HTML

Miről szólunk?

Ez a blog az adattudomány világába kínál bepillantást. Célunk, hogy az adatbányászat módszereit, eszközeit közérthetően bemutatva elősegítsük, hogy nem szakmabeliek – üzletemberek, magánszemélyek – is megértsék, milyen lehetőséget rejtenek számukra digitális adataik, és hogyan lehet a bennük rejtőző információkat értelmezni, hatékonyan kihasználni. Adatra fel! Kapcsolat: adattudomany at gmail dot com

Friss topikok

Adatbányászat, statisztika, webanalitika, big data

2014.06.11. 11:49 DataMiner

Real-time adatelemzés Twitterből

Címkék: adatbányászat a gyakorlatban adattudomány példák

Az Economist magazin aktuális száma egy remek, jól érthető valós példát hogy az adatbányászat felhasználására, amit érdemes nektek is megismernetek. Egy (stílszerűen, bár nem túl fantáziadúsan) DataminR nevű New York-i startup cég Twitter-üzenetek adatelemzésével és ezek értékesítésével foglalkozik, a bolt pedig a Twittert övező általános szkepszis ellenére is remekül megy nekik. De mi is az üzleti modell lényege?

A hírverseny a médiaiparban, a minél frissebb, gyorsabb információhoz való hozzájutás az üzlet világában élet-halál kérdése, de nem kell hozzá nagy fantázia, hogy a közszolgálatban is meglássuk az előnyét. De vajon honnan lehet hozzájutni a legfrissebb hírekhez még a vezető médiákat is megelőzve? A DataminR válasza: a napi több, mint ötszázmilló tweetet generáló közösségi csatornából.

A cég eredendően piaci szempontból értékes indikátorokat gyűjtött a híráradatból, mégpedig (a Twitterrel kötött megállapodás alapján) a nyilvánosan nem hozzáférhető teljes forgalomból. Mintegy 30 jellemző alapján döntik el egy tweet jelentőségét, és esetenként akár három üzenet is elegendő egy-egy prognózishoz. Az óriási adatmennyiségből nem könnyű kiszűrni a zajt, ehhez többek között korábbi tweetek és események közti összefüggések mintáit vizsgálták (pl. az Apple részvényeinek esését közvetlenül megelőzően a céggel szembeni negatív megnyilvánulások száma érzékelhetően megnőtt).

Jellemzően öt–tíz perccel az esemény előtt tudnak értesítéseket küldeni ügyfeleiknek, tehát gyakorlatilag real-time adatelemzésről van szó; Oszama bin Laden likvidálását például 23 perccel korábban tudták előjelezni, mint bármely más médium (a proznózist a gyilkosságról és Obama rendkívüli sajtótájékoztatójáról szóló tweetek adatelemzésével tették).

A DataminR tucatnyi nagy ügyfélnek értékesíti szolgálatását, köztük a CNN-nek és Boston városának, amely utóbbi a tavalyi maratonfutási merénylet valószínűségét akarta vele felmérni. Napi több száz riasztást küldenek, igény szerint tematikusan szelektálva. Mondani sem kell, milyen versenyelőnyöket tud ez a kliensek számára biztosítani, még akkor is, ha a prognózisoknak csak csekély hányada igazán nagy fontosságú, és annak értelmezése, hasznosítása a cégek számára nem annyira egyszerű.

Mit gondolsz, a te céged, ügyfeleid, vagy a saját személyes életedben vajon milyen változást jelentene, ha tíz perccel előbb tudnád, hogy az OTP részvényei hirtelen emelkednek vagy csökkennek, esetleg hogy a parlament holnap lefoglalja a bankszámládat?

A teljes cikk angol nyelven elolvasható itt.

Szólj hozzá!

A bejegyzés trackback címe:

https://adattudomany.blog.hu/api/trackback/id/tr626295334

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.