Az Economist magazin aktuális száma egy remek, jól érthető valós példát hogy az adatbányászat felhasználására, amit érdemes nektek is megismernetek. Egy (stílszerűen, bár nem túl fantáziadúsan) DataminR nevű New York-i startup cég Twitter-üzenetek adatelemzésével és ezek értékesítésével foglalkozik, a bolt pedig a Twittert övező általános szkepszis ellenére is remekül megy nekik. De mi is az üzleti modell lényege?
A hírverseny a médiaiparban, a minél frissebb, gyorsabb információhoz való hozzájutás az üzlet világában élet-halál kérdése, de nem kell hozzá nagy fantázia, hogy a közszolgálatban is meglássuk az előnyét. De vajon honnan lehet hozzájutni a legfrissebb hírekhez még a vezető médiákat is megelőzve? A DataminR válasza: a napi több, mint ötszázmilló tweetet generáló közösségi csatornából.
A cég eredendően piaci szempontból értékes indikátorokat gyűjtött a híráradatból, mégpedig (a Twitterrel kötött megállapodás alapján) a nyilvánosan nem hozzáférhető teljes forgalomból. Mintegy 30 jellemző alapján döntik el egy tweet jelentőségét, és esetenként akár három üzenet is elegendő egy-egy prognózishoz. Az óriási adatmennyiségből nem könnyű kiszűrni a zajt, ehhez többek között korábbi tweetek és események közti összefüggések mintáit vizsgálták (pl. az Apple részvényeinek esését közvetlenül megelőzően a céggel szembeni negatív megnyilvánulások száma érzékelhetően megnőtt).
Jellemzően öt–tíz perccel az esemény előtt tudnak értesítéseket küldeni ügyfeleiknek, tehát gyakorlatilag real-time adatelemzésről van szó; Oszama bin Laden likvidálását például 23 perccel korábban tudták előjelezni, mint bármely más médium (a proznózist a gyilkosságról és Obama rendkívüli sajtótájékoztatójáról szóló tweetek adatelemzésével tették).
A DataminR tucatnyi nagy ügyfélnek értékesíti szolgálatását, köztük a CNN-nek és Boston városának, amely utóbbi a tavalyi maratonfutási merénylet valószínűségét akarta vele felmérni. Napi több száz riasztást küldenek, igény szerint tematikusan szelektálva. Mondani sem kell, milyen versenyelőnyöket tud ez a kliensek számára biztosítani, még akkor is, ha a prognózisoknak csak csekély hányada igazán nagy fontosságú, és annak értelmezése, hasznosítása a cégek számára nem annyira egyszerű.
Mit gondolsz, a te céged, ügyfeleid, vagy a saját személyes életedben vajon milyen változást jelentene, ha tíz perccel előbb tudnád, hogy az OTP részvényei hirtelen emelkednek vagy csökkennek, esetleg hogy a parlament holnap lefoglalja a bankszámládat?