HTML

Miről szólunk?

Ez a blog az adattudomány világába kínál bepillantást. Célunk, hogy az adatbányászat módszereit, eszközeit közérthetően bemutatva elősegítsük, hogy nem szakmabeliek – üzletemberek, magánszemélyek – is megértsék, milyen lehetőséget rejtenek számukra digitális adataik, és hogyan lehet a bennük rejtőző információkat értelmezni, hatékonyan kihasználni. Adatra fel! Kapcsolat: adattudomany at gmail dot com

Friss topikok

Adatbányászat, statisztika, webanalitika, big data

2014.06.25. 14:36 DataMiner

Crowdsourcing az adatbányászatban

Címkék: adatbányászat a gyakorlatban

Tételezzük fel, hogy (blogunkat olvasva) rájöttél, mennyire hasznos lenne céged adataiból valami hasznosat kiolvasni. De ki az, aki ezt el tudná végezni neked? Ahogy a legtöbb professzionális tevékenység esetében, úgy az adatelemzésnél (sőt, ma Magyarországon az adatelemzésnél különösen) is probléma megfelelő szakembereket találni. De ha találnál is ilyet, egyáltalán nem biztos, hogy meg is tudnád fizetni. Mi lehet tehát ilyen esetben a megoldás? Például crowdsourcing, amely segítségével hatékonyan lehet korlátozott humánerőforrásokat kiaknázni.

Annak ellenére, mert te nem tudod, mi fán terem az adatbányász, a világban azért még szaladgál egy-kettő. Nincs tehát más dolgod, mint közzé tenni egy adott feladatot, és kitűzni hozzá egy csábító díjat. A dolog előnye azon túl, hogy több potenciális címzetthez is eljuthat a feladat, egyfajta versengés kialakítása is, amivel a lehető legügyesebb adatbányászt foghatod ki magadnak – ráadásul nem is feltétlenül kell alkalmaznod, ha csak egy-egy feladatra van szükséged rá.

Az ötlet nem mai: az USA-ban DVD-ket kölcsönző Netflix cég már 2006-ban versenydíjat tűzött ki azzal a céllal, hogy megkapja a legjobb, ajánlási rendszer formájában működő prediktív modellt. Önmagában az a tény, hogy ezt egymillió dollár felajánlásával tette, téged nem szükségszerűen kell, hogy elriasszon; itt is működik a kis pénz, kis foci szabálya azért.

Hovatovább a módszer annyira ígéretes, hogy egy Kaggle nevű ausztrál cég kifejezetten arra állt rá, hogy adatelemzők számára biztosítson kereteket ilyen jellegű versenyek számára, ami azon túl, hogy jó üzletnek bizonyult, ma már fogalommá tette a műfajban a vállalkozás nevét; a Kaggle-versenyeken való jó szereplés igazi rang az adatbányászok között, a legjobbak fordulnak meg itt. A modell meglehetősen egyszerű: a megrendelők (pl. a NASA, a Ford vagy a sarki pékség) körülírják a problémát, az igényt, biztosítják az adatokat; a Kaggle emberei ezt értelmezik adattudományilag, aztán publikálják a felhívást a kitűzött díjjal együtt, ami 100–1.000.000 dollár között lehet.

A crodsourcing remek megoldás minden közreműködő számára. Ki tudja, talán neked is érdemes kipróbálnod!

Szólj hozzá!

A bejegyzés trackback címe:

https://adattudomany.blog.hu/api/trackback/id/tr926295875

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.