Blanka, Bianka
5 °C
12 °C

Mátrixfaktorizáció egymillió dollárért

2009.08.07. 00:22
| Módosítva: 2009.12.16. 09:46
A Gravity nevű magyar csapat is tagja annak az együttműködésnek, amely a nem hivatalos végeredmény szerint megnyerte a Netflix nevű amerikai dvd-kölcsönző által kiírt versenyt, ám győztest még nem hirdettek, mert az eredmény nagyon szoros. A 2006 óta tartó Netflix Prize tétje egymillió dollár, célja pedig a kölcsönző ajánlórendszere teljesítményének legalább 10 százalékos javítása volt. A magyar programozókból álló csapat időközben céggé alakult, és a piacon is ajánlórendszereket fejlesztenek.

A Netflix az Egyesült Államok legnagyobb dvd-kölcsönzője: az ügyfelek fix havidíjért kölcsönözhetik a dvd-ket, egyszerre legfeljebb hármat, de havonta tetszőleges mennyiséget. A megnézett filmeket postán kell visszaküldeni, a kikölcsönzött alkotásokat ekkor egy ötpontos skálán értékelhetik. Az értékelések azért nagyon fontosak, mert egy idő után mindenki eljut arra a pontra, hogy az általa ismert és kedvelt filmeket már mind látta. Innentől kezdve a felhasználók egyre inkább arra az ajánlórendszerre támaszkodnak, amely a saját, valamint mások értékelései alapján további filmeket javasol nekik.

nx1

Ilyen ajánlórendszereket ma már minden magára valamit is adó online áruház, könyv-, film-, és zenebolt működtet, a legismertebb talán az Amazon szintén a felhasználói vásárlásokon, értékeléseken alapuló ajánlórendszere.

A Netflix rendszerében nagyjából százezer film hozzáférhető, ezért egyszerű böngészéssel elég reménytelen feladat a nekünk esetleg tetsző alkotások felkutatása az óriási kínálatban. A jó ajánlórendszer azonban olyan filmeket javasol, amelyek bejönnek a vásárlóknak, így nő az átlagos ügyfélélettartam, ami jelentős bevételt generál a cégnek. Ha a Netflix esetében a jelenleg 6-7 millió felhasználónál átlagosan csak 1 hónappal nő az ügyfélélettartam, az a havi 15 dolláros előfizetési díjjal számolva 90-100 millió dolláros pluszbevételt hoz a cégnek. Tehát az ajánlórendszer minősége üzleti szempontból is nagyon fontos a Netflixnek, ezért írták ki a versenyt 2006 októberében.

A Netflix Prize tétje egymillió dollár, a verseny akkor ér véget, ha valamelyik csapat legalább 10 százalékkal megjavítja a Netflix ajánlórendszere, a Cinematch teljesítményét egy nyilvánosságra hozott halmazon. Ebbe a halmazba nagyjából 18 ezer felhasználónak 480 ezer filmre adott 100 millió értékelése került, a versenyzőknek a felhasználói azonosítókból, a filmek címéből és az értékelésekből álló mátrixokon kellett dolgozniuk. Egy másik, hasonló adathalmazon az értékelések nem voltak megadva, a feladat tehát az ebbe a halmazba tartozó értékelések lehető legjobb becslése volt. A verseny állását egy publikus hirdetőtáblán követhették az egymillió dolláros fődíjjal motivált programozócsapatok.

Szoros befutó

A versenyre több ezer csapat nevezett, köztük egy magyar. A Budapesti Műszaki Egyetem oktatói és hallgatói – Tikk Domokos, Takács Gábor, Pilászy István és Németh Bottyán – Gravity néven indultak, 2007 januárjában az élre kerültek, többször vezettek hónapokig, és mindig az élmezőnyben voltak a verseny folyamán. Egy év elteltével összeálltak egy másik csapattal, a kaliforniai Berkeley diákjaiból álló Dinosaur Planettel, hogy megelőzzék az akkor vezető Bellkor nevű csapatot. Ez majdnem sikerült, a Gravity és a Bellkor azóta is fej-fej mellett haladt.

A verseny végén a csapatok különféle együttműködésekkel próbálták javítani esélyeiket: a Gravity 2009 elején megalapította a több csapatot tömörítő Grand Prize Team (GPT) nevű szupercsapatot, hogy minél hamarabb elérjék az áhított 10 százalékos küszöböt. Ez azonban egy másik szupercsapatnak, a Bellkor's Pragmatic Chaosnak (BPC) sikerült hamarabb, és ezzel júniusban elkezdődött a verseny utolsó 30 napos szakasza. A GPT és egy harmadik együttműködés ekkor The Ensemble néven egyesült, de ennek a csapatnak is a magyar Takács Gábor és a Gravity volt a vezetője. A harminc nap elteltével ők végeztek az élen 10,10 százalékos eredménnyel, a BPC pedig 0,01 százalékkal lemaradva futott be a második helyen.

nx3

Az egymillió dolláros fődíj sorsa azonban ezzel még nem dőlt el, ugyanis a 10 százalék felett teljesítő csapatoknak más módszerrel is kiértékelik az eredményeit. A szoros befutó miatt a BPC is győztesként ünnepli magát, a Netflix pedig még nem hirdetett végeredményt. A magyarok mindenesetre reménykednek – mondta Tikk Domonkos csapattag, a BME kutatója.

Üzleti sikerek

A versennyel járó publicitás és szakmai elismertség már így is sokat hozott a magyar csapat konyhájára: a Gravity 2007 végén Gravity R&D néven céggé alakult, hogy az ajánlórendszer optimalizálása terén szerzett tapasztalatait az üzleti életben is kamatoztassa. Tavaly megnyerték a Valdeal projektversenyét az IT területen, és a Strands ajánlórendszereket fejlesztő induló cégeknek hirdetett, százezer dolláros befektetési ajánlattal járó versenyét. Jelenleg már több cégnek is fejlesztenek ajánlórendszert, köztük egy olasz mobilszolgáltatónak és egy amerikai online közösségi hálózatnak. A Gravity R&D befektetés előtt áll, több érdeklődővel is tárgyalnak a programozókból lett alapító-tulajdonosok.

Tikk szerint óriási a piac: a kulturális termékeken (könyven, filmen, zenén) túl ajánlórendszerekre van szükség a kulturális rendezvényeket (például színházat, koncerteket), az utazásokat, a szállásokat, sőt a banki termékeket értékesítő weboldalaknak is. A módszerükről csak annyit árult el a kutató, hogy a felhasználói értékelések alapján sokkal jobban lehet becsülni a filmek „jóságát”, mint az azokról nyilvánosan elérhető adatbázisokban, például az IMDB-n fellelhető szöveges információk alapján, ezért döntően matematikai módszerekkel, például mátrixfaktorizációval dolgoztak a verseny során.

nx2

Magyarországon ajánlórendszereket fejleszt egy másik cég, a Scarab Research is, ők fejlesztették például a Bookline online könyváruház ajánlórendszerét. Maróy Ákos, a Scarab Research technológiai igazgatója szerint a személyre szabott ajánlások és a relevancia kérdése nagyon izgalmas és aktív kutatási témakör, mivel végső soron a vásárlók fejében zajló döntési folyamatok megértéséről és modellezéséről van szó, az ajánlórendszerek hasznosságának végső mértéke pedig a vásárlók elégedettsége lesz.

A cikket itt lehet kommentálni