Olivér
5 °C
8 °C

Hír az, amit a web annak ítél

2010.01.27. 10:35
Nagyszerű koncepció, szerencsétlen kivitelezés: a Factery Labs gépi módszerekkel igyekszik kibányászni a webes linktömegből a híreket. Ha ez a hírszerkesztés jövője, akkor egyelőre inkább a múlt.

Az iskolában azt tanítják, hogy a hírt az esemény aktualitása, földrajzi közelsége, egyedisége, relevanciája és szórakoztató jellege teszi hírré. Ja, és még a hatás, az kimaradt. A gyakorlatban viszont a hír az, amit a hírszerkesztő annak tart. De el lehet-e dönteni, mi a hír, ha nincs hírszerkesztő?

A hírmeghatározás és -terjesztés egészen eredeti módszerét dolgozta ki a Factery Labs, egy tavaly alapított szilícium-völgybeli cég, amely a Twitteren, a Google-ön és a Yahoon kibontakozó webes trendekre és az azokból automatikusan kibányászható információra  alapozza a hírek szelekcióját. „Mélyfúrást végzünk, átmegyünk a linkeken, be az oldalakra, és kiderítjük, van-e ott a felhasználónak értékes információ – mondta nemrég az egyik alapító, Paul Pedersen, aki korábban az Infoseeknel és a Google-nél dolgozott. „Ezek nem hírek; ezek olyan hírek, amelyek a web szerint hírek.”

A napokban élesített Factery Labs a keresőmotorok (search engines) analógiájára ténymotornak (fact engine) nevezi magát, és azt ígéri, hogy a neten terjedő linkekből kibányássza az érdemi információt, ráadásul valós időben, amire a weboldalak szisztematikus bejárását és indexelését végző hagyományos keresők nem képesek.

A Factery Labs folyamatosan követi az eseményeket – a Twitteren kívül a Google Trendset és a fejlesztők számára szabadon hozzáférhető Yahoo-féle keresőplatformot, a BOSS-t –, aztán átnézi a hivatkozott oldalakat, posztokat és tweeteket, és a Google PageRankjének mintájára elnevezett FactRank algoritmussal megkísérli kibányászni belőlük a tényeket. A legfőbb újdonság tehát az, hogy a többi keresővel és híraggregátorral szemben a Factery Labs nem pusztán linkeket, hanem releváns információt igyekszik tálalni egy-egy keresőkifejezésre.

travolta450

A Factery Labs algoritmusait a cég alkalmazásfejlesztő felülete, a FactSource API révén sokféleképpen fel lehet használni. Az eddigi implementációk között szerepel például a FactFinder Source, ami azt demonstrálja, hogyan tud a ténymotor rendet vágni a valós idejű keresések kaotikus eredményeiben.

Ha például Haitire keres az ember a Twitteren, a legtöbb találat egy-egy címszerű mondat és egy url-rövidítővel készült, önmagában semmitmondó link. A FactFinder minden ilyen linkelt oldalra ellátogat, megpróbálja kiszűrni az ott található tényeket, és találatként azokat adja vissza, amivel időt spórol meg a felhasználónak, és elméletileg segít kihámozni a lényeget a tweetfolyamból.

A Factery Labs algoritmusát használja a Sobees közösségiszájt-aggregátor is, amely kereshetővé teszi a Facebookon, MySpace-en, LinkedInen és a Twitteren posztolt üzeneteket. Ez a fajta adatbányászat kifejezetten hasznos lehet a mobilnetezőknek, akik így kis képernyőre optimalizált, jól átlátható formában kapják a híreket.

Van még mit csiszolni

Na és hogy működik a Factery a gyakorlatban? A Haiti keresőkifejezésre a FactFinder Source több tucat találatot jelenít meg, ezeket a legfrissebb, vagy majdnem a legfrissebb Twitter-posztokból, blogokból és online újságokból szedi, ellátja őket egy százalékban megadott FactRankkel, vagyis nagyjából a találati pontosságot jelző értékkel, és a hivatkozott weboldalakról kimazsolázott tényekkel.

Ezek egy része teljesen releváns, megtudjuk például, hogy Haiti a világ egyik legszegényebb országa, hogy John Travolta éppen a szcientológia tanait terjeszti a földrengés károsultjai között, és hogy egy segélykoncert erejéig újra Robbie Williamsszel áll fel a Take That. A többi találat azonban a hivatkozott oldalakból véletlenszerűen  kirángatott mondat („De a tragédia új esélyt is jelent, és itt jön a képbe Tom Sehl”), ami nemhogy nem tény, de inkább növeli a káoszt, és a Factery által megtalált Twitter-posztoknak sokszor több értelmük van önmagukban, mint a melléjük rendelt random találatokkal együtt.

Sobees: balra Facebook, jobbra a Twitter-keresés eredményei
Sobees: balra Facebook, jobbra a Twitter-keresés eredményei

A Factery trendfigyelője is meglehetősen bugos, a Sport szekcióba kerültek az Apple bevételei, a Minnesota Vikings focicsapat kétszer is szerepel, és valamiért ide került a London Bridge; a Tech-szekcióban vannak viszont olyan témák, mint az egészségügyi reform és Brett Favre, a világhírű quarterback. A gép sem tudhat mindent.

És bár a Factery a hírműfajt szeretné újradefiniálni, sok esetben még csak nem is hírszerű. Bajnai Gordonról az első hat találat mind a Wikipediáról származik, és lexikális jellegű, életrajzi  adatokat tartalmaz, a hírnek szánt adatok között található két árva BBC-hír tavaly márciusi. Orbán Viktorral hasonló a helyzet, bár itt a fő forrás a Britannica.com, hírszerű információ még csak véletlenül sincs a találatok között. Még szerencse, hogy Robbie Williams már stúdióba is vonult a Take Thattel.

Köszönjük, hogy minket olvasol minden nap!

Ha szeretnél még sokáig sok ilyen, vagy még jobb cikket olvasni az Indexen, ha szeretnéd, ha még lenne független, nagy elérésű sajtó Magyarországon, amit vidéken és a határon túl is olvasnak, akkor támogasd az Indexet!

Tudj meg többet az Index támogatói kampányáról!

Milyen rendszerességgel szeretnél támogatni minket?

Mekkora összeget tudsz erre szánni?

Mekkora összeget tudsz erre szánni?