Hír az, amit a web annak ítél
További Tech cikkek
- Az Instagram ezentúl korlátozza a politikai tartalmakat
- Japán szigorítana a mesterséges intelligencia fejlesztésén
- Elképesztő változáson esik át a Waze
- Fél évig akár féláron is használhatják a vezetékes internetet a Digi előfizetői
- Aggódik az Apple az iPhone miatt, biztonsági kockázatokat rejthet egy uniós szabályozás
Az iskolában azt tanítják, hogy a hírt az esemény aktualitása, földrajzi közelsége, egyedisége, relevanciája és szórakoztató jellege teszi hírré. Ja, és még a hatás, az kimaradt. A gyakorlatban viszont a hír az, amit a hírszerkesztő annak tart. De el lehet-e dönteni, mi a hír, ha nincs hírszerkesztő?
A hírmeghatározás és -terjesztés egészen eredeti módszerét dolgozta ki a Factery Labs, egy tavaly alapított szilícium-völgybeli cég, amely a Twitteren, a Google-ön és a Yahoon kibontakozó webes trendekre és az azokból automatikusan kibányászható információra alapozza a hírek szelekcióját. „Mélyfúrást végzünk, átmegyünk a linkeken, be az oldalakra, és kiderítjük, van-e ott a felhasználónak értékes információ – mondta nemrég az egyik alapító, Paul Pedersen, aki korábban az Infoseeknel és a Google-nél dolgozott. „Ezek nem hírek; ezek olyan hírek, amelyek a web szerint hírek.”
A napokban élesített Factery Labs a keresőmotorok (search engines) analógiájára ténymotornak (fact engine) nevezi magát, és azt ígéri, hogy a neten terjedő linkekből kibányássza az érdemi információt, ráadásul valós időben, amire a weboldalak szisztematikus bejárását és indexelését végző hagyományos keresők nem képesek.
A Factery Labs folyamatosan követi az eseményeket – a Twitteren kívül a Google Trendset és a fejlesztők számára szabadon hozzáférhető Yahoo-féle keresőplatformot, a BOSS-t –, aztán átnézi a hivatkozott oldalakat, posztokat és tweeteket, és a Google PageRankjének mintájára elnevezett FactRank algoritmussal megkísérli kibányászni belőlük a tényeket. A legfőbb újdonság tehát az, hogy a többi keresővel és híraggregátorral szemben a Factery Labs nem pusztán linkeket, hanem releváns információt igyekszik tálalni egy-egy keresőkifejezésre.
A Factery Labs algoritmusait a cég alkalmazásfejlesztő felülete, a FactSource API révén sokféleképpen fel lehet használni. Az eddigi implementációk között szerepel például a FactFinder Source, ami azt demonstrálja, hogyan tud a ténymotor rendet vágni a valós idejű keresések kaotikus eredményeiben.
Ha például Haitire keres az ember a Twitteren, a legtöbb találat egy-egy címszerű mondat és egy url-rövidítővel készült, önmagában semmitmondó link. A FactFinder minden ilyen linkelt oldalra ellátogat, megpróbálja kiszűrni az ott található tényeket, és találatként azokat adja vissza, amivel időt spórol meg a felhasználónak, és elméletileg segít kihámozni a lényeget a tweetfolyamból.
A Factery Labs algoritmusát használja a Sobees közösségiszájt-aggregátor is, amely kereshetővé teszi a Facebookon, MySpace-en, LinkedInen és a Twitteren posztolt üzeneteket. Ez a fajta adatbányászat kifejezetten hasznos lehet a mobilnetezőknek, akik így kis képernyőre optimalizált, jól átlátható formában kapják a híreket.
Van még mit csiszolni
Na és hogy működik a Factery a gyakorlatban? A Haiti keresőkifejezésre a FactFinder Source több tucat találatot jelenít meg, ezeket a legfrissebb, vagy majdnem a legfrissebb Twitter-posztokból, blogokból és online újságokból szedi, ellátja őket egy százalékban megadott FactRankkel, vagyis nagyjából a találati pontosságot jelző értékkel, és a hivatkozott weboldalakról kimazsolázott tényekkel.
Ezek egy része teljesen releváns, megtudjuk például, hogy Haiti a világ egyik legszegényebb országa, hogy John Travolta éppen a szcientológia tanait terjeszti a földrengés károsultjai között, és hogy egy segélykoncert erejéig újra Robbie Williamsszel áll fel a Take That. A többi találat azonban a hivatkozott oldalakból véletlenszerűen kirángatott mondat („De a tragédia új esélyt is jelent, és itt jön a képbe Tom Sehl”), ami nemhogy nem tény, de inkább növeli a káoszt, és a Factery által megtalált Twitter-posztoknak sokszor több értelmük van önmagukban, mint a melléjük rendelt random találatokkal együtt.
A Factery trendfigyelője is meglehetősen bugos, a Sport szekcióba kerültek az Apple bevételei, a Minnesota Vikings focicsapat kétszer is szerepel, és valamiért ide került a London Bridge; a Tech-szekcióban vannak viszont olyan témák, mint az egészségügyi reform és Brett Favre, a világhírű quarterback. A gép sem tudhat mindent.
És bár a Factery a hírműfajt szeretné újradefiniálni, sok esetben még csak nem is hírszerű. Bajnai Gordonról az első hat találat mind a Wikipediáról származik, és lexikális jellegű, életrajzi adatokat tartalmaz, a hírnek szánt adatok között található két árva BBC-hír tavaly márciusi. Orbán Viktorral hasonló a helyzet, bár itt a fő forrás a Britannica.com, hírszerű információ még csak véletlenül sincs a találatok között. Még szerencse, hogy Robbie Williams már stúdióba is vonult a Take Thattel.