Menyhért, Mirjam
12 °C
24 °C

Túl a Google-ön

2007.11.22. 01:32
A Google egy jó keresőalgoritmussal egy kollégiumi szobából indulva lett tíz év alatt az internet meghatározó cége. Több száz kereső próbálja megismételni a sikertörténetet; kik ők, és milyen esélyük van erre?

Ha keresés, akkor Google - ez lassan "cipőt a cibőboltból" szintű evidencia lesz a internethasználók között. A szó a keresés szinonímájává vált, a "to google" ige 2006. júniusa óta benne van a nagy Oxford English Dictionaryben, azt jelenti, keresni az interneten, naná (és nekünk ugyan hidegrázásunk támad tőle, de a magyar szlengbe is beette magát a "guglizni" kifejezés). A felmérések rendszeresen azt mutatják, hogy minden második netes keresést a Google intéz, minden negyedik-ötödiket a Yahoo, 10-15 százalék körüli az MSN részesedése, úgy-ahogy elvegetálgat még az AOL saját keresője, aztán mintha elvágták volna, a többi keresőmotor alig mutat életjeleket. Pedig léteznek, több száz van belőlük, és mindegyik másképp próbálja lepipálni a Google-t. Összeállításunkban annak jártunk utána, ki taszíthatja le a trónról a nagy G-t, és mi lehet a trükk ehhez.

Specializálódjunk!

A legegyszerűbben úgy lehet szembemenni az árral, hogy az egyre inkább univerzálissá váló Google-lal szemben specializáljuk a sajátunkat valamilyen tartalom keresésére. Ugyan miért használna az ember külön keresőket, ha a Google-lal úgyis mindent megtalál? - jön a kérdés reflexből, de ha belegondol az ember, a YouTube vagy az IMDB keresőit is használjuk, ha egy videoklipre vagy egy film stáblistájára vagyunk kíváncsiak, nem is beszélve a Wikipedia keresőjéről. Témára specializálódott keresőkre tehát igenis szükség van, és rengetegen játszanak is erre a neten. Van, ami a saját területén standarddá vált (mint a SimplyHired álláskereső oldal, vagy a blogkereső Technorati), van, ami azzá válhatna, de még nem elég ismert hozzá, mint a zenére és podcastokra specializált Odeo vagy a Picsearch képkereső. De ide sorolhatjuk akár a fájlcseréhez nélkülözhetetlen torrentkeresőket is.

A tálalás a lényeg

Egy másik módszer, ha a találatok tálalását próbáljuk meg felhasználóbarátabbá, átláthatóbbá tenni. A Girafa például thumbnail formában mutatja meg a találati oldalakat, míg a Mooter vagy a Clusty a találatokat értelmezi, és csoportosítja nekünk (például a "labrador" kifejezésre külön csomagban kapjuk a kutyafajtával, és külön a kanadai félszigettel kapcsolatos eredményeket).

Labradorok a Mooteren

Csak tiszta forrásból

Érdekes irány az is a keresés hatékonyabbá tételében, ha szűkítjük azt a területet, ahol keresünk, és csak a megbízható(nak tartott) oldalakról származó találatokat és információkat közöljük a felhasználóval. Így működik például az emberekre kereső Spock (ami közösségi oldalakat használ forrásként), vagy a Factbites, ami nem csak linkeket ad eredményként, hanem egy külön oldalra összegyűjtögeti a forrásairól a fontosnak tartott információkat. Ide sorolható még a Dogpile, ami a keresőkifejezéseket egyszerűen továbbítja egy rakás másik keresőhöz (az Abouttól a Yahoo-ig), majd az onnan kapott eredményeket súlyozza, rendszerezi, és adja vissza a felhasználónak.

Angelina Jolie a Spockon

Értelmes kérdések

Megint csak a fejlődés egy iránya lehet a természetes nyelvi feldolgozás, amikor a kulcsszavak helyett szépen megfogalmazott kérdő mondatokat értelmez a kereső. Ezt az ask.com kezdte el erőltetni pár éve, ma pedig a Haika számít a technika élharcosának. Ez a gyakorlatban annyit tesz, hogy a kötőszavakat, létigéket, amik fölött a Google elegánsan átsiklik (lévén a világ összes weboldalán megtalálná őket) is megpróbálja értelmezni. Működik is: a tesztkérdésünkre ("What is the meaning of life?", vagyis mi az élet értelme) szépen csoportosítva tárta elénk az általános, tudományos, vallási és filozófiai magyarázatokat, bónuszként pedig a Monty Python témába vágó filmjét.

Az élet értelme a Haika szerint

A közösség ereje

Végül érdemes megemlíteni a közösségi keresést, ahol a keresés eredményét nem algoritmusok, hanem az algoritmusokat használó közösség adja, magyarán a felhasználók válogatják ki a találatok közül azokat, amik valóban a témába vágnak. A legextrémebb példája ennek a ChaCha, ahol emberi operátorok értelmezik a felhasználó kérdését, keresnek rá - vélhetőleg a Google-ön -, majd adják vissza a releváns találatokat.

Mi hiányzik?

Ötletekből, újító szándékból tehát láthatóan nincs hiány, a feltörekvő alternatív keresőket mégsem ismeri és használja szinte senki. Ez főként azért van, mert a Google (és a Yahoo és az MSN) már annyira beépült a köztudatba, meg a böngészők és weboldalak keresőmezőibe, hogy a felhasználók megszokásból azt használják, és eszükbe sem jutna új kereső után nézni, még ha az esetleg jobb, hatékonyabb is lenne a nagy keresőknél.

Csak persze nem jobbak; ahhoz kellene a nagyok mögött álló adatbázis, hardver és évekig finomított keresőalgoritmus is az innovatív ötletek mellett. Hiába áll elméletileg a Spock mögött százmillió személy adatait tartalmazó adatbázis, ha a legegyszerűbb teszten (rákerestünk a saját nevünkre) nulla talátatoz ad - ugyanerre a Google 643 oldalt dobott ki. Hiába értelmezi a Haika a bonyolult kérdéseket, ha a legkönnyebb gyakorlati példa (hány méter egy yard?) kifekteti - miközben a Yahoo vidáman átirányít a Yahoo Shortcuts aloldalra, és átváltja nekünk oda-vissza a mértékegységeket. Hiába látványosak a találataikat thumbnailekkel illusztráló oldalak (említsük meg az eddigiek mellett a Snap.com-ot), ha szörnyű lassúak cserébe.

Akkor ki lesz az új Google?

Hogy a Google-nek a maga idején csak szerencséje volt, vagy a PageRank algoritmus és a cég vezetőinek stratégiája tette őket a net királyává, talán nem is fontos. A lehetőség ma is megvan egy jó ötlettel a semmiből a csillagos égig nőni (lásd YouTube, Facebook, Skype, hogy csak a legkézenfekvőbbeket említsük), de vajon lesz-e a közeljövőben forradalom a keresők között is? Valószínűleg inkább az ötletek fognak kisebb-nagyobb summákért cserébe a Google meg a többiek rendszerébe átvándorolni, mint hogy a trónkövetelők mögött nőne ki a semmiből az infrastruktúra. Mi mindenképpen jól járunk, ha hatékonyabb keresőket kapunk végeredményül.

A sötét web

Kutatások szerint a keresők az interneten fellelhető adatmennyiségnek csupán az egy századát látják - a maradék 99 százalék a deep web: a dinamikusan frissülő tartalmak, azok az oldalak, ahová nem mutat link, privát adatbázisok, jelszóval védett területek. Van tehát még hová fejlődni a keresőknek.