Árpád
3 °C
12 °C

Újabb Wikipedia-kereső tör a Google trónjára

2008.05.17. 00:12
Kapcsolódó cikkek (1)
Elindult a Powerset keresőmotor nyilvános bétatesztje. Az adatbázisként a Wikipediát használó rendszer nagy újítása, hogy nemcsak a megadott kulcsszavak előfordulásai alapján keres, hanem a teljes mondat formájában feltett kérdésünket kielemzi, megpróbálja kihámozni belőle, hogy valójában mire is vagyunk kíváncsiak, és aztán arra keres választ.

Ha például megkérdezzük tőle, hány lemezt adott ki a Beatles, a mondat elemzése alapján rájön, hogy egy mennyiségre kérdeztünk rá, ami a Beatlesszel és albumokkal kapcsolatos, és olyan találatokra szűr, ahol ilyen adatokat tud adni nekünk. Ezzel szemben a hagyományos, kulcsszavas keresésénél egy ilyen kérdésre olyan oldalakat kapunk, ahol sokszor szerepel a Beatles és az album szó, csak éppen a kérdés lényegét nem érti a kereső.

A Powerset egyelőre csak a Wikipedia szócikkeiben keres; ehhez a teljes, 2,5 millió bejegyzést tartalmazó angol verziót letükrözték saját szerverekre, és a nyelvészekből és programozókból álló fejlesztőcsapat speciális algoritmusokkal a kereső számára feldolgozható formára hozta (éppen ezért lesz nehéz a teljes internetre kiterjeszteni a technológiát, hiszen ami a Wikipedia jól meghatározott struktúráinál működik, a web káoszában nem).

Tálalás

A keresés mechanizmusa mellett a találatok prezentálása is sem a megszokott: a fő érdekesség a Factz nevű összefoglaló, ahol az adott szócikkben leggyakrabban szereplő, a témához kapcsolódó igéket, és a hozzájuk legjellemzőbben kapcsolódó tárgyakat gyűjti ki a nyelvi elemző algoritmus. Ez egy személyről szóló bejegyzésnél például meglepően hatékonyan összefoglalja nekünk, hogy az illető mivel is foglalkozott életében. Ha például George Lucasra keresünk, a három első helyen kiadott Factz-ige (a 128-ból, amit eredményül kapunk) a "megalkotta", "írta", és "rendezte" lesz, a mellettük felsorolt tárgyakra rákattintva pedig a megfelelő Wikipedia-bejegyzéseket kapjuk meg arról, mit is alkotott, írt és rendezett Mr. Lucas.

Elméletben tehát nagyon izgalmas a Powerset, és valóban fejlettebb, felhasználóbarátabb, mint a kulcsszavas keresés, de vajon mennyire működik jól a gyakorlatban? Az az első pillanatoktól egyértelmű, hogy jóval lassabb a Google-nél, de ezt elnézi neki az ember, ha jobb találatokat ad a kérdéseinkre. A próbáknál kicsit a Powersetnek kedveztünk: olyan kérdéseket tettünk fel neki (majd ugyanezeket a Google-nek is), amelyek a saját címoldalán szerepelnek a példakeresések között, apró változtatásokkal persze, hogy ne legyen túl nagy a hazai pálya előnye.

A puding próbája

Hány lakosa van Budapestnek? - szólt az első kérdésünk (a Powerset példatárában Párizzsal szerepel ugyanez a kérdés). A Powerset megtalálja a Budapest szócikket első találatként, de a link mellé nem sikerül rögtön kiemelnie a választ, ami így egy plusz kattintásba kerül. További találatokként Raoul Wallenberget és a négyes metró terveit adja a kereső, ami már kevésbé meggyőző. A Google szintén a Wikipedia-oldallal nyitja a találati listát, aztán az Everything2.comról hoz egy 1999-es adatot, amihez klikkelnünk sem kell, rögtön a link alatt megkapjuk.

Mit vásárolt fel a Microsoft? - kérdeztük másodjára (az eredeti kérdés a Google-ről szólt). A Powerset a "felvásárolni" igéhez rögtön kanyarít egy Factz listát ömlesztve a cég bevásárlásairól, és ad egy csomó linket olyan szócikkekről, ahol a Microsoft egyes cégvásárlásait tárgyalja a Wikipedia. Csak éppen azt az oldalt nem kapjuk meg, ahol szépen táblázatba szedve, dátummal, árral, kapcsolódó sajtóközleménnyel tokkal-vonóval szerepel az összes Microsoft-felvásárlás az utóbbi 20 évből. A Google ugyanezt az oldalt harmadik találatként szállítja az elmaradt Yahoo-bizniszről szóló sztori, és egy friss bevásárlás bejelentése után.

A harmadik kérdésünket (Hogyan halt meg Hitler?) az AppScout tesztjéből kölcsönöztük, és megmutatja, milyen az, amikor a Powerset nem tud mit kezdeni a "hogyan" kérdéssel. Az első találatok között Göbbels, Hitler apja, Alois, a Führer elleni sikertelen merénylet, és Hitler állítólagos vegetarianizmusa áll, amit azért legalábbis tréfás mellélövés a halálával összefüggésbe hozni. A Google ezzel szemben az első találatban, külön klikkelés előtt hozza az öngyilkosságot, dátummal, helyszínnel.

Lehet belőle valami

A Powerset egyelőre nem lép túl az érdekes kísérlet szintjén, mindenesetre a benne rejlő potenciált jól jelzi, hogy a befektetői eddig 12 millió dollárt pumpáltak a technológiába, és a pletykák szerint a Microsoft erősen érdeklődik a keresőmotor iránt; ahogy tulajdonképpen bármi iránt, aminek egy kis esélye van, hogy egyszer majd megszorongassa a Google-t.