Judit
-2 °C
8 °C

Jönnek az intelligens keresőprogramok

2003.11.24. 16:00
Noha a Google igazi sikertörténet, kérdés, hogy meddig lesz elegendő a kulcsszavak alapján történő keresés? Új, mesterséges intelligenciát is alkalmazó, speciális tényeket kivonatoló, csoportosító, illetve következtető módszerek körvonalazódnak.
Az átlagfelhasználó egyelőre azonban csak azt érzékeli, hogy például négy és fél millió körüli találattal szembesül, miután az alltheweb.com keresőjébe ütötte a Ford szót. Rendkívül hasznosak az ilyen jellegű programok, ám még a legeredményesebbnek tartott Google esetében is gyakran időigényes rábukkannunk az óhajtott, megfelelően pontos információra.

Szövegkörnyezet, jelentés

A probléma voltaképpen egyidős a világhálóval, de az ígéretes megoldások ellenére se született meg az ideális.

"Hiányzik a kontextus" - véli Barak Pridor, a New York-i székhelyű, tartalomkivonatoló és elemző szoftvereket fejlesztő ClearForest egyik vezetője. Több megközelítéssel kísérleteznek, így az információba ágyazott, a gépi olvasást és pontos azonosítást könnyítő címkékkel (tags) is ( szöveg, vagy beágyazott címke ). Pridor a hírszerzéssel von párhuzamot, hasonló technikákat javasol a webes keresésre: képzeljünk el tízmillió beszámolót, és miután felcímkéztük a bennük szereplő összes személyt, különböző kapcsolatrendszerekre bukkanunk, s fontos következtetéseket vonhatunk le belőlük.

Egyre gyakrabban hangzik el a - matematikai statisztikát, heurisztikát, MI-t, új számítógépes nyelveket kombináló Szemantikus Webhez kapcsolódó - szövegkörnyezet-függő "jelentés szerinti címkézés" (semantic tagging) kifejezés. Egy ilyen nyelv létrehozásán is dolgoznak már. A kulcsszavakról a kontextusra tolódik a hangsúly.

Nevek, időpontok, helyszínek

Tom Mitchell, az Amerikai Mesterséges Intelligencia Társaság (AAAI) volt elnöke szerint három-öt évet kell várnunk az új típusú (divatos kifejezéssel: "következő generációs"), intelligens (smart, pontosabban: intelligensebb, smarter) keresőprogramok (search engines) széles körű használatára. Prognózisát a természetesnyelv-feldolgozásban elért eredményekre, valamint a szakterület gyors fejlődésére alapozza. Jelenleg az egy-egy adott honlapot vizsgáló, az ottani nevekre, időpontokra és helyszínekre rátaláló szoftverek fejlesztését tartja a legkivitelezhetőbb célnak.

A program Mitchell szerint ugyan "még nem tudja olyan részletesen olvasni, vagy megérteni a szöveget, mint az ember, viszont arra már képes, hogy 95 % pontossággal azt mondja, 'ez egy személy neve', vagy 'ez egy helyszín, ez meg egy dátum.'" Állítását a tényszerű információ automatikus kivonatolását célzó kutatásokkal támasztja alá.

Kulcsszavak helyett kérdések

Mindez oda vezet, hogy a jövő keresőprogramjának kulcsszavak helyett speciális kérdéseket adunk meg. Végzős középiskolások egyetemi szakok, az adott szak ideálisnak tartott hallgató-létszáma után nyomozva, ugyancsak elidőznek a különböző kutakodásokkal. Néhány év múlva számítógép végzi el helyettük ugyanezt: a program átvizsgálja a honlapokat, kiszűri, összerakja a szükséges adatokat, következtetéseket von le, és máris megvan az óhajtott információ.

A szoftvert a gépi tanulás módszereivel okítják az olvasásra. Tanulói algoritmusokkal: személyek neveit vörössel, címeiket kékkel emelik ki, majd a megfelelő neveket összekötik a megfelelő címekkel. Ez a bázis, melyből a program általános szabályokra következtet: milyen szavak, szócsoportok vesznek körül neveket, illetve rendelnek neveket és címeket egymáshoz.

A kapcsolódásra számos szövegminta utal. Olyannyira, hogy egyszerűbb, ha a program deríti fel azokat, s nem mi.

Mitchell e felismeréssel (is) indokolja az utóbbi idők eredményeit.

Ausztrál keresőprogram

Izgalmas vállalkozásnak tűnik a Google babérjaira törő ausztrál Mooter Search kezdeményezése. Az információkeresés "intelligensebb és emberibb megközelítését" ígérik, kevesebb kavarodással, időmegtakarítással, a gép helyett az emberi pszichére fókuszálva. Programjuk logikai csoportokba rendezi az adatokat; állításuk szerint így sokkal gyorsabban rábukkanunk az óhajtott információra. Például szoftverágensek után nyomozva, első körben tetszés szerint klikkelhetünk a web, az ágensek, a bányászat, az ágens, a kereskedelmi, a szoftver, az érdeklődés csoportokra, de annak sincs akadálya, ha az összes találatot ömlesztve szeretnénk látni.