További Net cikkek
Szövegkörnyezet, jelentés
A probléma voltaképpen egyidős a világhálóval, de az ígéretes megoldások ellenére se született meg az ideális.
"Hiányzik a kontextus" - véli Barak Pridor, a New York-i székhelyű, tartalomkivonatoló és elemző szoftvereket fejlesztő ClearForest egyik vezetője. Több megközelítéssel kísérleteznek, így az információba ágyazott, a gépi olvasást és pontos azonosítást könnyítő címkékkel (tags) is (
Egyre gyakrabban hangzik el a - matematikai statisztikát, heurisztikát, MI-t, új számítógépes nyelveket kombináló Szemantikus Webhez kapcsolódó - szövegkörnyezet-függő "jelentés szerinti címkézés" (semantic tagging) kifejezés. Egy ilyen nyelv létrehozásán is dolgoznak már. A kulcsszavakról a kontextusra tolódik a hangsúly.
Nevek, időpontok, helyszínek
Tom Mitchell, az Amerikai Mesterséges Intelligencia Társaság (AAAI) volt elnöke szerint három-öt évet kell várnunk az új típusú (divatos kifejezéssel: "következő generációs"), intelligens (smart, pontosabban: intelligensebb, smarter) keresőprogramok (search engines) széles körű használatára. Prognózisát a természetesnyelv-feldolgozásban elért eredményekre, valamint a szakterület gyors fejlődésére alapozza. Jelenleg az egy-egy adott honlapot vizsgáló, az ottani nevekre, időpontokra és helyszínekre rátaláló szoftverek fejlesztését tartja a legkivitelezhetőbb célnak.
A program Mitchell szerint ugyan "még nem tudja olyan részletesen olvasni, vagy megérteni a szöveget, mint az ember, viszont arra már képes, hogy 95 % pontossággal azt mondja, 'ez egy személy neve', vagy 'ez egy helyszín, ez meg egy dátum.'" Állítását a tényszerű információ automatikus kivonatolását célzó kutatásokkal támasztja alá.
Kulcsszavak helyett kérdések
Mindez oda vezet, hogy a jövő keresőprogramjának kulcsszavak helyett speciális kérdéseket adunk meg. Végzős középiskolások egyetemi szakok, az adott szak ideálisnak tartott hallgató-létszáma után nyomozva, ugyancsak elidőznek a különböző kutakodásokkal. Néhány év múlva számítógép végzi el helyettük ugyanezt: a program átvizsgálja a honlapokat, kiszűri, összerakja a szükséges adatokat, következtetéseket von le, és máris megvan az óhajtott információ.
A szoftvert a gépi tanulás módszereivel okítják az olvasásra. Tanulói algoritmusokkal: személyek neveit vörössel, címeiket kékkel emelik ki, majd a megfelelő neveket összekötik a megfelelő címekkel. Ez a bázis, melyből a program általános szabályokra következtet: milyen szavak, szócsoportok vesznek körül neveket, illetve rendelnek neveket és címeket egymáshoz.
A kapcsolódásra számos szövegminta utal. Olyannyira, hogy egyszerűbb, ha a program deríti fel azokat, s nem mi.
Mitchell e felismeréssel (is) indokolja az utóbbi idők eredményeit.
Ausztrál keresőprogram
Izgalmas vállalkozásnak tűnik a Google babérjaira törő ausztrál Mooter Search kezdeményezése. Az információkeresés "intelligensebb és emberibb megközelítését" ígérik, kevesebb kavarodással, időmegtakarítással, a gép helyett az emberi pszichére fókuszálva. Programjuk logikai csoportokba rendezi az adatokat; állításuk szerint így sokkal gyorsabban rábukkanunk az óhajtott információra. Például szoftverágensek után nyomozva, első körben tetszés szerint klikkelhetünk a web, az ágensek, a bányászat, az ágens, a kereskedelmi, a szoftver, az érdeklődés csoportokra, de annak sincs akadálya, ha az összes találatot ömlesztve szeretnénk látni.