További Szoftver cikkek
Lehet, hogy már nem sokáig, mert a Radar Networks (San Francisco) nemrég elkészült Twine rendszere megváltoztathatja információrendezési szokásainkat.
Keres, címkéz, csoportosít
A Twine egy honlap, ahova elvileg bármit feltölthetünk, vagy, ha akarjuk, automatikusan összegyűjti az általunk látogatott oldalakat, elektronikus leveleinket, stb. Mihelyst információhoz jut, kategóriákba csoportosít: kiről szól, milyen témák, szervezetek, cégek és helyszínek kerülnek benne megemlítésre, és így tovább. A csoportosításnak az a nagy előnye, hogy ha valami után kutakodunk, gyorsan hozzáférünk a releváns információhoz. A rendszer a közösségi hálózatépítésből (social networking) is hasznosít elemeket, így a velünk azonos hálózathoz tartozó személyek által gyűjtött információhoz szintén hozzáférünk.
„Egyfajta kollektív intelligencia jön létre” – állapította meg Nova Spivack, a Radar Networks alapító-igazgatója. – „A Szemantikus Web egyik első mainstream alkalmazásának tekinthető Twine abban segít, hogy a felhasználó produktívabb legyen, másokkal jobban együtt tudjon működni, az információt értelmesebben ossza meg és rendezze.”
Szemantikus Web
A Szemantikus Web évek óta a számítástudomány egyik nagy ígérete. Egyre több vállalat használja kisebb-nagyobb sikerrel az információt automatikusan kategóriákba gyűjtő és azoknak megfelelően kereső adatbázis-szoftvereket.
Már a bloggolásban is felbukkantak a Szemantikus Web elemei: kommentjeinkez címkéket (tags) rendelve, hasznos – és visszakereshető – metaadatokat hozunk létre. A strukturálatlan adat strukturálására történő kísérletek egyik legizgalmasabb példája a del.icio.us: az online könyvjelző honlapon például linkeket és lementett oldalakat látunk el címkékkel.
Ugyanakkor még mindig nem egészen világos – vagy: most már egyáltalán nem világos? – mit is értünk Szemantikus Weben. Az általánosan elfogadott vélekedés szerint egyrészt a könnyebb keresést támogatandó, az információ extra metaadatokkal történő címkézését, másrészt – általánosabban szinten – a jelenleginél sokkal magasabb információfeldolgozó-szintű számítógépeket, gépi rendszereket.
Stadion vagy labdarúgó?
Spivack szerint a Twine azért Szemantikus Web alkalmazás, mert annak a W3C (World Wide Web Consortium) által elfogadott szabványai szerint íródott, más alkalmazásaival kompatibilis, információi megoszthatók az alkalmazások között.
A Twine két másik mesterségesintelligencia-technológiát szintén használ: fejlett gépi tanuló és természetesnyelv-feldolgozó algoritmusai garantálják, hogy a kézi címkézésnél nagyságrendekkel hatékonyabban dolgozzon. Kiválóan kezeli a félreérthető, többféleképpen értelmezhető szóösszetételeket, szavak egymásutánját – például Giuseppe Meazza-ról a szövegkörnyezet alapján azonnal el tudja dönteni, hogy a milánói stadionra vagy az egykori legendás olasz labdarúgóra vonatkozik. A szövegekből kulcsfogalmakat választ ki és címkéz. Akkor is megállapítja, mi a főtéma, ha a kulcsszó egyetlen egyszer sincs megemlítve: a vizsgált szöveget statisztikus gépitanulás-módszereket használva hasonlítja össze online adatforrásokkal, például a Wikipédiával.
Csomópontok
A Twin a közösségi hálózatoknál bevált gráf-elemzést is alkalmazza: a hálózathoz tartozó személyek kapcsolódásait vizuálisan megjelenítő programokhoz hasonlóan a címkézett adatok, hálózati csomópontokká válnak, és ezeknek a csomópontoknak a különböző összeköttetései állnak össze grafikusan ábrázolható rendszerré. Egy-egy csomópont bármi lehet: adat, tárgy, személy, vállalat, esemény, fogalom, projekt, stb. A kapcsolódások szintje határozza meg, hogy az adott információ ilyen-olyan szempont szerint milyen mértékben releváns.
Egyelőre még nem lehet tudni, mennyire lesz sikeres a Twine. Az viszont biztos, hogy 2008 nyarától teljesen nyílt platformmá válik, azaz a szoftverfejlesztők bármit beépíthetnek a rendszerbe.