Judit
3 °C
6 °C

Szemantikus web

2001.11.26. 10:45
A világháló ugyan rendkívül hasznos, de okosnak mégsem nevezhetjük. A www-t kifejlesztő Tim Berners-Lee és kollégái az újabb generációs, a mainál sokkal intelligensebb, "szemantikus" weben dolgoznak. Egy olyan hálómodellen, amely érti az információözön mögötti jelentéseket.
A Massachusettsi Műszaki Egyetemen (MIT-n) működő WWW Konzorcium igazgatója, Berners-Lee olyan hálózatot próbál kifejleszteni, amely a különböző dokumentumokat nem csak összekapcsolja, hanem a jelentésüket is felismeri. Ez, az ember számára könnyű feladat egyelőre még megoldhatatlan problémát okoz a számítógépeknek. Például, ha egy cikket olvasunk online, könnyedén kiszedjük belőle a főcímet, a fotókat, a különböző információcsoportokat, amit csak akarunk, viszont, amennyiben nincsen minden sor, az oldal minden egyes fontos tartalmi és formai eleme egyértelműen "fölcímkézve", addig gépünknek fogalma sincs, mi is áll az oldalon, az egészet egyetlen karakterhalmazként kezeli.

Csak az információ formájáról rendelkezik adatokkal, a tartalmáról semmit sem tud. A szemantikus weben (leírásokat tartalmazó) címkékkel látnák el egyetlen oldal a különböző részeit. Így természetesen sokkal könnyebb lesz a keresés.

A cél: kvázi-mindentudás

A projektben résztvevő cégek, állami szervek
A DARPA (az Egyesült Államok védelmi kutatásainak intézete, amely annak idején internet kifejlesztését is finanszírozta) nemcsak több tízmillió dollárral támogatja a projektet, hanem az USA védelmi minisztériuma részére már kifejlesztettek egy szemantikus nyelvet (DARPA Agent Markup Language), amely lehetővé teszi, hogy a felhasználó www-dokumentumokhoz metaadatokat adjon, s mindezeket ontológiákhoz kapcsolja.

A Manchester Egyetemen dolgozó Ian Horrocks cége, a Network Inference ontológiákat és automata inferenciákat használó technológiákat fejleszt. Céljuk, hogy a szemamtikus web lehetőségeivel és tulajdonságaival javítsanak föl már létező adatbázisokat illetve site-okat.

A Hewlett-Packard metaadatokat létrehozó és karbantartó Java-alapú eszközöket, az Intellidimension (Windsor) szemantikus tulajdonságú adatbázisokat, a Nokia markup- és ontológia-nyelveket, az Ontoprise (Karlsruhe) ontológiaszerkesztő és inferencia-, a Taalee (Athens, Georgia) szöveges és audiovizuális tartalmak számára automatikusan szemantikus metaadatokat generáló, a CognIT (Halden, Norvégia) az információt különböző alkalmazások között megosztó, az Aidministrator Nederland (Amersfoort, Hollandia) a honlapokat tartalom és kapcsolatok alapján csoportosító programot, az Invention Machine (Boston) szemantikai keresőeszközöket fejleszt.

A mai web képek, szövegek tárolására és megosztására szolgáló rendszer. Ha mindehhez jelentést társítunk, "kiokosítjuk", alapjaiban alakul át. Az új keresők képesek lesznek a legkülönbözőbb forrásokból származó információk összegyűjtésére, feldolgozására, s ezekből új tényekre következtetni. "A szemantikus web végső célja, hogy a felhasználóknak kvázi-mindentudást adjon az internet mérhetetlen forrásairól, hogy a létező adatbázis-szigetek millióit egyetlen gigantikus Pangea-adatbázissá alakítsa" - írja Mark Frauenfelder.

Metaadatok, ontológiák

A jelen és a jövő hálózatának összehasonlítására Berners-Lee egy konferenciaregisztráció példáját hozza fel. Egy konferencia honlapja általában az esemény idejéről, helyszínéről, a legközelebbi repülőtérről és hotelekről ad tájékoztatást. Ha ott akarunk lenni a konferencián, lépésről lépésre végig kell mennünk a regisztrácis folyamaton, nekünk kell intézni mindent, külön-külön, szállást, repülőjegyet. "A szemantikus weben ezek az információdarabok be lesznek címkézve. A szoftver felismeri majd a címkéket, egyetlen klikkre automatikusan repülőjegyet és szállást foglal" - magyarázza Berners-Lee.

A nagyszabású vállalkozás első lépéseként olyan szabványokat kell kidolgozni, melyek lehetővé teszik a felhasználóknak, hogy a hálózati tartalomhoz egyértelmű, leíró címkéket, "metaadatokat" (adatokról szóló adatokat) adjanak. Következő fázis a különböző honlapok metaadatait összekapcsoló programok fejlesztése. Ezek lennének az alapok. Aztán jönnének az egyéb finomítások, testre szabások, például a már rendelkezésünkre álló adatokból további adatokra következtető alkalmazások létrehozása.

A metaadatok önmagukban azonban nem elegendők. Speciális dokumentumokhoz kell linkelni őket, melyek meghatároznák a metaadatok viszonyait és az e viszonyok közötti kapcsolatokat. Ezek a kapcsolódási rendszerek az úgynevezett "ontológiák". Fejlesztésük a metaadatoknál is bonyolultabbnak tűnik, más ontológiákhoz kell linkelni őket.

Kételyek

Nem mindenki osztja Berners-Lee-ék optimizmusát. Az egyik probléma a "következtetésekkel" (inferencia) szemben merül fel. Ha egyszerű a képlet, viszonylag gyors a döntés. Viszont, ha számos adat, metaadat és ontológia labirintusából kell kihámozni a megoldásokat, nagyon könnyen a klasszikus "utazó kereskedő problémájának" bonyolultabb változataival állunk szemben. A kereskedőnek a legrövidebb utat kell megtalálnia különböző városok között. Ha mindössze tizenöt városról van szó, a lehetséges utak száma már akkor is negyvenhárommilliárd_

A metaadatok kezelése egyéb kételyeket is felvet, például a mai HTML-programozás sokkal könnyebb, a szemantikus szerkesztés lényegesen több szakértelmet igényel.

Maga Berners-Lee is elismeri, hogy a szemantikus web teljes kidolgozása sokkal lassabb folyamatnak ígérkezik, mint a www-é volt.