További Net cikkek
A 2004. januárban indított, harminchat hónapra tervezett, az EU hatodik keretprogramja által (is) finanszírozott SEKT (Semantically-Enabled Knowledge Technologies) hamisítatlan összeurópai, köz- és magánszférát egyaránt érintő kezdeményezés: különböző egyetemek (Ljubljana, Karlsruhe, Innsbruck, Sheffield, Barcelona, Amszterdam) és telekommunikációs, IT-cégek (British Telecom, Empolis, stb.) vesznek részt benne. Távolabbi cél a következő generációs ismeretmenedzselés (Next Generation Knowledge Management, NGKM) kidolgozása, valamint - azon keresztül, annak a segítségével - az európai tudástársadalom megvalósítása.
Az NGKM rendszerek félig, vagy teljesen automatizált ismeretkivonatolási, "ismeretcsomagolási" és a felhasználói profil szerint elosztó, szemantikus elemző eszközökből állnak össze. Interdiszciplináris a megközelítés, a célokat az ontológia- és metaadat-technológia (Ontolgy & Metadata Technology, OMT), az emberi nyelvtechnológia (Human Language Technology, HLT) és az ismeretfeltárás (Knowledge Discovery, KD) integrálásával igyekeznek megoldani. "Az ontológiák és a metaadatok használata szolgál a SEKT-komponensek és az egész megközelítés alapjául, a nyelvtechnológia a metaadatok kivonatolását, az ismeretfeltárás a félautomatikus tanulást és az ontológiák kifejlesztését célozza" - írja a Szemantikus Webhez "ezer szállal" kapcsolódó projektet koordináló John Davies.
Meg kell találniuk a módját, hogy keresőprogramjuk emberibb módon viselkedjen, mint a jelenleg használatban lévők - fűzi hozzá a kutató. Csak úgy birkózhat meg a világháló azonnaliságát és a közvetlen ismeret-hozzáférést aláaknázó (permanensen) strukturálatlan, rendszertelen szövegmasszával, s bukkanhat rá a tényleg hasznos információra - és csökkentheti frusztrációnkat. Máskülönben a káoszba vész. Emberi adottságokat kell emulálnia: mielőtt eredményeket szolgáltatna, előbb meg kell állapítania az adott információ kontextusát, majd ki kell szűrnie az irreleváns adatokat.
Fast ESP
A Fast ESP (Enterprise Search Platform) kifejezetten üzleti alkalmazásra, cégek számára fejlesztett, e-mailek között, interneten és intraneten, külső és belső adatbázisokban kutató program. Forrásait nem külön-külön tanulmányozza, hanem mindet egyszerre, egyidőben. A problémát ezúttal is a strukturálatlan, de potenciálisan értékes információ, és annak kiszűrése/kivonatolása jelenti. Előnye, hogy nemcsak a rendezetlen (elektronikus levelek, word-dokumentumok, pdf-fájlok, stb.), hanem a gondosan strukturált adattengerben is eligazodik: banki tranzakciók, megrendelések, fizetésrészletek, digitalizált hangok és fényképek között. Azonnali és szimultán a hozzáférés, többórás munkát végez el másodpercek alatt.
Erőteljes program, nagy rendszerekre, ötvenezer, vagy még több oldal tanulmányozására a leghatékonyabb. Miután megvannak az eredmények, elkészíti az adatbázisok, személyes fájlok, hálózati honlapok kereszt-referenciáit, melyek alapján mintákat, trendeket és kapcsolatrendszereket azonosít.
Az ESP-t jelenleg olyan vállalatok, állami szervek használják, mint a General Electric, az Egyesült Királyság Nemzeti Statisztikai Hivatala, vagy a holland Elsevier kiadó. Cégek egybeolvadásakor a már létező számítógépes rendszerek feletti, mindegyikhez hozzáférő extrarétegként funkcionál. A főnökök könnyebben figyelhetik, mi történik az irodában, sőt, az ESP-t alkalmazva, gyorsabban fény derül az esetleges fura tranzakciókra, például a pénzmosásra is. Egy-egy szó digitális mintáit nyomozva, gyanús hangokat azonosítva, hamar kinyomozzák, ki kivel konspirál.
Az elemzők azonban hangsúlyozzák: az ESP lehet kétélű fegyver is. Egyes ázsiai országokban pedofília-ellenes rendőrségi akciók előtt, gyermekpornóra szakosodott fotósok minta-azonosítására használják. De pornókeresőként szintén kielégítené az igényeket.