Oszkár
20 °C
29 °C

Firkákat animál a szoftver

2003.10.09. 12:38
Randall Davis és Christine Alvarado az MIT nemrég alakult Számítógép-tudományi és Mesterséges Intelligencia Laboratóriumában (NLCSAI) a tervezőmérnökök munkáját, a gyerekek rajztanulását megváltoztató szoftvert fejlesztenek. Életre kelti a skicceket, segíti az elképzelések vizualizálását.
A kutatók már évek óta dolgoznak az ASSIST-on (A Shrewd Sketch Interpretation and Simulation Tool, Okos skiccinterpretáló és szimuláló eszköz).

Randall Davis
Kezdő lépésben, az első vázlatként készült, kevésbé kidolgozott, kézzel rajzolt formákat kell felismernie. Úgy és azt, ahogy a tervező elképzeli: például, hogy négy nem teljesen egyenes vonal kockába rendeződik.

A program több figyelemreméltó tulajdonsággal rendelkezik. Mivel az input nem a végleges változat, hanem skicc, kusza, esetleg girbegurba formákat képes kezelni. Az értelmezés a munkafolyamattal egyszerre, valós időben történik, és előre kiválasztott ikonok, az összetevők azonosítása nélkül teszi lehetővé a komponensek felvázolását. A szoftver általános architektúrát használ a két- és többértelműségek megjelenítésére, majd a rajzkörnyezeti ismeretek segítségével szünteti meg azokat. Különböző (a rajzoló stílusára, a tervrajzokra vonatkozó) ismeretforrásokat használ, és nemcsak a vonalakat ismeri fel, hanem megérti a skiccet is -"tudását" a tervezett eszköz szimulálásával illusztrálja.

Vegyünk egy primitív, néhány vonásból álló skiccet: autó gurul le egy dombról. A RUN-ra klikkelve, a kézzel készített rajz görbe egyeneseit, kusza köreit az ASSIST előbb szabályos vonalakká, kerekekké alakítja, majd a következményeket - a domb aljára érő járművet - szintén ábrázolja. A fizika törvényeit (gravitáció, súrlódás) alkalmazva hozza mozgásba a virtuális világot.

Davis és Alvarado jól informált emberi megfigyelő potenciális viselkedését tekintették modellnek: az illető egyrészt geometriai, másrészt tárgy-specifikus, az adott kontextusra vonatkozó tudással rendelkezik.

Az elemek értelmezése a rajzolással párhuzamosan, egyidőben kezdődik, ami csökkenti a félreértelmezési lehetőségeket, illetve megkönnyíti azok korrigálását. ASSIST több interpretációra, és tárolásukra is képes. Például ha a rajz első fázisában látunk egy kört, még nem tudjuk, minek (autónak, labdának, stb.) lesz a része a későbbiekben. Esetleg hibázunk, ha túl gyorsan döntünk, azaz döntésünket célszerű elhalasztani, s akkor meghozni, amikor az alacsonyabb szintű szerkezetek magasabb szintűekké - és egyértelmű, hogy mivé - alakulnak át. Ám, ha egy adott rész teljesen kész, még akkor se mindig evidens, hogy mihez tartozik majd. Ilyenkor szükséges a mechanikus tervrajzokra vonatkozó "ismeretanyag", háttér- és kontextus-információ. Például egy kör valószínűleg kocsikerékké, és nem emberi fejjé formálódik, és így tovább. ASSIST az okból (a kör) az okozatra (az autókerék) következtet. "Az okok a rajzoló elméjében léteznek, az okozatok a tényleges rajzok" - nyilatkozta Davis.

Christine Alvarado
A szoftver vezérlőrendszere hierarchikus mintasablon-kapcsoló folyamatokból áll össze. Az új információkat permanensen, három szakaszban - felismerés (recognition), következtetés (reasoning), döntés (resolution) - dolgozza fel. A felismerés generálja a skicc adott állapotában elképzelhető összes interpretációt, melyek a következtetés során pontozódnak, és végül csak a legjobb marad meg közülük.

A heurisztikus következtetést befolyásolják az időbeli evidenciák (minél hosszabb ideig változatlan egy forma, annál könnyebben értelmezhető). A program szerint "az egyszerűbb a jobb", és "minél speciálisabb, annál jobb", rendelkezik tárgyismerettel (domain knowledge), és visszacsatolás (feedback) segíti a hibák könnyebb kiszűrését. A kategóriákra (idő, egyszerűség, specifikum, tárgyismeret) és a szituációra (visszacsatolás) vonatkozó evidenciákat is kombinálja, azzal a kitétellel, hogy utóbbiak fontosabbak az előbbieknél.

Döntése meghozatalában az ASSIST Bayes-féle (valószínűségi) elemzést is végez. A programnak ez a része azonban még nagyon kezdetleges, egyelőre csak négyszögeket ismer fel. Davis egyéb geometriai formák észrevételét jelöli meg következő célként. Eldöntendő még, hogy miként egyesíthetők a papír és a digitális médium legjobb tulajdonságai, valamint azt is fel kell mérniük, hogy a rajzolóknak mennyire fontos a szabadkézzel végzett skiccelés, miközben a rendszernek minduntalan alkalmazkodnia kell új felhasználóihoz.

Az eddigi tesztek alapján az ASSIST helyesen értelmezi a legtöbb vázlatot. A rajzolók lassabban és pontosabban dolgoznak vele, mint nélküle, puszta papíron.