További Szoftver cikkek
Megosztott figyelem
A Nemzetközi Űrállomás legénysége komplex tevékenységek sorát, összesen mintegy tizenkétezer műveletet hajt végre: többek között tudományos kísérleteket irányítanak, karbantartják a fedélzeti rendszereket, orvosi vizsgálatokon esnek keresztül, ruházatukat ellenőrzik. Kivitelezésükhöz lépésről lépésre olvassák a laptop képernyőjén megjelenő instrukciókat. Figyelmük megoszlik a feladat végrehajtása és az olvasás, például a vízminta-elemzés és a szöveg görgetése között, miközben eleve mikrogravitációban lebegnek. Sem a szemükkel, sem a kezükkel nem elég hatékonyak.
Miként tudnának kizárólag a feladatra összpontosítani?
Asszisztensként működő teljes mértékben hangvezérelt művelet-böngésző (procedure browser) segítségével - fogalmazták meg a választ a NASA tudósai: "képzeljük el, mennyivel könnyebb lenne egy számítógépes rendszerrel úgy beszélgetni, mintha humán asszisztens, vagy munkatársunk lenne."
Akár a sci-fikben: az űrhajósok egyszer majd robotokkal, computerekkel elegyedhetnek intelligens beszélgetésbe. Egyelőre azonban távol vagyunk ettől; a "virtuális csapattag" csak a kezdet.
Utasítás vagy beszélgetés?
Clarissa az Ames RIALIST (Research in Advanced Language, Interfaces and Speech Technology) csoportja által jegyzett beszédinterfész-projektek egyike. 2003-ban kezdtek el munkálkodni rajta. 2004-ben felvették a kapcsolatot a Xerox Grenoble melletti Európai Kutatóközpontjában dolgozó Jean-Michel Renders-szel. Főként a gépi tanulásban, a nyelvészetben és a szövegkategorizálásban elért eredményeik miatt számítottak rájuk. Bíztak benne, hogy mindezekkel még hatékonyabbá teszik a "nyitott mikrofon" (open microphone) technikát alkalmazó rendszert.
"A NASA azt akarta, hogy Clarissa mesterségesen aktivált utasítások nélkül is bármikor segédkezzen" - meséli Renders. "Így az olyan megoldások nem működtek, hogy a legénység tagjai kérdésfeltevés, vagy utasítás előtt speciális szavakkal jelezzék a computernek: hozzá beszélnek. Meg kellett tanítani arra, hogy különbséget tegyen beszélgetés és utasítás között."
A Xerox módszereivel jobban elemzi a kifejezéseket. Szavakat, mondatokat és a szavak környezetét is felismeri. Többféleképpen elmondott utasításokat ért meg. Bonyolult gépitanulás-algoritmus segítségével súlyozza az információrészeket. Ez teszi lehetővé, hogy sikeresen megkülönböztesse a nem rátartozó csevegést a kifejezetten neki szóló utasításoktól. Korábban tíz százalékot tévedett, a jelenlegi változat kilencvenöt százalékos pontossággal dolgozik. (A szövegnek viszont még zajos környezetben is érthetőnek kell lennie.)
Kapcsolja ki a riasztót!
Természetesen egyelőre nem tesz csodákat. Viszonylag szűkek a lehetőségei: szókészlete kétszázhatvan szóból áll, ami maximum hetvenöt utasítás megértéséhez elég. A későbbiekben mindkét számot szeretnék jelentősen növelni.
"Egyes utasítások nagyon egyszerűek, mások bonyolultak" - magyarázza Hockey. "Sokszor csak annyit kell mondani: 'következő', vagy, hogy 'menjen el a nyolcadik lépésig'. Viszont szükségünk lehet olyanokat is közölni vele, hogy '10.25-kor kapcsolja ki a riasztót'."
Január 13-án installálták az állomáson, először - június 27-én - John Phillips fedélzeti mérnök tesztelte. Mind a beszédfelismerés, mind a dialóguskezelés jól működött.
Hockey és munkatársai elégedettek az eredménnyel.