Kütyütesztnek indult, bolgár farokméregetés lett belőle
További Tech-Tudomány cikkek
Régi vágya az emberiségnek, hogy a bábeli zűrzavar előtti állapotok visszaálljanak, és végre anélkül érthessük egymást, hogy kínkeserves munkával kellene megtanulnunk idegen nyelveket. A Timekettle nevű startup új, Zero elnevezésű, valós idejű tolmácseszköze pont ezt ígéri: elég csatlakoztatni egy külső mikrofont a telefonunkra, telepíteni a hozzá tartozó alkalmazást, és máris megszűnik minden nyelvi különbségekből fakadó kommunikációs gát.
A Timekettle egy kínai cég, ami tavaly azzal robbant be a köztudatba, hogy egy sikeres Kickstarter kampányt követően piacra dobta a WT2 Plus fordító kütyüt. Ez egy két fülesből és egy telefonos alkalmazásból álló, valós időben fordító tolmácseszköz, ami a sajtóvisszhangja alapján meglepően jól fordít.
Ha tényleg megbízhatóan működik ez a technológia, az azt jelenti, hogy itt a jövő.
Egy ilyen eszköz mindent forradalmasíthatna az utazástól kezdve az oktatáson át egészen az üzleti életig. Ha nem kellene nyelveket tanulni, ha nem kellene tolmácsot fogadni, ha hirtelen már nem számítana, hogy milyen nyelvet használunk, az egész világon értenénk egymást, az egy teljesen új korszak kezdetét jelentené. Ettől persze még igen messze vagyunk. A gépi fordítás piaca viszont már most pörög és egyre több befektetőt vonz, 2022-re a becslések szerint 983,3 millió dollárosra duzzadhat.
Az Amazonon a különböző tolmácskütyüket javarészt 100 és 200 dollár (durván 30 és 60 ezer forint) közti áron hirdetik jelenleg. Ehhez képest a Timekettle bemutatkozó eszköze, a WT2 Plus drágának tűnik a maga 220 dolláros árával. Főleg, ha figyelembe vesszük azt, hogy ez az eszköz nem önálló, félig a már meglévő okostelefonunk használatára épül. Az új verziót, a Zerot azonban még most is meg lehet rendelni az Indiegogon 70 dollárért (novemberre ígérik az első példányok kiszállítását). Így ez utóbbi első ránézésre a nyelvi korlátok nélküli jövő kifejezetten olcsó előfutárának tűnik.
Azért ez még nem a Bábel-hal
A Timekettle realtime-ként, vagyis valós idejűként hirdeti az eszközeit. Nemcsak a legújabb Zerot, de a WT2 Plust is. Utóbbit ráadásul az ember fülébe kellett dugni, már csak ezért is adná magát, hogy a Timkettle-cuccokat a Galaxis útikalauz stopposoknak című könyvből ismert Bábel-halhoz hasonlítsuk. Azonban arra már a WT2 Plus tesztelésekor rá kellett jönnünk, hogy messze járunk még attól a technológiától, aminek segítségével én pontosan ugyanakkor hallhatnék valamit magyarul, amikor azt a beszélgetőpartnerem elmondja, mondjuk japánul. Az élmény sokkal inkább hasonlít arra, amikor egy hús-vér ember formáját öltő tolmácsra kell várnunk.
Feltéve, hogy a tolmácsunk kicsit nagyot hall és igazából se magyarul, se japánul nem nagyon tud.
A Bábel-hal
Douglas Adams sci-fijeiből vált ismertté. A Galaxis útikalauz stopposoknak leírása szerint:
"Kicsi, sárga és piócaalkatú, s valószínűleg a legfurcsább lény a világegyetemben. Agyhullám-energián él, mégpedig nem a hordozójáén, hanem azokon, amelyek kívülről érik a hordozóját. A beérkező agyhullám-energiák összes tudat alatti mentális frekvenciáját abszorbeálja, és testébe építi. Majd exkrementumként a hordozója agyába üríti azt a telepatikus mátrixot, amely a tudatos mentális frekvenciák és a hordozó elme beszédközpontja idegi jelzéseinek kombinálásából adódik. Mindez gyakorlatilag azt jelenti, hogy aki Bábel-halat dug a fülébe, az azonnal megért bárkit bármilyen nyelven. A ténylegesen hallott beszédelemek dekódolják azt az agyhullámmátrixot, amelyet a Bábel-hal táplál a hordozója agyába.”
Az igazi Bábel-hallal szemben a Timekettle eszközei nem agy-, hanem ortodox hanghullámokkal dolgoznak. Előbb egy hangfelismerő szoftver konvertálja írott szöveggé mindazt, amit az eszköz tőlünk vagy a beszélgetőpartnerünktől hall. Ezután következik a tényleges fordítás része a dolognak. A laikus szemlélőnek épp ezért, mind a WT2 Plus, mind a Zero esetében úgy tűnhet: valójában egy hangfelismerő eszközt vesz meg, ami aztán egy Google Translate jellegű fordító szoftvert ereszt rá szövegekre.
Mi először a Timekettle korábbi eszközét, a két vezeték nélküli füles-mikrofon egységet használó WT2 Plust próbáltuk ki, és nagyon szerettünk játszani vele.
A legegyszerűbb mondatokat ugyanis többnyire vállalhatóan fordította, ha meg mégse, akkor nagyon jókat lehetett derülni rajta.
Különösebben praktikus vagy szükséges kütyünek azért nem tűnt, mert tényleges beszélgetések fordítására már egyáltalán nem bizonyult alkalmasnak. Arra viszont tök jól rávilágított, hogy miért a telefonhoz csatlakoztatható eszköz irányába mozdultak el a fejlesztők a következő verzióval. Van az a helyzet ugyanis, amikor az ember turistaként a fél karját odaadná azért, hogy egy-egy mondatot ki tudjon nyögni egy olyan nyelven, amit amúgy nem beszél. Ezekben a szituációkban pedig nehézkes és kevéssé életszerű, ha a fülbe dugós eszközt kell használnunk.
Az újabb tolmácseszköz tesztje előtt épp ezért azt gondoltuk, ilyen szituációban pompásan fog működni a Zero. Nem mondhatnám, hogy igazunk lett.
Mintha én lennék az a bizonyos új kapu
Az élet úgy hozta, hogy épp Csehországba kellett utaznom, mire sikerült olyan telefont szereznem, amivel jól működik a Zero (a saját, lassan ötéves, androidos mobilom szóba se jött, hiszen már a csatlakozója sem kompatibilis az USB-C-s kütyüvel). Menet közben arra is rá kellett jönnöm, hogy elég erős teljesítményt követel a mikrofon és az applikáció használata egyszerre. Gyengébb, a követelményeket elvileg megugró telefonokon egyszerűen néhány perc alatt befagyott az egész.
Mivel csehül nem tudok, az utazás tökéletes lehetőségnek tűnt ahhoz, hogy kipróbáljam, szót tudok-e érteni a helyiekkel kizárólag a telefon és a Zero segítségével. Nem fontos filozófiai kérdéseket vagy az asztrofizika legújabb fejleményeit akartam megvitatni, azzal próbálkoztam, hogy útbaigazítást kérjek vagy megtudjam, miből készült egy-egy étel, és mennyibe kerül a hűtőmágnes a csimpolyásnál.
Vagyis csak szerettem volna próbálkozni.
A mutatvány a legtöbbször már akkor kudarcot vallott, amikor azt próbáltam meg elmagyarázni, hogy a telefonomra tessék figyelni, az fog fordítani.
Amikor nem csaltam, és tényleg csak a telefonomra hagyatkoztam, képtelenség volt megértetnem már magát a szituációt. Az utcán, az éttermekben, boltokban általában van egy csomó háttérzaj, így már ott elakadt a tolmácseszköz, hogy azt kábé jól értse, amit én magyarul vagy angolul mondtam. Ebből a felállásból pedig már lehetetlen volt nyerni. Mindenhol csak néztek rám kérdően, hogy vajon mi a fészkes fenét hadonászok egy ki tudja, mit karattyoló telefonnal. Nagyjából tucatnyi tipikus turistaszituációban próbáltam így használni, de egyszer sem volt sikerélményem.
Kénytelen voltam ezért valamivel laboratóriumibb körülmények között is tesztelni.
Mivel a csehországi kiruccanás oka egy nemzetközi konferencia volt, a kávészünetekben egy-egy csendesebb helyen kipróbáltuk bolgár, szerb és ukrán kollégákkal is a bolgár és az orosz, illetve a magyar és az angol nyelvek közti fordítást. (Ukrán és szerb nyelvet sajnos nem lehet választani az appban.)
Vicces félreértések és félrefordítások persze így is akadtak
Amikor azt hittem, hogy a Zero kapcsán a döbbenet összes arcát láttam már, akkor a tolmácskütyü segítségével teljesen véletlenül sikerült belebocsátkoznom bolgárul egy kis farokméregetésbe. Én csak azt akartam mondani, hogy ha a telefont az asztalra teszem, talán jobban működik a fordítás. De az eredeti mondat fordításos részéről a Zero valahogy lemaradt, és miután könnyesre röhögték magukat a bolgár srácok, elmondták nekem, hogy
a bolgár verzió szerint valami egészen mást csaptam ki az asztalra, kifejezetten méregetés céljából.
A csendesebb helyeken, nem turistaszituációban megejtett tesztjeinkkel mindenesetre nagyjából választ kaptunk az alábbi fontos kérdésekre:
Mennyivel fordít jobban a Zero, mint a Google Translate?
Az igazság az, hogy semennyivel. Gondja van az azonos alakú, de eltérő jelentésű szavakkal (pl. sír, dob, fűz, ér stb.), időnként akkor is, amikor a mondatbeli szerepből egyértelmű lehetne a helyzet. A bonyolultabb mondatszerkezeteket nem tudja értelmesen fordítani. Sőt, a magyar nyelvnél a relatíve szabad szórend miatt sokszor tűnt úgy, minta csak egymás után fordította volna a szavakat a teljes mondat értelmétől függetlenül. A nagyon egyszerű, szinte kifejezésként állandósult mondatokkal azért megbirkózik az eszköz, feltéve persze, hogy nem akad el a hangfelismerésnél.
Megakadásjelenségek
A spontán beszédre jellemző jelenségek, amik úgy szakítják meg a folyamatos beszédet, hogy közben a beszéd értelmén nem változtatnak. Tulajdonképpen a beszédképzés részfolyamatainak pillanatnyi hibái. Idetartoznak például a különböző hezitálások (mm, hm, öhm stb.), a töltelékszavak, a szavak elnyújtásai, de a véletlen nyelvtani hibák és a tévesen elkezdett szavak újrakezdései is.
Mennyire érti a Zero, amit mondunk?
Néhány nyelven, például bolgárul és oroszul egész jól. Magyarul sajnos kevésbé, pedig értelemszerűen ezt csak anyanyelvű beszélőkkel teszteltük. Többször előfordult például, hogy a magyar szavak tövét és a toldalékokat külön próbálta meg értelmezni, sikertelenül. Azt se mindig találta el, hogy hol ér véget egy mondat. A tesztjeink során a Zeronak (és amúgy a WT2 Plusnak is) sokszor meggyűlt a baja már a lélegzetvételnyi szünetekkel is. Ha pedig valaki gondolkozott is egy icipicit mondat közben, sosem sikerült jól a fordítás. Arról nem is beszélve, hogy a spontán beszédre jellemző, úgynevezett megakadásjelenségekkel egyáltalán nem tudott mit kezdeni az eszköz.
Az mondjuk pozitívum, hogy mivel átiratot készít a hallott szövegből, és ezt ki is írja a telefon képernyőjén, már a fordítás pillanatában lehet tudni, hogy nem azt fogja hallani a beszélgetőpartnerünk, amit mondani akartunk. Szóval, ha mindketten elég türelmesek vagyunk, próbálkozhatunk addig, amíg legalább a szöveg megértése összejön.
Mennyire valós idejű a Zero fordítása?
Nagyjából annyira, mint vártuk. Attól a pillanattól, amikor a beszélő befejezte a mondanivalóját, addig, amíg a fordítás megjelenik, pont annyi idő telik el, mint amennyit a Google Translate-nél kellene várni. Néha, például ha nem elég erős a wifi vagy a mobilnet, kicsit többet.
Mennyire kényelmes a Zerot használni?
Nem nagyon. Persze legyünk igazságosak: tolmácsra várni sosem kényelmes. A beszélgetést mindig megtöri egy kicsit, ha arra kell várni, hogy valaki más megértse, és aztán le is fordítsa, amit mondunk. Csakhogy, amíg egy tényleges tolmács érti a kontextust és visszakérdez, ha nem értett minket, erre az applikáció egyelőre messze nem képes.
Mire lehet használni a Zerot?
Valódi beszélgetésre és főleg üzleti tárgyalásra, amire a reklámok ajánlják, biztosan nem. Játszani lehet vele, a szerkesztőségben például remek szórakozásnak bizonyult azt nézni, hogy egy-egy mondat hová torzult néhány kör után, amikor elkezdtük a félrefordított mondatokat visszaolvasva újra, meg újra lefordíttatni. Ez ugyanaz, mint amikor az ember a félrefordított mondatokat próbálja meg az eredeti nyelvre visszafordíttatni a Googel Translete-tel, annyival megfejelve, hogy a kisiskolás körbe sugdosós játékok félreértés-faktora is rátesz egy lapáttal.
Bár azt hittük, a Zero a nyelvtudás nélküli turisták megmentője lehet, úgy tűnik, túl sokat reméltünk. Ha külföldön kell megértetnünk magunkat, és telefonunk meg netünk már úgyis van kéznél (hisz ezek mind kellenek a Zero működéséhez), mi továbbra is a Google Translate használatát javasolnánk. Egyrészt ott gépelünk, azaz nem lehet gond a hangfelismeréssel. Másrészt azt legalább mindenki ismeri, így jó eséllyel értik, hogy miért hadonászunk a telefonnal.
(Borítókép: Aradi László / Index)