A Microsoft nem ismeri a magyarok istenét
További Tech cikkek
- Beperelték a Disney-t, szabadalmi jogokat sérthetett az egeres cég
- Hatalmas bejelentéssorozatra készül az Apple
- Új válság fenyeget: a B-vitamin-hiány már itt van a sarkon, az italpolcok is kiürülhetnek
- Fontos változás jön a Google keresőjében, érdemes résen lenni
- Beperelték a YouTube-ot, súlyos vádakat fogalmaztak meg
Általános közröhej közepette mutatkozott be a héten a Microsoft keresőjébe, a Bingbe épített fordítógép magyar verziója. A vidámság egyik oka, hogy a program titokzatos okokból – fatális adatbázishiba, programozói baklövések vagy vicces kedvű munkatársak – miatt külföldi városok neveire fordítja le a magyar településeket. Ha például valaki azt írja a Bing magyar-angol fordítógépébe, hogy Veszprém, azt kapja eredményül, hogy Las Vegas, míg Mogyoródot Mexico City-nek, Békéscsabát Chicagónak, Hódmezővásárhelyt Lostocknak fordítja a program.
Mint arra a Subba kommentelői rámutattak, vannak üdítő kivételek is, Ózdot például nem Tokiónak fordítja a Bing, hanem „species of StarCraft”-nek, vagyis a számítógépes játékban szereplő egyik fajnak, és előszeretettel használja angol focicsapatok neveit is: Kaposvár a Bing szerint angolul úgy hangzik, hogy West Ham United, Siófok meg úgy, hogy West Bromwich Albion.
Az igazsághoz tartozik, hogy a helységnevek túlnyomó többségét békén hagyja a fordítógép, vagyis Eger Eger, Győr Győr, Szombathely Szombathely marad angolul is. Abból viszont, hogy Szolnok várost úgy fordítja angolra, hogy „navigated to.”, arra lehet következtetni, hogy a fordítógép által használt adatbázis összekeveredhetett egy földrajzi-navigációs adatbázisban tárolt információkkal. A Microsoft magyarországi illetékesei csütörtökön azt mondták, tudnak a problémáról, és dolgoznak a hibák kijavításán.
Arra persze így sincs magyarázat, miért fordítja a Bing a BKV-t úgy, hogy „Mexicana”, és a Szöktetés a szerájból miért úgy van angolul, hogy „Die Entführung aus”, így, „dem Serail” nélkül.
Az általános közröhej másik oka, hogy a Bing a magyar Himnusz első sorát, miszerint „Isten, áldd meg a magyart”, úgy fordítja, hogy „God bless the Unites States”, vagyis hogy Isten áldja Amerikát, és érdekes módon ugyanígy fordítja németre is („Gott segne den USA”), meg oroszra is („Бог благословит Соединенных Штатов”), viszont franciára úgy fordítja, hogy annak semmi értelme ugyan („Prochaine aux États-Unis”), de az Egyesült Államok azért abban is benne van. A jelenség azért is furcsa, mert magát a magyar szót a legtöbbször korrektül, Hungariannek fordítja.
A magyarok istenével mégis lehet valami baj, mert Petőfi Nemzeti dalának egy részlete produkálja minden idők minden fordítógépének legkülönösebb produkcióját: „A magyarok istenére/Esküszünk,/Esküszünk, hogy rabok tovább/Nem leszünk!” a Bing szerint úgy hangzik angolul, hogy „Www.moderatto.Piczo.com, Esküszünk, that we will no longer be swamped!”. Ha kattintunk a magyarok istenének tulajdonított linkre, egy bloggyűjtő oldalon elhelyezett profilképre bukkanunk, ahol megtekinthetjük a magyarok istenét, egy fiatal, kreol bőrú, dús hajú, napszemüveges fiatalembert. Ha ő az, hát ő az.
Mielőtt azonban magyarellenességgel vádolnák a Binget, felhívjuk a figyelmet arra, hogy – mint az egy olvasónk észrevette – a Microsoft fordítógépe nyelvrokonainkkal, a finnekkel sem bánik jobban, Suomit, Finnország finn nevét ugyanis United States of Americaként fordítja angolra. Bár a jelenség pontos magyarázatát nem ismerjük, valószínűleg itt is lokalizációs, illetve adatbázis-probléma okozza a hibát. A Google Translate magyar verziójának indulásakor hasonló jelenségek álltak elő, és sokszor az a fordítógép sem tudott mit kezdeni az angol szó magyarra fordításával.
Google Translate vs. Microsoft Translator
A Google Translate-et tavaly februárban mutatták be, és akkor gyorstesztünkben, ahol a magyar konkurenciával, a Morphologic MorphoWordjével és a Dativusszal hasonlítottuk össze, úgy találtuk, hogy a három közül ez tud a legkevésbé magyarul.
De hogyan állja vajon a versenyt most, egy év finomítgatás után a frissen a Bingbe integrált fordítóval, legnagyobb vetélytársával? Példamondataink a régiek, a Zompist Phrasebookból származnak, és a gépi módszer hiányosságainak bemutatásához csatoltuk az emberi verziót is, amely a gépek által értelmezhetetlen kontextus ismeretében született:
1. Don't you speak English?
Google, 2009: Don't you speak English?
Google, 2010: Nem beszélsz angolul?
Bing, 2010: Nem beszél angolul?
Ember, 2010: Még angolul sem beszélsz?
2. No, I've always enjoyed simple-minded ethnic humor.
Google, 2009: Nem, én mindig is élveztem az egyszerű gondolkodású etnikai humor.
Google, 2010: Nem, én mindig is élveztem az egyszerű gondolkodású etnikai humor.
Bing, 2010: Nem, amit mindig élveztem egyszerű etnikai humor.
Ember, 2010: Mindig is élveztem az együgyű nemzetiségi vicceket.
3. You're very pretty for a foreigner.
Google, 2009: Nagyon szép a külföldit.
Google, 2010: Nagyon szép a külföldi.
Bing, 2010: Te nagyon szép, egy külföldi számára.
Ember, 2010: Ahhoz képest, hogy külföldi vagy, nagyon jól nézel ki.
4. That's got to be silicone.
Google, 2009: Hogy van a szilikon.
Google, 2010: Ez van, hogy szilikon.
Bing, 2010: Ez van, hogy szilikon.
Ember, 2010: Ez biztos szilikonból van.
5. I bet those machine guns are fake.
Google, 2009: Fogadok ezeket géppisztolyok a hamis.
Google, 2010: Fogadok, hogy ezek a géppisztolyok hamisítvány.
Bing, 2010: Fogadok, hogy e géppisztolyok hamisítvány.
Ember, 2010: Azok a géppisztolyok biztos nem is igaziak.
6. Follow that car.
Google, 2009: Kövesse ezt a kocsit.
Google, 2010: Kövesse a kocsit.
Bing, 2010: Kövesse az autó.
Ember, 2010: Kövesse azt az autót!
7. I'm a personal friend of the Ambassador.
Google, 2009: Én vagyok a személyes barátja a nagykövet.
Google, 2010: Én vagyok a személyes barátja a nagykövet.
Bing, 2010: Én vagyok egy személyes barátom a nagykövet.
Ember, 2010: A nagykövet személyes jó barátom.
8. You call this beer?
Google, 2009: Te ezt a sört?
Google, 2010: Ezt nevezed te sört?
Bing, 2010: Ez a sör hívni?
Ember, 2010: Ezt te sörnek nevezed?
Az első meglepetés, hogy a Google fordítógépe az elmúlt egy évben változott valamennyit, bár nem feltétlenül az előnyére. A „Don't you speak English”-t sikerült végre lefordítani, igaz, nem úgy, hogy tükrözze a negatív kérdésben rejlő rosszallást, és a „Nagyon szép a külföldit”-ből eltűnt a tárgyrag – persze anélkül, hogy a fordítás közelebb lenne az eredetihez, de legalább nyelvtanilag helyes a mondat. A „Fogadok, hogy ezek a géppisztolyok...” minőségi javulás a „Fogadok ezeket a géppisztolyok...”-hoz képest, bár a hamisítványt itt sem sikerült többes számba tenni. Nem meglepő, hogy a Google továbbra sem tud mit kezdeni az idiomatikus kifejezésekkel, de ezt egyelőre a magyar fejlesztésű szoftverektől sem lehet elvárni.
A magyarra fordító Bing? Ahhoz képest, hogy egy évvel később indult a Google Translate-nél, a Microsoft fordítója nem is olyan rossz. Máshol, másképp hibázik, mint a Google, az autós példában például lefelejti a tárgyragot, az „e géppisztolyok” esetében meglehetősen archaikus megoldást választ, a harmadik példában a létigét ugyanúgy kifelejti, mint a Google, a negyedikben pedig ugyanúgy beleteszi a mondatba, tehát nem sokkal rosszabb a konkurenciánál.
Az Index-címlap angol nyelvű változataiból viszont kitűnik, hogy a Google fordításai ha nem is szebbek, de pontosabbak és informatívabbak a Bingéinél. A Microsoft fordítója már a Belföld rovat címét is Belföldi járatoknak fordítja, a Külföldöt meg a jellemző amerikai paternalizmussal „Rest of the worldnek”, a világ maradékának. A Bing kedvenc retorikai alakzata láthatóan az ellipszis, vagyis a kihagyás: azt a címet, hogy „Hová ne menjen, aki fél a földrengéstől?”, úgy fordítja, hogy „Where should go, the city?” – azon kívül, hogy ez így nem jelent semmit, nincs benne se félelem, se földrengés, se semmi. A Google legalább megpróbálja. A „Where not to go who is afraid of earthquakes” fordítás helytelen ugyan, de ki lehet belőle hámozni a lényeget.
Azzal a mondattal, hogy „Lendvai Ildikót is meg akarták támadni”, sem a Google, sem a Bing nem tud mit kezdeni. „Ildikó Lendvai also wanted to attack” – fordítja a címet a Google, vagyis „Lendvai Ildikó is támadni akart”, ami pont az ellenkezőjét jelenti az eredetinek. Ennél a megoldásnál, már csak a Bingé viccesebb: „Lendvai also wanted to attack Ildikót”, ami viszont azt jelenti, hogy „Lendvai meg akarta támadni Ildikótot is”. De ha elkövetjük a gonosz Karinthy-féle trükköt, és ugyanazzal a lendülettel visszafordítjuk a mondatot angolról magyarra, a Bing már elő is áll a végső megoldással, miszerint „Lendvai is akart Ildikót támadás”. Ez már legalább semmilyen nyelven nem jelent semmit.