Judit
3 °C
6 °C

Hunglish szótár haladóknak

2006.06.16. 10:40
Szövegkörnyezetükben, az eredeti mondatokkal együtt jeleníti meg az angol–magyar jelentéspárokat a MOKK és az Akadémia online szótára, a Hunglish. De vajon hogy mondják azt magyarul, hogy „You’re right”?

Make coffe, make love, make amends... Végigböngészte már az Országh-féle angol–magyar nagyszótár egy-egy kilométer hosszú szócikkét, hogy megtalálja egy szó vagy kifejezés jelentését? És megtalálta?

Ha nem, próbálja ki az itthon egyedülálló, online és ingyen elérhető Hunglish-t, amely szövegkörnyezetükben jeleníti meg az angol és magyar szavakat, azokkal a mondatokkal együtt, amelyekben leírva már szerepeltek valahol. Makes sense.

A Hunglish teljesen másképp működik, mint a többi ismert fordító- és szótárprogram, a Morphologic, a Dativus Translator vagy a Sztaki szoftverei: ahelyett, hogy egy-egy szóhoz egy vagy több jelentést rendelne, inkább egy nagy méretű, angol és magyar nyelvű szövegekből összeállított adatbázishoz fordul, és kikeresi azokat a mondatokat, amelyekben az adott szó, illetve annak humán erőforrás által gyártott fordítása megtalálható. Így csak véletlenül fordulhat elő, hogy például a szótár az azonos alakú, de más jelentésű szavak közül a rossz megoldást választja (ami a mesterségesen intelligens fordítóprogramokkal gyakran megesik), a szövegkörnyezet pedig segít a nyelvvel küzdőknek abban, hogy maguk is épkézláb szövegeket gyártsanak – legalább olyan jót, mint az eredeti.

Aki alapszavakra kíváncsi, az mégis jobban jár a hagyományos szótárakkal. A „left” szó, amely egyszerre jelent bal oldalt és múlt idejű távozást, az első húsz találat között csak egyszer szerepel az utóbbi értelemben, és bár ebből a szakemberek pompás következtetéseket vonhatnak le a gyakoriságra vonatkozóan, a gyors eredményhez jobb egy miniszótár vagy egy alapfokú ismerős, mint a Hunglish.

Országh Laci bácsi és az ismeretlen fordító

Ha viszont finomságokra, mondjuk a „lófasz” szó angol jelentésére kíváncsi valaki, egy világ tárul ki előtte: a szó szerinti fordítás természetesen értelmetlen, de a Hunglish által felkínált lehetőségek nagyrészt életszagúak és találóak, a szép emlékű Országh Laci bácsi szemérmességéhez képest mindenképpen. (Ehelyt mindenképpen érdemes megemlékezni arról az ismeretlen, túlbuzgó fordítótól, aki a „You’re right” (igazad van) kifejezést „Szent lófasz…”-nak fordította. Köszönjük.)


A tű foka a Hunglishban

Nyilván a fordítások alapjául szolgáló szövegek természetétéből ered, hogy a Hunglish egyes területeken erős, míg másokon szomorúan alulteljesít. A „nyelvtudomány” szóra például mindössze három találatot hoz, az is mind „language engineering”, ami korántsem teljes megoldás; a Bibliából viszont mindent tud, azt is, hogy könnyebb átmenni a tevének a tű fokán, meg azt is, hogy a fenevad száma hatszázhatvanhat.

A Biblia mellett a Hunglish készítői számos más forrást is használtak a jogi és szépirodalmi szövegektől a filmfeliratokig. Az angol mondatokat és magyar megfelelőiket gép illesztette össze – név szerint a hunalign nyelvfüggetlen mondatszintű illesztőprogram.

A 2004 nyarán indított projekt a BME médiakutató intézetének (MOKK) és az Akadémia nyelvtudományi intézetének közös munkája. Varga Dániel, a MOKK számítógépes nyelvésze, matematikus elmondta, hogy a szótár alapját képező szövegtár többek között az EU jogszabályaiból, illetve a Magyar Elektronikus Könyvtárban elérhető magyar és a Project Gutenberg által közzétett angol nyelvű szövegekből állt össze.

"Nem feladata a kiváltásuk. Inkább kiegészítheti őket" – válaszolta Varga arra a kérdésre, vajon kiválthatja-e a Hunglish a hagyományos szótárakat. A kutató szerint a szótár még nincs kész, de ha kijavítják a hibáit, akkor a Hunglishnak az a szolgáltatása, hogy példamondatokat ad a szótári tételekre, kiválóan integrálható lesz bármely már létező szótárba. A másik közvetlen haszna egy ilyen gyűjteménynek, hogy pontosan jelzi az egyes jelentések előfordulásának gyakoriságát, vagyis kiderül belőle, hogy a "red" gyakran jelenti azt, hogy "piros", de csak ritkán azt, hogy "kommunista". "A SZTAKI szótárában a jelentések például egyszerűen ábécérendben vannak felsorolva" – mondta Varga.

A szakember szerint a meglévő hibákat, „göcsörtösségeket” hamarosan ki lehet javítani, így a mostaninál barátságosabb interfész és pontosabb szószedet várja a felhasználókat.