![](https://indexadhu.hit.gemius.pl/redot.gif?id=nSCbubuYpDWJZLZs0TssLrbt33Lk5kbipuiZrkg89G3.g7/stparam=skrjjshgja/fastid=eeorncrnbsilkneetelidigetojp/nc=0)
További Szoftver cikkek
Make coffe, make love, make amends... Végigböngészte már az Országh-féle angol–magyar nagyszótár egy-egy kilométer hosszú szócikkét, hogy megtalálja egy szó vagy kifejezés jelentését? És megtalálta?
Ha nem, próbálja ki az itthon egyedülálló, online és ingyen elérhető Hunglish-t, amely szövegkörnyezetükben jeleníti meg az angol és magyar szavakat, azokkal a mondatokkal együtt, amelyekben leírva már szerepeltek valahol. Makes sense.
A Hunglish teljesen másképp működik, mint a többi ismert fordító- és szótárprogram, a Morphologic, a Dativus Translator vagy a Sztaki szoftverei: ahelyett, hogy egy-egy szóhoz egy vagy több jelentést rendelne, inkább egy nagy méretű, angol és magyar nyelvű szövegekből összeállított adatbázishoz fordul, és kikeresi azokat a mondatokat, amelyekben az adott szó, illetve annak humán erőforrás által gyártott fordítása megtalálható. Így csak véletlenül fordulhat elő, hogy például a szótár az azonos alakú, de más jelentésű szavak közül a rossz megoldást választja (ami a mesterségesen intelligens fordítóprogramokkal gyakran megesik), a szövegkörnyezet pedig segít a nyelvvel küzdőknek abban, hogy maguk is épkézláb szövegeket gyártsanak – legalább olyan jót, mint az eredeti.
Aki alapszavakra kíváncsi, az mégis jobban jár a hagyományos szótárakkal. A „left” szó, amely egyszerre jelent bal oldalt és múlt idejű távozást, az első húsz találat között csak egyszer szerepel az utóbbi értelemben, és bár ebből a szakemberek pompás következtetéseket vonhatnak le a gyakoriságra vonatkozóan, a gyors eredményhez jobb egy miniszótár vagy egy alapfokú ismerős, mint a Hunglish.
Országh Laci bácsi és az ismeretlen fordító
Ha viszont finomságokra, mondjuk a „lófasz” szó angol jelentésére kíváncsi valaki, egy világ tárul ki előtte: a szó szerinti fordítás természetesen értelmetlen, de a Hunglish által felkínált lehetőségek nagyrészt életszagúak és találóak, a szép emlékű Országh Laci bácsi szemérmességéhez képest mindenképpen. (Ehelyt mindenképpen érdemes megemlékezni arról az ismeretlen, túlbuzgó fordítótól, aki a „You’re right” (igazad van) kifejezést „Szent lófasz…”-nak fordította. Köszönjük.)
![](http://index.hu/cikkepek/0606/tech//tu450.jpg)
A tű foka a Hunglishban
Nyilván a fordítások alapjául szolgáló szövegek természetétéből ered, hogy a Hunglish egyes területeken erős, míg másokon szomorúan alulteljesít. A „nyelvtudomány” szóra például mindössze három találatot hoz, az is mind „language engineering”, ami korántsem teljes megoldás; a Bibliából viszont mindent tud, azt is, hogy könnyebb átmenni a tevének a tű fokán, meg azt is, hogy a fenevad száma hatszázhatvanhat.
A Biblia mellett a Hunglish készítői számos más forrást is használtak a jogi és szépirodalmi szövegektől a filmfeliratokig. Az angol mondatokat és magyar megfelelőiket gép illesztette össze – név szerint a hunalign nyelvfüggetlen mondatszintű illesztőprogram.
A 2004 nyarán indított projekt a BME médiakutató intézetének (MOKK) és az Akadémia nyelvtudományi intézetének közös munkája. Varga Dániel, a MOKK számítógépes nyelvésze, matematikus elmondta, hogy a szótár alapját képező szövegtár többek között az EU jogszabályaiból, illetve a Magyar Elektronikus Könyvtárban elérhető magyar és a Project Gutenberg által közzétett angol nyelvű szövegekből állt össze.
"Nem feladata a kiváltásuk. Inkább kiegészítheti őket" – válaszolta Varga arra a kérdésre, vajon kiválthatja-e a Hunglish a hagyományos szótárakat. A kutató szerint a szótár még nincs kész, de ha kijavítják a hibáit, akkor a Hunglishnak az a szolgáltatása, hogy példamondatokat ad a szótári tételekre, kiválóan integrálható lesz bármely már létező szótárba. A másik közvetlen haszna egy ilyen gyűjteménynek, hogy pontosan jelzi az egyes jelentések előfordulásának gyakoriságát, vagyis kiderül belőle, hogy a "red" gyakran jelenti azt, hogy "piros", de csak ritkán azt, hogy "kommunista". "A SZTAKI szótárában a jelentések például egyszerűen ábécérendben vannak felsorolva" – mondta Varga.
A szakember szerint a meglévő hibákat, „göcsörtösségeket” hamarosan ki lehet javítani, így a mostaninál barátságosabb interfész és pontosabb szószedet várja a felhasználókat.
![](https://indexadhu.hit.gemius.pl/redot.gif?id=nSCbubuYpDWJZLZs0TssLrbt33Lk5kbipuiZrkg89G3.g7/stparam=skrjjshgja/fastid=eeorncrnbsilkneetelidigetojp/nc=0)