Márta, Flóra
17 °C
27 °C

A Google, a helyesírás és a nép szava

2004. 11. 04. 13:37
| Módosítva: 2009. 04. 02. 19:37
Bár a módszer számos sebből vérzik, sokan használják helyesírási szótárnak a Google-t: kétség esetén bepötyögik a lehetséges szóalakokat, és aztán azt használják, amelyikre több találatot kaptak. Egy magyar programozó hobbiból készített oldala még inkább megkönnyíti ezt a sok nyelvész által szörnyülködve figyelt eljárást.
A Google hejesírás nevű weboldal működése egyszerű: beírunk egy szót vagy kifejezést, a program előállítja a lehetséges helyes és helytelen alakokat hozzá (egybe- és különírás, a hosszú és rövid magánhangzók, ly és j, teljes hasonulások és egyebek szerint), majd a Google, illetve saját cache segítségével meghatározza az egyes alakok gyakoriságát. A program még kipróbálás és fejlesztés alatt áll, így nem tud mindent, de gyorstesztjeinken így is jól szerepelt.

"Poénnak szántam, nem akarok sok időt foglalkozni vele" - mondta az Indexnek a weblap készítője, Cucu, azaz Németh András informatikus. Az indulás óta eltelt két hétben mindenesetre már hatezer látogatója volt az oldalnak, amihez hasonló elven működik a Google-harc is, itt két beírt kifejezést futtat meg egymással szemben a program, azt hozva ki győztesnek, amelyikre több találatot kapott.

A forrás nem a nép

A készítő az oldalon megjegyzi, hogy a módszer nem tökéletes, például az egyelőre-egyenlőre problémát nem lehet vele megoldani, hiszen mind a két változat helyes, attól függően, hogy miről beszélünk, hiába ad a Google az első változatra 159 ezer, a másodikra pedig csak 34 ezer találatot.

A másik probléma az, hogy azért, mert több találatot ad valamire a Google, még nem feltételenül az a helyes alak, legfeljebb elterjedtebb (de még ez sem biztos, hiszen az internet nem reprezentálja tökéletesen a köznyelvet). Az oldal alján apró betűvel azonban hamar elrendezi ezt a kérdést: felhívják a látogatók figyelmét, hogy "a helyesírás kanonikus forrása nem a Google (azaz a "nép"), hanem a Magyar Tudományos Akadémia. Akit az előbbi érdekel, használja nyugodtan ezt az oldalt, akit az utóbbi, keresse fel Balázs Gézát! A kettő viszonyáról pedig kérdezze meg Nádasdy Ádámot!"

A fórum tanúsága szerint különben eddig egyedül a bója-bólya párosról derült ki, hogy a Google-ellenőrzés tévútra viheti a felhasználót, ugyanis a helytelen bólya változatra valamivel több találatot ad.

Szabad szoftver

Az már technikai probléma, hogy a Google a kereséseknél nem veszi figyelembe a kötőjeleket, így például a mozgószabályok kérdésénél nem lehet döntőbírónak használni, tette hozzá Németh András. A programozó szerint később szóba jöhet teljes szövegek ellenőrzése is, amennyiben sikerül valahogy felgyorsítani a Google-használatot, jelenleg ugyanis ez a szűk keresztmetszet.

Németh András a nyelvspecifikus részt elkülönítette a programtól, így már bárki bármilyen nyelvre átalakíthatja azt. A helyesírásellenőrző teljesen szabad szoftver, az oldaról le is lehet tölteni a forráskódot.