További Tudomány cikkek
- Megtalálták a másnaposság felelősét, de nem az, amire eddig gyanakodtak
- Ha nincs vérfrissítés, jönnek a bajok
- Magas rangú katonatiszt tűnt fel a világ legnagyobb hadseregében, de még mindig rejtély, ki irányítja őket
- Végre tényleg megoldódhatott Stonehenge rejtélye
- Még mindig mérgező az 1916-os verduni csata helyszíne
I. rész: Szó, szótár, nagyszótár – elvetemült elméleti alapvetés
I. rész: Szó, szótár, nagyszótár – elvetemült elméleti alapvetés
II. rész: A lexikográfus munkaköri leírása
III. rész: Nagyszótártörténet, avagy mi tart kétszáz évig
IV. rész: Mi végre van és miből a Nagyszótár
A magyar nyelv nagyszótára 1. Segédletek.
MTA Nyelvtudományi Intézet, Budapest, 2006.
(Bevezetők – Tájékoztató a szótár szerkesztési elveiről, szerkezetéről és használatáról – Forrás- és névjegyzékek – Ragozási táblázatok – Rövidítések, lexikai minősítések, szaknyelvi jelölések)
A magyar nyelv nagyszótára 2.
A–azsúroz.
Főszerk.: Ittzés Nóra.
MTA Nyelvtudományi Intézet,
Budapest, 2006.
Index: Legelőször azt írtam föl magamnak, hogy a szótár a szavak tára. Két kérdésem van ezzel kapcsolatban: mi az, hogy szó, meg...
Ittzés Nóra: Mi az, hogy tár [nevet].
Talán világos: az érdekelne, hogy egy lexikográfusnak mi az, hogy szó. A tárból meg az, hogy milyen szótárak vannak.
Hogy mi a szó, meglehetősen nehéz kérdés. Megközelíthetjük grammatikai oldalról, szemantikai oldalról, pragmatikai oldalról vagy a szöveg felől is; a szótárírónak inkább azt a kifejezést kell használnia, hogy lexéma. Lexémának, úgynevezett szótári szónak a nyelvnek azokat a legkisebb, önállóan is használt egységeit tekintjük, amelyek jelentése vagy a használata valamilyen módon már társadalmi érvényűvé vált.
A lexéma tehát nem azonos a beszédben, a mondatban használt szóalakkal, hanem az egyes szóelőfordulásokból elvont nyelvi egység. Nem tekintjük szótárazásra érett lexémának azokat az egységeket, amelyek teljesen alkalmilag, egyedileg használódnak, vagyis nincs mögöttük egyfajta társadalmi konszenzus, amely abban a jelentésben, abban a használatban elfogadja őket.
A lexéma nem feltétlenül azonos egyetlen szóval, lexémának tekinthetjük az olyan szó értékű egységeket, több – rendszerint két, esetleg három – szóból álló szókapcsolatokat is, amelyek nem mondat értékűek, de együtt nyertek el valamilyen sajátos használatot, jelentést, funkciót. Mi úgy mondjuk, hogy értelmezett szókapcsolatok. Idiómáknak, frazémáknak, állandósult szókapcsolatoknak is nevezhetjük őket. Ezek is olyan elemei a nyelvnek, amelyeket a szótáríró úgy egyben értelmez, egységként szótározásra méltónak tekint.
Természetesen vannak olyan szótárak, amelyek a mondatértékű állandósult szókapcsolatokat – szólásokat, szóláshasonlatokat, közmondásokat – is feldolgozzák. A Nagyszótár a lexémák – a szavak, illetve az értelmezett szókapcsolatok – feldolgozására törekszik.
Azért belekerült az első kötetbe az Elekfi-féle nagy ragozási szótár, és a ragokat talán nem tekinthetjük lexémáknak. Vagy ott vannak az önállóan nem használatos elő- és utótagok is, meg az igekötők is.
A különböző nyelvtanok mást és mást tekintenek szónak. A hagyományosabb leíró nyelvészet és – mondjuk – a strukturális nyelvtan ebben eltérhet. Van, aki álszóról, félszóról, egyéb kategóriákról beszél. Mi ezeket azért szótározásra méltó elemeknek tekintjük, hiszen megvan a maguk funkciója, jelentése. Egy sereg szó jelentése nem olyan módon ragadható meg, mint a fogalomszók – a főnevek, az igék vagy a melléknevek – jelentése.
A grammatikai szófajok – kötőszavak, névutók, névelők – jelentését másképp kell megközelíteni. Ezek az egységek vagy önállóan használatosak, vagy nagyon jellemző módon és mindig ugyanabban a funkcióban, ugyanabban a jelentésben – tehát grammatikai, morfológiai, illetve szemantikai szempontból is azonos módon – kapcsolódhatnak össze más elemekkel.
Az önállóan nem használt utótagoknál még abban is vita lehet a különböző nyelvtanok között, hogy szavak vagy szószerű elemek-e – tehát tényleg utótagok, és összetett szóról beszélhetünk –, vagy csak képzőnek tekinthetők. Vagy esetleg – még az is előfordulhat – ragnak. Ezek mögött azért általában szói eredet van – persze a magyar nyelvben a ragok jelentős része mögött is eredetileg önálló szó áll.
És akkor a másik fele, amivé összeáll egy ilyen gyűjtemény?
Mi az, hogy szótár? Miben áll a tár-ság? Ez manapság izgalmas kérdés, mert nagyon sok olyan mű jelenik meg, amelyet szótárnak mondanak, de valójában szólistáról, szójegyzékről, szógyűjteményről van pusztán szó. Az igazi szótárak az általuk kiválasztott anyagról, szókészleti egységről vagy részről – hiszen semmilyen szótárba nem tud belekerülni a teljes szókészlet, minden szótár szükségszerűen válogat, nem is feladata a szótárnak, hogy minden szóról leírást adjon – mindenképpen strukturált, rendszerezett ismeretet adnak.
A jó szótár tulajdonképpen a nyelv leírásának egy sajátos eszköze. Megmondja azt is, hogy milyen információkat képes ezekről a szókészleti egységekről adni. Elsősorban természetesen a lexémák jelentését mutatja meg. Pontosabban a jelentésstruktúráját, hiszen a szavak döntő többségének több jelentése van, és ezek nem véletlenszerű halmazba állnak össze, hanem valamilyen módon fejlődtek egymásból, és összefüggésben vannak egymással.
A jó szótár bizonyos grammatikai információkat is képes adni. Elsősorban a szófajt kell megemlíteni, ami a grammatikai jelentésnek egy nagyon fontos eleme, hiszen az, hogy milyen jelentése lehet, milyen funkcióban, mondatbeli szerepben használhatunk egy szót, arról nagyon sok mindent elárul, hogy milyen szófajba tartozik.
És mitől nagyszótár a Nagyszótár, azonkívül, hogy nagy szótár?
A nagyszótár egy értelmező szótári műfaj. Hagyományosan a betűrendhez igazodik – a legtöbb szótár ehhez igazodik, ez nagyon klasszikus szempont –, és ezen belül is alkalmaz egyfajta struktúrát, talán gazdagabbat is, mint más értelmező szótárak.
A mi szótárunk azzal, hogy minden feldolgozott jelentést, értelmezett egységet példamondatokkal illusztrál, adatol, nagyon sok mindent el tud árulni a lexéma használatáról, más szavakkal való jellemző együttállásáról is, tehát nagyon gazdag információanyagot ad.
Talán a címszavak számát tekintve nem olyan nagyon nagy a Nagyszótár, bár más magyar értelmező szótárak – a Magyar értelmező kéziszótár és a hétkötetes A magyar nyelv értelmező szótára – címszószáma jóval kisebb, de azért léteznek olyan szótárak, mondjuk, az Erdélyi magyar szótörténeti tár, amelyekben több címszó van, de ezeknek a szótáraknak a szerepe és a feldolgozási mélysége nem olyan, mint a Nagyszótáré. A Nagyszótár attól nagyszótár, ahogyan feldolgozza az egyes szavak jelentéseit.
Fotók: Barakonyi Szabolcs
Ehhez a gazdagsághoz, feldolgozási mélységhez hozzá tartozik a Nagyszótár utalózási rendszere is. Például az összetett szavak lineáris elrendezése nem szükségszerű velejárója egy szótárnak, illetve még ebben az esetben is nagyon érdekes, hogy melyek azok az egyszerű szavak, amelyek összetételi formában is megtalálhatók a szótárban.
Ráadásul a hagyományosan használt úgynevezett önálló szócikkek és utaló szócikkek mellett bevezettünk egy új szócikktípust is. Ezek az úgynevezett bokrosított szócikkek, amelyek nálunk nem tipográfiai szempontok alapján szerveződnek, mint, mondjuk, az Értelmező kéziszótárban, ahol csak a tipográfiai elrendezés bokrosított.
Ebben a szócikktípusban azokat az összetett szavakat dolgozzuk fel, amelyek elemei nagyon sztereotip módon kapcsolódnak össze, és könnyedén megérthető az előtagot és az utótagot alkotó szó jelentéséből az összetétel jelentése is, tehát az összetétellé válás nem hozott létre olyan jelentésmódosulást, ami miatt önálló értelmezésre szorulna a szó. Adatoljuk őket, értelmezzük vagy az előtagot, vagy az utótagot, attól függően, hova soroltuk az összetételt, de az összetétel maga nem kap önálló jelentésstruktúrát. Ezzel mentjük kicsit a menthetőt is, hiszen szerettünk volna azért mennyiségileg is nagyobb szótárt csinálni.
Hogyan mondja meg egy szótárkészítő, amikor számba veszi egy szónak a jelentéseit, hogy ez itt már egy másik jelentés?
Ez az egyik legnehezebb és legizgalmasabb része a szótárkészítésnek. A lexémák jelentése mindig egy kicsit elvont. A „társadalmilag elfogadott jelentés” azt jelenti, hogy az a jelentés a nyelvet használó sok-sok ember tudatában közös jegyekkel rendelkezik. A lexikográfusnak az a feladata, hogy megállapítsa, részben a saját nyelvi kompetenciája alapján, ezeket a közös jegyeket.
Mi korpusszal dolgozunk, tehát rendelkezésünkre áll egy szöveggyűjtemény, és abban az adott szónak – optimális esetben – sok-sok előfordulása, ezekből a kontextusrészletekből kirajzolódik, hogy jellemzően mikor és hogyan fordul elő ez a szó. Ez részben tapasztalat, ismeretanyag, felkészültség kérdése is, és nagyon gondos, elemző munkát feltételez. Nagyon sok adatot kell ahhoz átnéznie az embernek, hogy valamelyest biztonsággal mondhassa, hogy itt már egy új jelentéssel van dolga.
Tehát, ha egyszer fölbukkan egy valamiféle értelemben használt szó, mondjuk, egy írónál, egy valamiben...
Az valószínűleg nem elég. Ha kevés az adat, az kérdésessé teszi, hogy valóban lexikalizálódott szóról vagy jelentésről van-e szó. A régiségbe visszanyúlva persze a kevés adat is értékes lehet. Régi szavaknál sok olyan jelentéssel találkozunk, amelyre a mi időhatáraink között néhány adat van csak, de korhatáron kívül visszamenve, tehát az 1772 előtti irodalomban találunk szép számban adatot. Vagyis a mi időintervallumunkban azért kevés az adat, mert ott van a szó életének a vége, attól kezdve már egyre kevésbé használták.
A másik korszakhatárnál ugyanez a helyzet. Most egyelőre 2000-ben zártuk le az anyagot, nagy valószínűséggel, mire a szótár megjelenik, ezen módosítanunk kell. De amikor tudjuk, hogy 2001-ből, '2-ből, '5-ből is vannak adatok, még ha éppen csak megjelent a korszakhatáron belül, akkor azt is dokumentáljuk.
Általában a különböző korpuszaink – a hagyományos cédulán gyűjtött anyag, az elektronikus formában a mi céljainkhoz gyűjtött anyag (a Magyar történeti szövegtár) és a kiegészítő cédéadatbázisunk – együtt mutatnak valamilyen képet. A harmadik korpuszt, a kereskedelmi forgalomra készült cédéket azért kezdtük el használni, mert kevés volt a mi saját korpuszunk. Szótárazva voltak jelentések, meg az ember tudja, hogy ez a szó vagy ez a jelentés létezik, de nem volt adatunk. Nagyon fájlaltuk volna, ha nem tudjuk adatolni ezeket a szavakat, tehát elkezdtük így is kiegészíteni az anyagot.