Titok marad a megfejthetetlen kézirat
További Tudomány cikkek
A XV. századi Voynich-kézirat azóta izgatja a kriptográfusok és történészek fantáziáját, hogy 1912-ben felfedezték. Hogyisne, hiszen egy máig érthetetlen nyelven írták, és meghökkentő ábrák láthatók benne: ismeretlen növények, sosem látott asztronómiai együttállások, valamint megdöbbentő ábrák sárkányokról és nőknek készített zöld fürdőkről.
Két számítógép-tudományi szakértő – Grek Kondrak, a természetes nyelvfeldolgozás professzora és végzős hallgatója, Bradley Hauer – 2016-ban mesterséges intelligenciával dekódolták a kéziratot, megfejtve, hogy az ősi szöveg héber nyelven íródott. Legalábbis erről számolt be az összes nagyobb hírportál, köztük az Index is.
Ennek ellenére a kriptográfusok úgy látják, hogy a Voynich-kézirat a két kutató munkája után is pontosan ugyanolyan értelmetlennek tűnik, mint eddig. Csak annyival lett tisztább a kép, hogy Kondrak és Hauer munkájának köszönhetően kiderült: a kézirat még annál is sokkal bonyolultabb, mint korábban feltételezték.
Kezdetben vala a nő
Gyorsan fussuk át, hogy milyen módszerrel dolgozott Kondrak és Hauer. Az algoritmusokkal feldolgoztatták az Emberi és Polgári Jogok nyilatkozatát – egy dokumentumot, amit 380 nyelvre fordítottak le. Az algoritmus ennek alapján megismerhette a különböző nyelvekhez kapcsolódó szabályokat, és a statisztikai analízis módszereivel fel is ismerhette azokat. Kondrak és Hauer abból a hipotézisből indultak ki, hogy a szöveget alfagramokból (a betűket ábécésorrendben leíró anagrammákból) áll; ezeknek a megfejtéséhez újabb algoritmust terveztek. Ezután kapták azt az eredményt, hogy a kéziratot héberül írhatták.
Az eredmény mindkét kutatót meglepte; a Voynich-kézirat szakértői korábban arra gyanakodtak, hogy a szöveg arabul lehet. Az algoritmussal lefordított szöveg szavainak 80 százaléka megtalálható héber szótárakban, csak éppen azt nem tudni, hogy ezeknek van-e együtt értelme. A szöveg első mondata a kutatók módszerével lefordítva a következő:
[A nő] ajánlásokat tett a papnak, a ház urának, nekem és az embereknek.
Érdekes nyitómondat egy középkori kéziratnak, de tény, hogy van értelme. Viszont ez még nem jelenti azt, hogy sikerült megfejteniük a szövegek értelmét.
Van olyan jó eredmény, mint a többi
A megfejtéssel előálló bejelentők sosem kommunikálják egyértelműen, hogy nem sikerült az egész szöveget lefordítaniuk. Ez lehet az oka, hogy néhány évente – sőt, néhány havonta! – felröppen a dokumentum megfejtésének híre. A mostani esetben az első félreértés az volt, hogy ez egy vadonatúj hír, holott az eredeti tanulmány – Decoding Anagrammed Texts Written in an Unknown Language and Script – már 2016-ban megjelent, de csak egy tavalyi konferencián mutatták be. A sajtó azután kapta föl a témát, ahogy az alaphír a tudományos magazinokból átszivárgott a mainstream médiába.
Lisa Fagin Davis, a Medieval Academy of America igazgatója szerint máig nincs konszenzus abban, hogy milyen nyelvű a kézirat; a lehetséges megoldások között szerepel az arab, az azték, a latin és az olasz is. Az is csak interpretáció kérdése, hogy a titkosított nyelvben 25 vagy 30 karakter található-e. A szakértők legfeljebb abban értenek egyet, hogy a szöveg balról jobbra íródik, de a titkosítás módszeréről már megoszlanak a vélemények.
Egyesek szerint a kézirat szerzője behelyettesítéses módszert (substitutional cipher) és monoalfabetikus kódokat használt; ilyenkor a betűket egy másik betűvel vagy számmal helyettesítik. De ez is csak feltételezés: Kondrak és Hauer például abból indultak ki, hogy a szöveget alfagramokkal kódolták. Hogy így is értékelhető eredményt kaptak, annak a mássalhangzók és magánhangzók változatlan aránya az oka. Ezért, valamint a (Google Translate-tel) lefordított példamondat miatt állíthatták, hogy kézzelfogható eredményt értek el. (Arra nincs magyarázat, hogy egy héber nyelven írt dokumentum rejtjelezéséhez miért nem a héber írásmódhoz kifejlesztett titkosítást használtak, mint amilyen az atbas.)
A másik félreértett állítás az volt, hogy Kondrak és Hauer mesterséges intelligenciát használva fejtették meg a kéziratot. Nos, a kutatók valóban számítógépeket használtak, de ez nem mesterséges intelligencia volt. Az algoritmusuknak semmi köze nem volt a mély tanuláshoz (deep learning) vagy a neurális hálózatokhoz, annál több a statisztikai analízishez.
A végeredményt nézve ez mindegy is: a Voynich-kézirat van annyira titokzatos, hogy már egy részeredmény is elég a világhírhez. Shlomo Argamon professzor, az Illinois Egyetem számítástudományi tanszékének nyelvészprofesszora szerint az előzetes eredményekre
mondhatjuk, hogy megkérdőjelezhetők, de nem sokkal jobban, mint azok a gyakran publikált eredmények, amik időnként megjelennek a tudományos folyóiratokban.
Hogy akkor mi a kifogás? A kriptográfiai szakértők szerint az, hogy a két kutató módszertanában túl sok a feltételezés és a felületes megállapítás. Úgy tűnik, a tudományos módszertan kérlelhetetlensége kevésbé izgatta őket, mint az, hogy látható eredményt érjenek el.
Néhány probléma, amit a szakértők kifogásolnak:
- A szövegértelmező algoritmust modern nyelvekkel ismertették meg. Ennek alapján az algoritmus felismerhet bármilyen bedigitalizált nyelvet. Csakhogy a Voynich-kézirat a XV. században íródott. Vagyis a fordításnál XV. századi héber szöveget kéne kapnunk, aminek teljesen más volt a szókincse, a nyelvtana és az írásmódja, mint a ma írt és beszélt héberé. Különösen egy olyan kézirat esetében – mondja Davis – mint a Voynich, ami a Bibliával és más liturgikus dokumentumokkal szemben tudományos munkának tűnik.
- Az algoritmus a nyelv valószínűségét nem minősítette. Kondrak és Hauer algoritmusa a kiértékelés során a héber nyelvnek adta a legtöbb pontot. Az viszont nem vizsgálták, hogy az adott nyelv használatának mekkora a valószínűsége, pedig ez nagy mértékben változtathatott volna az eredményeken. A magas pontszámot kapott nyelvek között szerepel például a maláj is, ami egy, a hébertől gyökeresen különböző nyelv.
- A kutatók feltételezték, hogy a szöveget anagrammákkal vagy behelyettesítéses módszerekkel titkosították. Ezt Gordon Rugg 2004-es tanulmányával indokolták, aki előállt azzal az ötlettel, hogy a szöveg külalakja alfagramokat idéz. Ez más Voynich-kutatók és kriptográfusok fejében is megfordult: erre a következtetésre jutott a Voynich-szakértő Philip Neal is. De ez nem bizonyított tény, csak egy hipotézis.
- A mindenhol idézett példamondatot a Google Translate nem egyszerűen kiadta: úgy kellett kitaposni belőle. A tanulmányban Kondrak és Hauer leírták, hogy először nem találták túl koherensnek a szöveget, de több gépelési hibát javítottak benne, hogy jobban hasonlítson a héber szavakhoz. Csak ezután fordíttatták le a mondatot a Google Translate-tel. Így jött ki a kézirat nyitómondata.
- Héber nyelv és anagrammák – milyen kényelmes! A héber egyike az abdzsád nyelveknek; ezeknek az írott változatában nem jelölik külön a magánhangzókat. Ha viszont feltételezzük, hogy a kézirat szövege héber, és anagrammákkal írták, sokkal könnyebbé válik a fordítása: csak tetszés szerinti sorrendben használjuk a megfejtett karaktereket, és olyan szót rakunk ki belőlük, amilyet akarunk.
Szent Grál volt, az is marad
Az eset kapcsán megszólaló kriptográfusok épp ezért nem tartják áttörő jelentőségűnek a Kondrak–Hauer-páros munkáját. Mentségükre legyen mondva, hogy ők sem annak szánták, csak most, hogy a média felkapta a témát, világszerte vezető hír lett egy értékelhető részeredményből.
Hogy nem jártak sikerrel, az nem jelent kudarcot: az elmúlt száz évben egy kriptográfus sem állt elő jobb eredménnyel, de ez nem tartotta vissza őket attól, hogy könyveket írjanak a témáról. Legutóbb Nicholas Gibbs, a középkori kódexek szakértője dobta piacra a sajátját: ebben azt fejtegette, hogy a kézirat szövegezése nagyon hasonlít a kódexekben használt rövidítésekhez, így nem titkosított nyelvként, hanem rövidítések sokaságaként kéne értelmezni.
A kriptográfusok egyébként is gyakran elkövetik azt a hibát a kézirat dekódolásánál – írja a Cipher Mysteries szerkesztője és a kézirat szakértője, Nick Pelling–, hogy feltételezik, hogy
- az általuk használt átirat tökéletesen megbízható;
- a saját módszerük használata miatt nem kell a rejtett félrevezető megoldásokkal foglalkozni, amik a visszafejtést akadályozzák meg;
- az összevetéshez használt szövegek jellege megegyezik a kézirat szövegének jellegével;
- az egyszeri kódoláson kívül máshogy nem változtattak a szövegen;
- a légből kapott, hipotézisekre támaszkodó átírási módszerek, amit épp tesztelnek, pont a Voynich-kéziratra alkalmazható;
- a titkosítás feloldása esetén a kézirat összefüggő, értelmes szöveg lesz.
Ez, illetve az együttműködés helyett a saját szakállukra dolgozó, a saját megoldásaikat erőltető kriptográfusok öntörvényűsége hátráltatja, hogy valaha is megtudjuk, miről szól a kézirat. Hiába, ez a titkosított kéziratok Szent Grálja, és mindenki a magáénak akarja a megfejtést. Az ő érdekükben remélhetjük, hogy a szövegnek van értelme, nem csak értelmetlen jelek és nagyon furcsa rajzok összefüggéstelen halmaza az egész.
Mert ez sem zárható ki: a Voynich-kéziratban, szemben más középkori kódexekkel, egyáltalán nincsenek elírásra utaló javítások. És ha van nyelv, amit soha nem kell javítani, az a halandzsa.