Sziasztok.
Egy kicsit off leszek, de nem találtam ennél relevánsabb topicot.
Olyanok hozzászólását várnám, aki már felajánlotta valamilyen munkáját(szakdolgozatát, cikkét stb.) valamelyik digitális könyvtárnak.
A díjazással kapcsolatban szeretnék érdeklődni.
A unicode-ba rovásírást belerakatni nehéz lesz, mert tudomásom szerint betelt. Egy-két tompa ékezetes e (vö. Molière) és egyéb kis képként egyszerűbben kódolható, mint UTF-8-ban, de ilyenkor lehet két változatot csinálni: mivel úgyis adatbázisból készül a CGI lekérdezi az adott oprendszert, böngészőt, és annak fényében két különböző oldalt generál: az UTF-8-at ugyanis nagyon kevés böngésző jeleníti meg jól (elég sokat végigteszteltem anno). A magyar kultúrában relatíve gyakrabban használtak közül tényleg csak a franciával van baj (tompa és kúpos ékezetek), mert a németben előforduló cikornyás betűk mind rajta vannak az iso-8859-2-es kódlapon, s így a windows-1250-en is.
A DIA-val semmi gond nincs a stíluslapok szempontjából. Azt írtam, hogy a stíluslapok felvetése nem a te igazad mellett, hanem az ellen volt érv.
OFF
Kösz. Igen, 1996-tól megvan Word-doksiban, odáig könnyebb visszamenni, a korábbiakat talán szkennerrel. De ez még a jövő zenéje. Tudomásom szerint a Nyelvőr nem fizet jogdíjat a cikkekért, de ebben lehet, hogy tévedek. Ez viszont komoly volt.
ON
Rhadamantys,
Azt hiszem a temat lezarhatjuk, hisz nem nagyon kozeledunk.
A HTML elsodleges celja a tartalom volt. A forma csak mellekes - ez az oka a webszabvanyok zurzavaranak, mert ertheto modon rengetegen az anyag formajat is meg akarjak vele szabni.
A szovegek digitalizalasanal szerintem szinten csak a tartalom (a szoveg) a fontos. Elenyeszo esetben izgatja az alkotot es a befogadot a szoveg megjelenesi formaja. Persze ez a nehany kivetel fontos, de HTML-en keresztul kepverset remenytelen atvinni kep alkalmazasa nelkul. Nem a digitalizalas celja, hogy olyan szep legyen mint egy szep konyv. Ez a megjelenites feladata.
Nekem igenis megteszi adott esetben egy text file (ha magyar irodalom, akkor azert ne ascii legyen). Mar volt szerencsem regenyt igy olvasnom a MEK-bol, nem is egyszer. A forma a jo oreg zold betus, fekete hatteru terminalablak. Senkinek sincs goze arrol, hogyan is kene az elektronikus konyvet csinalni, de talan nem is a DIA-nak kellene erre rajonni.
Most akkor a digitalis kiadasnak akkor milyen papikiadasra kell hajaznia, milyen betukeszlettel lesz autentikus? Azt a par dolt betus cirillt a lynx is kihozhatja, de hany magyar iro hasznal ilyet?
Es mindez tenylegesen total akademikus vita, hisz ha letoltom a szoveget, akkor gyonyoruen olvashato lynx-szel is, csak ez a bongeszobol nem elerheto a nyitolapon at. Szoval ott van minden, csak az oldalak nincsenek rendesen strukturalva.
Ha valaki az en cipomben jar, az is nyugodtan hasznalhatja. Egyszeruen tessek a www?.neumann-haz.hu/html cimre csobbanni. [ahol a ? egy szamjegy]. Persze igy en elerek mindent a jogkoveto magatartasra valo felszolitas nelkul. Es Gyurko Laszlo kalozkiadasokbol fogok most mar vagyont keresni.
Konyorgom, ha olvassak az illetekesek, ne tessek atkonfiguralni az Apache-ot!!! Vagy akkor keretik bekotni elobb. Es nem osszekeverni a Javat es a Javascriptet.
Az SGML adatbazis meg kereso azert biztos dicseretes, de hat en olvasni akartam csak munka helyett, meg kozben.
PS: A MEK is jo. En a helyukben surgosen belinkelnem a DIA-n megjelent szovegeket. Veluk is van azert bajom - nincs Word licensem, ami sok mindentol megfoszt.
rumci elismerem, abszolút nem "szakértőként" érvelek, s őszintén, nem is értem, mi az a paleográfiai hűség, én - ha ez nem is derül ki - tényleg betűhűségre gondoltam. De egyáltalán nem értem, miért kellene pdf vagy kép speciális betűk megjelenítéséhez. A unicode gyakorlatilag is alkalmas erre. Lehet, persze, hogy "székely" rovásírás nincs benne (bele kell rakatni az új verzióba :-)) ), de én inkább olyan nagyon gyakori dolgokra gondolok, hogy francia, német, magyar speciális karakterek és görög betűk ugyanazon file-ban egyidőben szabványosan megjeleníthetők legyenek. És a pdf ebből a szempontból semmivel nem jobb, sőt a kereshetősége rosszabb.
Azt meg nem értem, hogy a DIA miért rossz a stíluslapok szempontjából? Ezt légyszíves fejtsd ki bővebben!
Kevés olyan böngésző van, mint a Lynx, hogy annyira unicode-os meg HTML4-es, hogy pl. a cirill betűket szabványosan átírja latinra, hogy meg tudja jelentíteni. (Szerintem a legkorrektebb böngésző.)
A stíluslapok kérdése megint csak azt mondja, hogy rosszul lett kitalálva a DIA, hiszen a stíluslapok éppen arról szólnak, hogy ne legyen formai kódolás a HTML-fájlban, hanem az külön részben a stíluslapok leírásában legyen olvasható, éppen ezért a legrégibb és legbutább browserek is elfogadhatóan megjelenítik a szöveget (nagyobb baj, hogy Netscape alól sokszor nem lehet nyomtatni a stíluslapok kikapcsolása nélkül).
Rhadamanthys, a szöveghűség esetében rendesen kevered a betűhűséget a paleográfiai hűséggel. A betűhűség szerintem szövegkiadásban feltétlen követelmény, bár a kritikai kiadások még ezt sem követelik meg, ugyanis pl. a cz-ket konzekvensen c-nek írják, ami pl. a Juhász Gyula-kritikai kiadások esetében nagy hiba, hiszen épp az ő alkotása idején változott meg ennek a helyesírása, s ennek kutatására a kritikai kiadás alkalmatlan, mint ahogy alkalmatlan sok régi magyar irodalmi szövegkiadás nyelvészeti vizsgálatra a betűhűség meg nem követelése miatt. Az azonban, hogy a kalligrafált vagy egyéb speciális betűket HTML valaha is visszaadja, őrült elvárás. Nem arra való. Ez ugyanis a digitális könyv dolga, erre PDF-et kell használni. HTML-en beül ezeket képként kell/lehet megjeleníteni, bőszen használva az ALT tageket.
Amiket itt most írtam, nem a levegőből veszem, sok ilyen problémán vagyok már túl a Magyar Nyelvőr című folyóirat webesítésében (kétségtelen, hogy nem SGML adatbázis van mögötte, de a szöveg logikus strukturálására tökéletesen alkalmas a HTML is, ráadásul az illusztrációkat, diagramokat, nyelvjárási és régi betűket, idegen betűkészleteket is szép számmal tartalmazó 128 oldal elkészítésére 1-2 hetem és nem ugyanennyi hónapom/évem van).
szvako azt hiszem, igencsak eltér az elvárásunk a gy digitális adattárt illetően. Nekem például nagyon nem megfelelő, éppencsak elégséges, hogyha a megjelenítő "ahogy tudja" alapon jelenít meg dolgokat. A stíluslap és a unicode is arra jó, hogy viszonylag (sajnos még csak viszonylag) pontosan megjelenítse, ha egy szerző teszem azt egy irodalmi alkotáson belül fontosnak tartotta jobbról balra és balról jobbra, színes szingaléz és hátsógót karaktereket keverve leírni a mondandóját.
Számodra viszont gyakorlatilag egy hagyományos ascii text file is megteszi, hiszen az is elég elterjedt, viszonylag megjeleníti a szöveget, ilyen-olyan speckó karakterekkel jelezni lehet a formázás létét. Ha erre vágysz, ott a MEK. Én is szertem, mert hiánypótló, mert rengeteg minden van benne, sőt igyekszem a magam szerény módján hozzájárulni a gyarapodásához. Ámde a lecsupaszított text file egy tényleges könyvvel szemben összehasonéíthatatlan. A digitalizálásnak pedig az lenne a célja, hogy legalább olyan szép legyen, tudja azt a pontosságot (ha kell dőlt cirill betűs kalligrammát is), amit a nyomtatás, és ezen fölül a könnyű kereshetőség lehetőséghét is biztosítsa.
A DIA pedig minden kezdeti gyermekbetegségével együtt igenis nagyon jó irányba mozdult el. Volt a MEk levlistán most egy vita, hogy a vakok szövegolvasó programjai kedvéért hogyan kellene lebutítani a szövegeket. Szerintem viszont nem a minél egyszerűbb, hanem a minél pontosabb szöveg a cél, s ezek megjelenítő (vagy vakok esetében fölolvasó) programjait kell a magasabb igényekhez szabni.
A szabványokat (mint amilyen a HTML 4) azért találták ki, hogy egyértelműen lehessen megjeleníteni mindazt, ami papíron is kinyomtatható. A szabványok közül pedig lehet a legnagyobb közös osztót alapul venni, de én ennek nem azt az oldalát látom, hogy azt mindenki tudja olvasni, hanem azt a hátrányt, hogy ez a digitális szövegek megjelenítését mesterségesen megrekeszti egy elég gagyi szinten. Igazából még a 4.0-ás html szabvány is fejleszthető volna a többnyelvűség szempontjából.
Ezek szerint az unicode kell a 4.0-bol. Hat az (I18N) megy rendesen. Amilyen jol a szoveges megjelenitod tudja, annyira megjeleniti.
Ha meg nem tudja pontosan, akkor a legkozelebbi ertelmes verziora alakitja at.
Olvashato lesz.
A betutipust meg a stiluslapot nem mondhatod komolyan. Bekezdesekre tagolt szovegnek kell atjonnie. Vagy nem?
szvako
Először is: felkértek, azaz elmondták - személyesen! -, mit várnak tőlem. Ezt megfontoltam és igent mondtam. Nagyképű körlevelet sosem kaptam (lehet, hogy tényleg naív lennék?).
Sajnos nem vagyok otthon a nagymúltú kutatóhelyeken (nem teljesen az én hibámból), viszont bizonyára sokhelyütt elférne ennyi pénz.
Szerintem jónéhány ún. digitális halhatatlan _ megérdemli a megérdemelt nyugalmat_, személyszerint a Stálin-ódákat nem gondoztam volna, abban viszont biztos vagyok, hogy ez utóbbi írások idős szerzői fiatal írók számára hoznak létre független pénzalapot, amelyről fiatal írók dönthetnek (kik is a Sztálin-ódák szerzői, akik így fognak cselekedni?:)
szvako ok. ha a keresés is megoldható szöveges felületen, akkor igazad van, ehhez nem értek. A html4 viszont mindenképpen kell a tisztességes unicode-támogatás és a stíluslapok miatt, s bizony még az úgymond "legfejlettebb" böngészők is elég szelektíven támogatják ezeket a funkciókat. Arra például én is kíváncsi vagyok, hogy Linuxon mennyire van egyáltalán unicode-os fontkészlet, s azt milyen kódolással jeleníti meg. pl. ezek a &#nnn(n); megoldások mennek-e. A betűtípusok meg szerintem nagyon platformfüggőek, többnyire úgyis windowsos ttf-eket veszbnek alapul a honlapoknál, amivel nem tudom, hogy egy DOS-os vagy linuxos szöveges böngésző mit csinál. De érdekelne, szóval írhatnál erről.
Az, hogy a megnevezett személyek egy része még csak nem is tud a dologról (hogy ő szakértett). Már a felkérő körlevél (melyet volt szerencsém látni) elárulta, hogy a szervezőknek nem igazán van fogalmuk a szövegkiadás mibenlétéről. A program stábja beérte egy nagyképű körlevél kiküldésével, azután tárgyaltak néhány emberrel és ezzel letudták a dolog szakmai részét. Nem nagyon látom, hogy a stábban kik azok, akinek legalább magyar szakos diplomája volna. Úgy gondolom, hogy a szöveggondozás a bölcsész végzettségű szakember dolga. az informatikus pedig csinálja meg azt, amit kérnek tőle. Régen a nyomdász beleszól a szöveggondozásba? Egyébként nem akarok tovább vitatkozni, annál kevésbbé, mivel erősen érintett vagy a témában. Igaz, hogyan lettél szakértő? Nem akartam személyeskedni, csak felbosszantott az álnaívitásod. A lényeg az: melyik nagy múltú bölcsész kutatóhely álmodhat 300 milliós támogatásról? Mikor éri el egy egyetemi oktató fizetése a digitális hallhatatlanok havi zsebpénzének összegét? Miért lehet hallhatatlan valaki Sztálin-ódákért? És így tovább. Ezzel a vitát a részemről lezártam, elnézést, ha megbántottam valakit.
Rhadamantys! A keresest eddig az osszes internetes kereso megtudta oldani szovegesen.
Huzosabb dolgok is mennek. Pl. ez itt (a forumok).
A lynx HTML konformitasaval nincs gond. Amit lehet szovegesen, az megy. Amit nem az is (imagemap...)
Fog ez a kis atalakitas menni nekik, ha akarjak.
Ugye akarjatok!!!
szvako
PS: Miert kell a szoveghuseghez a HTML 4.0? Ha a kodolas OK, akkor szoveg - szoveg. Mi mas? Legyen ugy tordelve es olyan betutipussal, mint a nyomtatott?
Komolyan kerdezem, nem kekec.
Hát, a Lynx-ről én nem sokat tudok, de abban biztos vagyok, hogy nem a html 4 élharcosa, márpedig a DIA célkitűzései közül a minél pontosabb, szöveghűbb megejelenéshez elengedhetetlen a html 4. Jó, a scriptek nem. ez jogos. Abban egyetértünk, hogy a JS kikapcsolásával is lehetne egy xy-letolt.html-t előhozni, ahol a szerzői jogi figyelmeztetés is van, meg egy link a tényleges file-ra. A keresést persze csak szöveges felületen nem tudom, hogy meg lehetne-e oldani.
Például ez:
"A tagok által kiválasztott szakértőkkel 1998. szeptember 1-jén tartott megbeszélésen tisztáztuk azon elveket és szempontokat, amelyek alapján megvalósul az egységes számítógépes feldolgozás, azaz a művek minél pontosabb szöveggel, formahűen jelennek meg és válnak elérhetővé az Interneten, és megbízható, egyre bővülő adatokat teszünk közzé mind a művekről, mind a szerzőkről, mind a róluk szóló irodalomról.
A szakértők névsora: Ablonczy László, Agárdi Péter, Angyalosi Gergely, Balassa Péter, Balogh Endre, Bárdos László, Bengi László, Bodnár György, Borsos Attila, Buda Attila, Cs. Nagy Ibolya, Csűrös Miklós, Dérczy Péter, Erdődy Edit, Ézsiás Erzsébet, Farkas László, G. Komoróczy Emőke, Görömbei András, Gulyás Zsuzsa, Hafner Zoltán, Honti Mária, Kabdebó Lóránt, Kovács Sándor Iván, Köröspataki Kiss Sándor, Lakatos András, Margócsy István, Monostori Imre, Murányi Gábor, Nagy Eszter, Odorics Ferenc, Pécsi Györgyi, Pomogáts Béla, Pozsvai Györgyi, Radnóti Zsuzsa, Schiller Erzsébet, Stauder Mária, Stuber Andrea, Széles Klára, Szepes Erika, Tarján Tamás, Thomka Beáta, Urbán László, Várady Szabolcs, Vasy Géza, Veres András, Zsoldos Sándor."
Kettő, számomra fontos célt gondolkodás nélkül mondok:
1. szerintem a jövő könyvtára épül, ebben nem csak az akadémia van benne..., a MEK és más internetes orgánumok is.
2. a legfontosabb a keresés. Próbáltál már papíron visszakeresni egy olyan szövegrészt, amelyiknek egy szavára biztosan emlékztél, de az oldalszámra stb. nem?
Kedves Seven, nem értelek: ha szakértettél, akkor bizonyára tudod: nem a technikai oldal minél tökéletesebb kitalálására, hanem a szerzővel való kapcsolattartásra, illetve szöveggondozásra kértek fel. Nincs ebben semmi szemfényvesztés. Vagy téged a digitalizálás elméleti megalapozására kértek volna fel, hogy aztán meg se hallgassanak, és az "új technicisták" véleménye überolja a tiédet?
Hmmm???