Tanulmányok

„bejáratok […] az univerzumba”

Horváth Iván meghatározó befolyással volt és van a tudománnyal kapcsolatos nézeteimre. A hetvenes években – első tanítványai között – szegedi bölcsészként jártam hozzá nevezetes hétfői speciális kollégiumára, ahol forradalmi módon elemeztünk kötetkompozíciókat a kor legmodernebb elméleti szakirodalma alapján. Elitképzés folyt olyan kiválasztottaknak, akik maguk akartak kiválasztódni. A témákra mindenki felkészült. Gyakran meghívott vendégelőadókat is, hogy az adott téma legnagyobb tekintélyű szakértői tartsanak előadást. A tekintély szellemi értelemben értendő. Amikor a középkori ars praedicandi kezdett érdekelni, elvitt a legnagyobb szaktekintélyhez, a félelmetes1 Tarnai Andorhoz, az MTA Irodalomtudományi Intézetébe. Vég nélkül sorolhatnám Horváth Iván „tanítási” módszereit: a Szeged–Budapest vasútvonalon elhangzott beszélgetésektől a lakásán tartott szemináriumokon keresztül a kézirataimon végzett szigorú javításokig, amelyekből megtanulhattam, hogyan kell szakszerűen dolgozatot, tanulmány írni.

De a legfontosabb mégis az az állandó ösztönző hatás, ahogyan a legfrissebb szellemi áramlatokat ismertette és kreatív módon azonnal alkalmazta a mi tudományunkra. Rendkívül érzékeny volt, és az ma is: korát megelőzve ismer fel olyan irányokat, amelyeket kevesen. 1978-ban „megsejtette”, hogy szövegek digitalizálása, számítógépes programokkal való feldolgozása teljes átalakulást fog jelenteni a bölcsészettudományokban (is).2 Az új médium új, elképzelhetetlen lehetőségeket hoz majd. Ezt akkor is megtapasztaltam, amikor a lexikon-, majd szótárszerkesztés lett a kenyerem.

A fentiek érzékeltetésére arról írok, hogyan alakítja át a szótárírást, a szótárszerkesztést a digitalizáció, melynek hatását Horváth Iván 40 évvel ezelőtt felismerte. Digitalizáción azt a folyamatot értem, amelynek eredményeként a digitálisan rögzített szövegek – valamilyen szabványos jelölőnyelv alkalmazásával – olyan többletinformációkat is elérhetővé tesznek, amelyeket a szöveg önmagában nem tartalmaz. A digitalizáció ebben a tágabb értelemben több mindent is jelent: hozzáférést egy készülő új mű (szótár) szerkesztéséhez rendelkezésre álló digitális forrásanyagokhoz, szövegkorpuszokhoz; a célhoz kiválasztott, gondos előmunkálatokkal előállított adatbázisokhoz. Jelenti a géppel feldolgozott adatbázisok használatát, magát az elektronikus rögzítés módját, szoftverkörnyezetét és a speciálisan erre a célra kifejlesztett szövegszerkesztőt is. A szótárszerkesztés átalakulása a digitális korban céladatbázisok, megtervezett adatbázisok, jelölőnyelvi adatformátumok használatával készülő új kiadványokra vonatkozik.

1990 óta a szótárak számítógépes programok segítségével készülnek: speciális szövegszerkesztők, szótárkészítést elősegítő szoftverek, adatbázisok, paralel korpuszok, nemzeti korpuszok használatával. Az így készült szótárak többet tudnak, mint a csak ember által szerkesztett művek.

A kódolt szöveg (SGML, XML) egységes, standard és számos fölös (azaz lényegesen több, mint ami az adott célhoz elégséges lenne) információt tartalmaz, ami biztosítja az adatok hosszú távú, egységes megőrzését, az adatállomány fenntarthatóságát. Lehetővé teszi a publikálást a ma ismert valamennyi felületen (könyv formátum, internet, mobileszközökre készült alkalmazások, szoftverbe beépíthető, annak képességeit bővítő vagy módosító kiegészítő modult stb., internetes böngészőben kereshető funkciók).

A digitális tartalmak létrehozása, szerkesztése is átalakult: feldolgozott, előkészített nyelvi adatbázisok, források állnak rendelkezésünkre.

A szótári szócikkek szerkezete, megjelenése jelentősen megváltozott.

A nyomtatott szótárak korában a szócikkek a nyomtatott médium használatának figyelembevételével készültek. Összefoglalják a címszóra vonatkozó legfontosabb információkat, a címszó helyettesítésére tildéket használnak, a tipográfiai kialakításakor a sorról sorra olvasást tekintik a legfőbb szempontnak, a jelentésváltozatokat arab számmal tagolják, az álló és dőlt betűtípus szolgálja a forrás- és célnyelv elkülönítését. A szótár nyelvezete, a szócikk felépítése a hagyományos szótárhasználat ismeretanyagára épít, feltételezve, hogy az olvasó (használó) képes az adott információkat értelmezni és használni.

Egyes szakmák gyökeres változásokat hozó fordulópontjai gyakran köthetők konkrét, forradalmi tetthez. Számomra és a szótárkészítői szakma számára is ilyen történelmi pillanat volt, amikor 2012. november 5-én a brit Macmillan Kiadó – ereje teljében – bejelentette, hogy 2013-tól nem ad ki többé nyomtatott szótárat. A lexikográfusokat, szótárírókat, nyelvészeket szinte sokkolta a hír. Adam Kilgariff – a szakma elismert tekintélye – azonban örömmel fogadta: A day of liberation for the straitjacket of print!3 A digitális médium révén a szótár kiszabadult a nyomtatott könyv kényszerzubbonyából.

Megindultak a változások. A digitális kiadásnál nem kell takarékoskodni a hellyel, a szócikk sokkal tagoltabb, áttekinthetőbb. A kiejtés meghallgatható a hangszóró ikonra kattintva. A forrásnyelv fekete, a célnyelvi megfelelők más színnel jelenhetnek meg. Nincs szükség tildére.

A médium változása a megjelenítésre is hatással van. A hagyományos kiadványoknál a szótár és a szócikk méretéhez igazodva kellett kialakítani a felhasználó számára élvezhető formát a tipográfiai jellemzők (betűnagyság, tükörméret, oldalméret stb.) figyelembevételével. A digitális korszakban a megjelenítést nem befolyásolják a nyomtatott oldal korlátai. Az olvashatóság és használhatóság ugyanolyan elvárás, mint korábban, de ugyanannak a tartalomnak egyszerre többféle médiumra is alkalmasnak kell lennie: kisebb képernyőn, táblagépen, mobileszközön sem sérülhet a szótár használati értéke. Az ún. reszponzív design alkalmazásával a szócikkek bármilyen méretű eszközön és képernyőn jelennek is meg, „áttördelődnek”, és élvezhetően olvashatók, használhatók.

Sok szótárszolgáltatás él a megnyitható hivatkozás, illetve további, releváns tartalmakhoz való hozzáférés lehetőségével és ennek felkínálásával. A szócikkek nézete a netes felhasználási szokásból indul ki: a felhasználó először látni akarja a keresett információ szerkezetét, mennyiségét, és saját igényei szerint megy mélyebbre, keres, kattint tovább. Az új, digitális szótárak élnek az új médium adta lehetőségekkel: a jelentés vagy példamondat, kifejezés stb. után egy buborékban olvasható egy pluszjel után a következő példamondat, még több példamondat, szinonimák. Egy-egy címszó esetében viszonylag nagyszámú, tovább nyitható tartalmat lehet feltárni. A digitális korszak szótárhasználója maga döntheti el, kíván-e mélyebbre hatolni a nyelvi adatokba, és azt is, mely ponton. Kíváncsi-e újabb kattintással elérhető tartalmakra: további példamondatokra, szinonimákra, antonimákra, gyakorisági adatra, etimológiára. Jelentős változás a felhasználó bevonása a tartalom alakításába: lehetősége van új címszójavaslatra, javításra, bővítésre, s ezáltal a tartalomfogyasztó a tartalom előállítójává is válik.

A digitális korszakban tehát van, ami megmarad a hagyományos szótárkészítés eszköztárából, és gyökeresen változások is bekövetkeznek.

Merre tart a folyamat?

Atkins, S.–Rundell, M. szerint4 „A jövő szótára teljesen új információk újfajta módon való megközelítésének lehetőségét nyitja meg. Az új szótár legfőbb jellemzője, hogy testre és személyre szabható. Olyan lexikográfiai forrásgyűjtemény (többnyelvű), amelyből a felhasználók válogathatnak, és igényeknek megfelelően konfigurálhatják.”

Azt gondolom, hogy e testre szabást és személyre szabást már nem a felhasználó fogja végezni, hanem szokásait elemző szoftver és/vagy mesterséges intelligencia.

A klasszikus kétnyelvű szótár mint műfaj mostani formájában eltűnik. Többnyelvű adatbázisok veszik át a helyét, melyek gép és gép közti kommunikációra is alkalmasak, folyamatosan tanulnak, a felhasználó által létrehozott tartalmakat is feldolgozzák. A digitális világ által kitermelt felhasználói szokásokhoz olyan szoftverek kellenek, amelyek a felhasználó tudását, szokásait rendszeresen monitorozzák, rendszerezik, és az így rendezett adatok alapján szolgálják ki. A szótár funkcionális részei (definíció, kiejtés, helyesírás, morfológia, használat, szókapcsolatok) érintetlenek maradnak, szükségesek egy másik nyelv megértéséhez. A felhasználó (szótárhasználó) személyre szabott igényeit számítógépes programok segítségével fogjuk pontosan azonosítani, és ez alapján, ehhez szabott találatokat kap.

Mindannyian – akik interneten elérhető tartalmakat fogyasztunk: olvasunk, írunk, beszélünk – hozzájárulunk a globális gépi–gépi kommunikációhoz, annak egyre tökéletesebb működéséhez. A szótár esetében a referált nyelvhez tartozó valamennyi információ egy helyen lehet, a felhasználó tetszőleges sorrendet választhat: térben és időben is kitágul a szótár határa.

A digitalizációval a világ tudományos megismerésének folyamata új dimenziót nyert, használatával az emberi agy számára addig rejtett területekre hatol be, és beláthatatlanul nagy mennyiségű digitális tartalomban kereshet egyszerre. A mesterséges intelligencia korában felfedezhetünk olyan összefüggéseket, amikről eddig nem tudtunk. A nyelv mint az emberi és gépi intelligencia kommunikációra alkalmas eszköze ehhez elengedhetetlen.

Lehetséges, hogy az új szótár – Horváth Ivántól kölcsönzött fogalommal – egyetlen bejárat a nyelvi univerzumba.5

 

Hivatkozások

1 Az epitheton ornans a tudására vonatkozott, nem a jellemére.

2 „Szegedi kísérlet a XVI. századi magyar vers gépi feldolgozására”, Irodalomtörténeti Közlemények 84(1980) 5–6. sz. 630–638.

4 B. T. S. Sue Atkins and Michael Rundell, The Oxford Guide to Practical Lexicography (New York: Oxford University Press, 2008), 239.

5 „Nincs média tovább, hanem bejáratok vannak az univerzumba” – Interjú Horváth Ivánnal. Hozzáférés: 2018.02.26, http://www.mediatortenet.hu/2016/03/21/horvathivan/.

Vizualizáció: Markó Anita