A gépi fordítás mindenki számára hozzáférhetové teheti a kizárólag angol nyelvu tudományt

Gépi fordítás DeepLTranslatorral és emberi ellenorzés Palotás Brigitta által.

Még középiskolás korában Xinyi Liu rövid ideig a pekingi Beihang Egyetem egyik kutatócsoportjában dolgozott, és meglepodve tapasztalta, hogy a kínai kutatók rendszeresen a Google fordítót használják a tudományos cikkek elso angol nyelvu vázlatának elkészítéséhez. A fordítás elengedhetetlen, ha a kutatók magas presztízsu folyóiratokban akarnak publikálni, hiszen szinte mindegyike angol nyelvu.

"Szokványos volt, hogy a posztdoktorok a Google Fordítóval eloször lefordítottak mindent, majd ezt a fordítást módosították és csiszolták. A legelso fordítás után azonban még az egész szöveg értelmezhetetlen volt” – mondta Liu, aki a Berkeley-i Kaliforniai Egyetem molekuláris és sejtbiológia szakán tanul. "Szó szerint az összes szó, az összes kifejezés csak úgy véletlenszeruen volt egymás mellé rakva”.

Arra gondolt, hogy lennie kell jobb megoldásnak.

Ezért tavaly, amikor meglátta Rebecca Tarvin új szemináriumát a tudományos nyelvi korlátok leküzdésérol, beiratkozott.

Ez a kurzus, amelyet 2023 tavaszán már harmadszor tartanak majd meg a Berkeley Egyetemen, egy afféle kísérlet volt Tarvin, az integratív biológia adjunktusa számára. A sokszínuség, a méltányosság és a befogadás témája iránti megújult egyetemi érdeklodés miatt o és a tanszékén belül muködo munkacsoportok úgy gondolták, hogy a kurzus hozzájárulhat a tudományos életben régóta fennálló probléma kezeléséhez a Berkeley Egyetemen. A tudományt uraló angol nyelv komoly akadályt jelent az angolul nem anyanyelvi szinten beszélo kutatók számára.

Nemcsak a külföldi diákok és kutatók vannak hátrányban, ha a tudományt elsosorban angolul muvelik. Sok amerikai születésu diák is így van ezzel. 2020 oszén a Berkeley Egyetemre beiratkozó elsoévesek mintegy 40%-a elso generációs egyetemista volt, és a Kaliforniai Egyetem 10 campusát összesítve az elso generációs hallgatók 39%-ának nem az angol volt az anyanyelve.

"Sok kaliforniai diákunk úgy nott fel, hogy a szüleinek fordított” – mondta Tarvin. "A fordítás már egészen kicsi koruk óta az életük része volt.”

Tarvin számára a kurzus – A nyelvi korlátok áttörése az evolúcióban és az ökológiában – "lehetoséget nyújtott arra, hogy a hallgatóknak egyrészt fordítási ismereteket tanítson, másrészt arra ösztönözze oket, hogy tevékeny szerepet vállaljanak a szerkezetváltás ezen területén. És tulajdonképpen úgy láttam, hogy a diákok nagyon pozitívan fogadják ezt a fajta aktivizmust. Úgy tunik, hogy a kurzus elvégzése után mindannyian egyetértenek abban, hogy a nyelvi korlátok problémájának kezelése nagyon fontos”.”

A kurzus eredményeként Tarvin és néhány végzos hallgató a Berkeley Egyetemrol, kanadai, izraeli és magyarországi munkatársakkal egyuttmuködve egy tudományos cikkben olyan új gépi fordítóprogramokat értékeltek, amelyeket világszerte használhatnak az emberek arra, hogy tudományos cikkeiket a nem angolul beszélok számára is hozzáférhetové tegyék. A tanulmány ma (augusztus 3-án) jelent meg online a BioScience címu folyóiratban. A spanyol, francia, portugál és magyar nyelvu fordítások – a társszerzok nyelvei – szintén elérhetoek online.

"Az ötlet lényege, hogy megpróbáljuk megadni az embereknek az eszközöket és a motivációt is ahhoz, hogy lefordítsák saját tudományos kutatásukat” – mondta Tarvin. "A tudománynak nem kell egyetlen nyelven alapulnia és rengeteg elony származik abból, ha a tudomány minden fázisában többnyelvu megközelítéseket alkalmazunk. Például a több nyelven történo publikálás a társadalom javára válik a tudományos eredmények hatékonyabb megismertetése révén.”

"A nyelv egyszerre lehet akadály és fantasztikus eszköz is, amely összehozza az embereket” – hangsúlyozta Emma Steigerwald , a tanulmány elso szerzoje, a UC Berkeley végzos környezettudomány, -politika és -menedzsment szakos hallgatója. "Ez egy olyan akadály, amelyet ezzel az új technológiával leküzdhetünk. Elmagyarázzuk a technológiát és azt, hogy hogyan lehet alkalmazni, és hogy mire kell figyelnünk, amikor használjuk. Bemutatjuk mindazokat a nagyszeru lehetoségeket, amerre a tudományos kommunikáció fejlodhet ennek az új technológiának a bevetésével”.”

Egy többnyelvu tudományos hálózat felé

A közelmúltig a számítógépes fordítás a viccek tárgya volt. Az emberek mulatságos példákat osztottak meg a hibás fordításokról, és gyakran úgy tunt, mintha az angolon kívüli nyelveket és - ezzel együtt – más kultúrákat becsmérelnének.

A gépi tanulás, vagyis a mesterséges intelligencia azonban drámaian megnövelte a fordítások pontosságát, olyannyira, hogy a turisták már olyan internetes szolgáltatásokat használnak a nem angol nyelvu országokban való kommunikációhoz, mint a Google Translate.

A sok szakzsargont tartalmazó szövegek esetében azonban – amelyek nagy része természettudományos, de akár más tudományágból is származhat – a Google Translate szánalmasan alkalmatlan.

"A fordítás minosége nem méltó egy folyóirathoz” – mondta Ixchel Gonzalez Ramirez, a kurzus egyik mesterszakos témavezetoje. "Az embereknek gyakran fizetniük kell azért, hogy munkájuk fordítását egy hivatásos fordító készítse el, és ez nagyon drága.”

A most megjelent cikk kiemel néhányat a sok – többnyire ingyenes - szolgáltatás közül, amelyekkel az angol nyelvu tudományos szövegek lefordíthatók más nyelvekre. A jól ismert Google Translate platform mellett ezek közé tartozik a neurális hálózatokat használó DeepL , amely saját állítása szerint az angol nyelv kínaira, japánra vagy németre fordításakor nagyságrendekkel pontosabb, mint a versenytársak; a Baidu Translate , a kínai Baidu internetes vállalat szolgáltatása, amely kezdetben az angol és kínai közötti fordításra összpontosított; a Naver Pagago, egy dél-koreai cég által fejlesztett többnyelvu fordító; valamint a Yandex.Translate , amely statisztikai gépi fordítást használ, és foként az orosz és angol nyelvre összpontosít.

"A fordítás egyre inkább elérhetové válik bárki számára. Mindegy, hogy szakérto vagy sem, és akár kétnyelvu vagy sem, a fordítás muvelete a ma rendelkezésre álló technológiáknak köszönhetoen sokkal egyszerubbé válik” – mondta Steigerwald. "Hogyan tudjuk ezt beépíteni kutatóként a munkafolyamatainkba, és hogyan változtatja meg ez a tudományos kommunikációt övezo elvárásokat?”.

Az angol a tudomány lingua franca-ja

Tarvin érdeklodése a fordítás iránt az egyik végzos hallgatója, Valeria Ramírez Castańeda kapcsán alakult ki, aki egy 2020-ban publikált cikkben kifejtette, hogy milyen költségek merültek fel kolumbiai doktorandusz társai számára, amikor publikálni akartak, vagy kapcsolatba akartak lépni kollégáikkal egy az angol nyelv által uralt világban.

Mivel evolúcióbiológusként az foglalkoztatta, hogy hogyan jutottak el egyes állatok a méreg használatához, Tarvin úgy döntött, hogy új szemináriumán az evolúció és az ökológia területérol szóló cikkek fordítására helyezi a hangsúlyt, bár a jelentkezok végül saját maguk választottak irányt. Kifejezetten olyan hallgatókat keresett, mint Liu, és olyan témavezetoket, mint Gonzalez Ramirez, akik két- vagy többnyelvuek.

"A csoportban mindenkinek volt valamilyen nyelvi érintettsége a családja révén” – mondta Tarvin.

Tarvin felkérte Mairi-Louise McLaughlint, a UC Berkeley francia és nyelvészet professzorát, az újságírói és irodalmi fordítás szakértojét is, hogy beszéljen az osztálynak arról, hogyan fordítanak a szakemberek, és hogyan befolyásolja a fordítás a jelentést. A téma akkor vált igazán érdekessé a hallgatók számára, amikor kipróbálták magukat tudományos összefoglalók és néha egész cikkek fordításában.

Ruoming Cui másodéves hallgató, aki 2022 tavaszán vett részt a kurzuson, a Baidut választotta tudományos összefoglalók fordítására. Azonnal felfedezte, hogy az angol nyelv hosszú, összetett mondatai és a több szó használata egy fogalom leírására szószaporításnak tunik, ha kínaira fordítják.

"Ilyet a kínaiban nem szoktunk csinálni, mert így minden mondat extra hosszú lesz, és ez nagyon nehézkes” – mondta.

Liu hozzátette, hogy komoly átdolgozás nélkül sok angol fordítás zavaros lesz.

"Azt mondják, hogy bármilyen remek is az eredményed, ha a fordítás miatt zavaros cikket írsz, az emberek csak bosszankodni fognak, mert nem értik, amit csinálsz” – mondta Liu. "És ez nagyban befolyásolja, hogy az emberek milyennek értékelik a kutatást, vagy hogy egyáltalán elolvassák-e azt. Azt hiszem, ez egy hatalmas akadály a tudományos világban.”

Steigerwald, Tarvin és szerzotársaik arra is rájöttek, hogy a tudományos cikkek egyszerubb angol nyelven történo megírása – amit a nem kutatók már régóta szorgalmaznak -  az angolul beszélok, és az angolul nem beszélok számára egyaránt elonyös.

"Ha az anyanyelvünk nem az angol, és éppen a tanulmány angol nyelvu változatát próbáljuk elolvasni, akkor sokkal olvasmányosabbnak és kevésbé félreérthetonek érzezzük, ha a szerzo egyszeru nyelvet használt” – mondta Steigerwald. "Emellett nagyon fontos az is, hogy amikor le akarjuk fordítani az adott szöveget, a gépi tanuló programoknak sokkal könnyebb dolguk van egy egyszeru nyelven íródott szöveggel. Tehát az írásnak ez egyfajta elokészítése is annak bebiztosítására, hogy ha milliónyi nyelvre le szeretnék fordítani, sokkal könnyebben megoldható legyen.”

A tudományos cikkek széles köru fordításának más akadályai is vannak, többek között az, hogy hol tegyék hozzáférhetové azokat, és hogyan kezeljék a szerzoi jogokat. A legtöbb folyóirat egyáltalán nem fogad el nem angol nyelvu cikkeket, és csak kevés folyóirat engedélyezi kifejezetten a cikkek fordítással együtt történo publikálását. Tarvin úgy találta, hogy kevés folyóiratnak van a fordításokra vonatkozó szabályzata, és az általános szerzoi jogi korlátozások miatt sok kiadó aránytalanul magas díjat számít fel a publikálás után a fordítások online közzétételéért.

"Eléggé megdöbbento, hogy hány folyóirat nem teszi lehetové a fordítások szabad közzétételét a publikálás után, és hogy milyen kevés olyan felület áll rendelkezésre, ahol akár csak egy kivonatot is meg lehet jelentetni egy második vagy harmadik nyelven” – mondta Tarvin. "Azt hiszem, ennek egyik fo akadálya maga a webes felület; a lehetoségeket nemcsak a publikálási és szerzoi jogi szabályok korlátozzák, hanem a felület muködése és kialakítása is.”

Tarvin és kollégái azt remélik, hogy a "Breaking Barriers" szemináriummal és most a BioScience címu cikkel a tudományos életben bevett gyakorlatot sikerül fokozatosan megváltoztatni, és a publikációkat a jövoben alapértelmezésként fordítják le más nyelvekre is mindenekelott annak az országnak a nyelvére, ahol a kutatást végezték, illetve a társszerzok nyelvére.

És minél több fordítás készül, annál több anyag áll rendelkezésre a gépi fordítóprogramok továbbfejlesztéséhez, hogy aztán jobb munkát végezzenek, és ezáltal fokozatosan növekedjen a tudományos fordítás minosége.

"Az én kutatócsoportomban sok kutatásunkat fordítjuk le, és most már Emma csoportjában is ezt teszik az emberek” – mondta. "Úgy érzem, hogy az ezzel kapcsolatos pozitív hozzáállásunk és annak bemutatása, hogy ez mennyit számít az embereknek, egyre több emberre van hatásal, akik emiatt elkezdték beépíteni a fordítást a tudományos munkafolyamatukba.”.

A BioScience címu cikk további társszerzoi Valeria Ramírez-Castańeda és Débora Brandt, a Berkeley Egyetem doktoranduszai; Báldi András, a Vácrátóti Ökológiai és Botanikai Kutatóközpont Ökológiai és Botanikai Intézetének munkatársa; Julie Teresa Shapiro, az izraeli Be’er Sheva-i Ben-Gurion University of the Negev posztdoktora; valamint Lynne Bowker, a kanadai Ottawai Egyetem fordító és tolmács professzora.

Köszönetnyilvánítás a fordításhoz. A magyar fordítást Palotás Brigitta végezte a DeepL fordító segítségével, majd lektorálta és szerkesztette a szöveget.

KAPCSOLÓDÓ INFORMÁCIÓK

A nyelvi akadályok leküzdése a tudományos életben: gépi fordítóprogramok és a többnyelvu jövo víziója (BioScience)

By Robert Sanders

View all articles by Robert Sanders

This site uses cookies and analysis tools to improve the usability of the site. More information. |