Gea

Ironija in besedne igre

Kar nekaj slovenskih prevajalskih agencij je razvilo svoje lastne strojne prevajalnike, pove v intervjuju dr. Špela Vintar

Tekst: Mateja Hrastar

slika

Špela Vintar je profesorica na Oddelku za prevajalstvo Filozofske fakultete v Ljubljani. Foto: Uroš Hočevar

Digitalna jezikoslovka je avtorica knjige Prevajalske tehnologije in organizatorka mednarodne poletne šole prevajalskih tehnologij TransTech17. Če kdo, potem ona ve, kaj za uporabnike pomeni, da je Google svoje prevajalske servise nadgradil z nevronskimi mrežami. Prvo različico so objavili pred letom dni, in sicer za osem jezikov, maja pa novo različico z 41 jeziki. Med njimi sicer ni slovenščine, toda zdi se, da je strojno prevajanje tako napredovalo, da bo za vedno spremenilo naš odnos do tujih jezikov. 

Kako delujejo nevronske mreže pri prevajanju?
Nevronska mreža je način obdelave podatkov, ki obstaja že več kot dvajset let. Tudi pri prevajalskih orodjih se uporablja že dolgo, denimo že leta 1998 se je proizvajalec prevajalskih orodij Trados pohvalil, da pri iskanju podobnosti med stavki uporabljajo nevronske mreže. V strojnem prevajanju pa so nevronske mreže prišle v ospredje v zadnjih petih letih. Nevronski strojni prevajalniki so še vedno statistični strojni prevajalniki, se pravi delujejo na podlagi podatkov, matematike in izračuna. Nevronska mreža pa je serija algoritmov, ki so pri delovanju podobni človeškemu živčevju v smislu, da so sestavljeni iz vozlišč, ki pričakujejo vhodne podatke kot dražljaje, ki povzročijo aktivacijo, kar je bodisi izhodni signal ali prehod na naslednje stanje. Pri strojnem prevajanju so ti dražljaji besede izhodiščnega besedila. Glede na parametre vhodnih podatkov se vozlišče odloči, kako bo reagiralo. Glavna razlika med nevronskim strojnim prevajalnikom in fraznim statističnim prevajalnikom je ta, da se sedaj resnično prevaja celotna poved in se upošteva širši kontekst, poleg tega je prevajalnik zdaj sposoben prepoznavati tudi bolj oddaljene odvisnosti med stavčnimi deli. Običajni statistični prevajalnik poved že na začetku razdeli na fraze, dolge od ene do pet besed, nato pa jih prevede. Nasprotno pa se nevronski strojni prevajalnik sproti odloča, kaj so optimalne enote za prevod, in se po potrebi tudi vrača v izhodiščno besedilo po dodatne informacije. Zdaj bo torej manj napak, kjer prvi del stavka ne sodi k drugemu ali je začetek v ženski obliki, konec pa v moški obliki. 

Kaj naj naredi uporabnik Googlovega prevajalnika, če potrebuje prevod v slovenščino iz jezika, ki ga ne pozna, prevajalnik pa mu besedilo prevede v nerazumljivo godljo?
Najprej se je dobro zavedati, da gredo pri Googlovem prevajalniku vsi manjši jezikovni pari prek angleščine. Če torej prevaja iz madžarščine v slovenščino, je vmesna postaja angleščina, kar gotovo vnaša dodatne napake. Zato je moj prvi nasvet, da se besedilo prevede le v angleščino, morebiti se ga bo dalo bolje razumeti. Drugi nasvet bi bil, da se za primerjavo uporabi tudi kakšen drug prevajalnik, denimo Microsoftov Bing ali ruski Yandex, ki kar dobro deluje pri prevodih med slovanskimi jeziki. 

Koliko konteksta pa lahko prevede nevronski strojni prevajalnik?
Kolikor mi je znano, je pri Googlovem in Facebookovem prevajalniku osnovna enota ena poved, kadar zazna težavo, pa išče kontekst v več povedih. 

Več v novembrski številki revije Gea (2017)

  • Dodaj na Twitter
  • Dodaj na MySpace
  • Dodaj na Delicious

Mladinska knjiga Založba d.d.
Slovenska 29
1000 Ljubljana

E-naslov: info@mladinska.com
Telefon: 01 241 30 00

Postanimo prijatelji!

slika slika slika
  

(c) Mladinska knjiga, vse materialne pravice so last Mladinske knjige.