Tartu ülikooli arvutiteaduse instituudi keeletehnoloogia teadlased alustasid masintõlke alast koostööd tõlkebürooga Grata. Koostöö eesmärk on luua tõlkebüroo vajadusi arvestav masintõlke lahendus, mis teeb automaattõlkeid saksa ja inglise keelest eesti keelde.
Tartu ülikool viis masintõlke tehnoloogia ärimaailma
Loodav rakendus kasutab statistilist lähenemist masintõlkele, mis tähendab seda, et süsteem õpib tõlkima automaatselt, kasutades suurt hulka tõlkenäiteid, ega olene sisend- või väljundkeelest. Seega lahendus töötab kõige paremini andmetega, mille peal ta on nii-öelda õppinud ning arvestab ka näiteks tõlgitavate tekstide valdkonnaga.
«Tehniliste kirjelduste, kasutusjuhendite või näiteks seadustekstide puhul saab automaatselt suurt osa sisendlauseid usaldusväärselt automaatselt tõlkida. Ebaõnnestunud tõlked saab samuti tuvastada ning välja filtreerida juhul, kui on kergem nullist ise tõlkida,» selgitas masintõlke võimalusi Tartu ülikooli keeletehnoloogia dotsent Mark Fišel.
Päris automaagiliselt see Fišeli sõnul muidugi ei tööta, sest statistiline lähenemine ei võta arvesse näiteks mõnede keelte eripärasid ning süsteemi väljundit peab analüüsima ja erinevaid parandusi välja mõtlema.
Kvaliteetse masintõlke rakenduse kasutamine annab tõlkebüroole võimaluse pakkuda klientidele uusi teenuseid. «Loodame masintõlke abil rahuldada nende klientide soove, kes juba praegu soovivad näiteks järeltoimetuse teenust, samuti loodame masintõlke tööprotsessi integreerimisega suurendada tootlikkust,» ütles Grata tegevjuht Eve Anijärv.
Tartu ülikooli jaoks on tegemist esmakordse sellise koostööprojektiga, kus eesti keele masintõlke tehnoloogiat viiakse ärimaailma. «Mujal maailmas, eelkõige Lääne-Euroopas, on masintõlge ja järeltoimetamine aktiivselt kasutusel. Eesti alles jõuab sellele järele ning loomulikult tahame olla nii-öelda rongi ees,» kommenteeris Fišel.
Lisaks osalevad arendustöös ka tudengid, kelle jaoks on tegemist hea võimalusega ühendada teadustöö praktilise väljundiga. Keeletehnoloogia teadlaste loodav Grata masintõlke baassüsteem on plaanis valmis saada 2016. aasta suvel.