Kas eesti keel aitaks parandada arusaamist inimkeelest? Tartu ülikooli teadlased usuvad, et jah (1)

Aime Jõgi
, ajakirjanik
Copy
Üks näide, mida tähendab keeleteaduses korpus. Tartu ülikooli foneetikalaboris salvestatakse spontaanset kõnet, helistuudios on eesti foneetika kaasprofessor Pire Teras. Sisseräägitud tekst segmenteeritakse hiljem sõna, hääliku ja muudel lingvistilistel tasanditel. Suur hulk segmenteeritud ehk märgendatud heilifaile moodustavad kokku foneetikakorpuse, mida on võimalik kasutada kõne akustika uurimiseks ja kõnetehnoloogiliste rakenduste arendamiseks. Salvestustele on lisatud kõneleja vanus, sugu, päritolu ja haridustase, ja nii on võimalik uurida keelekasutuse varieerumist ka sotsiaalsete aspektide järgi.
Üks näide, mida tähendab keeleteaduses korpus. Tartu ülikooli foneetikalaboris salvestatakse spontaanset kõnet, helistuudios on eesti foneetika kaasprofessor Pire Teras. Sisseräägitud tekst segmenteeritakse hiljem sõna, hääliku ja muudel lingvistilistel tasanditel. Suur hulk segmenteeritud ehk märgendatud heilifaile moodustavad kokku foneetikakorpuse, mida on võimalik kasutada kõne akustika uurimiseks ja kõnetehnoloogiliste rakenduste arendamiseks. Salvestustele on lisatud kõneleja vanus, sugu, päritolu ja haridustase, ja nii on võimalik uurida keelekasutuse varieerumist ka sotsiaalsete aspektide järgi. Foto: Pärtel Lippus

Keeleteaduse headest tulemustest sõltub palju, sealhulgas keeletehnoloogia arendamine, mis tähendab uusi tõlkimisvõimalusi ning kõnetuvastusega automaatselt hakkamasaavaid äppe. Samuti ei saaks keelt uurimata luua keeleõppe abivahendeid ega arendada emakeeleõpetust. Keeleteadusele toob lähiajal kasu ilmselt seegi, et Tartu ülikooli eesti- ja üldkeeleteaduse instituut sai Euroopa Komisjonilt ligi 1,5 miljoni euro suuruse rahastuse, et käivitada rahvusvaheline keeleteaduse metodoloogia arendamise ja õpetamise konsortsium MEDAL, lühend inglise keelest Methodological Excellence in Data-Driven Approaches.

Tartu ülikool kutsus MEDAL-is kaasa lööma tippteadlased partnerasutustest Birminghami ülikoolist Ühendkuningriigis, Max Plancki psühholingvistika instituudist ja Nijmegeni Radboudi ülikoolist Hollandis, kelle vahel rahastus jagamisele läheb. MEDALi eesmärk on arendada kõigi partnerite pädevust keeleteaduslikes meetodites, eriti noortel keeleteadlastel.

Projekti eestvedaja Tartu ülikooli psühholingvistika kaasprofessori Virve Vihmani sõnul algab nende töö 2023. aasta jaanuaris ja kestab 2025. aasta detsembri lõpuni. «Igal aastal leiavad ühes partnerasutuses aset suvekool, lisaks konverentsid ja töötoad. Luubi alla võetakse keeleteaduslikud meetodid: korpuslingvistika, katselised meetodid ja arvutimodelleerimine,» selgitas ta.

Korpuspõhised uurimismeetodid

Konsortsiumi neli teadusasutust täiendavad üksteist nii koolituspädevuses kui ka teadustöös. Tartu ülikool panustab eelkõige teadmistega korpuspõhiste keeleuurimismeetodite ning ka laiemalt keeltevaheliste võrdlevate meetodite kohta.

Virve Vihman
Virve Vihman Foto: Erakogu foto

«Tartus on olnud alati huvi võrrelda eesti ja soome-ugri keeli üksteise ja muude keeltega ning seetõttu oleme palju kokku puutunud keeltevahelise võrdlusega kas korpuste uurimisel, katsete loomisel või keele modelleerimisel arvutis,» ütles Virve Vihman.

Korpuslingvistika viitab suurele keelevalimile ehk teatud tingimuste järgi valitud ja digiteeritud kirjaliku või suulise keele näited, mida saab statistiliselt analüüsida. Keelekorpuseks võivad olla näiteks kõik ühe konkreetse aasta eestikeelsed veebilehed, salvestatud vestluste transkribeeringud või ühe raamatu tõlked mitmes keeles, mis võimaldab ühe põhiteksti keeleüleseid võrdlusi.

Virve Vihman selgitas, et korpuslingvistikaga saab digitaalselt töödelda tohutul hulgal teksti, mis muidu poleks terve elu jooksul teostatav. On ka teisi meetodeid, mida teadlased soovivad arendada, näiteks on psühholingvistika uuringutes populaarsust kogunud silmade jälgimine ja masinõpe.

Korpuspõhiste uurimismeetodite kõrval pälvivad Virve Vihmani sõnul samavõrd tähelepanu aga ka keele uurimise katselised meetodid ning arvutimodelleerimine.

Mitte ainult inglise keel

«Ebaproportsionaalselt palju on lingvistikauuringuid, mis on keskendunud inglise keelele ja indoeuroopa keeltele üldiselt,» rääkis Vihman veel. «Konsortsiumi eesmärk on rõhutada vajadust keelte võrdlemise rangete meetodite järele. See aitab paremini mõista, mis on keeltel ühist ja kuidas need erinevad ning võimaldab  teha üldistusi inimese kognitiivsete ja keeleliste võimete kohta. Eesti keele kaasamine taolistesse võrdlevatesse uurimustesse veel üks võimalus parandada üldist arusaamist inimkeelest.»

Küsimuse peale, mis teeb keeleteadlase töö kalliks, vastas Virve Vihman, et keeleteadlaste töö ei ole just kallis, kuid keeleteadus paikneb just humanitaar- ja sotsiaalteaduste piirimail ning on palju eksperimentaalsem kui mõned humanitaaralad.

«Kui kasutame moodsaid keeleteaduslikke meetodeid, siis sisaldab see suuri andmemahtusid ja eksperimentaalmeetodeid, millega mõistagi kaasneb aparatuur ja suurandmete hoiustamine,» selgitas ta. «Euroopa Komisjoni raha on plaanis kasutada osalt koolituste korraldamiseks, osalt teadustööks rahvusvaheliste partneritega ning osalt noorteadlaste ja üliõpilaste lähetuste toetamiseks, et kõigi institutsioonide tudengid ja partnerid saaksid käia töötubades ja suvekoolides ning tutvuda omavahel. Ning et kogu projektist sünniks reaalne koostöö, mis jätkuks ka peale projekti lõppu.»

Tervele konsortsiumile eraldatud 1,5 miljonit eurot jaguneb Virve Vihmani sõnul enam-vähem võrdselt. Ühendkuningriigi partner saab pool miljonit, kaks Hollandi partnerit  jagavad samuti ligi pool miljonit ning Tartu ülikooli eesti ja üldkeeleteaduse instituut veidi üle poole miljoni euro.

«Twinning» – otsetõlkes mestimine või mesti löömine – tähendab Euroopa komisjonis sellist meedet, mille juhtpartner peab olema Euroopa Liidus nimetatud «Widening countries» loetelus ehk nende riikide loetelus, kus üldine teadustoodang ja nähtavus on väiksem kui vanemates Euroopa Liidu riikides, ning selle meetme kaudu üritatakse niisugust ebavõrdsust korrigeerida.

Konsortsiumi MEDAL lõppeesmärk on teha Tartu ülikoolist Põhja-Euroopa rahvusvaheliselt tunnustatud keeleteaduse tippkeskus, mis aitab kaasa nii Tartu kui ka terve Eesti maine tugevdamisele.

Kommentaarid (1)
Copy
Tagasi üles