Tartu teadlased tegid närvivõrkudel masintõlke: kas saame ingliskeelse Wikipedia homseks eestikeelseks?

Tartu teadlased said valmis masintõlke tarkvara, mis peaks suutma näiteks Google’i tõlkemootorist targemalt eesti keelt inglise keelde ja vastupidi tõlkida.

“Eestikeelset tõlget teeb Google Translate endiselt statistiliste meetoditega, mis tähendab seda, et meie rakendusel on suurem tõenäosus anda kvaliteetsemat tõlketulemust,” ütles lahenduse kohta Tartu ülikooli (TÜ) keeletehnoloogia õppetooli juhataja dotsent Mark Fišel. Nimelt kasutavad TÜ teadlased tarkvaras tehisnärvivõrke. “Neurovõrkudel töötav tõlge annab võimaluse rohkem ja rikkalikumat infot töödelda ning selle tulemusena on ka rakenduse väljund kvaliteetsem,“ rääkis Fišel.

TÜ ülikooli arvutiteaduse instituudi keeletehnoloogia uurimisrühma tarkvara on avalikult saadaval aadressil neurotolge.ee.

Proovinäidis neurovõrkude tõlkemootorist

Geenius proovis arvutiteaduste instituudi masintõlget ka ise järele. Masintõlge sai endale prooviks ühe tuntud tehnoloogiafirma Vikipeedia lehe ning ka veidi Geeniuse enda sisu. Lisatud on ka võrdlus Google’i poolt pakutava tõlketeenusega.

Kui anda tarkvarale ette Microsofti Wikipedia lehe esimene lause, siis on tulemus järgmine:

  • Originaal: Microsoft Corporation is an American multinational technology company headquartered in Redmond, Washington, that develops, manufactures, licenses, supports and sells computer software, consumer electronics and personal computers and services.
  • Tõlge: Microsofti korporatsioonitsentriks on ameerika tehnoloogiline ettevõte, mille peakorter asub Redmondis, Washingtonis, mis areneb, toodab ja müüb ning müüb tarkvara, tarbija elektroonika ja personaalarvuteid.
  • Google’i tõlge: Microsoft Corporation on Ameerika rahvusvaheline tehnoloogia ettevõte asukohaga Redmond, Washington, mis arendab, toodab, litsentsid, toetab ja müüb arvutitarkvara, tarbeelektroonika ja personaalarvutid ja teenuseid.

Kui proovida teistpidi ning anda tarkvarale tõlkimiseks hoopis mõni eestikeelne Geeniuse lugu, siis on tulemus selline:

  • Originaal: Maanteeametis küpseb plaan, mille kohaselt ei jagaks terve sõidueksami ajal juhiseid enam eksamineerija, vaid juhiloa taotleja peab sõidu ajal jälgima ka GPS navigaatori poolt antavaid juhiseid.
  • Tõlge: The Maantea profession is a plan that does not give instructions for an examiner during the driving test, but the applicant must also follow the instructions given by the navigator’s navigator during the journey.
  • Google’i tõlge: Road Administration matures plan that does not share the entire driving test examiner more time instructions, but the candidate must also monitor the driving instructions given by the GPS navigator.

Nagu näha, siis saab tarkvara tõlkimisega suuremas osas hakkama, kuid selgelt jääb sisse ka veidi ebakõlasid.

Uus tööriist plaanitakse proovile panna 19.–20. aprillil toimuval keeletehnoloogia konverentsil, kus toimub muuhulgas ka masintõlkimise häkaton. Masintõlke lahendusi plaanitakse panna tõlkima ka Vikipeedia artikleid ning uurida, kas selliseid tarkvarasid saaks kasutada enamate artiklite tõlkimisel eesti keelde.