Keeleekspert: Google’i eesti keele kõnetuvastus valmib kõige varem poole aasta pärast

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.
Foto: kuvatõmmis YouTube'ist

Kuigi Tallinna Tehnikaülikoolil (TTÜ) võttis keeletuvastuse loomine aega kümmekond aastat, siis Google võib selle valmis teha poole aastaga, ütles ülikooli tarkvarateaduse instituudi vanemteadur Einar Meister.

Geenius kirjutas eile, et Google on alustanud sadade tuhandete kõnenäidiste kogumist Eesti inimestelt, mis viitab ilmselt kavatsusele õpetada masinatele Eesti keele kõnest aru saamine selgeks. See omakorda tähendab, et tõenäoliselt saame varsti hakata oma telefonide, telerite ja arvutitega eesti keeles vestlema.

“Arvan, et Google’il ei ole väga keeruline eesti keele kõnetuvastust teha, sest seal on vaja kahesuguseid andmeid: suur hulk eestikeelseid tekste, mida leidub veebis väga palju ja eestikeeset kõnematerjali,” lausus Meister.

Kaua aega Google’il võiks eesti keele kõnetuvastuse tegemine aega võtta, sõltub teaduri sõnul sellest, kui kiiresti nad saavad kogutud eestikeelsed kõnenäited.

“Kui need on kogutud, siis pole mingi küsimus kõnetuvastus teha,” lausus ta. “Kui kõik läheb plaanipäraselt, siis on ehk eesti keel Google’is olemas kõige varem poole aasta pärast.”

Kas 10 eurot on piisav?

1000 inimese poolt 600 erineva sisse loetud fraasiga saab Google teaduri hinnangul arvestatava kõnekorpuse, millega peaks saama päris häid tulemusi. Tema arvates võib aga takistuseks kujuneda see, et 600 fraasi sisselugemise eest pakutakse vaid 10 eurot ning kas see summa võib motiveeriv olla. Samas kogus TTÜ 2000. aastal oma kõnenäited tasuta.

“Meie kogusime oma 1000 kõnenäidet nii, et oli tasuta telefonile helistamise võimaluse ja lõpuks loosisime T-särke,” rääkis ta.

Vanemteadur pakkus, et Google võiks osta tehnikaülikoolilt kõnekorpuse, selle asemel, et otsib Eestist inimesi helinäidiste sisselugemiseks, sest ülikoolil on mitmesuguseid kõnekorpuseid, mida nad ka ise eestikeelse kõnetuvastuse treenimiseks kasutavad.

TTÜ-l kestis kõnetuvastuse loomine kümmekond aastat. Meistri sõnul oli probleem selles, et kuigi kõnekorpuste tegemisega oli rohkem inimesi seotud, siis kõnetuvastuse algoritmide ja sobivate eesti keele näidete loomisega tegeles ülikooli vanemteadur Tanel Alumäe üksi.

“Kuid nüüd on meie eestikeelne kõnetuvastus päris heal tasemel,” lisas Meister.

See oli vaid aja küsimus

Tema sõnul oli see vaid aja küsimus, millal Google jõuab ka väiksemate keelteni. Umbes viis aastat tagasi ütles Google’i esindaja, et nende eesmärk on see, et nad teevad kõnetuvastuse kõigile keeltele, kus on vähemalt miljon kõnelejat.

“Kuid kindlasti mängib siin rolli ka üldine riigi IT-tase ja kasutamine,” lausus Meister ning lisas, et ta ei usu, et Google hakkab kõnetuvastust tegema näiteks ühele Aafrika hõimule või piirkonnale, kus võib vabalt olla üle miljoni inimese, aga nende tehnoloogiakasutus on algeline ning teenusel poleks piisavalt kasutajaid.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.