Google asus oma tehismõistusele eesti keelt õpetama, et me varsti telefonidega emakeeles vestelda saaks

Foto: Martin Mets

Google on vaikselt käivitanud kõigi aegade ühe suurima arvutitele eesti keele õpetamise projekti, lastes Eesti inimestel sisse lugeda üle poole miljoni helinäidise, mille tulemusena saab ilmselt varsti hakata telefonide ja arvutitega eesti keeles rääkima.

Häälnäidiseid kogutakse kolmanda firma vahendusel ja ühel inimesel tuleb sisse lugeda enam kui 600 erinevat fraasi, mille eest makstakse 10 eurot. Kokku otsib Google vähemalt 1000 inimest, kes Google’i assistendi koolitamiseks oma hääle annaksid. See tähendab, et ettevõte soovib koguma enam kui 600 000 erinevat heliklippi, makstes nende eest vähemalt 10 000 eurot.

Fraasid, mida Google kuulda soovib, on erinevad. Harilikult on nende alguses või lõpus Google Assistanti aktiveerimiseks vajalik fraas “OK, Google”, kuid lausete sisu on juhuslik ning nende seast leiab erinevaid väljavõtteid seadustest, ajakirjandustekstidest kui ka lihtsalt erinevaid küsimusi, mida inimesed virtuaalselt assistendilt küsida võivad.

Lause, mis tuleb Google’i jaoks sisse lugeda.

Muude seas võib brauseris töötav helisalvestusleht paluda kasutajatel sisse lugeda fraasid nagu “Elamute pakkumine ületab jätkuvalt nõudlust”, “Mida teha, kui saad teada, et oled rase?” ning “Seejärel tükelda tomatid väikesteks tükkideks samuti küüslauk”.

Google’i häälassistent Google Assistant on nüüdseks ära õppinud mitmeid keeli, kuid sarnaselt Apple’i Sirile ei mõista see eesti keelt ja Google’i tegevus viitab sellele, et plaan on eesti keelt ka enda virtuaalsele assistendile selgeks teha. Kui soovid ka enda häält Google’ile anda, siis seda saab teha, täites selle vormi.

Annad enda hääle igaveseks Google’ile

Abilised, kes programmiga liituvad, peavad esmalt enda kohta ohtralt informatsiooni jagama. Küsitava info seas on näiteks ka see, kas eesti keel on kasutaja emakeel ning kas ta on kunagi mõnes teises riigis elanud. Ilmselt on selle eesmärk õpetada Google’i teenustele ära tundma ka keele varieeruvust.

Lause, mis tuleb Google’i jaoks sisse lugeda

Samuti peavad häälenäidiseid jagavad inimesed nõustuma erinevate tingimustega. Nende seas ka sellega, et Google võib nende andmetega teha seda, mida ise soovib.

Tee töötava kõneassistendini võib olla pikk

Häältuvastusprogrammide koolitamine on pikk ja keeruline töö, mis nõuab ohtralt andmeid, näiteks heliklippe, mis tuleb algoritmidel läbi töötada ning ära õppida, et mõista konkreetset keelt ning seda ka ise rääkida.

Lause, mis tuleb Google’i jaoks sisse lugeda.

Kui harilikult keskendutakse häältuvastuse puhul rohkema kasutajate hulgaga keeltele, mida räägib rohkem inimesi, siis nüüd paistab, et Google soovib vähemalt mingil hetkel tuua häältuvastusel põhinevad teenused ka eesti keelt rääkivatele kasutajatele.

Võib arvata, et Google’i häälassistent pole võõrkeelsena Eestis eriti populaarseks saanud ja seetõttu on vaja meie turule läheneda eesti keeles. Millal Google’i teenused päriselt eesti keelt mõistma hakkavad ja kas see üldse teoks saab, seda on praegu raske hinnata.