Arvutiga inimese portree loomises on tehtud nelja aastaga kõva läbimurre

Pane tähele! Artikkel on ilmunud enam kui 5 aastat tagasi ning kuulub Geeniuse digitaalsesse arhiivi.

Ülevaade teadusartiklitest näitab, et kõigest nelja aastaga on tehtud väga tugev läbimurre selles, kui realistlikke portreesid inimestest suudab masinõppe algoritm iseseisvalt genereerida.

Tegu on masinõppe teaduses ühe suunaga, millega treenitakse algoritme iseseisvalt looma võimalikult usutavaid ja realistlikke portreesid. Pildil näha olevaid inimesi pole reaalselt olemas, need ei matki ühtegi päris fotot.

Vaatame näiteid viimase nelja aasta töö tulemustest. 2014. avaldasid oma uurimustöö tulemused Montreali ülikooli teadlased Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville ja Yoshua Bengio. Nagu pildilt näha ja nad ka ise artiklis ütlevad, ei pruugi tulemus olla toona eksisteerinud tasemest parem:

2015. avaldasid teadusartikli Alec Radford ja Luke Metz ettevõttest indico Research ja Soumith Chintala Facebookist. Nende tulemus oli “ebastabiilne”, selle lahendamiseks on vaja teadlaste sõnuk uurimustööd jätkata:

Järgmisel aastal näitasid oma töö tulemusi Mitsubishi laborite teadlased Ming-Yu Liu ja Oncel Tuzel. Nende töö tulemus:

2017. aastal pakkusid uue lähenemise oma artiklis välja Tero Karras, Timo Aila, Samuli Laine ja Jaakko Lehtinen, kes töötavad NVIDIAs (ja Lehtinen Aalto ülikoolis). Juba selles töös on näha oluliselt teise tasemega pilte:

Tero Karras, Timo Aila ja Samuli Laine NVIDIAst avaldasid äsja detsembris oma värskeima teadusartikli, mis arendab eelmist veel edasi. Lõpptulemuses on arvuti genereeritud fotodes inimesed nüüd enneolematu detailsusega. Laiemalt võttes on tegu väga realistlike fotodega, samas lähemal uurimisel torkavad silma mõned ebaloomulikud detailid:

Kuidas see käib?

Eelnimetatud teadustöö langeb üldjuhul masinõppe ühe suuna alla. Tegu on tehnikaga generative adversarial network (GAN), kus sisuliselt pannakse üksteise vastu töötama kaks närvivõrku. Üks püüab reaalsete andmete põhjal luua kunstlikke, võlts-andmeid, nii edukalt kui võimalik. Teine püüab jälle päris-andmeid võltsidest eristada. Tulemuseks on tehnoloogia, mis loob sünteetilisi fotosid.

Oluline on aru saada, et tegu pole meedias kajastatud nn Deepfakes tehnikaga. Deepfake kasutas samu tehnoloogiaid, et liita kaks olemasolevat fotot või videot: võeti ühe inimese (nt USA presidendi) nägu, siis aluseks teine kujutis (näiteks inimene hobusega ratsutamas) ja neid kokku pannes tekkis realistlik video, nagu USA president ratsutaks videoga.

Antud juhul on tegu ülimalt realistlike kujutistega “inimestest”, keda pole kunagi olemas olnud. Peamised teadustöö rakenduskohad on meelelahutustööstus, filmi- ja videomängutööstus.

Kinnituse, et tegu pole tõesti fotodega päris inimestest, peaks andma veel see video:

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.