Euroopa oma tehismõistus

Paradoksaalselt ei ole kogu selle sajandi IT-progress toonud kaasa tootlikkuse kasvu kiirenemist, sestap on lootus andmekogumisel ja tehismõistuse arendamisel.

TANEL TAMMET, INNAR LIIV

Euroopa majandused on digitaliseerimise rongist hakanud maha jääma ning ELi juhtkond püüab olukorda poliitiliste suunistega ümber pöörata. Äsja avaldati kolm suunavat dokumenti,1 kuhu liikmesriikidelt küsitakse ideid ja täiendusi Euroopa digitaalsele tulevikuvisioonile ning tehismõistuse arendamisele, andmete kogumisele ja kasutamisele.

Euroopa mureks on maailmamajanduse keskendumine digitaaltehnoloogiatele, andmeteaduse ja tehismõistuse kasvav juhtroll sellealases innovatsioonis, samal ajal kui euroliidu riikide majandused on neis valdkondades mahajääjate seas. Kui 2009. aastal olid kakskümmend maailma suurimat ettevõtet jagunenud kõigepealt nafta- ja gaasitootmise, selle järel finantsteenuste ning kolmandal kohal tehnoloogia ja teenuste valdkonda, siis 2018. aastal olid ülekaalus tehnoloogia ja teenused 56 protsendiga, nende järel finantsteenused ning nafta- ja gaasitootmine kaugel tagapool (joonis 1).

IT-suurfirmade poolest on maailm täielikult polariseerunud Ameerika ja Hiina konglomeraadiks. Suurim Euroopa IT-ettevõte SAP on esikümne lõpus ja kõik teised Euroopa IT-ettevõtted on maailma mastaabis kääbused. Nii on nimetatud dokumentides märgilise tähendusega ka Ameerika ja Hiina nimetamine konkurentideks – seda olukorras, kus Washington eelistab oma suhet Pekingiga kirjeldada kui koostööalast rivaalitsemist.

Lohutuseks võib mõelda, et ülaltoodud polariseerumise pilt ei esita kogu tõde. Euroopa on vähem tsentraliseeritud kui Ameerika ja Aasia – mis on mitmes mõttes hea – ja sestap on meil palju väiksemaid IT- ja teenuste ettevõtteid, mida ei ole koondatud megakorporatsioonideks. Euroopas on palju väga heal tasemel ülikoole ja teadusasutusi ning traditsioonilist tööstust, mida digitaliseeritakse päris korralikus tempos.

Tehismõistus ja andmekogumine

Miks on lootused pandud andmekogumisele ja tehismõistuse arendamisele? Paradoksaalselt ei ole kogu selle sajandi IT-progress toonud kaasa tootlikkuse kasvu kiirenemist, pigem vastupidi: globaalne majanduskasv on pidevas langustrendis, teiste sõnadega, majandus küll kasvab, aga üha aeglasemalt.

Mis võiksid olla kasvu aeglustumise põhjused? Ehk on IT-investeeringute fookus läinud sotsiaalsete ja tarbijate igapäevaste vajaduste rahuldamisele (ühismeedia, uudisteportaalid, nutitelefonid, digifotograafia, mängud jne)? Võib-olla on see kõik tootlikkust pärssinud? Sajandivahetuse lühike tõusufaas, eeskätt Ameerikas, on seletatav interneti arenguga masstehnoloogiaks, sealt edasi aga paistab mõju majandusele olevat negatiivne. Kui mõelda, kes on digimajandusest eeskätt võitnud, siis tulevad pähe lõpptarbijate teenustele-toodetele keskendunud megakorporatsioonid nagu Google, Facebook, Apple, Samsung, Uber. Nende ühine nimetaja on tsentraliseerimine, olemasolevate valdkondade kaaperdamine oma keskse juhtimise alla.

Majanduskasvu kiirendamiseks on vaja tootlikkust tõsta. Infotehnoloogia ja digitaliseerimine paistab olema selleks loomulik viis, kuid siin on põhimine probleem see, et tarkvara arendamine on keeruline, aeglane ja kallis ega pruugi väiksemate ettevõtete puhul ennast kiirelt ära tasuda. Ei ole mõtet teha suuri pingutusi, luues tarkvara, millega hoitakse kokku paari inimese mõned töökuud.

Siit siis lootused tehismõistusele ja andmekogumisele. Nende valdkondade praktiline eesmärk on automatiseerida keerulise tarkvara loomine, kasutades ära IT-süsteemide automaatselt kogutavaid suuri andmehulki.

Lihtsalt öeldes jagunevad tehismõistuse meetodid sarnaselt inimeste alusoskustega kaheks: tegevusvariantide otsing ehk ettemõtlemine ja planeerimine, ning masinõpe ehk senise kogemuse kasutamine olukordade hindamiseks ja nähtuste tundmaõppimiseks. Masinõpe oli veel eelmise sajandi lõpul vaeslapse osas, kuna kättesaadavaid andmeid oli vähe ja arvutid aeglased, kuid on viimasel kümnendil teinud läbi väga kiire arengu ja jõudnud omakorda platoole, kus edasiminek vaikselt aeglustub. Masinõppe valdkonnas on kaks suurt muret: õppimiseks läheb vaja kohutavalt palju andmeid, mis ideaalis oleksid inimeste poolt märgendatud (à la õiged/valed „vastused“ lisatud) ja õppimise tulemus on mitteseletatav arvurägastik, kust selgeid ja mõistetavaid reegleid on pea võimatu eraldada. See kõik erineb sellest, kuidas inimene õpib: meil ei ole uue äratundmiseks vaja tuhandeid ja miljoneid näiteid ning üldiselt suudame oma arusaamist teistele mingil moel selgitada.

Ebameeldivaks kõrvalmõjuks masin­õppes loodu mitteseletatavusele on kallutatus ja prognoosimatud, ootamatud eksimused. Kallutatus võib väljenduda näiteks selles, et masinõppesüsteem kasutab parameetrina inimese nahavärvi. Eksimus võib tähendada, et isesõitev auto peab mingis olukorras teele astunud inimest puu varjuks ega hakkagi pidurdama. Ka väike protsent selliseid vigu ei ole aktsepteeritav, aga masin­õppega on veaprotsenti erakordselt raske nullilähedaseks viia.

Andmekogud kättesaadavaks

Kõigist nendest probleemidest ja ohtudest euroliidu poliitika lähtubki. Kolm dokumenti on omavahel seotud järgmiselt: tehismõistus vajab arenguks palju kvaliteetseid andmeid ning tehismõistust peetakse üheks peamiseks digitaliseerimise arengumootoriks. Kõigepealt, mida ütlevad kesksed andmepoliitika suunised?

• Andmekogud tuleb teha võimalikult laialt kättesaadavaks, tekitada mehhanismid ja motivatsioon nende jagamiseks riigisektorist ettevõtetele, ettevõtetelt riigisektorile ja risti-rästi omavahel.

• Tuleb luua tegutsemisprintsiibid andmekvaliteedi, allikate ja andmete arusaadavuse ning koosvõime parandamiseks.

• Luua Euroopa terviseandmetele ühine formaat ja raamistik.

• Toetada Euroopa oma serveriparkide loomist andmete turvatud hoidmiseks Euroopa Liidu pinnal.

Iseenesest ei ole nendes suunistes uusi alusideid, kuid tähele tuleb panna rõhuasetusi. Väljatoodust olulisim on tervitatav: parem integreerumine Euroopa digisüsteemidega toob meid geograafilisest kolkast päris-Euroopasse ja annab võimaluse oma seniste kogemustega saada suuremaks ja mõjukamaks, kui meie tilluke majandus ja rahvaarv lubaksid. Sellest vaatenurgast on andmete arusaadavus ja koosvõime tugevdamine otsustava tähtsusega. Oleme oma andmete ühekordse kasutamise põhimõtte tsementeerinud, kuid nüüd tuleb astuda järgmine samm: andmeid tuleks kodanikelt ja organisatsioonidelt küsida vaid üks kord, kuid alati peab mõtlema, kus saab neidsamu andmeid kasutada vähemalt teinegi kord. Saaksime paremini kontrollida bürokraatia vohamispüüdu ning soodustaksime loomingulisust. Paraku on suurimaks õiguslikuks takistuseks veelgi sügavamate juurtega ebaefektiivsust paljundav põhimõte, et andmeid tohiks kasutada ainult nende kogumisel ette nähtud eesmärkidel. Nende kahe põhimõtte õiglane tasakaalustamine ongi edasise andmestrateegia peaküsimus.

Mis on Eesti nõrkused? Meie IT-edusammude juures oleme olnud küllalt kehvad andmejagajad. Riigiasutused ei taha oma andmestikke väljapoole avalikuks kasutamiseks anda. Ühest küljest nõuab see asutuselt lisatööd ja teiselt poolt suurendab tema tegevuse jälgitavust, suurendab ametkondlikku riski ja vähendab asutuse infomonopoli.

Tehismõistuse poliitika

Digiarengu kolmest dokumendist on kõige põnevam tehismõistuse poliitika kogumik. Siin antakse kaks peamist sõnumit.

Tehismõistuse süsteemidest tekkivad ohud on tõsised ja nende vähendamiseks tuleb tööd teha, seda eriti kriitilistes valdkondades nagu tervishoid ja transport.

Tehismõistuse valdkonda investeerimist tuleb Euroopa Liidus järsult suurendada, eesmärk on lähema kümne aasta jooksul investeerida iga aasta 20 miljardit eurot.

Ohtude vähendamiseks tuuakse välja kolm peamist abinõu. Esiteks, õppimiseks kasutavad andmekogud peavad olema teada ja usaldusväärsed, vältida tuleb kallutatust. Teiseks, õpitust tulenevad otsused peavad olema seletatavad, neist peab välja saama tuua mõistetavad reeglid ja põhjendused, miks just selline otsus on tehtud. Kõige tugevama meetmena – mida on ka juba laiemalt kritiseeritud – plaanitakse keelata mitteseletatavate, n-ö musta kasti masinõppesüsteemide kasutamine tervishoius ja transpordis. Lootustandvaks suunaks peetakse masinõppe ja reeglipõhiste otsingualgoritmide integreerimist. Kolmandaks, masinõpet ei tohi kasutada inimeste identifitseerimiseks ja jälgimiseks, välja arvatud juhtudel, kui selle järele on üheselt selge ja tungiv ühiskondlik vajadus.

Investeeringute puhul tuuakse välja, et Euroopa on olnud tehismõistuse investeeringutes lootusetu järelsörkija: juba 2016. aastal investeeriti Ameerikas sellesse valdkonda üle 12 miljardi ja Aasias üle 6,5 miljardi euro, sellal kui euroliidus ainult 3 miljardit. Alates 2017. aastast on lõhe investeeringumahtudes aina suurenenud. Protsessi kiirendamiseks investeerib Euroopa Liit 2020. a esimeses kvartalis 100 miljonit ja see on mõeldud esialgse käivitamisrahana. Järgmisena plaanib Euroopa Komisjon investeerida 15 miljardit digitaal-, tööstus- ja kosmoseklastrisse, keskendudes seejuures tehismõistusele. Samuti plaanib komisjon investeerida 2,5 miljardit andmeplatvormide ja tehismõistuse rakenduste käivitamisse ning toetada riike väärtuslikumate andmekogude integreerimisel ühistesse andmeruumidesse.

Hiljutises Stanfordi ülikooli tehismõistuse analüüsis tuuakse välja,2 et praegu valitsevad Ameerika Ühendriigid ja Hiina täielikult tehismõistusealaseid investeeringuid ning teistest teevad tõsiseltvõetavaid investeeringuid ainult Iisrael ja Suurbritannia.

Rootsis on Wallenbergi sihtasutus viimase aasta jooksul otsustanud suurima suunatud teadusrahastusena (projekt nimega WASP) panustada 5,5 miljardit Rootsi krooni, et Rootsi tõuseks tehismõistuse liidriks. Sõnavalik ei ole kindlasti juhuslik ja peegeldab auahnet taotlust, on ju ka meie idanaabri president Vladimir Putin öelnud: „Kes iganes on tehismõistuse maailmaliider, valitseb maailma.“

Joonis 2. Eri maailmajagude IT-suurfirmade turuväärtus miljardites dollarites. Allikas: United Nations Conference On Trade And Development, Digital Economy Report 2019.

Joonis 3. SKT kasvuprognoos on ajaloolises madalseisus. Allikas: Consensus Economics, Goldman Sachs Global Investment Research.

Joonis 1. Kakskümmend maailma suurimat ettevõtet 2009 ja 2018. Allikas: United Nations Conference On Trade And Development, Digital Economy Report 2019.

Euroliidu poliitikaplaanid

Kolme dokumendi nõrgaks küljeks võib lugeda vähest veenvust ja hajutatud eesmärke. Peale prioriteetide paljususe ei olda dokumentides eelisarendatavate ja suuri võite toovate valdkondade suhtes järjepidev. Siiski tasub neid tähelepanelikult jälgida. Tehismõistuse poliitikadokumendi avalõigu põhjal parandavat uued digitehnoloogiad meie elu eelkõige tervishoiu, põllumajanduse efektiivistamise, kliimamuutustega kohanemise, tootmise tõhustamise ennetava hoolduse kaudu ja suurendavat eurooplaste julgeolekut.

Sama komplekti teises dokumendis nähakse Euroopal võimalust saada maailma eestvedajaks tööstuses, tervishoius, transpordis, finantssektoris, põllumajanduses, energiakeskkonnas, metsanduses, maakera nutijälgimises ja kosmosetööstuses. Inimkeskse tehnoloogia peamise rakendusvaldkonnana tuuakse välja personaalmeditsiin. Arusaadavalt ei näidata siin üheselt loetletud prioriteetide järjekorda, kuid vihjeid-suuniseid otsuste tegemiseks see loetelu kindlasti annab.

Uudsemate põnevate initsiatiividena võib välja tuua kavandatavad Euroopa ühised andmeruumid, mille arengut peaks pingsalt jälgima, ning üha kasvav digitaalsete kaksikinitsiatiivide (digital twins) hulk, mis päädib suure algatusega „Destination Earth“ ehk kõigile maakeral leiduvatele objektidele digiteisikute loomine. Suured tehnilised ülesanded ja taotlused ei ole halvad, kuid ilmselt vajavad need ülikõrge trepiastme eel ühiselt ületatavaid vaheastmeid. Alustada võiks kas või aastakümneid mõeldud-proovitud hoonete digitaalsete kaksikute meelekindlast juurutamisest.

Rahvusvaheline reaktsioon Eurooopa Liidu plaanidele on olnud ettevaatlik. Ühendriikide ametlik tehnoloogiapealik Michael Kratsios kahtleb, kas tehismõistuse ohtude hulgas on mõttekas rangelt eristada vähese ja kõrge riskiga valdkondi ja soovitab sujuvamat käsitlusviisi. Ka masinõppeguru Jeff Hinton on murelik, et soovitakse kontrollida ja piirata musta kasti tehismõistuse kasutamist. Üldiselt toetatakse soovitust liikuda selgitavate reeglipõhiste süsteemide ja masinõppe integreerimise poole, kuid ei kiideta heaks rangete keeldude poliitikat.

Eestis ei ole ohud ehk nii akuutsed kui suuremates riikides. Meil ei ole olnud massjälitamist ja igal tänavanurgal ei ripu masinõppesüsteemidega ühendatud kaamerad. Tehismõistuse süsteeme kasutatakse meil vähe ja isesõitvad autod on olnud ülikoolide uurimis- ja katseprojektideks.

Eestis on vaja suurendada tehismõistuse alaseid investeeringuid. Ülikoolid on valdkonnas tegevad, kuid kompetentsete teadurite ja õppejõudude hulk on väga piiratud. Meil on tehismõistusega tegelevaid iduettevõtteid ning meie mastaabis n-ö suuremad ettevõtted nagu Bolt arendavad oma tehismõistusesüsteeme. Ometi on investeeringud ikkagi väga väikesed, kui võrrelda neid näiteks traditsioonilise käsitsi kirjutatud tarkvara hulgaga, mida riigiasutused ja ettevõtted Eesti IT-firmadelt tellivad. Olles harjunud olema IT-riik, on meil suhteliselt suured tarkvaravajadused, kuid väike inimeste hulk on teinud vajadustele vastutuleku raskeks. Seega on väikese riigi vajadus selle järsu efektiivistamise järele automatiseerimise ja tehismõistuse abil suuremgi kui teistes Euroopa liikmesriikides.

Euroopa Liit plaanib andmeteaduse ja tehismõistuse arendamisega vähendada oma majanduse kõrvalejäetuse ohtu. Kui töötame ühise eesmärgi nimel, pöörame senised pooltühjad loosungid püsivaks majanduskasvuks.

Tanel Tammet ja Innar Liiv on Tallinna tehnikaülikooli IT-teadlased.

1 White Paper, On Artificial Intelligence – A European approach to excellence and trust. COM(2020) 65 final, Brussels 19. II 2020.

Communication From The Commission To The European Parliament, The Council, The European Economic And Social Committee And The Committee Of The Regions, A European strategy for data. COM(2020) 66 final, Brussels 19. II 2020.

Communication From The Commission To The European Parliament, The Council, The European Economic And Social Committee And The Committee Of The Regions, Shaping Europes digital futuure. COM(2020) 67 final, Brussels 19. II 2020.

2 Raymond Perrault, Yoav Shoham, Erik Brynjolfsson, Jack Clark, John Etchemendy, Barbara Grosz, Terah Lyons, James Manyika, Saurabh Mishra, and Juan Carlos Niebles, The AI Index 2019 Annual Report. Stanford University 2019.

Kui sulle meeldis see postitus jaga seda oma sõpradega

[LoginRadius_Share]

Leia veel huvitavat lugemist

Värske Rõhk
Hea laps
LR
Keel ja kirjandus
Akadeemia
Kunstel
Muusika
Õpetajate leht
Täheke
TeaterMuusikaKino
Vikerkaar
Looming
Müürileht