Kas juturobot võtab üle?

Teksti ja visuaalseid kujutisi loovad programmid tekitavad täiesti uudse olukorra. Inimeste mõjutamine muutub veelgi lihtsamaks ja automatiseeritumaks.

KURMO KONSA

Kirjutamine on mu elus väga tähtsal kohal. Mäletan, et valmistasin raamatuid juba siis, kui veel õieti kirjutadagi ei osanud. Murdsin paberilehed kokku, joonistasin pildid ja teksti kujutas lihtsalt looklev joon ning raamat oligi valmis. Isiklikus ajaarvamises järgnes sellele käsitsi kirjutamise ajajärk. Käsitsi kirjutamise ajajärk läks ülikooli lõpus (1990. aastate alguses) tasapisi üle masinakirja epohhiks. Kui meelde tuletada, siis oli ka see üsna keeruline. Käekiri ei olnud enam probleemiks, küll oli seda aga tekstide töötlus. Väiksemaid parandusi sai teha valge värviga või pabeririba peale kleepides, suuremate korral tuli kogu tekst uuesti kirjutada. Mehaaniliste kirjutusmasinate asemele tulid elektrilised ja siis mäluga masinad, mis salvestasid paar rida teksti, mida seejärel sai enne paberile kandmist üle vaadata ja parandada. Sealtkaudu jõutigi tänase päevani kestvasse arvutite ajajärku. Tekstide tehniline töötlemine muutus ülilihtsaks, kuigi praeguste mõõdupuude kohaselt ei olnud tollased tekstiredaktorid WordStar ja WordPerfect teab mis mugavad. Veelgi tähtsam oli interneti tulek, mis lõi lahti üüratu informatsioonilise varasalve. Praegu on raske ette kujutada suuri pakse raamatuid, kus olid kirjas välismaa ajakirjades ilmunud artiklite kokkuvõtted. Sealt sai kätte artikli autori või autorite aadressid, seejärel tuli saata autorile kirjaga palve, et nad saadaksid oma artikli koopia. Pool aastat asjaajamist ja hea õnne korral oligi artikkel käes. Google muutis kõike, info hankimine ja töötlemine muutusid kordades lihtsamaks ja kiiremaks. Võis arvata, et paremaks enam minna ei saagi. Aga tehnoloogia areneb sõltumata sellest, mida sellest arvatakse. Otsimootorite ajajärgule järgneb tekstirobotite ajastu.

Kuidas kirjutamine meid maailmaga seob

Iseenesest on ju tore meenutada kõiki neid läbitud tehnoloogilisi etappe, aga kas see iseloomustab veel midagi peale selle, et autor on juba vana? Kirjutamine ei ole ju lihtsalt teabe salvestamine, kaugel sellest. Kirjutamise kaudu ja abil toimub info töötlemine, mõtlemine. See, milliseid tööriistu kasutame, mõjutab seda, mida me teeme, ja ka seda, kes me oleme.

Käsitsi kirjutamine võib aidata võrreldes lugemise või kuulamisega paremini infot meelde jätta. Samuti suurendab see tähelepanu teabe suhtes ning muu hulgas vähendab märkimisväärselt stressitaset. Paberile kirjutades töötab inimese aju märksa kriitilisemal ja analüütilisemal viisil kui klaviatuuril klõbistades.

Vastupidiselt üldlevinud arvamusele on paberil märkuste tegemine ja kirjutamine ka hulga kiirem võrreldes tahvlite või nutitelefonide kasutamisega.1 Kuid arvutis on lihtsam lõike ümber tõsta, siduda eri allikatest pärit infot, lisada viiteid ja toimetada teksti. Käsikirjalise suure süsteemi loomise asemel aitab trükkimine tekitada kiirelt kombineeruva teabe mustreid.

Väga suur muutus saabus infotöötlusse koos interneti ja otsingumootoritega. Internetieelsel ajal tähendas artikli kirjutamiseks info otsimine ennekõike raamatukogu külastamist ja sageli ka teemaga kursis olevate inimeste ülesotsimist. Praegu otsivad otsingumootorid, näiteks Google, kindlate tunnustega andmeid veebist otsingusõnade ja -fraaside abil (kuid kõikidesse andmekogudesse ei pääse nad ligi). Otsingusõnad peab valima kasutaja ise ja sellest valikust sõltub suuresti talle esitatav teave. Teave esitatakse andmeressursside loendina, asjakohasemad tulemused eespool. Otsingumootor jälgib, milliseid inforessursse kasutaja kasutab ning vastavalt sellele täiustab algoritmi.

Ja juba on toimumas järgmine tehnoloogiline hüpe infotöötlemise vallas. Selleks on juturobotid (chatbots), mis simuleerivad reaalset suhtlust kasutajatega kas hääle, teksti, kujutiste või videoga. Juturobotid mitte ainult ei vahenda kasutajale teavet, vaid täidavad ka neile antud ülesandeid. Kuna nad õpivad aja jooksul tundma kasutaja vajadusi ja harjumusi, teevad nad infootsingu ennenägematult efektiivseks ja personaalseks. Viimasel ajal laineid löönud juturobot ChatGPT suudab luua hämmastavalt üksikasjalikke ja mitmekülgseid tekste ning pidada vestlusi. Nimes olev tähekombinatsioon GPT (Generative Pre-Trained Transformer) viitab autoregressiivsele keelemudelile, mis kasutab tavakeelse teksti genereerimiseks sügav­õpet.

 

Kuidas õpetada arvutit inimkeelt mõistma?

Juturobotid on tehisintellektil töötavad programmid, mis kasutavad tehisnärvivõrkude tehnoloogiat. Mõistega „tehisintellekt“ tähistatakse väga erinevaid asju ning enamikul juhtudel on sellest sõnast saanud moodne müügiargument. Seega tasub alati vaadata, mida igal konkreetsel juhul selle sõnaga tähistatakse, seda enam et puudub ka täpne ja üldlevinud määratlus sõnale „intellekt“.

See, mis annab juturobotitele ja paljudele teistele algoritmidele nende intellektuaalsed võimed, olgu need siis olemuslikud või näivad, on tegelikult masinõpe. Seda nägi ette juba arvutitehnoloogiale aluse rajanud Alan Turing (1912–1954). 1948. aastal koostatud ettekandes „Intelligentsed masinad“ („Intelligent Machinery) esitas ta silmapaistvalt uudseid ideid, mis käsitlesid geneetilisi algoritme, tehislikke närvivõrke (tema terminoloogias mitteorganiseeritud masinad) ja arvutite masinõpet. Oma ideed võtab Turing kokku järgmiselt: „Arutatakse võimalikke viise, kuidas panna masinaid intelligentselt käituma. Juhtiva printsiibina kasutatakse seejuures analoogiat inimajuga. Juhitakse tähelepanu asjaolule, et inimese intelligentsuse potentsiaal realiseerub ainult sobiva hariduse tagamisel. Käesolev uurimus keskendubki peamiselt analoogsele masinate juures rakendatavale õpetamisprotsessile. Esitatakse mitteorganiseeritud masinate idee ja väidetakse, et imiku ajukoor sarnaneb sellise masinaga. Tuuakse lihtsaid näiteid sellistest masinatest ning arutletakse, kuidas neid õpetada premeerimise ja karistamise abil.“2 Tänapäevaks ongi masinõppest kujunenud keskne tehisintellekti valdkond.

Masinõppe korral on tegemist programmidega, mis täiustavad ise oma toimimist, see tähendab – on õppimisvõimelised. Sellise programmi korral ei pea inimene enam ette andma detailseid toimimisjuhiseid, vaid algoritm omandab need õppimise käigus. Siinkohal ei ole vahest liigne meelde tuletada, et arvutid tegelevad arvutamisega. Tihtipeale ei mõtle kasutajad selle peale, kui just oma pere eelarve kokkulöömiseks Excelit ei kasuta. Arvutis loetakse ja kirjutatakse tekste, vaadatakse pilte ja filme, kuulatakse muusikat. Koos sellega kasutatakse mõisteid „informatsioon“ ja „andmed“. Arvuti jaoks on kõik aga ainult arvud, milledega teostatakse matemaatilisi tehteid. Algoritmid on arvutusjuhendid, mille järgi arvutid sooritavad arvudega mitmesuguseid operatsioone.

Arvude endiga on asi lihtne, ei ole vaja täiendavalt kirjeldada arvu 2, arvuti oskab sellega niigi toimetada. Küll on aga lugu keerulisem muude objektidega. Näiteks inimese arvude kaudu kirjeldamiseks tuleb esmalt leida vajalikud tunnused ja seejärel siduda need arvudega. Inimest iseloomustavateks tunnusteks võivad olla nimi, sugu, vanus, kaal, silmade värv jms. Nagu näha, on osa tunnuseid arvulised (vanus, kaal) ja teised, näiteks inimese nimi, ei ole seda. Neid viimaseid kutsutakse mittearvulisteks või kvalitatiivseteks tunnusteks. Mittearvuliste tunnuste väärtused tuleb samuti seostada arvudega, selleks kasutatakse koode, mis seavad teatud väärtuste vastavuseks arvud. Objektide tunnustest moodustub andmestik, mis tavaliselt esitatakse tabeli kujul.

Tunnust, mida ei teata, aga tahetakse olemasolevate andmete alusel ennustada, nimetatakse märgendiks või sildiks. Näiteks võin tahta teada, milline on selle artikli lugejaskond Sirbi veebilehel. Seda tunnust ma praegu ei tea, see selgub alles mõne aja pärast. Näideteks tuleks võtta minu varem kirjutatud artiklite tunnused (nt maht tähemärkides, teema, ilmumise kuupäev, piltide arv jms) ja lugejate arv (või täpsemalt artikli veebis avanud lugejate arv), mis on märgendiks. Seoste leidmiseks võrdlevad masinõppe algoritmid näidete tunnuste väärtusi ja püüavad nende põhjal ennustada märgendeid. Selleks vajalike matemaatiliste sammude järjestust kutsutaksegi algoritmiks. Algoritmi põhjal luuakse juba arvutis käitatav programm, mis teeb ennustuse selle kohta, milline võiks olla märgendi väärtus. Pärast artikli ilmumist saame teada märgendi tegeliku väärtuse – kui palju inimesi artiklit veebis vaatas. Algoritmi ennustatud märgendi väärtust saab tegeliku väärtusega võrrelda ja algoritmi muuta nii, et need väärtused oleksid võimalikult lähedased. Seda nimetataksegi algoritmi õpetamiseks. Õppimise tulemusena saame algoritmi, mis ennustab märgendit täpsemini kui enne õppimist. Siin kirjeldatud masinõpet tuntakse juhendatud õppena.

Juhendamata õppe korral ei ole eesmärgiks teatud tunnustest märgendi ennustamine, vaid andmetes olevate korduvate mustrite otsimine. Selle korral püütakse avastada seoseid eri tunnuste ja eri näidete vahel. Nii näiteks võiks uurida Sirbi veebiartiklite lugejate ja nende loetud artiklite vahelisi seoseid.

Viimasel ajal on üheks edukamaks masinõppe algoritmiks osutunud sügavad tehisnärvivõrgud (deep neural networks), mille loomisel on eeskujuks olnud inimese aju. Inimese aju koosneb, muidugi väga lihtsustatult võetuna, neuronite võrgustikest. Tehisnärvivõrkudes täidavad neuronite rolli algoritmid, mida tuntakse pertseptronidena. Tegemist on bioloogilisi neuroneid lihtsustatult simuleeriva mudeliga. Pertseptronid saavad signaale teistelt pertseptronidelt, teostavad nendega arvutusi ja edastavad töödeldud signaali edasi kas ühele või mitmele teisele pertseptronile. Pertseptronil on kaks seisundit – see kas annab signaali (spaigib) või ei anna. Pertseptronil on oma sisemine tundlikkuse lävi: kui sisendsignaalide tugevus ületab läve, siis pertseptron annab signaali, kui ei ületa, siis vastab pertseptron vaikimisega. Pertseptron saab sisendsignaale mitmelt teiselt pertseptronilt, sisendsignaalid ei ole seejuures võrdsed, vaid nende erinevus kajastub sisendi tugevuses (kasutatakse ka kaalu mõistet). Selline pertseptronidest koosnev tehisnärvivõrk on võimeline õppima. Kui soovitakse, et närvivõrk eristaks kassipilte koerapiltidest, siis esitakse sellele suur hulk pilte, kus on kujutatud kasse ja koeri. Kui närvivõrk klassifitseerib antud kujutise õigesti, siis esitatakse järgmine pilt. Kui närvivõrk eksib, annab juhendaja sellest märku ja pertseptron muudab oma kaalude tugevust. Seega muutuvad õppimise käigus kaalude tugevused ning pertseptron muutub piltide klassifitseerimisel järjest osavamaks. Tehisnärvivõrkudes on tehislike neuronite arv väga suur ulatudes kümnetesse ja sadadesse miljarditesse ning need on organiseeritud kihtidena. Iga järgnev kiht tuvastab järjest keerukamaid tunnuseid. Tehisnärvivõrkude treenimisel kombineeritakse juhendamata ja juhendatud õpet ja see on viinud lausa hämmastavate tulemusteni.

Juturobot ChatGPT

Viimasel ajal on laineid löönud juturobot ChatGPT,3 mis suudab luua hämmastavalt üksikasjalikke ja mitmekülgseid tekste ning pidada vestlusi. Juturoboti ehitas tehisintellekti arendamisega tegelev ettevõte OpenAI. 2015. aastal loodud iduettevõtte rajajate hulka kuulus ka Elon Musk. ChatGPT kuulub OpenAI poolt arendavate GPT-3.5 keelemudelite perekonda. Mudeli treenimiseks kasutati internetis leiduvaid tekste. Näiteks õpetati vestluste pidamist Redditi veebikeskkonnast leitud diskussioonide abil. Juturoboti kasutamise käigus kogutakse samuti pidevalt andmeid ja täiustatakse neile tuginedes kogu aeg algoritme. Kasutajatel on võimalik hinnata juturoboti antud vastuseid ja lisaks saavad nad anda ka tekstilist tagasisidet. Sellisel viisil treenitud tehisnärvivõrk ennustab, millise tõenäosusega järgneb mõnele kindlale sõnale teine sõna või sõnaühendile ja lausele teine sõnaühend või lause. Selline lihtne printsiip kombineerituna ülisuure tehisnärvivõrgu ja unikaalsete õpetamismeetoditega võimaldaski luua vägagi võimeka vestluskaaslase.

Juturoboti eesmärgiks on info otsimine ja küsimustele vastamine, mis toimub hariliku vestluse vormis. See võimaldab programmil täpsustada küsimusi, lükata tagasi ebasobivaid küsimusi, aga ka tunnistada oma vigu. Ühesõnaga, selle kasutamine on tehtud vägagi inimliku suhtluse sarnaseks. Just see eristabki ChatGPT teistest lihtsamatest juturobotitest. Programm kommenteerib seda ise nii: „ChatGPT on tehisintelligentsil põhinev kirjutus­assistent, mis loob inimsarnast ja loomulikku sisu. See on loomuliku keele töötlemise võimekusega, pakkudes abi kiiresti ja veatult kirjutamiseks, säilitades samal ajal teksti inimlikkuse. Võrreldes enamiku inimestega kirjutab ChatGPT märksa paremat teksti ning on samas ka äärmiselt kohandatav, sobides seega kõikideks ettevõtmiseteks, kus on vaja luua usaldusväärset sisu.“ Nagu vastusest näha, ei kannata juturobot erilise tagasihoidlikkuse all.

Tõepoolest, seda saab edukalt kasutada tekstide loomiseks, klientide päringutele vastamiseks, kasutajatele soovituste andmiseks ja mitmesuguste automatiseeritud vestlusrobotite loomiseks. Edaspidi võib selline süsteem tegeleda mingite teemade uurimise ning nende kohta info kogumisega. Ehk siis võib sellest saada tõeline intelligentne abiline vaimse töö tegijatele. Kas see võib tähendada ka seda, et ChatGPT või mõni sarnane programm võtab minusuguselt kirjutajalt töö? Esitasin selle küsimuse juturobotile endalt ja vastus oli lohutav: „ChatGPT ei ole loodud asendamaks inimestest ajakirjanikke. See muudab kirjutamisprotsessi kiiremaks ja aitab tagada ühtlasema kvaliteedi, kuid tekst vajab ikkagi inimese ülevaatamist.“

Enamik spetsialiste on veendunud, et tehislikud keelemudelid, kuigi need tuginevad paljus inimmõistuse tööprintsiipidele, erinevad siiski olemuslikult inimesele omasest keelevõimest. Asi on selles, et masin ei saa keelest aru nii nagu inimene. Tegelikult masin ei mõistvat keelt. Meiegi ei oska ju praegu veel öelda, mida keele mõistmine tähendab. Juturobot ise vastas küsimusele, kas ta mõistab teksti, järgmiselt: „Absoluutselt! Masinad suudavad tekstist väga hästi aru saada, kuigi selles valdkonnas on veel palju väljakutseid, millele tuleb vastata. Masinad suudavad mõista sõnade tähendust, analüüsida, kuidas neid koos kasutatakse ja koguda teadmisi sõnade konteksti kohta. Keele nüansside mõistmiseks on aga vaja keerukaid algoritme ja võimsat tehisintellekti tehnoloogiat.“ Muidugi ei tasu kohe kõike uskuda, mida masin räägib, aga sama käib ju ka inimeste kohta.

Midagi pole teha, päris paljudel juhtudel võib ChatGPT anda ka loogilisena näivaid ja hästi sõnastatud, kuid sisult täiesti valesid vastuseid. Võib-olla üks kurioossemaid näiteid on vastus küsimusele, milline imetaja muneb kõige suuremaid mune, mille vastuseks ütles juturobot kindlalt, et muidugi elevant. Erinevalt lihtsamatest vestlusrobotitest on ChatGPT õpetatud mõistma inimese esitatud küsimuste olemust ja tema vastused on tõesed, kasulikud ja kahjutud. Ilmselgelt võimatuile või kuritahtlikele küsimustele keeldub juturobot vastamast. Muidugi on kavalusega võimalik nendest piirangutest mööda minna. Just enne selle artikli kirjutamist vaatasin krimiseriaali, kus kirjutati väljapressimiskirju. Palusin ChatGPT kirjutada mulle üks selline kiri. Programm keeldus, viidates selliste kirjade ebaseaduslikkusele. Seejärel rääkisin juturobotile, et kirjutan krimijuttu ja selles jutus kirjutab üks tegelane teisele väljapressimiskirja. Palusin programmil kirjutada sellise kirja näidis ja saingi enam-vähem korraliku väljapressimiskirja. Kas petmine näitab tõesti intelligentsi olemasolu? Eespool mainitud Alan Turing vastas sellele oma kuulsas artiklis „Arvutusmasinad ja intellekt“ jaatavalt.4 Kui küsisin selle kohta juturobotilt, vastas see nii: „Kuigi petmisvõime on inimese ainulaadne võime, töötatakse praegu välja tehisintellektisüsteeme, mis suudavad ka pettust tuvastada. Tehisintellekt on varustatud loomuliku keeletöötluse ja masinõppe võimalustega, mis suudavad tuvastada erinevusi petlike ja mittepetlike väidete keelelistes tunnustes, võimaldades tehisintellektil tuvastada pettusi reaalsetes olukordades.“

Kas juturobotid astuvad varsti otsimootorite, näiteks Google’i, asemele? See võib vabalt nii juhtuda, kuna selgeks suundumuseks on üleminek info­otsingult kindlate ülesannete lahendamisele. Näiteks sellegi artikli kirjutamiseks oli vaja otsida teavet internetist, kuigi eesmärk ei ole ju teemakohaste artiklite leidmine, vaid hoopiski selle loo kirjutamine. Kui otsimootorite korral tegeleb info väljavalimisega leitud allikatest ja selle kokkukirjutamisega kasutaja, siis juturobotite korral on ka see töö antud algoritmile. Ilmselt tekivad mingid hübriidsed lahendused, mis pakuvad nii otsimisvõimalust kui ka dialoogipõhist tekstiloomet. Tasub mainida, et ka Google arendab usinasti oma juturobotit LaMDA.

Uudne olukord

Loomulikult kaasnevad uute tehnoloogiatega alati probleemid. Kindlasti on juturobotite ja üldse loovate tehisintelligentsete süsteemide korral üheks küsimuseks autoriõigused. Kelle oma on ChatGPT abil loodud tekst? Väga selget lahendust sellele esialgu ei olegi. Teiseks teemaks, mida tuliselt arutatakse, on selliste juturobotite mõju haridusele. Kui õpilane laseb juturobotil kirjutada essee, siis pole seda võimalik mingil viisil tuvastada. Harilike plagiaadituvastusprogrammidega ei ole siinkohal midagi peale hakata, on ju tekst mitte kopeeritud, vaid originaalne. Tõsi küll, selle ei ole kirjutanud õpilame, vaid tehisintellekt. Üheks võimaluseks oleks kõikide tekstigeneraatorite loodud tekstide säilitamine sõltumatus hoidlas, kust soovijad saaksid neid palgiaadituvastusprogrammidega kontrollida. Samuti saaks tekstigeneraatorite kasutajatele kehtestada näiteks vanusepiirangu, et kooliõpilased ei pääseks neile ligi. Võiks ju proovida ka sisulisi piiranguid, kuid nagu näha, on vähemalt praegu võimalik neid programme alt vedada. Kõiki neid võimalusi praegu alles arutatakse, aga tekstiloomeprogrammid on juba kasutuses. Tehnika vallas on taas tegemist juba tuttava olukorraga – seade või meetod on välja töötatud ja kasutuses ning nüüd tuleb ühiskonnal otsustada, mil viisil seda reguleerida. Esimeseks lahenduseks on tavaliselt keelustamine ja nii keelatigi 3. jaanuaril 2023 New Yorgis avalike koolide internetivõrgust ligipääs juturobotile ChatGPT.

Teksti ja visuaalseid kujutisi loovad programmid tekitavad täiesti uudse olukorra. Need võimaldavad luua lühikese ajaga suures mahus kindla suunitlusega teavet. Inimeste mõjutamine muutub seega veelgi lihtsamaks ja automatiseeritumaks. Pisut naiivne on loota, et kasumile orienteeritud ettevõtted kehtestavad piiranguid vabatahtlikult.

1 Keita Umejima, Takuya Ibaraki, Takahiro Yamazaki, Kuniyoshi L. Sakai. Paper Notebooks vs. Mobile Devices: Brain Activation Differences During Memory Retrieval. – Frontiers in Behavioral Neuroscience 19. III 2021, 15 DOI: 10.3389/fnbeh.2021.634158

2 B. Jack Copeland (ed.), The Essential Turing: Seminal Writings in Computing, Logic, Philosophy, Artificial Intelligence, and Artificial Life plus The Secrets of Enigma. Clarendon Press, Oxford 2004.

3 https://chat.openai.com/auth/login

4 Alan Turing, Arvutusmasinad ja intellekt. – Akadeemia, 2005, 12, lk 2582.

Kui sulle meeldis see postitus jaga seda oma sõpradega

[LoginRadius_Share]
 

Leia veel huvitavat lugemist

Värske Rõhk
Hea laps
LR
Keel ja kirjandus
Akadeemia
Kunstel
Muusika
Õpetajate leht
Täheke
TeaterMuusikaKino
Vikerkaar
Looming
Müürileht