23.08.2024

Tehisintellekt ja humanitaarteadused – kes vajab keda?

Tootval tehisintellektil põhinevate süsteemide kiire levik on tekitanud tungiva vajaduse traditsiooniliste humanitaarteaduslike oskuste järele.

KRISTER KRUUSMAA, ANDRES KARJUS, OLIVER LAAS

Arvutiteadustes täheldati juba aastakümnete eest nn Moraveci paradoksi, et arvutite jaoks on keerulised probleemid lihtsad ja lihtsad probleemid keerulised. Lihtsam võib olla õpetada arvuti maailmatasemel malet mängima kui eristama pilte koertest ja kassidest. Viimase aasta-kahe jooksul sõna „tehisintellekt” (TI) ümber tekkinud furoor seisneb aga selles, et lühikese ajaga lahendati suur hulk arvutite jaoks üliraskeid või isegi võimatuks peetud ülesandeid, ennekõike inimkeeles suhtlemine ja juhiste järgimine.

ChatGPT ja teiste generatiivse ehk tootva tehisintellekti rakenduste areng tugineb ühelt poolt innovatsioonile sügavõppes tehisnärvivõrkude alal, teiselt poolt riistvara võimekuse kiirele kasvule, mis võimaldab treenida väga suuri mudeleid suurte andmemahtude peal. Tehisnärvivõrgud on paralleelarvutuse süsteemid, mida on võimalik andmete abil õpetada ülesandeid lahendama (keelemudeli puhul nt eelneva teksti põhjal järgmist sõna genereerima). Võrreldes lihtsamate masinõppemeetoditega on tehisnärvivõrgud kordades võimsamad ja paindlikumad.

Tootva tehisintellekti edu on tekitanud vajaduse ümber mõtestada arvutite potentsiaal paljudes valdkondades – sealhulgas humanitaarias. On vahest ajastu märk, et aprillis esimest korda toimunud Eesti humanitaarteaduste aastakonverentsil (EHAK) pidas ühe kolmest plenaarettekandest arvutiteaduse professor ja seda tehisintellekti teemal,¹ lisaks toimus kaks tehisintellekti käsitlevat sessiooni. Siinse kirjutise eesmärk on diskussiooni jätkates näidata, et humanitaarteadused ei jää tehisintellekti arengust puutumata, aga kätkevad suurt potentsiaali seda kujundada.

Tehisintellekti rakendamine teaduses ja analüütikas

Nimetame generatiivset tehisintellekti teadlikult tootvaks (ja mitte loovaks), sest selle suhe vaimutöösse on sarnane tööstusseadmete suhtega käsitöösse. Tehisintellekti kõige otsesem efekt humanitaarias on seotud eelkõige töö automatiseerimisega ja ootustega produktiivsuse kasvule. Esmapilgul võiks arvata, et humanitaarteadused ei ole automatiseeritavad ning jäävad väljapoole TI plahvatuse mõjuraadiust. Humanitaaria tuum ehk mõtestamine ja (uute) seoste loomine jääb tõesti ilmselt nähtavas tulevikus arvutitele kättesaamatuks, kuid sama ei saa öelda humanitaarteadlase töö kohta.

Kultuuriliselt joondamata tehisaru toodetud väljundid võivad kõikuda mõistlikust kohatuni. Pildil näited Flux AI pildimootori nägemusest eestlaste jaanipäevast.

Humanitaarteaduste tulemustele eelneb tihti suur hulk rutiinset käsitööd, mis võib võtta näiteks arhiividokumentide pahmakale ühe ja sama küsimuse esitamise, tekstide ja piltide märgendamise või andmebaasi kirjete loomise kuju. Seda sai teha ka varem masinõppe lahenduste abil, ent tootva TI süsteemid ehk tehisarud – näiteks eeltreenitud suured keelemudelid – on selle teinud veel lihtsamaks. Probleemid, küsimused ja ülesanded, mis varem eeldasid igaüks omaette mudeli treenimist või kohandamist, saab nüüd lahendada nullõppe (zero-shot learning) põhimõttel, kus eeltreenitud mudelit instrueeritakse mingi teksti, pildi või andmeühikuga midagi tegema. Nii toimib ka keelemudelipõhine ChatGPT: kasutaja ütleb, mida tal on vaja ja mudel genereerib vastuse. Juba praegu on edukalt näidatud, et paljud kvalitatiivset analüüsi nõudvad ülesanded on suurte keelemudelite ehk SKMide abiga edukalt automatiseeritavad, kusjuures tulemuste kvaliteet ei kannata ning võib mõnel juhul isegi paraneda.²

Humanitaarteadlastel on seega avanenud võimalus rakendada oma oskusi suuremate teabemassiivide analüüsiks, kui seda käsitsi üksinda jõuaks teha. Teisisõnu, humanitaaralane kompetents on tänu tehisarudele muutunud kordades hõlpsamini skaleeritavaks. Sellel tõdemusel on mitu tagajärge. Esiteks on teadlastel võimalik teha laiapindsemaid järeldusi ja vabaneda igiammusest pudelikaelast, mis seab kvalitatiivse analüüsi sügavuse ja käsitletava ainese hulga pöördvõrdelisse sõltuvusse. Teine tagajärg on ressursi vabanemine. Pole saladus, et humanitaaria köögitoimkonnas rügavad enamasti praktikandid ja juhendatavad, aga olude sunnil sageli ka teenekad teadlased ja professorid. Võib eeldada, et tehisarude tulek muudab varsti keeruliseks taotleda raha projektideks, kus teadlased raiskavad aega, tehes käsitsitööd, mida on võimalik automatiseerida. Võimaluste avardumisega kasvavad seega ka ootused ja sarnaselt teiste valdkondadega tekib konkurentsieelis neil, kes uue tehnoloogia kiiremini enda kasuks oskavad pöörata.

See viib otsejoones kolmanda tagajärje, tehnilise kirjaoskuse vajaduse kasvuni. Näiteks ei ole keelemudelil põhinev tekstirobot nagu ChatGPT või Copilot üldjuhul sobiv viis teaduse tegemiseks, vaid selleks tuleb kasutada keelemudelit ennast. Tehisarude efektiivne rakendamine ei vaja tingimata programmeerijaks hakkamist (nagu ennustati ajaloolastele juba üle poole sajandi tagasi),³ küll aga baasteadmisi koodikirjutamisest, andmetöötlusest ja statistiliste põhitõdede tundmist. TI-alane teadmispagas peab muutuma humanitaarhariduse elementaarseks osaks, nagu on selleks saanud kontoritarkvara kasutamine ja veebiotsing.

Kvaliteetse ja õiglase TI poole

On selge, et humanitaarid peavad õppima tehnoloogilist arengut enda kasuks pöörama, kuid samal ajal on sügavalt mõtestavaid teadusi tarvis TI arengu suunamiseks ja uurimiseks. Tootval tehisintellektil põhinevate süsteemide kiire levik ja murrangulised muutused eri sektorites on tekitanud tungiva vajaduse traditsiooniliste humanitaarteaduslike oskuste järele lausa mitmel viisil.

Kõigepealt on humanitaarteaduslik kompetents otseselt vajalik selleks, et arendada kvaliteetseid ja õiglasi TI-süsteeme. Praegu levivate tootva TI mudelite treenimiseks kasutatakse teadupoolest ülisuurel hulgal (kultuuri)andmeid: keelemudelite puhul tekste, pildimootorite puhul teksti ja pildi paare. Nende andmete kvaliteet, iseloom ja jaotus määravad mudeli võimalike väljundite universumi, kuid ei pane paika, kuidas mudel selle piirides käitub. Alusandmestike paratamatu mitmekesisuse tõttu oleks praegu populaarsete TI-rakenduste nagu ChatGPT või DALL-E kapoti all põksuvad keelemudelimootorid hõlpsasti võimelised šokeerivat või räiget sisu looma. Selle ärahoidmiseks kasutatakse mitmesuguseid peenhäälestamise meetodeid nagu instruktsioonõpe ja stiimulõpe, mille tulemusel suunatakse mudelit eelistama teatud väljundeid teistele.

Lõpliku TI-toote omadused ja käitumine on seega tugevalt sõltuvad arendusprotsessi vältel tehtavatest subjektiivsetest valikutest. Näiteks treeningandmete koosseis võib määrata selle, kas keelemudel oskab väikekeeli ja on kasutatav ka väljaspool angloameerika kultuuriruumi. Siin on võimalus panustada kultuuripärandiga tegelevatel teadlastel, nagu ka asutustel, kes tegelevad kultuuriandmete säilitamise ja kureerimisega. Veelgi selgemalt on humanitaarteadlasi vaja toormudeli treenimisele järgnevates peenhäälestamise etappides. Keegi peab otsustama, milline väljund on soositav ja milline mitte: mis eristab viisakat vastust ebaviisakast, millised teemad on tabud, millised väärtused tuleb esile tõsta ja milliseid kritiseerida.

Selliseid protsesse, mille eesmärk on tehisaru inimese maailmapildiga ja väärtustega vastavusse viia, kutsutakse joonduseks (alignment). Humanitaarteaduslik ekspertiis on nende juures hädavajalik, sest inseneriharidus üksi ei paku piisavalt pädevusi, et mõista joondamise käigus tehtavate otsuste täit mõju. Praegu on suured TI-firmad oma süsteemide kujundamisse tõenäoliselt kaasanud küll erinevaid eksperte, kuid tervikuna on protsess läbipaistmatu ja väga tehnomaailma keskne. Sellised de facto universaalsusele pretendeerivad süsteemid peaksid aga olema rajatud eetikale ja teaduslikule arusaamale inimkultuurist.

Praeguste TI-süsteemide alusandmete piiratusel ning joonduse pealiskaudsusel on oma tagajärjed: näiteks võib pildimootor talvise Eesti jõulumaastiku pähe kujutada hoopis märtsiküüditamist.⁴ Mudelid on väikekeeltes tihti nürimad ja ohtlikumad ning võivad esindada osa ühiskonnagruppe ja poliitilisi vaateid selgemalt kui teisi.⁵ Joondus vajab seega hädasti humanitaarteaduslikku panust, et uurida tehisaru käitumist ühe või teise kultuuri raames. Esimesed katsetused sellel alal toetuvadki näiteks kultuurantropoloogia ja sotsiaalpsühholoogia meetoditele.⁶

Just kultuuriline joondus on Eesti humanitaarteadlastele võtmetähtsusega. Esiteks on see vajalik, et TI oleks ka eesti kultuuri puudutava uurimistöö raames kasutuskõlblik. Teiseks on seda uurides võimalik ka rahvusvaheliselt silma paista ja isegi teed näidata. Eestlaste digitaalne jalajälg on piisavalt suur selleks, et võimsamad tootva TI mudelid sisaldaksid (juhuslikult) mingil määral eesti keelt ja kultuuri. Samal ajal oskame me mõista ja ära tunda väikekultuuridele tihti osaks langevat kõrvalejäetust ja diskriminatsiooni. Selle poolest eristume nii suurrahvastest, kes ei pruugi kirjeldatud probleeme üldse märgata, aga ka digitaalselt mahajäänud kultuuridest, kel puuduvad vahendid nendega tegelemiseks.

Tehisintellekt ühiskonnas

Tehisintellekti mudelite ja teenuste võimekus, ligipääsetavus ning rahastusmudelid võivad ajas muutuda, aga põhimõtteline nihe on jõudnud juba toimuda ning ka ühiskondlikud tagajärjed ei jää tulemata. Tehisintellekti mõju inimkonnale saab olema sujuvam ja varjatum, kui seda võiks arvata eksistentsiaalsete, nn x-riskide teemalisest arbumisest. Eeskätt ei ole vaja tegeleda maailma hävitava superintellekti ennetamisega (ehkki on hea, kui keegi ka sellele mõtleb!), vaid analüüsida väga suure hulga tähendust tarbivate ja tootvate mitteinimestest agentide koosmõju, tegeleda valeinfo genereerimise ja levitamise probleemiga, arendada allikakriitilist mõtlemist jne.⁷

Millise loomeprotsessi poole suunavad tehisarud kirjanikku või filmitegijat? Kas robot võib inimese kujunemises etendada sama tähtsat rolli nagu hea lapsepõlvesõber? Kuidas mõjutab tekstirobotite levik keelekasutust? Kas kirjaliku eneseväljenduse tähtsus harituse tunnusena võib sattuda löögi alla? Kuidas motiveerida õpilasi kirjutamist õppima, kui (vähemalt esmapilgul) hea kirjutaja on nupuvajutuse kaugusel? Millised mälupaigad pesitsevad pildimootorite toodangus ning kuhu suunavad need meie visuaalset identiteeti? Kuidas mõjutavad meie ühiskondades levinud tulevikuutoopiad TI arendusprotsessides tehtud valikuid? Need on vaid mõned näited probleemidest ja uurimisküsimustest, mis tekivad tootva tehisintellekti ja ühiskonnaelu kokkupuutekohtades ning mis kuuluvad selgelt humanitaar- ja sotsiaalteaduste valdkonda.

Lisaks TI mõjude uurimisele teaduslike, sealhulgas TI- ja andmepõhiste meetoditega, on humanitaarteadlastel võimalus võtta kandev roll ühiskondliku debati suunamises ja teadmussiirdes. Arutelud tehnoloogia mõjude üle takerduvad alatihti determinismi taha, kus nähakse muutuste allikana tehnoloogiat ennast, mitte selle ja ühiskonna vastastikmõju. Humanitaaridel on võimalus ja kohustus panustada sellesse, et avalik arusaam TI mõjudest oleks mitmekülgne ja informeeritud. Selleks on tarvis nii traditsioonilisi õppetöö ja teaduskommunikatsiooni vahendeid, aga eelkõige enesekindlat veendumust, et tehisintellekt ei ole mitte mingil juhul vaid tehnoloogiavaldkonna pärusmaa.

Masinate kultuur

Humanitaaridel on õigus tehisintellekti teemal kaasa rääkida tänu praeguse nihke fundamentaalsele olemusele. Sügavõppe abil on nimelt tulemuslikult modelleeritud mitu märgisüsteemi, mida inimesed on aegade algusest harjunud vaid enda omaks pidama – ennekõike keel. Tootva TI kaudu on masinad omandanud varasemast võrreldamatult suurema võime osaleda tähendusloomes, mõjutada kultuurilisi edasikandemehhanisme, kujundada eelistusi ja luua uusi kultuurivorme.⁸ Tootvate tehisarude ja inimeste suhtlus sisaldab endas keelekontakti ja nii nagu eri keelte või sotsiolektide kõnelejad võivad suheldes üksteist mõjutada, võivad ChatGPTismid nõrguda inimeste keelde – mis omakorda treeningandmete kaudu jõuavad järgmiste mudelite repertuaari. Masinate loodav ja vahendatav keel ja kultuur põhineb seega küll inimkultuuril, aga võib sellesse tuua ootamatuid mõjusid.⁹

Tehisarud ja nendega liidestatud tehnoloogiad on astunud sammu siiapoole semiosfääri piiri ja seega otsejoones humanitaaride koduväljakule.¹⁰ See tähendab, et masinate kultuuri uurimine ei ole enam vaid nišitegevus, vaid ka klassikalisemad humanitaarteadused peavad selleks meetodeid leidma. Seejuures ei ole takistuseks, et praegused sügavõppealgoritmid on oma olemuselt „mustad kastid“, s.t nende väljundi tekkimise üldine loogika on lihtne, aga konkreetse väljundi seletamine keeruline. Ka inimese aju toimimine on jätkuvalt uurimisobjekt, see aga pole takistanud õpetlastel juba sajandeid edukalt uurida selle „sisendit“ ja „väljundit“. Nagu inimloomingki, on arvuti genereeritud sisu vastastikmõjus oma aja ja teiste tekstidega ning võib kujundada meie arusaama maailmast.

Ka varasemast leidub näiteid humanitaarteaduste areaali laienemisest väljaspoole rangelt inimeste uurimist – nimelt keskkonnahumanitaaria. Võrdlemisi hiljuti tekkinud uurimissuund on nüüdseks juuri ajanud terves humanitaarias ja näiteks ajalookäsitlustes on keskkonnafaktori sisse arvestamine muutunud juba iseenesestmõistetavaks. Ilmselt oleks tehisintellekti uurimisel võimalik keskkonnahumanitaariast nii mõndagi üle võtta, eriti kuna tegu ei ole teineteisest lahus olevate aladega, vaid tehisintellekti areng ja kasutuselevõtt on tihedalt seotud ka keskkonnamõjude ja -tunnetusega.

On tõenäoline, et mõne aasta pärast ei rõhutatagi enam tehisnärvivõrkudel põhinevate tehnoloogiate puhul, et tegu on tehisintellektiga. Tootev TI hakkab lihtsalt arvutimaailmaga vaikimisi ühte kuuluma, nagu on ajapikku juhtunud näiteks kuvari või ülemaailmse veebiga, mis kumbki pole algselt olnud arvutite pärisosa. Tänapäeva laste jaoks on tulevikus iseenesestmõistetav, et nutitelefoni või tolmuimejaga saab vestlust pidada.

Masinate astumine „siiapoole piiri” tähendab tahes-tahtmata inimkonnale sügavat ja arvatavasti püsivat muutust, millega toime tulemisel ja mille suunamisel saab humanitaaria mängida otsustavat rolli.

Ajastul, kus rutiinne analüütika ja infotöötlus on aina lihtsamini automatiseeritav, tõusevad esile just humanitaarsed oskused – allikakriitika, tervikpildi nägemine ja õigete küsimuste esitamine.

1 Video: Tanel Tammeti ettekanne tehisintellektist humanitaarteaduses. – ERR 12. IV 2024.

2 Andres Karjus, Machine-assisted mixed methods: Augmenting humanities and social sciences with artificial intelligence. – arXiv 24. IX 2023.

Fabrizio Gilardi et al., ChatGPT outperforms crowd workers for text-annotation tasks. – Proceedings of the National Academy of Sciences 2023, 120(30).

Caleb Ziems et al., Can large language models transform computational social science? – Computational Linguistics 2024, 50(1).

3 Annaalide koolkonna ühe juhtfiguuri ja XX sajandi ajalooteaduse suurkuju Emmanuel Le Roy Ladurie ennustus, et „homne ajaloolane on kas programmeerija, või pole teda üldse“, pole siiani tõeks saanud. Vt Emmanuel Le Roy Ladurie, La fin des érudits. – Nouvel Observateur 8. V 1968.

4 Marek Strandberg, Ämber. Kuidas tehisaru Isamaale korraliku jõulukäru keeras. – Postimees 24. I 2024.

5 Lingfeng Shen et al., The Language Barrier: Dissecting Safety Challenges of LLMs in Multilingual Contexts. – arXiv 23. I 2024.

Shibani Santurkar et al., Whose Opinions Do Language Models Reflect? – arXiv 30. III 2023.

Esin Durmus et al., Towards Measuring the Representation of Subjective Global Opinions in Language Models. – arXiv 28. VI 2023.

6 Badr AlKhamissi et al., Investigating Cultural Alignment of Large Language Models. – arXiv 20. II 2024.

Reem I. Masoud et al., Cultural Alignment in Large Language Models: An Explanatory Analysis Based on Hofstede’s Cultural Dimensions. – arXiv 25. VIII 2023.

7 Vt ka Google’i teadlaste loodud SKMidega seotud riskide taksonoomia: Laura Weidinger et al., Taxonomy of Risks posed by Language Models. – Proceedings of the 2022 ACM Conference on Fairness, Accountability, and Transparency 20. VI 2022.

8 Alberto Acerbi, Joseph M. Stubbersfield, Large language models show human-like content biases in transmission chain experiments. – Proceedings of the National Academy of Sciences 2023, 120(44).

9 Levin Brinkmann et al., Machine culture. – Nature Human Behaviour 2023, 7(11).

10 Vrd John Hartley, Indrek Ibrus, Maarja Ojamaa, Digitaalsest semiosfäärist. Tallinna Ülikooli Kirjastus 2022, lk 409 jj.

Vaatamisi: 2,399