Druga in zadnja kolumna o ChatGPT-ju

kolumna

Martin Justin

Nisem nameraval napisati še ene kolumne o ChatGPT-ju. Z urejanjem podatkov, o čemer sem pisal v prejšnji kolumni, imam nekaj osebnih izkušenj, zato se mi je zdelo, da o tem lahko pišem. A v resnici nimam nobenega posebnega tehničnega znanja o teh tehnologijah, ki bi mi omogočalo, da o njih povem kaj novega ali zanimivega. Potem pa sem pred kakšnimi tremi tedni na zadnji strani Sobotne priloge prebral tekst, pri katerem je bilo očitno, da ga je napisal nekdo, ki nima o umetni inteligenci absolutno nobenega znanja in ki niti na najbolj abstraktni ravni ne razume, kako delujejo ChatGPT in podobni modeli. To me je na koncu prepričalo, da se teme vseeno lotim še enkrat. Pa ne iz ciničnega »če lahko oni, bom pa tudi jaz!«, ampak ker sem ugotovil, da mi verjetno ni treba povedati nič revolucionarnega. Zanimivo, morda pa celo koristno, bi bilo že, če bi se posvetil nekaterim osnovnim terminološkim in konceptualnim opredelitvam. Prepričan sem namreč, da imamo humanisti_ke, družboslovci_ke in umetniki_ce pomembno vlogo pri premišljevanju novih tehnologij in njihovih družbenih učinkov, a moramo najprej vsaj približno vedeti, o čem govorimo. 

Prejšnji mesec sem za ChatGPT in podobne tehnologije uporabljal izraz »model strojnega učenja«. Bolj samoumevna, zagotovo pa slogovno bolj primerna izbira bi bila verjetno »umetna inteligenca«. To tudi ne bi bilo narobe. Prav tako bi lahko ChatGPT opisal kot »nevronsko mrežo« ali pa »globoko nevronsko mrežo«, zagotovo pa lahko kje preberete tudi, da gre za »algoritem«. Ampak kaj ti skrivnostni, zlovešče zveneči izrazi sploh pomenijo?

Najprej je treba vedeti, da lahko z umetno inteligenco mislimo dvoje. Z izrazom lahko merimo na raziskovalno področje, katerega začetki segajo nazaj vse do Aristotelove logike ali pa še dlje, svoje institucionalno mesto v okviru računalništva pa je dobilo v petdesetih letih prejšnjega stoletja. Lahko pa umetno inteligenco razumemo kot stvar – kot entiteto, ki ni »naravna«, recimo računalniški program, in izkazuje inteligentno delovanje. Zdi se mi, da veliko nesporazumov izhaja ravno iz zamenjevanja teh dveh pomenov: strokovnjaki_nje z umetno inteligenco običajno mislijo na specifično metodo ali pristop k problemu, javnost pa sliši, da napovedujejo prihod inteligentnih strojev. 

Izraza seveda nista povsem nepovezana. Raziskovalni program umetne inteligence se v splošnem ukvarja z razvojem modelov računanja, ki so zmožni opravljati naloge, ki, če jih opravljajo ljudje, zahtevajo uporabo inteligence. Ne obstaja opredelitev inteligence, s katero bi se strinjali vsi ali pa vsaj večina raziskovalcev_k s področja, so pa tradicionalni cilji umetne inteligence na primer poustvariti zmožnosti logičnega sklepanja, uporabe jezika, tvorjenja konceptov, učenja, igranja iger in podobno. Pri čemer je treba biti pozoren še na eno razlikovanje. Umetna inteligenca se ukvarja z razvojem strojev, ki poustvarjajo posamezne vidike inteligence. Od tega je treba razločiti pojem splošne umetne inteligence, torej entitete, ki bi bila inteligentna v širšem smislu samozavedanja in zmožnosti reševanja različnih tipov problemov. Taka tehnologija, znana iz popularne kulture, recimo filma Her (2013), je dejansko nedoločljivo daleč v prihodnosti in načeloma ni v ospredju zanimanja stroke. Vse, kar trenutno zares imamo, so tehnologije, ki znajo precej dobro opravljati neko nalogo. Dobra orodja torej. ChatGPT je odličen primer: vse, kar ChatGPT »zna«, je natančno predvideti, katera beseda bi mogla slediti prejšnji, tako da bo neki sestavek čim bolj podoben tekstom, ki že obstajajo. ChatGPT je tako umetna inteligenca samo v smislu, da zna reproducirati en vidik jezikovne zmožnosti, ki jo pri ljudeh razumemo kot znak inteligence.

Raziskovalno področje umetne inteligence je imelo od svojega institucionalnega začetka sredi petdesetih let slabša in boljša obdobja, večinoma povezana z zmožnostmi takrat obstoječe tehnologije. Trenutno zagotovo živimo v novi »zlati dobi« umetne inteligence. To v veliki meri poganja napredek nevronskih mrež, specifično globokih nevronskih mrež, ki so se izkazale za zelo učinkovite pri reševanju določenih problemov. Kaj so torej nevronske mreže? Najbolj v splošnem gre za poseben pristop k reševanju računskih problemov, ki se idejno zgleduje po delovanju možganov. Nevronska mreža je tako sestavljena iz množice enot, »nevronov«, ki so med seboj povezane in razporejene v nivoje. Vsaka enota lahko sprejme neko vhodno vrednost, na njej opravi neko matematično operacijo in jo posreduje enotam v naslednjem nivoju, pri čemer imajo različne povezave med enotami različne uteži oziroma so bolj ali manj aktivne. Nevronska mreža se lahko »uči«, tako da med delovanjem po nekem pravilu spreminja uteži povezav med enotami. Njeno delovanje si je morda laže predstavljati na primeru. Recimo, da imamo nevronsko mrežo, naučeno za prepoznavanje sadja na slikah. Mreža kot vhodni podatek sprejme neko fotografijo, ki jo preoblikuje v ustrezno številčno vrednost. Nato poteče računanje, rezultat katerega je izhodni podatek, torej druga številčno vrednost, ki ima za nas pomen ustrezne klasifikacije. Globoke nevronske mreže pa so zgolj nevronske mreže z več nivoji enot, ki lahko zato opravljajo kompleksnejše naloge. 

Zgoraj sem nekajkrat omenil, da se nevronske mreže »učijo«. To pomeni samo, da s časom na subtilne načine spreminjajo svoje delovanje in se s tem izboljšujejo pri neki nalogi. Jih pa zato obravnavamo tudi kot tehnologijo strojnega učenja. To predstavlja ločen raziskovalni program, ki se v splošnem ukvarja z vprašanjem, kako izdelati stroje, ki se sami izboljšujejo pri opravljanju neke naloge, se na neki način učijo iz podatkov. Nevronske mreže niso edina metoda strojnega učenja, prav tako ni nujno, da se nevronske mreže »učijo«. So pa trenutno globoke nevronske mreže zagotovo ena najbolj uspešnih tehnologij, ki jih lahko uporabljamo za pridobivanje znanja iz podatkov. 

Tako, zdaj bi morali malo natančneje razumeti, kaj je ChatGPT. Najbolj konkretno je ChatGPT »velik jezikovni model«, to pa je zgolj globoka nevronska mreža, naučena na jezikovnih podatkih. Je model umetne inteligence, a to ne pomeni, da je v kakršnemkoli ogrožajočem smislu inteligenten. Je tudi model strojnega učenja, a je tudi to učenje razumljeno na precej specifičen način, kot vedno bolj uspešno reševanje neke naloge. To, da vemo, kaj te besede pomenijo, se mi ne zdi pomembno kar tako. Pomembno se mi zdi predvsem zato, ker lahko šele na podlagi tega znanja razmišljamo o družbenih, psiholoških, znanstvenih in drugih posledicah tehnologij, kot je ChatGPT. Brez njega bomo samo še naprej pisali članke, ki so bliže znanstveni fantastiki.

 

***

Nekaj zanimivih prispevkov o umetni inteligenci v slovenskih medijih:

  • Sašo Dolenc, »Kako deluje ChatGPT« (Kvarkadabra)
  • Špela Vintar, »Z nevronščino v prihodnost« (Alternator)
  • Simon Mezgec, »Kako sodobne naprave samodejno prepoznajo hrano s fotografij?« (Alternator)
  • Matjaž Ličer, Lojze Žust, Matej Kristan, »Prepletanje umetne inteligence in fizike pri napovedovanju obalnih poplav« (Alternator)
  • Dunja Mladenić: Glavni problem pri umetni inteligenci so nerealistična pričakovanja (Podobe znanja, Radio Ars)
  • Janez Demšar, Blaž Zupan: Program Orange, orodje za demokratizacijo umetne inteligence (Podobe znanja, Radio Ars)

 

 

Objavo je omogočila Javna agencija za knjigo RS

 

JAK RS

 

O avtorju. Martin Justin (1998) je magistrski študent filozofije. Kot literarni in filmski kritik ter esejist sodeluje z več spletnimi portali in revijami, predvsem Airbeletrino, Ludliteraturo in Literaturo. Seznam njegovih objav lahko najdete na https://martin-justin.github.io/.

Avtorjevi novejši prispevki
Bodi udeležen. Sodeluj. Prijavi se na novice.
Pogovor o tekstu

Pripiši svoje mnenje

Sorodni prispevki
  • V & O ali 無

    Veronika Dintinjana

    To je namreč ključna funkcija umetniškega dela: ne to, da nosi “glavno sporočilo”, temveč da pripravi oz. je pot, po kateri lahko bralec in bralka dostopata do določene človeške izkušnje. In če govorimo o poeziji, je ta izkušnja kodirana z besedami, z mrežo njihovih pomenov, barvo, in predvsem z ritmom besed.

  • Povezovanje

    Uroš Zupan

    Včasih sem se lahko delil na dvoje. En del sebe sem v plen prepustil svetu, ki me je obkrožal in ogrožal. Z drugim sabo pa sem zbežal, vstopil v hipnagoško stanje in se povezal, našel miren kraj, kjer sem si lahko oddahnil in s polnimi dlanmi zajel nekaj tiste neprekinjene svetlobe, ki sem jo vedno znova povezoval z istim krajem in z nekim zdaj še davnim obdobjem v svojem življenju. Z drugim sabo.

  • Ada Škerl: v iskanju »koščka raja na zemlji«

    Eva Ule

    In koliko časa bomo še potrebovali, da spoznamo, da nas včasih lahko najbolj poveže prav intimna, čuteča poezija, ki deluje onkraj ideološko-političnih mehanizmov in se dotika čistega bistva človeškega? In koliko časa bodo pesnice slovenske literarne preteklosti še iskale »svoj košček raja«?

Izdelava: Pika vejica