ABC Slovar osnov “umetne inteligence” ;)

Umetna inteligenca je obsežen in zapleten svet. Znanstveniki, ki delujejo na tem področju, se pri pojasnjevanju svojega dela pogosto zatekajo k strokovnemu žargonu. Zato moramo v naših prispevkih o industriji umetne inteligence pogosto uporabljati te strokovne izraze. Zato smo menili, da bi bilo koristno sestaviti slovar z opredelitvami nekaterih najpomembnejših besed in izrazov, ki jih uporabljamo v naših člankih.

Ta slovar bo redno posodablen , saj raziskovalci nenehno odkrivajo nove metode za premikanje meja umetne inteligence, hkrati pa identificirajo nastajajoča varnostna tveganja.

AGI

Splošna umetna inteligenca ali AGI je nejasen izraz. Vendar pa se na splošno nanaša na umetno inteligenco, ki je pri mnogih, če ne pri večini nalog, sposobnejša od povprečnega človeka. Izvršni direktor OpenAI Sam Altman je nedavno opisal AGI kot »ekvivalent povprečnega človeka, ki bi ga lahko zaposlili kot sodelavca«. Medtem pa statut OpenAI opredeljuje AGI kot »visoko avtonomne sisteme, ki presegajo ljudi pri večini ekonomsko najbolj dragocenih del«. Razumevanje Google DeepMind se nekoliko razlikuje od teh dveh opredelitev; laboratorij AGI obravnava kot »AI, ki je pri večini kognitivnih nalog vsaj tako sposobna kot ljudje«. Zmedeni? Nič ne skrbite – tako so tudi strokovnjaki na čelu raziskav AI.

AI agent

AI agent se nanaša na orodje, ki uporablja tehnologije umetne inteligence za izvajanje vrste nalog v vašem imenu – kar presega zmožnosti bolj osnovnega AI chatbota –, kot so vnašanje stroškov, rezervacija vozovnic ali mize v restavraciji ali celo pisanje in vzdrževanje kode. Vendar, kot smo že pojasnili, je v tem nastajajočem prostoru veliko spremenljivk, zato lahko »AI agent« za različne ljudi pomeni različne stvari. Prav tako se še vedno gradi infrastruktura, da bi se uresničile predvidene zmogljivosti. Vendar pa osnovni koncept predvideva avtonomen sistem, ki lahko črpa iz več sistemov umetne inteligence za izvajanje večstopenjskih nalog.

Veriga misli – Chain of thought

Na preprosto vprašanje lahko človeški možgani odgovorijo, ne da bi sploh preveč razmišljali o tem – na primer: »Katera žival je višja, žirafa ali mačka?« Vendar pa v mnogih primerih pogosto potrebujete papir in svinčnik, da pridete do pravega odgovora, saj obstajajo vmesni koraki. Na primer, če ima kmet piščance in krave, ki imajo skupaj 40 glav in 120 nog, boste morda morali napisati preprosto enačbo, da pridete do odgovora (20 piščancev in 20 krav).
V kontekstu umetne inteligence razmišljanje po verigi misli za velike jezikovne modele pomeni razčlenitev problema na manjše, vmesne korake, da se izboljša kakovost končnega rezultata. Običajno traja dlje, da se dobi odgovor, vendar je verjetnost, da bo odgovor pravilen, večja, zlasti v kontekstu logike ali programiranja. Modeli razmišljanja so razviti iz tradicionalnih velikih jezikovnih modelov in optimizirani za razmišljanje po verigi misli zahvaljujoč učenju s krepitvijo.
(Glej: Veliki jezikovni model)

Računalniška moč

Čeprav je izraz »računalniška moč« nekoliko večpomenski, se na splošno nanaša na ključno računalniško moč, ki omogoča delovanje modelov umetne inteligence. Ta vrsta obdelave poganja industrijo umetne inteligence in ji omogoča usposabljanje ter uvajanje zmogljivih modelov. Izraz je pogosto skrajšana oblika za vrste strojne opreme, ki zagotavlja računalniško moč – na primer grafične procesne enote (GPU), centralne procesne enote (CPU), procesne enote za globoko učenje (TPU) in druge oblike infrastrukture, ki tvorijo temelj sodobne industrije umetne inteligence.

Globoko učenje – Deep learning

Podskupina samoučljivega strojnega učenja, v kateri so algoritmi umetne inteligence zasnovani z večplastno strukturo umetne nevronske mreže (ANN). To jim omogoča ustvarjanje bolj zapletenih korelacij v primerjavi s preprostejšimi sistemi, ki temeljijo na strojnem učenju, kot so linearni modeli ali odločevalna drevesa. Struktura algoritmov globokega učenja črpa navdih iz medsebojno povezanih poti nevronov v človeških možganih.
Modeli umetne inteligence za globoko učenje so sposobni sami prepoznati pomembne značilnosti v podatkih, namesto da bi te značilnosti morali opredeliti človeški inženirji. Struktura podpira tudi algoritme, ki se lahko učijo iz napak in s procesom ponavljanja in prilagajanja izboljšujejo svoje lastne izhodne podatke. Vendar sistemi globokega učenja za dobre rezultate potrebujejo veliko podatkovnih točk (milijone ali več). Njihovo usposabljanje običajno traja dlje v primerjavi z enostavnejšimi algoritmi strojnega učenja – zato so razvojni stroški ponavadi višji.
(Glej: Nevronska mreža)

Difuzija – Diffusion

Difuzija je tehnologija, ki je v središču mnogih modelov umetne inteligence za ustvarjanje umetnosti, glasbe in besedil. Navdihnjeni s fiziko, sistemi difuzije počasi „uničujejo“ strukturo podatkov – na primer fotografij, pesmi in podobno – z dodajanjem šuma, dokler ne ostane nič. V fiziki je difuzija spontana in nepovratna – sladkor, ki se je raztopil v kavi, ni mogoče vrniti v obliko kocke. Vendar pa si sistemi difuzije v umetni inteligenci prizadevajo naučiti se nekakšen proces »obratne difuzije«, da bi obnovili uničene podatke in pridobili sposobnost za obnovo podatkov iz šuma.

Destilacija – Distillation

Destilacija je tehnika, ki se uporablja za pridobivanje znanja iz velikega modela umetne inteligence z modelom »učitelj-učenec«. Razvijalci pošljejo zahteve modelu učitelja in zabeležijo izhodne podatke. Odgovori se včasih primerjajo z naborom podatkov, da se preveri njihova točnost. Ti izhodni podatki se nato uporabijo za usposabljanje modela učenca, ki je usposobljen za približevanje vedenju učitelja.
Destilacijo je mogoče uporabiti za ustvarjanje manjšega, učinkovitejšega modela na podlagi večjega modela z minimalno izgubo pri destilaciji. Verjetno je OpenAI na ta način razvil GPT-4 Turbo, hitrejšo različico GPT-4.
Čeprav vsa podjetja za umetno inteligenco destilacijo uporabljajo interno, so jo nekatera morda uporabila tudi za dohitevanje najnaprednejših modelov. Destilacija iz konkurenta običajno krši pogoje uporabe API-jev za umetno inteligenco in klepetalnih pomočnikov.

Natančno prilagajanje – Fine-tuning

To se nanaša na nadaljnje usposabljanje modela AI za optimizacijo zmogljivosti za bolj specifično nalogo ali področje, kot je bilo prej v središču njegovega usposabljanja — običajno z vnosom novih, specializiranih (tj. nalogam usmerjenih) podatkov.
Mnogi AI-startupi uporabljajo velike jezikovne modele kot izhodišče za razvoj komercialnega izdelka, vendar si prizadevajo povečati uporabnost za ciljni sektor ali nalogo tako, da prejšnje cikle usposabljanja dopolnijo z natančnim prilagajanjem na podlagi lastnega domensko specifičnega znanja in strokovnosti.
(Glej: Veliki jezikovni model [LLM])

GAN

Generative Adversarial Network (GAN), ali Generativno nasprotujoče omrežje, je vrsta okvira za strojno učenje, ki podpira nekatere pomembne razvojne dosežke v generativni umetni inteligenci, ko gre za ustvarjanje realističnih podatkov – vključno z (a ne le) orodji za deepfake. GAN-i vključujejo uporabo para nevronskih omrežij, od katerih eno črpa iz svojih podatkov za usposabljanje, da ustvari izhod, ki se posreduje drugemu modelu za oceno. Ta drugi, diskriminatorni model, tako igra vlogo razvrščevalca izhodnih podatkov generatorja – kar mu omogoča, da se sčasoma izboljša.
Struktura GAN je zasnovana kot tekmovanje (od tu »adversarial«) – pri čemer sta oba modela v bistvu programirana tako, da poskušata drug drugega prekašati: generator poskuša, da bi njegovi izhodni podatki prešli mimo diskriminatorja, medtem ko diskriminator poskuša odkriti umetno ustvarjene podatke. Ta strukturirano tekmovanje lahko optimizira izhodne podatke AI, da so bolj realistični, brez potrebe po dodatnem človeškem posredovanju. Čeprav GAN-i delujejo najbolje za ožje aplikacije (kot je ustvarjanje realističnih fotografij ali videov), namesto za splošno AI.

Halucinacija – Hallucination

Halucinacija je izraz, ki ga industrija AI najraje uporablja za AI-modele, ki si stvari izmišljajo – dobesedno ustvarjajo informacije, ki so napačne. Očitno je to ogromen problem za kakovost AI.
Halucinacije ustvarjajo izhodne podatke GenAI, ki so lahko zavajajoči in lahko celo vodijo do tveganj v resničnem življenju – s potencialno nevarnimi posledicami (pomislite na zdravstveno poizvedbo, ki vrne škodljiv zdravstveni nasvet). Zato večina orodij GenAI v drobnem tisku zdaj opozarja uporabnike, naj preverijo odgovore, ki jih ustvari umetna inteligenca, čeprav so takšna opozorila običajno veliko manj vidna kot informacije, ki jih orodja izdajo s pritiskom na gumb.
Menijo, da problem umetne inteligence, ki si izmišlja informacije, izhaja iz vrzeli v podatkih za usposabljanje. Zlasti za splošno namensko GenAI – včasih znano tudi kot temeljni modeli – se zdi to težko rešiti. Preprosto ni dovolj podatkov, da bi umetno inteligenco usposobili za celovito reševanje vseh vprašanj, ki bi jih lahko zastavili. TL;DR: še nismo izumili Boga.
Halucinacije prispevajo k premiku v smeri vse bolj specializiranih in/ali vertikalnih modelov umetne inteligence – tj. področno specifičnih umetnih inteligenc, ki zahtevajo ožje strokovno znanje – kot način za zmanjšanje verjetnosti vrzeli v znanju in tveganj dezinformacij.

Inference

Inference je proces izvajanja modela umetne inteligence. To pomeni, da se modelu omogoči, da na podlagi prej videnih podatkov napoveduje . Da bo jasno: Inference ni mogoče brez usposabljanja; model mora najprej naučiti vzorce v nizu podatkov, preden lahko učinkovito ekstrapolira iz teh podatkov za usposabljanje.
Inferenco lahko izvaja veliko vrst strojne opreme, od procesorjev pametnih telefonov do zmogljivih grafičnih procesorjev (GPU) in posebej zasnovanih AI pospeševalnikov. Vendar pa vsi ne morejo enako dobro izvajati modelov. Pri zelo velikih modelih bi napovedovanje na primer na prenosnem računalniku trajalo večnost v primerjavi z oblačnim strežnikom z vrhunskimi AI čipi.
[Glej: Usposabljanje]

Velik jezikovni model (LLM) – Large language model

Veliki jezikovni modeli, ali LLM-ji, so modeli umetne inteligence, ki jih uporabljajo priljubljeni AI-pomočniki, kot so ChatGPT, Claude, Googlov Gemini, Meta AI Llama, Microsoft Copilot ali Mistralov Le Chat. Ko klepetate z AI-pomočnikom, komunicirajete z velikim jezikovnim modelom, ki vašo zahtevo obdela neposredno ali s pomočjo različnih razpoložljivih orodij, kot so brskanje po spletu ali tolmači kode.
AI-pomočniki in LLM-ji imajo lahko različna imena. Na primer, GPT je velik jezikovni model OpenAI, ChatGPT pa je AI-pomočnik.
LLM-ji so globoka nevronska omrežja, sestavljena iz milijard številčnih parametrov (ali uteži, glej spodaj), ki se učijo odnosov med besedami in frazami ter ustvarjajo predstavitev jezika, nekakšen večdimenzionalni zemljevid besed.
Ti modeli so ustvarjeni s kodiranjem vzorcev, ki jih najdejo v milijardah knjig, člankov in transkriptov. Ko vnesete ukaz v LLM, model ustvari najverjetnejši vzorec, ki ustreza ukazu. Nato oceni najverjetnejšo naslednjo besedo po zadnji na podlagi tega, kar je bilo rečeno prej. Ponovi, ponovi in ponovi.
(Glej: Nevronska mreža)

Pomnilniški predpomnilnik – Memory cache

Pomnilniški predpomnilnik se nanaša na pomemben proces, ki pospešuje sklepanje (kar je proces, s katerim AI deluje, da ustvari odgovor na uporabnikovo poizvedbo). V bistvu je predpomnjenje optimizacijska tehnika, zasnovana za učinkovitejše sklepanje. AI očitno poganjajo visoko zmogljivi matematični izračuni in vsakič, ko se ti izračuni izvedejo, porabijo več energije. Shranjevanje v predpomnilniku je zasnovano tako, da zmanjša število izračunov, ki jih mora model izvesti, s tem da shrani določene izračune za prihodnja uporabniška vprašanja in operacije. Obstajajo različne vrste shranjevanja v predpomnilniku, čeprav je ena izmed bolj znanih shranjevanje v predpomnilniku KV (ali ključ-vrednost). Shranjevanje v predpomnilniku KV deluje v modelih, ki temeljijo na transformatorjih, in poveča učinkovitost ter omogoča hitrejše rezultate z zmanjšanjem časa (in algoritmičnega dela), potrebnega za ustvarjanje odgovorov na uporabniška vprašanja.
(Glej: Inference)

Nevronska mreža – Neural network

Nevronska mreža se nanaša na večplastno algoritmično strukturo, ki podpira globoko učenje — in, širše gledano, celoten razcvet generativnih orodij umetne inteligence po pojavu velikih jezikovnih modelov.
Čeprav ideja, da bi se pri oblikovanju algoritmov za obdelavo podatkov zgledovali po gosto prepletenih poteh človeških možganov, sega vse do 40. let prejšnjega stoletja, je šele veliko novejši vzpon grafične procesne strojne opreme (GPU) – prek industrije video iger – resnično sprostil moč te teorije. Ti čipi so se izkazali za zelo primerne za usposabljanje algoritmov z veliko več sloji, kot je bilo mogoče v prejšnjih obdobjih – kar omogoča sistemom umetne inteligence, ki temeljijo na nevronskih mrežah, da dosežejo veliko boljšo zmogljivost na številnih področjih, vključno z prepoznavanjem glasu, avtonomno navigacijo in odkrivanjem zdravil.
(Glej: Veliki jezikovni model [LLM])

RAMageddon

RAMageddon je zabaven nov izraz za ne ravno zabaven trend, ki preveva tehnološko industrijo: vse večje pomanjkanje pomnilnika z naključnim dostopom ali čipov RAM, ki poganjajo praktično vse tehnološke izdelke, ki jih uporabljamo v vsakdanjem življenju. S cvetom industrije umetne inteligence največja tehnološka podjetja in laboratoriji za umetno inteligenco – ki se vsi tekmujejo za najmočnejšo in najučinkovitejšo umetno inteligenco – kupujejo toliko RAM-a za napajanje svojih podatkovnih centrov, da za ostale nas ne ostane veliko. In ta ozkogrl v ponudbi pomeni, da tisto, kar ostane, postaja vse dražje.
To vključuje industrije, kot so igralništvo (kjer so velika podjetja morala dvigniti cene konzol, ker je težje najti pomnilniške čipe za njihove naprave), potrošniška elektronika (kjer bi pomanjkanje pomnilnika lahko povzročilo največji padec v prodaji pametnih telefonov v več kot desetletju) in splošno podjetniško računalništvo (ker ta podjetja ne morejo dobiti dovolj RAM-a za svoje podatkovne centre). Pričakuje se, da se bo porast cen ustavil šele po koncu strašnega pomanjkanja, a žal ni prav veliko znakov, da se bo to zgodilo kmalu.

Usposabljanje – Training

Razvoj umetne inteligence za strojno učenje vključuje proces, znan kot usposabljanje. Preprosto povedano, to pomeni vnašanje podatkov, da se model lahko uči iz vzorcev in ustvarja koristne izhodne podatke.
Na tej točki v AI-sklopu lahko postane malo filozofsko – saj je pred usposabljanjem matematična struktura, ki se uporablja kot izhodišče za razvoj učnega sistema, le kup plasti in naključnih številk. Šele z usposabljanjem AI model resnično dobi obliko. V bistvu je to proces, v katerem sistem odgovarja na značilnosti v podatkih, kar mu omogoča, da prilagodi izhodne podatke želenemu cilju – naj gre za prepoznavanje slik mačk ali ustvarjanje haikujev na zahtevo.
Pomembno je opozoriti, da ne vsa umetna inteligenca zahteva usposabljanje. Na pravilih temelječe umetne inteligence, ki so programirane za upoštevanje ročno vnaprej določenih navodil – na primer linearni klepetalni roboti – usposabljanja ne potrebujejo. Vendar so taki sistemi umetne inteligence verjetno bolj omejeni kot (dobro usposobljeni) sistemi za samoučenje.
Kljub temu je usposabljanje lahko drago, saj zahteva veliko vhodnih podatkov – in običajno se količina vhodnih podatkov, potrebnih za takšne modele, povečuje.
Hibridni pristopi se včasih lahko uporabijo za skrajšanje razvoja modela in pomagajo pri upravljanju stroškov. Na primer z natančnim prilagajanjem umetne inteligence, ki temelji na pravilih, na podlagi podatkov – kar pomeni, da razvoj zahteva manj podatkov, računske moči, energije in algoritemske kompleksnosti, kot če bi razvijalec začel graditi od začetka.
[Glej: Inference]

Tokeni – Tokens

Ko gre za komunikacijo med človekom in strojem, obstajajo nekateri očitni izzivi. Ljudje komunicirajo z uporabo človeškega jezika, medtem ko programi umetne inteligence izvajajo naloge in odgovarjajo na poizvedbe prek zapletenih algoritmičnih procesov, ki temeljijo na podatkih. V najpreprostejši definiciji tokeni predstavljajo osnovne gradnike komunikacije med človekom in umetno inteligenco, saj so diskretni segmenti podatkov, ki jih je obdelal ali ustvaril LLM.
Tokeni se ustvarjajo prek procesa, znanega kot »tokenizacija«, ki razčleni surove podatke in jih preoblikuje v ločene enote, ki jih LLM lahko obdela. Podobno kot programski prevajalnik prevaja človeški jezik v binarni kod, ki ga računalnik lahko obdela, tokenizacija razlaga človeški jezik za program AI prek uporabniških poizvedb, da lahko ta pripravi odgovor.
Obstaja več različnih vrst tokenov – vključno z vhodnimi tokeni (vrsta, ki jo je treba ustvariti kot odgovor na poizvedbo človeškega uporabnika), izhodnimi tokeni (vrsta, ki se ustvari, ko LLM odgovori na človeško zahtevo) in tokeni za sklepanje, ki vključujejo daljše, intenzivnejše naloge in procese, ki potekajo kot del uporabniške zahteve.
Pri AI za podjetja uporaba tokenov določa tudi stroške. Ker so tokeni enakovredni količini podatkov, ki jih model obdeluje, so postali tudi sredstvo, s katerim industrija umetne inteligence monetizira svoje storitve. Večina podjetij za umetno inteligenco zaračunava uporabo LLM na podlagi števila tokenov. Torej, več tokenov podjetje porabi pri uporabi programa umetne inteligence (na primer ChatGPT), več denarja bo moralo plačati svojemu ponudniku storitev umetne inteligence (OpenAI).

Prenosno učenje – Transfer learning

Tehnika, pri kateri se predhodno usposobljen model umetne inteligence uporabi kot izhodišče za razvoj novega modela za drugačno, a običajno sorodno nalogo – kar omogoča ponovno uporabo znanja, pridobljenega v prejšnjih ciklih usposabljanja.
Prenosno učenje lahko poveča učinkovitost z okrajšanjem razvoja modela. Lahko je koristno tudi, kadar so podatki za nalogo, za katero se model razvija, nekoliko omejeni. Vendar je pomembno opozoriti, da ima ta pristop omejitve. Modeli, ki se zanašajo na prenos znanja za pridobitev splošnih zmogljivosti, bodo verjetno potrebovali usposabljanje na dodatnih podatkih, da bodo dobro delovali na svojem področju
(Glej: Fine tuning)

Teže – Weights

Teže so bistvene za usposabljanje umetne inteligence, saj določajo, koliko pomembnosti (ali teže) se pripisuje različnim značilnostim (ali vhodnim spremenljivkam) v podatkih, uporabljenih za usposabljanje sistema – s čimer oblikujejo izhod umetnega inteligenčnega modela.
Drugače povedano, uteži so numerični parametri, ki opredeljujejo, kaj je v nizu podatkov najbolj pomembno za dano nalogo usposabljanja. Svojo funkcijo izpolnjujejo z množenjem vhodnih vrednosti. Usposabljanje modela se običajno začne z naključno dodeljenimi utežmi, vendar se te med potekom procesa prilagajajo, saj model poskuša doseči izhod, ki je čim bolj skladen s ciljem.
Na primer, model umetne inteligence za napovedovanje cen nepremičnin, ki je usposobljen na podlagi zgodovinskih podatkov o nepremičninah za ciljno lokacijo, bi lahko vključeval uteži za značilnosti, kot so število spalnic in kopalnic, ali je nepremičnina samostojna ali dvojna, ali ima parkirišče, garažo in tako naprej.
Končno uteži, ki jih model pripiše vsaki od teh vhodnih vrednosti, odražajo, koliko vplivajo na vrednost nepremičnine, glede na dani nabor podatkov.

Ta članek se redno posodablja z novimi informacijami.