Glenn Gabe analizira primer spletišča NationalToday.com, ki je po Googlovem ročnem ukrepu v velikem obsegu izgubilo vidnost tako v Googlu kot v ChatGPT-u.

Članek opozarja na sistemsko tveganje: agresivno in nepremišljeno skaliranje z AI-vsebino za SEO ne prinaša le Google kazni (v tem primeru ročne, sicer pa v obliki padca v serp-u – praviloma kmalu po začetnem vrhu), temveč se posledice kaskadno razširijo na vse AI iskalne platforme, ki temeljijo na Googlovem indeksu. Primer NationalToday.com je jasen dokaz, da »Mt. AI« strategije delujejo le začasno, nato pa se sesuljejo na vseh frontah hkrati.


BISTVO

  • Spletišče NationalToday.com je v direktoriju /us/ objavilo več kot 850.000 100% AI-generiranih lokalnih novic, ki so se uvrščale v Google Top Stories, News in Discover

  • Google je po razkritju portala Futurism izdal ročni ukrep za »scaled content abuse« in celoten direktorij odstranil iz indeksa

  • Odstranitev iz Googlovega indeksa je neposredno povzročila izpad v AI Overviews, AI Mode in posledično v ChatGPT citatih

  • ChatGPT pri iskanju z utemeljitvijo na spletu delno uporablja Googlov indeks, zato spletišče, ki je odstranjeno iz Googla, izgubi tudi večino CitGPT citatov

  • Izjema so redki primeri, kjer ChatGPT za utemeljitev uporablja Bing ali drug vir in citati ostanejo

DEJSTVA

  • 850.000+ URL-jev v /us/ direktoriju — vse 100% AI-generirane vsebine

  • Vidnost spletišča se je po ročnem ukrepu takoj strmoglavila — tipičen vzorec, ki ga Gabe imenuje »Mt. AI«

  • Preverjanje je potekalo na več ChatGPT računih (plačljivi in brezplačni) prek orodja Brand Radar (Ahrefs)

  • Večina citatov za /us/ direktorij je izginila; le redki so ostali (verjetno prek Bing indeksa)

  • Ukrep je prizadel izključno /us/ direktorij — preostala vsebina NationalToday.com v Googlu in ChatGPT-u ostaja nedotaknjena

CITATI

  • “A recent manual action provides a great view of how scaling via AI-generated content can yield a huge drop in Google’s 10-blue links, AI Overviews, and AI Mode.”

  • “When ChatGPT searches the web to ground answers, it can leverage Google’s index (which has been documented many times).”

  • “If you receive a manual action from Google… then you will drop in AIOs, AI Mode, and then downstream in AI search (which includes ChatGPT).”

  • “Do not implement risky and spammy tactics just to rank in AI search.”

  • “It works until it doesn’t. It’s just another example of ‘Mt. AI’. Beware.”

2026-04-21

Dune

Tipkovnica za Mac, ki se prilagaja kontekstu in v realnem času spreminja vaše bližnjice

Claude Desktop Buddy

Spremenite Clauda v fizičnega sodelavca tako, da ga povežete s strojno opremo, ki se odziva, signalizira in usklajuje z vašo umetno inteligenco.

The New Waydev

Preverite, ali se vaša koda, napisana z umetno inteligenco, dejansko izvede

Pegasus 1.5 od TwelveLabs

Pretvori dolge videoposnetke v podatke z možnostjo iskanja in časovnimi oznakami, tako da lahko pregledujete posnetke, kot da gre za preglednico.

Granter

Agent, ki poišče, napiše in upravlja s sredstvi za subvencije

StackAdapt tržijo oglaševanje znotraj ChatGPT prek omejenega pilotnega programa v partnerstvu z OpenAI

Članek razkriva, kako StackAdapt aktivno gradi mostove med trenutnim oglaševanjem in generativnimi AI platformami. Oglaševanje znotraj ChatGPT ni zgolj kontekstualno – temveč je usmerjeno glede na relevantnost poziva, kar pomeni, da se oglasi prikazujejo na podlagi tega, kaj uporabnik išče ali sprašuje v realnem času. To predstavlja novo paradigmo v digitalnem oglaševanju, kjer se premika od ključnih besed (SEO/SEM) k nameri izraženi v naravnem jeziku. Minimalna poraba $50.000 nakazuje, da je pilot za zdaj namenjen večjim oglaševalskim proračunom, ne malim podjetjem.

VIR: https://www.adweek.com/media/exclusive-leaked-deck-reveals-stackadapts-playbook-for-chatgpt-ads/

BISTVO

  • StackAdapt, neodvisna platforma na strani povpraševanja (DSP), tiho pristopa oglaševalcem z možnostjo testiranja oglasov znotraj ChatGPT

  • Program je zasnovan kot zgodnji dostop do novega »odkritvenega sloja« (discovery layer), ki cilja uporabnike med fazo raziskovanja in primerjave izdelkov

  • Pitch deck z naslovom “OpenAI x StackAdapt Limited Pilot Program” je bil dne 27. marca poslan izbranim kupcem in ga je pregledal Adweek

  • CPM (cena na tisoč prikazov) se giblje med $15 in $60, pri čemer StackAdapt ponuja znižane platformske in upravljavske provizije

  • Vstop v pilotni program zahteva minimalno porabo $50.000, kar program umešča med premium ekskluzivne ponudbe

DEJSTVA

  • CPM razpon: $15–$60 glede na relevantnost poziva (prompta)

  • Minimalna poraba: $50.000 za vstop v pilotni program

  • Datum pošiljanja decka: 27. marec 2025 (izbranim kupcem)

  • Avtor članka: Trishla Ostwal, poročevalka Adweeka za AI in tehnologijo

  • Platforma: ChatGPT je opredeljen kot »ena od najhitreje rastočih potrošniških platform na svetu«

CITATI

  • “StackAdapt has partnered with OpenAI to enable advertising within ChatGPT, one of the fastest growing consumer platforms in the world.” — iz pitch decka

  • Opis umestitve: zajemanje uporabnikov »in the middle of researching and comparing products on ChatGPT«

  • Program je opredeljen kot »early-stage test inside a still-developing ad system«

  • Pozicioniranje: StackAdapt program opisuje kot dostop do novega »discovery layer«

  • Adweek ekskluzivno poroča: deck je bil »shared with select buyers on March 27 and reviewed by ADWEEK«

Kvantni računalniki ne ogrožajo 128-bitnih simetričnih ključev

Splošno prepričanje, da moramo simetrične ključe podvojiti (npr. preiti z AES-128 na AES-256) zaradi kvantne grožnje, ni tehnično utemeljeno. Prava nujnost post-kvantnega prehoda zadeva izključno asimetrično kriptografijo (RSA, ECDH, digitalni podpisi), ki je ranljiva na Shorjev algoritem. Vsa prizadevanja naj se osredotočijo tja, medtem ko simetrični podsistemi ostanejo nespremenjeni.

VIR: https://words.filippo.io/128-bits/

BISTVO

  • AES-128, SHA-256 in drugi simetrični algoritmi so varni pred kvantnimi računalniki in ne zahtevajo sprememb v okviru post-kvantnega prehoda

  • Groverjev algoritem sicer teoretično ponuja kvadratno pohitritev za iskanje ključev, a ga je nemogoče učinkovito paralelizirati, kar izničuje praktično prednost

  • Za napad na AES-128 z Groverjevim algoritmom bi potrebovali 140 bilijonov kvantnih vezij s 724 logičnimi kubiti, ki bi delovali vzporedno 10 let

  • Napad z Groverjevim algoritmom na AES-128 je 2⁷⁸˙⁵-krat dražji kot napad z Shorjevim algoritmom na 256-bitne eliptične krivulje

  • Nepotrebno podvajanje dolžin ključev odvrača sredstva od dejansko nujnih post-kvantnih posodobitev asimetričnih algoritmov (RSA, ECDH, ECDSA)

DEJSTVA

  • Groverjev algoritem zahteva zaporedno (serializirano) izvajanje — paralelizacija napada razredči kvadratno pohitritev in poveča skupni strošek

  • Optimizirano kvantno vezje za AES-128 (Liao in Luo, 2025) ima globino 2³² T-vrat in širino 724 logičnih kubitov

  • NIST je AES-128 opredelil kot referenčni algoritem za Kategorijo 1 post-kvantne varnosti — to je uradno merilo za vse PQC primitive

  • NIST IR 8547 prepoveduje vse kvantno ranljive algoritme od leta 2035, a eksplicitno dovoljuje vse velikosti AES ključev

  • BSI (Nemška zvezna agencija za informacijsko varnost) prav tako priporoča AES-128, AES-192 in AES-256 za nove kriptografske sisteme

CITATI

  • “AES-128 is safe against quantum computers. SHA-256 is safe against quantum computers. No symmetric key sizes have to change as part of the post-quantum transition.” — Filippo Valsorda

  • “It is quite likely that Grover’s algorithm will provide little or no advantage in attacking AES, and AES 128 will remain secure for decades to come.” — NIST FAQ

  • “Breaking AES-128 with Grover is 430,000,000,000,000,000,000,000 times more expensive than breaking 256-bit elliptic curves with Shor’s.” — Filippo Valsorda

  • “Conflating necessary and unnecessary changes will cause needless churn and take resources away from the urgent updates.” — Filippo Valsorda

  • “A surface-code based Grover search on AES-128 will never succeed.” — Samuel Jaques, Univerza Waterloo (2024)


ABC Slovar osnov “umetne inteligence” ;)

Umetna inteligenca je obsežen in zapleten svet. Znanstveniki, ki delujejo na tem področju, se pri pojasnjevanju svojega dela pogosto zatekajo k strokovnemu žargonu. Zato moramo v naših prispevkih o industriji umetne inteligence pogosto uporabljati te strokovne izraze. Zato smo menili, da bi bilo koristno sestaviti slovar z opredelitvami nekaterih najpomembnejših besed in izrazov, ki jih uporabljamo v naših člankih.

Ta slovar bo redno posodablen , saj raziskovalci nenehno odkrivajo nove metode za premikanje meja umetne inteligence, hkrati pa identificirajo nastajajoča varnostna tveganja.

AGI

Splošna umetna inteligenca ali AGI je nejasen izraz. Vendar pa se na splošno nanaša na umetno inteligenco, ki je pri mnogih, če ne pri večini nalog, sposobnejša od povprečnega človeka. Izvršni direktor OpenAI Sam Altman je nedavno opisal AGI kot »ekvivalent povprečnega človeka, ki bi ga lahko zaposlili kot sodelavca«. Medtem pa statut OpenAI opredeljuje AGI kot »visoko avtonomne sisteme, ki presegajo ljudi pri večini ekonomsko najbolj dragocenih del«. Razumevanje Google DeepMind se nekoliko razlikuje od teh dveh opredelitev; laboratorij AGI obravnava kot »AI, ki je pri večini kognitivnih nalog vsaj tako sposobna kot ljudje«. Zmedeni? Nič ne skrbite – tako so tudi strokovnjaki na čelu raziskav AI.

AI agent

AI agent se nanaša na orodje, ki uporablja tehnologije umetne inteligence za izvajanje vrste nalog v vašem imenu – kar presega zmožnosti bolj osnovnega AI chatbota –, kot so vnašanje stroškov, rezervacija vozovnic ali mize v restavraciji ali celo pisanje in vzdrževanje kode. Vendar, kot smo že pojasnili, je v tem nastajajočem prostoru veliko spremenljivk, zato lahko »AI agent« za različne ljudi pomeni različne stvari. Prav tako se še vedno gradi infrastruktura, da bi se uresničile predvidene zmogljivosti. Vendar pa osnovni koncept predvideva avtonomen sistem, ki lahko črpa iz več sistemov umetne inteligence za izvajanje večstopenjskih nalog.

Veriga misli – Chain of thought

Na preprosto vprašanje lahko človeški možgani odgovorijo, ne da bi sploh preveč razmišljali o tem – na primer: »Katera žival je višja, žirafa ali mačka?« Vendar pa v mnogih primerih pogosto potrebujete papir in svinčnik, da pridete do pravega odgovora, saj obstajajo vmesni koraki. Na primer, če ima kmet piščance in krave, ki imajo skupaj 40 glav in 120 nog, boste morda morali napisati preprosto enačbo, da pridete do odgovora (20 piščancev in 20 krav).
V kontekstu umetne inteligence razmišljanje po verigi misli za velike jezikovne modele pomeni razčlenitev problema na manjše, vmesne korake, da se izboljša kakovost končnega rezultata. Običajno traja dlje, da se dobi odgovor, vendar je verjetnost, da bo odgovor pravilen, večja, zlasti v kontekstu logike ali programiranja. Modeli razmišljanja so razviti iz tradicionalnih velikih jezikovnih modelov in optimizirani za razmišljanje po verigi misli zahvaljujoč učenju s krepitvijo.
(Glej: Veliki jezikovni model)

Računalniška moč

Čeprav je izraz »računalniška moč« nekoliko večpomenski, se na splošno nanaša na ključno računalniško moč, ki omogoča delovanje modelov umetne inteligence. Ta vrsta obdelave poganja industrijo umetne inteligence in ji omogoča usposabljanje ter uvajanje zmogljivih modelov. Izraz je pogosto skrajšana oblika za vrste strojne opreme, ki zagotavlja računalniško moč – na primer grafične procesne enote (GPU), centralne procesne enote (CPU), procesne enote za globoko učenje (TPU) in druge oblike infrastrukture, ki tvorijo temelj sodobne industrije umetne inteligence.

Globoko učenje – Deep learning

Podskupina samoučljivega strojnega učenja, v kateri so algoritmi umetne inteligence zasnovani z večplastno strukturo umetne nevronske mreže (ANN). To jim omogoča ustvarjanje bolj zapletenih korelacij v primerjavi s preprostejšimi sistemi, ki temeljijo na strojnem učenju, kot so linearni modeli ali odločevalna drevesa. Struktura algoritmov globokega učenja črpa navdih iz medsebojno povezanih poti nevronov v človeških možganih.
Modeli umetne inteligence za globoko učenje so sposobni sami prepoznati pomembne značilnosti v podatkih, namesto da bi te značilnosti morali opredeliti človeški inženirji. Struktura podpira tudi algoritme, ki se lahko učijo iz napak in s procesom ponavljanja in prilagajanja izboljšujejo svoje lastne izhodne podatke. Vendar sistemi globokega učenja za dobre rezultate potrebujejo veliko podatkovnih točk (milijone ali več). Njihovo usposabljanje običajno traja dlje v primerjavi z enostavnejšimi algoritmi strojnega učenja – zato so razvojni stroški ponavadi višji.
(Glej: Nevronska mreža)

Difuzija – Diffusion

Difuzija je tehnologija, ki je v središču mnogih modelov umetne inteligence za ustvarjanje umetnosti, glasbe in besedil. Navdihnjeni s fiziko, sistemi difuzije počasi „uničujejo“ strukturo podatkov – na primer fotografij, pesmi in podobno – z dodajanjem šuma, dokler ne ostane nič. V fiziki je difuzija spontana in nepovratna – sladkor, ki se je raztopil v kavi, ni mogoče vrniti v obliko kocke. Vendar pa si sistemi difuzije v umetni inteligenci prizadevajo naučiti se nekakšen proces »obratne difuzije«, da bi obnovili uničene podatke in pridobili sposobnost za obnovo podatkov iz šuma.

Destilacija – Distillation

Destilacija je tehnika, ki se uporablja za pridobivanje znanja iz velikega modela umetne inteligence z modelom »učitelj-učenec«. Razvijalci pošljejo zahteve modelu učitelja in zabeležijo izhodne podatke. Odgovori se včasih primerjajo z naborom podatkov, da se preveri njihova točnost. Ti izhodni podatki se nato uporabijo za usposabljanje modela učenca, ki je usposobljen za približevanje vedenju učitelja.
Destilacijo je mogoče uporabiti za ustvarjanje manjšega, učinkovitejšega modela na podlagi večjega modela z minimalno izgubo pri destilaciji. Verjetno je OpenAI na ta način razvil GPT-4 Turbo, hitrejšo različico GPT-4.
Čeprav vsa podjetja za umetno inteligenco destilacijo uporabljajo interno, so jo nekatera morda uporabila tudi za dohitevanje najnaprednejših modelov. Destilacija iz konkurenta običajno krši pogoje uporabe API-jev za umetno inteligenco in klepetalnih pomočnikov.

Natančno prilagajanje – Fine-tuning

To se nanaša na nadaljnje usposabljanje modela AI za optimizacijo zmogljivosti za bolj specifično nalogo ali področje, kot je bilo prej v središču njegovega usposabljanja — običajno z vnosom novih, specializiranih (tj. nalogam usmerjenih) podatkov.
Mnogi AI-startupi uporabljajo velike jezikovne modele kot izhodišče za razvoj komercialnega izdelka, vendar si prizadevajo povečati uporabnost za ciljni sektor ali nalogo tako, da prejšnje cikle usposabljanja dopolnijo z natančnim prilagajanjem na podlagi lastnega domensko specifičnega znanja in strokovnosti.
(Glej: Veliki jezikovni model [LLM])

GAN

Generative Adversarial Network (GAN), ali Generativno nasprotujoče omrežje, je vrsta okvira za strojno učenje, ki podpira nekatere pomembne razvojne dosežke v generativni umetni inteligenci, ko gre za ustvarjanje realističnih podatkov – vključno z (a ne le) orodji za deepfake. GAN-i vključujejo uporabo para nevronskih omrežij, od katerih eno črpa iz svojih podatkov za usposabljanje, da ustvari izhod, ki se posreduje drugemu modelu za oceno. Ta drugi, diskriminatorni model, tako igra vlogo razvrščevalca izhodnih podatkov generatorja – kar mu omogoča, da se sčasoma izboljša.
Struktura GAN je zasnovana kot tekmovanje (od tu »adversarial«) – pri čemer sta oba modela v bistvu programirana tako, da poskušata drug drugega prekašati: generator poskuša, da bi njegovi izhodni podatki prešli mimo diskriminatorja, medtem ko diskriminator poskuša odkriti umetno ustvarjene podatke. Ta strukturirano tekmovanje lahko optimizira izhodne podatke AI, da so bolj realistični, brez potrebe po dodatnem človeškem posredovanju. Čeprav GAN-i delujejo najbolje za ožje aplikacije (kot je ustvarjanje realističnih fotografij ali videov), namesto za splošno AI.

Halucinacija – Hallucination

Halucinacija je izraz, ki ga industrija AI najraje uporablja za AI-modele, ki si stvari izmišljajo – dobesedno ustvarjajo informacije, ki so napačne. Očitno je to ogromen problem za kakovost AI.
Halucinacije ustvarjajo izhodne podatke GenAI, ki so lahko zavajajoči in lahko celo vodijo do tveganj v resničnem življenju – s potencialno nevarnimi posledicami (pomislite na zdravstveno poizvedbo, ki vrne škodljiv zdravstveni nasvet). Zato večina orodij GenAI v drobnem tisku zdaj opozarja uporabnike, naj preverijo odgovore, ki jih ustvari umetna inteligenca, čeprav so takšna opozorila običajno veliko manj vidna kot informacije, ki jih orodja izdajo s pritiskom na gumb.
Menijo, da problem umetne inteligence, ki si izmišlja informacije, izhaja iz vrzeli v podatkih za usposabljanje. Zlasti za splošno namensko GenAI – včasih znano tudi kot temeljni modeli – se zdi to težko rešiti. Preprosto ni dovolj podatkov, da bi umetno inteligenco usposobili za celovito reševanje vseh vprašanj, ki bi jih lahko zastavili. TL;DR: še nismo izumili Boga.
Halucinacije prispevajo k premiku v smeri vse bolj specializiranih in/ali vertikalnih modelov umetne inteligence – tj. področno specifičnih umetnih inteligenc, ki zahtevajo ožje strokovno znanje – kot način za zmanjšanje verjetnosti vrzeli v znanju in tveganj dezinformacij.

Inference

Inference je proces izvajanja modela umetne inteligence. To pomeni, da se modelu omogoči, da na podlagi prej videnih podatkov napoveduje . Da bo jasno: Inference ni mogoče brez usposabljanja; model mora najprej naučiti vzorce v nizu podatkov, preden lahko učinkovito ekstrapolira iz teh podatkov za usposabljanje.
Inferenco lahko izvaja veliko vrst strojne opreme, od procesorjev pametnih telefonov do zmogljivih grafičnih procesorjev (GPU) in posebej zasnovanih AI pospeševalnikov. Vendar pa vsi ne morejo enako dobro izvajati modelov. Pri zelo velikih modelih bi napovedovanje na primer na prenosnem računalniku trajalo večnost v primerjavi z oblačnim strežnikom z vrhunskimi AI čipi.
[Glej: Usposabljanje]

Velik jezikovni model (LLM) – Large language model

Veliki jezikovni modeli, ali LLM-ji, so modeli umetne inteligence, ki jih uporabljajo priljubljeni AI-pomočniki, kot so ChatGPT, Claude, Googlov Gemini, Meta AI Llama, Microsoft Copilot ali Mistralov Le Chat. Ko klepetate z AI-pomočnikom, komunicirajete z velikim jezikovnim modelom, ki vašo zahtevo obdela neposredno ali s pomočjo različnih razpoložljivih orodij, kot so brskanje po spletu ali tolmači kode.
AI-pomočniki in LLM-ji imajo lahko različna imena. Na primer, GPT je velik jezikovni model OpenAI, ChatGPT pa je AI-pomočnik.
LLM-ji so globoka nevronska omrežja, sestavljena iz milijard številčnih parametrov (ali uteži, glej spodaj), ki se učijo odnosov med besedami in frazami ter ustvarjajo predstavitev jezika, nekakšen večdimenzionalni zemljevid besed.
Ti modeli so ustvarjeni s kodiranjem vzorcev, ki jih najdejo v milijardah knjig, člankov in transkriptov. Ko vnesete ukaz v LLM, model ustvari najverjetnejši vzorec, ki ustreza ukazu. Nato oceni najverjetnejšo naslednjo besedo po zadnji na podlagi tega, kar je bilo rečeno prej. Ponovi, ponovi in ponovi.
(Glej: Nevronska mreža)

Pomnilniški predpomnilnik – Memory cache

Pomnilniški predpomnilnik se nanaša na pomemben proces, ki pospešuje sklepanje (kar je proces, s katerim AI deluje, da ustvari odgovor na uporabnikovo poizvedbo). V bistvu je predpomnjenje optimizacijska tehnika, zasnovana za učinkovitejše sklepanje. AI očitno poganjajo visoko zmogljivi matematični izračuni in vsakič, ko se ti izračuni izvedejo, porabijo več energije. Shranjevanje v predpomnilniku je zasnovano tako, da zmanjša število izračunov, ki jih mora model izvesti, s tem da shrani določene izračune za prihodnja uporabniška vprašanja in operacije. Obstajajo različne vrste shranjevanja v predpomnilniku, čeprav je ena izmed bolj znanih shranjevanje v predpomnilniku KV (ali ključ-vrednost). Shranjevanje v predpomnilniku KV deluje v modelih, ki temeljijo na transformatorjih, in poveča učinkovitost ter omogoča hitrejše rezultate z zmanjšanjem časa (in algoritmičnega dela), potrebnega za ustvarjanje odgovorov na uporabniška vprašanja.
(Glej: Inference)

Nevronska mreža – Neural network

Nevronska mreža se nanaša na večplastno algoritmično strukturo, ki podpira globoko učenje — in, širše gledano, celoten razcvet generativnih orodij umetne inteligence po pojavu velikih jezikovnih modelov.
Čeprav ideja, da bi se pri oblikovanju algoritmov za obdelavo podatkov zgledovali po gosto prepletenih poteh človeških možganov, sega vse do 40. let prejšnjega stoletja, je šele veliko novejši vzpon grafične procesne strojne opreme (GPU) – prek industrije video iger – resnično sprostil moč te teorije. Ti čipi so se izkazali za zelo primerne za usposabljanje algoritmov z veliko več sloji, kot je bilo mogoče v prejšnjih obdobjih – kar omogoča sistemom umetne inteligence, ki temeljijo na nevronskih mrežah, da dosežejo veliko boljšo zmogljivost na številnih področjih, vključno z prepoznavanjem glasu, avtonomno navigacijo in odkrivanjem zdravil.
(Glej: Veliki jezikovni model [LLM])

RAMageddon

RAMageddon je zabaven nov izraz za ne ravno zabaven trend, ki preveva tehnološko industrijo: vse večje pomanjkanje pomnilnika z naključnim dostopom ali čipov RAM, ki poganjajo praktično vse tehnološke izdelke, ki jih uporabljamo v vsakdanjem življenju. S cvetom industrije umetne inteligence največja tehnološka podjetja in laboratoriji za umetno inteligenco – ki se vsi tekmujejo za najmočnejšo in najučinkovitejšo umetno inteligenco – kupujejo toliko RAM-a za napajanje svojih podatkovnih centrov, da za ostale nas ne ostane veliko. In ta ozkogrl v ponudbi pomeni, da tisto, kar ostane, postaja vse dražje.
To vključuje industrije, kot so igralništvo (kjer so velika podjetja morala dvigniti cene konzol, ker je težje najti pomnilniške čipe za njihove naprave), potrošniška elektronika (kjer bi pomanjkanje pomnilnika lahko povzročilo največji padec v prodaji pametnih telefonov v več kot desetletju) in splošno podjetniško računalništvo (ker ta podjetja ne morejo dobiti dovolj RAM-a za svoje podatkovne centre). Pričakuje se, da se bo porast cen ustavil šele po koncu strašnega pomanjkanja, a žal ni prav veliko znakov, da se bo to zgodilo kmalu.

Usposabljanje – Training

Razvoj umetne inteligence za strojno učenje vključuje proces, znan kot usposabljanje. Preprosto povedano, to pomeni vnašanje podatkov, da se model lahko uči iz vzorcev in ustvarja koristne izhodne podatke.
Na tej točki v AI-sklopu lahko postane malo filozofsko – saj je pred usposabljanjem matematična struktura, ki se uporablja kot izhodišče za razvoj učnega sistema, le kup plasti in naključnih številk. Šele z usposabljanjem AI model resnično dobi obliko. V bistvu je to proces, v katerem sistem odgovarja na značilnosti v podatkih, kar mu omogoča, da prilagodi izhodne podatke želenemu cilju – naj gre za prepoznavanje slik mačk ali ustvarjanje haikujev na zahtevo.
Pomembno je opozoriti, da ne vsa umetna inteligenca zahteva usposabljanje. Na pravilih temelječe umetne inteligence, ki so programirane za upoštevanje ročno vnaprej določenih navodil – na primer linearni klepetalni roboti – usposabljanja ne potrebujejo. Vendar so taki sistemi umetne inteligence verjetno bolj omejeni kot (dobro usposobljeni) sistemi za samoučenje.
Kljub temu je usposabljanje lahko drago, saj zahteva veliko vhodnih podatkov – in običajno se količina vhodnih podatkov, potrebnih za takšne modele, povečuje.
Hibridni pristopi se včasih lahko uporabijo za skrajšanje razvoja modela in pomagajo pri upravljanju stroškov. Na primer z natančnim prilagajanjem umetne inteligence, ki temelji na pravilih, na podlagi podatkov – kar pomeni, da razvoj zahteva manj podatkov, računske moči, energije in algoritemske kompleksnosti, kot če bi razvijalec začel graditi od začetka.
[Glej: Inference]

Tokeni – Tokens

Ko gre za komunikacijo med človekom in strojem, obstajajo nekateri očitni izzivi. Ljudje komunicirajo z uporabo človeškega jezika, medtem ko programi umetne inteligence izvajajo naloge in odgovarjajo na poizvedbe prek zapletenih algoritmičnih procesov, ki temeljijo na podatkih. V najpreprostejši definiciji tokeni predstavljajo osnovne gradnike komunikacije med človekom in umetno inteligenco, saj so diskretni segmenti podatkov, ki jih je obdelal ali ustvaril LLM.
Tokeni se ustvarjajo prek procesa, znanega kot »tokenizacija«, ki razčleni surove podatke in jih preoblikuje v ločene enote, ki jih LLM lahko obdela. Podobno kot programski prevajalnik prevaja človeški jezik v binarni kod, ki ga računalnik lahko obdela, tokenizacija razlaga človeški jezik za program AI prek uporabniških poizvedb, da lahko ta pripravi odgovor.
Obstaja več različnih vrst tokenov – vključno z vhodnimi tokeni (vrsta, ki jo je treba ustvariti kot odgovor na poizvedbo človeškega uporabnika), izhodnimi tokeni (vrsta, ki se ustvari, ko LLM odgovori na človeško zahtevo) in tokeni za sklepanje, ki vključujejo daljše, intenzivnejše naloge in procese, ki potekajo kot del uporabniške zahteve.
Pri AI za podjetja uporaba tokenov določa tudi stroške. Ker so tokeni enakovredni količini podatkov, ki jih model obdeluje, so postali tudi sredstvo, s katerim industrija umetne inteligence monetizira svoje storitve. Večina podjetij za umetno inteligenco zaračunava uporabo LLM na podlagi števila tokenov. Torej, več tokenov podjetje porabi pri uporabi programa umetne inteligence (na primer ChatGPT), več denarja bo moralo plačati svojemu ponudniku storitev umetne inteligence (OpenAI).

Prenosno učenje – Transfer learning

Tehnika, pri kateri se predhodno usposobljen model umetne inteligence uporabi kot izhodišče za razvoj novega modela za drugačno, a običajno sorodno nalogo – kar omogoča ponovno uporabo znanja, pridobljenega v prejšnjih ciklih usposabljanja.
Prenosno učenje lahko poveča učinkovitost z okrajšanjem razvoja modela. Lahko je koristno tudi, kadar so podatki za nalogo, za katero se model razvija, nekoliko omejeni. Vendar je pomembno opozoriti, da ima ta pristop omejitve. Modeli, ki se zanašajo na prenos znanja za pridobitev splošnih zmogljivosti, bodo verjetno potrebovali usposabljanje na dodatnih podatkih, da bodo dobro delovali na svojem področju
(Glej: Fine tuning)

Teže – Weights

Teže so bistvene za usposabljanje umetne inteligence, saj določajo, koliko pomembnosti (ali teže) se pripisuje različnim značilnostim (ali vhodnim spremenljivkam) v podatkih, uporabljenih za usposabljanje sistema – s čimer oblikujejo izhod umetnega inteligenčnega modela.
Drugače povedano, uteži so numerični parametri, ki opredeljujejo, kaj je v nizu podatkov najbolj pomembno za dano nalogo usposabljanja. Svojo funkcijo izpolnjujejo z množenjem vhodnih vrednosti. Usposabljanje modela se običajno začne z naključno dodeljenimi utežmi, vendar se te med potekom procesa prilagajajo, saj model poskuša doseči izhod, ki je čim bolj skladen s ciljem.
Na primer, model umetne inteligence za napovedovanje cen nepremičnin, ki je usposobljen na podlagi zgodovinskih podatkov o nepremičninah za ciljno lokacijo, bi lahko vključeval uteži za značilnosti, kot so število spalnic in kopalnic, ali je nepremičnina samostojna ali dvojna, ali ima parkirišče, garažo in tako naprej.
Končno uteži, ki jih model pripiše vsaki od teh vhodnih vrednosti, odražajo, koliko vplivajo na vrednost nepremičnine, glede na dani nabor podatkov.

Ta članek se redno posodablja z novimi informacijami.