LLM,SLM&RAG|SEO|PPC|SEM | Moji bookmarki ;)

Sedanji LLM-i še niso pripravljeni na zanesljivo znanstveno, poslovno ali ustvarjalno delo brez striktnega človeškega nadzora (Philippe Laban, Tobias Schnabel in Jennifer Neville, vsi iz Microsoft Research.)

Apr 25, 2026 | LLM (AI)

Članek trdi, da današnji LLM-i še niso zanesljivi za delegirano urejanje dokumentov, ker skozi daljše zaporedje nalog tiho vnašajo napake in sčasoma kvarijo vsebino. Avtorji zato predstavijo nov benchmark DELEGATE-52, s katerim merijo, kako dobro modeli ohranjajo pravilnost dokumentov skozi dolge delovne tokove v 52 različnih strokovnih domenah. Najpomembnejše praktično sporočilo je, da dober rezultat v kratkem ali enkratnem testu še ne pomeni, da bo model varen pri dolgotrajni uporabi na istih datotekah. LLM-i danes pri delegiranem delu pogosto ne odpovedo z mnogimi majhnimi napakami, temveč z redkimi, a hudimi okvarami, ki se nato seštevajo skozi več interakcij.

VIR https://arxiv.org/pdf/2604.15597.pdf

https://github.com/microsoft/DELEGATE52

BISTVO

Članek uvede benchmark DELEGATE-52, ki simulira dolge delovne tokove urejanja dokumentov v 52 profesionalnih domenah, od programiranja in kristalografije do glasbene notacije in računovodstva.
Osrednja ugotovitev je, da tudi najboljši preizkušeni modeli po daljšem zaporedju delegiranih nalog opazno poslabšajo dokumente, namesto da bi jih zanesljivo ohranili ali pravilno povrnili v prvotno stanje.
Metodologija temelji na “round-trip” pristopu: model najprej izvede spremembo, nato njeno obratno različico, raziskovalci pa izmerijo, koliko prvotne vsebine je po tem ciklu še pravilno ohranjene.
Rezultati kažejo, da so modeli praviloma boljši v strogo strukturiranih ali programskih domenah, precej slabši pa v naravnojezikovnih in nišnih formatih, kjer je semantična natančnost težje vzdržna.
Avtorji iz tega sklepajo, da sedanji LLM-i še niso pripravljeni na zanesljivo delegirano znanstveno, poslovno ali ustvarjalno delo brez tesnega človeškega nadzora.

DEJSTVA

Benchmark zajema 52 domen, 310 delovnih okolij in skupaj 2.125 nalog urejanja, razporejenih v pet skupin: Science & Engineering, Code & Configuration, Creative & Media, Structured Records in Everyday.
V glavnem eksperimentu so avtorji preizkusili 19 modelov; med vodilnimi so navedeni Gemini 3.1 Pro, Claude 4.6 Opus in GPT 5.4.
Po 20 interakcijah so frontier modeli v povprečju izgubili približno 25% vsebine dokumenta, povprečna degradacija čez vse modele pa je bila približno 50%.
Python je edina domena od 52, v kateri je večina modelov dosegla prag “ready”, ki ga avtorji definirajo kot vsaj 98% ohranjenosti po 20 interakcijah.
Avtorji pokažejo še tri pomembne učinke: večji dokumenti poslabšajo rezultat, daljši potek interakcije dodatno kopiči napake, prisotnost distraktorskih datotek pa zanesljivo škodi uspešnosti.

CITATI

“current models degrade documents during delegation” pomeni glavno tezo članka: problem ni le nepopolnost, ampak sistematična degradacija med delegiranjem dela.
“corrupt an average of 25% of document content” je najbolj neposredna številčna ocena škode, ki jo avtorji pripišejo tudi najmočnejšim modelom v dolgih potekih.
“agentic tool use does not improve performance” poudari, da preprosta dodana orodja sama po sebi ne rešijo problema zanesljivosti pri urejanju dokumentov.
“sparse but severe errors” dobro povzame naravo odpovedi: napake niso stalne, vendar so takrat, ko se pojavijo, dovolj velike, da resno poškodujejo artefakt.
“Python is the only domain” izpostavi, kako omejena je dejanska pripravljenost modelov za delegirano delo zunaj kodiranja.

2026-04-24

Apr 24, 2026 | AI SAS

Yutori Delegate

Agent za raziskave, administrativna opravila, spremljanje in rutinska spletna dela.

Bansi AI by Writesonic

Naložite posneto “talking heads” videoposnetke in dobite pametne shorte, poudarjene povečave, podnapise, dodatne posnetke ter izpopolnjen zvok.

DeepSeek-V4

Serija odprtokodnih modelov MoE s kontekstom 1 milijona tokenov za sklepanje in kodo.

☎️ Amotions AI

Trener za prodajne klice v živo, ki bere čustvene signale, obravnava ugovore in prodajnim predstavnikom pove, kaj naj rečejo, preden se z improvizacijo zapletejo v izgubljeno poslovno priložnost.

Ask Product Hunt AI

Vprašajte po orodjih, primerjajte možnosti in iščite podatke Product Hunta, ne da bi morali neskončno brskati po 47 straneh z novostmi.

RAG: pridobivanje podakov iz spomina– pridobivanje pravega konteksta

Apr 23, 2026 | RAG & SLM

VIR

https://machinelearningmastery.com/ai-agent-memory-explained-in-3-levels-of-difficulty/

memory-types-ai-agents

BISTVO

Članek izhaja iz osnovnega dejstva, da je veliki jezikovni model brez trajnega notranjega stanja, zato vsaka API-zahteva začne “od začetka”, kar je dovolj za enkratne naloge, ne pa za več fazne agente.
Avtorica zato definira problem spomina kot problem, kako stateless sistemu dati občutek trajnega, poizvedljivega znanja o preteklosti, da lahko sledi odločitvam, preferencam, neuspelim poskusom in zbranim dejstvom.
V drugi ravni članka razloži delovni oziroma in-context spomin, kjer model v trenutnem kontekstnem oknu vidi zgodovino pogovora, rezultate orodij, sistemski poziv in relevantne dokumente.
Ker kontekstno okno ni neskončno in z dolžino vhodov rasteta strošek ter latenca, članek predstavi zunanji spomin, kjer agent relevantne informacije prikliče iz ločenega sistema šele takrat, ko jih potrebuje.
Tretja raven članka pokaže, da v praksi ni dovolj samo hraniti podatke, ampak je treba odločiti tudi, kaj shraniti, kdaj zapisati, kako priklicati pravo informacijo, kako obravnavati zastaranje in kako uskladiti več agentov, ki pišejo v isti spominski sistem.

DEJSTVA

Članek z naslovom “AI Agent Memory Explained in 3 Levels of Difficulty” je napisala Bala Priya C in je bil objavljen 22. aprila 2026 v kategoriji Artificial Intelligence.
Avtorica članek razdeli na 3 ravni: razumevanje problema spomina, vrste agentnega spomina in arhitekturo spomina pri produkcijski skali.
Pri delovnem spominu navede, da trenutni modeli podpirajo približno od 128K do 1M tokenov konteksta, vendar stroški in latenca naraščajo z dolžino vhodnega besedila.
Med glavne tipe agentnega spomina izrecno uvrsti epizodični spomin za dogodke in izide, semantični spomin za dejstva in preference ter proceduralni spomin za uspešne strategije, vzorce delovanja in znane načine odpovedi.
Za vrednotenje kakovosti spomina predlaga 4 metrike: retrieval recall, retrieval precision, faithfulness in staleness rate, ker lahko sistem napačen priklic izvede tiho in nato iz njega sklepa povsem verjeten, vendar napačen odgovor.

CITATI

“Every request starts from scratch.” Ta kratek stavek povzema jedrni problem stateless agenta, ki brez dodatnega mehanizma ne ohrani nobene operativne kontinuitete med klici.
“The memory problem is the problem of giving an inherently stateless system the ability to behave as if it has persistent, queryable knowledge about the past.” To je osrednja definicija članka in najbolj natančen opis, kaj avtorica sploh razume pod agentnim spominom.
“Memory has to be selective.” Ta stavek poudari, da dobro zasnovan sistem ne zapisuje vsega, ampak samo tisto, kar vpliva na prihodnje vedenje agenta.
“Memories become stale.” S tem avtorica opozori, da je dolgoročni spomin lahko tudi škodljiv, če agent priklicuje zastarele preference, spremenjene entitete ali opuščene tehnične podatke.
“Agent memory functions like a stack.” Zaključna metafora članka poveže delovni spomin za trenutno stanje in zunanji priklic za zgodovino ter dejstva v enoten praktični model delovanja.

2026-04-22

Apr 22, 2026 | AI SAS

️ ChatFolders

Uredite AI-kaos v pregledne mape za ChatGPT, Claude, Gemini in Grok

ml-intern

AI agent poskrbi za rutinsko delo po usposabljanju, da bodo vaši modeli dejansko res prišli na trg

FusedFrames

Spremenite znanje vašega tima v strukturirane podatke, ki jih AI agenti lahko dejansko uporabijo

⚙️ Story copilot

Oblikujte in izvajajte zapletene workflow zgolj s klepetanjem (podobno kot pri Zapierju)

Nomie v2

Zamenjajte doomscrolling z gamified svetom, ki spremlja vaše razpoloženja, gradi navade in pomiri vaš živčni sistem.

4 SEO “koncepti”, ki vam že dolgo časa ne pomagajo, temveč vam prej škodujejo

Apr 21, 2026 | SEO

„4 SEO koncepti, ki vam ne pomagajo” — avtor Mike Friedman razgrinja štiri pogosto napačno razumljene SEO prakse, ki po nepotrebnem jemljejo čas in energijo.

VIR: https://theseopub.com/4-seo-concepts-that-arent-helping-you/

BISTVO — 5 ključnih ugotovitev:

Google že dolgo ne temelji na štetju ključnih besed, temveč razume entitete, kontekst in namen iskanja, zato optimizacija gostote ključnih besed ni smiselna
Ocena PageSpeed Insights (Lighthouse) je laboratorijsko orodje za diagnostiko napak, ne merilo za rangiranje — Google dejansko uporablja podatke iz resničnih uporabniških sej (Core Web Vitals)
Daljša vsebina ne rangira bolje sama po sebi; rangira bolje, ker pogosto pokriva več entitet in odgovori na več vprašanj — a besedna dolžina brez vsebinske vrednosti ne pomaga
Orodja tretjih strani, ki označujejo “toksične” povezave, pogosto niso usklajena z Googlovimi dejanskimi kriteriji; Google v večini primerov sam ignorira nizkokakovostne povezave
Skupni vzorec napak je, da se optimizatorji osredotočijo na konkretne, merljive številke namesto na dejavnike, ki dejansko vplivajo na to, kako Google ocenjuje stran

DEJSTVA — 5 podatkovnih dejstev:

Lighthouse oceni tri Core Web Vitals metrike: LCP (hitrost nalaganja največjega elementa), INP (odzivnost na interakcijo) in CLS (nestabilnost postavitve)
Stran z oceno 65 v Lighthouse ima lahko odlične Core Web Vitals, stran z oceno 98 pa slabe — ker laboratorijsko in terensko merjenje nista enaka
Primer: stran z 3.000 besedami polnila se obnese slabše od strani z 1.200 besedami globinskega znanja
Orodje za disavow je namenjeno izrecno dvema primeroma: manualnim kaznim in zavestni udeležbi v shemah plačanih povezav
Avtor je Mike Friedman, članek je bil objavljen 21. aprila 2026

CITATI — 5 dobesednih citatov:

“There is no target percentage. There hasn’t been one for a very long time.” — o gostoti ključnih besed
“The Lighthouse score you see in PageSpeed Insights is a lab-based diagnostic tool… It’s a debugging tool.”
“More words is not more information gain. More novel, specific information is more information gain.”
“Google has said repeatedly that its algorithms are very good at identifying and ignoring low-quality links on their own.”
“The fix is always the same question. Does this thing I’m spending time on directly influence how Google evaluates my site?”

Glenn Gabe analizira primer spletišča NationalToday.com, ki je po Googlovem ročnem ukrepu v velikem obsegu izgubilo vidnost tako v Googlu kot v ChatGPT-u.

Apr 21, 2026 | SEO

Članek opozarja na sistemsko tveganje: agresivno in nepremišljeno skaliranje z AI-vsebino za SEO ne prinaša le Google kazni (v tem primeru ročne, sicer pa v obliki padca v serp-u – praviloma kmalu po začetnem vrhu), temveč se posledice kaskadno razširijo na vse AI iskalne platforme, ki temeljijo na Googlovem indeksu. Primer NationalToday.com je jasen dokaz, da »Mt. AI« strategije delujejo le začasno, nato pa se sesuljejo na vseh frontah hkrati.

VIR: https://www.gsqi.com/marketing-blog/when-mt-ai-crumbles-chatgpt-follows/

BISTVO

Spletišče NationalToday.com je v direktoriju /us/ objavilo več kot 850.000 100% AI-generiranih lokalnih novic, ki so se uvrščale v Google Top Stories, News in Discover
Google je po razkritju portala Futurism izdal ročni ukrep za »scaled content abuse« in celoten direktorij odstranil iz indeksa
Odstranitev iz Googlovega indeksa je neposredno povzročila izpad v AI Overviews, AI Mode in posledično v ChatGPT citatih
ChatGPT pri iskanju z utemeljitvijo na spletu delno uporablja Googlov indeks, zato spletišče, ki je odstranjeno iz Googla, izgubi tudi večino CitGPT citatov
Izjema so redki primeri, kjer ChatGPT za utemeljitev uporablja Bing ali drug vir in citati ostanejo

DEJSTVA

850.000+ URL-jev v /us/ direktoriju — vse 100% AI-generirane vsebine
Vidnost spletišča se je po ročnem ukrepu takoj strmoglavila — tipičen vzorec, ki ga Gabe imenuje »Mt. AI«
Preverjanje je potekalo na več ChatGPT računih (plačljivi in brezplačni) prek orodja Brand Radar (Ahrefs)
Večina citatov za /us/ direktorij je izginila; le redki so ostali (verjetno prek Bing indeksa)
Ukrep je prizadel izključno /us/ direktorij — preostala vsebina NationalToday.com v Googlu in ChatGPT-u ostaja nedotaknjena

CITATI

“A recent manual action provides a great view of how scaling via AI-generated content can yield a huge drop in Google’s 10-blue links, AI Overviews, and AI Mode.”
“When ChatGPT searches the web to ground answers, it can leverage Google’s index (which has been documented many times).”
“If you receive a manual action from Google… then you will drop in AIOs, AI Mode, and then downstream in AI search (which includes ChatGPT).”
“Do not implement risky and spammy tactics just to rank in AI search.”
“It works until it doesn’t. It’s just another example of ‘Mt. AI’. Beware.”

2026-04-21

Apr 21, 2026 | AI SAS

Dune

Tipkovnica za Mac, ki se prilagaja kontekstu in v realnem času spreminja vaše bližnjice

Claude Desktop Buddy

Spremenite Clauda v fizičnega sodelavca tako, da ga povežete s strojno opremo, ki se odziva, signalizira in usklajuje z vašo umetno inteligenco.

The New Waydev

Preverite, ali se vaša koda, napisana z umetno inteligenco, dejansko izvede

Pegasus 1.5 od TwelveLabs

Pretvori dolge videoposnetke v podatke z možnostjo iskanja in časovnimi oznakami, tako da lahko pregledujete posnetke, kot da gre za preglednico.

Granter

Agent, ki poišče, napiše in upravlja s sredstvi za subvencije

StackAdapt tržijo oglaševanje znotraj ChatGPT prek omejenega pilotnega programa v partnerstvu z OpenAI

Apr 21, 2026 | PPC

Članek razkriva, kako StackAdapt aktivno gradi mostove med trenutnim oglaševanjem in generativnimi AI platformami. Oglaševanje znotraj ChatGPT ni zgolj kontekstualno – temveč je usmerjeno glede na relevantnost poziva, kar pomeni, da se oglasi prikazujejo na podlagi tega, kaj uporabnik išče ali sprašuje v realnem času. To predstavlja novo paradigmo v digitalnem oglaševanju, kjer se premika od ključnih besed (SEO/SEM) k nameri izraženi v naravnem jeziku. Minimalna poraba $50.000 nakazuje, da je pilot za zdaj namenjen večjim oglaševalskim proračunom, ne malim podjetjem.

VIR: https://www.adweek.com/media/exclusive-leaked-deck-reveals-stackadapts-playbook-for-chatgpt-ads/

BISTVO

StackAdapt, neodvisna platforma na strani povpraševanja (DSP), tiho pristopa oglaševalcem z možnostjo testiranja oglasov znotraj ChatGPT
Program je zasnovan kot zgodnji dostop do novega »odkritvenega sloja« (discovery layer), ki cilja uporabnike med fazo raziskovanja in primerjave izdelkov
Pitch deck z naslovom “OpenAI x StackAdapt Limited Pilot Program” je bil dne 27. marca poslan izbranim kupcem in ga je pregledal Adweek
CPM (cena na tisoč prikazov) se giblje med $15 in $60, pri čemer StackAdapt ponuja znižane platformske in upravljavske provizije
Vstop v pilotni program zahteva minimalno porabo $50.000, kar program umešča med premium ekskluzivne ponudbe

DEJSTVA

CPM razpon: $15–$60 glede na relevantnost poziva (prompta)
Minimalna poraba: $50.000 za vstop v pilotni program
Datum pošiljanja decka: 27. marec 2025 (izbranim kupcem)
Avtor članka: Trishla Ostwal, poročevalka Adweeka za AI in tehnologijo
Platforma: ChatGPT je opredeljen kot »ena od najhitreje rastočih potrošniških platform na svetu«

CITATI

“StackAdapt has partnered with OpenAI to enable advertising within ChatGPT, one of the fastest growing consumer platforms in the world.” — iz pitch decka
Opis umestitve: zajemanje uporabnikov »in the middle of researching and comparing products on ChatGPT«
Program je opredeljen kot »early-stage test inside a still-developing ad system«
Pozicioniranje: StackAdapt program opisuje kot dostop do novega »discovery layer«
Adweek ekskluzivno poroča: deck je bil »shared with select buyers on March 27 and reviewed by ADWEEK«

Kvantni računalniki ne ogrožajo 128-bitnih simetričnih ključev

Apr 21, 2026 | Varnost

Splošno prepričanje, da moramo simetrične ključe podvojiti (npr. preiti z AES-128 na AES-256) zaradi kvantne grožnje, ni tehnično utemeljeno. Prava nujnost post-kvantnega prehoda zadeva izključno asimetrično kriptografijo (RSA, ECDH, digitalni podpisi), ki je ranljiva na Shorjev algoritem. Vsa prizadevanja naj se osredotočijo tja, medtem ko simetrični podsistemi ostanejo nespremenjeni.

VIR: https://words.filippo.io/128-bits/

BISTVO

AES-128, SHA-256 in drugi simetrični algoritmi so varni pred kvantnimi računalniki in ne zahtevajo sprememb v okviru post-kvantnega prehoda
Groverjev algoritem sicer teoretično ponuja kvadratno pohitritev za iskanje ključev, a ga je nemogoče učinkovito paralelizirati, kar izničuje praktično prednost
Za napad na AES-128 z Groverjevim algoritmom bi potrebovali 140 bilijonov kvantnih vezij s 724 logičnimi kubiti, ki bi delovali vzporedno 10 let
Napad z Groverjevim algoritmom na AES-128 je 2⁷⁸˙⁵-krat dražji kot napad z Shorjevim algoritmom na 256-bitne eliptične krivulje
Nepotrebno podvajanje dolžin ključev odvrača sredstva od dejansko nujnih post-kvantnih posodobitev asimetričnih algoritmov (RSA, ECDH, ECDSA)

DEJSTVA

Groverjev algoritem zahteva zaporedno (serializirano) izvajanje — paralelizacija napada razredči kvadratno pohitritev in poveča skupni strošek
Optimizirano kvantno vezje za AES-128 (Liao in Luo, 2025) ima globino 2³² T-vrat in širino 724 logičnih kubitov
NIST je AES-128 opredelil kot referenčni algoritem za Kategorijo 1 post-kvantne varnosti — to je uradno merilo za vse PQC primitive
NIST IR 8547 prepoveduje vse kvantno ranljive algoritme od leta 2035, a eksplicitno dovoljuje vse velikosti AES ključev
BSI (Nemška zvezna agencija za informacijsko varnost) prav tako priporoča AES-128, AES-192 in AES-256 za nove kriptografske sisteme

CITATI

“AES-128 is safe against quantum computers. SHA-256 is safe against quantum computers. No symmetric key sizes have to change as part of the post-quantum transition.” — Filippo Valsorda
“It is quite likely that Grover’s algorithm will provide little or no advantage in attacking AES, and AES 128 will remain secure for decades to come.” — NIST FAQ
“Breaking AES-128 with Grover is 430,000,000,000,000,000,000,000 times more expensive than breaking 256-bit elliptic curves with Shor’s.” — Filippo Valsorda
“Conflating necessary and unnecessary changes will cause needless churn and take resources away from the urgent updates.” — Filippo Valsorda
“A surface-code based Grover search on AES-128 will never succeed.” — Samuel Jaques, Univerza Waterloo (2024)

ABC Slovar osnov “umetne inteligence” ;)

Apr 20, 2026 | Reference

Umetna inteligenca je obsežen in zapleten svet. Znanstveniki, ki delujejo na tem področju, se pri pojasnjevanju svojega dela pogosto zatekajo k strokovnemu žargonu. Zato moramo v naših prispevkih o industriji umetne inteligence pogosto uporabljati te strokovne izraze. Zato smo menili, da bi bilo koristno sestaviti slovar z opredelitvami nekaterih najpomembnejših besed in izrazov, ki jih uporabljamo v naših člankih.

Ta slovar bo redno posodablen , saj raziskovalci nenehno odkrivajo nove metode za premikanje meja umetne inteligence, hkrati pa identificirajo nastajajoča varnostna tveganja.

AGI

Splošna umetna inteligenca ali AGI je nejasen izraz. Vendar pa se na splošno nanaša na umetno inteligenco, ki je pri mnogih, če ne pri večini nalog, sposobnejša od povprečnega človeka. Izvršni direktor OpenAI Sam Altman je nedavno opisal AGI kot »ekvivalent povprečnega človeka, ki bi ga lahko zaposlili kot sodelavca«. Medtem pa statut OpenAI opredeljuje AGI kot »visoko avtonomne sisteme, ki presegajo ljudi pri večini ekonomsko najbolj dragocenih del«. Razumevanje Google DeepMind se nekoliko razlikuje od teh dveh opredelitev; laboratorij AGI obravnava kot »AI, ki je pri večini kognitivnih nalog vsaj tako sposobna kot ljudje«. Zmedeni? Nič ne skrbite – tako so tudi strokovnjaki na čelu raziskav AI.

AI agent

AI agent se nanaša na orodje, ki uporablja tehnologije umetne inteligence za izvajanje vrste nalog v vašem imenu – kar presega zmožnosti bolj osnovnega AI chatbota –, kot so vnašanje stroškov, rezervacija vozovnic ali mize v restavraciji ali celo pisanje in vzdrževanje kode. Vendar, kot smo že pojasnili, je v tem nastajajočem prostoru veliko spremenljivk, zato lahko »AI agent« za različne ljudi pomeni različne stvari. Prav tako se še vedno gradi infrastruktura, da bi se uresničile predvidene zmogljivosti. Vendar pa osnovni koncept predvideva avtonomen sistem, ki lahko črpa iz več sistemov umetne inteligence za izvajanje večstopenjskih nalog.

Veriga misli – Chain of thought

Na preprosto vprašanje lahko človeški možgani odgovorijo, ne da bi sploh preveč razmišljali o tem – na primer: »Katera žival je višja, žirafa ali mačka?« Vendar pa v mnogih primerih pogosto potrebujete papir in svinčnik, da pridete do pravega odgovora, saj obstajajo vmesni koraki. Na primer, če ima kmet piščance in krave, ki imajo skupaj 40 glav in 120 nog, boste morda morali napisati preprosto enačbo, da pridete do odgovora (20 piščancev in 20 krav).
V kontekstu umetne inteligence razmišljanje po verigi misli za velike jezikovne modele pomeni razčlenitev problema na manjše, vmesne korake, da se izboljša kakovost končnega rezultata. Običajno traja dlje, da se dobi odgovor, vendar je verjetnost, da bo odgovor pravilen, večja, zlasti v kontekstu logike ali programiranja. Modeli razmišljanja so razviti iz tradicionalnih velikih jezikovnih modelov in optimizirani za razmišljanje po verigi misli zahvaljujoč učenju s krepitvijo.
(Glej: Veliki jezikovni model)

Računalniška moč

Čeprav je izraz »računalniška moč« nekoliko večpomenski, se na splošno nanaša na ključno računalniško moč, ki omogoča delovanje modelov umetne inteligence. Ta vrsta obdelave poganja industrijo umetne inteligence in ji omogoča usposabljanje ter uvajanje zmogljivih modelov. Izraz je pogosto skrajšana oblika za vrste strojne opreme, ki zagotavlja računalniško moč – na primer grafične procesne enote (GPU), centralne procesne enote (CPU), procesne enote za globoko učenje (TPU) in druge oblike infrastrukture, ki tvorijo temelj sodobne industrije umetne inteligence.

Globoko učenje – Deep learning

Podskupina samoučljivega strojnega učenja, v kateri so algoritmi umetne inteligence zasnovani z večplastno strukturo umetne nevronske mreže (ANN). To jim omogoča ustvarjanje bolj zapletenih korelacij v primerjavi s preprostejšimi sistemi, ki temeljijo na strojnem učenju, kot so linearni modeli ali odločevalna drevesa. Struktura algoritmov globokega učenja črpa navdih iz medsebojno povezanih poti nevronov v človeških možganih.
Modeli umetne inteligence za globoko učenje so sposobni sami prepoznati pomembne značilnosti v podatkih, namesto da bi te značilnosti morali opredeliti človeški inženirji. Struktura podpira tudi algoritme, ki se lahko učijo iz napak in s procesom ponavljanja in prilagajanja izboljšujejo svoje lastne izhodne podatke. Vendar sistemi globokega učenja za dobre rezultate potrebujejo veliko podatkovnih točk (milijone ali več). Njihovo usposabljanje običajno traja dlje v primerjavi z enostavnejšimi algoritmi strojnega učenja – zato so razvojni stroški ponavadi višji.
(Glej: Nevronska mreža)

Difuzija – Diffusion

Difuzija je tehnologija, ki je v središču mnogih modelov umetne inteligence za ustvarjanje umetnosti, glasbe in besedil. Navdihnjeni s fiziko, sistemi difuzije počasi „uničujejo“ strukturo podatkov – na primer fotografij, pesmi in podobno – z dodajanjem šuma, dokler ne ostane nič. V fiziki je difuzija spontana in nepovratna – sladkor, ki se je raztopil v kavi, ni mogoče vrniti v obliko kocke. Vendar pa si sistemi difuzije v umetni inteligenci prizadevajo naučiti se nekakšen proces »obratne difuzije«, da bi obnovili uničene podatke in pridobili sposobnost za obnovo podatkov iz šuma.

Destilacija – Distillation

Destilacija je tehnika, ki se uporablja za pridobivanje znanja iz velikega modela umetne inteligence z modelom »učitelj-učenec«. Razvijalci pošljejo zahteve modelu učitelja in zabeležijo izhodne podatke. Odgovori se včasih primerjajo z naborom podatkov, da se preveri njihova točnost. Ti izhodni podatki se nato uporabijo za usposabljanje modela učenca, ki je usposobljen za približevanje vedenju učitelja.
Destilacijo je mogoče uporabiti za ustvarjanje manjšega, učinkovitejšega modela na podlagi večjega modela z minimalno izgubo pri destilaciji. Verjetno je OpenAI na ta način razvil GPT-4 Turbo, hitrejšo različico GPT-4.
Čeprav vsa podjetja za umetno inteligenco destilacijo uporabljajo interno, so jo nekatera morda uporabila tudi za dohitevanje najnaprednejših modelov. Destilacija iz konkurenta običajno krši pogoje uporabe API-jev za umetno inteligenco in klepetalnih pomočnikov.

Natančno prilagajanje – Fine-tuning

To se nanaša na nadaljnje usposabljanje modela AI za optimizacijo zmogljivosti za bolj specifično nalogo ali področje, kot je bilo prej v središču njegovega usposabljanja — običajno z vnosom novih, specializiranih (tj. nalogam usmerjenih) podatkov.
Mnogi AI-startupi uporabljajo velike jezikovne modele kot izhodišče za razvoj komercialnega izdelka, vendar si prizadevajo povečati uporabnost za ciljni sektor ali nalogo tako, da prejšnje cikle usposabljanja dopolnijo z natančnim prilagajanjem na podlagi lastnega domensko specifičnega znanja in strokovnosti.
(Glej: Veliki jezikovni model [LLM])

GAN

Generative Adversarial Network (GAN), ali Generativno nasprotujoče omrežje, je vrsta okvira za strojno učenje, ki podpira nekatere pomembne razvojne dosežke v generativni umetni inteligenci, ko gre za ustvarjanje realističnih podatkov – vključno z (a ne le) orodji za deepfake. GAN-i vključujejo uporabo para nevronskih omrežij, od katerih eno črpa iz svojih podatkov za usposabljanje, da ustvari izhod, ki se posreduje drugemu modelu za oceno. Ta drugi, diskriminatorni model, tako igra vlogo razvrščevalca izhodnih podatkov generatorja – kar mu omogoča, da se sčasoma izboljša.
Struktura GAN je zasnovana kot tekmovanje (od tu »adversarial«) – pri čemer sta oba modela v bistvu programirana tako, da poskušata drug drugega prekašati: generator poskuša, da bi njegovi izhodni podatki prešli mimo diskriminatorja, medtem ko diskriminator poskuša odkriti umetno ustvarjene podatke. Ta strukturirano tekmovanje lahko optimizira izhodne podatke AI, da so bolj realistični, brez potrebe po dodatnem človeškem posredovanju. Čeprav GAN-i delujejo najbolje za ožje aplikacije (kot je ustvarjanje realističnih fotografij ali videov), namesto za splošno AI.

Halucinacija – Hallucination

Halucinacija je izraz, ki ga industrija AI najraje uporablja za AI-modele, ki si stvari izmišljajo – dobesedno ustvarjajo informacije, ki so napačne. Očitno je to ogromen problem za kakovost AI.
Halucinacije ustvarjajo izhodne podatke GenAI, ki so lahko zavajajoči in lahko celo vodijo do tveganj v resničnem življenju – s potencialno nevarnimi posledicami (pomislite na zdravstveno poizvedbo, ki vrne škodljiv zdravstveni nasvet). Zato večina orodij GenAI v drobnem tisku zdaj opozarja uporabnike, naj preverijo odgovore, ki jih ustvari umetna inteligenca, čeprav so takšna opozorila običajno veliko manj vidna kot informacije, ki jih orodja izdajo s pritiskom na gumb.
Menijo, da problem umetne inteligence, ki si izmišlja informacije, izhaja iz vrzeli v podatkih za usposabljanje. Zlasti za splošno namensko GenAI – včasih znano tudi kot temeljni modeli – se zdi to težko rešiti. Preprosto ni dovolj podatkov, da bi umetno inteligenco usposobili za celovito reševanje vseh vprašanj, ki bi jih lahko zastavili. TL;DR: še nismo izumili Boga.
Halucinacije prispevajo k premiku v smeri vse bolj specializiranih in/ali vertikalnih modelov umetne inteligence – tj. področno specifičnih umetnih inteligenc, ki zahtevajo ožje strokovno znanje – kot način za zmanjšanje verjetnosti vrzeli v znanju in tveganj dezinformacij.

Inference

Inference je proces izvajanja modela umetne inteligence. To pomeni, da se modelu omogoči, da na podlagi prej videnih podatkov napoveduje . Da bo jasno: Inference ni mogoče brez usposabljanja; model mora najprej naučiti vzorce v nizu podatkov, preden lahko učinkovito ekstrapolira iz teh podatkov za usposabljanje.
Inferenco lahko izvaja veliko vrst strojne opreme, od procesorjev pametnih telefonov do zmogljivih grafičnih procesorjev (GPU) in posebej zasnovanih AI pospeševalnikov. Vendar pa vsi ne morejo enako dobro izvajati modelov. Pri zelo velikih modelih bi napovedovanje na primer na prenosnem računalniku trajalo večnost v primerjavi z oblačnim strežnikom z vrhunskimi AI čipi.
[Glej: Usposabljanje]

Velik jezikovni model (LLM) – Large language model

Veliki jezikovni modeli, ali LLM-ji, so modeli umetne inteligence, ki jih uporabljajo priljubljeni AI-pomočniki, kot so ChatGPT, Claude, Googlov Gemini, Meta AI Llama, Microsoft Copilot ali Mistralov Le Chat. Ko klepetate z AI-pomočnikom, komunicirajete z velikim jezikovnim modelom, ki vašo zahtevo obdela neposredno ali s pomočjo različnih razpoložljivih orodij, kot so brskanje po spletu ali tolmači kode.
AI-pomočniki in LLM-ji imajo lahko različna imena. Na primer, GPT je velik jezikovni model OpenAI, ChatGPT pa je AI-pomočnik.
LLM-ji so globoka nevronska omrežja, sestavljena iz milijard številčnih parametrov (ali uteži, glej spodaj), ki se učijo odnosov med besedami in frazami ter ustvarjajo predstavitev jezika, nekakšen večdimenzionalni zemljevid besed.
Ti modeli so ustvarjeni s kodiranjem vzorcev, ki jih najdejo v milijardah knjig, člankov in transkriptov. Ko vnesete ukaz v LLM, model ustvari najverjetnejši vzorec, ki ustreza ukazu. Nato oceni najverjetnejšo naslednjo besedo po zadnji na podlagi tega, kar je bilo rečeno prej. Ponovi, ponovi in ponovi.
(Glej: Nevronska mreža)

Pomnilniški predpomnilnik – Memory cache

Pomnilniški predpomnilnik se nanaša na pomemben proces, ki pospešuje sklepanje (kar je proces, s katerim AI deluje, da ustvari odgovor na uporabnikovo poizvedbo). V bistvu je predpomnjenje optimizacijska tehnika, zasnovana za učinkovitejše sklepanje. AI očitno poganjajo visoko zmogljivi matematični izračuni in vsakič, ko se ti izračuni izvedejo, porabijo več energije. Shranjevanje v predpomnilniku je zasnovano tako, da zmanjša število izračunov, ki jih mora model izvesti, s tem da shrani določene izračune za prihodnja uporabniška vprašanja in operacije. Obstajajo različne vrste shranjevanja v predpomnilniku, čeprav je ena izmed bolj znanih shranjevanje v predpomnilniku KV (ali ključ-vrednost). Shranjevanje v predpomnilniku KV deluje v modelih, ki temeljijo na transformatorjih, in poveča učinkovitost ter omogoča hitrejše rezultate z zmanjšanjem časa (in algoritmičnega dela), potrebnega za ustvarjanje odgovorov na uporabniška vprašanja.
(Glej: Inference)

Nevronska mreža – Neural network

Nevronska mreža se nanaša na večplastno algoritmično strukturo, ki podpira globoko učenje — in, širše gledano, celoten razcvet generativnih orodij umetne inteligence po pojavu velikih jezikovnih modelov.
Čeprav ideja, da bi se pri oblikovanju algoritmov za obdelavo podatkov zgledovali po gosto prepletenih poteh človeških možganov, sega vse do 40. let prejšnjega stoletja, je šele veliko novejši vzpon grafične procesne strojne opreme (GPU) – prek industrije video iger – resnično sprostil moč te teorije. Ti čipi so se izkazali za zelo primerne za usposabljanje algoritmov z veliko več sloji, kot je bilo mogoče v prejšnjih obdobjih – kar omogoča sistemom umetne inteligence, ki temeljijo na nevronskih mrežah, da dosežejo veliko boljšo zmogljivost na številnih področjih, vključno z prepoznavanjem glasu, avtonomno navigacijo in odkrivanjem zdravil.
(Glej: Veliki jezikovni model [LLM])

RAMageddon

RAMageddon je zabaven nov izraz za ne ravno zabaven trend, ki preveva tehnološko industrijo: vse večje pomanjkanje pomnilnika z naključnim dostopom ali čipov RAM, ki poganjajo praktično vse tehnološke izdelke, ki jih uporabljamo v vsakdanjem življenju. S cvetom industrije umetne inteligence največja tehnološka podjetja in laboratoriji za umetno inteligenco – ki se vsi tekmujejo za najmočnejšo in najučinkovitejšo umetno inteligenco – kupujejo toliko RAM-a za napajanje svojih podatkovnih centrov, da za ostale nas ne ostane veliko. In ta ozkogrl v ponudbi pomeni, da tisto, kar ostane, postaja vse dražje.
To vključuje industrije, kot so igralništvo (kjer so velika podjetja morala dvigniti cene konzol, ker je težje najti pomnilniške čipe za njihove naprave), potrošniška elektronika (kjer bi pomanjkanje pomnilnika lahko povzročilo največji padec v prodaji pametnih telefonov v več kot desetletju) in splošno podjetniško računalništvo (ker ta podjetja ne morejo dobiti dovolj RAM-a za svoje podatkovne centre). Pričakuje se, da se bo porast cen ustavil šele po koncu strašnega pomanjkanja, a žal ni prav veliko znakov, da se bo to zgodilo kmalu.

Usposabljanje – Training

Razvoj umetne inteligence za strojno učenje vključuje proces, znan kot usposabljanje. Preprosto povedano, to pomeni vnašanje podatkov, da se model lahko uči iz vzorcev in ustvarja koristne izhodne podatke.
Na tej točki v AI-sklopu lahko postane malo filozofsko – saj je pred usposabljanjem matematična struktura, ki se uporablja kot izhodišče za razvoj učnega sistema, le kup plasti in naključnih številk. Šele z usposabljanjem AI model resnično dobi obliko. V bistvu je to proces, v katerem sistem odgovarja na značilnosti v podatkih, kar mu omogoča, da prilagodi izhodne podatke želenemu cilju – naj gre za prepoznavanje slik mačk ali ustvarjanje haikujev na zahtevo.
Pomembno je opozoriti, da ne vsa umetna inteligenca zahteva usposabljanje. Na pravilih temelječe umetne inteligence, ki so programirane za upoštevanje ročno vnaprej določenih navodil – na primer linearni klepetalni roboti – usposabljanja ne potrebujejo. Vendar so taki sistemi umetne inteligence verjetno bolj omejeni kot (dobro usposobljeni) sistemi za samoučenje.
Kljub temu je usposabljanje lahko drago, saj zahteva veliko vhodnih podatkov – in običajno se količina vhodnih podatkov, potrebnih za takšne modele, povečuje.
Hibridni pristopi se včasih lahko uporabijo za skrajšanje razvoja modela in pomagajo pri upravljanju stroškov. Na primer z natančnim prilagajanjem umetne inteligence, ki temelji na pravilih, na podlagi podatkov – kar pomeni, da razvoj zahteva manj podatkov, računske moči, energije in algoritemske kompleksnosti, kot če bi razvijalec začel graditi od začetka.
[Glej: Inference]

Tokeni – Tokens

Ko gre za komunikacijo med človekom in strojem, obstajajo nekateri očitni izzivi. Ljudje komunicirajo z uporabo človeškega jezika, medtem ko programi umetne inteligence izvajajo naloge in odgovarjajo na poizvedbe prek zapletenih algoritmičnih procesov, ki temeljijo na podatkih. V najpreprostejši definiciji tokeni predstavljajo osnovne gradnike komunikacije med človekom in umetno inteligenco, saj so diskretni segmenti podatkov, ki jih je obdelal ali ustvaril LLM.
Tokeni se ustvarjajo prek procesa, znanega kot »tokenizacija«, ki razčleni surove podatke in jih preoblikuje v ločene enote, ki jih LLM lahko obdela. Podobno kot programski prevajalnik prevaja človeški jezik v binarni kod, ki ga računalnik lahko obdela, tokenizacija razlaga človeški jezik za program AI prek uporabniških poizvedb, da lahko ta pripravi odgovor.
Obstaja več različnih vrst tokenov – vključno z vhodnimi tokeni (vrsta, ki jo je treba ustvariti kot odgovor na poizvedbo človeškega uporabnika), izhodnimi tokeni (vrsta, ki se ustvari, ko LLM odgovori na človeško zahtevo) in tokeni za sklepanje, ki vključujejo daljše, intenzivnejše naloge in procese, ki potekajo kot del uporabniške zahteve.
Pri AI za podjetja uporaba tokenov določa tudi stroške. Ker so tokeni enakovredni količini podatkov, ki jih model obdeluje, so postali tudi sredstvo, s katerim industrija umetne inteligence monetizira svoje storitve. Večina podjetij za umetno inteligenco zaračunava uporabo LLM na podlagi števila tokenov. Torej, več tokenov podjetje porabi pri uporabi programa umetne inteligence (na primer ChatGPT), več denarja bo moralo plačati svojemu ponudniku storitev umetne inteligence (OpenAI).

Prenosno učenje – Transfer learning

Tehnika, pri kateri se predhodno usposobljen model umetne inteligence uporabi kot izhodišče za razvoj novega modela za drugačno, a običajno sorodno nalogo – kar omogoča ponovno uporabo znanja, pridobljenega v prejšnjih ciklih usposabljanja.
Prenosno učenje lahko poveča učinkovitost z okrajšanjem razvoja modela. Lahko je koristno tudi, kadar so podatki za nalogo, za katero se model razvija, nekoliko omejeni. Vendar je pomembno opozoriti, da ima ta pristop omejitve. Modeli, ki se zanašajo na prenos znanja za pridobitev splošnih zmogljivosti, bodo verjetno potrebovali usposabljanje na dodatnih podatkih, da bodo dobro delovali na svojem področju
(Glej: Fine tuning)

Teže – Weights

Teže so bistvene za usposabljanje umetne inteligence, saj določajo, koliko pomembnosti (ali teže) se pripisuje različnim značilnostim (ali vhodnim spremenljivkam) v podatkih, uporabljenih za usposabljanje sistema – s čimer oblikujejo izhod umetnega inteligenčnega modela.
Drugače povedano, uteži so numerični parametri, ki opredeljujejo, kaj je v nizu podatkov najbolj pomembno za dano nalogo usposabljanja. Svojo funkcijo izpolnjujejo z množenjem vhodnih vrednosti. Usposabljanje modela se običajno začne z naključno dodeljenimi utežmi, vendar se te med potekom procesa prilagajajo, saj model poskuša doseči izhod, ki je čim bolj skladen s ciljem.
Na primer, model umetne inteligence za napovedovanje cen nepremičnin, ki je usposobljen na podlagi zgodovinskih podatkov o nepremičninah za ciljno lokacijo, bi lahko vključeval uteži za značilnosti, kot so število spalnic in kopalnic, ali je nepremičnina samostojna ali dvojna, ali ima parkirišče, garažo in tako naprej.
Končno uteži, ki jih model pripiše vsaki od teh vhodnih vrednosti, odražajo, koliko vplivajo na vrednost nepremičnine, glede na dani nabor podatkov.

Ta članek se redno posodablja z novimi informacijami.

« Older Entries

Next Entries »

VIR https://arxiv.org/pdf/2604.15597.pdf

BISTVO

DEJSTVA

CITATI

VIR

BISTVO

DEJSTVA

CITATI

BISTVO

DEJSTVA

CITATI

BISTVO

DEJSTVA

CITATI

BISTVO

DEJSTVA

CITATI

AGI

AI agent

Veriga misli – Chain of thought

Računalniška moč

Globoko učenje – Deep learning

Difuzija – Diffusion

Destilacija – Distillation

Natančno prilagajanje – Fine-tuning

GAN

Halucinacija – Hallucination

Inference

Velik jezikovni model (LLM) – Large language model

Pomnilniški predpomnilnik – Memory cache

Nevronska mreža – Neural network

RAMageddon

Usposabljanje – Training

Tokeni – Tokens

Prenosno učenje – Transfer learning

Teže – Weights

Zadnje objave