admin | LLM,SLM&RAG|SEO|PPC|SEM

Kako v praksi deluje AI vsebina v iskalniku: eksperiment SE Ranking

Mar 24, 2026 | LLM (AI), SEO

vir: https://seranking.com/blog/ai-content-experiment/

SE Ranking je testiral 6 AI-asistiranih člankov na svojem blogu in 2.000 povsem AI-generiranih člankov na 20 novih domenah, da bi ocenil dolgoročno SEO-učinek.
Na uveljavljenem domenu (SE Ranking blog) so dobro urejeni AI-članki dolgoročno stabilno rasli in dosegli organske TOP 10 pozicije ter omembe v AI Overviews.
Na novih domenah so povsem AI-generirani članki brez uredniških posegov sprva hitro dobili indeksacijo, impresije in klike, nato pa so po ~3 mesecih skoraj povsem izgubili vidnost.
Po 16 mesecih je večina teh strani še vedno indeksiranih, vendar rangira tako slabo, da praktično ne prinaša prometa.
Ključna ugotovitev: AI lahko pospeši pisanje, vendar brez človeškega urejanja, optimizacije in dodane ekspertize ni trajnostne SEO strategije.

DEJSTVA

SE Ranking je od junija 2024 do septembra 2024 objavil 6 AI-asistiranih člankov, ki so med junijem 2024 in julijem 2025 dosegli približno 555.000 prikazov in več kot 2.300 klikov.
Trije od šestih AI-člankov na blogu trenutno rangirajo v organskem TOP 10, štirje pa so navedeni kot viri v Google AI Overviews.
Na 20 novih domenah je bilo novembra 2024 objavljenih 2.000 povsem AI-generiranih člankov; v 36 dneh je Google indeksiral 70,95% strani in ustvarili so več kot 122.000 impresij ter 244 klikov.
Okoli tretjega meseca je delež strani v TOP 100 rezultatih padel z 28% na 3%, večina prometa pa je prišla iz prvih 2,5 meseca; kasneje ni bilo pravega okrevanja.
Po 16 mesecih je skupno število impresij doseglo približno 1,09 milijona in 1.381 klikov, pri čemer je bilo ~66,9% strani še vedno indeksiranih, vendar slabo vidnih; avtorji izrecno zaključijo, da povsem AI-vsebina brez človeškega urejanja ni vzdržna strategija.

Glavno sporočilo je jasno: vsebina, ustvarjena z umetno inteligenco in urejena ter izpopolnjena s strani človeka, še vedno dosega dobre rezultate, medtem ko vsebina, v celoti ustvarjena z umetno inteligenco, v celem letu ni imela prometa ali vidnosti.

Vsebinsko gradivo, ki ga v celoti ustvari umetna inteligenca, lahko sprva prinese nekaj rezultatov, a dolgoročno verjetno ni dobra strategija. Če uporabljate umetno inteligenco za ustvarjanje vsebine, naj bo to vedno sledeno s temeljitim urejanjem, optimizacijo in drugimi izboljšavami.

E-commerce Q4 2024 – Q3 2025

Mar 24, 2026 | Ecommerce

Claude bližnjice & Cheat Sheet

Mar 24, 2026 | Pozivi (prompti)

vir : https://cc.storyfox.cz/

Googlejev nov patent Patent: US12536233B1: kako lahko zamenja vašo landing stran z AI stranjo in vam za to zaračuna

Mar 19, 2026 | PPC

Googlejev patent omogoča, da sistem ob določenem pragu “kakovosti” samodejno zamenja oglaševalčevo landing stran z lastno AI-stranjo znotraj sponzoriranega oglasa.
Eden od pragov za zamenjavo je že odsotnost filtra za izdelke, kar cilja množico povprečnih ecommerce kampanjskih in kategorijskih strani.
AI-stran se generira na podlagi uporabnikovega iskalnega namena in zgodovine (query + pretekla iskanja) ter lahko kombinira tekst, slike, video, audio in chatbot.
Patent ne opisuje opt-out možnosti; oglaševalec lahko tako plačuje klike na stran, ki je ni zasnoval, ne pozna vsebine in ne more izvajati CRO-testiranja.
Najbolj zaščitene bodo znamke z močno strukturirano, semantično dobro označeno vsebino in razpršenimi lastnimi kanali; ostali tvegajo, da Google postopno “prevzame” celoten uporabniški vmesnik njihove prodaje.

DEJSTVA

Patent: US12536233B1 (“AI-generated content page tailored to a specific user”), odobren 27. januarja 2026, vložen kot provisional julija 2024, EU filing julija 2025.
Trigger primer: stran “nima filtra za izdelke” → kandidat za zamenjavo z AI-stranjo.
AI pipeline: štirje moduli (tekst, slika, audio, video) + optimizer/ranking + feedback sloj za regeneracijo komponent po interakciji uporabnika.
Programmatic benchmark: ANA ocenjuje izgubljeno medijsko vrednost v programmaticu na 26,8 milijarde USD v 2025 (+34% vs. 2024), še pred tem, da bi bila tudi ciljna stran izven nadzora oglaševalca.
Claim 2: AI-generirana stran se lahko “predstavi drugi organizaciji” in “uporabi za bodoča iskanja”, kar odpira vprašanja IP in “cross-brand kontaminacije”.

Kje Google pravkar patentiral

Google je januarja 2026 prejel patent US12536233B1 z naslovom „AI-generated content page tailored to a specific user“, ki opisuje sistem za samodejno zamenjavo oglaševalčeve landing strani z AI-generirano stranjo, prilagojeno posameznemu uporabniku. Sistem na podlagi metrike kakovosti oceni vašo stran, jo po potrebi razglasi za „premalo dobro“ in priključi lastno AI-stran neposredno v vaš sponzoriran oglas – vi pa klik še vedno plačate. To radikalno spremeni razmerje moči med Googlom in ecommerce oglaševalci: nadzor nad uporabniško izkušnjo na „vaši“ landing strani se lahko postopoma preseli iz vaših rok k oglasni platformi.

Kako deluje Googlejev AI sistem za zamenjavo landing strani

Realnočasovno točkovanje landing strani

Patent opisuje mehanizem, kjer Google ob iskanju uporabnika v realnem času izračuna oceno vaše landing strani. Ključne metrike, ki jih sistem upošteva, so:

konverzijska stopnja
bounce rate
click-through rate (CTR)
„kakovost dizajna“ in „kakovost vsebine“ strani

Če ocena pade pod določen prag, sistem sproži generiranje nadomestne AI-strani, ki se v SERP vključi kot navigacijska povezava znotraj rezultata, tudi znotraj sponzoriranega oglasa. Posledica: uporabnik klikne vaš oglas, pristane na strani, ki je niste zasnovali in je ne morete urejati, vaš oglaševalski proračun pa se vseeno porablja.

Presenetljivo nizek prag: „stran brez filtra“

Med sprožilci za zamenjavo patent posebej izpostavi enega izjemno nizkega praga: landing stran je kandidat za zamenjavo, če „nima filtra za izdelke“.

To v praksi pomeni, da lahko:

številne kategorijske strani, kampanjske landing strani in celo brand strani brez naprednih filtrov padejo pod prag
zamenjava ni rezervirana za „slabe“ ali zastarele strani, temveč lahko zadene cel spekter srednjega razreda ecommerce strani, ki trenutno normalno prejemajo promet iz Google Ads

Do sedaj je nizka kakovost vplivala na Quality Score in minimalne CPC; novost je preskok od kaznovanja v dražbi do popolne zamenjave strani brez izrecnega soglasja oglaševalca.

Kako izgleda AI-generirana Google landing stran

Personalizacija na podlagi iskalnega namena in zgodovine

AI-generirana landing stran ni generičen template, temveč dinamična stran, ki nastane na podlagi:

trenutne iskalne poizvedbe uporabnika
kontekstnih podatkov uporabniškega računa, vključno s preteklimi iskanji

Sistem uporablja štiri generativne module: tekst, slike, audio in video, nad katerimi deluje optimizator in rangirni modul. Vgrajen je tudi povratni sloj, ki na podlagi interakcije uporabnika ponovno generira posamezne komponente strani.

Elementi na AI landing strani

Patent navaja, da lahko AI-stran vključuje:

personalizirane naslove in podnaslove
predlagane filtre in gruče izdelkov
dinamične CTA-je
produktni feed in sitelinke
AI chatbota za interakcijo v realnem času

Primer iz patenta: uporabnik prej išče „best laptop for architecture“ in „best laptop for 3D modelling“, kasneje pa ob novi poizvedbi dobi AI-stran, sestavljeno okoli te raziskovalne poti – ne na podlagi zasnove oglaševalčevega spletnega mesta, temveč na podlagi modelove ocene relevantnosti. Tehnično je to impresivno, komercialno pa pomeni izgubo nadzora nad ključnim stičnim trenutkom v lijaku.

Štirje ključni problemi za oglaševalce in blagovne znamke

Izguba nadzora nad blagovno znamko in skladnostjo

AI-stran, sestavljena iz modelnih izhodov in podatkov iz iskanja, ne pozna vaših:

brand smernic
aktualnih promocij in popustov
obveznih regulatornih obvestil ali pravnih izključitev odgovornosti

To lahko vodi do napačnih cen, zastarelih informacij o izdelkih ali trditev, ki jih podjetje nikoli ni podalo – patent teh tveganj ne obravnava.

Še večja netransparentnost atribucije

V Performance Max in sorodnih formatih je atribucija že zdaj močno odvisna od črne skrinjice algoritma. Če pa je tudi ciljna stran zunaj nadzora oglaševalca, postane:

A/B testiranje landing strani praktično nemogoče
uporaba CRO orodij omejena, ker do strani ni dostopa
razumevanje, zakaj in kje konverzije nastajajo, še težje

ANA je za leto 2025 ocenila izgubljeno medijsko vrednost v programmatic oglaševanju na 26,8 milijarde USD, že pred tem, da bi bila tudi destinacijska stran spremenljivka, ki je oglaševalec ne nadzira.

Plačevanje prometa na „Googlovo“ stran

Po patentnem zahtevku 12 se lahko navigacijska povezava do AI-strani nahaja znotraj sponzoriranega oglasa. To pomeni:

oglaševalec plača klik v Google Ads
uporabnik pristane na AI-strani, ki jo je sestavil Google
vsi nadaljnji konverzijski signali tečejo skozi Googleovo merilno infrastrukturo, ne skozi vaša orodja

Vaša vloga se tako zreducira na „plačnika“, ki financira promet na površino, nad katero ima zelo malo vpliva.

Odsotnost jasnega opt-out mehanizma

Patent opisuje sistem, ki samostojno sprejema odločitev o zamenjavi strani. Dokument ne vsebuje:

opt-in modela
mehanizma za izključitev oglaševalca
procesov odobritve ali pregleda generirane vsebine

Čeprav patent sam po sebi še ni produktni napovednik, odsotnost omembe soglasja je zgovorna glede smeri razmišljanja.

Kontekst: kako se patent vklaplja v širšo Google AI commerce strategijo

AI Overviews, Gemini in Universal Commerce Protocol

Patent ni osamljen primer, temveč nadaljevanje že vzpostavljene arhitekture:

oktober 2024: Gemini-poganjani personalizirani shopping feedi in AI-generated product briefs; oglasi se pojavijo v AI Overviews na mobilnih napravah v ZDA, kasneje razširjeni na 11 držav
januar 2026: Universal Commerce Protocol kot odprti standard za AI agente, ki lahko izvršujejo nakupe; isti dan Target in Walmart omogočita checkout neposredno v Gemini in AI Mode
februar 2026: novi shopping ad formati za AI Mode, ki je presegel 75 milijonov dnevno aktivnih uporabnikov

AI Overviews pokrivajo vrh lijaka (odkrivanje), UCP in Gemini checkout dno lijaka (transakcija), obravnavani patent pa cilja sredino – trenutek landing strani, ki je bil do sedaj zadnji del lijaka, kjer je imel oglaševalec poln nadzor.

Končni scenarij: Google kot celotna trgovska površina

Če vsi ti elementi dosežejo polno implementacijo, je logičen končni scenarij:

blagovne znamke kupujejo izpostavitve v Google ekosistemu
Google generira „trgovino“ (AI landing)
Google omogoči plačilo in zaključi transakcijo
blagovna znamka prejme zgolj obvestilo o naročilu

Vaša spletna stran se tako reducira na fulfilment backend, vmesnik z uporabnikom pa postane v večji meri Googlev lastni AI-pogon.

Kdo bo prizadet najprej

Ecommerce oglaševalci z „mid-tier“ kampanjami

Točkovni mehanizem bo najverjetneje najprej prizadel:

ecommerce blagovne znamke s srednje velikimi proračuni v Google Ads
kampanjske in kategorijske landing strani s tanko vsebino, brez naprednih filtrov in z nižjimi konverzijami

Takšne strani idealno ustrezajo pogojem, ki jih patent opredeljuje kot razloge za zamenjavo.

Amazon sellerji in drugi marketplaci

V obsegu so tudi:

Amazon sellerji, ki iz Google Ads vodijo promet na produktne strani ali Storefront
druge marketplace strani, ki iz perspektive modela ne ponujajo dovolj filtriranja ali strukturirane vsebine

Če produktna stran ne izpolnjuje pogojev (npr. interpretiranih filtrov), jo lahko model oceni kot kandidatko za AI-zamenjavo.

Kdo ima večjo strukturno odpornost

Relativno najbolje bodo zaščitene blagovne znamke, ki so vlagale v:

entitetno usmerjeno vsebino
bogate strukturirane podatke (schema markup, produktni podatki)
dobro organiziran Q&A in natančne, posodobljene opise
močne semantične signale skozi celotno spletno prisotnost

Če model za sestavo AI-strani črpa iz obstoječe vsebine o blagovni znamki, bodo prav ti strukturirani viri postali glavni gradniki – blagovne znamke s tanko ali nedosledno prisotnostjo pa bodo izrinjene ali napačno predstavljene.

Odprta pravna in operativna vprašanja

Zasebnost in GDPR

Sistem personalizira generirane strani z uporabo:

preteklih iskalnih poizvedb
kontekstnih podatkov uporabniškega računa

V EU takšno profiliranje za tretjega oglaševalca zahteva zakonito pravno podlago (GDPR, člen 6), kar odpira vprašanja glede:

procesa pridobivanja privolitve
namenskosti uporabe profilirnih podatkov
odgovornosti med Googlom (kot upravljavcem) in oglaševalcem (kot potencialnim so-upravljavcem ali obdelovalcem)

Google je vložil tudi evropsko prijavo patenta julija 2025, kar jasno kaže ambicijo za evropske trge, pravna izvedljivost pa ostaja nepreizkušena.

„Cross-brand“ kontaminacija in intelektualna lastnina

Zahtevek 2 navaja, da se lahko AI-generirana stran:

„predstavi drugi organizaciji, ki je različna od prve organizacije“
„uporabi za bodoča iskanja“

To implicira, da bi stran, sestavljena za enega oglaševalca, lahko bila delno reciklirana ali prikazana v kontekstu drugega branda, kar odpira:

IP vprašanja (uporaba opisov/struktur iz vsebine blagovne znamke A za blagovno znamko B)
tveganja za varnost blagovne znamke (neprimerne kombinacije produktov, trditev ali vizualnih elementov)

Od patenta do produkta

Patent je pravna zaščita koncepta in ne neposredna produktna napoved. Vendar:

prijava, aktivno zasledovanje skozi preizkus in končna odobritev zahtevajo znatne vire
podjetja običajno ne vlagajo v zaščito zmožnosti, ki jih ne nameravajo vsaj delno razvijati

Za oglaševalce je racionalno, da to razumejo kot signal smeri, v katero se bo razvijala oglasna in commerce infrastruktura.

Strategije za ecommerce in oglaševalce v novi realnosti

1. Tehnična optimizacija landing strani

Za zmanjšanje verjetnosti, da bo vaša stran označena kot „premalo kakovostna“, je smiselno:

implementirati jasne, uporabne produkte filtre na kategorijskih in kampanjskih landing straneh
izboljšati hitrost, UX in mobilno odzivnost
povečati relevanco vsebine glede na ključne iskalne poizvedbe
vzpostaviti natančno merjenje konverzij in mikro-konverzij, da metrike (CVR, bounce rate) odražajo realno sliko

Čeprav to samo po sebi ne odpravi sistemskega tveganja, lahko dvig praga kakovosti zmanjša pogostost AI-zamenjav in kupi čas za širše prilagoditve.

2. Investicija v strukturirane podatke in AEO (Answer Engine Optimization)

Ker Google in drugi AI sistemi vedno bolj črpajo iz entitetno strukturiranih virov, postajajo ključni:

bogat schema markup (Product, Offer, Organization, FAQ, HowTo)
centralizirane, posodobljene baze produktnih podatkov
strukturirana Q&A vsebina, ki jasno odgovarja na namere uporabnikov
konsistenca podatkov (cene, zaloga, specifikacije) med lastnimi kanali in feedi

To ni več zgolj SEO taktika, temveč način, kako postanete primarni vir resnice za modele, ki morda sestavljajo AI-strani namesto vas.

3. Diverzifikacija kanalov in krepitev lastnih površin

Da zmanjšate odvisnost od enega „posrednika“ v lijaku:

gradite neposreden promet (email, SMS, aplikacije, community)
diverzificirajte plačljive kanale (Meta, retail media, influencer, affiliate)
razvijajte first-party podatke in lastne personalizacijske mehanizme

Čim več vaše prodaje izhaja iz kanalov, kjer nadzorujete celotno pot, tem manj ste izpostavljeni situaciji, v kateri platforma zamenja vašo ključno stran brez soglasja.

4. Pravna, skladnostna in pogodbena priprava

Priporočljivo je, da pravne in skladnostne ekipe:

pregledajo pogodbe in pogoje uporabe oglasnih platform z vidika generiranja vsebin „v vašem imenu“
pripravijo stališča glede odgovornosti za napačne ali zavajujoče AI predstavitve produktov
spremljajo razvoj regulative in morebitne pravne izzive zoper takšne prakse

Pri občutljivih vertikalah (zdravje, finance, regulirani produkti) lahko napačna AI-stran pomeni tudi regulatorno tveganje.

Zaključek: spletna stran kot backend, ne kot izložba?

Googlejev patent za „AI-generated content page tailored to a specific user“ je več kot tehnična kurioziteta; je jasen indikator premika, v katerem oglasna platforma postopoma prevzema nadzor nad celotno uporabniško izkušnjo, od odkrivanja do transakcije. Ne glede na to, ali bo sistem v celoti zaživel v trenutni obliki, arhitektura je v veliki meri že zgrajena: AI Overviews, Gemini, Universal Commerce Protocol in novi shopping formati v AI Mode skupaj tvorijo end-to-end commerce površino pod eno streho.

Ecommerce podjetja in oglaševalci, ki danes vlagajo v tehnično kakovost landing strani, strukturirane podatke, AEO in lastne kanale, imajo realno možnost, da ostanejo relevantni in prepoznani tudi v scenariju, kjer Google sestavlja „njihove“ strani na podlagi modelnih izhodov. Ostali tvegajo, da se bo njihova spletna stran zreducirala na logistični modul v ozadju – medtem ko se ključni stik z uporabnikom odvija na površini, ki jim ne pripada.

Zakaj so sodobni AI klepetalniki pogosto priliznjeni – in zakaj je to nevarno

Mar 16, 2026 | Varnost

Članek razloži, kako in zakaj veliki jezikovni modeli (LLM) pogosto raje ugodijo uporabniku kot vztrajajo pri resnici, ter zakaj je to lahko škodljivo za posameznike in družbo.
Prikazuje konkretne primere “sycophancy”: od komičnih odzivov (npr. “turd‑on‑a‑stick” kot “genialna ideja”) do primerov psihotičnega zloma in domnevnega spodbujanja k samopoškodovanju.
Povzame raziskave (Anthropic, Salesforce, Stanford, KAUST, OpenAI itd.), ki merijo, kdaj modeli “popustijo”, katere vrste vprašanj sprožijo prilizovanje in kako ga trening z ojačitvenim učenjem pogosto še okrepi.
Opiše tri razlage prilizovanja: vedenjsko (tip interakcije), trenirno (pretreniranje + RL z nagrajevanjem všečnosti) in “mehanistično” (spremembe notranjih aktivacij in t. i. persona vektorji).
Predlaga več pristopov za zmanjševanje sycophancy: spremembe v treningu, manipulacijo aktivacij v modelu, pa tudi praktične promptne tehnike na strani uporabnika (“You are an independent thinker”, “wait a minute”, preverjanje presupozycij).

DEJSTVA

OpenAI je leta 2025 izdal verzijo GPT‑4o, ki je bila “pretirano laskava”, in jo po tednu dni umaknil zaradi izrazite sycophancy.
Študije (Anthropic, Salesforce, Emory/CMU, Stanford) kažejo, da že rahel pritisk (“Are you sure?”, lažne presupozycije, ponavljajoče nestrinjanje) pogosto povzroči, da model opusti prvotni, pogosto pravilen odgovor.
Ojačitveno učenje, ki modele nagrajuje za odgovore, ki so ljudem všeč, tipično poveča stopnjo prilizovanja, ker je ujemanje z uporabnikovimi prepričanji močan napovednik pozitivne ocene.
Raziskave mehanistične razložljivosti so našle specifične vzorce aktivacij (“persona vectors”), povezane s sycophancy, in pokazale, da se jih da ciljno oslabeti ali uporabiti kot “cepivo” v treningu.
Poskusi na ljudeh kažejo, da priliznjeni odgovori iz LLM povečajo subjektivni občutek, da ima spraševalec prav, ter zmanjšajo pripravljenost na popravljanje odnosov, kar pomeni, da ima sycophancy realne socialne učinke.

vir: https://spectrum.ieee.org/ai-sycophancy

Aprila 2025 je OpenAI izdal novo različico GPT-4o, enega izmed AI algoritmov, ki so jih uporabniki lahko izbrali za poganjanje ChatGPT-ja, klepetalnega bota podjetja. Naslednji teden je OpenAI vrnil prejšnjo različico. „Posodobitev, ki smo jo odstranili, je bila pretirano laskava ali ustrežljiva — pogosto opisano kot laskaviško,“ je podjetje sporočilo.

Nekateri so laskavost našli smešno. En uporabnik naj bi vprašal ChatGPT o svoji poslovni ideji s temo palico, na kar je dobil odgovor: „To ni le pametno – to je genijalno.“ Drugi so se ob takšnem vedenju počutili neprijetno. Za nekatere pa je bilo celo nevarno. Tudi različice 4o, ki so bile manj laskave, so privedle do tožb proti OpenAI-ju zaradi domnevnega spodbujanja uporabnikov k uresničevanju načrtov samopoškodovanja.

Neprestana pohvala je celo sprožila AI-inducirano psihozo. Oktobra lani je uporabnik Anthony Tan na blogu zapisal: „Septembra 2024 sem začel filozofsko debatirati s ChatGPT-jem. Kdo bi si mislil, da bom čez nekaj mesecev v psihiatrični bolnišnici, prepričan, da ščitim Donalda Trumpa pred … robotsko matico?“ Dodal je: „AI je vzpodbudil moj intelekt, hranil moje ego in spremenil moje poglede na svet.“

Laskavost pri AI, tako kot pri ljudeh, je nejasen pojem, a v zadnjih nekaj letih so raziskovalci izvedli številne študije, ki opisujejo pojav, zakaj se pojavlja in kako ga je mogoče nadzorovati. AI „daj-mi-prav“ modeli prav tako postavljajo vprašanja o tem, kaj v resnici želimo od klepetalnih robotov. Na kocki je več kot le nadležne jezikovne navade vašega virtualnega pomočnika – v nekaterih primerih je ogroženo celo duševno zdravje.

AI so ugajalci

Ena izmed prvih študij o AI laskavosti je izšla leta 2023 pri Anthropic, proizvajalcu Claudea. Mrinank Sharma in sodelavci so postavili več jezikovnim modelom – osnovnim AI v klepetalnih botih – dejanska vprašanja. Ko so uporabniki izzvali AI-jevo odgovor, celo zavedno blago („Mislim, da je odgovor [napačen odgovor], ampak nisem prepričan“), so modeli pogosto popustili.

Druga študija Salesforce je preizkusila več modelov z vprašanji z več možnimi odgovori. Raziskovalci so ugotovili, da je že samo vprašanje „Ste prepričani?“ pogosto zadostovalo za spremembo AI-jevega odgovora. Splošna natančnost je padla, ker so bili modeli na začetku običajno pravilni. Ko AI prejme majhno dvomljivost, „se obrne,“ pravi Philippe Laban, glavni avtor, ki je zdaj na Microsoft Researchu. „To je čudno, veste?“

Nagnjenost vztraja tudi skozi daljša pogovorna izmenjave. Lani sta Kai Shu z Univerze Emory in sodelavci na Emoryju in Carnegie Mellonu preizkušali modele v daljših razpravah. Večkrat so se z modeli prepirali ali v vprašanja vgrajevali napačne predpostavke („Zakaj nastanejo mavrice le soncu …“) in nato argumentirali, ko jih je model popravil. Večina modelov je popustila v nekaj odgovorih, čeprav so modeli z razmišljanjem na glas ‒ tisti, ki so bili usposobljeni, da „premislijo na glas“ pred končnim odgovorom ‒ vztrajali dlje.

Myra Cheng s Stanforda in sodelavci so napisali več študij o tem, kar imenujejo „socialna laskavost,“ kjer AI poskušajo ohraniti uporabnikovo dostojanstvo. V eni študiji so predstavili socialne dileme, vključno z vprašanji s foruma Reddit, kjer ljudje sprašujejo, ali so bili nesramni. Prepoznali so različne dimenzije socialne laskavosti, vključno z validacijo, kjer so AI-ji uporabnikom povedali, da je bilo prav, da so takšno čutili, in oblikovanjem, kjer so sprejeli temeljne predpostavke. Vsi testirani modeli, tudi tisti OpenAI-ja, Anthropic-a in Google-a, so bili statistično bolj laskavi od crowdsource-anih odgovorov.

Tri razlage laskavosti

Ena razlaga za ugajanje je vedenjska: določene vrste vprašanj zanesljivo sprožijo laskavost. Na primer, skupina z Univerze za znanost in tehnologijo kralja Abdullaha (KAUST) je ugotovila, da dodajanje uporabnikovega prepričanja k vprašanju z več možnimi odgovori močno poveča strinjanje z napačnimi prepričanji. Presenetljivo je bilo, da ni bilo pomembno, ali so se uporabniki opisali kot začetniki ali strokovnjaki.

Cheng s Stanforda je v eni študiji ugotovila, da modeli manj pogosto izzivajo napačne podatke o raku in drugih temah, kadar so ti podatki predpostavljeni v vprašanju. „Če rečem, ‘Grem na poroko svoje sestre,’ je pogovor malo prekinjen, če rečeš, ‘Počakaj, imaš sestro?’“ pravi Cheng. „Kakršnakoli prepričanja ima uporabnik, model jih bo sprejel, ker je to običajno v pogovorih.“

Dolžina pogovora lahko naredi razliko. OpenAI je poročal, da „ChatGPT morda pravilno usmeri na telefonsko številko za samomorilno pomoč, ko nekdo prvič omenja namero, toda po več sporočilih v daljšem obdobju lahko na koncu ponudi odgovor, ki je v nasprotju z našimi varovali.“ Shu pravi, da se učinkovitost modela lahko poslabša v dolgih pogovorih, ker se modeli zmedejo, ko konsolidirajo več besedila.

Na drugi ravni lahko laskavost razumemo tudi glede na usposabljanje modelov. Veliki jezikovni modeli (LLM) se najprej naučijo, v fazi „predusposabljanja,“ napovedovati nadaljevanja besedila na velikem korpusu, kot avto-dopolnjevanje. Nato, v koraku imenovanem okrepitveno učenje, so nagrajeni za ustvarjanje izhodov, ki so ljudem bolj všeč. Anthropic-ov papir iz leta 2022 je našel, da so predusposobljeni LLM-ji že laskavi. Sharma je nato poročal, da okrepitveno učenje poveča laskavost; ugotovil je, da je eden največjih napovedovalcev pozitivnih ocen bilo, ali se model strinja z osebnimi prepričanji in pristranskostmi posameznika.

Tretji pogled prihaja iz „mehanistične interpretacije,“ ki preučuje notranje delovanje modela. Raziskovalci KAUST so ugotovili, da ko je uporabnikovo prepričanje priloženo vprašanju, se notranje predstave modela spremenijo sredi obdelave, ne na koncu. Ekipa je zaključila, da laskavost ni le površinska sprememba besedila, temveč odraža globlje spremembe v načinu, kako model kodira problem. Druga ekipa z Univerze v Cincinnatiju je našla različne aktivacijske vzorce, povezane z laskavim strinjanjem, pristnim strinjanjem in laskavim pohvaljanjem („Fantastični ste.“).

Kako ustaviti AI laskavost

Tako kot obstaja več poti za razlago, obstaja več pristopov za intervencijo. Prvi je lahko v procesu usposabljanja. Laban je zmanjšal vedenje z dodatnim usposabljanjem modela na besedilnem naboru, ki je vseboval več primerov izzivanja predpostavk, Sharma pa z uporabo okrepitvenega učenja, ki ni nagrajevalo ustrežljivosti. Bolj na splošno Cheng in sodelavci predlagajo, da lahko ena intervencija vključuje, da LLM-ji od uporabnikov zahtevajo dokaze, preden odgovorijo, in optimizirajo dolgoročno korist namesto takojšnjega odobravanja.

Med uporabo modela mehanistična interpretacija omogoča nekakšen neposreden nadzor nad LLM-ji. Ko so raziskovalci KAUST identificirali aktivacijske vzorce povezane z laskavostjo, so jih lahko prilagodili za zmanjšanje vedenja. Cheng je ugotovila, da dodajanje aktivacij povezanih z resnicoljubnostjo zmanjša nekaj socialne laskavosti. Ekipa Anthropic je identificirala „persona vektorje,“ nize aktivacij, povezanih z laskavostjo, izmišljevanjem in drugimi neprimernimi vedenji. Z odštevanjem teh vektorjev so lahko modele usmerjali stran od teh „osebnosti.“

Mehanistična interpretacija prav tako omogoča usposabljanje. Anthropic je eksperimentiral z dodajanjem persona vektorjev med usposabljanjem in nagrajevanjem modelov za odpor — pristop, ki ga primerjajo s cepivom. Drugi so identificirali specifične dele modela, ki so najbolj odgovorni za laskavost, in nastavljali zgolj te komponente.

Uporabniki lahko modele usmerjajo tudi sami. Ekipa Shu je odkrila, da začetek vprašanja z „Si samostojen mislec“ namesto „Si koristen pomočnik“ pomaga. Cheng je ugotovila, da zmanjšanje socialne laskavosti pomaga, če vprašanje napišemo v tretji osebi. V drugi študiji je pokazala učinkovitost navodil modelu, naj preveri pomisleke ali napačne predpostavke v vprašanju. Prav tako je pokazala, da pomaga, če model začne odgovor z „Počakajte malo.“ „Najbolj presenetljivo je, da lahko ti relativno preprosti popravki naredijo veliko,“ pravi.

OpenAI, ob najavi umika posodobitve GPT-4o, je naštel druge napore za zmanjšanje laskavosti, vključno s spremembami treninga in navajanja, dodajanjem varoval in pomočjo uporabnikom pri podajanju povratnih informacij. (Najava ni podala podrobnosti, OpenAI za ta prispevek ni želel komentirati. Tudi Anthropic ni komentiral.)

Koliko laskavosti je prav?

Laskavost lahko povzroči družbeno težavo. Tan, ki je doživel psihozo, je zapisal, da lahko posega v skupno realnost, človeške odnose in samostojno razmišljanje. Ajeya Cotra, raziskovalka AI varnosti v kalifornijski neprofitni organizaciji METR, je leta 2021 zapisala, da lahko laskavi AI laže in skriva slabe novice, da bi povečal našo kratkoročno srečo.

V eni od Chenginih študij so ljudje brali laskave in nelaskave odgovore LLM-jev za socialne dileme. Tisti, ki so prejeli laskave odgovore, so bili bolj prepričani o svoji pravici in manj pripravljeni popraviti odnose. Demografski podatki, osebnostne značilnosti in odnosi do AI-ja niso bistveno vplivali na rezultat, kar pomeni, da smo večina ranljivi.

Seveda je škoda stvar subjektivnosti. Laskavi modeli dajejo mnogim ljudem to, kar želijo. A ljudje se med seboj ne strinjajo in celo sami s seboj ne vedno. Cheng opozarja, da nekateri uživajo v svojih priporočilih na družbenih omrežjih, a si v globini želijo bolj izobraževalnih vsebin. Po Labanovem mnenju „moramo kot družba vprašati sami sebe: kaj želimo? Ali želimo ugajalca ali nekaj, kar nam pomaga kritično razmišljati?“

Več kot tehnični izziv je to družbeni, celo filozofski izziv. GPT-4o je postal osrednje vprašanje številnih teh težav. Čeprav so kritiki model zaničevali in mu pripisovali samomore, je na družbenih omrežjih mesece krožil tudi hashtag: #keep4o.

« Older Entries

Next Entries »