Google uvaja označevanje AI-vsebine (SynthID)

VIR
https://www.link-assistant.com/news/how-google-detects-ai.html

BISTVO

Google DeepMind je razvil SynthID, neviden vodni žig, ki se vgradi v AI-generirano besedilo, slike, video in zvok ter omogoča zanesljivo strojno zaznavo izvora vsebine.
Vodni žig ni v metapodatkih, temveč v sami vsebini, zato preživi običajne obdelave (obrezovanje, kompresija, zaslonski posnetki, blagi filtri) in se ga z “casual” urejanjem ne da odstraniti.
Glavni motiv za zaznavanje AI ni neposredno kaznovanje v iskanju, temveč preprečevanje “model collapse” – degradacije prihodnjih modelov, ko se ti učijo na AI-izpisih namesto na človeških podatkih.
Za SEO je ključno uporabljati AI za raziskavo, osnutke in pospešitev dela, nato pa v vsebino vgraditi lastne podatke, izkušnje in specifične vpoglede, ki jih AI ne more ponoviti.
Spletni založniki lahko tehnično zmanjšujejo zaznavnost vodnih žigov (močno prepisovanje, prevajanje, regeneracija z drugimi modeli), vendar to ne rešuje bistva: ali je vsebina dovolj uporabna, citabilna in vredna povezav.

DEJSTVA

Google poroča, da je bilo v začetku 2026 z SynthID označenih že več kot 10 milijard kosov vsebine v njihovih AI-orodjih (Gemini, Imagen, Lyria, Veo).
V koaliciji C2PA za standard “Content Credentials” sodeluje več kot 200 organizacij, med drugim Microsoft, Adobe, OpenAI, Meta, BBC in Amazon.
Raziskava v reviji Nature kaže, da treniranje modelov pretežno na AI-generiranih podatkih vodi v degenerativni učinek (model collapse), kjer se izhodi postopno odmikajo od realnosti.
Študija princetonskih raziskovalcev ugotavlja, da dodajanje statistik in citiranih virov lahko poveča “AI citation rate” vsebine za približno 30–40%.
Test 14 komercialnih AI-detektorjev leta 2023 ni pokazal niti enega orodja z vsaj 80% natančnostjo, pri čemer so nekateri pogosto označili človeško besedilo kot AI.

CITATI

“SynthID is a watermarking technology developed by Google DeepMind. It embeds an invisible digital watermark into AI-generated content.”
“The watermark isn’t stored in removable metadata — it’s embedded in the content itself.”
“AI models learn from data scraped from the internet. As more and more of that internet gets filled with AI-generated content, future models increasingly end up training on AI outputs rather than human writing.”
“Stop using AI for content entirely? No. That’s not the takeaway.”
“Passing a detector and being worth citing are two different problems, and the second one is harder to game.”

Zadnje objave