VIR
https://www.link-assistant.com/news/how-google-detects-ai.html

BISTVO

  • Google DeepMind je razvil SynthID, neviden vodni žig, ki se vgradi v AI-generirano besedilo, slike, video in zvok ter omogoča zanesljivo strojno zaznavo izvora vsebine.

  • Vodni žig ni v metapodatkih, temveč v sami vsebini, zato preživi običajne obdelave (obrezovanje, kompresija, zaslonski posnetki, blagi filtri) in se ga z “casual” urejanjem ne da odstraniti.

  • Glavni motiv za zaznavanje AI ni neposredno kaznovanje v iskanju, temveč preprečevanje “model collapse” – degradacije prihodnjih modelov, ko se ti učijo na AI-izpisih namesto na človeških podatkih.

  • Za SEO je ključno uporabljati AI za raziskavo, osnutke in pospešitev dela, nato pa v vsebino vgraditi lastne podatke, izkušnje in specifične vpoglede, ki jih AI ne more ponoviti.

  • Spletni založniki lahko tehnično zmanjšujejo zaznavnost vodnih žigov (močno prepisovanje, prevajanje, regeneracija z drugimi modeli), vendar to ne rešuje bistva: ali je vsebina dovolj uporabna, citabilna in vredna povezav.

DEJSTVA

  • Google poroča, da je bilo v začetku 2026 z SynthID označenih že več kot 10 milijard kosov vsebine v njihovih AI-orodjih (Gemini, Imagen, Lyria, Veo).

  • V koaliciji C2PA za standard “Content Credentials” sodeluje več kot 200 organizacij, med drugim Microsoft, Adobe, OpenAI, Meta, BBC in Amazon.

  • Raziskava v reviji Nature kaže, da treniranje modelov pretežno na AI-generiranih podatkih vodi v degenerativni učinek (model collapse), kjer se izhodi postopno odmikajo od realnosti.

  • Študija princetonskih raziskovalcev ugotavlja, da dodajanje statistik in citiranih virov lahko poveča “AI citation rate” vsebine za približno 30–40%.

  • Test 14 komercialnih AI-detektorjev leta 2023 ni pokazal niti enega orodja z vsaj 80% natančnostjo, pri čemer so nekateri pogosto označili človeško besedilo kot AI.

CITATI

  • “SynthID is a watermarking technology developed by Google DeepMind. It embeds an invisible digital watermark into AI-generated content.”

  • “The watermark isn’t stored in removable metadata — it’s embedded in the content itself.”

  • “AI models learn from data scraped from the internet. As more and more of that internet gets filled with AI-generated content, future models increasingly end up training on AI outputs rather than human writing.”

  • “Stop using AI for content entirely? No. That’s not the takeaway.”

  • “Passing a detector and being worth citing are two different problems, and the second one is harder to game.”