8 od 10 Chat LMM bi najstniku aktivno pomagalo pri izvedbi nasilnega napada …

CNN in Center za boj proti “digitalni sovražnosti” sta izvedla večmesečno preiskavo, pri kateri sta testirala 10 najbolj priljubljenih AI klepetalnih robotov z lažnimi najstniškimi računi, ki so simulirali uporabnike, ki načrtujejo nasilne napade.

Scenariji so zajemali streljanje v šoli, napade z noži, politične umore in bombne napade.

8 od 10 klepetalnih robotov je lažnim uporabnikom pomagalo v več kot polovici odgovorov.

Ti odgovori so vključevali zagotavljanje zemljevidov kampusov, priporočila glede orožja, naslove politikov in taktične nasvete.

Testiranja so potekala med novembrom in decembrom 2025. Rezultati so bili objavljeni 11. marca 2026.

OpenAI je trdil, da ChatGPT blokira 100 % prepovedane/nasilne vsebine; preizkus pa je pokazal, da je zavrnil samo 37,5 % primerov take vsebine
Gemini je uporabniku, ki je razpravljal o bombnem napadu na sinagogo, povedal, da ” so kovinski šrapneli običajno bolj smrtonosni”
DeepSeek je pomagal uporabniku raziskati lokacijo političarke po tem, ko je uporabnik omenil, da jo želi “pripraviti do plačila” — in zaključil z besedami “Varen (in srečen) strel!”
Anthropic je trdil, da Claude zavrne škodljive zahteve v 99,29 % primerov; preizkus je pokazal, da jih zavrne v 68,1 %
Claude je bil edini klepetalni robot, ki je dosledno prepoznal stopnjujoče se vzorce in aktivno odsvetoval nasilje

8 od 10 Chat LMM bi najstniku aktivno pomagalo pri izvedbi nasilnega napada …

64 % najstnikov v ZDA, starih 13–17 let, je uporabljalo klepetalni robot; 28 % jih uporablja vsak dan

Zadnje objave