Sistemska kartica predstavlja modela Claude Fable 5 in Claude Mythos 5, pri čemer je Mythos 5 zmogljivejša in manj omejena različica za zaupanja vredne partnerje, Fable 5 pa splošno dostopna različica z dodatnimi varovalkami za biologijo, kemijo in kibernetsko varnost.
BISTVO
-
Dokument je sistemska kartica z datumom 9. junij 2026 in opisuje dve konfiguraciji istega novega velikega jezikovnega modela podjetja Anthropic.
-
Claude Mythos 5 je po navedbah dokumenta najbolj zmogljiv model, ki ga je Anthropic doslej treniral, vendar je dostopen le majhnemu krogu preverjenih partnerjev, začetno v okviru Project Glasswing.
-
Claude Fable 5 uporablja iste osnovne uteži modela kot Mythos 5, vendar vključuje dodatne klasifikatorje in preusmeritve, ki omejujejo uporabo v tveganih domenah, zlasti v kibernetski varnosti ter biologiji in kemiji.
-
Glavni poudarki dokumenta so ocene po Responsible Scaling Policy, kibernetske zmogljivosti, varovalke in neškodljivost, agentska varnost, poravnava, dobrobit modela ter splošne zmogljivosti.
-
Splošna ocena dokumenta je, da so katastrofalna tveganja po mnenju Anthropic še vedno nizka, vendar so pri Mythos 5 višja kot pri prejšnjih modelih, zlasti na področju biologije, kemije in kibernetskih zmogljivosti.
DEJSTVA
-
Dokument navaja, da je Fable 5 za splošni dostop, Mythos 5 pa za omejeno uporabo pri preverjenih partnerjih.
-
Pri kemično-bioloških tveganjih Anthropic model Mythos 5 obravnava kot model s sposobnostmi ravni “CB-1”, vendar ne kot model, ki bi presegel prag “CB-2”.
-
V razdelku o biologiji dokument navaja, da sta dve od treh ekip splošnih biologov v eni oceni presegli vse tri ekipe specialistov, ko so uporabljale Mythos 5.
-
Ocenjevalci so zapisali, da bi naloge, za katere so ekipe z Mythos 5 potrebovale 16 ur, brez AI-orodij trajale od 40 do 95 delovnih dni, v povprečju 72,5 dneva.
-
Pri avtomatiziranih viroloških nalogah je Mythos 5 dosegel končni oceni 0,77 in 0,91, pri multimodalni virologiji pa 0,56, kar je nad ekspertno osnovo 0,221.