vir: https://www.anthropic.com/news/claude-sonnet-4-6
-
Sonnet 4.6 je nova privzeta različica modela Claude Sonnet z bistveno boljšim kodiranjem, računalniško uporabo, dolgoročnim razmišljanjem in 1M tokenskim kontekstom (beta), pri enaki ceni kot Sonnet 4.5.
-
Po internih in zunanjih evalvacijah Sonnet 4.6 v številnih nalogah dosega ali presega zmogljivost modela Opus 4.5/4.6, zlasti pri pisarniških opravilih, računalniški uporabi in kompleksnem kodiranju.
-
V benchmarkih, kot so OSWorld, Vending‑Bench Arena in OfficeQA, model kaže velike skoke v računalniški uporabi, dolgoročnem načrtovanju in razumevanju dokumentov, ob boljših varnostnih lastnostih in odpornosti na prompt injection.
-
Zmogljivosti za razvijalce vključujejo podporo za adaptive/extended thinking, avtomatsko kompakcijo konteksta ter razširjeno orodjarno (web search/fetch, code execution, memory, programmatic tool calling, tool search) na API‑ju in Developer Platform.
-
Sonnet 4.6 je na voljo v vseh Claude paketih (vključno z brezplačnim), v Claude Cowork/Code, na glavnih cloud platformah in integracijah (npr. Excel z MCP konektorji), pri čemer Opus 4.6 ostaja izbira za najzahtevnejše naloge z najglobljo stopnjo razmišljanja.
DEJSTVA
-
Datum izdaje: 17. februar 2026; Sonnet 4.6 postane privzeti model za Free in Pro uporabnike na claude.ai in Claude Cowork, pri cenah od 3/15 USD na milijon žetonov (vhod/izhod).
-
Kontekstno okno: 1M žetonov (beta), namenjeno celotnim kodnim bazam, dolgim pogodbam ali več deset raziskovalnim člankom v eni zahtevi z učinkovitim razmišljanjem čez celoten obseg.
-
Računalniška uporaba: opazen napredek na OSWorld/OSWorld‑Verified; zgodnji uporabniki poročajo o skoraj človeški ravni pri delu s kompleksnimi preglednicami in več koraki v spletnih obrazcih.
-
Varnost: obsežne varnostne evalvacije kažejo, da je Sonnet 4.6 enako ali bolj varen od nedavnih Claude modelov, z “toplim, poštenim in prosocialnim” karakterjem ter izboljšano odpornostjo na prompt injection.
-
Sprejetje pri strankah: partnerji kot Databricks, Replit, GitHub, Box, Pace, Rakuten in drugi poročajo o boljšem razmerju zmogljivost/cena, večji natančnosti v svojih domenah in manjšem številu potrebnih iteracij do produkcijske kakovosti.