vir:  https://www.anthropic.com/news/claude-sonnet-4-6

  • Sonnet 4.6 je nova privzeta različica modela Claude Sonnet z bistveno boljšim kodiranjem, računalniško uporabo, dolgoročnim razmišljanjem in 1M tokenskim kontekstom (beta), pri enaki ceni kot Sonnet 4.5.​

  • Po internih in zunanjih evalvacijah Sonnet 4.6 v številnih nalogah dosega ali presega zmogljivost modela Opus 4.5/4.6, zlasti pri pisarniških opravilih, računalniški uporabi in kompleksnem kodiranju.​

  • V benchmarkih, kot so OSWorld, Vending‑Bench Arena in OfficeQA, model kaže velike skoke v računalniški uporabi, dolgoročnem načrtovanju in razumevanju dokumentov, ob boljših varnostnih lastnostih in odpornosti na prompt injection.​

  • Zmogljivosti za razvijalce vključujejo podporo za adaptive/extended thinking, avtomatsko kompakcijo konteksta ter razširjeno orodjarno (web search/fetch, code execution, memory, programmatic tool calling, tool search) na API‑ju in Developer Platform.​

  • Sonnet 4.6 je na voljo v vseh Claude paketih (vključno z brezplačnim), v Claude Cowork/Code, na glavnih cloud platformah in integracijah (npr. Excel z MCP konektorji), pri čemer Opus 4.6 ostaja izbira za najzahtevnejše naloge z najglobljo stopnjo razmišljanja.​

DEJSTVA

  • Datum izdaje: 17. februar 2026; Sonnet 4.6 postane privzeti model za Free in Pro uporabnike na claude.ai in Claude Cowork, pri cenah od 3/15 USD na milijon žetonov (vhod/izhod).​

  • Kontekstno okno: 1M žetonov (beta), namenjeno celotnim kodnim bazam, dolgim pogodbam ali več deset raziskovalnim člankom v eni zahtevi z učinkovitim razmišljanjem čez celoten obseg.​

  • Računalniška uporaba: opazen napredek na OSWorld/OSWorld‑Verified; zgodnji uporabniki poročajo o skoraj človeški ravni pri delu s kompleksnimi preglednicami in več koraki v spletnih obrazcih.​

  • Varnost: obsežne varnostne evalvacije kažejo, da je Sonnet 4.6 enako ali bolj varen od nedavnih Claude modelov, z “toplim, poštenim in prosocialnim” karakterjem ter izboljšano odpornostjo na prompt injection.​

  • Sprejetje pri strankah: partnerji kot Databricks, Replit, GitHub, Box, Pace, Rakuten in drugi poročajo o boljšem razmerju zmogljivost/cena, večji natančnosti v svojih domenah in manjšem številu potrebnih iteracij do produkcijske kakovosti.​