• Podjetje Anthropic je pravkar predstavilo Claude Opus 4 in Claude Sonnet 4. Ta nova modela ne izboljšujeta le svojih predhodnikov, temveč nameravata na novo opredeliti, kaj je mogoče pri kodiranju, sklepanju in delovnih postopkih agentov.
  • Claude Opus 4 je zdaj najboljši model za kodiranje, ki je na voljo, in vodi v primerjalnih testih, kot sta SWE-bench (72,5 %) in Terminal-bench (43,2 %).
  • Več ur lahko izvaja osredotočena opravila in obvladuje zapletene delovne postopke, ki so bili prej nedosegljivi za umetno inteligenco.
  • Claude Sonnet 4 je velika nadgradnja različice 3.7, saj se v testu SWE-bench (72,7 %) kosa z Opusom in blesti v natančnosti, nadzoru in praktičnih namestitvah.
  • Oba modela zdaj podpirata razširjeno razmišljanje z uporabo orodij, kar jima omogoča, da izmenično uporabljata razmišljanje in zunanja orodja, kot je spletno iskanje.
  • Orodja lahko uporabljajo vzporedno in dostopajo do lokalnih datotek za ustvarjanje spomina, kar jim omogoča ohranjanje konteksta pri dolgih projektih.
  • Claude Code je uradno izšel iz beta različice z globoko integracijo IDE in nalogami v ozadju prek GitHub Actions.

Clot 4 je uradno na voljo, kar predstavlja prvo pomembno posodobitev od izida Claude 3 marca 2024, ki je med uporabniki in razvijalci vzbudil veliko navdušenja. Ta nova zbirka modelov vključuje visoko cenjeni Claude Opus 4, ki velja za najnaprednejši model kodiranja, ki je trenutno na voljo, in Claude Sonnet 4, ki ponuja znatne izboljšave v primerjavi s svojim predhodnikom, Claude 3.7. Družina Claude je razdeljena na stopnje, in sicer Haiku, Sonnet in Opus, pri čemer vsaka nova različica obljublja še večje zmogljivosti kot prejšnja, zlasti z novim spletnim iskanjem in razširjenimi funkcijami razmišljanja, ki modelom omogočajo dostop do najnovejših informacij in učinkovitejše razmišljanje o poizvedbah. V spodnjem videu  podrobno primerja zmogljivosti najnovejših modelov Claude in drugih vodilnih konkurentov, kot sta Gemini 2. 5 Pro in ChatGPT, pri čemer poudarja, da Claude Opus 4 izstopa v nalogah programskega inženirstva in razmišljanja, hkrati pa ponuja večstopenjski cenovni model, kjer je osnovni dostop do Claude Sonnet 4 brezplačen, medtem ko je Opus 4 na voljo za doplačilo, ki se začne pri 20 dolarjih na mesec; recenzent namerava predstaviti zmogljivosti modelov s pomočjo različnih testov, vključno z zanimivim izzivom kodiranja, osredotočenim na spreminjanje gibov šahovskih figur.