Qwen3

Alibaba je pravkar predstavil družino modelov umetne inteligence Qwen3.

Po prvih primerjalnih testih so nekatere različice že presegle OpenAI in Google pri kritičnih testih.

modeli Qwen3 imajo od 0,6B do 235B parametrov in podpirajo 119 jezikov.
so “hibridni” modeli, ki lahko po potrebi poglobljeno razmišljajo ali se hitro odzovejo pri preprostejših nalogah
Nekateri uporabljajo arhitekturo Mixture of Experts (MoE) za hitrejše in učinkovitejše reševanje problemov
Vodilni model, Qwen-3-235B-A22B, je v primerjalnih testih kodiranja in matematike premagal o3-mini podjetja OpenAI in Googlov Gemini 2.5 Pro
Čeprav največji model še ni javen, je Qwen3-32B odprt in že tekmuje z vodilnimi modeli, kot je DeepSeek R1
Modeli Qwen3 so usposobljeni na 36 bilijonih žetonov, vključno z učbeniki, pari za preverjanje kakovosti, kodo in vsebinami, ki jih ustvarja umetna inteligenca
Na voljo za prenos na straneh Hugging Face, GitHub in prek ponudnikov storitev v oblaku, kot sta Fireworks AI in Hyperbolic

Zadnje objave