Alibaba je pravkar predstavil družino modelov umetne inteligence Qwen3.
Po prvih primerjalnih testih so nekatere različice že presegle OpenAI in Google pri kritičnih testih.
- modeli Qwen3 imajo od 0,6B do 235B parametrov in podpirajo 119 jezikov.
- so “hibridni” modeli, ki lahko po potrebi poglobljeno razmišljajo ali se hitro odzovejo pri preprostejših nalogah
- Nekateri uporabljajo arhitekturo Mixture of Experts (MoE) za hitrejše in učinkovitejše reševanje problemov
- Vodilni model, Qwen-3-235B-A22B, je v primerjalnih testih kodiranja in matematike premagal o3-mini podjetja OpenAI in Googlov Gemini 2.5 Pro
- Čeprav največji model še ni javen, je Qwen3-32B odprt in že tekmuje z vodilnimi modeli, kot je DeepSeek R1
- Modeli Qwen3 so usposobljeni na 36 bilijonih žetonov, vključno z učbeniki, pari za preverjanje kakovosti, kodo in vsebinami, ki jih ustvarja umetna inteligenca
- Na voljo za prenos na straneh Hugging Face, GitHub in prek ponudnikov storitev v oblaku, kot sta Fireworks AI in Hyperbolic