Zmogljivost in učinkovitost: DeepSeek-R1 je v ključnih testih dosegel rezultate, ki so primerljivi ali celo boljši od modela GPT-3 od OpenAI. Dosegel je visoke rezultate na matematičnih in programerskih izzivih, kar kaže na njegovo vsestranskost in sposobnost sklepanja na različnih področjih.
Inovativna arhitektura: Model DeepSeek-R1 uporablja učinkovito arhitekturo mešanice strokovnjakov (MoE), ki omogoča optimalno obdelavo brez ogrožanja zmogljivosti. Podpira tudi dolge kontekste do 128.000 žetonov (tokenov), kar je idealno za obdelavo obsežnih vnosov.
Stroškovna učinkovitost: DeepSeek-R1 je bistveno cenejši od modela GPT-3 od OpenAI. Osnovne provizije so 27,4-krat cenejše na žeton, poleg tega pa model uporablja sistem predpomnjenja, ki lahko zmanjša stroške ponavljajočih se poizvedb do 90%.
Odprtokodnost: DeepSeek-R1 je na voljo pod odprtokodno licenco MIT, kar omogoča komercialno uporabo, modifikacije in spodbuja sodelovanje ter inovacije na področju umetne inteligence.
Potencial za preoblikovanje trga umetne inteligence: Z učinkovitostjo, zmogljivostjo in dostopnostjo DeepSeek-R1 postavlja nov standard za modele umetne inteligence in lahko vpliva na pristop k lastniškim modelom, kar bo prisililo vodilne v panogi, da ponovno razmislijo o svojih strategijah cen in dostopnosti.
Medtem ko sistemi OpenAI potrebujejo več deset tisoč čipov Nvidia, je DeepSeek svoje delo opravil z le 2.000 čipi. Stroški? Približno 6 milijonov dolarjev v primerjavi z več kot 100-milijonskimi proračuni ameriških podjetij.
Če ga vprašate o temah, kot sta Trg nebeškega miru ali Tajvan ne dobite odgovora. Na 85 % vprašanj o občutljivih temah noče odgovoriti.
Odprtokodna moč: Namesto da bi podjetje DeepSeek svojo tehnologijo skrivalo, jo je naredilo odprtokodno in tako razvijalcem po vsem svetu omogočilo, da gradijo na njihovih orodjih.
Modeli podjetja DeepSeek se dobro odrežejo v primerjalnih testih logike, sklepanja in programiranja. Na Redditu imajo nekateri uporabniki celo raje njegovo preglednost pri prikazovanju miselnega procesa, česar modeli OpenAI nimajo.
V zadnjem času se okoli DeepSeek dviga velik hrup. Ta kitajski LMM model, ki je na voljo v dveh različicah, DeepSeek V3 in R1, trdi, da lahko tekmuje z najboljšimi modeli OpenAI, Google in Meta, hkrati pa je zelo poceni. Govorimo o 1/20 cene. Na prvi pogled se sliši kot zmaga: visokokakovostna umetna inteligenca za delček cene.
Toda če se poglobimo pod površje, stvari postanejo čudne in to zelo hitro.
Cenzura?
DeepSeek se ne izogiba le „spornim“ vprašanjem o Kitajski. Aktivno pozna odgovore, jih zapiše in nato izbriše. Dobesedno. Vprašajte ga o temah, kot so suverenost Tajvana, pokol na Trgu nebeškega miru leta 1989 ali kriza človekovih pravic Ujgurov v Sinkiangu. Začel bo z dejanskim odgovorom, ki bo čez nekaj trenutkov izginil. Kaj se pojavi namesto tega? Neodgovor, kot je: „Oprostite, govorimo o nečem drugem.“
To ni naključje ali programska napaka. Gre za namerno cenzuro. In tu je bistvo, da je popolnoma enostransko. Če vprašate o občutljivih temah v drugih državah, DeepSeek brez težav poda podrobne odgovore. Trg nebeškega miru? Molk. Jallianwala Bagh? Popolna razlaga. To ni nevtralen klepetalni robot, temveč orodje z določenim namenom.
Toda cenzura ni edino vprašanje.
Celotna trditev o „proračunski umetni inteligenci“ ne drži. DeepSeek naj bi stal le 6 milijonov dolarjev. To se sliši impresivno, dokler se ne zavedate, da ima kitajska vlada zaradi sankcij stroge omejitve pri uvozu grafičnih procesorjev. Kako točno so z omejenim dostopom do kritične strojne opreme zgradili najsodobnejši veliki jezikovni model (LLM)? Tudi če bi lahko tu in tam zmanjšali stroške, 6 milijonov dolarjev za model, ki premaga Googlovo in Metino umetno inteligenco? Recimo, da je to težko prodati.
Kaj pa dolgoročna tveganja?
Ko je model umetne inteligence programiran za cenzuro ali subtilno vsiljevanje ideologij, ne gre samo za to, da preskoči sporne odgovore. Oblikuje način razmišljanja uporabnikov. Če mu zastavite filozofska ali moralna vprašanja, lahko namesto globalnih perspektiv dobite rezultate, ki se tiho nagibajo h kitajskim vrednotam in stališčem. Tega sploh ne bi opazili.
Recimo, da ste razvijalec ali podjetje, ki razmišlja o vključitvi orodja DeepSeek v svojo aplikacijo. Ali ste pripravljeni tvegati težave z zaupanjem uporabnikov? Ker ko ljudje ugotovijo, da je umetna inteligenca pristranska, se nanjo nehajo zanašati. Kaj pa vsakdanji potrošniki? Zgodba je enaka. Če umetna inteligenca ne more biti pregledna, jo je težko jemati resno kot vir resnice.
Ali je torej tehnologija DeepSeek „slaba“? Ne. Njeni modeli naj bi bili odlični pri sklepanju in odgovarjanju na splošne poizvedbe. Vendar je pristranskost, vgrajena v njegov sistem, značilnost in ne napaka. Zaradi tega je nevaren.
Bistvo je naslednje:
DeepSeek je morda poceni, vendar njegova cena presega dolarje. S seboj prinaša tveganja cenzure, vpliva in nezaupanja. Preden se vkrcate na vlak, se vprašajte: Ali je prihranek nekaj dolarjev vreden tega, da dobite umetno inteligenco, ki vam pove le tisto, kar sme povedati?