admin | LLM,SLM&RAG|SEO|PPC|SEM

Kitajski “čudež” v razvoju humanoidne robotike

Mar 25, 2026 | NC

VIR: https://www.youtube.com/watch?v=mCUayp_OjTs

BISTVO

Video prikazuje več incidentov s kitajskimi humanoidnimi roboti, ki padajo, izgubljajo nadzor in poškodujejo gledalce, kar razkrije nizko zanesljivost realnih sistemov za odrom.
TSMC-jev izvršni direktor Wei (Way) Ja v govoru poudari, da so kitajski skakalni in plešoči roboti “brezvezna dekoracija”, ker nimajo pravegaa AI, temelječega na visokozmogljivih čipih in senzorjih.
Trdi, da je 95–100% “možganov” takšnih robotov (računalniških čipov za AI) izdelanih v TSMC, kar potrjuje tajvansko prevlado v naprednih polprevodnikih.
Video ostro kritizira kitajsko industrijo humanoidnih robotov kot PR–in kapitalsko zgodbo: nastopi na državnih galah, strogo skriptirani plesi in zakulisno daljinsko upravljanje, medtem ko je dejanska komercialna uporabnost minimalna.
Analiza finančnih podatkov in strokovnih ocen opozarja na mehurček: visoka rast prihodkov in IPO ambicije podjetij, kot je Unitree, temeljijo na subvencijah kapitala, prototipih in marketingu, ne pa na množični realni uporabi v domovih in tovarnah.

DEJSTVA

Na razstavi “Tomorrow’s Walker” v Šanghajskem znanstveno-tehničnem muzeju je 8. marca humanoidni robot padel z višine, se raztreščil, kovinski deli in elektronika so se razsuli po tleh, občinstvo pa je ostalo šokirano.
V več posnetkih Unitary/Unitree robot med plesom zadane dečka v obraz, drugič pade, krči se kot pri epileptičnem napadu in s sunkom noge udari člana osebja, kar izpostavi varnostna tveganja.
TSMC po navedbah Weija proizvaja okrog 95% (če ne 100%) ključnih čipov (“možganov”) za napredne robotske in embodied AI modele, kot sta Nvidia Groot in Cosmos, pri čemer je 2 nm proces že v masovni proizvodnji.
Podjetje Unitree načrtuje IPO na šanghajski znanstveno-tehnološki borzi z zbranim kapitalom okoli 4,2 milijarde juanov ter napoveduje pošiljke 30.000 kvadrupedov in 5.500 humanoidnih robotov, prihodke 1,7 milijarde juanov in več kot 600 milijonov juanov čistega dobička po odbitkih.
Industrijsko poročilo Goldman Sachs navaja, da med devetimi anketiranimi podjetji s skupaj načrtovanimi >100.000 enotami ni nobenega z resnimi potrjenimi naročili, profesor Li Fei (Stanford) pa ocenjuje, da do resnih komercialnih aplikacij humanoidne robotike lahko mine še 20 let.

CITATI

Wei Ja o kitajskih robotih: “Naša soseda, celinska Kitajska, razvija robote, ki lahko skačejo, poskakujejo in skippajo, a so neuporabni, zgolj za razstavo.”
“95%, če ne 100%, možganov je izdelanih v mojem podjetju TSMC,” poudari Wei, ko govori o vlogi TSMC pri naprednih AI čipih.
Cheetah Mobile predsednik opozarja: “Trenutna raven humanoidnih robotov na Kitajskem ni praktična. Pomembnejša je predstava kot uporabnost, varnost pa je popolnoma nezadostna.”
Netizen o gala robotih: “Ne zaupajte robotom s spomladanske gala prireditve – programiranje je večkrat popravljeno, trenje čevljev in tal je natančno izračunano, vse je inscenirano.”
Zaključno opozorilo: “Robot brez močnega možgana bo vedno le neuporabna dekoracija,” kar povzame ključno tezo videa o tem, da brez vrhunskih čipov ni prave robotike.

Vektorske baze vs RAG , ko potrebuješ natančne relacije, večstopenjsko sklepanja in razložljivost agentovega spomina.

Mar 25, 2026 | RAG & SLM

VIR
https://machinelearningmastery.com/vector-databases-vs-graph-rag-for-agent-memory-when-to-use-which/

BISTVO

Članek razloži, kako vektorske baze in grafni RAG služita kot arhitekturi dolgoročnega spomina za AI agente in kdaj je smiselno uporabiti katerega.
Vektorske baze predstavljajo podatke kot vektorje v visoko-dimenzionalnem prostoru in so odlične za semantično iskanje po ne-strukturiranem besedilu (pogovori, dokumentacija, koda).
Grafni RAG kombinira znanostne grafe in LLM ter modelira svet kot entitete (vozlišča) in relacije (povezave), kar omogoča natančno, večskokovno iskanje in razložljivost.
Vektorske baze so enostavnejše za uvedbo, a slabše pri kompleksnih relacijah in natančnih poizvedbah; grafni RAG je dražji in kompleksnejši, a boljši za strukturirane podatke in natančne povezave.
Avtor predlaga hibridno arhitekturo: vektorji za začetno semantično iskanje, nato grafni sprehod za natančen kontekst okoli najdenih entitet.

DEJSTVA

Članek je objavil Matthew Mayo 5. marca 2026 na portalu MachineLearningMastery v kategoriji “Artificial Intelligence”.
Vektorske baze uporabljajo vdelave (embeddings) kot goste vektorje realnih števil, kjer razdalja odraža semantično podobnost.
V grafnem RAG so entitete (npr. oseba, podjetje, tehnologija) predstavljene kot vozlišča, relacije (npr. »dela pri«, »uporablja«) pa kot usmerjene ali neusmerjene povezave.
Tipični use-case za vektorske baze so pogovorni dnevniki, splošna dokumentacija in široke baze znanja iz surovega besedila.
Tipični use-case za grafni RAG so finančni zapisi, odvisnosti kode, kompleksni pravni dokumenti, organizacijske strukture in odobritvene verige.

7 majhnih jezikovnih modelov

Mar 25, 2026 | RAG & SLM

VIR

Top 7 Small Language Models You Can Run on a Laptop

BISTVO

Članek opisuje 7 SLM modelov, ki delujejo na potrošniški strojni opremi in so razvrščeni po primernosti za konkretne use-case scenarije, ne po benchmarkih.
Glavne osi izbire so: dolgi kontekst (Phi‑3.5 Mini), splošna vsestranskost (Llama 3.2 3B), ekstremna učinkovitost za rob/telefon (Llama 3.2 1B), večja moč ob še sprejemljivi velikosti (Ministral 3 8B, Gemma 2 9B) ter specializacija za kodo (Qwen 2.5 7B) in prototipiranje (SmolLM2 1.7B).
Avtor poudari, da se posamezne uteži, kontekstni limiti in izdaje modelov hitro spreminjajo, zato priporoča, da bralec konkretne variante preveri na model cardih oz. straneh v Ollami.
Vsi opisani modeli so na voljo za lokalni prenos prek Hugging Face ali Ollama, pri čemer morata uporabnik za nekatere družine (Llama, Gemma) sprejeti licenčne pogoje in se včasih avtenticirati.
Zaključna poanta: vstopni prag za lokalni pogon AI je nizek; izberite eno družino modelov glede na svoj primer uporabe, jo preizkusite na lastnih podatkih in nato iterirajte.

DEJSTVA

Phi‑3.5 Mini (Microsoft) ima približno 3,8B parametrov, v 4‑bit kvantizaciji potrebuje približno 6–10 GB RAM, v 16‑bit natančnosti pa približno 16 GB RAM.
Llama 3.2 3B (Meta) podpira vsaj 8 jezikov (angleščina, nemščina, francoščina, italijanščina, portugalščina, hindijščina, španščina, tajščina), v 4‑bit načinu potrebuje približno 6 GB RAM.
Llama 3.2 1B lahko v 4‑bit kvantizaciji deluje v približno 2–4 GB RAM in je primerna tudi za višji razred pametnih telefonov in IoT naprave.
Ministral 3 8B (Mistral AI) cilja na robne namestitve; v 4‑bit kvantizaciji potrebuje približno 10 GB RAM, v 16‑bit pa okrog 20 GB RAM, priporočeno je vsaj 16 GB RAM.
Gemma 2 9B (Google) v 4‑bit kvantizaciji potrebuje približno 12 GB RAM, v 16‑bit okoli 24 GB RAM, priporočilo je 16+ GB RAM za resnejšo uporabo.

CITATI

»Powerful AI now runs on consumer hardware. The models covered here work on standard laptops and deliver production-grade results for specialized tasks.«
»Microsoft’s Phi-3.5 Mini is a top choice for developers building retrieval-augmented generation (RAG) systems on local hardware.«
»Meta’s Llama 3.2 3B is the all-rounder. It handles general instruction-following well, fine-tunes easily, and runs fast enough for interactive applications.«
»Alibaba’s Qwen 2.5 7B dominates coding and mathematical reasoning benchmarks.«
»Hugging Face’s SmolLM2 is one of the smallest models here, designed for rapid experimentation and learning.«

SLM (mali jezikovni modeli) pokrijejo ~80% produkcijskih primerov z do 95% nižjimi stroški kot veliki modeli (LLM )

Mar 25, 2026 | RAG & SLM

VIR: https://machinelearningmastery.com/introduction-to-small-language-models-the-complete-guide-for-2026/

BISTVO:

Majhni jezikovni modeli (SLM, do ~10B parametrov) zadoščajo za večino tipičnih produkcijskih nalog (chatboti, support, dokumenti) pri bistveno nižjih stroških in latencah.
Ključne prednosti SLM-ov so nižji stroški (lokalni GPU namesto API), manjša latenca (50–200 ms lokalno) in boljša zasebnost (on‑prem, brez pošiljanja podatkov v oblak).
Sodobni SLM-i (Phi-3 Mini, Llama 3.2 3B, Mistral 7B) z dobro dodelavo dosegajo zmogljivost, primerljivo z bistveno večjimi modeli na ozko usmerjenih domenah.
Priporočeni pristop v praksi je hibrid: SLM rešuje ~80% ponavljajočih se, predvidljivih poizvedb, zahtevnih ~20% se preusmeri na velik LLM prek “router” vzorca.
Za začetek avtor priporoča: lokalni preizkus (Ollama + Llama/Phi), identifikacijo ponovljivih use‑caseov, fine‑tuning na 500–1000 primerih in lokalno/on‑prem namestitev.
Zasebnost: Regulirani sektorji (zdravstvo, finance, pravni sektor) ne smejo pošiljati občutljivih podatkov zunanjim API-jem.
SLM-i omogočajo tem organizacijam uporabo AI-ja ob hkratnem ohranjanju podatkov na lastnih strežnikih. Brez klicev zunanjih API-jev podatki ne zapustijo vaše infrastrukture.
LLM so zasnovani za širino in nepredvidljivost, medtem ko so SLM zgrajeni za globino in ponavljanje. Če vaša naloga zahteva obravnavo kakršnegakoli vprašanja o kateri koli temi, potrebujete široko znanje LLM. Vendar pa, če rešujete isti tip problema na tisoče krat, bo SLM, ki je fino prilagojen za to specifično področje, hitrejši, cenejši in pogosto bolj natančen.

DEJSTVA:

Članek je objavljen 24. februarja 2026, avtor je Vinod Chugani na portalu Machine Learning Mastery.
SLM je definiran kot model z manj kot 10 milijardami parametrov, tipično med 1B in 7B.
Phi‑3 Mini ima približno 3,8B parametrov, Llama 3.2 3B ima 3B parametrov, Mistral 7B pa 7B parametrov.
Kvantizacija 7B modela iz 16‑bit (≈14 GB) v 4‑bit zmanjša pomnilniški odtis na približno 3,5 GB, ob ohranitvi ~95% kvalitete.
Veliki modeli, kot je GPT‑4, imajo več kot 1 bilijon parametrov, Claude Opus ima stotine milijard parametrov, Llama 3.1 70B se še vedno šteje kot “velik”.

Kako SLM-ji Dosežejo Svojo Prednost

SLM-ji niso zgolj »majhni LLM-ji«. Uporabljajo specifične tehnike za zagotavljanje visoke zmogljivosti pri nizkem številu parametrov.

Distilacija Znanja:
trenira manjše »študente« modele, da posnemajo večje »učiteljske« modele. Študent se nauči ponoviti izhod učitelja, ne da bi potreboval enako veliko arhitekturo. Microsoftova serija Phi-3 je bila stisnjena iz veliko večjih modelov, pri čemer je ohranila več kot 90 % zmogljivosti pri 5 % velikosti.

Visokokakovostni Trening:
Podatki so pomembnejši za SLM-je kot sama količina podatkov. Medtem ko so LLM-ji trenirani na bilijonih tokenov z interneta, SLM-ji koristijo kurirane, visokokakovostne podatkovne zbirke. Phi-3 je bil treniran na »učbenik kakovostnih« sintetičnih podatkih, skrbno filtriranih za odstranitev šuma in odvečnosti.

Kvantizacija stisne uteži modela iz 16-bitnih ali 32-bitnih plavajočih vejic v 4-bitne ali 8-bitne cela števila. Model s 7 milijardami parametrov v 16-bitni natančnosti zahteva 14 GB pomnilnika. Kvantiziran na 4-bitni način, se prilega v 3,5 GB (dovolj majhen za zagon na prenosniku). Sodobne kvantizacijske tehnike, kot je GGUF, ohranijo več kot 95 % kakovosti modela ob doseganju 75 % zmanjšanja velikosti.

Arhitekturne Optimizacije, kot je redka pozornost, zmanjšujejo računsko obremenitev. Namesto da bi vsak token pozornosti namenil vsakemu drugemu tokenu, modeli uporabljajo tehnike kot so pozornost z drsnim oknom ali skupinska pozornost po poizvedbah, da osredotočijo izračune tam, kjer so najbolj pomembni.

13 ključnih AI veščin za SEO v 2026

Mar 25, 2026 | Ecommerce, LLM (AI)

VIR: https://www.link-assistant.com/news/ai-skills.html

Prompt engineering – potrebna je sposobnost jasnega strukturiranja vloge, naloge, konteksta in formata izhoda ter razumevanje, kako različne formulacije vplivajo na točnost, konsistenco in “halluciniranje” izhodov pri tipičnih nalogah (briefi, meta opisi, keyword research).
AI workflow automation – zahteva razumevanje procesov in orodij (Zapier, Make, n8n), razbitje ponavljajočih se SEO korakov v sprožilce in akcije ter sposobnost zanesljivega povezovanja exportov z AI povzetki in dostavo v Slack, email ali dashboarde.
AI agents for SEO tasks – potrebno je poznavanje agent frameworkov (Crew AI, LangChain, AutoGen), razgradnja kompleksnih ciljev (auditi, content gap analize) v zaporedje podnalog, definiranje orodij, ki jih agent lahko kliče, ter vzpostavitev varnih človeških “checkpointov”.
Retrieval-Augmented Generation (RAG) – zahteva razumevanje vektorskih baz in indeksiranja vsebine (LangChain, Vectara, LlamaIndex), pripravo SEO podatkov (auditi, backlinki, vsebina) v strukturirani obliki ter projektno ločevanje zbirk, da AI odgovarja na podlagi aktualnih, specifičnih podatkov.
Fine-tuning in custom GPT-ji – potrebna je sposobnost definiranja pravil (tone, struktura, omejitve), zbiranja visokokakovostnih vzorčnih vsebin ter ločevanja med “znanjem” (prek RAG) in “vedenjem” modela, da AI dosledno replicira brand voice in SEO standarde brez prekomernega ročnega editiranja.
Multimodalni AI – zahteva razumevanje, kako modeli z vizijo obdelujejo slike, video in tekst, ter sposobnost izkoriščanja tega za generiranje alt oznak, vizualnih analiz konkurenčnih strani, repurposing blog objav v več formatov in avtomatizirano bogatenje metapodatkov.
AI generiranje videa – potrebno je osnovno znanje video-narative (hook–poanta–zaključek), delo z orodji kot Runway, OpusClip, Pika ter sposobnost vzetja obstoječega teksta/članka in pretvorbe v kratke, testabilne video formate z ustreznimi napisi.
AI tool stacking – zahteva sistemsko razmišljanje o pretoku podatkov med orodji (npr. RankDots → SEO PowerSuite → Notion), mapiranje trenutnih procesov, standardizacijo vhodnih/izhodnih formatov in postopno ukinjanje ročnih “copy–paste” korakov.
Evalvacija in upravljanje LLM – potrebna je definicija kriterijev kakovosti za posamezne naloge (npr. brief, audit), sposobnost A/B testiranja promptov in modelov, beleženje izhodov, spremljanje stroškov ter uvedba orodij, kot so Helicone, PromptLayer, TruLens, ko se obseg poveča.
AI SEO (AEO / GEO) – zahteva razumevanje, kako AI sistemi izbirajo in citirajo vire, sposobnost strukturiranja vsebine z jasnimi definicijami, topic cluster pristopom, bogatim strukturiranim podatkovjem (schema) ter spremljanje pojavnosti v AI Overviews z orodji, kot je AIO Tracker.
AI systems thinking – potrebno je procesno razmišljanje: beleženje obstoječih SEO workflowov, prepoznavanje ozkih grl, načrtovanje vhodov–korakov–izhodi, dizajn za odpornost in napake ter redno poenostavljanje sistemov, da ostanejo vzdržni pri rasti.
AI narrative control – zahteva sposobnost auditiranja, kako AI opisuje znamko, razumevanje virov (spletno mesto, shema, recenzije, omembe), UX pri posodabljanju ključnih “entity” signalov (About, produktne strani, Wikidata …) in stalno spremljanje ter popravljanje napačnih ali zastarelih informacij.
AI‑podprta konkurenčna inteligenca – potrebna je veščina uporabe orodij za zbiranje podatkov o konkurenci, nato pa uporaba AI za hitro odkrivanje vzorcev (teme, formati, backlinki), keyword/content gapov in pretvorbo teh vpogledov v prioritetizirane SEO akcijske načrte

« Older Entries

Next Entries »

Kitajski “čudež” v razvoju humanoidne robotike

BISTVO

DEJSTVA

CITATI

Vektorske baze vs RAG , ko potrebuješ natančne relacije, večstopenjsko sklepanja in razložljivost agentovega spomina.

7 majhnih jezikovnih modelov

VIR

BISTVO

DEJSTVA

CITATI

SLM (mali jezikovni modeli) pokrijejo ~80% produkcijskih primerov z do 95% nižjimi stroški kot veliki modeli (LLM )

Kako SLM-ji Dosežejo Svojo Prednost

13 ključnih AI veščin za SEO v 2026

Zadnje objave