Google je predstavil raziskavo o novi metodi za razpoznavo uporabniške namere, ki temelji na majhnih modelih, ki tečejo neposredno v brskalniku ali na mobilni napravi, brez pošiljanja surovih podatkov nazaj v podatkovni center. Raziskovalci so problem razdelili na dva podproblema in pokazali, da tak dvofazni pristop premaga osnovno zmogljivost večmodalnih velikih jezikovnih modelov (MLLM), ki tečejo v masivnih podatkovnih centrih. Cilj je omogočiti avtonomnim agentom na napravi, da iz serije interakcij v uporabniškem vmesniku zanesljivo sklepajo, kaj uporabnik poskuša doseči, ob hkratnem poudarku na zasebnosti in robustnosti.​  Razpoznavanje uporabniške namere (user intent extraction) v tem kontekstu ne temelji na klasičnem iskalnem poizvedovanju, temveč na analizi zaporedja interakcij uporabnika z mobilno ali spletno aplikacijo. Vsaka uporabniška pot, ki jo raziskava imenuje trajektorija, je opisana kot zaporedje korakov, kjer vsak korak sestavljata vizualno stanje zaslona (posnetek zaslona) in konkretno dejanje uporabnika (klik, vnos besedila, izbira elementa). Več:  https://aclanthology.org/2025.emnlp-main.949.pdf