imageMeta je pred kratkim predstavila NotebookLlama, „odprto“ različico Googlove funkcije za generiranje podkastov, ki jo najdete v programu NotebookLM. S pomočjo modelov Meta Llama lahko NotebookLlama ustvarja pogovorne, podkastne povzetke prenesenih besedilnih datotek, kot so članki v obliki PDF novic ali prispevki na blogu. Cilj te tehnologije je ponoviti vidik interaktivnega pripovedovanja zgodb Googlovega viralnega orodja in dodati lastne elemente dramatizacije in prekinitev, da vsebina zveni bolj dinamično.

Postopek se začne tako, da NotebookLlama iz naložene datoteke ustvari prepis. Nato besedilo izboljša z vključitvijo bolj dramatičnih interakcij, preden ga pretvori v zvok z uporabo odprtokodnih modelov za pretvorbo besedila v govor. Vendar kakovost teh ustvarjenih podcastov trenutno zaostaja za kakovostjo NotebookLma, saj glasovi pogosto zvenijo robotsko in se nerodno prekrivajo. Raziskovalci Meta so te pomanjkljivosti priznali in poudarili, da bi naprednejši modeli pretvorbe besedila v govor lahko bistveno izboljšali naravnost rezultatov.

Razvijalci so omenili tudi, da bi lahko trenutni pristop – uporaba enega samega modela za ustvarjanje osnutka podkasta – izboljšali tako, da bi sprejeli obliko razprave med dvema agentoma umetne inteligence, kar bi zagotovilo bogatejšo razpravo. Menijo, da bi to lahko privedlo do bolj prepričljive in skladne pripovedi podkasta. Kljub tej inovaciji je NotebookLlama tako kot druge vsebine, ki jih ustvarja umetna inteligenca, še vedno dovzetna za pogost problem „halucinacij“, kar pomeni, da lahko nekateri deli ustvarjenega podkasta vključujejo netočne ali izmišljene informacije.

Čeprav NotebookLlama ni prvi poskus posnemanja funkcije podcasta NotebookLM, je zaradi svoje odprtokodne narave in sodelovanja podjetja Meta pomemben udeleženec na tem nastajajočem področju. Možnost izboljšanja kakovosti modelov in sprejetja novih pristopov daje programu NotebookLlama prostor za prihodnji napredek, čeprav še ni dosegel povsem naravnega rezultata.