VIR

image

BISTVO

  • Članek razlaga, da je pri agentni umetni inteligenci prompt engineering predvsem načrtovanje sistema odločanja skozi več korakov, ne le oblikovanje enkratnega vprašanja za klepetalni model.

  • Osrednja teza je prehod iz »prompt engineering« v »context engineering«, kjer je ključno, katere informacije ima model na voljo v posameznem trenutku izvajanja naloge.

  • Avtor kot štiri ključne gradnike agentnega prompta izpostavi sistemski prompt, definicije orodij, few-shot primere in upravljanje zgodovine sporočil oziroma stanja konteksta.

  • Članek poudari, da zanesljivost agentov močno izboljšajo strukturirani vzorci razmišljanja, posebej Chain of Thought, ReAct in Reflexion.

  • Praktični del opozori, da agenti najpogosteje odpovedo zaradi preveč orodij, nejasnega kriterija uspeha, prenasičenega konteksta, pomanjkanja primerov in napačne obravnave večkoraknega sistema kot navadnega chata.

DEJSTVA

  • Članek se sklicuje na Anthropicov koncept »context engineering« in na raziskavo o degradaciji konteksta oziroma »context rot«, kjer daljši kontekst zmanjša natančnost priklica in sklepanja.

  • Med temeljnimi referencami sta navedena Lilian Weng in Anthropicov inženirski zapis o učinkovitem kontekstnem inženiringu za AI agente.

  • Kot empiričen primer je navedena raziskava Googlove ekipe iz leta 2022, kjer je uspešnost na nalogi Game of 24 zrasla z 4% na 74% z uvedbo strukturiranega razmišljanja.

  • Članek kot uporabne arhitekture izrecno obravnava Chain of Thought, ReAct ter Reflexion, pri čemer ReAct opiše kot zanko »Thought → Action → Observation → Thought«.

CITATI

  • »One is asking. The other is designing how a system thinks.«

  • »Prompt engineering asks ‘what are the right words?’ Context engineering asks ‘what is the optimal set of information this model should have at every point during execution?’«

  • »The model did not get smarter; its reasoning architecture did.«

  • »Never skip the Thought step. Never take an Action without a Thought that justifies it.«

  • »The teams getting the most out of agentic AI right now are the ones who stopped asking ‘how do I phrase this better?’ and started asking ‘what does this model need to know at every step to behave the way I want?’«