Du gibst ein Ziel und wartest. Zwölf Sekunden später steht ein Ergebnis. Was passiert dazwischen? Diese Lehrtafel öffnet die Black Box, Schritt für Schritt: der Loop, die innere Stimme, das Gedächtnis und der Live-Trace eines echten Agent-Runs.
You give a goal and wait. Twelve seconds later, a result appears. What happens in between? This article opens the black box, step by step: the loop, the inner voice, memory, and a live trace of a real agent run.
Was wir Denken nennen, ist beim Agent kein Mysterium. Es ist ein Mechanismus aus drei Bewegungen, die sich wiederholen, bis ein Ziel erreicht ist. In der Forschung heißt er Plan, Act, Observe. Auf Deutsch: Planen, Handeln, Beobachten.
What we call thinking is no mystery for an agent. It’s a mechanism of three movements that repeat until a goal is reached. In research it’s called Plan, Act, Observe.
Der Agent zerlegt dein Ziel in Schritte. Er führt einen aus. Er prüft das Ergebnis. Wenn es passt, geht es weiter. Wenn nicht, plant er um. Dieser Drei-Takt ist die Grundeinheit jeder Agent-Architektur. Manchmal genügen drei Schleifen. Manchmal braucht es vierzig.
The agent breaks down your goal into steps. It executes one. It checks the result. If it fits, it continues. If not, it replans. This three-beat is the basic unit of every agent architecture. Sometimes three loops suffice. Sometimes it takes forty.
FORMEL
PLAN ┌──→ ACT ┌──→ OBSERVE ↺
┌──→ KLICKEN ZUM HALTEN. AUTO-WECHSEL ALLE 3 SEKUNDEN.┌──→ CLICK TO PAUSE. AUTO-SWITCH EVERY 3 SECONDS.
Im Plan-Schritt führt der Agent einen inneren Monolog. Er notiert Schritte, verwirft sie, ordnet sie neu. In der Fachwelt heißt das Chain of Thought, eine Kette aus Gedanken. Je länger sie wird, desto klüger die Schlussfolgerung am Ende.
In the Plan step, the agent runs an inner monologue. It notes steps, discards them, reorders them. In the field this is called Chain of Thought, a chain of thoughts. The longer it gets, the smarter the conclusion at the end.
CHAIN OF THOUGHT · ROHFASSUNGCHAIN OF THOUGHT · DRAFT
Auszug · Real ist die Kette länger.Excerpt · Real chain is longer.
01 · CHAIN OF THOUGHT
Eine gerade Linie aus Gedanken. Schritt für Schritt. Glied für Glied. Funktioniert für die meisten Aufgaben und ist die Standard-Form jedes modernen Agents.
A straight line of thoughts. Step by step. Link by link. Works for most tasks and is the standard form of every modern agent.
02 · TREE OF THOUGHT
Bei schweren Problemen verzweigt sich die Kette zu einem Baum. Der Agent denkt mehrere Wege parallel, vergleicht sie, schneidet schwache ab und folgt dem besten.
For hard problems, the chain branches into a tree. The agent thinks multiple paths in parallel, compares them, prunes weak ones, and follows the best.
03 · WARUM DAS WICHTIG IST03 · WHY THIS MATTERS
Ein Modell, das laut denken darf, ist messbar zuverlässiger als eines, das direkt antwortet. Wer Agents baut, schaltet diese Schicht nie ab.
A model allowed to think out loud is measurably more reliable than one that answers directly. Anyone building agents never turns this layer off.
Ein Agent ohne Memory ist ein Werkzeug. Ein Agent mit Memory wird zum Mitarbeiter. Der Unterschied liegt nicht in einem Speicher, sondern in drei verschiedenen, die parallel arbeiten und je eine eigene Aufgabe haben.
An agent without memory is a tool. An agent with memory becomes a colleague. The difference isn’t in one store, but in three different ones that work in parallel, each with its own job.
| DIMENSIONDIMENSION | KURZZEIT · SCRATCHPADSHORT-TERM · SCRATCHPAD | SESSION · EPISODISCHSESSION · EPISODIC | LANGZEIT · SEMANTISCHLONG-TERM · SEMANTIC |
|---|---|---|---|
| LebensdauerLifespan | Eine AufgabeOne task | Eine SessionOne session | PermanentPermanent |
| SpeicherortLocation | Im Modell-KontextIn model context | Session-StateSession state | Vektor-DB / DateienVector DB / Files |
| GrößeSize | Wenige tausend TokensA few thousand tokens | Bis zu hunderttausendUp to a hundred thousand | Unbegrenzt, indexiertUnlimited, indexed |
| SpeichertStores | Aktueller Plan, letzte Tool-AntwortCurrent plan, last tool response | Bisherige Schritte, gegebene ApprovalsPrevious steps, given approvals | Vorlieben, Tools, Tonalität, SchwellenPreferences, tools, tone, thresholds |
| Gefahr ohneRisk without | Faden verlieren mitten im LoopLosing the thread mid-loop | Du musst zweimal antwortenYou have to answer twice | Agent bleibt ein FremderAgent stays a stranger |
| BeispielExample | „Welche 12 Wettbewerber waren das gerade?““Which 12 competitors were those?” | „Du hattest vorhin Budget X freigegeben.““You had approved budget X earlier.” | „Du schreibst nüchtern, ohne Adjektive.““You write soberly, without adjectives.” |
┌──→ DREI EBENEN, JE EIGENE ROLLE. WER EINE WEGLÄSST, BAUT EINEN HALBEN AGENT.┌──→ THREE LAYERS, EACH WITH ITS OWN ROLE. SKIP ONE AND YOU BUILD HALF AN AGENT.
Eine echte Aufgabe, zwölf Schritte, ein Loop in Aktion. Drück Play und sieh dem Agent zu, wie er aus drei Sätzen einen erledigten Auftrag macht. Pausiere jederzeit oder klick auf einen Schritt, um in seinen Kopf zu schauen.
A real task, twelve steps, a loop in action. Press Play and watch the agent turn three sentences into a completed assignment. Pause at any time or click a step to look inside its head.
SIMULATION · VEREINFACHTER ECHTER AGENT-RUN. ZAHLEN GESCHÄTZT.SIMULATION · SIMPLIFIED REAL AGENT RUN. NUMBERS ESTIMATED.
In jedem zweiten Run schlägt irgendwo etwas fehl. Eine Datenbank antwortet nicht. Eine Suche bringt Schrott. Ein Tool gibt einen Timeout zurück. Hier zeigt sich, ob ein Agent wirklich denkt oder nur tut.
In every second run, something fails somewhere. A database doesn’t respond. A search returns garbage. A tool returns a timeout. This is where it shows whether an agent actually thinks or just does.
OHNE SELF-CORRECTIONWITHOUT SELF-CORRECTION
Ein primitiver Agent gibt auf, sobald irgendetwas hakt. Kein Plan B. Kein Ausweg. Du bekommst einen Fehler statt einer Lösung.
A primitive agent gives up as soon as anything snags. No plan B. No way out. You get an error instead of a solution.
MIT SELF-CORRECTIONWITH SELF-CORRECTION
Ein guter Agent liest jede Fehlermeldung wie ein Detektiv. Was war das? Was lerne ich daraus? Was probiere ich als Nächstes? Genau dieser Reflex unterscheidet ein robustes System von einem Spielzeug.
A good agent reads every error message like a detective. What was that? What can I learn from it? What do I try next? Exactly this reflex distinguishes a robust system from a toy.
A · HALLUZINATION
Der Agent erfindet Quellen, Zitate, Zahlen. Klingt richtig. Ist es nicht. Lösung: Tools statt Fantasie, also Fakten holen statt raten.
The agent invents sources, quotes, numbers. Sounds right. Isn’t. Solution: tools instead of fantasy, i.e. fetch facts instead of guessing.
B · LOOP-FALLEB · LOOP TRAP
Der Agent dreht sich im Kreis, korrigiert die Korrektur. Lösung: harte Limits auf Schritte, Zeit und Budget pro Run.
The agent goes in circles, corrects the correction. Solution: hard limits on steps, time and budget per run.
C · ÜBER-AUTOMATIONC · OVER-AUTOMATION
Wer den Agent ohne Rückfrage senden lässt, riskiert peinliche oder teure Aktionen. Lösung: Approval-Gates an heiklen Stellen.
Letting the agent send without asking risks embarrassing or costly actions. Solution: approval gates at critical points.
FAUSTREGELRULE OF THUMB
In zwei von drei Runs muss der Agent mindestens einmal selbst korrigieren. Ein Run ohne Selbstkorrektur ist eher die Ausnahme als die Regel. Wer das versteht, baut Guardrails ein, statt auf reibungslose Magie zu hoffen.
In two out of three runs, the agent must self-correct at least once. A run without self-correction is the exception rather than the rule. Those who understand this build guardrails instead of hoping for frictionless magic.
03
Was Agents an Werkzeugen haben. Was du für dich anbinden kannst. Wie das alles zusammensteckt. Inkl. realer Beispiele.
What tools agents have. What you can connect for yourself. How it all fits together. Including real examples.
04
Wo Agents schiefgehen, wie man sie absichert, wann Mensch im Loop sein muss. Mit Checkliste für eigene Setups.
Where agents go wrong, how to secure them, when humans must be in the loop. With checklist for your own setups.
05
Vom Anwendungsfall bis zum Prototyp. Welche Schritte, welche Werkzeuge, welche Stolperfallen.
From use case to prototype. What steps, what tools, what pitfalls.