● 02· LEHRTAFEL · DAS DENKEN· ARTICLE · THINKING

Wie ein Agent
denkt.
How an Agent
thinks.

Du gibst ein Ziel und wartest. Zwölf Sekunden später steht ein Ergebnis. Was passiert dazwischen? Diese Lehrtafel öffnet die Black Box, Schritt für Schritt: der Loop, die innere Stimme, das Gedächtnis und der Live-Trace eines echten Agent-Runs.

You give a goal and wait. Twelve seconds later, a result appears. What happens in between? This article opens the black box, step by step: the loop, the inner voice, memory, and a live trace of a real agent run.

START LESENSTART READING ┌──→
FILE · 02 / SERIE AI & AGENTIC EXPLAINEDFILE · 02 / SERIES AI & AGENTIC EXPLAINED LESEZEIT · 10 MINUTENREADING TIME · 10 MINUTES VERSION · v0.1
● 03· DAS HERZSTÜCK· THE CORE

Drei Schritte.
Eine Schleife.

Three Steps.
One Loop.

Was wir Denken nennen, ist beim Agent kein Mysterium. Es ist ein Mechanismus aus drei Bewegungen, die sich wiederholen, bis ein Ziel erreicht ist. In der Forschung heißt er Plan, Act, Observe. Auf Deutsch: Planen, Handeln, Beobachten.

What we call thinking is no mystery for an agent. It’s a mechanism of three movements that repeat until a goal is reached. In research it’s called Plan, Act, Observe.

Was im Loop passiert

What happens in the loop

Der Agent zerlegt dein Ziel in Schritte. Er führt einen aus. Er prüft das Ergebnis. Wenn es passt, geht es weiter. Wenn nicht, plant er um. Dieser Drei-Takt ist die Grundeinheit jeder Agent-Architektur. Manchmal genügen drei Schleifen. Manchmal braucht es vierzig.

The agent breaks down your goal into steps. It executes one. It checks the result. If it fits, it continues. If not, it replans. This three-beat is the basic unit of every agent architecture. Sometimes three loops suffice. Sometimes it takes forty.

FORMEL

PLAN  ┌──→  ACT  ┌──→  OBSERVE  ↺

PLAN · ACT · OBSERVE · LOOP PLAN ZERLEGEN ACT HANDELN OBSERVE PRÜFEN Drei Schritte. Beliebig viele Runden.
01 · PLAN01 · PLAN
Er denkt laut.It thinks out loud.
Der Agent zerlegt dein Ziel. Welche Schritte braucht es? Welcher zuerst? Was hängt wovon ab? Hier entstehen Hypothesen, bevor irgendetwas Echtes geschieht.The agent breaks down your goal. What steps does it need? Which first? What depends on what? Hypotheses are formed here before anything real happens.
02 · ACT02 · ACT
Er greift zum Werkzeug.It reaches for the tool.
Aus Plan wird Tat. Der Agent ruft ein Tool auf. Sucht im Web. Schreibt eine Email. Liest aus der Datenbank. Führt Code aus. Berührt die Realität.Plan becomes action. The agent calls a tool. Searches the web. Writes an email. Reads from the database. Executes code. Touches reality.
03 · OBSERVE03 · OBSERVE
Er prüft das Ergebnis.It checks the result.
Hat es geklappt? Steht da, was gehofft war? Oder kam Müll zurück? Hier entscheidet sich, ob der nächste Plan reicht oder alles neu gedacht werden muss.Did it work? Is what was hoped for there? Or did garbage come back? Here it decides whether the next plan suffices or everything must be rethought.

┌──→ KLICKEN ZUM HALTEN. AUTO-WECHSEL ALLE 3 SEKUNDEN.┌──→ CLICK TO PAUSE. AUTO-SWITCH EVERY 3 SECONDS.

● 04· DAS LAUTE DENKEN· THINKING OUT LOUD

Bevor er handelt,
redet er mit sich.

Before it acts,
it talks to itself.

Im Plan-Schritt führt der Agent einen inneren Monolog. Er notiert Schritte, verwirft sie, ordnet sie neu. In der Fachwelt heißt das Chain of Thought, eine Kette aus Gedanken. Je länger sie wird, desto klüger die Schlussfolgerung am Ende.

In the Plan step, the agent runs an inner monologue. It notes steps, discards them, reorders them. In the field this is called Chain of Thought, a chain of thoughts. The longer it gets, the smarter the conclusion at the end.

CHAIN OF THOUGHT · ROHFASSUNGCHAIN OF THOUGHT · DRAFT

> Ziel: 5 Leads finden, anschreiben.
> Schritt 1: ICP klären.
↳ Branche? Größe? Region?
> Schritt 2: Quellen.
↳ CRM zuerst, dann LinkedIn-Signale.
> Halt. CRM hat keine Trigger.
↳ Plan revidieren: erst LinkedIn.
> Schritt 3: Top 5 scoren.
> Schritt 4: Personalisieren.
> Schritt 5: Approval-Gate.
▣ PLAN BEREIT.
> Goal: find 5 leads, reach out.
> Step 1: clarify ICP.
↳ Industry? Size? Region?
> Step 2: sources.
↳ CRM first, then LinkedIn signals.
> Hold. CRM has no triggers.
↳ Revise plan: LinkedIn first.
> Step 3: score top 5.
> Step 4: personalize.
> Step 5: approval gate.
▣ PLAN READY.

Auszug · Real ist die Kette länger.Excerpt · Real chain is longer.

Zwei Spielarten

Two Variants

01 · CHAIN OF THOUGHT

Eine gerade Linie aus Gedanken. Schritt für Schritt. Glied für Glied. Funktioniert für die meisten Aufgaben und ist die Standard-Form jedes modernen Agents.

A straight line of thoughts. Step by step. Link by link. Works for most tasks and is the standard form of every modern agent.

02 · TREE OF THOUGHT

Bei schweren Problemen verzweigt sich die Kette zu einem Baum. Der Agent denkt mehrere Wege parallel, vergleicht sie, schneidet schwache ab und folgt dem besten.

For hard problems, the chain branches into a tree. The agent thinks multiple paths in parallel, compares them, prunes weak ones, and follows the best.

03 · WARUM DAS WICHTIG IST03 · WHY THIS MATTERS

Ein Modell, das laut denken darf, ist messbar zuverlässiger als eines, das direkt antwortet. Wer Agents baut, schaltet diese Schicht nie ab.

A model allowed to think out loud is measurably more reliable than one that answers directly. Anyone building agents never turns this layer off.

● 05· DAS GEDÄCHTNIS· MEMORY

Drei Gedächtnisse.
Verschiedene Aufgaben.

Three Memories.
Different Jobs.

Ein Agent ohne Memory ist ein Werkzeug. Ein Agent mit Memory wird zum Mitarbeiter. Der Unterschied liegt nicht in einem Speicher, sondern in drei verschiedenen, die parallel arbeiten und je eine eigene Aufgabe haben.

An agent without memory is a tool. An agent with memory becomes a colleague. The difference isn’t in one store, but in three different ones that work in parallel, each with its own job.

DIMENSIONDIMENSION KURZZEIT · SCRATCHPADSHORT-TERM · SCRATCHPAD SESSION · EPISODISCHSESSION · EPISODIC LANGZEIT · SEMANTISCHLONG-TERM · SEMANTIC
LebensdauerLifespan Eine AufgabeOne task Eine SessionOne session PermanentPermanent
SpeicherortLocation Im Modell-KontextIn model context Session-StateSession state Vektor-DB / DateienVector DB / Files
GrößeSize Wenige tausend TokensA few thousand tokens Bis zu hunderttausendUp to a hundred thousand Unbegrenzt, indexiertUnlimited, indexed
SpeichertStores Aktueller Plan, letzte Tool-AntwortCurrent plan, last tool response Bisherige Schritte, gegebene ApprovalsPrevious steps, given approvals Vorlieben, Tools, Tonalität, SchwellenPreferences, tools, tone, thresholds
Gefahr ohneRisk without Faden verlieren mitten im LoopLosing the thread mid-loop Du musst zweimal antwortenYou have to answer twice Agent bleibt ein FremderAgent stays a stranger
BeispielExample „Welche 12 Wettbewerber waren das gerade?““Which 12 competitors were those?” „Du hattest vorhin Budget X freigegeben.““You had approved budget X earlier.” „Du schreibst nüchtern, ohne Adjektive.““You write soberly, without adjectives.”

┌──→ DREI EBENEN, JE EIGENE ROLLE. WER EINE WEGLÄSST, BAUT EINEN HALBEN AGENT.┌──→ THREE LAYERS, EACH WITH ITS OWN ROLE. SKIP ONE AND YOU BUILD HALF AN AGENT.

● 06· LIVE-TRACE

Schritt für Schritt.
Was wirklich passiert.

Step by step.
What really happens.

Eine echte Aufgabe, zwölf Schritte, ein Loop in Aktion. Drück Play und sieh dem Agent zu, wie er aus drei Sätzen einen erledigten Auftrag macht. Pausiere jederzeit oder klick auf einen Schritt, um in seinen Kopf zu schauen.

A real task, twelve steps, a loop in action. Press Play and watch the agent turn three sentences into a completed assignment. Pause at any time or click a step to look inside its head.

AUFTRAGASSIGNMENT „Schick einen Wettbewerber-Report über letzte Woche an das Leadership-Team.“ “Send a competitor report about last week to the leadership team.”

SIMULATION · VEREINFACHTER ECHTER AGENT-RUN. ZAHLEN GESCHÄTZT.SIMULATION · SIMPLIFIED REAL AGENT RUN. NUMBERS ESTIMATED.

● 07· WENN ETWAS BRICHT· WHEN SOMETHING BREAKS

Der Moment,
der den Unterschied macht.

The moment
that makes the difference.

In jedem zweiten Run schlägt irgendwo etwas fehl. Eine Datenbank antwortet nicht. Eine Suche bringt Schrott. Ein Tool gibt einen Timeout zurück. Hier zeigt sich, ob ein Agent wirklich denkt oder nur tut.

In every second run, something fails somewhere. A database doesn’t respond. A search returns garbage. A tool returns a timeout. This is where it shows whether an agent actually thinks or just does.

OHNE SELF-CORRECTIONWITHOUT SELF-CORRECTION

FEHLERERROR
db_query()  →  TimeoutError
⊘ ABORT. Auftrag gescheitert.⊘ ABORT. Task failed.

Ein primitiver Agent gibt auf, sobald irgendetwas hakt. Kein Plan B. Kein Ausweg. Du bekommst einen Fehler statt einer Lösung.

A primitive agent gives up as soon as anything snags. No plan B. No way out. You get an error instead of a solution.

MIT SELF-CORRECTIONWITH SELF-CORRECTION

FEHLER ERKANNTERROR DETECTED
db_query()  →  TimeoutError
↻ Retry mit kürzerem Range.↻ Retry with shorter range.
↻ Falls erneut: alternative Quelle.↻ If again: alternative source.
▣ Erfolg im 2. Versuch.▣ Success on 2nd attempt.

Ein guter Agent liest jede Fehlermeldung wie ein Detektiv. Was war das? Was lerne ich daraus? Was probiere ich als Nächstes? Genau dieser Reflex unterscheidet ein robustes System von einem Spielzeug.

A good agent reads every error message like a detective. What was that? What can I learn from it? What do I try next? Exactly this reflex distinguishes a robust system from a toy.

⚊ DREI TYPISCHE GRENZEN⚊ THREE TYPICAL LIMITS

A · HALLUZINATION

Selbstbewusste FiktionConfident Fiction

Der Agent erfindet Quellen, Zitate, Zahlen. Klingt richtig. Ist es nicht. Lösung: Tools statt Fantasie, also Fakten holen statt raten.

The agent invents sources, quotes, numbers. Sounds right. Isn’t. Solution: tools instead of fantasy, i.e. fetch facts instead of guessing.

B · LOOP-FALLEB · LOOP TRAP

Endlose SchleifeEndless Loop

Der Agent dreht sich im Kreis, korrigiert die Korrektur. Lösung: harte Limits auf Schritte, Zeit und Budget pro Run.

The agent goes in circles, corrects the correction. Solution: hard limits on steps, time and budget per run.

C · ÜBER-AUTOMATIONC · OVER-AUTOMATION

Zu viel VertrauenToo much trust

Wer den Agent ohne Rückfrage senden lässt, riskiert peinliche oder teure Aktionen. Lösung: Approval-Gates an heiklen Stellen.

Letting the agent send without asking risks embarrassing or costly actions. Solution: approval gates at critical points.

2 / 3

FAUSTREGELRULE OF THUMB

In zwei von drei Runs muss der Agent mindestens einmal selbst korrigieren. Ein Run ohne Selbstkorrektur ist eher die Ausnahme als die Regel. Wer das versteht, baut Guardrails ein, statt auf reibungslose Magie zu hoffen.

In two out of three runs, the agent must self-correct at least once. A run without self-correction is the exception rather than the rule. Those who understand this build guardrails instead of hoping for frictionless magic.

● 08· GLOSSAR· GLOSSARY

Fünf Begriffe,
die jetzt fallen.

Five terms
that come up now.

PLAN-ACT-OBSERVE Der Drei-Takt-Loop, in dem ein Agent arbeitet. Plan: zerlegen. Act: handeln. Observe: prüfen. Wiederholen, bis das Ziel steht. In manchen Frameworks heißt das auch ReAct. The three-beat loop in which an agent works. Plan: decompose. Act: act. Observe: check. Repeat until goal is achieved. In some frameworks this is also called ReAct.
CHAIN OF THOUGHT Der innere Monolog, in dem das Modell Schritt für Schritt mit sich selbst spricht, bevor es handelt. Macht Antworten messbar zuverlässiger. The inner monologue in which the model talks to itself step by step before acting. Makes responses measurably more reliable.
MEMORY Drei Schichten: Kurzzeit für die laufende Aufgabe, Session für die laufende Session, Langzeit für alles, was immer gilt. Three layers: short-term for the current task, session for the current session, long-term for everything that always applies.
SELF-CORRECTION Die Fähigkeit, einen Fehler zu erkennen, zu interpretieren und einen anderen Weg zu probieren. Ohne diese Fähigkeit ist der Agent eine bessere Skript-Engine. The ability to recognize an error, interpret it, and try another path. Without this ability, the agent is a glorified script engine.
GUARDRAIL Regeln und harte Limits, die den Agent vor sich selbst schützen. Maximal N Schritte. Maximal X Euro. Approval bei kritischen Aktionen. Rules and hard limits that protect the agent from itself. Maximum N steps. Maximum X euros. Approval for critical actions.
● 09· NÄCHSTE LEHRTAFEL· NEXT ARTICLE

Du kennst das Denken.
Was kommt als Nächstes?

You know the thinking.
What’s next?

03

Tools, MCPs, PluginsTools, MCPs, Plugins

Was Agents an Werkzeugen haben. Was du für dich anbinden kannst. Wie das alles zusammensteckt. Inkl. realer Beispiele.

What tools agents have. What you can connect for yourself. How it all fits together. Including real examples.

04

Risiko, Kontrolle, TrustRisk, Control, Trust

Wo Agents schiefgehen, wie man sie absichert, wann Mensch im Loop sein muss. Mit Checkliste für eigene Setups.

Where agents go wrong, how to secure them, when humans must be in the loop. With checklist for your own setups.

05

Dein erster AgentYour First Agent

Vom Anwendungsfall bis zum Prototyp. Welche Schritte, welche Werkzeuge, welche Stolperfallen.

From use case to prototype. What steps, what tools, what pitfalls.

┌──→ ZURÜCK ZU LEHRTAFEL 01BACK TO ARTICLE 01 LEHRTAFEL 03 LESENREAD ARTICLE 03 ┌──→