Agents machen Fehler. Manche kostenlos, manche teuer. Diese Tafel zeigt fünf typische Versagensmuster, drei Schichten Schutz, das Spektrum zwischen Vorschlag und Vollautomatik, und am Ende eine Checkliste mit zwölf Punkten, die du vor jedem produktiven Setup durchgehst.
Agents make mistakes. Some cheap, some costly. This module shows five typical failure patterns, three layers of protection, the spectrum between suggestion and full automation, and a twelve-point checklist you run through before any production setup.
Fast jedes Versagen lässt sich auf eine von fünf Mustern zurückführen. Wer diese fünf kennt, kann sie früh erkennen, einplanen und abfangen. Wer sie ignoriert, baut sich böse Überraschungen ein.
Nearly every failure traces back to one of five patterns. Those who know them can spot them early, plan for them, and intercept them. Those who ignore them build in nasty surprises.
01 · HALLUZINATION
Erfindet Quellen, Zahlen, Zitate. Klingt richtig, ist es nicht. Häufigster Modus, schwer erkennbar in glatten Texten. Invents sources, numbers, quotes. Sounds correct, isn't. The most common mode, hard to spot in polished text.
02 · TOOL-MISUSE
Greift ein Tool, das sich gleich anhört, aber etwas anderes tut. Liest statt zu schreiben. Sendet statt zu speichern. Reaches for a tool that sounds similar but does something different. Reads instead of writing. Sends instead of saving.
03 · LOOP-FALLE
Korrigiert die Korrektur, dreht sich im Kreis. Frisst Tokens und Zeit, ohne näher ans Ziel zu kommen. Corrects the correction, spins in circles. Burns tokens and time without getting closer to the goal.
04 · GOAL DRIFT
Optimiert das Falsche. Fokussiert auf einen Nebenaspekt und vergisst den eigentlichen Auftrag. Entsteht oft mit langer Kontexttiefe. Optimises the wrong thing. Fixates on a side detail and forgets the actual task. Often emerges with deep context.
05 · PROMPT INJECTION
Eine externe Quelle schmuggelt versteckte Anweisungen in den Kontext. Der Agent folgt ihnen, statt deinen Auftrag zu erfüllen. An external source smuggles hidden instructions into the context. The agent follows them instead of your task.
FAUSTREGEL · ROHE LÄUFE RULE OF THUMB · RAW RUNS
In zwei von drei produktiven Runs ohne Schutzschicht tritt mindestens einer dieser fünf Modi auf. Nicht jedes Mal teuer, aber häufig genug, dass keine seriöse Setup-Liste an den Modi vorbeikommt.
In two out of three production runs without a protection layer, at least one of these five modes appears. Not always costly, but often enough that no serious setup checklist can ignore them.
Trust ist keine Ja-Nein-Entscheidung. Es ist ein Schieberegler. Für jeden Anwendungsfall sucht man die richtige Stufe: nicht zu eng, sonst fühlt sich der Agent wie ein langsamer Praktikant. Nicht zu offen, sonst fliegt einem etwas um die Ohren.
Trust is not a yes-or-no decision. It is a slider. For each use case you find the right level: not too tight, or the agent feels like a slow intern. Not too open, or something blows up in your face.
┌──→ FAUSTREGEL: ACTION-TOOLS BEGINNEN AUF L1 ODER L2. READ-TOOLS DÜRFEN HÖHER STARTEN. ┌──→ RULE OF THUMB: ACTION TOOLS START AT L1 OR L2. READ TOOLS MAY START HIGHER.
Eine einzige Schutzschicht reicht nie. Der Stand der Praxis sind drei: vor dem Lauf, im Lauf, nach dem Lauf. Jede fängt andere Fehler ab, gemeinsam decken sie das meiste, was schiefgehen kann.
A single protection layer is never enough. The state of the art is three: before the run, during the run, after the run. Each catches different errors; together they cover most of what can go wrong.
| SCHICHT LAYER | INPUT · VOR DEM LAUF INPUT · BEFORE THE RUN | RUNTIME · IM LAUF RUNTIME · DURING THE RUN | OUTPUT · NACH DEM LAUF OUTPUT · AFTER THE RUN |
|---|---|---|---|
| Schützt vor Protects from | Prompt Injection, Daten-Leaks Prompt Injection, data leaks | Loop-Falle, Goal Drift, Kostenexplosion Loop trap, Goal Drift, cost explosion | Halluzination, Tool-Misuse Hallucination, Tool-Misuse |
| Mechanismen Mechanisms | Sanitizer, Scope-Limits, PII-Filter Sanitizer, Scope Limits, PII filter | Step-Limit, Token-Budget, Kill-Switch Step limit, Token budget, Kill switch | Fact-Check, Diff-Vorschau, Approval Fact-check, Diff preview, Approval |
| Wer sieht es Who sees it | Niemand, läuft im Hintergrund Nobody, runs in background | Monitoring-Dashboard, Logs Monitoring dashboard, logs | Du, kurz vor Versand You, just before dispatch |
| Aufwand Effort | Einmalig konfigurieren Configure once | Pro Run-Typ ein Profil One profile per run type | Klick pro relevanter Aktion One click per relevant action |
| Was passiert bei Fehler On failure | Anfrage wird abgewiesen Request is rejected | Run wird abgebrochen Run is terminated | Du widerrufst, kein Schaden You revoke, no damage done |
DEFENSE IN DEPTH
Eine Guardrail-Schicht ist eine Tür. Drei sind ein Schleusen-System. Wenn eine Schicht versagt, fängt die nächste den Schaden ab. Selbst hartnäckige Fehler kommen so selten bis ans Ziel.
One guardrail layer is a door. Three are an airlock system. When one layer fails, the next catches the damage. Even stubborn errors rarely make it through to the end.
Tippe einen Failure-Modus an. Links siehst du, was ohne Schutzschicht passiert. Rechts, was mit der passenden Guardrail anders läuft. Echte Patterns, vereinfacht zur Lesbarkeit.
Tap a failure mode. On the left you see what happens without a protection layer. On the right, what changes with the right guardrail in place. Real patterns, simplified for readability.
SIMULATION · KEINE ECHTEN AKTIONEN. SIMULATION · NO REAL ACTIONS.
Vollautomatik ist selten der richtige Endzustand. In den meisten produktiven Setups bleibt der Mensch an vier Stellen im Loop: vor dem Start, an Schlüsselmomenten, am Ende, und wenn etwas Ungewöhnliches passiert. Vier Plätze, vier Aufgaben.
Full automation is rarely the right end state. In most production setups the human stays in the loop at four points: before the start, at key moments, at the end, and when something unusual happens. Four seats, four responsibilities.
Du gibst Ziel, Budget, Schwellen. Der Agent fängt erst danach an. Verhindert, dass er etwas Falsches überhaupt erst angeht.
You set goal, budget, thresholds. The agent only starts after. Prevents it from going after the wrong thing in the first place.
Vor jeder Action-Tool-Ausführung hält er kurz an, zeigt was er tun will, wartet auf Ja oder Nein. Ein Klick, weiter geht es.
Before each action-tool execution it briefly pauses, shows what it intends to do, waits for yes or no. One click, it continues.
Du prüfst, ob das Ergebnis stimmt, bevor es nach draußen geht. Bei reversiblen Aktionen reicht eine Stichprobe.
You verify the result is correct before it goes out. For reversible actions a spot check is sufficient.
Bei unerwarteten Mustern, neuen Tool-Errors, hohen Kosten ruft der Agent dich aktiv. Standard ist Slack oder Email.
On unexpected patterns, new tool errors, high costs the agent actively calls you. Standard is Slack or email.
Wer alle vier Plätze ungenutzt lässt, hat Vollautomatik gebaut. Wer alle vier durchgehend besetzt, hat manuelle Arbeit mit AI-Anstrich. Die Kunst liegt darin, je nach Risiko nur die nötigen Plätze zu besetzen und die anderen offen zu lassen.
Leaving all four seats empty means you have built full automation. Keeping all four permanently staffed means manual work with an AI coat of paint. The art is filling only the seats the risk demands and leaving the rest open.
Klick die Punkte an, während du sie für dein Setup beantwortest. Wer einen Punkt nicht beantworten kann, ist nicht produktiv-bereit. Wer alle zwölf hat, hat ein robustes Setup.
Click the items as you answer them for your setup. Anyone who cannot answer a point is not production-ready. Anyone with all twelve has a robust setup.
FORTSCHRITT · 0 / 12 PROGRESS · 0 / 12
05
Vom Anwendungsfall bis zum Prototyp. Welche Schritte, welche Werkzeuge, welche Stolperfallen.
From use case to prototype. Which steps, which tools, which pitfalls.
06
Mehrere Agents, die zusammen arbeiten. Rollen, Übergaben, Orchestrierung. Wo das funktioniert und wo nicht.
Multiple agents working together. Roles, handoffs, orchestration. Where it works and where it doesn't.
07
Wohin sich Agentic AI bewegt. Welche Trends bleiben, welche verschwinden, was du jetzt schon einüben solltest.
Where Agentic AI is heading. Which trends stay, which disappear, what you should start practising now.