Vom Use-Case bis zum lauffähigen Prototyp. Kein Framework-Marathon, keine Cloud-Migration. Eine klare Reihenfolge: Ziel, Bestandteile, sechs Schritte, ein Test-Run, ein Echo. Diese Tafel ist die Anleitung, die du brauchst, wenn du das erste Mal selbst einen Agent zusammensteckst.
Der erste Agent scheitert oder gelingt schon vor dem Bauen. An der Wahl des Use-Cases. Ein guter erster Use-Case ist klein genug, dass du ihn fertig bekommst, und groß genug, dass das Ergebnis spürbar Zeit spart. Drei Fragen helfen, ihn zu finden.
| FRAGE | GUT GEEIGNET | EHER NICHT |
|---|---|---|
| Wie oft kommt es vor? | Mehrmals pro Woche | Einmal im Quartal |
| Wie klar ist das Ziel? | In einem Satz erklärbar | Hängt vom Bauchgefühl ab |
| Wie viele Quellen? | Zwei bis fünf, klar abgegrenzt | Offenes Internet, beliebige Domänen |
| Was kostet ein Fehler? | Reversibel, intern | Externe Wirkung, irreversibel |
| Wer prüft das Ergebnis? | Du, in unter einer Minute | Niemand, oder zu spät |
FAUSTREGEL · USE-CASE
Wenn du eine Aufgabe in dieser Woche dreimal selbst gemacht hast, ist sie ein guter Kandidat. Einmaliges baut man nicht als Agent. Repeatables verdienen einen.
Egal ob du in Claude, OpenAI, einem Plugin-System oder selbst gebauter Pipeline arbeitest, jeder funktionierende Agent besteht aus fünf Teilen. Wer einen weglässt, baut keinen Agent, sondern einen netten Chatbot.
Ein Satz, der das Ergebnis konkret beschreibt. Nicht das Verfahren. Beispiel: "Liste der fünf interessantesten Wettbewerber-News der letzten 7 Tage, mit Quellen."
Drei bis sieben Tools. Mehr verwirrt das Modell. Jedes Tool mit klarer Beschreibung und engem Scope. Lieber eines weglassen als zu viele zulassen.
Mindestens Kurzzeit für den laufenden Run. Falls du dem Agent Vorlieben mitgibst, auch Langzeit. Ohne Memory kein lernender Agent.
Step-Limit, Token-Budget, Approval-Gates an heiklen Stellen. Aus Tafel 04 übernehmen, je nach Risiko der Aktionen.
Ein Kriterium, an dem du erkennst, ob der Run gut war. Beispiel: "Mindestens 3 verifizierte Quellen pro Wettbewerber, Tonalität neutral." Ohne Maß keine Verbesserung.
Kein einziger Agent läuft im ersten Wurf. Drei bis fünf Iterationen sind Standard, bevor er das tut, was du dir vorgestellt hast. Plane sie ein.
Reihenfolge zählt. Wer mit Tools anfängt, baut sich in eine Sackgasse. Wer mit dem Erfolgsmaß anfängt, kommt schneller ans Ziel als gedacht. Die folgenden sechs Schritte sind die kürzeste Strecke, die in der Praxis funktioniert.
Ein Satz. Konkret. Kein Verfahren, nur Ergebnis.
Wie messbar gut sieht der Run aus?
3 bis 7. Mit Scope, mit Beschreibung.
Limits, Approval-Gates, Kill-Switch.
Drei Beispielfälle. Manuell prüfen.
Live mit Audit. Erste Stichproben.
In dieser Reihenfolge fällt jeder Schritt leicht, weil der vorherige geklärt ist. Wer Test überspringt, zahlt es im Run. Wer Erfolg überspringt, weiß nie, ob es funktioniert hat. Wer Schutz überspringt, lernt seine Lektion einmalig und teuer.
Beispiel: ein Agent, der jeden Montag fünf Wettbewerber-News zusammenstellt. Klick durch die fünf Phasen und sieh, wie aus einem Satz eine lauffähige Konfiguration wird. Die JSON-Schnipsel sind echte Agent-Konfigurationen, gekürzt zur Lesbarkeit.
SIMULATION · BUILDER-OBERFLÄCHEN UNTERSCHEIDEN SICH JE PLATTFORM, DAS PRINZIP IST IDENTISCH.
Die folgenden fünf Fehler tauchen in fast jedem ersten Setup auf. Wer sie kennt, vermeidet sie. Wer sie ignoriert, lernt sie über Schmerz. Beides funktioniert, das eine ist günstiger.
A · ZU VIELE TOOLS
Der Agent verzettelt sich, wählt das falsche Werkzeug, dreht im Kreis. Cut on six.
B · KEIN ZIELSATZ
"Hilf mir mit Wettbewerbern" ist kein Ziel. Ohne klaren Satz kein klarer Output.
C · KEIN MASS
Ohne Erfolgsmaß weißt du nicht, wann du fertig bist. Iteration ohne Maß ist Bastelei.
D · KEIN BUDGET
Ein vergessener Loop verbrennt in zehn Minuten dein Monatsbudget. Limits sind Pflicht.
E · PRODUCTION ZUERST
Wer ohne drei Test-Runs live geht, lernt seine Failure-Modi vor Publikum kennen.
FAUSTREGEL · TEST-RUNS
Drei Test-Runs vor dem ersten produktiven sind das Minimum. Idealerweise mit drei verschiedenen Eingabe-Typen, damit der Agent in der Bandbreite getestet ist und nicht nur im Idealfall glänzt.
06
Mehrere Agents, die zusammen arbeiten. Rollen, Übergaben, Orchestrierung. Wann das funktioniert und wann nicht.
07
Wohin sich Agentic AI bewegt. Welche Trends bleiben, welche verschwinden, was du jetzt schon einüben solltest.
∞
Dein erster Agent ist nie fertig. Wie du ihn pflegst, nachschärfst und Schritt für Schritt zu einem ernsthaften Werkzeug machst.