Agent Team skalieren | AI Engineering Wiki

📋 Auf einen Blick

Ein Agent-Team wächst mit deinen Anforderungen. Neue Agenten folgen einem Fünf-Schritte-Prozess: Rolle definieren, Bot erstellen, Konfiguration schreiben, Polling einrichten, beim Manager registrieren. Bei der Skalierung auf fünf oder mehr Agenten werden API-Kosten, Maschinenressourcen und Koordinationskomplexität zu wichtigen Faktoren.

Einen neuen Agenten hinzufügen

Das Hinzufügen eines neuen Agenten folgt einem wiederholbaren Prozess. Hier am Beispiel eines Kundensupport-Agenten:

Rolle definieren

Was macht dieser Agent? Der Kundensupport-Agent liest eingehende Kunden-E-Mails, entwirft passende Antworten, kategorisiert die Anfrage und eskaliert komplexe Themen an einen Menschen.

Bot-Account erstellen

Im Team-Chat (z.B. Team-Chat) einen neuen Bot erstellen mit beschreibendem Namen. Access Token generieren und sicher speichern.

Konfiguration schreiben

Eine CLAUDE.md erstellen, die Rolle, Tools und Kontext definiert. Der Support-Agent braucht Zugriff auf Produktdokumentation, Preisinformationen, Rückgabe-Richtlinien und den Brand Voice Guide. Er sollte Dateien lesen und schreiben können, aber keine Systembefehle ausführen.

Polling konfigurieren

Das Polling-Script mit dem Token und der User ID des neuen Bots konfigurieren und auf die passenden Channels einstellen.

Beim Manager registrieren

Die CLAUDE.md des Managers aktualisieren, um den neuen Agenten ins Roster und die Delegationsregeln aufzunehmen. Definieren, wann der Manager Aufgaben an den neuen Agent routen soll.

Bestehende Rollen anpassen

Du kannst das Verhalten jedes Agenten ändern, indem du seine CLAUDE.md bearbeitest:

Aufgabenbereich erweitern: Dem Coding Agent die Verantwortung für Datenbank-Migrationen zusätzlich zur Feature-Entwicklung geben
Aufgabenbereich einengen: Einen Generalisten-Agenten in zwei Spezialisten aufteilen wenn die Arbeitslast wächst

Beim Einengen: Die Delegationsregeln des Managers aktualisieren. Wenn du den Coding Agent in Frontend und Backend aufteilst, muss der Manager wissen, welche Art von Aufgabe wohin geht.

Multi-Agent Workflows

Über einzelne Aufgaben hinaus kannst du koordinierte Abläufe erstellen, bei denen mehrere Agenten zusammenarbeiten:

Workflow	Ablauf
Content Pipeline	Research Agent erstellt Brief → Content Agent schreibt Post → QA Agent prüft → Manager koordiniert
Deployment	Coding Agent bereitet Release vor → QA testet → Coding deployed → Monitoring verifiziert → Content schreibt Release Notes
Kunden-Onboarding	Support empfängt Kunde → Content erstellt Willkommens-Mail → Coding richtet Account ein → Manager trackt Abschluss

Diese Workflows werden über die Delegations-Anweisungen des Managers implementiert. Du beschreibst die Schritte in der CLAUDE.md des Managers, und der Manager orchestriert die Sequenz automatisch.

Skalierungs-Faktoren

Faktor	Details	Massnahme
API-Kosten	Jeder Agent verbraucht Credits bei der Aufgabenbearbeitung	Polling-Intervalle anpassen: beschäftigter Agent alle 30s, ruhiger alle 5min
Maschinenressourcen	Jede Instanz nutzt Memory und CPU	2-3 Agenten pro Maschine, bei grösseren Teams auf mehrere Maschinen verteilen
Channel Noise	Mehr Agenten = geschäftigerer Hauptkanal	Sub-Channels für verschiedene Workflows erstellen
Koordination	Ab 5+ Agenten: informelle Koordination reicht nicht	Strukturierte Delegationsregeln, Prioritätssysteme, Konfliktlösung dokumentieren

Fortgeschrittene Patterns

Zeitgesteuerte Agenten

Nicht alle Agenten müssen auf Mentions reagieren. Manche arbeiten nach Zeitplan: Der Monitoring Agent prüft die Infrastruktur alle fünf Minuten, der Analytics Agent erstellt tägliche Reports, der Backup Agent verifiziert Backups jede Nacht. Für zeitgesteuerte Agenten die Polling-Loop durch ein Cron-getriggertes Script ersetzen.

Cross-Agent Memory

Agenten können Kontext über eine gemeinsame MEMORY.md teilen. Der Coding Agent notiert ein Deployment, der QA Agent weiss dann was zu testen ist, der Monitoring Agent weiss worauf er achten muss. Shared Memory erzeugt Team-Bewusstsein ohne direkte Kommunikation.

Graceful Degradation

Wenn ein Agent offline geht, sollte das System nicht zum Stillstand kommen. Der Manager sollte erkennen wenn eine delegierte Aufgabe keine Antwort bekommt und entweder einen Retry starten, an einen alternativen Agenten delegieren oder an einen Menschen eskalieren. Timeout-Logik in die CLAUDE.md des Managers einbauen.

💡 Praxis-Tipp

Starte mit zwei bis drei Agenten und erweitere schrittweise. Jeder neue Agent sollte einen klaren, messbaren Nutzen haben. Lieber wenige Spezialisten als viele Generalisten.

Weiterführend

• Agent Rollen — Das Rollenmodell verstehen
• AI Agent Team aufbauen — Von Null zum ersten Team
• Memory Management — Wie Agenten Wissen über Sessions hinweg teilen

Quellen

Anthropic: Agent Patterns — Multi-Agent Orchestration
Anthropic: Claude Code Overview — Skills, Agents, Hooks

Agent Team skalieren und anpassen