Zum Inhalt springen
>_<
AI EngineeringWiki

Agent Team skalieren und anpassen

Patterns · 9 min

📋 Auf einen Blick

Ein Agent-Team wächst mit deinen Anforderungen. Neue Agenten folgen einem Fünf-Schritte-Prozess: Rolle definieren, Bot erstellen, Konfiguration schreiben, Polling einrichten, beim Manager registrieren. Bei der Skalierung auf fünf oder mehr Agenten werden API-Kosten, Maschinenressourcen und Koordinationskomplexität zu wichtigen Faktoren.

Einen neuen Agenten hinzufügen

Das Hinzufügen eines neuen Agenten folgt einem wiederholbaren Prozess. Hier am Beispiel eines Kundensupport-Agenten:

1

Rolle definieren

Was macht dieser Agent? Der Kundensupport-Agent liest eingehende Kunden-E-Mails, entwirft passende Antworten, kategorisiert die Anfrage und eskaliert komplexe Themen an einen Menschen.

2

Bot-Account erstellen

Im Team-Chat (z.B. Team-Chat) einen neuen Bot erstellen mit beschreibendem Namen. Access Token generieren und sicher speichern.

3

Konfiguration schreiben

Eine CLAUDE.md erstellen, die Rolle, Tools und Kontext definiert. Der Support-Agent braucht Zugriff auf Produktdokumentation, Preisinformationen, Rückgabe-Richtlinien und den Brand Voice Guide. Er sollte Dateien lesen und schreiben können, aber keine Systembefehle ausführen.

4

Polling konfigurieren

Das Polling-Script mit dem Token und der User ID des neuen Bots konfigurieren und auf die passenden Channels einstellen.

5

Beim Manager registrieren

Die CLAUDE.md des Managers aktualisieren, um den neuen Agenten ins Roster und die Delegationsregeln aufzunehmen. Definieren, wann der Manager Aufgaben an den neuen Agent routen soll.

Bestehende Rollen anpassen

Du kannst das Verhalten jedes Agenten ändern, indem du seine CLAUDE.md bearbeitest:

  • Aufgabenbereich erweitern: Dem Coding Agent die Verantwortung für Datenbank-Migrationen zusätzlich zur Feature-Entwicklung geben
  • Aufgabenbereich einengen: Einen Generalisten-Agenten in zwei Spezialisten aufteilen wenn die Arbeitslast wächst

Beim Einengen: Die Delegationsregeln des Managers aktualisieren. Wenn du den Coding Agent in Frontend und Backend aufteilst, muss der Manager wissen, welche Art von Aufgabe wohin geht.

Multi-Agent Workflows

Über einzelne Aufgaben hinaus kannst du koordinierte Abläufe erstellen, bei denen mehrere Agenten zusammenarbeiten:

WorkflowAblauf
Content PipelineResearch Agent erstellt Brief → Content Agent schreibt Post → QA Agent prüft → Manager koordiniert
DeploymentCoding Agent bereitet Release vor → QA testet → Coding deployed → Monitoring verifiziert → Content schreibt Release Notes
Kunden-OnboardingSupport empfängt Kunde → Content erstellt Willkommens-Mail → Coding richtet Account ein → Manager trackt Abschluss

Diese Workflows werden über die Delegations-Anweisungen des Managers implementiert. Du beschreibst die Schritte in der CLAUDE.md des Managers, und der Manager orchestriert die Sequenz automatisch.

Skalierungs-Faktoren

FaktorDetailsMassnahme
API-KostenJeder Agent verbraucht Credits bei der AufgabenbearbeitungPolling-Intervalle anpassen: beschäftigter Agent alle 30s, ruhiger alle 5min
MaschinenressourcenJede Instanz nutzt Memory und CPU2-3 Agenten pro Maschine, bei grösseren Teams auf mehrere Maschinen verteilen
Channel NoiseMehr Agenten = geschäftigerer HauptkanalSub-Channels für verschiedene Workflows erstellen
KoordinationAb 5+ Agenten: informelle Koordination reicht nichtStrukturierte Delegationsregeln, Prioritätssysteme, Konfliktlösung dokumentieren

Fortgeschrittene Patterns

Zeitgesteuerte Agenten

Nicht alle Agenten müssen auf Mentions reagieren. Manche arbeiten nach Zeitplan: Der Monitoring Agent prüft die Infrastruktur alle fünf Minuten, der Analytics Agent erstellt tägliche Reports, der Backup Agent verifiziert Backups jede Nacht. Für zeitgesteuerte Agenten die Polling-Loop durch ein Cron-getriggertes Script ersetzen.

Cross-Agent Memory

Agenten können Kontext über eine gemeinsame MEMORY.md teilen. Der Coding Agent notiert ein Deployment, der QA Agent weiss dann was zu testen ist, der Monitoring Agent weiss worauf er achten muss. Shared Memory erzeugt Team-Bewusstsein ohne direkte Kommunikation.

Graceful Degradation

Wenn ein Agent offline geht, sollte das System nicht zum Stillstand kommen. Der Manager sollte erkennen wenn eine delegierte Aufgabe keine Antwort bekommt und entweder einen Retry starten, an einen alternativen Agenten delegieren oder an einen Menschen eskalieren. Timeout-Logik in die CLAUDE.md des Managers einbauen.

💡 Praxis-Tipp

Starte mit zwei bis drei Agenten und erweitere schrittweise. Jeder neue Agent sollte einen klaren, messbaren Nutzen haben. Lieber wenige Spezialisten als viele Generalisten.

Weiterführend

Quellen

War dieser Artikel hilfreich?

Nächster Schritt: vom Wissen in die Umsetzung

Wenn du mehr willst als Theorie: Setups, Workflows und Vorlagen aus dem echten Betrieb für Teams, die lokale und dokumentierte AI-Systeme wollen.

Warum AI Engineering
  • Lokal und self-hosted gedacht
  • Dokumentiert und auditierbar
  • Aus eigener Runtime entwickelt
  • Made in Austria
Kein Ersatz für Rechtsberatung.