Künstliche Intelligenz

Cloudflare Project Think erklärt: Dauerhafte KI-Agenten

Cloudflares Project Think bringt dauerhafte Ausführung, Sub-Agenten und persistente Sessions ins Agents SDK. Praxis-Guide für Mobile und Automatisierung.

İlker Ulusoy 2026-05-05 8 Min. Lesezeit

Cloudflare hat während der Agents Week 2026 mit Project Think die nächste Schicht für sein Agents SDK vorgestellt: ein Bündel an Primitiven, das zustandslose Agenten-Loops in langlaufende, absturzsichere Worker mit eigenen sandboxed Sub-Agenten und persistenten Sessions verwandelt. Parallel dazu kam Agent Lee, ein integrierter Dashboard-Agent, der in der Beta bereits rund eine Viertelmillion Tool-Aufrufe pro Tag bearbeitet. Dieser Leitfaden zeigt Schritt für Schritt, was Project Think für Mobile-, Automatisierungs- und Orchestrierungs-Teams wirklich ändert und wo es neben n8n, Hermes und OpenClaw passt.

Die meisten produktiven Agenten sterben heute, sobald die Maschine rebootet. Der Prozess hält den Plan, der Call Stack hält den Zustand, und ein einziger fehlgeschlagener Schritt wirft den ganzen Lauf weg. Project Think ist Cloudflares Antwort darauf: dauerhafte Ausführung mit Fibers, isolierte Sub-Agenten mit eigener SQLite und typisiertem RPC, sowie persistente Sessions, die Deploys überleben. Veröffentlicht als @cloudflare/think im Cloudflare Agents SDK.

Die 30-Sekunden-Version

Project Think macht Cloudflare-Agenten standardmäßig dauerhaft. Abstürze, Deploys und lange Wartezeiten setzen den Lauf nicht mehr zurück. Sub-Agenten bekommen eigenen Zustand und typisiertes RPC. Agent Lee ist die erste opinionierte UI auf diesem Stack und sitzt direkt im Cloudflare-Dashboard.

Was Project Think tatsächlich liefert

Project Think ist nicht ein einzelnes Feature. Es ist ein kleines Bündel an Primitiven, das das Agents SDK von zustandsloser Orchestrierung in ein dauerhaftes Akteur-Modell verschiebt:

  • Dauerhafte Ausführung mit Fibers — Checkpointing, automatischer Keepalive und Crash-Recovery, sodass ein langer Lauf ab dem letzten sicheren Schritt fortgesetzt wird statt von vorn zu beginnen.
  • Sub-Agenten — isolierte Kind-Agenten mit eigener SQLite und typisierter RPC-Schnittstelle, sodass ein Eltern-Agent Worker spawnen kann, ohne ungewollt Speicher zu teilen.
  • Persistente Sessions — Konversations- und Tool-Zustand überleben Deploys, Region-Failover und das erneute Verbinden eines Mobile-Clients.
  • Sandboxed Code-Ausführung — Agenten können generiertes TypeScript in einer Sandbox ausführen, ohne die Worker-Grenze zu verlassen.
  • Eine opinionierte Basisklasse — verbindet die Primitive, sodass Sie sie nicht in jedem Projekt von Hand zusammenkleben.

Die Form ist wichtig. Jedes Primitiv ist klein genug, um es einzeln zu adoptieren, und zusammen entfernen sie den Großteil der Bug-Klasse "warum hat der Agent vergessen", die langlaufende Automatisierung sonst plagt.

Warum dauerhafte Ausführung das Design ändert

Sobald ein Lauf pausierbar, persistierbar und fortsetzbar ist, öffnet sich der Designraum für Agenten in drei konkreten Richtungen:

Lange Wartezeiten werden kostenlos

Ein Workflow kann Stunden auf einen Webhook, eine menschliche Freigabe oder einen langsamen Drittanbieter-Job warten, ohne einen Prozess offen zu halten. Der Fiber schläft und wacht beim Ereignis auf. Das ändert die Kostenrechnung für jeden Agenten, der bisher einen Worker warmhalten musste, nur um zu warten.

Crash-Recovery ist nicht mehr Ihr Problem

Wenn die Runtime nach jedem Tool-Aufruf checkpointet, setzt ein Absturz mitten im Lauf am letzten sicheren Schritt fort. Sie schreiben keine eigene Resume-Logik und duplizieren keine Seiteneffekte beim Retry. Allein das spart eine Menge eigene Queue-Klempnerei.

Sub-Agenten lecken keinen Zustand mehr

Jeder Sub-Agent bekommt seine eigene SQLite und einen typisierten RPC-Vertrag. Ein Eltern-Agent kann das Arbeitsgedächtnis eines Kindes nicht versehentlich lesen, und ein Kind kann den Plan des Elternteils nicht mutieren. Das macht Multi-Agenten-Flows viel leichter zu verstehen als Patterns mit geteiltem Kontext.

Die Arbeitseinheit verschiebt sich von "einem Request-Handler, der ein LLM aufruft" hin zu "einem dauerhaften Akteur, der Plan und Kinder besitzt". Die Runtime, nicht Ihr Code, hält den Lauf am Leben.

Project Think gegen den Stack, den Sie schon haben

Project Think ersetzt nicht n8n, Hermes oder einen Conductor-artigen Router. Es sitzt auf einer anderen Schicht. Am klarsten zeigt sich das nebeneinander:

SchichtWerkzeugWas es besitzt
Visueller Workflown8nTrigger, Integrationen, lesbare Flow-Schritte
Mobile-OrchestrierungHermes WorkspaceFreigaben am Handy und Agent-Steuerebene
RoutingSakana ConductorWählt, welches Modell welche Teilaufgabe übernimmt
Dauerhafte RuntimeCloudflare Project ThinkAbsturzsichere Ausführung, Sub-Agenten, persistente Sessions
Dashboard-AgentAgent LeeBedient Cloudflare-Ressourcen aus der gewohnten UI

Ein realer Produktions-Stack wird mehrere davon nutzen. n8n hält die lesbare Karte eines Flows. Hermes ist das Handy für Freigaben. Project Think ist die Engine, die die langlaufenden Teile dieses Flows eine schlechte Nacht überleben lässt.

Agent Lee, und warum er zählt

Agent Lee ist die erste First-Party-UI auf dem Project-Think-Stack. Er lebt im Cloudflare-Dashboard, kennt Ihre Workers, Zonen, DNS und Fehlerraten und lässt Sie in natürlicher Sprache darauf reagieren. Cloudflare berichtet von rund 18.000 täglichen Nutzerinnen und etwa einer Viertelmillion Tool-Aufrufe pro Tag während der aktiven Beta.

Interessant ist nicht die Chat-Box. Interessant ist der Beweis. Ein Dashboard-Agent, der echte Produktions-Ressourcen anfasst, ist genau die Art von langer, verzweigter, absturzanfälliger Aufgabe, die dauerhafte Ausführung und isolierte Sub-Agenten brauchte, um vertrauenswürdig zu sein. Wenn Cloudflare Agent Lee auf Project Think betreibt, sind die Primitive im Großeinsatz getestet, bevor Sie sie übernehmen.

Warum das für mobile Automatisierung zählt

Eine dauerhafte Runtime ist die fehlende Hälfte der Mobile-Orchestrierungs-Geschichte aus Hermes Workspace mobile und Agenten-Orchestrierung. Das Handy ist die Freigabe-Schicht. Project Think ist die Engine, die den Lauf am Leben hält, während Sie in der U-Bahn, im Flugzeug oder in einem Meeting auf das Tippen einer Kollegin warten.

Fünf praktische Anwendungsfälle für Halmob-artige Stacks

n8n-Flows, die Tage warten, nicht Sekunden

Verschieben Sie die lange wartenden Zweige eines n8n-Flows (Vertragsfreigabe, Rechnungsprüfung, geplante Eskalation) in einen Project-Think-Agenten. Die n8n-Seite bleibt die visuelle Karte. Die Cloudflare-Seite besitzt das Warten und das Fortsetzen.

Mobile-Assistent mit absturzsicheren Sessions

Eine Nutzerin startet eine Anfrage am Handy, wechselt zweimal das Netz und kommt eine Stunde später zurück. Persistente Sessions bedeuten, dass der Agent genau dort weitermacht, wo er stehen geblieben ist, mit demselben Plan, derselben Tool-Historie und demselben Freigabe-Zustand.

Sub-Agenten pro Integration

Jede Integration (CRM, Abrechnung, Kalender) bekommt einen dedizierten Sub-Agenten mit eigener SQLite. Der Eltern-Agent sieht nur die typisierte RPC-Oberfläche, sodass eine experimentelle neue Integration den Rest des Flows nicht beschädigt, wenn sie sich falsch verhält.

Hintergrund-Recherche, die Deploys überlebt

Langlaufende Recherche- oder Datensammelaufgaben müssen nicht mehr bei jedem Deploy pausieren. Der Fiber checkpointet, der Deploy läuft durch, und der nächste Schritt führt auf dem neuen Codepfad mit dem alten Plan weiter.

Operative Agenten, die echte Infrastruktur anfassen

Agent Lee zeigt das Muster: eine Chat-Oberfläche, die Produktions-Ressourcen liest und ändert, mit einer dauerhaften Spur hinter jeder Aktion. Project Think ist das, was diese Idee sicher genug macht, um sie einem Operations-Team an die Hand zu geben.

So starten Sie

  1. 1Lesen Sie die Project-Think-Ankündigung im Cloudflare-Blog und überfliegen Sie die Agents-SDK-Referenz für die neuen Primitive.
  2. 2Wählen Sie eine bestehende Automatisierung mit langer Wartezeit oder unzuverlässigem Fortsetzen. Das ist der billigste Weg, den Wert dauerhafter Ausführung zu spüren.
  3. 3Verpacken Sie diesen Flow in einen Project-Think-Agenten. Verschieben Sie die Wartezeit in einen Fiber. Fügen Sie für die fragilste Integration einen einzelnen Sub-Agenten hinzu.
  4. 4Instrumentieren Sie den Lauf. Loggen Sie jeden Checkpoint, jeden Sub-Agenten-Aufruf und jedes Resume. Das Log ist Ihr Argument, das Muster später auszuweiten oder zurückzudrehen.

Wenn Sie die Agenten-Schicht noch sortieren, erklärt unser OpenClaw-101-Leitfaden die Bausteine (Tools, Skills, Berechtigungen, Gedächtnis), und der Beitrag zur Orchestrierungs-Ära des agentischen Codings setzt den breiteren Kontext, in den Project Think einrastet.


Fazit

Project Think ist kein neues Modell und kein neuer Harness. Es ist die Runtime-Schicht, die dem Agents SDK gefehlt hat: dauerhafte Ausführung, isolierte Sub-Agenten und persistente Sessions, eingewickelt in eine opinionierte Basisklasse. Agent Lee ist der Beweis, dass der Stack unter realer Last funktioniert. Für ein Team, das schon mit n8n, mobiler Orchestrierung oder einem Router-artigen Agent-Muster baut, ist das das Stück, das die langen Teile eines Flows einen schlechten Tag überleben lässt.

Die Frage für Ihren nächsten Sprint ist einfach. Welche Ihrer aktuellen Agenten würden sich besser verhalten, wenn die Runtime, nicht Ihr Code, den Lauf über Abstürze, Deploys und lange Wartezeiten am Leben hielte?