Cloudflare hat während der Agents Week 2026 mit Project Think die nächste Schicht für sein Agents SDK vorgestellt: ein Bündel an Primitiven, das zustandslose Agenten-Loops in langlaufende, absturzsichere Worker mit eigenen sandboxed Sub-Agenten und persistenten Sessions verwandelt. Parallel dazu kam Agent Lee, ein integrierter Dashboard-Agent, der in der Beta bereits rund eine Viertelmillion Tool-Aufrufe pro Tag bearbeitet. Dieser Leitfaden zeigt Schritt für Schritt, was Project Think für Mobile-, Automatisierungs- und Orchestrierungs-Teams wirklich ändert und wo es neben n8n, Hermes und OpenClaw passt.
Die meisten produktiven Agenten sterben heute, sobald die Maschine rebootet. Der Prozess hält den Plan, der Call Stack hält den Zustand, und ein einziger fehlgeschlagener Schritt wirft den ganzen Lauf weg. Project Think ist Cloudflares Antwort darauf: dauerhafte Ausführung mit Fibers, isolierte Sub-Agenten mit eigener SQLite und typisiertem RPC, sowie persistente Sessions, die Deploys überleben. Veröffentlicht als @cloudflare/think im Cloudflare Agents SDK.
Die 30-Sekunden-Version
Was Project Think tatsächlich liefert
Project Think ist nicht ein einzelnes Feature. Es ist ein kleines Bündel an Primitiven, das das Agents SDK von zustandsloser Orchestrierung in ein dauerhaftes Akteur-Modell verschiebt:
- Dauerhafte Ausführung mit Fibers — Checkpointing, automatischer Keepalive und Crash-Recovery, sodass ein langer Lauf ab dem letzten sicheren Schritt fortgesetzt wird statt von vorn zu beginnen.
- Sub-Agenten — isolierte Kind-Agenten mit eigener SQLite und typisierter RPC-Schnittstelle, sodass ein Eltern-Agent Worker spawnen kann, ohne ungewollt Speicher zu teilen.
- Persistente Sessions — Konversations- und Tool-Zustand überleben Deploys, Region-Failover und das erneute Verbinden eines Mobile-Clients.
- Sandboxed Code-Ausführung — Agenten können generiertes TypeScript in einer Sandbox ausführen, ohne die Worker-Grenze zu verlassen.
- Eine opinionierte Basisklasse — verbindet die Primitive, sodass Sie sie nicht in jedem Projekt von Hand zusammenkleben.
Die Form ist wichtig. Jedes Primitiv ist klein genug, um es einzeln zu adoptieren, und zusammen entfernen sie den Großteil der Bug-Klasse "warum hat der Agent vergessen", die langlaufende Automatisierung sonst plagt.
Warum dauerhafte Ausführung das Design ändert
Sobald ein Lauf pausierbar, persistierbar und fortsetzbar ist, öffnet sich der Designraum für Agenten in drei konkreten Richtungen:
Lange Wartezeiten werden kostenlos
Ein Workflow kann Stunden auf einen Webhook, eine menschliche Freigabe oder einen langsamen Drittanbieter-Job warten, ohne einen Prozess offen zu halten. Der Fiber schläft und wacht beim Ereignis auf. Das ändert die Kostenrechnung für jeden Agenten, der bisher einen Worker warmhalten musste, nur um zu warten.
Crash-Recovery ist nicht mehr Ihr Problem
Wenn die Runtime nach jedem Tool-Aufruf checkpointet, setzt ein Absturz mitten im Lauf am letzten sicheren Schritt fort. Sie schreiben keine eigene Resume-Logik und duplizieren keine Seiteneffekte beim Retry. Allein das spart eine Menge eigene Queue-Klempnerei.
Sub-Agenten lecken keinen Zustand mehr
Jeder Sub-Agent bekommt seine eigene SQLite und einen typisierten RPC-Vertrag. Ein Eltern-Agent kann das Arbeitsgedächtnis eines Kindes nicht versehentlich lesen, und ein Kind kann den Plan des Elternteils nicht mutieren. Das macht Multi-Agenten-Flows viel leichter zu verstehen als Patterns mit geteiltem Kontext.
Die Arbeitseinheit verschiebt sich von "einem Request-Handler, der ein LLM aufruft" hin zu "einem dauerhaften Akteur, der Plan und Kinder besitzt". Die Runtime, nicht Ihr Code, hält den Lauf am Leben.
Project Think gegen den Stack, den Sie schon haben
Project Think ersetzt nicht n8n, Hermes oder einen Conductor-artigen Router. Es sitzt auf einer anderen Schicht. Am klarsten zeigt sich das nebeneinander:
| Schicht | Werkzeug | Was es besitzt |
|---|---|---|
| Visueller Workflow | n8n | Trigger, Integrationen, lesbare Flow-Schritte |
| Mobile-Orchestrierung | Hermes Workspace | Freigaben am Handy und Agent-Steuerebene |
| Routing | Sakana Conductor | Wählt, welches Modell welche Teilaufgabe übernimmt |
| Dauerhafte Runtime | Cloudflare Project Think | Absturzsichere Ausführung, Sub-Agenten, persistente Sessions |
| Dashboard-Agent | Agent Lee | Bedient Cloudflare-Ressourcen aus der gewohnten UI |
Ein realer Produktions-Stack wird mehrere davon nutzen. n8n hält die lesbare Karte eines Flows. Hermes ist das Handy für Freigaben. Project Think ist die Engine, die die langlaufenden Teile dieses Flows eine schlechte Nacht überleben lässt.
Agent Lee, und warum er zählt
Agent Lee ist die erste First-Party-UI auf dem Project-Think-Stack. Er lebt im Cloudflare-Dashboard, kennt Ihre Workers, Zonen, DNS und Fehlerraten und lässt Sie in natürlicher Sprache darauf reagieren. Cloudflare berichtet von rund 18.000 täglichen Nutzerinnen und etwa einer Viertelmillion Tool-Aufrufe pro Tag während der aktiven Beta.
Interessant ist nicht die Chat-Box. Interessant ist der Beweis. Ein Dashboard-Agent, der echte Produktions-Ressourcen anfasst, ist genau die Art von langer, verzweigter, absturzanfälliger Aufgabe, die dauerhafte Ausführung und isolierte Sub-Agenten brauchte, um vertrauenswürdig zu sein. Wenn Cloudflare Agent Lee auf Project Think betreibt, sind die Primitive im Großeinsatz getestet, bevor Sie sie übernehmen.
Warum das für mobile Automatisierung zählt
Fünf praktische Anwendungsfälle für Halmob-artige Stacks
n8n-Flows, die Tage warten, nicht Sekunden
Verschieben Sie die lange wartenden Zweige eines n8n-Flows (Vertragsfreigabe, Rechnungsprüfung, geplante Eskalation) in einen Project-Think-Agenten. Die n8n-Seite bleibt die visuelle Karte. Die Cloudflare-Seite besitzt das Warten und das Fortsetzen.
Mobile-Assistent mit absturzsicheren Sessions
Eine Nutzerin startet eine Anfrage am Handy, wechselt zweimal das Netz und kommt eine Stunde später zurück. Persistente Sessions bedeuten, dass der Agent genau dort weitermacht, wo er stehen geblieben ist, mit demselben Plan, derselben Tool-Historie und demselben Freigabe-Zustand.
Sub-Agenten pro Integration
Jede Integration (CRM, Abrechnung, Kalender) bekommt einen dedizierten Sub-Agenten mit eigener SQLite. Der Eltern-Agent sieht nur die typisierte RPC-Oberfläche, sodass eine experimentelle neue Integration den Rest des Flows nicht beschädigt, wenn sie sich falsch verhält.
Hintergrund-Recherche, die Deploys überlebt
Langlaufende Recherche- oder Datensammelaufgaben müssen nicht mehr bei jedem Deploy pausieren. Der Fiber checkpointet, der Deploy läuft durch, und der nächste Schritt führt auf dem neuen Codepfad mit dem alten Plan weiter.
Operative Agenten, die echte Infrastruktur anfassen
Agent Lee zeigt das Muster: eine Chat-Oberfläche, die Produktions-Ressourcen liest und ändert, mit einer dauerhaften Spur hinter jeder Aktion. Project Think ist das, was diese Idee sicher genug macht, um sie einem Operations-Team an die Hand zu geben.
So starten Sie
- 1Lesen Sie die Project-Think-Ankündigung im Cloudflare-Blog und überfliegen Sie die Agents-SDK-Referenz für die neuen Primitive.
- 2Wählen Sie eine bestehende Automatisierung mit langer Wartezeit oder unzuverlässigem Fortsetzen. Das ist der billigste Weg, den Wert dauerhafter Ausführung zu spüren.
- 3Verpacken Sie diesen Flow in einen Project-Think-Agenten. Verschieben Sie die Wartezeit in einen Fiber. Fügen Sie für die fragilste Integration einen einzelnen Sub-Agenten hinzu.
- 4Instrumentieren Sie den Lauf. Loggen Sie jeden Checkpoint, jeden Sub-Agenten-Aufruf und jedes Resume. Das Log ist Ihr Argument, das Muster später auszuweiten oder zurückzudrehen.
Wenn Sie die Agenten-Schicht noch sortieren, erklärt unser OpenClaw-101-Leitfaden die Bausteine (Tools, Skills, Berechtigungen, Gedächtnis), und der Beitrag zur Orchestrierungs-Ära des agentischen Codings setzt den breiteren Kontext, in den Project Think einrastet.
Fazit
Project Think ist kein neues Modell und kein neuer Harness. Es ist die Runtime-Schicht, die dem Agents SDK gefehlt hat: dauerhafte Ausführung, isolierte Sub-Agenten und persistente Sessions, eingewickelt in eine opinionierte Basisklasse. Agent Lee ist der Beweis, dass der Stack unter realer Last funktioniert. Für ein Team, das schon mit n8n, mobiler Orchestrierung oder einem Router-artigen Agent-Muster baut, ist das das Stück, das die langen Teile eines Flows einen schlechten Tag überleben lässt.
Die Frage für Ihren nächsten Sprint ist einfach. Welche Ihrer aktuellen Agenten würden sich besser verhalten, wenn die Runtime, nicht Ihr Code, den Lauf über Abstürze, Deploys und lange Wartezeiten am Leben hielte?