Künstliche Intelligenz

OpenAI Symphony erklärt: Codex-Orchestrierung mobil

OpenAIs Open-Source-Spec Symphony macht Linear zum Control Plane für Codex-Agenten. Praxisleitfaden für mobil-first Orchestrierung, die PRs liefert.

İlker Ulusoy 2026-04-30 8 min Min. Lesezeit

OpenAI hat Ende April 2026 Symphony veröffentlicht, eine Open-Source-Spezifikation, die Codex-Agenten direkt mit Ihrem Issue-Tracker verbindet. Ein Ticket in Linear wird zu einem eigenen Agenten-Workspace, einem laufenden Pull Request und einem Review-Eintrag, ohne dass jemand dazwischen den Startknopf drückt. Dieser Leitfaden zeigt, was Symphony tatsächlich tut, warum Mobile die unerwartete Stärke ist und wie Sie das Muster in Ihren eigenen Automatisierungs-Stack einbauen.

Der Pitch ist geradlinig. Sie ziehen ein Ticket auf einem Board, ein Codex-Agent nimmt es auf einer Remote-Devbox auf, schreibt die Änderung, öffnet einen Pull Request und wartet auf das Review. Stürzt der Agent während des Laufs ab, startet Symphony ihn neu. Ändert sich das Ticket, übernimmt der Agent die neue Spec beim nächsten Poll. Das Control Plane ist Ihr bestehender Projekttracker, kein neues Dashboard. Die ersten internen Teams bei OpenAI berichteten von einem Sprung von 500 % bei gemergten Pull Requests in den ersten drei Wochen.

Die 30-Sekunden-Version

Symphony ist eine offene Spec, kein Produkt. Sie verbindet einen Issue-Tracker wie Linear mit einer Flotte aus Codex-Agenten auf Devboxen. Aus einem offenen Ticket wird ein Agent-Lauf, daraus ein Pull Request, daraus ein menschliches Review. Die unbeobachtete Mitte war das, was den meisten Agent-Setups bisher fehlte, und genau dieses Stück macht mobile Orchestrierung endlich brauchbar.

Was Symphony tatsächlich tut

Symphony ist eine dünne Schicht mit klaren Meinungen. Sie schreibt keinen Code und ersetzt Codex nicht. Sie bindet die beiden Enden der Schleife zusammen, das menschenlesbare Task-Board und den Agenten, der tatsächlich liefert, in einen einzigen Vertrag:

  • Pollt den Issue-Tracker im Takt nach neuen oder geänderten Tickets.
  • Fährt pro Ticket eine frische Devbox hoch, mit geklontem Repo und vorbereiteten Tools.
  • Übergibt die Ticket-Spec an einen Codex-Agenten und lässt ihn von Anfang bis Ende laufen.
  • Öffnet einen Pull Request, verlinkt ihn zurück zum Ticket und benachrichtigt den Reviewer.
  • Startet abgestürzte Läufe neu und synchronisiert, wenn das Ticket während des Laufs bearbeitet wird.

Die spannende Designentscheidung: Symphony will nicht das einzige System sein. Sie behandelt den Issue-Tracker als Quelle der Wahrheit und den Agent-Runner als Black Box. So bleibt die Spec klein genug, um sie zu forken.

Warum eine Spec, kein Produkt

OpenAI hat ausdrücklich gesagt, dass Symphony nicht als eigenständiges SaaS gepflegt wird. Die Spec existiert, damit andere Teams sie studieren, forken oder auf ihrem eigenen Stack neu bauen können. Diese Wahl zählt aus drei Gründen:

Sie behalten Ihren Tracker

Die meisten Teams leben bereits in Linear, Jira oder GitHub Issues. Ein neues Produkt würde eine Migration erzwingen. Eine Spec lässt Sie die Agenten-Schleife auf das aufsetzen, was Sie schon nutzen.

Sie wählen den Agent-Runner

Symphony ist für Codex geschrieben, aber der Vertrag ist allgemein. Sie können Claude Code, einen offenen Coder oder einen selbst-gehosteten Runner an dieselbe Stelle stecken. Das Muster überlebt einen Modellwechsel.

Das Schwierigste ist der Harness, nicht das Modell

Die 500 % bei OpenAI kamen nicht von einem klügeren Codex. Sie kamen davon, dass der Mensch aus der Schleife "zuweisen, beobachten, neu starten, anstoßen, neu prompten" verschwand, die jedes Agentenprojekt entkräftet. Wir haben diese Verschiebung in der Orchestrierungs-Ära des agentischen Codings beschrieben, und Symphony ist bisher die sauberste Referenzimplementierung dafür.

Das Modell schreibt den Code. Der Harness schreibt die Firma. Symphony ist OpenAIs Veröffentlichung des Harness.

Der mobile Hebel, den niemand kommen sah

Das Detail, das die Launch-Geschichte einprägsam machte, ist klein. Eine Engineerin von OpenAI hat aus einer Hütte mit schwachem WLAN drei Pull Requests gelandet, komplett aus der Linear-Mobile-App. Kein Laptop, keine SSH-Sitzung, kein Terminal. Nur Tickets per Handy ziehen, während Agenten auf Remote-Devboxen liefen und PRs öffneten.

Genau diese mobile These vertreten wir in Beiträgen wie Hermes Workspace Mobile und Agenten-Orchestrierung am Handy, und Symphony macht sie konkret. Das Handy ist nicht der Ort, an dem die Arbeit passiert. Das Handy ist der Ort, an dem die Arbeit freigegeben, umgelenkt und reviewed wird. Die Arbeit selbst läuft auf einer Devbox mit voller GPU-Geschwindigkeit.

Warum das für mobile Automatisierung zählt

Symphony entkoppelt den Ort, an dem ein Mensch eine Absicht äußert (ein Ticket auf dem Handy), vom Ort, an dem ein Agent die Arbeit macht (eine Remote-Devbox). Sobald diese beiden Oberflächen getrennt sind, fühlt sich ein Mobile-First-Workflow nicht mehr nach Spielzeug an, sondern nach einer echten Engineering-Schleife.

Die Symphony-Schleife, Schritt für Schritt

StufeWo es läuftWer besitzt es
Ticket erstellt oder bearbeitetLinear (mobil oder Web)Mensch
Polling und DispatchSymphony-ControllerSpec
Devbox bereitstellenCloud-Devbox pro TicketSpec
Code-ÄnderungCodex-Agent in der DevboxAgent
Pull Request öffnenGitHubAgent
Review und MergeGitHub (mobil oder Web)Mensch

Die beiden menschlichen Stufen, Ticket und Review, sind beide von Haus aus mobil-tauglich. Alles dazwischen läuft unbeaufsichtigt. Das ist die Form eines Workflows, den Sie aus einer Hütte per Handy steuern können, und es ist die Form, die in den nächsten Monaten immer mehr Agenten-Harness-Systeme übernehmen werden.

Wie Sie eine Symphony-artige Schleife auf Ihrem Stack bauen

Sie brauchen nicht OpenAIs exakte Spec, um den Großteil des Gewinns mitzunehmen. Die Schleife ist baukastenartig, und Sie können diese Woche eine funktionierende Version aufstellen:

  1. 1Wählen Sie den Tracker, den Sie schon nutzen. Linear, Jira, GitHub Issues sind alle in Ordnung. Einzige Voraussetzung: ein Webhook oder Polling-API.
  2. 2Wählen Sie einen Agent-Runner. Codex, Claude Code oder ein offener Coder hinter einer dünnen Sandbox reicht zum Start. Achten Sie darauf, dass jeder Lauf einen sauberen Workspace bekommt.
  3. 3Schreiben Sie einen kleinen Dispatcher. Tracker pollen, ein Label wie "agent-ready" matchen, Devbox starten, Ticket an den Agenten geben und PR-Link zurück ans Ticket posten.
  4. 4Eine Restart-Politik einbauen. Abstürze passieren. Der Dispatcher sollte einen hängenden Lauf neu in die Queue stellen, statt einen Menschen babysitten zu lassen.
  5. 5Den Review-Schritt in den bestehenden PR-Workflow einbinden. Mobile Reviewer profitieren am meisten, wenn der PR klein, klar abgegrenzt und mit dem Originalticket verlinkt ist.

Wenn Ihr Team schon n8n betreibt, ist der Dispatcher ein einziger Workflow mit einem Webhook-Trigger und einer HTTP-Node, die mit Ihrem Devbox-Provider spricht. Wir gehen die n8n-Seite langlaufender Automatisierungen in unserem n8n auf ECS Fargate Lasttest durch, und das ist genau die Infrastruktur, die Symphony annimmt.

Wo Symphony neben anderen Orchestratoren steht

Symphony ist nicht der einzige Agent-Orchestrator, der Ende April 2026 erschienen ist, und der Vergleich lohnt sich:

  • Sakana Conductor lernt per RL, welcher Agent welche Teilaufgabe übernehmen soll. Er ist ein Router für einen Agentenpool.
  • Hermes Workspace Mobile legt die Freigabe- und Routing-Oberfläche aufs Handy, mit Workern in der Cloud.
  • OpenAI Symphony verbindet den Issue-Tracker mit dem Agent-Runner und reduziert die menschliche Arbeit auf Ticket und Review.

Diese drei Designs konkurrieren nicht. Sie stapeln sich. Ein Team kann Symphony zur Ticket-Verteilung nutzen, Conductor zur Modellauswahl pro Teilaufgabe und eine Hermes-artige mobile Oberfläche für sensible Freigaben. Das Bild aus Sakana Conductor und Multi-Agenten-Orchestrierung bekommt mit Symphony eine viel konkretere obere Hälfte.

Fünf praktische Anwendungsfälle

Bug-Triage, die Fixes über Nacht liefert

Eingehende Bug-Tickets mit "agent-ready" markieren. Der Dispatcher startet eine Devbox, der Agent reproduziert den Bug, schreibt einen fehlschlagenden Test, behebt ihn und öffnet einen PR. Sie wachen mit einer Queue kleiner, prüfbarer Änderungen auf.

Mobile-First Produkt-Backlog

Eine Gründerin unterwegs zieht ein Feature-Ticket in Linear, sieht eine Stunde später einen PR auftauchen und reviewt ihn vom selben Handy. Der Laptop wird für ein echtes Stück der Engineering-Schleife optional.

Dokumentation, die mit dem Code Schritt hält

Ein dauerhaftes "Docs einholen"-Ticket wird nach jedem gemergten PR neu geöffnet. Der Agent liest das Diff, aktualisiert die passende Doku-Seite und öffnet einen Folge-PR. Drift wird ein gelöstes Problem.

Refactor-Wellen, die nie einen Sprint blockieren

Long-Tail-Refactors (Config-Key umbenennen, Import tauschen, Enum normalisieren) liegen in einer Queue mit Agenten-Label. Der Dispatcher arbeitet die Queue zwischen wichtigeren Tickets ab, ohne menschliche Kapazität zu binden.

Kundengemeldete Fehler mit voller Audit-Spur

Jedes Ticket trägt die Kunden-ID, den Agent-Lauf, den PR und das Review. Compliance bekommt einen einzigen Faden pro Fix, ohne dass jemand ein eigenes Dashboard baut.


Fazit

Symphony ist der Moment, in dem die "Ticket zu Agent zu PR"-Schleife vom cleveren Demo zu einer dokumentierten Spec mit einer 500-%-Zahl wurde. Die Veröffentlichung ist klein in Codezeilen und groß in Bedeutung. Das Control Plane für Agentenarbeit ist Ihr Issue-Tracker, und sobald das stimmt, ist das Gerät, zu dem ein Mensch greift, ein Handy.

Die Frage für die nächste Planungsrunde ist einfach. Wenn jedes "agent-ready"-Ticket auf Ihrem Board ohne Mensch in der Mitte zu einem Pull Request wird, was würde Ihr Team mit der Zeit bauen, die Sie zurückbekommen?