Deine App läuft. Deine Nutzer sind zufrieden. Du hast sie auf OpenAIs Assistants API gebaut — ein System, bei dem die KI den Gesprächsverlauf ("Threads") verwaltet und mehrstufige Aufgaben ("Runs") serverseitig ausführt. Du hast das Ganze irgendwann 2024 in Produktion gebracht, und es tut genau das, was du versprochen hast. Das Leben ist schön.
Nur hat OpenAI gerade entschieden, dass dein Fundament von vorgestern ist.
Am 26. August 2025 hat OpenAI angekündigt, dass die Assistants API genau ein Jahr später abgeschaltet wird — am 26. August 2026. Dann, am 15. April 2026, haben sie ein großes Agents SDK Update mit Sandbox-Ausführung, persistentem Speicher und dauerhaften Agent Runs veröffentlicht. Dein funktionierender Code liegt jetzt zwei Abstraktionsebenen hinter dem, was OpenAI von dir will. Vier Monate zum Migrieren. Die Uhr tickt.
Fünf Plattformen in sechs Jahren
Zählen wir mal die Rewrites, die OpenAI Entwicklern zugemutet hat:
- Completions API (2020) — du schickst Text, die KI vervollständigt ihn. Simpel. Jetzt deprecated.
- Chat Completions API (März 2023) — gleiche Idee, aber als Konversation mit Rollen strukturiert ("system", "user", "assistant"). Lebt noch, aber in der Doku an den Rand gedrängt.
- Assistants API (November 2023) — serverseitig verwaltete Threads, Runs, eingebaute Dateiverarbeitung. Sunset August 2026.
- Responses API (März 2025) — zustandslose Single-Turn-Aufrufe mit eingebauten Tools wie Websuche und Computer Use. Der aktuell empfohlene Weg.
- Agents SDK (März 2025, großes Update 15. April 2026) — eine Python-Bibliothek zum Bau autonomer Agenten mit Handoffs zwischen spezialisierten KIs, Guardrails und Tracing.
Fünf Plattformwechsel. Jeder ändert die zentrale Abstraktion — wie du State verwaltest, Tools aufrufst und KI-Verhalten orchestrierst. Keiner lässt sich sauber auf den Vorgänger abbilden. Und seit 2023 liegt der Takt bei ungefähr 8-12 Monaten — schnell genug, dass deine Migration möglicherweise nicht fertig wird, bevor die nächste beginnt.
Was tatsächlich kaputtgeht
Die Assistants API hat alles serverseitig gespeichert: deine Konversations-Threads, deine Datei-Uploads, deine Assistant-Konfigurationen. Die Responses API hat das alles über Bord geworfen — sie ist standardmäßig zustandslos. Du willst Gesprächspersistenz? Dann nimm die neue Conversations API und einen /responses/compact-Endpunkt zum Komprimieren langer Kontexte.
Aber hier wird es richtig schmerzhaft. Entwickler, die SaaS-Plattformen auf der Assistants API gebaut haben, konnten programmatisch Hunderte von Assistants über die API erstellen — dynamisch, im großen Stil. Der Ersatz in der Responses API? Ein Feature namens "Prompts", das du nur über die Dashboard-Oberfläche erstellen kannst. Nicht über die API. Das Dashboard.
Wie ein Entwickler es im Community-Forum formulierte: "Ich habe Hunderte davon, dynamisch erstellt, gelöscht und bearbeitet." Ein anderer war knapper: "Ehrlich gesagt ist das alles ein einziges Chaos."
OpenAI-Mitarbeiter haben die Deprecation-Ankündigung gepostet. Auf die Beschwerden darunter haben sie nicht reagiert.
Das Spiel der schleichenden Abschaltung
Der Trick: OpenAI hat die meisten alten APIs noch nicht hart abgeschaltet. Die Assistants API läuft noch. Chat Completions funktioniert noch. Aber die Dokumentation schwenkt auf die neueste Plattform um. StackOverflow-Antworten referenzieren das neueste SDK. Offizielle Beispiele zeigen die neuesten Patterns. Community-Tutorials folgen dem neuesten Hype.
Dein alter Code kompiliert noch. Er wird nur zum Waisenkind — funktionierende Software, für die niemand mehr Anleitungen schreibt. Das ist keine Deprecation. Das ist Aushungern.
Parallel dazu stellt OpenAI auch DALL·E 2 & 3 (12. Mai 2026), die Realtime API Beta (7. Mai 2026), Sora 2 (24. September 2026) und GPT-3.5-turbo-instruct (28. September 2026) ein. Wenn du auf OpenAIs Stack gebaut hast, verwaltest du einen Deprecation-Kalender, keine Produkt-Roadmap.
Die echten Kosten sind nicht die Tokens
Die Migration von Assistants zu Responses kostet Engineering-Wochen. Du schreibst das State Management um. Du schreibst das Tool Calling um. Du schreibst die Orchestrierungslogik um. Und was bekommt der Nutzer? Nichts. Das Produkt macht dasselbe wie vorher. Du hast einen Sprint verbrannt, um auf der Stelle zu treten.
Aber Abwarten kostet auch — nur anders. Bugfixes werden langsamer. Enterprise-Kunden fragen, warum du nicht auf der neuesten Plattform bist. Neue Entwickler, die mit der aktuellen Dokumentation gelernt haben, können deine Codebase nicht lesen, ohne Archäologie zu betreiben.
Such dir dein Gift aus.
Bevor du das Agents SDK adoptierst
Das Agents SDK Update vom 15. April sieht aus wie genau das, was du willst — natives Sandboxing über Cloudflare, E2B, Modal, Vercel, dauerhafte Runs mit Snapshotting, konfigurierbarer Speicher — wenn du darauf vertrauen würdest, dass es in zwölf Monaten noch das ist, was OpenAI von dir will. Aber betrachte das Muster: OpenAI hat seit 2023 ungefähr alle 8-12 Monate eine neue Entwicklerplattform rausgehauen. Das Agents SDK wird das Fundament sein — bis das nächste Fundament kommt.
Rechne die Rewrite-Kosten durch. Nicht den Token-Preis. Die Rewrite-Kosten.
Die teuerste API ist nicht die mit dem höchsten Preis pro Aufruf. Es ist die, die dich zwingt, dein Produkt jedes Jahr neu zu bauen, um sie weiter nutzen zu können.





