Am 15. April 2026 hat OpenAI das Agents SDK v0.14.0 ausgeliefert — das Toolkit, mit dem Entwickler autonome KI-Worker bauen (Agent — ein Programm, das mehrstufige Aufgaben selbst plant, statt auf Prompts zu warten). Die Release Notes prahlen mit 100+ unterstützten Sprachmodellen via LiteLLM, einer Übersetzungsschicht, mit der ein Agent-Framework mit vielen KI-Anbietern reden kann. Scrolle die Liste durch und da steht es: xAIs Grok, höflich zwischen Claude und Gemini platziert. Ein Founder, der das liest, sieht xAI als First-Class-Citizen im Agent-Stack. Die Kompatibilitätsmatrix sagt ja.
Die Deployment-Liste sagt nein.
Zwischen dem 8. und 15. April 2026 sind drei Agent-Plattformen gelandet. Anthropics Managed Agents am 8. April — Claude-only, $0,08 pro Session-Stunde, mit Notion, Rakuten, Asana, Sentry und Atlassian als namentlich genannten Early Customers. Rakuten behauptet 10x schnelleres Agent-Shipping und einen Sprung von 22 Punkten bei der Task-Erfolgsquote gegenüber simplen Prompts. OpenAIs SDK am 15. April mit den Sandboxing-Partnern Cloudflare, Vercel, E2B und Modal. Zed v0.232.2 am selben Tag, mit neun zusätzlichen Modellen im Pro-Tier. Über alle drei Launches hinweg, die Anzahl der namentlich genannten Enterprise-Kunden, die Grok in Produktion laufen lassen: null 😹.
Das ist der Teil, der zählt. „Kompatibel" und „ausgewählt" sind verschiedene Sportarten.
LiteLLM-Kompatibilität ist ein Shim — ein dünner Adapter, der OpenAI-förmige API-Calls umschreibt (API — der Stecker, mit dem Entwickler ein Modell aufrufen) in das Format, das der jeweilige Anbieter erwartet. Auf dem Papier klingt das identisch. In der Praxis variiert Function Calling (der Mechanismus, mit dem ein Agent einem Tool sagt, was es tun soll) wild von Modell zu Modell. Ein GitHub-Issue im OpenAI Agents SDK Repo — #1056 — fängt die Stimmung ein: Ein Entwickler fragt, wie man Grok-4 anschließt, und bekommt einen Community-Workaround (model="litellm/xai/grok-3-mini"), keine offizielle xAI-Doku. xAI hat die Integration nicht geschrieben. Jemand anderes hat das gemacht, kostenlos, in einem Kommentar-Thread 🙀.
Jetzt die Belege. Jede April-2026 Enterprise-Case-Study — Notions Workspace-Delegation, Rakutens Slack-Agents via Claude Cowork, Sentrys automatisiertes Debugging, Cisco und Nvidia in Anthropics Project Glasswing, Allianz-Vertrag — nennt Claude oder GPT. Keine nennt Grok. Bei Benchmarks führt Gemini 3.1 Pro SWE-bench Verified (Agent-Coding-Test) mit 78,80 %, Claude Opus 4.6 und GPT 5.4 liegen gleichauf bei 78,20 %. xAI hat keine Agent-spezifischen tau-bench-Ergebnisse veröffentlicht. Es hat keine Coding-CLI wie Claude Code, Codex, Gemini CLI oder Jules. Es hat eine Agent Tools API auf Grok 4.1 Fast — Code-Ausführung, Web-Suche, MCP-Support — aber kein Managed-Agent-Produkt, keine Referenz-Architektur, keine ergebnisbelegte Kunden-Story 😾.
Der Tradeoff für Käufer ist fies. „Kompatibel" und „supported" sehen im Vendor-Slidedeck identisch aus, kosten dann aber 2–3x mehr Entwicklerstunden für Retries, Tool-Schema-Tweaks und fehlende Observability (Observability — die Dashboards, die dir zeigen, warum dein Agent um 3 Uhr morgens gecrasht ist). xAI hat wenig Anreiz, diese Lücke zu schließen. Alle 11 ursprünglichen Co-Founder sind seit Ende März 2026 weg. CFO Anthony Armstrong ist am 10. April gegangen. Grok 5 hat sein Q1-Ziel verfehlt und rutscht in Q2. Die Headline-Moves — FedRAMP-High-Bewerbung mit USDA-Sponsoring angekündigt am 15. April, Grok Computer in privater Beta seit dem 13. April, XChat geplant für den 17. April — sind Distributionsspielereien und Consumer-Wetten. Keine davon liefert eine Case Study im Rakuten-Stil 🐈⬛.
Wenn du also in Q2 2026 ein Agent-Modell auswählst, lautet die Checkliste nicht „wer steht auf der Kompatibilitätsmatrix". Alle stehen drauf. Die Checkliste lautet: Eigenes Agent-SDK? Namentlich genannte Enterprise-Kunden mit veröffentlichten Ergebnissen? Agent-Benchmark-Zahlen, die der Anbieter verteidigen wird? Bei allen drei ist xAI leer. Colossus 2 von 1 GW auf 1,5 GW in Memphis zu skalieren ist der falsche Hebel, wenn der Bottleneck Ökosystem-Reife ist, nicht GPUs.
Das Agent-Platform-Shakeout sortiert Labore danach, wer in Case Studies auftaucht. Ohne ein echtes SDK und namentlich genannte Kunden bis Q3 2026 beendet Grok das Jahr als Checkbox, nicht als Wahl 😼.


