15 kwietnia 2026 OpenAI wypuściło Agents SDK v0.14.0 — zestaw narzędzi, który pozwala devom budować autonomicznych agentów AI (agent — program, który sam planuje wieloetapowe zadania zamiast czekać na promptowanie). Release notes chwalą się 100+ wspieranych modeli językowych przez LiteLLM, warstwę tłumaczącą, która pozwala jednemu frameworkowi agentowemu rozmawiać z wieloma dostawcami AI. Przewiń listę i jest: Grok od xAI, siedzi sobie grzecznie między Claude i Gemini. Founder, który to czyta, widzi xAI jako pełnoprawnego obywatela stosu agentowego. Macierz kompatybilności mówi tak.

Lista wdrożeń mówi nie.

Między 8 a 15 kwietnia 2026 wylądowały trzy platformy agentowe. Managed Agents od Anthropic 8 kwietnia — tylko Claude, w cenie 0,08 dolara za godzinę sesji, z Notion, Rakuten, Asana, Sentry i Atlassian jako wymienionymi z nazwy wczesnymi klientami. Rakuten twierdzi, że dostarcza agentów 10x szybciej i ma 22-punktowy skok skuteczności zadań w porównaniu z podstawowym promptowaniem. SDK od OpenAI 15 kwietnia z partnerami sandboxowymi: Cloudflare, Vercel, E2B i Modal. Zed v0.232.2 tego samego dnia, dodający dziewięć modeli do swojego planu Pro. Łącznie we wszystkich trzech premierach liczba wymienionych z nazwy enterprise klientów odpalających Groka na produkcji: zero 😹.

To jest część, która ma znaczenie. „Kompatybilny" i „wybrany" to dwie różne dyscypliny.

Kompatybilność LiteLLM to shim — cienki adapter, który przepisuje wywołania API w kształcie OpenAI (API — wtyczka, której devowie używają do wywoływania modelu) na cokolwiek, czego oczekuje dany dostawca. Na papierze brzmi identycznie. W praktyce function calling (mechanizm, w którym agent mówi narzędziu, co ma zrobić) różni się drastycznie w zależności od modelu. Issue na GitHubie w repo OpenAI Agents SDK — #1056 — łapie ten klimat: dev zapytał, jak podpiąć Grok-4, i dostał community workaround (model="litellm/xai/grok-3-mini"), nie oficjalną dokumentację xAI. xAI nie napisało tej integracji. Zrobił to ktoś inny, za darmo, w wątku komentarzy 🙀.

A teraz rachunki. Każdy enterprise case study z kwietnia 2026 — delegowanie workspace'u w Notion, agenci Slacka w Rakuten przez Claude Cowork, automatyczne debugowanie w Sentry, Cisco i Nvidia w Project Glasswing od Anthropic, kontrakt Allianz — wymienia Claude albo GPT. Żaden nie wymienia Groka. Na benchmarkach Gemini 3.1 Pro prowadzi w SWE-bench Verified (test kodowania agentowego) z wynikiem 78,80%, z Claude Opus 4.6 i GPT 5.4 zremisowanymi na 78,20%. xAI nie opublikowało żadnych wyników tau-bench specyficznych dla agentów. Nie ma CLI do kodowania jak Claude Code, Codex, Gemini CLI czy Jules. Ma Agent Tools API na Grok 4.1 Fast — wykonywanie kodu, web search, wsparcie MCP — ale żadnego produktu managed-agent, żadnej architektury referencyjnej, żadnego case study klienta popartego wynikami 😾.

Kompromis dla kupujących jest paskudny. „Kompatybilny" i „wspierany" wyglądają identycznie w prezentacji vendora, a potem kosztują 2–3x więcej godzin developerskich na retry, poprawki schematów narzędzi i brakujący observability (observability — dashboardy, które pokazują ci, dlaczego twój agent padł o 3 nad ranem). xAI ma niewielką motywację, żeby tę lukę zasypać. Wszystkich 11 oryginalnych współzałożycieli zniknęło pod koniec marca 2026. CFO Anthony Armstrong odszedł 10 kwietnia. Grok 5 nie trafił w cel Q1 i ślizga się na Q2. Nagłówkowe ruchy — walka o FedRAMP High ze sponsoringiem USDA ogłoszona 15 kwietnia, Grok Computer w prywatnej becie od 13 kwietnia, XChat zaplanowany na 17 kwietnia — to gry o dystrybucję i zakłady konsumenckie. Żaden z nich nie dostarcza case study w stylu Rakuten 🐈‍⬛.

Więc jeśli wybierasz model agentowy w Q2 2026, checklista to nie „kto jest na macierzy kompatybilności". Wszyscy są. Checklista to: first-party SDK agentowe? Wymienieni z nazwy enterprise klienci z opublikowanymi wynikami? Liczby z benchmarków agentowych, których vendor będzie bronił? Na wszystkich trzech polach xAI świeci pustkami. Skalowanie Colossus 2 z 1 GW do 1,5 GW w Memphis to zły punkt dźwigni, gdy wąskim gardłem jest dojrzałość ekosystemu, a nie GPU.

Shakeout platform agentowych sortuje laby po tym, kto pojawia się w case studies. Bez prawdziwego SDK i wymienionych z nazwy klientów do Q3 2026, Grok kończy rok jako checkbox, a nie wybór 😼.