Le 15 avril 2026, OpenAI a livré Agents SDK v0.14.0 — la boîte à outils qui permet aux développeurs de construire des travailleurs IA autonomes (agent — un programme qui planifie tout seul des tâches en plusieurs étapes au lieu d'attendre des prompts). Les notes de version se vantent de plus de 100 modèles de langage supportés via LiteLLM, une couche de traduction qui permet à un framework d'agent unique de parler à de multiples vendeurs d'IA. On fait défiler la liste et le voilà : Grok de xAI, assis poliment entre Claude et Gemini. Un fondateur qui lit ça voit xAI comme un citoyen de première classe dans la stack agent. La matrice de compatibilité dit oui.

Le tableau des déploiements dit non.

Entre le 8 et le 15 avril 2026, trois plateformes d'agents ont atterri. Managed Agents d'Anthropic le 8 avril — Claude uniquement, à 0,08 $ par heure-session, avec Notion, Rakuten, Asana, Sentry et Atlassian comme clients pilotes nommés. Rakuten revendique une livraison d'agents 10x plus rapide et un bond de 22 points en taux de réussite par rapport au prompting basique. Le SDK d'OpenAI le 15 avril avec Cloudflare, Vercel, E2B et Modal comme partenaires de sandboxing. Zed v0.232.2 le même jour, ajoutant neuf modèles à son offre Pro. Sur les trois lancements combinés, le nombre de clients enterprise nommés faisant tourner Grok en production : zéro 😹.

C'est là que ça se joue. « Compatible » et « choisi » sont deux sports différents.

La compatibilité LiteLLM est un shim — un adaptateur fin qui réécrit les appels API au format OpenAI (API — la prise que les développeurs utilisent pour appeler un modèle) dans le format attendu par chaque vendeur. Ça sonne identique sur le papier. En pratique, le function calling (le mécanisme par lequel un agent dit à un outil quoi faire) varie énormément selon le modèle. Une issue GitHub sur le repo OpenAI Agents SDK — #1056 — capture l'ambiance : un dév a demandé comment brancher Grok-4 et a reçu un workaround communautaire (model="litellm/xai/grok-3-mini"), pas une doc officielle xAI. xAI n'a pas écrit l'intégration. Quelqu'un d'autre l'a fait, gratuitement, dans un fil de commentaires 🙀.

Maintenant les preuves. Chaque étude de cas enterprise d'avril 2026 — la délégation d'espace de travail chez Notion, les agents Slack de Rakuten via Claude Cowork, le debugging automatisé de Sentry, Cisco et Nvidia dans le Project Glasswing d'Anthropic, le contrat d'Allianz — nomme Claude ou GPT. Aucune ne nomme Grok. Côté benchmarks, Gemini 3.1 Pro mène le SWE-bench Verified (test de codage pour agents) à 78,80 %, avec Claude Opus 4.6 et GPT 5.4 à égalité à 78,20 %. xAI n'a publié aucun résultat tau-bench spécifique aux agents. Pas de CLI de codage comme Claude Code, Codex, Gemini CLI ou Jules. Il y a une Agent Tools API sur Grok 4.1 Fast — exécution de code, recherche web, support MCP — mais aucun produit managed-agent, aucune architecture de référence, aucun témoignage client appuyé par des résultats 😾.

L'arbitrage pour les acheteurs est moche. « Compatible » et « supporté » ont l'air identiques dans un slide vendeur, puis coûtent 2 à 3 fois plus d'heures-dév en retries, en ajustements de schémas d'outils et en observabilité manquante (observabilité — les dashboards qui te montrent pourquoi ton agent a planté à 3h du matin). xAI a peu d'intérêt à combler ce fossé. Les 11 co-fondateurs originaux sont tous partis depuis fin mars 2026. Le CFO Anthony Armstrong est parti le 10 avril. Grok 5 a raté sa cible Q1 et a glissé au Q2. Les coups d'éclat — la chasse à la FedRAMP High avec le parrainage de l'USDA annoncée le 15 avril, Grok Computer en bêta privée depuis le 13 avril, XChat prévu pour le 17 avril — sont des jeux de distribution et des paris consumer. Aucun ne produit une étude de cas à la Rakuten 🐈‍⬛.

Donc si tu choisis un modèle d'agent en Q2 2026, la checklist n'est pas « qui est sur la matrice de compatibilité ». Tout le monde y est. La checklist c'est : SDK d'agent first-party ? Clients enterprise nommés avec des résultats publiés ? Chiffres de benchmark d'agent que le vendeur défendra ? Sur les trois, xAI est vide. Faire passer Colossus 2 de 1 GW à 1,5 GW à Memphis, c'est le mauvais levier quand le goulot d'étranglement c'est la maturité de l'écosystème, pas les GPU.

Le grand tri des plateformes d'agents classe les labos selon leur présence dans les études de cas. Sans vrai SDK ni clients nommés d'ici Q3 2026, Grok finira l'année comme une case à cocher, pas comme un choix 😼.