Em 15 de abril de 2026, a OpenAI lançou o Agents SDK v0.14.0 — o kit que permite desenvolvedores construírem trabalhadores de IA autônomos (agente — um programa que planeja tarefas de múltiplas etapas sozinho, em vez de esperar prompts). As notas de release se gabam de 100+ modelos de linguagem suportados via LiteLLM, uma camada de tradução que deixa um framework de agente conversar com vários fornecedores de IA. Passe o olho na lista e lá está: o Grok da xAI, sentado educadamente entre Claude e Gemini. Um founder lendo isso vê a xAI como cidadã de primeira classe na stack de agentes. A matriz de compatibilidade diz que sim.

A lista de deploys diz que não.

Entre 8 e 15 de abril de 2026, três plataformas de agentes pousaram. Managed Agents da Anthropic em 8 de abril — exclusivo Claude, a US$ 0,08 por hora-sessão, com Notion, Rakuten, Asana, Sentry e Atlassian como clientes iniciais nomeados. A Rakuten afirma estar entregando agentes 10x mais rápido e um salto de 22 pontos em sucesso de tarefa sobre prompting básico. SDK da OpenAI em 15 de abril com parceiros de sandboxing Cloudflare, Vercel, E2B e Modal. Zed v0.232.2 no mesmo dia, adicionando nove modelos ao seu tier Pro. Nos três lançamentos juntos, a contagem de clientes enterprise nomeados rodando Grok em produção: zero 😹.

É essa a parte que importa. "Compatível" e "escolhido" são esportes diferentes.

Compatibilidade via LiteLLM é um shim — um adaptador fino que reescreve chamadas de API no formato OpenAI (API — a tomada que desenvolvedores usam pra chamar um modelo) pra qualquer formato que o fornecedor espere. No papel, soa idêntico. Na prática, function calling (o mecanismo pelo qual um agente diz a uma ferramenta o que fazer) varia absurdamente entre modelos. Uma issue no repo do OpenAI Agents SDK — #1056 — captura a vibe: um dev perguntou como plugar o Grok-4 e recebeu um workaround da comunidade (model="litellm/xai/grok-3-mini"), não docs oficiais da xAI. A xAI não escreveu a integração. Alguém escreveu, de graça, num thread de comentários 🙀.

Agora os recibos. Todo case enterprise de abril de 2026 — delegação de workspace da Notion, agentes no Slack via Claude Cowork da Rakuten, debugging automatizado da Sentry, Cisco e Nvidia dentro do Project Glasswing da Anthropic, contrato da Allianz — cita Claude ou GPT. Nenhum cita Grok. Em benchmarks, Gemini 3.1 Pro lidera o SWE-bench Verified (teste de coding para agentes) com 78,80%, com Claude Opus 4.6 e GPT 5.4 empatados em 78,20%. A xAI não publicou resultados de tau-bench específicos para agentes. Não tem CLI de coding como Claude Code, Codex, Gemini CLI ou Jules. Tem uma Agent Tools API no Grok 4.1 Fast — execução de código, busca na web, suporte a MCP — mas nenhum produto de managed-agent, nenhuma arquitetura de referência, nenhum case de cliente com resultado comprovado 😾.

O tradeoff pra quem compra é feio. "Compatível" e "suportado" parecem idênticos num slide de vendor, e depois custam 2–3x mais horas de dev em retries, ajustes de schema de ferramentas e observabilidade faltando (observabilidade — os dashboards que mostram por que seu agente quebrou às 3 da manhã). A xAI tem pouco incentivo pra fechar esse gap. Todos os 11 co-founders originais saíram no fim de março de 2026. O CFO Anthony Armstrong deixou a empresa em 10 de abril. O Grok 5 perdeu a meta do Q1 e escorregou pro Q2. Os movimentos de manchete — corrida por FedRAMP High com patrocínio do USDA anunciada em 15 de abril, Grok Computer em beta privado desde 13 de abril, XChat marcado pra 17 de abril — são jogadas de distribuição e apostas de consumo. Nenhum deles entrega um case estilo Rakuten 🐈‍⬛.

Então se você está escolhendo um modelo de agente no Q2 de 2026, o checklist não é "quem está na matriz de compatibilidade". Todo mundo está. O checklist é: SDK de agente first-party? Clientes enterprise nomeados com resultados publicados? Números de benchmark de agente que o vendor vai defender? Nos três, xAI está zerada. Colossus 2 escalando de 1 GW pra 1,5 GW em Memphis é o ponto de alavancagem errado quando o gargalo é maturidade de ecossistema, não GPU.

O shakeout das plataformas de agentes está separando os labs por quem aparece em case study. Sem um SDK de verdade e clientes nomeados até o Q3 de 2026, o Grok termina o ano como checkbox, não como escolha 😼.