Estamos em abril de 2026, e escolher uma assinatura de IA se parece muito com escolher um plano de celular. Você abre uma planilha, compara Claude, ChatGPT, Gemini — cada um publica benchmarks (testes padronizados que medem o desempenho de um modelo de IA), relatórios de segurança e estudos de caso de clientes. Você lê os números, compara os preços, escolhe. Processo racional. Comportamento de adulto.

Aí tem a xAI.

$300 por Vibes

Em 17 de abril, a xAI silenciosamente soltou o Grok 4.3 Beta no seletor de modelos do grok.com. Sem blog post. Sem model card — a ficha técnica que todo outro laboratório de IA publica para explicar o que um modelo pode e não pode fazer. Sem benchmarks independentes. Sem tour de imprensa. Apenas um tweet do Elon Musk e um preço: $300 por mês pelo tier "SuperGrok Heavy".

Isso é $100 a mais que o ChatGPT Pro. $50 a mais que o Google AI Ultra. $100 a mais que o Claude Max. A assinatura de IA para consumidor mais cara do mercado — e a única com zero evidência independente de que merece ser.

A Cratera de Evidências

A lacuna não é uma lacuna. É uma cratera.

A Anthropic publica system cards para cada release do Claude. A OpenAI entrega benchmark disclosures com cada atualização do GPT. O Google mantém dashboards de avaliação públicos. A xAI? O último model card deles foi do Grok 4, publicado em 20 de agosto de 2025. Desde então — Grok 4.1, 4.20 e agora 4.3 — nada. Nenhuma avaliação de terceiros do LMSYS ou HuggingFace. Nenhum red-team report (auditorias de segurança independentes onde pesquisadores deliberadamente tentam quebrar o modelo). Como o TechSifted notou em 17 de abril, o lançamento "veio sem blog post oficial da xAI, sem model card publicado, sem benchmarks de terceiros e sem cobertura de veículos tier-1."

O que ele trouxe: geração nativa de PDF, criação de slides e saída de planilhas — funcionalidades que Claude, Gemini e ChatGPT lançaram há mais de um ano. E ainda sem memória persistente entre sessões. Como a review do BuildFastWithAI colocou em 19 de abril: "A $300/mês, a ausência disso é genuinamente difícil de defender."

Então Pelo Que Você Está Pagando?

Escala. Pura escala não verificada.

O data center Colossus da xAI roda 555.000 GPUs NVIDIA, com mais de 700.000 ativas em todos os treinamentos. Em 8 de abril, o EONMSK reportou que eles estão treinando sete modelos simultaneamente, incluindo dois com um trilhão de parâmetros — um parâmetro sendo um dos botões ajustáveis dentro de uma rede neural que molda como ela responde. Mais parâmetros podem significar mais capacidade. Ou podem significar mais conta de luz. Sem benchmarks, você genuinamente não consegue dizer qual dos dois.

O timing piora tudo. Três dias antes do lançamento do Grok 4.3, em 14 de abril, a NBC News revelou que a Apple havia ameaçado em sigilo remover o Grok da App Store em janeiro por causa de deepfakes não consensuais gerados pelo modelo. O déficit de confiança não é teórico — está documentado, carimbado e protocolado no Congresso.

A Defesa (Porque Justiça Importa)

Os contra-argumentos merecem espaço. O poder computacional é real e sem precedentes. Preço de beta naturalmente seleciona entusiastas que aceitam risco. E a integração profunda do Grok com o X (antigo Twitter) dá acesso a dados sociais em tempo real que nenhum concorrente iguala — se você precisa analisar o que está em alta agora, o Grok tem uma vantagem legítima.

São vantagens legítimas. Mas "confia em nós, temos muitas GPUs" não é justificativa de compra. É vibe.

O Que Isso Significa Pra Você

Pra qualquer um avaliando ferramentas de IA hoje — seja você um dev solo, um tech lead, ou alguém tentando colocar isso no cartão corporativo — a lição é direta: preço não sinaliza qualidade quando a camada de evidência está ausente. Um modelo que você não pode benchmarkar é um modelo que você não pode orçar. Ninguém no financeiro aprova "parece bem rápido" como item de linha.

Duas Religiões de Precificação

O mercado de IA agora funciona com duas filosofias de preço. Baseada em evidências: aqui está o que pontua, aqui quem usa, aqui o que quebrou. E baseada em escala: olha o tamanho disso.

Só uma dessas sobrevive ao financeiro perguntando "por que a gente precisa disso?"

A xAI escolheu a outra.