Estamos en abril de 2026, y elegir una suscripción de IA se parece mucho a elegir un plan de celular. Abres una hoja de cálculo, comparas Claude, ChatGPT, Gemini — cada uno publica benchmarks (pruebas estandarizadas que miden qué tan bien funciona un modelo de IA), reportes de seguridad y casos de estudio de clientes. Lees los números, comparas precios, eliges. Proceso racional. Comportamiento adulto.
Y luego está xAI.
$300 por puro feeling
El 17 de abril, xAI metió silenciosamente Grok 4.3 Beta en el selector de modelos de grok.com. Sin blog post. Sin model card — esa ficha técnica que todos los demás laboratorios de IA publican para explicar qué puede y qué no puede hacer un modelo. Sin benchmarks independientes. Sin gira de prensa. Solo un tweet de Elon Musk y una etiqueta de precio: $300 al mes por el tier "SuperGrok Heavy".
Eso es $100 más que ChatGPT Pro. $50 más que Google AI Ultra. $100 más que Claude Max. La suscripción de IA para consumidores más cara de la industria — y la única con cero evidencia independiente de que merece serlo.
El cráter de evidencia
La brecha no es una brecha. Es un cráter.
Anthropic publica system cards para cada versión de Claude. OpenAI envía divulgaciones de benchmarks con cada actualización de GPT. Google mantiene dashboards públicos de evaluación. ¿xAI? Su última model card fue para Grok 4, publicada el 20 de agosto de 2025. Desde entonces — Grok 4.1, 4.20, y ahora 4.3 — nada. Ninguna evaluación de terceros de LMSYS o HuggingFace. Ningún red-team report (auditorías de seguridad independientes donde investigadores intentan deliberadamente romper el modelo). Como señaló TechSifted el 17 de abril, el lanzamiento "llegó sin blog post oficial de xAI, sin model card publicada, sin benchmarks de terceros, y sin cobertura de medios de primer nivel."
Lo que sí trajo: generación nativa de PDFs, creación de diapositivas y exportación de hojas de cálculo — funciones que Claude, Gemini y ChatGPT lanzaron hace más de un año. Y todavía sin memoria persistente entre sesiones. Como lo expresó la reseña de BuildFastWithAI el 19 de abril: "A $300/mes, su ausencia es genuinamente difícil de defender."
Entonces, ¿por qué estás pagando?
Escala. Pura escala sin verificar.
El centro de datos Colossus de xAI corre con 555,000 GPUs de NVIDIA, con más de 700,000 activas en todas las corridas de entrenamiento. El 8 de abril, EONMSK reportó que están entrenando siete modelos simultáneamente, incluyendo dos de un billón de parámetros — un parámetro es una de las perillas ajustables dentro de una red neuronal que moldea cómo responde. Más parámetros pueden significar más capacidad. O pueden significar más facturas de electricidad. Sin benchmarks, genuinamente no puedes distinguir cuál de las dos.
El timing lo empeora. Tres días antes del lanzamiento de Grok 4.3, el 14 de abril, NBC News reveló que Apple había amenazado en privado con remover Grok de la App Store en enero por deepfakes no consensuados generados por el modelo. El déficit de confianza no es teórico — está documentado, sellado y archivado ante el Congreso.
La defensa (porque la justicia importa)
Los contraargumentos merecen aire. El cómputo es real y sin precedentes. El precio de beta naturalmente selecciona entusiastas que aceptan el riesgo. Y la integración profunda de Grok con X (antes Twitter) le da acceso a datos sociales en tiempo real que ningún competidor iguala — si necesitas analizar qué está trending ahora mismo, Grok tiene una ventaja genuina.
Estas son ventajas legítimas. Pero "confía en nosotros, tenemos muchas GPUs" no es una justificación de compra. Es un feeling.
Lo que esto significa para ti
Para cualquiera evaluando herramientas de IA hoy — ya seas un desarrollador independiente, un líder de equipo, o alguien intentando meter esto como gasto de la empresa — la lección es directa: el precio no señala calidad cuando la capa de evidencia está ausente. Un modelo que no puedes evaluar con benchmarks es un modelo que no puedes presupuestar. Nadie en finanzas aprueba "se siente bien rápido" como partida presupuestaria.
Dos religiones de pricing
El mercado de IA ahora funciona con dos filosofías de precios. Basada en evidencia: aquí está lo que puntúa, aquí está quién lo usa, aquí está lo que falló. Y basada en escala: mira qué grande es.
Solo una de esas sobrevive cuando el equipo de finanzas pregunta "¿por qué necesitamos esto?"
xAI eligió la otra.



