Esta mañana cubrimos la jugada de plataforma de Anthropic con Managed Agents — cuatro capas de lock-in, cada una más pegajosa que la anterior. Pero el modelo de facturación enterrado en ese lanzamiento merece su propia autopsia. Porque tu modelo de costos de IA se bifurcó el 8 de abril, y tu equipo de finanzas todavía no se enteró.

Aquí va la división. Las llamadas tradicionales a la API — pregunta entra, respuesta sale — siguen cobrándose por token, igual que siempre. Pero cualquier cosa que haga loops, reintentos, ejecute herramientas o piense de forma autónoma ahora lleva un segundo cargo: $0.08 por session-hour, medido al milisegundo. Dos medidores corriendo al mismo tiempo. Anthropic es el primer vendor grande en cobrar el cómputo de agentes de esta forma. OpenAI y Google fueron por caminos completamente distintos.

Pongamos la misma carga de trabajo en los tres. Una tarea realista de agente: revisión de código en un repositorio mediano. Una hora de ejecución. El agente lee archivos, corre tests, hace loops sobre fallos, escribe un resumen. Al final consumió aproximadamente 500K tokens de entrada y 100K de salida.

Anthropic (Sonnet 4.6): Runtime de sesión a $0.08. Tokens de entrada a $3/M: $1.50. Salida a $15/M: $1.50. Total: $3.08. La tarifa de sesión es el 2.6% de la factura.

OpenAI (GPT-5.2-Codex): Sin tarifa de sesión. Entrada a $1.75/M: $0.88. Salida a $14/M: $1.40. Total: $2.28. Tokens puros. Nada más que rastrear.

Google (Vertex AI Agent Engine): Facturación por segundo de cómputo — vCPU y memoria, con precio de contenedor en la nube. Un runtime de agente estándar cuesta entre $3 y $8 por hora según la configuración, y pagas las tarifas de tokens de Gemini encima. El total varía brutalmente pero normalmente se absorbe en compromisos existentes de GCP. La misma tarea podría salir en unos $5–$10 — o efectivamente cero si ya comprometiste suficiente gasto en GCP para el trimestre.

A escala pequeña, OpenAI gana en costo bruto. A escala, el panorama se invierte.

Presupuesta 10,000 horas-agente al mes. La capa de orquestación de Anthropic son $800 fijos — una línea que un CFO puede aprobar sin necesitar un tutorial de tokenomics. La factura de OpenAI es 100% variable: cada token, cada reintento, cada momento en que un agente decide reconsiderar mueve la cifra. Sin piso, sin techo. El costo de agentes de Google desaparece dentro de tu compromiso de nube, lo cual es una ventaja o una trampa dependiendo de cómo lea tu contrato.

El punto de equilibrio depende de qué tan hambrientos de tokens sean tus agentes. Agentes ligeros — monitoreo, ruteo, verificaciones de estado — quizás usen 50K tokens por hora. En Anthropic, eso sale $0.31 en total. Esa tarifa de $0.08 ahora es el 26% de la factura. No es un error de redondeo. Agentes pesados haciendo generación de código o investigación profunda queman 1M+ tokens por hora. La tarifa de sesión baja del 1%. Invisible.

Anthropic está haciendo una apuesta implícita: los agentes se van a hacer más pesados, no más ligeros. Si la industria avanza hacia la eficiencia de tokens — hacer más con menos contexto — el session-hour se convierte en un impuesto cada vez más visible. Si los agentes siguen hambrientos, desaparece en el ruido. Anthropic le apuesta al hambre.

Tres vendors, tres filosofías de facturación, cero unidades en común. No puedes meterlos en la misma hoja de cálculo sin construir un modelo de normalización, y ese modelo requiere supuestos de carga de trabajo que todavía no mediste. Comparar costos de IA en 2026 es más difícil que comparar costos de nube en 2014 — y ese problema tampoco lo resolvimos.

Así que aquí queda la cosa. Las llamadas simples a la API siguen en el medidor de tokens. Cualquier cosa autónoma ahora vive en session-hours, tokens puros o facturación de cómputo en la nube dependiendo de tu vendor. Cambiar de proveedor significa reaprender no solo la API sino todo el modelo financiero alrededor.

El token fue la unidad universal de costo en IA por tres años. Anthropic lo partió en dos dimensiones, y ahora todos tienen que elegir en qué denominación van a operar.