Tu demo del agente IA funcionó de maravilla. Respondió preguntas, llamó tools — pequeños programas que la IA ejecuta por su cuenta para buscar datos o realizar acciones — y manejó los casos borde. La factura de API llegó a $47. Tu jefe se emocionó. Tu PM empezó a escribir el roadmap. El CEO lo mencionó en la junta directiva.
Ahora desplegá ese mismo agente en producción para 10,000 usuarios y mirá cómo esos $47 se transforman en un número que hace que tu director de finanzas busque el tequila. 💰
El presupuesto que nadie muestra en el demo day
El Q1 2026 trajo una oleada de lanzamientos de agentes — Anthropic lanzó integraciones de Claude para empresas, OpenAI desplegó Operator para equipos de pago, Google metió agentes Gemini en Workspace. Todos los proveedores vendieron la misma historia: conectá la API, mirá cómo funciona. Nadie empezó mostrando la factura.
Vamos a hacer ingeniería inversa de dónde realmente se va el dinero cuando movés un agente IA — un programa autónomo impulsado por un LLM (large language model, el cerebro detrás de Claude y ChatGPT) — de un demo pulido a un producto real.
Según una encuesta de Q3 2025 de Mavvrik y Benchmarkit, el 85% de las organizaciones subestima sus costos de IA por más del 10%. Casi una cuarta parte falla en su estimación por más del 50%. Eso no es un error de redondeo — es la diferencia entre un producto viable y un incendio presupuestario.
Acá va el desglose que sigo viendo cuando analizo despliegues en producción: 🔍
Costos de API del LLM (40-60% del gasto total). La API — el tubo que tu app usa para enviar prompts a Claude o GPT y recibir respuestas — cobra por token (un fragmento de palabra que la IA lee, aproximadamente ¾ de una palabra en inglés). Una sola llamada a Claude Opus 4.6 con la ventana de contexto completa — cuánto texto puede "ver" la IA de una vez — cuesta $5 por millón de tokens de entrada según la página de precios de Anthropic. Multiplicá eso por miles de usuarios ejecutando flujos de varios pasos con reintentos, y estás viendo $10,000–50,000/mes para una app con tráfico moderado. Antes de que alguien siquiera empiece a optimizar prompts.
Preparación de datos (40-60% de los costos iniciales). Tu agente necesita conocimiento. Ese conocimiento vive en documentos, bases de datos y APIs que necesitan limpieza, chunking, embedding — convertir texto en números que un sistema de búsqueda pueda emparejar — e indexación. Esto no es un trabajo de una sola vez. Los datos cambian, los schemas evolucionan, y tu pipeline de RAG (retrieval-augmented generation — un sistema que alimenta documentos relevantes a la IA antes de que responda) necesita atención constante. Presupuestá $25,000–100,000 para cualquier sistema no trivial.
Integración (20-35% adicional). Tu agente habla con tu CRM, tu base de datos, tu sistema de tickets, tu capa de autenticación. Cada integración es una superficie para bugs, una dependencia que puede romperse a las 3 AM, y un perímetro de seguridad que necesita auditoría.
La sorpresa de gobernanza (20-30% extra en el presupuesto). La línea más tramposa de la factura. Tu agente sale a producción, y entonces legal pregunta por la privacidad de datos. Seguridad pregunta por prompt injection — cuando alguien engaña a la IA para que ignore sus instrucciones. Cumplimiento regulatorio quiere trazabilidad. Meter todo esto a la fuerza en un sistema que nadie diseñó para eso siempre cuesta más que construirlo desde el inicio. Y siempre pasa a mitad del proyecto porque nadie invita a legal al demo del prototipo.
El mantenimiento por sí solo supera el costo de desarrollo en el primer año. Migraciones de versiones de modelos, parches de seguridad, ajustes de escalabilidad, y el tuneo constante que se requiere cuando tu agente empieza a alucinar — producir respuestas incorrectas con total confianza — de formas creativamente nuevas.
Una encuesta de Deloitte de noviembre 2025 encontró que solo el 11% de las organizaciones realmente ejecutan agentes IA en producción. El resto se quedó en pilotos — los equipos los abandonaron tras desbordes de costos o los archivaron silenciosamente.
El otro lado de la hoja de cálculo
Estos costos son reales, pero necesitan contexto. Un equipo de soporte al cliente de 20 personas cuesta $800K–1.2M al año solo en salarios. Si un agente IA maneja el 60% de los tickets por $200K/año todo incluido, eso sigue siendo una victoria enorme.
La tendencia de precios va agresivamente a la baja. Haiku 4.5 de Anthropic cuesta $1 por millón de tokens de entrada — 80% más barato que Opus (misma página de precios mencionada arriba). Una arquitectura inteligente — enrutar consultas simples a modelos más baratos, cachear respuestas comunes, comprimir contexto — puede reducir los costos de LLM entre un 70-90%. Los equipos que se vuelan el presupuesto usan Opus para todo porque su prompt engineering es flojo.
¿Y esa cifra del 11% en producción? Hace un año estaba en 4%. La tasa de fracaso es alta porque esta es una categoría nueva. Las tasas de fracaso en etapas tempranas se veían similares para la migración a la nube, las apps móviles, y cada otro cambio tecnológico que eventualmente se volvió normal.
Lo que le digo a todos los que me preguntan 🦝
Triplicá tu estimación de costos de API. Lo que calculaste con tu prototipo, multiplicalo por tres. Los usuarios van a usar el agente de formas que nunca probaste. Los casos borde demandan más contexto. El uso de tokens sube, nunca baja.
Empezá con el modelo más barato que funcione. Haiku para enrutamiento simple. Sonnet para la mayoría de las tareas. Opus solo para los problemas difíciles. El model routing — elegir automáticamente qué modelo de IA maneja cada solicitud — es la diferencia entre $5K/mes y $50K/mes con el mismo tráfico. ⚡
Presupuestá para lo aburrido. Monitoreo, logging, rate limiting, manejo de fallbacks, alertas de costos. Un agente sin controles de costos es una tarjeta de crédito conectada a un generador de números aleatorios.
Planificá la gobernanza desde el día uno. No el día 90, no "después del lanzamiento", no "cuando legal mande ese correo". Día uno.
Los agentes IA en producción son caros. Solo que son menos caros que las alternativas — si presupuestás para la realidad en vez del demo. Las empresas que fracasan construyen su caso de negocio sobre esa corrida del prototipo de $47. Las empresas que ganan miran los números reales y dicen "sí, cuesta $30K/mes, y aun así vale la pena".
Conocé la diferencia antes de salir a producción. 🚀





