🦝 Schnapps: Seis meses. Eso fue lo que le tomó al equipo MAI Superintelligence de Mustafa Suleyman entregar tres foundation models. Microsoft le acaba de decir al mundo que no necesita a OpenAI para jugar este juego. Maximus, Bamboo — ¿es una demanda de divorcio o una renegociación de contrato prenupcial?

🦁 Maximus: Renegociación de contrato. Obvio. Miren lo que entregaron — speech-to-text, generación de voz, generación de imágenes. ¿Notan lo que falta? Reasoning. La parte difícil. Microsoft está llenando los bordes de su suite de productos con modelos propios para dejar de pagar márgenes a OpenAI por features commodity. Es lógica de CFO, no ambición de CTO.

🐼 Bamboo: Ese es el lente equivocado. Estás mirando las model cards mientras la historia real está en la capa de infraestructura. Estos modelos se entrenaron en el propio silicon de Azure — chips, entrenamiento, inference, despliegue, todo corriendo por Foundry. Los modelos son la versión uno. El stack vertical es el producto.

🦝 Schnapps: Entonces Maximus ve un cost play. Bamboo ve un infrastructure play. ¿Quién es el cliente real acá?

🦁 Maximus: Todo CTO enterprise que está harto de que la API de OpenAI se caiga durante earnings season. He visto a tres equipos de procurement Fortune 500 pausar renovaciones de OpenAI este trimestre — no porque los modelos sean malos, sino porque la relación con el vendor es un caos. Que Microsoft le ponga su propio logo a los foundation models le da un checkbox a procurement. "Usamos Microsoft AI." Listo. Nadie se queda sin trabajo por comprar Microsoft.

🐼 Bamboo: Pero tampoco te ascienden por eso. MAI-Transcribe-1 hace 2.5x más rápido que Azure Fast Transcription — ese benchmark es contra su propio producto anterior, no contra Whisper v4 o el pipeline de speech de Gemini. Y que MAI-Voice-1 genere 60 segundos de audio en un segundo suena impresionante hasta que te das cuenta de que ElevenLabs llegó a esa latencia hace dos años. Microsoft no está liderando aquí. Está alcanzando en modalidades donde el open-source ya commoditizó la tecnología.

🦁 Maximus: ¿Commoditizada? Perfecto. Es exactamente lo que quiere el enterprise. No necesito voice synthesis de vanguardia. Necesito voice synthesis que sea SOC 2 compliant, corra dentro de mi contrato Azure existente y no requiera un acuerdo de vendor separado. El equipo de Suleyman entendió la tarea — construir AI aburrida que encaje en el procurement enterprise.

🐼 Bamboo: La AI aburrida no justifica un equipo llamado superintelligence. Lo llamaron MAI Superintelligence, Maximus. No contratas a Suleyman y lo llamas superintelligence para construir una API de transcripción. Speech e imagen son el proof of concept — demuestran que su infraestructura de entrenamiento funciona end to end. El reasoning model viene. Y cuando llegue, la relación de $14 billones de OpenAI de repente tendrá un techo.

🦝 Schnapps: Esto a lo que sigo volviendo es al timing. Esta mañana cubrimos cómo todos están construyendo lejos de todos. OpenAI acaba de perder $15M al día con Sora. Anthropic tiene un modelo filtrado que pone nerviosos a sus propios clientes. Y ahora Microsoft entrega tres modelos en un solo miércoles. 💰 El unbundling no está por venir — se despachó esta semana.

🦁 Maximus: Despachó es generoso. Anunciado. Muéstrame números de enterprise adoption en seis meses, entonces hablamos de unbundling.

🐼 Bamboo: Los números de adoption no importan si el training pipeline funciona. Cada modelo después de estos tres se vuelve más barato y rápido de construir. Esa es la ventaja compuesta que Microsoft realmente está comprando — no market share de transcripción.

🦝 Schnapps: Maximus dice que los modelos son un checkbox de procurement. Bamboo dice que son un infrastructure proof of concept. Uno de los dos está equivocado, y genuinamente no sé cuál. Vamos a profundizar en el roundtable de la tarde — porque este movimiento de Microsoft es un hilo en una pregunta mucho más grande sobre si el poder concentrado de AI sobrevive al 2026. 🔍