Microsoft acaba de decirle a OpenAI exactamente cómo termina esta historia.
Tres foundation models — MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2 — llegaron a Azure Foundry esta semana. No son wrappers. No son fine-tunes. Son modelos originales construidos por el equipo MAI Superintelligence de Microsoft, liderado por Mustafa Suleyman — el tipo que antes dirigía Google DeepMind y ahora reporta directamente a Satya Nadella.
Déjenme hacer el reverse-engineering de lo que realmente pasó acá.
Microsoft metió $13 mil millones en OpenAI. Tienen board seats, acuerdos de revenue-sharing y derechos exclusivos de cloud distribution. Y esta semana lanzaron productos competidores en speech, voice e image generation — no más baratos, sino mejores al mismo precio.
MAI-Transcribe-1 alcanza 3.8% de word error rate en 25 idiomas — el más bajo en el benchmark FLEURS — a $0.36 por hora. Idéntico al precio de Whisper de OpenAI, pero con accuracy notablemente mejor out of the box. MAI-Image-2 debutó top-3 en Arena.ai el primer día. MAI-Voice-1 genera un minuto de audio en un segundo a $22 por millón de caracteres. No son research previews. Son servicios production-ready con billing codes de Azure.
Esto es supplier diversification disfrazada de innovación.
Cada cliente enterprise de Azure ahora tiene una elección: usar OpenAI a través de Microsoft, o usar Microsoft a través de Microsoft. La diferencia de margen en esa decisión de routing es brutal. Cuando eres la plataforma y el proveedor del modelo al mismo tiempo, te quedas con los dos cortes.
OpenAI también lo ve. Están construyendo su propia infraestructura cloud, contratando ingenieros de Azure y hablando abiertamente de reducir su dependencia de Microsoft. La sociedad de $13 mil millones ahora es una negociación de divorcio de $13 mil millones donde los dos lados ya están saliendo con otras personas.
Si tengo razón, Microsoft se convierte en una plataforma three-vendor en 18 meses — OpenAI, MAI y lo que adquieran después — y el revenue share de OpenAI cae de "socio estratégico" a "uno más entre muchos". Si me equivoco, estos models se quedan como productos nicho en speech e imagen mientras la línea GPT de OpenAI sigue dominando texto, y la sociedad se arrastra otro ciclo más.
Pero miren el pricing. Miren quién lidera el equipo. Miren la shipping velocity.
Nadie lanza tres foundation models el mismo día para complementar a un socio. Eso se hace para reemplazarlo.
Ya había señalado la matemática del partnership cuando cubrimos la crisis del directorio de OpenAI. Esta semana, Microsoft empezó a hacer las cuentas en voz alta.





