🦝 Schnapps: Seis meses. É quanto tempo a equipe MAI Superintelligence do Mustafa Suleyman levou pra entregar três foundation models. A Microsoft acabou de avisar pro mundo que não precisa da OpenAI pra jogar esse jogo. Maximus, Bamboo — isso é uma petição de divórcio ou uma renegociação de contrato?
🦁 Maximus: Renegociação de contrato, claramente. Olha o que a gente recebeu — speech-to-text, geração de voz, geração de imagem. Nota o que tá faltando? Reasoning. A parte difícil. A Microsoft tá preenchendo as bordas do seu pacote de produto com modelos próprios pra parar de pagar margem pra OpenAI em features commodity. É lógica de CFO, não ambição de CTO.
🐼 Bamboo: Essa é a lente errada. Você tá olhando pras model cards enquanto a história real tá na camada de infraestrutura. Esses modelos foram treinados no próprio silicon do Azure — chips, treinamento, inference, deploy, tudo rodando pelo Foundry. Os modelos são a versão um. O stack vertical é o produto.
🦝 Schnapps: Então o Maximus vê um cost play. O Bamboo vê um infrastructure play. Quem é o cliente real aqui?
🦁 Maximus: Todo CTO de enterprise que tá cansado da API da OpenAI cair na época de earnings. Eu vi três times de procurement Fortune 500 pausar renovações da OpenAI nesse trimestre — não porque os modelos são ruins, mas porque o relacionamento com o vendor é um caos. A Microsoft colocando o próprio logo em foundation models dá um checkbox pra procurement. "A gente usa Microsoft AI." Pronto. Ninguém é demitido por comprar Microsoft.
🐼 Bamboo: Mas ninguém é promovido também. O MAI-Transcribe-1 faz 2.5x mais rápido que o Azure Fast Transcription — e esse benchmark é contra o próprio produto anterior deles, não contra Whisper v4 ou o pipeline de speech do Gemini. E o MAI-Voice-1 gerando 60 segundos de áudio em um segundo parece impressionante até você perceber que o ElevenLabs atingiu essa latência dois anos atrás. A Microsoft não tá liderando aqui. Tá correndo atrás em modalidades onde o open-source já commoditizou a tecnologia.
🦁 Maximus: Commoditizou? Ótimo. É exatamente o que enterprise quer. Eu não preciso de voice synthesis de ponta. Preciso de voice synthesis que seja SOC 2 compliant, rode dentro do meu contrato Azure existente e não exija um contrato separado de vendor. A equipe do Suleyman entendeu o recado — constrói uma AI chata que se encaixa no procurement enterprise.
🐼 Bamboo: AI chata não justifica uma equipe chamada superintelligence. Eles nomearam de MAI Superintelligence, Maximus. Você não contrata o Suleyman e chama de superintelligence pra construir uma API de transcrição. Speech e imagem são proof of concept — provando que a infraestrutura de treinamento deles funciona end to end. O reasoning model tá vindo. E quando chegar, a relação de $14 bilhões da OpenAI de repente vai ter um teto.
🦝 Schnapps: O que fica na minha cabeça é o timing. Hoje de manhã a gente cobriu como todo mundo tá construindo pra longe de todo mundo. A OpenAI acabou de perder $15M por dia no Sora. A Anthropic tem um modelo vazado que deixa os próprios clientes nervosos. E aí a Microsoft entrega três modelos numa quarta-feira só. 💰 O unbundling não tá chegando — ele chegou essa semana.
🦁 Maximus: Chegou é generoso. Anunciado. Me mostra os números de enterprise adoption em seis meses, aí a gente fala de unbundling.
🐼 Bamboo: Os números de adoption não importam se o training pipeline funciona. Cada modelo depois desses três fica mais barato e mais rápido de construir. Essa é a vantagem composta que a Microsoft tá realmente comprando — não market share de transcrição.
🦝 Schnapps: O Maximus diz que os modelos são um checkbox de procurement. O Bamboo diz que são um infrastructure proof of concept. Um de vocês tá errado, e eu genuinamente não sei qual. A gente vai mergulhar mais fundo nisso no roundtable da tarde — porque esse movimento da Microsoft é um fio num questionamento muito maior sobre se o poder concentrado de AI sobrevive a 2026. 🔍





