Seu time está entregando código mais rápido do que nunca. Os gráficos de velocidade da sprint apontam pra cima e pra direita. Pull requests — aqueles pacotes de mudanças de código propostos pra revisão — passam pela aprovação como se tivessem sido untados com manteiga. O PM dá o crédito às ferramentas de IA. Todo mundo concorda. A vida é boa.
Só que os tickets de bug estão subindo. Reverts — quando você desfaz uma mudança porque ela quebrou alguma coisa — acontecem com mais frequência. O backlog cresce. Ninguém conecta os pontos porque o dashboard diz que vocês estão arrasando.
Em 30 de março de 2026, uma equipe de pesquisadores da Singapore Management University publicou o maior estudo empírico sobre qualidade de código gerado por IA já realizado. Eles analisaram 304.362 commits verificados como escritos por IA (mudanças de código confirmadas como vindas de ferramentas de IA) em 6.275 repositórios do GitHub, cobrindo cinco ferramentas principais: GitHub Copilot, Claude, Cursor, Gemini e Devin. O período: janeiro de 2024 a outubro de 2025.
O que eles encontraram deveria tornar sua comemoração de velocidade bem mais silenciosa.
Nesses repositórios, os pesquisadores identificaram 484.606 problemas distintos. Desses, 89% eram code smells — padrões que funcionam hoje mas apodrecem amanhã. Quase 6% eram bugs de runtime. E 5,1% eram vulnerabilidades de segurança. Entre 15% e 29% dos commits de IA introduziram pelo menos um problema, dependendo da ferramenta. O Gemini ficou no topo com 28,7%. O Copilot marcou 17,3% — melhor, mas ainda é um em cada seis commits chegando com bagagem.
O golpe final: 24,2% desses problemas introduzidos pela IA ainda estavam vivos na versão mais recente do código. Vulnerabilidades de segurança tiveram uma taxa de sobrevivência de 41,1% — a mais alta de qualquer categoria. Até fevereiro de 2026, o estudo rastreou mais de 110.000 problemas sobreviventes que a IA colocou ali e humanos nunca limparam. Os pesquisadores foram diretos: assistentes de IA corrigem aproximadamente a mesma quantidade de code smells que criam, mas "criam mais bugs e problemas de segurança do que resolvem".
Um dia antes, em 29 de março, a Exceeds AI publicou dados de benchmark que enquadram por que isso importa no nível organizacional. A análise deles coloca a proporção segura de código IA entre 25–40% da produção total — a faixa em que times veem ganhos genuínos de 10–15% de produtividade sem se afogarem em retrabalho. A média global atual? 41–42%. Já passou da linha. Times acima de 40% de código IA mostram taxas de retrabalho 20–25% maiores. E aqui está o paradoxo de produtividade que deveria assombrar todo gerente de engenharia: desenvolvedores sentem que estão 20% mais rápidos, mas na verdade medem 19% mais lentos quando você conta overhead de review, debugging e correções.
Velocidade percebida sobe. Throughput real desce. O dashboard mente.
Em 6 de abril, a pesquisadora Margaret-Anne Storey, da University of Victoria, deu nome a esse problema em um novo artigo. Ela chama de "Cognitive Debt" (Dívida Cognitiva) — a erosão do entendimento compartilhado dentro de um time. Quando a IA gera código mais rápido do que os devs conseguem compreender, o time perde a capacidade de modificar seu próprio sistema com segurança. Não é só dívida técnica (código bagunçado que você vai arrumar depois). É dívida de conhecimento — ninguém entende mais completamente o que o codebase faz.
Nada disso significa que você deveria parar de usar ferramentas de IA para código. Os ganhos de produtividade são reais, e o gênio não vai voltar pra garrafa. Mas a pergunta que seu time deveria estar fazendo não é "quanto código a IA consegue escrever pra gente?" É "quanto código gerado por IA nosso processo de review e cobertura de testes realmente aguenta antes de tudo desmoronar?"
Velocidade sempre foi uma métrica de vaidade — um número que impressiona mas não diz se você está construindo algo sólido. Agora, sem um denominador de qualidade, é uma métrica perigosa. Seu gráfico de sprint está subindo e pra direita. Seu número de bugs também. Mesmo gráfico. História diferente.

