Você provavelmente escolheu a API do Claude em parte porque a Anthropic se vende como o laboratório que coloca segurança em primeiro lugar — o adulto responsável que saiu da OpenAI exatamente por essas preocupações. Sua checklist de fornecedores corporativos tem um bonito check verde ao lado de "compromisso com segurança". Esse check pode valer bem menos do que você imagina.
A pergunta que ninguém na sua reunião trimestral está fazendo: qual mecanismo estrutural realmente impede a Anthropic de fazer um OpenAI no momento em que o dinheiro ficar pesado o suficiente? Porque em 14 de abril de 2026, a Bloomberg reportou que o dinheiro ficou muito pesado — ofertas de investidores ultrapassando US$ 800 bilhões. Três dias depois, em 17 de abril, o CEO Dario Amodei sentou com a Chefe de Gabinete da Casa Branca Susie Wiles e o Secretário do Tesouro Scott Bessent. Esse é exatamente o roteiro de lobby que toda big tech segue quando fica grande demais para ser regulada facilmente.
Vamos olhar o que de fato sustenta a promessa de segurança.
A Responsible Scaling Policy: um regulamento que você mesmo escreve e corrige a prova
Todo o framework de segurança da Anthropic se apoia na Responsible Scaling Policy (RSP) — um conjunto de regras auto-escrito que define AI Safety Levels, como um sistema de classificação que a empresa tanto cria quanto avalia sozinha. A versão 3.0, lançada em 24 de fevereiro, removeu as travas automáticas que antes obrigavam a Anthropic a pausar o desenvolvimento se um modelo cruzasse certos limites de perigo. O que entrou no lugar? Um requisito de "argumento forte" — autoavaliado.
Isso merece um olhar mais atento, porque é o núcleo estrutural de toda a narrativa de segurança. A RSP antiga definia níveis ASL — camadas progressivas de bloqueio. Cruzou a linha de perigo, o desenvolvimento para até você provar que é seguro. Essa função forçada criava uma restrição mecânica: não importava quanta pressão o lado comercial aplicasse, a política exigia uma pausa. A versão 3.0 substituiu esse mecanismo por um framework de "safety case" — basicamente, a liderança escreve um documento persuasivo explicando por que continuar está tudo bem.
Como escreveu o analista independente Zvi Mowshowitz em 3 de abril: "Se tudo que você precisa fazer é criar um safety case que convença a si mesmo, bem, você sempre pode fazer isso se for suficientemente importante para você."
A diferença é enorme. Uma trava automática é um disjuntor — ele desarma independentemente de quem está segurando o interruptor. Um requisito de "argumento forte" é um memorando. CEOs, conselhos e principalmente investidores olhando para um número de US$ 800 bilhões passam por cima de memorandos. Relatórios de risco agora saem a cada 3–6 meses, mas a Anthropic lança modelos a cada dois. A conta não fecha.
O Trust que não consegue fazer nada de verdade
Depois tem o Long-Term Benefit Trust (LTBT) — o órgão de governança da Anthropic que deveria manter a empresa honesta, tipo um conselho de assessores éticos com o nome na porta. Em 14 de abril, o CEO da Novartis, Vas Narasimhan, entrou no conselho, dando aos diretores nomeados pelo Trust uma maioria de 4 em 7. Parece reconfortante.
Só que o Trust detém ações consultivas que só podem eleger membros do conselho. Ele não pode bloquear lançamentos de modelos, demitir a liderança ou anular decisões operacionais. E segundo análise do EA Forum, os acionistas — incluindo Amazon e Google — poderiam potencialmente passar por cima do Trust com um voto de supermaioria. A Anthropic não publicou o acordo do Trust em si, então ninguém consegue verificar os poderes exatos.
Todos os predecessores quebraram com um valor menor
Agora olhe o padrão histórico:
| Empresa | Valuation na virada | O que morreu |
|---|---|---|
| Meta | ~US$ 300B (2023) | Time de IA Responsável |
| ~US$ 400B (2018) | "Don't be evil" | |
| OpenAI | ~US$ 500B (2025) | Governança sem fins lucrativos |
| Anthropic | US$ 800B (2026) | Travas automáticas de segurança (RSP v3) |
A Anthropic ultrapassou todos. Com salvaguardas estruturais mais fracas do que o conselho original sem fins lucrativos da OpenAI tinha antes de implodir.
O contra-argumento é real — e insuficiente
Para ser justo, a Anthropic fez coisas que nenhum outro laboratório fez. Ela segurou o Mythos — um modelo que encontrou bugs em todos os principais sistemas operacionais. Recusou demandas do Pentágono para permitir que o Claude fosse usado em ataques autônomos letais. Publicou 13 system cards — relatórios detalhados de segurança que a maioria dos labs ignora.
Isso não é pouca coisa. Mas cada uma dessas ações foi discricionária — uma escolha feita pela liderança atual porque a liderança atual quis. Não uma obrigação estrutural que sobrevive a uma troca de comando, um IPO (negociações estão em andamento com Goldman Sachs para uma possível listagem em outubro de 2026), ou uma revolta de investidores a US$ 800 bilhões. A Anthropic silenciosamente trocou o mecanismo que teria forçado uma pausa por um que requer apenas autoconvencimento.
Como a Transparency Coalition colocou em fevereiro: "Políticas de empresas mudam. Às vezes da noite pro dia."
Enquanto isso, em 19 de abril, o Axios reportou que a NSA usa o Mythos apesar da lista negra do Pentágono — o governo americano simultaneamente chamando a Anthropic de perigosa demais para trabalhar junto e capaz demais para ignorar. Nem o governo federal consegue manter uma política consistente sobre essa empresa. Boa sorte com sua planilha de risco de fornecedores.
O que isso significa para você
Sua avaliação de risco de fornecedores provavelmente lista "segurança em primeiro lugar" como um recurso. Deveria listar "enforcement de segurança = voluntário, não vinculante, autoavaliado" como um risco não precificado, logo ao lado dos SLAs de uptime e residência de dados.
A coisa mais honesta sobre a resposta de Trump quando perguntado sobre a visita de Amodei à Casa Branca em 18 de abril? "Quem?" É mais ou menos esse o peso estrutural que os compromissos de segurança da Anthropic carregam fora das paredes da própria Anthropic.
O fornecedor de IA mais seguro não é o que tem as melhores intenções declaradas. É aquele cujos compromissos de segurança um terceiro pode auditar e fazer cumprir. Em 20 de abril de 2026, essa empresa ainda não existe.



