Leak Anthropic Mythos : un niveau au-dessus d'Opus

Comme je l'ai couvert dans le digest de ce matin, l'histoire principale du 31 mars n'est pas venue d'un communiqué de presse. Elle est venue d'un système de gestion de contenu mal configuré.

Ce qui s'est passé

La documentation interne d'Anthropic pour un modèle dont le nom de code est Mythos — alias ingénierie : Capybara — a brièvement été exposée sur un serveur de staging accessible depuis l'internet public. Le document a été indexé par au moins deux crawlers avant que l'équipe sécurité d'Anthropic ne le retire. Entre-temps, des captures d'écran circulaient déjà sur X et dans des groupes Slack privés.

Anthropic a confirmé l'exposition. Leur déclaration était soigneusement formulée : ils ont confirmé l'existence de Mythos, confirmé qu'il est en test, et refusé de commenter le contenu du document fuité au-delà de le qualifier de "notes internes préliminaires".

Ce que disait le document

Plusieurs personnes qui ont lu le document avant sa suppression ont décrit les mêmes passages. Le langage qui s'est répandu le plus vite :

"Un changement qualitatif de capacités" — pas une amélioration incrémentale par rapport à Claude Opus, mais un changement de nature dans ce que le modèle peut faire
"Dépassera les défenseurs" dans le contexte des applications de cybersécurité
Des références à des résultats de benchmarks marqués non publiés et caviardés dans la version qui a fuité

La phrase "outpace defenders" porte ici beaucoup de poids. Lue en contexte, elle semblait décrire un risque dont Anthropic était conscient — une analyse de sécurité interne de ce que le modèle pourrait permettre de façon adversariale. Sortie de son contexte, elle ressemble à une revendication de capacité. Les deux interprétations sont inconfortables pour des raisons différentes.

Pourquoi ça compte

Le leak comporte trois niveaux, et vous devriez vous préoccuper de tous.

Niveau un : le modèle lui-même. Anthropic était discret sur ce qui vient après Opus. Les modèles de classe Sonnet font l'essentiel du travail commercial — Claude Code est construit dessus, l'API en est dominée. Mais Mythos semble être quelque chose de différent. "Changement qualitatif" est le type de langage qu'Anthropic réserve aux transitions entre niveaux de capacité. Si Mythos tient ce que le document décrit, ce n'est pas une mise à jour d'Opus. C'est un nouveau niveau au-dessus.

Niveau deux : le langage sécurité. La phrase "outpace defenders" est un signal d'alarme qui mérite attention quel que soit le contexte. Que l'équipe safety d'Anthropic écrive ces mots en interne signifie qu'ils modélisent activement des scénarios où les capacités de classe Mythos dépassent la capacité de réponse des professionnels de la sécurité. C'est une évaluation interne de risque sérieuse. Le fait qu'elle ait été exposée accidentellement est secondaire par rapport au fait qu'elle existe.

Niveau trois : le mécanisme de fuite. Un CMS mal configuré sur un serveur de staging n'est pas une attaque sophistiquée. C'est un échec de sécurité opérationnelle. Pour une entreprise qui détient certaines des recherches de capacité IA les plus sensibles au monde, ça mérite examen. Qu'est-ce qui d'autre est sur des serveurs de staging sans devoir y être ?

Le marché a réagi

Le Bitcoin a atteint 66 000 $ dans les heures suivant la large diffusion du leak. La corrélation est spéculative mais pas irrationnelle — les marchés qui traitent des signaux de capacité IA les traitent parfois comme des signaux macro. Si un modèle frontier sur le point d'arriver "dépasse les défenseurs" en cybersécurité, les implications dépassent l'industrie IA.

La dernière valorisation privée connue d'Anthropic est de 61 Md$. Ce chiffre sera réévalué.

Ce qui est à surveiller

Les benchmarks. Le document référençait des résultats non publiés. Quand Anthropic annoncera officiellement Mythos — et ils le feront, selon leur calendrier — les chiffres de benchmark indiqueront si le langage "changement qualitatif" était précis ou aspirationnel.

La disclosure sécurité. Comment Anthropic communique-t-il sur un modèle que leurs propres documents internes ont signalé comme pouvant potentiellement dépasser les défenseurs ? Le cadre de mise à l'échelle responsable qu'ils ont utilisé jusqu'ici sera fortement mis à l'épreuve.

La réponse des concurrents. OpenAI, Google et Meta ont tous des calendriers de modèles frontier. Un "changement qualitatif" confirmé d'Anthropic comprime les calendriers publics de tout le monde.

L'ironie Codex. Comme je le couvrirai à 9h30, OpenAI a livré ce matin un plugin qui tourne dans Claude Code. C'est arrivé avant la nouvelle Mythos. Si Mythos tient ses promesses, la dynamique de plateforme vient de basculer davantage en faveur d'Anthropic.

Le document est parti. Le signal, non.

Leak Anthropic Mythos : un niveau au-dessus d'Opus

Ce qui s'est passé

Ce que disait le document

Pourquoi ça compte

Le marché a réagi

Ce qui est à surveiller

Keep reading

Pourquoi la plupart des startups IA vont échouer en 2026

Les consultants ont gagné la guerre de l'IA que tu ne regardais pas

Deux fuites, une entreprise, et un IOU de 852 milliards

Le Pouvoir Est dans les Tuyaux