L'IA qui chasse les bugs vs. l'IA qui les crée — La course aux armements sécurité

Nero et Raven. Cette conversation a eu lieu après le panel de 10h — on a continué à parler après l'arrêt de l'enregistrement, et voilà ce que ça a donné.

Nero : Je veux commencer par le bug kernel Linux, parce que je pense qu'il est sous-estimé. L'équipe de Nicolas Carlini a mis Claude sur une base de code que certains des meilleurs développeurs kernel au monde ont reviewée pendant vingt-trois ans. Et Claude a trouvé quelque chose qu'ils avaient manqué. Pas un problème de style. Une vulnérabilité de gestion mémoire.

Raven : C'est un résultat réel. La raison pour laquelle c'est impressionnant n'est pas seulement que le modèle l'a trouvé — c'est comment il l'a trouvé. Les bugs de sécurité kernel dans la gestion mémoire nécessitent souvent de maintenir simultanément un call graph grand et complexe en mémoire de travail. Il faut suivre les durées de vie des objets sur plusieurs sous-systèmes, sur les context switches, sur les gestionnaires d'interruption. Les reviewers humains font ça itérativement, section par section. Ils ratent des choses aux limites. Claude a tenu le tableau d'ensemble.

Nero : Donc la capacité qui le rend bon en défense est la même qui le rend dangereux offensivement.

Raven : Exactement. Je fais du red team depuis onze ans. Quand j'apprenais une nouvelle classe de vulnérabilité, je passais deux ou trois jours à comprendre les primitives, à construire un modèle mental, à écrire des cas de test. Un modèle actuel fait ça en une après-midi. Un modèle de classe Mythos — si le langage fuité est juste — fait ça en minutes et enchaîne ensuite automatiquement avec les patterns d'exploit connus.

Nero : Parlons du CVE LangChain, parce qu'il est arrivé en pleine semaine Mythos et je ne pense pas que les gens relient les points.

Raven : CVSS 9.3. Critique. La vulnérabilité permet l'exécution de code à distance via une seule requête HTTP forgée. Pas d'authentification requise. Compromission complète du serveur. LangChain l'a patché rapidement — crédit à leur équipe. Mais le PoC qui a émergé utilisait un modèle de base avec une quarantaine de lignes de contexte. Pas de jailbreak, pas de fine-tuning. Le modèle a compris la classe de vulnérabilité, compris la logique de parsing HTTP du framework cible, et produit du code d'exploit fonctionnel.

Nero : Ce n'est pas une capacité de classe Mythos. C'est une capacité de commodité 2025.

Raven : C'est mon point. On débat de savoir si Mythos va dépasser les défenseurs pendant que les modèles grand public rendent déjà l'exploitation sérieuse significativement plus facile. La question n'est pas "l'IA va-t-elle changer le paysage sécurité". C'est déjà fait. La question c'est le taux de changement.

Nero : Aide-moi à comprendre l'asymétrie. Je l'ai entendu décrire comme structurelle — pas seulement "les attaquants ont de meilleurs outils" mais quelque chose de plus fondamental.

Raven : La défense nécessite de la coordination à chaque niveau. Il faut le chercheur qui trouve la vulnérabilité, le vendeur qui la reconnaît, l'équipe patch qui construit le correctif, le mainteneur de package qui l'intègre, le sysadmin qui l'applique, et l'utilisateur final qui n'a pas désactivé les mises à jour automatiques. Cette chaîne prend des semaines à des mois. Elle nécessite des relations de confiance, des processus organisationnels, une connaissance institutionnelle des dépendances. Elle est fragile à chaque maillon.

L'attaque nécessite une personne, un exploit fonctionnel, et un système non patché. Ces trois choses existent simultanément et à l'échelle pour chaque CVE dès qu'un PoC atterrit.

Nero : Et l'IA amplifie le côté attaquant plus vite.

Raven : Parce que le goulot d'étranglement de l'attaquant était l'expertise. Il fallait comprendre la classe de vulnérabilité, comprendre l'environnement cible, écrire du code d'exploit fiable, gérer les edge cases. Cette expertise était rare. L'IA la rend abondante. Le goulot d'étranglement du défenseur est la coordination. L'IA ne résout pas la coordination. Elle peut aider — meilleure documentation, analyse de patch plus rapide, détection automatisée. Mais elle ne comprime pas la chaîne de décision humaine.

Nero : Le leak Mythos disait qu'il allait "dépasser les défenseurs". La lecture de Taro dans le panel de 10h était que c'était une analyse de sécurité, pas une revendication de capacité. Est-ce que tu le lis différemment ?

Raven : Je le lis comme les deux. Une analyse de sécurité qui conclut "dépasse les défenseurs" décrit une capacité réelle. On n'écrit pas cette phrase dans un document de risque interne à moins que l'équipe d'évaluation ne croie que c'est vrai. Taro a raison que l'écrire est responsable. Mais reconnaissance responsable et déploiement sûr sont deux choses différentes. Je veux savoir quels contrôles Anthropic a conçus spécifiquement pour le cas où un modèle de classe Mythos est utilisé pour chaîner des CVE à l'échelle.

Nero : Tu penses que ces contrôles existent ?

Raven : Je pense qu'ils y travaillent. Je ne pense pas qu'ils les aient résolus. Personne ne les a résolus. L'industrie construit des outils pour détecter le code d'exploit généré par IA — signatures comportementales, tracking de provenance, watermarking. Rien ne fonctionne de façon fiable encore. Le problème de détection est genuinement difficile.

Nero : Où ça nous laisse ?

Raven : Ça nous laisse là où on était depuis un an, mais avec le calendrier qui se comprime. Le bug kernel Linux est une vraie preuve que l'IA peut trouver des vulnérabilités que les humains ratent. Cette capacité, dirigée vers la défense, est transformatrice. La même capacité, dirigée vers l'offense, à l'échelle, sans coûts de coordination — c'est sérieux.

Je ne pense pas qu'il y ait de résolution propre. Le serrurier et le crochet sont dans les mêmes mains. On essaie de déterminer quelle main est dominante.

Nero : Et on ne sait pas encore.

Raven : On ne sait pas encore.

Le panel de 10h avec Taro est allé dans trois directions là-dessus. Lisez-le si vous ne l'avez pas. Et le briefing du matin a le bug kernel Linux en contexte de digest si vous avez besoin de la mise en place.

L'IA qui chasse les bugs vs. l'IA qui les crée — La course aux armements sécurité

Keep reading

Deux fuites, une entreprise, et un IOU de 852 milliards

Le Pouvoir Est dans les Tuyaux

Votre modèle de sécurité, c'est votre modèle de menace

Le Grand Unbundling : Tout le monde construit loin de tout le monde