Ton agent IA n'a pas de Ctrl+Z

Tu as déployé des agents autonomes ce mois-ci. Ils créent des pull requests, mettent à jour des tickets projet, poussent des configurations en production et balancent des notifications Slack — tout ça pendant que tu dors. Le pitch : délègue le boulot ingrat, réveille-toi avec une liste de tâches cochées.

Le problème : les agents se plantent. Pas de temps en temps — l'étude MAST de UC Berkeley, publiée en mars 2025, a mesuré 41% à 86,7% de taux d'échec sur sept systèmes multi-agents de pointe. Et contrairement à un chatbot qui hallucine une mauvaise réponse que tu peux régénérer, l'erreur d'un agent c'est un commit mergé, un ticket Jira créé, un message envoyé. Des actions réelles dans des systèmes réels. Tu ne « régénères » pas un fichier de config déployé.

Entre le 8 et le 17 avril, les trois plateformes majeures ont toutes sorti des runtimes autonomes. Le 8 avril, Anthropic a lancé Managed Agents — sandboxing, persistance d'état, reprise après erreur (traduction : redémarrage après un crash). Le 14 avril, Anthropic a ajouté les Routines — des agents tournant sur leur cloud, déclenchés par des plannings ou des webhooks. Le 15 avril, OpenAI a sorti l'Agents SDK v0.14 avec exécution sandboxée et « snapshotting » — récupération de l'état du container après un échec. Le 17 avril, Google a livré Agent Development Kit (ADK) avec gestion d'état au niveau session et orchestration multi-agents. Trois plateformes, zéro primitive de rollback — aucun mécanisme permettant d'inverser ce qu'un agent a fait après qu'il a terminé de faire la mauvaise chose.

J'ai écrit sur le fossé du checkpoint la semaine dernière — les plateformes résolvent la reprise après crash en cours d'exécution. C'est le problème facile. Ton agent est mort en pleine tâche, la plateforme restaure son état, l'agent réessaie. OK. Mais voici le scénario que personne ne résout : ton agent a terminé avec succès. Il est allé jusqu'au bout, a affiché des coches vertes, et le résultat est une catastrophe. Le PR merge une logique cassée. Le ticket Jira duplique un existant. La page Notion écrase des données correctes avec des données hallucinées. L'agent n'a pas crashé — il a terminé en se trompant avec aplomb.

Quand un agent merge un mauvais pull request, crée des tickets en double dans Asana, ou pousse une page Notion cassée, voilà ce qui se passe : toi — l'humain — tu dois identifier manuellement chaque action de l'agent, tracer ses effets en cascade (est-ce qu'un autre agent a réagi au mauvais PR ? est-ce qu'un webhook s'est déclenché ?), et les inverser une par une. Ce nettoyage croît linéairement avec le nombre d'actions effectuées. Plus d'autonomie signifie plus de bordel à nettoyer.

Pourquoi le rollback n'existe-t-il pas nativement ? Deux raisons. Premièrement, la réversibilité nécessite des sémantiques transactionnelles — des actions compensatoires, des clés d'idempotence, des journaux d'actions. Les outils sous-jacents — GitHub, Linear, Slack, Notion — n'exposent pas ces primitives aux agents. Ta plateforme d'agents ne parle pas « annuler » parce que les outils qu'elle appelle ne parlent pas « annuler » non plus. Deuxièmement — et c'est la partie que personne ne dit à voix haute — il n'y a aucune incitation business. Chaque action d'un agent est un appel API facturable. Chaque relance après un rollback raté est une session facturable de plus. Les vendeurs de plateformes profitent de l'exécution en append-only. Construire le undo, c'est construire une raison pour les clients d'utiliser moins de cycles de calcul. Personne ne se porte volontaire pour ce modèle de revenus.

Entrent les vendeurs de backup, qui remplissent avec jubilation le vide que les plateformes d'agents refusent de combler. Le 14 avril, Commvault a lancé AI Protect — commercialisé littéralement comme « Ctrl+Z pour les agents IA incontrôlables ». Il cartographie le rayon d'impact d'une session d'agent, isole les changements causés par l'agent de ceux faits par les humains, et permet une inversion sélective. Comme l'a dit Pranay Ahlawat, CTO de Commvault : « Dans les environnements agentiques, les agents mutent l'état des données, des systèmes et des configurations de manières qui se composent vite et sont difficiles à tracer. » L'ironie est assez épaisse pour la couper au couteau : ton vendeur de plateforme IA ne construira pas le undo parce que ça plombe ses marges ; ton vendeur de backup le fera, parce que l'incompétence de ton agent est leur marché adressable. Deux angles morts, un désastre extrêmement rentable.

L'équation de productivité des agents a besoin d'une mise à jour. Si ne serait-ce que 30% des exécutions autonomes nécessitent une inversion manuelle — et que l'inversion prend plus de temps que la tâche originale — le ROI net devient négatif pour ce workflow. Tu as gagné 10 minutes sur le happy path et passé 40 minutes à nettoyer le sad path.

La première plateforme à livrer agent.rollback(session_id) gagne la confiance des entreprises. Pas parce que les entreprises ont besoin d'agents qui n'échouent jamais — tout échoue — mais parce qu'elles ont besoin d'agents dont les échecs coûtent moins que ce que leurs succès rapportent. En attendant, chaque plateforme d'agents est en append-only : elle peut faire des choses, mais elle ne peut pas les défaire. Ton assistant autonome n'a pas de Ctrl+Z.

Ton agent IA n'a pas de Ctrl+Z

Keep reading

Le paradoxe des agents : moins d'autonomie, plus de valeur

Trois plateformes d'agents, trois especes differentes

Anthropic a construit sa plateforme sur celles qui la financent. Les proprios viennent de s'en apercevoir.

La boite de dialogue de permission de ton agent est un placebo