Tous les vendeurs d'IA ont passé le mois d'avril à te vendre le même rêve : des agents autonomes — de petits employés numériques qui écrivent du code, ferment des tickets et répondent aux mails clients pendant que toi, tu te concentres sur la « stratégie ». Anthropic, OpenAI, Google — les trois ont sorti leurs plateformes d'agents en l'espace de deux semaines. Ton fil LinkedIn ressemble à un salon de recrutement pour robots.

Le truc que personne ne mentionne pendant la keynote : ton boss vient de t'envoyer un Slack pour savoir quand TON équipe déploie des agents. Les démos sont magnifiques — un agent passe du bug report au pull request en quelques minutes, le public applaudit comme s'il n'avait jamais vu un script bash de sa vie. Mais que se passe-t-il vraiment une fois la démo terminée et les caméras éteintes ?

Trois lancements coup sur coup. Anthropic a sorti Managed Agents le 8 avril — des API d'agents hébergées dans le cloud (un moyen pour ton logiciel de créer et piloter des agents à distance) à 0,08 $ la session-heure. OpenAI a mis à jour son Agents SDK le 15 avril avec l'exécution en sandbox native — les agents tournent dans une boîte hermétique pour ne rien casser à l'extérieur. Et Google Cloud Next a démarré le 22 avril avec une keynote intitulée « The Agentic Cloud », mettant en avant ADK (Agent Development Kit), sorti plus tôt dans le mois. Google a intégré le human-in-the-loop comme fonctionnalité de premier plan dès le départ — mettre un agent en pause en pleine tâche, obtenir l'approbation d'un humain, reprendre.

Les early adopters ont foncé tête baissée. Rakuten a déployé des agents spécialisés dans cinq départements — produit, ventes, marketing, finance, RH — chacun opérationnel en moins d'une semaine. Le CTO d'Asana a déclaré livrer des fonctionnalités « considérablement plus vite ». Notion a branché Claude directement dans ses espaces de travail pour du traitement de tâches en parallèle. Et Sentry ? Sentry a tout envoyé : leur agent passe du bug signalé au pull request ouvert sans aucune intervention humaine. Totalement autonome. Le rêve des vendeurs devenu réalité.

Mais voilà la partie qui fâche. Si tu as suivi la recherche indépendante ce mois-ci — et ce canal l'a suffisamment citée pour que les lecteurs réguliers puissent réciter les chiffres par cœur — le schéma ne change jamais. Le code IA génère 1,7× plus de défauts. Les PRs augmentent de 20 % tandis que les incidents grimpent de 23,5 %. Les développeurs suppriment un cinquième du code IA accepté et en réécrivent lourdement 7 % de plus. Gartner prédit que 40 % des projets agentiques seront abandonnés d'ici 2027. Plus de volume, de pires résultats. Chaque étude. Sans exception. 😹

Andrej Karpathy l'avait annoncé le 3 avril — avant qu'aucune de ces trois plateformes ne soit lancée. « L'industrie fait un saut trop grand et essaie de prétendre que c'est incroyable, alors que ça ne l'est pas. » Trois semaines et trois lancements plus tard, rien ne lui a donné tort.

Ça crée un fossé structurel entre le marketing et la réalité. Les vendeurs se battent sur l'autonomie maximale parce que ça claque en démo sur scène. Mais les données de production disent l'inverse : un périmètre restreint bat une capacité large. Les workflows en lecture (où les agents analysent mais modifient rarement) battent ceux en écriture. Les points de contrôle humain avant toute action conséquente battent le pilote automatique intégral. Même le succès « totalement autonome » de Sentry fonctionne précisément parce que le triage de bugs vers PR est un domaine intrinsèquement contraint — pas parce que l'autonomie en soi est gagnante. 😾

Google a peut-être compris le truc. Leur ADK intègre le human-in-the-loop comme chemin par défaut, pas comme un boulon rajouté après coup. Comme l'a écrit John Furrier de SiliconANGLE le 20 avril : « Les fonctionnalités se posent sur les plateformes. Les systèmes d'exploitation définissent la plateforme. » La vraie compétition, ce n'est pas qui construit l'agent le plus autonome — c'est qui construit le meilleur plan de contrôle.

Alors quand ton boss te parle d'agents, ne lui transfère pas le clip de la keynote. Pose une seule question sur n'importe quelle plateforme : est-ce qu'il est facile de construire un agent strictement contraint avec des limites de périmètre explicites, des accès en lecture seule par défaut, et une approbation humaine obligatoire avant toute action conséquente ? Si la réponse est « eh bien, on peut configurer ça... » — fuis. Si c'est le comportement par défaut — tu tiens peut-être quelque chose. 😼

L'agent le plus intelligent ne gagnera pas la guerre des plateformes. Le plus contrôlable, oui. Et ça inverse les priorités de tous les vendeurs actuels. 🐈