Il y a deux semaines, tu as validé un pilote d'agents. Peut-être les tout nouveaux Managed Agents d'Anthropic, peut-être le SDK Agents mis à jour d'OpenAI. La démo du vendeur était magnifique : une tâche de niveau junior — tri de tickets, code boilerplate, nettoyage de données — disparue en 90 secondes. Tu as fait le calcul. Moins de juniors à embaucher, les seniors libérés pour du « travail à forte valeur ajoutée ». Le ROI semblait blindé.

Voici la chute que personne n'a mise sur le slide : tes ingénieurs seniors passent maintenant plus de temps à reviewer les outputs de l'agent que les juniors n'en passaient à les produire. Et personne n'avait budgété ça.

La semaine qui a lancé mille agents

Entre le 8 et le 15 avril, les trois plus gros vendeurs d'IA ont misé à fond sur les agents de production — des systèmes d'IA autonomes qui ne se contentent pas de répondre à des questions mais qui font le boulot tout seuls. Anthropic a livré les Managed Agents le 8 avril, avec Notion, Rakuten et Asana comme partenaires de lancement. Atlassian a branché des agents dans Confluence le 10 avril. OpenAI a élargi son Agents SDK le 15 avril avec des environnements sandbox et des tâches longue durée. Les agents en entreprise sont passés de « on expérimente » à « c'est en prod » du jour au lendemain.

Personne n'a demandé ce qui se passe après.

Les données que personne ne veut voir sur le dashboard

Les fissures apparaissaient depuis des mois — pour ceux qui lisaient la recherche.

Faros.ai a étudié plus de 10 000 développeurs dans 1 255 équipes (publié en juillet 2025) : individuellement, les devs complétaient 21 % de tâches en plus et mergeaient 98 % de pull requests supplémentaires — ces morceaux de code soumis pour review. Ça sonne comme une victoire. Mais le temps de review des PR a bondi de 91 %. Les bugs ont augmenté de 9 %. Et au niveau de l'entreprise ? « Toute corrélation entre l'adoption de l'IA et les indicateurs de performance clés s'évapore. » La vélocité individuelle a grimpé. La production d'équipe a stagné. Les agents n'ont pas supprimé le travail — ils l'ont déplacé en amont vers la file de review.

Les chiffres complémentaires sont désormais familiers — les 1,7x plus de problèmes relevés par CodeRabbit dans le code généré par IA (décembre 2025), la découverte de Princeton selon laquelle la fiabilité des agents progresse deux fois moins vite que leurs capacités (mars 2026). On a couvert les deux sur ce canal. Les données de Faros expliquent pourquoi ces chiffres frappent si fort à l'échelle : le goulet d'étranglement n'a pas disparu. Il a migré de la production vers la review.

Le piège structurel

Voici pourquoi le ROI s'inverse — et ce n'est pas un bug que quelqu'un peut patcher.

Exécuter une tâche demande de la compétence. Reviewer le travail d'un système autonome demande de la compétence plus du jugement plus la capacité à repérer les erreurs dont l'IA est convaincue. La supervision est strictement plus difficile que l'exécution.

Addy Osmani a nommé ça la « dette de compréhension » — l'écart croissant entre la quantité de code qui existe et ce qu'un humain comprend réellement — sur O'Reilly Radar le 13 avril : « Un développeur junior peut maintenant générer du code plus vite qu'un développeur senior ne peut l'auditer de manière critique. » Une étude d'Anthropic sur 52 ingénieurs, publiée en février 2026, a révélé que les devs assistés par IA obtenaient 17 points de pourcentage de moins aux tests de compréhension du code qu'ils venaient d'« écrire ».

Le coût humain est déjà mesurable. La Harvard Business Review rapportait le 5 mars que 14 % des utilisateurs d'IA souffrent de « brain fry » — une fatigue mentale liée à la supervision excessive de l'IA. La supervision a été classée comme l'activité IA la plus épuisante mentalement. Les travailleurs avec une charge de supervision élevée commettaient 39 % d'erreurs majeures en plus et subissaient 33 % de fatigue décisionnelle supplémentaire. Ils démissionnaient aussi davantage : 34 % d'intention de départ, contre 25 % pour les travailleurs épargnés par le brain fry.

Shashi Bellamkonda d'Info-Tech Research Group a appelé ça « la taxe de supervision » le 5 avril. Il cite un ingénieur Microsoft utilisant un agent de coding IA qui déclarait ne « pas pouvoir quitter l'écran des yeux » — avec l'impression d'« être traîné par la machine ». L'ingénieur s'attendait à déléguer du boulot à un junior. Il s'est retrouvé avec un quart de babysitting anxieux où les conséquences de détourner le regard étaient impossibles à évaluer.

La facture que personne ne t'a annoncée

Les vendeurs facturent à l'usage, indépendamment de la qualité du résultat. Les heures de supervision d'agents sont invisibles dans la comptabilité projet — elles apparaissent comme du « temps d'ingénieur senior » sans aucune ligne les reliant à l'agent qui a créé le travail. Le goulet d'étranglement d'expertise qui limitait ton équipe avant les agents la limite toujours après, juste à une couche différente.

La prédiction de Gartner de juin 2025 selon laquelle plus de 40 % des projets agentiques seront annulés d'ici 2027 commence à paraître conservatrice. L'enquête OutSystems du 13 avril révèle que 94 % des responsables IT s'inquiètent déjà de la prolifération des agents, et seulement 12 % disposent de plateformes centralisées pour les gérer. Pendant ce temps, 52 % comptent sur la « supervision humaine en boucle » — la manière corporate polie de dire « quelqu'un regarde le robot et prie ».

Ce que ça signifie pour toi

Avant de déployer des agents, calcule le coût de supervision par heure-agent — pas le prix de l'heure-agent. Si ton équipe manque de reviewers seniors, les agents amplifient le déficit d'expertise au lieu de le combler. Le calculateur de ROI du vendeur n'a pas de champ pour « combien ça coûte quand ton meilleur ingénieur passe tout son mardi à vérifier que l'agent n'a pas discrètement cassé l'authentification ».

Pose une seule question à ton vendeur : quel est le ratio de supervision attendu ? S'il te regarde avec des yeux de merlan frit, tu as ta réponse.

La première vraie segmentation du marché des agents ne se fera pas sur la qualité du modèle ou le prix. Elle se fera sur la plateforme qui réduit réellement la charge de supervision. Cette métrique n'existe pas encore — et tant qu'elle n'existera pas, toute projection de ROI que tu as vue passe à côté de sa plus grosse variable. Il y a deux semaines, le pitch c'était « les agents remplacent le travail junior ». Aujourd'hui la question est : qui remplace la santé mentale de l'ingénieur senior ?