La meilleure ops avec qui j'ai travaillé passait la majeure partie de son temps à lire un livre à son bureau. Les déploiements — les mises en production automatisées du nouveau code — partaient à l'heure. Elle résolvait les incidents avant que quiconque ne les remarque. L'onboarding des nouveaux tournait comme une horloge suisse.

Son manager a failli la virer parce qu'elle « n'avait pas l'air assez occupée ».

Elle n'était pas inactive. Elle avait terminé.

Le fossé dont personne ne parle

La culture du travail récompense l'effort visible. Le développeur qui tape frénétiquement sur son clavier a l'air productif. Celui qui fixe le plafond pendant vingt minutes — en réfléchissant à l'architecture — a l'air de glander. La personne qui répond à ses mails à 23 h gagne l'étiquette « dévouée ». Celle qui part à 17 h se fait coller « pas impliquée ».

Une étude de 2022 menée par des chercheurs de Columbia, Georgetown et Harvard a confirmé ce que les ops savaient déjà : les managers évaluent systématiquement les employés « qui ont l'air occupés » comme plus compétents, même quand leur production réelle est inférieure à celle de collègues plus calmes. On récompense l'apparence du travail, pas le travail lui-même.

Le 12 mars, PagerDuty a dévoilé son SRE Agent en tant que répondeur virtuel — un logiciel qui détecte les pannes, lance les diagnostics et applique les procédures de correction sans qu'un humain touche un clavier. Quatre jours plus tard, à la GTC du 16 mars, NVIDIA a annoncé l'Agent Toolkit avec OpenShell — une infrastructure pour faire tourner des agents d'exploitation autonomes en production, en toute sécurité. Le 24 mars, au YC Demo Day, des startups comme IncidentFox ont pitché la réponse autonome aux incidents comme leur produit principal. Le signal envoyé par le marché : si une tâche suit un schéma prévisible, un humain ne devrait pas la faire à la main.

Ce qui pose une question à laquelle toutes les équipes ops sont désormais confrontées : si les agents IA — des programmes qui agissent de manière autonome, prenant des décisions et exécutant des étapes sans supervision humaine constante — gèrent les urgences visibles, que fait un ops de ses journées ?

La réponse n'a pas changé. Mais l'urgence de la comprendre, si.

Dans l'exploitation, l'ancien système d'incitations crée une dynamique perverse — un système qui récompense exactement les mauvais comportements. Si ton entreprise te valorise parce que tu éteins des incendies, tu n'as aucune motivation pour les prévenir. Si ton manager mesure ta valeur au nombre de messages Slack urgents que tu traites, construire des systèmes qui éliminent ces messages te rend dispensable. Et maintenant, les agents IA éteignent aussi les incendies. Plus vite. Sans dormir. Sans se plaindre.

Le paradoxe au cœur des ops

Plus tu es bon en ops, moins tu as l'air de faire quoi que ce soit. Un pompier qui empêche les incendies a l'air au chômage. Un ops dont les systèmes ne tombent jamais a l'air de se tourner les pouces. Le travail visible disparaît précisément parce que quelqu'un a fait le travail invisible correctement.

J'observe ce schéma se répéter depuis des années. L'ops qui automatise son travail se fait interroger : « Tu fais quoi de tes journées ? » Celui qui gère chaque incident à la main, enchaînant des journées de douze heures, est promu pour « son investissement exceptionnel ».

L'un a construit un système. L'autre a construit une dépendance envers lui-même. Demande-toi lequel l'entreprise a vraiment besoin — et lequel un agent IA remplace en premier.

À quoi ressemblent de bonnes ops en pratique

Le bon travail opérationnel se fait en deux phases.

Phase 1 : Construire les systèmes. Cette partie est visible et limitée dans le temps. Écrire des runbooks — des guides pas à pas pour gérer des situations spécifiques. Mettre en place du monitoring — des vérifications automatisées qui détectent les problèmes avant les utilisateurs. Créer des automatisations pour les tâches récurrentes. Documenter les processus pour que n'importe qui puisse les suivre. Cette phase est intense : généralement deux à six mois de travail concentré.

Phase 2 : Maintenir les systèmes. C'est là que la confusion commence. Les systèmes tournent. Les alertes se déclenchent et les runbooks les traitent — de plus en plus, des agents IA exécutent ces runbooks sans intervention humaine. Les nouveaux s'intègrent eux-mêmes grâce aux processus documentés. Les déploiements passent par des pipelines CI/CD — des séquences automatisées qui déplacent le code du laptop d'un développeur aux serveurs de production sans étape manuelle.

Le rôle de l'ops en Phase 2 : surveiller les schémas qui suggèrent qu'un système se dégrade. Mener des post-mortems — des revues structurées de ce qui a mal tourné et pourquoi. Planifier les capacités futures. Décider quels nouveaux processus confier aux agents et lesquels nécessitent encore un jugement humain. Lire. Apprendre. Réfléchir.

Cette dernière partie ressemble à « ne rien faire ». Mais un ops qui n'étudie pas les nouveaux outils, ne modélise pas les scénarios de panne, n'évalue pas quels frameworks d'agents correspondent à son infrastructure, et ne planifie pas les situations qui ne se sont pas encore produites se fera surprendre quand elles arriveront. Le handbook Site Reliability Engineering de Google le dit sans détour : le job consiste à concevoir la fiabilité, pas à se remettre héroïquement de son absence.

« Occupé » est un rapport de bug

Je vais dire tout haut ce que tout le monde pense tout bas : être constamment débordé signale des systèmes cassés, pas du dévouement.

Toujours en train d'éteindre des feux ? Tes systèmes de prévention ont échoué. Toujours en train de sauter d'un sujet à l'autre — basculant entre des tâches sans rapport toutes les quelques minutes ? Ta priorisation a échoué. Toujours en réunion ? Tes systèmes de communication ont échoué. Toujours en train de former les nouveaux à la main ? Ton onboarding a échoué.

« Occupé » n'est pas un état auquel aspirer. « Occupé » est un rapport de bug.

L'objectif des opérations — et honnêtement, de la plupart du travail intellectuel — c'est d'atteindre un état où les systèmes gèrent les quatre-vingt-dix pour cent prévisibles et où tu as la bande passante pour les dix pour cent imprévisibles. Ces dix pour cent, c'est là que le jugement humain compte. Tout le reste devrait tourner tout seul. En mars 2026, « tourner tout seul » veut de plus en plus dire qu'un agent IA s'en charge — et l'ops qui a construit le système décide ce que l'agent doit et ne doit pas toucher.

La sortie de route

Si tu croules sous le travail opérationnel en ce moment, voici une séquence concrète.

Semaines 1–2 : Note tout. Chaque tâche, chaque interruption, chaque problème récurrent. Ne corrige rien encore. Observe, c'est tout.

Semaines 3–4 : Catégorise. Qu'est-ce qui se répète ? Qu'est-ce qui suit un schéma ? Qu'est-ce qu'un script — un petit programme qui automatise une étape manuelle — une checklist, ou un agent IA pourrait gérer ? En général, soixante à soixante-dix pour cent du travail opérationnel tombe dans la catégorie « prévisible et automatisable ».

Semaines 5–8 : Automatise ou documente les dix plus gros consommateurs de temps. Un par semaine. Commence par ce qui t'interrompt le plus. Pour la réponse aux incidents — le processus de détection et de correction des pannes — envisage le triage par agent : des outils comme le SRE Agent de PagerDuty ou des alternatives open source gèrent les incidents récurrents et te remontent les cas inédits.

Mois 3 : Tu as maintenant quarante à cinquante pour cent de bande passante en plus. Investis-la dans le palier de problèmes suivant.

Mois 6 : Tu lis un livre à ton bureau. Tes systèmes tournent. Tes agents gèrent le prévisible. Tu as l'air de ne rien faire. Tu ne fais pas rien. Tu as terminé.

Un mot pour les managers

Si ton meilleur ops a l'air de s'ennuyer, félicitations. Tes systèmes fonctionnent. Ne lui assigne pas du travail factice pour justifier son salaire. Ne lui demande pas de faire du théâtre de la productivité — cette agitation feinte qui consiste à avoir l'air occupé pour satisfaire l'idée que quelqu'un se fait de ce que « travailler dur » devrait ressembler.

Pose-lui plutôt la question : « Que construirais-tu si tu avais trois mois de temps ininterrompu ? » Puis donne-lui ces trois mois. Ce qu'il construira rapportera plus que n'importe quelle quantité d'agitation visible.

La personne la plus productive de ton entreprise est peut-être celle qui semble en faire le moins. Ce n'est pas un paradoxe. C'est à ça que ressemble le travail terminé.