Tu utilises l'API de Claude — un moyen pour ton appli de causer avec l'IA d'Anthropic, comme un serveur entre ton code et la cuisine. Tu envoies un prompt, tu reçois une réponse, tu payes au token (un bout de mot que l'IA lit, environ ¾ d'un mot anglais). Deal classique. Si ça te plaît pas, tu migres vers GPT en un après-midi.
Mais faire tourner des agents IA — des programmes qui utilisent l'IA pour accomplir des tâches en plusieurs étapes de manière autonome — en production, ça demande une infrastructure que personne n'a envie de construire. Sandboxing, gestion d'état, récupération d'erreurs, scaling. Le fossé entre « ça marche en démo » et « ça marche un mardi à 3h du mat' quand tout pète » tue la plupart des projets d'agents avant même qu'ils sortent.
Le 8 avril, Anthropic a lancé Managed Agents — un service cloud qui héberge, exécute et gère tes agents IA sur les serveurs d'Anthropic. Le prix : 0,08 $ par session-heure (imagine que tu loues un micro-serveur pour ton agent) plus les coûts standard en tokens. Notion, Rakuten, Asana et Sentry se sont inscrits comme early adopters.
Voilà ce que tu obtiens pour ces huit centimes. Chaque agent tourne dans un conteneur isolé — une boîte scellée qui ne peut rien toucher à l'extérieur — avec des checkpoints automatiques (des sauvegardes pour que ton agent puisse reprendre après un crash), des permissions scopées (il accède uniquement à ce que tu autorises), et le support de sessions qui durent des heures. Selon SiliconANGLE, Rakuten a déployé des agents dans cinq départements — produit, ventes, marketing, finance, RH — en une semaine par agent. Sentry a couplé son outil de débogage avec un agent Claude qui écrit désormais des patchs et ouvre des pull requests (des propositions de modifications de code soumises à revue). Notion a intégré des agents qui permettent aux développeurs de livrer du code et aux équipes métier de générer des présentations directement dans leurs workspaces.
Le timing raconte la vraie histoire. Un jour plus tôt, le 7 avril, Anthropic a atteint 30 milliards de dollars de revenus annualisés — le revenu annuel projeté à partir des gains mensuels actuels — contre 9 milliards fin 2025. C'est un bond de 3,3x en quatre mois, dépassant les ~25 milliards d'OpenAI pour la première fois. Les clients entreprise dépensant plus d'un million de dollars par an ont doublé pour dépasser les 1 000 depuis février. Huit entreprises du Fortune 10 sont clientes d'Anthropic. Claude Code — l'outil de coding d'Anthropic — génère à lui seul 2,5 milliards de dollars de revenus annualisés après neuf mois sur le marché. MCP (Model Context Protocol — un standard de connexion universel pour les outils IA, comme l'USB mais pour les données) a atteint 97 millions d'installations en mars 2026.
Tu vois le schéma ? L'API te donne le modèle. Claude Code te donne les outils développeur. MCP standardise la connexion des outils. Managed Agents héberge la charge de travail complète. Chaque couche rend la suivante naturelle, pas une nouvelle décision fournisseur. C'est AWS vers 2008 — tu commences par le compute, puis tu rends le départ progressivement plus douloureux. Le revenu d'Anthropic ne triple pas en quatre mois parce que le modèle est devenu trois fois plus intelligent. Il triple parce que chaque couche d'infrastructure capitalise sur celle du dessous.
Les compromis sont réels, et les nouveaux sont pires que les anciens. Managed Agents introduit une facturation à double couche — temps plus tokens — et personne ne sait ce qu'un workflow d'agent complexe coûte réellement avant l'arrivée de la facture. Un agent de coding qui tourne pendant quatre heures, se plante dans trois impasses, fait marche arrière et finit par livrer un fix ? Tu payes chaque minute d'errance plus chaque token de raisonnement. Avec un simple appel API, le coût évolue avec l'output. Avec les session-hours, le coût évolue avec le temps que ton agent réfléchit — y compris quand il réfléchit mal. La prévision budgétaire pour les charges agents vient de devenir un jeu de devinettes déguisé en modèle tarifaire.
Mais la facturation n'est même pas le crochet le plus acéré. Quand ton agent tourne sur Managed Agents, son état — checkpoints, historique d'exécution, mémoire de runtime — vit sur les serveurs d'Anthropic. Pas ton code. Pas tes prompts. Le contexte opérationnel réel que ton agent accumule en faisant son boulot. Un agent Sentry qui a passé trois mois à apprendre les particularités de ta codebase, à construire un contexte implicite sur quels fichiers cassent ensemble, quels patterns de PR causent des régressions ? Ce savoir de runtime existe dans les conteneurs d'Anthropic. Tu peux exporter ton code quand tu veux. Tu ne peux pas exporter ce que ton agent est devenu. Ce n'est plus le vieux lock-in du changement d'API. C'est de la dépendance fournisseur au niveau de la mémoire institutionnelle.
Et le modèle session-hour crée une incitation qu'Anthropic ne mentionnera jamais dans un article de lancement. Chaque minute où ton agent tourne, c'est du revenu. Les agents efficaces qui résolvent les problèmes vite rapportent moins à Anthropic que les agents qui délibèrent, réessaient et explorent. La plateforme profite du temps de calcul, pas des résultats. Ton intérêt — des résultats rapides et pas chers — va directement à l'encontre de la structure tarifaire. Cette tension n'aura pas d'importance à 0,08 $ de l'heure. Elle en aura énormément quand Managed Agents gérera des milliers de sessions concurrentes et que ce tarif s'ajustera aux « conditions du marché ».
Anthropic vend désormais quatre couches d'infrastructure IA. Le modèle — ce truc que tu croyais acheter — n'est que la couche un. Les outils, le protocole, la stack d'hébergement au-dessus : c'est là que vit la marge. Et avec Managed Agents, pour la première fois, tes données opérationnelles — pas juste tes appels API, mais les comportements appris de tes agents et leur état de runtime — sont sur leurs serveurs. Tu ne loues plus du compute. Tu déposes ton savoir institutionnel dans le coffre-fort de quelqu'un d'autre en espérant que les conditions de retrait restent favorables.



