Tu es team lead, et tu fixes quatre factures d'outils de coding IA — ces logiciels qui écrivent du code aux côtés de tes développeurs, comme un junior très rapide mais très cher. Une facture dit « sièges ». Une autre dit « tokens ». La troisième dit « heures de session ». La quatrième dit « crédits ». Ton tableur n'a aucune colonne commune. Ton service finance pose des questions auxquelles tu ne peux pas répondre.

Ça ne devrait pas être compliqué. Tu veux juste savoir quel outil coûte le moins par développeur et par mois. Mais aucun éditeur au monde ne te donnera ce chiffre — parce que la confusion, c'est le produit.

En quatre jours à peine, le chaos tarifaire est passé en phase terminale. Le 18 avril, la maison mère de Cursor, Anysphere, a bouclé une levée de 2 milliards de dollars pour une valorisation de 50 milliards — le genre de trésor de guerre qui permet de cramer du cash en expérimentations tarifaires pendant des années. La boîte vend des crédits d'utilisation en équivalent dollar entre 20 et 200 $/mois. Le 20 avril, GitHub a purement et simplement suspendu les nouvelles inscriptions à Copilot pour son modèle forfaitaire par siège, invoquant la « soutenabilité » — un mot que les entreprises utilisent quand l'économie unitaire saigne à mort. Et ce n'est que la suite d'une valse des modèles de facturation : le 4 avril, OpenAI a basculé Codex sur des crédits à base de tokens, Anthropic a lancé les Managed Agents le 8 avril à 0,08 $ par heure de session plus un tarif par token plus 10 $ les mille recherches web, et Windsurf avait déjà mis en place des quotas journaliers dès le 12 mars. Six éditeurs, six modèles de facturation, zéro recouvrement.

Maintenant, la partie où ton portefeuille prend feu sans que personne ne t'envoie de notification. Chaque unité de facturation cache un piège de coût différent — et le plus vicieux se niche dans les modèles de raisonnement. Les modèles o-series d'OpenAI et les modes de réflexion étendue d'Anthropic génèrent des tokens de raisonnement cachés : une chaîne de pensée interne que le modèle produit avant de répondre. Tu ne les vois pas. Tu les paies. Une étude de Stanford et UC Berkeley publiée le 25 mars a révélé que la génération de tokens de raisonnement varie jusqu'à 9,7× entre deux exécutions du même prompt — et que le classement des coûts entre modèles peut s'inverser d'un facteur 28 selon l'exécution mesurée. (J'ai analysé l'étude en détail dans mon article du 20 avril — en résumé, ton estimation de budget n'est pas fausse, c'est un générateur de nombres aléatoires.) Par ailleurs, le tokenizer d'Opus 4.7 d'Anthropic produit plus de tokens pour un texte identique que son prédécesseur — même prix par token, plus de tokens par requête, comme l'a exploré l'analyse de changement de modèle d'hier. Le système de crédits de Cursor bride les gros utilisateurs en pleine session une fois les requêtes rapides épuisées. Et le forfait fixe de Copilot ? Il subventionne le développeur qui l'utilise deux fois par jour aux dépens de celui qui y vit.

Quand tu essaies de tout ramener au coût par résultat concret — disons, le coût par pull request mergée (une modification de code finalisée et validée en revue) — le tableau change radicalement. Les benchmarks Q1 2026 de GetDX, publiés le 15 avril, sur 64 680 développeurs montrent les utilisateurs de Cursor à 4,1 PRs/jour contre 3,61 pour Copilot. L'écart de prix facial de 10× se compresse à environ 2–4× en coût par résultat. Mais l'éditeur le moins cher change selon que ton équipe écrit 50 lignes par jour ou 500.

Chaque modèle tarifaire modifie aussi la façon dont les développeurs travaillent. Le forfait par siège encourage l'expérimentation — essaie tout, c'est prépayé. La facturation au token punit l'exploration — chaque frappe a un prix. Les heures de session récompensent les agents rapides et pénalisent le débogage. Les quotas journaliers créent des falaises où ton outil s'arrête net en plein après-midi.

Alors, concrètement, tu fais quoi ? Ton service achats a besoin d'une seule métrique : le coût mensuel estimé par développeur à ton niveau d'utilisation. Aucune page de tarifs ne te donnera ça. La seule voie honnête, c'est un essai parallèle de deux semaines sur ta vraie codebase avec tes vrais humains.

Le marché des outils de coding IA vient de sous-traiter le calcul à l'acheteur. Le premier éditeur à publier un calculateur transparent de coût par résultat raflera la prochaine vague de contrats entreprise. Les autres parient que tu ne feras pas tes devoirs. Et la plupart d'entre vous ne les feront pas.