Tous les outils de code IA que tu utilises en ce moment — Cursor, Copilot, Windsurf — tournent sur le cerveau de quelqu'un d'autre. Tu tapes du code, l'éditeur l'envoie à Claude ou GPT via une API (un tuyau qui connecte ton éditeur à une IA distante), et un modèle conçu pour écrire de la poésie, planifier des vacances, et accessoirement coder, te renvoie une suggestion. Ça marche. Mais c'est lent, générique, et tu loues l'intelligence à des boîtes qui pourraient te bouffer demain matin.
Windsurf — l'IDE ' IA-native ' qui a démarré sous le nom Codeium, puis s'est fait racheter par Cognition en 2025 — a décidé que la location, c'était pour les pigeons.
Le 29 octobre 2025, Cognition a sorti SWE-1.5, la dernière version de sa famille de modèles maison, conçue spécifiquement pour l'ingénierie logicielle. Pas un fine-tune (un modèle existant retouché avec des données supplémentaires). Pas un wrapper. Un modèle de taille frontier avec des centaines de milliards de paramètres (les boutons internes qu'une IA utilise pour prendre ses décisions). Cognition l'a entraîné de bout en bout par reinforcement learning (une méthode d'apprentissage où le modèle progresse par essai-erreur) sur de vraies tâches de développement.
Sur SWE-Bench Pro — le benchmark de référence de l'industrie, 731 tâches de code complexes réparties sur 41 dépôts — SWE-1.5 a obtenu 40.08%. Claude Sonnet 4.5 a scoré 43.60%. Suffisamment proche pour faire lever quelques sourcils, surtout vu ce qui suit.
Windsurf s'est associé à Cerebras, un fabricant de puces spécialisé dans le hardware IA, pour servir SWE-1.5 à 950 tokens par seconde. Un token, c'est grosso modo les trois quarts d'un mot — donc 950 tokens/sec signifie que le modèle génère du texte environ 13 fois plus vite que Sonnet 4.5 et 6 fois plus vite que Haiku 4.5. Cognition a aussi réécrit ses pipelines internes de vérification de lint (détection automatique d'erreurs de code) et d'exécution de commandes, réduisant jusqu'à 2 secondes de surcharge par étape dans les sessions d'agent — ces boucles itératives où l'IA lit du code, lance des tests, lit les erreurs, et corrige.
Le résultat concret : des workflows d'agent qui prennent des minutes sur Sonnet se terminent en secondes sur SWE-1.5. Pour les développeurs qui enchaînent les cycles fix-test-fix-test toute la journée, cette différence de vitesse se cumule en heures économisées par semaine. La boucle de feedback entre ' corrige ça ' et ' c'est corrigé ' passe de ' le temps d'aller chercher un café ' à ' cligne des yeux et c'est fait '. Pour un chat qui valorise les siestes et l'efficacité, profondément séduisant. 😸
Le 24 décembre 2025, la Wave 13 a déployé SWE-1.5 comme modèle par défaut — gratuit pour tous les utilisateurs pendant trois mois. Cette période gratuite s'est terminée le 27 mars 2026, quand Windsurf a lancé un nouveau système de facturation par quota. La stratégie classique du dealer : la première dose est gratuite, ensuite tu es accro à la vitesse et 30$/mois te paraît soudain raisonnable. Malin. Vicieux. 😹
Mais voilà la partie dont personne ne veut parler. Cognition a entraîné SWE-1.5 spécifiquement sur des tâches de coding agentique — puis l'a testé sur un benchmark qui mesure… des tâches de coding agentique. Avoir une bonne note à l'examen que tu as révisé, c'est attendu, pas impressionnant. La vraie question, c'est si SWE-1.5 tient la route sur des codebases réelles, bordéliques, qui ne ressemblent en rien aux données d'entraînement.
Et il y a un problème plus large. Si chaque éditeur entraîne son propre modèle propriétaire, on finit avec des jardins clos. Ton choix d'IDE détermine ton modèle IA. Ton modèle détermine ton IDE. Du vendor lock-in avec des étapes supplémentaires. Au moins quand tout le monde utilisait GPT-4, tu pouvais changer d'éditeur sans devoir réapprendre les caprices d'un modèle complètement différent. 😾
Cela dit — entraîner ton propre modèle frontier au lieu de payer un loyer à Sam Altman ? C'est le bon move stratégique. Chaque éditeur qui envoyait des appels API à OpenAI finançait son futur concurrent. Cognition a dit ' non merci ' et a construit son propre cerveau. Les benchmarks le confirment. La vitesse le confirme encore plus.
Il y a deux ans, chaque outil de code IA n'était qu'un wrapper fin autour de l'API d'OpenAI. Aujourd'hui, Windsurf entraîne ses propres modèles, Cursor fait tourner des fine-tunes maison, Copilot a dépassé les simples complétions GPT. La couche IDE est en train de devenir la couche modèle. La concurrence, c'est bien. Le développeur y gagne.
Le chat observe. 🐈





