😼 Crystal Ball : Les modèles open source prennent le contrôle du dev d'ici 2027
Voici mon pari pour les vingt prochains mois : d'ici décembre 2027, les modèles open-weight géreront 80% des tâches dev en production — génération de code, code review, refactoring, testing, documentation — sur du matériel d'entreprise ou des instances cloud bon marché, sans appels API vers Anthropic ou OpenAI.
Non pas parce que les modèles ouverts seront plus intelligents. Mais parce que l'équation de confiance s'est renversée.
😸 L'effondrement de confiance que personne ne valorise.
Nous avons couvert aujourd'hui le deuxième leak de source code d'Anthropic — et ce n'est même pas le pire. Le Pentagone met des AI providers sur liste noire pour des raisons de sécurité. OpenAI a tué Sora après ne pas avoir réussi à stopper la génération de contenu protégé. Ce ne sont pas des incidents isolés. C'est un schéma : les entreprises qui vous demandent de faire transiter votre codebase propriétaire par leurs APIs ne peuvent même pas garder leur propre source code privé.
Quand votre AI provider leak ses propres secrets deux fois en une semaine, la question cesse d'être de savoir si l'alternative open est suffisamment bonne, et devient : pourquoi envoyons-nous encore notre code à des gens qui ne peuvent pas sécuriser le leur ?
😼 Et les modèles ouverts viennent de devenir suffisamment bons pour poser cette question sérieusement.
Google a publié Gemma 4 sous Apache 2.0 — son modèle dense 31B est classé #3 sur Arena AI, devançant des modèles propriétaires vingt fois plus grands. Le Qwen 3.5 d'Alibaba égale GPT-5-mini sur les benchmarks à un trentième du coût. DeepSeek V4 a réécrit son training stack pour le silicon Huawei, prouvant qu'on n'a même pas besoin de NVIDIA pour jouer. La communauté LocalLLaMA fait déjà tourner Gemma 4 sur des MacBooks — résultats mitigés, mais la trajectoire est limpide.
Deux forces convergent : les providers propriétaires perdent la confiance exactement au moment où les alternatives ouvertes comblent le performance gap. Pour 80% des tâches dev — le travail de routine qui ne nécessite pas de frontier reasoning — un modèle 30B fine-tuné sur une machine à $3.000 surpasse un appel API à $0,003 par token en latence, confidentialité et coût total de possession. En Europe, où l'AI Act impose de nouvelles obligations de transparence sur les systèmes tiers, l'hébergement local répond simultanément à deux impératifs : confiance et conformité réglementaire.
😹 Ce qui confirmerait la prédiction.
Guettez les Fortune 500 annonçant des stratégies d'indépendance des modèles. Guettez les guerres de prix API qui feront paraître les tarifs actuels anecdotiques. Guettez GitHub Copilot proposant un tier bring your own model. Deux des trois se réalisent et nous sommes en avance sur le calendrier.
Probabilité honnête : 55%.
Les 20% restants de tâches — le reasoning complexe, les décisions d'architecture inédites, les moments où l'on dit explique-moi cette codebase que je n'ai jamais vue — nécessitent encore des frontier models. Et je sous-estime probablement la rapidité avec laquelle les labs propriétaires baisseront leurs prix pour concurrencer. Mais la direction ? 😼 La direction est une certitude acquise.
Le domino que personne ne surveille : environ $300 milliards de venture capital sont actuellement misés sur l'hypothèse que les moats d'AI propriétaire tiennent. Si les modèles ouverts engloutissent les 80% de routine, ce moat ne se réduit pas seulement — il s'effondre en une fine couche premium pour le frontier reasoning. Beaucoup de valorisations actuelles sont calculées pour nous possédons le modèle, quand le marché évolue vers nous possédons les données et le deployment. Ce repricing sera brutal.
L'ère du paiement au token pour le travail de routine se termine. La seule question est de savoir si cela arrive en 2027 ou en 2028.





