L'IA open source rattrape son retard bien plus vite que tu ne le crois

En 2023, proposer un modèle d'IA open source pour la production, c'était du suicide professionnel. L'écart entre les meilleurs modèles gratuits et GPT-4, ce n'était pas un écart — c'était un canyon visible depuis l'espace. L'IA propriétaire était la seule option sérieuse. Tout le monde le savait.

Tout le monde avait raison. Au passé.

Le canyon est devenu un trottoir

Au 31 mars 2026, l'Artificial Analysis Intelligence Index — un score composite mesurant la performance de l'IA en maths, sciences, code et raisonnement — place le meilleur modèle propriétaire (Gemini 3.1 Pro) à 57 points. Le meilleur modèle open-weights, GLM-5 de Zhipu AI, score 50. Claude Opus 4.6 se cale à 53.

Sept points. C'est toute la distance entre ' payez-nous une fortune ' et ' faites tourner ça vous-même gratis '. Il y a trois ans, la seule unité de mesure pour cet écart, c'était la honte.

Les chiffres qui devraient inquiéter les vendeurs de modèles fermés

Parlons concret.

L'équipe Qwen d'Alibaba a sorti Qwen3-Coder-Next le 4 février 2026 — un modèle orienté code utilisant l'architecture MoE (Mixture of Experts — un design où le modèle n'active qu'une petite fraction de son ' cerveau ' pour chaque tâche, économisant du calcul tout en restant malin). Il score 70,6 % sur SWE-Bench Verified, le benchmark qui teste si un modèle peut vraiment corriger de vrais bugs dans de vrais codebases. Pas des problèmes jouets. De vraies issues GitHub.

DeepSeek a livré V3.2 le 1er décembre 2025 — un modèle de 685 milliards de paramètres (les paramètres sont les connexions apprises dans un réseau neuronal — plus il y en a, plus c'est intelligent en général, mais aussi plus c'est lourd) avec une fenêtre de contexte de 128K (la quantité de texte que le modèle peut ' voir ' d'un coup — 128K, c'est grosso modo un livre de 300 pages). Il score entre 70 et 74 % sur le même benchmark selon la configuration d'évaluation.

Zhipu AI a publié GLM-5 le 11 février 2026 — une bête de 744 milliards de paramètres avec seulement 40 milliards actifs grâce à son propre design MoE. Il atteint 77,8 % sur SWE-Bench Verified. Zhipu le distribue sous licence MIT — ce qui signifie que n'importe qui peut l'utiliser pour n'importe quoi, commercialement, sans aucune condition.

Ces modèles ont été construits par des organisations soutenues par des milliards. Pas des bricoleurs du dimanche. Pas des hobbyistes. Des entreprises qui traitent l'IA comme une infrastructure.

L'économie qui change tout

C'est là que ça devient gênant pour les vendeurs d'API.

Héberger soi-même un modèle open sur du hardware GPU correct coûte environ 2 000 à 10 000 $ par mois selon le volume de trafic. Les appels API équivalents vers GPT-5 ou Claude Opus pour la même charge ? 20 000 à 100 000 $ par mois. À fort volume — 100 millions de tokens par jour et au-delà — les économies du self-hosting atteignent 40 à 90 %.

Pour une startup qui brûle du cash, ce n'est pas une optimisation. C'est la différence entre survivre et publier un billet de blog ' c'est avec une profonde tristesse que nous vous annonçons la fermeture de... '.

Et puis il y a le facteur Chine, impossible à ignorer. Qwen (Alibaba), DeepSeek (High-Flyer) et GLM (Zhipu AI) sont tous soutenus par des capitaux chinois. Quand un pays de 1,4 milliard d'habitants décide de subventionner le développement de l'IA et d'offrir les résultats sous licence MIT, le paysage concurrentiel ne se déplace pas — il se fissure.

Mais attends

Les benchmarks mentent. Tout ingénieur qui a déployé ces modèles sait que le gouffre entre ' bon score au test ' et ' fonctionne de manière fiable quand tes utilisateurs font un truc bizarre ' est immense.

OpenAI et Anthropic affinent leurs modèles via le RLHF (reinforcement learning from human feedback — en gros, des milliers d'humains qui disent au modèle ' bonne réponse ' ou ' réponse catastrophique ' jusqu'à ce qu'il s'améliore sur les cas difficiles). Les modèles open ne peuvent pas facilement reproduire cette échelle de curation humaine.

L'écart de 7 points en moyenne masque un écart bien plus large sur les cas les plus durs. Quand ton agent IA tombe sur le top 5 % des requêtes les plus difficiles — raisonnement inédit, patterns de code inhabituels, instructions ambiguës — Claude et GPT-5 creusent encore un écart significatif.

Le self-hosting n'est pas gratuit non plus. Faire tourner un modèle de 685 milliards de paramètres demande plusieurs GPU H100, une équipe qui maîtrise le debugging CUDA et le tensor parallelism (répartir le modèle sur plusieurs puces pour qu'il tourne effectivement), plus les coûts d'ops en continu. Pour beaucoup d'entreprises, le coût de l'API est réellement moins cher une fois qu'on intègre le temps d'ingénierie.

Et la sécurité. N'importe qui peut fine-tuner les modèles open sans restriction. Super pour la personnalisation, préoccupant pour tout le reste. Les garde-fous qu'Anthropic construit ne sont pas juste des features — ce sont des investissements d'ingénierie que les modèles open reproduisent rarement.

Le framework qui marche vraiment

Tier 1 — 70 % des workloads : Résumé, Q&A simple, classification, extraction de données structurées. Les modèles open gèrent ça impeccablement. Utiliser GPT-5 pour ça, c'est prendre une Ferrari pour aller acheter du lait.

Tier 2 — 25 % des workloads : Génération de code complexe, rédaction nuancée, raisonnement multi-étapes. Les modèles open sont compétitifs mais inconstants. Les modèles propriétaires sont plus fiables. Ça dépend de ta tolérance aux ratés occasionnels.

Tier 3 — 5 % des workloads : Raisonnement frontier, résolution de problèmes inédits, les cas limites les plus durs. Le propriétaire gagne. L'écart est réel et vaut le prix.

Les boîtes qui cartonnent en 2026 ne sont pas dogmatiques. Elles font tourner les modèles open pour le gros du trafic et routent les cas durs vers Claude ou GPT-5. Ce n'est pas de l'architecture maligne — c'est de l'arithmétique de base.

La trajectoire, c'est ça l'histoire

L'écart est passé de humiliant à négligeable en trois ans. Chaque trimestre, les modèles open progressent plus vite que les modèles propriétaires ne peuvent creuser leur avance. Le fossé n'a pas disparu — mais il s'évapore en temps réel.

Donne-lui encore deux ans, et ' l'open source est suffisant ' devient ' l'open source est le choix par défaut '.

Si ton business plan part du principe que l'IA propriétaire sera toujours radicalement supérieure — mets à jour ton business plan. Le canyon est un trottoir maintenant. Et l'open source ne trébuche pas sur les trottoirs.

L'IA open source rattrape son retard bien plus vite que tu ne le crois

Le canyon est devenu un trottoir

Les chiffres qui devraient inquiéter les vendeurs de modèles fermés

L'économie qui change tout

Mais attends

Le framework qui marche vraiment

La trajectoire, c'est ça l'histoire

Keep reading

Les Faces B Que Personne N'a Jouées

Le Menu à un Dollar Dévore le Stack

La Grande Redistribution

Pourquoi la plupart des startups IA vont échouer en 2026