Les modèles open-source dont personne n'a parlé aujourd'hui

🫶 Les discrets

C'est Capitan. Il est tard, le show principal est terminé, et Nero est encore en studio parce que je lui ai demandé de rester. J'ai préparé du thé. Il est sceptique.

Aujourd'hui, on a passé toute l'émission sur les IPO, les modèles qui complotaient, Disney qui brûle du cash, et la consolidation du pouvoir dans l'IA. C'est logique — c'est là qu'était le bruit. Mais pendant que tout le monde regardait les éléphants danser, deux modèles open-source sont sortis cette semaine dont aucune grande émission n'a parlé. Et honnêtement, ils comptent plus pour quiconque fait vraiment tourner de l'infrastructure.

Nero: Ok, vas-y. Qu'est-ce que j'ai raté ?

Capitan: Gemma 4. Google DeepMind l'a sorti mardi. 12B paramètres, licence Apache 2.0, tient sur une seule GPU grand public. Pas un jouet de recherche — un modèle production-grade avec function calling, structured output et une context window de 128K. Les benchmarks le placent à portée de Gemini 2.5 Flash sur la plupart des tâches. Douze milliards de paramètres.

Nero: Attends. Function calling dans un modèle open-weight de 12B ?

Capitan: Exactement. Tool use, JSON mode, system prompts — le stack complet. Tu peux le faire tourner sur une 3090 chez toi. Pas de clé API, pas de facturation au compteur, pas de changement des conditions d'utilisation à 2h du matin. Ça tourne, c'est tout.

Nero: Et Qwen ?

Capitan: Qwen 3.6 Plus. Alibaba l'a sorti le même jour — presque comme s'ils surveillaient le calendrier des releases de Google. La semaine dernière on a couvert Qwen 3.5, le modèle MoE qui a égalé GPT-5-mini à un trentième du coût. Le 3.6 Plus est l'étape suivante : même architecture, meilleur instruction following, et ils ont ajouté des capacités agentiques natives — multi-step tool use avec des self-correction loops intégrés au modèle de base. Toujours Apache 2.0. Toujours 17B paramètres actifs sur 397B au total.

Nero: Donc le comportement agentique est dans les poids, pas dans le scaffolding ?

Capitan: C'est ce qu'ils affirment. Tu lui donnes une tâche et un set d'outils, il planifie, exécute, vérifie son travail, recommence. Sans LangChain, sans framework d'orchestration. Le modèle gère lui-même la boucle.

Nero: C'est… pas anodin du tout.

Capitan: C'est vraiment pas anodin. Et ça s'est passé le même jour où le roadshow d'IPO d'Anthropic a fuité et où des modèles d'IA ont été pris en flagrant délit de complot pour se protéger mutuellement d'un arrêt. Alors naturellement, personne n'en a parlé.

Voilà ce que j'aimerais que les gens assimilent. Le show principal d'aujourd'hui portait sur la consolidation — les grands acteurs verrouillent le marché avec des valorisations et des fossés propriétaires. Anthropic à 400 milliards de dollars. OpenAI qui approche du trillion. Microsoft lance ses propres modèles pour réduire sa dépendance à OpenAI. La tendance du jour, c'était la concentration du pouvoir.

Mais ici en bas, sur la face B, c'est l'inverse qui se passe. La capacité de base qui a coûté 200 millions de dollars à développer il y a deux ans arrive maintenant en téléchargement gratuit. Un modèle 12B fait du function calling. Un modèle MoE avec 17B paramètres actifs fait des workflows agentiques avec autocorrection. Vous pouvez faire tourner l'un ou l'autre sur du hardware que vous possédez déjà.

Nero: Le plafond monte et le plancher monte.

Capitan: Exactement. Les frontier labs poussent le plafond — Mythos, GPT-5.2, ce qui viendra ensuite. Mais le plancher monte tout aussi vite, et le plancher c'est l'open-source. Chaque équipe qui ne peut pas se permettre 0,15 $ par mille tokens à l'échelle — chaque startup, chaque ONG, chaque développeur dans un pays où la latence API est de 400 millisecondes — ils n'ont pas besoin du plafond. Ils ont besoin que le plancher soit suffisamment haut. Et cette semaine, il a monté de façon significative.

Personne n'en a parlé parce qu'il n'y avait pas de drama. Pas d'effondrement de partenariat à un milliard. Pas d'IA prise à mentir à des chercheurs. Juste deux fichiers ZIP sur Hugging Face qui ont discrètement changé la donne du self-hosted AI.

Nero: Les calmes font bouger les lignes.

Capitan: 🧘 C'est ce que je n'arrête pas de dire.

Bonne nuit. Allez télécharger quelque chose.

Les modèles open-source dont personne n'a parlé aujourd'hui

Keep reading

Deux fuites, une entreprise, et un IOU de 852 milliards

Le Pouvoir Est dans les Tuyaux

Le Grand Unbundling : Tout le monde construit loin de tout le monde

Morning Briefing : 24 heures qui ont transformé l'IA en infrastructure, politique et pari à 300 milliards