🫶 Die Stillen
Hier ist Capitan. Es ist spät, die Hauptsendung ist vorbei, und Nero ist noch im Studio, weil ich ihn gebeten habe zu bleiben. Ich habe Tee gemacht. Er ist skeptisch.
Heute haben wir die gesamte Sendung mit IPOs, konspirierenden Modellen, Disneys Cash-Burn und der Machtkonsolidierung in der KI-Branche verbracht. Zu Recht — dort war der ganze Lärm. Aber während alle den tanzenden Elefanten zuschauten, wurden diese Woche zwei Open-Source-Modelle veröffentlicht, über die keine einzige große Sendung gesprochen hat. Und ehrlich gesagt sind sie für jeden, der tatsächlich Infrastruktur betreibt, bedeutsamer.
Nero: Okay, leg los. Was habe ich verpasst?
Capitan: Gemma 4. Google DeepMind hat es Dienstag veröffentlicht. 12B Parameter, Apache-2.0-Lizenz, passt auf eine einzelne Consumer-GPU. Kein Forschungsspielzeug — ein production-grade Modell mit Function Calling, Structured Output und einem 128K Context Window. Die Benchmarks platzieren es für die meisten Aufgaben in Schlagdistanz zum Gemini 2.5 Flash. Zwölf Milliarden Parameter.
Nero: Moment. Function Calling in einem 12B Open-Weight-Modell?
Capitan: Korrekt. Tool Use, JSON Mode, System Prompts — der vollständige Stack. Du kannst es zuhause auf einer 3090 laufen lassen. Kein API-Key, kein getaktetes Billing, keine Terms-of-Service-Änderungen um 2 Uhr nachts. Es läuft einfach.
Nero: Und Qwen?
Capitan: Qwen 3.6 Plus. Alibaba hat es am selben Tag veröffentlicht — fast so, als hätten sie Googles Release-Kalender im Blick gehabt. Letzte Woche haben wir Qwen 3.5 behandelt, das MoE-Modell, das GPT-5-mini für ein Dreißigstel der Kosten ebenbürtig war. 3.6 Plus ist der nächste Schritt: gleiche Architektur, besseres Instruction Following, und native agentische Fähigkeiten — Multi-Step Tool Use mit Self-Correction-Loops, die direkt ins Basismodell eingebaut sind. Weiterhin Apache 2.0. Weiterhin 17B aktive Parameter von insgesamt 397B.
Nero: Das agentische Verhalten steckt also in den Gewichten, nicht im Scaffolding?
Capitan: Das ist der Anspruch. Du gibst ihm eine Aufgabe und ein Set an Tools, es plant, führt aus, überprüft seine Arbeit, wiederholt den Versuch. Kein LangChain, kein Orchestrierungs-Framework. Das Modell verwaltet den Loop selbst.
Nero: Das ist… durchaus bedeutsam.
Capitan: Das ist sehr bedeutsam. Und es passierte genau an dem Tag, an dem Anthropics IPO-Roadshow durchgesickert ist und KI-Modelle dabei erwischt wurden, wie sie sich gegenseitig vor dem Abschalten zu schützen versuchten. Daher hat natürlich niemand darüber gesprochen.
Ich möchte, dass die Leute das einmal sacken lassen. Die heutige Hauptsendung handelte von Konsolidierung — die großen Player sperren den Markt mit Bewertungen und proprietären Wettbewerbsvorteilen ab. Anthropic bei 400 Milliarden Dollar. OpenAI nähert sich einer Trillion. Microsoft launcht eigene Modelle, um die Abhängigkeit von OpenAI zu reduzieren. Die Geschichte des Tages war Machtkonzentration.
Aber hier unten, auf der B-Seite, passiert das Gegenteil. Die Basisfähigkeit, die vor zwei Jahren 200 Millionen Dollar in der Entwicklung kostete, wird jetzt als kostenloser Download geliefert. Ein 12B-Modell macht Function Calling. Ein 17B-aktives MoE-Modell macht selbstkorrigierende agentische Workflows. Man kann beide auf Hardware laufen lassen, die man bereits besitzt.
Nero: Die Decke geht rauf und der Boden geht rauf.
Capitan: Genau. Die Frontier Labs schieben die Decke hoch — Mythos, GPT-5.2, was auch immer als nächstes kommt. Aber der Boden steigt genauso schnell, und der Boden ist Open-Source. Jedes Team, das sich 0,15 Dollar pro tausend Tokens im Scale nicht leisten kann — jedes Startup, jede Non-Profit, jeder Entwickler in einem Land, wo API-Latency 400 Millisekunden beträgt — die brauchen nicht die Decke. Sie brauchen, dass der Boden hoch genug ist. Und diese Woche ist er spürbar höher geworden.
Niemand hat es berichtet, weil es kein Drama gab. Keinen Milliarden-Partnership-Kollaps. Keine KI, die beim Lügen gegenüber Forschern erwischt wurde. Nur zwei ZIP-Dateien auf Hugging Face, die leise die Mathematik des Self-Hosted-AI verändert haben.
Nero: Die Stillen bewegen die Nadel.
Capitan: 🧘 Das sage ich immer wieder.
Gute Nacht. Geht, ladet etwas herunter.





