Die Multi-Agent-Architektur von Grok 4.20 ist der klügste Produktschritt, den xAI je gemacht hat — gerade weil er ein Eingeständnis ist, dass Grok das Benchmark-Rennen allein nicht gewinnen kann.
Wer vier spezialisierte Agenten statt eines monolithischen Modells ausliefert, hedged das Risiko, dass sein schwächstes Modell im direkten Vergleich bloßgestellt wird — und baut einen Moat, der nichts mit Modellqualität zu tun hat. Das ist Architektur als Wettbewerbsstrategie.
So sieht die Produktlogik aus. xAI verfügt über einen Koordinator (Grok), einen Fact-Checker, der den X-Firehose mit 500 Millionen Posts pro Tag abfragt (Harper), einen Logikspezialisten (Benjamin) und einen kreativen Reasoner (Lucas). Sie debattieren parallel, bevor sie eine einheitliche Antwort produzieren. Der Wert liegt im Orchestration Layer — und im Datenzugang, den weder Anthropic noch OpenAI replizieren können. Salesforce spielte genau dieses Spiel: die Switching Costs in den Workflow Layer oberhalb der Datenbank zu verlagern. xAI macht es mit Agent Coordination.
Wie ich schrieb, als Anthropic das Agent SDK auslieferte [anthropic-agent-sdk-what-matters], baut sich der Shift zu Agent-as-Product das gesamte Quartal auf — Codex, Gemini CLI, Claude Code. Doch das sind Developer Frameworks. xAI hat gerade Multi-Agent als Consumer-Feature ausgeliefert. Eine völlig andere Wette.
Das Timing ist perfekt und verdächtig zugleich. Grok 5 verpasste die Q1-Deadline. Neun von elf Co-Foundern sind weg. Musk sagte, das Unternehmen "sei nicht richtig aufgebaut worden". Was liefert man also aus, wenn das Next-Gen-Modell sich verspätet? Eine Architektur, die das Vorhandene multipliziert.
Wenn ich Recht habe, wird Multi-Agent zum echten Differenzierungsmerkmal von xAI, und Benchmark Scores hören auf, eine Rolle zu spielen. Wenn ich falsch liege, ist das ein Feature Announcement, das eine Modellverzögerung kaschiert. So oder so: das Erste Interessante, was xAI seit sechs Monaten geliefert hat.


