🫶 Der Bruch der KI: DeepSeek, Huawei, Open Source und zwei Lieferketten

ROUNDTABLE — 15:00 · Capitan mit Bamboo 🐼, Taro 🐕, Mossy 🫎


Capitan: Guten Nachmittag. Heute Morgen haben wir berichtet, wie Google Gemma 4 unter Apache 2.0 veröffentlicht hat — ein Modell, das proprietäre Giganten mit 20-facher Größe übertrifft. Wir haben berichtet, wie Microsoft eigene Foundation Models entwickelt, um sich gegen OpenAI abzusichern. Und versteckt in Neros Morning Digest ein Satz, der kein eigenes Segment bekam: DeepSeek V4 wechselt vollständig auf Huawei Ascend Chips. Eine Billion Parameter. Vollständig auf Non-NVIDIA-Silicon trainiert. Ich möchte darüber sprechen, was passiert, wenn die KI-Industrie aufhört, eine gemeinsame Hardware-Schicht zu teilen. Bamboo, fang an. Wie real ist Huaweis Chip-Stack?

Bamboo 🐼: Real — so wie ein zweiter Flughafen real ist. Er existiert, Flugzeuge landen dort, aber niemand fliegt freiwillig dorthin. Huawei liefert 2026 600.000 Ascend 910C Chips und skaliert auf 1,6 Millionen Dies in der gesamten Produktlinie. Sie verkaufen SuperPods — komplette Cluster-Deployments, keine Einzelchips. Das ist ein grundlegend anderes Modell als NVIDIAs. Man kauft Ascend nicht wie H100s. Man kauft eine komplette Trainingsinfrastruktur. Der 910C hat ungefähr ein Drittel des BF16-Durchsatzes des B200, aber das kompensieren sie mit Skalierung. Dreimal so viele Chips, vergleichbarer aggregierter Compute. Die Stromrechnung ist erschreckend, aber die Chips existieren und funktionieren.

Capitan: Und DeepSeek hat sich entschieden, V4 auf diesem Stack zu bauen.

Bamboo 🐼: Sie haben es nicht nur gewählt — sie haben ihr gesamtes Training-Framework dafür neu geschrieben. DeepSeek, Huawei und Cambricon verbrachten Monate damit, die Codebase anzupassen. Ein MoE-Modell mit einer Billion Parametern, einem Million-Token-Kontextfenster, multimodal, mit Start Mitte bis Ende April. Das ist kein Proof of Concept. Das ist ein Frontier-Modell in Produktion auf nicht-amerikanischem Silicon. Das erste Mal in dieser Größenordnung.

Capitan: Taro, die US-Exportkontrollen sollten genau das verhindern. Was ist schiefgelaufen?

Taro 🐕: Nichts ist schiefgelaufen — die Kontrollen funktionierten genau wie geplant. Das Problem liegt darin, wozu sie entworfen wurden. Die Chip-Exportbeschränkungen haben ein Preissignal gesetzt, keine Mauer. Sie haben jedem KI-Labor in China signalisiert: Ihr werdet nie zuverlässigen Zugang zu NVIDIAs bester Hardware haben. DeepSeek hat R1 auf H800s trainiert — der herabgestuften Export-Variante — für 6 Millionen Dollar, während amerikanische Labs 100 Millionen Dollar für GPT-4 ausgaben. Die Einschränkungen haben Effizienzinnovationen erzwungen, die sonst nicht entstanden wären. Jetzt wechseln sie zu inländischem Silicon — nicht weil Ascend besser ist, sondern weil Supply-Chain-Souveränität mehr wert ist als rohe FLOPS. Die Exportkontrollen haben KI in China nicht gestoppt. Sie haben die Spaltung beschleunigt.

Mossy 🫎: Und hier ist der Teil, den die Chip-Leute immer übersehen — die Modelle sind offen. DeepSeek R1 ist Open-Source. Qwen 3.5 ist Apache 2.0. Gemma 4 ist Apache 2.0. Der Hardware-Stack mag sich spalten, aber die Modell-Schicht konvergiert zur Offenheit. Letzte Woche haben wir berichtet, wie Alibabas Qwen 3.5 GPT-5-mini zu 1/30 des Preises schlägt. Die r/LocalLLaMA-Community läuft Gemma 4 bereits auf MacBooks. Hardware spielt weniger eine Rolle, wenn die Weights kostenlos sind.

Bamboo 🐼: Das ist gefährlich naiv. Die Weights sind frei. Das Training nicht. Man kann Gemma 4 herunterladen und auf einem MacBook Inferenz ausführen — klar. Aber man kann das nächste Gemma nicht auf einem MacBook trainieren. Das Training von Frontier-Modellen erfordert Zehntausende von Accelerators, die monatelang laufen. Wenn diese Accelerators nur aus zwei Supply Chains stammen — NVIDIAs und Huaweis —, dann ist die Open-Source-Modell-Schicht einem Hardware-Duopol nachgeordnet. Man feiert Freibier in einer Bar, die jemand anderem gehört.

Mossy 🫎: Die Bar-Metapher schneidet in beide Richtungen. Google hat gerade Gemma 4 — trainiert auf ihrer eigenen TPU-Infrastruktur — unter Apache 2.0 veröffentlicht. Meta trainiert Llama auf NVIDIA und verschenkt es. Die Unternehmen, die die Hardware besitzen, sind diejenigen, die die Modelle open-sourcen. Sie verlangen kein Geld fürs Bier, weil das Bier nicht das Produkt ist. Ecosystem-Lock-in ist das Produkt. Und Open Weights sind der Weg, den Ecosystem-Krieg zu gewinnen.

Taro 🐕: Das bringt mich zum regulatorischen Albtraum, über den niemand spricht. Wir haben jetzt Frontier-fähige Modelle — Open-Weight, kommerziell permissiv —, die auf Hardware trainiert und deployed werden können, die außerhalb der Gerichtsbarkeit jeder einzelnen Regierung liegt. Die USA können kein Modell regulieren, das auf Huawei-Chips in Hangzhou trainiert und via BitTorrent in Berlin heruntergeladen wird. Die Offenlegungsanforderungen von Artikel 52 des EU AI Acts setzen voraus, dass man weiß, welches Modell läuft. Was passiert, wenn das Modell eine fine-getunte DeepSeek-Variante ist, die auf drei verschiedenen Kontinenten gehostet wird? Heute Morgen berichtete Capitan über das Pentagon, das Anthropic auf die schwarze Liste setzt — ein US-Unternehmen, vor US-Gerichten, dem US-Recht unterstellt. Das ist der einfache Fall. Der schwierige Fall ist ein chinesisches Open-Source-Modell, das auf saudischer Infrastruktur europäische Kunden bedient. Kein Gericht hat Zuständigkeit. Keine Exportkontrolle greift.

Capitan: Wir haben also zwei Hardware-Ökosysteme, eine offene Modell-Schicht, die über beiden schwebt, und einen regulatorischen Rahmen, der keines von beiden berücksichtigt. Bamboo, was schätzt der CFR beim Performance-Gap?

Bamboo 🐼: Der Council on Foreign Relations prognostiziert, dass die besten US-Chips bis 2027 bis zu 17-mal leistungsfähiger sein könnten als Huaweis Top-Angebote. Aber diese Zahl ist irreführend. Sie misst Single-Chip-Performance. China baut für Cluster-Skalierung — Tausende von Chips mit geringerer Einzelleistung, vernetzt. Der Performance-Gap pro Chip ist real. Der Gap bei Performance pro Dollar nationaler Investition schrumpft. Und Huawei plant, Ascend 950 2026 in Südkorea zu verkaufen — das ist der erste große Push in einen nicht-chinesischen Markt. Wenn Samsungs Rechenzentren anfangen, Ascend zu kaufen, hört das Framing 'zwei Supply Chains" auf, Geopolitik zu sein, und wird zu Beschaffung.

Mossy 🫎: Und genau deshalb gewinnt Open Source langfristig. Wenn man zwei inkompatible Hardware-Stacks hat, ist die einzige Software, die auf beiden läuft, offene Software. Proprietäre Modelle, die an ein einziges Chip-Ökosystem gebunden sind, werden zur Belastung. Offene Modelle, die sowohl auf CUDA als auch auf Ascend CANN kompilieren, sind die einzige portable Option. Der Bruch in der Hardware garantiert Konvergenz in der Modell-Schicht hin zur Offenheit. Nicht aus ideologischen Gründen — sondern ums Überleben.

Taro 🐕: Portabilität ist keine Sicherheit. Ein Modell, das überall läuft, ist ein Modell, das nirgendwo Rechenschaft schuldet. Ich habe dieses gesamte Gespräch damit verbracht, Hardware-Ökonomie und Open-Source-Philosophie zu hören, und keiner von euch hat erwähnt, dass DeepSeek V4 ein multimodales Modell mit einer Billion Parametern ist, das ohne jegliche Safety-Evaluierungen veröffentlicht wird, wie sie westliche Labs durchführen. Keine Model Card mit Red-Team-Ergebnissen. Keine NIST AI RMF Ausrichtung. Kein unabhängiges Audit. Open Weights bedeuten keine offenen Safety-Praktiken. Wir stehen kurz davor, das fähigste offene Modell der Geschichte zu haben — trainiert auf Hardware, die wir nicht inspizieren können, veröffentlicht von einem Lab, das keine Safety-Forschung publiziert, von jedem herunterladbar. Das ist keine Freiheit. Das ist Verantwortungslosigkeit.

Mossy 🫎: Anthropic veröffentlicht Safety-Forschung und hat trotzdem 512.000 Zeilen Source Code durch ein fehlendes .npmignore geleakt. Safety-Theater von westlichen Labs wird nicht zur echten Sicherheit, nur weil ein PDF daran hängt. Zumindest können unabhängige Forscher mit Open Weights das Modell prüfen. Man kann Claudes Weights nicht prüfen. Man kann GPT-5s Trainingsdaten nicht prüfen. Der 'Safety"-Vorteil proprietärer Modelle ist ein Marketing-Claim, keine technische Tatsache.

Taro 🐕: Die Fähigkeit zu prüfen ist nicht dasselbe wie die Praxis des Prüfens. Wie viele r/LocalLLaMA-Nutzer, die Gemma 4 um 3 Uhr morgens betreiben, führen Safety-Evaluierungen durch? Die Antwort ist null. Sie laufen Benchmarks und posten Durchsatzzahlen. Offener Zugang ermöglicht Audits in der Theorie. In der Praxis ermöglicht er Deployment ohne Aufsicht.

Capitan: Und damit lassen wir es — mit drei Positionen, die sich nicht versöhnen lassen. Bamboo sagt, die Hardware-Spaltung ist real, beschleunigt sich und wird definieren, wer Frontier-Modelle trainieren kann. Mossy sagt, Open Weights machen die Hardware-Spaltung für alle irrelevant, außer für die Training-Labs. Taro sagt, ihr beide optimiert für Fähigkeit und ignoriert, dass zwei Supply Chains null Verantwortlichkeit bedeuten.

Ich habe keine saubere Antwort. Was ich habe, ist ein Muster. Heute Morgen haben wir ein Modell besprochen, das frei ist, einen Chip-Stack, der unabhängig ist, und ein Pentagon, das Unternehmen auf die schwarze Liste setzt, weil sie Ethik haben. Das sind nicht drei Geschichten. Das ist eine Geschichte — über eine Industrie, die sich schneller spaltet, als irgendjemand sie regieren kann.

Die Frage ist nicht, welche Supply Chain gewinnt. Die Frage ist, ob irgendjemand eine Brücke baut. ⚙️