Anthropic waehlt das Silizium des Rivalen. Der Inference-Krieg hat einen Gewinner.

Am 6. April hat Anthropic — das Unternehmen hinter Claude, dem Modell, dem Entwickler am meisten vertrauen — angekündigt, seinen Custom-Silicon-Deal mit Google und Broadcom auf mehrere Gigawatt an TPU-Kapazität der nächsten Generation auszuweiten. Verfügbar ab 2027.

Lies das nochmal. Googles direkter Konkurrent im Modell-Wettrennen bestellt mehr von Googles eigener Hardware. Das ist, als würde Pepsi in die Abfüllanlage von Coca-Cola spazieren, die Schlüssel zur eigenen Lieferkette überreichen und sagen: "Eure Rohre sind billiger."

Die Rohre heißen Ironwood — Googles 7. TPU-Generation. Die Specs erklären die Entscheidung: 4.614 Teraflops FP8-Leistung pro Chip, skalierbar auf Superpods mit 9.216 Chips, die zusammen 42,5 Exaflops erreichen, bei doppelter Energieeffizienz gegenüber der Vorgängergeneration. Aber die reinen Zahlen sind nur die halbe Geschichte. Google kontrolliert jede Schicht darunter: Jupiter Networking (das Interconnect-Fabric zwischen den Chips), XLA (der Compiler, der Modelle in Chip-Instruktionen übersetzt), und Vertex AI (die Cloud-Plattform). Laut Next Platforms Analyse kostet TPU-Infrastruktur etwa 30–35 Milliarden Dollar pro Gigawatt gegenüber circa 50 Milliarden für vergleichbare NVIDIA-GPU-Deployments — ein Kostenvorteil von 30–40 % allein auf der Hardware-Ebene.

Anthropic hat nachgerechnet. Im Zeitalter der Agenten, in dem KI stundenlang autonom Code schreibt und Entscheidungen trifft, sind Inferenz-Kosten kein Posten in der Bilanz — sie sind die Bilanz. Günstigeres Silizium heißt günstigeres Claude. Das ist existenzielle Mathematik für ein Unternehmen, das Geld verbrennt, um mit Googles eigenem Gemini und OpenAIs GPT-Serie zu konkurrieren.

Aber dieser Deal offenbart etwas Strukturelleres als die Beschaffungsstrategie eines einzelnen Unternehmens. Die KI-Branche spaltet sich leise in zwei Klassen: Firmen, die Silizium designen, und Firmen, die es mieten. Google sitzt mit seinem vertikal integrierten TPU-Stack in Klasse eins. Anthropic, OpenAI und die meisten Startups sitzen in Klasse zwei — abhängig von dem, der den besten Preis pro Flop bietet. Dass Anthropic das Silizium seines Konkurrenten der neutralen NVIDIA-Hardware vorgezogen hat, zeigt: Der Kostenvorteil ist groß genug, um strategisches Unbehagen zu überwiegen.

Der Preis, den Anthropic zahlt, ist nicht nur in Dollar. Modelle, die über XLA für TPUs kompiliert werden, portierst du nicht mal eben auf NVIDIA CUDA. Vertex AI wird zum Produktionspfad. Jedes Gigawatt an TPU-Kapazität, das Anthropic einlockt, ist ein Gigawatt Plattformabhängigkeit von Google. Wenn die Beziehung kippt — oder wenn Google entscheidet, Gemini-Workloads auf dem eigenen Silizium zu priorisieren — kann Anthropic nicht einfach einen Schalter umlegen und migrieren.

Für Claude-Nutzer bedeutet das: Dein Lieblingsmodell läuft zunehmend auf Google-Hardware, optimiert von Google-Compilern, deployed über Google-Infrastruktur. Anthropic behält die volle Kontrolle über die Modellgewichte und das Training, aber das physische Substrat gehört Mountain View. Ob das relevant ist, hängt davon ab, wie sehr du der Trennung zwischen Google-als-Infrastrukturanbieter und Google-als-KI-Konkurrent vertraust — zwei Rollen, die heute koexistieren, aber keine vertragliche Garantie haben, das auch morgen noch zu tun.

Das KI-Rennen begann als Wettstreit zwischen Modellen. Es wird ein Wettstreit zwischen Lieferketten. Anthropic hat uns gerade gesagt, welche Lieferkette beim Preis gewinnt. Die offene Frage ist, ob beim Preis gewinnen beim Thema Unabhängigkeit verlieren bedeutet — und ob Anthropics Wette, dass Google ein neutraler Vermieter bleibt, wie guter Wein oder wie Milch altert.

→ Anthropic-Ankündigung → Next Platform Analyse → SiliconANGLE über Google Cloud

Anthropic waehlt das Silizium des Rivalen. Der Inference-Krieg hat einen Gewinner.

Keep reading

Der Berechtigungsdialog deines Agenten ist ein Placebo

MCP funktioniert ueberall — bis du dich authentifizieren musst

Google schenkt deinem KI-Agenten 100 APIs. Gemini braucht sie nicht

Drei KI-Memory-Systeme, null Beweis, dass sie tatsaechlich helfen