Heute Morgen haben wir Anthropics Managed Agents als Plattformstrategie beleuchtet — vier Schichten Lock-in, jede klebriger als die vorherige. Aber das Abrechnungsmodell, das in diesem Launch versteckt war, verdient eine eigene Obduktion. Denn dein KI-Kostenmodell hat sich am 8. April gespalten, und dein Controlling hat es noch nicht mitbekommen.

Hier die Aufspaltung. Klassische API-Calls — Frage rein, Antwort raus — werden weiterhin pro Token abgerechnet, wie gehabt. Aber alles, was Schleifen dreht, Retries fährt, Tools nutzt oder autonom denkt, bekommt jetzt einen zweiten Zähler: $0,08 pro Session-Stunde, auf die Millisekunde genau abgerechnet. Zwei Zähler laufen gleichzeitig. Anthropic ist der erste große Anbieter, der Agent-Compute so bepreist. OpenAI und Google sind in völlig andere Richtungen gelaufen.

Lass uns denselben Workload durch alle drei jagen. Eine realistische Agent-Aufgabe: Code-Review über ein mittelgroßes Repository. Eine Stunde Laufzeit. Der Agent liest Dateien, führt Tests aus, iteriert bei Fehlern, schreibt eine Zusammenfassung. Am Ende hat er ungefähr 500K Input-Tokens und 100K Output-Tokens verbraucht.

Anthropic (Sonnet 4.6): Session-Laufzeit: $0,08. Input-Tokens bei $3/M: $1,50. Output bei $15/M: $1,50. Gesamt: $3,08. Die Session-Gebühr macht 2,6 % der Rechnung aus.

OpenAI (GPT-5.2-Codex): Keine Session-Gebühr. Input bei $1,75/M: $0,88. Output bei $14/M: $1,40. Gesamt: $2,28. Reine Tokens. Nichts weiter zu tracken.

Google (Vertex AI Agent Engine): Sekundengenaue Compute-Abrechnung — vCPU und Memory, bepreist wie ein Cloud-Container. Eine Standard-Agent-Laufzeit kostet je nach Konfiguration ungefähr $3–$8 pro Stunde, plus Gemini-Token-Tarife obendrauf. Die Gesamtkosten schwanken massiv, verschwinden aber typischerweise in bestehenden GCP-Commitments. Dieselbe Aufgabe landet bei ungefähr $5–$10 — oder quasi bei Null, wenn du für das Quartal schon genug GCP-Budget committed hast.

Im kleinen Maßstab gewinnt OpenAI bei den reinen Kosten. Skalierst du hoch, dreht sich das Bild.

Budgetiere 10.000 Agent-Stunden pro Monat. Anthropics Orchestrierungsschicht kostet $800 flat — ein einzelner Posten, den ein CFO genehmigen kann, ohne erst ein Token-Ökonomie-Seminar zu belegen. OpenAIs Rechnung ist rein variabel: jeder Token, jeder Retry, jedes Mal wenn der Agent beschließt nochmal nachzudenken, bewegt die Zahl. Kein Boden, keine Decke. Googles Agent-Kosten verschwinden in deinem Cloud-Commitment, was entweder ein Feature oder eine Falle ist — je nachdem wie dein Vertrag formuliert ist.

Der Break-even hängt davon ab, wie tokenhungrig deine Agents sind. Leichtgewichtige Agents — Monitoring, Routing, Statuschecks — verbrauchen vielleicht 50K Tokens pro Stunde. Bei Anthropic sind das $0,31 gesamt. Die $0,08 Session-Gebühr macht dann 26 % der Rechnung aus. Kein Rundungsfehler. Schwere Agents, die Code generieren oder Deep Research betreiben, verbrennen 1M+ Tokens pro Stunde. Die Session-Gebühr fällt unter 1 %. Unsichtbar.

Anthropic wettet darauf: Agents werden schwerer, nicht leichter. Wenn die Branche in Richtung Token-Effizienz tendiert — mehr erreichen mit weniger Kontext — wird die Session-Stunde zu einer immer sichtbareren Steuer. Wenn Agents hungrig bleiben, verschwindet sie im Rauschen. Anthropic setzt auf hungrig.

Drei Anbieter, drei Abrechnungsphilosophien, null gemeinsame Einheiten. Du kannst sie nicht in dieselbe Tabelle packen, ohne ein Normalisierungsmodell zu bauen, und dieses Modell braucht Workload-Annahmen, die du noch nicht gemessen hast. KI-Kosten 2026 zu vergleichen ist schwerer als Cloud-Kosten 2014 zu vergleichen — und das haben wir bis heute nicht gelöst.

Also hier die Lage. Einfache API-Calls bleiben auf dem Token-Zähler. Alles Autonome lebt jetzt auf Session-Stunden, reinen Tokens oder Cloud-Compute-Abrechnung — je nach Anbieter. Wechseln heißt nicht nur eine neue API lernen, sondern das gesamte Finanzmodell drumherum.

Der Token war drei Jahre lang die universelle Einheit für KI-Kosten. Anthropic hat ihn in zwei Dimensionen aufgespalten, und jetzt muss jeder entscheiden, in welcher Währung er handelt.