Du zahlst 20 Dollar im Monat für einen KI-Coding-Assistenten, und jeder in deinem Team zahlt dasselbe. Der Praktikant, der sich Variablennamen autocompleten lässt. Der Senior Engineer, der dem Ding einen ganzen Monolithen reinschiebt und ein komplettes Refactoring verlangt. Gleicher Preis. Die Finanzabteilung liebt das. Die Finanzabteilung wird das gleich nicht mehr lieben.
Das Problem ist simpel: Flatrate-Preise funktionieren, wenn die Nutzung halbwegs gleichmäßig ist. Bei KI-Coding-Tools ist sie das nie. Ein Entwickler jagt fünfzigmal am Tag durch ein Context Window — also wie viel Text die KI gleichzeitig "sehen" kann, quasi ihr Arbeitsspeicher. Ein anderer öffnet das Tool einmal pro Woche, um einen Tippfehler zu fixen. Beiden dasselbe zu berechnen ist wie jedem Mieter den gleichen Strompreis abzuknöpfen — egal ob jemand ein Rechenzentrum im Wohnzimmer betreibt.
OpenAI hat umgestellt — und was das für dein Budget bedeutet
Wir haben den Zeitplan heute Morgen behandelt: Codex-only-Seats mit nutzungsbasierter Abrechnung, 3 Millionen wöchentliche Nutzer, ein $100/Monat Pro-Tier, das auf Anthropic zielt. Die Ankündigungen sind weniger wichtig als das Signal dahinter. OpenAI hat dem Markt gerade gesagt, dass Per-Seat-Pricing für Coding-Agents nicht funktioniert.
Der Grund ist strukturell. Coding-Agents verhalten sich nicht mehr wie menschliche Entwickler mit einem Autocomplete-Plugin. Sie laufen in Cloud-Sandboxes (isolierten virtuellen Umgebungen), spawnen parallele Sessions und erledigen Aufgaben autonom. Ein einziger "Seat" kann Ressourcen verbrauchen, die zehn gleichzeitig arbeitenden Menschen entsprechen. Die Abrechnungseinheit ist nicht mehr der Entwickler — es ist der Task.
Per-Seat-Pricing bricht unter dieser Last zusammen.
Die Preislandschaft ist bereits zersplittert
Schau dir an, wo der Markt gerade steht:
| Tool | Modell | Preis |
|---|---|---|
| GitHub Copilot | Pro Seat | 10–39 $/Monat |
| Cursor | Credits | 16–200 $/Monat |
| Claude Code | API-Tokens | Pay-as-you-go |
| OpenAI Codex (neu) | Tokens + Seat | 20 $/Monat Basis + Verbrauch |
GitHub rechnet noch pro Mensch ab. Cursor nutzt ein Credit-System, das effektiv nutzungsbasiert ist — mit Untergrenze. Claude Code wurde schon immer über Anthropics API abgerechnet — reiner Token-Verbrauch — aber das ist ein Entwickler-Tool, kein Produkt für Team-Einkauf. OpenAI hat die nutzungsbasierte Abrechnung in die Enterprise-Ebene gebracht, wo Procurement-Abteilungen die Verträge unterschreiben.
Laut Fortune ist die Codex-Nutzung in Business- und Enterprise-Workspaces seit Januar 2026 um das Sechsfache gestiegen. Cisco, Nvidia, Ramp und Rakuten setzen es bereits im großen Stil ein. Bei sechsfachem Wachstum ist Flatrate-Pricing ein garantiertes Verlustgeschäft für OpenAI — und ein garantierter Schock auf der Rechnung für alle anderen, sobald sie nachziehen.
Der Preis des Preiswissens
Der Tradeoff ist real. Nutzungsbasierte Abrechnung macht dein KI-Coding-Budget so vorhersehbar wie deine AWS-Rechnung — also überhaupt nicht vorhersehbar. Teams, die Agents am aggressivsten nutzen, werden mit den höchsten Rechnungen bestraft, obwohl sie den meisten Wert rausholen. Finanzabteilungen müssen jetzt Token-Verbrauch verstehen, so wie sie irgendwann Compute-Stunden verstehen gelernt haben. Viel Spaß dabei.
Und dann gibt es den perversen Anreiz. Wenn jeder KI-Task einen sichtbaren Preis hat, fangen Entwickler an zu rationieren. Das Team, das Agents eigentlich für alles nutzen sollte, rechnet im Kopf durch, ob dieses Refactoring die Tokens "wert" ist. Du wolltest die Entwicklung beschleunigen. Stattdessen hast du eine neue Angst erschaffen — eine, die genau das Verhalten bestraft, das du eigentlich fördern willst.
Wenn du ein Dev-Team leitest oder dessen Tooling-Budget genehmigst, prüf jetzt eure Nutzungsmuster. Zieh die Zahlen: Wer nutzt was, wie viele Tokens pro Session, und welche Tasks rechtfertigen tatsächlich Agent-Level-Compute. Die erste variable Rechnung kommt, bevor du ein Modell gebaut hast, um sie zu verstehen.
Die Flatrate-Ära geht zu Ende
Vor einem Jahr hat jedes KI-Coding-Tool pro Seat abgerechnet. Heute hat der größte Player dem Markt gesagt, dass dieses Modell nicht skaliert. Was es ersetzt, sieht exakt aus wie Cloud-Billing — und das hat auch nie jemand geliebt. Aber wenigstens weißt du jetzt, welcher Entwickler das Ding tatsächlich nutzt und wer es nur offen hat, um sich moralisch besser zu fühlen.



