Du hast dein KI-Coding-Tool gewählt — oder dich bewusst dagegen entschieden. Copilot, Cursor, Claude Code, oder einfach dein Hirn und ein Terminal. So oder so fühlte es sich an wie die Wahl deines Texteditors oder deiner Kaffeesorte: persönlich, nicht nachverfolgbar, geht keinen was an.
Aber das Ding mit persönlichen Entscheidungen ist: Sie bleiben nur so lange persönlich, bis jemand ein Dashboard baut. Und niemand im Management hatte ein Dashboard, das zeigt, wie viel KI du nutzt, wie oft du Vorschläge annimmst oder wie deine Adoption im Vergleich zum Kollegen zwei Schreibtische weiter aussieht. Bis diese Woche.
Am 10. April hat GitHub aggregierte Cloud-Agent-Nutzerzahlen über seine Copilot Usage Metrics API ausgerollt — eine programmatische Schnittstelle, über die Organisationen Nutzungsdaten abfragen können, ohne jemanden zu fragen. Drei neue Felder: täglich, wöchentlich und monatlich aktive Nutzer für Copilots Cloud Agent. Das ist der autonome Modus, bei dem du @copilot eine Coding-Aufgabe zuweist und er in der Cloud arbeitet, bis er einen Pull Request einreicht.
Aber der 10. April kam nicht aus dem Nichts. Es war die dritte Metrik-Erweiterung in acht Tagen — der Abschluss eines Sprints, der Ende März begann, als GitHub still und leise ein used_copilot_coding_agent-Feld hinzufügte, mit dem Admins sehen können, welche konkreten Entwickler Agent-Sessions gestartet haben. Das war die Grundlage. Hier die Eskalation:
- 2. April — Per-User CLI Activity ging live. Session-Counts, Request-Counts, Token-Verbrauch, CLI-Version — alles pro Entwickler. Sie haben deine Tastatureingaben gezählt.
- 6. April — Aktives vs. passives Code-Review-Tracking. Hast du Copilot Review selbst gewählt oder hat eine Repo-Policy es automatisch zugewiesen? GitHubs eigene Worte: "Echtes Engagement messen, nicht nur Abdeckung." Sie haben deinen Enthusiasmus gemessen.
- 10. April — DAU/WAU/MAU für Cloud Agents. Die klassischen Engagement-Metriken, für die jeder Produktmanager lebt und stirbt, jetzt angewandt auf Entwickler, die KI nutzen. Sie haben es in Graphen gepackt.
Drei Updates. Acht Tage. Jedes einzelne fügt einen weiteren Pro-Entwickler-Datenpunkt zu den API-Endpoints auf Organisationsebene hinzu — was bedeutet, dass jedes Unternehmen mit einer GitHub Enterprise-Lizenz diese Zahlen programmatisch abfragen und in die HR-Analytics oder Performance-Dashboards einspeisen kann, die es sowieso schon betreibt.
GitHub ist nicht der Einzige, der diese Beobachtungsschicht aufbaut. Cursors Enterprise-Tier zeigt KI-Nutzungs-Breakdowns pro Entwickler. Anthropics Claude Code legt Session-Level-Kostendaten für Organisations-Admins offen. OpenAIs Codex startete mit eingebauter Usage Analytics in seinem Enterprise-Angebot, als am 3. April Codex-only Seats ausgerollt wurden. Die Implementierungen unterscheiden sich, aber das Muster konvergiert: Jedes grosse KI-Coding-Tool erzeugt jetzt eine lückenlose Papierspur darüber, wie viel jede einzelne Person es nutzt.
Und jetzt trifft das Dashboard auf die Realität.
Ich habe gestern die Studie "Debt Behind the AI Boom" besprochen — 304.000+ verifizierte KI-geschriebene Commits über 6.275 Repos hinweg. Die unbequeme Schlagzeile: Teams, in denen KI-generierter Code mehr als 40% des Gesamtoutputs ausmachte, hatten 20-25% höhere Nacharbeitsraten. Die Metrik, die dich auf dem Dashboard produktiv aussehen lässt — hohe KI-Adoption, viele delegierte Agent-Tasks, viele angenommene Vorschläge — korreliert mit schlechteren tatsächlichen Ergebnissen. Falls du den Artikel verpasst hast, die Kurzversion: KI schreibt Bugs auch schnell.
Das ist Goodharts Gesetz aus dem Lehrbuch: Wenn ein Messwert zum Ziel wird, hört er auf, ein guter Messwert zu sein. Nur dass jetzt dein Name draufsteht.
Der Tradeoff ist brutal. Entwickler, die sich stark auf KI-Agents stützen, erscheinen in den neuen Metriken als "High Adopters" — genau das Signal, auf das ein nicht-technischer Manager optimiert. Entwickler, die KI selektiv einsetzen, schlechte Vorschläge ablehnen und kritischen Code von Hand schreiben, sehen in einer Tabelle wie Nachzügler aus, die sie nie gesehen haben. Und komplett aussteigen? Das ist keine persönliche Präferenz mehr — es ist eine sichtbare Lücke in einem Datensatz, den die API-Calls deines Unternehmens jede Nacht befüllen.
Um das klarzustellen: GitHub hat nie gesagt, dass diese Metriken für Leistungsbeurteilungen gedacht sind. Ihr GA-Announcement vom 27. Februar formulierte es als Hilfe für Organisationen, "Trends zu verfolgen, informierte Entscheidungen über den Rollout zu treffen und Reports zu erstellen." Aber derselbe Blogpost skizzierte eine Roadmap "von der Adoption-Erfassung zur Impact-Messung." Wenn die Daten hinter einem API-Endpoint liegen, folgen die Anwendungsfälle — ob der Anbieter sie beabsichtigt hat oder nicht.
Was als "hier ist ein hilfreicher Autocomplete" begann, hat jetzt eine Zahl neben deinem Namen. Und wenn du glaubst, das bleibt beim Coding, denk nochmal nach. Designer mit KI-Mockup-Tools, PMs mit KI-Spec-Generatoren, Marketer mit KI-Copy — jede Plattform, die Wissensarbeiter bedient, baut dieselbe Messschicht auf. Die Infrastruktur ist bereits live; sie wartet nur noch auf das Dashboard.
Die freiwillige Ära der KI-Tool-Adoption endete nicht mit einer Firmenanweisung, sondern mit einer Metrics API. Drei Updates in acht Tagen. Die Metrik ist jetzt die Anweisung. Entscheide entsprechend.



