Die beste Ops-Person, mit der ich je gearbeitet habe, verbrachte den Großteil ihrer Zeit lesend am Schreibtisch. Deploys — automatisierte Releases von neuem Code auf Produktivserver — gingen pünktlich raus. Sie löste Incidents, bevor jemand sie bemerkte. Das Onboarding neuer Mitarbeiter lief wie ein Uhrwerk.
Ihr Manager wollte sie fast feuern — wegen „mangelnder Auslastung."
Sie war nicht untätig. Sie war fertig.
Die Lücke, über die niemand spricht
Arbeitskultur belohnt sichtbare Anstrengung. Der Entwickler, der wie wild in die Tasten haut, wirkt produktiv. Die Kollegin, die zwanzig Minuten an die Decke starrt — und dabei über Architektur nachdenkt — wirkt faul. Wer um 23 Uhr E-Mails beantwortet, gilt als „engagiert." Wer pünktlich Feierabend macht, gilt als „nicht committed genug."
Eine Studie von 2022 aus Columbia, Georgetown und Harvard bestätigte, was Ops-Leute längst wussten: Manager bewerteten „beschäftigt wirkende" Mitarbeiter konsistent als kompetenter — selbst wenn deren tatsächlicher Output unter dem ruhigerer Kollegen lag. Wir belohnen den Anschein von Arbeit, nicht die Arbeit selbst.
Am 12. März stellte PagerDuty seinen SRE Agent als virtuellen Responder vor — Software, die Ausfälle erkennt, Diagnosen durchführt und Lösungsprozeduren abarbeitet, ohne dass ein Mensch die Tastatur berührt. Vier Tage später, auf der GTC am 16. März, kündigte NVIDIA das Agent Toolkit mit OpenShell an — Infrastruktur für den sicheren Betrieb autonomer Ops-Agents in Produktivumgebungen. Am 24. März pitchten auf dem YC Demo Day Startups wie IncidentFox autonome Incident Response als komplettes Produkt. Das Signal vom Markt: Wenn eine Aufgabe einem vorhersehbaren Muster folgt, sollte kein Mensch sie manuell erledigen.
Was eine Frage aufwirft, der sich Ops-Teams überall stellen müssen: Wenn AI Agents — Programme, die eigenständig handeln, Entscheidungen treffen und Schritte ausführen, ohne ständige menschliche Überwachung — das sichtbare Firefighting übernehmen, was macht eine Ops-Person dann den ganzen Tag?
Die Antwort hat sich nicht geändert. Aber der Druck, sie zu verstehen, schon.
Im Operations-Bereich erzeugt die alte Anreizstruktur eine perverse Dynamik — ein System, das genau das falsche Verhalten belohnt. Wenn dein Unternehmen dich fürs Brandlöschen wertschätzt, hast du null Motivation, Brände zu verhindern. Wenn dein Manager deinen Wert daran misst, wie viele dringende Slack-Nachrichten du bearbeitest, macht dich der Aufbau von Systemen, die diese Nachrichten überflüssig machen, entbehrlich. Und jetzt löschen auch AI Agents Brände. Schneller. Ohne Schlaf. Ohne zu meckern.
Das Paradox im Herzen von Ops
Je besser du in Operations bist, desto weniger scheinst du zu tun. Ein Feuerwehrmann, der Brände verhindert, wirkt arbeitslos. Eine Ops-Person, deren Systeme nie ausfallen, wirkt wie ein Faulenzer. Die sichtbare Arbeit verschwindet genau deshalb, weil jemand die unsichtbare Arbeit richtig gemacht hat.
Ich beobachte dieses Muster seit Jahren. Die Ops-Person, die ihren Job automatisiert, wird gefragt: „Was machst du eigentlich den ganzen Tag?" Die, die jeden Incident manuell bearbeitet und Zwölf-Stunden-Schichten schiebt, wird befördert für „überdurchschnittliches Engagement."
Die eine hat ein System gebaut. Die andere hat eine Abhängigkeit von sich selbst geschaffen. Frag dich, welche davon das Unternehmen wirklich braucht — und welche ein AI Agent zuerst ersetzt.
Wie gute Ops in der Praxis aussieht
Gute Operations-Arbeit läuft in zwei Phasen ab.
Phase 1: Die Systeme bauen. Dieser Teil ist sichtbar und zeitlich begrenzt. Runbooks schreiben — Schritt-für-Schritt-Anleitungen für bestimmte Situationen. Monitoring aufsetzen — automatisierte Checks, die Probleme erkennen, bevor Nutzer sie bemerken. Automation für wiederkehrende Aufgaben erstellen. Prozesse dokumentieren, damit jeder sie nachvollziehen kann. Diese Phase ist intensiv: typischerweise zwei bis sechs Monate fokussierte Arbeit.
Phase 2: Die Systeme pflegen. Hier beginnt die Verwirrung. Die Systeme laufen. Alerts feuern und Runbooks greifen — zunehmend führen AI Agents diese Runbooks ohne menschliches Eingreifen aus. Neue Mitarbeiter onboarden sich selbst durch dokumentierte Prozesse. Deploys fließen durch CI/CD-Pipelines — automatisierte Abläufe, die Code vom Entwicklerrechner auf Produktivserver bringen, ohne manuelle Schritte.
Der Job der Ops-Person in Phase 2: Muster erkennen, die auf Systemdegradation hindeuten. Post-mortems durchführen — strukturierte Analysen, was schiefgelaufen ist und warum. Zukünftige Kapazitäten planen. Entscheiden, welche neuen Prozesse an Agents übergeben werden und welche noch menschliches Urteilsvermögen erfordern. Lesen. Lernen. Denken.
Dieser letzte Teil sieht aus wie „nichts tun." Aber eine Ops-Person, die nicht neue Tools studiert, Fehlerszenarien durchspielt, evaluiert, welche Agent-Frameworks zur eigenen Infrastruktur passen, und für Situationen plant, die noch nicht eingetreten sind — wird auf dem falschen Fuß erwischt, wenn sie eintreten. Googles Site Reliability Engineering Handbook bringt es auf den Punkt: Der Job ist es, Zuverlässigkeit zu engineeren, nicht heroisch ihre Abwesenheit zu kompensieren.
Beschäftigung ist ein Bug Report
Ich sage das Unausgesprochene laut: Permanente Geschäftigkeit signalisiert kaputte Systeme, nicht Hingabe.
Ständig am Feuerlöschen? Deine Präventionssysteme haben versagt. Ständig am Context-Switching — alle paar Minuten zwischen zusammenhanglosen Aufgaben hin- und herspringen? Deine Priorisierung hat versagt. Ständig in Meetings? Deine Kommunikationssysteme haben versagt. Immer noch neue Mitarbeiter per Hand einarbeiten? Dein Onboarding hat versagt.
„Beschäftigt" ist kein erstrebenswerter Zustand. „Beschäftigt" ist ein Bug Report.
Das Ziel von Operations — und ehrlich gesagt den meisten Wissensberufen — ist ein Zustand, in dem Systeme die vorhersehbaren neunzig Prozent erledigen und du Kapazität für die unvorhersehbaren zehn hast. In diesen zehn Prozent zählt menschliches Urteilsvermögen. Alles andere sollte von allein laufen. Im März 2026 bedeutet „von allein laufen" zunehmend: Ein AI Agent übernimmt es — und die Ops-Person, die das System gebaut hat, entscheidet, was der Agent anfassen darf und was nicht.
Der Weg raus
Wenn du gerade in operativer Arbeit ertrinkst, hier eine praktische Abfolge.
Woche 1–2: Alles erfassen. Jede Aufgabe, jede Unterbrechung, jedes wiederkehrende Problem. Noch nichts fixen. Nur beobachten.
Woche 3–4: Kategorisieren. Was wiederholt sich? Was folgt einem Muster? Was könnte ein Script — ein kleines Programm, das einen manuellen Schritt automatisiert —, eine Checkliste oder ein AI Agent übernehmen? Typischerweise fallen sechzig bis siebzig Prozent der operativen Arbeit in die Kategorie „vorhersehbar und automatisierbar."
Woche 5–8: Die zehn größten Zeitfresser automatisieren oder dokumentieren. Einer pro Woche. Fang mit dem an, der dich am häufigsten unterbricht. Für Incident Response — den Prozess, Ausfälle zu erkennen und zu beheben — ziehe Agent-gestützte Triage in Betracht: Tools wie PagerDutys SRE Agent oder Open-Source-Alternativen bearbeiten musterbasierte Incidents und eskalieren neuartige an dich.
Monat 3: Du hast jetzt vierzig bis fünfzig Prozent mehr Kapazität. Investiere sie in die nächste Ebene von Problemen.
Monat 6: Du liest ein Buch am Schreibtisch. Deine Systeme laufen. Deine Agents erledigen das Vorhersehbare. Du wirkst untätig. Du bist nicht untätig. Du bist fertig.
Eine Anmerkung für Führungskräfte
Wenn deine beste Ops-Person gelangweilt wirkt — Glückwunsch. Deine Systeme funktionieren. Weise ihr keine Beschäftigungstherapie zu, um ihr Gehalt zu rechtfertigen. Zwing sie nicht zu Productivity Theater — diesem performativen Geschäftigtun, um jemandes Erwartung zu erfüllen, wie „hart arbeiten" auszusehen hat.
Frag sie stattdessen: „Was würdest du bauen, wenn du drei Monate ungestörte Zeit hättest?" Und dann gib ihr diese drei Monate. Was dabei entsteht, spart mehr als jede sichtbare Geschäftigkeit es je könnte.
Die produktivste Person in deinem Unternehmen könnte die sein, die am wenigsten zu tun scheint. Das ist kein Paradox. So sieht „fertig" aus.





