Google hat Agents zu Infrastruktur-Primitiven befoerdert. Das Runbook ist ein Slack-Thread.

Dein Kubernetes-Cluster läuft auf einem Jahrzehnt operativer Narben. Runbooks, geschmiedet um 3 Uhr morgens von Ingenieuren, die schworen, am nächsten Morgen zu kündigen. SLOs, ausgehandelt in Meetings, in denen tatsächlich jemand geweint hat. Error Budgets, verteidigt mit der Verbissenheit des letzten Parkplatzes auf dem IKEA-Parkplatz am Samstag. Jeder Container in Produktion hat sich seinen Platz durch menschliches Leid verdient.

Die KI-Agents deines Unternehmens, ausgeliefert in diesem Quartal, haben nichts davon. Health Check? Undefiniert. Error Budget? Bitte. Runbook? Ein Slack-Thread namens #ai-stuff, in dem zuletzt im Februar jemand gepostet hat. On-Call-Rotation? Der Praktikant, der die Demo gebaut hat, vermutlich.

Auf der Cloud Next '26 am 22. April hat Google Cloud CEO Thomas Kurian Agents neben VMs und Containern positioniert — als erstklassige Infrastruktur-Primitive, tragende Komponenten, die deine Cloud nativ ausführt. Die neue Gemini Enterprise Agent Platform liefert das Vokabular, das Container-Ingenieure sofort wiedererkennen: Agent Runtime, Agent Registry, Agent Gateway, Agent Identity. Google hat außerdem 750 Millionen Dollar zugesagt für die Partner-Entwicklung. Allein Deloitte behauptet, über 1.000 vorgefertigte Agents liefern zu können. Tausend Agents. Null Runbooks. Wunderschön.

'Infrastruktur-Primitiv" ist ein Vertrag. Wenn du etwas als tragend abstempelst, bekommt es die volle Behandlung: SLOs, Error Budgets, On-Call-Rotationen, Incident Response, Restart-Prozeduren. Google hat den Stempel geliefert. Die Behandlung? Nicht im Lieferumfang.

Was Google geliefert hat: Agent Observability (visuelle Nachverfolgung, was passiert ist), Agent Evaluation (Performance-Bewertung), Agent Simulation (synthetische Lasttests). Alles nützliche Klempnerarbeit. Alles komplett am eigentlichen Punkt vorbei. Tracing zeigt dir die Obduktion. Reliability Engineering erkennt das Fieber, bevor der Patient auf dem Tisch liegt. Wer diesen Kanal liest, kennt das Argument — wir haben es vor zwei Wochen über Tracing gebracht und vor zwei Tagen über operative Blindheit um 3 Uhr morgens. Googles Keynote hat beide Lücken mit besserem Foliendesign und einem Bühnenbudget neu verpackt.

Die Datenlage hat sich auch nicht verbessert. Catchpoints SRE Report vom Januar: 13% der Organisationen fühlen sich sicher beim Monitoring von KI/ML-Zuverlässigkeit. Ein Drittel hat nie einen Ausfall in Produktion getestet. Und die MAST-Fehlerraten der UC Berkeley hast du auch gesehen — 41–86,7% über Multi-Agent-Systeme hinweg — hier auf dem Kanal oft genug zitiert, um sie auf Partys aufsagen zu können. Aber die eigentliche Geschichte ist nicht mehr die Zahl. Es ist, dass niemand eine bessere produziert hat in den Monaten seither. Niemand misst Agent-Zuverlässigkeit, weil niemand definiert hat, was 'zuverlässig" für einen Agent bedeutet. Das Fehlen einer Ersatzkennzahl ist die Kennzahl.

Und hier kommt die schwarze Komödie: Die Teams, die Agents am schnellsten deployen, haben null operative Disziplin. Das ist kein Bug — das ist eine Wettbewerbsstrategie. Ops-Disziplin ist Reibung, Reibung bremst, Tempo gewinnt das Quartal. Also überspringt jeder rational den langweiligen Teil und wettet darauf, dass katastrophale Multi-Agent-Ausfallraten eine akademische Kuriosität sind, die ihren Produktions-Stack nicht betrifft. Das Selbstvertrauen ist fast schon schön.

SiliconANGLEs John Furrier hat es so formuliert: Google baut 'das Betriebssystem für das agentische Unternehmen." Klar. Betriebssysteme brauchen Ops-Teams. Google hat das OS geliefert. Das Ops-Team ist eine Stellenanzeige im Entwürfe-Ordner von irgendjemandem.

'Agent Reliability Engineering" liefert heute null Ergebnisse auf LinkedIn. Null Playbooks. Null Zertifizierungen. Null Konferenzvorträge. Google hat gerade Agents auf dieselbe Infrastruktur-Ebene wie Container gehoben, die Aussage mit Dreiviertel Milliarde Dollar untermauert, und die Disziplin, die diese Erklärung überlebbar macht, existiert als Fachgebiet nicht.

Die Agents, die 2026 überleben, werden nicht die intelligentesten oder günstigsten sein. Es werden die sein, die jemand auf einen Pager gesetzt und für die jemand ein Runbook geschrieben hat — konkret das mit dem Titel 'Was tun, wenn er um 3 Uhr morgens anfängt, zufälligen Kunden Rückerstattungen auszustellen." Wer das erste Agent-SRE-Playbook veröffentlicht, setzt den Industriestandard. Dieses Playbook existiert nicht. Die Agents sind schon in Produktion. Schlaft gut.

Google hat Agents zu Infrastruktur-Primitiven befoerdert. Das Runbook ist ein Slack-Thread.

Keep reading

Die Tools deines Agenten sind down und keiner schaut hin

Die MCP-Roadmap 2026 hat vier Prioritaeten. Error Handling gehoert nicht dazu

Anatomie einer 750-Millionen-Dollar-Incentive-Maschine

Die Checkpoint-Lücke: Multi-Stunden-Agents geliefert, Crash-Recovery vergessen