Твій AI-асистент для кодингу щойно написав Terraform-модуль. Не React-компонент — файл, який визначає, скільки серверів ти оплачуєш, хто має доступ до твоєї продакшн-бази, і чи твій деплой-пайплайн зливає секрети в публічний білд-лог. Ти затвердив його з тим самим напівсонним поглядом, яким дивишся на utility-функцію. І ось тут ця історія стає дорогою.
Місяць тому ці інструменти переважно сиділи у своїй пісочниці: функції, компоненти, API-хендлери. Баг там — користувач бачить 500-ку три секунди. Дратує, переживеш, забудеш. Але у квітні 2026 кожен великий AI-інструмент для кодингу тихо перетнув ту саму межу — вліз в інфраструктуру — і ніхто не оновив процес рев'ю. Бо навіщо? Це ж все просто код, правильно?
Правильно. І багаття, і лісова пожежа — теж просто горіння.
Усі випустили інфра-агентів у квітні
Три великі релізи за перші два тижні квітня. 14 квітня Anthropic запустив Claude Code Routines — хмарні заплановані задачі, які працюють поки твій ноут спить, з явним фокусом на CI/CD-верифікацію через сканування деплой-логів на помилки. 16 квітня OpenAI оновив Agents SDK з нативним sandbox-виконанням на семи хмарних провайдерах і додав SSH-підключення до Codex. 6 квітня вийшов Cursor 3 ("Glass") з окремим Agents Window для паралельних AI-агентів — інженери самого Cursor визнають, що понад третина їхніх PR тепер від хмарних агентів. Microsoft, зі свого боку, рухається в тому ж напрямку з кінця березня зі своїм фреймворком "Agentic Platform Engineering" для Copilot-агентів, націлених на Terraform, Kubernetes і GitHub Actions — з агентом "Cluster Doctor", який діагностує проблеми Kubernetes. Чарівно.
Жоден із цих інструментів не розрізняє utils.ts і main.tf. Жодного окремого сигналу впевненості. Жодного "гей, цей файл керує твоїм хмарним рахунком і безпекою, може глянеш двічі." Просто код.
Математика радіусу ураження
Неправильна функція повертає поганий API-відповідь. Хтось заводить тікет у Jira. Неправильний Terraform-ресурс — один рядок, де instance_type = "x1e.32xlarge" замість t3.micro — спалює $50,000 за ніч. Найдорожча друкарська помилка у твоїй кар'єрі, згенерована за 200 мілісекунд і затверджена ще швидше. Неправильна IAM-політика відкриває продакшн-базу на весь інтернет. Зламаний GitHub Action публікує секрети у публічний білд-лог. Інфраструктурний код працює не всередині твого додатку. Він запускає весь твій додаток.
Як зазначив CloudMagazin 2 квітня: "AI-згенерований Terraform-код пишеться швидше, ніж читається — саме це робить його небезпечним." Їхнє правило: якщо ти не можеш пояснити більше 20% згенерованого конфігу рядок за рядком, цей розрив у розумінні кваліфікується як вразливість безпеки.
Цифри, про які ніхто не говорить
Ось тут стає по-справжньому соромно за індустрію. На кодинг-бенчмарках типу HumanEval — ізольовані задачки на функції, те, що другокурсник інформатики розв'яже за достатню кількість кави — топ-моделі тепер набирають 99% (за даними Morphllm, квітень 2026). Вражаюче. А ще — нерелевантно.
DPIaC-Eval, стаття від червня 2025, що побудувала перший бенчмарк спеціально для тестування генерації infrastructure-as-code на 153 реальних AWS CloudFormation шаблонах, виявила середню успішність першого деплою 24.7%. Відповідність безпеці по повних шаблонах: 8.4%. Головний тип помилок: галюциновані властивості — модель впевнено вигадує поля конфігурації, яких не існує. Вона помиляється не зі скромністю. Вона помиляється з впевненістю сеньйор-інженера, який просто все вигадує на ходу.
Отже: 99% на іграшкових функціях. 24.7% на коді, який реально запускає твою інфраструктуру. Ніхто не говорить про цей розрив, бо ні SWE-bench, ні HumanEval, ні жоден мейнстрім-бенчмарк не покриває Terraform, Docker чи CI/CD-файли. Розрив залишається невидимим, бо індустрія вирішила його не вимірювати.
Тим часом, опитування ControlMonkey (січень 2026) виявило, що 58% хмарних команд вже стикалися з AI-внесеними місконфігураціями, а 81% governance-команд кажуть, що ручне рев'ю не масштабується зі швидкістю AI-генерації. Дані Veracode за Q1 2026 показують, що 41% AI-згенерованого бекенд-коду йде в продакшн із надмірно широкими правами доступу — цифровий еквівалент роздати всім в офісі майстер-ключ, бо так швидше, ніж розбиратися, кому що потрібно.
Що це означає для тебе
Policy-as-Code інструменти існують — OPA, Checkov, tfsec — автоматичні сканери, що ловлять небезпечні або невідповідні інфраструктурні конфіги до деплою. Жоден AI-інструмент для кодингу не інтегрує їх у свій дефолтний агентський пайплайн. Тобі треба підключати їх самому. А ти не будеш, бо весь selling point цих агентів у тому, що тобі нічого не треба підключати самому. Класний парадоксик.
Кожен AI-згенерований інфраструктурний файл потребує окремого, суворішого рев'ю: dry-run валідація, оцінка вартості, аудит мінімальних привілеїв. Твій інструмент не проведе за тебе цю межу. Або проведеш ти, або її проведе твій рахунок від AWS.
Невидима стіна
Історія AI-продуктивності в кодингу щойно вдарилась об межу, про яку ніхто не оголосив: лінію між кодом, що працює всередині твого додатку, і кодом, що запускає твій додаток. По один бік — 99% на бенчмарках і реальна економія часу. По інший — 24.7% успішності, 8.4% відповідності безпеці і рівно нуль захисних бар'єрів.
Ти досі затверджуєш Terraform тим самим поглядом, яким дивишся на utility-функцію. Ніхто не наклеїв попередження. Вважай це — твоїм.





