Как команда Cloudflare научила семь AI-агентов делать то, на что у живых ревьюеров уходили часы
Код-ревью давно превратился в одну из главных болевых точек инженерных команд. Merge request висит сутками, ревьюер отвлекается от своих задач ради пары комментариев к названиям переменных, автор отвечает - и карусель закручивается заново. Cloudflare решила эту проблему радикально: заменила ожидание первым эшелоном из семи специализированных AI-агентов.
Наивный подход не сработал - и это было ожидаемо
Поначалу команда пошла стандартным путём: взяла готовые инструменты для AI-ревью. Те работали сносно, но не тянули специфику масштабов компании. Тогда инженеры попробовали грубую силу - скормили git diff сырому промпту и попросили языковую модель найти баги. Результат оказался предсказуемо мусорным: поток расплывчатых советов, выдуманные синтаксические ошибки и рекомендации «добавить обработку ошибок» там, где она уже стояла. Стало очевидно: один огромный промпт и одна модель - тупиковая ветка.
Примечательно, что с похожими граблями сталкивается большинство компаний, которые пытаются механически влить LLM в CI/CD пайплайн. По отраслевым оценкам, более 60% первых попыток внедрения AI-ревью заканчиваются именно этим - шумом вместо сигнала.
Семь агентов вместо одного монолита
Архитектура, к которой пришли в Cloudflare, строится на принципе узкой специализации. Вместо монолитного ревьюера система запускает до семи независимых агентов - каждый смотрит на код через свою линзу:
- безопасность и уязвимости
- производительность
- качество кода
- документация
- релиз-менеджмент
- соответствие внутреннему Engineering Codex
Поверх всего этого работает агент-координатор. Он агрегирует находки, вычищает дубликаты, взвешивает реальную критичность каждой проблемы и публикует единый структурированный комментарий. Никакого шума - только то, что действительно важно. Техническую оркестрацию выстроили вокруг OpenCode - опенсорсного агента для написания кода, встроив всё это как CI-нативное решение.
Десятки тысяч MR - и система уже блокирует реальные баги
Сегодня каждый merge request в Cloudflare проходит через этот конвейер автоматически. Система уже обработала десятки тысяч запросов на слияние. Чистый код она одобряет без лишних вопросов. Реальные баги помечает с, по словам самой команды, впечатляющей точностью. Серьёзные уязвимости - блокирует мерж полностью. Это часть более широкой инициативы по отказоустойчивости разработки под названием Code Orange: Fail Small.
Подход Cloudflare - это, по сути, новая точка отсчёта для команд, которые хотят внедрить AI в критический путь доставки кода. Медианное время ожидания первого ревью, которое раньше измерялось часами, теперь сжалось до минут. Ревьюер-человек подключается уже не к сырому diff-у, а к отфильтрованному списку проблем, которые действительно заслуживают внимания. Скорость выросла. Качество - тоже. Норвегия - Сенегал 23 июня покажет, умеют ли скандинавы так же чётко выстраивать командные системы на поле - но в разработке Cloudflare этот вопрос уже закрыт. Бутылочное горлышко перестало быть неизбежностью.