
Cloudflare: Оркестрация AI-ревью кода в промышленных масштабах
Overman775 11 минут назад Cloudflare: Оркестрация AI-ревью кода в промышленных масштабах Сложный 12 мин 160 Искусственный интеллект Управление разработкой * Машинное обучение * Программирование * Перевод Автор...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Вот важная новость с фронта ИИ: Overman775 11 минут назад Cloudflare: Оркестрация AI-ревью кода в промышленных масштабах Сложный 12 мин 160 Искусственный интеллект Управление разработкой * Машинное обучение * Программирование * Перевод Автор оригинала: Cloudflare, Ryan Skidmore Code review (ревью кода) — отличный механизм для отлова багов и обмена знаниями, но вместе с тем это почти гарантированный способ создать «бутылочное горлышко» для всей команды разработчиков. Merge Request (MR) сутками висит в очереди, ревьюер рано или поздно отвлекается от своих задач, чтобы вникнуть в diff, оставляет пару мелких придирок к названиям переменных, автор отвечает, и цикл повторяется. В наших внутренних проектах медианное время ожидания первого ревью часто измерялось часами.
Когда мы только начали экспериментировать с AI-ревью кода, мы пошли по пути, который, вероятно, выбирает большинство: попробовали несколько готовых инструментов. Многие из них работали неплохо и даже предлагали широкие возможности кастомизации. Но, к сожалению, их гибкости просто не хватало для организации масштабов Cloudflare.
Технические детали
Тогда мы перешли к следующему очевидному шагу: взяли git diff, скормили его сырому промпту и попросили большую языковую модель (LLM) найти баги. Результат получился ожидаемо зашумленным: поток расплывчатых предложений, выдуманные синтаксические ошибки и «полезные» советы из разряда «добавьте обработку ошибок» в функциях, где она уже и так была. Мы быстро поняли, что наивный подход с саммаризацией не даст нужных результатов, особенно на сложных кодовых базах.
Вместо того чтобы создавать очередного монолитного агента для код-ревью с нуля, мы решили построить CI-нативную систему оркестрации вокруг OpenCode — open-source агента для написания кода. Сегодня, когда инженер Cloudflare открывает merge request, он сразу же проходит первичную проверку через скоординированный набор ИИ-агентов. Вместо использования одной модели с огромным универсальным промптом мы запускаем до семи узкоспециализированных ревьюеров: по безопасности, производительности, качеству кода, документации, релиз-менеджменту и соответствию нашему внутреннему Engineering Codex.
Этими специалистами управляет агент-координатор, который удаляет дубликаты их находок, оценивает реальную критичность проблем и публикует единый структурированный комментарий. Мы используем эту систему внутри компании на десятках тысяч merge request’ов. Она одобряет чистый код, с впечатляющей точностью помечает реальные баги и активно блокирует мерж, если находит действительно серьезные проблемы или уязвимости.
Это лишь один из многих способов повышения отказоустойчивости нашей разработки в рамках инициативы Code Orange: Fail Small. В этой статье мы подробно разберем, как мы это построили, к какой архитектуре в итоге пришли и с какими инженерными проблемами вы обязательно столкнетесь, если попытаетесь внедрить LLM в критический путь вашего CI/CD пайплайна — и, что еще важнее, на пути инженеров, пытающихся поставлять код.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





