
Я отдал разработку автономному ИИ — промежуточные итоги за 178 релизов
insane-jo 14 минут назад Я отдал разработку автономному ИИ — промежуточные итоги за 178 релизов Средний 12 мин 554 Искусственный интеллект Управление разработкой * Информационная безопасность * DevOps * Кейс Продолжение...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. insane-jo 14 минут назад Я отдал разработку автономному ИИ — промежуточные итоги за 178 релизов Средний 12 мин 554 Искусственный интеллект Управление разработкой * Информационная безопасность * DevOps * Кейс Продолжение эксперимента, в котором автономный пайплайн пишет и катит код в прод без человеческого ревью. 4 млрд токенов, ноль строк кода, прочитанных человеком перед мержем. Что сработало, что сломалось и почему главная работа теперь — не код.
Обложка: рука-кукловод держит на ниточках роботов, которые несут коробки к монитору с кодомДве недели назад я позвал Хабр ломать мой автономный AI-пайплайн — и заодно накидать своих задач на доработку, чтобы вместе раздуть репозиторий, который этот пайплайн ведёт. Устроено так: живая браузерная игра, любой пишет в бота «что поменять», дальше пайплайн сам уточняет, формулирует, пишет код, гоняет тесты, ревьюит и выкатывает в общий прод — без единого человеческого взгляда на дифф. Я обещал вернуться с тем, что сломается.
Технические детали
Пришли, поломали, нагрузили задачами. И сразу рамка, через которую я теперь смотрю на всё это. Когда у бухгалтера появился Excel, профессия не исчезла — она поднялась на уровень выше.
Ценность сместилась с «быстро и без ошибок считать на счётах» на «знать формулы, ВПР, держать структуру таблицы и проверять результат». Программист со счётами — это тот, кто пишет код руками. Программист с Excel — тот, кто строит обвязку и критически проверяет.
Весь эксперимент оказался про этот сдвиг — и я увидел его на живых данных. СпасибоОгромное спасибо читателям, ставшим участниками и со-авторами игры, которую мы разрабатываем с помощью ИИ. Без вас этого среза просто не существовало бы — мерить было бы нечего.
Отраслевые последствия
Спасибо каждому, кто завёл заявку, дотерпел раунд уточнений, накидал задач на доработку и особенно — кто приходил ломать осознанно. Самые ценные данные дали именно вы, и эта статья — настолько же ваша, насколько моя. Что произошло за две недели (сухие цифры)178 релизов в боевой билд; 0 строк кода, прочитанных человеком перед мержем.
4 млрд токенов сожрали модели (вместе с экспериментами ниже). Один внешний игрок увлёкся и дал почти половину всех заявок; своих я за это время подал четыре — я теперь сижу не на коде, а на воротах. Воронка: 194 заявки → 167 одобрено → 159 доехало до прода (93% одобренного).
Из доехавших 9 откатились автоматикой, остальное осталось жить. +95 840 / −16 790 строк, 199 тест-файлов, 1955 тестов — всё это написал не я. Режимов игры: на старте был 1 (тактическая кампания) — сейчас 12 (оборона, перестрелка, MOBA, раннер, платформер, гонки на танках, лабиринт, realtime на реальной карте и др.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





