
Когда AI-агент начинает убивать SSD: разбор инцидента с Codex и 640 ТБ логов в год
VadimLunin 20 минут назад Когда AI-агент начинает убивать SSD: разбор инцидента с Codex и 640 ТБ логов в год Простой 3 мин 768 Искусственный интеллект Мнение В июне 2026 года в репозитории OpenAI Codex появился...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. VadimLunin 20 минут назад Когда AI-агент начинает убивать SSD: разбор инцидента с Codex и 640 ТБ логов в год Простой 3 мин 768 Искусственный интеллект Мнение В июне 2026 года в репозитории OpenAI Codex появился баг-репорт, который быстро стал одним из самых обсуждаемых. Пользователь обнаружил, что Codex непрерывно пишет огромный объем диагностических логов в локальную SQLite-базу и потенциально способен записывать до 640 ТБ данных в год на SSD. Через неделю проблема была признана и исправлена двумя PR.
Что произошлоАвтор заметил аномально высокий износ диска:за 21 день SSD записал около 37 ТБ данных;основным источником записи оказался Codex;логи сохранялись в SQLite-файлы:logs_2. sqlite-shmЕсли экстраполировать эти цифры на год, получается около 640 ТБ записи, что сопоставимо или даже превышает ресурс многих потребительских SSD на 1 ТБ. Самая интересная находкаРазмер базы составлял всего около 1.
Технические детали
2 ГБ, однако счетчик записей SQLite показывал более 5. 5 миллиардов вставок. При этом реально в базе оставалось лишь около 500 тысяч строк.
Это означает, что система постоянно:записывала новые логи;записывала новые логи;индексировала их;писала данные в WAL;удаляла старые записи;снова записывала новые. То есть происходило классическое write amplification — огромный объем физической записи ради относительно небольшого количества сохраняемых данных. Что именно генерировало трафикАнализ логов показал довольно типичную проблему инженерии observability:ИсточникДоляTRACE-логи~71%OpenTelemetry mirror logs~25%Остальное~4%Основными виновниками стали:логирование WebSocket-сообщений;SSE-события;внутренние сообщения tokio;inotify-события файловой системы;OpenTelemetry-трейсы;сетевой транспортный слой.
Фактически в SQLite сохранялось почти всё подряд на уровне TRACE. Корневая причинаПроблема оказалась удивительно простой. Для SQLite-логирования был установлен глобальный уровень:Targets::new().
Отраслевые последствия
with_default(Level::TRACE)То есть система сохраняла практически любые внутренние события, включая низкоуровневые сообщения библиотек и сетевых протоколов. Это хороший пример того, как настройки, полезные для отладки, случайно попадают в production и начинают создавать огромные накладные расходы. Почему это важно не только для CodexСам инцидент гораздо интереснее конкретного бага.
Он показывает типичную проблему современных AI-агентов:1. Агент — это не просто LLMСегодняшний агент состоит из множества подсистем:модель;терминал;файловая система;телеметрия;логи;контекст;память;WebSocket-коммуникации;плагины и инструменты. Большая часть инженерных проблем возникает именно вокруг этих компонентов, а не вокруг самой модели.
Это подтверждают и исследования багов AI-агентов: более трети проблем связаны с интеграциями, инфраструктурой и конфигурацией, а не с качеством генерации кода.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





