
Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест
techno_mot 16 минут назад Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест 12 мин 614 Блог компании Selectel Искусственный интеллект Машинное обучение * Исследования и...
Вот важная новость с фронта ИИ: techno_mot 16 минут назад Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест 12 мин 614 Блог компании Selectel Искусственный интеллект Машинное обучение * Исследования и прогнозы в IT * IT-инфраструктура * Дайджест Пока инфо-бизнесмены продают очередные курсы по промпт-инжинирингу, в индустрии пересобирают саму архитектуру ИИ-систем. Главные вызовы сегодня лежат в плоскости ML-инфраструктуры: как запустить автономных агентов на проде, снизить latency и не обанкротиться на обучении моделей с нуля. В майском выпуске разбираем свежие архитектурные подходы, новое железо и софт, которые меняют экономику современных нейросетей.
Как один разработчик запускает 100 агентов на CodexВ начале мая 2026 года в инженерном сообществе обсуждали не столько сам OpenClaw, сколько ощутимый эффект от его внутренней работы: один из авторов проекта, Питер Штайнбергер, опубликовал скриншот OpenAI‑дешборда, где за 30 дней накопился счет на 1 305 088,81 доллара. Это не демонстрация, а фактический лог агентов в продакшен‑среде, которые в фоне дергают Codex по нескольку миллионов запросов. За месяц сервис обработал около 603 млрд токенов в рамках 7,6 млн запросов.
Технические детали
При этом за всю инфраструктуру отвечают примерно 100 экземпляров Codex, которыми управляет команда из трех человек. ИИ-агенты полностью закрывают рутину:проверяют pull request'ы и ищут уязвимости в коммитах;очищают баг-трекер от дубликатов;пишут исправления и сами открывают новые PR, опираясь на roadmap OpenClaw. Отдельные системы непрерывно отслеживают бенчмарки и фиксируют регрессии, сразу отправляя алерты в Discord.
Расходы оплачивает уже не сам Штайнбергер, а OpenAI, куда он перешел в февраля 2026. Важная деталь: в этот бюджет сильно вписывается режим «Fast Mode» Codex, который расходует токены гораздо быстрее обычного режима. По словам Штайнбергера, при отключении Fast Mode месячный объем расходов сокращается примерно до 300 000 долларов.
Даже в таком виде это значительно больше, чем типичные корпоративные подписки на аналогичные ассистенты. Этот кейс естественно подводит к теме, которая сейчас активно поднимается в обсуждении агентных систем: когда говорят о сотнях агентов, экономика переходит на первое место — каждая лишняя токенизация, режим «быстрее/медленнее» и стиль автоматизации начинают напрямую затрагивать счет, а не только точность модели. Облачная инфраструктура для ваших проектовВиртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.
Отраслевые последствия
Подробнее →Cerebras запустил Kimi K2. 6 и обогнал все GPU мираЕсли в прошлом месяце нас впечатлил пример, как Kimi 2. 6 сама переписала рантайм на Zig и обогнала LM Studio, то сейчас Cerebras продемонстрировала, как эта же архитектура смотрится в корпоративном масштабе.
Калифорнийская компания официально включила в продакшен свои возможности по инференсу для модели Kimi K2.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.




