
От 0 до 10 миллионов ИИ-проверок в месяц: как мы продуктивизировали CV в Пятёрочке за 8 месяцев
ZackST 15 минут назад От 0 до 10 миллионов ИИ-проверок в месяц: как мы продуктивизировали CV в Пятёрочке за 8 месяцев Средний 11 мин 368 Блог компании X5 Tech Машинное обучение * Искусственный интеллект Обработка...
<5 — 2026'da uzaya kaç SpaceX Starship fırlatması ulaşacak?
Значимый прорыв формирует отрасль ИИ: ZackST 15 минут назад От 0 до 10 миллионов ИИ-проверок в месяц: как мы продуктивизировали CV в Пятёрочке за 8 месяцев Средний 11 мин 368 Блог компании X5 Tech Машинное обучение * Искусственный интеллект Обработка изображений * Высоконагруженные системы * Кейс Привет, Хабр! Меня зовут Иван Попов, я руковожу командой компьютерного зрения CV Hub в дирекции искусственного интеллекта X5 Tech. А ещё у нас в команде есть Иваныч.
Так пользователи «Пятёрочки» ласково называют нашу CV-систему, которая модерирует фотографии в «Клубе тайных покупателей». Когда анкета закрывается за час, в комментариях пишут: «Иваныч сегодня хорошо работает». Имя дали сами пользователи, совпадение с моим именем чистая случайность, опыт Amazon Go не повторяем))За последние восемь месяцев Иваныч из MVP вырос в сервис, который проверяет около 10 миллионов фотографий в месяц по всем «Пятёрочкам» и «Перекрёсткам» (порядка 27 000 магазинов).
Технические детали
Под капотом у нас: Triton Inference Server, 26 моделей, 62 типа проверок, гибрид специализированных CNN и VLM-моделей. Эта статья не про то, какие классные модели у нас обучены. А про то, что значит продуктивизация CV на практике.
О том, как мы выжимали из инженерии каждый процент, чтобы 10 миллионов фото в месяц обрабатывались без падений, каждый VLM-вызов был не зря потрачен, а новые типы проверок добавлялись максимально быстро. Вкратце для тех, кто торопится:Бизнес-задача: снять с модераторов «Клуба тайных покупателей» «Перекрёстка» и «Пятёрочки» рутинную проверку миллионов анкет, чтобы они могли сосредоточиться на сложных и спорных кейсах. Архитектура: Kafka RPC → асинхронный пайплайн → Triton Inference Server + vLLM.
Что получили: рост производительности команды модерации в 7 раз, 50% экономии операционных затрат и увеличение доли анкет «день-в-день» с 0 до 40%. И большую часть истории сервиса всё это жило на 4 vCPU и 16 GB RAM, без учёта внешней VLM. Самое интересное лежит в разделе про оптимизации.
Отраслевые последствия
Это шестой раздел, при желании можно сразу перейти в него. Откуда больТайный покупатель позволяет ритейлу взглянуть на себя глазами клиента. Человек приходит в магазин по сценарию, фотографирует, заполняет анкету с вопросами и отправляет её в систему.
Дальше нужно проверить каждую анкету: фото действительно из нашего магазина? Оно сделано в правильной зоне? Проблема соответствует тому, что отмечено в анкете?
Пока поток анкет был небольшой, всё работало. Дальше клуб вырос, и началась беда. По нашим внутренним оценкам, если бы все анкеты, поступающие за день, распечатали, получилась бы стопка высотой полтора метра.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





