
HFT + LLM: почему «просто добавить ИИ» не работает и как строить системы без потери микросекунд
Finam_Broker 31 минуту назад HFT + LLM: почему «просто добавить ИИ» не работает и как строить системы без потери микросекунд Средний 7 мин 374 Блог компании Финам Финансы в IT Высоконагруженные системы * Читальный зал...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Значимый прорыв формирует отрасль ИИ: Finam_Broker 31 минуту назад HFT + LLM: почему «просто добавить ИИ» не работает и как строить системы без потери микросекунд Средний 7 мин 374 Блог компании Финам Финансы в IT Высоконагруженные системы * Читальный зал Алгоритмы * Обзор Если вы читали восторженные статьи о том, как ИИ трансформирует финансовые услуги, у вас могло сложиться впечатление, что внедрение больших языковых моделей и агентных систем в институциональные торговые среды — это в первую очередь инженерная задача: нужно лишь выбрать подходящую модель, настроить нужные параметры и дождаться роста эффективности. Проработав почти пять лет архитектором по ИИ и интеграциям для платформы, обрабатывающей HFT-данные петабайтного масштаба более чем для 100 институциональных клиентов, включая Bank of America, Merrill Lynch, JPMorgan Chase и Citigroup, Лев Яцемирский, директор по искусственному интеллекту и интеллектуальным системам в Банке Монреаля, утверждает, что такое представление упускает самую важную часть проблемы. Самая сложная часть применения ИИ в высокочастотном трейдинге — это не сам ИИ.
LLM не вписываются в микросекундный контурВысокочастотный трейдинг работает в масштабах микросекунд. Разница между системой, реагирующей за 50 микросекунд, и системой, реагирующей за 500 микросекунд, — это не просто небольшое отличие в производительности. Это разница между жизнеспособной торговой стратегией и стратегией, которая постоянно исполняется по невыгодным ценам.
Технические детали
Большие языковые модели вносят задержку инференса, измеряемую миллисекундами, — то есть работают на три-четыре порядка медленнее, чем требуют основные исполнительные системы HFT. Простое и прямолинейное внедрение LLM в такие среды не создаёт интеллектуальную торговую инфраструктуру. Оно создаёт медленную торговую инфраструктуру с прикреплённым чат-ботом.
Архитектурное решение заключается в разделении функций. Необходимо определить те области внутри HFT-стека, где задержка инференса LLM допустима. Например:Запросы по рискам на естественном языкеПомощь в настройке конфигурацийГенерация документацииПоддержка принятия решений для операторовИ выстроить строгие границы между этими функциями и критически важным с точки зрения задержек контуром исполнения сделок.
В результате получается система, действительно усиленная ИИ в тех областях, где он приносит пользу, без ущерба для характеристик производительности, необходимых высокочастотному трейдингу. На платформе Nasdaq Risk Platform такое архитектурное разделение позволило автору статьи внедрить системы запросов по рискам с поддержкой LLM, благодаря которым институциональные клиенты получили возможность анализировать сложные данные о рисках в режиме реального времени на естественном языке — возможность, которая ранее требовала специализированной технической экспертизы. При этом удалось сохранить доступность на уровне 99,9% и производительность в микросекундном диапазоне, необходимую для их торговых операций.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





