yakvenalex только что Облачная LLM на 16 ГБ VRAM — часть 3: ChatGPT-интерфейс для ваших LangGraph-агентов 30 мин 12 Блог компании Selectel Искусственный интеллект Python * NestJS * DevOps * Туториал Друзья, возвращаюсь...

Значимый прорыв формирует отрасль ИИ: yakvenalex только что Облачная LLM на 16 ГБ VRAM — часть 3: ChatGPT-интерфейс для ваших LangGraph-агентов 30 мин 12 Блог компании Selectel Искусственный интеллект Python * NestJS * DevOps * Туториал Друзья, возвращаюсь с финальной частью цикла. За две предыдущие статьи мы подняли собственную локальную модель на облачном сервере с GPU на 16 ГБ VRAM, разобрались с vLLM и tool calling, собрали агентный бэкенд на LangGraph с MCP-серверами, получили вокруг него полноценный REST API из коробки и обернули все это в FastAPI-сервис через LangGraph SDK. Серьезная инфраструктура — и она реально работает.

Все, что мы собрали, — это бэкенд. Красивый, правильно устроенный, с трейсингом и персистентностью. Только вот показать его обычному пользователю, который привык к ChatGPT, пока не получится — curl в терминале его не впечатлит, а давать доступ к LangSmith, мягко говоря, неправильно.

Технические детали

Сегодня это исправляем. Предыдущие материалы серии:Облачная LLM на 16 ГБ VRAM — часть 1;Облачная LLM на 16 ГБ VRAM — часть 2. Оказывается, у LangChain есть официальный ответ на вопрос «А где фронтенд?

» — проект agent-chat-ui. js-интерфейс, который из коробки умеет подключаться к LangGraph Server, стримить токены, показывать шаги агента, вызовы инструментов и размышления модели в реальном времени. По духу — тот же ChatGPT, только работает на вашей инфраструктуре и полностью под вашим контролем.

Схема подключения предельно простая: клонируем репозиторий, прописываем в . env адрес нашего LangGraph Server и имя агента, запускаем. Примерно так же, как в прошлой части мы одной командой получали REST API вокруг графа, — здесь одной командой получаем UI вокруг этого API.

Отраслевые последствия

Сегодня закрываем полный цикл:Цикл: инфраструктура → локальная LLM → агентный бэкенд → MCP-инструменты → production-ready фронтенд → деплой. Подходы к разработке UI и безопасностьПрежде чем лезть в код, хочу сделать небольшое отступление — про подходы к UI в контексте агентов. Чтобы то, что мы будем делать дальше, воспринималось как осознанный выбор, а не единственно возможный путь.

Подходов, по большому счету, два, но есть и третий — гибридный, и о нем тоже расскажу. Первый — вы берете REST API от LangGraph Server, пишете вокруг него собственную обертку через LangGraph SDK (как мы делали в прошлой части) и уже поверх этой обертки реализуете фронтенд с нуля под свои нужды. Второй — берете тот же REST API, подключаете к нему готовый фронтенд и кастомизируете его под себя.

Именно этим мы займемся сегодня. agent-chat-ui умеет работать в режиме API Passthrough: все запросы к LangGraph Server идут не напрямую с клиента, а через Next. js API routes на том же сервере.

Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.

Облачная LLM на 16 ГБ VRAM — часть 3: ChatGPT-интерфейс для ваших LangGraph-агентов

Технические детали

Отраслевые последствия

Related Prediction Markets

Related News