
Локальная большая лингвистическая модель на Windows 11: выбор среды, модели и пошаговое развёртывание
RedBuilder81 14 минут назад Локальная большая лингвистическая модель на Windows 11: выбор среды, модели и пошаговое развёртывание Простой 11 мин 389 Визуализация данных * Будущее здесь Искусственный интеллект...
<5 — 2026'da uzaya kaç SpaceX Starship fırlatması ulaşacak?
Значимый прорыв формирует отрасль ИИ: RedBuilder81 14 минут назад Локальная большая лингвистическая модель на Windows 11: выбор среды, модели и пошаговое развёртывание Простой 11 мин 389 Визуализация данных * Будущее здесь Искусственный интеллект Исследования и прогнозы в IT * Занимательные задачки Туториал Это третья статья в рамках проекта "Ситуационная осведомленность 24/7". С нее мы начинаем подготовку к развертыванию своей локальной систему круглосуточной ситуационной осведомленности. В данном материале пойдет доклад о том, как поднять свою локальную большую лингвистическую модель (далее - БЛМ).
Зачем вообще запускать БЛМ локально Локальная БЛМ — это модель, которая работает на вашем компьютере, а не где-то в облаках. Она не требует постоянной отправки запросов на внешние серверы, может использоваться без подписки, а главное может стать фундаментом для автономных AI-проектов: локальный помощник, анализатор документов, мониторинг новостей, подготовка сводок, RAG-поиск по собственной базе знаний. В нашем случае, мы хотим создать мультиагентную систему круглосуточной осведомлённости, которая будет использовать собственную БЛМ.
Технические детали
Для тестов мы будем использовать следующую сборку:ОС: Windows 11;Видеопамять: 4 ГБ VRAMОперативная память: 16 ГБ RAMМодели-кандидаты: Gemma и Qwen;Среды-кандидаты: LM Studio и Ollama. Небольшой спойлер: финальной рабочей сборкой будет Ollama как backend/runtime для дальнейшей автоматизации, Qwen3. 5-4B как основная модель и Gemma 4 как резервная модель.
LM Studio будет использоваться как удобная среда с графическим пользовательским интерфейсом (далее - ГПИ) для первичной диагностики, тестирования и сравнения моделей. Какие бывают системы для локального запуска БЛМ Перед тем как перейдем к установке важно понять: Ollama, LM Studio и похожие им программы - это не сами модели. Модель - это файл с весами и конфигурацией нейросети.
А среда запуска, в свою очередь, - это программа, которая загружает модель в память, распределяет нагрузку между процессором и видеокартой, принимает запрос пользователя, управляет параметрами модели и возвращает ответ. Условно такие решения можно разделить на четыре класса. Первый класс - программы с ГПИ.
Отраслевые последствия
К ним относятся LM Studio, GPT4All и Jan. Их главное преимущество - простой старт при работе с ними. Пользователю достаточно просто скачать приложение, выбрать модель, открыть чат и сразу проверить модель.
Такие программы особенно удобны на этапе знакомства с локальными БЛМ, потому что они позволяют удобно посмотреть, какая модель скачана, какое квантование выбрано, поменять параметры и проверить насколько быстро модель отвечает. Недостаток - они меньше подходят для постоянной автоматической работы по расписанию. Второй класс - программы для запуска моделей без ГПИ.
Сюда относятся Ollama, llama. Они используются через командную строку, локальный сервис и API. Такой подход менее нагляден и удобен для обывателей, зато намного практичнее для автоматизации.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





