SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы
nlaik 13 минут назад SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы Средний 7 мин 367 Искусственный интеллект Open source * Программирование * Обзор Что внутри: Qdrant, Ollama,...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. nlaik 13 минут назад SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы Средний 7 мин 367 Искусственный интеллект Open source * Программирование * Обзор Что внутри: Qdrant, Ollama, AST-чанкинг и гибридный поиск без лишних танцев с бубномЕсли вы работаете с Claude Code, Cursor или другими ИИ-ассистентами на больших кодовых базах, то наверняка знаете эту боль. Просишь агента найти, где у нас обрабатывается авторизация. Он начинает делать grep -r "auth" по всему проекту, читать десятки файлов подряд, заполнять контекстное окно мусором.
На монорепе с миллионом строк это превращается в медленный и дорогой процесс. И часто бесполезный — нужный класс называется IdentityVerifier, а не Auth, и grep его просто не найдёт. Эту проблему пытаются решить разными способами: от индексации в IDE до встроенных систем семантического поиска в платных версиях ИИ-ассистентов.
Технические детали
Я недавно наткнулся на open source проект SocratiCode, который подходит к задаче с другой стороны — через MCP (Model Context Protocol). Решил разобраться, как он устроен, и потестировать на реальных проектах. Что такое SocratiCodeЕсли коротко — это MCP-сервер, который индексирует вашу кодовую базу и предоставляет ИИ-агенту набор инструментов для умного поиска по ней.
Вместо grep и чтения файлов агент получает API: семантический поиск, анализ графа зависимостей, поиск по контекстным артефактам (схемы БД, API-спецификации, инфраструктурные конфиги). Стек под капотом такой:Qdrant — векторная БД с HNSW-индексированием, хранит и dense-векторы, и sparse-векторы BM25;Ollama — локальные эмбеддинги по умолчанию (опционально OpenAI или Gemini);ast-grep — AST-aware чанкинг кода по границам функций и классов, плюс анализ зависимостей для 18+ языков;Docker — единственное обязательное требование, всё остальное поднимается автоматически. 0, есть коммерческая лицензия для тех, кому AGPL не подходит.
Что важно: всё работает локально по умолчанию, ваш код не уходит ни в какие облака. Авторы заявляют тестирование на репозиториях до 40 миллионов строк кода. Это, конечно, не значит, что у вас всё будет летать — но порядок цифр впечатляющий.
Отраслевые последствия
УстановкаТут реально без танцев. Если у вас Claude Code, команда такая:claude mcp add socraticode -- npx -y socraticode Для VS Code, Cursor, Windsurf, Cline, Roo Code в конфиг MCP добавляется блок:"socraticode": { "command": "npx", "args": } Для OpenAI Codex CLI правится ~/. toml: command = "npx" args = После рестарта хоста SocratiCode при первом запуске сам подтягивает Docker-образы для Qdrant и Ollama, скачивает модель эмбеддингов и поднимает контейнеры.
Один раз потратил минут пять на загрузку всего этого добра, дальше старт занимает секунды. Дальше говорите агенту: «Проиндексируй эту кодовую базу». Индексация идёт в фоне, можно следить за прогрессом запросом «What is the codebase index status?
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





