
Obsidian Hybrid Search (OHS). MCP и CLI, которые выводят поиск по заметкам с AI-агентами на новый уровень
flowing_abyss только что Obsidian Hybrid Search (OHS). MCP и CLI, которые выводят поиск по заметкам с AI-агентами на новый уровень Средний 9 мин 7 Искусственный интеллект Natural Language Processing * Open source *...
Значимый прорыв формирует отрасль ИИ: flowing_abyss только что Obsidian Hybrid Search (OHS). MCP и CLI, которые выводят поиск по заметкам с AI-агентами на новый уровень Средний 9 мин 7 Искусственный интеллект Natural Language Processing * Open source * Node. JS * Поисковые технологии * Кейс AI-агенты умеют искать по Obsidian-хранилищу, но делают это слишком топорно через glob и grep.
Да, для кода эти инструменты работают потрясающе, но хранилище в Obsidian не имеет такой же высокой структурированности. Искать по нему чисто лексически – значит терять инсайты, которые связаны по смыслу. Чтобы решить эту проблему, я разработал Obsidian Hybrid Search – MCP-сервер и CLI, которые дают агенту мощный поисковый движок поверх заметок.
Технические детали
GitHub + Obsidian PluginОглавлениеПроблема glob и grepГибридный поискКлючевые особенности OHSКак настроитьCLIMCPКак использоватьА что другие инструменты? Система, а не поискПроблема glob и grepИскать вручную по огромному хранилищу слегка утомительно. Хотя за долгое время я придумал довольно много стратегий для обзора заметок, но ни одна из них не может с достаточной надежностью дать ответ на вопрос, который я ещё сам не до конца осмыслил.
При этом чрезвычайно сложно отлавливать инсайты, которые могут рождаться из связи заметок, лежащих на разных полюсах графа. А ведь это чертовски ценно и приятно – ловить IA, затем AI. Это инсайт, который звучит как каламбур.
У меня в системе заметки об этих вещах лежат в разных категориях. Хотя одно определяет эффективность другого. " data-abbr="междисциплинарные инсайты">междисциплинарные инсайты.
Отраслевые последствия
Казалось бы, умные ИИ-агенты могут прошерстить хранилище и добыть для нас новую связь. Однако ИИ модели glob-ают и grep-ают контент. Это весьма хорошо работает в случае кода, так как он высоко структурирован, но плохо работает для базы знаний, где структуры, концепции, терминология и связи размыты.
Пример проблемы glob и grepЕсли я захочу выжать из базы знаний максимум того, что я знаю про управление вниманием, то даже умный " data-abbr="Claude Code">Claude Code будет искать в стиле Glob("notes/**/внимание*. md или Grep("внимание|attention . Если агент в заметках найдёт новые лексические зацепки, например, где написано "фокус" или "deep work" – он расширит запрос и найдёт больше релевантных заметок.
Но это всё равно принципиально не решает проблему, что glob/grep не могут найти семантически близкое, которое отличается лексически. Подобная проблема неплохо решается векторизованным поиском. Заметки превращаются в векторы, а далее мы задаём какой-то вопрос, преобразуем его в такой же вектор и смотрим, насколько он математически похож на другие векторы.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





