
Harness вокруг LLM: что я понял за полтора года ежедневной работы
halezov 8 минут назад Harness вокруг LLM: что я понял за полтора года ежедневной работы Средний 6 мин 101 Искусственный интеллект Машинное обучение * Программирование * Управление разработкой * Управление продуктом *...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. halezov 8 минут назад Harness вокруг LLM: что я понял за полтора года ежедневной работы Средний 6 мин 101 Искусственный интеллект Машинное обучение * Программирование * Управление разработкой * Управление продуктом * Мнение Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества будет очередной релиз модели. Оказалось, ровно наоборот: смена модели даёт заметный, но ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный.
Англоязычные инженеры называют эту обвязку harness. Это контур, в котором живёт модель: системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память. Без него даже флагманский Claude или Codex работает как экскаватор без рычагов — мощность есть, использовать нечем.
Технические детали
У русского аналога одного короткого слова пока нет, поэтому ниже — harness и обвязка вперемешку. Формула, которая всё ставит на местоЛучше всех тезис свёл Эдди Османи из Google в апрельском посте Agent Harness Engineering: Agent = Model + Harness. Его сопроводительная мысль звучит так: «A decent model with a great harness beats a great model with a bad harness».
Зрелая обвязка вокруг средней модели бьёт сырую обвязку вокруг топовой. Эту картину независимо подтверждает Gabriel Chua из OpenAI в февральской рассылке Симона Уиллисона: «Codex-модели обучаются в присутствии harness. Tool use, execution loops, компакция, итеративная верификация — это не накладное поведение, а часть того, как модель учится работать».
Если читать прямо, модель и обвязка формируют друг друга двунаправленно, и граница между ними со временем размывается. Из чего конкретно состоит harness, удобнее всего показывает практический гайд корейского инженера Youngju Kim от марта 2026-го: семь блоков — system-prompt, tools, context, skills, hooks, permissions, memory. Если у вас в Claude Code есть CLAUDE.
Отраслевые последствия
md, пара slash-команд, скилл с триггер-описанием и pre-commit-хуки — у вас уже зрелый harness, просто называется иначе. Почему все приходят к одному и тому жеКогда независимые инженеры из Google, OpenAI, Anthropic, Answer. AI за полгода описывают одно и то же место, велик соблазн назвать это сходимостью индустрии.
Мне эта рамка кажется слабее, чем она выглядит. За ней стоит другая, более точная: нормальная фаза взросления любого, кто прошёл с LLM достаточный путь — пользователя или команды. Я заметил это на себе.
Чем выше мой собственный грейд работы с LLM, тем меньше радости от очередного релиза модели и больше дисциплины в том, как я строю контур вокруг неё. Глубина использования всегда упирается в один и тот же потолок — потолок предсказуемости, который модель сама не пробивает. Самый чистый кейс из Kaiten — наш внутренний AI-редактор документов.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





