
Plan-tango: как я перестал гонять план между Claude Code и Codex руками
egorsokolov 23 минуты назад Plan-tango: как я перестал гонять план между Claude Code и Codex руками Средний 4 мин 1.3K Искусственный интеллект Open source * Лайфхаки для гиков Софт Программирование * Кейс Codex...
В сфере искусственного интеллекта произошло заметное событие. egorsokolov 23 минуты назад Plan-tango: как я перестал гонять план между Claude Code и Codex руками Средний 4 мин 1. 3K Искусственный интеллект Open source * Лайфхаки для гиков Софт Программирование * Кейс Codex стабильно находит в моих планах разработки вещи, которые Claude в своём же плане не видит. Я заметил это в первые несколько дней после покупки GPT Pro — и с тех пор стараюсь не садиться писать код, пока план не пройдёт хотя бы один раунд cross-review.
GPT Pro я брал в основном из-за Pro-модели, Codex в комплекте был приятным бонусом — плюс в мае OpenAI давали двойные лимиты на Codex для Pro-подписок. Но не совру, если скажу, что идея немного ослабить vendor lock-in и свою зависимость от Антропика мне также грела душу. К моему удивлению, пока самым полезным и часто используемым сценарием стал cross-review планов разработки.
Технические детали
md, который Claude Code пишет в фазе планирования, кидаешь в Codex, просишь: «найди дыры, не пиши код». Получаешь список замечаний, несешь обратно в Claude Code. Почему вторая модель находит то, чего автор плана не видитЭто известный паттерн LLM-as-judge: одна модель оценивает выход другой.
Даже свежая Claude-сессия на той же модели уже что-то находит. Но ревью с помощью другой модели работает заметно мощнее. У Codex другие фокусы внимания, другая интуиция про edge-кейсы, другие опасения.
Если Claude писал план на оптимистичной волне («сейчас быстренько добавим вот этот хук»), Codex как правило настроения автора не разделяет. Категории находок, по моим ощущениям, повторяются: недооценённые edge-кейсы, неаккуратные предположения о библиотечном API, места, где сам Claude в плане честно написал «возможно, понадобится отдельный шаг», — а к финалу плана этот шаг куда-то исчез. Чего я не ожидал: ревьюер хочет переписать план в кодОдин план я как-то гонял аж 15 итераций.
Отраслевые последствия
В какой-то момент я вчитался поглубже в то, что Codex пишет в очередном review, — и увидел, откуда эти 15 итераций берутся. Если спрашивать LLM «что не так с этим планом? », она по дефолту дрейфует в сторону «давай я просто перепишу твой план так, как он должен выглядеть».
И «как он должен выглядеть» в её представлении — максимально похоже на готовый код. Псевдокод, готовые блоки кода прямо в плане, иногда детальные пошаговые инструкции уровня «и вот эту проверку добавь сюда». По мере итераций план переходит из «вот примерный маршрут и три развилки, где надо подумать» до «вот построчная спецификация, агенту-исполнителю остаётся только распарсить».
Звучит как улучшение — пока не задумаешься, что это значит дальше. Дальше писать код пойдёт другой агент. Если план уже превратился в построчный псевдокод — у этого агента не осталось пространства для решений.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





