
Режим thinking у ИИ: что на самом деле происходит, когда модель «думает»
Lordneo 25 минут назад Режим thinking у ИИ: что на самом деле происходит, когда модель «думает» Простой 5 мин 1.4K Машинное обучение * Искусственный интеллект Научно-популярное Обзор Когда нажимаешь кнопку Thinking и...
GPT-5.6 31 Temmuz 2026'da yayınlanacak mı?
Вот важная новость с фронта ИИ: Lordneo 25 минут назад Режим thinking у ИИ: что на самом деле происходит, когда модель «думает» Простой 5 мин 1. 4K Машинное обучение * Искусственный интеллект Научно-популярное Обзор Когда нажимаешь кнопку Thinking и видишь, как модель несколько секунд «размышляет» перед ответом — легко решить, что она просто старается сильнее. Может, перебирает больше вариантов из какой-то внутренней базы знаний.
Thinking-режим — это принципиально другой способ генерации текста, не просто «обычный режим с усилием». И понять разницу полезно не для общего развития, а чтобы знать, когда его включать, когда он даёт реальное преимущество — а когда только тратит твоё время и ресурсы. Как работает обычная генерация — и в чём её фундаментальная ловушкаСтандартная языковая модель генерирует текст токен за токеном, строго слева направо, без права на передумать.
Технические детали
Написала «Я согласен с тем, что» — и всё, дальнейший текст строится именно на этом фундаменте. Вернуться назад, переосмыслить начало, выбрать другой поворот — невозможно. Контекст зафиксирован, и каждый следующий токен предсказывается с учётом всего написанного ранее.
Это создаёт неочевидную, но серьёзную проблему. Если на старте модель выбрала чуть неудачный поворот — она будет последовательно и уверенно развивать именно его, вплоть до конца абзаца. Никакого внутреннего сигнала «стоп, я ошибаюсь» не существует.
Именно поэтому модели иногда так убедительно гонят чушь: не потому что «не знают правильного ответа», а потому что однажды свернули не туда в самом начале — и обратного пути нет. Особенно остро эта проблема проявляется в задачах, где важна точная последовательность шагов. Математика, формальная логика, многоходовые рассуждения с условиями — именно здесь одна ранняя ошибка тянет за собой цепочку следующих, и финальный ответ оказывается красиво оформленным, но неверным.
Отраслевые последствия
Откуда взялся chain-of-thought — и почему это открытие изменило подходНесколько лет назад исследователи из Google заметили странную вещь. Если перед финальным ответом попросить модель написать промежуточные шаги рассуждения — она начинает ошибаться заметно реже. Причём эффект был воспроизводимым и измеримым.
Простая инструкция «думай шаг за шагом» реально улучшала результат на математических и логических задачах — иногда драматически. Потому что промежуточные токены-рассуждения становятся частью контекста и напрямую влияют на следующие токены. Модель как бы оставляет себе черновик прямо в тексте — и опирается на него при формулировке финального ответа.
Вычислив на бумаге «3 умножить на 7 равно 21», она с высокой вероятностью не напишет в следующей строке «итого 22». Промежуточный шаг зафиксировал результат в контексте. Это и называется chain-of-thought — цепочка рассуждений.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





