Авторы: Канунников А., Лыков А., к.ф.-м.н., академический руководитель Школы Высшей Математики и ШАДХелпера.В статье разбираем задачи онлайн-экзамена в ШАД 2026 года и смотрим, как с ними справились восемь больших...

Вот важная новость с фронта ИИ: Авторы: Канунников А. , академический руководитель Школы Высшей Математики и ШАДХелпера. В статье разбираем задачи онлайн-экзамена в ШАД 2026 года и смотрим, как с ними справились восемь больших языковых моделей — от ChatGPT до GigaChat.

В прошлом году мы тестировали модели на задачах онлайн-экзамена ШАД 2025. Тогда лидировал ChatGPT o3 с 57 баллами, а российские модели не набрали ни одного. В этот раз берём шесть задач онлайн-экзамена 2026 года и тестируем восемь моделей: ChatGPT 5.

Технические детали

1 Pro, Claude Opus 4. 8, DeepSeek-V4-Pro, YandexGPT 5. 1 Pro, GigaChat Ultra, Qwen3.

Сразу скажем результат: Qwen3. 7-Max и DeepSeek-V4-Pro набрали по 58 баллов из 60, Gemini 3. 1 Pro — 56, ChatGPT 5.

Российские модели в этом году уже не нулевые: YandexGPT — 28 баллов, GigaChat — 13. Результаты остальных моделей — в таблице ниже.

Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.

Frontier модели на экзамене в ШАД 2026

Технические детали

Related Prediction Markets

Related News