Frontier модели на экзамене в ШАД 2026
Авторы: Канунников А., Лыков А., к.ф.-м.н., академический руководитель Школы Высшей Математики и ШАДХелпера.В статье разбираем задачи онлайн-экзамена в ШАД 2026 года и смотрим, как с ними справились восемь больших...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Вот важная новость с фронта ИИ: Авторы: Канунников А. , академический руководитель Школы Высшей Математики и ШАДХелпера. В статье разбираем задачи онлайн-экзамена в ШАД 2026 года и смотрим, как с ними справились восемь больших языковых моделей — от ChatGPT до GigaChat.
В прошлом году мы тестировали модели на задачах онлайн-экзамена ШАД 2025. Тогда лидировал ChatGPT o3 с 57 баллами, а российские модели не набрали ни одного. В этот раз берём шесть задач онлайн-экзамена 2026 года и тестируем восемь моделей: ChatGPT 5.
Технические детали
1 Pro, Claude Opus 4. 8, DeepSeek-V4-Pro, YandexGPT 5. 1 Pro, GigaChat Ultra, Qwen3.
Сразу скажем результат: Qwen3. 7-Max и DeepSeek-V4-Pro набрали по 58 баллов из 60, Gemini 3. 1 Pro — 56, ChatGPT 5.
Российские модели в этом году уже не нулевые: YandexGPT — 28 баллов, GigaChat — 13. Результаты остальных моделей — в таблице ниже.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





