nikicat 35 минут назад Opus 4.7 vs GPT-5 vs DeepSeek V4-Pro: три агента строят TSS-CLI на Rust Средний 7 мин 821 Rust * Искусственный интеллект Машинное обучение * Обзор Из песочницы TL;DR24 апреля 2026 DeepSeek в...

В сфере искусственного интеллекта произошло заметное событие. nikicat 35 минут назад Opus 4. 7 vs GPT-5 vs DeepSeek V4-Pro: три агента строят TSS-CLI на Rust Средний 7 мин 821 Rust * Искусственный интеллект Машинное обучение * Обзор Из песочницы TL;DR24 апреля 2026 DeepSeek в режиме preview выкатил V4-Pro — MoE на 1. 6T параметров (49B активных), 1M контекста.

Появился повод посадить три флагманские модели за один и тот же не самый тривиальный таск и посмотреть, кто как справится. Задание общее, машина одна, час один, всё запускалось параллельно:МодельHarnessReasoning effortAnthropic Opus 4. 7 (1M ctx)Claude Codex-highOpenAI GPT-5CodexhighDeepSeek V4-ProOpenCodehigh (max)Если коротко: GPT-5 в Codex оказался самым быстрым и единственным, кто полностью реализовал ТЗ; Opus 4.

Технические детали

7 в Claude Code — самым аккуратным с точки зрения инженерной культуры (модули, README, тесты, QA-скрипты), но оплаченным горой permission prompts; DeepSeek V4-Pro в OpenCode не уложился в ТЗ ни архитектурно, ни функционально — и, что интереснее, проигнорировал прямую обратную связь от пользователя. QA: pass / partial / fail по каждому агентуДалее — цифры, таблицы и разбор конкретных технических проблем по каждой модели. ЗадачаДано ТЗ: написать на Rust CLI-утилиту dkls23ctl для t-of-n threshold-ECDSA (поверх библиотеки silence-laboratories/dkls23) с p2p-сетью на iroh и mDNS-discovery.

Подкоманды: keygen, pubkey, sign, reshare, verify. Никакого выделенного лидера, никакого сервера, key shares хранятся в . Singleton-режим (-t1) должен выдавать обычный ECDSA, а reshare — поддерживать import/export между singleton и (t,n).

ТЗ прицельно неприятное: TSS-криптография не самый ходовой жанр, у dkls23 несколько разных публикаций на crates. io с разными API, а у iroh за последние полгода был не один мажорный релиз, ломающий совместимость. Что получилось — общая картинаOpus 4.

7 (Claude Code)GPT-5 (Codex)DeepSeek V4-Pro (OpenCode)QA-сценариев (16) — pass/partial/fail12 / 4 / 014 / 2 / 06 / 2 / 8Активное время сессии65 мин26 мин95 минВызовов инструментов / вмешательств пользователя337 / 2217 / 3294 / 1Cargo-тестов2/2 PASS2/2 PASS0mDNS, как требовало ТЗ✅✅❌ файлы в /tmpПолная матрица reshare⚠ часть ветвей с явной ошибкой✅❌ висит«Partial» у Opus и GPT-5 — это не баги, а сознательные отказы реализовать какую-то ветку reshare («не умею, выхожу с ошибкой»); «partial»/«fail» у DeepSeek — реальные провалы. Соответствие ТЗ: GPT-5 единственный закрыл всёСамое тонкое место — это reshare, потому что у dkls23 за этим стоят пять разных переходов:(1,1) → (t,n) — key_import::ecdsa_secret_shares + key_refresh;(t,n) → (t,n) той же команды — обычный key_refresh;(t,n) → (t',n) тот же набор пиров, меняем порог — quorum_change;(t,n) → (t',n смешанный committee — quorum_change с overlap старого/нового;(t,n) → (1,1) — key_export с x25519-ключом. GPT-5 реализовал все пять переходов, и они работают сквозным сценарием (проверяли (2,3)→(3,4) и сборку обратно в singleton).

Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.

Opus 4.7 vs GPT-5 vs DeepSeek V4-Pro: три агента строят TSS-CLI на Rust

Технические детали

Related Prediction Markets

Related News