
DSpark на двух DGX Spark: порт, баг на одну строку и бенчмарки, которые пришлось мерить заново
AGmind 9 минут назад DSpark на двух DGX Spark: порт, баг на одну строку и бенчмарки, которые пришлось мерить заново Средний 20 мин 88 Open source * Искусственный интеллект Машинное обучение * DeepSeek выпустил DSpark —...
<5 — 2026'da uzaya kaç SpaceX Starship fırlatması ulaşacak?
В сфере искусственного интеллекта произошло заметное событие. AGmind 9 минут назад DSpark на двух DGX Spark: порт, баг на одну строку и бенчмарки, которые пришлось мерить заново Средний 20 мин 88 Open source * Искусственный интеллект Машинное обучение * DeepSeek выпустил DSpark — спекулятивный декодер для V4. В окне 27–30 июня 2026 рабочего публичного пути для GB10 не было — мы портировали его сами, нашли унаследованный баг, убивавший качество драфта, и сняли профиль своего стенда. Потом комьюнити выложило рецепт вдвое быстрее нашего.
Мы его воспроизвели — и вместо гонки за цифрой сняли данные, которых в паблике не нашли: кривую деградации до реального 1M, механизм выигрыша NVFP4 и петли когерентности на глубине. Плюс три негативных результата. DSpark — спекулятивный модуль DeepSeek поверх чекпойнта V4 — работает на 2× DGX Spark (GB10, SM121, TP=2 через QSFP 200G / RoCEv2) как новый метод dspark в нашем форке поверх community‑форка jasl.
Технические детали
Порт независимый: в окне 27–30 июня 2026 в доступном нам публичном vLLM‑пути для GB10/SM121 method=dspark не был рабочей опцией — запуск не проходил дальше конфиг‑валидации. Главный багфикс — одна строка: унаследованный кернел сэмплил драфт из noise‑слота вместо bonus‑слота. Сдвиг индекса сэмплинга на один слот поднял acceptance позиции 0 с 0.
74, среднюю принятую длину с 1. 5, throughput с 26 до 36 tok/s. Single‑stream на fp8: 26.
7 tok/s без спекуляции → 32. 4 tok/s с DSpark = +21–24%. Это не опровержение цифр DeepSeek: их headline (+60–85% per‑user speedup и кратно большие aggregate‑выигрыши в SLA‑режимах) снят над baseline MTP-1 и на другом железе — мы сравниваем другую метрику с другим baseline.
Отраслевые последствия
Разбор по четырём слагаемым внутри. Фактический выигрыш DSpark на GB10 — конкурентность: ~99 tok/s агрегата на 8 потоках (против ~64 у прежнего MTP-2 прода, +55%), 141–146 tok/s на 12 потоках. Комьюнити: tonyd2wild выложил NVFP4-KV рецепт с заявкой 67 tok/s single‑stream против наших 32.
Мы воспроизвели: single 55–63, C16-static 324 против его 315. 1 — ничья в пределах разброса. Механизм NVFP4: в no‑spec контроле 4-битный KV не ускорил голый forward (26.
7 tok/s у fp8) — single‑stream выигрыш рецепта пришёл через acceptance 3–4 против ~2. Глубина и когерентность: кривая деградации до реального 1M: 42. 03M (после 512K — полка, не обвал); на глубине ≥256K билд иногда уходит в петли (а на 1M оба прогона связные — лотерея, не стена), и acceptance в петле завышается.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.




