
Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8.0
skovalev 16 минут назад Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8.0 Простой 7 мин 471 Блог компании Selectel IT-компании IT-инфраструктура * Компьютерное железо Дайджест На связи Сергей Ковалёв из...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Значимый прорыв формирует отрасль ИИ: skovalev 16 минут назад Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8. 0 Простой 7 мин 471 Блог компании Selectel IT-компании IT-инфраструктура * Компьютерное железо Дайджест На связи Сергей Ковалёв из Selectel с традиционным ежемесячным дайджестом железа. Сегодня я пробую новый формат: по ходу месяца мы с коллегами публикуем новости железных новинок, и я собрал их с краткими аннотациями в первой части статьи.
Если вы уже читали наши новости, смело переходите ко второй части — в ней собрал то, до чего не дошли наши писательские руки. Подробности под катом. О чем писал Selectel в маеAMD Instinct MI430XAMD анонсировала MI430X — HPC-ускоритель с 432 ГБ HBM4, пропускной способностью 19,6 ТБ/с и нативным FP64 свыше 200 TFLOPs.
Технические детали
Это не развитие серии MI350X, а другой класс железа для научных расчетов, где FP32 просто не подходит. Задачи для GPU: CFD (гидродинамика), молекулярная динамика, ядерные расчеты. NVIDIA предлагает эмуляцию FP64 через тензорные ядра, но для ряда реальных задач высокопроизводительных вычислений это дает лишь 33 TFLOPs против честных 200 у AMD.
Подробности в статье. AMD Instinct MI350PAMD выпустила первую с 2022 года PCIe-карту серии Instinct™ MI350P с 144 ГБ HBM3E. Архитектура CDNA™ 4 в стандартном двухслотовом форм-факторе с TDP 600 Вт.
По сути, это половина MI350X: четыре XCD-кристалла вместо восьми, пропускная способность памяти — 4 ТБ/с. Прямой соперник H200 NVL, только без NVLink®, то есть объединить карты в пул не получится. Полная заметка здесь.
Отраслевые последствия
NVIDIA HGX B300: тест на инференсеНе про новое железо, но нельзя пройти мимо в майском дайджесте. Взяли HGXTM B300 с 2,3 ТБ VRAM и прогнали на нем DeepSeek R1/V3. NVFP4 дает двух-трехкратный прирост на prefill по сравнению с FP8 — это реально ощутимо.
На decode разница скромнее и пока до конца не объяснена, но Qwen 3. 5 в NVFP4 вытягивает 330 тысяч ответов в сутки при decode-окне в 1000 токенов. Читайте, это интересно!
Alibaba Zhenwu M890Alibaba представила GPU Zhenwu™ M890 с 144 ГБ HBM, межчиповым интерконнектом 800 ГБ/с и поддержкой FP4 для инференса. На его базе собрали суперсервер Panjiu® AL128 — это стойка из 128 ускорителей с задержкой между GPU менее 150 наносекунд. По памяти паритет с H200, по масштабированию кластеров — тоже, но главное здесь не характеристики, а стек и предпочтения рынков.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





