
Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X
skovalev 4 часа назад Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X 5 мин 674 Блог компании Selectel Серверная оптимизация * Машинное обучение * Видеокарты Облачные вычисления * Мнение Официальный...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. skovalev 4 часа назад Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X 5 мин 674 Блог компании Selectel Серверная оптимизация * Машинное обучение * Видеокарты Облачные вычисления * Мнение Официальный рендер HPC-ускорителя AMD Instinct MI430X. На майском HPC User Forum в Остине AMD рассказали о MI430X — ускорителе серии MI400, который позиционируется как инструмент для научных вычислений.
Пока индустрия увлечена инференсом и считает токены в секунду на FP4, AMD напомнила, что CFD-код (Computational Fluid Dynamics) не интересует, насколько быстро чип умножает восьмибитные числа. Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в SelectelХ. В этой статье мы мысленно «разберем» MI430X и обсудим, насколько новинка подходит для «ядерных расчетов» и машинного обучения.
Технические детали
Подробности под катом! Технические характеристикиMI430X — прямой наследник MI300A. Это GPU на следующем поколении CDNA (предположительно, CDNA 5) с 432 ГБ памяти HBM4 и пропускной способностью 19,6 ТБ/c.
Архитектура: CDNA 5 — следующее поколение после CDNA 4 в MI350-серии. Пропускная способность памяти: 19,6 ТБ/с. FP64 (нативный, вектор): более 200 TFLOPs.
Интерконнект: Infinity Fabric пятого поколения + UALink — первые ускорители в семействе AMD MI430X, MI440X и MI455X с поддержкой обоих стандартов одновременно. Целевые задачи: HPC + AI (двойная специализация). Ключевой показатель — более 200 TFLOPs нативной FP64-производительности в векторном режиме.
Отраслевые последствия
Без звездочек и мелкого шрифта. Да, MI430X вместе с MI440X и MI455X стал первым ускорителем, поддерживающим Infinity Fabric в связке с UALink — открытым стандартом scale-up (соединение GPU друг с другом внутри одного узла или стойки), альтернативой закрытому NVLink. Сравнение с другими GPUСерверный узел на базе ускорителей AMD Instinct MI430X.
ПараметрAMD Instinct MI300XAMD Instinct MI350XAMD Instinct MI430XNVIDIARubin (R200)АрхитектураCDNA 3CDNA 4CDNA 5RubinПамять192 ГБ HBM3288 ГБ HBM3E432 ГБ HBM4288 ГБ HBM4Пропускная способность5,3 ТБ/с8 ТБ/с19,6 ТБ/с22 ТБ/сFP64 нативный~48 TFLOPs~79 TFLOPs>200 TFLOPs33 TFLOPsИнтерконнектInfinity Fabric 4Infinity Fabric 4Infinity Fabric + UALinkNVLink 6Целевые задачиAI / HPCAI / LLMHPC + AIAI / АгентныйВ сравнении с MI350X: 288 ГБ HBM3E и 8 ТБ/с. MI430X добавляет сверху 50%, а пропускная способность вырастает в 2,4 раза. Это не эволюция для инференса, это другой класс устройства с другой целевой функцией.
MI350X и ее ближайший родственник MI355X с жидкостным охлаждением построены на архитектура CDNA 4 — 3-нм техпроцессе. Обе карты сделаны под AI: MI355X поддерживает MXFP6 и MXFP4, FP8, и выдает до 20 PFLOPs в низкоточных форматах. Для LLM-инференса — отлично, а вот для расчета горения в двигателе – не то железо.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





