
ИИ-серверы Majestic Labs Prometheus: 128 ТБ памяти в одном устройстве, которое заменяет целую стойку
skovalev 42 минуты назад ИИ-серверы Majestic Labs Prometheus: 128 ТБ памяти в одном устройстве, которое заменяет целую стойку 3 мин 1.5K Блог компании Selectel Majestic Labs — небольшая команда, о которой мало кто...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. skovalev 42 минуты назад ИИ-серверы Majestic Labs Prometheus: 128 ТБ памяти в одном устройстве, которое заменяет целую стойку 3 мин 1. 5K Блог компании Selectel Majestic Labs — небольшая команда, о которой мало кто слышал до ноября прошлого года. В мае 2026 они анонсировали серверную ИИ-платформу Prometheus.
Задача, которую взялась решать компания, хорошо знакома всем, кто разворачивал инференс больших моделей. Вычислительные блоки простаивают, пока ждут данные из памяти. Чем крупнее модель, тем острее эта проблема — и тем сложнее и дороже обойти ее в «традиционных» GPU.
Технические детали
Что предлагает стартап и что это за устройство, которое согласно громкому заявлению заменяет целую стойку? АрхитектураВ основе серверов Prometheus — Ignite, собственные чипы AIU (AI Processing Unit, специализированный ускоритель для задач искусственного интеллекта). Гибридная конструкция с нетипичным сочетанием компонентов:CPU-ядра на архитектуре Arm,векторные и тензорные движки на базе RISC-V,единое адресное пространство памяти до 128 ТБ на весь сервер,поддержка фреймворков PyTorch, vLLM и OpenAI Triton без изменения кода.
Пункт про память — ключевой. Речь не о распределенной памяти с сетевым доступом через межсерверный интерконнект, а именно о едином пространстве, в котором работают все Ignite-чипы одновременно. Для масштаба: восемь B300 SXM в стандартной HGX-конфигурации от NVIDIA дают суммарно 2304 ГБ памяти типа HBM3e.
Prometheus предлагает примерно в 60 раз больше, но при этом компания пока не публикует цифры по пропускной способности. Это может оказаться неспроста: объем без скорости — даже не половина истории. Какой смысл в автобусе, который везет 1 000 пассажиров, но со скоростью 10 км/ч?
Отраслевые последствия
Архитектурно идея опирается на разделение вычислений и памяти в отдельные домены (disaggregation). Сама по себе концепция не новая: аналогичным образом устроен стандарт CXL (Compute Express Link — высокоскоростной интерфейс для связи процессора с памятью и ускорителями), который активно развивается на рынке. Однако, Majestic Labs заявляет, что у них это не надстройка над стандартным сервером, а нативная архитектура с нуля.
Новые GPU в облаке Selectel от 196,09 ₽/часВидеокарты для ресурсоемких задач — NVIDIA® H100, H200, RTX™ 6000 Pro. Подробнее →КонкурентыИсточник. Majestic Labs заходит на рынок, где уже есть несколько игроков с похожими амбициями.
Cerebras со своим WSE-3 (Wafer Scale Engine — ускоритель размером с целую кремниевую пластину) решает проблему памяти радикально: 900 000 ядер и 44 ГБ SRAM прямо на чипе, без каких-либо обращений во внешнюю память. Латентность минимальная, но объем все равно несопоставим с тем, что обещает Prometheus. SambaNova идет другим путем — архитектура RDU (Reconfigurable Dataflow Unit — реконфигурируемый ускоритель с потоковой обработкой данных) оптимизирована под конкретные модели и переносит часть работы с памятью на уровень компилятора.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





