
GPU для инженерных задач: как я ускорял массовый расчёт траекторий с RTX 5090
gpugo_team 26 минут назад GPU для инженерных задач: как я ускорял массовый расчёт траекторий с RTX 5090 Средний 9 мин 825 Блог компании GPUGO Кейс Разбор на примере симуляции баллистических траекторий в Python через...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Значимый прорыв формирует отрасль ИИ: gpugo_team 26 минут назад GPU для инженерных задач: как я ускорял массовый расчёт траекторий с RTX 5090 Средний 9 мин 825 Блог компании GPUGO Кейс Разбор на примере симуляции баллистических траекторий в Python через NumPy и CuPyКоротко: я взял прикладную инженерную задачу — массовый расчёт 2D-траекторий с сопротивлением воздуха — и сравнил обычный NumPy-расчёт на CPU с вариантом на GPU через CuPy RawKernel. Главный результат: на арендованной RTX 5090 вариант CuPy RawKernel device-resident показал ускорение примерно в 3771 раз относительно NumPy CPU. Даже режим including transfer, где учитывается копирование данных между CPU и GPU, оказался быстрее CPU примерно в 1863 раза.
Отдельное внимание уделено тому, как расчёт был переписан под логику видеокарты и зачем использовать RawKernel. Я — часть команды GPUGO, занимаюсь продвижением сервиса. В этой статье на практическом примере разберу, как GPU может ускорять инженерные численные расчёты на примере с моделированием большого числа траекторий.
Технические детали
Для эксперимента я использовал арендованную на gpugo. ru RTX 5090 и сравнил обычный расчёт на CPU через NumPy с реализацией на GPU через CuPy RawKernel. Внутри — совсем немного математики, кода, практические замеры, сравнение реализаций с учётом передачи данных CPU-GPU и без.
Поскольку основная моя деятельность связана с решением и реализацией подобных задач численными методами, тема представленного материала — это область моего непосредственного интереса. Главная цель статьи — на наглядном примере показать, почему параллельные вычисления хорошо ложатся на видеокарту и в каких случаях это существенно сэкономит время получения решения и ускоряет расчеты в тысячи раз. СодержаниеGPU в прикладных расчётахПостановка задачиМатематическая модельКак я поднял среду на gpugo.
ruРеализация: от NumPy к CuPy RawKernelМетодика бенчмарка и счётчики времениСтруктура итогового ноутбукаКлючевые результатыГде лучше CPU, а где GPUВывод1. GPU в прикладных расчётахВ инженерных задачах часто встречается не один большой расчёт, а множество похожих независимых расчётов. Типичные примеры: метод Монте-Карло, перебор параметров, сеточные методы, массовое моделирование траекторий, оптимизация начальных условий.
Отраслевые последствия
Такая нагрузка хорошо ложится на личную или арендованную GPU, если выполняются три условия:Работы много: сотни тысяч или миллионы элементов. Данные можно держать в видеопамяти хотя бы на время серии вычислений. Если хотя бы одно из условий не выполняется, CPU может оказаться быстрее — особенно когда NumPy уже делает тяжёлую часть в оптимизированном C-коде.
Перенос вычислений на GPU требует подходящей формы задачи, а не только замены np на cp.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





