
Пишу алгоритм FFT на Си для процессора Эльбрус
LeonidLagunov 4 минуты назад Пишу алгоритм FFT на Си для процессора Эльбрус Сложный 127 мин 82 Assembler * C * Программирование * Процессоры Математика * Примерно полгода назад я познакомился с VLIW‑процессором...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Значимый прорыв формирует отрасль ИИ: LeonidLagunov 4 минуты назад Пишу алгоритм FFT на Си для процессора Эльбрус Сложный 127 мин 82 Assembler * C * Программирование * Процессоры Математика * Примерно полгода назад я познакомился с VLIW‑процессором Эльбрус-8СВ. На тот момент у меня уже был опыт написания кода на ассемблере для VLIW‑процессора TMS320C66. Поэтому я захотел написать нечто похожее для Эльбруса.
А именно, реализовать алгоритм FFT на ассемблере. Но из‑за нехватки документации на инструкции процессора мне пришлось начать с реализации какого‑нибудь простого алгоритма на Си, чтобы изучать его ассемблерный вывод. По результатам той деятельности была написана предыдущая статья.
Технические детали
После написания той статьи я решил попробовать реализовать алгоритм FFT на Си для Эльбруса. Работа ещё не завершена, но определённые успехи уже есть (сравнение с EML присутствует). В этой статье я хочу поделиться полученными на данный момент результатами.
Содержание:Постановка задачиЧто такое FFTОсобенности реализации FFT на ЭльбрусеЗамечание про коэффициенты в функциях StageПишем функцию Reversereverse_radix21. reverse_radix2_etalon2. reverse_radix2_x2_bad4.
reverse_radix2_x2_good5. reverse_radix2_x2_best6. reverse_radix2_x4_oneTickVersion8.
Отраслевые последствия
reverse_radix2_x1610. reverse_radix2_x3211. reverse_radix2_x32x2Итоги по reverse_radix2reverse_radix41.
reverse_radix4_etalon2. reverse_radix4_oneTickVersion4. reverse_radix4_x4_bad5.
reverse_radix4_x4_good6. reverse_radix4_x4_best7. reverse_radix4_x16x29.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.




