關鍵詞:armv8 fft算法 fftw armpl simd優化
摘要:FFT(快速傅里葉變換)是用于計算離散傅里葉變換(DFT)或其逆運算的快速算法,它廣泛應用于工程、科學和數學計算.到目前為止,鮮有基于ARM平臺的高性能FFT算法的實現和優化,然而,隨著ARMv8處理器應用的日益廣泛,研究FFT算法在ARM平臺上高性能實現日益重要.該文在ARMv8平臺上實現和優化了一個高性能的多維FFT算法庫:PerfFFT,通過FFT蝶形網絡優化、蝶形計算優化、蝶形自動生成、SIMD優化、內存對齊、cache-aware的分塊算法和高效轉置等優化方法的應用,顯著提升了FFT算法的性能.實驗結果表明,PerfFFT相比目前應用最為廣泛的開源FFT庫FFTW實現了10%~591%的性能提升,而相比ARM高性能商業庫ARM Performance Library實現了13%~44%的性能提升.
計算機學報雜志要求:
1.來稿要求論點明確,數據,條理清晰,文字精練,字跡清楚.
2.為了使審理過程順利進行,在投稿的同時,作者需附一份關于文章所述工作的背景。將研究背景同文章放在同一個文件中,另起一頁。并且需向編輯部聲明:稿件內容屬于作者的科研成果;署名無爭議;引用他人成果已注明出處;未公開發表過.
3.稿件首頁包括下列內容:題目、真實姓名、詳細工作單位、城市及郵政編碼、200字的中文摘要和3-5條關鍵詞.文末附上稿件的英文文摘,包括英文題目、漢語拼音的姓名、工作單位的英文譯名、200個單詞以上的英文摘要和3-5條與中文關鍵詞對應的英文關鍵詞.請將作者的Email、聯系地址、電話放在文章的首頁下方。
4.來稿必須做到清稿定稿.稿件中的外文字母必須分清大、小寫,正、斜體;上、下角的字母、數碼和符號,其位置高低應區別明顯;符號及時次出現時需要進行說明。
5.文中的計量單位一律使用《中華人民共和國法定計量單位》.文中圖表只附必要的,插圖要精繪,圖中文字書寫清楚.插圖和照片不得用復印件,必須是清繪圖和原照片.圖、表應貼在正文中的相應位置上.圖、表和公式分別用阿拉伯數字全文統一編號.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社