關(guān)鍵詞:armv8 fft算法 fftw armpl simd優(yōu)化
摘要:FFT(快速傅里葉變換)是用于計算離散傅里葉變換(DFT)或其逆運算的快速算法,它廣泛應用于工程、科學和數(shù)學計算.到目前為止,鮮有基于ARM平臺的高性能FFT算法的實現(xiàn)和優(yōu)化,然而,隨著ARMv8處理器應用的日益廣泛,研究FFT算法在ARM平臺上高性能實現(xiàn)日益重要.該文在ARMv8平臺上實現(xiàn)和優(yōu)化了一個高性能的多維FFT算法庫:PerfFFT,通過FFT蝶形網(wǎng)絡優(yōu)化、蝶形計算優(yōu)化、蝶形自動生成、SIMD優(yōu)化、內(nèi)存對齊、cache-aware的分塊算法和高效轉(zhuǎn)置等優(yōu)化方法的應用,顯著提升了FFT算法的性能.實驗結(jié)果表明,PerfFFT相比目前應用最為廣泛的開源FFT庫FFTW實現(xiàn)了10%~591%的性能提升,而相比ARM高性能商業(yè)庫ARM Performance Library實現(xiàn)了13%~44%的性能提升.
計算機學報雜志要求:
1.來稿要求論點明確,數(shù)據(jù),條理清晰,文字精練,字跡清楚.
2.為了使審理過程順利進行,在投稿的同時,作者需附一份關(guān)于文章所述工作的背景。將研究背景同文章放在同一個文件中,另起一頁。并且需向編輯部聲明:稿件內(nèi)容屬于作者的科研成果;署名無爭議;引用他人成果已注明出處;未公開發(fā)表過.
3.稿件首頁包括下列內(nèi)容:題目、真實姓名、詳細工作單位、城市及郵政編碼、200字的中文摘要和3-5條關(guān)鍵詞.文末附上稿件的英文文摘,包括英文題目、漢語拼音的姓名、工作單位的英文譯名、200個單詞以上的英文摘要和3-5條與中文關(guān)鍵詞對應的英文關(guān)鍵詞.請將作者的Email、聯(lián)系地址、電話放在文章的首頁下方。
4.來稿必須做到清稿定稿.稿件中的外文字母必須分清大、小寫,正、斜體;上、下角的字母、數(shù)碼和符號,其位置高低應區(qū)別明顯;符號及時次出現(xiàn)時需要進行說明。
5.文中的計量單位一律使用《中華人民共和國法定計量單位》.文中圖表只附必要的,插圖要精繪,圖中文字書寫清楚.插圖和照片不得用復印件,必須是清繪圖和原照片.圖、表應貼在正文中的相應位置上.圖、表和公式分別用阿拉伯數(shù)字全文統(tǒng)一編號.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社