久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      基于ARMv8平臺的多維FFT實現(xiàn)與優(yōu)化研究

      陳暾; 李志豪; 賈海鵬; 張云泉 中國科學院計算技術(shù)研究所計算機體系結(jié)構(gòu)國家重點實驗室; 北京100190; 中國科學院大學; 北京100190

      關(guān)鍵詞:armv8 fft算法 fftw armpl simd優(yōu)化 

      摘要:FFT(快速傅里葉變換)是用于計算離散傅里葉變換(DFT)或其逆運算的快速算法,它廣泛應用于工程、科學和數(shù)學計算.到目前為止,鮮有基于ARM平臺的高性能FFT算法的實現(xiàn)和優(yōu)化,然而,隨著ARMv8處理器應用的日益廣泛,研究FFT算法在ARM平臺上高性能實現(xiàn)日益重要.該文在ARMv8平臺上實現(xiàn)和優(yōu)化了一個高性能的多維FFT算法庫:PerfFFT,通過FFT蝶形網(wǎng)絡優(yōu)化、蝶形計算優(yōu)化、蝶形自動生成、SIMD優(yōu)化、內(nèi)存對齊、cache-aware的分塊算法和高效轉(zhuǎn)置等優(yōu)化方法的應用,顯著提升了FFT算法的性能.實驗結(jié)果表明,PerfFFT相比目前應用最為廣泛的開源FFT庫FFTW實現(xiàn)了10%~591%的性能提升,而相比ARM高性能商業(yè)庫ARM Performance Library實現(xiàn)了13%~44%的性能提升.

      計算機學報雜志要求:

      1.來稿要求論點明確,數(shù)據(jù),條理清晰,文字精練,字跡清楚.

      2.為了使審理過程順利進行,在投稿的同時,作者需附一份關(guān)于文章所述工作的背景。將研究背景同文章放在同一個文件中,另起一頁。并且需向編輯部聲明:稿件內(nèi)容屬于作者的科研成果;署名無爭議;引用他人成果已注明出處;未公開發(fā)表過.

      3.稿件首頁包括下列內(nèi)容:題目、真實姓名、詳細工作單位、城市及郵政編碼、200字的中文摘要和3-5條關(guān)鍵詞.文末附上稿件的英文文摘,包括英文題目、漢語拼音的姓名、工作單位的英文譯名、200個單詞以上的英文摘要和3-5條與中文關(guān)鍵詞對應的英文關(guān)鍵詞.請將作者的Email、聯(lián)系地址、電話放在文章的首頁下方。

      4.來稿必須做到清稿定稿.稿件中的外文字母必須分清大、小寫,正、斜體;上、下角的字母、數(shù)碼和符號,其位置高低應區(qū)別明顯;符號及時次出現(xiàn)時需要進行說明。

      5.文中的計量單位一律使用《中華人民共和國法定計量單位》.文中圖表只附必要的,插圖要精繪,圖中文字書寫清楚.插圖和照片不得用復印件,必須是清繪圖和原照片.圖、表應貼在正文中的相應位置上.圖、表和公式分別用阿拉伯數(shù)字全文統(tǒng)一編號.

      注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

      計算機學報

      北大期刊
      1-3個月下單

      關(guān)注 9人評論|1人關(guān)注
      相關(guān)期刊
      服務與支付