前沿

? 人工智能運(yùn)算分析依賴CPU和顯卡的運(yùn)算能力 。查詢CPU支持的指令集,當(dāng)前加速會用到AVX2指令集,如何查詢是否支持
工具下載
https://www.cpuid.com/softwares/cpu-z.html
AMD Ryzen Threadripper 3000 preliminary support
Intel Ice-Lake preliminary support
NVIDIA RTX 2070 and 2080 Super
下載ZIP.CHINESE
https://www.cpuid.com/downloads/cpu-z/cpu-z_1.90-cn.zip
Linux的查詢指令cat /proc/cpuinfo?
知識儲備
AVX2指令集:AVX指令集的加強(qiáng)版
對于指令集和AVX指令集不了解的朋友可以先看看《AVX是什么?AVX指令集技術(shù)與應(yīng)用解析》。當(dāng)年AVX在SSE4指令集的基礎(chǔ)上加入了256位矢量寬度、增強(qiáng)的數(shù)據(jù)排序、3/4個操作數(shù)、不對齊內(nèi)存存取以及VEX編碼方式,最直接的收益就是浮點性能大提升了2倍。
AVX2的新內(nèi)容
在2011年發(fā)布的AVX2則在此基礎(chǔ)上加入了以下新內(nèi)容:
-整數(shù)SIMD指令擴(kuò)展至256位
-2個新FMA(融合乘加,即±(a×b)±c)單元及浮點FMA指令
-離散數(shù)據(jù)加載指令“gather”、新的位移和廣播指令
理論性能:整數(shù)和浮點性能翻倍
其中最為重要的是對256位的整數(shù)SIMD的支持,并新增60條256位浮點SIMD指令,完善從AVX開始的256位擴(kuò)展,理論上可再次提升整數(shù)和浮點運(yùn)算速度。
新FMA單元和指令帶來更強(qiáng)的性能
FMA則關(guān)系到浮點運(yùn)算能力。Haswell架構(gòu)中擁有2個新的FMA單元(Intel的FMA3指令),每個FMA單元支持8個單精度或4個雙精度浮點數(shù),每周期單/雙精度FLOPs都要比AVX高1倍。
FMA擁有20種指令形式,與3種操作數(shù)次序組合,形成60種新指令,為選擇內(nèi)存操作數(shù)或目的操作數(shù)提供了極大的靈活性。另外融合乘加還會自動選擇多項式的計算過程,降低了延遲。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
本文題目:IntelCPU指令集以及運(yùn)算加速-創(chuàng)新互聯(lián)
瀏覽路徑:http://chinadenli.net/article14/iijde.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)、用戶體驗、網(wǎng)站改版、手機(jī)網(wǎng)站建設(shè)、搜索引擎優(yōu)化、小程序開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容