通信世界網(wǎng)消息(CWW)十年前,AWS(Amazon Web Services)發(fā)布了首個(gè)采用NVIDIA M2050 GPU的實(shí)例。當(dāng)時(shí),基于CUDA的應(yīng)用主要專(zhuān)注于加速科學(xué)模擬,AI和深度學(xué)習(xí)還遙遙無(wú)期。
自那時(shí)起,AWS就不斷擴(kuò)充云端GPU實(shí)例陣容,包括K80(p2)、K520(g3)、M60(g4)、V100(p3 / p3dn)和T4(g4)。
現(xiàn)在,已全面上市的全新AWS P4d實(shí)例采用最新NVIDIA A100 Tensor Core GPU,開(kāi)啟了加速計(jì)算的下一個(gè)十年。
全新的P4d實(shí)例,為機(jī)器學(xué)習(xí)訓(xùn)練和高性能計(jì)算應(yīng)用提供AWS上性能與成本效益高的GPU平臺(tái)。與默認(rèn)的FP32精度相比,全新實(shí)例將FP16機(jī)器學(xué)習(xí)模型的訓(xùn)練時(shí)間減少多達(dá)3倍,將TF32機(jī)器學(xué)習(xí)模型的訓(xùn)練的時(shí)間減少多達(dá)6倍。
這些實(shí)例還提供出色的推理性能。NVIDIA A100 GPU在最近的MLPerf Inference基準(zhǔn)測(cè)試中一騎絕塵,實(shí)現(xiàn)了比CPU快237倍的性能。
每個(gè)P4d實(shí)例均內(nèi)置八個(gè)NVIDIA A100 GPU,通過(guò)AWS UltraClusters,客戶可以利用AWS的Elastic Fabric Adapter(EFA)和Amazon FSx提供的可擴(kuò)展高性能存儲(chǔ),按需、可擴(kuò)展地同時(shí)訪問(wèn)多達(dá)4,000多個(gè)GPU。P4d提供400Gbps網(wǎng)絡(luò),通過(guò)使用NVLink、NVSwitch、NCCL和GPUDirect RDMA等NVIDIA技術(shù),進(jìn)一步加速深度學(xué)習(xí)訓(xùn)練的工作負(fù)載。EFA上的NVIDIA GPUDirect RDMA在服務(wù)器之間可通過(guò)GPU傳輸數(shù)據(jù),無(wú)需通過(guò)CPU和系統(tǒng)內(nèi)存,從而確保網(wǎng)絡(luò)的低延遲。
此外,許多AWS服務(wù)都支持P4d實(shí)例,包括Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster和Amazon SageMaker。P4d還可使用所有NGC提供的經(jīng)過(guò)優(yōu)化的容器化軟件,包括HPC應(yīng)用、AI框架、預(yù)訓(xùn)練模型、Helm圖表以及TensorRT和Triton Inference Server等推理軟件。
目前,P4d實(shí)例已在美國(guó)東部和西部上市,并將很快擴(kuò)展到其他地區(qū)。用戶可以通過(guò)按需實(shí)例(On-Demand)、Savings Plans、預(yù)留實(shí)例(Reserved Instances)或競(jìng)價(jià)型實(shí)例(Spot Instances)幾種不同的方式進(jìn)行購(gòu)買(mǎi)。
GPU云計(jì)算發(fā)展最初的十年,已為市場(chǎng)帶來(lái)超過(guò)100 exaflops的AI計(jì)算。隨著基于NVIDIA A100 GPU的Amazon EC2 P4d實(shí)例的問(wèn)世,GPU云計(jì)算的下一個(gè)十年將迎來(lái)一個(gè)美好的開(kāi)端。
NVIDIA和AWS不斷幫助各種應(yīng)用突破AI的界限,以便了解客戶將如何運(yùn)用AI強(qiáng)大的性能。
新聞標(biāo)題:NVIDIAA100登陸AWS,開(kāi)啟加速云計(jì)算的下一個(gè)十年
文章路徑:http://chinadenli.net/article0/chdpio.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、微信小程序、靜態(tài)網(wǎng)站、網(wǎng)站設(shè)計(jì)、服務(wù)器托管、網(wǎng)站收錄
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)