欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

如何在GPU上加速數(shù)據(jù)科學(xué)

2021-02-13    分類: 網(wǎng)站建設(shè)

筆者按,數(shù)據(jù)科學(xué)家需要算力。無論您是用 pandas 處理一個大數(shù)據(jù)集,還是用 Numpy 在一個大矩陣上運行一些計算,您都需要一臺強大的機器,以便在合理的時間內(nèi)完成這項工作。

在過去的幾年中,數(shù)據(jù)科學(xué)家常用的 Python 庫已經(jīng)非常擅長利用 CPU 能力。

Pandas 的基礎(chǔ)代碼是用 C 語言編寫的,它可以很好地處理大小超過 100GB 的數(shù)據(jù)集。如果您沒有足夠的 RAM 來容納這樣的數(shù)據(jù)集,那么您可以使用分塊功能,它很方便,可以一次處理一個數(shù)據(jù)塊。

GPUs vs CPUs:并行處理

有了大量的數(shù)據(jù),CPU 就不會切斷它了。

一個超過 100GB 的數(shù)據(jù)集將有許多數(shù)據(jù)點,數(shù)據(jù)點的數(shù)值在數(shù)百萬甚至數(shù)十億的范圍內(nèi)。有了這么多的數(shù)據(jù)點要處理,不管你的 CPU 有多快,它都沒有足夠的內(nèi)核來進行有效的并行處理。如果你的 CPU 有 20 個內(nèi)核(這將是相當昂貴的 CPU),你一次只能處理 20 個數(shù)據(jù)點!

CPU 在時鐘頻率更重要的任務(wù)中會更好——或者根本沒有 GPU 實現(xiàn)。如果你嘗試執(zhí)行的流程有一個 GPU 實現(xiàn),且該任務(wù)可以從并行處理中受益,那么 GPU 將更加有效。

使用 Scikit-Learn 在 CPU 上運行 DBSCAN 的結(jié)果

GPU 上帶 Rapids 的 DBSCAN

現(xiàn)在,讓我們用 Rapids 進行加速!

首先,我們將把數(shù)據(jù)轉(zhuǎn)換為 pandas.DataFrame 并使用它創(chuàng)建一個 cudf.DataFrame。pandas.DataFrame 無縫轉(zhuǎn)換成 cudf.DataFrame,數(shù)據(jù)格式無任何更改。

  1. import pandas as pd  
  2. import cudf  
  3. X_df = pd.DataFrame({'fea%d'%i: X[:, i] for i in range(X.shape[1])})  
  4. X_gpu = cudf.DataFrame.from_pandas(X_df) 

然后我們將從 cuML 導(dǎo)入并初始化一個特殊版本的 DBSCAN,它是 GPU 加速的版本。DBSCAN 的 cuML 版本的函數(shù)格式與 Scikit-Learn 的函數(shù)格式完全相同:相同的參數(shù)、相同的樣式、相同的函數(shù)。

  1. from cuml import DBSCAN as cumlDBSCAN  
  2. db_gpu = cumlDBSCAN(eps=0.6, min_samples=2) 

最后,我們可以在測量運行時間的同時運行 GPU DBSCAN 的預(yù)測函數(shù)。

  1. %%time  
  2. y_db_gpu = db_gpu.fit_predict(X_gpu) 

GPU 版本的運行時間為 4.22 秒,幾乎加速了 2 倍。由于我們使用的是相同的算法,因此結(jié)果圖也與 CPU 版本完全相同。

如何在GPU上加速數(shù)據(jù)科學(xué)

使用 cuML 在 GPU 上運行 DBSCAN 的結(jié)果

使用 Rapids GPU 獲得超高速

我們從 Rapids 獲得的加速量取決于我們正在處理的數(shù)據(jù)量。一個好的經(jīng)驗法則是,較大的數(shù)據(jù)集將更加受益于 GPU 加速。在 CPU 和 GPU 之間傳輸數(shù)據(jù)有一些開銷時間——對于較大的數(shù)據(jù)集,開銷時間變得更「值得」。

我們可以用一個簡單的例子來說明這一點。

我們將創(chuàng)建一個隨機數(shù)的 Numpy 數(shù)組并對其應(yīng)用 DBSCAN。我們將比較常規(guī) CPU DBSCAN 和 cuML 的 GPU 版本的速度,同時增加和減少數(shù)據(jù)點的數(shù)量,以了解它如何影響我們的運行時間。

下面的代碼說明如何進行測試:

  1. import numpy as np  
  2.  
  3. n_rows, n_cols = 10000, 100  
  4. X = np.random.rand(n_rows, n_cols)  
  5. print(X.shape)  
  6.  
  7. X_df = pd.DataFrame({'fea%d'%i: X[:, i] for i in range(X.shape[1])})  
  8. X_gpu = cudf.DataFrame.from_pandas(X_df)  
  9.  
  10. db = DBSCAN(eps=3, min_samples=2)  
  11. db_gpu = cumlDBSCAN(eps=3, min_samples=2)  
  12.  
  13. %%time  
  14. y_db = db.fit_predict(X) 
  15.  
  16. %%time  
  17. y_db_gpu = db_gpu.fit_predict(X_gpu) 

檢查下面的 Matplotlib 結(jié)果圖:

如何在GPU上加速數(shù)據(jù)科學(xué)

當使用 GPU 而不是 CPU 時,數(shù)量會急劇增加。即使在 10000 點(最左邊),我們的速度仍然是 4.54x。在更高的一端,1 千萬點,我們切換到 GPU 時的速度是 88.04x!

網(wǎng)站標題:如何在GPU上加速數(shù)據(jù)科學(xué)
標題路徑:http://chinadenli.net/news/100796.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名品牌網(wǎng)站制作、外貿(mào)建站網(wǎng)站維護、商城網(wǎng)站微信公眾號

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司
在线观看国产午夜福利| 日本欧美视频在线观看免费| 欧美野外在线刺激在线观看| 久久国产人妻一区二区免费| 91人妻人人澡人人人人精品| 国产在线成人免费高清观看av| 白丝美女被插入视频在线观看| 大香蕉伊人精品在线观看| 日本人妻的诱惑在线观看| 日韩精品亚洲精品国产精品| 中国一区二区三区人妻| 日本道播放一区二区三区| 国产成人午夜在线视频| 99免费人成看国产片| 久久99一本色道亚洲精品| 久久精品欧美一区二区三不卡| 成人亚洲国产精品一区不卡 | 东京热男人的天堂一二三区| 欧美国产亚洲一区二区三区| 国产精品视频一级香蕉| 免费国产成人性生活生活片| 我要看日本黄色小视频| 国产精品久久三级精品| 亚洲高清中文字幕一区二三区| 国产精品一区二区传媒蜜臀| 中文字幕有码视频熟女| 亚洲品质一区二区三区| 日韩av欧美中文字幕| 国产精品二区三区免费播放心| 黑丝国产精品一区二区| 99久久无色码中文字幕免费| 中文字幕日韩无套内射| 女人高潮被爽到呻吟在线观看| 国产户外勾引精品露出一区| 久久夜色精品国产高清不卡| 正在播放国产又粗又长| 搡老妇女老熟女一区二区| av中文字幕一区二区三区在线 | 亚洲综合精品天堂夜夜| av国产熟妇露脸在线观看| 黄片在线免费观看全集|