欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

5個(gè)實(shí)用的Pandas技巧分別是哪些

本篇文章給大家分享的是有關(guān)5個(gè)實(shí)用的Pandas技巧分別是哪些,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)服務(wù)團(tuán)隊(duì)是一支充滿著熱情的團(tuán)隊(duì),執(zhí)著、敏銳、追求更好,是創(chuàng)新互聯(lián)的標(biāo)準(zhǔn)與要求,同時(shí)竭誠(chéng)為客戶提供服務(wù)是我們的理念。成都創(chuàng)新互聯(lián)把每個(gè)網(wǎng)站當(dāng)做一個(gè)產(chǎn)品來開發(fā),精雕細(xì)琢,追求一名工匠心中的細(xì)致,我們更用心!

作者|RAM DEWANI 編譯|VK 來源|Analytics Vidhya

介紹

效率已成為及時(shí)完成工作的關(guān)鍵因素。一個(gè)人不應(yīng)該花超過合理的時(shí)間去完成事情。尤其是當(dāng)任務(wù)涉及基本編碼時(shí)。使用Pandas庫(kù)能節(jié)省你的時(shí)間。

5個(gè)實(shí)用的Pandas技巧分別是哪些

Pandas是一個(gè)開源包。它有助于用Python語言執(zhí)行數(shù)據(jù)分析和數(shù)據(jù)操作。此外,它還為我們提供了靈活的數(shù)據(jù)結(jié)構(gòu)。

目錄

  • Pandas技巧1–行的條件選擇

  • Pandas技巧2–數(shù)據(jù)的存儲(chǔ)

  • Pandas技巧3–分組數(shù)據(jù)

  • Pandas技巧4–Pandas map

  • Pandas技巧5–Pandas DataFrame的條件格式化

Pandas技巧1–行的條件選擇

首先,數(shù)據(jù)探索是必要步驟。Pandas為進(jìn)行各種分析提供了一種快速簡(jiǎn)便的方法。其中一個(gè)非常重要的技巧是根據(jù)條件選擇行或過濾數(shù)據(jù)。

行的條件選擇可以基于由邏輯運(yùn)算符分隔的單個(gè)語句中的單個(gè)條件或多個(gè)條件。

例如,我使用一個(gè)關(guān)于貸款預(yù)測(cè)的數(shù)據(jù)集。

我們將挑選一排還沒有畢業(yè)、收入低于5400英鎊的客戶。讓我們看看我們?cè)撛趺醋觥?/p>

視頻:https://youtu.be/hc4or_RF5M8

import pandas as pd
data = pd.read_csv('../Data/loan_train.csv')
data.head()
data2 = data.loc[(data['Education'] == 'Not Graduate') & (data['ApplicantIncome'] <= 5400)]
data2

注意:記住把每個(gè)條件放在括號(hào)內(nèi)。

Pandas技巧2–數(shù)據(jù)的存儲(chǔ)

數(shù)據(jù)可以有兩種類型-連續(xù)的和離散的,這取決于我們的分析要求。有時(shí)我們不需要連續(xù)變量中的精確值,但需要它所屬的群體。

例如,你的數(shù)據(jù)中有一個(gè)連續(xù)變量,年齡。但你需要一個(gè)年齡組來進(jìn)行分析,比如兒童、青少年、成人、老年人。實(shí)際上,Binning非常適合解決我們這里的問題。

為了執(zhí)行Binning,我們使用cut()函數(shù)。這對(duì)于從連續(xù)變量到離散變量非常有用。

視頻:https://youtu.be/WQagYXIFjns

import pandas as pd

df = pd.read_csv('titanic.csv')
from sklearn.utils import shuffle

# 隨機(jī)化
df = shuffle(df, random_state = 42)

df.head()

bins = [0,4,17,65,99]
labels =['Toddler','Child','Adult','Elderly']

category = pd.cut(df['Age'], bins = bins, labels = labels)

df.insert(2, 'Age Group', category)

df.head()

df['Age Group'].value_counts()

df.isnull().sum()

代碼:https://github.com/kunalj101/Data-Science-Hacks/blob/master/Code/binning_data.ipynb

Pandas技巧3–分組數(shù)據(jù)

這種操作在數(shù)據(jù)科學(xué)家和分析師的日常生活中經(jīng)常執(zhí)行。Pandas提供了一個(gè)基本的函數(shù)來執(zhí)行數(shù)據(jù)分組,即Groupby。

Groupby操作包括根據(jù)特定條件拆分對(duì)象,應(yīng)用函數(shù),然后組合結(jié)果。

讓我們?cè)倏匆淮钨J款預(yù)測(cè)數(shù)據(jù)集,假設(shè)我想看看給來自不同財(cái)產(chǎn)領(lǐng)域的人的平均貸款額,比如農(nóng)村、半城市和城市?;c(diǎn)時(shí)間來理解這個(gè)問題陳述并思考如何解決它。

嗯,Pandas的groupby可以非常有效地解決這個(gè)問題。首先根據(jù)屬性區(qū)域劃分?jǐn)?shù)據(jù)。其次,我們將mean()函數(shù)應(yīng)用于每個(gè)類別。最后,我們將它們組合在一起,并將其打印為新的數(shù)據(jù)幀。

視頻:https://youtu.be/fK-6ZlPvZYU

#導(dǎo)入數(shù)據(jù)集
import pandas as pd

df = pd.read_csv('../Data/loan_train.csv')
df.head()

# 男女平均收入
df.groupby(['Gender'])[['ApplicantIncome']].mean()

# 平均貸款金額不同的財(cái)產(chǎn)地區(qū),如城市,農(nóng)村
df.groupby(['Property_Area'])[['LoanAmount']].mean()

# 比較不同教育背景的貸款狀況
df.groupby(['Education'])[['Loan_Status']].count()

代碼:https://github.com/kunalj101/Data-Science-Hacks/blob/master/Code/groupby_in_pandas.ipynb

Pandas技巧4–Pandas map

map是另一個(gè)提供高度靈活性和實(shí)際應(yīng)用的重要操作。

Pandas map()用于根據(jù)輸入對(duì)應(yīng)關(guān)系將序列中的每個(gè)值映射到其他值。實(shí)際上,這個(gè)輸入可以是一個(gè)序列、字典,甚至是一個(gè)函數(shù)。

讓我們舉一個(gè)有趣的例子。我們有一個(gè)虛擬的雇員數(shù)據(jù)集。此數(shù)據(jù)集由以下列組成–姓名、年齡、職業(yè)、城市。

現(xiàn)在需要添加另一列,說明相應(yīng)的狀態(tài)。你會(huì)怎么做?如果數(shù)據(jù)集的范圍是10行,你可以手動(dòng)執(zhí)行,但是如果有數(shù)千行呢?使用Pandas map會(huì)更有利。

視頻:https://youtu.be/XkwQOy5RZWY

#樣本數(shù)據(jù)
data = {'name': ['A', 'B', 'C', 'D', 'E'], 
        'age': [22, 26, 33, 44, 50],
        'profession' : ['data engineer', 'data scientist', 'entrepreneur', 'business analyst', 'self-employed'], 
        'city': ['Gurgaon', 'Bangalore', 'Gurgaon', 'Pune', 'New Delhi']}

df = pd.DataFrame(data)
df

# 城市與州
map_city_to_states = { 'Gurgaon' : 'Haryana', 
                  'Bangalore' : 'Karnataka', 
                  'Pune' : 'Maharashtra', 
                  'New Delhi' : 'Delhi'}

# 將城市列映射為州
df['state'] = df['city'].map(map_city_to_states)
df

代碼:https://github.com/kunalj101/Data-Science-Hacks/blob/master/Code/map%20python.ipynb

Pandas技巧5–Pandas DataFrame的條件格式化

這是我最喜歡的Pandas技巧之一。這個(gè)技巧讓我有能力直觀地定位特定條件下的數(shù)據(jù)。

可以使用Pandas的style屬性將條件格式應(yīng)用于數(shù)據(jù)框。事實(shí)上,條件格式是根據(jù)某種條件對(duì)數(shù)據(jù)幀應(yīng)用視覺樣式的操作。

雖然Pandas提供了大量的操作,但我將在這里向你展示一個(gè)簡(jiǎn)單的操作。例如,我們有對(duì)應(yīng)于每個(gè)銷售人員的銷售數(shù)據(jù)。我想查看的是銷售價(jià)值高于80的。

import pandas as pd

data = pd.read_excel("../Data/salesman_performance.xlsx")
data

data.style

def highlight_green(sales):
    color = 'green' if sales > 80 else 'black'
    return 'color: %s' % color

formatting = data.iloc[:,1:6].style.applymap(highlight_green)
formatting

代碼:https://github.com/kunalj101/Data-Science-Hacks/blob/master/Code/Pandas_conditional_formatting.ipynb

在這篇文章中,我們總結(jié)了Pandas的5個(gè)技巧。

以上就是5個(gè)實(shí)用的Pandas技巧分別是哪些,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

本文標(biāo)題:5個(gè)實(shí)用的Pandas技巧分別是哪些
文章分享:http://chinadenli.net/article26/ppdpjg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開發(fā)網(wǎng)站導(dǎo)航、虛擬主機(jī)靜態(tài)網(wǎng)站、App設(shè)計(jì)定制網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網(wǎng)站優(yōu)化
欧美特色特黄一级大黄片| 国产成人综合亚洲欧美日韩| 中国一区二区三区不卡| 视频一区二区 国产精品| 久久精品国产99精品亚洲| 国产亚洲欧美一区二区| 欧美三级不卡在线观线看| 亚洲中文在线男人的天堂| 日本高清视频在线播放| 国产传媒高清视频在线| 日本三区不卡高清更新二区| 久久精品国产亚洲av麻豆尤物| 高潮日韩福利在线观看| 日韩一本不卡在线观看| 精品国产亚洲av久一区二区三区| 五月婷婷欧美中文字幕 | 国产亚洲中文日韩欧美综合网 | 国产精品一级香蕉一区| 日韩欧美中文字幕av| 欧美一级片日韩一级片| 亚洲人午夜精品射精日韩 | 亚洲一区二区欧美激情| 国产传媒精品视频一区| 97人妻精品一区二区三区男同| 欧美精品久久男人的天堂| 亚洲中文字幕人妻系列| 色播五月激情五月婷婷| 欧美视频在线观看一区| 亚洲中文字幕剧情在线播放| 九九视频通过这里有精品| 尹人大香蕉中文在线播放| 免费播放一区二区三区四区| 精品一区二区三区中文字幕| 欧美日韩乱码一区二区三区| 日韩一区二区三区久久| 亚洲男女性生活免费视频| 日本欧美一区二区三区就| 日本黄色录像韩国黄色录像| 青青操日老女人的穴穴| 国产精品欧美激情在线| 九九热这里只有精品视频|