Python怎么處理雜亂無序的數(shù)據(jù)

這篇文章主要講解了“Python怎么處理雜亂無序的數(shù)據(jù)”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“Python怎么處理雜亂無序的數(shù)據(jù)”吧！

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比于田網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式于田網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們，業(yè)務(wù)覆蓋于田地區(qū)。費(fèi)用合理售后完善，10多年實(shí)體公司更值得信賴。

問題抽絲剝繭

這個問題算是群友答疑。如果說同事或者老板給你一堆這樣的數(shù)據(jù)，你估計(jì)會抓狂，該怎么處理呢？

仔細(xì)觀察上面數(shù)據(jù)可以發(fā)現(xiàn)，該數(shù)據(jù)有如下2個主要特點(diǎn)：

① 每一行的數(shù)據(jù)長度不同。第一行和第三行有4個屬性，第二行有5個屬性。
② 不同行的屬性值，并不是對應(yīng)排列。

解題思路剖析

你可能會想，直接用Excel分裂。其實(shí)并不可行，因?yàn)椴煌械膶傩灾担⒉皇菍?yīng)排列。Excel分列導(dǎo)致的結(jié)果就是：不同的屬性，存在于相同的行。

放棄Excel那條路之后，我就只能尋求Python的幫助了。我們要根據(jù)數(shù)據(jù)的特點(diǎn)，選擇合適的數(shù)據(jù)存儲方法。最終問題就轉(zhuǎn)化為：構(gòu)造數(shù)據(jù)源，然后創(chuàng)建DataFrame即可。

然后根據(jù)我們這個數(shù)據(jù)的特點(diǎn)，我選擇構(gòu)造字典組成的列表這樣一個數(shù)據(jù)，并利用它來創(chuàng)建DataFrame。

觀察我提供的這個案例和待解決的問題，簡直異曲同工。我們同樣可以將上述數(shù)據(jù)的每一行，都變成一個個鍵值對組成的字典。然后最外層用一個大列表，將所有的字典包含起來。

完整代碼

1）首先需要構(gòu)造練習(xí)數(shù)據(jù)

import pandas as pd
x = {"信息":["年齡:12;性別:女;身高:22;愛好:打球",
             "年齡:12;說明:歷史數(shù)據(jù);性別:女;身高:22;愛好:打球",
             "生日:2月3日;年齡:12;性別:女;愛好:打球"]
    }
df = pd.DataFrame(x)
df

結(jié)果如下：

2）構(gòu)造字典組成的列表

tmps_list = []
for data in df["信息"].values:
    tmp_dict = {}
    for kv in data.split(";"):
        k, v = kv.split(":")
        tmp_dict[k] = v
    tmps_list.append(tmp_dict)
tmps

結(jié)果如下：

3）創(chuàng)建DataFrame

df = pd.DataFrame(tmps)
df

結(jié)果如下：

感謝各位的閱讀，以上就是“Python怎么處理雜亂無序的數(shù)據(jù)”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對Python怎么處理雜亂無序的數(shù)據(jù)這一問題有了更深刻的體會，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)，小編將為大家推送更多相關(guān)知識點(diǎn)的文章，歡迎關(guān)注！

文章名稱：Python怎么處理雜亂無序的數(shù)據(jù)
瀏覽路徑：http://chinadenli.net/article36/ppcdsg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供移動網(wǎng)站建設(shè)、網(wǎng)站內(nèi)鏈、網(wǎng)站維護(hù)、網(wǎng)站改版、軟件開發(fā)、自適應(yīng)網(wǎng)站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

Python怎么處理雜亂無序的數(shù)據(jù)

問題抽絲剝繭

解題思路剖析

完整代碼