創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買多久送多久,劃算不套路!
小編給大家分享一下解決python中zipfile出現(xiàn)亂碼的問題,相信大部分人都還不怎么了解,因此分享這篇文章給大家學(xué)習(xí),希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學(xué)習(xí)方法吧!
在zipfile.ZipFile中獲得的filename有中日文則很大可能是亂碼,這是因?yàn)?/p>
在 zip 標(biāo)準(zhǔn)中,對(duì)文件名的 encoding 用的不是 unicode,而可能是各種軟件根據(jù)系統(tǒng)的默認(rèn)字符集來采用(此為猜測(cè)),而zipfile 中根據(jù)文件 flag 檢測(cè)的時(shí)候,只支持 cp437 和 utf-8。
具體zipfile模塊中的源代碼如下:
if flags & 0x800: # UTF-8 file names extension filename = filename.decode('utf-8') else: # Historical ZIP filename encoding filename = filename.decode('cp437')
可見編碼被正確識(shí)別為utf8時(shí)的情況外,都會(huì)被識(shí)別并decode為cp437編碼,但如果實(shí)際是gbk等其他編碼時(shí)就變?yōu)閬y碼了。所以解決的方法在于被decode為cp437后,重新再手動(dòng)轉(zhuǎn)為正確的編碼。
在實(shí)際過程中可以對(duì)已經(jīng)先用zipfile進(jìn)行解壓,然后對(duì)unzip文件夾中的亂碼文件直接進(jìn)行重命名。具體實(shí)現(xiàn)過程如下:
import os def an_garcode(dir_names): """anti garbled code""" os.chdir(dir_names) for temp_name in os.listdir('.'): try: #使用cp437對(duì)文件名進(jìn)行解碼還原 new_name = temp_name.encode('cp437') #win下一般使用的是gbk編碼 new_name = new_name.decode("gbk") #對(duì)亂碼的文件名及文件夾名進(jìn)行重命名 os.rename(temp_name, new_name) #傳回重新編碼的文件名給原文件名 temp_name = new_name except: #如果已被正確識(shí)別為utf8編碼時(shí)則不需再編碼 pass if os.path.isdir(temp_name): #對(duì)子文件夾進(jìn)行遞歸調(diào)用 an_garcode(temp_name) #記得返回上級(jí)目錄 os.chdir('..') an_garcode(os.getcwd())
以上是解決python中zipfile出現(xiàn)亂碼的問題的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道!
新聞名稱:解決python中zipfile出現(xiàn)亂碼的問題-創(chuàng)新互聯(lián)
本文鏈接:http://chinadenli.net/article48/decpep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、網(wǎng)站制作、企業(yè)網(wǎng)站制作、品牌網(wǎng)站設(shè)計(jì)、ChatGPT、定制網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容