欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

Python3如何解決讀取中文文件txt編碼的問(wèn)題-創(chuàng)新互聯(lián)

小編給大家分享一下Python3如何解決讀取中文文件txt編碼的問(wèn)題,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比修武網(wǎng)站開(kāi)發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式修武網(wǎng)站制作公司更省心,省錢(qián),快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋修武地區(qū)。費(fèi)用合理售后完善,十年實(shí)體公司更值得信賴。

問(wèn)題描述

嘗試用Python寫(xiě)一個(gè)Wordcloud的時(shí)候,出現(xiàn)了編碼問(wèn)題。

Python3如何解決讀取中文文件txt編碼的問(wèn)題

照著網(wǎng)上某些博客的說(shuō)法添添改改后,結(jié)果是變成了“UnicodeDecodeError: ‘utf-8' codec can't decode byte…”這個(gè)錯(cuò)誤。

搗鼓了一天啊,TXT(此處為本人現(xiàn)下內(nèi)心表情)。最后,干脆寫(xiě)個(gè)最簡(jiǎn)單的文件讀取,竟然還是報(bào)錯(cuò)。于是就考慮是不是txt的編碼問(wèn)題,因?yàn)樽x取的txt文件是在Mac上面新建的純文本文件,一時(shí)沒(méi)找到在哪里查看編碼,最后拷貝到Windows系統(tǒng)上,查看了txt文件的編碼,竟然是ASCII,不是我最愛(ài)的utf-8,Mac你辜負(fù)了我對(duì)你的一番信任??!ε(┬┬﹏┬┬)3

解決方法

將txt文件的編碼格式改為utf-8即可

此外,在打開(kāi)文件的時(shí)候,要加上第三個(gè)參數(shù)encoding=‘utf8'(沒(méi)有橫杠)。

with open('./test3.txt','r',encoding='utf8') as fin:
  for line in fin.readlines():
    line = line.strip('\n')

下面附上第一次成功顯示的詞云的源碼(參考網(wǎng)上他人的,注釋很詳細(xì))

import jieba
import jieba.analyse
from matplotlib import pyplot as plt
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
 
# 1.讀取數(shù)據(jù)
with open("./test.txt","r",encoding="utf8") as f:
  text = f.read()
 
# 2.基于 TextRank 算法的關(guān)鍵詞抽取,top50
keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))
file = ",".join(keywords)
 
# 指定中文字體,不然中文顯示框框
font = r'./HYQiHei-25J.ttf'
print(file)
# 指定背景圖,隨意
image = imread('cake.jpg')
wc = WordCloud(
  font_path=font,
  background_color='white',#背景色
  mask=image,#背景圖
  stopwords=STOPWORDS,#設(shè)置停用詞
  max_words=100,#設(shè)置大文字?jǐn)?shù)
  max_font_size=100,#設(shè)置大字體
  width=800,
  height=1000,
 
)
 
#生成詞云
image_colors = ImageColorGenerator(image)
wc.generate(file)
 
# 使用matplotlib,顯示詞云圖
plt.imshow(wc) #顯示詞云圖
plt.axis('off') #關(guān)閉坐標(biāo)軸
plt.show()
# 保存圖片
wc.to_file('news.png')

Python3如何解決讀取中文文件txt編碼的問(wèn)題

以上是“Python3如何解決讀取中文文件txt編碼的問(wèn)題”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

名稱欄目:Python3如何解決讀取中文文件txt編碼的問(wèn)題-創(chuàng)新互聯(lián)
文章分享:http://chinadenli.net/article4/psgoe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)品牌網(wǎng)站設(shè)計(jì)、企業(yè)建站、虛擬主機(jī)、搜索引擎優(yōu)化、網(wǎng)站改版

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷(xiāo)型網(wǎng)站建設(shè)
国产国产精品精品在线| 日韩三极片在线免费播放| 日本淫片一区二区三区| 国产欧美日韩精品一区二| 不卡免费成人日韩精品| 欧美国产亚洲一区二区三区| 91人妻人人精品人人爽| 国产免费人成视频尤物| 日韩精品中文字幕在线视频| 久久亚洲国产视频三级黄| 欧美一区二区三区视频区| 国产高清一区二区不卡| 日本久久中文字幕免费| 国产丝袜女优一区二区三区| 国产精品一区日韩欧美| 日系韩系还是欧美久久| 99免费人成看国产片| 亚洲国产精品一区二区毛片| 亚洲中文字幕人妻av| 一区二区三区四区亚洲另类 | 亚洲欧美日韩色图七区| 夫妻性生活真人动作视频| 国产免费无遮挡精品视频| 麻豆国产精品一区二区三区| 日本道播放一区二区三区| 国产一区二区不卡在线视频| 成人精品亚洲欧美日韩| 少妇人妻中出中文字幕| 欧美色婷婷综合狠狠爱| 免费观看日韩一级黄色大片| 夫妻性生活动态图视频| 一本色道久久综合狠狠躁| 黄色美女日本的美女日人| 中国美女偷拍福利视频| 国产一级一片内射视频在线| 福利专区 久久精品午夜| 蜜臀人妻一区二区三区| 成在线人免费视频一区二区| 日本特黄特色大片免费观看| 欧美一级内射一色桃子| 五月激情综合在线视频|