這篇文章將為大家詳細(xì)講解有關(guān)python爬蟲中selenium怎么登錄微博,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)從2013年開始,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目網(wǎng)站設(shè)計(jì)、網(wǎng)站制作網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元鄧州做網(wǎng)站,已為上家服務(wù),為鄧州各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:13518219792
selenium是一個(gè)用于Web應(yīng)用程序測(cè)試的工具,同時(shí)我們也可以通過 selenium 實(shí)現(xiàn)登錄功能。以微博為例
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://weibo.com/")
username = driver.find_element_by_css_selector("input#loginname")
username.clear()
username.send_keys('your_username')
password = driver.find_element_by_css_selector('span.enter_psw')
password.clear()
password.send_keys('your_password')在輸入賬號(hào)和密碼后,最大的問題來了,驗(yàn)證碼都是圖片,一般我們要借助圖像識(shí)別才能識(shí)別驗(yàn)證碼,但是由于驗(yàn)證碼的種類非常多(英文、數(shù)字、中文或者它們的混合),而且驗(yàn)證碼還可能被一定的旋轉(zhuǎn)、扭曲甚至互相粘連,以至于人眼也不能很好的辨認(rèn),因此大多數(shù)模型的通用性和準(zhǔn)確率并不是很高。因此效率最高的方法就是在selenium打開瀏覽器之后手動(dòng)登錄(過程中調(diào)用time.sleep()暫停程序)。因?yàn)閷?duì)于爬蟲來說最重要的不是解決登錄問題,因此這么做可以節(jié)約大量的時(shí)間以及代碼量,雖然很蠢,但是很有用。
完成登錄后,用一下代碼即可獲取cookie,并把cookie_dict傳給pyspider全局參數(shù)中的cookies即可
cookies_dict = {}
cookies = driver.get_cookies()for cookie in cookies:
cookies_dict[cookie['name']] = cookie['value']關(guān)于python爬蟲中selenium怎么登錄微博就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
當(dāng)前標(biāo)題:python爬蟲中selenium怎么登錄微博
標(biāo)題來源:http://chinadenli.net/article42/ipccec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、云服務(wù)器、域名注冊(cè)、網(wǎng)站排名、虛擬主機(jī)、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
移動(dòng)網(wǎng)站建設(shè)知識(shí)