小編給大家分享一下怎樣使用python網(wǎng)絡(luò)爬蟲(chóng)抓取視頻,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
創(chuàng)新互聯(lián)公司是專業(yè)的阜康網(wǎng)站建設(shè)公司,阜康接單;提供成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì),網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行阜康網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!準(zhǔn)備工作:
l Chrome 瀏覽器、
l Vim
l Python3 開(kāi)發(fā)環(huán)境
l Kali Linux
API 尋找 && 提取
1、我們通過(guò) F12 打開(kāi)開(kāi)發(fā)者模式。
2、再查看一下 Headers 屬性
3、再看下看到Request URL這個(gè)屬性值
代碼實(shí)現(xiàn)
寫(xiě)好腳本,利用爬蟲(chóng)下載片斷
##導(dǎo)入的兩個(gè)模塊,其中requests模塊需要自行下載 from multiprocessing import Pool import requests ##定義一個(gè)涵數(shù) def demo(i): ##定義了一個(gè)url,后面%3d就是截取后面三位給他加0,以防止i的參數(shù)是1的時(shí)候參數(shù)對(duì)不上號(hào),所以是1的時(shí)候就變成了001 url="https://vip.okokbo.com/20180114/ArVcZXQd/1000kb/hls/phJ51837151%03d.ts"%i ##定義了請(qǐng)求頭信息 headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36"} ##構(gòu)建自定義請(qǐng)求對(duì)象 req=requests.get(url,headers=headers) ##將文件保存在當(dāng)前目錄的mp4文件中,名字以u(píng)rl后十位數(shù)起名 with open('./mp4/ {}'.format(url[-10:]), 'wb') as f: f.write(req.content) ##程序代碼的入口 if __name__=='__main__': ##定義一個(gè)進(jìn)程池,可以同時(shí)執(zhí)行二十個(gè)任務(wù),不然一個(gè)一個(gè)下載太慢 pool = Pool(20) ##執(zhí)行任務(wù)的代碼 for i in range(100): pool.apply_async(demo, (i,)) pool.close() pool.join()
復(fù)制電影存放的路徑
用進(jìn)入windows命令行模式,粘貼地址
復(fù)制該目錄下所有以*.ts結(jié)尾的文件,復(fù)制成一個(gè)文件
進(jìn)行合并
進(jìn)行驗(yàn)證
看完了這篇文章,相信你對(duì)怎樣使用python網(wǎng)絡(luò)爬蟲(chóng)抓取視頻有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
文章題目:怎樣使用python網(wǎng)絡(luò)爬蟲(chóng)抓取視頻-創(chuàng)新互聯(lián)
網(wǎng)頁(yè)路徑:http://chinadenli.net/article28/cdpojp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、Google、云服務(wù)器、電子商務(wù)、外貿(mào)建站、商城網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容
網(wǎng)頁(yè)設(shè)計(jì)公司知識(shí)