2021-12-25 分類: 網(wǎng)站建設
很多朋友都說自己的網(wǎng)站快照不更新,或者滯后好幾天,個人覺得也是蜘蛛抓取的頻率不夠造成的。要想快照更新快,特別是新站,前期一定要多做內容建設,內容頁面如果沒有內容的更新,一般蜘蛛可能不會抓取收錄,或者抓取了但是不返回數(shù)據(jù),當下次用戶搜索時候可能就會調用搜索引擎數(shù)據(jù)庫中存儲的一些數(shù)據(jù)。搜索引擎蜘蛛的爬取頻率很多時候是由網(wǎng)站內容質量決定的,因為只有網(wǎng)站有更新鮮更好的內容,才能更吸引蜘蛛來反復抓取,例如很多大型的內容型網(wǎng)站,每天更新大量的內容,這樣就把蜘蛛一直留在了站內,頁面抓取的頻率自然會提高。
而提升了爬取頻率,對于頁面中內容和鏈接的更新就會被搜索引擎蜘蛛更快的抓取到,能夠更充分的收錄網(wǎng)站的頁面內容信息。分析搜索引擎蜘蛛首先會考慮的一個參數(shù)就是爬取量,一般我們考慮蜘蛛爬取量的單位是以一天為一個時間段,那么我們很多時候考慮的就是一天時間內的爬取率。當然,你也可以根據(jù)自己的需要調整時間段的限定,如劃分到每個小時,來充分了解各個時間段的蜘蛛的抓取情況,然后針對性的做一些調整。其中我覺得一類分析可以給我們帶來很多的成就感,即對于一些模糊經(jīng)驗理論的驗證。
例如我們經(jīng)常聽到這樣一句話:做網(wǎng)站內容的時候要定時定量的更新,培養(yǎng)搜索引擎蜘蛛的抓取習慣,隨意的改變更新時間,可能影響蜘蛛對網(wǎng)站內容的抓取,這句話到底正確不正確呢這里就可以運用網(wǎng)站的日志進行分析搜索引擎蜘蛛的抓取率來解釋。具體的操作方法就是對一個月內每天每個小時段的蜘蛛抓取情況進行拆分統(tǒng)計(注意數(shù)據(jù)樣本選取的合理性),然后對每個時間段進行分析,對比就可以發(fā)現(xiàn)哪個時間段搜索引擎蜘蛛來的比較勤,再和自己做內容更新的情況進行一個對比就可以很快的得出結論。
至于后面談到搜索引擎蜘蛛的爬取深度,飽和度,優(yōu)先爬取,冗余度以及爬取路徑都是對于蜘蛛爬取習慣和爬取策略的研究,因為自己也沒有針對性的去實踐分析,所以只能在理論上談談自己的一些想法。搜索引擎蜘蛛的爬取深度如果不夠深,主要是因為網(wǎng)站在結構布局的時候沒有考慮到這蜘蛛是否能夠充分抓取或者是否按照一層一層的抓取,這里就涉及到鏈接入口的布局,也就會考慮到蜘蛛爬取優(yōu)先的一些入口,很多時候對一些大的網(wǎng)站做診斷,來提升其流量和收錄主要的策略布局就是優(yōu)化蜘蛛抓取優(yōu)先的入口,實現(xiàn)的方法就是采用nofollow標簽屏蔽一些頁面。還需要分析的可能是爬取的飽和度,因為對于單個頁面的爬取太多是在浪費蜘蛛資源,我們如果能夠適當?shù)目刂七@些資源的分配,那么對于頁面的抓取和收錄的提升肯定有很大的幫助。
當前文章:做seo我們應該先深入的了解蜘蛛的工作
標題鏈接:http://chinadenli.net/news/142032.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設、ChatGPT、域名注冊、網(wǎng)站建設、外貿建站、網(wǎng)站收錄
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內容