欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

搜索引擎是如何抓取和收錄頁面的?

2022-09-11    分類: 網(wǎng)站建設(shè)

搜索引擎對網(wǎng)頁的收錄是一個復(fù)雜的過程,簡單來說,收錄過程可以分為:抓取、過濾、建立索引和輸出結(jié)果。下面和大家簡單說一下這幾個步驟,讓你可以清楚你的網(wǎng)頁從你發(fā)布之后是如何被搜索引擎收錄并獲得相關(guān)排名的。

1、抓取

網(wǎng)站的頁面有沒有被搜索引擎收錄,首先要看一下網(wǎng)站的蜘蛛訪問日志,看一下蜘蛛有沒有來,如果蜘蛛都沒有抓取,那是不可能被收錄的。蜘蛛訪問網(wǎng)站的日志可以從網(wǎng)站的IIS日志里面看到,如果搜索引擎蜘蛛沒有來呢?那么就主動向搜索引擎提交,搜索引擎會派出蜘蛛來抓取網(wǎng)站,這樣網(wǎng)站才有可能被盡快收錄。

如果你不會分析網(wǎng)站的日志也沒有關(guān)系,這里推薦愛站SEO工具包,將網(wǎng)站的日志導(dǎo)入到這個工具之后,就能看到日志的分析,你能從中得到很到信息。

廣度優(yōu)先抓取:廣度優(yōu)先抓取是按照網(wǎng)站的樹形結(jié)構(gòu),對一個的層進(jìn)行的抓取,如果此層沒有抓取完成,蜘蛛不會進(jìn)行下一層的搜索。(關(guān)于網(wǎng)站的樹形結(jié)構(gòu),會在后續(xù)的日志中進(jìn)行說明,在沒有發(fā)布文章之后,在此會添加連接)

深度優(yōu)先抓?。荷疃葍?yōu)先抓取是按照網(wǎng)站的樹形結(jié)構(gòu)。按照一個連接,一直抓取下去,知道這一個連接沒有再往下的鏈接為止,深度優(yōu)先抓取又叫縱向抓取。

(注意:廣度優(yōu)先抓取,適用于所有情況下的搜索,但是深度優(yōu)先抓取不一定能適用于所有情況。因?yàn)橐粋€有解的問題樹可能含有無窮分枝,深度優(yōu)先抓取如果誤入無窮分枝(即深度無限),則不可能找到目標(biāo)結(jié)束點(diǎn)。所以,深度優(yōu)先抓取策略很多時候是不會被使用的,廣度優(yōu)先的抓取更加的保險(xiǎn)。)

廣度優(yōu)先抓取適用范圍:在未知樹深度情況下,用這種算法很保險(xiǎn)和安全。在樹體系相對小不龐大的時候,廣度優(yōu)先也會更好些。

深度優(yōu)先抓取適用范圍:剛才說了深度優(yōu)先抓取有自己的缺陷,但是并不代表深度優(yōu)先抓取沒有自己的價值。在樹型結(jié)構(gòu)深度已知情況下,并且樹體系相當(dāng)龐大時,深度優(yōu)先搜索往往會比廣度優(yōu)先搜索優(yōu)秀。

2、過濾

網(wǎng)站的頁面被抓取了并不代表一定會被收錄。蜘蛛來抓取了之后,會把數(shù)據(jù)帶回去,放到臨時的數(shù)據(jù)庫中,再進(jìn)行過濾,過濾掉一些垃圾的內(nèi)容或者是低質(zhì)量的內(nèi)容。

你頁面的信息如果是采集,在互聯(lián)網(wǎng)上有大量的相同信息,搜索引擎就很有可能不為你的網(wǎng)頁建立索引。有時候我們自己寫的文章也不會被收錄,因?yàn)樵瓌?chuàng)的不一定就是高質(zhì)量的。關(guān)于文章質(zhì)量的高低,我會在以后的文章中單獨(dú)拿出一篇來和大家詳細(xì)討論。

過濾這一過程就是一個去掉糟粕的過程,如果你的網(wǎng)站的頁面順利通過了過濾這一過程,說明頁面的內(nèi)容達(dá)到了搜索引擎設(shè)定的標(biāo)準(zhǔn),頁面會就會進(jìn)入建立索引和輸出結(jié)果這一步。

3、建立索引與輸出結(jié)果

這里,我們把建立索引和輸出結(jié)果合在一起進(jìn)行說明。

通過一系列的過程之后,符合收錄的頁面之后會建立索引,建立索引之后就是輸出結(jié)果,也就是我們在搜索關(guān)鍵詞后,搜索引擎展示給我們的結(jié)果。

當(dāng)用戶在搜索關(guān)鍵詞時搜索引擎就會輸出結(jié)果,輸出的結(jié)果是有順序排列的。這些結(jié)果排序是根據(jù)一系列復(fù)雜的算法來排定的。比如:頁面的外鏈,頁面與關(guān)鍵詞的匹配度,頁面的多媒體屬性等。

在輸出的結(jié)果中,還有一些結(jié)果是通過抓取之后直接可以輸出的,沒有經(jīng)過中間復(fù)雜的過濾和建立索引等過程。什么樣的內(nèi)容和什么樣的情況下才會發(fā)生的呢?那就是具有很強(qiáng)的時效性的內(nèi)容,比如新聞類的。比如今天發(fā)生了一件特大事件,各大門戶和新聞源快速發(fā)出了關(guān)于事件的新聞,搜索引擎會迅速對重大新聞事件作出反應(yīng),快速收錄相關(guān)的內(nèi)容。

百度對于新聞的抓取速度是很快的,對重大事件的反應(yīng)也比較及時。但是這里還有一個問題就是,這些發(fā)布的新聞如果有低質(zhì)量的頁面會怎么辦?搜索引擎會在輸出結(jié)果之后,仍然對這一部分新聞內(nèi)容進(jìn)行過濾,如果頁面內(nèi)容與新聞標(biāo)題不符,質(zhì)量過低,那么低質(zhì)量的頁面還是會被搜索引擎過濾掉。

在輸出結(jié)果的時候,搜索引擎會多多少少會對搜索結(jié)果進(jìn)行人工干預(yù),其中以百度為最嚴(yán)重,在百度很多關(guān)鍵詞的自然搜索結(jié)果中被加入了百度太多自家的產(chǎn)品,而且很多是沒有考慮用戶體驗(yàn)的,這也是百度被大家詬病的原因之一,有興趣的朋友可以百度一個詞看一下搜索結(jié)果,是不是百度自家的產(chǎn)品占據(jù)了太多的首頁位置。

文章名稱:搜索引擎是如何抓取和收錄頁面的?
標(biāo)題鏈接:http://chinadenli.net/news/194892.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站外貿(mào)網(wǎng)站建設(shè)、云服務(wù)器、面包屑導(dǎo)航網(wǎng)站內(nèi)鏈網(wǎng)站排名

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站優(yōu)化排名
色鬼综合久久鬼色88| 欧美黄色黑人一区二区| 91人人妻人人爽人人狠狠| 日韩性生活视频免费在线观看 | 久久亚洲午夜精品毛片| 日韩毛片视频免费观看| 亚洲精品一区二区三区免| 久热香蕉精品视频在线播放| 黄色美女日本的美女日人| 日系韩系还是欧美久久| 中文字幕乱子论一区二区三区| 久久综合九色综合欧美| 有坂深雪中文字幕亚洲中文| 又大又紧又硬又湿又爽又猛| 俄罗斯胖女人性生活视频| 亚洲男人的天堂就去爱| 日韩欧美国产亚洲一区| 久久精品国产亚洲熟女| 日韩欧美一区二区久久婷婷| 国产一区麻豆水好多高潮| 国产欧美日韩综合精品二区| 大香蕉精品视频一区二区| 国产偷拍盗摄一区二区| 草草视频精品在线观看| 免费在线播放不卡视频| 亚洲中文字幕免费人妻| 国产白丝粉嫩av在线免费观看| 欧美一区二区三区喷汁尤物| 欧美国产亚洲一区二区三区| 日本成人中文字幕一区| 国产精品一级香蕉一区| 日韩精品综合福利在线观看| 少妇福利视频一区二区| 一个人的久久精彩视频| 日本道播放一区二区三区| 日本中文在线不卡视频| 亚洲欧美日本国产有色| 亚洲妇女黄色三级视频| 日韩精品一区二区亚洲| 国产不卡免费高清视频| 久热人妻中文字幕一区二区|