欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

看完秒懂robots.txt寫法和注意事項(xiàng)

2020-09-14    分類: 網(wǎng)站建設(shè)

robots.txt直接放在網(wǎng)站根目錄下,是蜘蛛訪問網(wǎng)站時(shí),第一個(gè)抓取的文件。robots.txt是告訴蜘蛛網(wǎng)站的哪些文件允許抓取,哪些文件不允許抓取,甚至可以指定特定的蜘蛛能不能抓取特定的文件。沒有抓取就沒有收錄,沒有收錄就沒有排名。所以作為第一蜘蛛訪問的文件,寫好robots.txt是很重要的,寫好robots.txt后,一定要再檢查一兩遍,以防出錯(cuò)。這里總結(jié)下robots.txt寫法,讓你看完秒懂robots.txt寫法和注意事項(xiàng) 。

一.robots.txt具體作用

1.對(duì)搜索引擎做出規(guī)定,抓取或者不抓取。

2.由于有些信息規(guī)定了不讓抓取,所以可以保護(hù)到一些必要的信息,比如:網(wǎng)站后臺(tái),用戶信息。

3.節(jié)省搜索引擎抓取資源。

二.robots.txt規(guī)則

1.User-agent,用于告訴識(shí)別蜘蛛類型。比如,User-agent: Baiduspider 就是指百度蜘蛛。

各類蜘蛛列舉如下:

百度蜘蛛:Baiduspider

谷歌機(jī)器人:GoogleBot

360蜘蛛:360Spider

搜狗蜘蛛:Sogou News Spider

雅虎蜘蛛:“Yahoo! Slurp China” 或者 Yahoo!

有道蜘蛛:Youdaobot 或者 Yodaobot

Soso蜘蛛:Sosospider

2.Allow,允許蜘蛛抓取指定目錄或文件,默認(rèn)是允許抓取所有。

3.Disallow,不允許蜘蛛抓取指定目錄或文件。

4.通配符,“*”,匹配0或多個(gè)任意字符。

5.終止符,“$”,可以匹配以指定字符結(jié)尾的字符。

舉個(gè)例子:下面是一個(gè)wordpress程序的robots.txt

User-agent: *

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/plugins

Disallow: /wp-content/themes

Disallow: /feed

Disallow: /*/feed

Disallow: /comments/feed

Disallow: /*.js$

Disallow: /*?*

Sitemap: http://www.cdhuace.com/sitemap.xml

解釋:

User-agent: *:對(duì)所有搜索引擎都使用下面的規(guī)則。

Disallow: /wp-admin/:不讓蜘蛛抓取根目錄下的wp-admin文件夾。

Disallow: /*.js$:不讓蜘蛛抓取根目錄下所有的js文件。

Disallow: /*?*:不抓取所有的動(dòng)態(tài)鏈接。

Sitemap: http://www.cdhuace.com/sitemap.xml:給蜘蛛提供網(wǎng)站地圖,方便蜘蛛抓取網(wǎng)站內(nèi)容。

三.robots.txt注意事項(xiàng)

1.如果你希望搜索引擎收錄網(wǎng)站上所有的內(nèi)容,那么就不要建立robots.txt文件。

2.如果同時(shí)存在動(dòng)態(tài)和靜態(tài)鏈接,那么建議屏蔽動(dòng)態(tài)鏈接。

3.robots.txt只能是屏蔽站內(nèi)文件的,對(duì)站外文件沒有屏蔽功能。

4.User-agent,Allow,Disallow,Sitemap的首字母都是大寫的。

5.User-agent,Allow,Disallow,Sitemap的冒號(hào)后面都是有空格的,沒有寫空格直接寫接下來的內(nèi)容會(huì)出錯(cuò)。

6.網(wǎng)站通常會(huì)屏蔽搜索結(jié)果頁(yè)面。因?yàn)樗阉鹘Y(jié)果頁(yè)和正常展示的內(nèi)容頁(yè)相比,標(biāo)題和內(nèi)容上相同的,而這兩個(gè)頁(yè)面鏈接是不同的。那搜索引擎該將這篇文章歸屬于哪個(gè)內(nèi)鏈呢?這樣就會(huì)造成內(nèi)鏈之間相互競(jìng)爭(zhēng),造成內(nèi)部資源損耗。

比如上面舉的例子,那個(gè)wordpress程序,在沒有設(shè)置偽靜態(tài),還是動(dòng)態(tài)鏈接的時(shí)候,搜索結(jié)果頁(yè)面鏈接都包含有/?s=,而 標(biāo)題和內(nèi)容 與 正常展示的動(dòng)態(tài)鏈接內(nèi)容頁(yè)重復(fù),可以通過Disallow: /?=*來屏蔽搜索結(jié)果頁(yè)面。

而現(xiàn)在那個(gè)wordpress程序已經(jīng)設(shè)置了偽靜態(tài),也設(shè)置了Disallow: /*?*,Disallow: /*?*本身就包含了Disallow: /?=*,所以Disallow: /?=*這句寫不寫都沒有關(guān)系

7.建議屏蔽js文件。Disallow: /*.js$,以 .js 結(jié)尾的路徑統(tǒng)統(tǒng)被屏蔽,這樣就屏蔽了js文件。

8.路徑是區(qū)分大小寫的。Disallow: /ab/ 和 Disallow: /Ab/ 是不一樣的。

9.robots.txt會(huì)暴露網(wǎng)站相關(guān)目錄,寫robots.txt時(shí)要考慮到這一點(diǎn)。

10.有些seo會(huì)將文件直接備份在服務(wù)器中,文件是 .zip 格式,然后在robots.txt中屏蔽。個(gè)人不建議這樣,這就是明顯告訴人家你的備份文件位置。建議文件和數(shù)據(jù)都備份到本地。

11.一些特殊規(guī)則對(duì)比:

①Disallow: /和Disallow: / ab (/后面有個(gè)空格,再有ab)是一樣的,/后面多了個(gè)空格,蜘蛛之認(rèn)空格前面那一段,就是Disallow: /,所以兩個(gè)都是屏蔽整站的。

②Disallow: /ab和Disallow: /ab*是一樣的。比如兩個(gè)都能屏蔽http://域名/ab,http://域名/abc,http://域名/abcd。

③Disallow: /ab/和Disallow: /ab是不一樣的。很明顯,Disallow: /ab范圍更廣,包含了Disallow: /ab/。因?yàn)镈isallow: /ab/只能屏蔽http://域名/ab/,http://域名/ab/....這樣的路徑,也就是只能屏蔽ab目錄和ab目錄下的文件不被蜘蛛抓取。

四.驗(yàn)證robots.txt文件的正確性和是否生效

當(dāng)我們寫好了robots.txt文件后,怎么確定文件的正確性呢?上傳到服務(wù)器根目錄后,怎么判斷robots.txt文件是否生效了呢?這時(shí)我們可以借助百度資源平臺(tái)Robots。比如輸入樂呵SEO測(cè)試服網(wǎng)址,得到如下結(jié)果。

驗(yàn)證robots.txt文件是否生效

檢測(cè)到robots.txt文件的內(nèi)容

驗(yàn)證robots.txt文件的正確性

結(jié)果證明,http://wordpress.cdhuace.com/robots.txt這個(gè)文件沒有語法錯(cuò)誤,并且已經(jīng)生效了。

若是想測(cè)試某一個(gè)目錄或者文件是否被屏蔽了,百度也是提供了工具的。如下圖,由于 http://wordpress.cdhuace.com 是測(cè)試服,我屏蔽了所有文件。所以無論我輸入根目錄下的任何目錄或者任何文件,都是檢測(cè)不到的,也就是說蜘蛛是抓取不到的。

輸入了后臺(tái)目錄wp-admin:

后臺(tái)目錄檢測(cè)結(jié)果:

經(jīng)過測(cè)試,其他文件和目錄頁(yè)也檢測(cè)不到,所以這個(gè)功能還是很好用的。

更多robots.txt內(nèi)容,可以參考百度提供的文檔哦。https://ziyuan.baidu.com/college/courseinfo?id=267&page=12

robots.txt寫法和注意事項(xiàng)就總結(jié)到這里了,內(nèi)容相對(duì)細(xì)致,結(jié)合了例子講解會(huì)很容易看懂,希望對(duì)您有所幫助咯。

分享文章:看完秒懂robots.txt寫法和注意事項(xiàng)
轉(zhuǎn)載源于:http://chinadenli.net/news/86283.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站面包屑導(dǎo)航、商城網(wǎng)站網(wǎng)站排名、靜態(tài)網(wǎng)站用戶體驗(yàn)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

營(yíng)銷型網(wǎng)站建設(shè)
国产又粗又猛又爽色噜噜 | 国产色偷丝袜麻豆亚洲| 亚洲国产精品无遮挡羞羞| 色婷婷激情五月天丁香| 亚洲内射人妻一区二区| 日韩一区二区三区高清在| 国产成人亚洲精品青草天美| 在线日韩欧美国产自拍| 99秋霞在线观看视频| 日本人妻丰满熟妇久久| 国产精品内射婷婷一级二级| 中文字幕一区二区久久综合| 国产精品九九九一区二区 | 在线观看中文字幕91| 成人午夜在线视频观看| 欧美日韩国产一级91| 欧美日韩国产一级91| 亚洲男人天堂成人在线视频| 国产精品内射婷婷一级二级| 亚洲精品国产美女久久久99| 在线懂色一区二区三区精品| 97人摸人人澡人人人超碰| 国产欧美一区二区另类精品| 国产精品视频一区二区秋霞| 丰满的人妻一区二区三区| 亚洲一区二区三区精选| 欧美日韩一级aa大片| 亚洲一区二区三区熟女少妇 | 亚洲视频一级二级三级| 亚洲一区二区三区四区| 亚洲高清亚洲欧美一区二区| 欧美一区二区三区性视频| 亚洲伦片免费偷拍一区| 日韩av生活片一区二区三区| 日系韩系还是欧美久久| 正在播放国产又粗又长| 国产成人在线一区二区三区| 欧美日韩国产综合特黄| 亚洲综合激情另类专区老铁性| 国产精品免费无遮挡不卡视频| 国产一区二区不卡在线视频|