欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

搜索引擎對關(guān)鍵字堆砌的識別

2022-07-08    分類: 網(wǎng)站建設(shè)

搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對矛盾,合理的優(yōu)化有助于搜索引擎對網(wǎng)站內(nèi)容的識別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以期達(dá)到增加頁面收錄數(shù)和頁面排名的目的。

早期的關(guān)鍵字堆砌SpAM作弊方式之一,是將中文詞庫中的單詞直接用軟件拼湊成文章,這樣的文章沒有實際的意義,只能給搜索引擎看。那么對于這樣的文章,搜索引擎是通過什么方式來識別的呢?

我們知道,每個搜索引擎都有網(wǎng)頁質(zhì)量監(jiān)控部門,對于百度等摻雜人工處理的搜索引擎而言,用戶發(fā)現(xiàn)這樣的網(wǎng)站,投訴到百度,百度直接封了這個網(wǎng)站了事。但對于Google這樣的封站也是自動處理的搜索引擎而言,對關(guān)鍵字堆砌作弊的識別就顯得更為重要了。

對于關(guān)鍵字堆砌作弊方式的識別,搜索引擎一般采用統(tǒng)計分析的方法進(jìn)行。

搜索引擎首先將網(wǎng)頁進(jìn)行分詞,分詞完成后可以得到詞的數(shù)量N和文章長度L,從大量文章的統(tǒng)計中發(fā)現(xiàn)文章的長度L和詞的數(shù)量N兩個數(shù)字之間存在一定的分布關(guān)系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說一篇長度為1000字節(jié)的文章中,應(yīng)該有125-250個分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個比值的范圍會有所不同。如果搜索引擎發(fā)現(xiàn)L/N特別大,那么這篇文章就存在就存在關(guān)鍵字堆砌現(xiàn)象了,如果L/N特別小,則可能是這篇文章是由一些詞所組成的沒有意義的文章,筆者對泥胚文章中的不同作者發(fā)表的文章進(jìn)行了驗證,基本上都服從這個比值范圍。

進(jìn)一步,通過大量正常文章統(tǒng)計發(fā)現(xiàn),文章中密度高的幾個關(guān)鍵字出現(xiàn)的次數(shù)之和與N/L存在一定的分布關(guān)系,搜索引擎就可以通過網(wǎng)頁中的分布與統(tǒng)計結(jié)果的分布圖進(jìn)行比較得出文章是否存在關(guān)鍵字堆砌的現(xiàn)象。

此外,搜索引擎還將從停止字的比例來判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,如果文章中停止字的比例在正常的比例范圍之外,這個網(wǎng)頁應(yīng)提交到網(wǎng)頁質(zhì)量監(jiān)控部門審核。

當(dāng)然,還有更多的算法可以對網(wǎng)頁與自然語言的文章進(jìn)行比較分析,以判別文章是否為自然文章。

所謂魔高一尺、道高一丈,有些作弊者已經(jīng)放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過爬蟲或其它方式獲得網(wǎng)上文章的句子,并用軟件將數(shù)十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語義的分析來判斷是否作弊了,然而目前關(guān)于語義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。

然而我們?nèi)匀徊荒軐⒆詣游恼律梢还髯哟蛩溃谌斯ぶ悄艿奈恼律扇匀皇侨祟愌芯孔陨碚Z言以及自身智能的一個重要方向。作弊與反作弊,將能促使人類對人工智能的研究。

如果到最后,軟件能生成人類能夠理解的文章,這是SpAM還是精華?你能肯定地說目前存在的智能化程度還不夠高的RSS聚合文章一定是SpAM嗎?然而,如果這樣的文章海量的出現(xiàn),我們又該如何去面對這個現(xiàn)象?

參考文獻(xiàn):《搜索引擎原理、實踐和應(yīng)用》盧亮、張博文,2007

網(wǎng)頁名稱:搜索引擎對關(guān)鍵字堆砌的識別
轉(zhuǎn)載來于:http://chinadenli.net/news/175563.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App設(shè)計、品牌網(wǎng)站設(shè)計服務(wù)器托管、標(biāo)簽優(yōu)化網(wǎng)站營銷、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管
丰满熟女少妇一区二区三区| 久久精品中文扫妇内射| 人妻人妻人人妻人人澡| 99少妇偷拍视频在线| 国产精品一区二区传媒蜜臀| 日本最新不卡免费一区二区| 日韩欧美综合在线播放| 亚洲清纯一区二区三区| 日韩欧美一区二区黄色| 中文字幕中文字幕一区二区| 一区二区三区日韩经典| 国产在线一区二区免费| 九九九热在线免费视频| 亚洲一区二区亚洲日本| 2019年国产最新视频| 老熟女露脸一二三四区| 国产女优视频一区二区| 麻豆视传媒短视频免费观看| 亚洲中文字幕乱码亚洲| 日韩欧美一区二区不卡视频| 亚洲最新一区二区三区| 欧美一二三区高清不卡| 亚洲一区二区精品免费| 亚洲欧美黑人一区二区| 天堂热东京热男人天堂| 亚洲高清中文字幕一区二三区| 国产伦精品一一区二区三区高清版| 中文字日产幕码三区国产| 太香蕉久久国产精品视频| 老司机精品视频在线免费看 | 内射精品欧美一区二区三区久久久| 国产一区欧美一区日本道| 日韩中文字幕欧美亚洲| 欧美一区二区三区在线播放| 久久福利视频视频一区二区 | 搡老熟女老女人一区二区| 97人摸人人澡人人人超碰| 欧美日韩国产黑人一区| 好东西一起分享老鸭窝| 日韩欧美亚洲综合在线| 大香蕉精品视频一区二区|