百度對每一個網(wǎng)站都是平等對待的,它會嘗試抓取網(wǎng)站中的每一篇文章。但是,在抓取這些文章之前,百度需要對這些文章進(jìn)行質(zhì)量評估,而評估的結(jié)果決定了百度是否抓取這篇文章并列入它的索引。有人會說,難度百度會人工對整個互聯(lián)網(wǎng)中以千億計的的文章進(jìn)行審核和評估嗎?當(dāng)然不是,百度有一套智能化的抓取機(jī)制,通過某種既定的程序?qū)?nèi)容進(jìn)行分析,最后決定是否抓取和建立索引。
什么樣的文章會被百度收錄?
搜索引擎的原則是將用戶最需要、最有參考價值的內(nèi)容呈現(xiàn)給搜索引擎用戶。在這個前提下,我們就能夠獲得一個清晰的思路了。什么是高質(zhì)量、有參考價值的文章呢?百度官方給出的解釋是:通過對某個方面的專業(yè)分析、用心編輯出來并且含有非常高的可讀價值的原創(chuàng)文章會被百度優(yōu)先考慮。通過對網(wǎng)上其它作者寫的文章進(jìn)行深度修改并導(dǎo)入自己的一些新觀點,用心編輯成一篇新的文章,百度也會優(yōu)先考慮。比如,某個網(wǎng)站中的文章都是從各種網(wǎng)站中抄襲而來的,那么,這些文章很有可能不會被收錄,而且還可能面臨搜索引擎對網(wǎng)站的進(jìn)一步懲罰,因為百度認(rèn)為,這些文章毫無價值。
什么樣的文章會被百度拒絕?
違反國家法律法規(guī)的文章根本不需要考慮,肯定不會收錄,并且網(wǎng)站也會受到相應(yīng)的懲罰。然后就是互聯(lián)網(wǎng)上已存在大量同樣內(nèi)容的文章,百度認(rèn)為,這些資料已經(jīng)過時了,沒有任何參考價值,極有可能不被收錄。過度優(yōu)化的文章同樣不會被收錄,文章里大量充斥著各種關(guān)鍵詞,大大影響用戶的可讀性,即便這是純原創(chuàng)的文章,百度會認(rèn)為,你正準(zhǔn)備人為干擾搜索引擎排序方式,也極有可能不會被收錄。但是,適當(dāng)?shù)膬?yōu)化是可以的,它可以幫助搜索引擎更加了解這篇文章的重點,并推薦給用戶瀏覽。各種違反百度的行為準(zhǔn)則的文章,皆有可能不被收錄。比如在一個教育網(wǎng)行業(yè)站里發(fā)布一些有關(guān)醫(yī)藥的內(nèi)容;比如在一篇介紹農(nóng)業(yè)的文章里插入與本文毫無關(guān)聯(lián)的廣告等等。