網站中出現大量重複內容是百度被K的主要原因,但有的人並不知道什麼是重複內容,也不知道怎樣才能解決重複問題。重複內容不僅是網站本身出現相同的文章,其中還包括很多方面。
第一:網站內容重複
1、同樣一篇文章出現多個URL。
2、網站內容很多都是採集,百度新綠蘿演算法就是專門打擊採集站點的。
3、沒有設定404錯誤頁面,刪除某一個頁面時一定要使用404狀態碼給予使用者和蜘蛛一定的提示,如果程式碼設定出現錯誤,那麼蜘蛛就會多收錄一次。
4、網站的固定版塊出現太多次,網站的`右側總是固定放一些板塊和欄目,而這些欄目也從來不更新或者每個頁面都是前一篇內容,這樣就會造成很多頁面重複。
5、網站以圖片為主缺少文字,大量圖片使用同一個URL地址,這樣就會造成蜘蛛在索引的時候被重複收錄。
6、動態頁面和靜態頁面共存,百度爬去目錄時收錄了大量動態頁面。
第二:如何檢查重複內容
1、title:+文章標題即可找出相同的文章
2、在文章中隨機抽取一段,搜尋一下如出現大量紅色,就表明文章重複率高。
3、利用頁面相似度檢查工具,判斷相鄰頁面的相似度。
第三:怎樣刪除重複內容
1、增加原創內容,對於很多采集的站點來說,最好是增加原創文章,寧願讓百度少收錄一些,也能讓百度K掉。
2、網站固定欄目內容隨機展示,根據正文的關鍵詞,可以隨機呼叫右側欄目的文章,讓每個頁面都有不同的內容這樣可以避免重複。
3、設定404頁面,提醒使用者和搜尋引擎哪些頁面不存在了,並防止搜尋引擎收錄死鏈。