當前位置：才華齋>計算機>SEO網站優化>

關於文章SEO原創度的一些觀點和看法

通常來說，網站收錄減少，很有可能是因為站內文章原創度不高造成的，自從百度推出原創計劃之後，網站內容的原創度對於網站排名的影響變得越來越重要，可是原創的內容畢竟很少，而且創作起來也非常困難，所以很多人開始對內容進行少許的創新，使之能夠更好的滿足SEO優化需求，其中最為常見的方法就是偽原創。

一般來說，偽原創達到70%左右，在百度演算法中就能被預設為原創文章，然後在這些內容中適當增加一些關鍵詞，就能夠作為很好的原創文章來使用，那麼這樣針對這種SEO文章如何編輯才能夠更好的發揮優化效果呢?

總有人在說自己的文章被抄襲，然後抄襲者收錄了，自己的卻沒有被收錄，我曾經我也這樣想，甚至我使用遮蔽右鍵、遮蔽複製等手段來剋制抄襲者的惡意競爭行為，對此，我今天我有不同的看法，也有不同的觀點。

　1、未收錄不代表未抓取

確實，為了SEO的發展，自己辛辛苦苦寫了兩篇原創文章，被一個大型網站抄襲秒收錄，而自己的站點卻不收錄，這是一件非常讓人尷尬的事情，那麼真的不收錄，就不是原創了嗎?

很多朋友是這樣認為的，自己的文章沒有被收錄，而抄襲者的卻收錄了，所以百度判斷自己抄襲了別人的文章，所以自己權重也就一直上不來，排名一直沒有，其實這是一個錯誤的觀點，我曾在百度排名規則的文章中提到，百度收錄是需要經過抓取、識別、釋放這三個流程，其中在釋放的流程中，需要判斷整體網站的質量，當整體網站質量過關，收錄相對較快，當整體網站信譽度沒有達到百度的標準，百度將會暫時保留你的文章，不被釋放出來。

不被釋放出來，但是已經經過了抓取和識別這兩個流程，在這裡特別的說一下抓取的流程，當網站建立以後，提交到搜尋引擎，搜尋引擎基本每天都會來抓取，大家可以試著安裝百度雲加速後臺可以統計出抓取的頁面，如果抓取不夠，也可以在百度站長平臺中設定抓取頻率和sitemap自動推送，這樣抓取的是完全沒有壓力，設定方法如下：

開啟【百度站長平臺】點選左側導航【我的網站】-【站點管理】-【新增網站】-輸入網站域名，根據自身條件驗證網站。

然後點選左側導航【頁面抓取】-【連結管理】-提交方式選擇【sitemap】，然後將自己的網站地圖提交上去，更新時間更具你網站的更新時間來設定，比如網站每天更新一篇文章，那麼就填寫1天，論壇、門戶可能新增的比較多。

另外，在把sitemap地圖寫到robots裡面，抓取基本是完全沒有問題，那麼接下來就進入識別系統，每一個頁面抓取了，就一定會進行識別對比，是否會出現重複，與網際網路的內容重複度有多少，從而判斷出頁面的原創度，那麼在已經判斷出原創度的時候，再來談收錄，先收錄誰不代表誰就是原創了!

關於文章SEO原創度的一些觀點和看法

　　2、為什麼抄襲者的網站更容易收錄?

那麼還有一個問題來了，既然要抓取、識別、釋放這麼複雜的流程，為何抄襲我們網站的內容還先收錄呢?這是大家很糾結的這個問題，我也糾結了很久，直到有一天，我自己做了一個平臺，每天讓自媒體人釋出非常原創內容的時候，我才總結出來，為何越抄襲越容易收錄!

在談論抄襲者網站為何會收錄塊的時候，我覺得咱們先要搞清楚新聞內容是收錄流程，新聞內容相對普通的內容收錄較快，因為新聞內容具有時效性，所以必須當場發當場收錄，然後釋放出來，不然拖到第二天在收錄的話，這個新聞可能不熱了，關注的人也就少了，百度從而失去了這個體驗。

而抄襲者的網站與新聞內容類似，通常抄襲者的網站是抄襲過多篇文章，其中有直接抄襲原創者，也就抄襲二手文章，抄來抄去，網際網路同樣的文章就非常多了，當一篇文章被網際網路多次抄襲，這就意味著這篇文章比較熱門，不熱門怎麼會這麼多人抄襲呢?最終就出現了一個熱點效應，收錄的門檻也就降低了，所以就出現了抄襲者抄襲了你的文章，比你還先收錄。

　　3、如何判斷文章的原創度?

並不是你網站有文章，是你自己寫的，就一定會被搜尋引擎認為這是一篇原創文章，因為其中還有很多技術方面的問題，搜尋引擎還未能解決。

記得我曾經在一個網站每天更新一篇文章，一篇文章的字數只有100字左右，但是文章頁面非常簡單，簡單到整個頁面沒有JS、CSS、HTML程式碼，只有文字，但收錄卻非常好，而有一些網站，用JS、CSS、html程式碼把網站修飾的非常漂亮，但是釋出的文章卻不收錄，這讓我開始覺得程式碼與原創度有直接關係。

我忘記了，在哪裡看到過這樣的一句話“搜尋引擎只能識別200KB以內的內容”，對於一個網站而言，200KB算是很大了，馬海祥部落格只有30KB左右，所以馬海祥部落格在搜尋引擎中抓取是完全沒有壓力，如果你的網站有超過200KB，我覺得你是應該要優化了。

這和網站的檔案大小有什麼關係呢?好，我們來看看，搜尋引擎在抓取一個頁面的流程是從頭到底，任何一個頁面都有一個共同點，那就是頭部一樣、底部一樣，唯一不一樣的就是文章內容，那麼搜尋引擎在抓取頭部有10KB左右是一模一樣的，到中部文字的時候只有2KB是不一樣的，而底部又有10KB是一模一樣的，那麼還會認為這是原創文章嗎?

這裡還得給大家灌輸一個理念，那就是搜尋引擎是不認識字的，他只有把這個漢字放到他的資料庫去對比，當一對比一個新文章頁面的時候，總共22KB的頁面，居然有20KB一模一樣，就算是寫了原創文章，也會被列入到偽原創的列表中去。

經過我3年的SEO優化加測試，我對原創文章的判斷得出了這樣的一個理論，當一個頁面比較大的時候，一個頁面的不同點至少佔頁面的1/3，那麼寫多少文字呢?比如你頁面有10KB，那麼至少的寫3KB的文字，剩下的7KB相同，這些才不容易被列入到偽原創的列表中，當然，這是我個人得出的理論，並沒有完全的證據和理論來證明。

　　4、按照百度演算法把握原創關鍵點

網站的要害前提是高質量的內容，內容在規劃時要剖析要害字和擺設要害字，對文章進行整篇籌劃，融入SEO思維，所以要害詞在進行擺設時就需求很多的內容，網站編纂就需求先撰寫好文章，並嵌入要害字，把主要害字或許長尾關鍵詞要害字擺設好。

標籤： SEO 文章觀點

圖文推薦