Canonical 意思是什麼?被內容農場爬文可以利用 canonical SEO 設定解決嗎?
這次會分享的是關於 Canonical 的 SEO 設定包括普通網站、電商網站、https 和 http,當然不能少的是如果被内容農場爬文時候的處理手法
Canonical 影片解説
Canonical 中文是什麼?
今天講 canonical 連結,canonical 中文是標準網址。
Canonical 意思是什麼?如何整合重複的網址?
簡單來説,Canonical 就是整合重複的網址,令 Google 搜尋 URL 時,顯示原創內容的手段。
什麼是 Canonical? Canonical 語法是什麼?
如果同一篇內容出現在網站的多個頁面,搜尋引擎也只會顯示一次,因此你要告訴搜尋引擎通過關鍵字找到的這些相同的文章,應該顯示哪個頁面的才對,這個語法就是 canonical 語法,即表示原創或主要的頁面。
這類就是自己衍生出來的重複的內容。
另一類是被盜內容,很多內容農場看上你的內容,就直接抄出來放在他們的網站。
搜尋引擎也會看到兩篇一模一樣的內容,搜尋引擎只會選一篇來顯示。
你應該將你的那篇設定為 canonical (原創),留意自己的網站 source code 是否做好了這個設定。
但是盜竊者也會說自己是原創,這種情況也是可以有應對方法的,稍後會讓大家看一些。
如何進行 canonical SEO 設定?
最重要是如果你可以管理,你必須設定 canonical,讓搜尋引擎知道哪個才是原創內容,其他網站的內容,用家還是可以看到的,純粹是讓搜尋引擎知道並顯示原創的內容。
至於為何會有 canonical tag,Google canonical URL 例子
例子一:普通網站
這裡有個例子,第 1 個是普通網站,第 2 個是手機版,第 3 個是 AMP 版,同一篇內容已經有 3 個連結.
如果沒有設定 canonical,Google 會以為是 3 篇相同內容,然後選一篇,可是你不會知道 Google 選哪一個來顯示,除非你明確告訴它選哪一個。
例子二:網店
第 2 個常見在網店,第 1 個 link 是用戶搜尋某個顏色分類,第 2 個是通過一個 ID 連過去的,另外還有其他連結方式。
這種情況也要通知 Google 哪個是原創。
例子三:WordPress 網站的分類頁
第 3 個情況,如果你用 WordPress 或其他 blog 的系統,寫 blog 的時候會將文章分類,有時同一篇內容會多於一個分類,這樣就有機會有兩個分類的連結,這種情況也需要做 canonical。
例子四:http 及 https
另外,有人會將網址的 http 和 https,或有 / 無 www 做 redirection,這也會衍生很多頁面,因此也要設定好,不要讓搜尋引擎誤會有 3 篇,而其實只是為了做 redirection 功能。
被內容農場爬文如何處理?
剛才提到可能會遇到的困境,盜竊你内容的內容農場,當然不會告訴搜尋引擎你才是原創,反而可能會說他自己是原創,因為他可以在網站的加一些語法,告訴搜尋引擎他是原創。
最壞的情況是你的網站結構不怎麼樣,有新內容也不主動通知搜尋引擎,而是等搜尋引擎自己需要 7 個天後才找到你的新內容;
另一方面,盜竊內容者又很會做網站管理,拿了你的內容後馬上通知搜尋引擎有新內容,搜尋引擎依時序首先看到的內容是盜竊者的,就會把它當成原創了,然後關鍵字搜尋到盜竊者的網站,而不是你的網站。
這個情況當然讓人氣憤,你聯絡該網主也肯定不得要領。
本來搜尋引擎有演算法判斷內容是否原創,但你的連結是後來才看到的,所以認為你的不是原創。
延伸閲讀
向 Google 報告抄襲者的內容連結
有一個方法,搜尋引擎會告訴你,如果你遇到 copycat 抄襲者,填一個表格通知搜尋引擎,要求移走侵權的內容。
有幾種情況,侵權算是非法,就循法律途徑做;
版權方面,比如顯示的內容不當,可以點 web search,要求在搜尋引擎裡移除某些錯誤 / 抄襲 / 私隱內容,然後等搜尋引擎的答覆。
小結與建議
如果盜竊情況持續,你也持續跟搜尋引擎投訴,到一定量的時候,如果對方也用 Google / Gmail 帳戶的話,Google 會將盜竊者的帳戶註銷,這是你最後可以做的投訴方法。
不過我認為最佳做法是一有新內容,馬上通知搜尋引擎,防範於未然,不要等出事才求救。
所以要做的是有新內容要盡早告訴 Google,相同的內容要設定好哪一篇要讓搜尋引擎找到,這就是做 canonical 的過程。