「學術研究」抄文會被Google捉?究竟文章要改成點先可以避開Google大神的法眼
今天跟大家說的是一位學員提出的問題,他想提升 SEO 排名,所以經常要寫很多內容,但是否有足夠的內容量,或者有時真的要參考其他網站內容,然後放在自己的網站,這樣做是否會被Google 罰呢?
影片解説
如果你直接將別人網站上的內容抄進你的網站
Google 會視為 duplicate content (相同内容),抄和被抄的都不會受罰,因為它不知道哪一個是原創,尤其是同一時間同一內容出現在很多網站上。
不過 Google 是可以用 AI 分辨出原創,例如提交給 Google 搜尋的先後次序,先提交的就代表是原創,又或者某個網站的可信度較高。
如果有兩篇文章一模一樣的話
即使在兩個不同的 domain,Google 也只會顯示其中一篇。
給大家看一個例子 (參考以上影片),如何知道我的内容是否被人抄走了,或 Google 是否認爲我抄了別人的内容。
Techcrunch 是美國一個高流量的科技 blog 網站,我找了一篇文章,是講微軟 Azure 雲端比預期賺得更多。
我先抄下它的連結,然後去網站 copyscape,這個網站暫時不支援中、日、韓文,所以我特地找它來做實驗。
延伸閲讀:
我把剛才那個連結放進來做測試
得出的結果是沒有找到跟這篇內容類似的其他內容,這代表了這篇文章是原創內容。
我再次搜尋,結果找到一些跟這篇文章相當接近的內容,我們拿其中一篇對比一下,看到有些字段、數字是一樣的,甚至某些段落的頭尾也十分一樣。
結論就是這個叫 zychrome 的網站明顯抄襲了 techcrunch 的那篇文章,應該是利用機械人做的,因為連內容裏的連結也抄走了。
在 Google 眼中你的文章是否抄襲
如果你不肯定一篇英文文章在Google眼中是否抄襲而來的,或會否當成另一篇文章,你可以拿到這裏來測試。
如果測試結果是零相似,就代表該文章是原創,沒有跟別人相同。
現在 techcrunch 這篇文章有其他相似的文章,Google 就會嘗試去理解哪一篇才是原創文章,Google 認為哪一篇文章是原創,關鍵字搜尋結果就會顯示出哪一個網站的内容了。
至於文章有多少不同才會被視為另一篇內容
我研究了很多網上討論,得出一個大概數據,抄了別人的內容,改動其中30-35%,就會被Google 視爲另一篇內容。
告訴大家這個數據並不是鼓勵大家去抄襲別人的內容,然後改動部分成為自己的內容,而是只是想告訴大家這個測試結果。
小結與建議
不過中文和英文相差很遠,我見過一些中文的內容,只是標題不同,內容 500 多字一模一樣,Google 也當成兩個連結,可能中文難分析,不想英文每個字詞隔開,比較容易比對。
所以如果大家真的有需要“抄考”別人的文章,不要抄太多,借一小部份(引用)然後加自己的評論,Google 就會當時另一篇文章而不是抄襲的文章,不然的話你就不能獲得自然流量了。