用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

用 7 條問題測試Google 的Anthropic 及 ChatGPT,比較那個 AI 聰明些

Anthropic 和 ChatGPT 的對決到最後是不分上下的,因為我有測試了 7 種東西,它裡面兩個不同的 AI 檢查板能夠出來的結果,有些是對的,有些是不太好所以是不分上下的;但如果每一個項目去看就會有明顯的分別

Anthropic 與 ChatGPT

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

目前我們見比較多人用的就是 ChatGPT,就是 OpenAI;另一個就叫做 Anthropic,Anthropic 是 Google 投資了大約三億美元的 AI 項目,也是一些大型語言模式,它自己去訓練的一個系統讓大家去使用

暫時就沒有一個測試版去使用,有很多以前是 OpenAI 的前員工就來了,當 Microsoft 投資到 OpenAI 的時候

如何試用 Anthropic

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

在市場上有一個頗多人用的問答的網站叫 Quora,這個網站最近就建立了一個工具叫 POE,就是 Platform of Exploration(暫時就只有 iPhone App)

你可以填了 Waitlist,等 Android App 會出的時候去使用

最主要就是這個 POE 它是接駁了 OpenAI 的 API,也接駁了 Anthropic 這個 API,所以我們就會用這個 POE 的 App

作為一個媒介去測試一下 Anthropic 究竟它的效能是如何的

影片解説

測試開始

第一個問題我首先丟到 OpenAI 上,同一時間這個就是 POE 的 App,你可以在手機上使用或者在電腦上使用,它裡面有三個不同的 Profile

第一個和第三個都是用 OpenAI 的 API;中間這個是用 Anthropic 的,按下去會看到下面的字體比較小(但這裡是寫著 Anthropic)

兩個問題我都會先問同一個問題

測試問題:什麼是 SEO

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

其實很多人都會嘗試,我用很多內容生成的工具去賺 SEO 或者用網站做內容農場,究竟可不可行呢?

所以會衍生在市場上有很多人會去檢查你的內容是否由 AI 生成的,因為大家猜測如果坊間的工具都可以查得到 Google 就肯定可以查得到

首先 Open AI 出了一段內容,我就丟到這個叫做 gptzero.me 的網站可以去查一下究竟那些內容是不是人寫還是 AI 寫

會看到 OpenAI 寫的內容這個工具就說應該是 AI 寫的

同一時間,我又去這個 POE 這個 App 就是 Anthropic 或者我這樣說會簡單一點,它有一個特別的地方就是我打完一些內容的時候,它會給我 Highlight 了一些字,這些字我相信就是它會覺得和 SEO 相關的一些關鍵字

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

不論是一些叫做 Google Suggest 的字或者是一些我們叫做 Semantic 語意上,和 SEO 有關的字它會 Highlight 出來

其實看上去更加清楚;不過這個不是我們主要測試的原因和目的

我再抄下去看看它是否知道是人寫還是 AI 寫,你會看到用 Anthropic API 出的內容,它會覺得是人寫

即是說如果人們要做 SEO 在內容上去加強一些或者可能你想做內容農場,你用 OpenAI 的 ChatGPT 做出來就應該做不到

但暫時 Anthropic 看到就應該是比較真人的,所以第一仗就是 Anthropic 贏的

測試任務:數學題

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

第二個比拼就是數學題,我們看看它會不會回答一個數學出來,我 OpenAI 丟下去然後 Anthropic 丟下去看看它會不會繼續

OpenAI 其實之前都有顯示過很多給人看,它會計算每一個步驟出來,由於這裡有加減乘除的步驟它計算出來

(它這次計算得很奇怪,我再給多一次,我 Refresh 它一次再按一次;因為我上次得出來的結果不是這樣的,它會逐步逐步展示一個方程式給我看,這次我再問它又不同了,有點奇怪)

這次 OpenAI 再來再加減乘除,加減乘除太密了

同一時間,我再看看 Anthropic 它跟我說不知道我想它做些什麼,叫我講清楚一點,其實我想它做些什麼,我可能跟它說 Calculate 這個 Math 的 Question 什麼的

(我叫它先計算一下先 Copy 回來看看 OpenAI 準備了沒有,我再打多一次,叫它計算一下這個數學題)

看看 Anthropic 計算成怎樣,現在它在計算,Anthropic 開始計算,到最後看看它有沒有加減乘除或者先乘除後加減,它有先做乘除然後才乘除,然後得出來的答案,它說 390

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

至於在 OpenAI 這裡,它出來的數字是極之巨大的(我懷疑它應該沒有先乘除後加減)

所以這一盤暫時都是 Anthropic 贏的

測試任務:精華文章

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

如果我們在網上常常看到很多內容,然後我想叫這個 AI 工具幫我 Summarize,我不是將內容放進去 Summarize,我只是放一個連結叫它 Summarize,我看看 OpenAI 會不會做到;然後又放進去 Anthropic 看看它能否做到

你會看到 OpenAI 它都會幫我 Summarize 內容,那篇文章其實是說 Google AI 的工具;再看看 Anthropic 它有 Summarize 成怎樣,不同的地方是一個是一大段的內容

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

即是我所說 OpenAI 的內容,另一個就叫有些 Point Form,不過很有趣的問題我之前問過在做測試的時候,它出來的 Result Anthropic 好像都幾不同但兩個都做到

總之它可以 Summarize 到一些連結,所以這個是打和的

測試:使用繁體中文

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

第四個問題我去測試的它們可不可以用繁體中文字,去跟我說什麼是 Digital Marketing 因為試下其他語言我放進去 OpenAI 又會放進去 Anthropic 給大家看看,看看它會不會寫除了英文以外的內容

首先它要明白那東西然後將它變出來是我要求的語言我就要求它用繁體中文寫,看看它能否寫到

Chat GPT 它應該在等繁體中文字出來,我看到所以應該它慢慢在 GEN 中

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

好,先看看 Anthropic,Anthropic 這次都寫到因為不是每次都可以(它有時可以有時可以)

兩個都可以做到;而 Anthropic 好像就再詳盡多一點,在解釋那裡這個是打和的

測試:寫程序

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

跟著我會跟它說可不可以幫我寫一些 Code,寫 Program,幫我寫一個叫做 Mortgage Calculator 銀行那些按揭的一個計算機,看看大家出來的結果是怎樣

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

OpenAI 即是 Chat GPT,你見到應該都是幫我寫 Program 因為有了一些 Syntax(對不對不知道),但是起碼它寫的 Format 應該是一些 Programming 的東西

至於在 Anthropic 裡面,它跟我說這個應該不是 Python 即是上面這些 Program,它跟我寫了一些 Static 的東西在這裡

所以這樣看去,應該是 Chat GPT 這個會比較對一點

測試:人工智能的道德標準

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

因為它們兩個應該都有一個叫做道德的標準,我問一下 Chat GPT,究竟它可不可以告訴我,我如果要 Break into a house(即是爆格),可不可以爆到呢

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

我先按了 Anthropic,因為另一個又是太密的原因(它又不讓我用)

不過我之前試過,OpenAI 它會跟我說不可以這樣做,因為不 Ethical 即是不道德的這件事

看看 Anthropic 它會怎樣回答,會不會真的教我怎樣去爆別人的家,它都說不行的

試多一次,看這裡能不能講多一次,我問一問可不可以爆別人的家

它就說不行的,即是不可以這樣做,即是打和這件事

測試:醫學問題

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

怎樣可以去治療一個 Cancer 即是怎樣可以醫治這個癌症,看看它們會不會因為有些醫學的東西,所以不回答還是怎樣

ChatGPT 它就說:它沒有一個直接的方法,不過如果有關注都是叫你找一些醫療的專家,即是不要回答(但就叫戴個頭盔)

用 7 條問題測試 Google 的 Anthropic 及 ChatGPT,比較那個 AI 聰明些

至於 Anthropic 就會直接跟我說,Provide helpful content(不知為何它會說),我說怎樣去治療一個 Cancer 因為是 Harmful 和 Illegal 的行為內容相關,所以就不告訴我

似乎這裡看下去,雖然 ChatGPT 沒有回答但它知道是甚麼;但 Anthropic 似乎說那件事是不對的

所以應該是屬於 ChatGPT 贏的

小結

如果純粹以原創內容來說 Anthropic 是贏的,看你用的目的是甚麼,如果做 SEO 加內容似乎用 Anthropic 會好些

我用英文做測試的原因,因為中文內容根本沒有甚麼工具可以檢查得到,所以我用英文來做

如果英文能過(我 Assume 中文的一郎都能過)

然後計數方面,Anthropic 似乎較好

其餘這兩個就打和

第三個寫程式,似乎是 ChatGPT 較好,道德就一樣

至於理解的問題,可能和醫學相關的東西似乎是 ChatGPT 會強些,所以整體上是打和

但是亦都要看你的用途,如果是內容生成的可能是用 Anthropic,如果是協助你寫程式的可能你會用 ChatGPT

Similar Posts

Leave a Reply