OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決

在 AI 圖像生成領域,OpenAI 一直是強勢的競爭者。但最近 Google 推出的 Nano Banana Pro(根據影片內容指稱)似乎來勢洶洶。今天我們就透過 5 個不同的實際測試場景,來看看這兩款 AI 模型究竟誰比較好用?是擅長理解複雜指令的 OpenAI,還是支援 4K 高畫質與繁體中文的 Nano Banana Pro?

測試一:Cyberpunk 風格雜誌廣告

第一個測試要求 AI 製作一個帶有產品名稱且具備 Cyberpunk 風格的雜誌廣告。

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決
  • OpenAI: 選擇了直式廣告設計,背景較為模糊,前景清晰,文字拼寫正確且具真實感,像是一個能量飲料廣告 。
  • Nano Banana Pro: 理解稍有不同,將其設計得像是一本書的封面。背景有一輛廢棄車輛,細節較為清晰,整體氛圍較為自然,但風格上比較像書籍而非單純廣告 。

測試二:微距攝影(覆盆子與水珠)

為了測試逼真程度,第二個 Prompt 要求繪製帶有水珠的覆盆子(Raspberry)。

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決
  • OpenAI: 水珠非常清晰,圖像不顯得「塑膠感」,真實度相當高 。
  • Nano Banana Pro: 雖然看起來也很自然,但相比之下帶有一點點「糖果」的感覺。主觀來說,OpenAI 在這個純攝影真實感的測試中略勝一籌 7

測試三:複雜構圖(桌面、貓與雜物)

這個測試考驗 AI 對物體位置的理解:桌上有咖啡、筆,中間有一隻貓。

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決
  • OpenAI: 雖然物體都畫出來了,但左下角的物件帶有油畫感,不夠真實。貓咪在書本中間的界線處理得不夠好 。
  • Nano Banana Pro: 空間還原度較好。它畫出了一本打開的筆記本,中間的裝訂線非常清晰,整體真實感和還原度在這個場景中表現較佳 。

測試四:王家衛風格(Cinematic Style)

Prompt 要求「王家衛風格」、太空人在餐廳吃漢堡、微控燈光,設定年份為 98 年。

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決
  • OpenAI: 顏色和手指細節都正常,符合要求 。
  • Nano Banana Pro: 細節驚人,玻璃上的水珠、衣服的紋理都處理得非常仔細,畫面清晰度比 OpenAI 更高,展現了其高解析度的優勢 。

測試五:繁體中文 Infographic (關鍵勝負)

最後一個測試直接使用明報的新聞內容,要求生成帶有繁體中文的資訊圖表 (Infographics)。

OpenAI 遇到強敵?Google Nano Banana Pro 與 GPT Image 實測:畫質、速度與中文能力的終極對決
  • OpenAI: 這是 OpenAI 的弱項。指示牌和「駕駛」等字體模糊不清,錯誤較多 。
  • Nano Banana Pro: 發揮了 Google 資料庫的優勢。「駕駛」二字非常清晰,路牌指示也相對準確。雖然在車道線條的邏輯上可能有些許瑕疵,但在中文字的準確性上,Google 完勝 OpenAI 。

規格與數據對比

除了畫面對決,我們也整理了兩者的技術規格差異 :

項目OpenAI GPT ImageGoogle Nano Banana Pro
解析度最高 1.5K預設 2K,最高可達 4K (更清晰)
生成速度較慢 (約 30 秒)極快 (約 10-15 秒)
比例選項3 種8 種
參考圖數量5 張14 張
多語言能力英文較強,中文較弱支援多語言,中文表現優異
成本 (約)$1.2 港幣/張 (1K)$2.4 港幣/張 (4K)

結論:你該選哪一個?

  • 選擇 OpenAI: 如果你需要 AI 處理非常複雜的指令 (Instruction),OpenAI 目前在理解複雜 Prompt 上仍有優勢,且在 LM Arena 的評分中暫時領先 。
  • 選擇 Nano Banana Pro: 如果你需要高解析度 (4K) 的圖片、繁體中文內容,或者希望透過參考圖 (Reference Image) 來精準控制輸出效果,Google 的模型是更好的選擇。此外,它具備 “Grounding” 功能,會先搜尋資訊並查核事實後再作圖,這點對於需要準確資訊的創作者非常有價值 。

Similar Posts

Leave a Reply