ChatGPT多模態實測!AI究竟識唔識?6大任務全面挑機!廁紙、數錢、揀衫、沖咖啡、檢查牛奶到期日、啤牌概率

ChatGPT多模態實測!AI究竟識唔識?6大任務全面挑機!廁紙、數錢、揀衫、沖咖啡、檢查牛奶到期日、啤牌概率

隨住近年AI技術爆發,各大科技巨頭如 OpenAI、Anthropic、Google 等都馬不停蹄推出新功能或升級版本。尤其自從出現了「Deepseek」之後,坊間更炒得熱哄哄,令到其他AI公司都十分緊張,產生了所謂「黏魚效應」。ChatGPT 亦不甘示弱,新推出的多模態(Multimodal)功能讓人眼前一亮。今次就同大家分享一下我實測的 6 大任務,逐一測試 ChatGPT 多模態版究竟有幾多真本事!


一、前言:ChatGPT多模態的新體驗

傳統上,大家對 ChatGPT 的印象可能就只停留在文字對答層面,譬如打字問問題、生成文字、幫手整理資料等等。不過,隨住多模態版本的推出,ChatGPT 可以支援更多的輸入模式,包括圖片、聲音等,並且有能力「看到」畫面、作即時回應。
在這個情境下,你可以:

  • 用電話鏡頭對準一件物件,實時發問。
  • 當場跟 ChatGPT 說話,聽完你的問題之後,它可以馬上結合「視覺」及「語音」來作答。
  • 甚至可以在對話期間同時上網搜尋(如果連接到網絡插件或具備上網功能),幫你即時查價或者比對資訊。

簡單嚟講,ChatGPT 多模態等於把「眼、耳、口」都賦予了 AI——不再只是單純文字模式。於是我就突發奇想,設計了 6 個日常生活中會遇到的情境,想 test 下這個新功能到底有咩實際用途,以及準確度去到邊度!


二、6大實測任務簡介

為了盡量覆蓋唔同場景,我設計咗以下 6 個挑戰:

  1. 廁紙查價
    • 拿住一款廁紙,叫 ChatGPT 幫手上網搜尋在香港超市或網上平台賣幾錢。
  2. 數錢兼兌換日圓
    • 用手機鏡頭對準一疊現金,看看 ChatGPT 會唔會數對錢數,然後再即時上網幫手查今日港幣對日圓的匯率。
  3. 活動穿搭:幫我揀衫
    • 對住兩件衫,問 ChatGPT:明日我要去一個 IT 活動,想低調一點又有型,應該揀邊件?
  4. 咖啡機教學
    • 有一部陌生牌子的咖啡機,用手機對住咖啡機,想請 AI 幫手教下如何使用、操作步驟等等。
  5. 檢查牛奶到期日
    • 用手機鏡頭對準一盒牛奶或奶制品,請 AI 幫忙找出有效日期,並判斷有冇過期。
  6. 啤牌概率:Showhand勝算
    • 與 AI 一齊玩 “Showhand”,將牌面給 ChatGPT 睇,問下佢計埋對手的牌,目前我的勝算有幾高。

以下就同大家仔細分享每個任務的測試過程,同埋心得!


三、詳細實測過程與結果

1. 廁紙查價

挑戰內容:

  • 我手上有個某牌子廁紙,要求 ChatGPT 在香港超市或網上平台(如百佳、屈臣氏等)查價錢。

測試過程:

  • 打開 ChatGPT 多模態功能,將手機鏡頭對準廁紙外包裝,然後對著 AI 說:「幫我查吓香港區域而家幾錢,可以試吓屈臣氏或者百佳。」

結果觀察:

  • ChatGPT 的確嘗試給出一個「約莫」的價錢,並且引導去某網站查看。
  • 有時佢會顯示一個建議的零售價,但由於平台、折扣、包裝數量等因素,未必能夠 100% 精準。
  • 整體而言,ChatGPT 在回答香港本地超市價格時,資訊有機會較為籠統或者未能即時更新。若然未安裝官方的網上搜尋插件或功能,它會提供「參考價」,建議你再去確定。

心得:

  • 若單純做個參考,AI 估唔估中個大概幅度都 OK,但如果要精準到仙仙聲,最好去官方網站或有本地連結的搜尋功能再核實。

2. 數錢兼兌換日圓

挑戰內容:

  • 有一疊港幣現金,隨手擺喺枱面,請 ChatGPT 幫手「視覺」數吓有幾多錢,然後即時查日圓匯率並換算。

測試過程:

  • 我對住電話話:「幫我數吓呢疊錢,然後幫我查吓港幣對日圓匯率,計算一下可以換到幾多日圓。」

結果觀察:

  • 數錢過程出現失誤:有時候ChatGPT 會重複報出不正確的金額,好似錯把「幾張 100 元」當作某個總和。
  • 最後我只好自己補充:「當它是 2000 元」去計算,ChatGPT 即以目前大約匯率0.06(例子)去幫我計算。
  • 不過,這都要留意:實際日圓匯率會隨時變動,AI 提供的數字只能作參考,真要去銀行或找錢莊,匯率隨時唔同。

心得:

  • ChatGPT 對於「數現金」呢種工作,因為需要視覺辨識並且做一個精細計算,暫時存在誤差。
  • 自動兌換計算都算快,但結果不一定保證實時匯率,最終仍需要自己再檢查。

3. 活動穿搭:幫我揀衫

挑戰內容:

  • 有兩件衫放喺鏡頭前面,分別是紅色同黑色。問 ChatGPT:「聽日要去一個好勁的 IT 活動,想低調又要有點型格,應該著邊件?」

測試過程:

  • ChatGPT 可以「睇到」兩件衫的顏色以及簡單款式。
  • 它先問我想要咩感覺,例如想搶眼定想低調?

結果觀察:

  • 最後 ChatGPT 建議,如果我想要「低調帶點型」,就選擇黑色衫;如果想「好醒目」,就著紅色。
  • 還教我可以配一條有特色的飾物,例如銀鏈、皮帶鏈等等來增添個性。
  • 以一個「AI時裝顧問」角度嚟講,整體回答有點基本但尚算實用。

心得:

  • ChatGPT 能給予一定的配搭建議,也能「睇到」衫的顏色。對於日常有選擇困難症的朋友,算係幾有趣的功能。

4. 咖啡機教學

挑戰內容:

  • 拎住部全新或不熟悉牌子的咖啡機,照住鏡頭問 ChatGPT:「點樣用呀?插電後我要撳邊個掣?落水喉要點樣裝?」

測試過程:

  • AI 理應可以辨認咖啡機的按鍵或操作介面,然後向你提供基本步驟。

結果觀察:

  • 實際運作中,ChatGPT 有時會提供一個「大路」的咖啡機操作流程,譬如先加水、裝咖啡粉、然後開電源等待機器預熱等。
  • 但若然咖啡機的型號非常冷門,或者介面設計比較複雜,ChatGPT 未必能百分百識得。
  • 如果機身上冇太多清晰文字或指示,AI 可以參考的資訊就相對有限,可能只能給一些「通用指引」。

心得:

  • 如果部咖啡機是主流牌子或市面常見型號,ChatGPT 可能就能給到更準確的步驟指引。
  • 但如要深入教學,例如怎樣清洗、除垢、特定功能按鍵,就要睇下 ChatGPT「睇得清唔清楚」咖啡機上的標示。

5. 檢查牛奶到期日

挑戰內容:

  • 拎住一盒牛奶(或相似奶制品),讓手機鏡頭正對著包裝,問 ChatGPT:「可以幫我睇吓有效日期同現時有冇過期?」

測試過程:

  • ChatGPT 在鏡頭拍到盒裝的時候,理應可以辨認日期標籤,然後讀出來。
  • 但如果標籤細小,或者反光,或者拍攝角度不好,都會影響辨識度。

結果觀察:

  • 有時 ChatGPT 會把日期讀錯,或者要重試幾次先會讀到正確文字。
  • 若日期顯示為 2025 年 2 月 18 日,AI 會評估一下今天日期,然後話「尚未過期」或者「快將到期」。
  • 仍然要留意:如果封面字體特殊,或者位置比較隱蔽,AI 辨識上可能有誤差。

心得:

  • 幫手檢查食品有效期,算係一個方便但有時限度的功能。拍照時最好確保光線充足、焦點清晰,讓 ChatGPT 更容易辨別。

6. 啤牌概率:Showhand勝算

挑戰內容:

  • 與 ChatGPT「一齊玩牌」,利用手機鏡頭拍住自己手牌及公共牌,並且告訴 AI 對手牌面,問:「我贏佢機會有幾大?」

測試過程:

  • 我試咗拍住幾張撲克牌,像係A、K、8、3,對手可能有J、Q、4之類,想 ChatGPT 幫手計下我嘅勝算大概有幾多%。
  • 理論上 AI 需要根據德州撲克或 Showhand 的規則,計算出可能剩餘牌組,然後計算贏面。

結果觀察:

  • ChatGPT 閱讀撲克資訊後,有時會將牌型辨認錯,例如 A 說成 O,或者 J、Q、K 混淆。
  • 有時它會直接判斷「你有一對 A,所以優勢較大」,但又可能把對手牌面混合在一起。
  • 為了做大概概率計算,其實要考慮所有未翻開牌及组合,不過 ChatGPT 多數只能給一個粗略答案,好似話「你的排面優勢較明顯」。
  • 數學邏輯上,有時它會搞錯牌型判斷,未必可以非常準確給你一個百分比。這方面顯示 AI 多模態仍有改善空間。

心得:

  • 想當 AI 為「賭神輔助」可能仲未得,不過用作閒聊或者大概計算一下,還是挺有趣的實驗。

四、實測心得與體會

  1. 多模態功能新鮮有趣
    最直觀的感覺,肯定是從「純文字對答」升級到「看得見周遭物件」的交互方式。如果拍攝得當、光線充足,ChatGPT 識得認出物件或文案,然後再結合搜尋、語音進行回答,令人感覺就好似同一個人溝通咁方便。
  2. 現實環境挑戰多
    真正日常應用時,光線、拍攝角度、包裝反光、字體款式、資訊的即時性等,都會令 AI 辨識出現偏差。有時要多試幾次,或者補充一些口頭提示,先至有機會得到正確結果。
  3. 資料更新與實時性
    例如查價、匯率等,用戶期望 AI 能給到「最新最準確」的數字。但如果多模態版本未有即時上網搜索的能力,或者資料庫未更新,AI 只能提供有限度參考。真正要有實時資訊,仍需與網絡搜索服務融合。
  4. 判斷與計算層面的錯誤
    數錢、計排面勝算等涉及「精準度」的任務時,AI 都可能「亂龍」,出現重複或錯漏判斷。我哋要有心理準備,AI 暫未做到 100% 完美,而且也需注意它識別細節時的侷限。
  5. 應用場景仍具潛力
    不過,從整體而言,ChatGPT 多模態為未來的 AI 發展提供了更大空間——圖像辨識、語音交互、即時分析等功能配合,將來不論在教育、生活小助手、視障人士輔助、商業應用等領域,都很可能大派用場。

五、總結

今次的 6 大任務體驗,讓我見識到 ChatGPT 多模態功能既「驚喜」又「不足」的部分。日常小助手層面,它的確有一定參考價值:

  • 幫手做初步查價、選衫建議、簡單兌換匯率、讀出商品有效期等,能幫大家慳返唔少時間。
  • 但數量較多的精準計算、特別複雜的操作(例如罕見型號咖啡機),或者真正要「賭神」級別的概率計算,AI 就未必能一次過做得好完美。

展望未來,當 ChatGPT 與實時搜索、強化的電腦視覺技術結合得越深入,亦隨住演算法及語料庫不斷提升,多模態應用一定會越來越成熟。對用戶而言,最終目標當然係「一指神功」:拿起手機、一掃一拍一問,就可以得到準確又實時的解答。

如果你對今次的多模態功能有興趣,不妨留意官方更新,或者尋找相關示範教學片。當然,你亦可以想像更多創新用例,好似裝修報價、衣服尺寸搭配、甚至植物病蟲害診斷等等,都可以嘗試挑戰 AI!總之,AI 技術日新月異,我們要做的,就是帶著好奇心,大量嘗試,看看新功能如何顛覆我們日常生活的可能性。

Similar Posts

Leave a Reply