AI

ChatGPT多模態實測！AI究竟識唔識？6大任務全面挑機！廁紙、數錢、揀衫、沖咖啡、檢查牛奶到期日、啤牌概率

ChatGPT多模態實測！AI究竟識唔識？6大任務全面挑機！廁紙、數錢、揀衫、沖咖啡、檢查牛奶到期日、啤牌概率

隨住近年AI技術爆發，各大科技巨頭如 OpenAI、Anthropic、Google 等都馬不停蹄推出新功能或升級版本。尤其自從出現了「Deepseek」之後，坊間更炒得熱哄哄，令到其他AI公司都十分緊張，產生了所謂「黏魚效應」。ChatGPT 亦不甘示弱，新推出的多模態（Multimodal）功能讓人眼前一亮。今次就同大家分享一下我實測的 6 大任務，逐一測試 ChatGPT 多模態版究竟有幾多真本事！

目錄顯示

一、前言：ChatGPT多模態的新體驗

傳統上，大家對 ChatGPT 的印象可能就只停留在文字對答層面，譬如打字問問題、生成文字、幫手整理資料等等。不過，隨住多模態版本的推出，ChatGPT 可以支援更多的輸入模式，包括圖片、聲音等，並且有能力「看到」畫面、作即時回應。
在這個情境下，你可以：

用電話鏡頭對準一件物件，實時發問。
當場跟 ChatGPT 說話，聽完你的問題之後，它可以馬上結合「視覺」及「語音」來作答。
甚至可以在對話期間同時上網搜尋（如果連接到網絡插件或具備上網功能），幫你即時查價或者比對資訊。

簡單嚟講，ChatGPT 多模態等於把「眼、耳、口」都賦予了 AI——不再只是單純文字模式。於是我就突發奇想，設計了 6 個日常生活中會遇到的情境，想 test 下這個新功能到底有咩實際用途，以及準確度去到邊度！

二、6大實測任務簡介

為了盡量覆蓋唔同場景，我設計咗以下 6 個挑戰：

廁紙查價
- 拿住一款廁紙，叫 ChatGPT 幫手上網搜尋在香港超市或網上平台賣幾錢。
數錢兼兌換日圓
- 用手機鏡頭對準一疊現金，看看 ChatGPT 會唔會數對錢數，然後再即時上網幫手查今日港幣對日圓的匯率。
活動穿搭：幫我揀衫
- 對住兩件衫，問 ChatGPT：明日我要去一個 IT 活動，想低調一點又有型，應該揀邊件？
咖啡機教學
- 有一部陌生牌子的咖啡機，用手機對住咖啡機，想請 AI 幫手教下如何使用、操作步驟等等。
檢查牛奶到期日
- 用手機鏡頭對準一盒牛奶或奶制品，請 AI 幫忙找出有效日期，並判斷有冇過期。
啤牌概率：Showhand勝算
- 與 AI 一齊玩 “Showhand”，將牌面給 ChatGPT 睇，問下佢計埋對手的牌，目前我的勝算有幾高。

以下就同大家仔細分享每個任務的測試過程，同埋心得！

三、詳細實測過程與結果

1. 廁紙查價

挑戰內容：

我手上有個某牌子廁紙，要求 ChatGPT 在香港超市或網上平台（如百佳、屈臣氏等）查價錢。

測試過程：

打開 ChatGPT 多模態功能，將手機鏡頭對準廁紙外包裝，然後對著 AI 說：「幫我查吓香港區域而家幾錢，可以試吓屈臣氏或者百佳。」

結果觀察：

ChatGPT 的確嘗試給出一個「約莫」的價錢，並且引導去某網站查看。
有時佢會顯示一個建議的零售價，但由於平台、折扣、包裝數量等因素，未必能夠 100% 精準。
整體而言，ChatGPT 在回答香港本地超市價格時，資訊有機會較為籠統或者未能即時更新。若然未安裝官方的網上搜尋插件或功能，它會提供「參考價」，建議你再去確定。

心得：

若單純做個參考，AI 估唔估中個大概幅度都 OK，但如果要精準到仙仙聲，最好去官方網站或有本地連結的搜尋功能再核實。

2. 數錢兼兌換日圓

挑戰內容：

有一疊港幣現金，隨手擺喺枱面，請 ChatGPT 幫手「視覺」數吓有幾多錢，然後即時查日圓匯率並換算。

測試過程：

我對住電話話：「幫我數吓呢疊錢，然後幫我查吓港幣對日圓匯率，計算一下可以換到幾多日圓。」

結果觀察：

數錢過程出現失誤：有時候ChatGPT 會重複報出不正確的金額，好似錯把「幾張 100 元」當作某個總和。
最後我只好自己補充：「當它是 2000 元」去計算，ChatGPT 即以目前大約匯率0.06（例子）去幫我計算。
不過，這都要留意：實際日圓匯率會隨時變動，AI 提供的數字只能作參考，真要去銀行或找錢莊，匯率隨時唔同。

心得：

ChatGPT 對於「數現金」呢種工作，因為需要視覺辨識並且做一個精細計算，暫時存在誤差。
自動兌換計算都算快，但結果不一定保證實時匯率，最終仍需要自己再檢查。

3. 活動穿搭：幫我揀衫

挑戰內容：

有兩件衫放喺鏡頭前面，分別是紅色同黑色。問 ChatGPT：「聽日要去一個好勁的 IT 活動，想低調又要有點型格，應該著邊件？」

測試過程：

ChatGPT 可以「睇到」兩件衫的顏色以及簡單款式。
它先問我想要咩感覺，例如想搶眼定想低調？

結果觀察：

最後 ChatGPT 建議，如果我想要「低調帶點型」，就選擇黑色衫；如果想「好醒目」，就著紅色。
還教我可以配一條有特色的飾物，例如銀鏈、皮帶鏈等等來增添個性。
以一個「AI時裝顧問」角度嚟講，整體回答有點基本但尚算實用。

心得：

ChatGPT 能給予一定的配搭建議，也能「睇到」衫的顏色。對於日常有選擇困難症的朋友，算係幾有趣的功能。

4. 咖啡機教學

挑戰內容：

拎住部全新或不熟悉牌子的咖啡機，照住鏡頭問 ChatGPT：「點樣用呀？插電後我要撳邊個掣？落水喉要點樣裝？」

測試過程：

AI 理應可以辨認咖啡機的按鍵或操作介面，然後向你提供基本步驟。

結果觀察：

實際運作中，ChatGPT 有時會提供一個「大路」的咖啡機操作流程，譬如先加水、裝咖啡粉、然後開電源等待機器預熱等。
但若然咖啡機的型號非常冷門，或者介面設計比較複雜，ChatGPT 未必能百分百識得。
如果機身上冇太多清晰文字或指示，AI 可以參考的資訊就相對有限，可能只能給一些「通用指引」。

心得：

如果部咖啡機是主流牌子或市面常見型號，ChatGPT 可能就能給到更準確的步驟指引。
但如要深入教學，例如怎樣清洗、除垢、特定功能按鍵，就要睇下 ChatGPT「睇得清唔清楚」咖啡機上的標示。

5. 檢查牛奶到期日

挑戰內容：

拎住一盒牛奶（或相似奶制品），讓手機鏡頭正對著包裝，問 ChatGPT：「可以幫我睇吓有效日期同現時有冇過期？」

測試過程：

ChatGPT 在鏡頭拍到盒裝的時候，理應可以辨認日期標籤，然後讀出來。
但如果標籤細小，或者反光，或者拍攝角度不好，都會影響辨識度。

結果觀察：

有時 ChatGPT 會把日期讀錯，或者要重試幾次先會讀到正確文字。
若日期顯示為 2025 年 2 月 18 日，AI 會評估一下今天日期，然後話「尚未過期」或者「快將到期」。
仍然要留意：如果封面字體特殊，或者位置比較隱蔽，AI 辨識上可能有誤差。

心得：

幫手檢查食品有效期，算係一個方便但有時限度的功能。拍照時最好確保光線充足、焦點清晰，讓 ChatGPT 更容易辨別。

6. 啤牌概率：Showhand勝算

挑戰內容：

與 ChatGPT「一齊玩牌」，利用手機鏡頭拍住自己手牌及公共牌，並且告訴 AI 對手牌面，問：「我贏佢機會有幾大？」

測試過程：

我試咗拍住幾張撲克牌，像係A、K、8、3，對手可能有J、Q、4之類，想 ChatGPT 幫手計下我嘅勝算大概有幾多%。
理論上 AI 需要根據德州撲克或 Showhand 的規則，計算出可能剩餘牌組，然後計算贏面。

結果觀察：

ChatGPT 閱讀撲克資訊後，有時會將牌型辨認錯，例如 A 說成 O，或者 J、Q、K 混淆。
有時它會直接判斷「你有一對 A，所以優勢較大」，但又可能把對手牌面混合在一起。
為了做大概概率計算，其實要考慮所有未翻開牌及组合，不過 ChatGPT 多數只能給一個粗略答案，好似話「你的排面優勢較明顯」。
數學邏輯上，有時它會搞錯牌型判斷，未必可以非常準確給你一個百分比。這方面顯示 AI 多模態仍有改善空間。

心得：

想當 AI 為「賭神輔助」可能仲未得，不過用作閒聊或者大概計算一下，還是挺有趣的實驗。

四、實測心得與體會

多模態功能新鮮有趣
最直觀的感覺，肯定是從「純文字對答」升級到「看得見周遭物件」的交互方式。如果拍攝得當、光線充足，ChatGPT 識得認出物件或文案，然後再結合搜尋、語音進行回答，令人感覺就好似同一個人溝通咁方便。
現實環境挑戰多
真正日常應用時，光線、拍攝角度、包裝反光、字體款式、資訊的即時性等，都會令 AI 辨識出現偏差。有時要多試幾次，或者補充一些口頭提示，先至有機會得到正確結果。
資料更新與實時性
例如查價、匯率等，用戶期望 AI 能給到「最新最準確」的數字。但如果多模態版本未有即時上網搜索的能力，或者資料庫未更新，AI 只能提供有限度參考。真正要有實時資訊，仍需與網絡搜索服務融合。
判斷與計算層面的錯誤
數錢、計排面勝算等涉及「精準度」的任務時，AI 都可能「亂龍」，出現重複或錯漏判斷。我哋要有心理準備，AI 暫未做到 100% 完美，而且也需注意它識別細節時的侷限。
應用場景仍具潛力
不過，從整體而言，ChatGPT 多模態為未來的 AI 發展提供了更大空間——圖像辨識、語音交互、即時分析等功能配合，將來不論在教育、生活小助手、視障人士輔助、商業應用等領域，都很可能大派用場。

五、總結

今次的 6 大任務體驗，讓我見識到 ChatGPT 多模態功能既「驚喜」又「不足」的部分。日常小助手層面，它的確有一定參考價值：

幫手做初步查價、選衫建議、簡單兌換匯率、讀出商品有效期等，能幫大家慳返唔少時間。
但數量較多的精準計算、特別複雜的操作（例如罕見型號咖啡機），或者真正要「賭神」級別的概率計算，AI 就未必能一次過做得好完美。

展望未來，當 ChatGPT 與實時搜索、強化的電腦視覺技術結合得越深入，亦隨住演算法及語料庫不斷提升，多模態應用一定會越來越成熟。對用戶而言，最終目標當然係「一指神功」：拿起手機、一掃一拍一問，就可以得到準確又實時的解答。

如果你對今次的多模態功能有興趣，不妨留意官方更新，或者尋找相關示範教學片。當然，你亦可以想像更多創新用例，好似裝修報價、衣服尺寸搭配、甚至植物病蟲害診斷等等，都可以嘗試挑戰 AI！總之，AI 技術日新月異，我們要做的，就是帶著好奇心，大量嘗試，看看新功能如何顛覆我們日常生活的可能性。

ivan so

Ivan So 是一位 SEO 專家和數位行銷顧問，擁有超過 20 年的 SEO 經驗，為來自香港、泰國、澳洲、英國及德國的超過 100 名中小企公司及上市公司客戶提供專業的 SEO 服務。他管理超過 400 個 WordPress 網站，並建立了 50 個網站進行 SEO 測試，確保策略實用且有效。作為香港 MailChimp/MailerLite 及 Shopify 的合作夥伴，他的專業範疇涵蓋多個行業與平台。此外，Ivan So 也是 5 次 Amazon 暢銷書作家，並且在 Udemy 擁有 1.7 萬名學生，通過他優秀的 SEO 策略幫助客戶顯著提升網站流量，實現業務增長。

Leave a Reply Cancel reply

You must be logged in to post a comment.