Meta 推出有史以來最大的 AI 模型:Llama 3.1

Meta 推出有史以來最大的 AI 模型:Llama 3.1

在 AI 領域,Meta 再次掀起波瀾。Meta 發佈了其最新的開源 AI 模型——Llama 3.1,這是目前為止最大的開源模型,旨在挑戰 OpenAI 的 GPT 和 Anthropic 的 Claude 等行業領軍者的表現。

Llama 3.1 能做什麼?

Llama 3.1 雖然不是多模態模型(即它只能處理文本,無法處理圖像、音頻或視頻),但它的功能依然非常強大:

  • 完成編碼任務
  • 回答數學問題
  • 用八種語言(英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語)總結文件
  • 整合搜索引擎 API,以根據複雜查詢從互聯網檢索信息

Meta 已經將 Llama 3.1 整合到其 AI 助手中(類似 ChatGPT 的聊天機器人),該助手可以在 Facebook、Instagram 和 WhatsApp 上運行。

Llama 3.1 的訓練過程

Llama 3.1 的訓練數據集與 Meta 之前的模型相同,但 Meta 採用了更嚴格的質量保證和數據過濾方法來微調和改進該模型。數據集包括:

  • 非英文數據(以提高多語種表現)
  • 數學和編碼數據(以提高數學和編碼推理能力)
  • 最近的網絡數據(以提高其對當前事件的知識)

Meta 並未具體說明其訓練數據的來源,只表示使用了合成數據(由其他 AI 模型生成的數據)和公共網頁及網頁文件。這被 Meta 稱為“建模的秘方和醬汁”,以在競爭中佔據優勢。

然而,批評者認為,真正的原因是為了避免即將到來的版權訴訟,特別是在最近報告中指出它使用 Facebook 和 Instagram 的帖子、照片和標題,並且讓用戶難以選擇退出。

Llama 3.1 的性能

Llama 3.1 是使用 NVIDIA 的芯片建造的,並利用了新的訓練和開發方法,使其在多個任務上表現優於其他同類型的模型,如 ChatGPT-4o 和 Claude 3.5 Sonnet,包括:

  • 一般知識
  • 數學
  • 工具使用
  • 多語種翻譯

此外,Meta 認為其運行成本約為 GPT-4o 的一半。

Llama 3.1 擁有超過 4050 億個參數(相比之下,ChatGPT-4o 擁有超過 2000 億個參數)和更大的上下文窗口,這意味著它可以總結更長的文本,並且不太可能“忘記”先前的對話,特別是在解決問題方面表現更佳。

然而,在早期基準測試中,Llama 3.1 與 GPT-4o 和 Claude 3.5 Sonnet 相比,表現“喜憂參半”:儘管它在編碼和生成圖表方面表現更好,但在編程和一般推理方面則較弱。

結論

總的來說,Meta 推出的 Llama 3.1 不僅是目前最大的開源 AI 模型,而且在多個領域展現了卓越的能力。儘管在某些方面還有改進的空間,但其強大的多語種支持和高效的數據處理能力,使其成為業界不可忽視的重要力量。

常見問題

1. Llama 3.1 如何與其他 AI 模型相比?

Llama 3.1 擁有超過 4050 億個參數,比 ChatGPT-4o 的 2000 億個參數多出一倍多,並且在多語種支持、數學和編碼任務上表現更佳。

2. Meta 的訓練數據來源是否會引發法律問題?

Meta 並未公開其訓練數據的具體來源,但批評者認為其使用 Facebook 和 Instagram 上的用戶數據可能會引發版權訴訟。

Similar Posts

Leave a Reply