AI 大戰新紀元 Anthropic 發布次世代語言模型 Claude 3

圖片由 DALL-E 3 創作 ( Claude 3 目前仍不具備圖片生成能力,但可解析圖片)

矽谷新創公司 Anthropic 日前舉行線上活動,正式發布旗下最新一代大型語言模型 Claude 3 家族,直指成為商業界 AI 應用的新標竿。 Claude 3 家族包括三種不同規模和性能的模型,從入門級的 Claude 3 Haiku 到頂級的 Claude 3 Opus ,提供企業客戶具彈性選擇。

Claude 3 代表了 Anthropic 在自然語言處理技術上的重大突破。據公司資料顯示, Claude 3 的準確率較前一代模型成倍提升,同時在智能能力、運算速度和可靠性等層面也有長足進步,讓企業用戶可根據不同使用案例,挑選合適的模型組合部署。

Anthropic 產品經理 Daniela Amodei (筆者註:Daniela 事實上是公司的 Co-founder & President) 表示,公司此次推出多款模型的全家桶戰略,就是要滿足企業客戶對 AI 的不同需求。她解釋:「 Claude 3 Opus 是目前最先進的大規模模型,適合處理高度複雜的推理任務; Claude 3 Sonnet 則是中階的選擇,性價比更高;而 Claude 3 Haiku 則專為需要快速回應的應用場景而生。」

走向商業化是 Anthropic 的主要發展策略。 Claude 3 家族的發布,讓企業用戶能夠透過雲端 API 或合作夥伴如 Google 雲端平台 GCP 等管道,直接部署這些大型語言模型。而定位高階的 Claude 3 Opus ,定價政策也將與實力成正比,以滿足對頂尖 AI 性能有極高需求的企業客戶。

重視 AI 安全性 平衡公眾利益與商業化

儘管走向商業化是當務之急,但 Anthropic 作為一家上市公益公司,仍將 AI 安全性和可靠度視為教條。 Amodei 強調,公司採用獨家的「 Constitutional AI 」訓練架構,透過程式化的規則約束,才得以在提升模型能力的同時,也控制住潛在風險,創造出一個既強大又可信賴的 AI 系統。

她表示:「我們深知,沒有任何一種目前的 AI 產品是完美無缺的,但 Anthropic 一直是業界在 AI 安全性這一領域的領導者。」她承諾,無論公司的商業決策如何,將永遠把安全放在第一順位。

對於前東家 OpenAI 與馬斯克( Elon Musk )的官司糾紛, Anthropic 並未多做評論,僅表示公司的宗旨就是在提升 AI 能力的同時,也讓其變得更安全可靠。顯見 Anthropic 希望在爭議中保持中立,專注於自身產品的開發。

除了科技發展, Claude 3 在商業層面同樣備受矚目。知名投資巨擘陪德沃資產( Bridgewater Associates )、企業軟體領導者 SAP 等重量級企業均已納入 Claude 的服務,用以提升內部工作效率及客戶服務體驗。

值得一提的是,連生技醫療界龍頭機構,如達納法柏癌症研究所( Dana-Farber Cancer Institute )、 BCW 健康集團等,也前仆後繼導入 Claude 來優化各自的業務流程。顯示大型語言模型的應用已遍及各式產業,為數位轉型注入嶄新動能。

Claude 3 可能影響就業市場

儘管 Claude 3 的到來備受企業界歡迎,但部分專家仍憂心其對就業市場造成衝擊。 Anthropic 內部人士對此表示樂觀,認為新型 AI 系統將開創更多就業機會,取代人力的只是既有工作的一小部分重複性和簡單的任務。

而身為人工智慧新銳的 Anthropic ,對於開放式 AI ( Open AI )和封閉式 AI ( Closed AI )的爭議立場則傳遞了中立訊息。公司認為,未來的AI生態將是多種類型的模型並行競爭和合作。當企業客戶對不同應用需要選擇不同模型時,無論是開放還是封閉的訓練方式都可共存。

展望未來,隨著企業領域的數位浪潮持續擴大, AI 勢必扮演更重要的角色。作為最新世代的大型語言模型,Claude 3 的問世不啻是 Anthropic 向世人展示其在自然語言 AI 領域的實力和決心。未來,我們可以預期類似 Claude 的智能系統,將在工作場所、金融服務、製造業,以及其他重要產業中扮演舉足輕重的角色,徹底改變人類工作及生活的方式。

(本文由 Claude 3 Sonnet 所創作)

Claude 3 的優缺點 (筆者評價)

優點
  1. 在一些基準測試中表現優於 GPT-4 ,例如人工評估得分更高
  2. 展現出強大的上下文理解能力,能夠按照指示切換溝通風格
  3. 在拒絕不當提示方面比 ChatGPT 更加堅定
  4. 具備多模態能力,可處理圖像任務
  5. 擁有較新的知識截止日期(2023年8月)
缺點
  1. 在某些視覺推理任務上表現不佳
  2. 最大型號 Opus 的價格較為昂貴
  3. 無法渲染 latex 或 markdown 生成的表格
  4. 有些時候生成的回應比較簡短缺乏細節
  5. 在處理一些特定領域知識(如動漫)時表現遜於預期