Mistral AI 推出最新大型語言模型 Mistral Large 2,挑戰 Llama 3.1

Mistral AI 推出最新大型語言模型 Mistral Large 2,挑戰 Llama 3.1

在人工智能技術迅猛發展的時代,Mistral AI 再次引領潮流,在2024年7月24日推出了其最新的旗艦大型語言模型— Mistral Large 2。這款模型擁有 1230 億個參數,並在多個方面展現了顯著的性能提升,包括代碼生成、數學和推理能力。這一發布無疑為人工智能領域帶來了新的突破和挑戰。

Mistral Large 2 的主要特點

強大的多語言支持

Mistral Large 2 支持多達 11 種語言,包括法語、德語、西班牙語、意大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語。這使得該模型在全球範圍內具有廣泛的應用潛力。

優秀的編碼能力

該模型支持超過 80 種編程語言,包括 Python、Java、C、C++、JavaScript 和 Bash。這使得它在代碼生成和編程輔助方面具有強大的競爭力。

高效的上下文窗口

Mistral Large 2 擁有 128,000 個 token 的上下文窗口,比其前代產品大大增加,這意味著它可以處理更長的文本和更複雜的任務。

開放權重

Mistral Large 2 的權重已經開放,但僅限於研究和非商業用途。商業用途需要獲得專門的許可。

高性能基準測試

在多個基準測試中,Mistral Large 2 的性能表現優異。在 Wild Bench、Arena Hard 和 MT Bench 基準測試中,它的表現優於 Llama 3.1 405B 和 Claude 3 Opus。在 MMLU 基準測試中,該模型的表現優於 Llama 3.1 70B,與 Llama 3.1 405B 相當。

改進的函數調用和檢索技能

Mistral Large 2 現在支持並行和順序函數調用,使開發人員能夠構建更複雜的商業人工智能應用。

開源和合作

Mistral AI 強調開源,並與微軟和 Google 建立了合作關係,將其模型在 Azure 和 Google 雲上提供。

市場反應與合作

在 Mistral Large 2 推出後,市場反應熱烈。Google Cloud 宣布將支持 Mistral AI 的新模型,包括 Codestral、Nemo 和 Large 2,並將其整合到 Vertex AI 平台上。這一合作將使全球開發者能夠更輕鬆地使用這些先進的人工智能技術,從而加速創新和應用開發。

微軟也宣佈將 Mistral Large 2 和 Mistral Nemo 引入 Azure AI 平台,提供無伺服器部署和按需付費選項。這意味著企業和開發者可以更靈活地使用這些模型來構建和部署高效的人工智能應用。

性能與價格

根據最新的性能基準測試,Mistral Large 2 在多個指標上表現出色。其 MMLU 分數達到 0.84,質量指數為 91,顯示出其在推理和知識方面的強大能力。然而,該模型的價格相對較高,每百萬個 token 的價格為 4.50 美元,輸出速度為每秒 43.5 個 token,延遲時間為 0.29 秒。

後續發展

Mistral AI 的聯合創始人兼首席執行官 Arthur Mensch 表示:「我們的目標是將最先進的人工智能技術帶到每個人的手中。與 Google Cloud 和微軟的合作標誌著我們在實現這一目標方面邁出了重要的一步。」這些合作不僅有助於推動人工智能技術的普及,還將促進更多創新應用的誕生。

隨著 Mistral Large 2 的推出,Mistral AI 無疑在人工智能領域樹立了新的標杆。這款模型不僅在多語言支持和編碼能力方面表現卓越,還在多項基準測試中展示了其強大的性能。隨著 Mistral AI 與微軟和 Google 的合作,這款模型未來有望在更多應用場景中發揮重要作用。