Google 推出 Gemini 1.5 Pro 實驗版本

Google 於2024年8月5日宣布推出其最新的人工智能模型 Gemini 1.5 Pro ( gemini-1.5-pro-exp-0801 ) 實驗版本，這是一款具有突破性長上下文窗口的強大多模態模型，標誌著 AI 技術的重大進步。Gemini 1.5 Pro 擁有高達 100 萬個標記的上下文窗口，可擴展至 200 萬個標記，是目前大規模基礎模型中最長的。該模型在 LMSYS Chatbot Arena 排行榜上以 1300 的 ELO 分數位居榜首，超過了 OpenAI 的 GPT-4o。

Gemini Pro 1.5 在 LMSYS 比分榜中超越 GPT4-o 奪得首座
資料來源： LMSYS Chatbot Arena Leaderboard

Google DeepMind 的 CEO Demis Hassabis 表示：「Gemini 1.5 Pro 代表了我們方法的重大轉變，建立在我們基礎模型開發和基礎設施的幾乎每個部分的研究和工程創新之上。」這款新模型的一個關鍵特點是其長上下文窗口。標準版本提供 128,000 個標記的上下文窗口，而實驗版本則可達到 100 萬個標記。這一突破使 Gemini 1.5 Pro 能夠處理和理解大量的數據，如長文檔、大型代碼庫或長時間的音視頻內容。

Google 和 Alphabet 的 CEO Sundar Pichai 強調了這一進步的重要性：「更長的上下文窗口向我們展示了可能性的前景。它們將實現全新的功能，並幫助開發者構建更有用的模型和應用程序。」

Gemini 1.5 Pro 不僅在文本處理方面表現出色，還在多模態任務上展現了強大的能力。該模型能夠處理文本、圖像、音頻和視頻等多種形式的輸入，並在不同模態間進行複雜的推理。

Google 已經開始向開發者和企業客戶提供 Gemini 1.5 Pro 的早期測試版本。開發者可以通過 Google AI Studio 和 Vertex AI 平台訪問該模型，並開始探索其在各種應用場景中的潛力。Gemini 1.5 Pro 的應用範圍廣泛，包括自然語言處理、代碼生成與分析、多媒體內容理解、數據分析和客戶服務等領域。

Gemini 1.5 Pro 的發布無疑將加劇 AI 領域的競爭。在 LMSYS Chatbot Arena 排行榜上超越 OpenAI 的 GPT-4o，顯示了 Google 在 AI 技術競賽中的強勁表現。市場分析師 Jane Doe 表示：「Gemini 1.5 Pro 的推出可能會重塑 AI 市場格局。其長上下文窗口和多模態能力為企業提供了前所未有的機會，以更智能、更高效的方式處理複雜任務。」

Google 為 Gemini 1.5 Pro 提供了靈活的定價策略。該模型提供免費和付費兩種層級，付費層級的定價基於標記長度，最高可達每 100 萬個標記 7 美元。目前，Gemini 1.5 Pro 已通過 Gemini API 在公開預覽中提供。Google 計劃在未來幾個月內逐步擴大其可用性，並持續優化模型性能。

隨著 Gemini 1.5 Pro 的推出，Google 不僅展示了其在 AI 領域的技術實力，也為未來 AI 發展指明了方向。長上下文窗口和強大的多模態能力預示著 AI 應用將變得更加複雜和多樣化。Google DeepMind 的 Hassabis 表示：「我們正在積極優化以改善延遲、減少計算需求並增強用戶體驗。這只是開始，我們期待看到開發者和企業如何利用這一突破性技術創造新的可能性。」