前些日子在科技界掀起巨大波瀾的 Anthropic 2024年6月21日正式推出最新的人工智能模型 – Claude 3.5 Sonnet,這是 Claude 3.5 模型家族中的首個成員。該模型在各種評估中表現出色,超越了先前的 Claude 3 Opus,並以中等成本提供業界領先的智慧和性能。
圖片來源:Anthropic
Claude 3.5 Sonnet 現已在 Claude.ai 和 Claude iOS 應用上免費提供,同時 Claude Pro 和 Team 計劃的訂閱用戶可以在更高的使用配額下使用。此外,該模型還可通過 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 進行訪問,定價為每百萬個輸入標記 $3 和每百萬個輸出標記 $15,具備 200K 標記的上下文窗口。
卓越性能與成本效益
Claude 3.5 Sonnet 在多項基準測試中表現卓越,包括研究生級別的推理能力(GPQA)、本科級別的知識(MMLU)和編碼能力(HumanEval)。該模型在理解細微差別、幽默和複雜指令方面顯著提升,並能以自然、親和的語氣撰寫高質量內容。此外,Claude 3.5 Sonnet 的運行速度是 Claude 3 Opus 的兩倍,這一性能提升使其非常適合處理如上下文敏感的客戶支持和多步驟工作流程等複雜任務。
視覺能力的突破
在視覺基準測試中,Claude 3.5 Sonnet 表現出色,尤其在需要視覺推理的任務中,如解讀圖表和圖形。它還能準確轉錄不完美圖像中的文字,這對於零售、物流和金融服務等需要從圖像中獲取更多資訊的行業尤為重要。
圖片來源: Anthropic
新功能:Artifacts
Anthropic 還推出了一項新功能 – Artifacts,這擴展了用戶與 Claude 的互動方式。用戶可以在 Claude.ai 上生成如代碼片段、文本文件或網站設計等內容,並在專用窗口中即時查看、編輯和構建 Claude 的創作,無縫集成 AI 生成的內容。
新功能:Projects
將與 Claude 的聊天組織成可共享的項目。每個項目都包含一個200K上下文窗口,因此可以包含相關的文檔、代碼和文件。
安全性與隱私保護
Anthropic 強調其模型經過嚴格測試以減少誤用,並且不會在未經用戶明確許可的情況下使用用戶提交的數據進行模型訓練。該公司還與外部專家合作,確保其安全機制的健全性和透明性,並進行了多次測試以確保模型的安全性。
結語
Anthropic 計劃在未來幾個月內推出 Claude 3.5 Haiku 和 Claude 3.5 Opus,並致力於不斷改善智慧、速度和成本之間的權衡曲線。他們還在開發新功能,如記憶功能,這將使 Claude 能夠記住用戶的偏好和互動歷史,進一步個性化用戶體驗。