OpenAI 發佈 GPT-4o(Omni) ,免費開放 GPT-4 級 AI 助手

OpenAI發佈GPT-4o

在2024年5月13日的直播發佈會上, OpenAI 宣佈推出其最新旗艦語言模型 GPT-4o(Omni) ,並將這款強大的 AI 助手免費開放給所有用戶。這一重大舉措標誌著人工智能技術的新里程碑,有望加速 AI 在各行各業的應用落地,並深刻影響人們的工作和生活方式。

OpenAI GPT-4o 發布會。影片來源:OpenAI

GPT-4o 是 OpenAI 在其前代產品 GPT-4 基礎上的又一次突破性進展。這款新模型不僅在自然語言處理、計算機視覺、語音識別等方面展現了卓越的性能,還大幅提升了執行效率和易用性。通過 GPT-4o ,普通用戶無需任何技術背景,即可享受到媲美 GPT-4 的 AI 助手服務,而研發成本和使用門檻的大幅降低,更將助力 AI 技術的普及和應用創新。

在發佈會上, OpenAI 團隊詳細介紹了 GPT-4o 的技術細節和創新亮點。這款多模態AI系統能夠處理文字、圖像、音頻等多種形式的數據,並支持實時互動和上下文理解。通過對海量數據的深度學習, GPT-4o 建立起了龐大的知識圖譜和語義網絡,可以就各種主題進行智能問答、分析推理、創意生成等任務。

令人印象深刻的是, GPT-4o 還擁有逼真的語音交互能力。在現場演示環節, GPT-4o 展示了其在語音識別、語義理解、情感分析等方面的出色表現,並能夠根據上下文和用戶反饋動態調整回應策略,呈現出近乎真人的互動體驗。這一功能的突破性進展,有望在客戶服務、教育培訓、虛擬助理等領域掀起一場革命。

除了服務終端用戶外, OpenAI 還宣佈將 GPT-4o 的 API 開放給第三方開發者,以加速其在各垂直領域的應用落地。通過 API 接入,開發者可以將 GPT-4o 的強大能力與特定行業場景相結合,打造出創新的智能應用和解決方案。這無疑將為企業數字化轉型和產業智能升級帶來新的動能。

值得一提的是, OpenAI 在發佈 GPT-4o 的同時,還推出了全新的 ChatGPT 桌面應用程式,為用戶帶來更便捷、高效、人性化的交互體驗。新的應用界面設計簡潔美觀,支持語音輸入和多輪對話,並針對不同使用場景提供定制化的聊天模板和功能插件。這一舉措旨在讓 AI 技術真正走入尋常百姓家,成為人們日常工作和生活中的得力助手。

在談到 OpenAI 的目標和未來願景時,聯合創始人兼 CEO Sam Altman 表示,該公司一直秉承”造福全人類”的初心,致力於讓先進的 AI 技術惠及每一個人。免費開放 GPT-4o 正是基於這一宗旨的重要舉措,體現了 OpenAI 在 AI 民主化道路上的決心和擔當。 Altman 強調,隨著 AI 技術的日益強大,開發者和研究者更需要保持謹慎負責的態度,並呼籲社會各界共同參與,攜手構建一個安全、包容、可信賴的 AI 生態。

GPT-4o 的問世,在業界引起了廣泛關注和熱議。不少專家學者認為,這是 AI 發展史上的一個重要里程碑,標誌著人機協作和認知智能的新篇章。隨著 AI 在感知、理解、決策等方面的能力不斷提升,未來將在更多領域取代或協助人類完成任務,並催生出一系列顛覆性的創新應用。但與此同時, AI 的發展也對現有的就業格局、隱私保護、倫理道德等提出了新的挑戰,需要產業界、學術界、政府部門等多方協同應對。

對於廣大普通用戶而言, GPT-4o 無疑是一個振奮人心的好消息。這意味著每個人都有機會免費體驗到頂尖 AI 技術帶來的便利和樂趣,無論是日常問答、寫作創作,還是學習成長、職業規劃, GPT-4o 都能提供專業、高效、因材施教的智能支持。 AI 助手的普及,也將推動全民數字素養和創新思維的提升,為培養未來人才打下良好基礎。

官方新聞稿

筆者初步試用心得

  1. 問答輸出速度明顯高於 GPT-4 Turbo Vision ,接近 Claude 3 Haiku
  2. 實現完整的連網功能(之前的連網功能一直有問題),連網搜尋能力優於之前的所有版本,但是仍然無法搜尋到最新的資訊
  3. 對中文語音的接收、理解、反應及互動非常地流暢及自然,真正的達到了中文語音助理的程度
  4. 官方發布會中 OpenAI 技術長 Mira Murati 提到 GPT-4o 和 GPTs 將提供給免費用戶,但目前筆者測試仍然只有付費用戶可以使用。 Mira Murati 在發布會中表示未來數週會陸續開放給所有用戶
  5. 根據 OpenAI 的官方公告,這次僅在發佈時推出文字和圖像輸入和文字輸出的功能以及有限的音訊,音訊功能將於幾週內向 ChatGPT Plus 和 API 用戶發布有限的 alpha 階段版本
  6. GPTs 還沒有很好的與 GPT-4o 整合,使用 GPTs 時輸出速度明顯落後於直接使用 GPT-4o ,而且在外部連結的引用及處理上仍然不是很好
  7. 在文字表達能力及文學呈現上,仍然落後 Claude 3 Opus