OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!

ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!

OpenAI 今日宣布,其進階語音模式將新增影片和螢幕分享功能,讓用戶的對話體驗更加豐富和實用。此外,ChatGPT 還推出了與聖誕老人互動的功能,讓用戶可以直接與聖誕老人對話,問各種問題,並獲得即時回應。

在今天的發布會上,ChatGPT 的產品經理 Kevin 表示,系統昨天出現了幾小時的中斷,對此表示歉意,並承諾會進行詳細的事後分析。他強調,系統已經恢復正常運作,並即將推出兩個重要的新功能。第一個新功能保密,稍後會揭曉;第二個新功能是在進階語音模式中加入影片和螢幕分享功能。

Kevin 通過實際操作展示了如何使用這些新功能。他介紹了團隊成員,包括產品經理、工程師和研究人員,並通過互動測試展示了新功能的實際應用,如製作手沖咖啡。此外,他還展示了如何使用螢幕分享功能來尋求幫助,如回覆訊息。

影片和螢幕分享功能將在接下來的一週內逐步推出,先推出給所有團隊用戶和大部分的付費用戶。歐洲的付費用戶將稍後獲得此功能,而企業和教育計劃用戶將在明年初獲得此功能。首次與聖誕老人對話將重置進階語音模式的使用限制,即使超過限制,用戶仍可以在標準語音模式下與聖誕老人對話。

Kevin 表示,希望用戶享受與聖誕老人的對話體驗,並感謝工程師、研究人員、產品經理和設計師的辛勤工作。最後,聖誕老人分享了一個有趣的聖誕笑話,為發布會畫上了愉快的句號。

這次更新不僅豐富了 ChatGPT 的功能,也增加了節日的氛圍和用戶的互動體驗,讓用戶在節日期間有更多的樂趣和驚喜。

12 Days of OpenAI: Day 6 完整視頻。影片來源:OpenAI

進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合
  8. OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗
  9. OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora
  10. OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調
  11. OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro

Google 推出 Gemini 2.0:AI 能力的飛躍

Google 推出 Gemini 2.0

Google 宣布推出 Gemini 2.0,這是迄今為止最先進的 AI 模型。設計用於「代理時代」,Gemini 2.0 引入了一系列新功能,這些功能承諾將改變 AI 與世界互動的方式。

Google 推出 Gemini 2.0。影片來源:Google

Gemini 2.0 的一大亮點是其多模態輸出功能,包括本地圖像生成和音頻輸出。這意味著該模型可以直接生成圖像和音頻,增強其創建更沉浸和互動體驗的能力。此外,Gemini 2.0 可以本地使用 Google 搜索和地圖等工具,無縫集成現有的 Google 服務,提供更全面和準確的回應。

開發人員已經開始體驗 Gemini 2.0 的潛力,Gemini 2.0 Flash 是該模型的實驗版本。通過 Google AI Studio 和 Vertex AI 提供的 Gemini 2.0 Flash 具有低延遲和增強性能,使其成為希望構建下一代 AI 應用程序的開發人員的強大工具。Google 還使其第六代 TPU Trillium 普遍可用於 Google Cloud 客戶,進一步簡化了構建 AI 驅動應用程序的過程。

Gemini 2.0 Flash 的性能改進顯著。Google 報告稱,新模型的運行速度是其前代 Gemini 1.5 Pro 的兩倍,並且在各種基準測試中表現出色。在軟件工程任務中,Gemini 2.0 Flash 在 SWE-bench Verified 上獲得了 51.8% 的分數,突顯了其協助開發人員進行代碼生成、調試和優化過程的潛力。Google 正在將 Gemini 2.0 Flash 集成到其自身的開發工具中,表明其強烈承諾利用這項技術內部。

Gemini 2.0 的能力不僅僅限於速度和性能。該模型支持圖像、視頻和音頻等多模態輸入,並且可以生成文本與內聯圖像等多模態輸出。這使得會話式圖像編輯和創建多模態內容成為可能,例如在一個回合中生成帶有文本和圖像的部落格文章。該模型還可以本地調用 Google 搜索、代碼執行和第三方用戶定義函數,使其成為各種應用程序的多功能工具。

Google 已經看到初創公司使用 Gemini 2.0 Flash 進行實驗取得了令人印象深刻的進展。例子包括 tldraw 的視覺遊樂場、Viggle 的虛擬角色創建和音頻敘述、Toonsutra 的情境多語言翻譯以及 Rooms 的實時音頻添加。為了幫助開發人員入門,Google 在 Google AI Studio 中發布了三個入門應用程序體驗,以及用於空間理解、視頻分析和 Google 地圖探索的開源代碼。

未來 Google 計劃在 2025 年初將 Gemini 2.0 的功能集成到其搜尋應用程序中,進一步增強其主要盈利平台的用戶體驗。Google 還在探索 Gemini 2.0 的代理體驗,包括 Astra、Mariner 和 Jules 等項目,這些項目旨在推動 AI 能夠實現的邊界。

正如 Google DeepMind 的首席執行官 Demis Hassabis 和首席技術官 Koray Kavukcuoglu 所說,「如果 Gemini 1.0 是關於組織和理解資訊,那麼 Gemini 2.0 就是關於使其更加有用。」

OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合

ChatGPT 即將登陸 Apple 設備:iOS 與 Mac OS 整合帶來全新體驗

ChatGPT 即將在 Apple 的 iOS 和 Mac OS 上進行整合,這將使其使用更加方便。根據 OpenAI 發布會的影片,用戶可以無需帳號使用 ChatGPT,但有帳號會有更好的體驗。這次整合將使 Apple 設備的用戶能夠更輕鬆地使用 ChatGPT 的強大功能。

Siri 將能夠將任務交給 ChatGPT 處理,這意味著用戶可以通過語音指令輕鬆地完成複雜任務。此外,Apple 的寫作工具現在可以使用 ChatGPT 來撰寫文件,這對於需要快速撰寫和編輯文件的用戶來說是一個重大利多。

iPhone 16 的相機控制功能也將支援 ChatGPT,用戶可以使用 ChatGPT 來識別和學習物體。這項功能將使用戶能夠更深入地了解周圍的世界,並且能夠更輕鬆地獲取所需的信息。

在設定中,用戶需要啟用 Apple 智能和 Siri,並啟用新的 ChatGPT 擴展。Siri 會在將請求交給 ChatGPT 之前確認,並且用戶可以直接從設定中存取 ChatGPT 應用程式。這意味著用戶可以更輕鬆地管理和使用 ChatGPT 的功能。

用戶可以直接詢問 Siri 來使用 ChatGPT,並且可以請求 ChatGPT 來組織聖誕派對、製作節日播放清單和設計專輯封面。這些功能將使用戶能夠更輕鬆地完成日常任務,並且能夠更好地享受生活。

ChatGPT 還可以用來識別和評估圖像,並且 Mac OS 也可以啟用 Apple 智能和 ChatGPT 擴展。用戶可以使用 ChatGPT 來處理和分析長文件,並且可以控制與 ChatGPT 分享的內容。ChatGPT 的桌面應用程式功能強大,可以進一步處理文件,並且可以從多種應用程式中呼叫 Siri 和 ChatGPT。

這次發布將使更多人能夠使用 ChatGPT,OpenAI 期待這次發布能夠讓更多人體驗到 ChatGPT 的便利性和強大功能。這次整合將使 Apple 設備的用戶能夠更輕鬆地使用 ChatGPT 的強大功能,並且能夠更好地享受生活。

12 Days of OpenAI: Day 5 完整視頻。影片來源:OpenAI

進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!
  8. OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗
  9. OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora
  10. OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調
  11. OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro

OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗

OpenAI 推出 Canvas,重新定義 ChatGPT 的協作體驗

OpenAI 於昨日推出了備受矚目的 Canvas 功能,這項新技術旨在提升 ChatGPT 的多元應用能力。過去數月,Canvas 作為 beta 測試功能僅向 ChatGPT Plus 用戶開放,如今正式向所有用戶推出,並整合至核心模型中,無需額外設定即可使用。

Canvas 提供了一個全新界面,將 ChatGPT 的對話功能與文件編輯器相結合。用戶可以在左側進行輸入和互動,同時右側即時顯示 ChatGPT 的回應及修改結果,形成雙視窗協作模式。這樣的設計讓用戶能夠更直觀地處理複雜文本和程式碼編輯,避免內容與回饋混雜不清的情況。

三大核心功能革新

  1. 即時編程支持
    Canvas 現在支持直接在平台內運行 Python 程式碼,讓用戶能即時查看運行結果,包括文本輸出與圖形生成。例如,用戶可在數秒內完成 Sankey 圖的繪製,並根據需要進行即時調整。
  2. 協作式編輯體驗
    Canvas 不僅支持用戶和 ChatGPT 的雙向協作編輯,還加入了高級功能,如語法高亮、修改建議與實時錯誤檢測。當程式碼出現問題時,Canvas 可自動辨識錯誤,並提供修正建議,讓編程過程更加高效。
  3. 自定義 GPT 集成
    Canvas 現已與自定義 GPT 無縫整合,用戶可根據特定需求創建專屬應用程序。例如,利用 Canvas 來處理大量文本,如回覆客戶郵件或學術寫作,皆能大幅提升工作效率。

適用範圍廣泛,從寫作到編程全面覆蓋

OpenAI 的產品團隊表示,Canvas 對於多領域用戶都有極大的助益。從普通的創意寫作到高級的數據科學編程,Canvas 都能提供有力支持。這對於希望提升文稿品質或快速學習編程的用戶來說,無疑是一項強大工具。

特別值得一提的是,Canvas 支持用戶根據自己的寫作需求進行個性化調整,包括增加表情符號、調整文章語氣或簡化內容結構等。例如,用戶可以要求 ChatGPT 修改故事的語言層次,以適應不同年齡層的讀者。

結語

OpenAI 推出的 Canvas,不僅代表了 ChatGPT 的功能延伸,也展現了人工智能工具在生產力領域的廣泛應用潛力。隨著技術的進一步成熟,Canvas 或將成為專業人士和普通用戶不可或缺的日常助手。

12 Days of OpenAI: Day 4 完整視頻。影片來源:OpenAI

進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!
  8. OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合
  9. OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora
  10. OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調
  11. OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro

OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora

OpenAI 推出全新影片生成工具 Sora

OpenAI 於今日正式推出其全新影片生成工具 Sora,這款產品不僅標誌著 AI 技術在創意表達領域的重大突破,更為人類與 AI 的協同創作開啟了新的可能性。Sora 的推出不僅僅是一個技術進步,更是一種全新的創作方式,讓我們得以通過 AI 技術來增強和擴展人類的創意表達。

產品發布與重要性

Sora 是 OpenAI 推出的全新影片生成產品,今天正式上線。這款產品對 OpenAI 非常重要,因為它代表了創意工具的新動態、多媒體互動和 AGI 路線圖的一部分。OpenAI 強調,Sora 不僅僅是文字互動,還能理解和生成影片,這將深刻改變我們使用電腦的方式。影片生成是 AGI 學習和理解世界的重要環境,Sora 的推出標誌著 OpenAI 在這一領域的重要一步。

國際發布與訂閱優惠

Sora 在美國和大多數國際地區上線,但歐洲和英國除外。ChatGPT Plus Pro 訂閱者可以造訪 Sora 官方網站,無需額外付費即可使用,這無疑是對現有用戶的一大優惠。OpenAI 表示,Sora 的推出是為了讓更多人能夠體驗到 AI 技術在創意表達上的革新。

Plus 及 Pro 用戶的差異

  1. ChatGPT Plus – $20/month: – 50 videos (1,000 credits) – Up to 720p resolution and 5s duration
  2. ChatGPT Pro – $200/month – 500 videos (10,000 credits) – Unlimited relaxed videos – 1080p – No watermark

筆者覺得對一般付費的 Plus 用戶而言, Sora 的推出就真的只是體驗性質而已,5秒的長度及720p的畫質很難做出太多不同的應用場景。如果真的要透過 AI 製作長影片,價格又能經濟實惠,建議使用其他類似的工具,例如 Dream MachineRunwayPika ,或者中國快手推出的 Kling(可靈) 、 字節跳動推出的 即夢 ,都能產生品質不錯的影片。

技術進步與功能特點

Sora 研究團隊使 February 模型更快更便宜,推出了 Sora Turbo。這款新模型具備生成影片、動畫圖像和多種影片功能,如重混、延伸時間等。Sora Turbo 的推出標誌著 OpenAI 在技術上的顯著進步,使得影片生成更加高效和經濟。

Sora 的主要功能包括探索頁面、圖書館、簡單組合器、故事板、重混、循環和混合等。探索頁面展示社群分享的影片,提供創作靈感;圖書館是用戶的主頁,可以查看和管理所有生成的影片;簡單組合器允許用戶通過文字描述或上傳圖像生成影片;故事板工具允許用戶通過時間軸設計多動作影片;重混功能允許用戶對影片進行修改和重新生成;循環功能允許用戶生成無限重複的影片;混合功能允許用戶將兩個場景合併生成新場景。

產品目標與歷史

Sora 旨在深入理解世界物理,增強人類創意。OpenAI 在視覺生成領域有多年經驗,Sora 是其最新成果。這款產品強調機器學習和人機界面設計的突破,為用戶提供了更加直觀和高效的創作工具。

安全防護

OpenAI 重視安全和防止濫用,並將持續改進。Sora 的推出不僅僅是技術上的突破,更是創意表達的新方式。OpenAI 強調,Sora 在創意表達和安全防護之間取得平衡,確保用戶能夠安全地使用這款工具進行創作。

結語

Sora 的推出標誌著 AI 技術在創意表達領域的重大突破。這款產品不僅僅是一個工具,更是一種新的創作方式,讓人類與 AI 的協同創作成為可能。Sora 的推出將會激發更多創意,讓更多人能夠參與到創作中來。OpenAI 表示,Sora 的推出只是開始,未來將會有更多功能和改進,讓這款工具變得更加強大和易用。

12 Days of OpenAI: Day 3 完整視頻。影片來源:OpenAI
進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!
  8. OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合
  9. OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗
  10. OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調
  11. OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro