OpenAI 深度研究功能擴展至所有付費 ChatGPT 用戶

Deep research is now rolling out to all ChatGPT Plus, Team, Edu, and Enterprise users

OpenAI 於2025年2月26日宣布,其強大的深度研究功能將向所有付費 ChatGPT 用戶推出,包括 Plus、Team、Edu 和 Enterprise 方案的用戶。這項功能最初於 2 月初推出,僅限每月支付 200 美元的 Pro 方案用戶使用,它允許用戶指示 ChatGPT 針對幾乎任何主題創建深入的報告,並在幾分鐘內完成原本需要數小時才能完成的研究任務。

深度研究功能可以自主搜尋網路並分析大量資訊,最終生成一份條理清晰、結構完整的報告。 它可以瀏覽數千個不同的來源,例如新聞文章、研究論文和線上資料庫,並提取關鍵資訊,將其整理成結構化的報告,並引用其來源。

Plus 方案的用戶每月將獲得 10 個深度研究查詢的配額。Pro 方案的用戶則享有更高的額度,每月可以使用 120 個深度研究查詢,高於之前的 100 個。 OpenAI 表示,深度研究目前「計算量非常大」,因此免費用戶可能還需要一段時間才能試用這項功能。

深度研究如何運作?

深度研究由 OpenAI 早期版本的 o3 模型提供支持,該模型專為網頁瀏覽和數據分析進行了優化。 它利用 o3 先進的推理能力,可以搜索和解釋來自網絡的大量內容,包括文本、圖像、PDF 等等,然後以滿足您需求的報告形式輸出。 深度研究也經過真實世界任務的訓練,使用與 OpenAI 第一個推理模型 o1 相同的強化學習方法,使其能夠有效地執行需要瀏覽器和 Python 工具使用的任務。

深度研究不僅可以搜尋網路資訊,還可以讀取使用者提供的檔案,例如試算表和圖片,並進行分析。 這項功能適用於所有 ChatGPT 平台,包括網頁版、iOS、Android、macOS 和 Windows。

若要使用深度研究,您只需像往常一樣在 ChatGPT 聊天框中輸入您的查詢,然後選擇「深入研究」模式。 ChatGPT 會分析您的查詢,並可能會詢問您一些後續問題,以完善研究範圍。 深度研究的其中一項創新之處,在於它會在開始研究之前,先向使用者提出一些澄清問題,以確認使用者的需求和目標,確保最終產出的報告符合預期。

與傳統的聊天機器人交流不同,深度研究在後台運作,深入網路搜尋、閱讀文本、PDF、圖像等,然後綜合結果。深度研究在運行時,側邊欄會顯示模型的思考過程和它正在訪問的網站摘要,以查找相關資訊。最終的輸出以報告的形式在聊天中顯示。

深度研究的 AI 模型不像其他的大型語言模型那樣,擁有大量的內建知識。 12 相反地,深度研究更依賴於即時搜尋和分析網路上的資訊,這也讓它的產出結果更有可能保持最新的資訊,並減少「幻覺」的產生。 12

透過這些步驟,深度研究能為使用者帶來多項重要優勢:

OpenAI 深度研究的優勢

深度研究提供多項優勢,使其成為研究和分析的強大工具:

  • 深入分析: 深度研究超越了表面的網路搜尋,深入研究網路以收集關於所選主題的全面數據。 例如,如果需要編寫一份關於加密貨幣監管最新趨勢或 AI 對就業市場影響的詳細報告,深度研究可以處理繁重的工作,篩選大量線上資訊,並提供結構化、有洞察力的報告。
  • 結構化報告: 它可以提供結構良好的研究報告,節省數小時的手動編譯和格式化時間。
  • 時間效率: 可以快速訪問總結和綜合的信息,從而可以專注於分析和決策,而不是數據收集。
  • 提高效率: 深度研究可以讓使用者專注於更重要的任務,同時 AI 助手處理研究的繁重工作。
  • 競爭優勢: 通過最新的見解和研究保持信息優勢,讓使用者在自己的領域獲得競爭優勢。

功能增強

除了擴展訪問範圍外,OpenAI 還對深度研究進行了一些改進。ChatGPT 現在將在引用旁邊嵌入圖像,以提供「更豐富的見解」。 例如,如果使用者要求深度研究規劃一趟北海道的短期旅行,它不僅會提供度假村和觀光景點的概述,還會嵌入相關的圖片,讓使用者更直觀地了解這些景點。

該系統現在還可以更好地理解文件類型,這應該會帶來更好的文檔分析。例如,如果使用者上傳一份關於 AI 發展趨勢的 PDF 文件,深度研究可以更好地理解文件中的內容,並將其整合到研究報告中。

OpenAI 計劃在未來幾週內在這些報告中添加嵌入式圖像、數據可視化和其他分析輸出,以提高清晰度和背景資訊。

Anthropic 最新大型語言模型 Claude 3.7 Sonnet 功能再升級,劍指 AI 生成內容市場

Anthropic 最新大型語言模型 Claude 3.7 Sonnet 功能再升級

繼 OpenAI 的 GPT-o3 後, Anthropic 也推出最新力作 Claude 3.7 Sonnet ,號稱是目前最智能的 AI 模型,不僅擁有混合推理能力,更大幅提升程式碼撰寫和電腦使用效率,為 AI 生成內容市場投下震撼彈。  

YouTube thumbnailYouTube icon
影片來源:Anthropic

Claude 3.7 Sonnet 是什麼?

Claude 3.7 Sonnet 是 Anthropic 開發的混合推理模型,採用全新「延伸思考」功能,並改進了程式碼撰寫和電腦使用方面的能力。 與其他大型語言模型相比, Claude 3.7 Sonnet 最獨特之處在於它結合了 LLM 和推理模型的優勢。 一般的 LLM 擅長生成文字和理解語言模式,而推理模型則可以將複雜問題分解成步驟,顯示其「思考鏈」,以得出解決方案。 Claude 3.7 Sonnet 則 兼具兩者 的能力,使其在市場上獨樹一幟。 此外,Claude 3.7 Sonnet 的輸出容量也大幅提升,可產生長達 128,000 個 token 的回應,是 Claude 3.5 Sonnet 的 16 倍。 更長的回應長度對於程式碼和內容生成特別有效。  

混合推理: Claude 3.7 Sonnet 的秘密武器

Claude 3.7 Sonnet 導入了一種獨特的 AI 推理方法,將其與其他功能無縫整合。 不同於傳統模型將快速回應和需要深入思考的回應分開處理, Claude 3.7 Sonnet 允許用戶在標準和延伸思考模式之間切換。 在標準模式下,它的功能類似於 Claude 3.5 Sonnet 的升級版;而在延伸思考模式下,它會進行自我反思,以在各種任務中取得更好的結果。 用戶可以調整模型思考的時間,在速度和答案品質之間取得彈性平衡。 更重要的是, Claude 3.7 Sonnet 允許用戶設定「思考預算」,也就是調整模型思考的時間,最多可達 128,000 個 token,在速度、準確性和成本之間取得平衡。 這種彈性讓 AI 模型更能適應各種業務和技術需求。  

Claude 3.7 Sonnet 的混合推理模式與傳統大型語言模型的推理方式截然不同,它更像是人類大腦的運作方式。 傳統 LLM 通常使用不同的模型來處理快速查詢和複雜問題,而 Claude 3.7 Sonnet 則將推理能力整合到單一模型中,無論是回答簡單問題還是解決困難的謎題,都使用相同的「大腦」。  

程式碼撰寫能力大躍進

Claude 3.7 Sonnet 在軟體開發方面表現出色,尤其是在前端網頁開發方面。 它在程式碼基準測試中達到 最先進的效能 ,成為開發人員的強大工具。 此外, Anthropic 還推出了 Claude Code ,這是一款 AI 驅動的程式碼輔助工具,直接內建於模型中。 Claude Code 具備以下優勢:  

  1. 卓越的程式碼生成能力: 基準測試顯示, Claude Code 在特定程式碼任務中的表現優於先前的 Claude 模型 。
  2. 除錯和重構: 該模型協助開發人員進行程式碼除錯、程式碼優化,並以更簡單的方式解釋複雜的邏輯。
  3. 多語言支援: Claude Code 支援多種程式語言,對軟體工程師、研究人員和 AI 開發人員都非常有用。

開發人員可以透過終端機委派工程任務,例如搜尋和編輯程式碼、執行自動化測試,以及將變更提交到 GitHub 等。  

Claude 3.7 Sonnet 的進階功能

Claude 3.7 Sonnet 引入了「動作擴展」功能,這是一種改進的功能,允許模型迭代地呼叫函數、響應環境變化,並持續執行直到完成開放式任務。 其中一個例子是使用電腦: Claude 可以發出虛擬滑鼠點擊和鍵盤按鍵來代替用戶完成任務。與之前的模型相比, Claude 3.7 Sonnet 可以為電腦使用任務分配更多時間和計算能力,而且結果通常更好。  

Claude 3.7 Sonnet 與其他模型的比較

功能Claude 3.7 SonnetGPT-o3Grok 3DeepSeekGemini 2.0
混合推理能力⚠️ (僅限 Flash Thinking)
程式碼撰寫能力
代理工作流程⚠️⚠️
可見的逐步推理⚠️ (部分)✅ (僅限 Flash Thinking)
可調整的推理預算⚠️ (僅限 o3-mini)⚠️
多模態輸入⚠️ (部分)⚠️ (部分)
多模態輸出⚠️ (僅限 Flash)
網路搜尋

Claude 3.7 Sonnet 在混合推理能力方面表現出色,允許用戶在快速回應和深入思考之間切換。 它也具備強大的程式碼撰寫能力,並在 SWE-bench Verified 和 TAU-bench 等基準測試中達到最先進的效能。 此外, Claude 3.7 Sonnet 還具備代理工作流程能力,可以自主導航多步驟流程。 它可以顯示其推理過程,提高 AI 決策的透明度。 用戶還可以控制模型思考的時間,平衡速度、成本和效能。  

GPT-o3 在推理和程式碼撰寫方面也表現出色,尤其是在數學和科學領域。 它引入了「程式合成」功能,可以將現有知識重新組合成新的演算法,解決以前未曾遇到的問題。 GPT-o3 也採用了增強的「思考鏈」推理技術,模仿人類的腦力激盪過程。 然而, GPT-o3 的逐步推理過程並非完全可見, OpenAI 僅提供 CoT 的摘要版本。  

Grok 3 是一款多模態模型,具備進階的文字生成、圖像生成和推理能力。 它可以透過 Think 和 Big Brain 模式進行逐步推理,並透過 DeepSearch 模式搜尋網路資訊。 Grok 3 在多項基準測試中表現出色,包括 AIME 2025 、 Chatbot Arena 和 GPQA 。  

DeepSeek 專注於進階推理能力,並透過強化學習進行訓練。 它在數學、程式碼和科學問題解決方面表現出色。 DeepSeek 採用多頭潛在注意力 ( MLA ) 和多 token 預測 ( MTP ) 等架構創新,提高回應速度和準確性。  

Gemini 2.0 是 Google 推出的多模態模型,具備文字、圖像和語音處理能力。 Gemini 2.0 Flash 是其最新版本,支援即時 Live API 和增強的代理能力。 Gemini 2.0 Flash Thinking Experimental 則具備進階推理能力,並在 AIME2024 、 GPQA Diamond 和 MMMU 等基準測試中表現出色。  

Claude 3.7 Sonnet 的效能

Claude 3.7 Sonnet 在多項基準測試中展現出其強大的效能。 它在 SWE-bench Verified 和 TAU-bench 等基準測試中達到最先進的效能,證明了其強大的程式碼撰寫和問題解決能力。 此外,它在 AIME 2024 、 MMLU 等測試中的表現也相當出色,甚至在 Pokémon 遊戲測試中超越了所有先前的模型。 延伸思考模式讓 Claude 3.7 Sonnet 能夠更深入地分析複雜問題,進而在數學、物理和程式碼等任務中取得更好的結果。  

安全性與可靠性

Anthropic 顯著提升了 Claude 3.7 Sonnet 的安全性機制,重點包括:  

  1. 與先前版本相比,不必要的拒絕減少了 45% 。
  2. 更好地處理提示注入攻擊。
  3. 提高推理的可信度,減少幻覺和誤導性回應。

結語

Claude 3.7 Sonnet 是一款功能強大的大型語言模型,擁有混合推理、增強的程式碼撰寫能力和可調整的推理預算等多項優勢。 它在各個領域都有廣泛的應用潛力,可望成為 AI 生成內容市場的明日之星。 隨著 AI 技術的持續發展, Claude 3.7 Sonnet 將在推動 AI 應用和商業價值方面發揮重要作用。 其混合推理模式更接近人類的思考方式,讓 AI 模型不再只是單純的語言工具,而是能夠協助人類解決更複雜問題的合作夥伴。

常見問題 ( FAQ )

  1. Claude 3.7 Sonnet 在哪裡可以使用? Claude 3.7 Sonnet 目前可在所有 Claude 方案中使用,包括免費版、專業版、團隊版和企業版,以及 Anthropic API 、 Amazon Bedrock 和 Google Cloud 的 Vertex AI 。
  2. Claude 3.7 Sonnet 的價格是多少? Claude 3.7 Sonnet 的價格與其前身相同:每百萬個輸入 token 3 美元,每百萬個輸出 token (包括思考 token ) 15 美元。
  3. Claude 3.7 Sonnet 的主要競爭對手有哪些? Claude 3.7 Sonnet 的主要競爭對手包括 OpenAI 的 GPT-o3 和 Google 的 Gemini 2.0 Pro Experimental 、 Grok 3 及 DeekSeek R1 。
  4. Claude 3.7 Sonnet 有哪些潛在的應用? Claude 3.7 Sonnet 的潛在應用包括程式碼生成、進階聊天機器人、知識問答、視覺資料提取、客戶服務代理程式、內容生成和分析、機器人流程自動化等。

Grok 3 對所有人開放,一般使用者也能體驗 DeepSearch

Grok 3 對所有人開放,一般使用者也能體驗 DeepSearch

Elon Musk 旗下的 xAI 公司宣布了一項令人振奮的消息:旗下最新的 AI 聊天機器人 Grok 3 正式向所有用戶開放,不再局限於付費訂閱者。這項更新不僅讓更多人能夠接觸到這款被譽為「地球上最聰明的 AI」的技術,還首次將其強大的 DeepSearch 功能帶給一般使用者,讓人們得以一窺這款新世代搜尋引擎的威力。

Grok 3 的全民開放

根據 xAI 在 2 月 19 日的直播發布會, Grok 3 自推出以來便以其超越前代十倍的運算能力,以及在數學、科學和程式設計等領域擊敗競爭對手的表現,引發業界高度關注。最初,這款聊天機器人僅限於 X 平台的 Premium+ 訂閱用戶(每月 40 美元)使用,但如今, xAI 決定將其推向更廣泛的群眾。從 2 月 20 日起,任何人都可以透過 Grok 的官網( grok.com )或 X 平台免費體驗這款 AI。

這一舉動被視為 xAI 與 OpenAI、 Google 等對手競爭的最新策略。就在幾天前, Musk 才公開批評 OpenAI 偏離其非營利初衷,而此時將 Grok 3 開放給大眾,似乎也在向市場展示其「讓 AI 造福全人類」的承諾。與此同時, Musk 也在直播中透露, Grok 2 的程式碼即將開源,進一步展現 xAI 的開放態度。

DeepSearch:重新定義搜尋體驗

此次更新的亮點之一,莫過於 DeepSearch 功能的全面解鎖。這項內建於 Grok 3 的搜尋引擎不僅能即時掃描網路,還能展示 AI 在回答問題時的思考過程。根據 xAI 的說法, DeepSearch 有別於傳統聊天機器人,它會在回應前分析多個來源,並以簡潔、有條理的方式呈現結果,甚至能生成包含數據和表格的詳細報告。

「 DeepSearch 不只回答問題,它還告訴你答案怎麼來的,」 xAI 工程師在發布會上表示。「這是我們追求『極致真相』的一部分。」這項功能特別適合需要快速研究或深入分析的使用者,從學生到專業人士都能受惠。

市場反應

Grok 3 的開放消息一出,立刻在網路上掀起熱議。科技愛好者稱讚其強大性能與免費使用的吸引力,但也有聲音質疑這是否只是 xAI 用來搶占市場的短期策略。畢竟,維持如此高性能 AI 的運算成本不菲,而 xAI 尚未透露免費模式的長期計畫。

與此同時, Grok 3 的競爭對手並未坐視不管。 OpenAI 的 GPT-4o 和 Google 的 Gemini 仍穩坐市場前列,而中國的 DeepSeek 也憑藉其高效的 R1 模型迅速崛起。分析師指出, xAI 若想在這場 AI 大戰中脫穎而出,單靠免費開放可能不夠,還需在功能創新與用戶體驗上持續領先。

值得一提的是, xAI 即將推出名為 SuperGrok 的訂閱服務,據傳每月 30 美元,將提供更高圖像生成額度與進階功能。這或許暗示著免費版 Grok 3 是吸引用戶的敲門磚,而真正的獲利模式仍在後頭。

結語

無論如何, Grok 3 的全民開放無疑是 AI 領域的一大里程碑。它不僅讓一般使用者有機會體驗尖端技術,還透過 DeepSearch 展示了一種更透明、更高效的搜尋方式。隨著 xAI 持續推進其願景, Musk 是否能兌現「改變人類對宇宙理解」的承諾,值得拭目以待。

Perplexity 推出 Deep Research

Perplexity 推出 Deep Research

人工智能研究領域迎來革命性突破,Perplexity AI 於 2025 年 2 月 14 日正式推出 Deep Research 功能,這項免費開放的核心技術不僅重新定義資訊處理效率,更在 AI 競賽中對 OpenAI 與 Google 形成直接挑戰。

YouTube thumbnailYouTube icon
影片來源:Perplexity

技術架構與運作流程

三階段認知處理系統

Deep Research 的運作核心建立在仿人類認知的三階段架構:首先進行大規模資料爬梳,系統能在 90 秒內掃描超過 200 個權威來源,包括學術期刊、財報文件與即時新聞。不同於傳統檢索工具,其特徵在於第二階段的動態推理模組,會根據初步發現自動生成後續研究路徑,這種遞歸式學習機制使分析深度可達傳統方法的 4.7 倍。最後的綜合報告階段採用專利敘事引擎,將碎片化資訊轉化為結構嚴謹的專業文件。

性能基準與實測表現

學術評測全面領先

在權威的 Humanity’s Last Exam 綜合知識測試中,Deep Research 以 20.5% 準確率大幅超越 Gemini Thinking(15.2%)與 ChatGPT o3-mini(12.8%)。值得注意的是,其在地球科學與金融工程領域的表現分別達到 34.7% 與 41.2%,展現跨學科優勢。更關鍵的是 SimpleQA 事實性測驗中 93.9% 的準確率,這項指標直接反映系統的資訊可靠性,較業界平均水準高出 22 個百分點。

Perplexity Deep Research 在 Humanity's Last Exam 中的表現
圖片來源:Perplexity 官方網站
Perpelxity Deep Search 在 SIMPLE QA 的表現
圖片來源:Perplexity 官方網站

市場定位與競爭分析

商業模式創新突破

Perplexity 採取激進的免費策略,基礎用戶每日可進行 5 次深度查詢,相較 OpenAI 的 200 美元月費制形成鮮明對比。這種定價策略背後隱含的數據網絡效應值得關注—據內部數據顯示,Pro 用戶的查詢量中有 68% 會主動選擇公開報告,持續豐富系統的訓練資料庫。

技術比較層面,Deep Research 的迭代搜尋(Iterative Search)功能使其有別於 ChatGPT 的線性檢索。在專利分析任務中,前者能自動延伸 4.3 個關聯技術分支,而競爭產品平均僅 1.7 個延伸維度。輸出功能支援 PDF 與 Markdown 格式,特別針對學術寫作與程式開發需求設計,這在現有競品中屬獨創性功能。

結語

Perplexity 的 Deep Research 不僅是技術突破,更是知識民主化進程的重要里程碑。其創新的三階段認知架構與激進的免費策略,正在重塑專業服務市場。儘管面臨運算成本與監管合規的雙重挑戰,該系統展現的 93.9% 事實準確率與跨領域分析能力,已為 AI 輔助研究樹立新標竿。未來發展將取決於動態推理引擎的持續優化與商業生態系的建立,這項技術可能引發的生產力革命,值得每個知識工作者密切關注。

Adobe Firefly Video 火力全開:AI 影片生成工具正式登場

Adobe Firefly Video 火力全開:AI 影片生成工具正式登場

Adobe 正式推出 Firefly Video 模型公開測試版,為 AI 影片創作領域樹立了全新標竿。這項尖端技術整合至 Adobe Creative Cloud 套件和 Firefly 網頁應用程式,讓影片專業人士和愛好者都能透過文字提示和圖像生成吸睛的影片內容。Firefly Video 將徹底改變影片製作方式,提供前所未有的創意掌控和效率,同時解決智慧財產權方面的關鍵問題。

YouTube thumbnailYouTube icon
影片來源:Adobe

Firefly Video:AI 影片創作新紀元

Firefly Video 是 Adobe 生成式 AI 工具套件的最新成員,加入了 Firefly Image 2 和 Firefly Vector Model 的行列。這款創新模型允許使用者生成長達 5 秒、解析度達 1080p 的影片片段。值得注意的是,Firefly Video 是第一款公開可用且商業安全的影片生成器,突顯了 Adobe 在 AI 影片創作領域的領導地位。

使用者可以輸入文字提示或圖像,指定相機角度、運動和其他電影元素,以達到所需的視覺風格。Adobe 強調 Firefly Video 的「商業安全」特性,確保生成的內容對 IP 友善,適合用於商業用途。在 AI 影片生成快速發展的時代,版權侵權和法律挑戰的疑慮日益增加,這一點至關重要。Adobe Firefly Video 僅使用 Adobe Stock 素材和公共領域內容進行訓練,確保生成的影片不受版權限制。

為進一步解決錯誤資訊的疑慮並確保透明度,使用 Firefly Video 生成的影片將帶有內容憑證。這項浮水印技術由 Adobe 倡導,作為內容來源和真實性聯盟 (C2PA) 計畫的一部分,有助於建立標記 AI 生成內容的全產業標準。

Firefly Video 初期專注於生成自然景觀、植物和動物的影片,但它也具備更廣泛的功能。它還可以生成都市環境、動物運動和行為、天氣模式和粒子效果等大氣元素,甚至可以掌握 2D 和 3D 動畫。這種多功能性為各種應用開啟了令人興奮的可能性,從創造逼真的自然場景到開發動態的動態圖形和視覺效果,應有盡有。

主要功能和特色

Firefly Video 提供一系列強大的功能,旨在簡化影片製作流程並增強創意工作流程:

  1. 文字轉影片: 透過詳細的文字提示生成影片片段,指定相機角度、運動和縮放。此功能允許使用者只需用文字描述所需的場景,即可快速將其想法化為現實。
  2. 圖像轉影片: 將靜態圖像或插圖轉換為動態影片片段。此功能讓使用者可以為現有視覺效果增添動畫效果,為靜態圖像增添動感和生命力。
  3. 生成式延伸: 透過在開頭或結尾生成新的影格來延伸現有的影片片段,或為音訊添加環境「房間音調」。此功能在後期製作中提供了靈活性,允許剪輯師微調影片的時間和流程。
  4. 相機控制: 使用詳細的相機設定微調影片,包括鏡頭尺寸、相機角度和相機移動。此功能可以精確控制生成影片的視覺構圖。
  5. 畫面比例選擇: 在 16:9 和 9:16 畫面比例之間進行選擇,以適應不同的平台和觀看體驗。此功能確保生成的影片針對各種社群媒體平台和觀看裝置進行了最佳化。
  6. 場景轉圖像: 從影片場景建立圖像參考,這對於生成影片內容很有用。此功能允許使用者從現有影片中提取關鍵影格,並將其用作新 AI 生成內容的靈感來源。

AI 驅動的翻譯功能,拓展全球影響力

除了影片生成功能外,Firefly Video 還包含 AI 驅動的音訊和影片翻譯工具。這些工具允許使用者將影片內容翻譯成 20 種語言,同時保留原始聲音並確保逼真的唇形同步。這項突破性技術為全球內容創作和發行開闢了新的可能性,讓接觸世界各地的觀眾變得更加容易。

對影片剪輯和製作產業的影響

Firefly Video 將以多種方式改變影片剪輯和製作產業:

  1. 提高效率: 自動執行 B-roll 生成和場景延伸等任務,讓剪輯師能夠專注於工作的更具創意的方面。這種效率的提高可以縮短製作時間並降低製作成本。
  2. 增強創造力: Firefly Video 讓剪輯師能夠探索新的想法,並嘗試不同的視覺風格,而不受傳統拍攝方法的限制。這種創作自由可以帶來更具創新性和吸引力的影片內容。
  3. 節省成本: 使用 AI 生成影片內容可以顯著減少對昂貴的重拍和場景勘察的需求。這種成本效益對於小型企業和獨立創作者來說尤其有利。
  4. 提升易用性: Firefly Video 的直觀介面和使用者友善的控制項讓更多使用者可以使用 AI 影片創作,包括那些影片剪輯經驗有限的使用者。影片製作的普及化可以讓個人和企業無需廣泛的技術專長即可創造引人入勝的內容。

此外,Firefly Video 的影響力還擴展到這些關鍵領域之外。它可以用於影片製作的各個階段,包括:

  1. 前期製作規劃: 根據劇本生成詳細的故事板,並分析趨勢以提出創意。
  2. 自動剪輯: 自動執行修剪、拼接和整理片段等任務,以及顏色分級和校正 。
  3. 增強視覺效果: 快速有效地創造高品質的視覺效果。

這些不同的應用突顯了 Firefly Video 在簡化工作流程和增強整個影片製作流程中的創造力方面的潛力。

除了 AI 驅動的功能外,Adobe 還推出了 Premiere Pro 的重大效能升級,包括更快的匯出速度和新的上下文相關屬性面板。這些升級進一步提高了效率和使用者體驗,鞏固了 Firefly Video 對產業的影響。

Adobe 對 Firefly Video 未來發展的規劃

雖然 Firefly Video 已經在業界掀起了波瀾,但 Adobe 對其未來發展還有更大的計畫。該公司旨在推出 4K 模型,用於專業級的製作工作,為要求嚴苛的專案提供更高品質的輸出。此外,Adobe 計畫進一步增強模型的功能,包括提高其生成以人為中心的內容的能力,並支援更快的構思工作流程。

值得注意的是,Adobe 正在透過分層訂閱計畫將其 AI 工具貨幣化。此策略對創意產業具有潛在影響,可能會影響影片專業人士的定價模式和對進階 AI 功能的存取。

訂閱計畫和定價

為了使用 Firefly Video 的進階功能,Adobe 推出了兩款新的訂閱計畫:

計畫價格 (台幣/月)影片/音訊點數5 秒 1080p 影片
Firefly StandardNT 357元2,00020
Firefly ProNT 1,050元7,00070

這些計畫提供分層存取影片和音訊功能,允許使用者選擇最符合其需求和預算的選項。Firefly Premium 計畫也正在籌備中,將滿足高產量創作者和團隊的需求,提供更大的影片生成能力。

結語

Adobe Firefly Video 代表了 AI 影片創作的重大進步。透過將尖端技術與對 IP 安全性和創意控制的承諾相結合,Adobe 提供了一款有可能重塑影片製作格局的工具。Firefly Video 讓各級創作者(從經驗豐富的專業人士到有抱負的愛好者)都能以前所未有的輕鬆和效率製作高品質的影片內容。隨著 Firefly Video 的不斷發展,它無疑將釋放新的創意可能性,並重新定義影片製作的未來。