OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調

OpenAI 推出具突破性的模型自訂計劃,採用強化微調

OpenAI 宣布了其模型自訂能力的重大進展,推出了強化微調。這項新功能是 o1 系列模型改進的一部分,允許用戶使用強化學習算法在自己的數據集上對模型進行微調。這項宣布是由 OpenAI 研究主管 Mark 在最近的一場演示中發布的。

強化微調技術使模型能夠在特定領域內更有效地思考和推理,對於需要深厚專業知識的領域特別有價值,例如法律、財務、工程和醫療保健。與傳統的監督微調不同,監督微調專注於模仿輸入特徵,強化微調則通過評分模型的回應並強化正確的思維路線來教會模型學習新的推理方法。

這種方法的一大優點是其高效性。模型只需少量示例即可在新領域中有效推理,這是常規微調方法無法實現的。這使得強化微調成為專為特定需求量身定制專家模型的開發者、研究人員和機器學習工程師的強大工具。

OpenAI 已經從這項技術中看到了令人鼓舞的結果。在與 Thomson Reuters 的合作中,o1 mini 模型被微調以充當法律助手,展示了強化微調在實際應用中的潛力。此外,來自 Berkeley Lab 的計算生物學家 Justin Ree 強調了這項技術在科學研究中的潛力,特別是在理解罕見疾病的遺傳原因方面。

強化微調的過程包括上傳訓練和驗證數據集,設置評分器來評估模型輸出,並利用 OpenAI 的強化學習算法自訂前沿模型。這種方法允許用戶帶來他們的專業知識和數據,而 OpenAI 則處理模型訓練的複雜性。

OpenAI 目前正在擴大其 Alpha 計劃,允許更多組織和研究人員訪問這項技術。強化微調研究計劃適合那些正在與專家團隊合作解決複雜任務,並可能從 AI 助手中受益的人。有興趣的各方可以申請該計劃中有限的名額,計劃於明年早些時候公開發布這項技術。

YouTube thumbnailYouTube icon
12 Days of OpenAI: Day 2 完整視頻。影片來源:OpenAI
進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!
  8. OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合
  9. OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗
  10. OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora
  11. OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro

OpenAI 12天活動揭幕:DAY1 推出 o1 模型完整版和 Chat GPT Pro

OpenAI 12天活動揭幕:推出01模型完整版和Chat GPT Pro

在科技界備受矚目的 OpenAI ,今日正式揭開了「12天的OpenAI」活動的序幕。這場活動將在接下來的12個工作日內,每天推出或展示一項新功能或產品,為 AI 愛好者帶來一場科技盛宴。今天, OpenAI 一口氣推出了兩項重磅產品: o1 模型的完整版本ChatGPT Pro 版本

根據 OpenAI 的介紹, o1 模型在智能、速度、多模態輸入和指令跟隨方面有了顯著改進。這款模型主要針對科學家、工程師和程式設計師,他們需要更智能和快速的模型來處理複雜的任務。 OpenAI 表示, o1 模型在回應前會先思考,從而提供更詳細和正確的回應。這使得 o1 模型在回應速度上有了顯著提升,特別是在簡單問題上,並且在重大錯誤方面比 o1 預覽版減少了34%,思考速度提升了50%。

此外, o1 模型現在支持圖像和文字的聯合處理,這是用戶反饋後添加的功能。 OpenAI 的研究科學家們展示了 o1 模型在處理圖像和文字聯合問題時的能力,並且在多模態推理方面表現出色。這意味著用戶可以上傳圖像,讓模型進行聯合推理,從而解決更複雜的問題。

另一方面, ChatGPT Pro 版本針對高需求用戶推出,提供無限制的模型使用和高級語音模式。這款產品還包括一種特殊模式,稱為 o1 Pro 模式,允許模型在最困難的問題上使用更多的計算資源。 OpenAI 表示,這種模式在可靠性方面有顯著提升,特別是在複雜工作流程中。

OpenAI CEO Sam Altman 在活動中表示,ChatGPT Pro的價格是每月200美元,並且會在活動期間逐步添加更多功能。他還透露,未來計劃為 ChatGPT Pro 版本添加更多計算密集型任務和工具,並為開發者添加結構化輸出、函數調用和 API 圖像理解等功能。這些新功能將有助於解鎖更多的應用場景,讓開發者能夠建立更多新穎的應用。

這場「12天的 OpenAI 」活動將持續到12月20日,每天都會有新的驚喜。 OpenAI 希望通過這場活動,展示其在 AI 領域的最新成果,並與用戶分享這些創新的成果。這不僅是一場技術的盛宴,更是一場科技與創新的碰撞。

YouTube thumbnailYouTube icon
12 Days of OpenAI: Day 1 完整視頻。影片來源:OpenAI

進一步閱讀
  1. OpenAI 12天活動 DAY12:推出 o3 與 o3 Mini
  2. OpenAI 12天活動 DAY11:推出進階版 ChatGPT 桌面應用
  3. OpenAI 12天活動 DAY10:推出 ChatGPT 電話服務
  4. OpenAI 12天活動 DAY9:推出新模型與功能,提升開發者體驗
  5. OpenAI 12天活動 DAY8:ChatGPT 搜尋功能全面開放,免費用戶也能享受即時資訊
  6. OpenAI 12天活動 DAY7:推出「專案」功能整合對話與工作場景
  7. OpenAI 12天活動 DAY6:ChatGPT 推出影片與螢幕分享功能,聖誕老人也來了!
  8. OpenAI 12天活動 DAY5:ChatGPT 即將登陸 Apple 設備,與 iOS 及 Mac OS 整合
  9. OpenAI 12天活動 DAY4:推出 Canvas,重新定義 ChatGPT 的協作體驗
  10. OpenAI 12天活動 DAY3:推出全新影片生成工具 Sora
  11. OpenAI 12天活動 DAY2:推出突破性模型自訂計劃,採用強化微調

OpenAI 考慮在 ChatGPT 中引入廣告

OpenAI考慮在ChatGPT中引入廣告

OpenAI 首席財務官 Sarah Friar 近日表示,該公司正考慮在其人工智能產品中引入廣告,包括廣受歡迎的 ChatGPT 。此舉目的在探索新的收入來源,支持公司向營利模式的轉型。

Friar 強調,儘管目前尚無立即實施廣告的計劃,但公司對未來的可能性持開放態度。她指出, OpenAI 的現有業務模式正經歷快速增長,特別是在消費者訂閱方面。目前, ChatGPT 擁有約2.5億每週活躍用戶,且公司正以5%至6%的速度將免費用戶轉化為付費訂閱者。

為支持這一增長, OpenAI 計劃在美國中西部和西南部地區建立自己的資料中心,以提升基礎設施能力。此外,該公司還與蘋果公司建立了戰略合作夥伴關係,希望擴大 ChatGPT 的可及性,目標是在2025年達到10億用戶。

然而 OpenAI 的營利轉型也面臨挑戰。公司預計今年將虧損50億美元,主要原因是開發和運營先進人工智能模型的高昂成本。此外,特斯拉創辦人 Elon Musk 已對 OpenAI 的營利計劃提出法律挑戰,指控其違背原有使命,並試圖阻止其轉型。

在此背景下 OpenAI 正積極探索多元化的收入來源。引入廣告被視為一種潛在策略,儘管目前尚未有具體的實施時間表。公司領導層具備豐富的廣告行業經驗,包括來自 Instagram 的 Kevin Weil 和曾任 Google 廣告負責人的Shivakumar Venkataraman。這為未來可能的廣告業務奠定了基礎。

OpenAI 正處於快速增長和戰略轉型的關鍵時期。在探索廣告作為潛在收入來源的同時,公司也在加強基礎設施建設和戰略合作,以實現其長期增長目標。

Suno AI 發布 V4 版本:音樂創作領域的重大進展

Suno AI 發布 V4 版本:音樂創作領域的重大進展

2024年11月20日,在音樂創作者的重要發展中,Suno AI 推出了 Suno v4,這次更新承諾將革新音樂製作的方式,提供了更好的音頻品質、更精準的歌詞,以及動態的歌曲結構,讓創作過程隨著想法的速度進行。

Suno v4 的主要功能

  1. 重新製作工具:用戶現在可以使用「重新製作」功能,將舊曲目提升到最新的音頻標準。這允許在不從頭開始的情況下,賦予現有作品全新的、高品質的聲音。
  2. ReMi 的歌詞創作:目的是提升歌詞創作過程,ReMi( Suno 一個新的歌詞生成引擎,可以理解歌曲的主題、旋律、節奏等,來創造出與音樂元素高度匹配的歌詞。) 提供了一個工具,設計用來生成更創新和精緻的歌詞,支持詞曲作者創造與其音樂願景更深層次共鳴的歌詞。
  3. 增強的封面藝術:更新包括了新的封面藝術設計,確保音樂的視覺表現與其聽覺本質相匹配,提升每首曲目的整體展示。

超級加強的現有功能

  1. 翻唱:在 v4 中,用戶可以用全新音樂風格重新創作自己的曲目或他人的作品,提供了一個鼓勵並便於實驗的創作空間。
  2. 角色:這項功能允許一致地捕捉並在多個項目中應用一首歌曲的獨特氛圍,幫助藝術家保持獨特的聲音或探索不同的音樂身份。

可用性

Suno v4 目前處於測試階段,僅供 Pro 和 Premier 會員使用。這一策略性發布與 Suno 致力於根據用戶反饋來完善其產品的承諾相符,然後再進行更廣泛的發布。

社群和產業反應

音樂社群對 Suno v4 表現出興奮和期待的混合情緒。在 Discord 等平台上的早期使用者報告指出,聲音清晰度和歌曲結構有了顯著改進,有些甚至表示 AI 生成的音樂與人類創作的曲目越來越難以區分。

然而,關於這種技術的影響也存在爭論。雖然它為音樂製作開啟了無窮的可能性,但一些人擔心它可能會通過與人類創作者競爭而削弱傳統歌曲創作。這一更新正值 AI 在音樂領域受到讚揚其創新性的同時,也因其對音樂人生計的影響而受到審視。

結語

Suno 的最新版本不僅展示了技術進步,也暗示了 AI 可能在創意產業中扮演更大角色的未來。隨著 Suno 的持續發展,如何將這一工具融入專業音樂產業,將成為新的衡量標準,潛在地改變音樂製作技術的預期。

對於對未來音樂創作感興趣的人來說,Suno v4 不僅僅是一次升級,更可能是一個製作音樂的新範式轉變。

實際測試

讓我們先創作一首歌詞《衝浪愛戀》,測試它在 V3.5 與 V4 之間輸出結果的差異:

[Verse 1]
陽光炙熱 墾丁的沙灘
你的身影 如夢似幻
比基尼 閃耀著青春光芒
我的心 隨波浪起伏
[Pre-Chorus]
衝浪板上 展現自我
浪花間 尋找真愛
這個夏天 註定難忘
你我的愛 在這裡綻放
[Chorus]
衝破巨浪 勇往直前 (Yeah~)
墾丁的夏 熱情似火
你的微笑 是我的動力
讓我們的愛 乘風破浪
在這片藍 譜寫浪漫
台灣的驕傲 就在這片海
[Verse 2]
椰子樹下 分享芒果冰
你的甜美 讓我心醉
夕陽西下 漫步沙灘
十指緊扣 許下永恆
[Bridge]
[Romantic]
衝浪板上的默契
是我們愛情的見證
墾丁的魅力 台灣的驕傲
永遠珍藏在心底
[Chorus]
衝破巨浪 勇往直前 (Yeah~)
墾丁的夏 熱情似火
你的微笑 是我的動力
讓我們的愛 乘風破浪
在這片藍 譜寫浪漫
台灣的驕傲 就在這片海
[Outro]
(Harmonies)
衝浪愛戀 墾丁之夜
我們的愛 如浪永恆

V3.5

V4 (Remasterd)

兩首歌在相同的歌詞及旋律的情況下, V3.5 的平均音量表現較 V4 更高,表現出更強的音樂動態感;而 V4 在人聲及樂器細節表現更為細膩,樂器音更顯突出。兩者在流行樂的呈現各有特色,端看各位讀者的喜好決定要用那個版本。整體而言筆者認為 V4 表現更為突出。

歡慶中華隊勇奪WBC世界棒球錦標賽冠軍,僅以此首歌曲獻給場內場外集氣幫助球隊奪冠的各位熱情球迷!

歌詞

[Verse 1]
東京巨蛋
燈火輝煌
中華健兒
勇敢登場
飛灑汗水
燃燒希望
每一次揮棒
都是信仰

[Pre-Chorus]
團結一心
無懼風浪
我們的吶喊
震撼球場

[Chorus]
中華隊
加油
狂耀屬於我們
世界冠軍
夢想成真
中華隊
加油
勝利的積極
在風中飄揚
永不落下

[Verse 2] 
四比零的分數
寫下傳奇
終結連勝
勇者無懼
三十二年的等待
終於迎來這一刻的光彩

[Bridge]
每一個揮棒
每一次奔跑
都是為了這一刻的驕傲
我們的心
與你同在
中華隊
永遠的依賴

[Chorus]
中華隊
加油
狂耀屬於我們
世界冠軍
夢想成真
中華隊
加油
勝利的激震
在風中飄揚
永不落下

[Outro]
我們的英雄
中華隊
永遠的驕傲
進一步閱讀
  1. Suno 推出 v4.5,歌曲長度提升至8分鐘
  2. Suno Prompt 完整使用技巧(V3 V3.5 V4適用)
  3. Suno 推出全新音頻輸入功能,開放所有用戶免費使用
  4. Suno 推出 V3.5 版本,全面開放用戶創作4分鐘完整歌曲
  5. AI 音樂版權大戰:環球、 SONY 等巨頭聯手起訴 Suno 和 Udio,行業格局或將重塑

Mistral AI 推出全新升級的 Le Chat 與多模態模型 Pixtral Large

Mistral AI 推出全新升級的「Le Chat」與多模態模型「Pixtral Large」

Mistral AI 於2024年11月18日宣布對其生成式 AI 助手 Le Chat 進行重大升級,並推出最新的多模態模型 Pixtral Large ,旨在提升人機互動的流暢性與效率,為用戶在研究、創作等領域提供更直觀且高效的工具。

Le Chat 的全新功能

Le Chat 是 Mistral AI 提供的免費生成式 AI 工作助手,此次升級引入多項新功能,旨在優化用戶體驗:

  1. 網頁搜尋與引用功能:用戶現在可以直接在 Le Chat 中獲取最新資訊,並附上引用來源,協助用戶做出更明智的決策。
  2. 創意畫布(Canvas):這是一個全新的介面,允許用戶與 Mistral 的語言模型共同創作,實現內容的直接修改、內嵌編輯和匯出功能。
  3. 先進的文件與圖像理解:透過最新發布的 Pixtral Large , Le Chat 能夠處理和分析複雜的 PDF 文件和圖像,提供對圖表、表格、圖示等的深入見解。
  4. 圖像生成:與 Black Forest Labs 合作, Le Chat 現在提供高品質的 Flux 圖像生成功能,增強創意工作流程。
  5. 整合式服務:從模型到輸出, Le Chat 提供一個統一的平台,確保用戶獲得無縫的使用體驗。
  6. 更快的回應速度:利用推測編輯技術, Le Chat 能夠提供更快速的回應,提升用戶互動的效率。
YouTube thumbnailYouTube icon
網頁搜尋與引用功能。影片來源:Mistral
YouTube thumbnailYouTube icon
畫布功能。影片來源:Mistral
YouTube thumbnailYouTube icon
文件理解功能(支援OCR)。資料來源:Mistral

這些升級使 Le Chat 在市場上的聊天和搜尋助手中具備競爭力,為用戶提供全面的工具組合。

Pixtral Large 的推出

Mistral AI 最新推出的 Pixtral Large 是一個擁有1240億參數的開源多模態模型,基於 Mistral Large 2 構建。該模型展示了先進的圖像理解能力,特別是在解讀文件、圖表和自然圖像方面表現出色,同時保持卓越的文本理解能力。

Pixtral Large」的主要特點包括:

  • 前沿級多模態性能:在 MathVista、DocVQA 和 VQAv2 等基準測試中達到最先進的成果。
  • 擴展能力:在不影響文本性能的情況下,增強了 Mistral Large 2 。
  • 強大的架構:包含1230億參數的多模態解碼器和10億參數的視覺編碼器。
  • 擴展的上下文窗口:支持128,000個標記的上下文窗口,可容納至少30張高解析度圖像。
Mistral Large 在 MM-MT-Bench 中有優異的表現
Pixtral Large 在 MM-MT-Bench 上展示了有競爭力的能力,其性能優於所有 Claude-3.5 Sonnet(新)、Gemini-1.5 Pro 和 GPT-4o(最新)。圖片來源:Mistral

Pixtral Large 可根據 Mistral 研究許可證(MRL)供研究和教育用途,商業用途則需取得 Mistral 商業許可證。

結語

Le Chat 的升級與 Pixtral Large 的推出,彰顯了 Mistral AI 在推動 AI 與人類互動方面的不懈努力。透過整合最先進的多模態功能和優化用戶介面,Mistral AI 致力於滿足各行各業專業人士和創意工作者的多樣化需求。

隨著 AI 的持續發展,Mistral AI 的創新反映了更廣泛的趨勢,即提供更易於訪問且多功能的 AI 工具,賦能各領域用戶在日常工作流程中利用先進技術。