Google 搜尋結果將標注由 AI 生成的圖像

Google搜尋結果將標注由AI生成的圖像

Google 宣布將在搜尋結果中標註 AI 生成的圖像,此舉將提高透明度並幫助用戶識別真實與人工生成的內容。

這家科技巨頭計劃在未來幾個月內推出新的標籤系統,涵蓋 Google 搜尋、Google 圖片和 Google Lens 等多個產品。用戶將能夠使用「關於這張圖像」(About this image)功能來查看圖片是否由 AI 生成或編輯。

Google 副總裁 Laurie Richardson 表示:「我們的目標是為用戶提供更多背景資訊,幫助他們做出明智的決定。」

這項舉措是 Google 加入內容來源與真實性聯盟(C2PA)後的最新發展。該聯盟由 Adobe、Arm、Intel、Microsoft 和 Truepic 等公司聯合成立,旨在建立內容真實性的行業標準。

Google 還計劃將這一功能擴展到其廣告系統和 YouTube 平台。該公司正在探索如何在 YouTube 上標註 AI 生成或編輯的影片。

隨著 AI 生成內容的激增,此類措施變得越來越重要。根據驗證公司 Sumsub 的研究,2023 年至 2024 年間,與深度偽造相關的詐騙案件在全球範圍內增加了 245%,而在美國更是激增了 303%。

網絡安全專家警告稱,AI 技術正在降低網絡犯罪的門檻。Netskope 公司亞太地區首席資訊官兼首席安全官 David Fairman 指出:「這些服務的公開可用性降低了網絡犯罪分子的入門門檻。他們不再需要特殊的技術技能。」

Google 的這一舉措代表了科技行業在應對 AI 帶來的挑戰方面邁出的重要一步。隨著 AI 技術的不斷發展,類似的保護措施可能會在整個網絡世界變得更加普遍,使數字世界成為一個更安全、更透明的地方。

OpenAI 推出全新 AI 模型系列 o1 展現超強推理能力

OpenAI 推出全新 AI 模型系列o1 展現超強推理能力

OpenAI 2024年9月12日宣布推出全新的 AI 語言模型系列 o1,標誌著人工智能技術的重大突破。這個系列包括兩款模型:o1-preview 和 o1-mini,旨在提供更強大的推理能力和更高效的性能。

o1 系列:思考型 AI 的崛起

OpenAI 的研究團隊表示,o1 系列與之前的 GPT-4 等模型有顯著區別。o1 被稱為「推理模型」,其特點是在回答問題前會進行更深入的思考。這種設計旨在提高 AI 在處理複雜任務時的表現,如解決難題、制定商業計劃或創作小說等。

技術突破:自我反思與改進

o1 系列的一個重要突破在於其自我反思和改進的能力。OpenAI 的研究人員分享了一個關鍵的「啊哈時刻」:在訓練過程中,他們發現模型開始質疑自己的答案,並進行有趣的反思。這種能力使 o1 在數學問題等領域的表現大幅提升。

創新訓練方法

研究團隊採用了創新的訓練方法來開發 o1。他們發現,使用強化學習(RL)來訓練模型生成和完善自己的思維鏈,比直接使用人類寫出的思維過程進行訓練更有效。這一發現為大規模提升模型的推理能力開闢了新途徑。

o1-preview 與 o1-mini:滿足不同需求

o1-preview 是該系列的旗艦模型,展示了 o1 技術的全部潛力。而 o1-mini 則是一個更小、更快的版本,旨在提供更高效的性能。這兩個模型的推出,顯示了 OpenAI 在平衡高端性能和實用性方面的努力。

結語

OpenAI 的這一重大發布預計將對 AI 行業產生深遠影響。o1 系列的推出不僅展示了 AI 技術的快速進步,也為未來 AI 應用開闢了新的可能性。隨著這些模型的進一步發展和應用,可能會看到 AI 在更多複雜領域中發揮關鍵作用。

OpenAI 表示,他們將繼續改進 o1 系列,並期待看到這些新模型在實際應用中的表現。科技界和投資者都將密切關注 o1 系列的發展,以及它可能帶來的新機遇。

模型資訊

主要特點

  1. 增強推理能力:該模型被設計為在回應前花更多時間思考問題,類似於人類的思考過程
  2. 擅長複雜任務:在科學、編碼和數學等領域表現出色。例如,在國際數學奧林匹克(IMO)資格考試中,o1 的正確率達到 83%,遠高於 GPT-4o 的 13%
  3. 編碼能力:在 Codeforces 競賽中達到了第 89 百分位
  4. 安全性改進:採用了新的安全訓練方法,利用其推理能力更有效地遵守安全和對齊準則

使用限制

  1. 目前缺少一些 ChatGPT 常用功能,如網頁瀏覽、文件和圖像上傳等
  2. API 使用有一定限制,如每分鐘 20 次請求的限制
  3. API 目前不支持函數調用、流式傳輸和系統消息等功能

可用性

  1. ChatGPT Plus 和 Team 用戶可以從 2024 年 9 月 12 日開始使用
  2. ChatGPT Enterprise 和 Edu 用戶將從下週開始獲得訪問權限
  3. 符合 API 使用等級 5 的開發者可以開始使用 API 進行原型設計
  4. OpenAI 計劃將 o1-mini 版本提供給所有 ChatGPT 免費用戶

Mistral 發布首款多模態 AI 模型 Pixtral 12B

Mistral 發布首款多模態 AI 模型 Pixtral 12B

法國人工智能新創公司 Mistral 於2024年9月10日發布了其首款多模態 AI 模型 Pixtral 12B,該模型能夠同時處理影像與文字,標誌著 Mistral 在 AI 領域的一大突破。

Pixtral 12B 擁有 120 億個參數,大小約 24GB,建立在 Mistral 先前發布的文字模型 Nemo 12B 之上,新增了一個 4 億參數的視覺編碼器,使其能夠「看見」影像並進行處理。這使得 Pixtral 12B 能夠回答有關任意數量、任意大小影像的問題,為影像加上標題說明,計算照片中的物體數量等,與 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4 等其他多模態模型類似。

Mistral 在 GitHub 和 Hugging Face 平台上釋出了 Pixtral 12B 模型權重的磁力連結,開發者可以下載、微調並在 Mistral 的標準授權下使用該模型。研究和學術用途是免費的,但商業應用需要付費授權。Mistral 開發者關係主管 Sophia Yang 表示,Pixtral 12B 即將可在該公司的聊天機器人平台 Le Chat 和 API 服務平台 Le Platforme 上進行測試。

Pixtral 12B 的發布,標誌著 Mistral 在獲得 6.45 億美元融資、估值達到 60 億美元後的新里程碑。儘管成立僅一年多,Mistral 已被視為歐洲的 OpenAI,其策略是發布免費的「開放」模型、對這些模型的託管版本收費,並向企業客戶提供諮詢服務。

不過,目前還不清楚 Mistral 使用了哪些圖像數據來訓練 Pixtral 12B。大多數生成式 AI 模型都是在網路上大量公開數據上訓練的,而這些數據通常受版權保護。一些模型供應商辯稱「合理使用」權使他們有權採集任何公開數據,但許多版權所有者並不同意,已對 OpenAI 和 Midjourney 等大型供應商提起訴訟。Pixtral 12B 是否也會捲入此類法律爭議,仍有待觀察。

隨著更多開發者下載和研究 Pixtral 12B,將能夠更具體地了解其性能和能力。Mistral 的這款多模態 AI 模型勢必將在業界引起廣泛關注,為 AI 應用開啟更多可能性。

YouTube 推出全新 AI 工具以保護創作者與藝術家

YouTube 推出全新 AI 工具以保護創作者與藝術家

隨著 AI 技術的快速發展,YouTube 正致力於確保其創作者和合作夥伴能在這個不斷演變的環境中茁壯成長。YouTube 表示,他們正在開發新的相似度管理技術,以保護創作者並為他們開啟新的機會。

YouTube 強調,他們相信 AI 應該用來增強人類的創造力,而非取代它。他們致力於與合作夥伴共同努力,確保未來的進步能夠放大創作者的聲音,同時也將繼續開發保護措施,以解決相關問題並實現共同目標。

Content ID 系統的延伸應用

這兩項新功能建立在 YouTube 多年來利用技術驅動方法來大規模解決版權問題的基礎之上。自 2007 年以來,Content ID 系統已為版權所有者提供對其在 YouTube 上的整個目錄的精細控制,每年處理數十億次的版權主張,同時也透過作品的再利用為藝術家和創作者帶來數十億美元的新收入。YouTube 承諾將在 AI 時代為創作者提供同等程度的保護和賦權。

YouTube 表示,多年來他們一直使用上傳到 YouTube 的內容來改善創作者和觀眾在整個 YouTube 和 Google 平台上的產品體驗,包括透過機器學習和 AI 應用程式。這包括支援他們的信任與安全營運、改善推薦系統,以及開發新的生成式 AI 功能,如自動配音等。展望未來,YouTube 仍致力於確保以負責任的方式使用 YouTube 內容來開發 AI 驅動工具。

打擊未經授權的內容搜刮行為

對於其他可能試圖搜刮 YouTube 內容的第三方而言,YouTube 明確表示,以未經授權的方式存取創作者內容違反了其服務條款,並破壞了 YouTube 為創作者的工作提供的價值。YouTube 將繼續採取措施確保第三方遵守這些條款,包括持續投資於檢測和防止未經授權存取的系統,甚至封鎖那些進行內容搜刮的人的存取權限。

儘管如此,隨著生成式 AI 環境的不斷發展,YouTube 意識到創作者可能希望對如何與第三方公司合作開發 AI 工具有更多控制權。因此,YouTube 正在開發新的方式,讓 YouTube 創作者可以選擇第三方如何在其平台上使用他們的內容。YouTube 表示將在今年晚些時候分享更多相關資訊。

全新生成式 AI 工具激發創意

YouTube 推出的新生成式 AI 工具,如實驗性的 Shorts 夢幻螢幕 (Dream Screen),為創作者開啟了令人興奮的可能性,讓他們能夠以創新的方式表達創意並吸引觀眾。創作者可以掌控創作過程,引導工具的輸出並決定要分享的內容。

YouTube 強調,他們致力於營造一個安全負責的社群,這也延伸到使用 AI 生成的內容。與 YouTube 上的所有內容一樣,AI 生成的作品必須遵守社群指南。無論內容來源為何,創作者最終都有責任確保其發布的內容符合這些標準。

為了支援創作者遵循相關政策,YouTube 在其 AI 工具中納入了保護措施,旨在防止潛在的濫用。這意味著 YouTube 可能會封鎖違反其政策或涉及敏感主題的提示。雖然 YouTube 的主要目標是賦予創意,但他們鼓勵創作者在發布前仔細審查 AI 生成的內容,就像在任何其他情況下一樣。YouTube 表示,特別是在這些產品的早期階段,他們可能並不總是能做到完全正確,因此鼓勵創作者提供反饋意見。

與合作夥伴共同努力

隨著 AI 的發展,YouTube 認為它應該用來增強人類的創造力,而非取代它。他們致力於與合作夥伴共同努力,確保未來的進步能夠放大創作者的聲音,同時也將繼續開發保護措施來解決相關問題並實現共同目標。自成立之初,YouTube 就專注於賦予創作者和企業在其平台上建立蓬勃發展的社群,而他們的重點仍然是營造一個負責任創新蓬勃發展的環境。

YouTube 表示,他們將繼續與創作者和藝術家密切合作,在 AI 時代保護他們的權益。透過新推出的語音複製和臉部識別工具,YouTube 希望為創作者提供更多控制權,防止他們的肖像和聲音被濫用。同時,YouTube 也將持續投資於信任與安全系統,打擊未經授權的內容搜刮行為。

alphaXiv : AI 研究社群的革命性討論平台

alphaXiv:AI研究社群的革命性討論平台

在科技領域,資訊流動的速度比以往任何時候都來得快。無論是最新的 AI 模型、深度學習技術,還是語言模型(LLMs)的突破,研究者們幾乎每天都在推出令人矚目的論文。然而,儘管研究成果層出不窮,與研究作者互動的機會卻一直有限。這就是為什麼一個名為 alphaXiv 的新平台,正在迅速崛起,並改變研究社群的討論方式。

從 arXiv 到 alphaXiv :解決溝通的鴻溝

目前,大部分 AI 和計算機科學的研究成果都會發布在 arXiv 上,這是學術界最廣為使用的公開資料庫之一。使用者可以輕鬆取得論文摘要與 PDF 檔案,甚至進行深入的技術研究。然而,對於很多人來說, arXiv 最大的缺陷就是缺乏直接與論文作者或其他研究者互動的途徑。你可能有關於某個實驗結果的疑問,或者想進一步探討某個理論,但無法找到適合的平台來提出問題。

這裡就是 alphaXiv 的切入點。這個全新平台的核心宗旨,是建立一個專門的學術討論空間,讓研究者、開發者,甚至只是有興趣的讀者都能夠與論文的作者或其他研究者互動。通過 alphaXiv ,學術交流不再僅僅停留在 X 或 Discord 這些傳統社群平台上,也擺脫了這些平台上討論雜亂無章的困境。

互動與透明化: alphaXiv 的優勢

alphaXiv 的設計初衷是簡單而強大:讓使用者能夠直接與論文作者對話。每篇論文不僅有討論區,還允許作者聲明他們的身份,這樣可以確保交流的真實性與權威性。當你對某篇論文有疑問時,無需再去推特搜尋無數的評論,也不必在 Discord 中找尋那些難以追蹤的討論。 alphaXiv 提供了一個透明且有組織的環境,讓所有人都能即時參與學術討論。

這樣的互動機制對於 AI 社群來說尤其重要,因為這個領域的發展速度極快,許多技術變革都依賴於公開的批評和討論。 alphaXiv 不僅可以幫助研究者解答疑問,也能促使更多深入的討論,這對於技術的進一步突破至關重要。

為 AI 與更多學科搭建橋樑

alphaXiv 的功能並不僅限於 AI 研究。雖然目前 AI 社群的討論最為活躍,但該平台同樣支持物理、數學、統計學等多個領域的論文討論。這意味著,不論你是 AI 工程師還是物理學家, alphaXiv 都能成為你追蹤最新研究、參與學術討論的重要工具。

此外, alphaXiv 還提供了許多輔助功能,如書籤與活動紀錄,讓使用者能夠輕鬆管理他們感興趣的論文,並追蹤他們的提問與回覆。這樣的設計讓學術研究不再只是一個人的工作,而是一個互動性極高的過程。

競爭平台的挑戰: alphaXiv 能否脫穎而出?

毫無疑問, alphaXiv 的出現填補了一個長期以來被忽視的市場需求。然而,它仍面臨著一些挑戰。儘管該平台的討論機制極具潛力,但如何確保討論的質量、避免無用資訊充斥平台,仍需進一步探索。當前許多討論平台,如 Reddit 或 Hacker News ,因為無法有效管理討論內容,導致質量參差不齊。 alphaXiv 是否能成功解決這一問題,將是決定它能否在競爭中脫穎而出的關鍵。

此外, alphaXiv 的排名系統也是一個值得關注的方面。平台目前根據論文的討論活躍度進行排序,這固然能夠幫助使用者發現熱門話題,但如何避免熱門話題取代真正高質量的研究,仍然是未來的挑戰。

alphaXiv 的潛力無限

儘管挑戰重重, alphaXiv 在促進學術討論與交流方面的潛力不容忽視。對於 AI 研究社群來說,這可能是一個里程碑式的平台。它能夠為研究者、開發者與普通讀者搭建起一個共通的橋樑,讓所有人都能在這裡提出問題、分享見解,並促進技術的進步。

總體來看, alphaXiv 是一個極具前瞻性的工具,隨著其功能的不斷改進和使用者基數的增長,它有望成為全球學術研究者與技術開發者不可或缺的交流平台。