Perplexity:超越 Google 的下一代 AI 搜尋引擎

Perplexity 最新的搜尋生圖功能:搜尋語句 “perplexity ai 的背景和經營團隊”、輸出風格 “相片”。該功能由 DALL-E 3 提供技術支持。

搜尋引擎已成為我們獲取資訊的重要工具。隨著人工智能(AI)技術的發展,搜尋引擎正迎來一場革命。傳統搜尋引擎如 Google 雖然強大,但新一代的 AI 搜尋引擎,如 Perplexity,正顯示出超越傳統模式的潛力。今天,我們將深入探討 Perplexity —— 一款結合了先進 AI 技術的搜尋引擎,它如何為用戶提供更加直觀、準確的搜尋體驗。

Perplexity 公司背景

YouTube thumbnailYouTube icon
影片來源: Perplexity

Perplexity 於 2022 年 12 月正式推出,是一家專注於 AI 搜尋技術的創新公司。它的創立標誌著一個新時代的開始,致力於利用 AI 技術改進網上搜尋的方式。Perplexity AI 的聯合創始人兼首席執行官 Aravind Srinivas 曾在加州大學柏克萊分校獲得計算機科學博士學位,並在 OpenAI、Google 和 Deep Mind 等公司從事人工智能研究 。他與前 Meta 研究科學家 Denis Yarats(Perplexity 的首席技術官)等合夥人共同創辦了 Perplexity AI。Perplexity AI 的開發團隊在 AI 領域擁有豐富的經驗和專業知識,並得到了來自人工智能專家如 Nat Friedman、Elad Gill、Jeff Dean、Ian Lakun 和 Andre Carpethy 等人的支持。

YouTube thumbnailYouTube icon
Perplexity 的創業故事。影片來源:Silicon Valley Girl

在投資方面,Perplexity 得到了眾多知名投資機構和行業領袖的支持。例如,它在最近的一輪融資中獲得了著名風險投資公司 IVP 的領投,這不僅凸顯了 Perplexity 在 AI 搜尋引擎領域的領先地位,也反映了市場對其技術和商業潛力的高度認可​​。此外,該公司還獲得了來自 New Enterprise Associates、Databricks Ventures 的資金支持,以及包括前 GitHub CEO Nat Friedman 和 Meta 首席科學家 Yann LeCun 在內的天使投資人的參與​​。這些投資者的加入不僅為 Perplexity 提供了資金支持,同時也帶來了豐富的行業經驗和資源,為公司的未來發展提供了堅實的基礎。

Perplexity 被矽谷的科技媒體 The information 報導為2023年市場上領先的聊天機器人。資料來源: Aravind Srinivas X

技術基礎和競爭優勢

Perplexity 的核心技術基於 OpenAI 的 GPT-3 語言模型,結合了自主研發的搜尋引擎。這種獨特的技術組合使得 Perplexity 不僅能夠提供快速響應的搜尋結果,還能夠理解用戶的搜尋意圖,提供更加相關和精確的資訊。與傳統搜尋引擎相比,Perplexity 的一大優勢在於其能夠提供更自然、對話式的搜尋體驗,使用者可以以更接近日常對話的方式進行資訊搜尋。(筆者註:如果把搜尋比做開車旅遊,傳統的 Google 搜尋就像是確定方向跟路線的開車過程,而透過 Perplexity 搜尋搭配他們獨家的 copilot 功能更像是裝上汽車導航的輔助駕駛系統,會一次性地列出大量的搜尋來源並透過 AI 萃取相關的資訊再整合內容給使用者)

搜尋結果內容連結 (Perplexity 提供搜尋結果分享的功能,不僅是搜尋結果,甚至相關的資料還可以匯集到一個資料夾加以分享)

根據 CEO Aravind Srinivas 的分享, Perplexity 對於使用者問題的理解能力甚至超過 Google SGE( Search Generative Experience )。

主要功能和服務

Perplexity AI 的搜尋引擎具備多項引人注目的功能。首先,它能即時搜尋網路,理解用戶查詢的上下文,並提供來自可信來源的相關回答​​。此外,Perplexity 利用大型語言模型(LLMs)和機器學習技術,不斷從以往的搜尋結果中學習,以提高未來搜尋的準確性和相關性​​。這種學習機制使得 Perplexity 能夠不斷進步,為用戶提供更貼近其需求的搜尋體驗。

YouTube thumbnailYouTube icon
影片來源:Perplexity

Pro 版本的進階功能

除了基礎版提供的功能外,Perplexity 還推出了 Pro 版本,進一步擴展了其搜尋能力。Pro 版本的用戶可以享受到更加個性化的搜尋體驗,包括更精確的語言模型支持(如 GPT-4 Turbo、 Claude 3 Opus、 Mistral Large 、llama2-70b 等)、圖像生成模型(如 DALL-E 3、SDXL、Playground 2.5 等)、高級的搜尋過濾選項。這些進階功能不僅增強了搜尋的準確性,同時也提供了更深入的資訊挖掘能力,使得用戶能夠更有效地獲取所需資訊。

Pro 版本用戶同時也可以在網路和行動裝置上提供圖像上傳。用戶可以上傳圖像,無論是歷史地標、拼圖還是日常生活場景,並要求解釋。官方表示在 Copilot 開關打開時效果特別好。

YouTube thumbnailYouTube icon
Perplexity 的圖片上傳分析功能。影片來源: Perplexity

有效的 AI 幻覺治療藥

AI 幻覺,也被稱為虛構或妄想,是指人工智能自信地生成出看似具說服力、實際卻是錯誤答案的問題,儘管這答案在其訓練數據中並不合理。在自然語言處理中,幻覺通常被定義為「生成的內容相對於被提供的源內容而言是無意義或不可信的」。這些科技能提供看似有用,但實際卻毫無用處的建議。例如, ChatGPT 可能會回答一個看似有理有據的答案,並配以看似有理有據的引用,使人不得不仔細檢查自己是否不小心輸入了真實現象的名稱。這種情況下, AI 可能會產生出一個非常令人印象深刻的答案,但實際上卻是完全錯誤的。有些研究人員認為,這種幻覺可能是由於訓練數據不足或者是高維統計現象所導致的。然而,這些觀點並不是所有人都同意,有些人認為這可能是因為模型偏向表面統計數據,導致對抗訓練在現實場景中不具有魯棒性。目前,幻覺現象仍未完全被了解,因此,從業者仍在進行研究以試圖減輕/減緩其出。特別是研究表明,語言模型不僅會產生幻覺,還會放大幻覺,即使是那些旨在緩解這一問題的模型也遇到了同樣的問題。

Perplexity AI 透過多種方式來解決 AI 幻覺問題。首先,Perplexity AI 的一個重要特點是其迭代速度快,每周都會有新的小更新,這使得它能夠快速修正可能出現的問題,包括 AI 幻覺問題。其次,Perplexity AI 提供了一種名為 “Source Edit”(信源編輯)的功能,這個功能允許用戶編輯參考信源並重新搜索。例如,如果 Perplexity AI 引用了未及時更新的維基百科條目,導致給出了錯誤的答案,用戶可以使用 “Source Edit” 功能刪除該信源,然後重新搜尋,這樣就可以得到正確的答案。這種功能有效地減少了無關信源對結果的干擾,並通過人工的方式,對潜在的不穩定性進行修正。此外,Perplexity AI 在反覆查詢相同問題時,基本能夠基於相同信源提供一致的答案,有效降低了大模型的不確定性。這種穩定性有助於減少 AI 幻覺問題的出現。

Perplexity 的 Source Edit 功能

用戶體驗和市場反饋

自推出以來,Perplexity 已經在用戶群中獲得了廣泛的好評。用戶特別讚賞其快速、準確的搜尋能力和直觀的用戶界面設計​​。許多用戶表示,Perplexity 的對話式搜尋方式極大地改善了他們的網上搜尋體驗,使得獲取資訊變得更加輕鬆和自然。此外,隨著 Perplexity 不斷改進其算法和功能,用戶體驗也在持續提升。

完成 B 輪融資加速 AI 搜尋引擎發展

YouTube thumbnailYouTube icon
亞馬遜創辦人傑夫·貝佐斯投資 Perplexity。 Perplexity CEO Aravind Srinivas 接受 Bloomberg 專訪。影片來源: Bloomberg Technology

傑夫·貝佐斯對 Perplexity 的投資是其對 AI 初創公司興趣的最新例證。據報導,貝佐斯投資了7400萬美元於專注於網路搜尋的 Perplexity 。這筆投資是該公司最近一輪融資的一部分,該輪融資由包括 Nvidia 和亞馬遜創辦人傑夫·貝佐斯在內的投資者群體完成,將 Perplexity 的估值推至5.2億美元。這表明貝佐斯對該公司旨在挑戰 Google 在搜尋領域的主導地位的 AI 創新表示支持。

CNBC:這是 Google 搜尋的終結嗎? 巨人如何失去領先地位?

YouTube thumbnailYouTube icon
影片來源: CNBC

CNBC 認為 Google 在搜尋引擎的支配地位正面臨 ChatGPT 等新 AI 模型的挑戰。投資者和分析師都在質疑 Google 是否仍主導 AI 領域。包括 Anthropic 的Claude 和 Perplexity 等初創公司正利用 AI 助手改造搜尋引擎,能夠歸納資訊。Google 多年前就承諾成為 “AI第一” ,但尚未將其完全整合到搜尋中。它面臨失去用戶的風險。

Google 搜尋和 YouTube 仍是有史以來最具抗風險的消費者產品。Google 擁有 Android 並每年向蘋果支付數十億美元保持 iPhone 上的搜尋地位。但默認選項可以迅速改變,正如 Google 自己的興起所示,年輕一代已經開始去其他地方例如 TikTok 獲取資訊。儘管目前為時尚早宣佈 Google 搜尋的結束,該公司面臨着日益增長的 AI 競爭風暴,迫切需要採取行動。

CNBC Money 訪談 Perplexity CEO Arvin Krina

YouTube thumbnailYouTube icon
影片來源: CNBC

Perplexity 的 CEO Arvin Krina 評論了當前人工智能領域的發展格局。他認為微軟在人工智能整合執行方面做得很好,快速將其融入企業產品;但 Google 似乎在生成式人工智能領域執行力最差,原因在於 Google 的商業模式和被認為準確的品牌形象,使其難以容忍人工智能模型可能產生的錯誤或虛構內容。

Arvin 創立 Perplexity 的靈感來自尋找健保詳情時, Google 只返回廣告而無直接答案的挫敗感。他期望 Perplexity 能提供直接解答,不耗費時間瀏覽連結,顛覆 Google 賺廣告收入的傳統搜尋模式。隨著直接回答人工智能助理的興起,高效能的知識工作者可能會棄用耗時的 Google 搜尋,轉而使用能節省時間的新興選擇,這將對 Google 品牌和業務帶來重大衝擊。

此外,在接受 The Logan Bartlett Show 的訪談時,他認為 Perplexity 面臨著與 OpenAI 和 Google 等巨頭爭奪人才的挑戰,但他從 Larry Page 那裡學到了”用戶永遠是對的”的理念,並致力於打造一個由聰明人組成的團隊,解決棘手的問題,將產品推向用戶。他預測未來將有100家人工智能初創公司的估值超過100億美元。不過,他目前不太關注人工智能安全問題,因為他認為現有的風險似乎還很遙遠。現在還不是監管人工智能的時候,因為這可能會阻礙創新。 Perplexity 的最終目標是成為一個知識的瑞士軍刀,幫助人們在日常生活中做出更好的決策,並通過 Larry Page 的”牙刷測試”,即每天至少被使用兩次。儘管改變用戶習慣需要時間,但 Perplexity 團隊正致力於長期發展,以實現這一目標。

YouTube thumbnailYouTube icon
影片來源:The Logan Bartlett Show

即將銷售廣告:理想終究敵不過現實?

根據 CNETAdweek 等媒體的報導,Perplexity 計劃在未來幾個季度開始銷售廣告,這與該公司之前對外展示的”不受廣告影響”的品牌形象有所出入。外界關注 Perplexity 在保持準確高效搜尋結果的同時,如何在廣告中找到平衡,避免影響用戶體驗和贏得廣告商青睞,畢竟這關係到其商業模式的可持續性。

推出廣告的原因

  1. 商業模式需求
    Perplexity 目前的商業模式主要是會員訂閱和 API 接口,但似乎難以完全支撐其運營成本。引入廣告有望成為一種”回血”手段。
  2. 吸引廣告商
    據報導,約有40%的 Perplexity 搜尋量與某些特定主題相關,公司計劃在這些”相關問題”中插入品牌贊助的原生廣告。這有望吸引廣告商投放廣告。
  3. 追隨 Google 路線
    作為一個聲稱要”取代 Google “的 AI 搜尋引擎, Perplexity 最終還是選擇了與 Google 類似的廣告盈利模式。

可能的影響

影響1:搜尋體驗可能受到干擾

Perplexity 一直標榜提供”不受廣告影響”的高效搜尋體驗。如果在搜尋結果中插入廣告,可能會分散用戶注意力,影響資訊獲取的效率和準確性。用戶需要花更多精力去區分廣告和真實搜尋結果。

影響2:信任度可能下降

Perplexity 之前一直強調透明和不含廣告,這是其與 Google 等傳統搜尋引擎的區別之一。現在推出廣告計劃,可能會讓部分用戶對其信任度下降,覺得背離了最初的承諾。

一些網友抱怨Perplexity推出廣告這件事

一些用戶在 Reddit 揚言若 Perplexity 推出廣告,他們就會取消訂閱

影響3:個性化程度可能降低

如果廣告定位不準確,可能會給用戶推送與其搜尋無關的內容,降低了Perplexity 搜尋結果的個性化程度。

影響4:免費使用受限

目前 Perplexity 的基礎功能是免費的,未來可能會將部分付費內容或高級功能設置在廣告牆之後,限制了消費者的免費使用權限。

結語

Perplexity 作為一款新型 AI 搜尋引擎,展現了巨大的潛力和創新能力。它不僅在技術上超越了傳統搜尋引擎,還在用戶體驗方面設立了新的標準。隨著 AI 技術的不斷進步,Perplexity 有望繼續領先於搜尋引擎市場,為用戶提供更加智能、精準的搜尋服務。

進一步閱讀
  1. 《紐約時報》向 AI 搜尋引擎 Perplexity 發出停止通知函,要求停止使用其內容
  2. 最新研究:如何針對人工智能搜尋引擎進行 SEO 優化
  3. Perplexity 正在顛覆搜尋引擎領域,你的內容和 SEO 策略準備好了嗎?

2024年加密領域展望:迎接創新與發展的新時代

a16z - 2024年加密領域展望

Andreessen Horowitz(簡稱a16z)對2024年加密貨幣市場的期待充滿樂觀,並認為我們正進入一個新的去中心化時代。在這個新時代中,全球將創造出多邊、無需許可的市場,任何人都可以提供數據並獲得報酬。從去中心化的深化到技術的跨界融合,2024年我們將見證加密技術在多個層面的突破,開創全新的數位經濟和網路互動方式。

去中心化新時代

去中心化一直是加密世界的核心理念,2024年這一趨勢達到了新的高度。這不僅意味著更多的用戶自由和數據控制權,也將重塑我們對網路基礎設施的認識,促進更加公平和透明的網絡環境。

用戶體驗的重設

隨著技術的發展,加密應用的用戶體驗正在經歷重大改進。2024年,a16z認為我們將見證更加直觀和用戶友好的介面設計,使得加密技術不再是高科技專家的專利,而是每個普通用戶都能輕鬆接觸和使用的工具。

模塊化技術堆疊的崛起

模塊化技術堆疊在2024年的加密領域中起著關鍵作用。這種技術的靈活性和可擴展性對於促進創新和快速適應市場需求至關重要。它不僅使開發者能夠快速組合和部署新的解決方案,而且還為開源創新提供了更大的空間。

人工智能與區塊鏈的融合

2024年,人工智能與區塊鏈的結合將開啟新的可能性。這種跨界融合不僅能增強安全性和透明度,還將推動這兩種技術在各自領域的應用,從而實現更加智能和高效的數字交易和管理系統。

“玩與賺取”模式的演進

遊戲領域的”玩以賺取”模式在2024年進一步演變為”玩與賺取”。這種轉變將使玩家在享受遊戲樂趣的同時,也能從中獲得實際收益。這不僅改變了遊戲經濟的運作方式,也為玩家帶來了全新的動力和參與感。

人工智能成為遊戲製造者

在加密領域,人工智能正在成為遊戲創造的新動力。它不僅能夠設計出更加豐富和互動的遊戲體驗,還能通過加密技術保證遊戲的公正性和透明度。

正式驗證的轉變

在智能合約開發中,正式驗證的方法正在變得更加接近和易於理解。這種趨勢有助於擴大這一關鍵安全措施的應用範圍,使更多的開發者能夠有效地利用它來確保其代碼的穩健性和安全性。

NFT 成為普遍品牌資產

非同質化代幣(NFT)在品牌建設中的應用正日益普及。2024年,NFT不僅被視為一種投資工具,更成為企業與消費者互動和品牌形象塑造的關鍵資產。

SNARKs 的主流化

SNARKs 技術在2024年逐漸成為主流。這種技術以其高效和隱私保護的特性,在各種應用場景中發揮著重要作用,從金融交易到數據驗證等領域都能見到其身影。

結語

2024年,這些趨勢和發展將共同塑造加密行業的未來,開啟一個更加智能、安全、互動的數字世界。隨著技術的不斷進步和融合,加密技術不僅將成為我們日常生活中不可或缺的一部分,也將推動全球經濟和社會的創新和進步。

報告原文

Google 2023年11月評論更新已完成推出

Google 2023年11月評論更新完成推出

Google 於2023年11月發布的評論更新已於12月7日完全推出。這次更新旨在更好地獎勵高品質的評論,對搜尋結果和內容創作者產生重大影響。Google 提供了一系列撰寫優質評論的指南,強調了深入分析、原創研究和專家知識的重要性。

評論系統的運作方式是對與評論相關的內容進行排名。該系統旨在確保用戶看到的是提供深入分析的評論,而不是只有匯總多項產品、服務或其他資訊的空洞內容。該系統主要用於評估網頁層級的評論內容,如果網站擁有大量評論內容,則該更新機制可能會評估網站中的所有內容。

在更新期間,SEO 社群報告了排名波動的觀察,這表明了更新對網站和內容創作者的影響。這對於需要自我評估並根據 Google 的指南調整內容策略的網站來說尤為重要。

此次更新的一個重點是 Google 提出的高品質評論建議。這些建議並非排名因素的清單,而是一般性的建議,讓出版商了解評論系統試圖排名的內容類型。這些建議包括從使用者的角度進行評估,證明自己對評論內容的熟悉程度,提供個人經驗的影像內容、音訊或其他連結,分享量化的評估資料,說明競品之間的差異,並根據原創研究討論特定項目的優缺點等。
最終,這次評論更新的完成標誌著 Google 對於提升搜尋結果品質的持續努力。隨著評論系統未來的不定期更新,網站和內容創作者需要保持對 Google 指南的關注,以確保其內容能夠在搜尋結果中獲得良好的排名。此外,透過遵循 Google 的建議,可以提升內容的質量和吸引力,從而為用戶提供更大的價值。
這次評論更新的完成不僅對 SEO 專業人士來說具有重要意義,對所有依賴 Google 搜尋結果來獲取流量的內容創作者來說,都是一個重要的里程碑。隨著 Google 對評論系統的不斷改進,內容創造者和數位行銷者需要保持警惕,不斷學習和適應,以保持在競爭激烈的網路世界中的競爭力。

Meta 推出免費 AI 圖像生成工具 Imagine

2023年12月6日, Meta 公司推出了一款全新的獨立 AI 圖像生成工具,名為「Imagine with Meta」。這款工具允許用戶通過自然語言描述來創建圖像,標誌著Meta在人工智能圖像生成領域的又一次大躍進。這不僅是對 Google 的 Gemini 、 OpenAI 的 DALL-E、Midjourney 以及 Stable Diffusion 等類似工具的直接回應,更展示了 Meta 對於 AI 技術的深厚積累和創新應用。

Imagine with Meta 的基礎技術是 Meta 旗下已有的 Emu 圖像生成模型。該模型能夠根據用戶的文字提示創建高解析度圖像。目前,這項服務對美國用戶免費開放,並且每次提示可生成四幅圖像。(筆者註:圖片輸出固定比例為1:1、1280×1280)

除了技術創新之外, Meta 此次將圖像生成工具的應用範圍從聊天擴展到了網頁平台。 Meta 在官方部落格中提到,雖然他們原有的即時通訊體驗是為了更加玩味和互動設計的,但現在用戶也可以在網頁上免費創建圖像。這一轉變不僅豐富了 Meta 的產品線,也使得 AI 圖像生成更加易於普及和應用。

然而, Meta 過去在圖像生成領域的一些嘗試曾經引發了爭議,例如曾經推出的具有種族偏見的 AI 貼紙生成器。因此,對於 Imagine with Meta 是否設有足夠的安全機制以防止歷史重演,社會各界都保持著高度的關注。為了提高透明度和可追溯性, Meta 承諾在未來幾週內為 Imagine with Meta 生成的內容添加水印,儘管一些水印已經可見。這些無形水印將由 AI 模型生成,並能通過相應的模型檢測出來。 Meta 並未透露檢測模型是否會公開。

這種水印技術對於抵抗常見的圖像處理操作,如裁剪、調整大小、顏色變化(亮度、對比度等)、截屏、圖像壓縮、噪音、貼紙覆蓋等都具有很強的抗性。 Meta 在部落格中表示,他們計劃將這種無形水印技術未來應用於多個擁有 AI 生成圖像的產品中。

此外,隨著 AI 生成藝術的普及,各大科技公司面臨著越來越大的壓力,需要明確標示作品是由 AI 生成的。例如,法國初創公司 Imatag 提供的水印工具聲稱可以抵抗圖像的重置、裁剪、編輯或壓縮。另一家公司 Steg.AI 則運用 AI 模型應用水印,這些水印能夠在經過重置和其他編輯後依然存在。微軟和 Google 已經採用了基於 AI 的水印標準和技術,而在其他地方, Shutterstock 和 Midjourney 同意了嵌入標記的指南,表明其內容是由生成性 AI 工具創建的。

最近,中國的網絡空間管理局發布了規定,要求生成性 AI 供應商標記生成內容,包括文本和圖像生成器,而不影響用戶使用。此外,在最近的美國參議院委員會聽證會上,參議員 Kyrsten Sinema 強調了在生成性 AI 中使用水印以提高透明度的必要性。

總結來看,Meta 的 Imagine 工具在 AI 圖像生成領域具有重要意義,不僅展示了 Meta 在技術創新方面的雄心,也體現了對安全和道德問題的深刻關注。未來,隨著這一工具的進一步更新和完善,其在 AI 藝術和創意領域的應用前景值得期待。

比較實測

為了了解 Meta 這款 AI 圖像生成工具是否已達到可以應付我們日常圖像的成像品質需求,筆者使用相同的 Prompt 透過 Imagine 產生圖像與其他主流圖像生成工具 DALL-E 3 、Bing 影像建立工具、 Midjourney 5.2 、 Stable Diffusion XL 0.9 比較,並分別使用超現實圖像、一般人像、圖像含文字分別產出圖像,取其中品質最好的一張來作為比較參考,各位讀者可以看看其中的效果差異。目前大多數 Imagine 生成的圖都已經出現水印,所以想使用 Imagine 在工作上的朋友需要特別注意。Bing 影像建立工具雖然也會產生水印,但是因為是數位水印,實際使用時是看不到的。

整體測試的結果 Imagine 的成像品質仍然距離其他競爭者有一段差距,後續等到 Meta 正式推向全球後各位讀者可以再做觀察。

超現實圖像

Prompt: galaxy sky, big tree, dramatic atmosphere, flying island, waterfall.

DALL-E 3

Bing

Midjourney 5.2

Stable Diffusion XL 0.9

Imagine

一般人像

Prompt: Hyper-realistic photography, a Japanese girl sits on a chair in a hotel room, dressed in a dress with thin shoulder straps, big eyes, good face, perfect body, fair natural skin, cinematic shot, shoulder level shot.

DALL-E 3

Bing

Bing 的內容審核政策會擋細肩帶跟身材相關的字,故稍加調整 prompt

Midjourney 5.2

Midjourney 預設會把 girl 這個單字描繪成6-12歲左右的小女生,故稍加調整 prompt

Stable Diffusion XL 0.9

Imagine

圖像含文字

Prompt: A classic [Coca Cola] advertising board with the words [Coca Cola] on it, standing in front of a busy department store street.

DALL-E 3

DALL-E 3 的內容審核政策會阻擋跟品牌有關的內容,識了幾次它只讓我出現在一個小角落

Bing

Bing 的內容審核政策不允許我們輸出跟品牌有關的內容,直接改成別的文字

Midjourney 5.2

Stable Diffusion XL 0.9

Imagine

Google 推出 Gemini :迄今最強大的 AI 生成模型

Google 在2023年12月6日宣布推出其最先進的人工智能模型——Gemini。這是一個標誌性的進展,不僅展示了 Google 在 AI 領域的領先地位,也預示著人工智能技術的一個新時代的來臨。Google 和 Alphabet 的 CEO Sundar Pichai 在其發布筆記中提到,人工智能技術的轉變將是我們一生中最深遠的變革,其影響將遠超過移動或網絡技術的轉變。Pichai 相信,AI 的潛力將為全球人民創造前所未有的機會,從日常生活到非凡成就,AI 都將帶來創新和經濟進步的新浪潮,並在知識、學習、創造力和生產力等多個層面帶來規模化的推動。

YouTube thumbnailYouTube icon
影片來源:Google

Gemini 的特點與能力

Gemini 作為一款多模態模型,能夠理解並操作不同類型的資訊,包括文本、代碼、音頻、圖像和視頻。這種多模態的設計使其在處理各種複雜問題時展現出前所未有的能力。Gemini 分為三個版本:Ultra、Pro 和 Nano,每個版本都針對不同規模的任務進行了優化。其中,Ultra 版本適用於高度複雜的任務,Pro 版本適合於廣泛的任務範圍,而 Nano 版本則專為設備端任務設計,效率極高。在多項業界標準的基準測試中,Gemini 展現出了領先現有模型的卓越性能,證明了其在人工智能領域的先進地位。

Gemini Ultra 版本在 DeepMind 發布的研究報告中幾乎全面超越 GPT-4

資料來源: DeepMind

Gemini 在 Google 產品中的整合

Gemini 的推出不僅是技術上的突破,更意味著它將被整合到 Google 的多個產品中,從而大幅提升這些產品的智能化水平。目前,Gemini 已經被整合到 Google 的對話式 AI——Bard 中,這是 Bard 自推出以來最重要的一次升級。Gemini 在 Bard 中的應用分為兩階段:首先,Bard 將使用特別調整過的 Gemini Pro 版本,以支持更高級的推理、規劃、理解等功能;其次,在明年初,Google 還將推出 Bard Advanced,屆時將首次引入功能更強大的 Gemini Ultra 版本。目前,Gemini Pro 版本的 Bard 已在超過 170 個國家和地區提供英語服務,未來還將支持更多語言和地區。

YouTube thumbnailYouTube icon
影片來源:Google

Gemini 的影響與應用

Gemini 的先進能力將對各個領域產生深遠的影響,從科學研究到金融服務,再到技術創新,Gemini 都有潛力帶來革命性的變化。例如,在編程領域,Gemini 能夠理解、解釋並生成高質量的代碼,支持世界上最流行的編程語言,如 Python、Java、C++ 和 Go。此外,Gemini 在解決複雜的數學和理論計算機科學問題方面表現出色,這不僅展示了其在編碼方面的能力,也證明了其在複雜問題解決方面的潛力。

YouTube thumbnailYouTube icon
影片來源:Google

安全性、責任與可及性

在開發 Gemini 的過程中,Google 堅持負責任的 AI 發展原則,特別重視安全性和偏見問題。Gemini 經過了全面的安全評估,包括對偏見和有害內容的檢測,以確保其輸出內容的安全性和公正性。此外,Google 也在不斷完善其 AI 原則,以應對多模態能力帶來的新挑戰。為了使 Gemini 更加安全並適用於更廣泛的用戶群體,Google 採用了多層次的安全措施,包括專門的安全分類器和強大的過濾系統。此外,Google 還計劃通過 Google AI Studio 和 Google Cloud Vertex AI,將 Gemini 的 Pro 版本開放給開發者和企業客戶,使其能夠更廣泛地應用於各種場景。

YouTube thumbnailYouTube icon
影片來源:Google

結語

Gemini 的推出不僅標誌著 Google 在人工智能領域的一個重要里程碑,也預示著 AI 技術未來的發展方向。Google 對 Gemini 的持續改進和擴展,包括在規劃和記憶方面的進步,以及處理更多信息以提供更好回應的能力,都將進一步推動這一領域的創新。隨著 Gemini 的不斷發展,我們可以期待一個由負責任的 AI 技術賦能的創新未來,這將增強創造力,擴展知識,推動科學進步,並轉變全球數十億人的生活和工作方式。

進一步閱讀

Gemini Prompt 入門指南