Google 重塑其人工智能聊天機器人品牌 Bard ,並推出了名為 Gemini Advanced 的訂閱版本

圖片由 Gemini Advanced 生成

Google 於 2023 年 2 月推出了人工智能聊天機器人 Bard,旨在為用戶提供一種更強大、更靈活的人工智能工具。Bard 使用了 Google 的最新人工智能技術,能夠生成文字、翻譯語言、編寫不同種類的創意內容,並以信息豐富的方式回答您的問題。

在推出一年後,Google 於 2024 年 2 月 7 日宣布,將 Bard 重塑為 Gemini,並推出了名為 Gemini Advanced 的訂閱版本。

YouTube thumbnailYouTube icon
影片來源: Google

Gemini 的新品牌名稱

Gemini 的新品牌名稱旨在反映其雙重身份:既是人工智能聊天機器人,也是人工智能語言模型。Gemini 一詞在拉丁語中是“雙胞胎”的意思,這代表了 Bard 作為人工智能聊天機器人和人工智能語言模型的雙重角色。

作為人工智能聊天機器人,Gemini 可以與用戶進行自然語言對話,幫助用戶完成各種任務,例如:

  • 生成創意內容,例如詩歌、程式碼、腳本、音樂作品、電子郵件、信件等
  • 以信息豐富的方式回答您的問題,即使它們是開放式的、具有挑戰性的或奇怪的翻譯語言

作為人工智能語言模型,Gemini 可以生成文本、翻譯語言、編寫不同種類的創意內容,並以信息豐富的方式回答您的問題。

Gemini Advanced 訂閱版本

Gemini Advanced 訂閱版本將為用戶提供以下附加功能:

  • 訪問 Google 最先進的人工智能模型,包括 Gemini Ultra
  • 更高的 API 調用限額
  • 專屬客戶支持

Gemini Ultra 是 Google 最先進的人工智能模型,它在多項基准測試中都超越了 ChatGPT 等競爭對手。Gemini Advanced 訂閱者將能夠訪問 Gemini Ultra,從而獲得最先進的人工智能功能。

Gemini Advanced 訂閱者還將獲得更高的 API 調用限額,這意味著他們可以更頻繁地使用 Gemini API。此外,Gemini Advanced 訂閱者還將獲得專屬客戶支持,這將幫助他們解決使用 Gemini 時遇到的任何問題。

Gemini 的重塑和 Gemini Advanced 的推出是 Google 在人工智能領域的重要里程碑。Gemini 將為用戶提供更強大、更靈活的人工智能工具,幫助他們提高工作效率和創造力。

(本報導由 Gemini Advanced 所創作)

筆者註:

  1. Google 官方表示 Gemini Advanced 現已在150個國家/地區推出,目前只支援英文版 ,但筆者實測中文對話都是正常沒問題的,若是有出現對話回覆不順暢不正常的地方,建議使用英文 prompt 比較能夠獲得較為精準的結果。
  2. 目前仍無法透過中文創作圖片,需要透過英文 prompt ,但已可以生成人物圖像。
  3. 所有個人用戶都可以免費獲得2個月的試用,無須支付費用。2個月試用期結束之後,每個月需支付20美元 (台幣650元),與 OpenAI 的 ChatGPT 付費方案相同。
  4. 與 Gmail 、 Docs 等 Google 應用的整合很快地就會推出。
  5. 訂閱 Gemini Advanced 可以免費獲得 2TB 的 Google One 儲存空間,而即日起至 2024 年 7 月 31 日,訂閱 5TB 以上 Google One 方案的使用者可限時存取 AI 進階版功能,不需額外付費。
  6. Google 官方表示 Gemini 應用程式將在美國針對特定裝置推出,並支援英文。未來 Gemini 將提供日文和韓文版,英文版也會拓展支援至全球,但不包括英國、瑞士及歐洲經濟區 (EEA) 國家及相關地域。很快就會開始支援更多國家/地區和語言。目前美國地區用戶可以使用 Android 裝置到 Google Play 商店下載 Gemini 應用程式,開始和 Gemini 對話;如使用 iOS 裝置,必須透過 Google 應用程式體驗 Gemini 服務。
  7. 筆者實測結果,Gemini Advanced 在文字創作能力已可與 GPT-4 Turbo 匹敵,但在整體生態及邏輯理解能力筆者認為仍與 GPT-4 Turbo 有一定的差距,尤其是圖片生成這塊跟 DALL-E 3 落差極大。不過這次 Google 放出2個月免費吃到飽的大絕,應可吸引不少原本 ChatGPT 3.5 及若干 GPT 付費方案用戶嘗鮮。
  8. Gemini Advanced 最大的特色在於即時自我檢討及修正的能力。它會先生成使用者的提示詞,接著提出具體建議,再根據具體建議再生成新的內容。筆者認為它會參考之前使用者與它的對話來判斷修正方案的內容,與 GPT 輸入自訂指令的方式不太一樣。這樣的方式對於初級使用者而言更為友好,但相對可控性也較差,面對複雜的需求更容易產生錯誤的輸出。
  9. 根據國外知名 AI 評論 YouTuber All About AI 的第一手評測:Gemini Advanced 在介面設計、回應速度上較 GPT-4 優秀,它的黑暗模式介面看起來很棒,還有即時回應等方便的功能。但是在推理能力、編碼能力以及創造力方面,Gemini Advanced 與 GPT-4 相比還有一段差距。在解釋編碼時 Gemini Advanced 表現失常,說自己「只是語言模型」;而 GPT-4 可以流暢地解釋 Python 代碼。在生成圖像時,Gemini Advanced 也承認自己「還不能生成圖像」。總體來說 Gemini Advanced 是 Google 在大型語言模型上的重要進步,它的速度和介面設計值得稱讚,但核心能力如推理、編碼和創造力還需要提升,才能真正與 GPT-4 一較高下。這次測試只是初步印象,未來如果 Gemini 在 API 和能力上有所改進,它的表現還有很大潛力。
  10. 根據 Gemini Advanced 自己的回覆,其企業版本 Gemini for Google Workspace (目前稱為 Duet AI in Google Workspace) 將於 2024 年下半年推出,具體的發佈日期尚未確定。而 Gemini for Google Workspace 的推出將是 Google Workspace 的重大更新,它有可能徹底改變用戶的工作方式。
進一步閱讀

Gemini Prompt 入門指南

2/7 Midjourney Office Hours 回顧:V6 即將升級 Beta 版本、V7 版本開發進行中

在2月7日的 Midjourney 辦公時間中,Midjourney 宣布了一系列即將到來的更新和發展,這些更新將影響其人工智能驅動的視覺內容創建平台。以下是回顧和展望 Midjourney 未來版本的關鍵點。

首先,Midjourney 正在清理其 Alpha 網站的創建流程,計劃在下周開放給生成超過1000張圖像的用戶。此外,團隊正著手開發下一版本的網站,將引入更多社群功能,儘管具體細節尚屬未知。隨著新功能的加入和網站外觀的改善,他們將添加入門教程和教育內容。

關於 V6 版本,Midjourney 即將將其轉為 Beta 版本,並將其設為默認版本。這一更新將帶來性能提升、更高的圖像一致性和更佳的紋理表現,例如草地的紋理。此外,還可能進行輕微的美學更新。

Midjourney 還介紹了改進的“ Describe ”功能,旨在提供更貼近用戶想要的圖像的提示。這一功能預計在本周或下周初推出。另外,團隊開始著手於角色一致性的工作,這是社群最期待的下一個功能,預計需要幾周時間才能完成。

針對 Niji 6 ,Midjourney 計劃在下周推出區域變化功能。而對於 V6.1 ,團隊正在探索一種不同於默認 Midjourney 模型的個性化選項,稱之為“模型調節器”,可能將此更新命名為 V6.1。

除此之外,Midjourney 正著手於 V7 版本的開發,這一版本預計會在幾個月後推出,將帶來更好的像素圖像質量和細節改進,讓小物件在不產生人工痕跡的情況下看起來更好。

最後,Midjourney 團隊也在開發視頻功能,但這還需要一段時間。團隊還概述了社群反饋清單中的頂級需求,包括角色一致性、對用戶自己的圖像進行內部填充的能力、更好的風格和相機控制、圖像刪除(將有隱藏圖像的選項)、改善遠處物體的呈現,以及在 V7 版本中提高圖像質量。

這些更新和開發計劃反映了 Midjourney 對於不斷進步和滿足其廣大用戶需求的承諾。隨著這些計劃的實施,Midjourney 將繼續推動視覺內容創作的界限,為用戶提供更加強大和個性化的創作工具。

Google Bard 全球更新:Gemini Pro 現在支援 40 種語言

圖片由 Bard 生成

Google Bard 宣布進行全球更新,將 Gemini Pro 大語言模型(LLM)功能擴展到 40 種語言,並為其添加圖像生成功能。此更新將使 Bard 能夠為更多用戶提供服務,並使其能夠生成更具創意和信息量的內容。

Gemini Pro 是 Google 目前最先進的大語言模型,它經過訓練,可以生成人類質量的文字。Gemini Pro 可用於各種任務,包括回答問題、生成創意內容、翻譯語言和撰寫不同類型的文字。

此次更新將 Gemini Pro 功能擴展到 40 種語言,包括中文、英文、法文、德文、西班牙文、日文、韓文、葡萄牙文、俄文和義大利文。這將使 Bard 能夠為全球更多用戶提供服務。

「我們很高興宣布 Bard 的此次全球更新」, Google AI 研究科學家 Blaise Agüera y Arcas 說。「Gemini Pro 的擴展和圖像生成功能的新增將使 Bard 成為更強大、更具多功能性的工具。」

Google Bard 的此次全球更新將使其成為更強大、更具多功能性的工具。Gemini Pro 的擴展將使 Bard 能夠為更多用戶提供服務,而圖像生成功能將使 Bard 能夠生成更具創意和信息量的內容。

Google Bard 新增圖片生成功能

Google Bard 是一款大型語言模型,以其生成文字、翻譯語言、撰寫不同類型的創意內容以及以翔實方式回答問題的能力而聞名。近日 Google Bard 新增了一項新功能,允許使用者生成圖片。這項創新的功能由 Google 最新推出的 Imagen 2 模型支援,為創意表達和溝通開啟了無限可能。

運作方式

使用者可以輸入描述所需圖片的文字提示來存取圖片生成功能。然後,Bard 會利用其對語言的理解和對世界的認知來創建與提示相符的獨特圖片。例如,使用者可以提示 Bard “生成一隻戴著帽子的貓的圖片”,Bard 會生成一隻戴著時尚帽子的貓的圖片。

Imagen 2:賦予逼真創建能力

圖片生成功能由 Imagen 2 模型支援,Imagen 2 是 Google AI 推出的下一代模型。Imagen 2 經過專門設計,可生成高品質、逼真的圖片。它經過大量文字圖片對的訓練,能夠捕捉人類語言的細微差別並將其轉化為視覺震撼的圖片。

超越基本圖片

Bard 的圖片生成功能不僅限於簡單的物件創建。使用者還可以為圖片指定風格、情緒甚至品牌指南。這允許高度的定制和控制,使 Bard 成為設計師、行銷人員和任何想要創建獨特視覺內容的人的寶貴工具。

安全和負責任的使用

與任何強大技術一樣,負責任地使用 Bard 的圖片生成功能非常重要。Google 已採取措施降低濫用的可能性,例如禁止生成暴力或性暗示內容。此外,Bard 使用水印技術 SyntID 來識別由模型生成的圖片,幫助防止錯誤資訊的傳播。

Bard 的未來

新增圖片生成功能是 Bard 發展歷程中的重要一步,使其成為一種更通用、更強大的創意表達和溝通工具。隨著 Google 繼續開發 Bard 及其底層技術,可以期待未來會推出更加令人興奮的功能和功能。

其他注意事項
  • Bard 的圖片生成功能目前僅提供英文版本,預計未來會推出其他語言版本。
  • 個人和非商業用途的該功能是免費的。
  • 目前僅支援正方形,輸出尺寸1536×1536。Bard 對於指定大小的指令還不是很聽話,所以指定的尺寸很有可能不是使用者想要的那個尺寸。
  • 可以生成圓形、橢圓形、心形等圖像,但是外框仍然是正方形。
  • 目前無法產生人物圖像,Bard 回覆它仍處於開發階段,生成的人物圖像可能會被濫用來創建有害內容。

實際測試

使用者輸入

Draw a realistic photo: Naraji Temple in Kyoto, sparse deer grazing, natural light, sunlight shining above the temple.

輸出

Sure, here is a realistic photo of Naraji Temple in Kyoto, sparse deer grazing, natural light, sunlight shining above the temple:

不管是構圖、細節的呈現、成像品質跟主流 AI 圖像工具如 Midjourney 、 DALL-E 3、Microsoft Designer、 Stable Diffusion 等仍然有非常大的差距。

其他形狀

圓形

橢圓形

心形

Google 將於 3 月 12 日更新核心 Web Vitals,並與 Next Paint (INP) 進行交互

Google 將於 2024 年 3 月 12 日更新核心 Web Vitals 指標,並將首次輸入延遲 (FID) 替換為與下一次繪製的交互 (INP)。INP 是一種新的指標,用於衡量用戶與網頁互動後,網頁內容更新的速度。

INP 的定義與重要性

INP 代表「與下一次繪製的互動」,是一種新的 Google 核心 Web Vitals 指標,用於衡量導致網站延遲的用戶互動。 INP 測試衡量用戶與網站互動(例如點擊某物)和內容在視覺上更新以響應之間需要多長時間。 這種視覺更新稱為“下一次繪製”。 例如,用戶可能會在網站上提交聯絡表單、點擊按鈕或選擇在燈箱中開啟的圖像。 INP 測試將衡量用戶執行這些互動和實際看到網站上的更新內容之間所花費的時間。

然後,Google 測試會根據網站上大多數用戶互動的持續時間得出一个 INP 分數。分數將為“好”、“需要改進”或“差”,取決於網站在視覺上更新所需的時間。

INP 分數很重要,因為它可以反映網站對使用者輸入的反應速度。 如果 INP 分數較低,則表示網站對使用者輸入的反應速度較快,這會為使用者帶來更好的體驗。

INP 與 FID 的比較

INP 取代了 FID 成為核心 Web Vitals 指標之一。 FID 代表「首次輸入延遲」,也是一種用來衡量網頁互動性的指標。 FID 測量使用者首次與網頁互動(例如點擊按鈕或輸入文字)後,瀏覽器開始處理事件所需的時間。

INP 與 FID 的主要區別在於,INP 會考慮網頁的渲染時間。 因此,INP 分數通常會比 FID 分數更高。 此外,INP 會測量所有使用者互動的時間,而 FID 只會測量第一次使用者互動的時間。 因此,INP 可以更準確地反映出網頁的整體互動性。

如何改善 INP 分數

網站管理員和開發人員可以採取以下措施來改善 INP 分數:

  • 減少 JavaScript 的使用
    • JavaScript 可以讓網頁更加動態和互動,但它也會增加網頁的載入時間和複雜性。 過多或不必要的 JavaScript 會導致 INP 分數下降。
  • 優化 CSS 的使用
    • CSS 可用於控製網頁的版面和樣式。 過多的 CSS 規則會增加網頁的載入時間,並導致 INP 分數下降。
  • 使用圖像壓縮
    • 圖像文件通常是網頁上最大的文件類型。 壓縮圖像可以減少它們的尺寸,並加快網頁的載入速度,從而提高 INP 分數。
  • 啟用瀏覽器緩存
    • 瀏覽器緩存可以儲存網頁的靜態資源,例如圖像和 JavaScript 檔案。 啟用瀏覽器快取可以減少重複下載這些資源所需的時間,並提高 INP 分數。

INP 更新對 SEO 的影響

Google 將 INP 納入核心 Web Vitals 指標,意味著 INP 分數將成為 SEO 排名的重要因素。因此,網站管理員和開發人員應採取措施改善其網站的 INP 分數。

結語

Google 更新核心 Web Vitals 指標,旨在為使用者提供更好的網頁體驗。INP 的更新將有助於網站管理員和開發人員更有效地衡量和改善網頁的互動性。

以下是改善 INP 分數的其他建議:

  • 使用性能分析工具來監控網站的 INP 分數。
  • 進行 A/B 測試以找出哪些優化措施可以對網站產生最大的影響。
  • 遵循 Google 的最佳做法來改善網頁性能。

通過採取這些措施,可以提高網站的 INP 分數,並為用戶提供更好的體驗。