Google Bard 是一款大型語言模型,以其生成文字、翻譯語言、撰寫不同類型的創意內容以及以翔實方式回答問題的能力而聞名。近日 Google Bard 新增了一項新功能,允許使用者生成圖片。這項創新的功能由 Google 最新推出的 Imagen 2 模型支援,為創意表達和溝通開啟了無限可能。
運作方式
使用者可以輸入描述所需圖片的文字提示來存取圖片生成功能。然後,Bard 會利用其對語言的理解和對世界的認知來創建與提示相符的獨特圖片。例如,使用者可以提示 Bard “生成一隻戴著帽子的貓的圖片”,Bard 會生成一隻戴著時尚帽子的貓的圖片。
Imagen 2:賦予逼真創建能力
圖片生成功能由 Imagen 2 模型支援,Imagen 2 是 Google AI 推出的下一代模型。Imagen 2 經過專門設計,可生成高品質、逼真的圖片。它經過大量文字圖片對的訓練,能夠捕捉人類語言的細微差別並將其轉化為視覺震撼的圖片。
超越基本圖片
Bard 的圖片生成功能不僅限於簡單的物件創建。使用者還可以為圖片指定風格、情緒甚至品牌指南。這允許高度的定制和控制,使 Bard 成為設計師、行銷人員和任何想要創建獨特視覺內容的人的寶貴工具。
安全和負責任的使用
與任何強大技術一樣,負責任地使用 Bard 的圖片生成功能非常重要。Google 已採取措施降低濫用的可能性,例如禁止生成暴力或性暗示內容。此外,Bard 使用水印技術 SyntID 來識別由模型生成的圖片,幫助防止錯誤資訊的傳播。
Bard 的未來
新增圖片生成功能是 Bard 發展歷程中的重要一步,使其成為一種更通用、更強大的創意表達和溝通工具。隨著 Google 繼續開發 Bard 及其底層技術,可以期待未來會推出更加令人興奮的功能和功能。
其他注意事項
- Bard 的圖片生成功能目前僅提供英文版本,預計未來會推出其他語言版本。
- 個人和非商業用途的該功能是免費的。
- 目前僅支援正方形,輸出尺寸1536×1536。Bard 對於指定大小的指令還不是很聽話,所以指定的尺寸很有可能不是使用者想要的那個尺寸。
- 可以生成圓形、橢圓形、心形等圖像,但是外框仍然是正方形。
- 目前無法產生人物圖像,Bard 回覆它仍處於開發階段,生成的人物圖像可能會被濫用來創建有害內容。
實際測試
使用者輸入
Draw a realistic photo: Naraji Temple in Kyoto, sparse deer grazing, natural light, sunlight shining above the temple.
輸出
Sure, here is a realistic photo of Naraji Temple in Kyoto, sparse deer grazing, natural light, sunlight shining above the temple:
不管是構圖、細節的呈現、成像品質跟主流 AI 圖像工具如 Midjourney 、 DALL-E 3、Microsoft Designer、 Stable Diffusion 等仍然有非常大的差距。
其他形狀
圓形
橢圓形
心形