Midjourney 推出新 /describe 功能測試版

AI 繪圖工具 Midjourney 2024年3月8日在其 Discord 及 Twitter 頻道宣布,推出了一項名為 “/describe” 的新功能測試版。這個功能可以讓使用者從圖像生成文字描述,與 Midjourney 原本從文字生成圖像的方式相反。Midjourney 創辦人 David Holz 表示,這個新版的 /describe 功能目的是生成更長、更詳細的圖像描述文字,以更好地適應 V6 版本的功能。

/describe 功能的運作方式

根據 Midjourney 官網的說明,/describe 命令可以讓使用者上傳一張圖像,然後 Midjourney 會根據該圖像生成四個可能的文字描述。這個功能可以幫助使用者探索新的詞彙和美學風格。不過需要注意的是,/describe 生成的描述是啟發性和暗示性的,無法完全精確地重現上傳的圖像。此外,/describe 也會返回上傳圖像的長寬比例資訊。使用 /describe 命令的步驟如下1

  1. 在 Discord 頻道中輸入 “/describe” 命令
  2. 上傳一張圖像
  3. 按下 Return 鍵,Midjourney 就會生成四個描述該圖像的文字提示
  4. 可以點擊每個提示下方的 1️⃣2️⃣3️⃣4️⃣ 按鈕,根據該提示生成新的圖像

選擇其中一個提示按鈕後,會彈出一個文字框,使用者可以修改描述中的任何詞彙,然後生成類似風格的圖像。

/describe 功能的應用潛力

根據一些使用者的測試和分享,/describe 功能有許多應用潛力,例如:

  1. 改善網頁圖像的無障礙性:為視覺障礙者生成更詳盡的圖像替代文字( alt text )
  2. 優化圖像搜尋:為圖像生成更豐富的描述,有助於搜尋引擎索引
  3. 自動生成圖說文字:快速為圖像配上詳細的說明文字
  4. 創意激發:根據圖像生成不同的描述,啟發更多創作靈感
  5. 圖文互轉的創作流程:利用 /describe 生成的描述,再次輸入 Midjourney 生成新的相關圖像

目前 /describe 功能還處於早期測試階段,生成的描述品質有待提升。但隨著使用者的反饋以及 Midjourney 團隊的持續優化,相信這個功能未來會愈加強大,為 AI 繪圖開啟更多可能性。

實際測試

讓我們以一張參考圖片作為開始

使用 /describe 並上傳照片之後, Midjourney 給我們四個描述

  1. Cinematic still of a beautiful woman in an ornate outfit with long hair, twirling and dancing in mid action. The image has detailed facial features, detailed eyes, and detailed skin texture under cinematic lighting, appearing hyper realistic. ––ar 16:9 (一個美麗的女人穿著華麗的長髮,在動作中旋轉和跳舞的電影劇照。 在電影般的燈光下,這張照片有著詳細的面部特徵、詳細的眼睛和詳細的皮膚紋理,看起來非常逼真 ––ar 16:9)
  2. Cinematic still of a beautiful Asian woman in an elaborate costume, dancing gracefully with her hair flowing around her face. She is wearing intricate gold and red embroidery on the dress, with long earrings that sparkle as she moves. The background has dark tones, adding to the dramatic effect. Her expression reflects confidence and elegance in the style of an Asian artist. ––ar 16:9 (一個美麗的亞洲女人穿著精緻的服裝,優雅地跳舞,頭髮繞在臉上。 她在裙子上穿著複雜的金色和紅色刺繡,長耳環在她移動時閃閃發光。 背景是深色的,新增了戲劇性的效果。 她的表情體現了亞洲藝術家的自信和優雅 ––ar 16:9)
  3. Cinematic still of a beautiful Asian woman dancing in traditional dress, her long hair blowing in the wind, with gold and red earrings, detailed skin texture, detailed eyes, in an elegant pose, against a dark background, in a dance hall setting dimly lit with warm lighting, in the style of Wong KarWai. ––ar 16:9 (一個美麗的亞洲女人穿著傳統服裝跳舞,她的長髮在風中飄揚,戴著金色和紅色的耳環,細緻的皮膚紋理,細緻的眼睛,在黑暗的背景下,在燈光昏暗的舞廳裏,以王家衛的風格擺出優雅的姿勢 ––ar 16:9)
  4. Cinematic still of a beautiful young Asian woman in traditional dancing, with detailed facial features, intricate patterns on her dress, detailed hair and makeup, in a wide shot, against a dark background with lights, in the style of Alfonso Cuarón. ––ar 16:9 (一個美麗的年輕亞洲女子在傳統舞蹈中的電影劇照,她有著詳細的面部特徵,衣服上有著複雜的圖案,頭髮和妝容都很精緻,在一個有燈光的黑暗背景下,拍攝的是阿方索·庫隆的風格 ––ar 16:9)

對於細節的描述明顯地比之前的 /describe 版本更精準,代表 Midjourney 持續不斷地進化其平台功能的決心與速度。

根據以上的四個描述,我們直接創作了4×4組圖片,各位讀者可以比較一下與原始圖片的差異。

描述一

描述二

描述三

描述四

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *