Midjourney 推出新的「角色參考」測試功能

2024年3月12日,Midjourney 推出新功能“ Character Reference ”(角色參考)的測試,代表著在人工智能圖像生成領域的一大步。這項創新功能類似於既有的“ Style Reference ”(風格參考),但不同之處在於它專注於根據“角色參考”圖像來匹配角色,而非僅僅匹配參考風格。此功能允許用戶透過在提示命令後加上--cref URL並附上角色圖像的 URL 來使用角色參考,從而使生成的角色能更貼近用戶所提供的參考圖像。用戶還可以透過 --cw 命令來調整參考強度,範圍從100到0不等,以此來控制生成圖像的細節程度,從臉部、頭髮到服裝等各方面的匹配度。

此功能主要設計用於使用 Midjourney 生成的角色圖像,並非針對真實人物或照片。它在處理真人圖像時可能會產生扭曲,這與普通圖像提示的處理方式相似。這意味著,雖然 cref 功能與常規圖像提示在操作上相似,但它更專注於角色特徵,而非逐一複製如雀斑、痣或T恤上的標誌等細節。

進階功能方面, Midjourney 支援使用多個 URL 來融合來自多個圖像的資訊或角色,這類似於使用多個圖像或風格提示。在 Web Alpha 版本上,用戶可以拖動或粘貼圖像至想像欄,並通過選擇三個圖標之一來設定圖像是作為圖像提示、風格參考還是角色參考使用。若要將圖像用於多個類別,則可按住 Shift 鍵選擇適用的選項​​​​。

值得注意的是,儘管此功能目前處於 alpha 測試階段,且隨著 Midjourney V6 正式進入 beta 階段,功能可能會有所變化,但 Midjourney 團隊鼓勵用戶分享他們對於此新功能的想法及反饋。這顯示了 Midjourney 對於社群反饋的重視,並期待此功能能夠幫助用戶更加自由地構建故事和世界​​。

Midjourney 的 “ Character Reference ” 功能為 AI 圖像生成領域帶來了新的可能性,尤其是在創建一致性角色和故事講述方面。隨著技術的不斷發展和完善,期待看到更多創新功能的推出,以及它們將如何幫助創作者擴展他們的創意邊界。

官方使用說明

1.在提示後鍵入--cref URL,其中包含指向字元影像的 URL

2.可以使用 --cw 將引用“ strength ”從100修改為0

3.strength 100(--cw 100)是預設值,使用面部、頭髮和衣服

4.强度為0(--cw 0)時,它只會專注於面部(適合換裝/換發等)

5.可以使用多個 URL 來混合多個影像中的資訊/字元,如 --cref URL1 URL2(這類似於多個影像或樣式提示)

實際測試

讓我們先用上一篇文章 Midjourney 最新更新:引入「一致風格」功能,增強藝術生成體驗 的女主角作為例子:

我們使用以下的 Prompt 進行測試

Prompt: 冬季的日本八幡平,一個35歲清新脫俗的日本岩手縣美麗女導遊,她身穿滑雪服裝,在滑雪坡道上拍照。燦爛的陽光從她的背後照射。特寫鏡頭。

In Hachimantai, Japan in winter, a 35-year-old fresh and refined beautiful female tour guide from Iwate Prefecture, Japan, is taking pictures on the ski slopes. The bright sun shines from behind her. Close-up. --ar 16:9 --cref https://s.mj.run/NueRyP4V_No --v 6.0 

參考圖像

預設值 cw=100

由產生的圖像觀察,雖然官方表示處理真人圖像時可能會產生扭曲,但是實際上使用並沒有出現這樣的情形,人物的臉蛋及輪廓、服裝、背景接高度近似原圖。

讓我們繼續調整 cw 看看不同的變化效果:

CW = 70

服裝開始改變,開始露出部份的雪景。

CW = 50

雪景的比例明顯增加,身上穿的衣服也開始調整成雪地的穿著。

CW = 30

太陽的光線更加強烈,已經很明顯地是雪地的背景。

CW = 0

背景及身上的穿著已經完全符合 Prompt ,只保留原女主角的臉部。

融合二張照片

我們用另外一個簡單的 Prompt 融合兩張風格跟 Midjourney 明顯不同,由 Leonardo 所創造出來的圖像測試其融合效果。因為跳脫了 Midjourney 創作的風格框架,這樣會比較符合讀者在現實工作使用時的狀況:

Prompt: 東京年輕女子街拍

Tokyo Young Women's Street Shoot. --ar 9:16 --cref https://s.mj.run/7UIyBjFr-Uk https://s.mj.run/tpdDDGjIAvo --v 6.0
原圖( Leonardo )
輸出( Midjourney )

從輸出看得出確實是融合了我們提供的兩張圖的女主角風格,但是或許是這兩個女主角的臉蛋不太一致,輸出的結果並不是特別美麗。因此我們改以第二張圖像做單張的嘗試。

輸出單張 ( Midjourney )

在筆者嘗試的過程中,當 Midjourney 碰到非它生成的參考圖像時,確實有時會出現身體動作不自然的情形,但狀況不嚴重,多嘗試幾次即可。我們可以看到生成的圖像人物的髮型、眼睛、嘴唇、臉龐的確參考原始圖像的風格,但是也呈現了很明顯的 Midjourney 風格。有些讀者可能不太想要這麼強烈的平台風格,只想要擷取原始圖像的臉蛋,所以讓我們再試試去除 Midjourney 的風格,並使用 cw=0 參數:

以上是筆者實際測試的結果展示,各位讀者可以根據需要,參考筆者的參數呈現做出適合自己工作狀況的圖像。

進一步閱讀
  1. Midjourney 推出模型個人化( Model Personalization )功能
  2. 在 Midjourney 中使用 Triple Triple 技巧創造獨特風格的圖像