如何用 Gen ID 讓 DALL-E 3 輸出相同風格的圖片

在之前的文章《如何透過修改 Seed 讓 DALL-E 3 逐步生成完美圖片》中,我們教各位讀者利用相同 Seed 的圖片調整生成滿意的圖片。但如果今天想做的是創造相同風格但內容不同的連續圖片呢?這時就必須透過另外一種實用的方法:Gen ID 。

DALL-E 的 “Gen ID”(Generation ID)是指生成圖片時由系統賦予的一個唯一標識符。每當 DALL-E 生成一張新圖片時,系統會為這張圖片分配一個獨一無二的 Gen ID,以便於追蹤和參考。

在 OpenAI 公布的 DALL-E 系列,如 DALL-E 3 的介面中,Gen ID 可能被用來:

  1. 追蹤用戶的生成歷史:用戶可以通過 Gen ID 查找以前生成的圖片。
  2. 收藏或保存圖片:用戶可能想要保存或收藏特定的生成結果,Gen ID 可以幫助他們找到特定的作品。
  3. 分享和討論:當用戶想要在社群媒體或其他平台上分享他們通過 DALL-E 創建的圖片時,Gen ID 可以作為引用。
  4. 繼續迭代:在某些版本的 DALL-E 中,用戶可以根據現有的圖片繼續生成或編輯圖片,Gen ID 則用來標識基礎圖片。

總之,Gen ID 是 DALL-E 用來管理和引用生成圖片的一個內部工具。這樣的標識符對於管理大量生成的內容非常有用,特別是在需要準確追蹤每一次生成操作時。

Gen ID 和 Seed 有什麼不同

  • Seed (種子值):就像玩遊戲時擲骰子,骰子的點數會決定你在遊戲版圖上的移動,但在 DALL-E 裡,「種子值」就是擲骰子時決定的那個點數。你給 DALL-E 一個指令,比如說「畫一個坐在月亮上的貓」,這個「種子值」就像是在告訴 DALL-E 擲出了什麼點數,決定了生成圖片的「走向」。如果你不改變這個種子值, DALL-E 每次都會畫出同一幅坐在月亮上的貓。如果你改了種子值,即使指令不變,畫出來的貓和月亮的樣子或位置可能就會有所不同。
  • Gen ID (生成 ID):這就像是每幅畫的身份證號碼。就算是很多張「坐在月亮上的貓」的圖片,每一張都有一個獨一無二的號碼(Gen ID),讓你能辨識和記住每一張特定的圖片。就算是用同一個「種子值」生成的,只要是重新生成一次,圖片就會有一個新的「生成 ID」。

簡單來說,「Seed」是你可以設定來影響圖片長相的一個參數;「Gen ID」則是系統給每個生成的圖片的一個獨特編號,用來識別那一張圖片。

實際操作

讓我們用一個實際的例子教各位讀者如何創作連續相同風格的圖片。舉例來說,我們想創造一組”寫真相片( Photoshoot ) 風格的 DC 漫畫人物”時,先從一個角色例如”神力女超人”開始。為了避免與 DALL-E 3 溝通上的困擾,以下的輸入都使用英文。輸入:

Create a photoshoot of wonder woman. 16:9 format.

輸出

Here are the images from the photoshoot of the superhero inspired by ancient Greek warriors.

圖片1

prompt: Imagine a superhero inspired by ancient Greek warriors, wearing a costume with a red chest plate with a golden eagle emblem, blue starred lower armor, and a golden tiara. She’s standing heroically on top of a city skyscraper at dusk, with a flowing black cape billowing in the wind. In one hand, she holds a shield with ancient Greek patterns, and in the other, a sword with intricate designs. The city lights twinkle below, and the last rays of the sun cast a golden glow on the scene, highlighting her strong, confident posture.

圖片2

prompt:Imagine a superhero inspired by ancient Greek warriors, wearing a costume with a red chest plate with a golden eagle emblem, blue starred lower armor, and a golden tiara. She’s standing heroically on top of a city skyscraper at dusk, with a flowing black cape billowing in the wind. In one hand, she holds a shield with ancient Greek patterns, and in the other, a sword with intricate designs. The city lights twinkle below, and the last rays of the sun cast a golden glow on the scene, highlighting her strong, confident posture.

這時我們如何取得兩張圖片的 Gen ID 呢?很簡單,接著輸入:

Please give me the gen_ids.

輸出

Certainly! Here are the generation IDs for the images:

For the first image: dmNJF0sI7lwsuJ3A
For the second image: TxGOH8iAUFdMdir1

我們就取得了兩張圖片的 Gen ID 。

在這兩張圖片的風格中,第一張是我們比較喜歡的風格,於是我們紀錄這個 ID,接下來利用它繼續生成相同風格的蝙蝠俠。輸入:

Create an image of batman in the style of image dmNJF0sI7lwsuJ3A.

輸出

Here is the image inspired by the style you referenced, featuring the bat-themed superhero.

圖片

prompt: Visualize a superhero inspired by bats, standing tall on a gothic architecture gargoyle atop a skyscraper at dusk. He’s cloaked in a dark, flowing cape that merges with the shadowy skyline. The cape’s interior flashes with a subtle midnight blue lining. His muscular silhouette is accentuated by the armored suit, detailed with a bat emblem on the chest. His eyes are concealed behind a black cowl with pointed ears, and his fists are clenched, ready for action. The city below him is alight with the soft glow of sunset giving way to night, as he watches over with a guardian’s gaze.

看起來是不是風格很像呢?而且圖片的比例一樣維持16:9。

接下來我們想再做一張圖片,那當然是蝙蝠俠的宿敵小丑囉!輸入:

Create an image of the Joker in the Batman movie of image dmNJF0sI7lwsuJ3A.

輸出

Here is the image inspired by the style you referenced, featuring the theatrical villain.

圖片

prompt: Conjure an image of a villainous character with a flair for the theatrical, dressed in a vivid purple suit with a green vest and tie, exuding a chaotic charisma. His hair is a wild, vibrant green, and his face is painted with a white base, darkened eyes, and an exaggerated red smile that speaks of mischief and mayhem. He stands in the dimly lit, grimy alley of a city, with graffiti on the walls and a neon sign flickering in the background. The atmosphere is one of danger and unpredictability, capturing the essence of a character who is both a mastermind and an agent of chaos.

各位讀者有注意到嗎? DALL-E 3 換了一個場景,但是整體的視覺風格仍然維持不變,這有助於我們未來可以創造一組相同風格的組圖,而不是單調的背景。但是如果想要類似的背景圖呢?那也很容易,輸入:

Create an image of the Joker in the Batman movie of image dmNJF0sI7lwsuJ3A. Same background.

輸出

The image featuring the villainous character with the same background as the previously referenced superhero image is now displayed above.

圖片

prompt: Envision a character reminiscent of a notorious villain from a superhero film, with a stark white painted face, deep-set eyes with smudged dark makeup, and a wide, sardonic red smile. His hair is untamed and dyed a bright green, contrasting sharply against the white of his face. He’s clad in a distinctive purple suit, complete with a green shirt and a dark tie, capturing the essence of anarchy and madness. This figure is standing with a confident, yet menacing posture on top of a city skyscraper at dusk, similar to the background of the image with gen_id dmNJF0sI7lwsuJ3A, with the city’s lights beginning to illuminate the approaching night, echoing the chaotic energy of the character.

這時小丑的背景就跟第一張的神力女超人非常的類似。

相信各位讀者透過我們上面的實際操作多加練習,就可以善用這個技巧。無論你是文字工作者寫作的配圖、影像創作者在影片中插入輔助圖片、廣告投放設計風格近似的廣告圖,這個技巧都可以有效節省大量製圖或外包的時間。

最後,以上的方法僅適用於同一個對話內容,所以運用時請務必在同一個對話中創作喔!

進一步閱讀

  1. 直接複製!使用 DALL-E 3 新增的67種圖片風格,解放 AI 創作潛能 (附實例)
  2. DALL-E 3 新功能與實踐指南
  3. GPT-4V 進階:透過 GPT-4V 讓 DALL-E 3 以文生圖創造風格近似的作品
  4. 如何利用 Negative Prompt 優化 DALL-E 3 圖像生成
  5. 如何在 DALL-E 3 中將數種不同物體融合為一
  6. 如何在 DALL-E 3 的圖片上增加文字
  7. DALL-E 3 中的光線參數 (上)
  8. 六種適用於東方特色的 DALL-E 3 創作風格
  9. DALL-E 3 中的光線參數 (下)
  10. DALL-E 3 的角度參數及其影響