
2024年4月2日, DALL-E 3 再次成為焦點,推出了全新的圖片編輯功能。這項創新讓使用者不僅能生成高品質的圖像,更能對生成結果進行靈活的修改和調整,大幅提高了 AI 繪圖的實用性。除了圖片編輯功能外,針對 DALL-E 3 的新手用戶, OpenAI 也在其 DALL-E 3 GPT 中預設了一些風格推薦與版面設定,讓用戶更直覺地創作圖片。
影片來源: OpenAI
內畫選取編輯精準修改細節
DALL-E 3 的新功能支援在生成的圖像上直接進行局部編輯,用戶只需在圖像中框選一個區域,就能透過輸入文字指令來修改該區域的內容。例如在一張風景圖中加入櫻花樹、為室內場景添加新的家具、移除不想要的物件等,都能輕鬆完成。這種”內畫選取編輯”的操作方式不僅直覺易用,更能精準地對圖像進行細微的調整,避免了重新生成整張圖像的效率低落,選取工具的大小也可以自由調節,讓編輯區域能夠精確到像素級別。
對話式編輯流暢的人機互動
除了使用選取工具, DALL-E 3 的編輯功能還支援對話式的文字輸入。使用者可以直接在聊天視窗中鍵入指令,例如”將這張圖像變成黑白”、”調整圖像的對比度”等,系統就會依據指令對整張圖像進行相應的編輯。這種對話式的編輯模式,與 ChatGPT 等大語言模型的交互體驗高度一致,讓使用者能夠在同一個對話框中自然無縫地切換文字生成和圖像生成/編輯。
跨平台支援桌面體驗更完整
目前 DALL-E 3 的圖片編輯功能在桌面端可以獲得最完整的體驗。除了上述的選取編輯和對話式編輯,桌面版還支援調整畫布大小、縮放、平移等高級功能,讓使用者對生成結果有更多控制權。而在行動裝置上雖然暫時只能使用簡單的內畫選取編輯,但 OpenAI 已承諾未來將加強行動端的編輯能力,讓用戶隨時隨地都能輕鬆修改 AI 生成的圖像。
注意事項與潛在風險
儘管 DALL-E 3 的圖片編輯功能大大增強了使用者的創作彈性,但在使用過程中也需要注意一些事項:
- 編輯時應保留足夠的原始圖像內容,否則可能導致生成結果風格發生偏移。
- 使用 DALL-E 3 的各項功能需要支付相應的次數,每次編輯都會消耗一次對話。
- 為了版權和安全考量, DALL-E 3 不會生成涉及現任公眾人物或模仿在世藝術家風格的圖像。
- 實際上使用時經過2輪以上的對話 DALL-E 3 會出現無法順利執行指令或生成無法預期的圖像的問題。
實際測試
讓我們從一個簡單的 Prompt 開始:
Prompt: 一個充滿魅力的年輕日本女子,她烏黑的長髮梳成複雜的辮子,從岩石峭壁上凝視著大海。HD畫質,HDR,寫實照片。16:9 格式。
DALL-E 3 生成了2張圖像,我們選擇其中一張較符合我們心中意境的圖片。

接下來,我們對於畫面右下角的山不太滿意,我們想要移除那座山,於是我們使用上方的繪圖板標示(編輯功能)圈選山的部份進行修改:

圈選我們想要移除的部份,並輸入 Prompt: 移除畫面中的山:

DALL-E 3 順利幫我們移除山的部份,但是接下來的指令就開始不順利了。當我們圈選上方圖示之處,並輸入 Prompt: 畫一隻飛翔的老鷹,經過2、3次的嘗試 ,甚至嘗試讓它改畫海鳥,但 DALL-E 3 仍然無法幫我們順利畫出。

接下來的部份 DALL-E 3 更是脫稿演出,當我們輸入 Prompt: 背景畫面調整成夜晚, DALL-E 3 將之前沒畫出來的海鳥畫成圖片主角,並將背景改成夜晚的星空及月亮如下圖:

結語
DALL-E 3 推出的圖片編輯及風格推薦功能無疑是一項重大創新,它不僅讓 AI 生成圖像的能力更上一層樓,更重要的是大幅提高了 DALL-E 3 的實用性和靈活性。雖然相比其他早已具備此功能的 AI 繪圖平台如 Midjourney 和 Leonardo,這個功能推出的時間慢了許多,但是對於純粹使用 ChatGPT Plus 進行日常工作的用戶來說,仍無疑在便利性上推進了一大步。