2023年12月21日凌晨, Midjourney 宣布對所有用戶開放了其最新的 V6 模型的 alpha 版本。這個更新讓用戶在寒假期間能首次體驗 V6 模型的先進功能。用戶可以通過在設置菜單中選擇 V6 或在指令後加上”––v 6″來啟用新模型。
We're now alpha-testing our V6 models Midjourney. Just type /settings and click V6 or add ––v 6 after your prompt. Image coherence and prompt understanding are greatly improved. You can draw text and dolphins and there's new upscalers too. Happy holidays everyone!
— Midjourney (@midjourney) December 21, 2023
V6 模型帶來了許多顯著的改進。首先,它在遵循更長的指令方面變得更加精確,增強了模型的知識和圖像提示的能力。此外,它在繪製文字方面也有小幅改進,用戶需在指令中加入引號和特定的風格設定。新的 upscaler 功能也讓圖像的解析度提高了兩倍,並帶來了”細微”和”創意”兩種模式。
V6 在啟動時支持多種功能和參數,包括多種風格和效果設定。然而,也有一些功能尚未支持,預計將在未來一個月內推出,如視角轉換、區域變化等。
Midjourney 指出,與 V5 相比, V6 在提示方面的反應更為敏感,用戶需要重新學習如何有效地使用提示。這意味著要避免使用含糊不清的語言,並明確指出所需的內容。 V6 對於明確的指令有了更好的理解能力,如果用戶希望獲得更加真實或更少個人色彩的圖像,應該使用”––style raw”。
該公司提醒用戶,這只是一次 alpha 測試,模型在未來可能會經常且不預先通知地進行更改,並且 V6 在速度和成本上相對 V5 來說會更慢更昂貴,但預計隨著優化會逐步改善。
此外,由於 V6 能生成遠比以往任何版本更逼真的圖像, Midjourney 加強了其審核系統,並將嚴格執行社區規範。公司呼籲用戶使用這項強大的工具時要保持喜悅、好奇、責任感和尊重。
V6 模型是 Midjourney 基於其 AI 超級集群從頭開始訓練的第三個模型,已經開發了9個月。公司表示, V6 雖然不是最終步驟,但希望所有用戶都能感受到這一深刻進步,並與他們集體想象的力量更加緊密地交織在一起。用戶被邀請在特定的展示區分享他們的圖像,或在意見和特性討論區提供反饋。
實際圖像效果
筆者測試後覺得 V6 模型的成像擬真程度大勝 DALL-E 3 ,也比 V5.2 更接近真實照片。若你是 Midjourney 用戶也可以體驗看看差異。
人像
Prompt: A Japanese beautiful 22 year old woman wearing white lace deep v dress, sitting on a chair in the coffee shop, full body shot, cinematic shot, f/1.4, 50mm, iso 200, volumatic lighting, soft lighting, cold tone color, Nikon D6, natural skin.
V5.2
V6
風景
Prompt: Kyoto Nara Higashiji Temple, snow scene, panoramic view, wide-angle lens, cinematic stunning scene, intense sunlight, several deer walking ahead. F/8, 16mm, ISO 200, Pentax 645Z.
V5.2
V6
文字
Prompt: Low angle view. An advertisement with text “Leggie” printed on it stands on the TV wall in Times Square, with a crowd of onlookers below. In the snowy winter, at night, bright neon lights. F/5.6, ISO 800, Nikon D6.
V5.2
V6
文字的問題在這個版本仍然存在,但是文字呈現的效果及錯誤率相比 V5.2 要來得更好。