Midjourney 發佈 V6.1 版本,AI 圖像生成技術再創新高

Midjourney V6.1 測試 - 人像 - V6.1 結果

人工智能圖像生成領域的領先企業 Midjourney 2024年7月31日宣佈推出其備受期待的 V6.1 版本。這次更新不僅帶來了多項重大技術突破,更將成為該平台的默認模型,標誌著 AI 圖像生成技術的又一重要里程碑。
V6.1 版本的核心升級涵蓋了多個關鍵領域。首先,在圖像連貫性方面取得了顯著進展。新版本能夠更準確地生成人體四肢、植物和動物等元素,大大提升了整體圖像的自然度和真實感。其次,圖像品質得到了全面優化,包括減少像素瑕疵、增強紋理效果,特別是在皮膚質感和 8 位復古風格的呈現上有明顯改善。
更值得注意的是,V6.1 在處理圖像細節方面表現出色。眼睛、小臉部特徵以及遠處的手等細微元素都能得到更精確、更詳細的呈現。這一改進無疑將為創作者提供更多的可能性,使得生成的圖像更加細膩逼真。
在效能方面,Midjourney 也有所突破。新版本引入了全新的放大器功能,能夠顯著提升圖像和紋理質量。同時,標準圖像任務的處理速度提升了約 25%,這意味著用戶可以更快地獲得高質量的圖像輸出。
文字準確度的提升是另一個重要改進。當用戶在提示詞中使用引號標註文字時,V6.1 能夠更準確地在圖像中呈現這些文字,這對於需要在圖像中包含特定文字的創作者來說是一個重大利好。
V6.1 版本還革新了個人化功能。新的個人化模型提供了更多細微差別、驚喜元素和準確性。此外,Midjourney 引入了個人化代碼版本控制功能,允許用戶使用舊任務中的任何個人化代碼來應用該任務的個人化模型和數據。這一功能大大增強了用戶對生成結果的控制力。
除了上述主要更新,V6.1 還引入了一個名為 「–q 2」 的新模式。這個模式雖然會增加 25% 的處理時間,但能夠在某些情況下增加更多紋理細節,代價是可能略微降低圖像的整體連貫性。Midjourney 表示,這次更新後,整體圖像效果應該 「普遍更加美觀」。
然而,V6.1 版本也存在一些局限性。目前,新版本並未更新內繪/外繪模型,這意味著在使用縮放、重新構圖、重繪或區域變化等功能時,系統將回退到 V6.0 模型。對於希望繼續使用舊版本的用戶,Midjourney 提供了簡單的切換方法,用戶可以在設置中選擇 V6,或在任務後輸入 「–v 6」 指令。
Midjourney 透露可能會在下個月左右發布 V6.2 版本,帶來進一步的改進。但在此之前,公司希望盡可能收集更多用戶使用 V6.1 的數據。這也是 Midjourney 決定將 V6.1 設為所有用戶默認模型的原因之一。
值得一提的是,這次發布的功能很大程度上是基於社區用戶在 Midjourney 官方網站上提交和排序的優先事項。Midjourney 對社區成員的參與表示感謝,並鼓勵用戶在專門的頻道中展示最新的 V6.1 圖像、個人化結果,以及分享他們的想法和建議。
隨著 V6.1 版本的推出,Midjourney 再次展現了其在 AI 圖像生成領域的創新能力和領導地位。這次更新不僅提升了圖像質量和生成效率,還為創作者提供了更多個性化和精細控制的可能性。

實際測試

人物細節

Prompt: In the realm of photography, envision a picture filled with urban nostalgia. It depicts a portrait of youthful discontent placed against the backdrop of an ageless city scene. A woman reclines listlessly on an old, industrial metal staircase, and her posture emanates a feeling of self-reflection and quiet rebellion. She wears a plain black t-shirt, which is snug and slightly worn, delicately outlining her figure. Her black jeans embody the charm of streetwear fashion. Classic black and white shoes form a sharp contrast with the rusted steps, and her casual lace-up style implies a readiness to leap into action. Her hair is a flow of dark waves, partially covered by a black cap, with the brim showing a touch of youthful boldness. Around her, the worn brick walls murmur tales of the city’s bygone days, and the windows reflect fragmented views of urban existence. There is an atmosphere of contemplation as she rests her head on one arm, looking afar, perhaps lost in her thoughts or merely relishing a moment of solitude within the urban labyrinth. Canon EOS-1D X Mark III, f/5.6. –ar 16:9 –s 100(在攝影領域,想像一張充滿都市懷舊的照片。 它描繪了一幅年輕人不滿的肖像,背景是永恒的都市景象。 一個女人無精打采地躺在一個古老的工業金屬樓梯上,她的姿勢散發出一種自我反省和安靜反叛的感覺。 她穿著一件樸素的黑色T恤,舒適而略顯破舊,精緻地勾勒出她的身材。她的黑色牛仔褲體現了街頭時尚的魅力。 經典的黑白鞋和生銹的臺階形成了鮮明的對比,她隨意的繫帶風格意味著隨時準備行動。 她的頭髮呈深色波浪狀,部分被一頂黑色帽子遮住,帽沿透出一絲年輕的大膽。 在她周圍,破舊的磚牆訴說著這座城市過去的故事,窗戶反映出對都市存在的零散看法。 當她把頭靠在一隻胳膊上,望著遠方時,有一種沉思的氣氛,也許迷失在她的思緒中,或者只是在城市迷宮中享受片刻的孤獨。)

V6

Midjourney V6.1 測試 - 人像 - V6 對照

V6.1

Midjourney V6.1 測試 - 人像 - V6.1 結果

文字

Prompt: A photorealistic scene shows a modern urban building from the front view at night. There is a “PROMPTHERO” text bracket signage in neon lights on the side of the building. The ambiance is of dusk, with the building surrounded by a large crowd. Soft glows emanate from the windows, and a subtle city soundscape can be perceived. –ar 16:9 –s 100(一個逼真的場景顯示了夜晚從正面看到的現代城市建築。 大樓側面的霓虹燈上有一個“PROMPATHERO”文字括弧標誌。 氛圍是黃昏,建築被一大群人包圍著。 柔和的光芒從窗戶散發出來,可以感受到微妙的都市聲景。)

V6

Midjourney V6.1 測試 - 文字 - V6 對照

V6.1

Midjourney V6.1 測試 - 人像 - V6.1 結果

紋理

Prompt: The Pantheon of Rome and the Louvre, presented in the style of domestic interiors, reminiscent of 19th-century American paintings and works on paper, with an interdisciplinary art approach, incorporating elements of kintsugi, featuring large canvas sizes, emphasizing symmetry, and showcasing detailed naturalism. –ar 16:9 –s 100(羅馬萬神殿和盧浮宮以國內室內風格呈現,讓人聯想到19世紀的美國繪畫和紙上作品,採用跨學科的藝術方法,融合了金津的元素,具有大畫布尺寸,強調對稱性,並展示了詳細的自然主義。)

V6

Midjourney V6.1 測試 - 紋理 - V6 對照

V6.1 (增加 –q 2)

Midjourney V6.1 測試 - 紋理 - V6.1 結果