
備受期待的 AI 圖像生成服務 Midjourney 近日推出了最新版本— V7 。這距離其上一個主要版本的發布已將近一年,在競爭激烈的 AI 領域中,此舉無疑引發了廣泛關注。 V7 版本的發布時間,恰好與 OpenAI 在其 ChatGPT 平台中推出全新圖像生成器 4o Image Generation 之後不久,這使得市場競爭更趨白熱化。 Midjourney 團隊表示, V7 是一個完全重新打造的模型,擁有其獨特的優勢,但也可能存在一些需要使用者探索和適應的特性,特別是在 prompt 的設計上。
One of the most exciting new features for our new V7 model is something we call "Draft Mode". Draft mode is half the cost and 10 times the speed and it might be the best way to iterate on ideas ever. Try it with voice, think out loud and let our ideas flow like liquid dreams. pic.twitter.com/ANfTMC6Ej1
— Midjourney (@midjourney) April 4, 2025
Midjourney V7 已於2025年4月4日(星期五)美國東部時間午夜前後開始以 alpha 測試版本向用戶推出。值得注意的是,在一些社群媒體平台如 Reddit 上,曾有討論指出該版本的目標發布日期為3月31日,但實際發布時間似乎有所延遲。這種時間上的差異在軟體開發過程中並不少見,通常是由於最後階段的測試或調整所致。此次 V7 以 alpha 版本先行發布,也暗示了 Midjourney 可能希望在全面推廣之前收集用戶的反饋並進行進一步的完善。
V7 版本帶來了多項令人矚目的新功能。其中最引人注目的便是全新的 Omni-Reference 功能,據稱該功能可以更好地理解和應用使用者提供的參考圖像,無論是標誌、人類或非人類角色,還是各種物體,都能夠更精確地融入到生成的圖像中。此外, V7 預計將在理解使用者輸入的 prompt 方面有顯著的提升,並能生成更連貫的圖像。更快的處理速度也是 V7 的一大亮點,這意味著使用者可以更快地看到他們的創意成果。然而,在 V7 的 alpha 版本初期,部分功能如圖像放大(upscaling)和局部重繪(in-painting)將暫時使用 V6 的版本,而 V7 專屬的版本預計將在不久的將來推出。同樣,一些進階參數如 weird 、 quality 、 tile 和 multi-prompting 等,可能不會在第一時間提供,但開發團隊承諾將在發布後的幾週內逐步添加這些功能。值得關注的是, V7 預計將採用一套全新的風格參考系統,但目前尚不清楚 V6 版本的 SREF 代碼是否能與之兼容。此外 V7 還可能引入更為先進的 3D 建模功能,包括生成更複雜和細緻的 3D 模型,以及改進的紋理和照明選項,甚至可能與現有的 3D 軟體實現更好的整合。 Midjourney 團隊的目標是讓 V7 能夠生成具有高度細節的美學風格,並能準確地呈現圖像中的面部、角色、標誌和各種物體。
相較於其前身 V6 , Midjourney V7 在多個方面都展現出了顯著的改進潛力。據相關資訊顯示, V7 有望提供更快的處理速度,更精緻且直觀的使用者介面,以及更高品質的圖像,包括更豐富的細節、更生動的色彩和更逼真的效果。 V7 還引入了更先進的圖像合成技術,並提供了更多樣化的濾鏡供使用者選擇。在設計上, V7 也更加精簡且響應迅速,有助於提升使用者的整體體驗。 V7 在理解使用者 prompt 方面的能力也得到了提升,能夠更準確地將文字描述轉化為視覺圖像。此外, V7 可能還會提供更直觀的圖像編輯控制功能,使用者可以直接在平台內進行編輯,從而簡化整體的創作流程。在圖像的細節呈現、空間關係的理解以及色彩的準確性方面, V7 也預計將有所提升。 一個值得注意的改進是 V7 在生成連貫文本方面的能力也得到了增強,這對於需要在圖像中加入文字的使用者來說是一個重要的進步。
目前來看,沒有明確的證據顯示 Midjourney V7 的發布會帶來新的訂閱方案或價格變動。 Midjourney 目前提供四種主要的訂閱方案,分別是 Basic 、 Standard 、 Pro 和 Mega ,價格從每月10美元到120美元不等。其中 Basic 方案每月10美元,提供有限的快速 GPU 時間; Standard 方案每月30美元,提供更多的快速 GPU 時間和無限的 Relax GPU 時間; Pro 方案每月60美元,提供更長的快速 GPU 時間以及一些額外功能,如隱身模式; Mega 方案則是每月120美元,提供最長的快速 GPU 時間和最多的並行任務處理能力。這些方案旨在滿足不同用戶的需求和預算。
早期使用者和專業評測對於 Midjourney V7 的看法呈現出多種不同的聲音。一些參與了早期評分的使用者在提交了超過2000個評分後表示, V7 在圖像品質和細節方面表現非常出色,即使在一張圖像中有多個角色,也能夠保持良好的細節呈現。然而也有意見指出,V7在文本顯示方面仍然存在不足,與 Ideogram 和 OpenAI 的 GPT-4o Image Generation 相比仍有差距,並且其對於 prompt 的準確性還有待進一步觀察。在 Reddit 等社群平台上,一些使用者分享了 V7 與 V6 的比較結果,部分人認為 V7 在某些方面有所改進,例如人像的真實感有所提升,但在整體圖像品質上並未看到顯著的飛躍,甚至有時候更偏愛 V6 的輸出。更有評論認為,整個 AI 圖像生成技術可能已經發展到了一個相對成熟的階段,未來難以再看到像早期那樣巨大的品質提升。一些使用者表達了對於 V7 能夠帶來更好的 prompt 準確性、更強的文本渲染能力以及更易於新手使用的“簡單模式”的期望。值得肯定的是有評論指出 V7 在生成人像時的“粗糙感”有所減輕,這被認為是一個積極的改進。
作為最早的AI圖像生成服務之一, Midjourney 在該領域一直佔據著重要的地位。然而隨著技術的發展,市場競爭也日趨激烈。 Midjourney 的主要競爭對手包括 OpenAI(其 DALL-E 系列以及集成在 ChatGPT 中的圖像生成器)、 Stability AI 的 Stable Diffusion 、 Ideogram 以及 FLUX 等。 Midjourney 一直以來都以其獨特的藝術風格和卓越的創意生成能力而聞名,儘管在 prompt 的準確性方面可能不如某些競爭對手。 V7 的推出被廣泛認為是Midjourney在競爭日益激烈的市場中重新確立其領先地位的重要機會。
Midjourney V7 的發布預計將對整個 AI 圖像生成市場產生積極的影響。它的推出可能會刺激該領域的進一步創新,促使其他競爭對手也加快推出更先進的功能和模型。市場對於更高品質、更逼真圖像的需求持續增長,而 V7 的推出恰好迎合了這一趨勢。儘管 V7 可能尚未完全實現,但 Midjourney 對於影片生成領域的探索也預示著 AI 圖像生成技術未來將朝向多媒體內容發展。
實際測試
寫實照片
Prompt
A young Taipei woman lies comfortably on a cozy, textured gray blanket spread over a bed, with soft natural light illuminating the scene. Her long, dark hair is styled in loose waves, framing her face and cascading over her shoulders. She wears a simple white top paired with light blue jeans, creating a casual yet stylish look. Her left hand is gently placed on her forehead, with her fingers slightly curled and relaxed, while her right hand rests naturally by her side. Her fingers are slender and well-defined, with neatly trimmed nails. The woman’s expression is serene and thoughtful, with her gaze directed towards the camera. The background is softly blurred, emphasizing the focus on her face and upper body. The lighting is diffused, casting subtle shadows that enhance the texture of the blanket and her clothing. The overall composition is intimate and inviting, capturing a moment of quiet reflection. SONY FX3, Sony FE 50mm F1.2 GM. –no extra fingers, missing fingers, mutated hands, deformed hands, mirrored hands, missing arms, missing legs, deformed hands, extra fingers, distorted fingers, broken hands, fused fingers, long fingers, misshapen hands, extra limbs, disfigured hands, flat chest, low pixels –s 50 –style raw
一位年輕的台北女子舒適地躺在一張床上舖著的有質感的灰色毛毯上。柔和的自然光照亮了整個場景。她烏黑的長髮呈現自然的波浪捲,勾勒出她的臉龐,垂落在她的肩膀上。她穿著一件簡單的白色上衣,搭配淺藍色牛仔褲,營造出休閒又時尚的造型。她的左手輕輕地放在額頭上,手指微微彎曲且放鬆,而右手自然地放在身邊。她的手指纖細修長,指甲修剪得整齊。女子的表情寧靜而若有所思,目光直視著鏡頭。背景微微模糊,強調了對她的臉部和上半身的聚焦。光線柔和散射,投下微妙的陰影,增強了毛毯和她衣服的質感。整體構圖親密而吸引人,捕捉了一個寧靜沉思的瞬間。
V7(指令理解、人物皮膚、影像細節及情境表現力最佳,真人還原度高)

註:筆者實際測試後,新版本雖然手指的問題降低許多,但是仍然還是沒有完全改善老毛病,即使增加負向提示詞仍然需要多次抽卡才能生成滿意的照片。希望官方在未來的版本能夠積極改善這個問題。此外, Midjourney V7 預設強制使用個人化風格,如果想要使用 V7 原生的圖像風格的話在提示詞後方加入 --p none
參數即可。
V6.1(指令理解一般,藝術表現最佳,皮膚紋理表現較弱)

V6(指令理解一般,偏向寫實及復古,皮膚細節介於6.1與7之間,藝術感較弱)

結論:在照片生成類別中,其實三個模型版本各有特色。端看使用者的用途而定。如果追求真實感及要求指令細節的使用者最佳選擇一定是 V7 。
藝術
Prompt
A woman sitting quietly at the table and lost in thought by Christoph Niemann. –s 50 –style raw
克利斯多福·尼曼(Christoph Niemann)所繪的一名女子靜靜地坐在桌前陷入沉思。
V7

V6.1

V6

結論:在藝術風格上, V7 偏向靜謐的哀愁,流露出淡淡的回憶與孤單;V6.1 表現出現實中的壓抑與自我拉扯,顏色對比強化了內在掙扎;V6 情感張力最強,色彩和線條都充滿張力,暗示著難以平息的內心波動。三幅畫都以孤獨為核心,但 V7 偏向內斂,V6.1 著重現實的壓力, V6 則更加強烈地表達情感崩解。這些畫面透過色彩、構圖和畫風的變化,巧妙地傳達出孤獨的不同面向與層次。使用者可以根據自己比較偏好的藝術風格挑選適合的版本創作。
文字
Prompt
A restaurant menu in retro style. The words on the menu are as follows: At the top center, in bold large font, is the headline “Menu”. On the left side below are the words in sequence: “Drinks” (in bold font), “Cola $20”, “Coffee $40”, “Mineral water $15”, “Lemon juice $20”. On the right side below are the words in sequence: “Food” (in bold font), “Hamburger $50”, “Steak $80”, “French fries $10”, “Chicken cutlet $50”. –s 50 –style raw
一個復古風格的餐廳菜單,菜單上的文字分別是: 上方中央粗體字大標題 “菜單”,下方左排文字依序是”飲料”(粗體字),”可樂 $20″,”咖啡 $40″,”礦泉水 $15″,”檸檬汁 $20″,下方右排文字依序是”食物”(粗體字),”漢堡 $50″,”牛排 $80″,”薯條 $10″,”雞排 $50”
V7

V6.1

V6

結論:文字呈現一向 Midjourney 最大的弱點之一,即使到了 V7 官方仍然沒有解決這個問題。所以如果各位讀者有文字及排版的需求,筆者還是建議先透過 Midjourney 產生底圖之後再透過 PS 或 Canva 等工具進行二次處理。