如何在 DALL-E 3 中將數種不同物體融合為一

想像你是一個奇幻小說作家,或者動畫、遊戲設計人員,有時你需要創作一種融合各種不同元素的動物或是物體的圖片。這種需求 DALL-E 3 有沒有辦法幫我們做到呢? 答案是有的。只要在 prompt 中輸入一個特別的指令及參數就能創造這樣的作品:

指令

(物體A : 佔總體的比例,以小數點形式表示) (物體B : 佔總體的比例,以小數點形式表示) (物體C : 佔總體的比例,以小數點形式表示) ….依此類推,所有物體佔總體的比例相加為1

  • DALL-E 3 會以第一個物體為基底或輪廓(例如物體A),經過消噪的過程再根據指定的比例逐步融合後面的物體
  • 注意,若融合過於粗糙不美觀,增加一些正面及負面提示詞可以讓整體視覺更自然,不會看起來像拼貼圖

實際操作

讓我們舉二個實際的例子來觀察指令的效果:

第一個例子(獅子+貓)

輸入

An image of (Lion : x) (Cat : y) without text ,ugly , incomplete. 16:9 format.

圖片1-1,1-2 (x=0.8, y=0.2)

輸入

An image of (Lion : x) (Cat : y) , toned, shiny hair, without text ,ugly , incomplete, unnatural shape, wizened, scrawny. 16:9 format.

圖片2-1,2-2 (x=0.5, y=0.5)

輸入

An image of (Lion : x) (Cat : y) , toned, shiny hair, without text ,ugly , incomplete, unnatural shape, wizened, scrawny. 16:9 format.

圖片3-1,3-2 (x=0.3, y=0.7)

第二個例子(貓+獅子+魚)

輸入

An image of (Cat : x) (Lion : y) (Fish : z) without text ,ugly , incomplete. 16:9 format.

圖片1-1, 1-2 (x=0.4, y=0.3, z=0.3)

圖片2-1, 2-2 (x=0.3, y=0.3, z=0.4)

DALL-E 3 有時還是不太聽話,這張圖出現了我們不想要出現的文字,但也從這邊看到它確實成功解讀我們想要的不同動物之間的比例。

各位讀者可以依照上述的方法,嘗試不同的物體融合看看,多練習自然能夠得心應手,做出自己滿意的圖片。

進一步閱讀
  1. 直接複製!使用 DALL-E 3 新增的67種圖片風格,解放 AI 創作潛能 (附實例)
  2. DALL-E 3 新功能與實踐指南
  3. 如何用 Gen ID 讓 DALL-E 3 輸出相同風格的圖片
  4. 如何在 DALL-E 3 的圖片上增加文字
  5. DALL-E 3 中的光線參數 (上)
  6. GPT-4V 進階:透過 GPT-4V 讓 DALL-E 3 以文生圖創造風格近似的作品
  7. 六種適用於東方特色的 DALL-E 3 創作風格
  8. 如何利用 Negative Prompt 優化 DALL-E 3 圖像生成
  9. 如何透過修改 Seed 讓 DALL-E 3 逐步生成完美圖片
  10. DALL-E 3 中的光線參數 (下)

ChatGPT 推出新功能,讓付費用戶可以製作自己的 GPT

在人工智能領域取得革命性進展的 ChatGPT ,最近推出了一項新功能,允許付費用戶創建屬於自己的生成預訓練轉換器(GPTs)。這項創新的功能是由 OpenAI 於11月6日宣布,旨在讓用戶可以根據日常生活、工作或家庭中的特定任務,量身打造一個更為有用的 ChatGPT 版本。這些自訂版本的 ChatGPT ,或稱為 GPTs ,標誌著個人化智能助理的新紀元,用戶可以透過簡單的操作,無需任何編程知識,就能創建並分享他們的創新工具。

OpenAI 透露,許多所謂的「權力用戶」之前需要存儲文本文件,以框定 ChatGPT 對提示的回應。這些用戶每次啟用 ChatGPT 時,都必須將這些文本字段複製並粘貼到程式的聊天框中,然後才能執行任何任務。 GPTs 的推出,意在解決這一問題,使自定義指令和回應變得自動化。

此功能目前僅對「 ChatGPT Plus 」和企業訂閱層級的用戶開放,尚無免費版本。這意味著,只有付費用戶才能享受到打造專屬 GPTs 的權益,從而進一步提升他們使用 ChatGPT 的效率和體驗。這一變化不僅提升了用戶的使用便捷性,更為 OpenAI 開啟了新的商業模式和收益途徑。

在實際應用方面,這些個性化的 GPTs 已經開始在各行各業中顯示其價值。例如,生物技術公司 Amgen 、管理諮詢公司 Bain 以及支付處理商 Square 已經利用 GPTs 創建市場行銷素材、協助客服人員或幫助新工程師熟悉工作環境。這些用例不僅展示了 GPTs 在提升工作效率和促進工作自動化方面的潛力,也證明了這項技術能夠根據各種專業領域的特定需求進行定制。

另一方面, OpenAI 也宣布將於本月晚些時候推出 GPT 商店,這是一個類似於移動應用商店的平台,允許開發者創建並銷售他們的 GPTs 。只有經過驗證的建造者才能在商店中發布他們的 GPTs 。這個步驟不僅促進了創新和分享,也開啟了一個新的市場,用戶和開發者可以在此交流和共享資源。

在隱私和安全方面, OpenAI 強調他們始終將用戶的數據控制權放在首位。用戶與 GPTs 的對話不會與建造者共享,如果 GPTs 使用第三方 API ,用戶可以選擇是否將數據發送到該 API 。此外, OpenAI 還設立了新系統來審查 GPTs 是否符合其使用政策,並採取了一系列措施來建立用戶信任,包括允許建造者驗證他們的身份。這些措施加強了用戶對於他們數據安全和隱私的信心。

在 AI 服務市場中, ChatGPT 憑藉超過1.8億的用戶基礎,已成為最受歡迎的 AI 聊天程式之一。然而,它面臨著來自 Google 的 Bard 和 Anthropic 的 Claude 2 等服務的激烈競爭。此外, Elon Musk 最近宣布創建了自己的 AI 聊天程式“ Grok ”,這進一步加劇了這一領域的競爭。

隨著 AI 技術的快速發展, OpenAI 將 GPTs 視為邁向真實世界中的“代理人”發展的一步。他們正在逐步推動這一願景,同時考慮到其對社會的廣泛影響。隨著 GPTs 成為日常生活和工業界的一部分,它們可能會對許多行業產生深遠的影響,從而改變我們與技術互動的方式。

總結來說,這項功能的推出不僅是技術進步的一個里程碑,也是向更廣泛的用戶群體提供個性化 AI 的一大步。隨著用戶生成內容的不斷演進,我們可以預見一個更加智慧和互聯的未來。隨著 GPTs 功能的推廣,將來還會有更多創新和便捷的解決方案出現,以滿足不斷變化的全球需求。

如何用 Gen ID 讓 DALL-E 3 輸出相同風格的圖片

在之前的文章《如何透過修改 Seed 讓 DALL-E 3 逐步生成完美圖片》中,我們教各位讀者利用相同 Seed 的圖片調整生成滿意的圖片。但如果今天想做的是創造相同風格但內容不同的連續圖片呢?這時就必須透過另外一種實用的方法:Gen ID 。

DALL-E 的 “Gen ID”(Generation ID)是指生成圖片時由系統賦予的一個唯一標識符。每當 DALL-E 生成一張新圖片時,系統會為這張圖片分配一個獨一無二的 Gen ID,以便於追蹤和參考。

在 OpenAI 公布的 DALL-E 系列,如 DALL-E 3 的介面中,Gen ID 可能被用來:

  1. 追蹤用戶的生成歷史:用戶可以通過 Gen ID 查找以前生成的圖片。
  2. 收藏或保存圖片:用戶可能想要保存或收藏特定的生成結果,Gen ID 可以幫助他們找到特定的作品。
  3. 分享和討論:當用戶想要在社群媒體或其他平台上分享他們通過 DALL-E 創建的圖片時,Gen ID 可以作為引用。
  4. 繼續迭代:在某些版本的 DALL-E 中,用戶可以根據現有的圖片繼續生成或編輯圖片,Gen ID 則用來標識基礎圖片。

總之,Gen ID 是 DALL-E 用來管理和引用生成圖片的一個內部工具。這樣的標識符對於管理大量生成的內容非常有用,特別是在需要準確追蹤每一次生成操作時。

Gen ID 和 Seed 有什麼不同

  • Seed (種子值):就像玩遊戲時擲骰子,骰子的點數會決定你在遊戲版圖上的移動,但在 DALL-E 裡,「種子值」就是擲骰子時決定的那個點數。你給 DALL-E 一個指令,比如說「畫一個坐在月亮上的貓」,這個「種子值」就像是在告訴 DALL-E 擲出了什麼點數,決定了生成圖片的「走向」。如果你不改變這個種子值, DALL-E 每次都會畫出同一幅坐在月亮上的貓。如果你改了種子值,即使指令不變,畫出來的貓和月亮的樣子或位置可能就會有所不同。
  • Gen ID (生成 ID):這就像是每幅畫的身份證號碼。就算是很多張「坐在月亮上的貓」的圖片,每一張都有一個獨一無二的號碼(Gen ID),讓你能辨識和記住每一張特定的圖片。就算是用同一個「種子值」生成的,只要是重新生成一次,圖片就會有一個新的「生成 ID」。

簡單來說,「Seed」是你可以設定來影響圖片長相的一個參數;「Gen ID」則是系統給每個生成的圖片的一個獨特編號,用來識別那一張圖片。

實際操作

讓我們用一個實際的例子教各位讀者如何創作連續相同風格的圖片。舉例來說,我們想創造一組”寫真相片( Photoshoot ) 風格的 DC 漫畫人物”時,先從一個角色例如”神力女超人”開始。為了避免與 DALL-E 3 溝通上的困擾,以下的輸入都使用英文。輸入:

Create a photoshoot of wonder woman. 16:9 format.

輸出

Here are the images from the photoshoot of the superhero inspired by ancient Greek warriors.

圖片1

prompt: Imagine a superhero inspired by ancient Greek warriors, wearing a costume with a red chest plate with a golden eagle emblem, blue starred lower armor, and a golden tiara. She’s standing heroically on top of a city skyscraper at dusk, with a flowing black cape billowing in the wind. In one hand, she holds a shield with ancient Greek patterns, and in the other, a sword with intricate designs. The city lights twinkle below, and the last rays of the sun cast a golden glow on the scene, highlighting her strong, confident posture.

圖片2

prompt:Imagine a superhero inspired by ancient Greek warriors, wearing a costume with a red chest plate with a golden eagle emblem, blue starred lower armor, and a golden tiara. She’s standing heroically on top of a city skyscraper at dusk, with a flowing black cape billowing in the wind. In one hand, she holds a shield with ancient Greek patterns, and in the other, a sword with intricate designs. The city lights twinkle below, and the last rays of the sun cast a golden glow on the scene, highlighting her strong, confident posture.

這時我們如何取得兩張圖片的 Gen ID 呢?很簡單,接著輸入:

Please give me the gen_ids.

輸出

Certainly! Here are the generation IDs for the images:

For the first image: dmNJF0sI7lwsuJ3A
For the second image: TxGOH8iAUFdMdir1

我們就取得了兩張圖片的 Gen ID 。

在這兩張圖片的風格中,第一張是我們比較喜歡的風格,於是我們紀錄這個 ID,接下來利用它繼續生成相同風格的蝙蝠俠。輸入:

Create an image of batman in the style of image dmNJF0sI7lwsuJ3A.

輸出

Here is the image inspired by the style you referenced, featuring the bat-themed superhero.

圖片

prompt: Visualize a superhero inspired by bats, standing tall on a gothic architecture gargoyle atop a skyscraper at dusk. He’s cloaked in a dark, flowing cape that merges with the shadowy skyline. The cape’s interior flashes with a subtle midnight blue lining. His muscular silhouette is accentuated by the armored suit, detailed with a bat emblem on the chest. His eyes are concealed behind a black cowl with pointed ears, and his fists are clenched, ready for action. The city below him is alight with the soft glow of sunset giving way to night, as he watches over with a guardian’s gaze.

看起來是不是風格很像呢?而且圖片的比例一樣維持16:9。

接下來我們想再做一張圖片,那當然是蝙蝠俠的宿敵小丑囉!輸入:

Create an image of the Joker in the Batman movie of image dmNJF0sI7lwsuJ3A.

輸出

Here is the image inspired by the style you referenced, featuring the theatrical villain.

圖片

prompt: Conjure an image of a villainous character with a flair for the theatrical, dressed in a vivid purple suit with a green vest and tie, exuding a chaotic charisma. His hair is a wild, vibrant green, and his face is painted with a white base, darkened eyes, and an exaggerated red smile that speaks of mischief and mayhem. He stands in the dimly lit, grimy alley of a city, with graffiti on the walls and a neon sign flickering in the background. The atmosphere is one of danger and unpredictability, capturing the essence of a character who is both a mastermind and an agent of chaos.

各位讀者有注意到嗎? DALL-E 3 換了一個場景,但是整體的視覺風格仍然維持不變,這有助於我們未來可以創造一組相同風格的組圖,而不是單調的背景。但是如果想要類似的背景圖呢?那也很容易,輸入:

Create an image of the Joker in the Batman movie of image dmNJF0sI7lwsuJ3A. Same background.

輸出

The image featuring the villainous character with the same background as the previously referenced superhero image is now displayed above.

圖片

prompt: Envision a character reminiscent of a notorious villain from a superhero film, with a stark white painted face, deep-set eyes with smudged dark makeup, and a wide, sardonic red smile. His hair is untamed and dyed a bright green, contrasting sharply against the white of his face. He’s clad in a distinctive purple suit, complete with a green shirt and a dark tie, capturing the essence of anarchy and madness. This figure is standing with a confident, yet menacing posture on top of a city skyscraper at dusk, similar to the background of the image with gen_id dmNJF0sI7lwsuJ3A, with the city’s lights beginning to illuminate the approaching night, echoing the chaotic energy of the character.

這時小丑的背景就跟第一張的神力女超人非常的類似。

相信各位讀者透過我們上面的實際操作多加練習,就可以善用這個技巧。無論你是文字工作者寫作的配圖、影像創作者在影片中插入輔助圖片、廣告投放設計風格近似的廣告圖,這個技巧都可以有效節省大量製圖或外包的時間。

最後,以上的方法僅適用於同一個對話內容,所以運用時請務必在同一個對話中創作喔!

進一步閱讀

  1. 直接複製!使用 DALL-E 3 新增的67種圖片風格,解放 AI 創作潛能 (附實例)
  2. DALL-E 3 新功能與實踐指南
  3. GPT-4V 進階:透過 GPT-4V 讓 DALL-E 3 以文生圖創造風格近似的作品
  4. 如何利用 Negative Prompt 優化 DALL-E 3 圖像生成
  5. 如何在 DALL-E 3 中將數種不同物體融合為一
  6. 如何在 DALL-E 3 的圖片上增加文字
  7. DALL-E 3 中的光線參數 (上)
  8. 六種適用於東方特色的 DALL-E 3 創作風格
  9. DALL-E 3 中的光線參數 (下)
  10. DALL-E 3 的角度參數及其影響

Elon Musk 發布 AI 聊天機器人 Grok ,並宣稱性能優於 ChatGPT

Elon Musk,被譽為時代的異想天開者,最近通過他的人工智慧新創公司 xAI 發布了一款名為 Grok 的 AI 聊天機器人。這款新機器人的出現,不僅再次展示了 Musk 對 AI 領域無窮的探索精神,更是對已有技術提出了新的挑戰。根據 Musk 和 xAI 的聲明, Grok 的目的是為了創建能夠輔助人類、推動研究和創新的 AI 工具。在一系列學術測試中, Grok 的表現甚至超越了 OpenAI 早期的 ChatGPT 版本,顯示出在某些方面具有明顯的技術優勢。

與 ChatGPT 相比, Grok 在數學和編碼的學術測試中展現出較高的性能。根據 xAI 分享的數據, Grok 的性能在所有測試中都優於 ChatGPT-3.5 。然而,與 OpenAI 最先進的版本 GPT-4 相比, Grok 在測試中並未表現出優勢。但這並不意味著 Grok 的技術不值得期待,相反, Musk 和 xAI 表示, Grok 只是被訓練有素的模型所超越,這些模型具有大量的訓練數據和計算資源,例如 GPT-4 。這也顯示了 xAI 在訓練大型語言模型(LLM)方面取得了顯著的進步,並以非常高的效率進行訓練​。

不同於其他 AI 聊天機器人, Grok 具有通過X平台實時了解世界的獨特和基本優勢。它不僅能夠回答一些敏感問題,而且在回答時融入了一些幽默元素,顯示出一種叛逆的個性。 Musk 和 xAI 警告說,如果你討厭幽默,那麼最好不要使用 Grok 。此外, Grok 的引擎 Grok-1 在設計時就表現出了一些獨特的特色,使其在一些學術測試中優於 ChatGPT-3.5 。

xAI 公司成立於今年三月,距今僅八個月的時間,就成功推出了 Grok 。這不僅顯示了公司的技術實力和迅速的發展速度,更彰顯了其對人工智慧領域的高度重視和投入。 Grok 目前是一個“非常早期的測試產品”,預計將在未來快速改進。而且,為了確保 Grok 不被惡意使用, xAI 團隊表示會隨著時間的推移,逐步實施更多的安全措施。

在這個 AI 聊天機器人競爭激烈的市場中, Grok 的出現無疑為行業增色不少。它不僅提供了一個全新的、具有實時世界知識的 AI 聊天機器人選擇,而且推動了行業的技術競爭。 Musk 和 xAI 的這一新動作,不僅為社會帶來了可觀的科學和經濟價值,也為 AI 聊天機器人的未來發展指明了方向。

最後值得一提的是 Grok 將在 X Premium Plus 上以每月16美元的價格提供,但目前僅限於美國的一部分用戶(讀者也可以點此加入候補名單優先體驗)。隨著 Grok 的不斷完善和市場的開放,它將在未來取得更多突破,並為人類的研究和創新貢獻力量。在 AI 的世界裡,每一次創新的嘗試,都是向未知領域的一次勇敢探索。而 Grok 的出現,無疑為這個領域增添了新的可能。

Google發布2023年11月核心更新

Google 於2023年11月2日釋出了最新的核心更新,該更新目前正在進行中,並可能需要長達兩周的時間才能完全推出。此次更新是繼2023年3月、8月和10月之後的第四次核心算法更新。值得注意的是,每次核心更新都對 Google 的搜尋排名算法帶來了一些重大的變化,對網站的排名和流量有著直接的影響。

回溯至今年初, Google 在3月15日至28日間推出了2023年的第一次核心更新,隨後在8月22日至9月7日和10月5日至19日分別推出了第二次和第三次核心更新。每次更新都涵蓋了不同的核心系統和排名機制,以改善搜尋結果的準確性和相關性​。

在11月的核心更新中, Google 表示,此次更新涉及到了不同的核心系統,目的是為了改善其搜尋排名過程中的某些核心機制。 Google 在官方部落格中提供了一系列與核心更新相關的問答,解釋了此次更新的目的,並指出排名更新和排名系統之間的區別。簡而言之,排名系統是 Google 用來生成搜尋結果的機制,而更新則是對這些系統進行改善的過程。儘管 Google 的自動化系統已經非常精密,但仍存在一些不完美之處,核心更新的目的就是為了修正這些不足,提供更好的搜尋結果​​。

對於可能受到此次核心更新影響的網站, Google 建議,如果網站的排名受到負面影響,則沒有特定的操作可以恢復。然而, Google 提供了一個問題清單,幫助網站所有者分析可能的問題所在。此外, Google 表示,網站可能會在下一次核心更新之前看到一些恢復,但最大的變化會在下一次核心更新時出現​。

接下來, Google 預計在下周推出一個關於評論系統的更新,並表示此次更新將是定期通知評論系統改善的最後一次,因為評論系統的改善將成為一個持續且定期的過程。這意味著,未來的評論系統改善將不再像以往那樣被單獨通知,而是將與核心更新一起推出​。

每當 Google 更新其搜尋排名算法時,網站的表現可能會有所不同。了解 Google 何時進行這些更新,可以幫助網站所有者和 SEO 專家判斷網站排名和流量的變化是由網站本身的更動,還是 Google 的算法更動所引起。儘管如此,在這個持續變化的數位世界中,保持對 Google 核心更新的關注,並及時調整網站的 SEO 策略,將對網站的長期成功至關重要。

在接下來的幾周中,建議網站所有者密切關注其網站的分析和排名,以便及時發現並解決可能存在的問題。與此同時,也可以參考 Google 提供的資源和指南,以更好地理解核心更新的目的和影響,並制定相應的應對策略。