also, the video we made for dalle 3 is SO CUTE: pic.twitter.com/k1FOFTOsU5
— Sam Altman (@sama) September 20, 2023
OpenAI 執行長 Sam Altman 在 Twitter 上發布 DALL-E 3 宣傳影片
OpenAI近日發布了其生成式視覺藝術平台 DALL-E 的第三版。這一版本不僅在技術層面上有所突破,還在用戶體驗和安全性方面進行了全面優化。其中,與 ChatGPT 的整合和對生成文本與排版的支持是本次更新的兩大亮點。
與 ChatGPT 的深度整合
在先前的版本中,用戶需要自行創建文本提示以引導 DALL-E 生成圖像。然而,DALL-E 3 的推出改變了這一局面。這一版本與 OpenAI 的另一款人工智慧產品 ChatGPT 進行了深度整合。用戶現在可以直接使用 ChatGPT 來生成文本提示,從而更為方便地引導 DALL-E 3 進行圖像生成。這一整合不僅提高了用戶體驗,還為不擅長創建文本提示的用戶提供了便利。用戶只需向 ChatGPT 提出需求,ChatGPT 便會自動生成一個詳細的文本提示,供 DALL-E 3 遵循。這一過程大大簡化了用戶操作,同時也提高了生成圖像的準確性和多樣性。
文本和排版的創新支持
DALL-E 3 在生成文本和排版方面展示了前所未有的能力。與先前版本和市場上其他同類產品相比,DALL-E 3 能夠更為精確地在圖像中嵌入可讀的文本。這一特點使其成為了一個具有高度競爭力的產品,甚至挑戰了上個月剛剛推出的由前 Google 員工創立的 Ideogram 公司。這家公司也提供了使用其專有人工智慧模型生成帶有文本和排版的圖像的服務。DALL-E 3 的這一特性不僅提高了其在商業應用,特別是在廣告和內部文檔生成方面的潛力,也為藝術創作提供了更多可能性。
空間關係的精確理解
除了上述特點外,DALL-E 3 還在理解空間關係方面取得了重要突破。根據 OpenAI 的說明,新版本能夠更準確地理解用戶在提示文本中描述的空間關係,並根據這些描述在生成的圖像中準確地放置人物和對象。這意味著,即使是非常描述性的提示也能被更精確地呈現,從而大大提高了生成圖像的質量和多樣性。
安全性的全面提升
在 DALL-E 3 的開發過程中,OpenAI 特別重視了產品的安全性。為了防止生成不當或潛在仇恨的圖像,OpenAI 進行了一系列的安全性測試和優化。他們與外部的紅隊合作,並依賴輸入分類器這一方式來教育語言模型忽略某些會引發不當或暴力提示的詞語。這一系列措施不僅提高了 DALL-E 3 的安全性,也為其未來的應用鋪平了道路。
未來發展與市場前景
根據 OpenAI 的計劃,DALL-E 3 將首先在 10 月份對 ChatGPT Plus 和 ChatGPT Enterprise 用戶開放,之後會逐步對其他用戶群體開放。雖然 OpenAI 尚未確定何時會推出免費的公共版本,但這一新版本無疑將吸引更多的企業和個人用戶,特別是那些專注於藝術創作和商業應用的用戶。
結語
DALL-E 3 的推出無疑是一次重大突破,它不僅在技術層面上達到了新的高度,還在用戶體驗和安全性方面進行了全面優化。這一新版本有望進一步鞏固 OpenAI 在生成式視覺藝術領域的領先地位,並為未來的商業應用和藝術創作提供更多可能性。