DALL-E 3 新功能與實踐指南

隨著人工智能技術的飛速發展, DALL-E 3 在 AI 圖像生成領域的最新進展引起了廣泛關注。本文將詳細介紹 DALL-E 3 的新功能、實踐示例以及測試 prompt ,旨在為讀者提供一個全面的了解和實用的指南。

DALL-E 3的新功能概覽

提示重寫

利用 GPT-4 優化提示的功能,使得用戶可以通過更詳細的描述來生成更精確的圖像。這項技術的引入,大大提升了圖像生成的準確性和用戶體驗。

標準與高清質量

DALL-E 3 引入了圖像質量選擇功能,用戶可根據需求選擇“標準”或“高清”質量的生成圖像。“高清”模式能夠提供更細膩的細節和更高的圖像質量,適用於對圖像細節有高要求的場景。

新的圖像尺寸

新增的圖像尺寸選項包括1024×1024、1792×1024和1024×1792,這提供了更多靈活性來適應不同的應用場景,從而使生成的圖像更加多樣化和實用。

新風格介紹

“自然”和“鮮明”兩種新風格的引入,為用戶提供了更多的創作選擇。“自然”風格提供了更加細膩和真實的圖像效果,“鮮明”風格則是偏向於產生更加生動和電影化的圖像。

實踐示例與測試 prompt

提示重寫實踐

功能解釋

DALL-E 3 的提示重寫功能使用 GPT-4 來優化用戶的提示,目的是為了生成更符合用戶期望的圖像。這意味著即使用戶的原始提示不夠明確或詳細,系統也能理解其背後的意圖,並生成更精準的圖像。

完整的測試 prompt

原始 Prompt:”一位穿著中世紀盔甲的騎士在森林中尋找龍。”

提示重寫後的 Prompt:”描繪一位身著鮮明細節的中世紀盔甲的騎士,在光線透過樹冠的森林中謹慎地尋找龍的畫面。騎士手持長劍,表情堅定,背景中隱約可以看到龍的蹤影,營造出一種期待和探險的氛圍。”

標準與高清質量比較

功能解釋

DALL-E 3 允許用戶選擇生成圖像的質量級別,包括”標準”和”高清”。這一功能讓用戶能夠根據需要獲取更高質量的圖像,尤其是在需要細節豐富的場景中。

完整的測試 prompt

Prompt:”在一個清晨,一隻獨角獸在霧中的森林裡漫步。”

標準質量生成:該設置下的圖像將展現基本的細節,足以描繪獨角獸和森林的場景,但可能缺乏細膩的紋理和光影效果。

高清質量生成:高清設置將提供更豐富的細節,如獨角獸的皮毛紋理、霧中光影的交錯以及樹葉上露珠的清晰可見,為觀者呈現一幅更為逼真和動人的圖像。(在 prompt 中加入”HD畫質”或”HD Quality”等文字)

圖像尺寸的應用

Prompt 示例:“寬闊的田野上空,一群鳥兒在夕陽的映照下飛翔。”

實踐建議:嘗試不同的圖像尺寸來觀察如何影響構圖和視覺效果。

1024×1024

1792×1024

1024×1792

風格示例

功能解釋

DALL-E 3引入了”自然”和”鮮明”兩種新的圖像生成風格。”自然”風格提供更加細膩和真實的圖像效果,而”鮮明”風格則偏向於產生更加生動和電影化的圖像,讓用戶可以根據需要選擇合適的風格。

完整的測試 prompt

自然風格 Prompt:”一座安靜的湖邊小屋在秋天的傍晚,周圍是金黃色的樹葉。”

鮮明風格 Prompt:”一座位於熱帶雨林中的懸崖上的玻璃屋,在夕陽光的環抱下,渲染出一片光影交錯、色彩斑斕的奇幻景象。”

安全與道德考量

使用DALL-E 3時,用戶必須嚴格遵守安全和道德指南,包括不生成涉及暴力、成人內容或歧視性圖像的規定,以保護社區免受有害內容的影響。此外,用戶還需遵循版權法,避免生成侵犯他人智慧財產權的圖像。

結語

透過上述詳細介紹和測試 prompt,我們可以更深入地理解 DALL-E 3 的新功能如何工作,以及如何利用這些功能來創造出更符合我們期望的圖像。這些功能的加入,不僅豐富了用戶在圖像生成時的選擇,也進一步提升了生成圖像的質量和多樣性,使 DALL-E 3 成為一個更加強大和靈活的工具,滿足了不同用戶在不同場景下的需求。

進一步閱讀
  1. 直接複製!使用 DALL-E 3 新增的67種圖片風格,解放 AI 創作潛能 (附實例)
  2. DALL-E 3 的角度參數及其影響
  3. DALL-E 3 中的光線參數 (下)
  4. DALL-E 3 中的光線參數 (上)
  5. 如何在 DALL-E 3 的圖片上增加文字
  6. 如何在 DALL-E 3 中將數種不同物體融合為一
  7. 如何用 Gen ID 讓 DALL-E 3 輸出相同風格的圖片
  8. GPT-4V 進階:透過 GPT-4V 讓 DALL-E 3 以文生圖創造風格近似的作品
  9. 六種適用於東方特色的 DALL-E 3 創作風格
  10. 如何利用 Negative Prompt 優化 DALL-E 3 圖像生成
  11. 如何透過修改 Seed 讓 DALL-E 3 逐步生成完美圖片

2024年2月中文大模型排行

自從2018年 OpenAI 推出 GPT-1 以來,大模型技術逐漸嶄露頭角。隨著參數量級的不斷提高,大模型展現出驚人的理解和生成能力,正逐漸改變著人類的生活。尤其是在2022年11月 ChatGPT 問世後,大模型更是引起了全球的關注。隨著 AI 技術的快速發展,中文大模型已成為推動語言理解和生成能力飛躍的關鍵力量。從最初的探索階段到現在的技術成熟,中文大模型不僅促進了自然語言處理技術的進步,也為各行各業的數字化轉型提供了強大的支持。

2024年2月中文大模型排行榜

根據 SuperCLUE 評測結果,2024年2月中文大模型排行榜如下:

SuperCLUE 十大基礎能力排行榜 (2024年2月) 資料來源: SuperCLUE

SuperCLUE 大模型基準得分排行榜 (2024年2月) 資料來源: SuperCLUE

與12月份相比,本次榜單變化較大,主要原因在於各大廠商紛紛推出升級版大模型。例如,百度推出文心一言4.0,阿里雲推出通義千問2.1,科大訊飛推出星火V3.5,字節跳動推出雲雀大模型等。這些新模型的參數量和性能都有明顯提升,在榜單上取得了更好的成績。

中文大模型發展動態

2023-2024年,中文大模型發展迅速,主要進展如下:

國外大模型方面,2023年 OpenAI 推出 GPT4 , Meta 推出 Llama2 , Google 推出 Gemini , Anthropic 推出 Claude 等。2024年初, OpenAI 推出 GPT4-Turbo ,進一步提升了大模型性能。

中國大模型方面,2023年百度推出文心一言,阿里雲推出通義千問,360推出360智腦,科大訊飛推出星火,字節跳動推出雲雀等。2024年初,這些廠商又紛紛推出升級版大模型,如文心一言4.0、通義千問2.1、星火V3.5、雲雀大模型等,參數量和性能持續提升。

總體來看,中文大模型技術正處於快速發展期,各大廠商都在積極佈局,不斷推出更新、更大、更強的版本,以期在大模型領域取得領先地位。

中文大模型評測基準介紹

SuperCLUE 評測基準是由 CLUE 團隊發起,致力於科學、客觀、中立的語言模型評測基準。 SuperCLUE 評測基準由多輪開放式 SuperCLUE-OPEN 和三大能力客觀題 SuperCLUE-OPT 兩部分組成。 SuperCLUE-OPEN 包含1504道多輪簡答題, SuperCLUE-OPT 包含3068道客觀選擇題。通過多維度、多視角的綜合性評測方案,真實類比大模型的應用場景,全面考察模型生成能力。

四大維度分析

  1. 語言與知識: GPT 系列依然領先,中國頭部大模型表現優異。例如通義千問2.1得分89.67分,僅次於 GPT4-Turbo-0125 。
  2. 專業與技能: GPT-4 Turbo 領先,文心一言4.0緊隨其後。中國大模型與國外最好模型仍有一定距離,但差距正在縮小。
  3. 工具使用: GPT4-Turbo-0125 領先,文心一言4.0表現不俗。中國大模型表現優異,與積極落地應用密不可分。
  4. 傳統安全: GPT4-Turbo-0125 領先, Claude2 表現穩定。中國大模型表現不俗,是當下比較重視的一個方向。

領先模型案例

  1. 通義千問2.1:知識百科、生成與創作基礎能力排名中國第一,上下文對話、角色扮演、代碼、語義理解、傳統安全、工具使用能力排名中國前三。適用于金融、醫療、汽車等專業場景。
  2. Baichuan3:計算能力排名中國第一,邏輯推理能力排名中國前三。適用於數學推理、資料分析、資訊處理等場景。
  3. GLM-4:上下文對話、代碼、語義理解能力排名中國第一,邏輯推理、生成與創作、工具使用、計算能力排名中國前三。適用於客服對話、代碼助手、文本理解等場景。
  4. 訊飛星火V3.5:在傳統安全能力上排名中國前三,在邏輯推理、語義理解、生成與創作、計算能力上排名中國前五。適用於數學教育、邏輯分析、文本理解、創作場景。

中文大模型發展趨勢展望

隨著參數規模的不斷擴大,大模型的技術性能持續提升,應用領域也在不斷拓展。展望未來,大模型的發展趨勢將體現在以下幾個方面:

  1. 模型規模擴大:模型參數量將持續增長,千億級和萬億級大模型將成為主流,以支撐更複雜的任務和場景。
  2. 多模態能力增強:大模型將融合更多模態的資料,實現跨模態理解和生成,提升交互體驗。
  3. 領域細分化:面向不同領域的大模型將更加精細化,以更好地滿足垂直場景的需求。
  4. 低功耗和即時性:通過模型壓縮、量化等技術,大模型將更加羽量級,即時性能也將得到提升,以便更好地應用於移動端和邊緣計算場景。
  5. 安全性和可解釋性:模型的安全性和可解釋性將成為重點研究方向,以確保模型的可靠性和使用者信任度。

結語

2024年2月中文大模型評測報告充分展現了大模型技術的飛速發展。中國大模型已經逐步縮小與國際頂級大模型的差距。隨著大模型技術的持續進步,其在各行各業的應用將更加廣泛。

Google Ads 宣布 Gemini 模型將擴展至 Performance Max,為廣告客戶提供更強大的文字生成能力

Google Ads 於 2 月 23 日宣布,將其最新的大型語言模型 Gemini 模型擴展至 Performance Max。Gemini 模型是 Google AI 的最新突破,能夠生成更具創意和相關性的文字內容。

Gemini 與 Performance Max 廣告結合
影片來源:Google Ads & Commerce Blog

Performance Max 是 Google Ads 的一種自動化廣告解決方案,可以幫助廣告客戶在所有 Google 渠道上展示廣告。Performance Max 使用機器學習來優化廣告效果,並根據廣告客戶的目標和預算自動生成和投放廣告。

YouTube thumbnailYouTube icon
影片來源:Google Ads

Gemini 模型的加入將為 Performance Max 提供更強大的文字生成能力。Gemini 模型能夠理解廣告客戶的目標和受眾,並生成更具創意和相關性的廣告文案。這將幫助廣告客戶提高廣告效果,吸引更多潛在客戶。

Gemini 模型的優勢:

  • 更具創意和相關性的廣告文案
  • 提高廣告效果
  • 吸引更多潛在客戶

Gemini 模型的應用:

Gemini 模型將用於 Performance Max 的以下功能:

  • 長標題生成:Gemini 模型將能夠生成更長、更具描述性的廣告標題,以吸引更多潛在客戶的注意力。
  • 網站連結生成:Gemini 模型將能夠生成更具相關性的網站連結,以引導潛在客戶訪問廣告客戶的網站。

Gemini 模型的發布時間:

Gemini 模型將於 2024 年下半年開始在 Performance Max 中推出。

廣告客戶如何使用 Gemini 模型:

廣告客戶可以通過以下方式使用 Gemini 模型:

  • 在 Performance Max 中創建新的廣告活動
  • 將現有的 Performance Max 廣告活動升級到 Gemini 模型

Google Ads 表示,Gemini 模型的加入將為 Performance Max 提供更強大的文字生成能力,幫助廣告客戶提高廣告效果。

(本文由 Gemini Advanced 所創作)

進一步閱讀

Gemini Prompt 入門指南

Google Gemini 人工智能助力 Gmail 和 Workspace,打造更智能、更高效的工作體驗

Google 於2024年2月21日宣布推出 Gemini 人工智能 (AI) 平台新功能,旨在為 GmailWorkspace 等 Google 產品和服務提供強大的 AI 功能。Gemini AI 是 Google 迄今為止最强大的 AI 模型,它可以幫助用戶更輕鬆、更高效地完成工作。

Gemini AI 助力 Gmail 更智能

Gemini AI 可以幫助 Gmail 用戶更輕鬆地收發電子郵件。它可以自動完成句子、糾正拼寫和文法錯誤,並提供相關的搜索建議。例如,當用戶在 Gmail 中輸入電子郵件時,Gemini AI 可以自動完成收件人的姓名、地址和主題。它還可以糾正拼寫和文法錯誤,並提供相關的搜索建議。此外,Gemini AI 還可以識別和過濾垃圾郵件和釣魚郵件,幫助用戶保護個人信息和安全。

Gemini AI 助力 Workspace 更高效

Gemini AI 可以幫助 Workspace 用戶更有效地協作和完成工作。它可以自動生成會議摘要、翻譯文件和電子郵件,並提供智能的數據分析。例如,當用戶在 Workspace 中舉行會議時,Gemini AI 可以自動生成會議摘要,幫助用戶快速了解會議內容。此外,Gemini AI 還可以翻譯文件和電子郵件,幫助用戶跨語言交流。它還可以提供智能的數據分析,幫助用戶從數據中獲取洞察力。

Gemini AI 標誌著 Google AI 的重要里程碑

Gemini AI 的推出標誌著 Google AI 的重要里程碑。它將為 Google 產品和服務提供強大的 AI 功能,並幫助用戶更輕鬆、更高效地完成工作。Gemini AI 的推出將對工作和生活產生重大影響,它將為人們帶來更加智能和高效的未來。

Google 一直致力於人工智能技術的研發。 在過去的幾年裡,Google 在人工智能領域取得了重大突破。例如,Google 於 2020 年推出了 BERT 模型,該模型在自然語言處理領域取得了突破性進展。2022 年,Google 又推出了 LaMDA 模型,該模型在對話生成領域取得了突破性進展。

Gemini AI 是 Google 在人工智能領域的最新突破。 它融合了 Google 在自然語言處理、機器學習、計算機視覺等多個領域的技術,可以理解幾乎任何輸入、組合不同類型的信息,還能產生幾乎任何輸出。Gemini AI 的推出將為 Google 產品和服務帶來革命性的變化。

在未來,Google 將繼續致力於人工智能技術的研發,為用戶提供更加智能、更高效的工作和生活體驗。

具體事例

Gmail

  • 一位用戶正在撰寫一封電子郵件給客戶。Gemini AI 可以自動完成客戶的姓名、地址和主題。它還可以糾正電子郵件中的拼寫和文法錯誤,並提供相關的搜索建議。
  • 一位用戶收到了一封垃圾郵件。Gemini AI 可以識別並過濾這封垃圾郵件,防止用戶受到欺詐。

Workspace

  • 一位用戶正在準備一個會議。Gemini AI 可以自動生成會議摘要,幫助用戶快速了解會議內容。
  • 一位用戶需要翻譯一份文件。Gemini AI 可以快速準確地將文件翻譯成不同的語言。
  • 一位用戶正在分析數據。Gemini AI 可以幫助用戶從數據中獲取洞察力,做出更好的決策。

(本文由 Gemini Advanced 所創作)

Gartner:未來兩年內生成式人工智能將對搜尋引擎構成嚴重威脅

隨著資訊技術的發展,搜尋引擎已成為人們獲取資訊的主要途徑。但近年來,基於大規模神經網絡的生成式人工智能( Generative AI )技術正在快速發展,並對搜尋引擎產生了潛在的顛覆性影響。

根據分析公司 Gartner 的預測,僅在未來兩年內,生成式人工智能就將對搜尋引擎構成嚴重威脅。主要體現在:一方面生成式人工智能解決方案正在取代傳統搜尋引擎,成為新的答案引擎;另一方面,聊天機器人和其他虛擬助手也在蠶食搜尋引擎的搜尋量。具體而言:

生成式AI:新的答案引擎

生成式人工智能系統(如 ChatGPT 等)能夠根據提示自主生成文本、圖像、視頻等內容。不同於搜尋引擎只提供相關連結,這些系統可以直接為用戶生成所需答案。

這種直接獲取結果的便利性,正迅速改變人們的資訊搜尋行為。用戶開始習慣直接向 AI 助手提問,而不是在搜尋引擎中輸入關鍵詞後再點擊結果連結。

據統計, ChatGPT 上線後短短3個月就吸引了超過1億用戶。這表明生成式人工智能搜尋的規模化應用僅是時間問題。一旦用戶習慣了這種更便捷的搜尋模式,傳統搜尋引擎的地位將受到衝擊。

聊天機器人等蠶食搜尋量

除了生成式 AI 系統外,基於自然語言理解技術的智能聊天機器人、虛擬助手等也在影響搜尋引擎的使用。根據 Gartner 的預測,到2026年,這些新興應用將蠶食搜尋引擎四分之一的搜尋量。

智能聊天機器人能夠理解用戶需求並快速作出回應,它們也在成為新的“答案引擎”。例如微信、騰訊 QQ 等即時通信工具中的智能助手,就已經能夠回答一些生活、工作中的常見問題。

可以預見,隨著這些智能應用的智能化、個性化能力不斷提升,它們未來將進一步滿足更多複雜的搜尋需求,從而替代搜尋引擎的部分功能。

搜尋引擎的應對之策

面對生成式 AI 的衝擊,傳統搜尋引擎也在採取應對措施:

首先是演算法優化。搜尋引擎將提高演算法的準確性,使搜尋結果更加精準,以此彌補 AI 生成內容的劣勢。此外,通過添加浮水印等技術手段,也將變得更加重要,以鑒別真實與 AI 生成內容。

其次是開發專用搜尋引擎。以 Google 為例,其已推出專門搜尋 ChatGPT 對話的搜尋引擎“ Sparrow ”。這表明未來可能會出現更多針對 AI 生成內容的垂直搜尋引擎。

再者是建立生態圈。即使直接搜尋量下降,但作為流量入口, Google 等搜尋巨頭仍將佔據主導地位。因此它們也在加快與生成式 AI 廠商的合作。

新的商業模式

在這個過程中,生成式人工智能也為創業公司帶來機會。這些公司有可能成為搜尋領域的競爭對手。

可能的商業模式包括:基於生成式 AI 技術的垂直搜尋引擎、為不同行業定制的 AI 搜尋應用,以及使用者生成內容( UGC )平台等。這些模式都有望在細分領域取得一定的市場份額。

當然,生成式 AI 搜尋仍面臨品質控制與安全性等挑戰,目前尚未贏得足夠用戶信任。但隨著技術的進一步成熟與商業模式的不斷優化,其市場空間將逐步擴大。

行業影響

可以預見,生成式人工智能對整個搜尋市場及相關行業都將產生深遠的影響。

首當其衝的就是 SEO 市場。由於直接搜尋量的下降,全球 SEO 市場規模也面臨被壓縮的壓力。 SEO 從業者需要轉型升級,開拓基於 AI 搜尋的新業務。

內容生產與網路行銷領域也將受到衝擊。傳統依賴搜尋引擎流量進行商業推廣的模式,將難以為繼。企業需要調整市場策略,適應 AI 時代的新格局。

儘管生成式人工智能帶來顛覆性變革,但也給相關企業和創業公司帶來新的機遇。通過技術創新與商業模式優化,搜尋市場仍大有可為,等待著新老企業共同開拓。