Leggie - AI and SEO trends, exploring the digital world

Midjourney 中的 Ombre 色彩技巧

文章作者作者：Leggie
發表日期 2024 年 7 月 17 日
分類分類於 AI, Midjourney

Ombre 是一種顏色漸變技巧，指的是兩種或多種顏色之間的平滑過渡。這個詞源自法語，意為「陰影」或「漸變」。

與普通色彩提示的對比

普通提示：如果只是提到「藍色和金色翅膀」， Midjourney 可能會生成藍色和金色交織或層疊的效果。
使用 Ombre ：當提示中包含「ombre colored wings blue to gold」時，會生成從藍色漸變到金色的流暢過渡效果。

實際測試

Prompt: Realistic photography, a 20-year-old fighting angel, female, blue and gold wings, ancient Greek period, HDR. (寫實攝影，20歲的戰鬥天使，女性，藍色和金色翅膀，古希臘時期，HDR。)

Prompt: Realistic photography, a 20-year-old fighting angel, female, ombre colored wings blue to gold, ancient Greek period, HDR.(寫實攝影，20 歲的戰鬥天使，女性，漸變色翅膀藍色到金色，古希臘時期，HDR。)

進一步應用

服裝

藍金色禮服：普通提示可能會產生藍色和金色分別出現在禮服的不同部位，而使用 Ombre 技巧則會創造出一種從藍色優雅過渡到金色的效果。

Prompt: Realistic photography, a 20-year-old woman at a banquet, in a blue and gold dress, with the background of the interior of a Baroque castle.(寫實攝影，一位20歲的女性在宴會上，穿著藍色和金色的連身裙，背景是巴洛克城堡的內部。)

Prompt: Realistic photography, a 20-year-old woman at a banquet, ombre colored dress blue to gold, with the background of the interior of a Baroque castle. (寫實攝影，一位 20 歲的女子在宴會上，穿著藍色到金色的漸層色連身裙，背景是巴洛克城堡的內部。)

非對稱構圖

使用負面提示「–no symmetry」可以創造更有趣的構圖。這種方法可以打破常規的對稱構圖，產生更動態的圖像效果。

Prompt: Realistic photography, a 20-year-old woman at a banquet, ombre colored dress blue to gold, with the background of the interior of a Baroque castle. –no symmetry(寫實攝影，一位 20 歲的女子在宴會上，穿著藍色到金色的漸層色連身裙，背景是巴洛克城堡的內部。)

機器人

背景與身體顏色融合：普通提示可能會產生紅色和藍色分別出現在機器人與畫面背景的不同部份，而使用 Ombre 技巧則會創造出一種從紅色過渡到藍色的效果。

Prompt: A robot in a future world, red and blue.(一個未來世界的機器人，紅色與藍色。)

Prompt: A robot in a future world, omber colored red to blue.(一個未來世界的機器人，漸變色紅色到藍色。)

Prompt: A robot in a future world, omber colored red to blue. –no symmetry(一個未來世界的機器人，漸變色紅色到藍色。)

結語

Ombre 技巧不僅限於服裝或生物，還可以應用於各種物體、背景，同時為創作者提供了一種製作更富層次感和視覺吸引力的圖像的方法，特別適合需要柔和、漸進色彩變化的場景。筆者建議使用這個技巧時，最好清楚指定漸變的起始和結束顏色，以及漸變的方向（如果有特定要求的話）。

總體而言， Ombre 色彩技巧為 Midjourney 用戶提供了一個強大的工具，使用戶能夠在提示中精確控制顏色過渡，從而創造出更加細膩、和諧的視覺效果。這個技巧的簡單性和效果的顯著性使其成為 Midjourney 創作過程中一個非常有價值的添加。

2024 年 6 月中文大模型排行：中國 AI 賽道升溫

文章作者作者：Leggie
發表日期 2024 年 7 月 16 日
分類分類於 AI, 中文大模型排行

隨著人工智能技術的快速發展，中國 AI 產業正迎來一輪新的競爭高潮。在這場激烈的角逐中，大語言模型（LLM）無疑是最炙手可熱的領域之一。近日，權威第三方評測機構 SuperCLUE 發布了 2024 年 6 月中文大模型評測報告，為我們呈現了一幅生動的中文 AI 大模型全景圖。

排行榜概覽：中國模型迅速追趕，開源黑馬崛起

根據 SuperCLUE 的最新評測結果，OpenAI 的 GPT-4o 以 81 分的絕對優勢繼續領跑全球大模型。然而，中國的頂級模型已將差距縮小至 5% 以內，展現出驚人的進步速度。

中文大模型基準榜單。資料來源：SuperCLUE

中國大模型市場已然形成了三大梯隊格局。頭部企業憑藉其強大的技術積累和資源優勢，穩居第一梯隊。其中，阿里雲的 Qwen2-72B、商湯科技的 SenseChat5.0 等均以 75+ 的高分位列前茅。緊隨其後的是一批實力強勁的 AI 創業公司，如智譜 AI 的 GLM-4、百川智能的 Baichuan4、月之暗面的 Moonshot (Kimi) 等，它們的表現同樣出色，得分均超過 70 分。

值得特別關注的是，開源模型在本次評測中表現搶眼。阿里雲開源的 Qwen2-72B 不僅力壓眾多國內外閉源模型，更與 Anthropic 的 Claude-3.5 Sonnet 並駕齊驅，與 GPT-4o 的差距僅有 4 分。

重點模型分析：各顯神通，各具特色

Qwen2-72B：阿里雲的開源黑馬

作為本次評測的最大驚喜，Qwen2-72B 展現出全面而均衡的能力。在代碼生成、創意寫作、角色扮演、長文本處理和精確指令遵循等多個關鍵領域，Qwen2-72B 均名列中國第一。此外，它在計算、邏輯推理和工具使用等方面也躋身中國前三。這款開源模型的出色表現，除了證明了中國在 AI 開源領域的實力，也為其他研究者和開發者提供了寶貴的學習資源。

SenseChat5.0：商湯科技的重磅之作

商湯科技的 SenseChat5.0 採用了先進的混合專家架構（MoE），擁有高達 6000 億的參數量，支持 200K 的超長上下文窗口。在本次評測中，SenseChat5.0 展現出均衡的理科和文科能力，尤其在語義理解、代碼生成、角色扮演和創意寫作等方面表現出色。這款模型的綜合實力有目共睹，穩居中國大模型第一梯隊。

GLM-4-0520：智譜 AI 的強勁競爭者

由智譜 AI 和清華大學聯合推出的 GLM-4-0520 是 GLM 系列的最新力作。該模型在創意生成、知識百科、工具使用和精確指令遵循等能力上表現突出，尤其擅長文科任務。GLM-4-0520 的優異表現不僅彰顯了其研發團隊的技術實力，也為 AI 在教育、文化創意等領域的應用提供了新的可能性。

關鍵能力比較：各有所長，仍有提升空間

在理科能力方面，中國頂級模型如 Qwen2-72B、AndesGPT 和山海大模型 4.0 的表現已經非常接近 GPT-4-Turbo-0409，均取得了 76 分的高分。然而，與 GPT-4o 的 81 分相比，仍有一定差距。這表明在高難度的數學推理和科學計算領域，中國模型還有進一步提升的空間。

中文大模型基準榜單-理科得分。資料來源：SuperCLUE

文科能力方面，中國模型的表現更為亮眼。多個中國模型如 Qwen2-72B、AndesGPT、通義千問 2.5 和 DeepSeek-V2 在語言理解、知識百科和創意寫作等任務上均取得了與 GPT-4o 持平的 76 分。這一結果充分展示了中國大模型在處理語言和文化相關任務時的優秀能力。

中文大模型基準榜單-文科得分。資料來源：SuperCLUE

在高難度任務中，尤其是精確指令遵循能力上，GPT-4o 和 Claude-3.5-Sonnet-200k 以 85 分和 84 分的高分領先群雄。國內表現最佳的 GLM-4-0520 和 Qwen2-72B 也取得了 79 分的好成績，但與國際頂尖水平仍有 6 分的差距。這個領域將是未來中國大模型重點突破的方向之一。

中文大模型基準榜單- Hard 得分。資料來源：SuperCLUE

行業應用潜力：AI 賦能垂直領域，創新應用指日可待

隨著大模型能力的不斷提升，其在各行各業的應用前景也愈發廣闊。根據 SuperCLUE 的評測結果，中國領先的大模型在金融、醫療、汽車等垂直領域已經展現出強大的應用潛力。

例如，在金融領域，Baichuan3、GLM-4 與 MoonShot-v1-128k 等模型的表現優於 GPT-4，顯示出中國大模型在處理複雜金融數據和風險分析方面的優勢。在醫療健康領域，多個中國模型在醫學知識理解和診斷輔助方面的能力也不容小覷，為 AI 輔助診療和個性化醫療的發展提供了有力支撐。

汽車行業是另一個 AI 應用的熱點。SuperCLUE 的評測顯示，多個中國大模型在車輛使用指南、故障診斷等實用場景中表現優異，為智能座艙和車載助手的發展奠定了基礎。

值得一提的是，AI 智能體（Agent）和多模態能力正成為大模型發展的新方向。中國一些領先模型在任務規劃、工具使用等 Agent 核心能力上已經接近或超過 GPT-3.5 的水平。同時，視頻生成、圖像理解等多模態任務也成為各大模型競相發力的重點領域。

機遇與挑戰並存，中國 AI 蓄勢待發

中國大模型的發展趨勢可謂機遇與挑戰並存。一方面在某些領域已經展現出與國際頂尖大模型抗衡的實力，特別是在中文處理和特定垂直領域的應用上甚至略勝一籌。另一方面，在基礎研究和極限任務處理能力上，與 GPT-4 等頂級模型相比仍有差距。

為縮小這一差距，中國 AI 企業和研究機構正在採取多管齊下的策略：

持續投入基礎研究，提升模型的底層架構和訓練方法。
擴大數據規模和提高數據質量，特別是在中文和多語言語料庫方面。
加強產學研合作，促進理論創新與實際應用的結合。
大力發展開源生態，吸引全球開發者參與，加速技術迭代。
聚焦垂直領域應用，在特定行業形成差異化競爭優勢。

結語

2024 年 6 月的中文大模型排行榜不僅展示了中國 AI 產業的蓬勃發展，也為未來的競爭指明了方向。隨著技術的不斷進步和應用場景的不斷拓展，中國大模型有望在全球 AI 舞台上扮演越來越重要的角色。在這場 AI 競賽中，中國企業正以驚人的速度追趕國際巨頭，同時也在開闢屬於自己的創新道路。

百度李彥宏：人工智能應用為王，智能體將引領未來

文章作者作者：Leggie
發表日期 2024 年 7 月 6 日
分類分類於 AI, 生成式AI

在2024年世界人工智能大會（WAIC）上，百度創始人兼 CEO 李彥宏發表了關於人工智能（AI）未來發展的深刻見解。他的演講涵蓋了 AI 的角色、大模型的應用價值、開源模型的挑戰、智能體的未來趨勢以及中國 AI 企業的韌性。這些觀點不僅展示了他對 AI 技術的深刻理解，也為未來 AI 的發展指明了方向。

人工智能的角色

李彥宏在演講中強調，AI 應該被視為一種輔助工具，而不是取代人類工作的威脅。他指出，AI 的主要目的是增強人類的能力，提高工作效率和質量，而不是取代人類。他認為，AI 技術的真正價值在於其能夠幫助人類解決複雜問題，從而實現更高的生產力和更好的生活質量。

大模型的應用價值

李彥宏特別強調了大模型的應用價值，指出如果沒有實際應用，大模型將毫無價值。他批評當前市場上存在過多的 AI 模型，但缺乏實際應用，這導致了資源的浪費。他呼籲業界應該更加注重 AI 的實際應用，從而真正發揮 AI 的潛力。

「我們看到很多大模型，但它們缺乏實際應用場景，這是資源的浪費。」李彥宏說，「我們需要將更多的精力放在如何將 AI 技術應用到實際生活和工作中，這樣才能真正發揮 AI 的價值。」

開源模型的挑戰

在談到開源模型時，李彥宏表達了他的批評意見。他認為，開源模型實際上是一種“智商稅”，並未帶來預期中的創新和價值。李彥宏指出，開源模型的普及並沒有促進 AI 技術的實質性進步，反而在某種程度上阻礙了真正有價值的 AI 技術的發展。

「開源模型看似美好，但實際上它們並未帶來我們所期望的創新和價值。」李彥宏說，「我們需要重新思考開源模型的意義，並尋找更有效的方法來推動 AI 技術的發展。」

智能體的未來

李彥宏預測，智能體（Intelligent Agents）將成為 AI 時代的未來趨勢。他認為，智能體能夠更好地理解和執行複雜任務，並且能夠在多種應用場景中發揮作用，這將是 AI 技術未來發展的重要方向。

「智能體將成為未來 AI 技術的核心。」李彥宏說，「它們能夠在多種應用場景中發揮作用，從而實現更高的效率和更好的效果。」

大模型的落地挑戰

李彥宏指出，大模型在實際應用中的落地面臨諸多挑戰，包括技術實現的難度、應用場景的適配以及資源的有效利用等問題。他呼籲業界應該更加注重解決這些實際問題，從而推動大模型技術的真正落地。

「我們需要解決大模型在實際應用中的落地挑戰，這樣才能真正發揮它們的價值。」李彥宏說，「這包括技術實現的難度、應用場景的適配以及資源的有效利用等問題。」

提示詞工程的未來

李彥宏預測，未來10年內有50%的工作將會是提示詞工程（Prompt Engineering）。他指出，提示詞工程的重要性在於能夠有效地與 AI 進行互動，提出問題比解決問題更重要。這意味著未來的勞工薪酬水準將取決於他們能否寫好提示詞，而不是程式碼。

「提示詞工程將成為未來工作的核心。」李彥宏說，「提出問題比解決問題更重要，我們需要培養更多能夠提出有效問題的人才。」

中國 AI 企業的韌性

在面對美國制裁的背景下，李彥宏強調了中國 AI 企業的韌性和創新能力。他指出，儘管面臨挑戰，中國的 AI 企業依然展示了強大的創新能力和市場適應能力。

「中國的 AI 企業在面對挑戰時展示了強大的韌性和創新能力。」李彥宏說，「我們有信心在未來繼續推動 AI 技術的發展，並在全球市場中佔據一席之地。」

結語

李彥宏在2024年世界人工智能大會上的談話重點包括：強調 AI 作為輔助工具的重要性、應用優於模型、AI 創造新的工作機會，以及中國 AI 企業在面對國際挑戰時的韌性和創新能力。他對大模型的未來趨勢預測包括：強調應用的重要性、批評開源模型的局限、預測智能體將成為未來趨勢，以及指出大模型落地面臨的挑戰。

這些觀點展示了他對 AI 技術發展的深刻理解和前瞻性思考，為未來 AI 的發展指明了方向。隨著 AI 技術的不斷進步，AI 將在各行各業中發揮越來越重要的作用，並為人類帶來更多的便利和創新。

延伸閱讀

李彥宏在 WAIC 會後接受硅谷101專訪，暢談中國 AI 價格戰、開源 vs 閉源、超級應用與中國 AI 市場機會等議題。影片來源：硅谷101

微軟推出18門生成式 AI 免費課程，助力開發者掌握前沿技能

文章作者作者：Leggie
發表日期 2024 年 6 月 30 日
分類分類於 AI, 生成式AI

微軟2024年2月27日宣布推出一系列18門關於生成式人工智能( Generative AI )的免費線上課程，旨在幫助開發者和技術愛好者掌握這一快速發展的前沿技術。

這套名為「 Generative AI for Beginners 」的課程由微軟雲端倡導者和專家設計，涵蓋了生成式 AI 的基礎知識，包括大型語言模型( LLMs )、提示工程等核心概念。學習者可以使用 Python 或 TypeScript 來構建自己的生成式 AI 應用。

圖片來源：Microsoft

「隨著生成式 AI 技術的快速發展，我們看到了巨大的市場需求和人才缺口。」微軟 AI 部門負責人在一份聲明中表示「這套課程旨在幫助更多人掌握這一關鍵技能，為未來的 AI 驅動型經濟做好準備。」課程內容託管在 GitHub 上，每節課都包括視頻介紹、書面指南、代碼示例和實踐挑戰。微軟還提供了一個官方 Discord 伺服器，讓學習者可以相互交流和獲得支持。此舉顯示了微軟在 AI 教育領域的重大投入，有望進一步鞏固其在企業 AI 市場的領先地位。對於有創業想法的開發者，微軟的 Founders Hub 還提供免費的 OpenAI 積分和 Azure 積分支持。

隨著 ChatGPT 等生成式 AI 工具的爆炸性增長，科技巨頭們正在加緊布局相關教育資源。 Google 和 Amazon 近期也推出了類似的 AI 學習項目。業內人士預計，隨著更多企業尋求利用 AI 提高生產力，具備生成式 AI 技能的人才將在就業市場上擁有顯著優勢。微軟此次推出的免費課程，無疑將為更多人打開 AI 領域的大門。

Suno 推出全新音頻輸入功能，開放所有用戶免費使用

文章作者作者：Leggie
發表日期 2024 年 6 月 29 日
分類分類於 AI, Suno, 生成式AI

人工智能音樂創作平台 Suno 2024年6月28日宣布，其備受期待的音頻輸入功能現已向所有用戶開放，包括免費帳戶持有者。這項創新功能允許用戶將任何聲音轉化為音樂，大大擴展了 AI 輔助音樂創作的可能性。

功能亮點

Suno 的音頻輸入功能允許用戶上傳或錄製 6 至 60 秒長的音頻或視頻片段。用戶可以選擇從上傳的片段延伸創作，設定時間戳、指定音樂風格，甚至可以加入自己的歌詞。這種高度個性化的創作過程為音樂愛好者和專業人士提供了前所未有的創作自由。

使用方法

使用該功能的步驟如下：

導航至「資料庫( Library )」或「創建( Create )」頁面，點擊「上傳音頻( Upload Audio )」。
選擇錄製音頻或上傳音頻/視頻片段。
上傳後，從上傳的片段中選擇「延伸( Extend )」選項，設定延伸的時間戳，提供音樂風格，並可選擇包含自己的歌詞。

社群反響

Suno 社群對這一新功能反響熱烈。許多用戶表示，這項功能極大地提升了他們的創作靈感和效率。一位 Reddit 用戶分享道：「這個新功能讓我驚喜萬分。我用幾年前製作的素材嘗試了一下，結果令人驚艷。」

然而，也有用戶反映了一些初期問題。例如，有人表示該功能有時無法準確執行提示，或在生成過程中消耗大量積分。Suno 團隊表示，他們正在積極收集用戶反饋，不斷優化和改進這一功能。

版權保護

為確保負責任的使用，Suno 採取了嚴格的版權保護措施。系統會自動阻止受版權保護的作品上傳，並將含有人聲的輸入保持私密且不可搜索。這體現了 Suno 在推動創新的同時，也致力於保護知識產權的決心。

結語

Suno 的願景是讓音樂在人們的日常生活中扮演更重要的角色。該公司正在開發更多激動人心的新功能，並探索負責任的交付方式。隨著 AI 技術在創意領域的不斷發展，Suno 的這一創新無疑為音樂創作的未來開闢了新的可能性。

音樂愛好者和專業人士現在可以登錄 Suno 平台，親身體驗這一革命性的音頻輸入功能。

實際測試

讓我們先用 Elevenlabs 創作一個免費版權非商用的音效。Prompt：The sound of the waves in summer, accompanied by the sounds of seagulls. (夏天的海浪聲，伴隨著海鷗的聲音) 或者讀者也可以利用 Suno 社群中的免費音頻區找一個喜歡的音頻來使用。

製作完成後，透過 Upload Audio 按鈕上傳至 Suno：

這裡可以選擇自己錄一段聲音或者上傳本機檔案。

我們把剛剛創作完成的音頻上傳。

上傳完成之後可以將這個音頻命名，針對免費用戶 Suno 會提供一個自動生成的圖片，付費用戶則可以改用自己的圖片。以下是經過 Suno 預處理後的音效：

接著，我們利用 SunoAI Lyricist GPT 創作一首符合夏日情境的歌詞：

[Intro]
輕快的節奏，陽光灑滿沙灘，
墾丁的夏日夢，正在展開。

[Verse 1]
他是一個衝浪男孩，乘著浪花飛翔，
她穿著比基尼，在沙灘上閃耀光芒。
長髮隨風飄揚，眼中星光點點，
他們的目光相遇，心中泛起漣漪。

[Chorus]
哦，墾丁的夏日夢，
在浪花中，我們共同築起愛的城。
哦，這段熱情的旅程，
在陽光下，我們共享每一分每一秒。

[Verse 2]
海風輕拂，我們的腳步輕快，
手牽著手，漫步在金色的沙灘。
她的笑聲如鈴，他的心跳加快，
這一刻，他們的愛情如火般熱烈。

[Pre-Chorus]
她的溫柔，她的笑容，
讓他迷失在這片海洋。
他的勇敢，他的深情，
讓她感受到真愛的力量。

[Chorus]
哦，墾丁的夏日夢，
在浪花中，我們共同築起愛的城。
哦，這段熱情的旅程，
在陽光下，我們共享每一分每一秒。

[Bridge]
夜晚的星空，映照著他們的笑臉，
他們在月光下，許下永遠的諾言。
她的眼中閃爍著幸福的光芒，
他們的心緊緊相連，不會分離。

[Outro]
墾丁的夏日夢，永不會結束，
這段美好的回憶，將永遠珍藏在心底。

接著我們分別以沒有結合音效及結合音效的方式各創作一首歌曲讓各位讀者比較差異，音樂風格使用 SunoAI Lyricist 建議的熱帶浩室 ( Tropical House ) ：

沒有結合音效

音樂風格有比較強烈的 Suno 預設風格及節奏。

結合音效

將海浪的聲音及海鷗的聲音融入(這首歌沒有聽得很明顯，筆者比較喜歡這首所以選這首，不過 Suno 生成的歌曲中有些會有比較明顯的音頻置入，各位讀者可以多嘗試幾首看看)，風格也比較接近音效的情境。

與普通色彩提示的對比

實際測試

進一步應用

服裝

非對稱構圖

機器人

結語

排行榜概覽：中國模型迅速追趕，開源黑馬崛起

重點模型分析：各顯神通，各具特色

Qwen2-72B：阿里雲的開源黑馬

SenseChat5.0：商湯科技的重磅之作

GLM-4-0520：智譜 AI 的強勁競爭者

關鍵能力比較：各有所長，仍有提升空間

行業應用潜力：AI 賦能垂直領域，創新應用指日可待

機遇與挑戰並存，中國 AI 蓄勢待發

結語

人工智能的角色

大模型的應用價值

開源模型的挑戰

智能體的未來

大模型的落地挑戰

提示詞工程的未來

中國 AI 企業的韌性

結語

延伸閱讀

功能亮點

使用方法

社群反響

版權保護

結語

實際測試

沒有結合音效

結合音效

進一步閱讀