Google 推出2025年6月核心演算法更新

Google 推出2025年6月核心演算法更新

自2025年3月進行上一波核心更新以來,Google 承諾「頻繁推出核心更新」,但隨後出現一段沉寂期。此趨勢延續至今年6月,儘管社群與 SEO 工具偵測大量波動,Google 尚未以公告形式推出更新,直至今天(2025年6月30日)正式發布6月核心演算法更新

此外,Google 搜尋持續推進 AI 模式( AI Mode )與 AI 概覽( AI Overview )策略。2023年推出 Search Generative Experience( SGE ),2024年升級為 AI Overviews,2025年3月推出進階 AI Mode,逐步在 SERP 採用大型語言模型回覆,逐漸擠壓傳統青藍連結地位。

這波2025年6月核心演算法更新將 AI 特性更深度整合至 ranking system,旨在提升使用者體驗,但大幅重塑搜索結果格局。

波動軌跡:6月 SERP 智能重組期

1. 多重波段波動:從6月4日起,排名逐步受 AI 流入影響

  • 6月4日起,SEMrush、Mozcast 檢測到 SERP 移動增加。
  • 隨後6月9日第二波震盪,消費內容與電商類別密集洗牌。
  • 6月16–18日波動達頂峰,涵蓋移動、桌面、本地、交易頁面,SERP 結構快速重整。
  • 6月28日迎高峰,Semrush Sensor 指數接近9.3,Advanced Web Ranking 顯示當日波動為2025最嚴重次。

這一波波動特點為:排名位置短時間變化劇烈、點閱與印象脫鉤、AI Summary 顯著取代傳統連結、地圖與本地結果快速重排。

2. AI 概覽與零點擊:CTR 梯降近 35%

來自業界 SEO 資料指出,當 AI 概覽顯示於 SERP 時,這些頁面的點閱率( CTR )普遍下降高達 34.5 %。印象量可維持,但點閱流失,揭示搜尋介面被綜合回覆與結構化段落取代。

3. 本地與電商:快速變換,競爭再起

本地 3-Pack 排列在24 小時內多次變動,含評價項目與分類顯示位置。電商商品頁與高交易頁在移動端 SERP 中被“People Also Ask”方塊與 AI 回覆壓縮版位,排名不明顯下滑 。

更新核心:Google 對質量、UX 與 AI 的強化

1. AI 驅動評估進階:深度理解與真實體驗

核心更新強化 AI 評估能力,不只檢測內容品質與 E‑E‑A‑T 複合指標,亦能判別 AI 生成內容的「空洞」與真實性。對 YMYL ( Your Money or Your Life )內容加強審查。

2. 螢幕重構:聚焦移動與 Core Web Vitals

演算法加入新的 Mobile‑First 評估與 CWV 核心網頁指標 ( Largest Contentful Paint、Interaction to Next Paint、Cumulative Layout Shift ),強化移動效能與整體互動體驗。

3. AI 概覽與零點擊機制正式納入主流程

AI Generated Summaries 直接出現在 SERP 頂部,將點閱其內容的誘因降低,成為核心排名因素一環。即便頁面保有高排名,點閱流失仍會反饋排名模型。

誰受到最大衝擊?

1. YMYL 類別重災

健康、金融、法律等 YMYL 頁面遭受點閱率與排名雙重影響。AI 概覽優化形式優先展現答案,導致專家內容網站被系統調整位置,且收錄縮減。

2. 電商與轉換頁面萎縮

電商移動搜尋結果中,商品圖、價格、評論等資訊被 AI 混合顯示時,傳統 PDP ( Product Detail Page )排名雖留,流量與 CTR 減少。部分 SEO 工具報告顯示商品頁即使仍在第一頁,CTR 下降超過 20 %。

3. 本地服務與 3-Pack 混戰

Google Maps 本地包與 AI 回覆共存競爭。地圖套件內服務分類與評價顯示被 AI 調整,致行動預約與詢價流量起伏劇烈。

4. 部落格與長內容文章

資訊類長篇內容頁雖被 AI 作為資訊來源,但當 AI 答案顯示完整文章要點,使用者多選擇停留 SERP。此情形下頁面排名維持,但點閱為零,如『零點擊高排名』模式愈見普遍。

應對實戰:SEO 策略變革七步驟

步驟 1:分析 SERP 變化,拆解 AI 歧異

  • 使用 SEMrush Sensor、Mozcast、Advanced Web Ranking 等工具,確認受影響頁面類別、關鍵字與設備。
  • 搜尋條件中加入 SERP 截圖,記錄 AI 概覽是否出現,並比較 CTR 變動。

步驟 2:強化 AEO( Answer Engine Optimization )

  • 將頁面內容轉換為問答架構( Q&A 模式 ),突出易於 AI 摘取的段落。
  • 增設「結論摘要欄」與「TL;DR 列表」,以利 AI 捕捉要點。

步驟 3:兼顧 E‑E‑A‑T 強化真實專業

  • 明確呈現作者/專家經歷與資歷,添加引用與原始數據參考。
  • 對 YMYL 內容進行專家審稿,附上安全參考與審查流程,提供信任標籤。

步驟 4:保持技術與 UX 最佳

  • 測試 Core Web Vitals:LCP < 2.5s、CLS < 0.1、INP < 200ms。
  • 確保行動介面流暢,移除干擾式廣告與過多跳窗,提升互動體驗。

步驟 5:結構化標記與 schema 出場

  • 使用 FAQ、HowTo、Product、Review schema,幫助 Google AI 回答提取結構化內容。
  • 將有強力引用價值的段落置於頁首,提升搜尋可見性。

步驟 6:關注 SERP 可見性與 CTR 差距指標

  • Google Search Console 中,關注 Impressions 與 Clicks 差距,若印象穩定但點閱下降,代表 AI 取代。
  • 精測 CTR 下降關鍵字,檢查是否因 AI 概覽、高亮 snippet 或 PAA Box 擠壓。

步驟 7:多元引流策略部署

  • 增設 email 訂閱與私域流量;建立 newsletter、社群粉絲社群以構建第一方資產。
  • 拓展 YouTube、Podcast 與 Instagram 重導內容,降低對搜尋流量依賴。

未來趨勢與 SEO 進化方向

1. 搭上 AI 浪潮:內容節點成核心

內容需要適合 AI 選取與摘錄,「最佳摘要」模式成為新內容競賽維度。頁面重要資訊須可被 AI 模型簡略呈現,≠全篇必讀。

2. 零點擊正成常態:流量指標重構

未來 SEO 成效不能單以 CTR 衡量,而是要搭配停留時間、訪客回歸率、深度互動等指標衡量內容價值。

3. 使用者體驗主導:SEO 與 UX 不再分割

UX 設計與 SEO 越來越融合。網站不僅要被索引,更要提升留存、互動與分享率;CWV 與交互設計成核心競爭。

4. 雙向策略:SEO 與私域成為平行線

流量獲取不能靠單一管道,SEO 是入口,但深度溝通需透過自有平台:社群、電郵、訂閱皆是,抗風險能力提高。

結語

Google 2025年6月核心演算法更新呈現 AI 結合深化的路徑:AI 模式與 AI 概覽不再只是實驗功能,而是進階 SERP 排名判定的重要元素。此舉雖有助提升使用者體驗,但對於 SEO 來說是一場排名與流量革命

內容創作者必須同步強化以下四大重心:

  1. AEO 應答優化
  2. 真實專業與 E-E-A-T 建構
  3. 技術體驗最佳化
  4. 多元引流與使用者資產構建

唯有回應 Google AI 驅動的搜尋需求,SEO 才能從「流量追逐」走向「內容價值+品牌力量」並進。

Google Search Console 如何計算 Google 搜尋中 AI 模式 ( AI Mode ) 與 AI 摘要 ( AI Overviews ) 的曝光數/點擊數/排名

Google Search Console 如何計算 Google 搜尋中 AI 模式( AI Mode )與 AI 摘要( AI Overviews ) 的曝光數/點擊數/排名
中文語音摘要

一、什麼是 AI Overviews 與 AI Mode?

Google 從 2023 年起,逐步將 AI 能力整合進搜尋體驗,推出「AI Overviews」(原名 SGE),並在 2025 年進一步推出「AI Mode」。

• AI Overviews

AI Overviews 是一種會出現在搜尋結果頁頂端的摘要,會從多個網站彙整資訊並給出合成回覆,同時附帶「來源連結」讓使用者選擇深入閱讀。

• AI Mode

AI Mode 是更進階的互動搜尋模式,支援後續追問與多重角度展開。它會將使用者問題拆解成多個子查詢,同步進行訊息搜尋與綜合,是 AI Overviews 的升級版。

Google 正在以漸進且策略性的方式,把 AI 摘要功能深度整合進搜尋體驗,目的不只是提升使用者效率,更欲讓站長能夠在新的 AI 架構下持續獲得數據洞察。

二、Google Search Console 中新增 AI 指標的背景與時程

2025 年 6 月中旬,Google 正式宣布「AI Mode 流量」(包括曝光數、點擊數、平均排名)會被納入 Search Console 的 Performance 報表中,而非作為獨立項目呈現。

  • AI Mode 資料將直接混在「Web」類別中,不可篩選獨立呈現。
  • 曝光、點擊、排名規則與傳統搜尋一致。

這一次更新代表 Google 開始正視 AI 搜尋對網站流量影響,讓站長得以掌握更完整的流量來源;但同時也提示「資料分析難度提升」,因為要將 AI 與傳統流量整合分析需更多費心。

三、曝光數( Impressions )如何計算?— AI 摘要與 AI 模式差異

1. AI Overviews 的曝光規則

  • 系統認定使用者「看見或理應看見」來源連結時,就計算為一次曝光。
  • 無論連結是否實際滑動到視窗內,只要 AI 摘要區塊顯示,且來源網站連結包含其中,即視為曝光。

2. AI Mode 的曝光邏輯

  • 類似 AI Overviews,但當使用者觸發互動式 AI 回答時,每個子查詢都視為單次曝光。
  • 若後續追問產生新回答,每一次都會分開計算曝光與排名。

AI Mode 因為可生成多輪互動,曝光數往往比靜態 AI Overviews 還要高;但流量也因此更零散、多次被歸類為不同「查詢」。

四、點擊數( Clicks )如何統計?— 導流來源識別與資料歸屬

點擊的定義與傳統搜尋基本一致:當使用者點擊來源頁面連結,並跳轉至該網站時,即記為一次點擊。

三種 AI 點擊歸屬特性:

  1. 多來源合成: 一個 AI 摘要可能同時引用 3~5 個網站,使用者可能同時點擊多個連結。
  2. 延遲點擊: 使用者在閱讀 AI 回答後才點擊來源,仍視為來自該查詢的點擊。
  3. AI Mode 多輪互動: 每輪回應帶出新連結,每一點擊皆歸屬該次子查詢。

AI 讓點擊數不再是單一路徑導流結果。SEO 團隊若要判斷是否來自 AI 回答區,需結合 Google Looker Studio、自訂維度等進階工具。

五、排名( Position )在 AI 環境中的定位邏輯

Google 說明,AI Overviews 與 AI Mode 中的排名計算方式如下:

  • 若你的網頁被 AI 回答引用,則視為「在該查詢中被列為結果之一」,依該 AI 區塊內的連結位置,換算成排名。

實例說明:

  • AI Overviews:若為 AI 區塊中第 1 個連結,則計為第 1 名;第 3 個則為第 3 名。
  • AI Mode:每一輪互動皆為獨立查詢,連結排名依照該回合內的位置計算。

AI 的引用邏輯偏重語意匹配與可信度來源,因此即使非傳統 SEO Top 3 網站,只要內容品質佳,仍可能被選為 AI 回答的一部分。

六、資料分類與報表應用:如何在 Performance Report 做細分分析

AI Mode 流量與 Web 整體流量合併呈現,站長需使用以下方式進行推論與辨識:

1. 查詢模式觀察

  • 若查詢帶有「哪一種最好」、「怎麼做」、「推薦」等語氣,極可能來自 AI 觸發。

2. 點擊率( CTR )異常變化

  • AI 回答可能降低或提高 CTR,視使用者是否已被摘要滿足判斷。

3. 匯出資料 + Looker 分析

  • 將 GSC 查詢、CTR、排名匯出後,於 Looker Studio 製作報表分析,找出 AI 導流趨勢。

雖目前無法直接過濾「來自 AI 區塊」的資料,但透過語氣模式與異常 CTR 分析,可合理推測其影響範圍。

七、實務優化操作與常見問題

如何讓我的網站出現在 AI Overviews 中?

  • 專注 E-E-A-T(專業性、權威性、可信度與實際經驗)
  • 強化段落邏輯與語意完整度
  • 使用 Q&A 格式,明確回答問題

AI Mode 的排名是否能與傳統 SEO 同步追蹤?

不完全能。每次對話皆為新查詢,僅能追蹤單一回應的排名,無法橫跨追問關聯分析。

如何從查詢中判斷哪些是 AI 觸發結果?

觀察語氣,例如:「哪一款最好」、「怎麼選」等語句。這些查詢多為 AI 模型觸發關鍵。

AI Overviews 對網站流量是好事還是壞事?

兩面刃。若被引用則能獲得高可見度,但若回答已滿足使用者需求,也可能導致點擊減少。

如何優化內容以對應 AI 搜尋?

  • 使用清楚段落與 H2 標題
  • 強調實用、直接的解答
  • 融入第一手見解或經驗內容

八、未來觀察:GA4、內容行銷轉型與品牌再定義

GA4 與 AI 導流整合建議:

  • 使用自訂維度追蹤 AI 語義查詢
  • 追蹤 CTA 行為與高意圖流量差異
  • 與 GSC 交叉分析,辨識查詢趨勢

品牌策略轉型:

  • 建立權威內容中心而非雜亂部落格
  • 製作清晰作者頁面與社群連動
  • 將 SEO × PR × AI 結合為三合一曝光策略
進一步閱讀
  1. 突破 Google AI 搜尋( AI Overviews )的 SEO 策略
  2. Google 搜尋引擎的 AI 革命:邁向個人化搜尋新紀元?
  3. 2025年1月 Google 搜尋質量評估器指南更新:AI 內容的影響
  4. 2024 Google 搜尋的未來:SEO 將與 AI 深度結合
  5. Google 搜尋引入生成式 AI(SGE) 重塑使用者體驗

Gemini GEM 指令寫作指南:從入門到精通,打造你的專屬 AI 助理

Gemini Gem 指令寫作指南
中文語音摘要

你是否曾感到一絲挫敗?當你面對功能強大的通用型 AI 時,卻必須日復一日地重複輸入相同的背景資訊、語氣要求和格式指令。每一次新的對話,都像是一次從零開始的溝-通,耗費了寶貴的時間與精力。這種重複性的工作不僅效率低落,也阻礙了我們將 AI 真正融入複雜工作流程的潛力。現在,Google Gemini 的這個功能將徹底改變這個局面:它就是 Gems。

將 Gem 想像成一個可自訂、可重複使用的「超級提示詞」或一個專為你量身打造的個人化 AI 助理。它是一個預先設定好指令的 Gemini 版本,它已經深刻理解你的身份、你的具體需求,以及你偏好的交付成果形式。與其每次都告訴 Gemini 你是一位需要撰寫行銷文案的專案經理,不如直接啟用你專屬的「行銷文案大師 Gem」,它早已內建了所有必要的專業知識和語氣風格。

這篇文章提供一份詳盡的藍圖,引導初學者從零開始,一步步掌握 Gemini Gem 的設計與寫作。我們將從 Gem 的核心價值出發,深入剖析高效指令的構成要素,並逐步探索進階技巧。

客製化的力量:為何要打造 Gem?

打造一個 Gem 遠不止是為了節省打字時間的便利之舉。它是一種策略性的工具,能從根本上提升你與 AI 互動的品質、效率和準確性。當我們深入探討其背後的原因時,會發現 Gem 解決了通用大型語言模型在實際應用中最核心的幾個痛點。

實現一致性與準確性

在專業工作場景中,一致性是品質的基石。無論是撰寫符合公司品牌形象的郵件、產出格式統一的學術報告,還是進行任何需要可重複品質的任務,Gem 都能確保 AI 的輸出始終如一。透過在 Gem 指令中預先設定好「角色」、「語氣」和「輸出格式」,你可以消除 AI 回應中的不確定性。例如,一個設定為「專業、嚴謹的法律助理」的 Gem,其產出的文字風格將遠比一個通用模型更加穩定可靠。此外,透過預先載入特定情境,Gem 能有效減少模型產生通用、模糊甚至錯誤資訊的風險,因為它的知識庫已被你提供的上下文精準地「錨定」了。

提升生產力與工作流程效率

Gem 的核心價值之一在於自動化。許多日常工作都包含重複性的 AI 互動,例如:整理會議記錄、草擬社群媒體貼文、為程式碼生成註解文件等。Gem 能夠將這些常規任務轉化為一鍵式操作,將使用者從繁瑣的指令重複中解放出來,讓他們能更專注於需要深度思考和策略規劃的高價值工作上。這不僅僅是時間的節省,更是認知資源的優化配置,從而顯著提升整體工作效率。

打造特定領域的專家

通用 AI 模型如 Gemini,其知識廣博但深度有限。而 Gem,特別是當它與檔案上傳功能結合時,能將這個「通才」轉變為一個在特定領域擁有深厚知識的「專家」。想像一下,你可以上傳一份詳細的市場分析報告、一份複雜的法律合約或一個完整的專案程式碼庫,然後建立一個 Gem 來專門處理與這些資料相關的任務。這個 Gem 不再依賴其龐大的通用訓練數據,而是基於你提供的精準資料進行推理和回應。對於法律、醫療、金融、行銷等專業領域的工作者而言,這項能力是革命性的,它意味著 AI 終於能夠真正理解並參與到他們高度專業化的工作流程中。

這種從「通用對話夥伴」到「客製化工具」的演進,標誌著 AI 互動模式的重大轉變。這個轉變的背後,反映了 AI 使用者群體的成熟化以及對更高度控制和專業化工具的迫切需求。最初,AI 聊天機器人的核心價值在於其知識的廣度,能夠回答五花八門的問題。然而,使用者很快發現了固定的、重複性的工作模式,例如「用…風格總結這段文字」、「像對五年級學生一樣解釋這個概念」或「根據這些要點草擬一封郵件」。這種重複不僅效率低下,而且每次微小的指令差異都可能影響輸出品質。Google 推出 Gem 這項功能,正是為了直接解決這種低效率問題。它是一個精心設計的產品特性,旨在捕捉並自動化這些由使用者定義的工作流程。因此,Gems 不僅是 Google 提升其 AI 平台使用者黏性和實用性的策略性舉措,更代表著 AI 應用的未來方向:讓使用者能夠建立個人化的、由專業工具組成的資料庫,從而超越簡單的聊天互動,邁向深度整合的工作流程自動化。

打造你的第一個 Gem:一步步實戰演練

理論知識需要透過實踐來鞏固。我們提供一個清晰、詳細的實戰演練,引導你完成從零到一的過程,親手打造你的第一個 Gem。我們將以一個非常實用的場景為例:建立一個「會議記錄整理器」。

熟悉操作介面

首先,你需要熟悉 Gem 的建立與管理介面。整個過程都在 Gemini 的網頁版中進行,操作非常直觀。

  1. 定位 Gem 管理器:在瀏覽器中開啟 gemini.google.com。在頁面左側的側邊欄中,你會找到一個名為「Gem」或類似的選項,點擊它進入 Gem 管理器。
  2. 建立新 Gem:在 Gem 管理器介面中,點擊「新增 Gem」按鈕,這會開啟 Gem 的編輯器。
  3. 認識編輯器:你會看到一個雙欄佈局的介面。左側是「指令編輯區」,你將在這裡撰寫和修改 Gem 的所有指令。右側是「預覽面板」,你可以即時與正在建立的 Gem 進行對話,測試其反應。

實戰教學:打造「會議記錄整理器」Gem

現在,讓我們開始動手建立一個能自動整理會議文字記錄的 Gem。

  • 步驟一:命名你的 Gem
    在指令編輯區頂部的名稱欄位中,為你的 Gem 輸入一個清晰、具描述性的名稱,例如:「會議記錄整理器」。一個好的名稱能讓你日後在眾多 Gems 中快速找到它。
  • 步驟二:撰寫指令
    我們從一個簡單的「零樣本」提示詞開始,也就是只給予指令,不提供範例。在左側的指令框中,輸入以下文字:你是一位高效率的行政助理。當我貼上一段會議文字記錄時,你的任務是整理這份記錄。你需要識別出會議中做出的「關鍵決策」,並列出所有的「待辦事項」及其負責人。請使用粗體的「關鍵決策」和「待辦事項」作為標題來格式化輸出。
  • 步驟三:在預覽面板中測試
    這是最關鍵的一步。找一段模擬的會議記錄文字,將其複製並貼到右側的預覽面板中,然後按下「執行」。觀察 Gem 的輸出是否符合你的預期。這個即時反饋的過程,完美體現了 Gem 建立的迭代本質。如果輸出不理想,你可以隨時返回左側修改指令,然後再次測試。
  • 步驟四:儲存你的 Gem
    當你對預覽結果感到滿意後,務必點擊編輯器下方的「儲存」或「更新」按鈕。請記住,在預覽面板中的測試不會自動儲存你的變更,忘記儲存將會遺失你的所有工作。

管理你的 Gem 收藏庫

一旦你開始建立多個 Gem,有效的管理就變得至關重要。

  • 使用與尋找:儲存後,你可以在 Gemini 主介面的側邊欄中找到並點擊啟用你的「會議記錄整理器」。
  • 管理功能:在 Gem 管理器中,你可以對已有的 Gem 進行一系列操作,包括:
    • 釘選:將最常用的 Gem 釘選到側邊欄頂部,方便快速取用。
    • 編輯:隨時回來修改和優化你的 Gem 指令。
    • 建立副本:當你想建立一個功能類似但稍有不同的 Gem 時,建立副本是一個絕佳的起點。
    • 刪除:移除不再需要的 Gem。

熟練運用這些管理功能,將幫助你建立並維護一個強大且井然有序的個人化 AI 工具庫。

高效 Gem 指令的剖析:四大支柱

要從「能用」的 Gem 邁向「好用」的 Gem,關鍵在於掌握指令的寫作結構。一個強大而可靠的 Gem 指令,通常建立在四個核心支柱之上。我們將這個框架稱為 PTCF 框架角色 (Persona)任務 (Task)情境 (Context)格式 (Format)。理解並運用這個框架,是寫出清晰、無歧義指令的基礎。

支柱一:角色 (Persona) – 「他是誰?」

  • 定義:為 AI 指定一個具體的身份、職業或性格。這不僅僅是個有趣的設定,更是引導其語氣、風格和知識庫的關鍵指令。
  • 為何重要:一個明確的角色設定,能極大地影響回應的詞彙選擇、正式程度和整體風格,使其更貼近預期的受眾和場景。例如,對同一個問題,「你是一位風趣的科學部落客」和「你是一位嚴謹的大學教授」所產出的解釋將會截然不同。
  • 範例
    • 「你是一位專業的廣告文案撰寫員。」
    • 「你是一位有耐心且善於鼓勵的家教老師。」
    • 「你是一位世界頂級的米其林三星主廚。」

支柱二:任務 (Task) – 「他要做什麼?」

  • 定義:你希望 AI 執行的具體、可操作的指令。這是整個指令的核心驅動部分。
  • 最佳實踐:務必使用清晰的「動作動詞」來開頭,例如:「總結」、「分析」、「草擬」、「生成列表」、「改寫」等。模糊的指令如「談談這個主題」,遠不如「生成 10 個關於這個主題的獨特標題」來得有效。
  • 範例
    • 「生成 10 個獨特的標題選項。」
    • 「建立一份專案時程表。」
    • 「將這段文字翻譯成法文。」

支柱三:情境 (Context) – 「為何做?用什麼做?」

  • 定義:為了準確執行任務,AI 所需的所有背景資訊、資料、限制條件和目標。這是四大支柱中,對提升回應品質影響最大的一個。
  • 為何重要:提供充足的情境是減少 AI 產出通用、空泛內容,以及防止事實性錯誤(或稱「幻覺」)的最重要手段。你提供的背景資訊越豐富、越精準,AI 的回應就越貼切、越可靠。
  • 範例
    • 「目標受眾是行銷領域的初學者。」
    • 「這個專案是為了一個將於六月發表的新產品。」
    • 「請根據附件中的這份財務報告進行分析。」

支柱四:格式 (Format) – 「他該如何呈現?」

  • 定義:關於輸出結果應如何結構化的明確指示。
  • 為何重要:指定格式不僅能讓輸出結果更具可讀性,更關鍵的是,它能確保輸出的可預測性,這對於任何需要後續處理(無論是手動複製還是程式自動化處理)的場景都至關重要。
  • 範例
    • 「請使用項目符號列表。」
    • 「將輸出結果格式化為一個 Markdown 表格。」
    • 「回應內容限制在三個段落以內。」
    • 「以 JSON 格式回應。」

PTCF 框架不僅僅是一份寫作前的檢查清單,它更是一個強大的「診斷工具」。當你建立的 Gem 產出不理想的回應時,你可以不必隨機地修改指令,而是系統性地運用此框架來定位問題。這個過程本身就是一種更深層次的理解。

假設一個 Gem 的回應語氣錯誤、內容過長且事實不準確。我們可以這樣進行診斷:

  1. 語氣錯誤? 這意味著「角色 (Persona)」的設定不夠精確或強度不足。解決方案是強化角色描述,例如將「助理」改為「態度嚴肅的執行長特助」。
  2. 事實不準確或內容太通用? 這指向「情境 (Context)」的缺失。解決方案是提供更多、更具體的背景資訊,例如明確指出「這次會議是關於第三季度的預算,而非第二季度」。
  3. 內容過長或難以閱讀? 這是「格式 (Format)」的限制不足。解決方案是加入明確的格式化指令,例如「使用項目符號,並將摘要限制在 150 字以內」。
  4. 沒有執行正確的動作? 這可能是「任務 (Task)」的動詞不夠清晰。解決方案是使用更精準的動詞,例如將「討論這份會議記錄」改為「從這份會議記錄中提取所有待辦事項」。

這種結構化的除錯流程,遠比憑感覺反覆試錯來得高效,它體現了提示詞工程師的核心思維模式:將模糊的問題拆解為清晰、可解決的組成部分。

進階技巧,打造專家級 Gem

掌握了 PTCF 四大支柱後,你已經能建立出可靠的 Gem。然而,要應對更複雜、更細緻的任務,我們需要引入一些進階技巧。這些技巧並非孤立的竅門,而是解決同一個核心問題—「降低指令模糊性」—的不同策略。選擇哪種技巧,取決於你所面臨的模糊性類型。

技巧一:少樣本提示 (Few-Shot Prompting)

  • 概念:從僅僅「告知」AI 該做什麼(零樣本),進化到「展示」給它看如何做(少樣本)。當任務涉及微妙的判斷或需要特定的、非標準的輸出格式時,提供一兩個範例的效果遠勝過冗長的文字描述。
  • 實作:在指令框中,使用清晰的分隔符(如 範例: 或 —)來結構化你的範例。
  • 應用場景:建立「情緒分析器」Gem
  • 指令:你的任務是分析文本的情緒。請將情緒分類為「正面」、「負面」或「中性」。

    範例 1 輸入文字:「我超愛這部電影!劇情太棒了!」 情緒:正面


    範例 2 輸入文字:「服務生的態度很差,等了半小時才上菜。」 情緒:負面

透過這兩個範例,Gem 不僅學會了任務本身,更重要的是,它學會了你期望的確切輸出格式(情緒:[分類]),從而極大地降低了模糊性。

技巧二:運用檔案提供深度情境

  • 概念:利用 Gem 的檔案上傳功能,讓其能夠存取、理解並基於特定文件(如 PDF、TXT)甚至整個程式碼資料夾進行回應。這項功能將 Gem 從一個依賴通用知識的助理,轉變為一個能夠深入特定專案或領域的專家。
  • 實作:在 Gem 編輯器中,點擊「新增檔案」或「雲端硬碟」按鈕,上傳你希望 Gem 參考的資料。注意,檔案類型和大小會有限制。
  • 應用場景:建立「研究論文助理」Gem
  • 操作:上傳一篇特定的 PDF 研究論文。
  • 指令:你是一位研究助理。你的知識僅限於我所提供的這份文件。當我提問時,請根據這份文件的內容回答,特別是關於研究方法、實驗數據和結論的部分。如果答案在文件中找不到,請明確告知「文件中未提及此資訊」。

這種方法透過「錨定」資訊來源,有效地防止了 AI 產生幻覺或提供與文件無關的通用知識,從而確保了回應的精準性和可靠性。

技巧三:用提示詞鏈結構化複雜工作流

  • 概念:對於包含多個步驟的複雜任務,與其試圖用一個龐大而混亂的指令來涵蓋所有內容,不如在單一 Gem 的指令內部,將其分解為一個個邏輯清晰、循序漸進的步驟 。
  • 實作:透過編號或明確的步驟標示(如「步驟一」、「步驟二」)來組織指令,引導 Gem 按照預設的流程與使用者互動。
  • 應用場景:建立「部落格文章生成器」Gem
  • 指令:你是一位內容策略師,將協助我完成一篇部落格文章。請嚴格按照以下步驟進行:
    步驟一: 首先,詢問我文章的主題和目標讀者是誰。
    步驟二: 在我提供資訊後,根據主題和讀者,生成 5 個吸引人的標題選項供我選擇。
    步驟三: 在我選定一個標題後,為這篇文章建立一份詳細的大綱,包含引言、三個主要論點和結論。
    步驟四: 在我確認大綱後,根據這份大綱撰寫完整的文章初稿。

這種鏈式結構將一個模糊的「寫文章」任務,拆解成四個獨立、清晰且易於管理的子任務,顯著降低了 AI 理解和執行的難度,從而提升了最終成品的品質。

技巧四:要求結構化輸出

  • 概念:雖然「格式」支柱涵蓋了基本的輸出形式,但此進階技巧專注於獲取可靠的、可被機器讀取的結構化輸出,例如 Markdown 表格或類 JSON 格式的文字。
  • 實作:將「少樣本提示」與明確的格式指令相結合,為 AI 提供一個清晰的模仿目標。
  • 應用場景:建立「資訊提取器」Gem
  • 指令:你的任務是從我提供的產品描述中提取關鍵資訊。請將提取的資訊格式化為一個 JSON 物件,包含以下欄位:product_name、price 和 features(一個列表)。
    範例
    輸入文字:「全新的 Aqua-Blaster 3000 售價 99 美元,配備渦輪噴嘴和超長水管。」
    輸出:
    JSON
    {
      “product_name”: “Aqua-Blaster 3000”,
      “price”: 99,
      “features”: [“渦輪噴嘴”, “超長水管”]
    }

這個指令不僅告知了任務,還透過範例精確定義了輸出的語法結構,確保了結果的一致性和可用性,特別是在需要將輸出結果用於後續自動化流程的場景中。

Gem 藍圖庫:適用於各種需求的實用範例

理論需要透過具體的範例來深化理解。本節將提供四個精心設計的、可直接複製貼上的 Gem 指令藍圖。每一個藍圖都將附上 PTCF 框架的分析,以解構其為何有效,幫助你將前面學到的知識融會貫通。

藍圖一:創意寫作夥伴

這個 Gem 旨在成為作家的靈感催化劑和構思夥伴,而不僅僅是一個寫手。

  • 指令藍圖:角色 (Persona):你是一位經驗豐富的創意寫作教練與合作夥伴。
    任務 (Task):協助我進行腦力激盪、發展角色、克服寫作瓶頸。你需要針對我故事的主題、情節和角色提出深入的探問,引導我進行更深層次的思考。
    情境 (Context):我們正在合作一部科幻小說。請保持支持但批判性的語氣,提供建設性的回饋。
    格式 (Format):在進行腦力激盪時,請以項目符號列表的形式提供點子。在提供回饋時,請將其結構化為「優點」和「可改進之處」兩個部分。
  • PTCF 分析
  • 角色:定義為「教練與夥伴」,而非「作者」,確保 Gem 的行為是引導和提問,而不是直接代筆。
  • 任務:核心動詞是「協助」、「提出探問」,強調互動性。
  • 情境:「科幻小說」和「支持但批判性」的語氣設定了合作的基調和領域。
  • 格式:明確的格式要求(項目符號、特定標題)使交流更加結構化和高效。

藍圖二:個人化課程計畫設計師

這個 Gem 專為教師設計,能夠根據具體需求快速生成高品質的課程計畫。

  • 指令藍圖:角色 (Persona):你是一位專精於八年級社會科的課程設計專家。
    任務 (Task):根據我提供的學習目標,生成引人入勝的課程活動點子。
    情境 (Context):我的學生每人都有一台 Chromebook。我的課堂時間為 50 分鐘。我喜歡在教學中結合數位活動和紙本地圖。請確保活動設計也考慮到英語為第二語言 (ESL) 的學生。
    格式 (Format):針對每一個學習目標,請生成 3-5 個不同的課程點子。每個點子都必須包含:1. 簡短的活動描述;2. 各項活動的預估時間;3. 所需資源(特別註明 Chromebook 和地圖的使用);4. 評估學生學習成效的建議方法。
  • PTCF 分析
  • 角色:「八年級社會科課程設計專家」確保了內容的專業性和適用性。
  • 任務:「生成課程活動點子」是明確的核心指令。
  • 情境:提供了豐富的限制條件(Chromebook、50 分鐘、紙本地圖、ESL 學生),極大地提高了生成內容的實用性。
  • 格式:高度結構化的輸出要求確保了每一個生成的點子都是完整且可直接執行的。

藍圖三:商業策略腦力激盪器

這個 Gem 扮演一個批判性的思考夥伴,幫助使用者審視和強化他們的商業構想。

  • 指令藍圖:角色 (Persona):你是一位經驗老到的風險投資家和商業策略師。
    任務 (Task):分析我提供的一個商業構想,並識別其潛在的優勢 (Strengths)、劣勢 (Weaknesses)、機會 (Opportunities) 和威脅 (Threats),即進行 SWOT 分析。
    情境 (Context):請保持批判性和客觀性。你的目標是找出這個構想中的漏洞,以使其更加完善。請專注於市場可行性、競爭格局和可擴展性。
    格式 (Format):請將最終的分析結果以一個 Markdown 表格的形式呈現,該表格包含四個象限,分別對應優勢、劣勢、機會和威脅。
  • PTCF 分析
  • 角色:「風險投資家」的設定帶來了天生的批判性視角。
  • 任務:「進行 SWOT 分析」是一個非常具體且標準化的商業分析任務。
  • 情境:「找出漏洞」、「客觀性」等關鍵詞強化了角色的行為模式。
  • 格式:「Markdown 表格」和「四個象限」的要求使得輸出結果清晰、專業且一目了然。

藍圖四:程式碼文件助理

這個 Gem 旨在自動化軟體開發中一項重要但繁瑣的工作:撰寫文件。

  • 指令藍圖:角色 (Persona):你是一位編寫極度清晰簡潔文件的高級軟體工程師。
    任務 (Task):當我提供一段 Python 函式 (function) 時,為其生成專業的說明文件 (docstring)。
    情境 (Context):說明文件必須解釋該函式的用途、其所有參數(包含類型)以及它的回傳值。
    格式 (Format):請使用標準的 Google Python 風格來格式化說明文件。並務必包含一個簡單的 範例: 使用區塊。
  • PTCF 分析
  • 角色:「高級軟體工程師」的設定確保了輸出的專業性和規範性。
  • 任務:「生成專業的說明文件」是核心指令。
  • 情境:明確了說明文件必須包含的三個核心要素(用途、參數、回傳值)。
  • 格式:「Google Python 風格」和「範例區塊」是對輸出格式最精確的定義,確保了程式碼庫風格的統一。

最佳實踐

精通任何一項技能,不僅需要學習正確的方法,還需要了解並避開常見的錯誤:

  1. 從簡單開始,逐步迭代:不要試圖一次就建立一個功能完美、指令複雜的 Gem。從一個核心指令開始,透過預覽面板不斷測試和調整,逐步增加細節和複雜度。這個迭代過程是成功的關鍵。
  2. 使用自然語言:像與一位聰明的助理交談一樣撰寫指令,而不是像在寫程式碼。使用完整、清晰的句子,避免使用只有自己能懂的術語或縮寫。
  3. 拆解複雜任務:如果一個任務感覺過於龐大,難以用一個 Gem 的指令清晰描述,那麼它很可能確實太大了。考慮在 Gem 內部使用「提示詞鏈」技巧將其分解,或者思考是否需要建立多個功能更專一的 Gem 來協同工作。
  4. 讓 Gemini 幫助你:這是一個強大的元技能。當你對自己的指令不確定時,可以將草稿貼到一個新的 Gemini 對話中,然後提問:「請幫我優化這段指令,讓它作為一個 Gemini Gem 的指令時能更清晰、更有效。」Gemini 常常能提供出色的重構建議 。

給未來開發者的提醒:Gems vs. API 系統指令

當你在網路上深入研究 Gemini 的客製化功能時,你可能會遇到兩個看似相似但本質截然不同的術語:「Gems」和「系統指令 (System Instructions)」。對這兩者進行清晰的區分,可以有效避免混淆,特別是當你未來可能從使用者轉向開發者時。

術語定義

  • Gemini Gems:這是專為終端使用者設計的功能,存在於 gemini.google.com 的網頁應用程式中。它允許使用者透過圖形化介面 (UI) 建立、儲存和重複使用個人化的、有狀態的聊天機器人或助理。你為 Gem 撰寫的指令,實質上是構成了一段精心設計的、置於對話歷史開頭的「超級提示詞」。
  • 系統指令 (System Instructions):這是一個專為開發者設計的、在 Gemini API 中使用的特定參數 (system_instruction)。開發者在程式碼中設定此參數,用以向模型提供高層級的、持久性的行為指南。這些指南與使用者每回合的具體提問是分開的,並且通常對終端使用者不可見,也無法直接修改。

為何這個區分很重要?

這個區分之所以重要,是因為它能防止潛在的學習混淆。一個初學者在網路上搜尋「Gemini 自訂指令」時,很可能會同時看到針對使用者的 Gem 教學,以及針對開發者的 API 文件。如果無法區分這兩者,他可能會試圖將 API 的概念(如在程式碼中設定 system_instruction)應用到 Gem 的 UI 中,反之亦然,從而導致挫敗感。

理解了這一點,你就能更清晰地定位自己的需求:

  • 如果你想在日常使用中為自己建立一個方便的工具,例如「郵件撰寫助手」或「會議整理器」,那麼你應該學習和使用的是 Gemini Gems
  • 如果你正在開發一個應用程式,希望在後端控制 AI 的核心行為,例如確保你的客服聊天機器人始終保持禮貌且絕不提供醫療建議,那麼你需要在程式碼中研究和使用的是 API 的系統指令

這篇文章完全專注於前者—賦予每一位使用者打造個人化 Gemini Gems 的能力。當你掌握了本指南中的所有技巧後,你不僅能成為一位高效的 Gem 使用者,也為未來可能踏上 AI 開發之路奠定了堅實的提示詞工程基礎。

進一步閱讀
  1. Gemini Deep Research 最佳提示詞指南
  2. Google Gemini 多模態提示詞指南
  3. Gemini Prompt 專家指南
  4. Gemini Prompt 入門指南

Midjourney 推出 V1 Video Mode 革新 AI 視頻創作玩法

AI 影像生成平台 Midjourney 於2025年6月19日正式宣布推出其首款 V1 Video Mode 模型,開啟「AI 視頻」新時代。以「Image‑to‑Video」為核心,使用者可將 Midjourney 生成的靜態影像加入動畫效果,一鍵「Animate」生成動態短片,每次輸出為四段 5 秒鏡頭,並支援延伸功能。這項創新不僅標誌平台從圖片進入視頻領域,更展現其關鍵未來願景:朝向「實時開放世界模擬」踏出重要一步。

功能剖析:Image‑to‑Video 動畫流程與使用體驗

Midjourney 官方指出,V1 Video Mode 是從單一靜態影像生成動態視頻的「邁向未來的跳板」,核心流程如下:

  • Image‑to‑Video:在 Discord 或 Web 中生成圖像後,按下「Animate」按鈕,即可直接為靜態畫面加入動態效果 。
  • 動畫模式分為自動與手動
    • 自動模式(Automatic):由系統模擬出 motion prompt,適合快速生成「趣味動態」。
    • 手動模式(Manual):用戶可輸入具體文字描述,精準控制畫面移動方向、速率與視覺展開 。
  • 動作強度選擇
    • Low Motion:適合環境靜態為主,主體緩慢移動的場景;適合背景變化與氛圍影片,但可能無明顯動作。
    • High Motion:適合主體與鏡頭都有動作的全動態場景,但因高運算可能導致畫面畸變 。
  • 延伸長度:預設 5 秒,使用者可按需延長 4 秒一次,最多延展四次,總長最高可達 21 秒 。

此外,V1 還支持將 Discord 外部圖像上傳,設為起始幀,再加入 motion prompt,產生專屬動畫短片。

定價策略:“1 張圖=1 秒影片”的高性價比體驗

Midjourney 創辦人 David Holz 表示,為了讓更多人享受 AI 視頻體驗,V1 初期價格設定與圖像生成相當:估算每秒 1 個圖像成本,整段影像成本約為一張 Midjourney 圖像 。目前尚限於 Web 平台操作,定價策略如下:

  • 基礎方案:10 美元/月(Basic),可生成 V1 視頻。
  • Pro(60 美元)與 Mega(120 美元):提供 Relax 模式,支持不限次視頻生成(但速度較慢)。
  • 視頻成本約為圖像的 8 倍,因為每次生成包含四段 5 秒影片。
  • 定價將在 1 個月內依使用情形與伺服負載狀況做動態調整 。

此策略意在快速導入市場測試,同時兼顧平台營運成本與使用者使用體驗。

技術架構與品質聚焦:輸出風格延續靜圖特色

V1 延續 Midjourney 圖像一貫風格:畫面含蓄、有質感,非強求真實,而是追求「美感」和「風格一致性」。技術細節如下:

  • 風格保留:系統擅長維持 Midjourney 的視覺美學,影像具有畫面細緻的色彩處理與畫風一致性。
  • 動作有限:目前僅支援簡單飄移、推拉、旋轉等動作;高強度動畫可能出現不自然或變形瑕疵 。
  • 平台轉換:不同於 Discord 的指令式操作,動畫功能僅提供 Web 版,方便整合進階控制工具及預覽系統。

未來路線圖:走向 3D ⋅ 即時開放世界

Midjourney 官方指出,V1 僅是通往最終願景的重要一環:「未來要達到即時互動的 3D 模擬」永遠是核心目標。接下來幾年將推出四大功能模組:

  1. 靜態影像 → 已完成
  2. 視頻模型(Video Mode) → V1 正式上線
  3. 3D 模型 → 預計明年發布
  4. 真正的即時運算系統 → 長期目標

透過模組化發展策略,Midjourney 希望先釐清單一技術,再逐步整合,最終形成可互動、創作、模擬的開放世界系統。

市場對抗態勢:與 OpenAI、Runway 等平台正面交鋒

目前市場已有多家 AI 視頻領軍者,Midjourney 正面迎戰:

  • OpenAI Sora:主打可控性與品質
  • Runway Gen‑4:搭載專業級工具(masking、motion track),適合內容製作專業使用者
  • Adobe Firefly:偏重圖像-視頻整合於創作流程
  • Google Veo 3:強調速度與AI短視頻生成功能

對比之下,Midjourney 強調「風格一致」與「創意導向」,產品定位為「藝術家與設計師的創作工具」,而非純商業影片製作。這凸顯出其差異優勢與定位清晰性 。

V1 不是終點,而是令人期待的起點

Midjourney 推出的 V1 Video Mode 無疑在 AI 影像圈掀起新話題:它結合平台核心風格與可操作動畫功能,以超高性價比進入 AI 視頻市場。雖非最專業的視頻製作平台,但作為一款快速又具有美學風格的創作工具,其對藝術家與設計師、內容創作者來說具有極高吸引力。

未來把靜態影像拼接到動態圖像、最終實現即時 3D 模擬、構建開放世界的願景仍需時間,但今天這一步已踏出。面對市場競爭與法律訴訟壓力,Midjourney 選擇「美感與創意優先」,試圖以獨特定位在 AI 視頻領域找到自己的位置。

對於有興趣探索 AI 創作的使用者,不妨以低門檻方式嘗試 V1 Video Mode,開啟影像進入動態未來的新旅程。

實際測試

(筆者註:目前影片只支援480p)

原始圖像

Midjourney V1 Video Mode - 原始測試圖像

Auto Low-Motion

Auto High-Motion

手動控制提示詞

The woman lowered her arms and walked forward with a catwalk. She stepped out of the woods onto a flat highway and began to wriggle and dance. The lens is fixed, the lens is zoomed out, and the woman's whole body is presented in a panoramic view. Natural light shines on the woman's body. Movie scenes, 8K high resolution, showing a woman's charming and moving posture. 女子垂下雙臂,邁著貓步向前。她走出樹林,踏上平坦的公路,開始扭動舞動。鏡頭定格,鏡頭拉遠,女子全身全景呈現。自然光灑落在女子身上。電影場景,8K高清分辨率,展現女子嫵媚動人的姿態。

Manual Low-Motion

Manual High-Motion

延伸手動控制提示詞(增加4秒)

The woman backflips and starts hip-hop. A group of dancers appears on the left and right.女人後空翻,開始跳街舞,左右兩邊分別出現了一群舞者。

Manual Low-Motion-Extend

女主角不太能翻,看似不太能做出太大的動作。

Manual High-Motion-Extend

女主角稍微能翻了,動作幅度較大,可以呈現一些比較激烈的場景。

Midjourney 將 sref V7 設為預設

Midjourney 將 sref V7 設為預設

Midjourney 於2025年6月17日宣布正式啟用 V7 Style Reference 系統(簡稱 sref V7) 為預設功能,強調這項更新將成為所有 V7 圖像生成任務的標準參數,標誌著在 AI 繪圖技術上的重大進化。透過全新的 sref V7 引擎,Midjourney 表示該系統如今能更「智慧」地解析圖像風格,不僅能精確捕捉光影處理、質感與色調語彙,對於 prompt 與參考圖風格相異時仍具高容錯與適應能力,顯著降低了以往使用風格參考時常見的「主題洩漏(subject leakage)」問題,確保創作者仍能以既有風格輸出新內容而不致混入未預期物件或人物,提升產出品質與穩定度。

此外,Midjourney 本次更新特別推出 --sref random 模式,允許系統於風格庫中隨機選擇貼合但更為多樣的新風格,並自動轉換生成一組獨特 sref 編碼,賦予創意以意想不到的突破,既保留設計趣味也促進風格嘗試。對於偏好延續舊版風格碼的使用者,Midjourney 同時提供雙選項:一是切換至 V6 模型,二是在 V7 指令中加入 --sv 4 參數,即可呼叫舊版風格參考模型,維持原本風格一致性。

值得注意的是,此次 sref V7 的升級不只對單圖風格輸出有所加值,也同步優化了「moodboards 心情板」功能,其準確度與風格調和力皆有明顯提升,意味多圖 moodboard 的整體風格一致性更加穩定,專業設計應用將受益匪淺。若先前未曾嘗試 Style Reference 功能,用戶只需於網頁端將參考圖拖放至提示列風格區,或於 Discord/dev 指令中以 --sref <URL> 加入參考圖,即可喚起 V7 模型依照參考圖樣式進行圖像生成,使文字 prompt 與圖像風格達成高層次整合。

Midjourney 官方也持續鼓勵使用者將新創作品分享到 sref-showcase 頻道,並於 ideas‑and‑features 提出回饋意見,顯示 Midjourney 團隊希望與創作者形成即時互動與產品共創模式。整體而言,本次 V7 style reference 的正式上線與全面預設,不僅提升了 AI 繪圖 在風格應用與創作者體驗上的專業程度,也穩固了 Midjourney 在 AI 藝術創新領域的領導地位。

當前 Midjourney V7 模型於 2025 年 4 月 4 日才正式發布,內建已包含更快的渲染速度、畫質細節與多參數兼容性,也同步引入 Draft Mode、語音提示與 Omni Reference 等新功能,這次 sref V7 更新無疑為其核心競爭力再添重磅利器,讓使用者在 prompt 操作與風格一致性追求上,能更精準、更省力、更富創造性。

對於設計師與創作者而言,這意味 Midjourney 不僅是 AI 繪圖 的工具,更具備近乎「視覺風格控制中樞」之定位。在生成速度與品質同步優化後,V7 style reference 的亮相應該會成為推動 AI 圖像技術在商業、廣告、品牌設計與視覺藝術領域應用的重要動力。儘管目前仍可透過設定呼叫舊版風格,但顯而易見地,Midjourney 正試圖透過一套更新更智慧的風格參考體系,將原先依賴文字描述或 moodboard 整合的技術,提升為一種更具預測性與延展性的視覺控制機制,進一步鞏固平台效益,吸引更多專業/半專業創作者長期投入與創作。

進一步閱讀
  1. ​Midjourney V7 大幅提速,生成成本腰斬,推出新實驗模式
  2. Midjourney V7 推出 Omni-Reference
  3. Midjourney V7 優化準確性及手部呈現,並推出 exp 實驗性參數
  4. Midjourney V7 推出全新編輯器與 Weird 參數
  5. Midjourney V7 持續升級:導入 V6 熱門功能、AI 輔助提示與用戶回饋加速進化
  6. Midjourney V7 Alpha 版本震撼發布