Google 搜尋 API 文檔洩密事件:排名演算法內幕

Google 搜尋 API 文檔洩密事件:排名演算法內幕

2024年3月13日,一個名為 yoshi-code-bot 的自動化工具將數千份 Google 內部的 Content API Warehouse 文檔上傳至 GitHub 公共庫,這些文檔於5月7日被撤回。這次洩密事件讓許多人看到了 Google 搜尋排名算法的內部運作,並引發了 SEO 界的廣泛關注和討論。

洩密文檔的主要內容

這次洩密的文檔包含超過2,500頁,描述了 Google 搜尋 API 的功能和內部系統。以下是文檔中露出的主要內容:

排名信號

  1. 文檔揭示了 Google 使用的多種排名信號,包括點擊數據、Chrome 瀏覽器數據、內容新鮮度、作者資訊等。
  2. 具體系統和功能包括 NavBoost、Glue、Compressed Quality Signals 等,這些系統使用點擊數據來影響排名。

點擊數據的使用

文檔顯示 Google 使用點擊數據(如 “goodClicks”、“badClicks”)來影響搜尋結果的排名,這與 Google 過去否認使用點擊數據的聲明相矛盾。

Chrome 瀏覽器數據

文檔顯示 Google 使用 Chrome 瀏覽器數據作為排名信號的一部分,這與 Google 過去否認使用 Chrome 數據的聲明相矛盾。

網站權威性

文檔中提到的 “siteAuthority” 分數表明,Google 確實衡量網站的整體權威性,這與 Google 過去否認存在網站權威性評分的聲明相矛盾。

其他排名因素

文檔還揭示了其他影響排名的因素,如內容新鮮度、作者資訊、頁面標題與內容的一致性等。

業界相關的討論及回應

Rand Fishkin 和 Michael King 的分析

  1. SEO 專家 Rand Fishkin 和 Michael King 分析了這些文檔,並指出這些文檔揭示了 Google 搜尋排名算法的內部細節,這些細節與 Google 過去的公開聲明存在矛盾。
  2. Fishkin 表示,這次洩密事件是 SEO 界歷史上最大的事件之一,並建議所有 SEO 專業人士都應該查看這些文檔。

Rand Fishkin 的發文受到業內人士廣泛的討論及分享。來源:Rand Fishkin X

SEO 界的反應

  1. SEO 專家對這次洩密事件反應不一,有些人認為這證實了 Google 的不誠實,而另一些人則建議謹慎解讀這些資訊,因為這些文檔可能僅用於測試或內部項目。
  2. SEO 顧問 Aleyda Solis 表示,這次洩密事件可能會損害 Google 與網站所有者之間的信任,因為文檔中的資訊與 Google 過去的公開聲明存在矛盾。
  3. SEO 專家 Barry Schwartz 在 X 上針對 Google 官方回應後所作的線上調查,近 90% 的業界人士不信任 Google 未來的發展。

在 Google 所作的回應之後, Barry Schwartz 所作的線上調查
來源:Barry Schwartz X

Google 的回應

根據 The Verge 的報導, Google 發言人 Davis Thompson 在一封電子郵件中告訴 The Verge : “我們警告不要根據斷章取義、過時或不完整的資訊對搜尋做出不準確的假設。” “我們分享了有關搜尋如何運作以及我們的系統權衡因素類型的大量資訊,同時還努力保護我們結果的完整性免遭操縱。” 在 5月 29日, The Verge 多次就洩密事件的真實性提出置評請求,Google 並未做出回應。

洩密事件的影響

洩密事件引發了對 Google 透明度的質疑,特別是文檔中的資訊與 Google 過去的公開聲明存在矛盾,這可能會損害網站所有者和內容創作者對 Google 的信任。

結語

這次 Google 排名算法的曝光,揭示了許多此前不為人知或被 Google 否認的排名因素,包括使用者點擊行為、 Chrome 資料、網站權威性、作者信譽等。曝光的14,000個排名因素來自 Google 內部的 API 文件,其真實性已得到前 Google 員工的證實。

這些曝光資訊證實了許多 SEO 長期以來的猜測和理論,同時也顯示 Google 在公開場合的言論與其內部實際運作並不一致。這凸顯了 SEO 領域從業者和報導者保持獨立、客觀、懷疑態度的重要性,不應盲目相信 Google 的官方聲明。

此次曝光進一步揭示了 Google 搜尋引擎排名機制的複雜性和黑箱操作問題。儘管仍有許多細節尚不明朗,但對網站質量、使用者體驗、外部連結等因素的重視再次得到印證。這對 SEO 從業者來說,意味著應該著眼於提升網站整體價值,而非過度依賴所謂的”排名技巧”。同時對普通用戶而言,也需要提高甄別資訊的能力,不能將搜尋引擎視為”真理”的代名詞。