Google 只檢索網頁前 2MB!你的重要內容有沒有落在這個範圍內?

Google 只檢索網頁前 2MB!你的重要內容有沒有落在這個範圍內?

如果你有在經營網站或部落格,這次有一個跟 SEO 直接相關的重要更新一定要知道。根據 Google 官方搜尋中心的說明,負責幫 Google「閱讀」你網站內容的爬蟲程式 Googlebot,其實有一個很多人不知道的限制:它只會讀取網頁的前 2MB 內容,超過的部分直接忽略不計。對一般網站管理員來說,這個細節很容易被忽略,但卻可能悄悄影響你的 Google 搜尋排名。這篇文章就來帶大家了解這個限制的來龍去脈,以及怎麼用一個免費工具快速自我檢測。

Googlebot 是什麼?它為什麼只讀 2MB?

Googlebot 就是 Google 派去「閱讀」世界上每一個網頁的自動程式,它會定期拜訪你的網站、把內容帶回去給 Google 分析,然後才會決定你的網站要出現在哪一些搜尋結果裡。根據官網的介紹,Googlebot 分成兩種版本:模擬手機用戶的 Googlebot Smartphone 和模擬電腦用戶的 Googlebot 電腦版,而且目前大多數情況下,Google 是以手機版的瀏覽方式為主來替網站建立索引。這次的 2MB 限制,正是官方文件更新後才讓更多人注意到的技術細節。

2MB 限制的實際意義是什麼?

根據官網的介紹,Googlebot 只會抓取支援檔案類型的前 2MB 的未壓縮內容,PDF 檔案則有較寬鬆的前 64MB 限制。值得注意的是,這個 2MB 是指 HTML 本身,網頁裡引用的 CSS、JavaScript 等外部資源也各自受到相同大小限制,但圖片的上限則是 15MB。對大多數網站來說,一般的文章或頁面幾乎不可能超過 2MB,但如果網站使用了大量 Base64 編碼嵌入的圖片或字型,就可能在不知不覺中讓 HTML 體積暴增,導致部分重要內容落在 Googlebot 看不到的範圍之外。

相關文章

Will it Crawl?一個讓你秒懂的免費檢測工具

這次要介紹的工具叫做 Will it Crawl?,是由國外開發者專門針對這個 2MB 問題打造的免費線上工具。操作方式非常直覺,只需要把想檢測的網址貼入欄位、按下「Check Now」,工具就會立即回傳分析結果,告訴你這個網頁有沒有超出 Googlebot 的檢索範圍。對不熟悉瀏覽器開發者工具的人來說,這款工具可以說是最低門檻的替代選擇。實際上,只要 30 秒就能完成檢測,完全不需要任何帳號或安裝。

檢測結果怎麼看?數字背後代表什麼意思?

輸入網址並完成分析後,頁面會顯示一個清楚的視覺化報告,包含:總頁面大小、可被 Googlebot 抓取的比例、無法被抓取的比例,以及對應舊版 15MB 限制的比較數據。如果結果出現綠色勾勾,表示這個網頁完全在 2MB 範圍以內,Google 可以完整讀取;如果出現紅色標記,就代表有部分內容超出限制,Google 可能根本看不到那些內容。對經營網站的人來說,這個視覺化的呈現方式讓問題一目了然,省去不少自己判斷的麻煩。

哪些人最需要定期做這項檢測?

對一般部落客來說,文章頁通常非常輕量,幾乎不可能踩到 2MB 的上限。但對於以下幾種情況就特別值得留意:電商網站的商品頁(頁面往往包含大量 HTML 結構)、有使用大型頁面生成器(Page Builder)所建立的網頁、以及直接把圖片轉成 Base64 格式內嵌在 HTML 裡的開發作法。實際上,許多開發者在優化效能時會把小圖或字型以 Base64 方式嵌入,這在無意間就會讓頁面體積快速膨脹。對這些情境的網站管理員來說,Will it Crawl 是一個值得加入定期 SEO 健診流程的小工具。

操作步驟:怎麼用 Will it Crawl 檢測你的網頁?

Will it Crawl的使用步驟非常簡單:

1.開啟 Will it Crawl? 網站,在輸入欄位貼上你想檢測的網頁網址,點選「Check Now」按鈕。

Google 只檢索網頁前 2MB!你的重要內容有沒有落在這個範圍內?

2.等候數秒,系統即會顯示完整的分析結果,對照結果中的綠色/紅色標記,判斷網頁是否在安全範圍內。

Google 只檢索網頁前 2MB!你的重要內容有沒有落在這個範圍內?

整個過程不需要登入帳號,也不需要安裝任何套件,任何人都可以直接使用。如果遇到 Will it Crawl 暫時無法存取,也可以試試另一個功能相似的替代工具:G-Bot Limit Checker,同樣免費且不需要註冊。

Google 只檢索網頁前 2MB!你的重要內容有沒有落在這個範圍內?

總結:

對大多數以文字內容為主的部落格或新聞網站來說,超過 2MB 的機率非常低,這個限制不太可能造成明顯影響。不過,這次 Google 官方把舊版的 15MB 上限大幅調降到 2MB,確實是一個值得技術 SEO 從業者重視的改動。對有在認真做 SEO 的網站來說,養成定期用 Will it Crawl 做一次快速檢測的習慣,可以讓你更有把握 Google 是否有完整讀取你的每一頁重要內容,也是一個成本極低、但回報明確的 SEO 好習慣。


工具資訊
- 工具名稱:Will it Crawl?
- 官方網站https://willitcrawl.com/
- 費用:完全免費
- 操作難度:★☆☆☆☆(非常簡單)