XML Sitemap是SEO非常重要的檔案,XML指的是檔案格式(副檔名),而Sitemap則是指出它的用途:網址清單,它的用途就是讓我們列出網址清單、於Google Search Console(以下簡稱GSC)提交給Google。
這篇XML Sitemap的分享除了會詳細介紹它的用途,也會分享我如何用它來解決網站轉址、搬家造成的索引問題。至於在GSC的提交方式,請參考這篇文章!文章目錄:

XML Sitemap的用途:
XML Sitemap(Google的說明)最廣為人知的功能就是協助Google理解網站有哪些網址,讓它可以更有效的爬取、索引網站重要內容,但是即使沒有將這檔案提交給Google,它還是會爬取、索引網站內容,而且Google也說明「某些」情況下「不一定」需要這檔案,為何還是會建議一定要提交呢?原因:
- XML Sitemap搭配GSC的涵蓋範圍報表,可以更精準地知道Google處理網站重要網址的狀況;如果不提交XML Sitemap、而是讓Google自己想辦法,我們就無法由GSC涵蓋範圍報表獨立檢視重要網址的報告,而是全都混在一起
- 當網站有特別重要的網址(對SEO或業績很重要的文章、商品),可以將他們放在一個獨立的XML Sitemap,除了不會淹沒在XML Sitemap的眾多網址中,也能由涵蓋範圍報表更快的檢視這些重要網址的狀況
- XML Sitemap還可用來處理hreflang(Google的說明)、標準網址(參考連結)
- 建立Image的XML Sitemap有助於Google爬取、索引網站圖檔,對圖片 SEO很重要
- 提交XML Sitemap非常之簡單,還可以跟Google明示哪些網址重要、要它去看,為何要選擇放牛吃草、聽天由命的態度來處理Google的爬取?
整體而言,在評估XML Sitemap的運用時,應該要考量到網址的架構、網址的多廣、GSC的索引涵蓋範圍,如果網站是只有兩三百個網址的部落格,XML Sitemap也許沒那麼重要,但是搭配GSC的索引涵蓋範圍報表,還是檢視網站爬取跟索引狀態的重要手段。
如果網站是超大型網站,內容跟架構很複雜,不用XML Sitemap提示Google哪些是重要網頁,就是要它自己慢慢逛、隨意逛,我們也很難知道它到底有沒有逛到重點網址。即使有XML Sitemap,大型網站的爬取跟索引也是個極大的挑戰,何況是這種佛系做法!

以上是XML Sitemap的基本重點、更多介紹可參考Search Engine Journal的文章,接下來會介紹我如何用它來處理被轉址的網址、被Google判斷為錯誤但實際上可以讀取的網址,靈感來自於John Mueller的建議(他是Google的員工、跟SEO社群的主要窗口)。上面關於XML Sitemap與標準網址的關聯,也是來自於他的說明。
以XML Sitemap處理特殊網址:
John Mueller曾經建議過可將有問題的網址加到一個獨立的XML Sitemap並提交出去,讓Google知道這些網址,有機會可加快處理速度(參考連結),過一陣子後再移除這XML Sitemap。這個建議蠻實用的,在經營網站時很容易遇到因為某些原因讓我們產生無效網址,轉址需求也很常見。例:
- 頁面刪除或下架
- 網址結構轉換(轉換系統時很常見):產生無效連結,須轉址處理
- 文章合併:須轉址處理
- 將部分內容切割到全新網站:須轉址處理
無法連線或被轉址的網址,理論上不應該存在於XML Sitemap上,因為這Sitemap是用來跟Google說網站有那些重要內容,讓它將索引資源集中在這些內容。通常我也是如此處理,不管是被轉址或下架,Google還是會爬取舊網址,到時就會知道它的最新狀態。
但是….確實蠻常發生被轉址或下架的網址過了一段時間還顯示在搜尋結果頁上,用網址檢查工具看,發現Google超久沒爬取這些網址,根本不知道它的最新狀態。這時就可以考慮為這些網址建立、提交XML Sitemap,讓Google爬取這些舊內容、更新它們的狀態。
案例:將部分內容切割到全新網站
以本站為例,初始內容全都來自Travel with Leo、約40 – 50篇文章,我為每篇文章建立轉址之後就將其變成草稿,而草稿是不會顯示在WordPress的XML Sitemap上(我是用Yoast SEO生成)。我為這些內容生成一份獨立的XML Sitemap、提交到Travel with Leo的Google Search Console,除了很明確的跟Google說這些網址需要它看,也可搭配涵蓋範圍工具,檢視Google的處理進度。
不這樣處理的話,這些舊網址不存在於任一份XML Sitemap,網站前台也看不到(是草稿),又沒有外連,只能靠Google心血來潮時重新爬取,太賭運氣了。觀察的狀況是Google已經處理這XML Sitemap上八成的網址,但處理後是「這是重複網頁;已提交的網址未獲選為標準網址」,而非「頁面會重新導向」,雖然也解釋得通,但很微妙。
Google不是會爬取新網站嗎?是的,它會爬取,但我的SEO是累積在舊網址,沒有這些舊網址以301轉址將原本的SEO權重挹注到新網站,我要花很長的一段時間才能於全新的網站重建SEO成效。


案例:網站多次改版、變更網址結構
我平常也會協助維護親人的網站,該網站經過多次開發,前兩次是客製開發,後兩次是WordPress相關,網址結構非常混亂,累積了不少無效連結。問題可以分成兩段:
- 客製開發轉WordPress:同網域但網址結構不一樣,雖然設定了轉址,但依然有漏網之魚Google沒處理
- 移轉到WordPress後網域間的切割:同上述WP & SEO的例子,就算設定完整、正確的轉址,也要Google去爬取舊網址才能有進一步的更新
綜合上面兩個問題,Google Search Console的索引涵蓋範圍報告就很精彩了,有不少過往的網址是停留在「檢索異常」、「已檢索 – 目前尚未建立索引」、「已提交的網址發生檢索問題」,即使有設定正確的301轉址。
這些檢索有問題的網址不代表它們真的該被索引,我建議可以仔細查看這些網址在索引涵蓋範圍報表的狀態,如果發現有重要的舊網址,可以考慮同WP & SEO的例子,為他們建立、提交XML Sitemap,看看可否讓索引狀態正常。這邊的正常不是指狀態是GSC涵蓋範圍報表的「有效」或「有效但出現警告」,而是「頁面會重新導向」或「這是重複網頁;已提交的網址未獲選為標準網址」。



提醒事項:
- 不是每個網址都值得這樣做,如索引有問題的網址本身沒啥SEO價值、Google處不處理都無所謂,那就忽略吧
- 如果有問題的網址才一兩個,用網址檢查工具提交就好,不要殺雞用牛刀
- 所謂的「正確」要搭配你當下的情境與要解決的問題,以John Mueller舉的範例來說,他的目標是要讓Google去檢視已下架網址、將狀態變成404;而我這兩個例子的正確指的是Google去爬取我建立轉址的網址,將狀態變更為「頁面會重新導向」或「這是重複網頁;已提交的網址未獲選為標準網址」
- 最重要的一點:請想清楚自己想達成怎樣的目標,用怎樣的方式驗證是否達成,這才是真正的考驗。SEO有很多「It depends」,無法一概而論
- 覺得Google處理的差不多之後,請記得由GSC移除這些暫時性的XML Sitemap
其實….綜合這兩個例子,作法都是:
將「被轉址的網址」新增到一份暫時性的XML Sitemap,觀察Google的處理狀況。
以往我都是設定轉址後就不管它了,其實有點放牛吃草、聽天由命,不是很好,應該要好好利用XML Sitemap跟涵蓋範圍報表。當然,如果你發現涵蓋範圍有許多狀態是有問題的,Google也很久沒去看,也可用暫時性XML Sitemap處理,也是前面提到John Mueller的建議。
FAQ:
可以使用前文提到的Yoast SEO,或者All in One SEO、Rank Math等WordPress SEO外掛
根據WordPress官方說法,目前伴隨WordPress 5.5推出的XML Sitemap只包含Post、Page、Category、Tag,不包含Image、News、Video,也不包含WooCommerce的產品、產品分類,而這些在都包含在Yoast SEO的XML Sitemap內
根據Yoast SEO的官方說明,系統會自動停用WordPress 5.5內建的XML Sitemap,使用者不用做任何調整。至於其他SEO外掛如何處理,請自行搜尋相關文件
我是以付費版Screaming Frog產出包含特定網址的XML Sitemap(教學文章),免費版可以爬取500個網址並產出對應的XML Sitemap,但我不確定是否可以如同付費版一樣針對特定網址產出XML Sitemap
1. 使用Screaming Frog(免費版至多500個網址、付費版無限制) 2. Google「XML Sitemap generator」,可找到相關服務,免費版通常有使用量限制 3. 請IT開發,網路上也有現成的套件可使用 4. 自己參考範本寫,如果寫錯,提交到GSC會出現錯誤訊息
結語:
單單以小部落格索引的角度來看XML Sitemap,可能不會覺得它很重要,但它還牽涉到圖片索引、標準網址、hreflang等等SEO重要議題,而且….XML Sitemap的GSC涵蓋範圍報表無庸置疑的是SEO從業人員最需要關注的報表之一。再者,大型網站的爬取跟索引問題錯綜複雜,沒有XML Sitemap的協助,只能說是….用瞎子摸象或以管窺天的態度處理SEO的核心議題。
要善用XML Sitemap,除了要理解SEO知識、具備實作經驗,也要活用GSC,我推薦可以上連啟佑老師的SEO課程以及孟令強老師的GSC課程(Google「孟令強Google Search Console」),本篇也是結合了他們的無私分享以及我的實作經驗才能發表。
延伸閱讀:
- SEO小教室|Google Search Console驗證與提交Sitemap教學
- SEO小教室|如何用標準網址Canonical Tag處理重複性內容、與301轉址的差異
- SEO小教室|Pro Rank Tracker等五項Google排名追蹤工具比較
- 搜尋引擎最佳化SEO線上學習資源 – Google篇
- 自媒體經營分享|內容發想篇 – 心智圖、5W1H、Google搜尋等七大方式
- SEO大神Rand Fishkin(蘭德.費希金)2019年SEO排名要素研究報告讀後心得
- 2019年SEO元素週期表分享 – 內容、網站架構、HTML架構
- WordPress|內容網站SEO總整理 – 主機挑選、網站設定、內容編輯等五大面向教學