sitemap.xml怎么写?百度收录必备的网站地图教程

不少站长把 sitemap.xml 当成「交了就能收录」的开关,结果提交了仍长期无收录;也有人从不做地图,百度只能靠零散链接慢慢发现页面。本文讲 sitemap.xml 怎么写、WordPress 怎么生成,以及如何与 robots、站长平台配合,适合新站按步骤操作。

先厘清:网站地图管的是「告诉搜索引擎有哪些 URL」,不保证收录;收录还看内容质量、抓取是否被拦、站点信任度等。

一、sitemap.xml 是干什么的?

它是放在站点上的 XML 格式 URL 列表,常见路径如:

  • http://110.42.229.57/sitemap_index.xml(Rank Math 索引地图,备案前用当前站点地址)
  • 备案通过后改为 https://www.seohut.cn/sitemap_index.xml

作用包括:列出希望爬虫重点发现的页面、可选标注最后修改时间等,方便百度等搜索引擎发现与更新,尤其对新站、栏目多的站更有帮助。

它与 robots.txt 分工不同:robots 管能不能抓,sitemap 管有哪些页值得看。两者建议在
robots.txt怎么写里用 Sitemap: 一行互相指向,避免只提交地图却误拦爬虫。

二、和 HTML 网站地图、站内链接的区别

类型 给谁看 是否替代 XML sitemap
XML sitemap 搜索引擎爬虫 百度收录辅助,本篇重点
HTML 网站地图页 访客浏览 不能代替 XML,可并存
正文内链 用户 + 爬虫 传递权重,与地图互补

三、手写 XML 的最小结构(了解即可)

小站或静态页可手写;WordPress 一般用插件自动生成,不必手搓。标准单页示例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.seohut.cn/seo-shenme/</loc>
    <lastmod>2026-05-27</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

字段说明:

  • loc:完整 URL,必须可访问,与首选域一致(备案后统一 https://www);
  • lastmod:最后修改日期,宜真实,勿批量造假;
  • changefreq / priority:提示性字段,百度不严格按数值排序,不必过度纠结。

URL 超过约 5 万条或体积过大时,需拆分为多个 sitemap 并用索引文件(sitemap index)汇总——Rank Math 默认就是这种结构。

四、WordPress + Rank Math 怎么生成

  1. 安装并启用 Rank Math SEO,在「Sitemap 设置」中开启 XML 站点地图;
  2. 浏览器访问 /sitemap_index.xml,应返回 XML 而非 404;
  3. 在「要包含的文章类型」中勾选文章、页面等需要收录的类型,排除无用归档(如空标签页可按需关闭);
  4. robots.txt 增加一行:Sitemap: 你的完整 sitemap_index 地址
  5. 发布新文后地图会自动更新,无需每次手改文件。

备案前用 IP 建站时,地图里的 loc 往往是 IP 域名;备案通过、站点地址改为 https://www 后,需在 WordPress 站点地址、Rank Math、robots、站长平台里统一换新域名,并重新提交地图,否则会出现「提交了旧地址」的假象。

五、百度怎么提交网站地图

IP 站阶段往往无法在百度搜索资源平台完成站点验证,可先把地图配好、写在 robots 里,等域名备案通过再验证提交。验证通过后建议:

  1. 登录百度搜索资源平台,添加并验证站点(首选域与 WordPress 一致);
  2. 在「普通收录」或「Sitemap」相关入口提交 sitemap_index.xml 完整 URL;
  3. 配合「URL 提交」「抓取诊断」观察是否可访问重点页面;
  4. 定期看收录与索引数据,不要只提交一次就不管。

具体操作路径与按钮位置,可参考本站
百度站长工具怎么用一文;验证与提交都依赖已备案可访问的域名,与当前 IP 建站阶段要分开理解。

六、提交了 sitemap 仍不收录?先查这 5 项

  • robots 误拦:是否 Disallow: / 或封了重要目录;
  • 地图地址错误:http/https、www/裸域、IP 与正式域混用;
  • 页面本身问题:空白、极短、大量重复、未发布;
  • 新站观察期:正常,持续更新优质内容;
  • 只交地图不做站内优化:TDK、内链、速度等需同步。

按清单逐项排查,可对照
百度不收录怎么办中的 5 个解决方法,不要反复盲目重提同一份错误地图。

七、发布前检查清单

  • /sitemap_index.xml 可访问,返回 200;
  • 地图内 URL 与前台链接一致,无大量 404;
  • robots.txtSitemap: 地址正确;
  • 未把重要栏目从 Rank Math 地图中误排除;
  • 备案后已更新域名并在站长平台重新提交。

后期可拓展方向

(权重提升后可补充:新闻/图片/视频专用 sitemap、多语言 hreflang 地图、大站拆分策略、日志里抓取频次与地图 URL 对比、与 IndexNow 等推送方式配合。)

常见问题(FAQ)

sitemap.xml 必须手写吗?

不必。WordPress 用 Rank Math、Yoast 等插件可自动生成并随发文更新;手写适合纯静态小站。

提交了 sitemap 百度就一定会收录吗?

不会。sitemap 帮助发现 URL,是否收录取决于页面质量、站点状况、是否被 robots 或 noindex 限制等。

sitemap_index.xml 和 sitemap.xml 有什么区别?

索引文件列出多个子地图;单文件 sitemap 直接列 URL。文章多的 WordPress 站常见索引 + 子地图结构,提交索引地址即可。

地图里要放多少 URL?有没有上限?

单个 sitemap 建议不超过 5 万条 URL、未压缩体积约 50MB 内;超出需拆分。新站通常远不到上限,重点是 URL 有效、可抓取。