sitemap.xml怎么写?百度收录必备的网站地图教程
不少站长把 sitemap.xml 当成「交了就能收录」的开关,结果提交了仍长期无收录;也有人从不做地图,百度只能靠零散链接慢慢发现页面。本文讲 sitemap.xml 怎么写、WordPress 怎么生成,以及如何与 robots、站长平台配合,适合新站按步骤操作。
先厘清:网站地图管的是「告诉搜索引擎有哪些 URL」,不保证收录;收录还看内容质量、抓取是否被拦、站点信任度等。
一、sitemap.xml 是干什么的?
它是放在站点上的 XML 格式 URL 列表,常见路径如:
http://110.42.229.57/sitemap_index.xml(Rank Math 索引地图,备案前用当前站点地址)- 备案通过后改为
https://www.seohut.cn/sitemap_index.xml
作用包括:列出希望爬虫重点发现的页面、可选标注最后修改时间等,方便百度等搜索引擎发现与更新,尤其对新站、栏目多的站更有帮助。
它与 robots.txt 分工不同:robots 管能不能抓,sitemap 管有哪些页值得看。两者建议在
robots.txt怎么写里用 Sitemap: 一行互相指向,避免只提交地图却误拦爬虫。
二、和 HTML 网站地图、站内链接的区别
| 类型 | 给谁看 | 是否替代 XML sitemap |
|---|---|---|
| XML sitemap | 搜索引擎爬虫 | 百度收录辅助,本篇重点 |
| HTML 网站地图页 | 访客浏览 | 不能代替 XML,可并存 |
| 正文内链 | 用户 + 爬虫 | 传递权重,与地图互补 |
三、手写 XML 的最小结构(了解即可)
小站或静态页可手写;WordPress 一般用插件自动生成,不必手搓。标准单页示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.seohut.cn/seo-shenme/</loc>
<lastmod>2026-05-27</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
字段说明:
loc:完整 URL,必须可访问,与首选域一致(备案后统一 https://www);lastmod:最后修改日期,宜真实,勿批量造假;changefreq/priority:提示性字段,百度不严格按数值排序,不必过度纠结。
URL 超过约 5 万条或体积过大时,需拆分为多个 sitemap 并用索引文件(sitemap index)汇总——Rank Math 默认就是这种结构。
四、WordPress + Rank Math 怎么生成
- 安装并启用 Rank Math SEO,在「Sitemap 设置」中开启 XML 站点地图;
- 浏览器访问
/sitemap_index.xml,应返回 XML 而非 404; - 在「要包含的文章类型」中勾选文章、页面等需要收录的类型,排除无用归档(如空标签页可按需关闭);
- 在
robots.txt增加一行:Sitemap: 你的完整 sitemap_index 地址; - 发布新文后地图会自动更新,无需每次手改文件。
备案前用 IP 建站时,地图里的 loc 往往是 IP 域名;备案通过、站点地址改为 https://www 后,需在 WordPress 站点地址、Rank Math、robots、站长平台里统一换新域名,并重新提交地图,否则会出现「提交了旧地址」的假象。
五、百度怎么提交网站地图
IP 站阶段往往无法在百度搜索资源平台完成站点验证,可先把地图配好、写在 robots 里,等域名备案通过再验证提交。验证通过后建议:
- 登录百度搜索资源平台,添加并验证站点(首选域与 WordPress 一致);
- 在「普通收录」或「Sitemap」相关入口提交
sitemap_index.xml完整 URL; - 配合「URL 提交」「抓取诊断」观察是否可访问重点页面;
- 定期看收录与索引数据,不要只提交一次就不管。
具体操作路径与按钮位置,可参考本站
百度站长工具怎么用一文;验证与提交都依赖已备案可访问的域名,与当前 IP 建站阶段要分开理解。
六、提交了 sitemap 仍不收录?先查这 5 项
- robots 误拦:是否
Disallow: /或封了重要目录; - 地图地址错误:http/https、www/裸域、IP 与正式域混用;
- 页面本身问题:空白、极短、大量重复、未发布;
- 新站观察期:正常,持续更新优质内容;
- 只交地图不做站内优化:TDK、内链、速度等需同步。
按清单逐项排查,可对照
百度不收录怎么办中的 5 个解决方法,不要反复盲目重提同一份错误地图。
七、发布前检查清单
/sitemap_index.xml可访问,返回 200;- 地图内 URL 与前台链接一致,无大量 404;
robots.txt中Sitemap:地址正确;- 未把重要栏目从 Rank Math 地图中误排除;
- 备案后已更新域名并在站长平台重新提交。
后期可拓展方向
(权重提升后可补充:新闻/图片/视频专用 sitemap、多语言 hreflang 地图、大站拆分策略、日志里抓取频次与地图 URL 对比、与 IndexNow 等推送方式配合。)
常见问题(FAQ)
sitemap.xml 必须手写吗?
不必。WordPress 用 Rank Math、Yoast 等插件可自动生成并随发文更新;手写适合纯静态小站。
提交了 sitemap 百度就一定会收录吗?
不会。sitemap 帮助发现 URL,是否收录取决于页面质量、站点状况、是否被 robots 或 noindex 限制等。
sitemap_index.xml 和 sitemap.xml 有什么区别?
索引文件列出多个子地图;单文件 sitemap 直接列 URL。文章多的 WordPress 站常见索引 + 子地图结构,提交索引地址即可。
地图里要放多少 URL?有没有上限?
单个 sitemap 建议不超过 5 万条 URL、未压缩体积约 50MB 内;超出需拆分。新站通常远不到上限,重点是 URL 有效、可抓取。