Sitemap 网站地图文件格式是什么?在群里聊天过程中发现有同学对网站地图的格式认知有点问题,魏艾斯博客会在本文中分享相关知识,帮助大家对 Sitemap 网站地图文件格式有一个正确认识。
一、查阅官方资料
1、老魏翻查了 Google 官方对 sitemap 的解释,找到以下内容:
What are Sitemaps?
Sitemaps are an easy way for webmasters to inform search engines about pages on their sites that are available for crawling. In its simplest form, a Sitemap is an XML file that lists URLs for a site along with additional metadata about each URL (when it was last updated, how often it usually changes, and how important it is, relative to other URLs in the site) so that search engines can more intelligently crawl the site.
里面提到了 XML、RSS、文本、google协作平台等格式,包含全部网站链接内容。其中比较规范的 sitemap.xml 是谷歌推出的网站地图格式,可以通过规范要求写出网站地图 然后通过 goolge管理员工具提交,这样google的蜘蛛就能顺着网站地图的指引,高效快速爬取网站。
2、同样的在百度搜索资源平台官方帮助里面有以下内容:
百度Sitemap支持哪些格式?百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap。
可见度娘对于网站地图的认识,和谷歌是相同的。
3、无论如何通过国内外这两大搜索引擎(站长背后的参天大树)的规矩,xml 格式的网站地图是为了更有利于搜索引擎的的抓取策略,从而提高工作效率。生成 sitemap.xml 后将其链接放在 robort.txt 里面。而且目前有很多插件可以轻松实现一键获取全站链接,后面会提到相应的插件。
4、html 格式是国内提出来,有些同学认为是网站地图格式,且提交到搜索引擎。老魏认为严格来说这个不符合搜索引擎的规定,不是真正意义上的“网站地图”。Xml 格式网站地图是要提交到搜索引擎的,你提交 html 格式文件不一定会起到相应的作用。当然 html 格式里面也包含了网站全部链接,很多 CMS 内容管理系统可以一键生成网站 html 地图放在前台网页。它可以看做是一页普通的 html 静态网页。相当于一个网站的目录,用户从这一页上可以用最少步骤、最短时间到达网站任何栏目、分类、页面、内容页等。
5、老魏想表达的意思,xml 格式的网站地图是主要的,html 是次要的。如果你给搜索引擎提交网站地图,xml 是必须要提交的,html 可提可不提;如果要在网站上添加“网站地图”这个栏目给用户看,出发点是以用户体验度为主,方便用户浏览使用,放 html 格式就没错。换个角度看,xml 格式是给搜索引擎蜘蛛(机器)抓取用的,而 html 是给用户(人类)看的,这是二者的区别。
二、网站地图 Sitemap 插件
明确了网站地图格式,常用 wordpress 程序的话可以使用 sitemap 插件一键生成。请移步Google XML Sitemaps 插件设置,如果你动手能力强也可以自己写代码生成,或者也有在线生成 sitemap 的网站。
插件的特点是文章发布后会自动更新 sitemap,做到实时更新,无需人工干预,解放了站长。自己写代码或者在线生成网站就没这么高度“自动化”了。所以老魏建议你使用插件生成,这样符合谷歌的规范,最后生成的 xml 文件不会出差错。
在本文末尾总结核心内容,如果提交到搜索引擎,就提交 xml 文件;也可以在网站显眼位置放上 xml 和 html 格式的网站地图链接,吸引蜘蛛抓取。老魏记得之前用zblog 做站群的时候,就有人这么做过,效果很好。总之大家要区分开这两种常见网站地图的格式和用法,才能发挥最大作用。
暂无评论内容