sitemaps.org制定了网站地图的标准格式,方便各大搜索引擎使用,更加方便网站使用。有了标准,就意味着可以为多个搜索引擎制作一组网站地图即可,而不需要分开。提交了网站地图给搜索引擎,蜘蛛会比较高效地抓取页面,但是并非一定会全部收录。
Google 可支持多种格式的网络站点地图,但建议您根据站点地图协议创建站点地图,这是因为相同的文件也可能会提交给其他搜索引擎,例如 Bing 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
引自Google帮助的实例:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1" xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1"> <url> <loc>http://www.example.com/foo.html</loc> <image:image> <image:loc>http://example.com/image.jpg</image:loc> </image:image> <video:video> <video:content_loc>http://www.example.com/video123.flv</video:content_loc> <video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc> <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>夏季烤牛排</video:title> <video:description>每次都能烤出美味牛排</video:description> </video:video> </url> </urlset>Google的实例往往都是很高级的,有所有考虑到的可能,下面则是精简后普通的示例:
<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.focuznet.com/</loc> <lastmod>2012-12-22T10:00:01+08:00</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>下面是对sitemap.xml文件格式里的几个主要标签的含义描述:
1、<loc>是URL的绝对地址,必须用http或https开头,属于必须;
2、<lastmod>是该URL的最后一次修改时间,使用YYYY-MM-DDThh:mmTZD 格式,如果不会输出时间格式,可以不写该项,属于可选;
3、<changefreq>表示该URL的更新频率,可以设置为daily(每天) weekly(每星期) always(始终) monthly(月) never(从不,对于存档的使用该项) hourly(小时) 注意:不含括号内的内容,属于可选;
4、<priority>是该URL在整个站点的权重,是1.0~0.1之间的数值,属于可选。
sitemap.xml文件的限制:
1、必须是utf-8的编码格式;
2、每个sitemap.xml文件包含的URL建议不超过5万个URL;
3、单个sitemap.xml文件不能超过50M大小,对于超过大小的部分可将URL分别制作成多个sitemap.xml文件,在分别提交给google即可。
另外,sitemap.xml同sitemaps.xml的效果是一样的,所以不必区分。
除了XML格式的网站地图格式,谷歌(Google)还支持以下两种格式:
1、RSS、mRSS 和 Atom 1.0;
2、文本格式。
以上两种都必须是UTF-8格式。具体的请查看谷歌帮助。