百度Sitemap工具常见问题

一、什么是Sitemap?

Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。

百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。

此外,Sitemap 与搜索排名没有关系。

二、百度Sitemap协议都支持哪些格式?

百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap。

具体格式说明及示例如下:

1.第一种格式样例:txt文本格式

在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交

http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html

此文本文件需要遵循以下指南:

  • 文本文件每行都必须有一个网址。网址中不能有换行。不应包含网址列表以外的任何信息。
  • 您必须书写完整的网址,包括 http。
  • 每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
  • 文本文件需使用 UTF-8 编码或GBK编码。

2.第二种格式样例:xml格式

您先了解单个xml数据格式如下:

<?xml version="1.0" encoding="utf-8"?> XML文件需以utf-8编码
<urlset> 必填,这是整个链接集合的定义入口,以<urlset>作为开始,</urlset>作为结束
<url> 必填,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面。
<loc>http://www.yoursite.com/yoursite.html</loc> 必填,页面链接地址,长度不得超过256字节。
<lastmod>2009-12-14</lastmod> 选填,用来指定该链接的最后更新时间
<changefreq>daily</changefreq> 选填,用这个标签告诉此链接可能会出现的更新频率
<priority>0.8</priority> 选填,可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间
</url> 必填,标签闭合
</urlset> 必填,标签闭合

上述xml sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html

若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。

3.第三种格式样例:Sitemap索引格式

如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。您无需分别提交每个文件。

<?xml version="1.0" encoding="UTF-8" ?> XML文件需以utf-8编码
<sitemapindex> 必填,以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束
<sitemap> 必填,以<sitemap>标签提交一个子sitemap文件
<loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc> 必填,识别sitemap的位置
<lastmod>2012-01-06</lastmod> 选填,识别相对sitemap文件的修改时间
</sitemap> 必填,标签闭合
</sitemapindex> 必填,标签闭合

有多个sitemap,按上述格式重复<sitemap></sitemap>之间的片断,列明所有sitemap地址,向站长平台进行提交。

三、创建sitemap时有哪些注意事项?

  • 一个sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的sitemap超过了这些限值,请将其拆分为几个小的sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
  • 一次性最多提交50个地址,提交地址的文件类型和更新周期必须一致。
  • 如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。
  • 如果验证的www.example.com,你只能提交该验证网站的网址,不能出现其他网站的网址。

四、如何提交sitemap?

第一步,将需提交的网页列表制作成一个sitemap文件,文件格式请阅读百度sitemap协议都支持哪些格式。

第二步,将sitemap文件放置在网站目录下。

比如您的网站为example.com,您已制作了一个sitemap_example.xml的sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml

第三步,登录百度站长平台,确保提交sitemap数据的网站已验证归属。

第四步,进入sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和sitemap文件地址(如:www.example.com/sitemap_example.xml),进行提交。

提交完之后,可在sitemap列表里看到提交的sitemap文件,如果sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

整体流程如下图:

百度Sitemap工具常见问题

五、我提交时填写的周期是什么含义?

百度spider会参考设置周期抓取sitemap文件,因此请根据sitemap文件内容的更新(比如增加新url)来设置。

请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。sitemap工具不能解决页面更新问题。

六、sitemap提交后,多久能被百度处理?

sitemap数据提交后,一般在1小时内百度会开始处理。处理完成的时间视文件大小和您设置的抓取周期而定。

七、提交的sitemap都会被百度抓取并收录吗?

百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。

八、我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?

可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。

九、XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?

不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

十、网址在 Sitemap 中的位置是否会影响它的使用?

不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。

十一、Sitemap中提交的url能否包含中文?

因为转码问题建议最好不要包含中文。

分类:网站运营 时间:2012-10-30 人气:4
本文关键词:
分享到:

相关文章

  • 百度站长平台1000个sitemap权限限时送出 2012-01-08

      1月21消息:今日百度站长平台推出1000个sitemap权限限时送出活动。活动日期为1月21日-1月25日,每天上午11点开始200个权限限时送出。参加活动的站长需要在百度站长平台验证站点,每天有五次抽奖机会,获得权限的站长需在30天内提交sitemap,逾期未提交,权限将被收回。   活动页面:http://zhanzhang.baidu.com/act/sitemappermit   活动规则:   参加活动的账号需已在站长平台上验证站点。   对获得sitemap权限的站点,需要在获

  • 谷歌表示小网站不需要sitemap文件也无所谓 2012-01-22

      大家都知道,在发布一个新网站的时候,最好配合一个最基本的XML Sitemap以更好的被搜索引擎索引。但其实对于小网站来说没啥必要,今天Google的John Mueller就在 Google Webmaster Help 里回答了大家的疑虑:   1、要看网站的规模大小,你不是非要有一个sitemap文件,我们也会自己索引到所有的内容。   2、当然,如果有一个sitemap文件的话,你可以随时查看独立的URL地址是否已经正确被索引了。   也就是说对于小站来说,Google完全有能力在没

  • 创建sitemap时有哪些注意事项? 2012-05-15

      一个sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的sitemap超过了这些限值,请将其拆分为几个小的sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。   一次性最多提交50个地址,提交地址的文件类型和更新周期必须一致。   如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。   如果验证的www.example.com,你只能提交该验证网站的网址,不能出现其他网站的网址。

  • dedecms(织梦) 生成网站地图Sitemap.xml 2012-06-15

    dedecms没有为我们准备好现成的生成sitemap.xml的东东,网上搜罗一圈,以下解决办法还是挺好的 只需新建一个自由列表即可,需要更新sitemap时点点更新就行.看图吧... 1.自由列表管理中,增加列表 2,按红字要求填写即可 3.要选择一个,不然不添加不成功 4.主要代码部分了,可根据需求自行编写 <url> <loc>[field:arcurl function="Gmapurl(@me)"/]</loc> <lastmod>[fi

  • Sitemap协议类型及包含范围 2012-06-20

      百度Sitemap协议支持提交收录网页列表以及死链列表。   收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及Sitemap索引文件提交。   死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。   死链列表目前只能使用文本格式在百度站长平台提交。   Sitemap文件的包含范围以主域为单位。   如果您验证了 http://www.example.com/这个网站,那么Sitemap文件中可以包含ht

  • 百度站长平台:移动sitemap协议mobile type升级 2012-06-26

      百度站长平台发布就“PC站点移动化”问题发布了公告。据公告显示,百度方面已将PC移动化方式规范化,目前主要分为三种方式:跳转适配、代码适配和自适应。且升级了移动sitemap中的mobile type标注。   如下:   百度站长平台对移动sitemap协议里的mobile type标注进行更新升级,修改了对自适应页面的标注方式,增加了对代码适配页面的标注方式。现在移动sitemap协议mobile type标注如下:   现阶段新旧方式会并行一段时间,我们希望您尽快使用新的mobile

  • 百度站长平台:sitemap工具升级版开启内测 2012-10-11

      近日,百度站长平台发布公告表示,已对百度sitemap工具进行升级,并正式开启内测。据悉,升级后的sitemap工具能支持移动站点页面的提交及收录,将优先收录优质的移动页面,但不保证所有提交的数据都能够被收录。已通过百度站长平台验证的网站可申请内测资格,若获得内测资格的用户为在60 天内使用权限,则将作废。   具体详情如下:   很高兴的通知你,百度站长平台sitemap工具全新升级并开启内测,升级后支持移动站页面的提交和收录,现在开启内测,欢迎广大站长参与内测,提出更多宝贵的建议。   

  • PHPWind的文章系统添加sitemap.xml的方法 2012-12-11

    使用PHPWind程序做论坛的有很多,有时候我们会做一些资讯页面,如果安装新的CMS系统的话会比较麻烦,而PHPWind其实也有CMS文章管理系统。 当然在这里来说一下,PHPWind程序自带的CMS如何生成标准xml格式的sitemap网站地图。 因为16楼网站前段时间正式推出了16楼资讯中心,也就是启用了PHPWind的CMS系统。但是开启文章系统之后,有一问题,那就是百度收录资讯页面不是很充分。当然这跟PHPWind本身只是一个论坛系统,而文章CMS系统只是一个附加的有一定关系。 除了调整

  • Google Sitemaps使用指南 2013-01-20

      Google Sitemaps是Google的一个和网站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都 采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通 知”Google,方便Google进行索引。   初步使用了一下Google Sitemaps,用法非常简单。   首先 在自己网站根目录上上建立一个名为GOOGLE11e5844324b7354e.ht

Copyright (C) quwantang.com, All Rights Reserved.

趣玩堂 版权所有 京ICP备15002868号

processed in 0.284 (s). 10 q(s)