腾讯云服务器优惠活动华纳云香港服务器

百度sitemap、主动推送、自动推送同时使用可加快百度收录

关于新建站点如何快速的被百度收录,是很多SEOer在网站刚刚上线时最为关注的一个问题。今天我们就谈一谈如何通过使用百度链接提交工具以达到快速的收录我们的新站。

百度sitemap、主动推送、自动推送同时使用可加快百度收录-第1张-boke112百科(boke112.com)

目前百度链接提交工具分为自动提交和手动提交两大块,手动提交顾名思义自己手动复制粘贴去提交URL,相对简单,我就不做过多说明。而自动提交中又分为:sitemap、主动推送、自动推送三种方式。三者都是将站点自身的URL自动推送至百度,而后等待百度爬虫进行对页面的抓取,最终的目的是一样的。如果对这三种自动推送的安装方式不熟悉的话,可以参考该链接(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2)进行配置安装。本文我重点聊一下三者的注意事项和区别:

Sitemap提交:在配置sitemap文件时,无论是txt格式的文本文档还是还是xml格式的文件,都不建议将其sitemap的文件名命名为sitemap.txtsitemap.xml这么大众化且谁都能够知道的文件名。如果你这样设置,你的竞争对手或需要你网站内容的人很容易就能拿到你所有的页面url。出于保险起见还是使用一些自己定义的较复杂的文件名。每一个url都必须包含http://,文件中包含的url不得超过5万条,单文件大小不得超过10MB,一个站点最多提交5万个sitemap文件,超出5万个不再处理并会提示“链接数超”。如果是通过子域名的形式验证的站点。那么主域名下的sitemap文件是可以包含该域名下的所有域名的url的。

主动推送:对比sitemap而言在及时抓取上推送更快、发现更快、抓取更及时。如果是时效性文章不排除其收录速度达到一瞬间的效率,这里特别建议一下,最好是主动推送我们网站第一时间产生的新内容给百度其效果更佳;主动推送是有推送数量的限制,尽可能的不要推送重复的内容给百度,否则就会大大浪费自己的可推送资源。具体可参考《WordPress添加百度实时推送功能》添加主动推送功能,该文已经考虑到重复推送的问题。

自动推送:是我们将一段js代码部署到我们的每一个网页中,当有用户进行访问时,触发了这段代码,这段代码自动将当前页面的url推送给了百度。需要注意的是这段代码无论是在PC站还是在移动站均可使用,是一个非常及时、便捷的轻量级链接推送工具。同样为了避免重复推送,建议参考《优化解决百度自动推送和360自动收录JS重复推送问题》进行优化。

在6月22日的时候,智联招聘上线了一个新的站点。该站点实际上是在21日上线的。但由于还要线上调试,在21日是robots封禁了所有爬虫的抓取。却由于网站早在建设时就添加了自动推送的代码,然后造成了21号上线,还没有解禁爬虫,百度爬虫就来抓取了,并且收录了首页。如下图(负责该站点的同事保留了截图):

百度sitemap、主动推送、自动推送同时使用可加快百度收录-第2张-boke112百科(boke112.com)

所以大家也看到了,由于自动推送的安装,网站只要被访问,立刻就推送给了百度,爬虫第一时间抓取,然后快速收录,这效率,还能有谁?

这只是第一天21号,然后在22号我们又将主动推送配置上了。然后其效果在百度站长工具的抓取频次中是可以看到的,如下图:

百度sitemap、主动推送、自动推送同时使用可加快百度收录-第3张-boke112百科(boke112.com)

这是新站上线第二天,主动推送配置后的第二天,我们把事先准备的内容页以及列表页都利用主动推送一次性进行了推送。然后上图就是其明显的效果了。当然后续抓取的下降也是和我们每天发布的文章数量有直接关系。在6月28日又提交了sitemap,当天的抓取如上图结尾处,又涨了上来。下图是爬虫访问sitemap所提取的url数量,其效果不明觉厉!

百度sitemap、主动推送、自动推送同时使用可加快百度收录-第4张-boke112百科(boke112.com)

当然,为什么三者建议一起使用呢?下面说下Sitemap、主动推送、自动推送的区别:

sitemap是一个可以容纳大体量、历史数据的容器。它将我们网站所有的url装在了里面。个人觉得快速的抓取并不完全指望sitemap的提交方式,但对于已经产生的文章、现有的列表页、tag标签页等都是最佳的选择,当我们的页面发生变化时,主动推送并不一定会再次推送,因为毕竟主动推送承担更多的是对新产生页面的及时推送,最重要的是有最大推送数量的限制;再说自动推送。如果你对历史页面进行了修改,没有被访问。那么根本不会触发自动推送js代码,当然也就不会推送给百度。所以,归其根本,sitemap是对已经产生的文章页、现有的列表页、tag标签页最大的助推工具。

主动推送,虽然有推送数量上的限制,但我们推送后的抓取速度已经通过智联招聘的新站例子很好的诠释了。所以主动推送更多的应该承担对新产生的URL的及时推送作用。

自动推送,页面被访问了,就会被推送过去。那么被访问的和没被访问的就是热门页面或冷门页面的概念。冷门没被访问我们有sitemap,以及冷门页面产生时的自动推送。但对于热门页面,用户都喜欢的页面而言。在搜索引擎上也会有很大的需求,这类页面是我们获得流量的重要页面,他们如果没有被收录,除了sitemap、主动推送外,还可以更频繁的利用自动推送进行推送。这样被抓取或者收录的几率又会大多少呢?而且这个相对sitemap和主动推送实现的成本更低些,加段代码就搞定,何乐而不为呢?

所以,综合上述的案例也好,三者的区别也罢。强烈建议你将其三个自动推送工具进行安装,并让三者协同工作,将抓取和收录价值最大化。

赞 (0) 打赏
版权声明:本文为转载文章,来源于 百度站长学院 ,版权归原作者所有!发布此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请联系我们,确认后马上更正或删除,谢谢!
香港云主机55元/年
wu