sitemap和主动推送有什么区别?

作者:外链秒收录平台      来源:原创      时间:2020-12-27 01:15:46      点击:

对于新网站如何快速收录,很多SEOer在网站刚上线的时候就非常关注。而且收录速度也成了领导者经常追问的一个问题,那么如何通过使用百度链接提交工具快速收录我们的新站呢?

引入链接提交工具之前,首先要做的就是在百度站长平台上验证网站,只有通过了验证之后,我们才可以使用百度站长平台的链接提交工具和其他工具。以下是验证新站点的基本流程:

登入百度站长平台,选择左边“我的网站”栏目下的“网站管理”选项,然后点击右边“添加网站”,如下图:

此时,跳入添加网站的环节,分两步,一是输入您新站的域名,再对网站进行验证工作,如下:

上面的例子,重点需要说明一下,比如红框中的文字,最好是验证我们的主域名(比如http://www.mfyp33.com)这样在以后再添加二级域名时直接选择子链就可以了,不用再验证网站。此外,如果主域名是一个vip站点,那么子域名也将继承主域名的vip权限。

如果没有此权限,则将无法进行单独验证,也无法继承vip权限。输入主域名后,我们直接点击下一步,选择验证站点(文件验证,HTML标签验证,CNAME验证),然后按说明部署到我们的站点,点击验证按钮。

站点通过验证后,就可以使用链接提交工具了,目前的链接提交工具分为自动提交和手动提交两个部分,顾名思义,手工复制粘贴来提交,比较简单,我就不多说了。在自动提交方面,分为:网站链接页,主动推送,自动推送三种方式。这三个网站都是自动将网站自己的网址推到百度,然后等待百度爬虫来抓页。终极目标相同。如您不熟悉这三种自动推送的安装方式,请访问以下链接:http://zhanzhang.baidu.com/college/courseinfo?ID=267&page=2)用于安装配置。这篇文章主要讨论三个方面的注意事项和区别:

Sitemap提交:在配置sitemap文件时,可以是txt格式的文本文档,也可以是xml格式的文件。没有人建议把它的sitemap文件名命名为sitemap.txt或sitemap.xml,这样容易被所有人知道。这样做的话,你的竞争对手或者需要你网站内容的人会很容易地得到你所有的网页url。为了安全起见,还是使用一些自己定义的比较复杂的文件名。每个url必须包含http://,url不能包含超过50,000条,单个文件大小不能超过10MB,一个网站最多可以提交50,000个网站日志文件,超过50,000条将不再进行处理,并且将提示“链接数超”。如网站是通过子域名形式验证的。因此,主域名下的sitemap文件可以包含该域名下所有域名的url。

积极推送:与sitemap相比,在及时抓取方面,它推送更快,发现更快,抓取更及时。假如是时效性文章不排除其收录速度达到瞬间的效率,在此特别建议,最好是主动推送我们网站第一时间产生的新内容给百度其效果更好;主动推送是有推送数量限制的,尽量不要向百度推送重复内容。这将极大地浪费自己的推送资源。

AutoPush:就是我们在每个网页上部署js代码,当有用户访问时,就会触发这个代码,它会自动把当前网页的url推送到百度。要注意的是,该代码可以在PC站和移动站中使用。它是一款非常及时方便的轻量级链接推送工具。

六月二十二日,智联招聘推出了一个新的网站。这个网站实际上在21号上线。但是因为还要进行在线调试,所以在21号robots封禁了所有爬虫的抓取。但因为网站在建立之初就添加了自动推送的代码,然后导致21号上线,至今尚未解禁爬虫,百度爬虫就来抓取,并收录了首页。如下图(负责网站的同事保留了截图):

于是大家也看到了,因为安装是自动推送,网站只要一进入,马上就会推送到百度,爬虫第一时间抓取,然后快速收录,这样的效率,还能有谁呢?

仅仅是21号的第一天,然后在22号的时候我们会再次使用主动推配置。接着它的效果在百度站长工具的抓取频率上可以看到,如下图:

在新站上线的第二天,主动推送配置完成之后,我们将预先准备的内容页面和列表页面利用主动推送一次性进行推送。接着,上面的图片显示了它的效果。自然,随后抓取减少也与我们每天发表的文章数量有直接关系。sitemap又于6月28日提交,当天的抓拍如上图所示,再次上扬。下面的图片是爬虫访问sitemap获取的url数量,它的效果很糟糕!

为什么三个都要同时使用呢?以下是关于Sitemap,主动推送,自动推送的不同之处:

Sitemap是一个容器,它能存储大量的历史数据。他把网站上的所有url都装进去了。有人认为,快速抓取并不完全依赖于sitemap的提交方式,但是对于已经生成的文章、已存在的列表页、tag标签页等等来说,都是最好的选择,而且,当我们的页面发生更改时,主动推送也不一定会再次出现,因为毕竟,主动推送承担更多的是对新生成页面的及时推送,最重要的是有最大的限制;另外,自动推送也是。若您修改了历史页面,则无法访问它。这样就不会触发自动推送js代码,当然也就不会将代码推给百度了。因此,归根结底,sitemap是对已生成的文章页面、已存在的列表页面、tag标签页面的最大补充。

积极推,虽然有推数量上的限制,但是我们推后的抓取速度已经很好的通过智联招聘新站的例子来说明。因此,积极推送应该更多地承担对新生成的URL的及时推送。

在页面被访问的情况下,可以自动进行推送。然后,访问和未访问的都是热页或冷页概念。sitemap没有访问过,当冷门页面出现时也会自动推送。但是对于热门页面来说,用户都很喜欢。对搜索引擎的需求也会很大,这类页面是我们获取流量的重要页面,如果它们不被收录,除了sitemap,主动推送之外,还可以更频繁地使用自动推送来推送。那么被抓到或者收录的几率会多还是少呢?并且这种相对于sitemap和主动推送实现来说成本比较低,加段代码就可以了,何必呢?

因此,综合以上几个案例,还是有差别的。极力推荐你安装它的三个自动推送工具,并让它们一起工作,将抓取和收录的价值最大化。


温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="http://www.mfyp33.com/" target="_blank">外链秒收录平台</a>