【百度快照】大家注意了,百度快照算法又变了

本文由 黑喵SEM博客 于 2013-2-18 21:47 发布在  SEO教程    

一直以来,部分站长对百度快照的更新时间都存在一些误解,认为网站的快照更新时间与网站的权重状态存在一定关系,快照更新越频繁,网站的权重越高,反之,越低。
而实际上,网站快照的更新频率与权重并不存在任何直接的关系。
百度快照为什么会更新?
首先,需要澄清一下网页的抓取频率和快照的更新频率是完全不同的两个概念。
每一个被百度收录的网站,baiduspider都会根据其网站内容更新的频率不断的检查有无新网页产生,通常情况下,Baiduspider的抓取频率会和网站产生新内容的速度相符,通常说的更新,是指Baiduspider对网页内容的抓取。
每个新抓取或者新检查过的网页,我们都会根据其重要程度以及其时效性价值以不同的速度去创建索引,通常所说的快照更新时间是指索引时间,一些经常有重要内容更新的网页,我们会以更快的速度创建索引。如果一个网页只是一般的文字变更或者内容没有时效性的价值,并不一定会被搜索引擎认为有快速更新索引的价值,即便百度蜘蛛重新抓取了该网页内容,其快照也不一定会快速更新,但这并不意味着它不重要或者百度更新的速度很慢。
快照时间为什么会倒退?
一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。这对网站在搜索引擎中的表现无任何影响,也并不代表搜索引擎对该网站做了降权处理。  
综上,快照的更新与页面中是否出现重要新增内容有直接关联,而与网站本身的“权重”、是否“被K”并无直接关联。站长不必过多关注网站的快照时间,我们建议站长将精力集中在网站的内容建设中,只有提高网站的内容价值和检索体验,方可受到用户和搜索引擎的信赖。

标签: seo 百度快照 百度SEO

评论:

黑喵SEM博客    2015-01-18 21:49
首先,百度爬虫是对等分布式爬虫,不同爬虫服务器也会同时运行N个爬虫。爬虫是有不同种类的,好的域名更新快速的新闻源的分配快速更新爬虫,被降权的也有相应爬虫负责。网站域名分配的服务器好坏和网站本身的权重由关系的,内容质量更新频率等。
爬虫爬行后下载收录快照,建立倒排索引,因为索引庞大,不同的分词会得到不同的网页快照时间。
同一个网页存在不同快照就是这样产生的。
再说第一段,好的网站,权重好的域名分配的爬虫和服务器是不一样的,更新频率收录率等都要比普通网站好很多。还有就是快照的时间也会快速更新。
看快照时间评价网站权重是有道理的

发表评论:

黑喵SEM管理黑喵SEM-关于网络营销SEM和SEO的那些事儿黑喵SEM和SEO的那些事儿手机版RSS留言给黑喵SEM关于黑喵SEM

All Rights Reserved. Powered by emlog & Themes by 易玩稀有
京ICP备13018586号 sitemap