北京朗创营销,专业北京抖音代运营,北京企业产品短视频宣传片,北京广告片拍摄制作,品牌整合推广服务公司 联系我们 13683819778 |
随着互联网的不断发展,其网页无时无刻不发生着变化,例如:新网页的出现、页面内容保持更新或者原有的网页被删除等等。然而,SE为了能够把最新的网页数据快照去展现给用户,必须要对已存在网页去按照不同的时间间隔来进行重访,同时也更新SE的网页数据库。现在,就让我们一起来看看搜索引擎的网页重访策略有哪几类吧。
第一、网站的更新频率可作为主要参考标准
首先我们可以根据网页的历史更新数据来作为主要参考标准的,然后合理的判定网页的更新时间以及设定蜘蛛的重访时间。这个做法的依据是:一般在过去经常更新的网页,将来更新也会较为频繁。
第二、采取聚类抽样的策略
大家都知道,网页是有一些属性的,我们完全可以依据这些属性来预测它的更新周期。若是属性相似的网页,其更新周期也必定是相似的,所以我们可以根据这些相似的属性特征把网页进行归类,相同类别的网页一般都具有相同更新频率的,尤其是对于那些新抓取的网页,它没有历史信息的遗留积累,直接可以根据这些网页本身的属性特征来判断其所属的类别,然后设定该网页的重访频率。例如:网站首页、频道首页、专题首页、内容页面等更新频率都会不同的,并且它们的网页特征属性也是不同的,那么蜘蛛就能够根据它们所属不同的聚类合理来设定它们各自不同的重访频率。
第三、对具有有时效性要求的关键词进行特殊处理
对于那些具有时效性且要求高的关键词,比如“天气”、“黄金价格”等都要进行不间断的网页更新,有些关键词的时效性更甚是分钟级别的。所以,针对时效性强要求又高的关键词,我们必须要进行特殊处理。