初识搜索引擎缓存机制

【导读】百度几乎每个星期都会更新一次,而且通常会选择在夜阑人静的凌晨时分更新。这里所说的更新便是搜索引擎的缓存更新。厦门SEO顾问潇湘驭文将为大家简单介绍搜索引擎的缓存机制

搜索引擎的缓存

缓存也即cache,是计算机领域非常常用的一种技术,我们最熟悉的,恐怕就是浏览器的缓存。

搜索引擎的缓存可以这样简单描述:在高速内存硬件设备开辟一块数据存储区,用来存储搜索用户的查询、索引数据、搜索的中间结果或者最终的搜索结果。缓存的大小是有限度的,不可能无限存储数据。因此搜索引擎会采取缓存更新策略和缓存淘汰策略管理维护缓存区存储的数据。

搜索引擎缓存的价值

搜索引擎缓存具有两个价值:一、加快响应搜索用户查询的速度,提高搜索用户体验;二、减少搜索引擎后台的计算量,节省计算资源。

搜索引擎的缓存更新策略对提高搜索用户的体验方面起着举足轻重的作用。

今天是2012年9月17日,在百度搜索“厦门SEO顾问”这个关键词,我们可以看到,在排名百度前十的网站中,其百度快照各异。最新的百度快照是2012年9月16日,有的是2012年9月7日,还有的是2012年5月25日。

不同网站的快照是不一样的,为何会这样?因为每个网站的更新频率和权重互异。即便是用不同关键词去搜索同一个网站,这个网站也会呈现不一样的百度快照。为何?因为搜索引擎的缓存。你搜索“厦门SEO顾问”这个词所返回的搜索结果,很有可能是搜索引擎直接在缓存区直接调用的结果。因为缓存区中直接匹配到了你的搜索,搜索引擎无需重新计算排序。

即便你的网站不断有新的更新内容,而且搜索引擎也索引了你网站的最新内容,但当你搜索某些关键词时,你依然只能看到旧的网站内容,因为缓存内容不会随着索引内容发生即时的改变。这种不一致或多或少地影响了用户体验。

搜索引擎为了让索引内容与缓存内容尽量保持一致,推出了两种缓存更新策略:缓存——索引密切耦合策略;缓存——索引非耦合策略。

关于这两种缓存更新策略的更详细内容以后再谈。有兴趣的同志,可以购买张俊林撰写的《这就是搜索引擎——核心技术详解》一书。不论你是站长,还是SEO优化专员,抑或者只是对搜索引擎感兴趣的业余人士,相信看过之后,你都会有不少的收获。

免责声明:本文由用户上传,如有错误请指正,如有侵权请留言。

(0)
上一篇 2012 年 9 月 16 日 23:03
下一篇 2012 年 9 月 18 日 23:01

相关推荐

发表回复

登录后才能评论