• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> 网站运营 >> 搜索引擎 >> 详细内容
 

推荐文章

  • 谷歌关于网站重复内容的10个建议
 
 

热点文章

  • 谈如何提高百度排名,让百度认可你的站
  • 世界各大搜索引擎的蜘蛛名称列表
  • 从一分钟的蜘蛛抓取看搜索引擎
  • 百度热门关键字手法大揭密
  • 百度热门关键字进首页的玩转手法大揭密
  • Google靠什么赚钱?
  • 如何用Google搜索本地硬盘
  • 分享网站快速收录的一些经验
  • 搜索引擎优化工具-网站优化工具
  • Google Adsense广告应避免18个错误
  • 搜索引擎的正确使用方法
  • 被百度降权后,网站该怎么办?
 
 

相关文章

  • 优化网站内部链接:有效引导搜索引擎抓取
  • 网站被搜索引擎降权处理方法
  • 三联生活周刊:搜索引擎需要信息民主
  • 搜索引擎知识:网页的查重技术
  • 维基百科即将升级搜索引擎 抢夺Google市场
  • 雅虎推出新版手机网络搜索引擎oneSearch2.0
  • 搜索引擎如何给的网站打分的
  • 搜索引擎垄断式推广,及对付搜索引擎的软件
  • 让搜索引擎来负责版权的登记
  • 2008搜索引擎行业三大看点
  • 搜索引擎类网站流量的分析报告
  • 搜索引擎排名秘笈及优化原理
 
 

百度搜索

 
 

搜索引擎是如何工作的?

  • 阅览次数:
  • 文章来源: http://www.seoclub.net/seo/seo_se.html
  • 原文作者:
  • 整理日期: 2008-05-12
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大

在我们踏入学习搜索引擎优化之前,也许我们最先想了解的是关于搜索引擎如何工作的问题?

当你初步的了解了搜索引擎工作的大概流程和机制,你学习seo的思路就会更加清晰。掌握seo技术也会更加迅速。

好了。废话不多说。

我们一起来看看搜索引擎到底是如何工作的吧?~~

我们这里就以google为例子吧。

其实搜索引擎的工作大概流程如下:


(按上图所示分左边右边来看搜索引擎是如何工作的)

看了上面的图片后其实基本我们都明白了。如果还不明白请继续看下文:

首先:是搜索者在搜索引擎上敲下了关键词。
比如:seo俱乐部
也就是上面图片中左上部分:
第一步,匹配搜索请求。据说他们会把用户输入进去的关键词,比如什么的seo俱乐部,称作“搜索项”。

用户一旦输入搜索项然后敲下了回车后,搜索引擎就开始分析搜索请求了-----检查搜索引擎请求的每个搜索项,并且将作一件令人很多seoer紧张的事情:把哪个网页放在第一位,第二位,第三位。。。
而哪些作为分析的依据可能不同的搜索引擎有所不同或者有所侧重。但这一步基本是一样的。

比如这期间会有(以下东西说起来就比较深奥和繁琐,不一一详细解说了):
发现词的变体和矫正拼写:查找词组,非词组和停止词(像英文里,同样一个量词,但是有复数和单数,搜索引擎会根据这些微末的信息做出不同的判断;比如输错字的情况怎么提供答案。你可以试试在搜索引擎里输入:“举乐部”,谷歌就会问你:“您是不是要找:俱乐部!”没错,“俱乐部”正才正是我要找的。

接着会进入上图的右边部分的工作,按匹配搜索请求到分析搜索请求的这个过程里,将会进行以下步骤的处理:

A:检查词组,非词组和停止词:
检查词组和非词组.就是说当搜索者输入搜索请求时,搜索引擎会进行分析判断后作出一种过滤.把一个短句中认为是非词组的给过滤掉,然后又判断哪些词组作为关键词进行搜索,最后按分析的各页面的最合适的页面排序显示出来.
比如当我们搜索”一种绿茶”,很可能” 一种”会被判定成非词组.
另外像一种,一张,一个,这些词,搜索引擎一般不会去搜索他们,被称之为”停词(stop word)”.对于中文来说,我们一般会去以这些词来命名于产品.所以几乎也没有把这些词作关键词来处理.但是,在英文肯就会出现比较多.比如”The limited”

B:检查词序:
比如我们搜索”网站优化”和”优化网站”时,得到的结果一般是不一样的,这是因为搜索引擎在排序时也会考虑到词序问题.

C:处理搜索运算符号
比如”+-”号.这里用英文打比喻比较好说.
我们搜索白宫.英文: “the white house”但是这样的话搜索引擎有可能把the作为停止词给省略了,这样就会显示一些我们不想要的信息来,比如关于描述白房子(white house)的信息.

因此我们可以这样来做精确搜索 +the white house,这样就可以确保显示在最前的都是关于白宫的信息页面.

再比如:我们想搜索seoclub (它是一个提供搜索引擎优化信息的网站),但是还有一个叫seoclub tv(它是一个讲搜索引擎优化的电视台),这个时候如果我们想省略掉搜索结果里面的关于这个电视台的信息,而只把seoclub相关的信息显示在最前面.我们就可以这样写:seoclub –tv

对一个搜索引擎营销者来说,了解这些就可以避免在给产品或网站取名的时候,取一些会跟其他词一起出现的(就是需要加上类似”+-”才能搜索到的)的名字

(其实这些常被seoer来作为他们在查找信息的时候使用的一些过滤手法)

接着就到了搜索引索库了,也就是下面的第二步。

第二步:选择与搜索引擎请求匹配的结构

当我们看完上面的几个步骤后,到了这里其实也更容易理解了.只是在个匹配的搜索结果,还有一个是付费的搜索结果在内.这里就不讲了,我们只讲自然搜索.

A:选择自然搜索匹配的结果
自然搜索引擎使用搜索索引库定位最匹配的网页.基本上,通过分析搜索请求决定查找什么词-------不仅是在搜索请求中键入的那些词,还有词的所有变体(比如this 和these,或者 woman 和women),以及忽略哪些词(停止词和非词组)。搜索引擎查看搜索请求中的每个词,看哪些网页包含这些词。

搜索引索库可以被看做一个按字母顺序排列成的列表(说更通俗点,就是像一本词海或者说百科全书,具体可以查阅――如何最通用的去理解这个概念:什么是seo),列出了互联网每一个网页上的每一个词(参照下图表):


搜索引擎怎样被从索引库中找到示意.自然搜索引擎检查网页列表的索引,网页列表列出了包含搜索引擎请求中的每个词的所有网页.

以上只是一个最简单的例子。
事实上,搜索者常常不是这么单一的去搜索一个问题。比如,他不会搜索美食节,可能是广州美食节,上海美食节等等。于是,搜索引擎就要做多方面的分析判断。首先会先找出含有该关键词的所有页面,给出一个含有“广州”和“美食节”的网页列表。大多数的搜索引擎在遇到这种情况时,都是先显示同时含有“广州”和“美食节”或者是“上海”和“美食节”的网页。

还有一种情况,就是更长的句子。比如“广州美食节在哪一天”,显然,美食节,将是这个关键词里的关键词,所以,一些只含有美食节的网页也很有可能会显示在前面。

关于搜索引擎是如何工作的解说。就讲到这。事实上,搜索引擎工作的复杂性,一时讲不了那么清楚,而且我们也无法彻底清楚。

(注:本篇文章由seo俱乐部向草根网提供,其他单位如需转载务必写明源文出处。
文章出处路径:http://www.seoclub.net/seo/seo_se.html)

上一篇:张海宁讲座:开展电子商务的几种方式
下一篇:地震爱国赈灾Banner
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号