189-2522-6043

搜索引擎的基本工作原理

时间:07-27 12:21 浏览:24

  在网站优化过程中,想了解网站如何优化,就需要了解搜索引擎是如何工作的,搜索引擎的工作原理其实很简单,首先它被分为四个部分,如下图所示。第一个部分是 蜘蛛爬虫(抓取),第二个部分是数据分析系统(过滤 ...

  在网站优化过程中,想了解网站如何优化,就需要了解搜索引擎是如何工作的,搜索引擎的工作原理其实很简单,首先它被分为四个部分,如下图所示。第一个部分是 蜘蛛爬虫(抓取),第二个部分是数据分析系统(过滤),第三个部分是索引系统(建立索引), 第四个部分是查询系统(输出结果)。总之,如果希望通过搜索引擎为用户带来更好的体验, 就需要对网站进行严格的内容建设(输出结果),使之更符合用户的浏览需求。

搜索引擎的基本工作原理


  1.2.1抓取

  当你想要享受美味的海鲜大餐之前,需要有人把各种各样的海鲜抓来。然后,你才能有选 择地食用自己想要吃的品种。同样的,搜索引擎在完成一系列工作的过程中,也需要完成类似 的工作。只是,它们这个抓取的执行者是一种被称为“蜘蛛”的程序。下面介绍搜索引擎蜘蛛 及其抓取的相关内容。

  1.什么是搜索引擎蜘蛛

  关于搜索引擎蜘蛛,我们需要通过几个概念来了解。

  (1)程序:搜索引擎蜘蛛可以归类为程序的一种,程序的形式通过模仿蜘蛛织网后的爬行、 遍历爬行而展开。总之,搜索引擎蜘蛛程序,其实就是搜索引擎的一个自动应用程序。这一点 需要我们有一个清晰的认识。

  (2)计算:通过搜索引擎系统的计算,来决定对哪些网站施行抓取,以及抓取的内容和频 率值。搜索引擎的计算过程会参考你的网站在历史中的表现,比如内容是否足够优质,是否存 在对用户不友好的设置,是否存在过度的搜索引擎优化行为等。爬行和抓取是搜索引擎工作的 第一步,它完成真正意义上的数据收集任务。

  2.如何进行抓取

  2.1搜索引抓取

  网站更新后,产生了新的内容。这时,搜索引擎蜘蛛,会通过互联网中某个指向该页面 的链接进行访问和抓取,如果没有设置任何外部链接指向网站中的新增内容,它将不会给予 抓取处理。因此,及时更新网站的内容和有较广泛的外部链接非常重要。搜索引擎蜘蛛把这 些信息都抓取到搜索引擎的服务器上,然后建立索引库,举例说明,我们可以把搜索引擎蜘 蛛当做一个用户,它来访问你的网站,然后把网站的内容保存到自己的电脑上。下图是蜘 蛛抓取的流程图。

搜索引擎的基本工作原理

 

  1.2.2过滤

  如果说,蜘蛛爬行是“撒网捕鱼”,那么接下来需要做的就是,将捕上来的东西进行归类, 因为在网里的不一定都是我们需要的(比如,一些明显的欺骗用户的网页、死链接、空白内容 页面等),这又是一项浩大的工程。其实,对于搜索引擎’它的过滤工作,就是处理搜索引擎蜘 蛛抓取回来的网页,其作用类似于“过滤网”。

  1.2.3建立索引

  建立索引,是搜索引擎对网页的tagtitle、metadescripiton、网页夕卜链及描述、抓取记录等进

  行标记添加的行为。同时,还将对网页中的关键词信息进行识别和存储,这样做的目的是与用 户可能搜索的内容匹配。

  1.2.4输出结果

  搜索引擎对用户输入的关键词进行分析,参照得出的结果,在索引的结果中,查找出用户 需要的网页,并把用户需要的内容,以一定的方式展示。如下图所示内容,就是用百度搜索引 擎对“广场舞”一词进行搜索之后,所给出的输出结果。

搜索引擎的基本工作原理

  1.3搜索引擎的分类

  按照不同的技术特点,可以把搜索引擎分为全文搜索引笮、垂直搜索引擎、元搜索引笮、 目录搜索引擎和集成搜索引擎等5类。

  1.全文搜索引擎(Full Text Search Engine)

  全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、AUTheWeb、AltaVista、 Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu ),如下图所示。它们者P是通过从互联 网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配 的相关记录,然后按一定的排列顺序将结果返回给用户,因此它们是真正的搜索引擎。

2小时内报价 3天完成方案设计 7-10天内制定全年推广计划

华南地区出现问题,24小时内上门处理!

全国免费服务热线

189-2522-6043

提交需求免费获取网站SEO139项诊断方案

cache
Processed in 0.034130 Second.