联系我们
云瑞公司是一家从事互联网行业的创新型和创造型企业,致力于新型电子商务应用,互联网广告应用的研究与开发;引导电子商务市场、以及网络广告市场的规范化。公司定位于高科技企业,开发产品主要以云计算应用网络产品为主,实行实体市场与网络销售并举,同时也参与各种互联网云计算附属项目产品的开发经营,具有很高的互联网云计算技术的运作能力。提供专业的网站设计与制作服务。公司总部有3项国家级的创新技术
1、无限分层信息遗传技术: 2、搜索引擎目标核心优化技术; 3、海量信息数据库管理技术
搜索引擎主要包括搜索器、索引器、检索器和用户接口共4个部分。
1.搜索器
什么是搜索器?先通过它的作用和搜索内容以及目的来了解。搜索器实现在互联网中漫游,发现和搜集信息的作用。搜索器搜集的内容主要包括html、xml、newsgroup文章、ftp文件、文字处理文档和多媒体信息等。主要目的是尽可能多且快地搜集互联网上的新信息,进而将之前已经搜集到的旧信息进行更新。关于搜索器,需要掌握其两种搜集信息的策略。
⑴ 通过宽度优先、深度优先或者启发式等方式,从一个起始URL集合开始,顺着URL中的超链接,循环地进行信息的搜索。
⑵ 根据域名、IP 地址或者国家域名对 Web 空间进行划分,搜索器负责划分后 Web 空间的穷尽搜索任务。 为了提高信息发现和更新的速度,搜索器采用计算技术。主要的计算技术有分布式(计算方式的一种,是指将大的计算任务分成若干个小的任务来执行)和并行式(计算方式的一种,是指将计算任务同时执行)。其中,每天几百万网页的信息发现,是商业搜索引擎的一般工作量。透过其中的工作量,足以看出搜索器的工作之多及其重要程度。 在了解了上述内容之后,下面对搜索器进行进一步介绍。如果搜索引擎是一座房子,那么搜索器的作用就是,在“蜘蛛”的帮助下,让这座房子里的每一个角落,布满“蜘蛛”的足迹。在走走看看的同时,收集有用的、新的内容。
网站页面内容会随着时间变化,或因产品更新而进行更新,搜索器爬取的内容也会在重复搜索的过程中不断增加和积累。这样,保证用户在搜索时看到的结果总是最新最及时的。
2.索引器
索引器的功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。索引项有客观索引项和内容索引项两种。客观索引项与文档的语意内容无关,内容索引项是用来反映文档内容的。 内容索引项分为单索引项和多索引项。其中,多索引项又常被称为短语索引项。通过给搜索引擎中的索引项赋予权值的方式,完成索引项对文档的区分度的表示,进而实现查询结果相关度的计算。 搜索器是在房间里漫步进行搜索,索引器需要做的工作,就是对搜索器经过搜索所获取的东西进行“编码”处理,以方便检索器的检索。
3.检索器
检索器的功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息。检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种。检索器的工作过程是,在用户向搜索引擎发出搜索指令后,代替搜索引擎去向索引器找相关搜索内容的编号,然后根据编号,让搜索器调取搜索到的对应编号的html文件内容。检索器主要起到检索html文件的作用,因为搜索器给出的相关内容范围比较大,检索器需要对检索到的内容与用户所需内容的相关性进行最后把关。例如,房间里有不止一个杯子,但有的杯子可能是泡茶叶的,也有的杯子可能是泡咖啡的,所以需要由检索器进行把关。
4.用户接口
用户接口的作用是接纳用户查询、显示查询结果、提供个性化查询项。其主要目的是方便用户使用搜索引擎,从而通过搜索引擎高效率、多方式的工作,为用户提供有效、及时的信息。为了充分地适应人类的思维习惯,用户接口在设计和实现过程中更多地采用人机交互的理论和方法。 一般用户接口通过查询界面和查询输出界面来实现输入、输出功能。
⑴ 查询界面
用户想要搜索的待检索词条及各种简单或者高级检索条件,在符合搜索引擎的查询语法的前提下,通过用户输入接口输入查询界面中。根据查询要求的不同,输入接口有简单接口和复杂接口两种。
简单接口
在简单接口中,只为用户提供输入查询串的文本框。
⑵ 复杂接口 在复杂接口中,可以让用户对查询条件进行限制。例如,百度的高级搜索,如下图所示。可限制的查询条件包括逻辑运算、域名范围、出现位置、相近关系、长度信息和时间信息等。
① 逻辑运算:是指或、与、非运算。
② 域名范围:是指 com、edu、gov等形式。
③ 出现位置:是指检索词出现的位置,例如标题、内容等。
④ 相近关系:是指与相邻或相近等形式。
⑤ 长度信息:是指查询条件中关于长度的相关内容。
⑥ 时间信息:是指查询条件中关于时间的相关内容。
查询输出界面
在百度查询“搜索引擎”,输出下图所示的结果。搜索引擎以一个线性的文档列表,将检索结果展现在查询输出界面中。其中包含的文档内容有标题、摘要、快照和超链接等相关信息。用户可通过鼠标,逐条浏览输出的结果,最终找到所需要的内容。因为有了搜索器、索引器和检索器的分工合作,才有了最终显示在屏幕上的满足用户需求的搜索结果。
株洲云瑞电子商务有限公司位于株洲市荷塘区是一家从事互联网行业的创新型和创造型企业,主营云终端、网站建站、百度等搜索引擎排名、网站后台代运维、株洲荷塘新闻资讯、株洲论坛发帖、微信公众号、微官网、微商城、微营销等,提供专业的网站设计与制作服务。联系电话:15608405025
欢迎关注“云瑞电子商务”公众号