|
第三代搜索引擎是对第二代在搜索技术上的改进,主要增加了互动性和个性化浏览,第三代中文搜索引擎更注重智能化和用户使用的个性化,其采用了中文自动分类、自动聚类等人工智能技术,而且使用了中文内容分析技术,以及区域智能识别技术,增强了搜索引擎的查询能力。
第三代搜索引擎简介
1995年12月,DEC的正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND、OR、NOT等)。用户可以用AltaVista搜索新闻组(Newsgroups)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。
第三代搜索引擎特征和功能
基本特征
人们在日常工作和生活中的交流是使用自然语言而非关键词,因为关键词表达的意思和意图不完整不准确,反映在关键词搜索结果上的缺陷更是淋漓尽致。这就赋予第三代搜索引擎的主要特征是基于自然语言智能搜索,即从基于关键词层面搜索提升到基于自然语言和人工智能的知识层面搜索,使搜索过程由原来的关键词匹配提升为内容概念相互关联的匹配,从而解决仅表达形式匹配所带来的种种缺陷,实现基于自然语言的智能搜索。
基本功能
第三代搜索引擎的搜索方式是基于自然语言搜索,用户想要什么信息,它就快速准确搜出什么信息,用户不必再拘泥于关键词、标题、作者、时间、分类等传统搜索方法。
第三代搜索引擎发展趋势
基于自然语言搜索的趋势。人们的日常交流是使用自然语言而非关键词,因为关键词表达的意思和意图不完整不准确,反映在关键词搜索结果上的缺陷是返回信息过多。基于自然语言搜索,符合人们的语言习惯,像人与人之间的交流一样轻松、直接、方便,不必再拘泥于分类、关键词等传统搜索方法,这无疑给用户提供了巨大的便利。
智能化返回搜索结果的趋势。第二代搜索引擎是基于关键词符号匹配信息,并不能处理关键词本身的语义,这就是基于关键词搜索存在一系列缺陷的原因。从这个层面上讲,第三代搜索引擎的发展趋势是,把搜索引擎技术和人工智能融合,让计算机返回的结果富有针对性,将准确信息显示在前两三项的搜索结果之中。让计算机具有人的智能和逻辑分析能力,能够理解自然语言表达的语义,使搜索结果与用户需求实现更精准的匹配,以解决问题的形式把结果返回给用户。
|
|