搜索引擎的未来:“人工智能+搜索引擎”!
 
  所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
 
  从发展历史来看,搜索引擎技术自1994年以来,已经经历了三代的更新与发展,它们分别是:以Yahoo为代表的第一代搜索引擎技术,它是基于万维网运行并首次支持自然语言检索和高级搜索语法检索,以人工整理的目录方式呈现检索结果是其明显特征;以Google为代表的第二代搜索引擎技术,它是基于数据挖掘和网站评级技术并利用关键字进行机器检索,其检索速度与准确性迅速提高;以2005年微软公司“技术驱动型”搜索引擎构想为代表的第三代搜索引擎技术,是第二代搜索引擎技术的升级与改进,具有更为强大的服务空间与技术性能。
 
  目前,世界上主流搜索引擎公司是谷歌、雅虎,尤其如谷歌,它提出“让世界变得更美好”的口号令世界瞩目。在我国,百度一家独大,它提出的口号是“连接人与服务”,意欲为国人提供最智能化、个性化的检索服务。
搜索引擎的未来:“人工智能+搜索引擎”!
 
  一、搜索引擎的工作步骤与主要特点
 
  搜索引擎利用其强大的爬虫技术和索引技术,为计算机用户提供优质的个性化信息服务。其工作步骤主要包括三个环节:爬行和抓取(数据采集)、数据库处理(数据预处理和数据处理)、排名(结果展示)。各个环节的工作内容如下图所示:
 
搜索引擎的工作步骤与主要特点
  其主要特点是:
 
  1、信息抓取迅速。在大数据时代,网络产生的信息浩如烟海,令人无所适从,难以得到自己需要的信息资源。在搜索引擎技术的帮助下,利用关键词、高级语法等检索方式就可以快速捕捉到相关度极高的匹配信息。
 
  2、深入开展信息挖掘。搜索引擎在捕获用户需求的信息的同时,还能对检索的信息加以一定维度的分析,以引导其对信息的使用与认识。例如,用户可以根据检索到的信息条目判断检索对象的热度,还可以根据检索到的信息分布给出高相关性的同类对象,还可以利用检索到的信息智能化给出用户解决方案,等等。
 
  3、检索内容的多样化和广泛性。随着搜索引擎技术的日益成熟,当代搜索引擎技术几乎可以支持各种数据类型的检索,例如自然语言、智能语言、机器语言等各种语言。目前,不仅视频、音频、图像可以被检索,而且人类面部特征、指纹、特定动作等也可以被检索到。可以想象,在未来几乎一切数据类型都可能成为搜索引擎的检索对象。
 
  二、四种基本搜索方式的比较
 
  搜索方式是搜索引擎的一个关键环节,大致可分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,它们各有特点并适用于不同的搜索环境。所以,灵活选用搜索方式是提高搜索引擎性能的重要途径。全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式;元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式;垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式;目录搜索引擎是依赖人工收集处理数据并置于分类目录链接下的搜索方式。在此,我们对四种搜索方式的特征作一比对,如下表所示:
表1 四种搜索方式比较
 
  由表1可见,四种搜索方式各有利弊并适用于不同的网络使用环境:
 
  1、一般网络用户适用于全文搜索引擎。这种搜索方式方便、简捷,并容易获得所有相关信息。但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。尤其在用户没有明确检索意图情况下,这种搜索方式非常有效。
 
  2、元搜索引擎适用于广泛、准确地收集信息。不同的全文搜索引擎由于其性能和信息反馈能力差异,导致其各有利弊。元搜索引擎的出现恰恰解决了这个问题,有利于各基本搜索引擎间的优势互补。而且本搜索方式有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。
 
  3、垂直搜索引擎适用于有明确搜索意图情况下进行检索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。
 
  4、目录搜索引擎是网站内部常用的检索方式。本搜索方式旨在对网站内信息整合处理并分目录呈现给用户,但其缺点在于用户需预先了解本网站的内容,并熟悉其主要模块构成。总而观之,目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。
 
  总之,用户只有对上述四种搜索方式特点较为了解的基础上,才能在不同情境下灵活选择出最适合自己的搜索方式。
 
  三、当代搜索引擎技术发展趋势分析
 
  随着智能化和信息化时代的到来,网络普及化程度空前提高。尤其我国政府提出了“互联网+”的现代社会发展战略,李克强总理的“提速降费”政策的提出以及手机APP网络终端的迅猛增长,搜索引擎已成为广大网民不可或缺的网络生存工具。在这种形势下,搜索引擎技术出现了诸多发展势头并获得史无前例的发展,引起了国内外数以万计的信息技术行业工作者的高度关注。总而观之,当代搜索引擎技术的发展趋势主要有以下四个:
 
  1、智能化发展。随着人工智能技术的大幅度升温,试着将其运用于搜索引擎技术,实现网络搜索的智能化正成为当代搜索引擎技术发展的新方向。目前,已经出现了一系列智能化的搜索技术,如以自然语言直接进行数据搜索,基于云服务开展的云搜索技术,智能化判断用户搜索意图并据此向用户推送相关信息等等新技术已经进入我们的日常网络生活。可以预见,“人工智能+搜索引擎”必将引领AI时代的搜索引擎技术走向。
 
  2、个性化发展。以前,搜索引擎只是为用户提供机械化、单一的搜索方式,向用户反馈大众化的一般性信息资源。而如今,搜索引擎技术日益成熟,它不仅可以跟踪用户搜索痕迹和检索历史,把握每个用户的信息偏好和搜索习惯,还可以根据每个用户的特殊需求与偏好,为其提供个性化的搜索服务,以提高搜索的准确度,使其获得更好的用户体验。同时,各搜索引擎公司还建立了特色的搜索体系,以满足各行各业用户的不同搜索需求。
 
  3、一站化发展。由于网络资源的多样化,各式各样的数据类型充斥着整个互联网,如文字、语言、语音、视频、图片、GIF图片等,如何利用一次查询来获得各类相关数据资源,正成为搜索引擎技术发展的新方向。这就是一站式搜索。在这个方面,搜索引擎技术还面临着许多关键技术有待于攻关,如除文字外其他数据资源识别准度不高,与搜索关键词之间的匹配度问题难以解决。因此,一站式搜索将成为以后搜索引擎技术研发的一大热点。
 
  4、移动搜索迅猛发展。随着手机终端用户量的剧增,以手机用户为代表的移动搜索流量已经大大超过了PC端用户。数据表明:我国手机搜索用户数已达5.93 亿,且使用率为81.9%,足以说明移动搜索已逐渐成为搜索引擎技术开发的重点。目前,移动搜索还处于初步发展阶段,但它具有不容小觑的发展潜力和无限的商机,将占有更多的市场份额,必将主宰未来的搜索引擎市场。
 
  总之,搜索引擎技术是网络化生活的开端,是几亿网民捕获信息的窗口,也是网络化时代不可或缺的关键技术。灵活选用搜索方式,把握搜索引擎的时代热点,是我们提高信息素养、迎接信息化挑战的现实选择!