可视化搜索引擎应用与系统实现进展:领域应用
国内可视化搜索引擎应用集中在生物医学数字图书馆(文献专利、多语言搜索)、农业、地理空间、电子商务、社交网络等领域且前景良好。其中,生物医学、GIS可视化应用领域性较强但实现方式及架构可供Web信息可视化参考。

1、生物医学搜索引擎
作为分子生物学新兴交叉学科,生物信息学旨在由生物、数学、计算机学家共同研究生物分子数据,对其进行获取、处理、分析、利用,以揭示其内涵及人类未知的生物学知识和有用信息。龚庆侠基于信息图层动态可视化生物医学数据提出KNALIJ引擎,辅助用户浏览并高效搜索PubMed海量信息;张浩然基于Android系统开发了支持代谢网络可视化和生化反应检索的搜索引擎;王望提出新的分子数据集分析算法并结合可视化技术提供高效直观分子数据集搜索方法;张飞设计了旨在可视化RNA序列数据的B/S模式基因预测平台,并成功预测鸡microRNA新基因。
2、数字图书馆搜索引擎
可视化搜索数字图书馆中文献(论文、著作、专利)及其来源(期刊、会议等)、作者、研究领域等信息,相关研究主要分为理论、应用两类。
理论方面,王宁阐述数字图书馆可视化搜索引擎总体结构及关键技术;窦淑庆[to ]阐述图书馆可视化文献搜索引擎设计理论方法并进行具体设计;桂思思从设计步骤、实现方法方面阐述基于主题图与MARC书目的可视化搜索引擎构建原理;周怡雪基于共现分析理论构建“二维度(横向和纵向)一三方面(内部特征、外部特征和内外部特征结合)一四部分(关键词、作者、研究机构和主题)”的文献搜索结果可视化研究框架;周宁基于词频分析图,运用Java Applet对文献搜索结果进行可视化;秦雪梅指出文献可视化搜索引擎可将文献间语义关系、提问与搜索结果关系可视化并提供有效信息反馈机制。此外,Julia J.Jiirgens [}0]指出市场上可视化专利搜索引擎多采用传统图表、显示技术(如3D专利地图)分析并展示搜索结果集,未充分发掘可视化技术在搜索过程中的潜力,但已开始探索新应用方向,如从专利空间分布展示到搜索结果集可视化。
应用方面,钱力、马雨佳设计并实现交互、立体式数字图书馆馆藏跨库可视化搜索引擎并用于中科院国家科学图书馆,最终实现视觉化人机交互;王宁t8]用3D漫游实现虚拟图书馆场景并用于复旦大学图书馆;桂思思融合MARC、主题图与可视化技术构建原型系统,以可视化主题图中主题类型间联系并基于此搜索图书;张学福实现基于知识模型的文献可视化搜索引擎;蔚元方针对文献互引问题提出共引矩阵构造方法,基于社会网络分析算法实现文献可视化搜索。此外,张秀梅基于文献信息的科研合作复杂网络方法并用于大型文献搜索引擎,同时介绍美国国家科学数字图书馆为馆藏增加交互式可视化浏览器以提供可视化搜索服务;张学福指出新西兰数字图书馆用自组织可视化技术处理搜索结果,用HyperSpace生成三维图像并提供文献访问途径;刘如指出微软学术搜索在深度搜索过程中可视化搜索结果所隐藏有价值信息。
3、农业搜索引擎
目前国内农业搜索引擎主要有农搜网、搜农网等,仍处发展期。张阳以农业文本信息、农产品价格为研究对象,构建基于地理信息库的农业信息可视化搜索引擎;赵兰荣构建基于元搜索的农业信息可视化平台以图形化搜索结果;王恬二次开发农业搜索引擎,用Web信息抽取、数据挖掘及信息可视化技术将搜索结果可视化,实现人机交互,提升搜索体验。
4、地理空间搜索引擎
徐少坤研究基于多维可视化技术的地理空间元数据可视化搜索;宋国民实现基于双曲线树和基于平行坐标的地理空间元数据可视化搜索原型系统;张向荣设计空间数据管理系统模型,实现基于SVG(可缩放矢量图形)的GIS可视化,通过可视化搜索引擎模块返回空间属性信息来动态维护GIS数据;孙洪亮设计地理空间语义搜索引擎架构,基于地学知识库,用命名实体识别、实体消歧等自然语言处理技术空间化非结构化文档,用WebGIS将搜索过程、结果可视化;朱向彩结合VB、可视化等技术研究城市交通站点可视化搜索问题,为城市建设、三维仿真、交通模拟、信息搜索及维护等提供技术途径。
5、商务搜索引擎
目前大多数商务搜索引擎为用文本标注方式标注、索引图像的视觉搜索引擎。黄辉提出可视化搜索引擎及相关技术是可视化电子商务核心和业务基础,构建了符合用户搜索和使用习惯的可视化电子商务搜索引擎体系,通过第三方技术授权与合作的方式提供可视化搜索服务,运用完善互联网图片自动采集分析机制构建可视化电子商务平台并提供搜索服务;胡亦奇分析了现有电子商务网站搜索结果显示的优缺点,比较了多维数据可视化方法,用气泡图显示电子商务网站的搜索结果;刘晓慧设计并实现了基于可视化图像搜索技术的商务可视化搜索引擎iSearch,由Web端可视化搜索、广告注册、手机端可视化搜索、数据操作模块组成,以增强海报广告交互性。
6、社交搜索引擎
关岳认为当前社交网络数据可视化研究较分散,主流研究是可视化信息传播路径;周霞娟认为微博搜索过程用户需求较模糊,更倾向于探索式搜索,提出用户驱动微博可视化搜索方法,基于微博用户特征和兴趣特征,用向量空间模型表示用户微博,引人IDF(逆文本频率指数)降低常用词汇权重、提升用户兴趣模型精准性。提出关注度传递算法,计算微博用户对特征词的关注度并用气泡图将其可视化,以搜索用户感兴趣的微博。此外,蔚元方指出北京大学开发的微博分析工具Wei-boEvents可辅助用户认知,理解微博运转、传播过程,展示微博事件中关键人物、观点、人物关系及转发情况。