基于本体的信息检索系统的

更新时间:2024-03-17 作者:用户投稿原创标记本站原创 点赞:30719 浏览:143498

摘 要:搜索引擎在查全率和查准率方面难以完全满足用户的实际需求.本文引入本体技术,以图书信息的查询为例,通过构建图书信息的本体属性架构,在图书信息的检索中引入本体的技术,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的怎么写作打下基础.

关 键 词:本体信息检索搜索引擎

中图分类号:TP391文献标识码:A文章编号:1007-9416(2013)07-0043-01

1引言

随着信息技术发展与应用的不断深入,网络已经成为世界范围的信息源.与之相伴的是信息检索问题,怎样实现在海量网络信息中获取符合用户需求的信息,是信息检索界亟待解决的课题.本文以图书信息的查询为例,从而极大地提升图书查询的准确性和效率,使图书馆能够为用户提供更高品质的怎么写作打下基础,本文的成果具有比较好的理论价值与实践意义.

2本体技术概述

本体是以系统化的方法来描述客观世界的事物,从而能够实现事物中所包含元素的集成和重用,从而将信息抽象为知识.在对事物的描述中,本体将所有的事物分解为不同的概念,并准确地定义概念之间的逻辑联系.当前,作为一种信息技术的实现方法,本体论在计算机领域中具有比较重要的价值与意义,正在一些领域有着比较广泛应用,包括语义网络的实现、智能搜索的设计、异构数据的整合、以及GIS系统和图书馆的数字化等.在这其中,语义网络的研究和应用是一个热点.

3基于本体的信息检索设计与实现

3.1系统框架设计

结合目前应用比较广泛的B/S的结构体系,本研究所涉及的信息检索结构分为三个层次,下面分别进行阐述:(1)应用层的设计.在基于本体的检索系统中,应用层的功能是处理用户需求,实现用户和系统的交互.在应用层中,通过用户界面的表单来处理用户所输入或者选择的查询请求,对请求的格式进行初步处理之后传输至逻辑层进行进一步的处理,并将由逻辑层传输到本层的检索处理结果向用户显示.(2)逻辑层的设计.逻辑层是检索系统对查询和检索结果进行处理的核心部分,主要功能有:用户查询的生成、用户查询条件的表达、用户查询的执行.逻辑层的设计成股份考虑到了检索内容的本体模型与查询处理之间的匹配.(3)数据层的设计.数据层的功能是对系统的数据进行存储,针对本文所研究的图书信息而言,将会为所有的图书数据构建一个基于本体的数据库,本研究选择的是sqlserver数据库.在数据库中,结合本体库知识对所存储的信息以及信息之间的联系进行标注,从而使图书信息能够以本体的规范进行存储,以便查询.

3.2检索方法的设计

当前,无论是基于哪一种搜索引擎,具体的检索结果往往难以保证足够的查全率和查准率.其核心原因在于:首先对没能准确地表达用户的查询需求,导致信息系统难以精确地把握查询需求;其次是系统是以机械匹配的方式来处理用户所输入的检索关 键 词,因此没能对所查询的语句进行必要的扩展.所以本研究所涉及的基于本体的检索方式的设计基本思路为:(1)基于本体对于事物的描述,首先对用户所输入的查询条件进行整理和优化,把其查询条件进行转换,使之能够体现为本体的概念以及本体元素之间的联系.(2)结合本体的信息处理模式,对转换之后的查询条件进行概念上的扩展,最终形成符合本体属性和特点的查询式,开始查找,并得到结果.

3.2.1基于本体的检索优化方案设计

此处将用户查询条件所属的原始概念空间定义为{C,R},在该空间中,C的涵义是查询条件所包含的全部概念项,R的涵义是全部概念项之间所拥有的逻辑关系.在本体的设计理念下,本研究把检索优化的步骤定义为(1)把概念项空间C里用户的查询概念进行转化,使之成为本体类型的概念,从而构建基于本体的概念;(2)结合查询概念之间的逻辑关系R,对查询条件进行逻辑转换,从而构建符合本体模式的优化概念空间.

在(1)中,首先设概念项空间C里所包含的概念项是(C1,C2,C3,,C5等),针对里面的所有概念项,在已经构建的本体知识库里搜索与这些概念项匹配的概念,所有的同义词以及词性变换均能够生成新的记录,以(Ci,Oi)表示.记录中,Ci的涵义是概念项(C1,C2,C3,,C5等)中的一个元素,Oi则表示图书信息本体里和Ci匹配的概念,可知在这样的模式之下,每一个概念项均可能有多个与之匹配的概念,而所有的匹配概念最终形成新的概念集O.当前概念相的匹配完成之后,则进行针对查询条件的逻辑转换,最终通过一套逻辑转换规则形成新的逻辑关系.

3.2.2检索的语义扩展

在对用户的查询条件进行本体话处理之后,有可能会出现无法找到与之匹配的概念的情况,这时候需要对检索进行语义的扩展.扩展的目的是从一个概念延伸到其他概念,以及从一个属性眼神至其他的属性,从而实现查询的准确率.语义扩展包含三个方面,分别是同义词的扩展、子概念的扩展以及父概念的扩展.下面进行详细的阐述:(1)同义词的概念扩展.在中文的表述中,同义词的普遍存在的.相同的检索条件可能有多种不同表述方法,此时需要以同义词的扩展来达到检索的准确率.在本体库的构建中,将属于同一概念的所有表达方式进行标记,当收到用户的检索请求以,系统执行“或”运算,得到所有的同义词并集,提高查全率.(2)子概念的扩展.通过以更加贴近用户查询条件的子概念看来表达检索,从而将检索结果定位在更加精确的领域.举例来讲,用户搜索图书信息时,如果输入“通信介质”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,通讯介质又可以包含以下的子概念:如光纤、同轴电缆、微波等,通过子概念的扩展,实现信息检索的查准率.(3)父概念的扩展.与子概念相反,父概念的扩展指的是将查询条件的上层概念来替换用户所输入的查询条件,从而实现结果的扩展.举例来讲,如果输入“工作站”作为查询条件,未能看到满足要求的检索结果,此时根据本体知识的架构,工作站的父概念包括网络硬件、局域网节点等,从而达到更好的查准率.


4结语

本文结合当前信息检索所存在的不足之处,以图书馆信息检索为例,引入本体技术来构建数据检测和索引优化的科学方法,通过构建图书信息的本体属性架构,实现了复杂语义信息的表达和识别,从而在很大程度上提升了图书馆信息查询的效率.