古代农艺本体的构建实验

更新时间:2024-01-08 作者:用户投稿原创标记本站原创 点赞:3217 浏览:8951

[摘 要]借鉴和利用农业科学主题词表的语义关系和领域概念,描述农艺领域内的概念以及概念之间的关系,以农业领域专业词典、《农业专业分类表》、《农业科学叙词表》及农业文本为语料,吸收分面叙词表的编制思想,利用开发工具Protege2000来构建古代农艺的领域本体,以实现对古代农艺资源的有序组织和有效利用.


[关 键 词]古代农艺 构建 Protege2000 领域本体

[分类号]G356.8

20世纪90年代以来,哲学领域的“Ontology”被人工智能领域所借鉴,本体的建模方法也初步确立.近年来,国外对本体建模作了大量研究并将其运用于知识领域,国内对本体的概念、理论及开发某领域本体的研究也随之而兴起.

本文的核心内容是古代农艺本体的构建.拟在前人构建领域本体方法论的基础上,结合图书情报领域编制分类表和叙词表的经验,吸取分面叙词表的编制思想,尝试使用斯坦福大学开发的本体编辑工具Protege2000,探讨行之有效的领域本体的构建方法.在古代农艺本体的构建中,采用计算机辅助的形式半自动构建本体.

1 领域本体概述

1.1 领域本体概念

本体是关于一些主题的清晰规范的说明.它是一个规范的、已经得到公认的描述,包含词表(或名称表、术语表).词表中的术语与某一领域相关,词表中的逻辑声明用来描述术语的含义和术语间关系,即它们是怎样和其他术语相关联的.本体提供了用来表达和交流某些主题知识的词表和把握词表中术语间联系的关系集.

不同应用领域对本体研究的侧重点有所不同,涉及特定学科领域的本体被称为领域本体.本文所构建的古代农艺本体,便是一种领域本体.

1.2 本体构建原则

由于领域本体研究的特殊环境,没有办法给出一套规范性的指南,只能给出构建原则,而这些原则都是研究人员在各自系统开发经验之上提出的.其中,较有影响的是Gruber在1995年提出的五条规则.事实上,对于构建一个真正的本体来说,并没有一种唯一的途径或方法.最佳的方法依赖于本体构建者所采用的应用软件以及可以预见的扩展功能.同时,本体的开发和完善是一个反复叠加的过程,不能一蹴而就.

1.3 本体构建方法

目前构建领域本体的方法中,较为著名的有骨架法、TOVE法、Methontology、KACTUS、七步法.这些方法中,斯坦福大学医院开发的七步法较为成熟,而且主要用于领域本体的构建.

这种方法很符合人类的思维认知,逻辑性强,具有很强的可操作性以及可拓展性,本文古代农艺本体的构建实验即借鉴这种方法.

1.4 本体开发工具

目前本体的构建工具多达几十种,它们各有所长,亦各有缺陷.现在比较成熟、常用、知名度较高的本体构建工具主要有OntolinguaServer、Prot6g62000、On-toEdit、WebODE等.笔者选择了Prot6g62000作为古代农艺本体的构建工具.

2 古农艺本体的构建

2.1 古农艺本体构建目标

通过古代农艺本体的构建,利用本体思想和OWL语言组织和描述农艺领域的知识,建立具有逻辑检测和可扩展性的本体库,将词表中孤立的词汇通过本体的各种关系相联系,使传统的缺乏知识联系、简单的语法层次的字、词检索,上升为提供基于知识层面的语义检索,为用户去除冗余信息,快速得到检索需求.

构建古代农艺本体,可以加强对古代农艺知识的整理,使其成为农艺数字化知识库,便于更深入地挖掘古代农艺的丰富内涵.古代农艺本体用术语或概念对知识进行表达,揭示知识之间的内在关系.通过纵向类属分类和本体的联想进行组织、关联、推理,再利用这些知识进行推理,以满足用户的检索需求.构建古代农艺本体系统,可以实现对古代农艺资源的有序组织和有效利用.

2.2 古农艺本体构建步骤

根据本体的构建原则,将七步法的思想应用于古代农艺本体的构建,具体的构建过程如图1所示:

2.2.1确定古代农艺本体范畴 农艺即农作物生产的技术与原理,内容主要包括大田作物的栽培、育种、土壤管理、施肥、病虫害防治、农机具应用、农田灌溉和排水、农产品的初步加工和贮藏以及农业生产的经营管理等.以经验和手工劳动为基础,以精耕细作为主要特点的中国传统农艺,在世界上居于先进地位,因此对古代农艺的研究具有较高的价值.

古代农艺领域本体的开发,主要是利用《中国图书馆分类法》专业分类表系列之《农业专业分类表》、《农业科学叙词表》、农业领域专业词典以及农史研究论文为语料,进行构建本体的尝试.希望通过该本体的开发找到古代农艺信息的组织手段,在其基础之上寻找构建本体的一种方法.

构建一个完整或完善的领域本体不是一蹴而就的,而是一项极其浩大的工程,需要对其不断地完善和修订.因此,本体构建工作应明确目标,限定范围,降低难度,从而使工作得以顺利进行.根据上述目的,本文所构建的古代农艺本体首先缩小范围,给出最基础的一个实验本体.

2.2.2 考查复用现有农艺本体的可能国内对本体的研究还处于实验阶段,还没有成型的实用的领域本体,而且对于古代农艺这个领域,目前还没有发现与之相似、可以重用的本体.因此,在本构建方案中没有考虑复用现有本体,不过这是将来必须要考虑的.因为,本体最大的特点之一是共享和重用,考察复用现有本体的可能,是保证本体的这一特性得以实现的重要方式.

2.2.3列出古农艺本体的重要术语、概念 要进行领域本体的构建,首先要确定该领域的关键概念,确定上位概念、较为显著的概念和常用概念,以建立核心概念集,然后在此基础上进行扩展.本研究主要从试验性角度出发分析概念,主要参考了《农业专业分类表》、《农业科学叙词表》及农业领域词典,进行语义分析和确立核心概念.

经过语义分析,得到如下7个作为该本体类的一级核心概念:

农作物:禾谷类作物、经济作物、豆类作物、薯类作物等;

农具:整地工具、中耕工具、播种工具、收获工具等;

肥料:粪肥、饼肥、渣肥、骨肥等;

耕作制度:自然模仿农作制、休闲耕作制、撂荒制等;

耕作技术:畎亩法、垄平作兼行、发展轮耕制等;

选种育种:一穗传、穗选法、无性繁殖等;

农书:月令体农书、专业性农书、综合性农书等.

分析得到作为属性的核心概念:

朝代:夏朝、西周、三国、唐代等;

土地利用方式:丘陵山地的利用、河湖滩地的利用、滩涂的利用等;

施肥:追肥、基肥、分期施肥等;

材质:石质、木质、青铜质、铁质等.

2.2.4 定义古农艺本体类及类的等级体系一般而言,建立一个类的等级体系结构有两种方法:①自顶向下法,由一个领域中最大的概念开始,而后再将这些概念细化;②自底向上法,由这个等级体系中的细枝末节即最小概念开始,然后将这些细枝末节的类加以组织、概括,也就是泛化的过程.由于本文是参照《中国图书馆分类法》和《农业科学叙词表》的思想来定义类体系结构,由大概念开始向下细化,因此采用自顶向下法来构建,即将《中国图书馆分类法》和《农业科学叙词表》中的学科体系结构嵌入到这个本体中,充当本体的主干结构,对其中不足的部分进行添加和修改.

如前文所述,本体的构建是一个系统工程,必须一步一步来,首先要圈定一个小的范围.因此,通过修改,最终将古代农艺本体定义为7个大类,分别是农作物、农具、耕作制度、耕作技术、肥料、农书及作物育种,也就是第三步中所列举的7个一级核心概念.本文在本体构建过程中,曾考虑将土壤作为一类,但由于古代对土壤的分类没有作比较深入地研究,而且对古代土壤的研究记录不是很详细,因而将土壤转化为土地利用方式,作为属性而存在.

确定类之后,还需要确定类之间的关系.将等级关系转化至本体成父类与子类的关系,并且在Protege2000中以等级树的形式显示.

在类的等级关系确定过程中发现,有些类的下位类可以有多种标准,如农具的下位类可以按照农具的功能来划分,也可根据农具的制作材料来划定,经过多次讨论及思考,以功能来划分农具的下位类,而将农具的制作材料作为属性材质,使其更具合理性.

2.2.5定义古农艺本体类的属性 类只是描述了一个框架,还不能够确切地描述一个领域,因此还需要继续定义类的内部结构.在上述步骤中,已经确定了一些重要术语,下一步是确定类的属性.笔者给耕作制度类定义了属性,有耕作技术、土地利用方式、时代及出处.农具的属性有材质、对象、时代、地域.子类除了有自己的属性外,还要继承父类的全部属性.

2.2.6 定义类的分面 一个属性可以由多个分面组成,分面用来描述取值的类型、容许的取值以及取值的个数和有关属性取值的其他特征.类之间的关系属性设置为Object属性,概念本身的属性则设置为Da-tetype属性.

2.2.7 创建实例在完成了上述定义后,需要将这些类实例化.实例化的过程要先确定一个类,然后创建这个类的实例,本实验添加实例254个.在Protege2000中,通过Individuals标签的3个面板达到添加实例的目的,内容包括实例名称及附加在该类上的属性.当大量的实例被赋予相应的属性及属性值时,就形成了相关领域的知识库.

该本体中的实例获取主要通过以下几个方面得以进行:

农业领域的专业分类表、《农业科学叙词表》、《农业百科全书》(农业历史卷)等专业词表和工具书;

农业领域的大量书籍,如《中国农具发展史》、《中国农业史》、《中国农业科技发展史略》、《中国古代农耕史略》等;

农业领域的学术论文中的词汇.

比如,现在创建一个灌溉工具类的一个实例桔槔,枯槔具有灌溉工具的属性.再给禾谷类作物的稻创建一个实例白糯,那么在桔槔和白糯之间的关系仍然有灌溉和被灌溉的关系.

2.2.8 古农艺本体可视化显示 本实验在本体的可视化显示上,应用了Prot6g62000的TizTab插件,显示所构建的古农艺本体.该插件使用TouchGraph技术,支持中文显示.应用TizTab插件时,先要选择一个类,再进行可视化图的创建.图2是一个以农作物为中心的一级(在“Radius”选项中进行选择从O到10,显示不同的级数)显示结果界面,显示与农作物直接相关的概念,在概念右上角方框内的数字表示其下位类的书目,前面命名object属性时使用了中文,鼠标放置属性在显示位置时属性名显示为小方框而不是汉字.

图3是以农作物为中心的二级关系显示结果界面,可以看出,一级显示的是与中心词有直接关系的概念,二级以一级显示的概念为中心来辐射显示,不仅得到与农作物直接的相关概念,还可以得知与农书有关的信息.

3 结语

本文首次尝试构建了古代农艺这个试验性领域本体,阐述了构建古代农艺领域本体的基本方法、流程和工具.该本体实验的构建是在专业词表基础之上进行,将农业领域专业词表中的词有选择地转化为本体中的概念.

本实验古代农艺本体的构建存在以下问题:①没有邀请专业人员给出古农艺本体的骨架,为本体构建提供指导;②类之间存在交叉,类的划分比较困难,如农具类下的中耕农具类与整地农具类,由予古代农具存在多用途的性质,造成两个类目之间有交叉;③类的下位类存在多种划分标准,可以选用其中一种作为划分标准,将其他标准作为属性存在;④在Protege中,一个类或实例不具有二元性.一旦定义了某个类的实例,实例就是本体的最小单位,无法再进行划分和添加子实例;⑤在使用Protege进行本体构建时,只能用手工操作,而且只能按条目逐个进行操作,不能批量进行,费工费时,速度较慢.

本文对古代农艺领域本体构建做了尝试,希望在以后的工作中逐步进行完善,以使其成为一个面向Web的、开放的、动态的、能够实时更新的、共享的本体.下一步将在已经建成的初级本体基础上进行逻辑推理等工作,以实现其智能信息检索的功能.

相关论文范文