基于XML技术标准的主题图构建应用

更新时间:2024-04-08 作者:用户投稿原创标记本站原创 点赞:4774 浏览:14308

【 摘 要 】 文章主要讨论了XML技术在信息组织领域的某一个方面应用,即XML用于主题图的实现,或称为XTM技术.它是使用XML语法来处理主题图中数据的一种方法.围绕该主题,文章介绍了XTM标准、使用XTM代码或使用集成开发工具这两种方法构建基于XML技术主题图,并列举了国内外使用基于XML技术实现主题图的应用案例.

【 关 键 词】 XML;主题图;XTM;信息组织

Topic Maps Based on XML and its Application

Gui Si-si Cheng Xiu-feng

(Information Management Department, Huazhong Normal University HubeiWuhan 430079)

【 Abstract 】 XML being applied to Topic Maps, a way of information anization, is generally called XTM. In the content, we introduce XTM standard, two ways of using XTM to construct Topic Maps and some examples of using Topic Maps based on XML to anize information.

【 Keywords 】 XML, topic maps, XTM, information anization

1.引言

21世纪是信息时代,人们对信息的需求越来越多.但是,信息的量大质杂,与人们有限的时间精力、特定的信息需求存在极大的矛盾冲突.因此,对信息进行合理的组织,以方便用户获取信息的需求越来越迫切.数据是信息的载体,对信息的组织实质上是对数据的组织.主题图结构清晰并能够有效地反映数据间关联,因此主题图常被认为是信息组织的理想方法.如今有多种实现主题图的技术方法,如HyTM等.但是,上述实现主题图的方法有一个难题:利用主题图组织的数据如何实现跨平台的数据交换?XML是现在流行的Inter环境下跨平台的数据组织、数据存储工具,能较好地解决主题图数据跨平台交换的问题,因此,基于XML技术标准构建的主题图(XML Topic Map、XTM)有着极大的发展空间.

2.XML技术与主题图概述

2.1 XML概述

XML(Extensible Makeup Language,可扩展的标记语言)由万维网联盟(World Wide Web Consortium,W3C)提出,希望能方便Inter网络上的数据间交流,方便计算机处理文档内容以及文档结构.XML是一种元标记语言,是一套定义语义标记的规则.

相比较其他元标记语言而言,XML更加灵活.用户可根据处理的文档中的信息内容自定义符合一定规范的标记,从而更有助于用户理解文档内容结构,并方便计算机处理文档结构.但是,XML语法更加严格.因此XML更具有结构化,是处理结构化文档的有力工具.XML规范了格式,使用统一的编码,当所有平台遵守XML的格式规定,也就实现了跨平台,使不同来源、结构化的数据很容易地集成在一起.

简言之,XML允许用户自定义符合一定规范的标记,从而方便计算机处理结构化文档,同时,它能在Inter环境下实现跨平台的数据交换.这些特点使XML成为实现主题图的主要技术.

2.2 主题图概述

主题图(Topic Map)的概念最初是由W3C提出,用来实现索引和辞典构建过程的形式化.主题图是一种用于描述信息资源的知识结构的元数据格式,它可以定位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系.

简单说,主题图就是一种组织、表达信息,或者说数据的方式.现实世界中的事物都是一个对象,一个对象都有着自己的状态(如名字、存在地点)以及行为(与他人发生联系的方式).这个对象在主题图中的反映就是一组主题,这些主题同样也包含自身状态以及行为,如主题的名称,资源出处,以及它与其他主题间的关联.

因此,一个主题图就是一个由主题、联系、资源组成,主题、联系、资源构成了主题图概念中的三要素.构建主题图的思想是将信息归为二类:主题、资源地址或者相关信息,然后再建立各种信息内容之间的联系,从而实现对信息的组织.

以英语单词abundant为例,可以构建主题图.与abundant相关词汇有abundance、abound、redundant,因此可以共建立四个主题.其中,abundance是abundant的名词形式,abound是abundant的动词形式,redundant与abundant有相同的词根und,以上为他们之间的联系.每一个词存在于某一个例句中,例句为对应资源.

3.基于XML的主题图构建标准XTM

XML是当前处理结构化文档、跨平台的有力工具.利用主题图组织的信息十分具有固定的结构,即有三个元素:T、A、O.因此,XML技术可以较好地描述于主题图的组织的信息.将XML思想运用于主题图的实现,从而形成一种新的技术,即XTM,有时也称为TM/XML(Topic Map/XML).


XTM从本质而言,它是一种XML语言,只是其处理文档的对象为特定的、已知的结构文档.在XML文档中,所有文档以作为根标记,以标识该文件使用XML语法处理;在XTM文档中,所有文档以作为根标记,以标识该文件使用XTM语法处理.在XML文档中,用户可以根据文档内容自定义标记来使文档更具有结构化,以方便计算机处理;而在XTM文档中,所有内容都是根据主题图思想构建,它们结构相似,都具有T、A、O 三个要素,使用标识文档结构的标记基本相同,如 等.

相关论文范文