基于XML和本体的物联网数据交换标准体系

更新时间:2024-01-08 作者:用户投稿原创标记本站原创 点赞:21929 浏览:96944

摘 要:针对当前物联网应用层中相关数据交换标准纷繁复杂,相关标准主体各行其是的问题,从XML(可扩展标记语言)和本体的角度出发,从互联网、语义网和物联网的关系入手,提出了建立物联网数据交换标准体系的思路,即标准应以XML为语法格式,以标准化的本体为语义共识;标准体系应以顶级本体为基础,以纵向的领域本体和横向的任务本体为支撑,建立起各种不同的应用本体标准.文章最后通过一个应用实例分析了所述标准体系发展的若干关键要点.

关 键 词 :物联网;数据交换标准;可扩展标记语言;标准本体

中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2012)04-0067-05

Research on the data format standard of Inter of Things based on

XML and ontology

GUAN Jian

(College of Information, Capital University of Economics and Business, Beijing 100070, China)

Abstract: Currently in the application level of Inter of Things(IoT), relevant data format standards are very plicated and every relational subject goes his own way. To solve this problem, this paper, from the view of XML and ontology, started with the relationship among Inter, Semantic Web and IoT and then put forward the way of building the IoT data format standardization system. The IoT data format standardization should be based on XML for syntax and on standard ontology for semantic consensus.The standardization system should be based on top-level ontology, supported by vertical domain ontology and horizontal task ontology, and establish a variety of application ontology standards. Finally, the system with a specific application is illustrated and some key points for the development are analyzed.

Keywords: Inter of Things(IoT), data format standard, XML, ontology

0 引 言

2009年被称为中国的物联网元年,这一年,温家宝总理在无锡视察时提出了“感知中国”战略.2010年的“”期间,物联网首次被写入政府工作报告中,被确定为国家要大力发展的战略性新兴产业.近年来,从到地方、从政府到企业,一场物联网建设的热潮正在如火如荼地展开.然而,当前物联网的发展仍处于初级阶段,还面临着传感器技术不成熟、缺乏商业应用模式、信息安全和隐私等诸多问题与挑战,其中制约物联网发展的最大瓶颈,则是缺乏统一的技术标准,尤其是数据表达、交换和处理标准.因为传感器关键技术的突破、商业应用模式的推广等等,都只是物联网中“物”的问题,而数据交换标准则涉及物联网中“联”的问题.如果不能实现物与物之间畅通无阻的信息交换,就不能称之为真正的物联网.

1.物联网数据交换标准现状

物联网系统主要分为三个层面:感知层、传输层和应用层.感知层主要是对物体进行识别或数据采集;传输层是通过现有的通信网络将信息进行可靠传输;应用层则是对采集的数据进行智能处理或展示.在这三层体系中,感知层中基于物理、化学、生物等技术发明的传感器“标准”多已成为专利.而传输层的各种通信标准也已基本成熟,建立新的物联网通信标准难度较大,可行性较小[1].因此,物联网标准的关键和亟待统一的是关于应用层的标准,而其中尤以数据表达、交换和处理标准为核心.

目前,针对物联网应用层的数据交换标准主要有PML、EDDL、 M2MXML、NGTP等.其中,PML是实体标注语言,它是EPC(产品电码)物联网中交换信息的共同语言,用来描述人及机器都可以使用的自然物体的描述标准.EDDL是电子设备描述语言,它可以描述现场设备中的数据,以用于工程、调试、监视运行和诊断.M2MXML是一种用于终端设备间的通信协议,它包含一个用于分析协议的、与语义无关的Ja API.NGTP是宝马公司推出的开放式Telematics协议架构平台,它使用统一、开放的接口来区分Telematics怎么写作供应链的各个环节[1].此外,还有智能建筑领域的OBIX标准、公共安全与应急领域的CAP标准以及PCM(脉码调制)遥测技术的IRIG标准等.

可以看出,现有的物联网应用层的数据交换标准大多是针对某一特定领域或行业业务提出的,有一定的局限性,所以当前物联网缺少的是一个统一的物联网数据交换大集成应用标准(或标准体系).欧盟有关机构正在进行数据交换标准“融合”的研究,目标是综合考虑相关领域已有的基于XML的数据交换标准,以便为那些在不同的标准中语义上具有等价性的数据元素(尽管他们可能有不同的名字)提供全球唯一的交叉引用方式和标识结构,从而提炼出一个基础的元数据标准,把这个标准作为物联网数据交换的核心,那么,对于不同的行业应用,就可以基于元数据扩展出相应的行业数据交换标准[1].

总体来说,物联网的标准化工作已经得到了业界的普遍重视,但对于应用层的标准化工作来说,还需要客观分析物联网标准的整体需求,从国际标准、国家标准、行业标准、地区标准等多个层次进行统筹设计;其次,还需要协调各个标准的推进策略,优化资源配置[2].

2.物联网数据交换标准体系的构建

2.1 构建物联网数据交换标准体系的基石

XML 技术是为了克服HTML在互联网信息交换和表示方面的缺陷而设计的,本体论最初也是起源于哲学领域,随后在研究人工智能时被引入计算机领域.虽然两者的出现都不是为了解决物联网领域的数据交换标准问题,但它们却为这一问题的解决提供了必要的理论基础和技术手段.

2.1.1物联网数据交换标准的语法基础――XML

XML(eXtensible Markup Language,可扩展标记语言)是W3C组织于1998年推出的一种用于数据描述的元标记语言标准[2].作为SGML(Standard Generalized Markup Language,标准通用标识语言)的一个简化子集,它结合了SGML丰富的功能和HTML的简单易用,同时具有可扩展性、自描述性、开放性、互操作性、可支持多国语言等特点,因而得到了广泛地支持与应用.


对于作为物联网数据交换标准的格式来说,XML具有以下显著优点:

(1)可定义行业或领域标记语言

XML可以用DTD或者Schema来定义,一份遵循DTD或者Schema定义的XML文档才是有效的.因此,XML可以针对不同的应用建立相关的标准语言,如化学标记语言(CML)、数学标记语言(MathML)、语音标识语言(VoiceXML)等,包括目前物联网中很多已经存在的标准都是基于XML定义的.

(2)具有结构化的通用数据格式

XML使用树形目录结构形式,可以自行定义文字标签并指定元素间的关系,同时它也是W3C公开的一种数据格式,没有版权的使用限制,因而十分适合作为不同应用程序之间的信息交换格式.

(3)可提供整套方案

XML拥有一整套技术体系,如可扩展样式表语言XSL、数据查询技术XQuery、文档对象模型DOM等等.

2.1.2物联网数据交换标准的语义基础――本体

本体(Ontology)起源于哲学,被Neches等人引入计算机科学领域后,在人工智能、语义Web、软件工程、图书馆学以及信息架构等领域得到了广泛应用.关于本体最流行的定义是Gruber在1993年给出的,即“本体是概念模型的明确的规范说明” [3].Studer在对前人的定义进行概括后提出:本体的概念包括四个方面[4]:

(1)概念模型:它是客观世界现象的抽象模型,其表示的含义独立于具体的环境状态;

(2)明确:所使用的概念及使用这些概念的约束都有明确的定义;

(3)形式化:本体的表示是形式化的,可以被计算机处理;

(4)共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体.

本体的目标是获取相关的领域知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义.所以,本体是具有不同知识表示的Web应用系统之间进行数据或知识交换共享的基础结构.通过定义共享和公共的领域知识,本体可帮助机器之间或机器与人之间更加精确地交流,实现相互之间的语义交换,而不只是语法级的交互[5].


按照领域依赖程度,Guarino将本体划分为四类[6]:第一类是顶级本体,用于描述通用的概念和概念之间的关系,如时间、空间、物质、对象、事件、动作等,顶级本体独立于特定的问题和领域,与具体的应用无关;第二类是领域本体,用于描述特殊领域(如教育或金融)中的概念,即陈述性知识;第三类是任务本体,用于描述特定任务或活动(如入学或取款)中的概念,即过程性知识;第四类是应用本体,应用本体可通过进一步特殊化领域本体和任务本体,将其用于描述既依赖于特定领域,又依赖于特定任务的概念,这些概念通常对应于领域个体执行特定活动时所扮演的角色(如学生入学或客户取款).

2.2 构建物联网数据交换标准体系的思路

顾名思义,物联网就是物与物相连的网络,要想实现物与物之间畅通无阻的“交流”,就需要在语法上相同,在语义上互通.通俗的说,就是用相同的格式表达同一个意思.XML在语法上的结构化信息表达能力和本体在语义上的透明性之间的优势互补为物联网数据交换标准的建立提供了很好的解决思路.

2.2.1 从互联网向语义网、物联网发展

由于XML具有诸多的优点,因此,XML成为许多应用领域的首选信息表示格式.同样,XML也非常适合于物联网中的信息传输,同时,它还可使得各种物联网终端能够和当前的互联网实现很好的对接.因此,物联网的数据交换标准应该是一种基于XML的标记语言,而且,从目前已经存在的数据交换标准来看,也确实如此.然而,XML具有一定的语义局限性,它具有语义表达能力,却没有语义透明性,它允许用户在文档中加入任意的结构,而无需说明具体含义,但其缺乏数据表达式与相应概念之间的统一性.正因为如此,在XML2000会议上,Tim Berners-Lee提出了语义网的概念.语义网使用本体来描述一个专业领域知识中的重要概念以及概念之间的关系,以使得这些概念和联系在共享的范围内有着明确而唯一的定义,从而达成一种共识,这样,机器之间或人和机器之间就可以进行无障碍的交流.

语义网被称为下一代互联网,而物联网则是一种泛化的互联网,两者都将是互联网的发展方向,只是它们的出发角度不同,前者偏向于从技术角度出发,后者偏向于从应用角度出发.由于物联网具有自动识别、自动传输、自动处理等特点,因此,与当前的互联网相比,物联网更需要机器之间或人和机器之间实现语义级别的交互.

2.2.2 基于本体分类构建物联网数据交换标准体系

本体从底层向上分为顶级本体、领域本体和任务本体以及应用本体,这些不同层次的本体可向我们提供这个世界的共性描述,而物联网正是要将世界连接起来.

首先,物联网所连接的各种物体都处在同一个世界中,它们都具有某些共同的特点,即人们对于这个世界的基本认识,如时空、物质、事件、行为等,所以,物联网数据交换标准体系的基础是顶级本体标准.其次,物联网各个垂直的应用领域都有特殊性.具体到每一个领域,都有可能、有必要发展一套依托于领域本体的标准.但是,很多类型的业务词汇和流程是可以跨越多个垂直应用领域而公用的,所以,还有必要发展起跨领域的物联网任务本体标准,即某个领域的本体标准可能构建于多个任务本体标准之上,而某个任务本体也有可能被多个领域本体所引用.最后,具体到每个企业、组织甚至个人,它们针对于自身的物品、行为、过程等,也可以建立起基于顶级本体、领域本体和任务本体的应用本体标准,以供其他个体在与自身发生信息交换时共享这些事先定义好的内容.

基于上述思路,物联网数据交换标准应以XML为语法格式、以标准化的本体为语义共识.按照本体的分类,物联网数据交换标准体系应以顶级本体为基础,以纵向的领域本体和横向的任务本体为支撑,建立起各种不同的应用本体标准,其整个物联网数据交换标准体系示意图如图1所示.

2.3 物联网数据交换标准体系的应用实例

XML使物联网中的节点可以采用相同的数据交换格式,而本体则可以使相关节点对交换的数据实现语义上的共识和推理.下面用一个具体的实例来说明XML和本体在物联网数据交换中所发挥的作用.

例如,某消费者家里的智能家居系统检测到冰箱里的苹果存量不足,那么,系统就会根据预先设定的程序自动向网上商店发出购写指令.这样,关于此次购写行为中的苹果描述信息如下:

xmlns等于”l.

[8]蒋建文.基于多Agent的信息家居系统研究[D].合肥:合肥工业大学,2003.

[9]李为冲.XML到OWL文档生成方法研究[D].青岛:中国石油大学(华东),2008.

[10]施煜,何青,孙运传,等,译.欧盟物联网研究战略路线图[R]. 欧洲物联网研究项目组,2011.

作者简介:管 健 男,1988年出生,安徽六安人,首都经济贸易大学硕士研究生.主要研究方向为电子商务、信息安全、信息交换标准.