可信的电子文件管理传输平台功能与模型

更新时间:2024-02-10 作者:用户投稿原创标记本站原创 点赞:34281 浏览:157843

摘 要 :本文以电子文件管理及传输系统为研究对象,以真实、完整、可信、一致为系统功能目标,采用从上至下、由外而内、由粗及细的建模思路,对电子文件管理及传输平台所依赖的网络环境规划、元数据顶层设计、数字安全认证、数据封包等内容进行分析,提出一套基于“异构”背景下的电子文件管理及传输模型.

关 键 词 :电子文件,档案,管理系统,模型

Abstract:Inthispaper,forthestudyofelectronicdocumentmanagementanddeliverysystem,basedonreal,plete,credibleandconsistentsystemfunctionsasatarget,anddetailedanalysisofthecontentsoftheworkenvironmentalplanning,metadatatop-leveldesign,digitalsecurity,authentication,datapacketstructure,etc.,Proposedamoreplete,electronicdocumentmanagementandtranissionmodelof"heterogeneous"background.

Keywords:Electronicdocuments,Archives,ManagementSystems,Model

1前言

电子文件管理系统是保障电子文件安全有效管理及长期归档保存的解决方案.随着海量电子文件的出现,很多单位已经开始进行电子文件管理系统的实践,但究其本质,大多仍未达到“可信”标准,如系统不支持元数据捕获及管理、元数据方案及结构不完整、文件缺乏必要的签署和认证、数据格式不规范无法长期存用等,这种似是而非的电子文件管理系统,仍在“可信”二字上有较长道路要走.

本文主要针对业务系统、电子档案管理系统“异构”现状,提出一套电子文件从传输到集中的处置模型.在建模过程中,我们对系统功能目标、管理及传输网络、元数据方案、数字认证、文档封装等内容进行系统的研究,全面保障电子文件的真实可信.


2可信的电子文件管理及传输平台功能目标

2.1真实.电子文件真实性是指形成于特定环境的电子文件经过传输、处置、利用、迁移等环节之后文件的内容、结构和背景等基本构成要素没有发生变化,管理过程清晰可见.这个真实性体现在电子文件管理的三个阶段(业务系统、电子文件管理系统、数字档案馆),都应有相应的评价机制来保障该份电子文件在不同封装状态、不同处置环境下的管理及保存状态,且该评价贯穿电子文件形成、管理到利用.

全程管理及前端控制理论要求我们,一是要设计尽可能系统、完整的元数据项目,包含文件实体、形成背景、处置主体及处置行为等多方面内容,二是元数据规划要探入系统设计前端,要符合国家、地区及行业有关规范及要求,三是为了辅证公文的可信,系统中应有必要的权限管理与控制、操作日志、审计机制、数字保真、“留痕”等功能,可帮助我们监控管理行为并处置非法行为.

图1电子文件真实保障示意图

2.2完整.完整性是指电子文件及其元数据完整,它和真实性一起为电子文件的“可信”创造了条件.影响电子文件完整性的因素主要包括电子文件管理系统捕获机制是否完备、元数据方案是否规范、电子文件归档流程是否正确、电子文件物理及逻辑状态是否清晰等.

从系统功能看,系统首先应有灵活完善的收集机制,可以让我们的管理系统介入业务系统上游,对系统外及手工归档的各类电子文件及数字副本进行收集,通过规章力量和系统功能来保障所有完毕、具有保存价值的文件能实时或定期反映到电子文件管理系统之中,其次,电子文件管理的全过程要按照既定的元数据方案主动地捕获或手工登记文件形成、处置和利用等元数据,这是电子文件的重要组成部分,且与电子文件紧密联系在一起才能证明该份电子文件的法定身份,最后要充分建立和维护好元数据与文件本身的联系,保证电子文件与各类元数据、文档存储路径及格式信息等能牢固捆绑并封装在一起.

2.3可用.可用性是指电子文件的内容能始终可读并能长期保存,它包括内容可用和形式可用两个方面.内容可用是指电子文件中所包含的二进制信息和字符编码标准无误.系统可通过元数据捕获和记录来注册电子文件编码格式、字符集和版本序号、管理软件名称、版本号、制作及转换信息等特定内容,当我们面对保存或迁移需求时,可便捷地为读取或还原该文件提供良好的现实环境或仿真环境. 形式可用是指电子文件的格式和存储载体要符合管理规范.电子文件管理及传输系统应遵从《电子文件归档及管理规范》等标准,将通用电子文件格式(JPG、MP3、TXT/RTF、I等)纳入系统审查机制,并允许非标格式在系统内进行转换,保证管理端、传输端、利用端电子文件长久可用.对于流式文档,如DOC、TXT等格式,我们提倡采用版式文档进行转码,削弱硬件设备、平台差异对文件原貌的影响.

2.4一致.电子文件管理系统应具有相应的检测及约束机制,可以在系统管理及维护中通过内嵌的检测体系衡量系统是否达到既定效果,从而维护电子文件真实、完整、有效在理论和实践上的一致.换言之,文件管理系统应当具备自评估功能,能动态地对文件是否符合既定规划和标准进行评估,且该结果可以表单或系统警报的方式反馈至系统使用者或管理员.

它包括,系统能够对电子文件及元数据的捕获率作出完整性评估,尤其是对数据属性为非空值的数据进行检测,从而判断背景、结构、内容、管理过程是否完整,能够对文件存储格式作出标准化评估,非标准格式的由系统进行注册并作提示和预警[1],并转换为标准格式,能够深入封装、签署、认证、保真等环节,通过电子文件属性判断、元数据监测、病毒检测,作出真实性、有效性评估.评估完成后系统将形成评估报告,从而协助我们作出利于电子文件保存的判断,更好地发挥电子文件的价值(图2).

图2电子文件管理系统一致性检验及约束图

3可信的电子文件管理系统模型构建

3.1网络拓扑模型.网络是电子文件管理的底层物理环境,这个环境不好,电子文件的真实性、完整性就易遭受严重的威胁.综合考虑电子文件管理系统的用户分布和功能诉求,我们认为有必要对ERMS所处网域进行功能划分、分级管理,这既是对电子文件的管理特点的尊重与维护,也符合电子文件管理安全性要求.

电子文件随着其生命周期的推进,将依次经历三个物理网络(图3),在这三个网络中,电子文件的价值及处置主体(系统)是不同的.我们可采取关键网物理分离、网域内在线管理、网域间双线传输的形式来规范及约束电子文件的管理,确保电子文件的安全.

首个网络在电子文件形成机关内部,它通过物理网关及软硬件防火墙与广域网隔离,规避外界及内部不良影响,电子文件只能在局域网业务系统内进行登录和处置,第二个网络是资源收集或移交的关键,即业务系统中的电子文件及其元数据经过XML封装和数字证书加密保真后,以脱机拷贝的形式,进入到政务内网或机要网进行处理,第三个网络是电子文件接收方或管理方(档案馆、室、文件中心等)的专用网络,该网络直接与政务内网或机要网相连,可提供数据库、格式转换、封装、备份、WEB管理、全文浏览、流媒体点播等怎么写作.

图3电子文件生命周期内网络保障分布图

3.2元数据方案模型.元数据,是用来描述数据的内容、结构及背景的信息,它可以反映数据管理的整个过程,应用在电子文件及电子档案的管理上,可以用来证实文件的真实性、完整性、有效性、一致性.

我们目前关于电子文件元数据研究的较为成熟的成果有ISO15489、ISO23081、DA/T46-2009等.综合考虑电子档案载体形态、电子文件管理特点、国家及地方管理特色,本文以ISO23081中提出的法规四元组的顶层框架模型为基础[2],结合《文书类电子文件元数据方案》(DA/T46-2009),将反映电子文件与各类信息的关系描述、政策法规依据、职能活动描述等列入元数据采集范围[3].我们在元数据方案中定义了实体、业务、责任、法规及关系等五个元数据属类,并在封装时将其转成以文件为中心的扁平化结构.在整个元数据方案中,除反映文件本身自然属性的实体元数据稳定不变之外,其他各类元数据都是随管理过程的深入而动态变化(图4).

五个属类中,实体元数据用于了解电子文件的来源、属性及生成环境,责任元数据是落实责任对象、评价电子文件法定性的重要依据,业务元数据是重现文件管理过程的重要信息,关系元数据是揭示材料间相互联系、进行信息联动的有力支撑,法规元数据是控制、约束业务行为与职能授权的规则.这些元数据直接为电子文件三个阶段的管理提供了数据记录及验证支持.

图4元数据方案顶层设计图

3.3文档封装模型.元数据封装是指按元数据方案的结构将编码数据及元数据整合为一个文档,并用数字证书对需保真部分作摘 要 和签名.封装技术的直接优势在于它以纯文本、小体积的形式对文件背景、内容和关系进行了完整的自我描述.综合考虑BS、ERMS、TDR三个管理阶段的管理要求,其封装模型呈现出以下特点.

其一,封装的过程性.它的封装不是一次成型.电子文件的管理及利用有灵活的分段封装机制,即电子文件可以允许多次解析和封装,BS系统中以结构状态、形成背景及处置行为为主封装出SIP包(提交数据包),ERMS系统中以实体、验证及其管理行为为主封装AIP包(存档数据包),TDR系统则以实体、认证为主封装DIP包(分发数据包),三者基于同一种封装及解析算法,具有一定的系统性,但封装及解析又具有相对独立性. 其二,封装结构的半封闭式.它的部分取值来自对文档及生成环境的自动摄取,这些文档及背景元数据是静态的,提取后不可篡改,因而可保障电子文件的真实性,还有部分数据来自管理过程中的人工著录和记录,它是动态的,它可随管理活动的深入而增加,呈现出横向稳定、纵向增加、不可逆转的特点,连续的动态数据可佐证电子文件生成及管理过程、帮助解读各项职能及业务行为、明确及判断相关权限.

配合系统日志、审计机制,我们可以判断电子文件形成、归档及保存全过程是否合规合法,文件是否可信(图5).

图5元数据封包结构图

3.4数字认证模型.通过电子政务或电子商务平台制作和传输的电子文件,要杜绝业务流程中的篡改、丢失、攻击等问题,保障电子公文的真实有效,就必须借助于一定的验证技术.数字签名技术(PKI)就是其中一种,它利用某种运算生成一系列符号及代码组成的电子进行签名,来代替书写签名或印章,主要用于鉴定签名人身份以及确保电子数据完整、真实,技术成熟、可靠性强.

传统的“小作坊”式的两两认证只局限于处于同一编码环境下的文件传输双方,认证范围较窄,一旦脱离这个系统,势必又要重新开始认证,周而复始,浪费资源.鉴于ERMS系统中的电子文件都形成于合法的社会组织,所以,我们主张充分引入国家认可的认证机构及已有的认证资源,统一数字认证编码算法,在全国(全省)范围内建立一个完整的数字认证体系.当前可应用于立档单位与同级综合档案馆之间电子档案交接,待认证资源高度统一后,则可用于复杂的数字档案馆间档案共享与协作、档案交流与交换.

其原理及流程如下,CA作为国家承认并备案的第三方认证中心,负责向领用单位颁发证书,并通过根证书的离线或在线验证来证实其所颁发证书的有效,建立起发证单位与领证单位的信任,领证单位得到的这份证书主要用于信息及数据的加密,我们称为密钥,与之相对应的公钥在网上在线发布,公私两个密钥是非对称结构,接收加密数据包的单位在收到密文后,利用数字证书当中的公钥,确认算法,从而将其还原成明文,完成解码.

4结论

网络环境是电子文件管理系统所处的外界环境,是摒除网络不稳定因素,保障网络及信息安全的根本所在,元数据方案是保障电子文件真实可信的关键因素,是确保电子文件真实可信的第一道屏障,文档封装是元数据的组织及解析形式,是各类验证及评价的数据及结构基础,数字认证是确保文件来源及信息真实可信的有力支撑.可信平台的构建一定要妥善处理好以上四者的关系,不可偏废.相信随着管理体制的不断完善、国内标准的不断发布、安全技术的不断创新和应用,未来的电子文件管理系统会越来越成熟.

相关论文范文