电子文件格式转换归档

更新时间:2024-02-20 作者:用户投稿原创标记本站原创 点赞:27538 浏览:129115

信息技术的广泛应用和电子政务的快速推进,使档案业务工作的重心开始向档案信息化建设转移.而电子文件的归档和电子档案的管理则是电子政务的重要环节和档案信息化建设的主要内容.然而电子文件形成、归档和电子档案管理工作在实践中遇到了一些实际问题.“电子文件格式转换及归档系统”研究课题组在沈阳市和其他一些省、市就电子文件归档及电子档案管理的情况,进行了深入的调查,发现其中有两个突出问题亟待解决.

1.电子文件格式种类繁多,难以进行及时接收、规范管理和有效利用.目前,计算机操作系统、应用软件种类繁多,办公自动化、档案管理软件所用的开发语言、数据库系统也是多种多样,因此造成了电子文件格式的五花八门,同时各种管理软件又互不兼容,甚至软件相同、版本不同的文件彼此也不能通用,这就严重阻碍了电子文件接收和电子档案管理工作的开展.

2.“文档一体化”软件难以推广应用.目前我国办公自动化系统已经比较成熟,应用的也比较普遍,但绝大多数系统,很少涉及甚至根本没有涉及档案管理.档案管理系统经过十多年研究,其软件的功能也比较成熟.但是多年来,我国文书和档案的形成及保管一直是在不同的部门运作,目前已经开发的“文档一体化”软件由于侧重点的不同而多数显得不完整、不规范,因而也很难推广应用.因此,研制一个“中间件”将办公自动化与档案管理有机地结合起来应是解决上述问题的关键.

沈阳市档案馆研制的“电子文件格式转换及归档系统”2004年3月顺利通过了国家档案局和沈阳市科技局组织的鉴定.该系统通过对电子文件的接收、转换、排序、归档、检索利用等全过程自动化管理,实现了将不同格式、版本的电子文件自动转换为统一格式,并可按照归档文件整理规则自动组成逻辑卷,刻录光盘,最终实现电子档案的脱机保管与利用.由该系统生成的电子档案可像电子图书一样,不依赖于原生成系统独立运行,从而使电子档案既方便利用又有利于管理.

1.电子文件的格式转换

以往不同格式的电子文件管理的解决方法是将各不相同的电子文件连同生成它们的不同软件,乃至不同硬件同时接收并保存起来.这样不仅管理起来很麻烦,而且,倘若有一个管理环节出现问题,就会造成电子文件不可识读情况的发生.为了解决这一难题,在系统的设计中,我们采用数据库转换、文档转换、图像转换等相关技术,从不同角度解决电子文件不同格式转换成统一格式进行统一管理的问题,从而使电子文件管理不再依赖于原生成系统,使电子文件的管理更加便捷和规范.

(1)数据库系统的转换.为了实现将不同办公自动化系统产生的数据库文件统一管理,避免档案管理中的重复劳动,系统设计了数据采集器,通过数据采集接口实现与不同数据库系统的自动连接,并根据档案管理的要求,统一转换成格式相同、排列有序的中间文件,经批量导入进行归档管理,最后生成标准的XML文件格式脱机保存.

(2)电子文件的转换.通常在日常办公过程中产生的电子文件可分为:文本文件(或称为字表处理文件)、数据文件(数据库电子文件)、图像文件等.由于产生它们的软硬件环境多种多样,因此造成了电子文件接收、归档及利用的困难.经过认真调查研究,我们认为如果将不同格式的电子文件转换成统一格式的图像文件进行归档保存,一方面可以保证电子文件的真实可靠性,另一方面还可以使电子文件不再依赖原生成系统就可以浏览利用,这样就为电子文件的管理提供了一个可操作的、相对规范的方法.为了实现这一构想,我们开发设计了数据转换器.利用数据转换器可以方便地将文本文件、数据文件及不同格式的图像文件都转换成统一格式的图像文件进行归档保存.我们设计的数据转换器,除可在本系统中使用,还可根据用户的需求嵌入到其他应用程序中完成电子文件的转换,从而解决了以统一格式实现电子文件归档的难题.

2.归档文件的脱机管理

在系统设计中,根据国家标准,对电子文件的脱机管理格式和方式进行了大胆尝试.我们没有将脱机管理简单地设计成电子文件的数据集合,而是实现了真正意义上的电子文件脱机自动管理.设计实现了可脱离原生成系统自动运行的光盘检索系统,使系统生成的“电子卷”可像电子图书一样,脱离原生成系统独立保存、自动检索.

该系统主要功能有:文件接收、格式转换、分类排序、电子卷整理、数据检索、系统维护和数据采集(可独立运行).

1.文件接收:包括数据著录和数据导入两模块.数据著录模块包括对电子文件著录信息的编辑,电子文件原文的导入,数据文件、纸质文件的导入,TXT文本文件的导入,数据定位,数据提交等功能;数据导入模块是针对不同办公自动化系统生成的电子文件数据库进行自动批量导入.

2.格式转换:包括电子文件格式的自动转换、自动检验、将不符合要求的电子文件驳回、数据定位等功能.

3.分类排序:可根据用户设置的分类排序条件实现对归档电子文件进行自动分类排序,生成与纸质文件对应的电子文件的件号,并可自定义格式,打印输出电子文件目录.

4.电子卷管理:包括整理立卷、脱机保管和电子卷查询模块.可实现根据用户所给条件对归档电子文件进行自动组卷、自动封装、自动刻录到光盘进行脱机保管、自动检索等功能.

5.数据检索:包括分类检索、条件检索和全文检索模块.分类检索即根据用户指定的电子文件分类排序条件进行合理的检索显示,以满足人们日常的阅读习惯;条件检索即根据系统所指定条件进行检索显示;全文检索即实现对电子文件原文的检索.


6.系统维护:包括用户登录、更改口令、疑难解答、部门定义、问题定义、电子卷类别定义等模块.主要是完成对系统功能的维护与修改,如:设定机构代码、问题代码、更改系统运行口令等.该系统具有良好的人机界面,在用户的权限范围内可根据需要随时对系统进行维护与修改.

7.数据采集:该模块可脱离系统独立运行,可与不同的数据库连接,并按照需求将数据库信息转换成统一格式的中间文件.

1.方便快速的批量转换.在系统中采用“中间件”的技术,设计了先进的数据转换器,实现了不同格式电子文件的转换,解决了电子文件归档和电子档案接收、管理工作中的关键问题.

2.安全的脱机保管与方便、快捷的查阅.该系统实现了以件为单位的电子档案脱机保管方式,在需要查找文件时,只要将光盘放入计算机中,无须安装恢复原系统,即可找到所需要的文件,实现了真正意义上的电子档案查询与阅读.

3.独特的与平台无关性.系统采用B/S结构和JAVA设计语言,怎么写作器端可以实现跨平台安装、使用,客户端只需要有浏览器即可工作.当用户需要更换系统时,可方便地将其移植到其他系统上,不需要重新开发.

4.灵活的系统设计.系统给用户留有灵活的接口,可方便增加、扩展系统的功能.同时,还设计了所见即所得的程序修改方式,即在系统运行时,用户可随时提出修改要求,系统维护人员只要按一下窗口上方的程序修改按钮,便可进入程序设计窗口进行修改,保存后无需编译即可显示修改结果.

5.实现了办公自动化与档案管理的无缝连接.该系统不但可以自成体系独立运行,而且还可以将其嵌入办公自动化之中,既不放弃原有系统,又实现了文档一体化管理.

系统研制成功后,为检验系统运行的实用性和稳定性,我们将其在一些部门和单位进行了试运行.首先接收了沈阳市档案室局(馆)2002年局机关形成的全部电子文件和纸制文件,并对其进行了格式转换.其中电子文件接收了300份,转换了近5000页;纸质文件扫描了6000页鸦数据库文件转换了1000条.其次又将我馆现存的电子档案数据进行了转换,整合并转换了3个目录数据库、1个全文数据库和1个照片数据库.其中:目录数据库转换了54000条记录,全文数据库转换了10万页,照片数据库转换了4万幅,同时又将近两年编辑出版的书籍、统计报表、早期形成的WPS草稿性的电子文件等不同类型的数据库,均成功地进行了转换.