高句丽原生数字资源知识库的构建

更新时间:2024-04-13 作者:用户投稿原创标记本站原创 点赞:26207 浏览:119596

[摘 要 ]针对目前高句丽原生数字信息资源存在的形式和内容的特点提出构建高句丽原生数字信息资源知识库的意义、措施和方法,对实现真正意义上的知识库的构建提出新的看法.

[关 键 词 ]高句丽原生数字资源 知识库 构建

[分类号]G250

1 构建高句丽原生数字资源知识库现实意义

作为中国古代东北地区最具特色与影响的民族和地方政权之一,高句丽曾创造了辉煌的历史.其主要的历史遗迹大量地存续于中国的吉林省和辽宁省,成为该段历史无可替代的实物见证,具有重要的历史文化价值.其中的王城、王陵和贵族墓更弥足珍贵.由于高句丽文化品位高、建筑艺术精湛、艺术成就突出、文明内涵富有特色,2004年在苏州召开的第28届世界遗产大会上,正式确定我国申报的“高句丽王城、王陵和贵族墓葬”为世界文化遗产,列入《世界遗产名录》.高句丽文物遗迹及高句丽文化引起世人瞩目.因此,构建高句丽原生数字资源知识库对高句丽的研究具有重要意义.

1.1 研究高句丽学术文化发展

学术界虽然对已经公开出版的高句丽研究资料和研究成果进行了辑录,但到目前为止,他们的收录都不十分完整,而且有的没有进行分类,检索也颇不方便;研究成果的电子数据方面,国内收录的主要是中国知网CNKI和万方数据库,它们收录了关于高句丽研究方面的成果(主要是电子版期刊论文),数量较少,内容不全.对公开出版的专著以及未公开出版的灰色文献,没有具体的收录模式.尤其研究高句丽的一些灰色文献,不仅存在获取难的问题,而且大多数处于研究阶段,其思想体系很不成熟,内容、范围均处在一个补充、考证、完善和发展中.所以,建设一个专门收集高句丽原生数字化资源的知识库,对高句丽资料的收集、学术文化发展以及后人对高句丽文化的研究都具有重要的现实意义.

1.2 研究国际政治文化发展

2004年,由中国方面提议,中韩两国的历史学者在汉城举行了关于高句丽历史归属的第一次学术讨论会.会上中国学者、“东北工程”的创始人孙进已先生一段简短的发言确立了高句丽的历史归属地位.所以,让世界了解高句丽的文化和历史是重中之重.

关于高句丽的历史,中国古籍中对高句丽研究已经有了大量的记载,从近代以来中外史学界和考古学界就开始关注于高句丽的历史与考古,到目前为止,国内外对高句丽历史与考古的研究已持续了一个多世纪,在这一过程中,史学家从浩瀚的史籍中辑录出了大量有关高句丽研究的史料,使一大批学术成果得以出版发表问世,形成了大量的研究论文和著作.如果以这些资料为基础,采用先进的技术手段,将丰富的高句而文献资源建成电子知识库展示给世界,可以让世界更了解中国的高句丽文化,更了解中国,从而增强我国历史文化的世界影响力.

2 通化师范学院图书馆构建高句丽原生数字资源知识库的优势

2.1 地理位置优势

“高句丽王室与贵族墓葬”位于中国东北吉林省的集安市,隶属于通化市管辖,与通化师范学院相距甚近.近距离的地理位置优势便于研究人员对文物遗迹的考古调查和发现,便于第一手资料的收集、获取和整理,为知识库的构建提供了最便利的条件.

2.2 文献信息资源优势

资源的多少与好坏直接影响着知识库的质量.通化师范学院是高句丽学术研究的重要单位,下设高句丽研究院.该研究院是吉林省重点研究机构,自2003年以来,发表高句丽学术论文46篇,出版学术著作10部,承担省级以上科研项目14项.丰富的文献资源优势为知识库的构建提供了最坚实的基础.

2.3 文献信息收集的技术优势

首先,图书馆作为各级网络建设中的积极成员,随着图书馆自动化技术的发展和数字化、电子化图书馆研究工作的深入展开,在信息检索系统、人机界面、知识库设计和管理以及自然语言处理、专家系统等方面都拥有丰富的软件技术开发经验.再次,作为重要的信息资源集散地,经常能引进各类先进的信息处理技术设备,因而在硬件资源方面,图书馆作为一个整体也具备相当的优势.

2.4 人才优势

合理的人才结构是知识库成功构建的关键.本课题组在学科知识结构、年龄结构和职称结构等方面搭配合理、恰当适中.有专攻高句丽研究并成为领军人物的教授,有精通计算机技术的精英,有擅长信息收集和加工的专业人才,学历覆盖本科、硕士和博士.

3 高句丽原生数字资源知识库的构建

3.1 高句丽原生数字资源的存在形式

高句丽原生数字资源是通过科研人员有意识的思维活动,把客观存在的离散的原生数字化资源(包括流传在民间的各类资源)经过一定的积累、分析、比较、判断、归纳和重组,经过数字化处理,创造出的符合客观实际的知识.高句丽原生数字化资源既包括已公开发表的一次文献资源,也包括未公开发表的灰色文献资源,因此高句丽原生数字化资源具有原始性、随意性、研究性、权威性等特征.这一特征不仅决定其形式多样,更决定其内容、范围广泛.依据内容划分,有数字化教学文献信息、数字化科研文献信息和数字化民间管理文献信息;依据类型划分,有数字化教材、教案、教学课件、科研论文、科研报告、会议文献、学位论文、民间文化资源等;依据出版形式划分,有电子图书、期刊、报纸、网络信息等.因此,高句丽原生数字化资源载体类型多样,种类繁多,分布分散,具有不便于搜集、管理、利用等特点.

3.2 高句丽原生数字资源的搜集

信息是数据库的核心,信息搜集是数据库建设的基础.特色数据库的建设要求其数据收集要确保完整性和权威性.为此,在信息收集时需要确定合理的收集范围、确定信息源的类型、确定信息来源渠道、确定数据库的类型等等.高句丽原生数字资源的信息搜集主要通过以下几个途径:一是中国知网CNKI和万方数据库,截止到2008年6月30日共检索到430余篇电子化期刊;二是公开出版的有关高句丽的著作,目前已达到30部以上;三是有关高句丽的教材、教案和教学课件、学术报告等;四是实地考察获得的相关文献.工作人员前往集安高句丽文化遗址、各研究所及学科组,进行实地考察,与相关人员交流,获取前线第一手资料,深层次挖掘信息资源,以保证特色资源库的完整性和独特性.

3.3 高句丽原生数字资源的加工整理

高句丽原生数字资源知识库建设之初,我们对收集到的数据资源进行了认真的审核筛选和加工整理.在对高句丽原生数字资源的加工整理过程中,我们充分考虑到知识库的信息组织、知识导航、知识标识和知识检索等方面的需求,逐步深入地对数据进行组织、加工、整理、规范,通过题名、作者、关 键 词 、作者单位等对文献资源进行深层次的揭示.例如,为保证知识库的规范性和方便读者使用,我们对格式不同的数据进行了统一的处理:检索的文件资料主要以PDF、CAJ和文本格式存在,数据格式的不一导致知识库不规范,读者检索不方便,我们在对数据处理的时候根据大多数读者的检索习惯将所有文件利用Adobe软件转换成PDF格式统一处理.这样既保证了知识库的规范,同时又满足了大多数用户的需求.

3.4 高句丽原生数字资源知识库的分类

工欲善其事、必先利其器.作为知识管理者不仅要把握高句丽文献知识的动态分布情况,使知识库的文献信息始终具有实用性、真实性、新颖性、连续性和完整性,能有效怎么写作于广大用户,更重要的是知识库的建立要具有开放性、良构性,知识库中的信息便于使用、传播、修改、扩充和传递,并能提供远程信息怎么写作.基于对高句丽原生数字资源的搜集和分析,我们将知识库划分为下列5个专题:①高句丽王城、王陵及贵族墓葬专题库;②高句丽碑刻文字专题库;③高句丽壁画墓群专题库;④高句丽建筑专题库;⑤高句丽文物遗迹分布专题库.

3.5 高句丽原生数字资源知识库的编目


现代网络环境下,任何一个图书馆都不可能依赖本馆的信息资源满足用户的所有信息需求,图书馆之间需要一定形式的合作.资源共享已经成为图书馆发展的必然趋势.基于此种考虑,我们在构建高句丽原生数字资源知识库的过程中十分重视知识库的标准化和规范化问题.构建知识库之初,对省内各特色资源库进行调研,了解其采用的标准和规范.构建过程中,严格按照《UNI-MARC格式和手册》、《国际标准书目著录》、《中国机读规范格式》等国际、国内有关文献数据库的标准和要求进行知识库的建库工作.构建知识库选用清华同方的专业数据库制作管理系统(TPI)应用平台,该平台能够兼容各高校图书馆普遍使用的CNMARC标准和Dublin Core标准,支持Z39.50协议标准和XML文件格式,以及美国、日本、德国联合开发的STN模式,为实现知识库的共建共享打下良好基础.

3.6 高句丽原生数字资源知识库的设计与问题解决

建设高句丽原生数字资源知识库必然涉及到收集多种文献资源,其中论文资源有CAJ、PDF、VIP格式等;图片资源有BMP、JPG、TIF格式等;纸本资源有碑文拓片、图谱、古籍等;电子图书资源有中国数字图书馆、超星图书馆等.如此众多的异构资源,给数据库建设工作带来种种困难,具体为以下几点:

相同文献被重复收集,如《高句丽古墓壁画反映高句丽社会生活习俗的研究》这篇文章资源在CNKI期刊全文数据库中能够查询到并进行收录,而与此同时在维普资讯网中也能够查询到并进行收录,因此,资源收集人员单凭记忆无法保证收集的资源的唯一性;

多种异构的资源造成管理困难,由于上面提到高句丽原生数字资源知识库必然涉及的资源类型多样.如果寄希望用一个软件系统对这些资源全部管理起来,目前无疑是一件难以做到的事情.

由于上述因素给高句丽原生数字资源知识库的建库工作带来众多不可估量的阻力,所以,必须在建库前期制定合理、科学的数据库建设策略,尽量减少资料的重复收集,合理地管理异构数据资源.

3.7 高句丽原生数字资源知识库采用的策略

高句丽原生数字资源知识库建库策略:首先根据资源的内容进行收集,然后根据数字资源加工、分类、标引、入库.

对同一资源形式涉及的不同数据库进行选择:如在加工电子图书资源时选择数据资源质量较高、图文转换的成功率大、便于制作成为全文资源库、利于全文检索的资源进行收录.如国内期刊论文资源库就选择较为成熟的CNKI资源库.

通过检索系统实现对数据入库前的查重功能,使同名、同作者、同出处的文献不会重复录入.

通过数据库存储全文链接地址而不是全文文件的方式实现不同类型文件的上传下载.这样即可以实现批量文献导入数据库,也可以大大提高上传效率.

3.8 高句丽原生数字资源知识库的结构关系图

高句丽原生数字源知识结构关系如图1所示:

3.9 高句丽原生数字资源知识库的管理与维护

高句丽原生数字资源知识库是一个动态发展、内容不断充实的知识库;一方面要保证数据以某种特定的方式组织在一起,以实现整个项目的正常运行;另一方面要保证数据的连续性和完整性.因此,对知识库的有效管理成为非常重要的组成部分,基于此种情况,我们在构建知识库时采取ASP与SQL查询语言相结合,通过编写ASP语句来实现知识库的管理与维护.ASP通过两个主要的对象Connection和Recordset实现对知识库的连接和访问,为实现整个项目的高效运行提供有效保障.

3.10 高句丽原生数字资源知识库的检索与获取

高句丽原生数字资源知识库的最终构建目的是为了满足用户的信息情报资料需求.现代网络环境下,用户的信息需求呈现出多元化、动态化、集成化、高效化、广泛化等特征.为了适应不断变化发展的用户信息需求,知识库的构建必须从用户信息需求特点人手,以方便用户信息检索为目标,使检索界面简洁大方,能够满足不同层次、不同水平的用户需求.构建知识库时我们选取MS SQL Server 7.0作为数据库管理系统,选用Microsoft Windows 2000 Server作为操作系统,选用Mi―CrOSOft Intemet Information Server(IIS)作为Web怎么写作器,选用Inter数据库连接器ODBC和ADO作为ASP访问该Web数据库系统的访问接口,选用简单、灵活、扩充性较强的Visual Stdio作为数据库前台开发工具,同时利用清华同方USP技术(分布式跨平台跨库统一检索平台),对其进行统一管理,对最终用户提供一站式检索怎么写作.最终用户既可以将图书馆所有数据库视为一个数据库检索,也可以分别检索,不再需要一一登陆.

4 结语

高句丽原生电子数字资源知识库是通化师范学院特色资源数据库之一,是一个高水平、高质量、高智能的特色信息资源库.高句丽原生电子数字资源知识库的构建为高句丽的深入研究提供了最为便利的条件.今后,随着高句丽文化研究的不断深入,高句丽原生电子数字资源知识库的内容将不断丰富并日益突显其使用价值.

相关论文范文