图书馆日文编目系统优化

更新时间:2024-02-05 作者:用户投稿原创标记本站原创 点赞:4926 浏览:17170

摘 要 图书馆自动化、网络化的发展促使图书馆在图书编目工作上发生了重大改变,但日文图书编目与中西文编目相比仍然比较薄弱.通过对图书馆群的调查和查找相关文献,论文介绍各馆当前应用的日文图书编目系统和MARC格式的使用情况,结合日文图书编目的工作实践,以辽宁省图书馆为例阐述日文图书编目在套录数据时存在的局限性以及自编数据遇到的实际问题,以此探索日文图书编目业务的建设和发展.

关 键 词ILASII INTERLIB ALEPH500 MARC 日文图书编目

分类号 G254.3

On the Optimizing of the Japanese Catalogue System in the Library

Ma Zhuo

Abstract The development of library automation and working greatly changes the work of cataloguing. But the catalogue of Japanese books is still weak if pared with the catalogue of Chinese and Western books. This paper introduces Japanese books cataloguing and MARC format in each library by doing the survey on different libraries and checking the related literatures. With the experience of Japanese books cataloguing and taking the case of Liaoning Provincial Library, it expounds the limitations of Japanese books cataloguing when download the cataloguing data and the problems when self-cataloging data, so as to explore the construction and development of cataloguing work of Japanese books in the library.

Keywords ILAS II. INTERLIB. ALEPH500. MARC. Japanese books cataloguing.

1.日文图书编目系统和MARC格式使用情况

关于日文图书的编目系统,有美国RLG于1983年开发的处理中、日、朝文资料的CJK系统、加拿大公用书目组织自1986年以来开发的以JAPANMARC为基础的日文资料联机编目系统和日本的JAPANMARC系统.我国图书馆使用的系统有ALEPH 500系统、汇文系统、INTERLIB系统、ILAS系统.

吉林大学1998年4月引进日本国立图书馆光盘数据检索系统,采用JPMARC,在日文操作平台的支持下,完成检索、套录编目和原始编目工作.但关于日文数据用什么系统和格式,从2000年研讨会上到至今没有统一的标准.各馆采用的系统和格式都不同,即使是同一系统,采用的MARC格式也不一样.通过全国“图书馆决策咨询怎么写作”群调查得知,南京地区图书馆用汇文系统,采用CNMARC.湖北省馆用INTERLIB,支持各种文种,但据说有些功能也不好用.广东馆日文与英文、德文一样编目,全馆统一使用ALEPH.云南省馆馆员认为日语属于汉语系统,和中文一样编目.陕西馆和新疆馆由于缺少日语人才,尚未编目.据新疆馆馆员说,其他兄弟馆也没有编目.国家图书馆用ALEPH系统,UARC.东北师大图书馆采用ALEPH 500系统,CNMARC.辽宁省馆应用ILASII系统采用CNMARC.


以三个图书馆的数据为代表,用所藏最新版《朝日キワド》数据为例,三个图书馆因采用的系统与格式不同,所显示出的字段和内容均不同.在读音子字段上,例1用880字段,例2不采用,例3按中文图书的格式在对应字段显示.

1.1 国家图书馆应用ALEPH系统的UARC

ALEPH 500系统由以色列开发的第五代产品.其优点为多语种性,它支持包括中文在内的英文、俄文、日文、韩文、法文、德文等20余种用户接口语言.当前,已经有1250多套ALEPH系统安装在51个国家和地区的图书馆和多馆联合组织内.从网上资料得知,在国内有很多图书馆采用了此系统.北京师范大学图书馆率先引进该系统,将其独立汉化并投入使用.四川大学图书馆2005年8月启用.国家图书馆于2002年10月正式启用.国家图书馆的数据示例如下.

例1:

FMT BK

LDR cam a2202989 i 4500

001 003671580

005 20130515143538.0

008 121012s2012 ja ak 001 0 jpn d

020 |a 9784022276322 : |c 1100+税

040 |a NII |d CcBjTSG

090 |a H363-62

24500 |6 880-01 |a 朝日キワド 等于 |b Asahi keywords. |n 2013 / |c 朝日新出版. |k

24631 |a Asahi keywords

260 |a 京 : |b 朝日新出版, |c 2012. 300 |a 334 p. : |b , 表 ; |c 21 cm.

500 |a 索引あり.

500 |a ?国は1996.6刊.

500 |a 2009→10以降の者 出版者:朝日新出版.

500 |a 1998.6以降の 、国、英版、政治?法はにあり.

650 4 |6 880-02 |a 新―辞.

650 4 |6 880-03 |a 事用―辞.

650 4 |6 880-04 |a 新―辞.

7102 |6 880-05 |a 朝日新社.

7102 |6 880-06 |a 朝日新出版.

88000 |6 245-01/$1 |a アサヒ キワド.

880 4 |6 650-02/$1 |a シンゴ -- ショ.

880 4 |6 650-03/$1 |a ヨウゴ -- ショ.

880 4 |6 650-04/$1 |a シンゴ -- ショ.

8802 |6 710-05/$1 |a アサヒ シンブンシャ.

8802 |6 710-06/$1 |a アサヒ シンブン シュッパン.

OWN |a DB209

CAT |a WWDC103 |b 01 |c 20130423 |l NLC09 |h 0952

CAT |a WWDC209 |b 02 |c 20130515 |l NLC09 |h 1435

096 |a H363-62

1.2 南京地区图书馆使用汇文系统

汇文系统以南京大学图书馆、东南大学图书馆以及江苏省文献保障系统所属成员馆为基地的江苏汇文软件有限公司研制开发的系统软件,是“江苏省高校文献保障怎么写作系统”重点科技项目之一,是目前国产同类软件销售势头最好的图书馆管理系统之一.目前拥有用户近240家,已经覆盖了国内一大批重点大学的图书馆及公共图书馆.金陵图书馆采用CNMARC格式,数据示例-

例2:

000 00811nam0 2200277 450

001 0000527855

005 20071227163100.0

100 __ |a 20071116d1990 ekmy0jpny50 da

101 0_ |a jpn

102 __ |a JP

105 __ |a a z 001yy

106 __ |a r

200 1_ |a 朝日キワド |h 1991 |f 朝日新社 |g 野敬集 |g 相三[等]

210 __ |a 京 |c 朝日新社 |d 1990

215 __ |a 335 |c 表 |d 21cm

320 __ |a 有索引

610 0_ |a キワド |a 文化 |a 科学技 |a 政治 |a|a 社会 |a くらし |a マスコミ |a 告 |a 国土 |a 境 |a 交通 |a 通信 |a|a 教育 |a スポツ |a 国 |a 新 |a 辞

690 __ |a Z |v 4

702 _0 |a 野敬 |4 集

702 _0 |a 相三 |4

702 _0 |a 青柳正悟 |4

702 _0 |a 畦 |4

702 _0 |a 渥美好司 |4

711 02 |a 朝日新社 |4

801 _0 |a CN |b JL |c 20071116

905 __ |a JL |d Z/R21:1991

1.3 辽宁省图书馆使用ILASII系统、CNMARC格式

ILAS系统是1988年由深圳图书馆承担并组织开发的系统,其缺点是部分使用Unicode标准,对外文数据下载容易造成乱码.系统不支持日文输入法,使日文输入只能采用word格式复制、粘贴的方法,速度极其慢,而且粘贴到系统里,有时会出现乱码,它部分实现了小语种编目.数据示例-

例3:

HEA##01359nam0 2200421 450

001##886085032011000079

010##a9784022276292 b2012 d1100+税

020##aJP bJP86059736

035##a(NII)BN00737358

100##a20110530d2011 km y0jpny50 da

1010#ajpn

102##aJP

105##ay z 001yy

106##ar

2001#a朝日キワド 9アサヒ キワドh2012 f朝日新社

210##a京 c朝日新社 d2011

215##a358p d21cm

310##a交

5171#a朝日キワド 9アサヒ キ ワド

5171#aAsahi keywords 9アサヒ キ ワド

6060#a新 9シンゴ x辞 2NDLSH 6060#a事用 9ヨウゴ x辞 2NDLSH

6060#a新 9シンゴ x辞 2BSH

680## aPL685

686#a813.7 2NDC8

686##aKF7 2NDLC

690##aH366 v4

690##aK153 v4

71102a朝日新出版 9アサヒ シンブン シュッパン 4

71102a朝日新社 9アサヒ シンブンシャ

3DA00040016 4

801#0aJP bNII c20110117

801#2aCN b021001 c20110603

905##aLT fH366/ア245:2012

1.4 INTERLIB系统

由广州图创计算机软件开发有限公司开发的新一代图书馆自动化软件,存储使用Unicode标准,能够支持多MARC格式在同一系统中并存,能够实现多语种混合编码,完全支持小语种的输入法.兖州市图书馆于2007年底启用.东莞市图书馆2003年开始使用.青岛科技大学图书馆2007年10月引进.国内有大部分图书馆都由原来的ILAS系统改用INTERLIB系统.

2.日文图书套录数据的局限性

以辽宁省图书馆为例,采用CNMARC用《中文文献著录原则》进行数据修改.在应用ILASII系统利用外部数据库进行转换时,某些字段格式或指示符会发生变化,必须进行删除、修改、添加,其程序相当繁琐.有些字段及子字段内容的修改在做无用功,尤其是原数据附注项的精华便于检索资料时作为参考,如例1保留了500字段内容,而例3删除了其内容.不如保留原有数据的精华,利用修改或删除的时间好好研究下著录和分类.

2.1 需要删除的内容

NII数据责任者的片检测名读音的姓与名之间有一个半角状态下的逗号,需删除.附注项体现得最为细致、详细、具体,它包括责任者、出版发行者的变更、解说、监修、参考资料、引用文献、索引、题名页的选取以及封面英文特征等内容,并标示索引和参考文献的起止页码,建议保留.

2.2 需要修改的内容

出版时间书写格式不同.NII数据出版时间著录到“月”,按照规定要修改到“年”.

页码的书写格式不同.日文图书正文前、正文后的页码无论是否超过十页都照实录入,包括页码的书写方式.采用“×p”的形式,如“viii,296p”、“x,192,4p”.

读音子字段代码不同.原始数据中题名、丛书项、副题名、主题词、责任者字段内容的日语读音代码为“A”,没必要按照中文标准改为“9”.日本原始数据丛书项和主题词字段加了读音,值得借鉴.

文献类型特征符号.大概是转换数据时,NII数据主题字段的有些文献类型特征符号变成了“?”,要更改为适合的文献类型特征符号.日本很多小说不做主题标引.我馆对主题标引不做要求,指的是自编数据时不做此字段,这可能与当时制定规则时与编目员不懂日文,也不懂主题词标引有关.既然日文图书是所藏文献中不可分割的一部分,应使数据尽量全面化、标准化.

尽管如此“完美”修改,但数据中最重要的内容如对利用者和馆员来说具有检索意义的题名字段内容、丛书项、责任者项的日语汉字字形却无法修改.如汉语的“花”“植”不能改为日语的“花”“植”.这是由于系统不支持日文输入法,在数据转换时不识别某些日语格式造成的结果.

2.3 需要添加的内容

添加个别字段.添加漏掉的如010、215、7等的字段及子字段.

添加装帧形式.日文图书大多为精装书,对此字段没有特别说明.但从本馆数据情况来看,精装书要比简装书多,需用日语添加装帧形式.

添加获得方式附注.日文图书的获得方式只有唯一途径――国际交换.因而,要在数据中体现出其来源.今后如有购写的日文图书,也应做以说明,并根据购写时汇率情况计算出当时购写所需的人民币.

添加《中图法》分类号.将NII原始数据的字段转化为CNMARC格式的686字段里,都有分类表代码“NDC8”“NDC9”“NDLC”,分别代表是第8、9版《日本十进分类法》和《国立国会图书馆分类法》.我馆要求增加5版《中图法》.

添加责任者项.添加漏掉的责任者生卒年,对生卒年外没有小括号的要添加.

添加种次号.本馆要求依据《植村长三郎的著者简明表》,该表共有45个清音检测名和与其对应的45个两位数的数字,没有使用规则.而在2010年我参观、访问的日本51个图书馆中,多使用森清编的《日本著者表》、著者名顺序、书名顺序、入藏顺序和年代记号标记法(都立图书馆).

3.日文图书自编数据的实际问题

正因为套录数据存在一定的局限性,同时,有些日文图书尤其是2000年以前的图书没有套录数据可用.所以,对日文图书进行自编数据势在必行.仍以辽宁省图书馆为例,介绍日文图书编目时遇到的实际问题.

应用ILAS系统时,数据导入到ILAS系统中会发生乱码的现象,在系统里不能使用日文输入法,需在word文档里用日文输入法输入“庭”,粘贴到系统中.在此系统中,日文的自编数据必须在word文档逐一著录,再逐一粘贴到系统里,相当麻烦,费时、费力.

在INTERLIB系统中的试应用.2013年6月我馆开始开始此系统,用CNMARC标准,在这新系统里虽能使用日文输入法,但是“@9”后面的读音自动出现是对应中文汉字的汉语拼音,而不是日语的片检测名读音.例,200字段“@a 理想のとは何か@9li xiangの tu shu guanとは heか@ e知の公共性をめぐって理想の @f根本彰著”,而“@e”、“@f”不能直接在日文状态下输入,必须在英文状态或中文状态下输入.“@e”在日文状态下输不出来.“@f”在日文状态下输入,就会出现这样的情况“a理想の@f根本彰著9li xiangのtu shu guan@fgen ben zhang zhu”.在这种系统里做日文数据,要来回转换语种状态,即日文与英文输入法.但是“@9”反映出来是CNMARC格式,对于日语来说是个大错误,不伦不类.这些都将会给未来数据的准确转换带来了难度.虽然我们的日文图书很大一部分都能在NII里找到准确或可参考的数据,但并不是所有的数据都能套用.对于那些没有数据的日文图书,尤其是具有地方特色的旧日文来说,做好标准数据至关重要.在数据资源共享发展的大趋势下,国际交换的标准数据以及资源共享是必然趋势. 4 日文图书编目采用何种MARC格式

由于日语语言的特殊性、专业人才的稀缺以及成员馆采用不同的系统等原因,对日文图书编目采用何种MARC格式,一直尚未达成统一结论.在国内,主要采用UARC和CNMARC两种格式.

UARC:1972年,国际图联制定了UNIMARC以规范各国的MARC格式,它适应多类型、多语种的文献需求,已成为最成熟的元数据.1999年出版MARC21,MARC21的优点为:由于资料间的转换减少,书目记录更快完成,可减少昂贵的转换格式的维护费;能省下时间处理特定资料,促进书目趋向共存.UARC用880字段来揭示其他语种书的编目,主要是把中、日、韩文字罗马化,但输入过程非常麻烦、费时.(例1)

CNMARC:研制于20世纪70年代,用于中国国家书目机构同其他国家书目机构以及中国国内图书馆与情报部门之间,以标准的计算机可读形式交换书目信息.1992年2月,在UNIMARC基础上编制了《中国机读目录通讯格式》,即CNMARC格式.但它采用GBK字符集数据,适合我国出版物的一些情况、汉字处理的特点和书目信息处理的标准,仅适用于中文文献的处理,对多语种文献资源揭示不足.目前仅适用于日文图书的部分编目,对其他语种文献的反应不够敏锐.(例2/3)

JPMARC:是日本国立国会图书馆基于国际标准ISO2709格式和UNIMARC开发研制的.日文图书和西文文献在数据性质上不同,JPMARC设置了一些特殊的连接字段,并赋予UNIMARC中现在没有使用的字段标识符,采用表示读音的“检测名”“罗马字”数据的连接等措施.日本研究者认为指示符在日文书目信息处理上没有特别的作用,因此JPMARC中没有使用指示符.

UARC、CNMARC、JPMARC格式是针对不同的文献类型和语言特点设计,各具优缺点,有识别某语种的能力.但在我国各图书馆,西文图书编目采用UARC,中文图书编目采用CNMARC,而日文图书编目目前尚没有统一的格式与标准.很多人认为,只要能识别日文字体,不乱码,能检索到文献,采用哪种格式无所谓.尤其认为日文和中文一样都是汉字,采用CNMARC好,我认为这是不懂日语的人的想法.前文已阐述,套录数据转换来的不都是标准数据,造成这一问题的主要原因是采用何种MARC格式的问题.如果只用一种格式包含多种数据,可能会失去数据本身的文化特点.我认为日文图书编目采用ALEPH 500系统、JPMARC格式为好,一方面可以保证日文特色,另一方面还可以保证信息的完整性.

5.日文图书编目采用何种分类法

从例1、3中看出,对日文图书多采用《中图法》,但笔者认为直接利用日本图书馆数据的分类法为好.采用《日本十进分类法》,不仅能减少劳动,提高数据质量,也能促进国际间资源共享.何况,用《中图法》类分日文图书,往往很大一部分书都集中在一个类号里,就谈不上对书进行细分、排架了.用《中图法》分类日文图书有一定的局限性,不能全面地反映出日本的特点,在分类的细分要求上也失去了意义.同时,也失去了图书本身的特征信息.因此,不用《中图法》分类为好.如《にほんのいきもの》(ニホン ノ イキモノ ゴヨミ日本生系会著;Q94、Q95),这是反映生物――植物、动物与季节的关系的,在《日本十进分类法》“生态学类”类里有专门的“生物季节”类目(生物与气候学).而《中图法》没有专门的类目,分别分在植物学和动物学里,那与季节的关系又不能很好地体现出来,分到哪个类都不如日本的准确、直接.又《和器の世界:カラ解》(西川浩平著;TS953),是介绍日本特有的乐器,没有奏法.不能分到“中国乐器”里,分到“西乐”也不合适.按照《中图法》只能分到上位类,但已表达不出日本的特色文化.

近几年,交换的日文图书里增加了少儿图书,这类图书的分类、分库也值得探讨.

总之,日文图书的编目工作非常薄弱,各馆多采用NII数据库进行套录数据.而自编数据比中文、西文、俄文难度都大得多,它涉及到平检测名、片检测名以及当用汉字的混合应用.文献编目的过程,不但是书目数据制作的过程,同时也是检索系统建立的过程.因而,要求编目员站在利用者需求的角度,建立多元检索系统.因此,要培养懂日语的专业编目员,用日文输入法严格按照日语语言特点和书写格式著录,能够深刻理解文献揭示内容的深度进行分类,进而开拓采访资源,增加购写力.国内很多图书馆的日文图书都是历史遗留下来的.天津图书馆现存1945年以前出版的旧日文图书6万余册.张家口市图书馆藏有1945年以前的旧日文图书资料1.8万余册.上海图书馆的1949年前旧版日文图书8万余册.辽宁省图书馆所藏日文图书9万余册,其中每年新增的日文图书寥寥无几,通过国际交换获得的有一百种左右,更新、增长速度极其缓慢.从每年一两千万的购书经费上看,购书分配比例不均,首先在采写上不重视小语种的发展.一个先进的、与时俱进的图书馆首先必须具有多元文化的藏书特性.图书馆作为文化怎么写作和终身教育的学习场所,要为不同国籍、不同民族的人群怎么写作.购写和收集多语言的文献资料,进行多元化怎么写作.因此,应该重视对日文图书的采写,做到日文图书旧与新的全面与利用.这将促进各专业领域更好、更快的发展,特别是日本空气污染治理取得的先进成果非常值得借鉴.

随着国内、国外资源共享的要求及编目工作的进一步发展,日文图书的和编目会被各图书馆所重视,必将要求编目工作立馆,怎么写作全国,面向世界,提高日文编目工作的规范化和书目数据的查全率,日文编目规范工作也会在新系统环境下进入一个新阶段.

06;222-224.

[11] 马卓.日文图书编目中的套录数据[J].图书馆学刊,2009(6):85-87,93.

[12] 王涛.试析图书馆集群管理系统INTERLIB的运用前景[J].图书情报论坛,2008(3):66-58.