近年来图书情报期刊引用网络文献的计量

更新时间:2023-12-29 作者:用户投稿原创标记本站原创 点赞:34340 浏览:158213

[摘 要 ]选择2003-2007年间我国四种图书情报类核心期刊的998篇论文作为数据源,对网络引文总数、篇平均网络引文量、域名分类和作者情况等特征量进行统计分析,研究我国图书情报学界对网络学术信息资源的利用情况.

[关 键 词 ]网络信息资源 网络引文 信息计量学 引文分析

[分类号]G350

1 文献回顾

人类社会进入21世纪以来,互联网发展迅速.从2005年至2007年的三年间,我国网民数量增长率达到164%.这表明,网络信息资源的重要地位日益凸显.对科研人员而言,网络正成为开展科学研究的重要信息来源.作为学术论文的重要组成部分,参考文献是体现学术道德、反映学术背景和环境、评价论文和学术核心期刊的重要内容之一.“网络文献作为一种虚拟的信息资源,它没有具体的载体形态,传播不受时空限制,具备一定的硬件设施并且联网就能轻易获得”.网络文献开始出现在国内外各种期刊论文、学术著作的参考文献当中(以下称“网络引文”).从根本上讲,网络引文发挥着传统参考文献一样的作用.与此同时,网络引文还可以反映出更多的信息,包括论文作者对网络信息的使用能力、作者所处的网络环境以及网络信息资源的价值等.因此,对网络文献的被引用情况进行分析研究,具有十分重要的意义.

近年来,以“网络引文”为对象的研究也越来越多,不仅研究层次越来越深入,其研究内容也日益丰富.我们在本研究中选择我国图书情报学专业期刊为对象,有针对性地进行了文献调查,对相关研究进展进行汇总和分析.初步研究发现,我国图书情报类期刊对网络文献的引用主要有以下特点:①网络引文已成为仅次于期刊和图书的第三大引文来源,含网络引文的论文无论是在数量上还是在所占论文总数的比例上都呈上升趋势.王雪燕、潘宁、王恺荣、李亚君和陈玉顺等人的研究均证实了这一点.这表明,网络引文作为一种新兴的文献类型已经在一定程度上得到了我国图书情报研究者的认可,并正在得到越来越广泛的应用.②网络引文来源的域名分布是不平衡的.据统计,“.省略,edu”域名下的网站是我国情报学研究人员中吸收、利用网上资源的主要来源.此外,网络引文来源的地区分布也有不平衡性.北京、湖北、广东、江苏、上海等地区的学者利用网络文献更频繁.③网络文献的著录缺乏规范性,不仅格式很不统一,而且可追溯性不高.有的链接即使能够检索到具体网站,文献命中率也较低.王恺荣、杜云祥、龚军等人的研究均得出了类似的结论.

在以上研究成果的基础上,我们对选定的样本期刊近年来所载论文的网络引文进行统计分析,在验证上述结论的同时,更为深入地研究我国学术界对网络学术信息资源的利用情况.

2 数据来源与研究思路

我们以《中文核心期刊要目总览》(2008年版)为依据,在中国知网(省略ki.)上对19种图书情报学核心期刊进行检索,考虑到期刊的代表性和论文收录的完整性,最终选择《中国图书馆学报》、《情报资料工作》两种双月刊和《图书情报工作》、《现代图书情报技术》两种月刊,共四种期刊作为本研究的样本期刊.同时,考虑到数据处理能力的限制,我们在2003年、2005年和2007年这三年中,随机选择每种期刊的三分之一(即每种月刊随机选择四期,双月刊随机选择两期)、共36本期刊作为最终的数据来源.在中国知网上对这36本期刊进行限定检索,共获得998篇来源文献,9401条参考文献.经过人工辨识和手工记录,其中的2462条被认定为“网络引文”.然后,运用信息计量的方法对上述期刊中的网络引文量、篇均网络引文量、域名、著者的机构地区等信息进行分析研究.

需要说明的是,为了简化问题、保证研究的顺利进行,我们在统计和分析数据时确定了以下原则:①论文样本只包括学术论文,不包括增刊的文章、动态、书评、文摘、目次、编委论坛等;②由于数量太大,无法对网络引文逐个检查,所以参考文献中只要列出的均算是网络文献;③当几篇网络文献出自同一个网站的不同网页,只要文献的标题不同即认为是不同的文献;④对于作者的分析只考虑第一作者;⑤对于相同姓名的作者,均视为同一个人;⑥在分析作者所属机构时,如果在不同时间同一作者属于不同的机构,则以年限较后的为准,地区分析也同样如此.

3 研究方法

3.1 网络引文的数量特征

一般而言,学术论文的引文量和引文率可以衡量作者在科研交流过程中的信息吸收能力和创造能力,网络引文量和网络引文率也有类似的功能,尤其可以反映论文作者对网络中已有的学术成果和最新信息的吸收能力.此外,还可以用于研究网络文献被利用的程度和广度.

3.1.1 动态分析各期刊的引文数据如表1所示:

由于所选的期刊既有月刊也有双月刊,而且每种期刊的载文量相差较大,所以相对数量的变化(比例)更能客观地反映问题,也更具可比性.因此,我们重点分析“网络引文占引文总量的比例”、“含网络引文的文章所占比率”、“篇均网络引文量”共三个参数的变化情况.分别取“2003与2005”、“2005与2007”两组数据作图,如图1、图2所示:由图1可知,上述三个参数在2003年到2005年的增长幅度都非常明显.例如,《中国图书馆学报》、《图书情报工作》、《情报资料工作》的“网络引文占引文总量的比例”从2003年的18.92%、20.70%、6.54%迅速增加到了2005年25.95%、30.48%和16.90%.平均增加了近9个百分点.这种情况表明,在2003至2005年间我国图书情报学者在学术研究中利用网络文献的频率增长很快,网络引文作为一种新的引文类型发展迅速.但是,这种快速发展的趋势并没有持续下去.从图2可以清晰地看到各参数的变化.相比2003年到2005年的飞速增长,2005年到2007年各参数相对稳定,有的甚至有稍微的下降.例如,从2005年到2007年,《中国图书馆学报》中“网络引文占引文总量的比例”只增加了0.89%,而《图书情报工作》则下降了4.41%,《情报资料工作》下降1.54%.

上述两个阶段的不同发展特点充分反映了我国科技人员利用网络信息资源的实际情况.在本世纪初期,我国的网络基础设施还不够完善,网络资源也不够丰富,因而学术界对网络文献的认可度较低.随着互利网的快速发展,这种情况也迅速改观,图1中2003到2005年的“跨越式发展”就是很好的例证.此后,随着网络文献的广泛使用,其弊端也逐渐显现,包括可检索性和可靠性较差、著录不规范、缺乏统一的管理等.这使得质疑的声音越来越多,甚至出现了全盘否定的观点,网络引文的增长势头开始放缓.总之,网络引文的普及和推广是根本趋势,但这个过程并非一帆风顺,而是一个曲折前进的过程.而从长期来看,科研人员对网络信息资源的利用逐渐趋于理性化,更有利于其价值的充分发挥.

3.1.2 比较分析从统计数据可以看出,不同期刊的参数变化有着明显的区别,这表明期刊的办刊特色对网络文献的引用有着很大的影响.以《现代图书情报技术》和《情报资料工作》为例,由表1可见,《现代图书情报技术》的各项指标都非常高.如在2003、2005、2007年,网络引文分别占当年引文总量的31.46%、35.13%、38.03%,明显高于其他期刊.相比较而言,《情报资料工作》的各项指标并不高.如篇均网络引文从2003年的0.52到2005年1.48再到2007年的1.34,三年平均值为1.15条/篇,明显低于《现代图书情报技术》的2.93条/篇.

我们认为,这主要是由期刊本身的特色决定的.研究表明,计算机技术类文献引用网络文献的数量最多,图书情报学次之.《现代图书情报技术》作为一种侧重于信息技术的图书情报类期刊,设有“数字图书馆”、“情报分析与研究技术”等一些技术性较强的栏目,文章内容也多与计算机科学关系密切.而相比较而言,《情报资料工作》的主要栏目包括理论探索与争鸣、改革与发展、社会信息工作等,更加注重理论研究.因此,我们在分析网络信息资源的开发利用问题时,必须充分考虑学科特点的差异,不能一概而论.

3.1.3 频率分析 网络引文在文章中的频率分布曲线如图3所示:

显然,网络引文在文章中出现的频率十分不均匀,有着明显的集中与分散的趋势.在所选取的有507篇含有网络引文的文章中,引用1条到5条的占了大多数(74.56%),而含有大量网络引文的文章却很少(21条以上的仅占2.37%).此外,网络引文在所有引文中所占的比例也呈现不均匀的分布状态.有的文章网络引文高达100%,而有的则完全没有网络引文.

3.省略edutomgov省略等.不同网域的信息由于侧重点各异,因此对用户产生的影响也就有主次之分,用户对信息也就有不同的需求.通过对网络引文在不同网域的分布状况进行分析,可以发现不同网域的网络文献的传播利用程度,衡量不同网域的吸收能力、渗透能力、论著质量和社会影响.我们根据研究样本的实际情况,将网络引文按其来源分为六个主要网域进行比较,其他的以及只提供IP地址的均归为“else”类型.统计数据如表2所示:

首先,从网域类型来看,来自不同网域的引文数量差异明显.在全部域名中,来自.省略和.省略下的网站为例,截止2007年12月底,仅.省略就占了29.6%,远远多于其他类型的网站.综合考虑这一因素可以发现省略、和.gov等网域才是网络引文的最集中的来源.这表明,大部分网络引文来源于一些信誉较高的教育网站或可信度较高的政府网站以及一些科研机构的学术网站”.质量高、信誉好、稳定性强的网络信息资源是学者们关注的重点.另外值得注意的是,else类型在2005年和2007年的增长都超过了10个百分点,这说明人们获取信息所涉及的网域正逐步扩大.

其次,从国家域名来看,网络引文的来源涉及到日益广泛的国家和地区,不再局限于中文网站()和美国(us)、英国(uk)等国家,还包括澳大利亚(au)、法国(fk)、日本(jp)、荷兰(nl)、加拿大(ca)等多个网域.这表明,网络文献的易获取性使其更容易突破国家的界限,当作者研究课题涉及相关国家的信息时更容易直接引用这个国家的文献.这不但增加了信息的准确性、及时性,也使得科学研究更具全球意义.

3.3施引文献的分布特征

论文作者意识与水平的高低,直接决定着期刊质量的高低、期刊的定位和发展走向.为了进一步了解图书情报学期刊和网络文献的关系,就需要以论文作者为切入点进行分析,以达到一个全面清晰的认识.

3.3.1 作者分析研究表明,网络引文在作者中的分布极不平衡.在笔者统计的507篇含网络引文的论文中,共有第一作者440名,发表1-2篇的作者占了绝大多数,而发表3篇及以上的只有13位,只占2.95%,如表3所示:

在所有的样本中,曾引用过10条以上网络引文的作者只有64位,只占14.55%.这表明,利用网络引文的作者呈现出明显的集中与离散分布状态.除少数学者之外,大多数学者引用网络文献的意识仍不强烈,他们对网络资源的利用仍持一定的保守态度.此外,学者们在网络文献的使用中还表现出明显的马太效应.越是经常利用网络资源的学者,在科学研究过程中越倾向于利用网络资源,网络文献已成为他们开展研究不可或缺的一部分.例如,李春旺在所发表的3篇文章引用了62次网络文献,而王日芬、唐光前、江淇等人的每篇文章都引用了网络文献.与之相反,有些作者则几乎完全不采用网络引文.

值得一提的是,表3中的作者大都是一些在本学科内有较高关注度的核心作者.他们一方面通过网络汲取了大量有用的信息并将其与自身的知识融合,有力促进了科研工作,表现出了较强的网络信息吸收能力;另一方面,他们的文章被访率较高,有较多的学者会看到其引用的网络文献,将会在无形之中增加了人们对网络文献的认同感,具有较强的示范作用.

3.3.2 机构分析在利用网络引文的第一作者所属机构中,高等院校的图书馆占了39.48%,高等院校信息管理院系占了33.17%,如表4所示:

可见,在网络信息资源的利用上,来自高校的学者拥有良好的利用网络文献的习惯,起着带头作用.而文献信息研究所这样的学术机构,同样具有很强的科研力量.因此,上述机构无疑当前是开展网络信息资源怎么写作的重点目标.相对而言,公立图书馆以及其他一些机构的人员对网络文献的利用相对较少.主要是由于其从事的并非是研究型事业,平时可用于理论实践探索的时间和能力较少,研究氛围也不浓郁,以致汲取网络资源的能力及对反映学科最新动向的网络文献的敏感性不强.再者,这些机构一般不能像高校图书馆和研究所那样为研究人员提供非常完善的网络环境和各种大型数据库.这些情况都在客观上限制了对网络文献的利用.

3.3.3 区域分析研究表明,学者对网络文献的利用与其所处的地域密切相关.表3中的13位作者就大多来自于湖北、广东、北京、江苏等省份.而从总体上看,这种集中的现象更为明显.在本次统计中,利用网络引文的第一作者共来自29个地区(24个内地省市、港澳台地区以及2个国外地区),如表5所示:


其中,北京、上海、江苏、湖北和广东这5个主要地区所拥有的作者共277位,是全部作者的62.95%.与之相反,青海、云南、海南等地区的作者对网络资源的利用相对较少,以至于在这次统计中并没有出现.我们认为,造成这种显著地区差异的原因主要有两个方面:

信息基础设施的差异.表5中排名靠前的地区,大多是我国地区经济较发达的省市.而互联网等信息基础设施的发展与地区经济发展水平存在着密切的相关性.据亚太互联网信息中心(APNIC)和中国互联网络信息中心(CNNIC)在2007年12月底统计,全国IPv4地址数中北京占了19.4%,居于榜首,而广东、江苏、上海均名列前茅.从地区的网民数和互联网普及率看,上述省市同样远远领先于贵州、宁夏等省份.依据梅特卡夫定理,网络的价值和网民规模的平方成正比,随着上网人数的增长,网络的价值呈几何级数增长,人们利用网络资源的意识也会随之增强.正是由于完善的网络环境和较高的互联网普及率,才促使学者在科学研究中更多地利用网络文献.

高等教育水平的差异.信息基础设施的完善无疑有助于更多人利用网络文献,但更进一步比较可以发现,相比北京和上海较高的信息化水平,江苏和湖北明显略逊一筹.2007年底江苏的互联网普及率为23.3%,湖北只有12.4%,均明显低于北京和上海.然而这没有动摇湖北和江苏的领先地位,可见在网络文献的引用上,信息基础设施并不是惟一的主导因素.从学科发展来看,我国的图书情报学学科发展本身就存在地区不平衡性,这5个地区均拥有在图书馆情报学领域处于领先地位的大学院系和研究机构,拥有一批高水平的学者.此外,从高等教育的整体水平来看,这些省市也是我国最为发达的地区.据2007年《中国统计年鉴》统计,江苏省以116所高等院校、78358位专任教师居全国第一,湖北、广东、北京和上海均位居前列.这些地区的高校教师队伍有较高的素质,科研水平较高,对于前沿信息更为敏锐,需求量更大.更新频繁、覆盖范围广的网络文献因而受到他们更多的关注,如表6所示:

总之,不同地区的学者对网络文献的引用存在着明显的差异.我们在分析网络信息资源的开发利用问题时,必须充分考虑地区差异性,在探讨通用规律和共性的基础上,还要寻求有针对性的措施和方法.

4 结 语

在本研究中,尽管只考察了图书情报类期刊,但上述结果具有一定的普遍性,基本反映了我国学术界对网络文献的利用现状.将这些研究成果与工作实践相结合进行分析,不仅可以为网络文献的规范化管理提供定量化的依据,而且对于如何更好地开发和利用网络信息资源也具有重要的指导意义.此外,还有一些关键问题尚未涉及,如网络引文的著录格式、可追溯性,构建网络信息资源评价体系、确定学术性核心网站等,将是下一步研究的重点.