近10年国内情报学硕士学位文热点统计

更新时间:2024-03-10 作者:用户投稿原创标记本站原创 点赞:26366 浏览:119779

[摘 要]综合运用共词一聚类分析、多维尺度分析、社会网络分析等情报学分析方法,对2001―2010年近10年的情报学学位论文的关 键 词进行统计分析.研究发现,我国情报学学位论文的研究主题主要为图书馆信息怎么写作、信息检索与技术、竞争情报与知识产权、情报技术与应用四大研究群组,其中知识管理、电子商务、竞争情报等领域是学位论文研究的热点.揭示出我国情报学学位论文存在研究面不宽泛、与其他学科的交叉渗透能力较弱等薄弱环节,并进一步预测未来情报学可能出现的新的增长点.

[关 键 词]情报学硕士论文关 键 词共词一聚类分析多维尺度分析社会网络分析

[分类号]G350

1 引言

文献计量学是以文献或文献某些特征的数量为基础,来论述与预测科学技术现象与规律的情报科学分支.关 键 词分析则是该学科的重要方法,是一种将文献中诸多要素因子联系起来的引证分析方法,它科学评价文献、文献作者和文献的学术水平,揭示学科热点和发展趋势.目前,世界很多国家或地区的高校与科研机构都建立了比较完善的情报学教育体系,相比之下我国情报学教育则要落后许多,但近几年一直呈快速增长趋势,主要反映在情报学招生规模的不断扩大上.普遍认为情报学研究生教育是高层次教育,往往研究的是比较前沿的情报学理论和实践问题,特别是情报学硕士论文,因其研究内容专业、深刻,研究主题广泛、多元,在一定程度上反映了我国情报学教育的发展方向和水平.因此,对我国情报学硕士学位论文进行分析研究,可以揭示情报学学位论文的研究热点、重点及其变化情况,梳理我国情报学教育的发展脉络,为今后情报学研究生的选题提供借鉴,同时也为我国情报学教育的发展提供战略依据.本文拟从关 键 词这一重要维度出发,从多个角度分析我国情报学硕士学位论文研究的热点、主要研究方向和学科结构,并预测情报学的新的增长点.

2 数据来源与研究方法

目前国内收录学位论文的数据库主要有CNKI博硕士学位论文数据库、万方数据资源系统以及公共和高校图书馆自建的特色数据库.CNKI和万方数据库是国内收录学位论文较为全面的数据库,为了保证分析的数据文献具有代表性,笔者选取CNKI中国优秀硕士学位论文全文数据库以及万方学位论文数据库作为检索数据来源.对CNKI学位论文数据库按“学科专业名称”进行检索,输入“情报学”作为检索词,对万方学位论文数据库按照学科专业分类进行检索,选择其中的“情报学”,检索时间范围都限定在2001―2010年.两数据库共检索出情报学学位论文2955篇,其中CNKI数据库有1640篇论文,万方数据库有1315篇论文.由于两个数据库收录的学位论文肯定有交叉,因此为了确保数据的单一性原则,利用SQL语句对CNKI、万方数据库检索到的国内硕士论文进行去重处理,剔除重复的以及不符合的文献,共得到有效情报学硕士论文2160篇.

本文主要以SPSS17.0和excel作为数据处理工具,采用关 键 词分析、共词一聚类分析法、多维尺度分析、社会网络分析等分析方法对情报学学位论文的研究热点、研究现状从不同的角度进行剖析.

3 数据分析

3.1 高频关 键 词分析

把2160篇情报学学位论文的关 键 词导入SQLServer数据库,统计得到10331个关 键 词,篇均关 键 词为4.78个,符合国内外科技期刊要求的每篇关 键 词应标出3―8个的标引规则.对10331个关 键 词进行统计分析,去除不能表达论文主题概念的词汇、合并同义词以及下位词合并等处理,选择词频大于20的关 键 词作为高频词进行分析,构建高频词表,见表1.

从表1的高频关 键 词分布可以看出,知识管理出现的频次最高,达到124次.特别是近几年来,知识管理一直是研究的热点,在情报学领域的研究也在逐年升温.总体来看我国情报学研究的重点在知识管理、电子商务、竞争情报、信息怎么写作、信息检索、本体以及为企业等提供知识怎么写作、知识产权研究等领域.这些高频关 键 词从一定程度上反映了我国情报学学位论文的研究核心.同时笔者看到,高校图书馆、数字图书馆、图书馆等词频出现的频次也相对较高,这与我国学科设置有关.1997年,国务院学位委员会重新颁布了《授予博士、硕士学位和培养研究生的学科、专业目录》“图书馆、情报与档案管理”作为一级学科下设图书馆学、情报学和档案学三个二级学科.由此可见,图书馆学和情报学有着很近的学科渊源,两者存在着相当多的共同研究领域;另外,透过高频词也可以看出,目前情报学学位论文研究的重点仍然集中在情报学基础领域,像竞争情报、信息怎么写作、信息技术、元数据、信息构建、信息检索等相关词汇等出现频次很高.但随着情报学不断的发展,其学科外延也在不断扩展,与其他学科的交叉日益加深,例如,本体原本是哲学概念,现在用于情报学的研究;另外,与管理学相关的高频词汇如企业、知识产权、电子商务、客户关系管理等出现的频率较高,表明情报学与管理学之间渗透和结合日益加强.高频词表中网络信息资源出现了20次,网络环境下的信息资源数量早已远远超过传统的信息资源,不但内容繁多,而且分布分散.因此,对网络信息资源的开发、整合与利用可能是今后情报学研究的一个重点.

3.2 共词一聚类分析

利用excel数据表功能,统计表1中30个高频词在论文中两两互现的频次,构建30×30的共词矩阵,列出部分(见表2).共词矩阵是一个对称矩阵,共词矩阵对角线上的数据表示某关 键 词自身的共现频次,也就是相关度,而非对角线上的数据代表不同关 键 词之间的共现频次.一般来说,仅从高频词或者论文的某一个关 键 词很难看出论文研究的主题,但如果两个关 键 词同时出现在一篇文章中,我们就可以大致了解文章的主题脉络,同时也可以根据两两出现频次的高低发现论文的研究热点.例如知识管理出现了124次,是情报学学位论文研究的热点,但仅从这一个词看不出研究的是哪些方面的知识管理.通过组配与其他高频词在同一篇文章中出现的次数,笔者发现知识管理与竞争情报共现频次为12,即有12篇情报学学位论文的关 键 词同时标引了知识管理和竞争情报,也就是说有12篇文章的研究主题论述了知识管理与竞争情报的关系,或者是通过知识管理来提高竞争情报的收集能力.从表2可以看出,除去对角线上的高频词是自身出现的频次以外,像图书馆与信息怎么写作、信息怎么写作与信息检索、本体与信息检索、图书馆与知识管理等同时出现的频次较高,说明在情报学学位论文的研究主题中,这些组合研究是热点.

为了消除频次悬殊造成的影响,利用皮尔逊相关系数将表2的共词矩阵转换为相关矩阵,由于是相关系数,其相关性大小与数值的正负无关,故将其中的负值转化为正值.列出部分,如表3所示:

表3即为高频词的相关矩阵,这里相关矩阵中的数字为相似数据,相关系数的取值在0―1之间,其中0代表不相关,数值越大表明关 键 词之间的距离越近,相似度越好,反之亦然.矩阵对角线的数据为1,表示关 键 词自身相关的程度.

把表3相关矩阵导人SPSS17.0进行聚类分析,选择“HierarchicalClusterAnalysis”作为聚类方法获得我国情报学学位论文高频词聚类冰柱图,如图1所示:

冰柱图主要是看其树状冰柱的缺口及冰柱间的间隔.用一把标尺水平放在图1上,上下移动,标尺与冰柱有交点,两个相邻交点之间的间隔可视为一类.从上图可以大致将我国情报学学位论文研究的主题分为三大类:①从“信息构建”到“高校图书馆”之间是一类,主要研究与图书馆、数字图书馆相关的信息怎么写作、个性化怎么写作以及信息资源的整合和检索技术的发展等,是情报学研究的基础领域;②“客户关系管理”到“电子商务”之间是一类,主要研究情报学及其方法与其他学科领域的结合,如在电子商务、电子政务、知识产权以及数据挖掘领域的应用;③“竞争情报系统”到“知识管理”是一类,本大类主要研究情报学在企业的应用,包括竞争情报系统、反竞争情报系统的构建,企业的知识管理、知识共享等,可见情报学与企业的关系非常紧密.

3.3 多维尺度分析

用1减去全部相关矩阵中的每一个数据,得到高频词的相异矩阵.把相异矩阵导入SPSS17.0.利用SPSS17.0中的Scale菜单的多维尺度分析功能(multidi.mensionalscale)进行分析得到可视化分析结果(见图2).

图2中各高频关 键 词之间的距离,反映其所代表主题的相关程度.距离越小,说明词频之间相似度越大,研究内容越集中越核心;距离越大,说明研究主题越独立,主题与主题之间的关联性越小.纵观所得的多维尺度分析结果图,可以看到关 键 词的分布既有交叉、相互渗透又具有群组分布的独立性.主要表现在这些数据点大致划分为四大研究群组,群组之间又有交叉,说明我国情报学教育研究的领域在不断拓宽.这四大研究群组分别是:

竞争情报与知识产权:处于第一象限.包括竞争情报系统的构建、数据挖掘、反竞争情报以及竞争情报在企业的应用等.竞争情报是关于竞争环境、竞争对手和竞争策略的信息与研究,是情报学及多个学科的交叉,目前越来越受到学术界和企业界的重视.知识产权也是情报学学位论文研究的一个热点,特别是在企业专利信息的检索与应用、著作权的保护等方面.

图书馆与信息怎么写作:位于第二象限.情报学与图书馆学是“图书馆、情报与档案管理”下属的两个分支,两学科关系密切.它们的最终目标是为用户提供高效率、高信息质量的怎么写作,主要涉及:图书馆参考咨询怎么写作、个性化怎么写作、知识怎么写作、文献传递等诸多方面.其中“个性化信息怎么写作”是信息怎么写作近几年突出的研究对象,在情报学学位论文中有30篇涉及图书馆个性化信息怎么写作的研究.

信息检索与技术:处于第三象限.信息检索技术一直是情报学研究的传统重点领域,一般来说,情报学是一门技术性较强的学科,然而近几年来与其他学科的不断融合在一定程度上弱化了其技术性特征.当今社会是信息的社会、网络的社会,信息大爆炸,信息资源包罗万象并呈几何级数增长,如何在纷繁无序的信息中提取有用的信息是情报学研究的一个重点.对于信息检索技术的研究则主要集中于检索系统、检索行为、检索策略等.

情报技术与应用:处于第四象限.包括情报学在电子商务、电子政务的应用,搜索引擎、元数据、本体、web2.0等.情报学的技术性特征决定了其应用的广泛性,一个学科是否具有良好发展前景的一个很重要的因素是该学科是否具备广泛应用的基础.在对情报学学位论文的检索中发现,情报技术的应用与医学、军事等学科的结合相当紧密,特别是在一些设有情报学的医学院校和军事院校.

另外,从上下两个维度来看,图书馆信息怎么写作与信息检索技术这两个群组之间距离较近,说明这两个群组之间的关联性较强,这也与笔者的认识不谋而合,特别是数字图书馆提供图书馆信息怎么写作、OPAC检索系统等,都离不开信息检索技术的发展,两者关系密切.

3.4 社会网络分析

多维尺度分析虽然可以较好地观察到变量间的关系,但无法表现它们之间的强弱,而社会网络分析可视化工具Pajek可以较好地弥补这一缺陷,构建的高频词社会网络分布如图3所示:

本文采用高频词作为节点,它们之间的共现关系表示边,词团间的关系强弱用连线的粗细表示,两个词团的关系越强,连接它们之间的线条越粗.可以通过网络分析方法来研究网络在顶点的相互作用下的分布情况.共词网络分析的一个主要目的是确定这些高频词之间的概念图谱或知识网络结构,通过一系列类似图谱来详细地描述某一学科领域的主题.

某个节点与其他节点的连线数量越多、分布越广,表示该节点的影响力越高.从图3中可以看出信息怎么写作、图书馆、信息技术等与其他词团的共链频次最高、连通性最好、联系最紧密,说明该领域或者方向在其他词团中的影响力或地位是最高的,处于核心位置,是联系其他相关词团的桥梁.另外,连线的粗细代表了词团之间关系的强弱,从图中可以看出,企业与知识管理、图书馆与知识怎么写作、数字图书馆与信息资源、企业与电子商务等词团之间的连线较粗,说明这些相关的词团联系紧密,常常作为论文一个研究主题出现,是情报学学位论文研究的热点.


4 研究结论

通过多维尺度分析,结合之前的共词聚类分析以及社会网络分析,透过30个高频关 键 词的类别可以大致看出我国情报学教育和情报学学位论文研究的主要内容有如下几个特点:

4.1 研究热点

从表1高频词表以及表2共词矩阵可以看出,国内情报学研究的热点主要集中在知识管理、电子商务、数字图书馆、竞争情报、信息怎么写作、信息检索、本体以及为企业等提供知识怎么写作、知识产权研究等领域,这些高频关 键 词从一定程度上反映了我国情报学学位论文的核心,是近几年研究的重点.不过与国外情报学学位论文相比存还存在着一定的差异,国外情报学硕士学位论文的研究领域非常广泛,不但涉及到情报学的各个分支领域,而且与许多学科有交叉,有正在向人文学科、社会学科、自然科学甚至工程科学这些学科领域渗透的趋势,特别是与教育学、心理学等学科的联系较为密切,涉及交叉学科的这类关 键 词在国外情报学学位论文中占了不少的比例.

4.2 研究结构

透过情报学学位论文的高频词以及对10331个关 键 词进行整体分析,可以大致看出我国情报学的研究结构:①选题内容存在一定的重复性,高频词可以反映出某一个领域的研究热点,但同时也可能反映了对该领域的重复研究,特别是当超过一定频次时.②和国外相比,我国情报学学位论文的研究范围相对狭窄,与其他学科的交叉渗透能力也较弱.这与我国情报学研究生教育开展的较晚有关,目前世界上很多国家与地区的高校或科研机构都已经建立了比较完善的情报学教育体系,我国从1978年起开始招收情报学硕士研究生,至今仅有30多年的历史.③从总体上来看,我国情报教育处于快速发展阶段,特别是近几年,我国情报学研究越来越重视发展与其他众多学科之间的联系(从一些低频词如生物医学、产业经济学、物流管理、地理信息怎么写作可以看出),注重与其他学科的交叉应用,即在不断完善情报学核心领域发展的同时,积极利用情报的方法体系来解决其他学科领域的问题.

4.3 研究的薄弱环节

从高频词结合高频词的社会网络图,可以发现与情报技术相关的关 键 词的频次和影响力都比较低,这说明目前我国情报学教育的侧重点在理论研究与实证研究方面,实践研究和有关情报学技术方面的研究相对薄弱,而在国外情报学学位论文的研究主题中,计算机科学、信息技术以及人工智能等关 键 词出现的频率较高,这说明情报学在国外有着很强的技术性特征.国外的情报学教育体系已较为成熟,无论是理论研究还是应用实践都领先于国内,因此我国情报学应当在巩固理论研究的同时,加强情报技术应用方面的研究,实现研究重点的转变;另外要扩大与其他相关学科的交流和交叉,进一步扩大情报学的应用范围,把情报学的研究成果应用于其他学科的同时,借鉴吸收其他学科的理论和方法充实情报学.

4.4 新的增长点

高频关 键 词能反映某个学科的研究热点,但是从一些次高频词以及低频词却可以预测某个学科的未来可能出现的新的增长点.对收集到的共1万多个关 键 词按频次进行排序,抽取其中的次高频和低频次关 键 词,可以预测我国情报学新的研究热点或增长点可能出现在以下几个研究领域:信息行为(13次),包括读者或用户的阅读行为、信息的检索行为、图书借阅行为等;个人知识管理(12次),知识管理是一个研究热点,但大部分都集中在对组织的知识管理研究,个人知识管理是一个比较新的研究领域,现在越来越多的学者认同要实现对组织的知识管理必须处理好对个人的知识管理,通过建立个人知识管理系统,实现个人知识向企业知识的转化;社会网络(7次),包括利用一些社会网络分析软件进行情报学研究的追踪,同时结合数据挖掘技术发现研究对象之间的关联模式.另外,信息怎么写作模式、数字参考咨询、专利战略管理、知识地图等也可能成为新的研究热点.

5 结语

本文采用关 键 词词频分析法、关 键 词的共词一聚类分析、多维尺度分析和社会网络分析等多种分析方法对国内情报学硕士学位论文(主要是关 键 词)从多个角度进行了研究.这些研究方法具有一定的互补性,能够弥补单一研究方法的不足.通过对研究结果的比较分析,得出了一些有益的结论.并且从特定角度,在一定程度上了解了我国情报学研究生教育的现状及发展趋势,从而为今后我国情报学研究生教育的发展提供参考依据.当然本文的研究还有一定的局限性,比如选取的研究维度比较有限,更多地是从关 键 词的角度进行分析,这也为今后从摘 要或文本角度进行分析留下进一步研究的空间.