医药文献信息检索中的医学主题词检索法

更新时间:2024-02-20 作者:用户投稿原创标记本站原创 点赞:6050 浏览:18979

摘 要 文章通过PubMed与Embase两个检索系统及其各自主题词表MeSH与Emtree的对比研究,结合应用实例,阐明了医药文献信息检索课程中的医学主题词、主题词表及主题词检索法的理解与应用,使学员认识和了解主题词这种重要的检索手段,同时也通过对比发现不同检索系统主题词检索的重要意义.

关 键 词MeSH;Emtree;主题词;主题词表;主题词检索法

中图分类号TP39 文献标识码A 文章编号 1674-6708(2012)80-0211-02

医学主题词检索法是医药文献作息检索的重要手段,即使信息技术不断发展,在医药文献信息检索领域,主题词检索法都仍在继续使用,并且与时俱进,持续发展.医学主题词表是情报检索语言(通常是主题词语言)的具体体现形式,规范的医学主题词表是二次文献标引的重要依据,根据信息检索原理,标引与检索是信息存储与获取的两个方面,标引从一定程度上决定了信息检索.因此,医学主题词表是用户与标引人员间的“指南”.在医学文献信息检索课程中,医学主题词检索法是医学文献信息的重要方法.PubMed与Embase是医药领域最常用的二次文献检索系统,都包含MEDLINE资源,且都具有医学主题词表,本文以这两个检索系统为例,对医学主题词检索法进行研究.

1.PubMed与Embase

根据2012年最新数据表明,PubMed中经过MeSH标引的MEDLINE期刊有5627种,Embase包括MEDLINE在内的期刊有7961种,这些期刊全部经过Emtree标引.PubMed是世界上使用最广泛的免费检索MEDLINE文献的检索系统,它的学科范围包括生物医学和生命科学,覆盖护理学、药学、牙科学、生化学、细胞生物学、卫生保健和兽医学等学科.Embase是全球最大最具权威性的生物医学与药理学文献数据库,包括各种药物和疾病信息,除基础医学和临床医学外,还覆盖如药物研究、药理学、配药学、药剂学、药物副作用、毒物学人体医学(临床与实验)基础生物医学、生物工艺学、生物医学工程与仪器、保健策略与管理、药物经济学、医疗公共政策管理、公共职业与环境卫生、药物依赖性及滥用、精神科学、替代与补充医学、法医学和生物医学工程等学科.

2.MeSH与Emtree

医学词表编制的质量决定了对检索系统的检索效率.PubMed系统所用词表为MeSH,Embase系统所用词表为EMTREE,因Embase工作人员参照MeSH于1988年编制了Emtree,这两个著名的医学词表有共同之处,但区别非常明显.对医学词表的比较研究,有益于深入了解检索系统,而且可以加深对情报检索语言的理论研究.

MeSH与Emtree这两个词表最大的不同是专指度的差异.专指度是指主题词与文献主题概念的切合程度,揭示主题词在表达文献主题的深度和精度方面的能力.词表的专指度直接影响检索系统的查准率,较高专指度的词表能够帮助用户获得更高查准率的检索结果.而专指度的高低与词表的主题词数量直接相关,主题词越多说明词表的专指度越高.如表1所示的收词量上来看,Emtree收录的主题词是MeSH的2.4倍,同义词也多出了七万多条,从这一角度能够反应出利用Emtree检索比利用MeSH检索会获得更高的查准率.


同一个生物学或医学概念、术语,在两个词表中的地位有较大区别.通常,Emtree使用更多的词语做主题词,而有可能这些词语被MeSH当作入口词来使用,这样MeSH的概念体系可能更加清晰,同时可以防止相关文献在彼此同义或近义的各个词下的分散.但从总词汇量方面来讲,Emtree的词汇数量远远多于MeSH词汇数量,对于用户来讲,更多的词汇意味着易用性更好.而且Emtree针对药物主题词专门设置了17 个核心的药物副主题词和47 种给药途径,如药物副作用反应、临床试验或药物分析等,增强索引的深度.针对疾病主题词专门设置了14个疾病副主题词,包括恢复、副作用、外科手术、治疗等,帮助用户精确地检索疾病的某一类或几类分支的相关文献, 提高相关性.这些在Embase数据库中的文献记录可以清晰地体现,文献被标引时使用的主题词被分成了药物、疾病和其他三种类型.

3检索效果比较

本文通过对两个检索系统中主题词扩展检索(即包括被检索词及其所有下位词的检索)进行测试,比较分析其检出量之间的差异,进而评价其检索效率,为教学过程中学员理解和掌握主题词检索法示范,最终为用户选取最佳检索平台提供理论依据和参考.

3.1常见疾病、药物或研究方向等医药概念检索

因PubMed与Embase的基本检索都具有检索词自动转换或匹配主题词功能,故检索结果也同时对比给出基本检索命中文献数.

从表2中我们可以看到,常见疾病如心脏病和糖尿病的检索文献命中率Embase都好于PubMed;常见药物使用商品名芬必得,Embase能够通过商品名匹配到主题词布洛芬,命中文献,PubMed几乎不能识别芬必得,只有使用布洛芬才能命中约为Embase五分之一的文献.生物学领域的转基因动物研究,Embase的命中文献数远远少于PubMed,可以推见PubMed的生物学领域的文献较多.而2012年诺贝尔医学奖的研究领域“诱导多功能干细胞”,在Embase中收录的文献数量可观,而PubMed主题词检索的命中文献仅为它的七分之一多.

3.2专题检索

例:查找相关病毒性胃肠炎(viral gastroenteritis)的药物经济学(pharmacoeconomics)方面的文献.为查找到较为准确全面的文献,我们尽量使用主题词检索法和关 键 词 词组相结合的方式.经分析与实际操作.PubMed中“病毒性胃肠炎”没有主题词,但上位词“胃肠炎”有主题词,且它有一个“病毒学virology”的副主题词,故检索式为("Gastroenteritis/virology"[Mesh] OR “viral gastroenteritis”) AND pharmacoeconomics,命中文献数为3.为了扩大检索结果范围,使用“病毒性胃肠炎”的上位词“胃肠炎”,检索式为gastroenteritis AND pharmacoeconomics,命中文献数为62.Embase中“病毒性胃肠炎”这一概念有对应的主题词,故检索式非常简单:pharmacoeconomics AND 'viral gastroenteritis',检索效率也高,命中文献数为77条.

在医药文献信息检索课程中通过对MeSH与Emtree 两个著名医学主题词表的对比分析与研究,并结合PubMed与Embase中的主题词检索途径的实例检索,帮助学员理解医学主题词掌握主题词检索法,并能够通过结合主题词表来判断检索系统优劣,最终达到选择合适的检索系统与检索方法的目的.