医学统计方法的正确运用

更新时间:2024-01-16 作者:用户投稿原创标记本站原创 点赞:32659 浏览:153868

【摘 要】本文探讨如何在医学论文中正确运用恰当的统计方法.通过结合一些论文中出现的统计学方法运用错误的实例,分析如何正确选择恰当的统计学方法.各种统计学方法适用的范围不同,正确选择和运用医学统计方法是提高论文质量,增加其结论可信性的必要条件.

【关 键 词】医学论文;医学统计方法;正确运用

中图分类号R3文献标识码B文章编号1674-6805(2014)3-0157-02

在编写医学论文时,经常要运用收集到的数据进行各种医学统计的分析,医学统计方法应用不当,常常会带来错误的结论,影响整个论文的质量[1].因此,统计学方法是否正确运用是判断论文科学性的主要依据[2].本文对医学论文中统计方法的正确应用进行探讨,通过结合一些论文中出现的统计学方法运用错误的实例,分析如何正确选择恰当的统计学方法,以提高医学论文的统计质量及学术水平.

1统计学方法简介

统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容.其中医学论文中常提到检验水准即α,它是用来表示组间实际无差别而统计结果判断有差别,犯这类错误的概率[3].实际工作中常取α等于0.05,当研究数据计算的P值小于0.05时,组间差异比较被认为有统计学意义[4].统计学方法包括统计描述和检测设检验两个方面的内容.统计描述是指根据资料及原始数据分布的类型,选择正确的指标来描叙资料及数据的特征.而检测设检验即组间差异性检验,是医学论文中最常用的统计学方法.资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料.定性资料的统计描述包括率、相对比和构成比.而参数法及非参数法是常用的定量资料统计分析方法.参数法一般包括t检验、方差分析,非参数法常用的有秩和检验[5].

2试验设计中的统计学原理

合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明.在进行试验设计时应遵循随机、对照、均衡和重复四大原则[6].在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容.

医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论.因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费.其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数.研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等.此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断.选定好研究对象后就要对其进行分组.在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则.随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提.有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系.均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服.观察实验效应的指标主要有主观指标与客观指标.正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果.在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标.

3统计学方法的选择

统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法.不同的统计学方法应用的范围不同.研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择.当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法.t检验一般适用于小样本(n<50)的定量资料且方差齐的两组数据之间的比较.其特点是在均方差不知道的情况下,可以检验样本平均数的显著性,大样本(n≥50)采用u检验;多个样本均数两两比较则用方差分析,如差异有统计学意义,可采用q检验;Dunt检验则适用于多个实验组与一个对照组均数的比较.定性资料中,表现为互不相容的类别或属性,分为二分类和多类反应,如治疗结果为显著和好转的人数等,该种资料可选用字2检验,大样本(n≥50)时采用u检验.如:患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡.该种资料可选用秩和检验或u检验.总之,不论论文中选用的是哪种统计学方法,都要计算出检验值,然后再根据统计量值来判定P值的大小,结论一般描述为“差异有(无)统计学意义”[7].

4常见统计学方法的误用分析及对策

4.1统计方法误用

最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验.例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例.本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字2检验.研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法.

4.2统计方法应用错误

例如在一组资料中将临床疑似为支原体肺炎的201例患儿作为研究对象,分别采用三种检测方法检测实际患病人数以进行确诊,比较其检测率.则原文结果显示:MP-IgM组、咽拭子培养法阳性检出率与MP-PCR组比较,差异均有统计学意义(字2等于6.38,字2等于16.72,P<0.01);MP-IgM阳性检出率与咽拭子培养法比较,差异均有统计学意义(字2=43.26,P<0.01),详见表1.本组资料统计学分析中出现的错误有:201例均为疑诊患者,阳性检出率不能反映检测方法的准确性;三种检测方法两两比较无意义;三种方法检测的是不同的疑似患者,而文中作者却将201例疑诊者按确诊者计算.针对以上统计方法误用分析,应修改为三种方法检测同一组确诊患者,比较各方法的阳性检出率,从而计算各方法的敏感度.表1小儿支原体肺炎三种不同检测方法阳性检出率比较

检测方法阳性(例)阴性(例)检出率(%)

MP-PCR组(n等于76)423455.26

MP-IgM组(n等于91)325935.16

咽拭子培养法(n等于34)52914.71

4.3处理定量资料时均数表达问题

处理定量资料时常出现均值表达不准的问题.在定量资料平均数的计算时,研究者常用平均数(x)来反映平均水平.但只适合于定量资料中呈正态分布的资料.而对于偏态分布资料或信息不全的资料则需使用中位数.例如9例手足口病患儿年龄为1、1.5、2、2、2.5、3、5、7、12的平均数(x)为4,中位数为2.5.为更准确地反映年龄分布的集中位置,宜采用中位数而不是平均数.


4.4选用检验方法错误

在有些论文中,作者常将本应用方差分析和q检验的误用t检验.t检验一般适用于小样本(n<50)定量资料且方差齐的两组数据之间的比较,而方差分析及q检验主要用于对多个样本均数进行比较,几种不同治疗或处理方法等的同时比较.例如:在讨论中、西以及中西医结合治疗急性脑血管病时,两组患者的年龄、病程、病情严重程度等差别均无统计学意义,比较三组患者的一些指标变化.组间多重比较应用q检验,但文中作者采用的是t检验,对三组均数进行两两比较.这不仅造成了资料的利用率低,也增加了检测阳性的概率,降低了试验结果的可信度.

5结论表述中的统计学应用

资料的统计处理不是医学研究工作的最终目的,而是通过统计学分析为研究结论提供依据或者线索.因此,在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释.在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定.研究者习惯上将“P<0.05”称为显著性,不应误解为差别很大或者在医学上有显著的价值.统计推断是以一定的概率界值为依据,说明来自同一总体的可能性大小.“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释;“差异无统计学意义”表明在试验既定的条件下,差异可能是因抽象误差引起的,在增加样本数量的情况下,差异可能变成“有统计学意义”[8].

总之,不同的统计分析方法均有其适用的范围和应用的条件,研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计,选择恰当的统计分析方法,切记勿盲目套用.同时,还应注意得出的结果和结论应满足设计的要求.医学统计方法的正确运用,是充分利用试验研究获得的数据,也是最终得出科学、可信的结论的必要条件.

医学统计学[M].第2版.北京:人民卫生出版社,2006:55-56.

[5]杨湘华,尚磊,徐勇勇.重视统计学在科技论文中的正确应用[J].中华医学写作杂志,2004,11(13):1081-1083.

[6]唐军.中国医学统计百科全书:单变量推断统计分册[M].北京:人民卫生出版社,2004:25-35.

[7]胡良平,王功鹏.合理选用统计分析方法[J].中国医学影像学杂志,1996,4(3):185-192.

[8]于国艺,周晓彬,王俊.医学论文常见统计方法误用分析[J].编辑学报,1998:10(3):132.

(收稿日期:2013-09-13)(编辑:朱姣)