• 回答数

    3

  • 浏览数

    118

纯爱火乐
首页 > 医学论文 > 中医医学论文中的统计错误

3个回答 默认排序
  • 默认排序
  • 按时间排序

小葛装饰

已采纳

医学统计中的常见误区有哪些

医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。

一,真正差异和统计学差异

常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。

其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

二,卡方检验的局限性

我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!

这第2条可能大家不要理解,那我就举两个例子:

1) 关于男性和女性对于不同颜色的喜好的统计学分析

但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。

***红色 蓝色 黄色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!

2)两种治疗(A和B)效果的评价分析:

*****A法 B法

生存 41 54

死亡 47 31

用卡方检验 X2=; P <

但是,病人的临床分期将影响着分析结果:

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel检验: X2=; P >

说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

三,t 检验的局限性

1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!

比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。

四,ANOVA 检验的局限性

1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。

2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。

3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!

如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。

五,单元线性相关分析

有时我们常常只注意到了 P 值大小,可最重要的是 r 值!

样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:

当 P 值小于时: r 值

几乎没有相关关系

弱的相关关系

有相关关系

强相关关系

极强相关关系

P 值只是证明这个相关在统计学上是否成立!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

不是说样本小于5

而是说:在R×C表中

理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:

a.增加样本含量,使理论频数增大;

b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

c.改用双向无序的R×C表的fishher确切概率法。

还有一点

四格表卡方检验的适应指标:(T为理论频数)

1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

2。n≥40,但是1≤T≤5时,用四格表校正公式

3。n<40,或者T<1时,用fisher四格表确切概率法

4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

补充几点:

1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。

2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。

3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。

感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!

六,Logistic regression 分析

在判断某因子对疾病的危险度时常用的方法。

1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。

2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。

3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法):

我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。

213 评论

luck周哥周叔

总结统计部分。医学论文撰写中存在的统计学错误最为常见,常表现为统计学处理的设计不合理,统计学的方法应用不当,统计分析结果解释不合理以及统计学图表选用错误等。统计学设计的科学性统计学方法不合理或缺少统计学方法,或虽有统计学方法,但选择的统计学方法不合理是医学论文中的重要的错误。有统计结果表明其错误率在30%左右。还有的论文只给出统计学结果,没有注明所选用的统计学方法,使读者无法对结论进行准确判断。

355 评论

百叶书店

实证论文统计年鉴数据错误的解决方案是发布更正说明。根据查询相关资料信息,实证论文统计年鉴数据错误会导致论文全军覆没,可联系杂志编辑,发布一个更正说明,将正确的年鉴进行说明。

166 评论

相关问答

  • 医学论文中的统计数字错误

    医学统计中的常见误区有哪些 医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以

    微笑面对一 4人参与回答 2023-12-07
  • 医学论文中的统计错误

    论文一般由题名、作者、摘要、关键词、正文、参考文献和附录等部分组成,其中部分组成(例如附录)可有可无。论文各组成的排序为:题名、作者、摘要、关键词、英文题名、英

    喵喵:小妹 6人参与回答 2023-12-08
  • 医学期刊中的统计错误

    我搜到3篇文章,希望对你有所帮助医学科研设计中一个常被忽视的统计学错误辨析【作者中文名】 毕京峰; 段俊国; 【作者单位】 山东中医药大学; 成都中医药大学;

    社区人员 5人参与回答 2023-12-09
  • 医学论文中统计方法的错误

    医学统计中的常见误区有哪些 医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以

    libby131313 3人参与回答 2023-12-11
  • 中医医学论文中的统计错误

    医学统计中的常见误区有哪些 医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以

    纯爱火乐 3人参与回答 2023-12-09