首页 > 医学论文 > 医学论文中的统计数字错误

医学论文中的统计数字错误

发布时间:

医学论文中的统计数字错误

医学统计中的常见误区有哪些

医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。

一,真正差异和统计学差异

常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。

其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

二,卡方检验的局限性

我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!

这第2条可能大家不要理解,那我就举两个例子:

1) 关于男性和女性对于不同颜色的喜好的统计学分析

但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。

***红色 蓝色 黄色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!

2)两种治疗(A和B)效果的评价分析:

*****A法 B法

生存 41 54

死亡 47 31

用卡方检验 X2=; P <

但是,病人的临床分期将影响着分析结果:

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel检验: X2=; P >

说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

三,t 检验的局限性

1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!

比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。

四,ANOVA 检验的局限性

1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。

2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。

3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!

如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。

五,单元线性相关分析

有时我们常常只注意到了 P 值大小,可最重要的是 r 值!

样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:

当 P 值小于时: r 值

几乎没有相关关系

弱的相关关系

有相关关系

强相关关系

极强相关关系

P 值只是证明这个相关在统计学上是否成立!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

不是说样本小于5

而是说:在R×C表中

理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:

a.增加样本含量,使理论频数增大;

b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

c.改用双向无序的R×C表的fishher确切概率法。

还有一点

四格表卡方检验的适应指标:(T为理论频数)

1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

2。n≥40,但是1≤T≤5时,用四格表校正公式

3。n<40,或者T<1时,用fisher四格表确切概率法

4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

补充几点:

1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。

2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。

3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。

感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!

六,Logistic regression 分析

在判断某因子对疾病的危险度时常用的方法。

1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。

2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。

3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法):

我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。

呵呵~~~没事,查到也是学校的责任,学校会帮你的,没事放心吧!

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

实证论文统计年鉴数据错误的解决方案是发布更正说明。根据查询相关资料信息,实证论文统计年鉴数据错误会导致论文全军覆没,可联系杂志编辑,发布一个更正说明,将正确的年鉴进行说明。

医学论文数据统计错误

建议作者最好联系杂志社编辑或是审稿专家说明原因,保证论文数据中的正确性。当然,可能有的作者认为,只是一个数字写错的,修改与否对结果并没有影响,就不用修改了。

虽然审稿专家没有发现,但是并不代表论文发表出去后,别人发现不了。要知道论文发表出去,面向的是与你方向相同的人员,肯定会有不少同行业的人员阅读你的论文,若是发现错误,那么会质疑你的论文水平,也会怀疑杂志社及审稿专家的水平,对你今后在行业的发展并没有好处。

写论文的注意事项:

注意论文的严谨性,主要以陈述句为主要句式,合理控制直接引用和间接引用的比例,合理设置参考文献的格式,避免抄袭率过高的情况,论文结构要严谨完整,目录摘要等内容都要写到,论文的格式按照学校要求的进行编排,设置好段落、字行之间的间距,以及全文的字体。

论文中使用的标点符号也应该标准化,正确使用逗号、句号、分号、冒号和引号,论文选题最好做好简明扼要。除此之外,在论文写作时还可以适当的在论文当中添加一些图表作为补充说明,这样也能更好的表达效果,当然图标的美观性,简洁明了也很重要。

《中国电子商务》格式说明 [论文题目]作者A1作者B2[作者]1(单位A上海 210000)[单位] 2(单位B上海 210000)本规格为在《中国电子商务》上发表的科技论文而设定。请作者逐条阅读并落实,如不符合要求,将影响文章的发表。摘要的内容应包含与论文同等量的主要信息,一般应说明研究工作目的、实验方法、结果和最终结论等,而重点是结果和结论。电子商务格式说明信息化FORMAT DESCRIPTION OF COMPUTER APPLICATIONS AND SOFTWARE[英文题目]Zuo Zhe A1 Zuo Zhe B2 [英文作者]1(Editorial Department, Computer Applications and Software, Shanghai 210000,China) [英文单位]2(Editorial Department, Computer Applications and Software, Shanghai 210000,China) [英文单位]This specification is set for the theses to be published in Computer Applications and Software, including fonts, margins, page size and print area. Computer Format description Software [keywords] 引言 [标题1]采用Word 2000或Word xp格式排版,请同时提供Word版本和打印稿。[正文缩进]务请作者按照本规格编排论文。请直接使用样式,不要对样式作任何修改! 格式说明版心说明 [标题2]用A4纸,页边距上下左右已经设置好,请不要改动。论文题目一般不要超过两行。作者 关于作者中文名字的要求 [标题3]使用“作者”样式。姓名是两个字的,中间用一个中文空格或两个英文空格隔开。只有一个作者的,且作者姓名字数为三个的(包括三个的),姓名的每个字之间用一个英文空格隔开。 关于作者简介使用“收稿日期”样式。在文章的第一页右下角,可附一段说明,内容包括收稿日期、基金项目、第一作者姓名、职称、主研领域等。多个研究领域之间使用全角逗号隔开。一般保持在2行,如果高度不够,可作适当调整。单位使用“单位”样式。作者工作单位准确到系或学院等,要写全称。如:“清华大学计算机科学与技术系”不应简写为“清华大学计算机系”;“浙江大学计算机科学与工程学系”不应简写为“浙江大学计算机系”。单位是多个的写在多行中,可以用上标加以区分。在单位名称和城市名之间使用一个中文空格或两个英文空格隔开,在城市名和邮编之间使用一个英文空格隔开,不能用逗号。摘要使用“摘要”样式。中文摘要需写成200字左右的篇幅,摘要内容不能太简单,要有研究目的、方法、结果和结论等。摘要请采用第3人称的写法,且放在一个段落中。关键词提供3-8个关键词,之间用一个中文空格或两个英文空格隔开。英文题目使用“英文题目”样式。英文标题全部大写,一般不要超过两行。英文署名使用“英文作者”样式。两个姓名中间用两个英文空格隔开。姓氏第一个字母大写,单、双名第1个字母大写,双名中间不加连字符。例如: 李伟 Li Wei 张小军 Zhang Xiaojun英文单位使用“英文单位”样式。作者单位的中英文要完全对应。每个实词的首字母大写。在部门名称和单位名称之间、在单位名称和城市名之间使用英文逗号隔开,城市名和邮编之间使用一个英文空格隔开,不能用逗号。 Abstract使用“Abstract”样式。英文摘要需写成200词左右的篇幅,为了使本刊尽快实现国际化,所以要求英文摘要水平一定要高,内容要充实,要包括研究目的、方法、结果和结论等,与中文摘要可不完全对应。Keywords使用“Keywords”样式。提供与中文关键词对应的英文关键词。每个关键词之间用两个英文空格分开。每个关键词以一个单词的首字母大写,其余小写。 标题 一级标题使用“标题1”样式。用阿拉伯数字1,2,3…,数字之后没有任何符号,如小数点、顿号、逗号等。一般不超过一行。 二级标题使用“标题2”样式。前面冠之于一级标题,用阿拉伯数字表示,形如,,…。一般不超过一行。 三级标题及下级标题要求如同二级标题。形如,…。一般不超过一行。 四级标题使用“标题4”样式。形如,…。…。可以是多行。 标题文字标题为两个字的,如“引言”、“结论”等,两字中间用空格(一个中文空格或两个英文空格)隔开。 正文使用“正文缩进”样式。每个自然段开始时缩进两个汉字。

毕业论文数据算错了怎么办

1.找出错误点:

重新检查数据计算的每一个环节,找出错误产生的具体环节和原因。

2.重新收集数据:

如果数据的错误比较严重,那么就需要重新收集数据并进行分析。这虽然可能会花费一些额外的时间和精力,但对于保证论文的准确性是非常重要的。

3.与研究导师和评审专家沟通:

及时向研究导师和评审专家汇报数据错误的情况,并请求他们给予指导和建议。

4.修改论文结论:

如果重新收集数据不现实,或者修改所得结果对整体结论基本没有影响,则可以在论文中说明错误点和误差范围,并尝试在结论部分描述其中得到的其他有意义的结果。

总之,遇到这种问题,不能选择隐瞒或回避,应该及时采取行动以保证论文的科学性和可靠性,同时需要诚恳地向导师和专家说明情况并接受批评和教导。

高等学校和科学研究机构的研究生,或具有研究生毕业同等学力的人员,通过硕士学位的课程考试和论文答辩,成绩合格,达到上述学术水平者,授予硕士学位,基于此,硕士学位论文成为检验学业学术水平的重要依据和必要环节。

结构严谨,表达简明,语义确切。摘要先写什么,后写什么,要按逻辑顺序来安排。句子之间要上下连贯,互相呼应。毕业论文的撰写及答辩考核是顺利毕业的重要环节之一,也是衡量毕业生是否达到要求重要依据之一。

但是,由于许多应考者缺少系统的课堂授课和平时训练,往往对毕业论文的独立写作感到压力很大,心中无数,难以下笔。因此,就毕业论文的撰写进行必要指导,具有重要的意义。

撰写毕业论文是检验学生在校学习成果的重要措施,也是提高教学质量的重要环节。大学生在毕业前都必须完成毕业论文的撰写任务。申请学位必须提交相应的学位论文,经答辩通过后,方可取得学位。可以这么说,毕业论文是结束大学学习生活走向社会的一个中介和桥梁。

由于许多应考者缺少系统的课堂授课和平时训练,往往对毕业论文的独立写作感到压力很大,心中无数,难以下笔。因此,就毕业论文的撰写进行必要指导,具有重要的意义。

算数据造假,但是已经毕业,应该不至于被取消学位。

硕士论文算错也就是数据造假。如果论文数据的确存在造假行为,那就存在被人发现的可能,一旦被查,将会受到相应的处罚。据统计,数据造假发生最多的领域,第一是医学, 其次是药理学。硕士论文一般是由学校保存,只有优秀的论文才能被知网等网络数据库收录。

但是在论文答辩之前要经过审核的,还是要注意一些为好。 对论文的认真程度,要看你的答辩组的老师态度了,还有硕士论文在毕业之后,还会经历一次教育部的抽查, 如果到那时被发现出了问题,就比较麻烦了。所以建议你如果数据可以得到真实的,就避免使用虚假数据。

论文数据重要性:

虽然审稿专家没有发现,但是并不代表论文发表出去后,别人发现不了。要知道论文发表出去,面向的是与你方向相同的人员,肯定会有不少同行业的人员阅读你的论文,若是发现错误,那么会质疑你的论文水平,也会怀疑杂志社及审稿专家的水平,对你今后在行业的发展并没有好处。

所以,一旦发现错误之后,就要及时联系杂志社或是审稿专家修改。尤其是医学方面的作者来说,任何一个小数的错误,可能都会影响整个研究实验,甚至会造成连锁反应。就拿药学论文来说,因为一个小数原则,可能导致某一项药品成分增加或是减少, 起到相反的作用,那么后果是非常严重的。

而对于一件机械零件的设计而言,可能因为一厘一毫的差别, 而导致一批零件无法投入使用。所以发现错误后要及时修改,这既是对自己,也是对他人负责的表现。

医学论文中的统计错误

论文一般由题名、作者、摘要、关键词、正文、参考文献和附录等部分组成,其中部分组成(例如附录)可有可无。论文各组成的排序为:题名、作者、摘要、关键词、英文题名、英文摘要、英文关键词、正文、参考文献和附录和致谢。下面按论文的结构顺序依次叙述。题目(一)论文——题目科学论文都有题目,不能“无题”。论文题目一般20字左右。题目大小应与内容符合,尽量不设副题,不用第1报、第2报之类。论文题目都用直叙口气,不用惊叹号或问号,也不能将科学论文题目写成广告语或新闻报道用语。署名(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人,应该是能解答论文的有关问题者。往往把参加工作的人全部列上,那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者,也可以一般致谢。行政领导人一般不署名。引言(三)论文——引言是论文引人入胜之言,很重要,要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。材料方法(四)论文——材料和方法按规定如实写出实验对象、器材、动物和试剂及其规格,写出实验方法、指标、判断标准等,写出实验设计、分组、统计方法等。这些按杂志对论文投稿规定办即可。实验结果(五)论文——实验结果应高度归纳,精心分析,合乎逻辑地铺述。应该去粗取精,去伪存真,但不能因不符合自己的意图而主观取舍,更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据、不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因,不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃,不能只废弃不合己意者。实验结果的整理应紧扣主题,删繁就简,有些数据不一定适合于这一篇论文,可留作它用,不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图,可以不用图表的最好不要用图表,以免多占篇幅,增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代,不要随意丢弃。讨论(六)论文——讨论是论文中比较重要,也是比较难写的一部分。应统观全局,抓住主要的有争议问题,从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理,而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论,表明自己的观点,尤其不应回避相对立的观点。论文的讨论中可以提出假设,提出本题的发展设想,但分寸应该恰当,不能写成“科幻”或“畅想”。结论(七)论文——结语或结论论文的结语应写出明确可靠的结果,写出确凿的结论。论文的文字应简洁,可逐条写出。不要用“小结”之类含糊其辞的词。参考文献(八)论文——参考义献这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉,便于查找,同时也是尊重前人劳动,对自己的工作有准确的定位。因此这里既有技术问题,也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法;在结果中有时要引上与文献对比的资料;在讨论中更应引上与论文有关的各种支持的或有矛盾的结果或观点等。

一类错误是原假设Ho为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误.

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

第一类错误,又叫拒真错误,即本来原假设是正确的,而根据样本得出的统计量的值落入了拒绝域,根据检验拒绝了正确的原假设。第二类错误,又叫受伪错误,即本来原假设是错误的,而根据样本得出的统计量的值落入了接受域,不能拒绝原假设,接受了(确切地说是不拒绝)原本错误的原假设。

医学论文中统计错误

医学统计中的常见误区有哪些

医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。

一,真正差异和统计学差异

常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。

其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

二,卡方检验的局限性

我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!

这第2条可能大家不要理解,那我就举两个例子:

1) 关于男性和女性对于不同颜色的喜好的统计学分析

但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。

***红色 蓝色 黄色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!

2)两种治疗(A和B)效果的评价分析:

*****A法 B法

生存 41 54

死亡 47 31

用卡方检验 X2=; P <

但是,病人的临床分期将影响着分析结果:

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel检验: X2=; P >

说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

三,t 检验的局限性

1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!

比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。

四,ANOVA 检验的局限性

1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。

2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。

3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!

如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。

五,单元线性相关分析

有时我们常常只注意到了 P 值大小,可最重要的是 r 值!

样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:

当 P 值小于时: r 值

几乎没有相关关系

弱的相关关系

有相关关系

强相关关系

极强相关关系

P 值只是证明这个相关在统计学上是否成立!!!

1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!

讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。

不是说样本小于5

而是说:在R×C表中

理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:

a.增加样本含量,使理论频数增大;

b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

c.改用双向无序的R×C表的fishher确切概率法。

还有一点

四格表卡方检验的适应指标:(T为理论频数)

1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

2。n≥40,但是1≤T≤5时,用四格表校正公式

3。n<40,或者T<1时,用fisher四格表确切概率法

4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

补充几点:

1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。

2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。

3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。

感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!

六,Logistic regression 分析

在判断某因子对疾病的危险度时常用的方法。

1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。

2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。

3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法):

我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。

不论是什么错,还是谁提出的,一经核实,原刊物会在以后的期刊中,给出勘误表或更正。如果是作者本人,发现的最好尽快与杂志社联系,予以更正,并附一封对读者的致歉信。

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

我搜到3篇文章,希望对你有所帮助医学科研设计中一个常被忽视的统计学错误辨析【作者中文名】 毕京峰; 段俊国; 【作者单位】 山东中医药大学; 成都中医药大学; 【文献出处】 时珍国医国药, Lishizhen Medicine and Materia Medica Research, 编辑部邮箱 2008年 10期 期刊荣誉:中文核心期刊要目总览 ASPT来源刊 CJFD收录刊 【关键词】 医学统计学; 科研设计; 【摘要】 统计学错误在既往的临床科研设计中是常见的,但一般易于发现和改正。笔者近期查阅相关医学科研论文发现,有一个统计学错误,其错误应用率很高,甚至许多统计专业人员也不例外。例:某研究者研究A药对高脂血症性脂肪肝大鼠的作用,设计了如下试验方案:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠的血脂的影响。结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P<)。结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。在本设计方案中,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复组按多因素一水平的统计方法进行方差分析。仔细考察各处理组之间的关系,其实本研究主要涉及两个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3个水平,而不是与甲硫氨酸片平等的3个因素。表1各组大鼠血清脂质比较(x-±s)mmol·L-1组别TC TG HDL-C自然恢复± ± ±药低剂量± ± ±药中剂量±... 【DOI】 CNKI:SUN: 医学科研论文中常见的统计学错误【作者中文名】 李祝华; 【作者单位】 白城市传染病医院 吉林白城; 【文献出处】 吉林医药学院学报, Journal of Jilin Medical College, 编辑部邮箱 2007年 02期 期刊荣誉:ASPT来源刊 CJFD收录刊 【关键词】 医学; 科研论文; 统计学错误; 【摘要】 科技论文常用统计学方法对资料进行加工、整理与分析,从而定性或定量地阐述一些理论或实验结果。现就一些医学期刊(1999~2000年度国家级期刊8种共60期)中出现错误的统计方法进行归纳分析,以提醒科技工作者在撰写科技论文时能合理应用统计学方法,准确地进行描述、估计、比较、预测与分析,尽量减少统计学方法的错误应用,提高科技论文的写作水平。1资料缺乏可靠性有的资料样本数量较少,有的作者选择的实验对象不具代表性,有许多人为因素,有个别作者根据自己主观期望判断结果,更有甚者有时更改实验数据,致使一些实验结果出现较大误差。2统计学方法缺乏科学性统计学方法比较多,如率、构成比、发展速度、显著性检验方法等。有时计算方法不当就能直接影响结果或造成误解。如率与构成比的联系与区别就常被人误解,也有的作者只看表面现象,不经统计学方法处理,就下结论。3统计量投入缺乏规范性科学恰当地计算统计量,才能正确反映事物的真实情况,但如果计算不当,则会出现假象或错误的结果。如未经标准化处理的资料就进行率的比较,由于两组资料的内部结构不同,结... 【DOI】 CNKI:SUN: 医学论文中常见的统计学错误及对策【作者中文名】 杨云华; 【作者单位】 天津市医学科学技术信息研究所 300050天津; 【文献出处】 中华医学科研管理杂志, Chinese Journal of Medical Science Research Management, 编辑部邮箱 2004年 02期 期刊荣誉:ASPT来源刊 CJFD收录刊 【关键词】 医学论文; 统计学; 常见错误; 对策; 【摘要】 分析医学科研论文中统计学方法应用中常出现的错误 ,提高编辑人员识别统计学常见错误的能力 ,确保科研论文的科学性、准确性和可信性 ,努力办成精品期刊。 【DOI】 cnki:ISSN:

医学期刊中的统计错误

我搜到3篇文章,希望对你有所帮助医学科研设计中一个常被忽视的统计学错误辨析【作者中文名】 毕京峰; 段俊国; 【作者单位】 山东中医药大学; 成都中医药大学; 【文献出处】 时珍国医国药, Lishizhen Medicine and Materia Medica Research, 编辑部邮箱 2008年 10期 期刊荣誉:中文核心期刊要目总览 ASPT来源刊 CJFD收录刊 【关键词】 医学统计学; 科研设计; 【摘要】 统计学错误在既往的临床科研设计中是常见的,但一般易于发现和改正。笔者近期查阅相关医学科研论文发现,有一个统计学错误,其错误应用率很高,甚至许多统计专业人员也不例外。例:某研究者研究A药对高脂血症性脂肪肝大鼠的作用,设计了如下试验方案:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠的血脂的影响。结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P<)。结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。在本设计方案中,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复组按多因素一水平的统计方法进行方差分析。仔细考察各处理组之间的关系,其实本研究主要涉及两个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3个水平,而不是与甲硫氨酸片平等的3个因素。表1各组大鼠血清脂质比较(x-±s)mmol·L-1组别TC TG HDL-C自然恢复± ± ±药低剂量± ± ±药中剂量±... 【DOI】 CNKI:SUN: 医学科研论文中常见的统计学错误【作者中文名】 李祝华; 【作者单位】 白城市传染病医院 吉林白城; 【文献出处】 吉林医药学院学报, Journal of Jilin Medical College, 编辑部邮箱 2007年 02期 期刊荣誉:ASPT来源刊 CJFD收录刊 【关键词】 医学; 科研论文; 统计学错误; 【摘要】 科技论文常用统计学方法对资料进行加工、整理与分析,从而定性或定量地阐述一些理论或实验结果。现就一些医学期刊(1999~2000年度国家级期刊8种共60期)中出现错误的统计方法进行归纳分析,以提醒科技工作者在撰写科技论文时能合理应用统计学方法,准确地进行描述、估计、比较、预测与分析,尽量减少统计学方法的错误应用,提高科技论文的写作水平。1资料缺乏可靠性有的资料样本数量较少,有的作者选择的实验对象不具代表性,有许多人为因素,有个别作者根据自己主观期望判断结果,更有甚者有时更改实验数据,致使一些实验结果出现较大误差。2统计学方法缺乏科学性统计学方法比较多,如率、构成比、发展速度、显著性检验方法等。有时计算方法不当就能直接影响结果或造成误解。如率与构成比的联系与区别就常被人误解,也有的作者只看表面现象,不经统计学方法处理,就下结论。3统计量投入缺乏规范性科学恰当地计算统计量,才能正确反映事物的真实情况,但如果计算不当,则会出现假象或错误的结果。如未经标准化处理的资料就进行率的比较,由于两组资料的内部结构不同,结... 【DOI】 CNKI:SUN: 医学论文中常见的统计学错误及对策【作者中文名】 杨云华; 【作者单位】 天津市医学科学技术信息研究所 300050天津; 【文献出处】 中华医学科研管理杂志, Chinese Journal of Medical Science Research Management, 编辑部邮箱 2004年 02期 期刊荣誉:ASPT来源刊 CJFD收录刊 【关键词】 医学论文; 统计学; 常见错误; 对策; 【摘要】 分析医学科研论文中统计学方法应用中常出现的错误 ,提高编辑人员识别统计学常见错误的能力 ,确保科研论文的科学性、准确性和可信性 ,努力办成精品期刊。 【DOI】 cnki:ISSN:

缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

1、首先检查数据是否存在异常值或者缺失值。如果有,需要进行数据清洗和填充。2、其次重新计算均值。在计算均值时,可以采用不同的方法,如算术平均数、加权平均数等,以确保结果的准确性。3、然后进行统计分析。通过统计分析方法,如方差分析、回归分析等,对数据进行进一步分析,以确定计算错误的原因,并采取相应的措施进行纠正。4、最后向期刊编辑部提交更正申请。如果错误的数据已经发表在期刊上,您可以向期刊编辑部提交更正申请,并提供正确的数据和分析结果。

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

  • 索引序列
  • 医学论文中的统计数字错误
  • 医学论文数据统计错误
  • 医学论文中的统计错误
  • 医学论文中统计错误
  • 医学期刊中的统计错误
  • 返回顶部