医学论文中常见的统计学

发布时间：2023-12-05 20:23:32

医学论文中常见的统计学

医学统计学是运用概率论与数理统计的原理及方法，结合医学实际，研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。医学统计学在本世纪二十年代以后才逐渐形成为一门学科。解放前，我国学者即致力于把统计方法应用到医学中去，但人力有限、范围较窄。解放后，随着医学科研工作的发展，本学科得到迅速普及与提高。通过大量实践，在不少方面积累了自己的经验，丰富了医学统计学的内容。而电子计算机的作用，更促进了多变量分析等统计方法在医学研究中的应用。

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

常用的医学科研统计方法有：计量资料的统计方法可分为参数检验法和非参数检验法。参数检验法主要为t检验和方差分析（ANOVN，即F检验）等，两组间均数比较时常用t检验和u检验，两组以上均数比较时常用方差分析；非参数检验法主要包括秩和检验等。t检验可分为单组设计资料的t检验、配对设计资料的；方差分析可用于两个以上样本均数的比较，应用该方法时，要求各个样本是相互独立的随机样本，各样本来自正态总体且各处理组总体方差齐性

医学论文常见的统计

秋风送爽，也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来，说不定马上你就会用到了。编者语针对常用的基本统计学方法，一般而言说的就是t检验、单因素方差分析和卡方检验，这也是大家在写论文、阅读论文时经常遇到的统计学方法（几乎每篇文章都会涉及这一种或几种方法），那到底该采用何种统计学方法呢？今天我们就此来聊聊。一、拿到数据开始分析之前，一定要进行数据类型的划分（图1），因为不同数据类型资料，描述的方式不一样，统计学方法也不一样。图1 统计资料的类型举个例子（表1）：表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析（描述与统计推断）1.计量资料特点：每个观察单位的观察值之间有量的区别，有单位；描述形式：最常见采用“X±S”（一般文献中经常见到），用算数均数描述其平均水平，用标准差描述其离散程度。如果遇到数据“特别变态”（特别是标准差大于算数均数），就采用Md(P25,P75)（Md为中位数，P25和P75为四分位数）（表2）。正态分布检验请大家复习：医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计量资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是满足正态方差齐性时采用t检验（注意t检验有三种形式哦！）或单因素方差分析，不满足时采用秩和检验（图2）。图2 计量资料统计方法的正确选择提醒两点：① 如果样本数据不服从正态分布的话，那就只能用非参数检验（秩和检验），但其检验效能低于参数检验（t检验或方差分析）。所谓检验效能低就是本身有差异，却没有能力发现其差异。② 如果是两组以上样本的数据时，不能采用t检验（会导致假阳性错误概率增加），应该采用方差分析。若方差分析的P<，需再进一步两两比较，常用的方法为LSD法或SNK法（注意依旧不能采用t检验）。在上两讲内容中我们已经学过t检验（医学科研课堂丨统计说说（二）：你的t检验做对了吗？）和方差分析（医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析）了，至于秩和检验，我们以后会逐步介绍滴。多因素分析一般采用回归分析，主要是线性回归分析，以后会给大家介绍此方法。2.计数资料特点：无序分类，同类别中各观察单位之间没有量的差别，但各类别间有质的不同，各类别互不相容。其中二分类一定是计数资料（例如性别只有男/女之分，是否继发某种疾病只有继发/未继发之分），而多分类满足分类在性质上没有程度等级上的差别，即为计数资料（例如婚姻状况包括未婚、已婚、离异、丧偶，就属于多分类，但各分类没有程度等级差别，因此为计数资料，尿糖定性检测结果包括-、+、++、+++、++++，属于具有程度等级差别的多分类资料，就不属于计数资料，属于等级资料了）。描述形式：最常见采用“例数（%）”（一般文献中经常见到），主要要分清构成比（结构相对数）和率（强度相对数）的差别（表3）。而且在应用时，分母（就是样本量啦）一般不宜过小，分母太小不足以反映数据的客观事实，也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说：1.某地肺癌患者中男性A例，女性B例，则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种，总株数为A+B+C，其中一种致病菌检出株数为A，那么A/（A+B+C）就是构成比，即该种致病菌占总致病菌的比重或分布。3.某研究对患者（总例数为B）进行治疗，结果治愈的患者例数为A，则A/B即为率（可以理解为治愈率）。统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计数资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是多样本率比较，若卡方检验的P<，需再进一步两两比较，并进行Bonferroni校正，以控制假阳性（图3）。图3 计数资料统计方法的正确选择提醒两点：① 构成比是以100作为基数，各构成部分所占的比重之和必须为100%，故某组成部分所占比重的增减必影响其它组成部分的比重；② 构成比和率在实际应用时容易混淆，主要区别在分母上，所以应正确选择分母。多因素分析一般采用回归分析，主要是Logistic回归分析，以后会给大家介绍此方法。3.等级资料特点：属于多分类资料，满足多分类在性质上有程度等级上的差别，各分类属性按一定顺序排列（有序），即为等级资料。描述形式：最常见采用“例数（%）”（一般文献中经常见到），这和计数资料的描述大体相同，主要区别在于多个分类排列时一定要按照顺序进行（从小到大或从弱到强）。统计推断方法：等级资料的统计分析方法在单因素分析中采用非参数检验（秩和检验），当然对于双向有序R×C资料，也就说分组变量和结局变量都是有序（等级）的情况，构成比的比较采用卡方检验，程度的比较采用秩和检验，趋势关联性的比较用秩相关（也称等级相关）。多因素分析中采用有序Logistic回归。注意：分类变量（计数资料和等级资料）在软件分析操作时，要适当数量化处理（赋值），赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择（图4）。图4 常用基本统计学方法的正确选择今天的内容就到这里，同学们多多复习，有什么问题和不懂的可以在下面留言，我们会请刘岭教授一一解答。好了，让我们期待下一期吧！撰稿：刘岭约稿编辑：刘芹排版：毕丽审核：王东专家简介刘岭：陆军军医大学卫生统计学教研室副教授，主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员，重庆市预防医学卫生统计专业委员会副主任委员，并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验医学科研课堂丨统计说说（二）：你的t检验做对了吗？医学科研课堂丨统计说说（一）：样本量估算是个什么东东？

医学统计方法概述第一节医学统计学在临床医学中的作用和意义一、医学统计学 1、统计学统计学（statistics）是研究数据搜集、整理与分析的科学，是认识社会和自然现象数量特征的重要工具。 2、医学统计学统计学在医学研究领域的应用称为医学统计学。医学统计学与生物统计学、卫生统计学是统计学原理和方法在互有联系的不同学科领域的应用，三者间有少许区别，但无截然界限。二、医学统计学在临床医学中的应用及意义 1、临床科研设计 2、对搜集资料的内在规律进行分析 3、为医务工作者阅读科技文献和撰写科研论文提供工具第二节统计工作的基本步骤统计工作的基本步骤通常分为四步：(研究)设计、搜集资料、整理资料和分析资料。一．研究设计(design) 设计一般包括专业设计和统计设计。专业设计即确定调查题目、内容等。统计设计包括资料收集、整理与分析。统计设计包括资料收集、整理与分析全过程的统计设想和科学安排。设计需考虑以下几方面： 1、研究的目的和假设是什么? 2、研究对象的选择范围是什么？如何确定？ 3、研究方法是什么？技术路线如何？ 4、具体的研究内容、观察项目与指标是什么？ 5、研究对象的数量大小，如何抽样？怎样分组？ 6、对观察指标如何进一步计算？具体采用哪些统计分析方法？ 7、有哪些可能存在的误差？如何避免与减少其影响？ 8、时间、人员、经费方面的安排。实验三要素：处理因素、受试对象、实验效应设计四原则：对照、随机化、重复、盲法二、搜集资料(data collection) 按照设计要求，原则是及时、准确、完整地收集原始数据。 1、病历 2、日常医疗工作记录 3、临床检查与化验记录 4、疾病监测报表 5、专题研究三、整理资料（data sorting） 1、资料的录入和清理资料录入前后初步的清理是核实，其次是发现异

正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上，那些事先没有研究目的和研究设计，事后找来一堆数据进行统计分析都是不可取的。在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符，包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题；还有是目的不明确、设计不合理。如题目过小，论文不够字数，而一些无关紧要的变量指标或结果被分析被讨论；又如题目过大，论文的全部内容不足以说明研究的目的，使论文的论点难以立足。所以，合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。此外，样本含量是否满足，抽样是否随机，偏倚是否控制等，也是不可忽视的问题。2、建好分析用的数据库建好数据库是正确统计分析的前提和基础，甚至决定了论文分析结果的成败。对于编、审、读者来讲，一般由于篇幅的限制，往往得不到数据库数据，而只有作者在数据库数据基础上经统计描述计算后给出的诸如各指标均数 x、标准差 s 或中位数 M、百分位数 Px 的“二手”数据，或将研究对象小或特征属性分组，清点各组观察单位出现的个数或频数的频数表数据等。无论是否能够得到数据库数据，作者在统计分析过程中一定依据数据库数据进行计算，得出结果。如果对“二手”数据或频数表数据的结果等存在疑惑，编辑、审稿专家或读者有权要求作者提供数据库数据以检查其完整性、准确性和真实性，确保研究数据的质量。假若在投稿须知中对数据库数据作出必要的要求，无疑对于保证刊物的发表质量有着积极的意义

医学论文常见的统计学

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

常见的医学论文统计图

统计图在医学论文中常见的格式统计表是用表格的形式，通过分析指标来表达研究对象的特征、内部构成及各项目分组之间的相互关系。在科技报告或论文中除一些简单的数据必需用文字说明外，其余大部分的统计数据都要用统计表的形式表示。因此，统计表制作的合理与否，直接关系到统计分析的质量与效果。1、统计表的基本格式一张完整的统计表由4部分组成，即标题、标目、线条、数字，必要时可加备注。其制表的原则是重点突出、简单明了、层次清楚。重点突出是指突出所要表示研究事物的主要特征及相互关系;简单明了是指统计表的结构要简单，使人一目了然，不能包罗万象;层次清楚是指内容及标目要安排合理、数据准确。若表格编排不合理将不能充分揭示事物之间的内在规律及联系，也不便于理解和阅读。2、标题应简明扼要地说明表的主要内容，一般放在表的正上方。当某一统计表在同一研究报告中出现时，标题可不包括时间和地点;如果引用在其他文章中，则应包括时间和地点。如论文中只有一张表时，可写成附表，否则要注明表序。3、标目用以说明表内数字含义部分称为标目，分为横标目和纵标目。横标目位于表的左侧，代表被研究事物的主要标志，即主语部分，用以说明同一横行数字的意义;纵标目位于表的右上方，用来说明事物的统计指标，即谓语部分，说明同一列数字的意义。标目的正确安排可使读者自左向右顺利阅读，即从表的左侧横标目开始阅读到纵标目结束，可以读出一个完整的句子。

医学论文中常见统计错误

医学统计中的常见误区有哪些

医学统计学是运用概率论与数理统计的原理及方法，结合医学实际，研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识，欢迎阅读。

一，真正差异和统计学差异

常常有人和我说： P值越小，试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。

其实，这些人忽略了 n 这个样本数的作用，n 的大小会影响 P 值。但更应该澄清一下的是： P 值代表的是统计学差异，并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

二，卡方检验的局限性

我们知道各组之间的计数资料的比较，要用卡方检验，但有些情况是不行的!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

2，当组与组之间有不同的背景，而这些背景因子还可能会影响到组与组之间结果差异，这是就必须要用 Mantel-Haenszel 检验!

这第2条可能大家不要理解，那我就举两个例子：

1) 关于男性和女性对于不同颜色的喜好的统计学分析

但这里应该注意到年龄可能会对这个分析造成影响，这就要用Mantel-Haenszel 检验了。

***红色蓝色黄色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我们以15岁为分界)分层，在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里，并在统计指标选项里，选 Cochran和Mantel-Haenszel的统计量选项，这样出来的结果就可靠了!

2)两种治疗(A和B)效果的评价分析：

*****A法 B法

生存 41 54

死亡 47 31

用卡方检验 X2=; P <

但是，病人的临床分期将影响着分析结果：

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel检验： X2=; P >

说明实际上A法和B法两组的统计学差异，是这个不同的分期造成的!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

讨论：当样本有小于5的值2X2表时，必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时，将某两组合并，用pearson卡方检验。

三，t 检验的局限性

1，我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异，但这里要注意，有一些血清标记物的水平是不能用 t 检验的!

比如：血清标记物 PSA和AFP，在正常人的水平是很低的，而在病人则明显增加，呈现指数幂次改变，这样一来，血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

2，关于用不用配对t 检验，我个人认为当同一组样本在不同时点，不同处理方式的比较上，应该用配对t 检验。

四，ANOVA 检验的局限性

1，在2组以上计量资料样本比较时，ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果，并不能说明真正的统计学差异，真正的`差异还要通过每两个点的直接比较，也就是说应该在ANOVA 检验后，还必须做两两比较或多重比较，这样才能从全貌上反映出统计的全部结果。

2，既然方差分析得到差别有显著性意义的结论后，还需进行两两比较，有人认为还不如一开始就进行多次t检验更方便，其实，这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误，产生假阳性，因此要采用特定的方法，在SPSS的one-way ANOVA或General linear models中操作时，Post Hoc(多重比较)对话框内有多种方法可供选择，象两两比较一般用SNK法，而多个试验组和一个对照组的比较则多用dunnett检验。

3，我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异，但这里要注意，与 t 检验一样，有一些血清标记物的水平是不能用 ANOVA 检验的!

如上所说的：血清标记物 PSA和AFP，在正常人的水平是很低的，而在病人则明显增加，呈现指数幂次改变，这样一来，血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用非参数性检验---即 Kruskal-Wallis rank test 。

五，单元线性相关分析

有时我们常常只注意到了 P 值大小，可最重要的是 r 值!

样本数 n 对 P 值结果的影响很大，容易让我们产生错觉，其实，相关的存在与否的评价是与 r 值最直接相关的，如下：

当 P 值小于时： r 值

几乎没有相关关系

弱的相关关系

有相关关系

强相关关系

极强相关关系

P 值只是证明这个相关在统计学上是否成立!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

讨论：当样本有小于5的值2X2表时，必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时，将某两组合并，用pearson卡方检验。

不是说样本小于5

而是说：在R×C表中

理论频数不应该小于1，并且1≤T≤5的格子数不应该超过总格子数的1/5，若出现上述情况可以通过以下方法：

a.增加样本含量，使理论频数增大;

b.根据专业知识，删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

c.改用双向无序的R×C表的fishher确切概率法。

还有一点

四格表卡方检验的适应指标：(T为理论频数)

1。n≥40，且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

2。n≥40，但是1≤T≤5时，用四格表校正公式

3。n<40，或者T<1时，用fisher四格表确切概率法

4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

补充几点：

1. 关于P值：P值的大小并不是各组差异的大小，而是统计学差异显著性的大小。P值越小，说明得出各组没有差异的概率越小，越有理由说明各组存在差异(可以说，P值的大小反映了做出统计结论的“理由”的大小，而不是被比较的各组的实际差异的大小，得出有意义的结论后，其差异的大小可直接通过各组的均数或率进行比较)。

2. 关于t检验和方差分析：katalyster兄上面提到的t检验及方差分析在某些时候不适用，实际上就是每种方法都有其应用条件，不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料，为指数或幂次的关系，可用对数转换)，如变换后，服从正态分布，可用上述方法;若还不符合，则考虑非参数检验。

3. 关于相关分析：两个变量间是否存在相关关系，要看P值，而不是r值，r值用来说明相关关系的大小。当P<，才能讲两变量间存在相关关系，再看r值，r值越大，相关关系越强，反之越小;否则，P>,不能讲两变量间存在相关关系，r值毫无意义。

感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题，是真心想让初学者从这些<误区>中走出来!

六，Logistic regression 分析

在判断某因子对疾病的危险度时常用的方法。

1，假设要判断某因子对疾病的危险度(OR)，要了解这个OR是一个相对危险度，即是有某因子存在和没有某因子存在之间比较的OR值。

2，OR 和 RR 不一样，OR是在Logistic regression model中使用，RR是在Cox proportional hazard model中使用。

3，假设要判断某因子对疾病的危险度，要在多变量Logistic regression model中校正一些混扰因素，如常见的年龄，性别，吸烟等等，并最后得出这个 Adjusted OR。但并不是说有了这些校正，我们就可以在实验设计上就不考虑这些混扰因素，相反，必须在实验设计上就把这些混扰因素在实验组和对照组配平，光靠在多变量Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法)：

我们有时在临床研究只注意到了用这种方法分析与生存相关的研究，其实，在疾病复发上也常用这种方法!前者是以生---死为判别，后者则以复发---不复发为判别。

第一类错误是：零假设H0实际上是正确的，却被否定了。

第二类错误则是：H0实际上是错的，却没有被否定。

假设检验系指拒绝或保留零假设的判断，又称显著性检定。在选择否定域并计算检验统计量之后，完成最后一道手续，即根据试验或样本结果决定假设的取与舍。

如果结果落在否定域内，将在已知犯第一类错误概率的条件下，否定零假设。反之，如果结果落在否定域外，则不否定零假设，与此同时，就有了犯第二类错误的危险。

扩展资料

统计检验亦称“假设检验”。根据抽样结果，在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝（予以接受）结论的程序。决定常取决于样本统计量的数值与所假设的总体参数是否有显著差异。这时称差异显著性检验。检验的推理逻辑为具有概率性质的反证法。

例如，在参数假设检验中，当对总体分布的参数作出原假设 H0 后，先承认总体与原假设相同，然后根据样本计算一个统计量，并求出该统计量的分布，再给定一个小概率（一般为，等，视情况而定），确定拒绝原假设 H0 的区域（拒绝域）。

参考资料来源：百度百科——统计检验

计学，可以说无处不在，我们每个人的日常生活都会受到统计学的影响。但是很多人，即使受过统计学的正规训练，也会在不知不觉之间犯一些常见的分析错误。下面这篇文章，我就和大家分享一些现实生活中比较常见的统计研究错误。1. 参照组（Control group）那天我恰好在网上看到一篇文章，叫做《眼保健操对于保护眼睛有作用么？》。作者的观点是眼保健操没有什么作用，列举的证据是眼保健操在中国的学校里推行了50多年，小学生和中学生的近视率大大上升了，而非下降。因此作者得出结论：眼保健操对视力有害。乍一看，好像确实是这么回事：50多年前我们开始在学校里要求学生们做眼保健操。但是现在孩子们的近视率，则要比当时的那些孩子的近视率高出很多。但是如果就因为这个而得出眼保健操没用的结论，则是谬之大矣。主要原因在于：没有参照组。和建国初那时候的孩子们相比，现在的孩子由于功课压力，在室内花的时间（读书，做作业，上补习班等）大幅度增长，用眼的“诱惑”也大大增加，比如电视，电脑，手机等等。因此无论是否做眼保健操，现在孩子的视力肯定都不及当时的孩子。这也不是中国独有的现象，日本，韩国，新加坡等国的情况也类似。而这些国家都没有眼保健操。如果要真正研究眼保健操对于保护视力是否有效，那么就应该通过参照组来对比。研究人员应该找到两组情况类似的样本（比如同一个学校里的孩子）进行研究。这两组样本的区别除了他们是否做眼保健操以外，在其他方面越相似越好。然后通过一定时间的跟踪调查，研究人员才可能得出更加客观和可靠的研究结果。1747年，苏格兰医生James Lind在一艘名叫Salisbury的船上成功的找到了治疗坏血病的方法：就是通过吃橙子和柠檬补充维他命C。而他找到该疗法的关键就是运用了参照组实验方法。坏血病是一种非常可怕的疾病。坏血病的发病特征包括皮下出血（因此腿会变黑），极度疲劳，牙床腐烂，肌肉变软。长期出海的船员和海盗是坏血病的多发人群。James Lind使用的参照组实验是这样进行的。在Salisbury这艘船上，Lind医生找到了12个坏血病严重程度差不多的病人，将他们两人一组分成6组。对于这6组病人，Lind医生给予了他们6种不同的治疗方法，包括橙子，柠檬，苹果酒，醋和盐水等。后来Lind医生发现，食用橙子和柠檬的那组病人的恢复速度显然比其他组别要快很多，因此得出结论橙子和柠檬可以治疗坏血病。现在我们知道，橙子中的维他命C才是坏血病的克星。Lind医生通过参照组实验获得的这项重要发现，帮助挽救了成千上万的水手的生命。如果没有参照组这个重要的分析方法，Lind医生能否找到正确的解药要打一个大问号。当时，Lind医生一度怀疑坏血病的病因和啤酒有关。Lind医生观察到，每次船上的啤酒被喝光时，往往也伴之以坏血病的大面积流行。但事实上，啤酒喝光，和坏血病盛行，只是一个巧合而已。因为坏血病往往多发于长期航海旅途中，而在海上旅行久了，啤酒自然也会被喝完。如果不通过参照组方法去分析真正的原因，那么就可能得出啤酒能够治疗坏血病这样错误的结论。在我们阅读分析一些统计研究报告时，一个很重要的地方就是要看该研究有没有参照组进行对比。如果研究只是比较了几个变量之间的关系而缺乏参照组进行对照，那么该研究的结论就值得怀疑。2. 随机取样（Random Sampling）下面来讲讲“随机取样（Random Sampling）”这个问题。在现实中，我们经常面对的问题是，需要研究的样本量太大，无法收集到完整的数据。比如我们想要了解全国十几亿人的想法，或者想要知道所有沿海城市的中产阶级的消费偏好，等等。要想精确的回答这些问题，我们就需要随机抽取一些代表性样本，通过样本的表现来推测整体的特征。如何确保收集到的样本真正“随机”，是一个技术含量很高的问题。在这方面有很多失败的例子可供我们学习。1936年，美国的总统选举大战在罗斯福(FDR）和兰登（Alf Landon）之间展开。在选举投票前，当时一家非常大的调查机构Literary Digest发出了1千万张明信片来收集美国人的投票倾向。在这1千万张明信片中，Literary Digest收到了2百万份回复。在这些回复中，绝大部分人都倾向于选兰登。因此Literary Digest得出结论：兰登将赢得总统选举。当时还有另外一家新成立不久的调查公司，名叫Gallup。Gallup没有Literary Digest那么大的预算。他们只是有针对性的选了几千个受访者做了民意调查，并得出罗斯福将会赢得总统大选的结论。

一类错误是原假设Ho为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误.

索引序列
医学论文中常见的统计学
医学论文常见的统计
医学论文常见的统计学
常见的医学论文统计图
医学论文中常见统计错误
返回顶部

医学论文中常见的统计学