缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。
医学统计论文
医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科,下面是我为大家收集整理的是医学统计论文,仅供参考。
摘要: 不同的统计分析方法均有其适用的范围和应用的条件,研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计,选择恰当的统计分析方法,切记勿盲目套用。同时,还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用,是充分利用试验研究获得的数据,也是最终得出科学、可信的结论的必要条件。
关 键词 :医学统计;方法;运用;原理;选择
一、统计学方法简介
统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α,它是用来表示组间实际无差别而统计结果判断有差别,犯这类错误的概率。实际工作中常取α=,当研究数据计算的P值小于时,组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型,选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验,是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析,非参数法常用的有秩和检验。
二、试验设计中的统计学原理
合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容。
医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提。有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。
三、统计学方法的选择
统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择。当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法。t检验一般适用于小样本(n<50)的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下,可以检验样本平均数的显著性,大样本(n≥50)采用u检验;多个样本均数两两比较则用方差分析,如差异有统计学意义,可采用q检验;Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中,表现为互不相容的类别或属性,分为二分类和多类反应,如治疗结果为显著和好转的人数等,该种资料可选用字检验,大样本(n≥50)时采用u检验。如:患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之,不论论文中选用的是哪种统计学方法,都要计算出检验值,然后再根据统计量值来判定P值的大小,结论一般描述为“差异有(无)统计学意义”。
四、常见统计学方法的误用分析及对策
1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例。本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法。
2.选用检验方法错误。在有些论文中,作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本(n<50)定量资料且方差齐的两组数据之间的比较,而方差分析及q检验主要用于对多个样本均数进行比较,几种不同治疗或处理方法等的同时比较。例如:在讨论中、西以及中西医结合治疗急性脑血管病时,两组患者的年龄、病程、病情严重程度等差别均无统计学意义,比较三组患者的一些指标变化。组间多重比较应用q检验,但文中作者采用的是t检验,对三组均数进行两两比较。这不仅造成了资料的利用率低,也增加了假阳性的概率,降低了试验结果的可信度。
五、结论表述中的统计学应用
资料的统计处理不是医学研究工作的最终目的,而是通过统计学分析为研究结论提供依据或者线索。因此,在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性,不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据,说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释;“差异无统计学意义”表明在试验既定的条件下,差异可能是因抽象误差引起的,在增加样本数量的情况下,差异可能变成“有统计学意义”。
参考文献:
[1]医学统计工作的基本内容[J].国际检验医学杂志,2013(19):2563.
[2]关红阳,郭轶男.医学统计t检验的分析研究[J].中国校外教育,2013(30):114.
一般常用的统计检验方法有:t 检验、卡方检验、方差分析和相关回归分析。统计检验方法的选择主要依据数据的类型(计量、计数) 、组数的多少(两组、多组) 、样本量的大小以及对比的方式(相互比较、配对比较) ,此外计量数据还要考虑分布形态和方差齐性等问题。
医学统计论文
医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科,下面是我为大家收集整理的是医学统计论文,仅供参考。
摘要: 不同的统计分析方法均有其适用的范围和应用的条件,研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计,选择恰当的统计分析方法,切记勿盲目套用。同时,还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用,是充分利用试验研究获得的数据,也是最终得出科学、可信的结论的必要条件。
关 键词 :医学统计;方法;运用;原理;选择
一、统计学方法简介
统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α,它是用来表示组间实际无差别而统计结果判断有差别,犯这类错误的概率。实际工作中常取α=,当研究数据计算的P值小于时,组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型,选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验,是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析,非参数法常用的有秩和检验。
二、试验设计中的统计学原理
合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容。
医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提。有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。
三、统计学方法的选择
统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择。当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法。t检验一般适用于小样本(n<50)的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下,可以检验样本平均数的显著性,大样本(n≥50)采用u检验;多个样本均数两两比较则用方差分析,如差异有统计学意义,可采用q检验;Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中,表现为互不相容的类别或属性,分为二分类和多类反应,如治疗结果为显著和好转的人数等,该种资料可选用字检验,大样本(n≥50)时采用u检验。如:患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之,不论论文中选用的是哪种统计学方法,都要计算出检验值,然后再根据统计量值来判定P值的大小,结论一般描述为“差异有(无)统计学意义”。
四、常见统计学方法的误用分析及对策
1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例。本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法。
2.选用检验方法错误。在有些论文中,作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本(n<50)定量资料且方差齐的两组数据之间的比较,而方差分析及q检验主要用于对多个样本均数进行比较,几种不同治疗或处理方法等的同时比较。例如:在讨论中、西以及中西医结合治疗急性脑血管病时,两组患者的年龄、病程、病情严重程度等差别均无统计学意义,比较三组患者的一些指标变化。组间多重比较应用q检验,但文中作者采用的是t检验,对三组均数进行两两比较。这不仅造成了资料的利用率低,也增加了假阳性的概率,降低了试验结果的可信度。
五、结论表述中的统计学应用
资料的统计处理不是医学研究工作的最终目的,而是通过统计学分析为研究结论提供依据或者线索。因此,在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性,不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据,说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释;“差异无统计学意义”表明在试验既定的条件下,差异可能是因抽象误差引起的,在增加样本数量的情况下,差异可能变成“有统计学意义”。
参考文献:
[1]医学统计工作的基本内容[J].国际检验医学杂志,2013(19):2563.
[2]关红阳,郭轶男.医学统计t检验的分析研究[J].中国校外教育,2013(30):114.
科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。
一般常用的统计检验方法有:t 检验、卡方检验、方差分析和相关回归分析。统计检验方法的选择主要依据数据的类型(计量、计数) 、组数的多少(两组、多组) 、样本量的大小以及对比的方式(相互比较、配对比较) ,此外计量数据还要考虑分布形态和方差齐性等问题。
统计图在医学论文中常见的格式统计表是用表格的形式,通过分析指标来表达研究对象的特征、内部构成及各项目分组之间的相互关系。在科技报告或论文中除一些简单的数据必需用文字说明外,其余大部分的统计数据都要用统计表的形式表示。因此,统计表制作的合理与否,直接关系到统计分析的质量与效果。1、统计表的基本格式一张完整的统计表由4部分组成,即标题、标目、线条、数字,必要时可加备注。其制表的原则是重点突出、简单明了、层次清楚。重点突出是指突出所要表示研究事物的主要特征及相互关系;简单明了是指统计表的结构要简单,使人一目了然,不能包罗万象;层次清楚是指内容及标目要安排合理、数据准确。若表格编排不合理将不能充分揭示事物之间的内在规律及联系,也不便于理解和阅读。2、标题应简明扼要地说明表的主要内容,一般放在表的正上方。当某一统计表在同一研究报告中出现时,标题可不包括时间和地点;如果引用在其他文章中,则应包括时间和地点。如论文中只有一张表时,可写成附表,否则要注明表序。3、标目用以说明表内数字含义部分称为标目,分为横标目和纵标目。横标目位于表的左侧,代表被研究事物的主要标志,即主语部分,用以说明同一横行数字的意义;纵标目位于表的右上方,用来说明事物的统计指标,即谓语部分,说明同一列数字的意义。标目的正确安排可使读者自左向右顺利阅读,即从表的左侧横标目开始阅读到纵标目结束,可以读出一个完整的句子。
看懂医学文献中的统计图通常并不需要大堆的统计知识(读者们大多不是统计专业啊)。如果只是想看懂数据,那么弄懂一些基本的统计概念和一些常用词汇如 significance,P-value等等,就应该足以看懂大部分的数据图。这些基本概念可以在网上如wiki很容易的查到。稍微系统一点的,可以看看类似于以及其他几个线上教学网站的生物统计学的初级介绍课程(大部分是英文,但也有中文的)。除非个人兴趣或者专业方向要求,个人觉得并不一定需要全面学习统计课程。因为题主没有说明是做什么图,做数据和统计类的图。
一般地,作者会在文章正文中明确解释问题1,粗略地解释2,试图证明问题3。而问题2的相关细节会散落在正文的results、discussion、methods/experimental section中,以及图释和supporting information里。越是专业的人,越要读得细致,要思考方法上有没有不同于传统方法的地方,方法本身是否可信。图中的各种细节也要特别留心,比如轴、坐标、单位的意义,极值、拐点的意义,error bar的大小,scale bar的大小,等等等等。搞清楚方法,具体到各个细节,那么文章是否可信自然可以得到结论。如果感觉不可信,可以找其他专业人士乃至作者本人讨论。由于编辑和审稿人的精力、水平、研究经历等可以理解的原因,很多经受了同行评审的文章一样有大量疑点(虽然比未经同行评审的文章要可靠得多)。如果读的过程中有概念/方法不理解,最可靠但是也最耗时的方法是根据文中列举的参考文献按图索骥。不知道题主的专业领域是什么。如果不在相关领域,需要的知识基础是不太可能在一个晚上就建立起来的。如果是这种情况,我的建议是:找一个专业领域的靠谱朋友,请他/她吃顿饭,让他/她帮忙解释一下。如果是专业领域内的东西而暂时超出自己的知识范畴(如果没记错,题主现在上大二?),其实最省时省力高效的办法还是找该领域的高年级研究生师兄师姐或靠谱学霸解释一下。如果不方便,找其他有相关研究经验的同学讨论也好。对于自己专业内相关程度特别高的概念和方法,最好还是去读一下原文。
用stata,或spss软件来做。excel很麻烦,不行的。
论文研究对象那个表是论文研究对象基线资料。
通常医学科研论文的第一张表格汇总的是研究对象基线资料,也称为Table1,tableone命令也存在一定的缺陷,如不能提供组间比较的统计量,又如符合正态分布的变量。
会以均数(标准差)形式表示,这些对SCI文章来说,是比较正常的。国内杂志需要我们提供组间比较的统计量,而且符合正态分布的变量,通常是以均数±标准差的形式表示。
论文研究对象基线资料表示技巧
数值变量,符合正态性,用均数(标准差)表示,采用t检验比较组间差异;不符合正态性,中位数(四分位数间距)表示,采用Man-Whitney U检验比较组间差异。分类变量采用频数(百分比)表示,采用卡方检验或精确概率法进行比较组间差异。
多组比较,数值变量,符合正态性,用均数(标准差)表示,采用方差分析比较组间差异;不符合正态性,用中位数(四分位数间距)表示,采用 检验比较组间差异。分类变量采用频数(百分比)表示,采用卡方检验或精确概率法进行比较组间差异。
科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。
1 设计方面的问题
11 分组没有严格遵循随机化原则研究对象的分组与抽样离不开随机化原则,在足够样本的前提下,随机抽样,随机分组,明确交代随机方法,各组样本量、基本特征等。随机不等于随便,有的作者滥用随机,只要抽样或分组,一概冠以随机,不描述随机方法,把随意、随便当做随机,使研究结果不可信。
12 无对照组或不合理医务科技工作者开展研究的目的就是验证假设是否正确,没有对照,无法做出判断。有的论文无对照组,没有对比观察,所得结论没有说服力。有的论文虽设有对照组,但不是严格的随机分组,组间缺乏可比性,如非同期对照,组间性别、年龄、患病状况不一致等。在实验组和对照组的可比性方面,两组例数要基本一致,否则没有可比性。
13 样本含量过少抽取恰当的样本量,结果才有可靠性。有些文章例数太少,这样抽样误差大,导致结果不可靠。研究对象变量标准差小的,样本可以小一些。观察计数指标的样本一般不少于20~30例,计量指标的样本不少于5~10例。有的作者仅仅观察了数例患者,就得出百分之多少的有效率,显然是不恰当的。
对于对比分析,样本太少得出的结果不可靠,往往随着样本量的增大而发生变化。
2 统计学处理不恰当在进行统计学处理时,首先要明白研究资料是计数资料还是计量资料,尽管是一个常识性的问题,但仍有不少作者搞混了。先分类再计数的资料叫计数资料,如A组30例,B组32例,可根据研究目的计算出阳性率、治愈率等。测定某项具体数值的资料叫计量资料,如身高、体重、脉搏、血压等许多物理诊断和化验结果。在医学科研论文中,计数资料最常用的统计学方法是检验,计量资料最常用的是t检验。在研究设计时,就应根据研究资料的特点,决定假设检验的方法。在处理资料时,因均数和标准差是用来描述正态分布资料集中和离散趋势的指标,可否采用均数±标准差描述研究资料的分布特征,首先要看资料是否是正态分布,如果资料不是正态分布或者方差不齐时,应对资料进行转换处理,使其符合正态分布,方差齐性后采用t检验或方差分析,达不到上述要求,用秩和检验。来稿中,不少作者不考虑适用条件,盲目使用t检验。造成统计学方法使用不当,结果不可靠。更有甚者,有的作者不分计数资料还是计量资料,乱用检验或t检验,其结果可想而知。这是无统计学常识或极不负责任的表现。
有的研究资料数据庞大,只能在表格描述中用阿拉伯数字或特殊符号表示与比较对象的P值,如 P>005 , P<005, P<001,无法一一给出具体的P值。但有的作者既不交代使用的统计学方法,也不给出具体的P值,直接列出 P<005或 P>005,认为差异有统计学意义或无统计学意义,使读者对无法判断结果的可靠性。正确的做法是写明使用的统计学方法,使用了什么统计学软件,如进行了校正检验。亦应说明。这才有说服力。
3 描述不严谨日常生活中对差异的判断与统计学上差异是否有统计学意义是两个完全不同的概念。我们主观上感觉差异不大,而经统计学处理差异可能具有统计学意义;主观上感觉差别很大,但经统计学处理差异可能有统计学意义。有相当数量的作者,在描述统计学结果时,常用差异显着或差异非常显着,易与日常生活中差异的概念混淆,使用差异有统计学意义或差异无统计学意义更为确切。
我们把检验水准设定为 a=005时就是以 P>005为界值,一般以 P>005, P<005, P<0O1 3个档次描述差异有无统计学意义即可,有的作者出现 P<0001,以强调差异的显着性。有的作者用 P>O01或 P<01来表示,是错误的, P>0O1既可能是 P>005,也可能是 P<005,二者有本质的不同。
4 统计符号使用不规范统计符号使用不规范是论文中经常出现的问题,把卡方检验中的 写成x或x2,丢掉平方或把希腊字母x写成英文字母x;把均数±标准差( ±s),丢掉z 上方的一横,既影响论文质量,又影响阅读效果。
5 统计表格不规范统计表格是论文的重要组成部分,表格是否符合统计学要求,对论文有重要影响。常见的问题有:
① 无表题;
② 表题过于简单或过于繁琐。不确切;
③ 横纵标目倒置,不符合语法规律;
④ 标目层次过多;
⑤ 线条太多。甚至左上角有斜线;
⑥ 表内同一栏目数字不对齐,小数点后位数不一致。
表题如同文章的题目,简明扼要,字数控制在15个字以内。表格左侧的标目叫横标目,相当于汉语的主语,表明相应横行内数字的涵义;纵标目位于表格的上方,相当于汉语的谓语部分,说明表格内相应纵行数字的'涵义。
主谓语倒置是统计表格最常见的错误,一般情况下主语做横标目,谓语做纵标目。统计表用三线表,即顶线、底线和隔开纵标目与表内数字的横线,必要时可在纵标目下加辅助线,其余线条一概省略。
统计表格和文字叙述相辅相成,互相补充,能用简洁的文字说明的,一般不用表格,文字描述不要和表格内容完全重复。表格要简洁明快,重点突出,让人一目了然,不要变成数字的堆彻。出现统计表前,要用简要文字描述或强调主要发现,不要把文字叙述放在表格后。
6 使用统计指标不当常见的问题是率与构成比、发病率与患病率、死亡率与病死率等的混淆。
61 把构成比当率构成比是说明事物或现象内部各构成部分的比重,构成比表示某事物内部各组成部分的比重或分布,单位为%,各组成部分之和应为100%。计算公式为:构成比=某组成部分的观察单位数/同一事物各组成的观察单位总数例如2011年某市围产儿死亡总数为18例,其中死胎7例、死产3例、新生儿死亡8例。其构成比分另0为3889%、1667%、4444%。
率为表示某种现象发生的频率或强度。常以%、/万或/lo万表示。计算公式为率=某时期内某现象实际观察单位数/同时期内可能发生该现象的观察单位总数,如共检测568名5~7岁儿童,患龋齿儿童314人,检出率5528%。
构成比和率都是相对数指标。有一篇题为某年某地区4种乙类传染病疫情分析。经数据处理后,作者认为,4种传染病的发病率依次为痢疾5453%(1546/2 835)、肝炎1619%(459/2 835)、乙脑921%(261/2 835)、流脑689% (569/28352007)。该资料是构成比,不是发病率。作者犯了以比代率的错误。
62 发病率与患病率发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数,常以‰、/7/或/lO万表示。其计算公式为:某病发病率等于某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000%o。例如某地某年年平均人口数为2500人,白喉发病28人,该地白喉年发病率为1120%0。而患病率则指观察时点的某病的现患病例数与该时点人口数之比强调的是该观察时点上某病的现患(新、旧病例)情况,常以百分率表示。有人调查16 875人,其中男性8 674人,沙眼患者7 632人,发病率为8799%;女性8 201人,沙眼患者6 210人。发病率为7572%。这样的结论当然是错误的,其所描述的结果应该是患病率。
63 死亡率与病死率这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率。常以‰、/万或/10万表示;某病病死率是某病患者中因该病而死亡的频率。
一般以百分率表示。前者反映人群因该病而死亡的频率,后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。如重症监护室患者死亡情况分析一文中报道,颅脑损伤32例,死亡20例,死亡率为625%;严重心衰26例,死亡9例,死亡率为346%;严重肾衰竭18例,死亡11例,死亡率为611%。很明显,作者在这里是将住院病死率误作死亡率来讨论。
我们在编辑医学论文中经常会发现存在这样那样的统计学问题,致使文章质量下降,甚至无法刊用,十分可惜。提高统计学应用水平,减少统计学差错,是作者、审稿专家和编辑共同的责任。树立严谨的科学态度,选择正确的统计学方法,对提高科研水平,确保论文质量有着十分重要的意义。
论文研究对象那个表是论文研究对象基线资料。
通常医学科研论文的第一张表格汇总的是研究对象基线资料,也称为Table1,tableone命令也存在一定的缺陷,如不能提供组间比较的统计量,又如符合正态分布的变量。
会以均数(标准差)形式表示,这些对SCI文章来说,是比较正常的。国内杂志需要我们提供组间比较的统计量,而且符合正态分布的变量,通常是以均数±标准差的形式表示。
论文研究对象基线资料表示技巧
数值变量,符合正态性,用均数(标准差)表示,采用t检验比较组间差异;不符合正态性,中位数(四分位数间距)表示,采用Man-Whitney U检验比较组间差异。分类变量采用频数(百分比)表示,采用卡方检验或精确概率法进行比较组间差异。
多组比较,数值变量,符合正态性,用均数(标准差)表示,采用方差分析比较组间差异;不符合正态性,用中位数(四分位数间距)表示,采用 检验比较组间差异。分类变量采用频数(百分比)表示,采用卡方检验或精确概率法进行比较组间差异。
统计图在医学论文中常见的格式统计表是用表格的形式,通过分析指标来表达研究对象的特征、内部构成及各项目分组之间的相互关系。在科技报告或论文中除一些简单的数据必需用文字说明外,其余大部分的统计数据都要用统计表的形式表示。因此,统计表制作的合理与否,直接关系到统计分析的质量与效果。1、统计表的基本格式一张完整的统计表由4部分组成,即标题、标目、线条、数字,必要时可加备注。其制表的原则是重点突出、简单明了、层次清楚。重点突出是指突出所要表示研究事物的主要特征及相互关系;简单明了是指统计表的结构要简单,使人一目了然,不能包罗万象;层次清楚是指内容及标目要安排合理、数据准确。若表格编排不合理将不能充分揭示事物之间的内在规律及联系,也不便于理解和阅读。2、标题应简明扼要地说明表的主要内容,一般放在表的正上方。当某一统计表在同一研究报告中出现时,标题可不包括时间和地点;如果引用在其他文章中,则应包括时间和地点。如论文中只有一张表时,可写成附表,否则要注明表序。3、标目用以说明表内数字含义部分称为标目,分为横标目和纵标目。横标目位于表的左侧,代表被研究事物的主要标志,即主语部分,用以说明同一横行数字的意义;纵标目位于表的右上方,用来说明事物的统计指标,即谓语部分,说明同一列数字的意义。标目的正确安排可使读者自左向右顺利阅读,即从表的左侧横标目开始阅读到纵标目结束,可以读出一个完整的句子。
论文撰稿中表格的规范应用 医学论文中的表格是论文内容的重要表达形式,借助它可以将大量的实验数据和统计学数据简洁明了地表达出来,使论文论述清晰准确,层次分明,篇幅紧凑,从而避免冗长繁复的文字叙述。如果作者对表格的运用不熟悉,设计不当,制作不规范,不仅不能准确地表达统计数据的含义和分析结果,反而影响了论文的撰稿质量。为此,笔者结合工作体会,在参考有关文献的基础上,就医学论文撰稿中表格的规范应用简要介绍如下,供作者参考。1 医学论文表格的构成 在科技论文中目前普遍倡导和推荐使用“三线表”(是卡线表经简化和改造而成的),它保留了传统卡线表的全部功能,使表格以其形式简洁、功能分明、阅读方便而被大多数期刊采用。 “ 三线表”通常只有三条线,即顶线、底线和栏目线。其中顶线和底线为粗线,栏目线为细线,必要时可加辅助线。“ 三线表”由表序(表号)、表题(表名)、表头(项目栏)、表身及表注等项目组成,其构成及绘制如表1[1]。 表1 ××××××表序、表题(略) 注:××××××表注 表序和表题 表序即表格的序号,一篇论文中如只有1个表格,则表序编为表1,有两个及以上的表格,应按先后顺序标出表的序号。序号用阿拉伯数字表示,一般不用罗马数字和中文数字;表的序号和标题多置于表的上方。表题即表格的名称,应准确得体(能确切反映表格的特定内容)、简短精练,中间不用标点,末尾不加句号。 表头(项目栏) 指表格顶线与栏目线之间的部分,栏目是该栏的名称,反映了表身中该栏信息的.特征或属性。 表身 三线表内底线以上,栏目线以下的部分叫做表身,是表格的主体,表身内的数字一般不带单位,百分数也不带百分号,均归并在栏目中,表身中不应有空项,如确系无数字的栏,应区别情况对待,在表注中简要说明,不能轻易写“0”或画“—”线等填空,因“0”代表实测结果为零,“—”可代表阴性反应。 表注 必要时,应将表中的符号、标记、代码,以及需要说明的事项,以最简练的文字,横排于表题下,作为表注,也可以附注于表下。 2 表格应用的选择 如表格栏目中的内容基本相同或为相同类型的表格,应尽量删除或合并。 如表格的内容简单,仅少数几组统计数据,可用一两句话表达清楚的,应以简要文字叙述。 如同时使用插图和表格表述同一内容,应选择更为合适的表述形式。通常强调事物的形貌或参量变动的总体趋势时,以插图为宜;相反,对比事项的隶属关系或对比量的准确程度时,则以表格为宜。 请继续阅读相关推荐: 毕业论文