古蒂guti
统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!
医学统计学方法应用的错误解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
统计学专业毕业现状分析与对策研究
本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。
中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。
本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]
一、统计学专业毕业论文质量的现状分析
从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为。
从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。
从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的。二是数学专业教育和数学思维的研究,占总数的。研究统计学专业问题的毕业论文占绝大部分,比例为,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。
此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约分。
二、统计学专业毕业论文存在的问题
毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:
1.创新性不够
学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占,与实证型论文的比例为1︰,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。
2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象
有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。
3.相对前沿的分析方法利用较少
前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约,其他各统计方法使用的比例分别为:聚类分析为,判别分析为,相关性分析为,多元统计方法为,时间序列分析为,极少有学生使用教科书外的相对前沿的分析方法。
4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题
从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。
三、存在问题的原因分析
针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:
1.学生对论文不够重视
部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。
2.缺乏指导教师的针对性指导
指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。
3.学生的专业训练还不够
大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。
四、提高毕业论文质量的建议和 实践
1.加强毕业论文重要性的宣传,提高学生的重视度
加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。
2.选题和教师的科研项目相结合,提高论文的创新性
在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。
3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力
为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。
4.加强学生科技论文写作训练
加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。
5.实施激励措施,激发学生的兴趣和主动性
针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。
6.加强教师责任心,建立完善的机制
加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。
luclmars明尼苏达
生物医学动物实验研究论文
1实验设计
在开展生物医学研究时,研究者通过正确地运用统计学知识,可直接影响研究的质量。统计学设计的任务在于对研究的部署、实施,直到研究结果的解释进行系统的安排,力争做到以最少的人力、物力获得可靠的结论和信息。其目的在于确定某种处理是否会表现出某种特定的效应。在实验设计时应遵循惟一差异原则,即在进行两组比较时,两者之间仅有因处理因素不同而引起的差异,而其他实验条件相关的非处理因素都应保持等同。然而,处理组与对照组在反应上表现出的差别并不一定意味着是处理的结果。另有两种引起差别的可能性,即偏倚和偶然性。偏倚是指系统性差别,它不是因组间在处理上的不同所引起。生物医学实验中统计学设计和分析的目标就是消除潜在的偏倚,减少偶然性[2]。
实验的偏倚和控制
偏倚是在研究中从设计到实验实施和结果分析的各环节存在一些人为的、有系统倾向的非随机误差,它不是由于抽样造成的,而是某种偏性使得实验结果偏离它的真值。从所选择的生物医学问题到研究方案的制订与实施、实验的完成过程、实验的分析与解释,乃至实验结果的发表,均可能存在各式各样的偏倚[2]。这种偏倚常常表现为系统误差。偏倚的大小取决于研究的方法和具体的实验条件。常见的偏倚主要有选择性偏倚、观察性偏倚和混杂性偏倚。必须认识实验过程的偏倚,从实验设计起直到整个研究过程结束均要加以控制。正确的实验设计可控制选择性的偏倚,事前人为控制和采取相应的措施可避免和减少观察性的偏倚。对于混杂性偏倚,可将重要的混杂因素在设计阶段进行分层随机设计,使混杂因素在组间分布均衡;在统计分析阶段将混杂因素作为分层因素或采用有协变量分析方法,以消除混杂因素的影响。只有有效地控制或消除偏倚,方可减少结果的假阳性或假阴性。
减少偶然性的潜在影响
偶然性因素的作用可以减少,但不能完全排除。因为即使是在精心实施的研究中,接受同样处理的动物,其反应也不可能完全一样。适当的统计分析可使实验人员评估出现假阳性的概率,即根本不存在处理效应的情况下观察到差异的概率。这种概率越小,实验者发现真实效应的可能性就越大。为了更有把握地检测出真实效应,有必要减少偶然性的作用,并通过实验设计确保能在“噪声”之上识别真正的“信号”。
实验设计的要素
要消除生物医学实验中潜在的偏倚,减少偶然性,就应对实验对象、处理因素和实验效应这三个实验设计要素,按照对照、重复、随机化和均衡四项原则进行周到的设计与控制[3]。实验对象实验中处理因素所作用的对象称为实验对象。不同性质的实验研究需要选取不同种类的实验对象,一个完整的实验设计中所需实验对象的总数称为样本含量。生物医学试验中考虑动物实验对象时应关注以下几个方面:①动物种属的选择:选择实验动物的种属与品系时,尤其需要注意其背景反应的水平。为了将反应“信号”水平最大化,常常意味着应避免选择那些背景反应水平极低的动物种属或品系,但如果采用过度反应的动物种属或品系也同样会出现问题。动物物种选择中的其他问题,无论是实际问题(寿命、体型、易得性、对动物学特征的了解情况)或是理论问题(生化、生理或解剖结构与人的相似性),都需要从专业的角度认真加以考虑和权衡。②动物的数量:虽然从统计设计角度考虑可得出某项实验所需的动物数(样本含量),但所得出的数值往往很大。因此,虽然样本含量估计是保证结论可靠性(精度和检验效能)的前提,但基于实验的可操作性及经济原则方面的考虑,应结合统计学的计算结果与以往的生物医学研究经验予以确定。③动物的体重与年龄:为确保实验对象的同质性,实验中所使用的动物体重与年龄应尽可能相近;动物体重的标准差不应超出平均值的10%;啮齿类等小动物年龄相差不应超出1周,大动物年龄相差不应超出1个月。④动物的分层:为了准确检测一种处理因素引起的差别,各处理组在可能影响实验结果的其他非处理因素方面应尽可能具有同质性。当存在动物亚系间的差别时,有两种方法可得到更为准确的结论。一是在结果分析阶段将亚系作为一个“分层变量”处理,包括对两个亚系的结果进行单独分析,然后将结果综合,得出处理效应的总结论;二是将亚系作为实验设计的“区组因素”,这种情况下可使对照组与处理组中每个亚系动物数量相等。除以上所讨论的“亚系”之外,其他的非处理因素,如性别、窝别、体重段等也可作为分层变量进行局部控制,并据此进行分层随机化分组。处理因素设计实验研究时,要明确研究中的处理因素和影响实验效应的非处理因素。研究者希望通过对研究设计进行有计划的安排,从而能科学地考察其效应大小的因素称为处理因素或实验因素;研究者往往忽略对评价实验因素作用大小有一定干扰的重要的非处理因素或非实验因素(如动物的窝别、体重等);其他未加控制的许多因素的综合作用统称为实验误差。实验结果是处理因素和非处理因素共同作用而产生的实验效应,因此如何控制和排除非处理因素的干扰,正确显示处理的效应,是实验设计的基本任务。实验效应实验效应是处理因素作用于受试对象的反应和结果,是反映实验因素作用强弱的标志,它通过观察指标(统计学常将指标称为变量)来体现。如果指标选择不当,未能准确反映处理因素的作用,获得的研究结果就缺乏科学性,因此选择好观察指标是关系整个研究成败的重要环节。指标的观察应避免带有偏性或偏倚,要结合专业知识,尽可能多地选用客观性强的指标,在仪器和试剂允许的条件下,应尽可能多选用特异性强、灵敏度高、准确可靠的客观指标。对一些半客观(如尿液pH试纸读数值)或主观指标(行为测量、病理观察),一定要事先规定读取数值的严格标准,只有这样才能准确地分析实验结果,从而提高实验结果的可信度。
实验设计的原则
为了防止结果的偏倚,保证实验结果的准确性和最大化的表达,在进行生物医学实验设计时必须遵循统计学设计的对照、重复、随机化和均衡四个基本原则。生物医学实验中对照组的设置必须具备三个条件:①对等原则,即惟一差别原则,除处理因素外,对照组具备与实验组对等的非处理因素。在相互比较的各组间,除了给予的处理因素不同外,其他方面应与实验组具有一致性,如相同的实验单位来源(动物种属、体重等)和相同的实验条件、操作方式和喂养环境等。②同步原则,对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。③专设原则,任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往结果或其他研究资料作为本研究之对照。
生物医学中常用的实验设计类型
如果需要在同一实验中同时评价几种不同的效应,实验者应该安排能区别各自效应差别的实验设计方法。生物医学中常用的实验设计有以下几项。完全随机设计完全随机设计是生物医学动物实验中最为常用的一种实验设计方法,它是一种单因素有k个水平(k≥2)组的实验设计。即实验设计可设置一个对照或多个剂量组的实验方案。本设计保证每个实验动物都有相同机会接受任何一种处理,而不受实验人员主观倾向的影响。本设计应用了重复和随机化两个原则,因此能使实验结果受非处理因素的影响基本一致,真实反映出实验的处理效应。随机区组设计随机化完全区组设计,简称随机区组设计,又称配伍组设计,是配对设计的扩展,它将几个条件相同的受试者划分在同一个区组或配伍组,然后再按随机的原则,将同一配伍组的受试者随机分配到各实验组。该设计方法的优点是每个区组内的k个实验单位有较好的同质性,比完全随机设计更容易察觉处理间的差别。这种方法须特别注意的是要求区组内实验单位数与处理数相同,实验结果中若有缺失值,统计分析将损失部分信息。拉丁方设计拉丁方设计从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组,是比随机区组设计多一个区组因素的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。析因设计析因实验设计又称全因子实验设计,属于多因素、多水平单效应的设计。它不仅可以检验每一因素各水平之间的效应差异,而且可以检验各因素之间的交互作用。交互作用是指一个因素不同水平间的效应差受另一因素的影响,包括协同交互作用和拮抗交互作用。析因实验主要用于分析交互作用,当因素及水平数过多时,所需的实验对象数、处理组数和实验次数大幅度增加,故一般采用较简单的析因实验。含有较多因素和水平的实验一般采用正交实验设计[5]。
2生物医学动物实验的描述统计学
生物医学实验资料的类型
生物医学实验对实验对象(动物)进行干预后测定的观测指标通常有以下类型:①连续性数据:测定结果表现为有数字大小和单位的数据,统计上称定量资料,如生理、生化指标,体重值,器官重量等。②分类数据:测定结果表现为按某属性划分的定性类别,统计上称为定性资料,具体又可以分为二值资料、多值名义资料和多值有序资料。如某反应为出现或不出现,死亡或未死亡,有畸形或无畸形;病理损害的严重程度(无、轻度、中度、重度)等。
统计描述指标
描述性统计学(或归纳统计学)是对样本观察/测量数据频率分布的定量研究,描述性统计的目的在于:①对测量值或观察值进行归纳浓缩,用统计量、统计图或统计表的形式表现;②估计总体分布的参数。资料的整理与探索对于某一测量指标,一般应从文献资料中了解其分布类型。如果没有判断概率分布的理论基础,应重复以大样本测定,绘制样本的频数分布图(理论上样本量要大于100),并经统计学检验拟合其分布。数据的描述统计量①连续性数据的频数分布:通过对样本资料编制频数分布表或做茎叶图,以确定资料分布的类型、频数分布的集中趋势和离散趋势、估计总体参数,也便于发现离群值。②中心位置的描述统计量:描述数据分布的集中趋势,常用指标为算术均数、中位数、众数、几何均数等。③离散程度的描述统计量:描述数据分布的离散趋势,常用指标为标准差和方差、极差和四分位数间距、变异系数和离散系数等。④统计学图表:统计图包括连续性数据分布的直方图、茎叶图,表示数据中心位置和离散程度的点杆图(做图时表示均数和标准差)和盒须图(做图时表示中位数、极差、四分位数间距),描述构成比数据资料的百分条图、饼图,描述经时变化趋势的线图,以及预测和检验分布类型的概率-概率图(P-P图)等[6]。统计表具有简单、明了、易于理解、便于比较的优点。编制统计表时原则上应当重点突出、层次分明、避免层次过多或结构混乱。一般的统计表应为三线表,表中只有横线,无竖线和斜线。统计表的标目应层次清楚,不宜过于复杂。
3生物医学动物实验的假设检验
生物医学动物实验中最常见的情况是给予不同受试物后进行组间比较,通过统计学中的假设检验,说明受试物的作用。假设检验时应注意以下问题。
检验方法的选用依据
资料的类型和变量的数目不同类型的资料(定量、定性)的组间比较应采用不同的统计检验方法。单变量、多变量的`统计检验方法也各不相同。实验设计类型应该根据实验设计的具体类型选择对应的统计检验方法,以便得到处理组效应的真实结论。检验方法的前提条件选用假设检验方法前,应了解所分析的数据资料是否满足相应检验方法的前提条件,如t检验和方差分析等参数检验方法要求数据满足正态性和方差齐性,2检验要求样本含量大于40且理论频数大于5。
正态性检验及拟合优度检验
统计学假设检验须判定样本的频数分布是否符合某一理论分布,如符合要求就可按此理论分布来进行统计学处理。对正态分布可采用正态性检验,其他分布可用拟合优度检验。通常可通过查阅文献,了解实验参数符合何种理论分布。
方差齐性检验
连续性数据未达到参数法统计分析前提的第二种原因即为方差不齐。一般而言,数值愈大,其固有的变异性也愈大。例如,若某组动物的平均反应值为100,其数值范围可能为80~120;而另一组动物的平均反应值为300,其数值范围可能会扩大至240~360。解决方差不齐的措施是进行数据转换。若数据的标准差与平均值成正比,在统计分析前宜将数据转换为对数值之后再进行分析,据此,不仅数据的变异度与平均值大小无关,同时还可确保其更符合正态分布。若数据变异度增加幅度与平均值的关系不太明显,采用平方根转换则更易使数据的变异度与平均值大小无关。某些数据经对数或平方根转换后可能仍存在方差不齐,此时宜采用非参数检验。
单侧检验与双侧检验
检验假设选择单侧检验或双侧检验,应事先根据专业知识做出选择。一般而言,若研究目的仅须了解是否存在组间差异、实验者无法预测组间变化的方向以及实验者希望获得正负两方面的结果时,应采用双侧检验。若事先可预测组间差异的变化方向,实验者仅对某一方面的重要性感兴趣,实验者仅希望了解与对照组差异或正或负一个方向,则应采用单侧检验。此外,剂量设计预试验中应采用双侧检验,正式试验在了解相关信息后可采用单侧检验。
多重比较及多重性问题
生物医学实验经常在处理组和对照组之间做多个变量的比较。即使不存在真正的实验效应,也有可能纯粹由于偶然性而有一个或多个变量在5%检验水平出现显著性差别。除了上述均数多重比较导致Ⅰ类错误概率增加的多重性问题之外,其他的多重性问题还包括多次的中期分析、关注多个结局、亚组间的多重比较。处理多重性问题的原则包括:①预先计划进行多重比较;②限制比较的次数;③多重比较时采用更严格的界值标准;④多重比较具有生物学方面的依据。
观察值或实验对象的独立性
许多统计检验方法要求比较的观察值或实验对象相互独立,如二项分布的率检验、t检验和方差分析等。但是,有的生物医学实验中观察单位并不独立。例如,生殖和发育研究中就存在窝效应:由于遗传因素、宫内的发育环境和药物的代谢环境相似,与异窝胎仔相比,同窝胎仔之间对毒性效应的反应概率趋于系统,即同窝内数据为聚集性数据,这就是一种常见的非独立数据。在统计学分析时,忽略数据的窝内相关性具有潜在的风险;因同窝母鼠所产k个胎仔的观察值存在共性,其所提供的信息不及k个独立的来自不同母鼠所产胎仔所提供的信息;窝内相关性愈大,其信息量愈少。聚集性数据的均数标准误小于独立的数据,因此,若基于观察值独立的统计分析方法,就会增加犯Ⅰ类错误的概率,即假阳性的风险增加,降低实验的有效性。
历史对照数据的应用
某些情况下,尤其是在发生率较低的情况下,单项研究可能提示处理可影响肿瘤发生率,但无法得出明确的结论。可能想到的分析办法之一是将处理组的数据与来自其他研究的对照组动物相比较。虽然历史对照数据具有重要意义,但值得强调的是,众多原因可导致不同研究之间的变异度大于研究之内的变异度。动物来源、饲料及饲养条件,研究期限,研究中的动物死亡率、读片的病理学家等均可能影响最终的肿瘤发生率。故此,忽视这些差异,将处理组的肿瘤发生率与合并的对照组发生率相比较,可能得出严重错误的结果,并进而明显夸大统计显著性水平。Tarone[4]曾对历史对照组的比率数据分析进行过综述。
假设检验的局限性
首先,假设检验中的P值并未提供有关处理诱发效应大小的直接信息。某一受试物可诱发一定量的、反应的增加,但增加的幅度是否具有统计显著性则取决于研究的规模和数据的变异性。在规模较小的研究中,有可能错失较大、重要的效应,尤其是在检测终点测量精度不高的情况下。相反,在规模较大的研究中,较小、非重要的效应则具有统计显著性。例如,D药与C药相比,降血压效应相差近30mmHg,但因为例数仅10例,假设检验未发现显著性差异(P=);相反,B药与A药相比,降血压效应仅相差,但因为例数达500例,假设检验却发现存在显著性差异(P<)。由此可见,统计学显著性与效应大小无直接相关性。因此,愈来愈多的统计学家主张以处理组与对照组差异值的95%置信区间表述处理的效应。据此,若处理反应的增加值为10个单位(95%置信区间3~17单位),则该区间包含真实差异的几率为95%。若置信区间的下限大于零,则双侧检验的P值小于。其次,假设检验无法消除实验设计或实施不当所带来的影响。虽然前述的分层分析等有助于发现真实的差异,但若实验设计存在偏倚,或实验实施过程中存在偏差或失误,假设检验方法一般也于事无补。因此,在生物医学实验过程中应注重对实验设计或实施过程进行严格的质量控制和质量保证措施,强化GLP规范意识。其三,对统计学分析本身的质量控制和质量保证也是确保研究质量的重要环节。所用统计分析软件包应经过充分的认证,以确保分析结果的准确、可靠性。数据的录入、核对和分析结果的报告与归档,均应制订并严格执行相关的标准操作规程。综上所述,在动物实验研究的多个环节,统计学中的相关理论和方法都能够发挥重要作用。统计学不仅可以保证结果的科学性和可靠性,在很多情况下也可以极大地提高研究效率,节约研究成本。在这里还必须强调,除了实验后期的数据分析以外,在实验方案的制定阶段也需要统计学人员的早期介入,这样有助于避免实验设计出现大的偏差和漏洞,有利于研究目标的顺利实现。
发表论文,在实际生活中,是一项硬性指标,大学生发表论文为将来毕业和考研做铺垫,在职人员发表论文,打开了晋级职称的大门。可在实际操作中,由于他们忙于学业、忙于工作
柳叶刀杂志是世界著名的医学外科类杂志。 《柳叶刀》是1823年爱思唯尔(Elsevier)出版公司出版的杂志,部分是由李德·爱思唯尔(ReedElsevier)
随着2015年那场大规模的撤稿事件的全程发酵,论文造假的这个事件也越来越受到相关人员的重视,对于基层一线的医生而言,可能部分医生并不具备识别真假论文的能力,如果
对于广大医务工作者来说,撰写并发表医学科研论文是医学研究工作的重要组成部分,也是医学科技工作者的基本功之一。一篇想要投寄医学科技期刊的文章,必须具备以下几项要素
好的医学论文发表中心是有的,比如“旋威医学编译”,多年的成功经验。