英文摘要书写技巧信 息 来 源:创 新 医 学 网 英文摘要的内容要求与中文摘要一样,包括目的、方法、结果和结论四部分。但是,英文有其自身特点,最主要的是中译英时往往造成所占篇幅较长,同样内容的一段文字,若用英文来描述,其占用的版面可能比中文多一倍。因此,撰写英文摘要更应注意简洁明了,力争用最短的篇幅提供最主要的信息。第一,对所掌握的资料进行精心筛选,不属于上述"四部分"的内容不必写入摘要。第二,对属于"四部分"的内容,也应适当取舍,做到简明扼要,不能包罗万象。比如"目的",在多数标题中就已初步阐明,若无更深一层的目的,摘要完全不必重复叙述;再如"方法",有些在国外可能早已成为常规的方法,在撰写英文摘要时就可仅写出方法名称,而不必一一描述其操作步骤。 中英文摘要的一致性主要是指内容方面的一致性,目前对这个问题的认识存在两个误区,一是认为两个摘要的内容"差不多就行",因此在英文摘要中随意删去中文摘要的重点内容,或随意增补中文摘要所未提及的内容,这样很容易造成文摘重心转移,甚至偏离主题;二是认为英文摘要是中文摘要的硬性对译,对中文摘要中的每一个字都不敢遗漏,这往往使英文摘要用词累赘、重复,显得拖沓、冗长。英文摘要应严格、全面的表达中文摘要的内容,不能随意增删,但这并不意味着一个字也不能改动,具体撰写方式应遵循英文语法修辞规则,符合英文专业术语规范,并照顾到英文的表达习惯。 选择适当的时态和语态,是使摘要符合英文语法修辞规则的前提。通常情况下,摘要中谓语动词的时态和语态都不是通篇一律的,而应根据具体内容而有所变化,否则容易造成理解上的混乱。但这种变化又并非无章可循,其中存在着如下一些规律: 1、时态:大体可概括为以下几点。 1)叙述研究过程,多采用一般过去时。 2)在采用一般过去时叙述研究过程当中提及在此过程之前发生的事,宜采用过去完成时。 3)说明某课题现已取得的成果,宜采用现在完成时。 4)摘要开头表示本文所"报告"或"描述"的内容,以及摘要结尾表示作者所"认为"的观点和"建议"的做法时,可采用一般现在时。
P值是采用假设检验的方法来计算的。举个例子来说明:比较两个样本的均数有没有差别,采用反证法,首先建立假设检验,H0:假设两组没有差别,H1:假设两组有差别。通过假设两组没有差别计算出其没有差别的概率,一般取P<作为临界值,若P<则代表随机抽取的两组均数没有差别的概率小于,为小概率事件,此时拒绝H0,接受H1。P>接受H0。但是P值的大小只能代表两者是否具有统计学差异,不能代表差异的大小。详细的计算方法要根据你采用的统计学方法具体计算,现在这步一般都采用统计软件SPSS、SAS等来完成。希望对你有所帮助。
要求 1.简明扼要(short and concise) (1)尽量控制在一行,但不是一个句子 (2)不超过25个单词或120-140个字母 (3)除DNA、RNA、CT等不用缩写 2.信息丰富(informative) 3.便于索引(indexing) 4.较长标题可采用副标题
医学论文书写格式正文是医学论文的核心部分,包括引言、材料与方法、结果、讨论、致谢五部分。一、 引言引言(前言、导言、绪言、序言)是正文的引子,相当于演说中的开场白。国内刊物引言部分不需另立标题。引言应当对正文起到提纲挈领和引导阅读兴趣的作用。在写引言之前首先应明确几个基本问题:你想通过本文说明什么问题?它是否值得说明?本文将在什么杂志发表或本文的读者是什么人?在写引言乃至整篇论文时都应注意这几个问题。引言在内容上应包括:为什么要进行这项研究?立题的理论或实践依据是什么?拟创新点何在?理论与(或)实践意义是什么?告诉读者你为什么要进行这项研究是引言的主要内容和目的,这其中也包括说明这项研究的理论和(或)实践意义。语句要简洁、开门见山,如“重型继发性脑室出血临床表现严重,预后差,病死率高。本文着重探讨用双侧侧脑室穿剌交替引流尿激酶溶解血凝块冲洗结合腰穿脑脊液置换的方法治疗重型继发性脑室出血”。有时我们研究的项目是别人从未开展过的,这时创新性是显而易见的,如“左旋咪唑所至脑病患者的临床与CT表现国内陆续有报道,但未见磁共振成像的研究”。大部分情况下,我们所研究的项目是前人开展过的,这时说明你的研究与别人的研究的本质区别和创新点是至关重要的,如“已有数项研究探讨了阿斯匹林在缺血性脑卒中的应用,但这些研究均是小规模、非双盲对照的。本研究则采用双盲对照的方法,样本大、观察时间长”。在引言中对与本文相关的研究作一简要的回顾是十分必要的。在研究开始以前就应该对与本研究相关的内容作一系统的回顾,在引言中可以将回顾的结果作简要的概括。引言的写作在包括上述内容的同时要注意以下事项:①内容切忌空泛,篇幅不宜过长。回顾历史择其要点,背景动态只要概括几句即可,引用参考文献不宜过多。根据以往的经验,一篇3000~5000字的论文引言字数在150~250字较为恰当。②不必强调过去的工作成就。回顾作者以往的工作只是为了交待此次写作的基础和动机,而不是写总结。评价论文的价值要恰如其分,实事求是,慎用“首创”、“首次发现”、“达到国际一流水平”、“填补了国内空白”等提法。因为首创必须有确切的资料。对此,可以用相对较委婉的说法表达,如“就所查文献,未见报道”等。③不要重复教科书或众所周知的内容。如在讨论维生素D是否能预防骨质疏松的文章中,没有必要再说明什么是维生素D,什么是骨质疏松。④引言只起引导作用,可以说明研究的设计,但不要涉及本研究的数据、结果和结论,少与提要和正文重复。结果是通过实验或临床观察所得,而结论是在结果的基础上逻辑推理提升的见解。在引言中即对结论加以肯定或否定是不合逻辑的。⑤引言一般不另列序号及标题。二、 材料与方法材料与方法主要是说明研究所用的材料、方法和研究的基本过程,它回答“怎样做”的问题,起承上启下的作用。材料是表现研究主题的实物依据,方法是指完成研究主题的手段。材料与方法是科技论文的基础,是判断论文科学性、先进性的主要依据。它可以使读者了解研究的可靠性,也为别人重复此项研究提供资料。材料与方法的标题因研究的类型不同而略有差别,调查研究常改为“对象与方法”,临床试验则用“病例与方法”。不同类型研究的材料与方法的写作也不完全一样。实验研究要交待实验条件和实验方法。①实验条件包括实验动物的来源、种系、性别、年龄、体重、健康状况、选择标准、分组方法、麻醉与手术方法、标本制备过程以及实验环境和饲养条件等。②实验方法包括所用仪器设备及规格、试剂、操作方法。③试剂如系常规试剂,则说明名称、生产厂家、规格、批号即可;如系新试剂,还要写出分子式和结构式;若需配制,则应交待配方和制备方法。④操作方法如属前人用过的,众所周知的,只要交待名称即可;如系较新的方法,则应说明出处并提供参考文献;对某方法进行了改进,则要交待修改的根据和内容;对创新的方法,要注意不要将新方法的介绍和运用该方法研究的新问题混在一篇论文中,若论文系报道新方法,则应详细的介绍试剂的配置和操作的具体步骤,以便他人学习和推广。临床研究的对象是病人,应说明来自住院或门诊,同时必须将病例数、性别、年龄、职业、病因、病程、病理诊断依据、分组标准、疾病的诊断分型标准、病情和疗效判断依据、观察方法及指标等情况作简要说明。上述内容可根据研究的具体情况加以选择说明,并突出重点。①对研究新诊断方法的论文,要注意交代受试对象是否包括了各类不同患者(病情轻重、有无合并症、诊疗经过等),受试对象及对照者的来源(如不同级别的医院某病患病率及就诊率可能不同),正常值如何规定,该诊断方法如何具体进行等等。②研究疾病临床经过及预后的论文,要注意说明病人是在病程的哪一阶段接受治疗,病人的转诊情况,是否制定了观察疾病结果的客观标准。③病因学研究论文则要交代所用研究设计方法(如临床随机试验、队列研究等),是否做剂量-效应观察。④对临床疗效观察研究来说,主要说明病例选择标准,病例的一般资料(如年龄、性别、病情轻重等),分组原则与样本分配方法(配对、配伍或完全随机),疗效观察指标和疗效标准。⑤治疗方法如系手术,应注明手术名称、术式、麻醉方法等;如系药物治疗则应注明药物的名称(一般用学名而不用商品名)、来源(包括批号)、剂量、施加途径与手段、疗程,中草药还应注明产地与制剂方法。在材料与方法中,还应简要的说明在什么条件下使用何种统计处理方法与显著性标准,必要时应说明计算手段和软件名称。三、 结果将实验或临床观察所得数据或资料进行审核,去伪存真,再对其原始数据进行分析归纳和统计学处理就可以得出研究的结果。结果是科研论文的核心部分,科研的成败与否是根据结果来判断的,结论与推论亦由结果导出。结果部分最能体现论文的学术水平和理论与实用价值。因此,对于这一部分的写作要特别重视。结果部分的写作要做到指标明确可靠,数据准确无误,文字描述言简意赅,图表设计正确合理。结果的具体内容取决于文章的主体。结果的内容包括记录实验或临床观察的客观事实、测定的数据、导出的公式、典型病例、取得的图像等等,但不同类型文章结果的内容应有不同的侧重点。①如研究新诊断方法的论文,要特别注意交代试验结果是否与公认的金标准进行独立的“盲法”比较,其符合程度如何,敏感性、特异性、阳性预测值、阴性预测值各多少等。②研究疾病临床经过的论文,要特别交代是否对所有病例进行了随访,随访率有多高(一般应大于80%),对影响预后的外加因素有无进行调整,结果如何等。③病因学研究的文章要特别注意交代暴露组与非暴露组结果的差异程度,所得结果是否出现于暴露之后等等。未经统计学处理的实验观察记录叫原始数据。统计学处理的目的是使难以理解的原始数据变得易于理解,并从原始数据的偶然性中揭示某种必然规律。因此,实验结果的表达一般使用统计量而不使用原始数据,也不必将原始数据全部端出。计数资料可用相对数如百分率,但当样本数小于100时,则应在百分率后加括弧,在括弧内标明反应数/样本数,如(37/68)。计量资料如符合正态分布,应用均值+标准差(或标准误),如呈偏态分布,一般采用中位数和全距表示。如进行前后或组间比较,应说明统计检验的值(如t、u、F等)和P值。关于统计学处理的具体操作详见统计学专著,这里不作详解。关于统计名词及符号应根据中华人民共和国国家标准GB3358-82有关“统计名词及符号”的规定。结果的表达通常通过文字、图、表相互结合来完成。下列情况可用文字表达为主或仅用文字表达:①结果中数据较少,能作同类比较的观测项目不多者。②以观察形态特征为主的论文一般不用表格,而以文字描述为主配合形态学图片。能用文字表达的内容不用列表、绘图。已用图表说明了的内容,不必再用文字详述,只要强调或概括重点。文字表达主要是陈述本文取得的结果,不必强调过程,也不要重复“材料与方法”等项交待的资料,更不要将结果提升为理论上的结论,所以一般不引用文献。表与图设计的基本要求是正确合理,简明清晰。“自明性”(self-explanatoriness)是衡量表图的重要标志。所谓“自明性”是指仅通过表与图就能大体了解研究的内容和结果。表是简明的、规范化的科学用语。一般主张采用三线式表,即表由顶线、标目线、和底线这三条横线组成框架,两侧应是开口的。顶线与标目之间为栏头,标目与底线之间为表身。栏头左上角不用斜线,但栏头允许在设一条至数条横线。一般表的行头标示组别,栏头标示反应指标。但这种划分并不是固定的,著者可根据情况灵活安排。表的下方还可以加脚注。图是一种形象化的表达方式,它可以直观的表达研究的结果。通常我们用柱图的高度表达非连续性资料的大小,用线图、直方图或散点图表达连续性或计量资料的变化,用点图表示双变量的关系。图的标题应在图的下方,注释可放在柱或线附近。对于既可用图也可以用表的资料,可根据具体情况选择表达形式。一般的说,主要是表示变化趋势的资料,尤其是连续的动态资料,宜采用图的形式;需表示确切统计量的资料,宜采用表的形式。结果的写作一定要采取实事求是的科学态度,遵守全面性和真实性的原则。实验结果无论是成功或失败,只要是真实的就是有价值的。切不可对实验数据任意增删、篡改,以符合“正常”结果。这不利于我们全面认识事物和发现新问题。临床疗效的论文往往在描述大体结果后附以典型病例,可以起到举一反三的作用。目前认为,对于某些新发现的疾病(如艾滋病)或罕见病的疗效研究,附以典型病例是必要的。但对于常见病和多发病,则不必例举典型病例。但同样是常见病和多发病,如是介绍新疗法和技术时则要附典型病例。典型病例要选有代表性的,例如说某药治疗某病有效,典型病例最好选单独使用该药治疗显效的病例,而不要选用合并使用了其他可能也有疗效的药物的病例。四、 讨论讨论是论文的精华部分,是对引言所提出的问题的回答,是将研究结果表象的感性认识升华为本质的理性认识。在讨论中作者通过对研究结果的思考、理论分析和科学推论,阐明事物的内部联系和发展规律,从深度和广度两方面丰富和提高对研究结果的认识。讨论水平的高低取决于作者的理论水平、学术素养以及专业知识的深、广度。讨论的内容大致包括以下几个方面:①简要的概述国内外对本课题的研究近况,以及本研究的结论和结果与国际、国内先进水平相比居于什么地位。②根据研究的目的阐明本研究结果的理论意义和实践意义。③着重说明本文创新点所在,以及本研究结果从哪些方面支持创新点。④对本研究的限度、缺点、疑点等加以分析和解释,说明偶然性和必然性。⑤说明本文未能解决的问题,提出今后研究的方向与问题。并不是每篇论文都必须包括以上内容,应从论文的研究目的出发,突出重点,紧扣论题。讨论是最能体现论文水平的部分,也是写作难度较高的部分。对于初写着来说,要特别注意以下几点:①讨论是作者阐明自己的学术观点,但并不等于是自由论坛,不能泛泛而谈。讨论的内容要从论文的研究结果出发,围绕创新点与结论展开,要做到层次清晰、主次分明,不要在次要问题浪费笔墨冲淡主题。与文献一致处可一笔带过,重点讨论不一致处;引证必要的文献,切忌作文献综述。②实事求是、恰如其分的评价,不乱下结论,切忌推理过分外延。医学中尚有许多尚未阐明的问题,所以推理应非常谨慎,通常冠以“可能”等。③任何研究都有其局限性,如国内的研究结果有待国外验证;体外试验有待于体内试验验证。因此,讨论要坚持一分为二的观点,对于与他人研究结果不一致处要认真分析原因,要抱有虚心追求真理的态度与其他作者商摧,切勿持“唯我正确”的态度。④并非每篇论文都要有讨论,有的短篇可不写。若结果与讨论关系密切则可放在一起写,合称结果与分析等。五、 致谢科研工作的顺利完成离不开他人的帮助,在正文的最后应向对本研究提供过帮助的人致以谢意。致谢的对象包括:对研究工作提出指导性建议者,论文审阅者,资料提供者,技术协作者,帮助统计者,为本文绘制图表者,提供样品、材料、设备以及其他方便者。致谢必须实事求是,应防止剽窃掠美之嫌,也勿强加于人,如未经允许写上专家、教授的名字,以示审阅来抬高自己。致谢一般要说明被谢者的工作的内容,如“技术指导”、“收集资料”、“提供资料”等。参考文献是论文中某些观点、数据、资料和方法的出处,应于文章的最后一一列出,以便读者参阅、查找有关文献。它表明了论文的科学依据和历史背景,提示了本文是在前人工作基础上的创新,即表示了对他人研究成果的尊重,又反映了论文起点的高低。著录文献总的原则是准确、完备、规范、便于检索。对于著录文献的要求有:①一定是作者亲自阅读过全文的文献。如阅读的只是摘要,则不应列为参考文献。②参考文献的数量要适度。参考文献不是越多越好,应当有所选择。一般来说,课题提出的根据,主要实验方法,提示支持本文的资料和不支持本文的资料,均应列出参考文献。关于参考文献的数目,各杂志要求不一,一般论文的参考文献篇数为10篇左右,综述为20篇左右。③参考文献应尽量引用最新的,因为新文献必然包括老文献,以近1~2年以内的为好,少用旧的、年限长的文献。教科书的内容亦不宜列为参考文献,因为它的内容已是众所周知的。④引用的参考文献应以已发表的原著为主,未发表的论文及资料、译文、转载和内部资料等,均不能作为参考文献被引用。未发表,但以被刊物通知采用者,可以引用,但英在刊名后注明“待发表”。《国外医学》所刊内容都是经人加工的二手资料,一般不能作为参考文献被引用。同样,综述性文章不宜作为参考文献,但是如果综述中介绍了尚未在其他杂志上发表过的最新观点时,也可列为参考文献。⑤被引用的中医经典著作,不列入参考文献,而是在正文所引段落尾注明出处。关于参考文献的书写格式,目前有两种标准。一种是国际通用的温哥华式,另一种是国家标准GB7714-87关于《文后参考文献著录规则》的规定。但不同杂志对于参考文献的格式可能有不同的要求,在附参考文献时可参照以上两种标准和各杂志的要求。国际标准和国家标准都采取了顺序编码制,即参考文献的著录按其在文中出现的先后顺序,用阿拉伯数字连续编号,附于正文引文句末右上角方括弧内。引文写出原著者,序号标在著者的右上角,如×××等[4];如未写著者姓名,则序号应方在引文之后;如果参考文献序号作为句子的组成部分,则不作角码,如……参照文献[6];引用多篇文献时,将每篇文献的序号列出,中间以逗号相隔,如××[1,4,5];若序号连续,则只标注起止序号,中间加“~”。文后参考文献列表中各条文献的序号不加括弧,也不加“.”,只空1个字符。国内标准与国际标准(温哥华式)大致上是一致的,本文主要介绍一下目前使用最广泛的温哥华式的写作要求。期刊的著录格式一般为:作者.文题.刊名,出版年份,卷次(期次):起止页.。作者在6人或6人以内者全部列出姓名,相互之间加一逗号;6人以上者仅列前3位,后加“等”或“et al”。(国内一般只列前3位作者。)例:陈治.多发行肌炎与皮肌炎.临床神经病学杂志,1992,5:117-119.书籍与专著的著录格式为:作者.书名.版次.出版地:出版者,出版年,起止页.。例:吴恩惠主编.头部CT诊断学.第二版.北京:人民卫生出版社,40-168.
P值是衡量控制组与实验组差异大小的指标,*意思是P值小于.05,表示两组存在显著差异,**意思是P值小于.01,表示两组的差异极其显著,这个可以用SPSS统计,根据你的描述自变量应该是果蝇的性别(雌还是雄),因变量应该是寿命,自变量是名义变量,因变量是连续变量,所以用单因素方差分析就可以得出结果了。。。另外,在统计解释时一般不看F值,只需要看P值就可以了,但是在写论文时还是要将F值写出来,并把P值放在后面用括号括起来。
1 出版时间 一般情况下,2个月内即可通知作者稿件是否被录用。评审通过的稿件3~10个月内(自稿件收到之日算起)刊出。2 投稿要求 来稿应具先进性、新颖性和科学性,要求资料真实、数据可靠、论点明确、结构 严谨,文字通顺、精炼,标点符号准确。 述评、综述、进展、论著(包括摘要、图表及参考文献)一般不超过4000字,简报、论著摘要、病例报告等以800~1500字为宜。 来稿须附第一作者主管单位正式介绍信,作者单位应对稿件内容的真实性和保密性负责,确认无署名纠纷、无一稿两投或多投。获得基金资助的论文需注明基金中英文名称及编号。 文稿应隔行打印,一式两份并注意大小写、正斜体及上下角标注等。 请为本刊推荐2~4名可以评审所投稿件的审稿专家,并注明联系方式。 接到回执后2个月未收到任何处理意见,说明稿件仍在审理当中;欲另投他刊请务必与本部联系,切忌一稿两投。 根据著作权法,来稿一律文责自负,本刊对稿件有删改权,凡涉及原意的修改将征得作者同意。修改稿逾3个月不返回本部者视自动退稿。 稿件决定刊用后根据所占版面收取版面费,刊出后酌致稿酬,论著类文稿另赠当期学报1本及单行本25份。来稿请自留底稿,不拟刊用的稿件将退还作者。 稿件接受后,所有作者须签署“著作权专有许可使用授权书”。中国医学科学院 中国协和医科大学对授权文章具有汇编权(文章的部分或全部)、印刷版和电子版的复制权、翻译权、网络传播权、发行权及许可文献检索系统或数据库收录权。3 撰稿要求 题名(篇名) 题名应选用恰当、简洁的短语反映论文的中心内容,除公知公用者外,尽量不用外文缩略语。中文题名一般不宜超过20个汉字,英文题名不宜超过10个实词。中、英文题名含义应一致。尽量不设副题名。 署名 署名作者只限于参与研究课题设计、直接参加全部或主要部分研究工作、做出主要贡献、参加论文撰写并能对内容负责,同时对论文具有答辩能力的人员。如有外籍作者,应附其本人同意发表的书面材料。注明通信作者(用#标注),并在篇首页脚注注明其电话号码、传真号码及E-mail地址。外单位作者应标明其工作单位全称及科室名称及城市名。第一作者单位包括工作单位全称及科室名称、城市名及邮政编码。英文摘要中的作者单位著录项目应与中文一致,并应在邮政编码后加注国名“China”。 摘要 论著、述评及综述应附中英文摘要。论著采用结构式摘要,即按照目的(Objective)、方法(Methods)、结果(Results)、结论(Conclusions)4部分撰写。内容应具独立性和自明性,具有与正文同等量的主要信息。结果部分要求有具体数据、统计学显著性检验的确切值,可信区间等实质内容。中文摘要不超过300个汉字,英文摘要可详细些。述评和综述采用报道性摘要。英文摘要置于中文摘要下方。 关键词 根据论文所讨论的重点内容标出3~8个关键词, 中、英文关键词应一致。 中图号 按照《中国图书资料分类法》(科学技术文献出版社)标引论文分类号。作者可根据论文所涉及的学科范畴标引1~3个分类号。 脚注 在篇首页用短横线与正文分开,说明: 论文所受资助的课题基金来源(中英文)及编号; 合作者的单位、城市名与邮政编码(英文); 通信作者及其电话、传真号码和E-mail地址(英文)。 正文 格式和层次结构:论著、研究报告可按照前言、材料和方法、结果、讨论4部分撰写。 各层次标题应简短明确,同一级标题应反映同一层次的内容。 前言:简要介绍立题的目的、历史背景或理论依据、研究设想、意义。仅需提供与研究 主题紧密相关的参考文献,切忌写成文献综述。不要涉及本研究中的数据或结论。一般不宜超过250个汉字。 材料和方法:扼要叙述研究对象的特征,主要实验材料的来源、性质及数量,仪器设备 (包括厂家、型号)等实验条件。采用他人方法,引用文献即可;详述创新的方法及改良方 法的改进之处。要求所有方法均可重复验证。说明统计学方法、选择依据及所使用的统计学软件的版本。涉及患者隐私权的临床研究,需征得患者本人或其亲属知情同意,必要时需 通过有关伦理道德委员会审批。 结果:应客观、真实、准确地描述研究所得到的数据和所观察的现象。所有数据均需经 统计学处理。可用文字、图和表表达,但三者不应重复。不展开论证,不引证他人资料。 讨论:围绕研究结果着重阐述研究结果的意义,实事求是地评价其科学价值并可与前人 的有关结果进行比较论证,探讨尚无定论之处。客观真实地解释研究中出现的问题,总结经 验教训。切忌偏离研究结果地罗列资料或重述研究结果。图表 凡可用文字说明者,均不用图表。图、表应具有自明性。每个图表均应有图表题,图表题采用中、英文两种文字,图表内文字、说明及注释仅用英文。图表序号一律用阿拉伯数字表示,只有一个图或一个表时,应标注为“图1”或“表1”。图:图不宜过大,双栏不超过 cm,通栏不超过 cm。图、图题及说明应另纸绘 制和书写,图中文字、字母、数字和符号应清晰、匀整,大小以缩图后清晰易辨为宜。黑白 照片必须反差鲜明,大体照片应有图内标记尺度,显微照片须注明染色方法和放大倍数。 表:表一律采用“三线表”,取消表中竖线。表内参数单位相同者,将单位置于表的右 上方;各栏参数单位不同者,可将单位放于各相应栏目的表头或数值旁。医药学名词 以全国科学技术名词审定委员会公布的各学科名词(科学出版社,1995年)为准。暂无通用译名的名词术语第一次出现时应注明原词或注释,药名(包括中药)以《中华人民共和国药典》最新版本和中国药典委员会编写的《中国药品通用名称》为准,中草药一律加注学名。中文药物名称须使用其通用名称,不得使用商品名。动植物学名应加注标准学名。以上须排斜体字者,在字下加划一条横线。缩略语 题名一般不用缩略语,正文及摘要中的缩略语,应于首次出现处写出全称并加括号。 简化字及标点符号 简化字按照国务院1986年10月15日公布的《简化字总表》规定书写,通常可参照《新华字典》。标点符号以国家标准GB/T15834-1995《标点符号用法》为准。除半字线连字号、长横连字号分别占半格、一格,破折号、省略号不得断开占两格外,每个标点符号占一格。点号和标号的后一半不应出现在一行之首,标号的前一半不应出现在一行之末。 计量单位 按照国务院1984年2月颁布的《中华人民共和国法定计量单位》和2001年中华医学杂志社编写的《法定计量单位在医学上的应用》第3版(人民军医出版社),贯彻国家标准GB 3100~3102-1993《量和单位的规定》,正确使用、书写量和单位的名称和符号,如浓度单位用mo1/L,不再用M;放射性活度单位要换算成Bq,不用Ci等。不再使用分子量dalton和kd,而用相对分子质量Mr。单位符号中表示相除的斜线不得多于一条,也不可混用斜线和负指数幂。不能错把英文缩写cpm、ppb、pphm、ppm、ppt、rpm等作为计量单位使用。血压单位仍使用mm Hg,但在文中第一次出现时应注明与kPa(千帕斯卡)的换算系数。 统计学符号 按国家标准GB3358-1982《统计学名词及符号》的规定书写。统计学符号一般用斜体,但有大小写之分, 如t检验、n(样本大小)、x(样本的算术平均数)、s(标准差)、sx(标准误)、r(相关系数)、x±s(均数士标准差)、x±sx(均数士标准误)等用英文小写,F检验、P值、Q值、M(中位数)等用英文大写,卡方检验和自由度分别用希腊文χ2和υ表示。 数字 凡可使用阿拉伯数字且得体的地方均应使用阿拉伯数字。其使用规则如下: 计量和计数单位前的数字必须使用阿拉伯数字; 多位数字不能拆开转行; 小数点前后4位或多于4位,应分别向左或右每3位空1/4字距,不再用千分撇; 尾数“0”多的5位以上数字,可写为以万和亿为单位的数。 时间:公历世纪、年代、年、月、日、时间和时刻必须用阿拉伯数字。年份用四位数 表示,不能简写,如1997年不能写成97年;日期可采用全数字式写法,如19990228或1999 -02-18或19990218;时刻按GB/T 7408-94规定的写法,如18时20分15秒,写成18:20:15。 数值的修约:不能简单地采用“四舍五入”,应执行国家标准GB 3101-93附录B的 规定,其简明口诀是“4舍6入5看齐,5后有数进上去,尾数为零向左看,左数奇进偶舍 弃”。 参数与偏差范围: 数值范围:5至10写为5~10;5万至10万写为5万~10万, 不能写成5~10万; 百分数范围:要用20%~30%,不能写成20~30%;百分率偏差 应写成(80士5)%,不能写成80%士5%或80士5%;百分数系列不可省略,如60%、 70%、80%不能写成60、70、80%; 有相同单位的量值范围:~不必写成 ~; 偏差范围:(士)岁,不能写成士岁。 系列数值的单位:系列数值的单位相同时,中间数字的单位可省略, 如10、15、20 m1。 附带长度单位的数值:每个数值后的单位不能省略, 如50mm×80mm×100mm,不能 写成50×80×100mm3。分数:分数的分号用斜线表示,如2/3,数学公式例外。 检验结果构成比:统一用小数表示,不用百分数,如白细胞分类中的中性粒细胞占75 %,应写成。 志谢 用括号置于正文后,参考文献前。对参加过部分工作的人员、承担实验工作的人员、提供工作方便的人员,以及给予指导、提供资助的个人团体表示感谢。文字力求简练,评价得当,原则上应征得志谢对象的同意。 参考文献 采用顺序编码制,按照引文先后顺序,用阿拉伯数字连续编号。在正文引出处加方括号标注在句尾右上角,或标注在引文作者的右上角。论著的参考文献仅限作者亲自阅读过的主要文献,近5年的文献应占50%。内部资料、鉴定资料、个人通信、报纸、待发表及未公开发表的文章不得作为参考文献引用。文摘、综述等二、三次文献尽量不引用。作者须仔细核对所引参考文献以保证各项内容准确无误。本刊参考文献著录格式如下: [期刊]作者(3名及3名以内全部著录;多于3名者仅著录前3名,后加“等”或“et al).文献题名. 刊名,年,卷(期):起止页.例:陈杰,谢永强,张宏图,等. SARS尸检的肺部病理改变.中国医学科学院学报,2003,25(3) :360-362.例:Peiris JS, Lai ST, Poon LL, et a1.Coronavirus as a possible cause of severe acute respiratory syndrome. Lancet, 2003,361(9366): [书籍] 作者. 书籍名. 版本(第一版可省略). 出版地:出版者,出版年.起止页.例:吴冠云,方福德. 基因诊断技术及应用. 北京:北京医科大学 中国协和医科大学联合出版社,.例:Willis R. Patho1ogy of tumors. 4th ed. London:Batterrworths,. 「书籍中析出文献」作者. 题名. 见:作(编)者. 书籍名. 版本(第一版可省略). 出版地:出版者,出版年. 起止页. 例:郭俊渊. 胆道系统、肝脏、胰腺. 见:吴恩惠主编. 放射诊断学. 第2版. 北京:人民卫生出版社,.例:Stoff JS, Clive DM. Role of arachidonic acid metabolites in acute renal failure. In: Brenner BM, Lazarus JM, eds. Acute renal failure. 2nd ed. New York:Churchill Livingstone, .
缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。
1. 关于P值的理解
P值可以理解为结论的风险大小,也就是数据得出的结果有多大的错误风险。P值越小,结论错误的风险越小,即结论越可靠;P值越大,错误的风险越大,即结论的可靠性差。P值是对已有结果的错误风险判断,与结果大小无关。目前不少医学杂志上仍然存在着关于P值的不规范用语,如P≤认为“差异显著”,P≤认为“差异非常显著”等。不要将P值大小与实际差异大小联系起来。这是一个值得注意的地方。
统计学中普遍以作为假设检验的检验水准,这在手工计算的时代无疑是十分方便的。但到了计算机发达的今天,我们已经可以很轻松地计算出确切的P值,仅以P≤认为有统计学意义已经不符合潮流了。P值等于和等于有什么差别呢?无非就是比多了支持结论的证据,但是少了这的证据就没有意义了吗?因此,最好给出确切的P值,以便展示更多的信息。
2. 关于significant的理解
很多书通常将significant翻译为“显著的”,这一词很容易让人将其与实际差别大小联系起来。实际上significant的含义应该是“非偶然的”,当根据样本资料所得结果是significant,实际上表明这一结果“不是偶然”得到的,更可能是真实存在这样一种结果。如显著性水准设为,则P≤表示根据样本数据计算的统计量只有不到5%的可能是偶然(也可以理解为抽样误差造成的)造成的,反过来,计算的统计量不大可能是偶然造成的,而更有可能是真实的情况。
3. 统计学意义与实际意义
当统计学分析结果显示P≤时,我们的结论应该写为“组间差异有统计学意义”、“相关性有统计学意“、“影响有统计学意义”等,而不应该直接写成“组间有差异”、“变量间有相关”、“变量有影响”等。统计学结论与实际结论不同,它仅反映了从样本数据得到当前结果不是偶然的,但不反映实际结果的大小。
理论上,样本含量越大,越有可能得到小的P值。即使实际差别很小,大样本所得的P值也可能很小,于是问题来了:有的人便认为统计学是数字游戏。实际上并非如此,大样本P值很小,表明大样本的结果更为稳定可靠,恰恰反映了统计学的严谨性。比如某医生治愈1人,他据此宣称治愈率为100%,你会相信吗?但如果他治疗10000人仍然全部治愈,那他说治愈率100%,你会不会更相信?关键的问题是,当增加样本的时候,是不是还会保持原来的结果。治疗1人可以治愈,治疗第二个人一定会治愈吗?如果不断增加样本,结果仍然不变,统计学就会认为这种建立在大样本基础上的结果是可靠的,而不是偶然的,就会给出一个小P值。如果小样本的结果发现有差异,统计学会认为基于小样本的差异不一定可靠,因此会给出一个较大的P值,以提醒研究者谨慎下结论。
4. 单侧检验与双侧检验
单侧和双侧检验多用于组间比较。如果比较A、B两种药物的疗效,如果预期B药不可能不如A药,则可以采用单侧检验。这种情形也常用于新药与安慰剂比较。预期药物疗效不可能比安慰剂差,则可以用单侧检验。如果对两种药的疗效并不确定,B药可能优于A药,也可能劣与A药,则多采用双侧检验。
一般而言,如果事先对A、B两组了解不多,没有足够的证据了解A和B谁大谁小,就可选择双侧检验,如果事先了解谁大谁小,就可以选择单侧检验。值得注意的是:单侧检验和双侧检验的选择必须根据专业在数据分析之前确定。
对于同一资料,单侧检验比双侧检验更容易得到“有统计学意义”的结论,也就是更容易得到阳性结果。因此,切不可得到P值后再返回来选择有利的单侧检验或双侧检验,否则就真的是在玩统计学游戏了。
5. 关于把握度的理解
把握度又称检验效能(power),它表示如果确实有统计学意义的话,按照现有数据能够发现这种统计学意义的概率或把握度有多大。例如:两组比较中,power为,表示如果两组确实有差异的话,那我们在分析中有80%的把握度能够得到”有统计学差异“的结论。
把握度通常用1-β表示,β即犯第二类错误的概率。把握度在平常的统计分析中一般不大为人所重视,但当数据出现阴性结果的时候,你就会发现它的用处了。你可以用把握度判断一下阴性结果是否因为例数太少,如果是,你可以继续增加样本含量,如果不是,那就只好宣布实验结果事与愿违了。
原文: Why Most Published Research Findings Are False 译:张小邪 人们越来越担心的是,目前大多数已发表的研究结果都是错误的。研究主张成立的概率可能取决于研究的功效和偏倚、同一问题上其他研究的数量、以及每个科学领域中所探究的关系中真与假的比例。在这种框架下,当研究领域较小时;当效应值较小时;当被测关系的预选数量更多而预选次数更少时;当设计,定义,结果和分析模式具有更大灵活性时;当存在更大的金钱和其他利益和偏见时;当更多的团队参与科学领域以追求统计学意义时,研究结论就不太可能成立。模拟表明,对于大多数研究设计和设置,研究结论为假可能性更大。此外,对于一些当前科学领域,声称的研究结果可能通常只是对普遍存在的偏倚的准确测量。在本文中,我将讨论这些问题对研究的组织和解释的影响。 不断涌出的证据有时反驳了已发表的研究结果,随之而来的是困惑和失望。从临床试验和传统流行病学研究[1-3]到最现代的分子研究[4,5],研究设计的范围都存在驳斥和争议。越来越多的人担心,在现代研究中,错误的研究结果可能是已发表的研究主张的大多数乃至绝大多数[6-8]。然而,这并不令人惊讶。可以证明,大多数声称的研究结果都是错误的。在此,我将研究影响这一问题的关键因素及其中的一些推论。 几位方法学家指出[9-11],研究结论的非重复(缺乏证实)率高是追求便利的结果,然而,仅仅基于对单个研究在形式上的统计学显著性评估,就得出此研究结果毋庸置疑的结论,这种做法是站不住脚的(形式上的统计显着性,通常指p值小于)。研究结论的真伪并不总是能恰当地用p值(P-Value)表示和概括,但是,不幸的是,有一种普遍的观点认为医学研究文章应仅基于p值进行解释。研究结论在此定义为任何形式上能具有统计显著性的关系,例如有效的干预措施,信息性预报器,风险因素等等。其实 “负面”研究也非常有用。 “负面”实际上是一个误称,而且这种误解很普遍。但是,这里我们只针对研究者声称存在的关系,而不是无效的发现。 It can be proven that most claimed research findings are false. 如前所述,一项研究发现确实为真的概率取决于该事实为真的先验概率、研究的统计能力以及统计显著性水平[10,11]。想象一个2×2的表格,在表格中将研究结果与科学领域中真实关系的黄金标准进行比较。在一个研究领域中,关系存在真和假两种假设。令R为现场测试的“真关系”与“假关系”的数量之比。 R是该领域的特征,它可以有很大的变化,这取决于该领域是以高度可能的关系为目标,还是在可能的数千个假设中只搜索一个或几个真实的关系。为了简化计算,我们也可以认为,在这些领域中,要么只有一个真实的关系(在许多可以被假设的真实关系中),要么在几个现有的真实关系中找到任何一个的功效是相似的。一个关系为真的先验概率为R⁄(R+1)。研究发现真关系的概率反映的是功效1-β(1减去第二类错误率)。当没有一个关系真正存在时,声称关系为真的概率反映了Ⅰ型错误率,α。假设在该领域中正在探究c关系,表1中给出了2×2表的期望值。在基于正式的统计显著性声明了一项研究发现后,得出的结论是后验概率为真的预测值,PPV(positive predictive value)。 PPV也就是Wacholder等人所说的假阳性报告概率的补充概率[10]。根据表1,可以得出PPV =(1-β)R/(R-βR+α)。因此,如果(1-β)R>α,则研究发现更可能为真。通常,由于绝大多数研究者都取α= ,因此这意味着,如果(1-β)R> ,则研究结果更可能是对的。不太容易理解的是,全球各地不同研究人员团队的偏倚和重复进行的独立测试的程度可能会进一步扭曲这一状况,并可能导致研究结果真正属实的可能性更小。我们将尝试在类似的2×2表的环境中对这两个因素进行建模。 首先,让我们将偏倚定义为各种设计,数据,分析和表示因素的组合,这些因素往往会在不应该产生的时候产生研究结果。假设u是那些本不应该成为的 "研究结果",但最终却因为偏倚而呈现和报告为分析结果的比例。即使研究设计,数据,分析和陈述是完美的,也不应将偏倚与机遇变异相混淆,后者有一定概率会导致某些发现是错误的。在分析或报告结果的过程中,偏倚可能导致对分析或报告结果的操纵。断章取义或歪曲事实的报告是这种偏倚的典型形式。我们可以假设u并不取决于是否存在真实的关系。这不是一个不合理的假设,因为通常不可能知道哪些关系确实是真实的。在存在偏倚的情况下(表2),PPV =([1-β] R +uβR)⁄(R +α-βR+ u-uα+uβR),PPV随u的增加而减小,除非1-β ≤α,即在大多数情况下为1-β≤。因此,随着偏倚的增加,研究结论正确的机会将大大减少。图1中显示了针对不同功效水平和针对不同验前比(译者:即R)的情况。 反过来,真正的研究结果有时可能会因为反向偏倚而无效。例如,对于较大的测量误差,关系会在噪音中丢失[12],或调查人员无法有效使用数据,或他们没有注意到统计上显着的关系,或可能存在利益冲突,从而使他们倾向于 "埋没"重要的研究结果[13]。尚无良好的大规模实证证据表明,在不同的研究领域中,这种反向偏倚可能发生的频率有多高。然而,或许可以公平地说,反向偏倚并不常见。此外,测量误差和数据使用效率低下的问题可能正变得不那么频繁,因为随着分子时代技术进步,测量误差已经有所降低,研究者对数据的处理也越来越复杂。无论如何,反向偏倚可以与上面的偏倚相同的方式建模。同样,反向偏倚不应该与机遇变异混为一谈,后者可能会因为机会而错失一段真正的关系。(译者:上一段说偏倚越大,错误结果被认为真的可能性越低。这一段说,偏倚过大,有可能让真正的结果被埋没。) 几个独立的团队可能正在解决同一组研究问题。随着研究工作的全球化,几个研究团队(通常是几十个团队)可能会探索相同或相似的问题,这几乎是一种惯例。不幸的是,在某些领域,到目前为止,主流的心态一直是专注于单个团队的孤立发现,孤立地解释研究实验。至少有一项研究报告宣称有研究结果的问题越来越多,这就使得人们的注意力向这些问题倾斜。在关于同一问题的几项研究中,至少有一项研究声称其研究发现有统计学意义的概率很容易估计。对于n个等功率的独立研究,2×2的表(如表3)所示:PPV=R(1−βn)/(R+1−[1−α]n−Rβn)(不考虑偏倚)。随着独立研究数量的增加,除非1−β<α,即典型的1−β<,否则PPV有下降的趋势。在图2中显示了针对不同功效水平和不同的验前比的情况。对于不同功率的n个研究,在i = 1到n的情况下,βn被βi的乘积所取代,但推论是相似的。方块1中显示了一个实际示例。基于上述考虑,可以得出有关研究发现确实为真的概率的一些有趣的推论。 小样本量意味着较小的功效,对于上述所有函数,真正研究结果的PPV值随功效向1-β= 降低而降低。因此,在其他因素相同的情况下,在进行大研究的科学领域,如心脏病学的随机对照试验(几千名受试者随机化)[14],比起小研究的科学领域,如大多数分子预测因子的研究(样本量小100倍)[15],研究结果更有可能是真实的。 功效也与效应值有关。因此,在效应大的科学领域,如吸烟对癌症或心血管疾病的影响(相对风险3-20),与公认效应较小的科学领域,如多基因疾病的遗传危险因素(相对风险)[7],研究结果更有可能是真实的。现代流行病学越来越被迫以较小的效应规模为目标[16]。因此,真实研究成果的比例预计会下降。按照同样的思路,如果一个科学领域的真实效应值非常小,那么这个领域很可能会受到几乎无处不在的假阳性主张的困扰。例如,如果复杂疾病的大多数真正的遗传或营养决定因素的相对风险低于,那么遗传或营养流行病学的研究将在很大程度上是乌托邦式的。 如上所述,后验概率为真(PPV)在很大程度上取决于验前比(R)。因此,研究结果在验证性设计中,如大型III期随机对照试验或荟萃分析(meta-analyses)等,比起假设生成实验,研究结果更有可能是真的。基于大量经过汇编和测试的信息,被认为具有很高信息量和创造力的领域应具有极低的PPV,如微阵列和其他以发现为导向的高通量研究[4,8,17]。 对于一些研究设计,如随机对照试验[18-20]或荟萃分析[21,22]等,灵活性增加了将 "负面 "结果转化为 "正面 "结果的可能性,即偏倚u。遵循共同的标准很可能会增加真实发现的比例。研究结果也是如此。相较于设计了多种结果(例如精神分裂症结果的量表),当结果是明确和普遍认同的(如死亡),真实的结果可能更常见[23]。类似地,与分析方法仍处于实验阶段(例如,人工智能方法)并且只报告“最佳”结果的领域相比,使用普遍认同的、刻板的分析方法(例如,KaplanMeier曲线图和对数秩检验)的领域[24]可能产生更大比例的真实结果。不管怎么说,即使在最严格的研究设计中,偏倚似乎也是一个主要问题。例如,有强有力的证据表明,选择性结果报告,对报告的结果和分析进行操纵,即使对于随机试验也是一个常见的问题[25]。仅仅取消有选择的出版,并不能使这个问题消失。 利益冲突和偏见可能会增加偏倚u。利益冲突在生物医学研究中非常常见[26],虽然通常它们的报道不足且数量较少[26,27]。偏见不一定有经济根源。某一特定领域的科学家可能纯粹因为相信科学理论或致力于一己的发现而产生偏见。许多看似独立的、以大学为基础的研究可能只是为了给予医生和研究人员晋升或终身教职的资格,而不是出于其他原因。这样的非财务冲突也可能导致报告结果和解释被扭曲。有声望的研究者可能通过同行评审程序压制反驳他们的研究结果出现和传播,从而使他们的研究领域延续错误的教条。经验证据表明,专家意见极不可靠[28]。 这似乎是自相矛盾的推论,因为如上所述,当许多研究人员团队参与同一领域时,个别发现的PPV会降低。这可能解释了为什么在引起广泛关注的领域中,我们因重大发现而兴奋不已时,紧随其后的是深深的失望。随着很多团队挤入同一领域工作,随着大量实验数据的产生,要想击败竞争对手,时机变得至关重要。因此,每个团队可能会优先追求和传播其最令人印象深刻的 "正面 "成果。只有当其他团队在同一问题上找到了“正面”关联时,“负面”结果才可能变得具有传播吸引力。在这种情况下,驳斥一些著名期刊上的说法可能是有吸引力的。有人提出了Proteus现象这个术语来描述这种快速交替出现的极端研究主张和极端相反的反驳现象[29]。经验证据表明,这种极端对立的序列在分子遗传学中非常普遍[29]。 这些推论分别分析了每个因素,但这些因素往往相互影响。例如,在普遍认为真实效应值较小的领域工作的研究者,可能比在普遍认为真实效应值较大的领域工作的研究者更有可能进行大型研究。或者,偏见可能会在一个热门的科学领域盛行,进一步削弱其研究结果的预测价值。持有高度偏见的利益攸关方甚至可能制造障碍,破坏获得、传播相反结果的努力。反过来,一个领域很热门或能吸引浓厚的投资兴趣,有时会促进研究规模的扩大和研究水平的提高,从而提高其研究结果的预测价值。或者,大规模以发现为导向的测试可能会发现大量的重要关系,使研究者有足够的内容汇报及进行进一步的搜索,从而避免了数据挖掘、操纵。 在本文描述的框架中,PPV超过50%是相当困难的。表4提供了针对各种情况(可能是特定研究设计和设置所特有的)针对功效的影响,基于真实与非真实关系的比率和偏倚所开发的公式进行模拟的结果。从一项进行良好、有充分功效、以先验几率为50%(干预有效)开始的随机对照试验中发现,一项发现最终有大约85%的情况下是正确的。对高质量随机试验的验证性荟萃分析预期会有相当相似的表现:潜在的偏倚可能会增加,但与单一的随机试验相比,功效和预检机会更高。相反,如果R≤1:3,来自非结论性研究的荟萃分析结果很可能是错误的。来自功效不足的早期临床试验的研究发现,如果存在偏倚,仅有约四分之一的研究结果可能为真,甚至更少。以探索为导向的流行病学研究表现更差,特别是在功效不足的情况下,但即使功效充足,如果R=1:10,流行病学研究也可能只有五分之一的可能是真的。最后,在以发现为导向的研究中,如果测试的关系超过真实关系的1,000倍(例如,测试了30,000个基因,其中30个基因可能是真正的罪魁祸首)[30,31],即使在实验室和统计方法、结果和报告的标准化程度相当高、偏倚很小的情况下,每个已确认的关系的PPV也非常低。 如前述,大多数现代生物医学研究都是在研究前和研究后获得真实发现的概率非常低的领域进行的。让我们假设,在一个研究领域中,根本没有任何真正的发现。科学史告诉我们,至少根据我们目前的理解,过去科学工作常常浪费在完全没有真正科学信息的领域。在这样的“零场”中,理想情况下,在没有偏倚的情况下,所有观察到的效应大小都会在零场附近偶然变化。观察到的结果偏离预期的程度仅仅是偶然的,这仅仅是对普遍存在的偏倚的纯粹衡量。 例如,让我们假设缺乏营养或饮食习惯实际上是形成特定肿瘤风险的重要决定因素。我们还可以假设,科学文献研究了60种营养素,并声称所有这些营养素都与罹患这种肿瘤的风险有关,而在比较摄入量上限和下限的相对风险在至之间。那么,声称的效应值只是衡量了这些科学文献的产生过程中所涉及的净偏差。其实际上是对净偏差的最准确的估计。甚至可以说,在 "零场"之间,声称效应值更高的领域(往往伴随着医学或公共卫生重要性的声称)只是那些维持了最严重的偏倚的领域。 对于PPV很低的领域,为数不多的真实关系不会对整体情况造成太大扭曲。即使某些关系是正确的,观察到的效应分布的形状仍然可以清楚地衡量该领域所涉及的偏倚。这个概念完全颠覆了我们看待科学成果的方式。传统上,研究人员会兴奋地将巨大而极其重要的影响视为重要发现的迹象。在现代研究的大多数领域中,太大和太显著的影响实际上更有可能是巨大偏倚的迹象。它们应引导研究人员仔细地进行批判性思考,以了解其数据,分析和结果可能出了什么问题。 当然,在任何一个领域工作的研究人员都很可能不愿意接受这样一个事实,那就是,他们的职业生涯所处的整个领域都是一个 “零场”。然而,其他方面的证据,或技术和实验的进步,可能最终会导致一个科学领域的瓦解。衡量一个领域的净偏倚,也可能有助于了解其他领域的偏倚范围,在这些领域中,类似的分析方法、技术和冲突可能会在其他领域中使用。 大多数研究结果都是错误的,这是不可避免的吗?还是我们可以改善这种情况?一个主要的问题是,我们不可能百分之百肯定地知道任何研究问题中的真相是什么。在这方面,纯粹的 "黄金 "标准是无法实现的。然而,有几种方法可以提高后验概率。 提供更有力的证据可能会有所帮助,例如大型研究或低偏倚荟萃分析,因为它更接近未知的“黄金”标准。然而,大型研究仍可能存在偏倚,应该承认并避免这些偏倚。此外,对于当前研究中提出的数百万和数万亿个研究问题,大规模证据是不可能获得的。大规模证据应该针对先验概率已经相当高的研究问题,这样一个重大研究发现会使得后验概率可以被认为是相当确定的。当主要概念而不是狭义的、具体的问题能够得到检验时,也就特别指出了大规模证据的存在。一个否定的结论不仅可以反驳一个具体的建议主张,甚至可以驳斥整个领域或相当一部分的主张。根据狭义标准选择大规模研究的表现,例如特定药物的营销推广,这在很大程度上是浪费研究。此外,人们应该警惕的是,极大规模的研究,也许更有可能为一个与空值没有真正意义上区别的小效应,找到形式上的统计学显著性差异[32-34]。 其次,大多数研究问题都是由多个团队解决的,强调任何一个团队的统计学研究结果都是有误导性的。重要的是证据的整体性。通过提高研究标准和减少偏见来缩小偏倚也可能有所帮助。然而,这可能需要改变科学心态,而这可能很难实现。在一些研究设计中,通过研究的前期注册,如随机试验等,可提高成功的概率[35]。这是因为注册将对假设生成研究构成挑战。在领域内对数据收集或研究人员进行某种注册或联网可能比注册每个假设生成实验更可行。不管怎么说,即使我们在其他领域的研究注册方面没有取得很大的进展,但制定和遵守协议的原则可以从随机对照试验中更广泛地借鉴。 最后,我们不应该追逐统计学上的显著性,而应该提高我们对R值范围(验前比)的理解,这是研究真正能够发挥作用的地方[10]。在进行实验前,研究者应该考虑他们所测试的是真实关系而不是非真实关系的概率。推测的高R值有时会被确定。如上所述,只要在伦理上可以接受,应该对那些被认为是相对成立的研究结果进行偏差最小的大型研究,看看这些研究结果被证实的频率有多高。我怀疑有一些既定的 "经典 "将无法通过检验[36]。 然而,大多数新发现将继续来自验前比很低,甚至非常低的假设生成研究。那么,我们应该承认,单项研究报告中的统计显著性检验仅提供了部分情况,而不知道在报告之外和相关领域内的相关研究中,一共进行了多少检验。尽管有大量的统计文献可以进行多重检验校正[37],但通常情况下,我们不可能知晓报告作者或其他研究团队在报告研究发现之前进行了多少数据挖掘。就算这一点是可行的,我们也无法得知验前比是多少。因此,不可避免的是,人们应该对在相关研究领域和研究设计中被探究的关系中,有多少种关系是真实的,做出大致的假设。我们考虑的范围越广泛,就越有可能在独立研究中为确定验前比提供指导。在其他相邻领域中发现的偏倚经验也将是有益的借鉴。 在其他邻近领域检测到偏倚的经验也将有益于借鉴。尽管这些假设在很大程度上是主观臆断,但它们在解释研究主张并将其置于上下文中仍然非常有用。
医学论文统计学方法应用的错误解析论文
摘 要: 统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性,在研究设计时的错误应用会否决整个科研研究方案,基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用,提高单篇文献的质量和学术水平。
关键词: 统计学方法;医学论文;解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<;,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的'研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
[4] 张春军,董凯.网络信息时代加强医学期刊编辑的信息素养[J].牡丹江医学院学报,2011(32).
采用spss软件,单因素分组对照计算。
t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法
假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
1、t值是t检验的统计量值,t检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。2、F值是F检验的统计量值。F检验是一种在零假设(nullhypothesis,H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。3、P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般以P<为有统计学差异,P<为有显著统计学差异,P<为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于、、。扩展资料:F值和t值是F检验和t检验的统计量值,与它们相对应的概率分布,就是F分布和t分布。统计显著性是出现目前样本这结果的机率。P值代表结果的可信程度,P越大,就越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率,如p=提示样本中变量关联有5%的可能是由于偶然性造成的。参考资料:百度百科——假设检验中的P值百度百科——F检验百度百科——t检验
统计中t值和p值的区别为:
1、t值,指的是T检验,主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
2、P值,就是当原假设为真时,所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。
p值代表的是不接受原假设的最小的显著性水平,可以与选定的显著性水平直接比较。例如取5%的显著性水平,如果P值大于5%,就接受原假设,否则不接受原假设。这样不用计算t值,不用查表。
3、P值能直接跟显著性水平比较;而t值想要跟显著性水平比较,就得换算成P值,或者将显著性水平换算成t值。在相同自由度下,查t表所得t统计量值越大,其尾端概率P越小,两者是此消彼长的关系,但不是直线型负相关。
扩展资料:
1、T检验的适用条件:
(1) 已知一个总体均数;
(2)可得到一个样本均数及该样本标准差;
(3) 样本来自正态或近似正态总体
2、P值数据解释:
参考资料:百度百科_P值百度百科_t检验
t指的是T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。p值就是拒绝原假设的最小alpha值嘛,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值啊,举个例子,比如说算出来的统计量的值为z,服从的是正态分布,如果是双边检验的话那么pvalue=2*(1-probnorm(abs(Z)));单边检验的话,应该是1-probnorm(z)。统计学是在统计实践的基础上,它是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据。统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。
p就是犯第一类错误的概率,即原假设为真,被拒绝的概率,一般控制其小于因为在医学中,我们宁可犯第一类错误,即原假设为真,被拒绝的概率,也不能容忍接收一个错误的假设
你把各组30例原始数据拿来可以直接统计分析,你所给的数据不能分析。