根据韦氏词典的定义,介词是“ a word or group of words that combines with a noun or pronoun to form a phrase that usually acts as an adverb, adjective, or noun”, 用中文理解就是“与名词或代词相结合使用的一个词或一组词,所形成的短语通常充当副词、形容词或名词使用”。这种定义人们可能听到过很多次,但可能还是不太清楚究竟什么是介词,以及为什么在英语写作时不能忽略这些令人困惑的词,如何才能避免将它们弄混。 本文阐述介词在句子中的功能,以及为了确保英语写作正确清晰所应避免的常见错误。本文还针对介词的用法提供常用表达方式列表,供学术论文的作者在校对手稿时参考。 介词究竟做什么用? 介词用于其他单词或短语之间,告诉读者:某人或某事与其他人或事之间的位置关系,某人对某事或其他人做了什么,人与事物如何联系等。设想一下如果只用名词和代词造句,省略所有介词,而理由只是因为介词令人困惑不好用,而你又不想选错介词,所以干脆弃之不用。那么,你这样写出来或说出来的句子就是: “ I put the book the table noon. ” 为了掌握介词的用法,我们仔细分析一下这句话究竟出了什么问题。当你对你的朋友这样说话时,如果他正在找这本书,因为他需要这本书来完成作业,那他将不知道在哪里才能找到这本书。而这就是因为你没有说明句子中不同元素之间的关系——你是不是把书放在了桌子 上面 ?这很有可能。但是,你也可以把书放在了桌子 下面 、桌子 旁边 、桌子 后面 ,或者桌子 里面 (如果有抽屉的话)。 而且,还因为你没有说明行动(把书放在什么地方)与时间(中午)之间的关系,你的朋友可能会更加困惑。因为动词“put”既可以代表过去时,也可以代表现在时,那么这句话的含义就存在很多种可能性了。你的意思很可能是你已经把书放在桌子的上面、里面、后面或下面了,而放置的时间发生在中午之前或中午。所以,如果现在已经是下午2点,书还没有在那里,那么一定是发生了什么事情,你这样说话就误导和迫使你的朋友想办法去调查一下。 但是,另外一种可能性是你的朋友猜测你使用时态比较随意,那么你有可能将在中午把书放在那里。如果是这样,你其实应该说“I will”。但是,由于你的句子非常令人困惑和缺少信息,你的朋友便有很好的理由首先质疑你的语法。如果他这时现在看了看手表,发现现在是下午12点3分,他可能会认为你很快就会来,那么就可能决定在等候期间先去喝杯咖啡。 你看到这里可能会乐了,你或许认为这个缺失介词的例子扯得有点夸张,但实际上它恰好说明介词的重要性和缺失或误用介词所导致的严重后果。你或许觉得你的朋友应该很容易能够弄清楚究竟发生了什么,因为毕竟还有上下文可供推断。但是,需要记住的是,英语与许多亚洲语言不同,它是一种低语境语言;换言之,使用者必须尽可能精确,避免歧义,以便清晰地交流。因此,与其将介词误认为是一个可用可不用的、令人困惑的语法难点,还不如老老实实地接受介词的复杂性,并将重视它们,将介词视为必不可少的、关键性的句子元素,帮助你准确地表达你想说的意思。 读者能够在很多线上或线下的英文写作指导资源中找到详细的语法规则、介词列表和常见的用法示例。本文不重复这些内容。本文重点讨论英语不是母语的学术论文作者在写作时最常犯的介词错误,以及如何检查和纠正它们。 目录 如何检查介词的用法 学术论文中常见的介词错误 学术论文中介词的正确用法 关于介词规则的问答 如何检查介词的用法 介词可以用来表示方向、时间、空间、位置、地点或更加抽象的关系。介词的正确用法遵循高度习惯化原则,主要由固定的表达方式决定。因此,除了大量阅读习惯用法之外,正确使用介词的最好方法是了解单词与所有能够搭配使用的介词所形成的不同含义。查找介词及其正确用法的比较好的参考资料是韦氏在线词典、剑桥词典和当代美国英语语料库。 人们可以简单地使用谷歌搜索(Google search)或谷歌的Ngram Viewer查看所使用的搜索字符串的年度出现频率。这两个搜索工具都能显示短语出现的频率。Ngram Viewer还能显示同一个动词与不同介词组合在一起时出现的频率。许多动词的意思取决于它们搭配使用的介词。另外,虽然“grateful for ”这个词出现的频率比“grateful to ”的频率更低,但这并不意味着其中一个是正确的、而另一个是错误的。这些词组之间的频率比较只表示人们更频繁地使用什么词组而已。 事实上,正是因为介词的数量庞大,而且动词与不同介词组合时会产生不同的意思,所以介词误用是学术写作中最常见的错误之一。既然介词并没有很多通用规则可供遵循,那么就应当先从各个用法实例入手,看一下学术论文中常见的介词错误,以及应该如何纠正。 学术论文中常见的介词错误 1. 时间:由于时间区段、间隔、周期、时间表等在科研工作中非常重要,需要注意表达时间的介词用法,避免歧义和混淆。这些介词包括at、on、in、for、during、since、before、after、between、within等。 错误: The samples were incubated during 30 minutes. 正确: The samples were incubated for 30 minutes. 错误: The patient had been treated by us since 2 years. 正确: The patient had been treated by us for 2 years. 错误: Participants were enrolled between January 2021 to May 2021. 正确: Participants were enrolled between January 2021 and May 2021. 正确: Participants were enrolled from January 2021 to May 2021. 2. 位置和方向:事情发生的位置或事物放置的位置也是实验或科研中的重要细节。误用表达位置和方向的介词会导致歧义,特别是在论文的方法部分。这些介词包括at、on、in、above、behind、below、close to、inside、over等。 正确: The green arrow was displayed among the red circles. 正确: The green arrow was displayed between the red circles. 正确: The green arrow was displayed above the red circles. 正确: The green arrow was displayed across the red circles. 错误: The patient presented to our hospital. 正确: The patient presented at our hospital. 错误: One additional variable was entered to the analysis. 正确: One additional variable was entered into the analysis. 3. 比较:任何实验或研究结果通常都在比较的基础上进行描述。需要在论文的结果部分正确使用介词,包括than、to、as、among、with、from等。 错误:The students’ replies were similar than the office workers’ replies. 错误:The students’ replies were similar as the office workers’ replies. 正确: The students’ replies were similar to the office workers’ replies. 错误:The design of experiment 2 was the same to the design of experiment 2. 正确: The design of experiment 2 was the same as the design of experiment 2. 错误: The mode of action of cilostazol is different with that of acetylsalicylic acid. 正确: The mode of action of cilostazol is different from that of acetylsalicylic acid. 错误: Cardiac blood concentrations were higher as peripheral blood concentrations. 正确: Cardiac blood concentrations were higher than peripheral blood concentrations. 学术论文中介词的正确用法 以下英文列表包括在学术论文的各个部分中常见的介词用法,包括容易混淆的介词。在论文定稿之前,建议对照查看这些用法,纠正误用的介词。 1. 引言部分 X is the leading cause of Y in most industrialized countries. X is a common disease characterized by … X is a widely discussed issue in the field of … Recent developments in X have raised questions about … In recent years, increasing attention has been drawn to … The majority of earlier studies on X have focused on … Over the past 20 years, the incidence of Y has steadily increased. In the last 20 years, a number of studies have reported on … Since the late 1980s, advancements in the field of Y have led to … We tested the effect of antibiotics on bacteria in the treatment of … Past research into X has been lacking, due to methodological restrictions. A limited number of experiments have been reported on X so far. Despite its long use in clinical research, method X still has serious limitations. The main purpose of our study was to expand our understanding of … 2. 方法部分 The patient presented at our hospital with dizziness. The patient suffered from gastrointestinal bleeding. The patient complained of recurring headaches. Patients underwent surgery on the first day of hospital admission. Patients with no complaints during the past 2 weeks were considered pain-free. Participants who reported not having a smartphone were excluded from the study. A total of 45 participants who provided consent were included in the analyses. To prevent participants from moving, we placed a cushion under their head. In order to detect motion artefacts, the data were analyzed with Y software. Samples were collected over a period of… Stimuli were presented at intervals of… 3. 结果与讨论部分 Our comparison of different fish species revealed differences in food preference. The majority of participants responded to all questionnaire items. Group 1 showed a bigger effect than group 2. Nine of the 20 mice died of respiration arrest. Our analyses show that there are problems associated with the use of… We tested the correlation between X and Y and found that… ANOVA was used to assess the effect of X on Y . Figure 3 shows the differences between the treatment and control groups. We found no significant reduction in X compared to baseline concentrations. Our findings provide crucial insights into … Our findings point to an important role of X in … The results of the current study are not consistent with earlier findings. Our findings differ from those of earlier studies. Our results are in line with those of earlier studies. The differences between our study and that by Smith et a. can be explained by … A possible explanation for the discrepancy in results could be that… The differences could be attributed to … Our results show the effectiveness of X as a cure for Y in elderly patients. Our findings highlight the role of X in the treatment of Y . Further studies focusing on X are needed to clarify the role of … 关于介词规则的问答 1. 句子能够以介词结尾吗? 是的,可以。有人或许听说过不能用介词结束句子的说法,但是这种说法是错误的。努力试图不以介词结尾会导致写出的英文非常不自然。 YES(正确) Where did he come from ? 由于不能只说“ Where did he come? ”,而“ From where did he come? ”又听起来在语法上有些过时,那么在这种情况下,以介词结尾的写法会更好,如上例。 2. 可以省略介词吗? 不能简单地省略介词。但是,可以重新措辞,避免使用介词。这种做法实际上能够减少用词啰嗦的写法,提高写作水平。关于更多介绍,建议查看这篇文章:如何消除介词短语。 3. 我检查了我用的介词,但如何能够也检查词汇? 如果你担心会混淆类似的单词,那么请看这篇文章,以及关于有效短语和强有力动词方面的更多写作指导资源。
包括有:英语医学科技论文中分词、合成词作定语以及名词连缀的使用英语医学科技论文写作中的常见错误英文医学科技论文中数词的用法及数字的写法外文斜体的使用方法 希望能帮助到你,望采纳!
安瑞医学希望能解答您的问题,有更多医学sci疑问的朋友也可以私信我:医学sci论文在投稿中有以下10种状态:1. Submitted to Journal当上传结束后,显示的状态是Submitted to Journal,这个状态是自然形成的无需处理。2. With editor如果在投稿的时候没有要求选择编辑,就先到主编那里,主编会分派给别的编辑。这当中就会有另两个状态:① Editor assigned编辑分派② Editor Declined Invitation编辑拒绝邀请,这时主编不得不将投稿文章重新分派给其它编辑。3. Reviewer(s) invited说明编辑已接手处理,正在邀请审稿人中。有时该过程会持续很长时间,如果其中原因是编辑一直没有找到合适的审稿人,这时投稿者可以向编辑推荐审稿人。4. Under review审稿人的意见已上传,说明审稿人已接受审稿,正在审稿中,这应该是一个漫长的等待(期刊通常会限定审稿人审稿时间,一般为一个月左右)。当然前面各步骤也可能很慢的,要看编辑的处理情况。如果被邀请审稿人不想审,就会decline,编辑会重新邀请别的审稿人。5. required review completed审稿结束,等编辑处理,该过程短则几天,长则无期,科学堂有一篇文章出现required review completed状态已近一个月了,还是没有消息。6. Decision in Process到了这一步就快要有结果了,编辑开始考虑是给修改还是直接拒,当然也有可能直接接受的,但可能性很小,呵呵。7. Minor revision/Major revision小修/大修,这个时候可以稍微庆祝一下了,因为有修改就有可能。具体怎么改就不多说了,谦虚谨慎是不可少的(因为修改后一般会再发给审稿人看,所以一定要细心的回答每一个审稿人的每一个问题,态度要谦逊,要让审稿人觉得他提的每个问题都很有水准的,然后针对他的问题,一个一个的做出答复,能修改的就修改,不能修改的给出理由,而且都要列出来,文章的哪一段哪一行修改了最好都说出来,记住:给审稿人减少麻烦就是给你自己减少麻烦!另注:有时,审稿人会在修改意见里隐讳里说出要你仔细阅读某几篇文献,这时可要注意了,其中某些文章可能就是评审者自己发表的,这时你最好在你的修改稿中加以引用),修改后被拒绝的例子也多不胜数的。8. Revision Submitted to Journal修改后重新提交,等待编辑审理。9. Accepted如果不要再审,只是小修改,编辑看后会马上显示这个状态,但如果要再审也会有上面的部分状态。一步会比较快,但也有慢的。看杂志的。10. Rejected相信大家见了Rejected,都会很郁闷。但也不要太灰心,耐心将评审意见看完,一般评审者会给出有益的建议,相信看后你会有所收获。在投稿和审稿的过程中有可能出现的错误以及需要注意的问题是:发表的研究论文会给科研与创新带来新方法,为科学、技术与社会发展开辟新视野。本文分享下着名学者审稿和投稿经历,让投稿、审稿更轻松;相关经验总结如下:一、做研究决不能拖拉,有了idea一定要努力push,不管任务有多难,总是有希望完成的,一鼓作气,不到论文发表决不停歇(最好是还有后续工作); 二、论文投稿一定要及时,多少导师压着学生的paper不理不改不投,耽误了时机甚至影响其毕业? 三、即便是follow别人的研究工作,只要做的更加深入、系统、具体,总是能得到更为普遍的结论,也具有一定的发表价值,但是如果做的单薄,就难免被审稿人诟病而被拒稿; 四、审稿应该认真仔细些,不仅需要通读细读全文,也要提出准确中肯的意见,还得认认真真参照杂志审稿要求打分。试问有多少人认为光有审稿意见足矣,而打分只是随便打打的? 五、要学会从审稿意见中推测审稿人是谁,如果被拒稿,改投其他期刊后在建议审稿人里把之前可能是给好意见的那位加上,而对于给苛刻难以对付的审稿意见那位,就建议编辑规避,这样也许可以加速文章审稿和被接收的进程。目前, 国际一流SCI杂志基本都已采用了在线投稿方式。 常见的投稿系统有: ScholarOne Manuscripts, Editorial Manager, Elsevier Editorial System, EJPress, Open Journal Systems (OJS), 等等; 也有些出版者倾向于自己开发投稿系统, 如美国物理联合会出版社(AIP)的Peer X-Press, 英国物理学会出版社(IOPP)的Author Service and Referee Service, 等等。 这些在线投稿系统虽然界面风格各有不同, 但总体功能十分相似, 极大地方便了编者、作者、审稿人之间的联系与沟通, 对于提高出版效率、降低出版成本具有非常重要的作用。 在线投稿时应注意的事项主要有: (1) 应注意查询拟投稿期刊的最新要求, 以便在稿件的准备中尽早开始遵循期刊的习惯和格式。 (2) 投稿时应严格遵循期刊的相关要求, 按规定的程序填写或添加投稿信息, 如投稿信、摘要、文件类型、辅助信息、图件、建议的审稿人等, 以满足期刊的要求 (3) Email地址必须准确, 有些期刊要求主要作者和通信作者有相互独立的用户名和密码, 并且主要是与通信作者进行投稿及投稿后的联系, 这也是在投稿时需要注意的。 (4) 在投稿系统注册以后作者便拥有自己的网页, 该网页通常分为几个区域, 如投稿、查询已投稿件的状态、继续已经开始的投稿、传送修改稿、已录用稿件的出版阶段等, 因此, 对于特定的期刊(群), 应尽量保持自己唯一的用户名和密码, 以免导致混乱。 (5) 除了Email和FTP投稿形式需要一次性投稿外, 通过网页的投稿可以采取暂时保存的形式分多次完成投稿任务, 在最终递交稿件前, 投稿系统需要作者确认所有项目均已完成并且允许作者修改。 通常情况下投稿完成以后就不允许作者对已投的稿件进行修改, 除非编辑和出版商要求作者作某些修改。 (6) 投稿成功以后, 作者通常会收到一份来自编辑或系统的确认函, 作者可根据确认函提供的稿件编号跟踪稿件状态及进行投稿后的联系(如要求加快稿件处理速度), 可通过投稿系统规定的渠道或Email与编辑联络。
据学术堂了解,在医学英语论文写作的过程中,主要应该注意论文的题目、摘要及引言三个部分。题目:概括性强、体现创新性、精炼题目写作注意事项:英文题目以短语为主要形式,尤以名词短语最常见,即题目基本上由一个或几个名词加上其前置和(或)后置定语构成,例如The fabrication of…短语型题目要确定好中心词,再进行前后修饰。各个词的顺序很重要,词序不当,会导致表达不准摘要:与结论不重复,体现整个文章的结论和思想,包括研究工作的目的、方法、结果和应用等摘要写作注意事项: 摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。其基本要素包括研究目的、方法、结果和结论引言: 主要研究进展,有代表性的同行研究工作,自己与他人工作对比的优势和不足,前言的参考文献选取代表性的、重要的文献
医学统计中的常见误区有哪些
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。
一,真正差异和统计学差异
常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。
其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。
二,卡方检验的局限性
我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!
这第2条可能大家不要理解,那我就举两个例子:
1) 关于男性和女性对于不同颜色的喜好的统计学分析
但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。
***红色 蓝色 黄色
男性 5 7 8
女性 15 10 6
可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!
2)两种治疗(A和B)效果的评价分析:
*****A法 B法
生存 41 54
死亡 47 31
用卡方检验 X2=; P <
但是,病人的临床分期将影响着分析结果:
********生存**************死亡
——————————***——————————
————A****B————————A*****B———
1期-----18-----21--------------------0--------0-------
2期-----23-----33-------------------13------- 8-------
3期------0------0--------------------34-------23-------
再用Mantel-Haenszel检验: X2=; P >
说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
三,t 检验的局限性
1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!
比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。
2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。
四,ANOVA 检验的局限性
1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。
2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。
3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!
如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。
五,单元线性相关分析
有时我们常常只注意到了 P 值大小,可最重要的是 r 值!
样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:
当 P 值小于时: r 值
几乎没有相关关系
弱的相关关系
有相关关系
强相关关系
极强相关关系
P 值只是证明这个相关在统计学上是否成立!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
不是说样本小于5
而是说:在R×C表中
理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:
a.增加样本含量,使理论频数增大;
b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。
c.改用双向无序的R×C表的fishher确切概率法。
还有一点
四格表卡方检验的适应指标:(T为理论频数)
1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法
2。n≥40,但是1≤T≤5时,用四格表校正公式
3。n<40,或者T<1时,用fisher四格表确切概率法
4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。
补充几点:
1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。
2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。
3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。
感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!
六,Logistic regression 分析
在判断某因子对疾病的危险度时常用的方法。
1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。
2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。
3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。
其它方法---生存分析 (Kaplan-Meier法+ Logrank法):
我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。
计学,可以说无处不在,我们每个人的日常生活都会受到统计学的影响。但是很多人,即使受过统计学的正规训练,也会在不知不觉之间犯一些常见的分析错误。下面这篇文章,我就和大家分享一些现实生活中比较常见的统计研究错误。1. 参照组(Control group)那天我恰好在网上看到一篇文章,叫做《眼保健操对于保护眼睛有作用么?》。作者的观点是眼保健操没有什么作用,列举的证据是眼保健操在中国的学校里推行了50多年,小学生和中学生的近视率大大上升了,而非下降。因此作者得出结论:眼保健操对视力有害。乍一看,好像确实是这么回事:50多年前我们开始在学校里要求学生们做眼保健操。但是现在孩子们的近视率,则要比当时的那些孩子的近视率高出很多。但是如果就因为这个而得出眼保健操没用的结论,则是谬之大矣。主要原因在于:没有参照组。和建国初那时候的孩子们相比,现在的孩子由于功课压力,在室内花的时间(读书,做作业,上补习班等)大幅度增长,用眼的“诱惑”也大大增加,比如电视,电脑,手机等等。因此无论是否做眼保健操,现在孩子的视力肯定都不及当时的孩子。这也不是中国独有的现象,日本,韩国,新加坡等国的情况也类似。而这些国家都没有眼保健操。如果要真正研究眼保健操对于保护视力是否有效,那么就应该通过参照组来对比。研究人员应该找到两组情况类似的样本(比如同一个学校里的孩子)进行研究。这两组样本的区别除了他们是否做眼保健操以外,在其他方面越相似越好。然后通过一定时间的跟踪调查,研究人员才可能得出更加客观和可靠的研究结果。1747年,苏格兰医生James Lind在一艘名叫Salisbury的船上成功的找到了治疗坏血病的方法:就是通过吃橙子和柠檬补充维他命C。而他找到该疗法的关键就是运用了参照组实验方法。坏血病是一种非常可怕的疾病。坏血病的发病特征包括皮下出血(因此腿会变黑),极度疲劳,牙床腐烂,肌肉变软。长期出海的船员和海盗是坏血病的多发人群。James Lind使用的参照组实验是这样进行的。在Salisbury这艘船上,Lind医生找到了12个坏血病严重程度差不多的病人,将他们两人一组分成6组。对于这6组病人,Lind医生给予了他们6种不同的治疗方法,包括橙子,柠檬,苹果酒,醋和盐水等。后来Lind医生发现,食用橙子和柠檬的那组病人的恢复速度显然比其他组别要快很多,因此得出结论橙子和柠檬可以治疗坏血病。现在我们知道,橙子中的维他命C才是坏血病的克星。Lind医生通过参照组实验获得的这项重要发现,帮助挽救了成千上万的水手的生命。如果没有参照组这个重要的分析方法,Lind医生能否找到正确的解药要打一个大问号。当时,Lind医生一度怀疑坏血病的病因和啤酒有关。Lind医生观察到,每次船上的啤酒被喝光时,往往也伴之以坏血病的大面积流行。但事实上,啤酒喝光,和坏血病盛行,只是一个巧合而已。因为坏血病往往多发于长期航海旅途中,而在海上旅行久了,啤酒自然也会被喝完。如果不通过参照组方法去分析真正的原因,那么就可能得出啤酒能够治疗坏血病这样错误的结论。在我们阅读分析一些统计研究报告时,一个很重要的地方就是要看该研究有没有参照组进行对比。如果研究只是比较了几个变量之间的关系而缺乏参照组进行对照,那么该研究的结论就值得怀疑。2. 随机取样(Random Sampling)下面来讲讲“随机取样(Random Sampling)”这个问题。在现实中,我们经常面对的问题是,需要研究的样本量太大,无法收集到完整的数据。比如我们想要了解全国十几亿人的想法,或者想要知道所有沿海城市的中产阶级的消费偏好,等等。要想精确的回答这些问题,我们就需要随机抽取一些代表性样本,通过样本的表现来推测整体的特征。如何确保收集到的样本真正“随机”,是一个技术含量很高的问题。在这方面有很多失败的例子可供我们学习。1936年,美国的总统选举大战在罗斯福(FDR)和兰登(Alf Landon)之间展开。在选举投票前,当时一家非常大的调查机构Literary Digest发出了1千万张明信片来收集美国人的投票倾向。在这1千万张明信片中,Literary Digest收到了2百万份回复。在这些回复中,绝大部分人都倾向于选兰登。因此Literary Digest得出结论:兰登将赢得总统选举。当时还有另外一家新成立不久的调查公司,名叫Gallup。Gallup没有Literary Digest那么大的预算。他们只是有针对性的选了几千个受访者做了民意调查,并得出罗斯福将会赢得总统大选的结论。
一般都会过。一般盲审不过的论文多半都是违背学术道德规范,有造假和抄袭行为,不管是否盲审,这种论文铁定不通过。所以如果只是少量的方法用错,一般都会过。但是,针对论文中的问题评委会提出反馈意见供整改,也不能完全排除不通过的可能性,所以也要做好相应的准备应付这种情况。
安瑞医学希望能解答您的问题,有更多医学sci疑问的朋友也可以私信我:医学sci论文在投稿中有以下10种状态:1. Submitted to Journal当上传结束后,显示的状态是Submitted to Journal,这个状态是自然形成的无需处理。2. With editor如果在投稿的时候没有要求选择编辑,就先到主编那里,主编会分派给别的编辑。这当中就会有另两个状态:① Editor assigned编辑分派② Editor Declined Invitation编辑拒绝邀请,这时主编不得不将投稿文章重新分派给其它编辑。3. Reviewer(s) invited说明编辑已接手处理,正在邀请审稿人中。有时该过程会持续很长时间,如果其中原因是编辑一直没有找到合适的审稿人,这时投稿者可以向编辑推荐审稿人。4. Under review审稿人的意见已上传,说明审稿人已接受审稿,正在审稿中,这应该是一个漫长的等待(期刊通常会限定审稿人审稿时间,一般为一个月左右)。当然前面各步骤也可能很慢的,要看编辑的处理情况。如果被邀请审稿人不想审,就会decline,编辑会重新邀请别的审稿人。5. required review completed审稿结束,等编辑处理,该过程短则几天,长则无期,科学堂有一篇文章出现required review completed状态已近一个月了,还是没有消息。6. Decision in Process到了这一步就快要有结果了,编辑开始考虑是给修改还是直接拒,当然也有可能直接接受的,但可能性很小,呵呵。7. Minor revision/Major revision小修/大修,这个时候可以稍微庆祝一下了,因为有修改就有可能。具体怎么改就不多说了,谦虚谨慎是不可少的(因为修改后一般会再发给审稿人看,所以一定要细心的回答每一个审稿人的每一个问题,态度要谦逊,要让审稿人觉得他提的每个问题都很有水准的,然后针对他的问题,一个一个的做出答复,能修改的就修改,不能修改的给出理由,而且都要列出来,文章的哪一段哪一行修改了最好都说出来,记住:给审稿人减少麻烦就是给你自己减少麻烦!另注:有时,审稿人会在修改意见里隐讳里说出要你仔细阅读某几篇文献,这时可要注意了,其中某些文章可能就是评审者自己发表的,这时你最好在你的修改稿中加以引用),修改后被拒绝的例子也多不胜数的。8. Revision Submitted to Journal修改后重新提交,等待编辑审理。9. Accepted如果不要再审,只是小修改,编辑看后会马上显示这个状态,但如果要再审也会有上面的部分状态。一步会比较快,但也有慢的。看杂志的。10. Rejected相信大家见了Rejected,都会很郁闷。但也不要太灰心,耐心将评审意见看完,一般评审者会给出有益的建议,相信看后你会有所收获。在投稿和审稿的过程中有可能出现的错误以及需要注意的问题是:发表的研究论文会给科研与创新带来新方法,为科学、技术与社会发展开辟新视野。本文分享下着名学者审稿和投稿经历,让投稿、审稿更轻松;相关经验总结如下:一、做研究决不能拖拉,有了idea一定要努力push,不管任务有多难,总是有希望完成的,一鼓作气,不到论文发表决不停歇(最好是还有后续工作); 二、论文投稿一定要及时,多少导师压着学生的paper不理不改不投,耽误了时机甚至影响其毕业? 三、即便是follow别人的研究工作,只要做的更加深入、系统、具体,总是能得到更为普遍的结论,也具有一定的发表价值,但是如果做的单薄,就难免被审稿人诟病而被拒稿; 四、审稿应该认真仔细些,不仅需要通读细读全文,也要提出准确中肯的意见,还得认认真真参照杂志审稿要求打分。试问有多少人认为光有审稿意见足矣,而打分只是随便打打的? 五、要学会从审稿意见中推测审稿人是谁,如果被拒稿,改投其他期刊后在建议审稿人里把之前可能是给好意见的那位加上,而对于给苛刻难以对付的审稿意见那位,就建议编辑规避,这样也许可以加速文章审稿和被接收的进程。目前, 国际一流SCI杂志基本都已采用了在线投稿方式。 常见的投稿系统有: ScholarOne Manuscripts, Editorial Manager, Elsevier Editorial System, EJPress, Open Journal Systems (OJS), 等等; 也有些出版者倾向于自己开发投稿系统, 如美国物理联合会出版社(AIP)的Peer X-Press, 英国物理学会出版社(IOPP)的Author Service and Referee Service, 等等。 这些在线投稿系统虽然界面风格各有不同, 但总体功能十分相似, 极大地方便了编者、作者、审稿人之间的联系与沟通, 对于提高出版效率、降低出版成本具有非常重要的作用。 在线投稿时应注意的事项主要有: (1) 应注意查询拟投稿期刊的最新要求, 以便在稿件的准备中尽早开始遵循期刊的习惯和格式。 (2) 投稿时应严格遵循期刊的相关要求, 按规定的程序填写或添加投稿信息, 如投稿信、摘要、文件类型、辅助信息、图件、建议的审稿人等, 以满足期刊的要求 (3) Email地址必须准确, 有些期刊要求主要作者和通信作者有相互独立的用户名和密码, 并且主要是与通信作者进行投稿及投稿后的联系, 这也是在投稿时需要注意的。 (4) 在投稿系统注册以后作者便拥有自己的网页, 该网页通常分为几个区域, 如投稿、查询已投稿件的状态、继续已经开始的投稿、传送修改稿、已录用稿件的出版阶段等, 因此, 对于特定的期刊(群), 应尽量保持自己唯一的用户名和密码, 以免导致混乱。 (5) 除了Email和FTP投稿形式需要一次性投稿外, 通过网页的投稿可以采取暂时保存的形式分多次完成投稿任务, 在最终递交稿件前, 投稿系统需要作者确认所有项目均已完成并且允许作者修改。 通常情况下投稿完成以后就不允许作者对已投的稿件进行修改, 除非编辑和出版商要求作者作某些修改。 (6) 投稿成功以后, 作者通常会收到一份来自编辑或系统的确认函, 作者可根据确认函提供的稿件编号跟踪稿件状态及进行投稿后的联系(如要求加快稿件处理速度), 可通过投稿系统规定的渠道或Email与编辑联络。
??想问什么?
修改医学论文需要注意以下几点:
写论文最关键的是端正心态,静下心来研究、撰写、成稿,有时社会调研必不可少,我这可以帮你。VSJ
医学统计中的常见误区有哪些
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。
一,真正差异和统计学差异
常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。
其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。
二,卡方检验的局限性
我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!
这第2条可能大家不要理解,那我就举两个例子:
1) 关于男性和女性对于不同颜色的喜好的统计学分析
但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。
***红色 蓝色 黄色
男性 5 7 8
女性 15 10 6
可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!
2)两种治疗(A和B)效果的评价分析:
*****A法 B法
生存 41 54
死亡 47 31
用卡方检验 X2=; P <
但是,病人的临床分期将影响着分析结果:
********生存**************死亡
——————————***——————————
————A****B————————A*****B———
1期-----18-----21--------------------0--------0-------
2期-----23-----33-------------------13------- 8-------
3期------0------0--------------------34-------23-------
再用Mantel-Haenszel检验: X2=; P >
说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
三,t 检验的局限性
1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!
比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。
2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。
四,ANOVA 检验的局限性
1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。
2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。
3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!
如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。
五,单元线性相关分析
有时我们常常只注意到了 P 值大小,可最重要的是 r 值!
样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:
当 P 值小于时: r 值
几乎没有相关关系
弱的相关关系
有相关关系
强相关关系
极强相关关系
P 值只是证明这个相关在统计学上是否成立!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
不是说样本小于5
而是说:在R×C表中
理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:
a.增加样本含量,使理论频数增大;
b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。
c.改用双向无序的R×C表的fishher确切概率法。
还有一点
四格表卡方检验的适应指标:(T为理论频数)
1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法
2。n≥40,但是1≤T≤5时,用四格表校正公式
3。n<40,或者T<1时,用fisher四格表确切概率法
4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。
补充几点:
1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。
2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。
3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。
感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!
六,Logistic regression 分析
在判断某因子对疾病的危险度时常用的方法。
1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。
2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。
3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。
其它方法---生存分析 (Kaplan-Meier法+ Logrank法):
我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。
一般都会过。一般盲审不过的论文多半都是违背学术道德规范,有造假和抄袭行为,不管是否盲审,这种论文铁定不通过。所以如果只是少量的方法用错,一般都会过。但是,针对论文中的问题评委会提出反馈意见供整改,也不能完全排除不通过的可能性,所以也要做好相应的准备应付这种情况。
统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!
医学统计学方法应用的错误解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
统计学专业毕业现状分析与对策研究
本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。
中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。
本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]
一、统计学专业毕业论文质量的现状分析
从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为。
从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。
从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的。二是数学专业教育和数学思维的研究,占总数的。研究统计学专业问题的毕业论文占绝大部分,比例为,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。
此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约分。
二、统计学专业毕业论文存在的问题
毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:
1.创新性不够
学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占,与实证型论文的比例为1︰,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。
2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象
有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。
3.相对前沿的分析方法利用较少
前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约,其他各统计方法使用的比例分别为:聚类分析为,判别分析为,相关性分析为,多元统计方法为,时间序列分析为,极少有学生使用教科书外的相对前沿的分析方法。
4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题
从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。
三、存在问题的原因分析
针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:
1.学生对论文不够重视
部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。
2.缺乏指导教师的针对性指导
指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。
3.学生的专业训练还不够
大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。
四、提高毕业论文质量的建议和 实践
1.加强毕业论文重要性的宣传,提高学生的重视度
加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。
2.选题和教师的科研项目相结合,提高论文的创新性
在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。
3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力
为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。
4.加强学生科技论文写作训练
加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。
5.实施激励措施,激发学生的兴趣和主动性
针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。
6.加强教师责任心,建立完善的机制
加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。
不论是什么错,还是谁提出的,一经核实,原刊物会在以后的期刊中,给出勘误表或更正。如果是作者本人,发现的最好尽快与杂志社联系,予以更正,并附一封对读者的致歉信。
你可以参考一下 《当代医学论文研究 》 里面很多这样子的文章
医学统计中的常见误区有哪些
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识,欢迎阅读。
一,真正差异和统计学差异
常常有人和我说: P值越小,试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。
其实,这些人忽略了 n 这个样本数的作用,n 的大小会影响 P 值。但更应该澄清一下的是: P 值代表的是统计学差异,并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。
二,卡方检验的局限性
我们知道各组之间的计数资料的比较,要用卡方检验,但有些情况是不行的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
2,当组与组之间有不同的背景,而这些背景因子还可能会影响到组与组之间结果差异,这是就必须要用 Mantel-Haenszel 检验!
这第2条可能大家不要理解,那我就举两个例子:
1) 关于男性和女性对于不同颜色的喜好的统计学分析
但这里应该注意到年龄可能会对这个分析造成影响,这就要用Mantel-Haenszel 检验了。
***红色 蓝色 黄色
男性 5 7 8
女性 15 10 6
可以按大人和小孩(比如我们以15岁为分界)分层,在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里,并在统计指标选项里,选 Cochran和Mantel-Haenszel的统计量选项,这样出来的结果就可靠了!
2)两种治疗(A和B)效果的评价分析:
*****A法 B法
生存 41 54
死亡 47 31
用卡方检验 X2=; P <
但是,病人的临床分期将影响着分析结果:
********生存**************死亡
——————————***——————————
————A****B————————A*****B———
1期-----18-----21--------------------0--------0-------
2期-----23-----33-------------------13------- 8-------
3期------0------0--------------------34-------23-------
再用Mantel-Haenszel检验: X2=; P >
说明实际上A法和B法两组的统计学差异,是这个不同的分期造成的!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
三,t 检验的局限性
1,我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异,但这里要注意,有一些血清标记物的水平是不能用 t 检验的!
比如: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。
2,关于用不用配对t 检验,我个人认为当同一组样本在不同时点,不同处理方式的比较上,应该用配对t 检验。
四,ANOVA 检验的局限性
1,在2组以上计量资料样本比较时,ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果,并不能说明真正的统计学差异,真正的`差异还要通过每两个点的直接比较,也就是说应该在ANOVA 检验后,还必须做两两比较或多重比较,这样才能从全貌上反映出统计的全部结果。
2,既然方差分析得到差别有显著性意义的结论后,还需进行两两比较,有人认为还不如一开始就进行多次t检验更方便,其实,这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误,产生假阳性,因此要采用特定的方法,在SPSS的one-way ANOVA或General linear models中操作时,Post Hoc(多重比较)对话框内有多种方法可供选择,象两两比较一般用SNK法,而多个试验组和一个对照组的比较则多用dunnett检验。
3,我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异,但这里要注意,与 t 检验一样,有一些血清标记物的水平是不能用 ANOVA 检验的!
如上所说的: 血清标记物 PSA和AFP,在正常人的水平是很低的,而在病人则明显增加,呈现指数幂次改变,这样一来,血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!
这时应该用 非参数性检验---即 Kruskal-Wallis rank test 。
五,单元线性相关分析
有时我们常常只注意到了 P 值大小,可最重要的是 r 值!
样本数 n 对 P 值 结果的影响很大,容易让我们产生错觉,其实,相关的存在与否的评价是与 r 值最直接相关的,如下:
当 P 值小于时: r 值
几乎没有相关关系
弱的相关关系
有相关关系
强相关关系
极强相关关系
P 值只是证明这个相关在统计学上是否成立!!!
1,当样本有小于5的值2X2表时,必须要用 Fisher 检验才正确!
讨论:当样本有小于5的值2X2表时,必须要用 Fisher 确切概率法。
当样本有小于5的值R×C表时,将某两组合并,用pearson卡方检验。
不是说样本小于5
而是说:在R×C表中
理论频数不应该小于1,并且1≤T≤5的格子数不应该超过总格子数的1/5,若出现上述情况可以通过以下方法:
a.增加样本含量,使理论频数增大;
b.根据专业知识,删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。
c.改用双向无序的R×C表的fishher确切概率法。
还有一点
四格表卡方检验的适应指标:(T为理论频数)
1。n≥40,且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法
2。n≥40,但是1≤T≤5时,用四格表校正公式
3。n<40,或者T<1时,用fisher四格表确切概率法
4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。
补充几点:
1. 关于P值:P值的大小并不是各组差异的大小,而是统计学差异显著性的大小。P值越小,说明得出各组没有差异的概率越小,越有理由说明各组存在差异(可以说,P值的大小反映了做出统计结论的“理由”的大小,而不是被比较的各组的实际差异的大小,得出有意义的结论后,其差异的大小可直接通过各组的均数或率进行比较)。
2. 关于t检验和方差分析:katalyster兄上面提到的t检验及方差分析在某些时候不适用,实际上就是每种方法都有其应用条件,不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料,为指数或幂次的关系,可用对数转换),如变换后,服从正态分布,可用上述方法;若还不符合,则考虑非参数检验。
3. 关于相关分析:两个变量间是否存在相关关系,要看P值,而不是r值,r值用来说明相关关系的大小。当P<,才能讲两变量间存在相关关系,再看r值,r值越大,相关关系越强,反之越小;否则,P>,不能讲两变量间存在相关关系,r值毫无意义。
感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题,是真心想让初学者从这些<误区>中走出来!
六,Logistic regression 分析
在判断某因子对疾病的危险度时常用的方法。
1,假设要判断某因子对疾病的危险度(OR),要了解这个OR是一个相对危险度,即是有某因子存在和没有某因子存在之间比较的OR值。
2,OR 和 RR 不一样,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。
3,假设要判断某因子对疾病的危险度,要在多变量Logistic regression model中校正一些混扰因素,如常见的年龄,性别,吸烟等等,并最后得出这个 Adjusted OR。但并不是说有了这些校正,我们就可以在实验设计上就不考虑这些混扰因素,相反,必须在实验设计上就把这些混扰因素在实验组和对照组配平,光靠在多变量Logistic regression model中校正是不可靠的。
其它方法---生存分析 (Kaplan-Meier法+ Logrank法):
我们有时在临床研究只注意到了用这种方法分析与生存相关的研究,其实,在疾病复发上也常用这种方法!前者是以生---死为判别,后者则以复发---不复发为判别。