• 回答数

    7

  • 浏览数

    257

小涛涛偶巴
首页 > 医学论文 > 医学论文中数据的筛选

7个回答 默认排序
  • 默认排序
  • 按时间排序

张轶群123

已采纳

刚在那个什么 创新医学网 上看见过 医学论文 写作辅导的文章 这个知道是不是 你要的答案 统计资料的显著性检验(significant test)方法的选择是医学论文中常常遇见的问题,退稿原因中常有显著性检验方法选择不当。如t检验、u检验、χ2检验等,虽然各有其应用范围和要求,但也其共同之处。作者可根据统计资料的类型,选择一种或几种检验方法。但当作者在获得一组、两组或两组以上的数据资料时,选择何种显著性检验,是至关重要的问题。不同的资料类型其统计指标、统计检验的方法是不同的,见表1。 医学生物研究中,许多指标都是服从正态分布(u分布)的,而随着样本含量加大或自由度增大,t分布、χ2分布、F分布都趋向于正态分布见图1、图2。 在《中华创伤杂志》第12卷1~6期和增刊中文章所涉及的统计方法(表2),表明了正态分布的广泛性、常见性。 故当作者获得数据资料后,首先应进行正态性检眩�范ㄊ欠为标准正态分布(或近似正态分布)或不属于正态分布。笔者首先推荐概率单位法。 当统计资料属于正态分布或近似正态分布时,差异显著性检验方法的选裕�诜合其应用条件下,一般可按表3进行选择。 显著性检验应用时的主要注意事项:(1)率值或均值在进行显著性检验前,应注意样本的代表性和可比性。(2)检验结果接近显著性界限时:要多方面考虑,是否确实不存在差异;或是观察例数不够,而需加大样本例剩换是检验公式运用不当,可用其他检验印证。(3)多个样本比例数的χ2检验,差异显著性,只能说明多组比例数不同或不完全相同,而不能确定哪个比例数不同,要进一步进行显著性检验才能了解两个样本比例数是否构成相同。表1 一般情况下不同资料的统计指标与检验方法的关系资料类型 统计指标 统计检验方法 计量资料 均数、标准差 t检验、F检验等 计数资料 率、构成比 χ2检验等 半定量资料 率、构成比 秩和检验、Ridit分析表2 《中华创伤杂志》第12卷1~6期、 增刊显著性检验方法使用频数检验方法 应用次数 检验方法 应用次数 t检验 27 直线相关与回归分析 5 χ2检验 16 拟合线性回归 1 F检验 24 相关分析 6 Q检验 2 非参数统计 4 u检验 1 未注明方法 6表3 常用显著性检验方法的选择统计资料比较类型 显著性检验 小样本均数与总体均数相比较 t检验 小样本均数相比较 t检验、F检验 两个或多个大样本均数与 总体均数相比较 u检验、t检验 大样本均数相比较 u检验、t检验 配对计量资料 配对t检验 两个率的比较 u检验、χ2检验 多个样本率的的比较 χ2检验 配对计数资料两种属性的 相关分析及其差别的比较 χ2检验

271 评论

janesmonkey

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

226 评论

花葬夏季

绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。显然,经正确统计处理的结果可信度高,论文的质量也高。

158 评论

云里雨里大太阳

缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

342 评论

Alex@美食

截前5位筛选

351 评论

何时何处

医学论文中常用统计分析方法的合理选择目前,不少医学论文中的统计分析存在较多的问题。有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。 检验t检验是英国统计学家 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显著性差别。当样本例数较少(n<60)且总体标准差未知时,选用t检验;反之当样本例数较多或样本例数较少、总体标准差已知时,则可选用u检验 [3]。②配对样本t检验:适用于配对设计的两样本均数的比较,在选用时应注意两样本是否为配对设计资料。常用的配对设计资料主要有如下三种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一样本的两个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。③两独立样本t检验:又称成组t检验,适用于完全随机设计的两样本均数的比较。与配对t检验不同的是,在进行两独立样本t检验之前,还必须对两组资料进行方差齐性检验。若为小样本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t’检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。此外,当两组样本例数较多(n1、n2均>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。 2.方差分析方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。常用的方差分析有如下几类:①完全随机设计的方差分析:主要用于推断完全随机设计的多个样本均数所代表的总体均数之间有无显著性差别。完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成两个或多个样本。②随机区组设计的方差分析:随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。③析因设计的方差分析:将两个或两个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学著作。目前,某些医学论文中有这样的情况,就是用t 检验代替方差分析对实验数据进行统计学处理,这是不可取的。t 检验只适用于推断两个小样本均数之间有无显著性差别,而采用t 检验对多组均数进行两两比较,会增加犯I 型错误的概率,即可能把本来无差别的两个总体均数判为有差别,使结论的可信度降低[6]。对多个样本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显著性意义时,再进行多个样本均数的两两(多重)比较。3.卡方检验(χ2检验)χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于两个样本率、多个样本率、样本内部构成情况的比较,样本率与总体率的比较,某现象的实际分布与其理论分布的比较。但是当样本满足正态近似条件时,如样本例数n与样本率p满足条件np与n(1— p)均大于5,则可以计算假设检验统计量u值来进行判断。常用的χ2检验分为如下几类:①2×2表χ2检验:适用于两个样本率或构成比的比较,在应用时,当整个试验的样本例数n≥40且某个理论频数1≤T<5时,需对χ2值进行连续性校正。因为T值太小,会导致χ2值增大,易出现假阳性结论。此外,若样本例数n<40,或有某个T值<1,此时即使采用校正公式计算的χ2值也有偏差,需要用2×2表χ2检验的确切概率检验法(Fisher确切检验法)。②配对资料χ2检验:适用于配对设计的两个样本率或构成比的比较,即通过单一样本的数据推断两种处理结果有无显著性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的样本例数n1与甲处理结果为阴性而乙处理结果为阳性的样本例数n2之和<40,需要对计算的χ2值进行校正。③R×C表χ2检验:适用于多个样本率或构成比的比较。在R×C表χ2检验中,若检验统计量有显著性意义时,还需要对多个样本率或构成比进行两两比较,即分割R×C表,使之成为非独立的四格表,并对每两个率之间有无显著性差别作出结论。 2×2表资料在应用时可分为如下几种类型:横断面研究设计的2×2表资料、队列研究设计的2×2表资料、病例-对照研究设计的2×2表资料、配对研究设计的2×2表资料。研究者应注意不同类型的2×2表资料的统计分析方法略有差别,比如在分析队列研究设计的2×2表资料时,如果用χ2公式计算得到P<,研究者则应再计算相对危险度(RR)并检验总体RR与1之间的差异是否具有统计学意义。此外,在进行R×C表χ2检验时,还有如下两个主要的注意事项:首先,T值最好不要<5,若有1/5的T值<5,χ2检验结论是不可靠的,解决的办法有三种:增大样本量;删去T值太小的行和列;将T值太小的行或列与性质相近的邻行或邻列的实际频数合并。其次,不同类型的R×C表资料选择的统计分析方法是不一样。①双向无序的R×C表资料:可以选用一般的χ2公式计算。②单向有序的R×C表资料:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R×C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。③双向有序且属性不同的R×C表资料:对于这类资料采用的统计分析方法不能一概而论,应根据研究者的分析目而合理选择。如果研究者只关心原因变量与结果变量之间的差异是否具有统计学意义时,此时,原因变量的有序性就显得无关紧要了,可将其视为结果变量为有序变量的单向有序R×C表资料进行分析。如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的χ因此,对于适用参数检验的资料,最好还是用参数检验。秩和检验是最常用的非参数检验,它包括如下几类:①配对资料的符号秩和检验(Wilcoxon配对法):是配对设计的非参数检验。当n≤25时,可通过秩和检验对实验资料进行分析;当n>25时,样本例数超出T界值表的范围,可按近似正态分布用u检验对实验资料进行分析。②两样本比较的秩和检验(Wilcoxon Mann-Whitney检验):适用于比较两样本分别代表的总体分布位置有无差异。如果样本甲的例数为n1,样本乙的例数为n2,且n1<n2;当n1≤10、n2—n1≤10时,可通过两样本比较的秩和检验对实验资料进行分析;当n1、n2超出T界值表的范围时,同样可按近似正态分布用u检验对实验资料进行分析。③多个样本比较的秩和检验(Wilcoxon Kruskal-Wallis检验):适用于比较各样本分别代表的总体的位置有无差别,它相当于单因素方差分析的非参数检验,计算方法主要有直接法和频数表法等。此外,在进行上述3类秩和检验(前两类秩和检验实际上已经被u检验替代)时,如果相同秩次较多,则需要对计算的检验统计量进行校正。公式计算。④双向有序且属性相同的R×C表资料:这类资料实际上就是配对设计2×2表资料的延伸,在分析这类资料时,实验者的目的主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。4. 非参数检验非参数检验可不考虑总体的参数、分布而对总体的分布或分布位置进行检验。它通常适用于下述资料[2]:①总体分布为偏态或分布形式未知的计量资料(尤其样本例数n<30时);②等级资料;③个别数据偏大或数据的某一端无确定的数值;④各组离散程度相差悬殊,即各总体方差不齐。该方法具有适应性强等优点,但同时也损失了部分信息,使得检验效率降低。即当资料服从正态分布时,选用非参数检验法代替参数检验法会增大犯Ⅱ类错误的概率。

91 评论

刘彦热茶

假设时间在A列,另取一列空白列(假设B列),B2输入=TEXT(A2,"[h]:mm"),下拉再取一空白列(假设C列),C2输入=COUNTIF($B$2:$B2,B2),下拉,把C列结果是1的筛选出来,就是要的结果

316 评论

相关问答

  • 医学论文中统计数据的选择

    绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需

    花usahana兔 5人参与回答 2023-12-09
  • 医学论文数据库的数据来源

    一、Elsevier(sciencedirect)是荷兰一家全球著名的学术期刊出版商,每年出版大量的学术图书和期刊,大部分期刊被SCI、SSCI、EI收录,是世

    oo鱼泡泡oo 3人参与回答 2023-12-09
  • 中药学论文选题数据挖掘

    指纹图谱的特征信息的分析与提取又称作数据挖掘。中药指纹图谱形象地反映了药用植物物种具有遗传特性的次生代谢“共有特征”,又由于次生代谢中地域、生长环境、采收等多种

    小宝cute 4人参与回答 2023-12-11
  • 医学论文数据收集及筛选

    医学的我能写。按研究的学科,可将学术论文分为自然科学论文和社会科学论文。每类又可按各自的门类分下去。如社会科学论文,又可细分为文学、历史、哲学、教育、政治等学科

    blueberry317 4人参与回答 2023-12-10
  • 医学论文中的数据出处

    可以帮你写,有偿,可以的话回我

    小馋猫儿richard 5人参与回答 2023-12-09