首页 > 医学论文 > 医学论文统计p值很小怎么回事

医学论文统计p值很小怎么回事

发布时间:

医学论文统计p值很小怎么回事

p值是统计量出现更坏结果的可能。p值越小说明这种情况更不支持h0,所以统计量p值越小越拒绝原假设。

首先假设检验的思想是概率反证法思想。小概率事件在一次试验中几乎是不可能发生的,那么此时p值其实就是代表拒绝原假设H0的最小显著性水平。

如果p尽可能小那么显著性水平尽可能小,就可以保证拒绝域尽可能地小。如果拒绝域很小还是有小概率事件发生的话,那么我们就有更大的把握说明该事件不可能发生。所以p值越小就越肯定的拒绝原假设。

p值是指当原假设为真时样本观察结果或更极端结果出现的概率。如果p值很小,说明这种情况发生的概率很小,如果这种情况出现了,根据小概率原理,我们就有理由拒绝原假设1,p值越小,拒绝原假设的理由就越充分。

为什么要用p值

从p值的英文概念——probability value——很容易理解它是某一种概率的值,这个概率的具体含义是什么?

要说明这个概率的含义,我们先说明假设检验的流程,首先提出原假设和备择假设;其次,确定适当的检验统计量(如z统计量、t统计量或F统计量),并计算器数值,这一步会选定一个置信水平即α(如α=或α=)。

最后进行统计决策,决策的依据是根据样本计算出的统计量与选定置信水平下的值进行比较,然后决定是接受原假设还是拒绝原假设。

spss回归分析中,如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,就有理由拒绝原假设,P值越小,拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。p=α=  此时接受H0 表明参数相等或者无显著性差异或者不显著。

p值若与选定显著性水平(或)相比更小,则零假设会被否定而不可接受。然而这并不直接表明原假设正确。p值是一个服从正态分布的随机变量,在实际使用中因样本等各种因素存在不确定性。产生的结果可能会带来争议。

扩展资料

显著性检验有时,根据一定的理论或经验,认为某一假设h0成立,例如,通常有理由认为特定的一群人的身高服从正态分布。当收集了一定数据后,可以评价实际数据与理论假设h0之间的偏离,如果偏离达到了“显著”的程度就拒绝h0,这样的检验方法称为显著性检验。

偏离达到显著的程度通常是指定一个很小的正数α(如,),使当h0正确时,它被拒绝的概率不超过α,称α为显著性水平。这种假设检验问题的特点是不考虑备择假设,考虑实验数据与理论之间拟合的程度如何,故此时又称为拟合优度检验。拟合优度检验是一类重要的显著性检验。

参考资料来源:百度百科—P值

参考资料来源:百度百科—假设检验

在统计学上P值小于和表明都有统计学意义。这个要看你样本是如何假设的。

医学论文统计p值怎么算

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。P值的计算公式是 =2[1-Φ(z0)] 当被测假设H1为 p不等于p0时; =1-Φ(z0) 当被测假设H1为 p大于p0时; =Φ(z0) 当被测假设H1为 p小于p0时; 其中,Φ(z0)要查表得到。 z0=(x-n*p0)/(根号下(np0(1-p0))) 最后,当P值小于某个显著参数的时候(常用,标记为α,给你出题那个人,可能混淆了这两个概念)我们就可以否定假设。反之,则不能否定假设。 注意,这里p0是那个缺少的假设满意度,而不是要求的P值。 没有p0就形不成假设检验,也就不存在P值

统计学意义(p值)ZT 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果≥p>被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 为有统计学差异, P< 为有显著统计学差异,P<为有极其显著的统计学差异。

P<时,认为差异有统计学意义”或者“显著性水平α=”,指的是如果本研究统计推断得到的差异有统计学意义,那么该结果是“假阳性”的概率小于。

扩展资料:

P值的计算:

一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:

左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}

右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}

双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。

若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。

计算出P值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:

如果α > P值,则在显著性水平α下拒绝原假设。

如果α ≤ P值,则在显著性水平α下不拒绝原假设。

在实践中,当α = P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

放到spss中,定义两个变量,第一个变量叫做:group,用1代表实验组,用2代表对照组,每个组两个数字;第二个变量叫分娩方式,分别用1、2、3代表阴道分娩、阴道助产和剖宫产。然后用描述性统计方法中的交叉列联表计算就ok了!希望对你有帮助!

医学论文统计学p值怎么算

放到spss中,定义两个变量,第一个变量叫做:group,用1代表实验组,用2代表对照组,每个组两个数字;第二个变量叫分娩方式,分别用1、2、3代表阴道分娩、阴道助产和剖宫产。然后用描述性统计方法中的交叉列联表计算就ok了!希望对你有帮助!

P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。

总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

计算:

为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。

1、左侧检验

P值是当

时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

2、右侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

3、双侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

扩展资料

美国统计协会公布了P值使用的几大准则:

准则1:P值可以表达的是数据与一个给定模型不匹配的程度

这条准则的意思是说,我们通常会设立一个假设的模型,称为“原假设”,然后在这个模型下观察数据在多大程度上与原假设背道而驰。P值越小,说明数据与模型之间越不匹配。

准则2:P值并不能衡量某条假设为真的概率,或是数据仅由随机因素产生的概率。

这条准则表明,尽管研究者们在很多情况下都希望计算出某假设为真的概率,但P值的作用并不是这个。P值只解释数据与假设之间的关系,它并不解释假设本身。

准则3:科学结论、商业决策或政策制定不应该仅依赖于P值是否超过一个给定的阈值。

这一条给出了对决策制定的建议:成功的决策取决于很多方面,包括实验的设计,测量的质量,外部的信息和证据,假设的合理性等等。仅仅看P值是否小于是非常具有误导性的。

准则4:合理的推断过程需要完整的报告和透明度。

这条准则强调,在给出统计分析的结果时,不能有选择地给出P值和相关分析。举个例子来说,某项研究可能使用了好几种分析的方法。

而研究者只报告P值最小的那项,这就会使得P值无法进行解释。相应地,声明建议研究者应该给出研究过程中检验过的假设的数量,所有使用过的方法和相应的P值等。

准则5:P值或统计显著性并不衡量影响的大小或结果的重要性。

这句话说明,统计的显著性并不代表科学上的重要性。一个经常会看到的现象是,无论某个效应的影响有多小,当样本量足够大或测量精度足够高时,P值通常都会很小。反之,一些重大的影响如果样本量不够多或测量精度不够高,其P值也可能很大。

准则6:P值就其本身而言,并不是一个非常好的对模型或假设所含证据大小的衡量。

简而言之,数据分析不能仅仅计算P值,而应该探索其他更贴近数据的模型。

声明之后还列举出了一些其他的能对P值进行补充的分析方手段,比如置信区间,贝叶斯方法,似然比,FDR(False Discovery Rate)等等。这些方法都依赖于一些其他的假定,但在一些特定的问题中会比P值更为直接地回答诸如“哪个假定更为正确”这样的问题。

声明最后给出了对统计实践者的一些建议:好的科学实践包括方方面面,如好的设计和实施,数值上和图形上对数据进行汇总,对研究中现象的理解,对结果的解释,完整的报告等等——科学的世界里,不存在哪个单一的指标能替代科学的思维方式。

参考资料来源:百度百科-P值

P值即概率,反映某一事件发生的可能性大小。

统计学根据显著性检验方法所得到的P 值,一般以P < 为有统计学差异, P< 为有显著统计学差异,P<为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于 、、。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的几率。统计结果中显示Pr > F,也可写成Pr( >F),P = P{ > F}或P = P{ > F}。

假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。

扩展资料:

P值由来

从某总体中抽

⑴、这一样本是由该总体抽出,其差别是由抽样误差所致;

⑵、这一样本不是从该总体抽出,所以有所不同。

如何判断是那种原因呢?统计学中用显著性检验来判断。其步骤是:

⑴、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。

⑵、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。

⑶、根据选定的显著性水平(或),决定接受还是拒绝H0。如果P>,不能否定“差别由抽样误差引起”,则接受H0;如果P<或P <,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受另一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。

P值的计算:

一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:

左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}

右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}

双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。

计算出P值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:

如果α > P值,则在显著性水平α下拒绝原假设。

如果α ≤ P值,则在显著性水平α下接受原假设。

在实践中,当α = P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

参考资料:假设检验中的P值-百度百科

统计学意义(p值)ZT 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果≥p>被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

医学论文统计P值

采用spss软件,单因素分组对照计算。

t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法

假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。

如果P>,说明两者间没有统计学差异;如果P<,说明两者间有统计学差异.

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

P就是犯第一类错误的概率,即原假设为真,被拒绝的概率,一般控制其小于因为在医学中,我们宁可犯第一类错误,即原假设为真,被拒绝的概率,也不能容忍接收一个错误的假设

医学论文怎么计算p值

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。P值的计算公式是 =2[1-Φ(z0)] 当被测假设H1为 p不等于p0时; =1-Φ(z0) 当被测假设H1为 p大于p0时; =Φ(z0) 当被测假设H1为 p小于p0时; 其中,Φ(z0)要查表得到。 z0=(x-n*p0)/(根号下(np0(1-p0))) 最后,当P值小于某个显著参数的时候(常用,标记为α,给你出题那个人,可能混淆了这两个概念)我们就可以否定假设。反之,则不能否定假设。 注意,这里p0是那个缺少的假设满意度,而不是要求的P值。 没有p0就形不成假设检验,也就不存在P值

放到spss中,定义两个变量,第一个变量叫做:group,用1代表实验组,用2代表对照组,每个组两个数字;第二个变量叫分娩方式,分别用1、2、3代表阴道分娩、阴道助产和剖宫产。然后用描述性统计方法中的交叉列联表计算就ok了!希望对你有帮助!

统计学意义(p值)ZT 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果≥p>被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。

总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

计算:

为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。

1、左侧检验

P值是当

时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

2、右侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

3、双侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

扩展资料

美国统计协会公布了P值使用的几大准则:

准则1:P值可以表达的是数据与一个给定模型不匹配的程度

这条准则的意思是说,我们通常会设立一个假设的模型,称为“原假设”,然后在这个模型下观察数据在多大程度上与原假设背道而驰。P值越小,说明数据与模型之间越不匹配。

准则2:P值并不能衡量某条假设为真的概率,或是数据仅由随机因素产生的概率。

这条准则表明,尽管研究者们在很多情况下都希望计算出某假设为真的概率,但P值的作用并不是这个。P值只解释数据与假设之间的关系,它并不解释假设本身。

准则3:科学结论、商业决策或政策制定不应该仅依赖于P值是否超过一个给定的阈值。

这一条给出了对决策制定的建议:成功的决策取决于很多方面,包括实验的设计,测量的质量,外部的信息和证据,假设的合理性等等。仅仅看P值是否小于是非常具有误导性的。

准则4:合理的推断过程需要完整的报告和透明度。

这条准则强调,在给出统计分析的结果时,不能有选择地给出P值和相关分析。举个例子来说,某项研究可能使用了好几种分析的方法。

而研究者只报告P值最小的那项,这就会使得P值无法进行解释。相应地,声明建议研究者应该给出研究过程中检验过的假设的数量,所有使用过的方法和相应的P值等。

准则5:P值或统计显著性并不衡量影响的大小或结果的重要性。

这句话说明,统计的显著性并不代表科学上的重要性。一个经常会看到的现象是,无论某个效应的影响有多小,当样本量足够大或测量精度足够高时,P值通常都会很小。反之,一些重大的影响如果样本量不够多或测量精度不够高,其P值也可能很大。

准则6:P值就其本身而言,并不是一个非常好的对模型或假设所含证据大小的衡量。

简而言之,数据分析不能仅仅计算P值,而应该探索其他更贴近数据的模型。

声明之后还列举出了一些其他的能对P值进行补充的分析方手段,比如置信区间,贝叶斯方法,似然比,FDR(False Discovery Rate)等等。这些方法都依赖于一些其他的假定,但在一些特定的问题中会比P值更为直接地回答诸如“哪个假定更为正确”这样的问题。

声明最后给出了对统计实践者的一些建议:好的科学实践包括方方面面,如好的设计和实施,数值上和图形上对数据进行汇总,对研究中现象的理解,对结果的解释,完整的报告等等——科学的世界里,不存在哪个单一的指标能替代科学的思维方式。

参考资料来源:百度百科-P值

  • 索引序列
  • 医学论文统计p值很小怎么回事
  • 医学论文统计p值怎么算
  • 医学论文统计学p值怎么算
  • 医学论文统计P值
  • 医学论文怎么计算p值
  • 返回顶部