首页 > 医学论文 > 医学论文中的统计指标

医学论文中的统计指标

发布时间:

医学论文中的统计指标

采用spss软件,单因素分组对照计算。

t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法

假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。

描述统计,又称叙述统计,是统计学中,来描绘或总结观察量的基本情况的统计总称。其与推论统计相对应。1、研究者可以透过对数据资料的图像化处理,将资料摘要变为图表,以直观了解整体资料分布的情况。通常会使用的工具是频数分布表与图示法,如多边图、直方图、饼图、散点图等。2、研究者也可以透过分析数据资料,以了解各变量内的观察值集中与分散的情况。运用的工具有:集中量数,如平均数、中位数、众数、几何平均数、调和平均数。与变异量数,如全距、平均差、标准差、相对差、四分差。3、为了解个别观察值在整体中所占的位置,会需要将观察值转换为相对量数,如百分等级、标准分数、四分位数等。统计推断指统计学中,研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。更概括地说,是在一段有限的时间内,通过对一个随机过程的观察来进行推断的。在质量活动和管理实践中,人们关心的是特定产品的质量水平,如产品质量特性的平均值、不合格品率等。这些都需要从总体中抽取样本,通过对样本观察值分析来估计和推断,即根据样本来推断总体分布的未知参数,称为参数估计。参数估计有两种基本形式:点估计和区间估计。

统计描述是指运用统计指标如平均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推论总体的问题;统计推断是指在一定的可信程度或概率保证下,根据样本信息去推断总体特征。

统计指标医学论文

流行病学与统计 医学统计学:根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用各学科。 医学统计的主要内容: 研究对象:医学数据 统计设计:调查设计和实验设计 统计描述:率、均数 统计推断:对统计指标的差别和关联性进行分析和推断 医学统计资料的类型 统计工作的基本步骤包括: 1. 研究设计 2. 收集资料:来源:经常性资料【医疗卫生工作记录(病历、医学检查记录、出生死亡报表等)健康检查记录】;一时性资料【专题调查或实验研究】。要求:完整、正确和及时;足够数量;代表性和可比性 3. 整理资料:原始数据的检查与核对:常规检查;取值范围检错;逻辑检错 数据的分组设计和归纳汇总。4. 分析资料:统计描述;统计推断(区间估计、假设检验) 统计工作的基本步骤包括: A .实验和调查 B.统计设计 C.收集资料 D.整理资料 E.分析资料 统计工作中,分析资料指的是: A .统计设计 B.收集资料 C.整理资料 D.统计描述 E.统计推断 总体:根据研究目的而确定的同质观察单位的全体。有限总体和无限总体。 样本:是从总体中随机抽取有代表性的部分观察单位变量值的集合。 参数:指总体指标。如总体均数μ,总体标准差σ,总体率π。 统计量:指样本指标。如样本均数 ,样本标准差S ,样本率p 。 误差:指实际值与真实值之差。分为随机误差(随机测量误差和抽样误差)、非随机误差(主要是系统误差) 概率是对总体而言。是某随机事件发生的可能性大小的数值,常用符号P 表示。取值范围0~1。 在统计学中,误差的种类有 A .标准误差 B.计算误差 C .系统误差√ D .随机测量误差√ E .抽样误差√ 统计学上的误差主要有 A. 系统误差 B.标准误差 C.随机测量误差 D.抽样误差 E.计算错误误差 算术均数: 简称均数,用于描述对称分布或近似正态分布的资料。 描述正态分布资料集中趋势的指标是 A. 百分位数 B.中位数 C.算术均数 D.几何均数 描述正态分布资料集中趋势的指标是 A. 中位数 B.几何均数 C.算术平均数 D.标准差 有9名健康成人的空腹胆固醇测定值(mmol/L)为,,,,,,,,。求算术均数。 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64, 1:128,求平均抗体效价。 n 5. 61+3. 96+3. 67+4. 99+4. 24+5. 06+5. 20+4. 79+5. 93= 9 43. 45= 9 =4. 83(m m ol /L ) X = G =lg -1( 血清抗体平均效价为1:16 注意:变量值中不能有0;不能同时出现负数和正数;若全为负数,计算时先把符号去掉计算 中位数(median, M):可用于任何分布的计量资料 有7名正常人的血压(舒张压)测定值(mmHg )为:72,75,76,77,81,82,86,87求中位数。 M =(77+81)/2=79 一组从小到大排列的定量变量,位次居中的指标是 A .算术均数 B.几何均数 C.中位数 D.百分位数 描述离散趋势的指标是 A. 标准差 B.中位数 C. 几何均数 D.算术均数 n lg 2+lg 4+lg 8+lg 16+lg 32+lg 64+lg 128 =lg -1() 7 =lg -1(1. 204) =16 lg X ) 方差(variance )与标准差(standard deviation):表示数据的平均离散情况,常用于描述服从正态分布的资料的离散程度。 某地20岁男子160人 某地不同年龄女童身高(cm )的变异程度 统计表的基本结构与要求:标题、标目、线条、数字4部分组成。表中数字区不插入文字,不列备注项。必须说明者表“*”号等,在表下方说明。 统计表的基本结构为 A .标题、横标目、纵标目、线条 B.标题、横标目、纵标目、数字 C .标题、横标目、纵标目、备注 D.标题、标目、线条、数字 统计表的基本构成有 A .标题 B.横标目 C.纵标目 D .线条 E.数字 统计表内不列的项是 A. 标目 B. 线条 C.数字 D.备注 制图的基本要求 (1)根据资料的性质和分析目的,选择合适的图形。 (2)基本结构:标题、标目、刻度、图例4部分组成。 标题:一般放在图的下方,左侧加图号 标目:分为横标目和纵标目,分别表示横轴和纵轴数字刻度的意义 刻度: 图例:说明统计图中各种图形锁代表的事物。放在右上角或下方中间 比较两家医院15年床位数的增加速度,可选用的统计图是 A .构成图 B .直条图 C .线图 D .直方图 某医院拟表示一年中各月病床使用率的变化趋势,应选用的统计图是 A .普通线图 B .直条图 C .散点图 D .直方图 比较某地2001年和2011年结核、心脏病和肿瘤的死亡率,可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图 分析某医院1998年住院病人5种疾病构成比可选用的统计图是 A. 单式直条图 B. 复式直条图 C.圆图 D. 线图 分析某医院1998年和2008年住院病人5种疾病构成比可选用的统计图是 A .单式直条图 B.复式直条图 C.百分比条图 D.统计地图 观察某地十年肺结核患病率的变化趋势,可选择的统计图是 A. 条图 B.圆图 C.线图 D.直方图 比较某地2001年和2011年结核、心脏病和肿瘤的死亡率,可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图 假设检验的基本步骤 1. 建立假设检验,确定检验水准 (1)根据统计推断目的提出对总体特征的假设 无效假设,或称为零假设,记作H0,即假设差异是由于抽样误差所致,总体参数相同 备择假设,记作H1,即差别不是由于抽样误差所致,总体参数不同 (2)确定检验水准亦称显著性水准,用α表示 2. 选定检验方法,计算检验统计量(卡方、t 值、F 值) 3. 确定P 值,做出统计推断结论 注意:假设检验是针对总体而言的 假设检验的注意事项 1.. 检验方法的正确选择 定量资料 两个独立样本均数比较:t 检验 多个独立样本均数比较:方差分析 配对设计:配对t 检验 随机区组资料:随机区组设计方差分析 2. 结果的解释:差别有统计学意义与有无实际意义的关系 I 型错误(第一类错误):指拒绝了实际上是成立的H0。用α表示。 II 型错误(第二类错误):指不拒绝实际上是不成立的H0。用β表示。 1. 流行病学研究的对象是( ) A.病人 B.健康人 C.人群 D.亚健康人 E.亚临床的人 下列哪一项是分析流行病学方法( ) A.横断面研究 B.生态学研究 C.疾病监测 D.病例对照研究 E.社区干预试验 有学者通过调查肺癌病人和非肺癌的人过去的吸烟情况,来研究吸烟和肺癌的关系。这种方法称为: A.现况调查 B.描述性研究 C.筛检试验 D.病例对照研究 E.队列研究 有学者对某人群进行了高血压的调查,获得了该人群高血压的患病率,并对不同年龄组的高血压患病情况进行了分析。这种调查研究属于: A.探讨疾病的病因 B.探讨发病机制 C.描述疾病的分布 D.研究疾病自然史 E.疾病筛检 计算患病率的分子是( ) A .观察期间某病的新发病例数 B.观察期间某病的新旧病例数 C .观察期间之后某病的患病人数 D.观察期间某病的暴露人口数 E .观察期间所有人口数 某地区在1个月内进行了糖尿病的普查,可计算当地糖尿病的( ) A .发病率 B.死亡率 C.患病率 D.二代发病率 E.罹患率 下面哪一个公式用于计算发病率(E ) A .(受检者中阳性人数/受检人数)×100% B.(受检者中阳性人数/同期暴露人数)×100% C .(受检者中阳性人数/受检者人数)×100% D.(受检者中阴性人数/受检者人数)×100% E.(某一时期内新病例数/同期暴露人数)×100% 一个地区通过首次高血压普查,可计算当地的( ) A .高血压患病率 B.高血压罹患率 C.高血压发病率 D.高血压病死率 E.家庭续发率 某地区1960年度疫情资料统计,狂犬病患者100人全部死亡,此资料可计算 A .粗死亡率 B.死亡专率C .标化死亡率 D.病死率 E.此资料不全难以计算 下列叙述中,不属于病例对照研究优点的是( ) A .资料收集后可在短时间内得到结果 B.特别适用于罕见病的研究 C .一次调查可同时研究一种疾病与多个因素的关系 D.可直接获得发病率资料 E .所需研究对象的数量相对较少 病例对照研究中的调查对象是( ) A .病例组是怀疑患有欲研究疾病的病人,对照组是未患该病的人 B .病例组是具有某种暴露的人,对照组是未有该暴露的人 C .病例组是确诊患有欲研究疾病的病人,对照组是未患该病的人 D .病例组和对照组均是具有某种暴露的人 E.病例组是确诊患有欲研究疾病的病人,对照组是怀疑患有该病的 在病例对照研究中,若病例组某危险因素暴露史的比例在统计学上明显高于对照组,则表明( D ) A .该因素与疾病有统计学关联 B.该因素与疾病有因果关联 C .该因素是疾病的病因 D.该因素与疾病无关联 E.该病由该因素引起 下列关于病例对照研究特点的说法中,正确的为( C ) A .暴露与疾病都是现在的情况 B.能够确证因素与疾病的因果关联 C .由因及果的研究 D.需要随机分组 E.属于观察法 OR 主要应用于( A ) A .现况研究 B.生态学研究 C.现场试验 D.病例对照研究 E. 队列研究 属于病例对照研究缺点的是( E ) A .不能分析疾病与多种因素的关联 B.不能估计RR C.样本含量要求很大 D .容易产生医德问题 E.回忆信息时,易出现错误 下列说法中,不属于队列研究特点的是( B ) A .由因及果,前瞻性研究 B.属于描述性研究 C.能同时研究一种因素与多种疾病的关系 D .需要设立对照组 E.因果关联的说服力大于病例对照研究 队列研究中的研究对象为( C ) A .在一般人群中选取有、无某暴露因素的两个组 B.在患有某病者中选择有、无某暴露因素的两个组 C .在未患该病人群中选择有、无某暴露因素的两个组 D.患有某种疾病的人群随机分成的两组 E .一组患有某种疾病者,一组为未患有该种疾病者 在队列研究中,暴露组的疾病发病率与对照组的疾病发病率的差值称为 ( A ) A . AR B. RR C.OR D.PAR E. AR% 队列研究属于( B ) A .相关性研究 B.分析性研究 C.描述性研究 D.理论性研究 E.实验性研究 在队列研究中,估计某因素与某疾病关联强度的指标为( E ) A .总人群中该病的发病率 B.暴露人群中该病的发病率 C .人群中危险因素的暴露率 D.OR E. RR 在队列研究中,研究对象的分组原则是按( A ) A .是否暴露于某因素分组 B.随机分组 C.是否患病分组 D.人为随意分组 E.领导意图分组 属于实验流行病学特征的是(E ) A .由果及因,回顾性研究 B.属于观察法 C.获得因素与疾病联系强度的指标主要为比值比 D .不能确证因果关联 E.人为施加干预措施 关于临床试验中的对照组,正确的说法为( B ) A .是人群中的非患欲研究疾病者 B.是患欲研究疾病者,但在处理上不同于实验组 C .不具有某种暴露因素的人 D.与患欲研究疾病者同时入院的其它患者 E.所欲研究疾病的轻型患者 多选题: 下列所述中属于抽样调查优点的有( A C D ) A .工作量小 B.工作量大 C.省时间和人力、物力 D.工作易做到细致 E .特别适用于患病率很低的疾病调查 属于队列研究缺点的为( A C D ) A .观察时间长,花费大 B.易出现回忆偏倚 C.不宜用于研究发病率很低的疾病 D .设计的要求高,实施复杂 E.不能计算发病率、死亡率等 属于实验流行病学方法的有( A/C ) A .临床试验 B.普查 C.社区试验 D.队列研究 E.个体试验 反映诊断试验可靠性的指标是( E) A .灵敏度 B.特异度 C.约登指数 D.阳性似然比 E.符合率 为提高诊断试验的灵敏度, 对几个独立试验可(B ) A .串联使用 B.并联使用 C.先串联后并联使用 D .要求每个试验假阳性率低 E.要求每个试验特异度低 某病早期治疗效果好,漏诊后果严重,对此病的试验诊断应(A ) A .提高灵敏度 B.提高特异度 C.降低诊断的截断值 D.提高阳性预测值 E.提高阴性预测值 诊断试验的真实性是指(A ) A .被试验的测定值与实际值的符合程度 B.是重复试验获得相同结果的稳定程度 C .是观察者对测量结果判断的一致程度 D.是试验结果表明有无疾病的概率 E.指病例被试验判为阳性的百分比 流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素,用以预防科控制疾病、促进健康的学科。 流行病学研究的方法: 观察性研究 实验性研究 理论性研究 观察性研究: 描述性研究 (横断面研究(现况调查)比例死亡比研究 生态学研究) 、 分析性研究 (病例对照研究 队列研究(随访研究)) 实验性研究:临床实验、现场试验、社区干预试验和整群随机试验 理论性研究:流行病学方法研究理论流行病学 比例:是表示同意事物局部与总体之间数量上的比值,分子和分母的单位相同,且分子包含于分母之中。(构成比) 某医院住院病人中有15%的胃癌患者,该15%是: A. 患病率 B.发病率 C.构成比 D.相对比 例:某病患者409人,其中男性170人,女性239人,男女性构成比见右侧表所示。具体计算: 表 409名患者性别构成 男性患者数 男性构成比=⨯100% 男女性患者总数170 =⨯100%= 170+239 构成比的特点是各组成部分的构成比之和为100% 例如,某年某地出生婴儿中,男性婴儿有185人,女性婴儿有176人,则: 出生婴儿性别比= 男性婴儿数女性婴儿数 = 185176 = .比或相对比:是两个相关指标之比,说明两指标间的比例关系。两个指标可以是性质相同,如不同时期发病数之比;也可以性质不同,如医院的门诊人次与病床数之比。常用倍数或百分数表示。 两指标可以是绝对数、相对数或平均数。 相对比= 甲指标 ⨯100%)乙指标 3.率:表示一定时间内,实际发生某现象的例数与可能发生该现象的总例数之比,用以说明某现象发生的频率或强度,常用百分率(%)、千分率(‰)、万分率(1/万) 或十万分率(1/10万)等表示。 率= 说明某现象发生频率或强度的相对数是 某现象实际发生的例数 ⨯k 可能发生该现象的总例数 A. 率 B.构成比 C.相对比 D.百分位数 发病率 发病率= 一定时期内某人群某病新病例数 ⨯k 同期暴露人口数 用途:反映该病的风险。用来描述疾病的分布、探讨发病因素、提出病因假设、评价防治效果 1.描述疾病的发病率指标,计算时分子应为 A .新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2.发病率的分子是 A .患病人数之和 B.新病人数之和 C.感染人数之和 D.死亡人数之和 1. 描述疾病的患病率指标,计算时分子应为:B A. 新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2. 患病率:又称现患率或流行率。 患病率= 特定时间点某人群中某病新旧病例数 ⨯k 同期观察人口数 K=100%,1000‰,10 000/万或100 000/10万 时点患病率:调查时间一般在1个月内 期间患病率:调查时间超过1个月 影响因素:患病率=发病率×病程 用途:患病率通常用来描述病程较长的慢性病发生或流行情况 黄炳率与发病率的区别 1. 死亡率:指某人群在一定期间内(1年)死于所有原因的人数在该人群中所占比例。 K=1000或100 000/10万 死亡率= 某时期内死亡总数 ⨯k 同期平均人口数 2. 病死率:在一定时间内患某病的全部患者中因该病而死亡的比例。多用于病程短的急性病。表明疾病的严重程度。 病死率= 某时期因某病死亡的人数 ⨯100% 同期患某病的人数 3. 生存率:又称存活率。指患某病的人(或接受某种治疗措施的患者)经n 年随访,到随访结束时仍存活的病例数与随访病例的总数之比 n年生存率是评价慢性、病死率高的疾病远期疗效的重要指标。 n 年生存率= 1. 相对危险度(RR )或率比:指暴露组发病率与非暴露组发病率之比。反映了暴露于疾病的关联强度。RR= Ie/I0 RR=1,暴露与疾病无联系 RR1,暴露与疾病存在正联系(暴露是危险因子) 例:Doll 和Hill 调查了英国35岁以上男性吸烟习惯与肺癌死亡率的关系,不吸烟人群的肺癌死亡率为‰,中度吸烟者(15-24支/日)的肺癌死亡率为‰。RR= 说明吸烟者死于肺癌的危险性是不吸烟者的倍。 2. 比值比(OR ):又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。 发病率(死亡率)很低;研究对象代表性好—— OR≈RR 归因危险度(AR )或率差(RD ):是指暴露组发病率与非暴露组发病率之差,反映发病归因于暴露因素的 随访满n 年后仍存活的病例数 ⨯100% 随访满n 年的该病病例数 程度。AR= Ie-I0 =RR×I0-I0 =I0 (RR-1) AR 意义:暴露者中完全由某暴露因素所致的发病率或死亡率。 例:AR=‰‰=‰。表明在每日吸15-24支香烟当中由于吸烟所致的肺癌死亡率为‰ 归因危险度百分比(AR%):指暴露人群中有暴露因素引起的发病在所有发病中所占的百分比。 AR%= (Ie-I0)/Ie×100% 例:AR%=()/×100%= 表示在每日吸15-24支香烟者中有的肺癌是由吸烟所致。 现况调查:在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾病的关联。 现况调查的种类 (!)普查:指在特定时间内,对特定范围人群的每一个成员所进行的调查,也称全面调查。 (2)抽样调查:是从总体人群中随机抽取有代表性的一部分人(样本)进行调查,以样本结果来估计总体人群的疾病或健康状况的一种调查方法。 抽样方法:非随机和随机抽样 现况调查优缺点 (1)优点:研究结果有较强的推广意义;可形成同期对照;是病因探索中的基础性工作 (2)局限性:难以确定心因后果;不能获得发病率资料;有可能低估患病水平 队列研究的原理是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n 个群组或队列,追踪观察一段时期,比较两组或各组发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 1. 队列研究主要用于: A .研究发病机理 B.研究职业种类 C .验证某种暴露因素对发病率或死亡率的影响 D.研究个体基因突变性 队列研究的特点: 时序是前瞻性研究 观察性对比研究 暴露组否分组 研究方向由“因”推“果” 追踪观察的两组间的发病率或死亡率差异,RR=[a/(a+b)/[c/(c+d)] 1. 队列研究的特点有 A. 属于观察法√ B.属于实验法 C.设立对照√ D.研究方向由因推果√ E.研究方向由果追因 队列研究的优缺点: (1)优点: 研究对象在疾病发生前按暴露情况分组且进行随访,所获资料完整可靠,无回忆偏倚可直接计算发病率或死亡率,因而能计算相对危险度和特异危险度等指标,直接估计暴露于疾病的联系强度大小可同时研究一种因素与多个疾病的关系, 有助于了解疾病自然史。暴露因素与疾病的时间先后顺序清晰,因此论证因果关系的 能力强。暴露因素的作用可分等级,便于计算剂量-效应关系。样本量大,结果较稳定。在有完整资料记录的条件下,可做回顾性历史队列研究。 (2)局限性: 观察时间长,费人力、费钱,不能在较短时间内得到结果;准备工作繁重,设计的科学性要求高,实施难度大。暴露人年计算工作量较为繁重。不适于研究发病率很低的疾病。由于随访时间长,所以容易产生失访偏倚 多选 1. 队列研究的用途有( ) A. 用于验证某种暴露因素对发病率的影响 B.用于传染病发病机理研究 C.用于检验职业人群 D. 用于人群干预研究 E.描述疾病的自然发展过程 病例对照研究: 选择患有所研究疾病的患者作为病例组,同时选择未患该病的人作为对照组,调查两组人群发病前对某个(些)因素的暴露状况,比较两组暴露率和暴露水平的差异,以研究该疾病与这个(些)因素的关系。 病例研究的优点 1. 在疾病发生后进行,研究开始时已有一批可供选择的病例 2. 研究对象按发病与否分成病例组与对照组 3. 研究因素的暴露状况是通过回顾获得的 4. 由果及因的推理顺序 5. 比较两组暴露率或暴露水平,分析暴露于疾病的联系。OR=ad/bc 1. 病例对照研究的因果顺序是:c A .由因追果 B.由因追因 C.由果追因 D.由果追果 2. 病例对照研究在时间上属于: b A. 现况性研究 B.回顾性研究 C.前瞻性研究 D.回顾加前瞻性研究 实例 目的:A 型性格与冠状动脉病变的关系 研究对象: 病例组:经冠状动脉造影确诊的冠心病患者 对照组: 医院对照(内对照):冠状动脉造影正常+ECG平板运动试验阴性的其他科室住院者 人群对照(外对照):中型企业健康普查人群完全随机抽样( ECG平板运动试验阴性) 信息采集: 信息采集: A 型性格:全国冠心病与A 型行为类型协作组1985年制定的《A 型性格问卷》,按确诊冠心病前两年的情况 其他危险因素:一般人口学特征,既往高血压、高血脂等心血管疾病史及家族史,烟酒及膳食习惯等。 冠状动脉病变指数:按造影所示病变部位及支数、狭窄程度及范围,结合美国心脏病协会规定的节段法进行评判。 研究对象例数:实际分析339人 病例组139人 医院对照83人 人群对照117人 主要结果: 病例组与医院和人群对照组之间在年龄、性别、居住地及工作年限、职业构成等方面经检验,均无显著性差异,说明各组间可比性较好 A 型性格发生冠心病的危险性: 男性:OR 值(95%CI:) 女性: OR值(95%CI:) 性格评分等级与冠状动脉病变的关系:呈明显剂量-效应关系 控制和调整了各因素的混杂后,A 型性格与冠状动脉病变的发生依然密切相关 表6-2 性格类型与冠状动脉疾病程度间关系的对比分析 实验性研究:又称干预研究,基本性质是研究者在一定程度上掌握着实验的条件,主动给予研究对象某种干预措施。 主要类型:临床试验、现场试验、社区试验、类实验 实验研究的特点: 1. 前瞻性研究:干预在前,效应在后 2.随机分组: 3. 设立对照组:来自同一总体 4.有干预措施:容易产生伦理学问题 临床试验是按实验法,运用随机分配的原则将试验对象分为试验组和对照组,给实验组某种治疗措施,不给对照组该措施或给予安慰剂(placebo ),经过一段时间后评价两种措施产生的效应,从而评价临床治疗、 预防措施的效果和进行病因研究。 诊断指标: 客观指标:仪器测定指标 主观指标:患者主诉 半客观指标:诊断者的主观感知(肿物的硬度、大小) 诊断标准:生物统计学方法、临床判断法、ROC 曲线法 真实性:有效性、效度或准确性。是指待评价试验所获得的测量值与实际情况(金标准测量值)符合程度。 灵敏度(真阳性率) 特异度(真阴性率) 误诊率(假阳性率) 漏诊率(假阴性率) 似然比 正确诊断指数 练习题 提高诊断试验灵敏度的办法是( ) A. 串联试验 B.并联试验 C.先串联后并联 D.先并联后串联 筛检试验:通过快速的检验、检查或其他措施,将可能有病但表面上健康的人,同那些可能无病的人区分开。 筛检的主要用途: 早发现临床前期的可疑患者(二级预防) 发现高危个体(一级预防) 流行病学监测 了解疾病的自然史 小王是北京海淀区万寿路社区卫生服务中心的一名健康管理师,需要针对本社区老年常见慢性病患者进行健康管理,计划两年之内增加高血压、糖尿病等的检出率、建档率和随访干预覆盖率,五年之内减少因高血压、糖尿病发病和死亡等指标,那么他应该从什么地方开始动手呢? 该小区人群一般人口学特征(如年龄、职业、婚姻状况、性别等)情况如何分布? 该小区人群常见慢性病(高血压、糖尿病、周围血管疾病、冠心病等)患病率如何? 影响这些慢性病患者的危险因素有哪些?如何进行干预? 社区中高血压、糖尿病患者的远期心血管病(主要是冠心病和脑卒中)发病和死亡风险如何,怎样预测?在进行12个月的干预后,如何评价效果?

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

医学论文统计学方法应用的错误解析论文

摘 要: 统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性,在研究设计时的错误应用会否决整个科研研究方案,基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用,提高单篇文献的质量和学术水平。

关键词: 统计学方法;医学论文;解析

一、引 言

医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。

关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。

1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。

2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<;,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的'研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。

3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。

四、小 结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。

参考文献:

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

[4] 张春军,董凯.网络信息时代加强医学期刊编辑的信息素养[J].牡丹江医学院学报,2011(32).

医学论文中统计学图标

医学论文的格式

医学论文写作是一项严肃、意义重大的工作、是交流经验,传播科技成果,不断提高临床诊治和科研水平的重要组成部分。下面是我整理的医学论文的格式,希望对大家有帮助!

1、论文标题:

医学论文标题应简明确切反映所写论文的内容,一般不要采用副标题,如有可能,也尽可能不使用代号。文章标题控制在20个字左右(以内)。同时,对与论文所使用的“英文题目”、“摘要”、“关键词”与“作者名拼音”,使用时中英文必须一致。

2、作者单位

作者单位应按照顺序写在文章标题下一行,在单位后面用括号注明邮政编码,然后空一格再写上论文作者及姓名,此处,投稿送排后应保证作者顺序不再改动。

3、论文摘要

所有论文的摘要(含医学论文)均采用结构式的文摘,按照目的、方法、结果、结论四要素写,字数应在300字左右。

4、论文关键词

多选用3-8个关键词,具体可参考MesH(即《医学主题词注释字须表》)中的主题词,如果MesH词表中空缺,则可使用自由词(自定义词)。

5、图表

凡是在论文文字中能表述或说明的'内容建议或尽量不使用表图,另外,对于正文、表和图3者中的数据不应重复。论文中涉及的统计表应在投稿时应在纸上绘出并附 在所投稿件中,以便审阅。表中要有表题(表的标题),图有图题(图的标题)以及各自的图标或序号。论文图标应采用三线表或王字表,表中数据应多加检查,务 必核实,准确无误,数字小数点后应最少保留一位。

对于表中需要说明的问题或注释可采用*,2个以上说明依次为**、***表示,在表的下方,加“注:……”。另外,对于图的坐标需刻度均匀,设计准确,坐 标轴上有数值,不用箭头。图表要用绘图笔、硫酸纸等绘制,做到曲线均匀、圆滑,图面清洁、图中数字与符号应在打印后植入,不可机打或打印前写入,纵横坐标 应同时注有量和单位,例如t/h、t/min。

另外,对于统计学上的处理结果应用用P<、P<、p>表示。

6、医学名词、药物名称

论文中使用的医学名词与药物名称要注意稿件前后统一,应使用全国自然科学名词委员会公布的各科名词,不能随意缩写、更改,如果所用名词太长,文件中又多次重复使用,可在第一次使用时,在全名后加上括号并注明缩写,如:游行性脑脊髓膜炎(流脑)。

对于在论文中使用的“药物名称”则应以《中国药典》与《中国通用药名》二者为准,不可随意使用。

7、计量单位

论文中出现的计量单位需用我国法定计量单位,而标点符号和数字用法等均按要按国家标准执行。

8、标题序号

医学论文中的标题序号应全部靠左并顶格写,按照1,,,依次排序。然后紧跟其后空一格写标题,仅限分4级,不可再分。在标题后再空一格写正文。对与正文内序号宜用①……②……等表示。

9、论文讨论

对于论文讨论部分,要求重点阐述论文中新的发现、得出的结果与观点,但请勿作文献综述,不可重复在讨论中表达己叙述过的内容。对于论述应联系本论文的与研究结果,并应该与其所报告的相联系,当理由充足时,则可恰如其分地提出论文的建议或设想。

例如:“本结果与文献(2)结果相符”则应写成“本结果与文献[2]结果相符”。

10、参考文献

论文中的参考文献部分为极易出错的地方,医务人员在投稿时务必引起重视。

论文中的参考文献应只限作者阅读过、引用的近期公开出版的主要文献,外文文献限定为近5年内,中文文限 为近3年内,不宜采用过早的文献内容。文献顺序应按文中首次出现的次序依次编号,在正文右上角部分用圆括号注明,如“王书中,李国坚,等()报 道”(()用上标!应网页排版特殊性,本处暂无法列出,请注意!)。未公开发表的资料和内部刊物均不列入参考文献中。

参考文件具体格式

“参考文献”4个字应另起新段,所列文献按次序另起新段,具体采用格式如下:

期刊 作者(0~3个作者应全部列出,3个以上作者只写前3个(作者之间用“,”分隔开),在作者后面加“,等。”或者是“,et cd”)。文章标题,所引用的刊名,出版年;卷(期):起页~结束页。

书籍名称 作者·书名·版本(第一版可不写)。出版地:出版者,年。起页~结束页。

医学统计学中常用的符号可以使用LaTeX语言进行输入,以下是一些常用符号及其对应的LaTeX代码:1、$\mu$:表示总体均值,LaTeX代码为\mu。2、$\overline{x}$:表示样本平均值,LaTeX代码为\overline{x}。3、$\sigma$:表示总体标准差,LaTeX代码为\sigma。4、$s$:表示样本标准差,LaTeX代码为s。5、$n$:表示样本大小,LaTeX代码为n。6、$r$:表示相关系数,LaTeX代码为r。

医学统计学当中用星号表示的一般是χ2检验。

医学统计学当中用星号表示的一般是χ2检验,其中χ2检验是反应变量和分组变量都为二分类变量或多分类(无序)变量时,两变量间关系的分析方法。

所谓等级资料是将观察单位按某个指标量的大小分成等级或按某种属性的不同程度分成等级后分组计数。同学们要明白其中分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。

医学论文统计方法之X2检验

医学论文中计数资料最常用的统计方法为X2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法,避免统计方法选择与使用不当。

同学们要注意的是必要时,研究设计阶段也应该有统计专业的人员参与,从最源头进行控制和修正,以免降低研究的水平,以至于造成整个研究的失败。

医学论文统计指导

缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

秋风送爽,也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来,说不定马上你就会用到了。编者语针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及这一种或几种方法),那到底该采用何种统计学方法呢?今天我们就此来聊聊。一、拿到数据开始分析之前,一定要进行数据类型的划分(图1),因为不同数据类型资料,描述的方式不一样,统计学方法也不一样。图1 统计资料的类型举个例子(表1):表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析(描述与统计推断)1.计量资料特点:每个观察单位的观察值之间有量的区别,有单位;描述形式:最常见采用“X±S”(一般文献中经常见到),用算数均数描述其平均水平,用标准差描述其离散程度。如果遇到数据“特别变态”(特别是标准差大于算数均数),就采用Md(P25,P75)(Md为中位数,P25和P75为四分位数)(表2)。正态分布检验请大家复习:医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计量资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是满足正态方差齐性时采用t检验(注意t检验有三种形式哦!)或单因素方差分析,不满足时采用秩和检验(图2)。图2 计量资料统计方法的正确选择提醒两点:① 如果样本数据不服从正态分布的话,那就只能用非参数检验(秩和检验),但其检验效能低于参数检验(t检验或方差分析)。所谓检验效能低就是本身有差异,却没有能力发现其差异。② 如果是两组以上样本的数据时,不能采用t检验(会导致假阳性错误概率增加),应该采用方差分析。若方差分析的P<,需再进一步两两比较,常用的方法为LSD法或SNK法(注意依旧不能采用t检验)。在上两讲内容中我们已经学过t检验(医学科研课堂丨统计说说(二):你的t检验做对了吗?)和方差分析(医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析)了,至于秩和检验,我们以后会逐步介绍滴。多因素分析一般采用回归分析,主要是线性回归分析,以后会给大家介绍此方法。2.计数资料特点:无序分类,同类别中各观察单位之间没有量的差别,但各类别间有质的不同,各类别互不相容。其中二分类一定是计数资料(例如性别只有男/女之分,是否继发某种疾病只有继发/未继发之分),而多分类满足分类在性质上没有程度等级上的差别,即为计数资料(例如婚姻状况包括未婚、已婚、离异、丧偶,就属于多分类,但各分类没有程度等级差别,因此为计数资料,尿糖定性检测结果包括-、+、++、+++、++++,属于具有程度等级差别的多分类资料,就不属于计数资料,属于等级资料了)。描述形式:最常见采用“例数(%)”(一般文献中经常见到),主要要分清构成比(结构相对数)和率(强度相对数)的差别(表3)。而且在应用时,分母(就是样本量啦)一般不宜过小,分母太小不足以反映数据的客观事实,也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说:1.某地肺癌患者中男性A例,女性B例,则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种,总株数为A+B+C,其中一种致病菌检出株数为A,那么A/(A+B+C)就是构成比,即该种致病菌占总致病菌的比重或分布。3.某研究对患者(总例数为B)进行治疗,结果治愈的患者例数为A,则A/B即为率(可以理解为治愈率)。统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计数资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是多样本率比较,若卡方检验的P<,需再进一步两两比较,并进行Bonferroni校正,以控制假阳性(图3)。图3 计数资料统计方法的正确选择提醒两点:① 构成比是以100作为基数,各构成部分所占的比重之和必须为100%,故某组成部分所占比重的增减必影响其它组成部分的比重;② 构成比和率在实际应用时容易混淆,主要区别在分母上,所以应正确选择分母。多因素分析一般采用回归分析,主要是Logistic回归分析,以后会给大家介绍此方法。3.等级资料特点:属于多分类资料,满足多分类在性质上有程度等级上的差别,各分类属性按一定顺序排列(有序),即为等级资料。描述形式:最常见采用“例数(%)”(一般文献中经常见到),这和计数资料的描述大体相同,主要区别在于多个分类排列时一定要按照顺序进行(从小到大或从弱到强)。统计推断方法:等级资料的统计分析方法在单因素分析中采用非参数检验(秩和检验),当然对于双向有序R×C资料,也就说分组变量和结局变量都是有序(等级)的情况,构成比的比较采用卡方检验,程度的比较采用秩和检验,趋势关联性的比较用秩相关(也称等级相关)。多因素分析中采用有序Logistic回归。注意:分类变量(计数资料和等级资料)在软件分析操作时,要适当数量化处理(赋值),赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择(图4)。图4 常用基本统计学方法的正确选择今天的内容就到这里,同学们多多复习,有什么问题和不懂的可以在下面留言,我们会请刘岭教授一一解答。好了,让我们期待下一期吧!撰稿:刘岭 约稿编辑:刘芹排版:毕丽 审核:王东专家简介刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析 医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验 医学科研课堂丨统计说说(二):你的t检验做对了吗? 医学科研课堂丨统计说说(一):样本量估算是个什么东东?

医学论文统计学分析的知识你可以登陆:创新医学网 创新医学网上有医学论文统计学分析视频、医学论文写作辅导范文、医学论文写作视频、医学论文写作电子书等等,统计学分析的所有信息创新医学网上有很多资料,都是可以查看的。 卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中,经常遇到统计学方法使用不当等问题。 数理统计的基础是概率论,对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。一般统计上习惯把概率P≤或P≤认为是小概率事件[1]。当通过假设检验(显著性检验)获得P>时,认为是大概率事件,说明在这一次试验中很可能发生,因此接受假设,认为差异无显著意义(差异不显著)。

医学论文的统计学报告指南

缺失值的处理:缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。2、数据的预处理:实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述:确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析(primary analysis):指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

科学研究很早就已经从简单的定性分析深入到细致的定量分析,科研工作者要面对大量的数据分析问题,科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中,实验设计的方法直接决定了数据采取何种统计学方法,因为每种统计方法都要求数据满足一定的前提和假定,所以论文在实验设计的时候,就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别,其中最主要的就是统计方法和实验设计不符,造成数据统计结果不可靠。下面,医刊汇编译列举一些常见的可以避免的问题和错误:打开百度APP,查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中,最常见的此类错误就是实验设计是多组研究,需要对数据使用方差分析的时候,而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中,不同数据要采取不同统计处理方法,这就需要作者清楚地描述出每个统计值采用的是何种统计学方法,但在许多使用一种以上数据统计分析方法的医学论文中,作者往往只是简单地把论文采用的数据统计方法进行了整体罗列,并没有对每个数据结果分析分别交代具体的统计方法,这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性,即作者即使不看文章内容,也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字,缺乏直观的统计图或表;或者虽然也列出了统计表或统计图,但表或图内缺项很多,让读者难以从中提取太多有用的信息。另外,也有作者为了增加文章篇幅,同时列出统计表和统计图,造成不必要的浪费和重复。统计表的优点是详细,便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释,最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误,把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论,一定要把统计结果和临床实践结合在一起,这样才会避免出现类似的错误。至于回避阴性结果,只提供阳性结果,是因为不少作者在研究设计时,难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时,从一个方向的实验就下完美的结论,尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性,有时会刻意回避报道差异的不显著结果,不思考和探究差异不显著的原因和意义,反而会因此忽视一些重大的科学发现。

《统计学与应用》这本期刊上的文献,你可以去看看学习学习的

我也没做过,关注一下,希望可以找到答案!

  • 索引序列
  • 医学论文中的统计指标
  • 统计指标医学论文
  • 医学论文中统计学图标
  • 医学论文统计指导
  • 医学论文的统计学报告指南
  • 返回顶部