不用那么紧张,好象给教师送点$就比较容易了!
在答辩前老师会首先检验一下论文是不是学生自身的研究成果,是不是有抄袭和剽窃的现象。因此通常会提出以下这些问题:
1、“你是怎么想到要选择这个题目的?”
2、“你在写这篇论文时是怎样搜集有关资料的?”
3、“你写这篇论文时参考了哪些书籍和有关资料?”
在答辩开始前,答辩老师一般都会让学生介绍一下论文的大概内容,也就是这篇论文主要写的是什么内容。
可以叙述一下文章的整体框架,即这篇文章主要包括几个部分,每个部分各自写的是什么。
注意事项:
1、对文章内容要非常熟悉。
的学生将参加论文答辩,首先,必须有一个更深刻的理解他们的毕业论文的内容和一个全面的熟悉,这是回答毕业论文的深度及相关知识,并可能提出的论文答辩问题所做的准备。
2、答辩时一定要控制好自己的语速和仪态。
学生的毕业论文答辩一般都是第一次,语速快,容易导致毕业答辩委员会委员听不清,影响毕业答辩结果。因此,毕业答辩学生在论文答辩过程中一定要注意语速的流畅,有急有慢,有轻有重。
教育学毕业论文答辩自述
接地气的大学生活即将结束,毕业生都要通过最后的毕业论文,毕业论文是一种的检验大学学习成果的形式,那么什么样的毕业论文才是好的呢?以下是我帮大家整理的教育学毕业论文答辩自述,欢迎大家借鉴与参考,希望对大家有所帮助。
尊敬的各位老师,亲爱的同学们:
大家上午好!
我是20XX学前的xx,我的毕业论文题目是《浅谈幼儿数学学习兴趣的培养》。我的指导老师是曾老师,在我论文写作期间,曾老师给予了悉心的指导,这才使得我的论文能够如期的顺利完成。在此,我向曾老师表示衷心的感谢。
下面,我将这次论文的任务,目的,意义,所选用的资育和幼儿数学学习兴趣培养方面的资料,运用所学的学前心理学、学前教育学、幼儿数学教育等理论,结合自身幼儿教育实践对当前幼儿数学学习兴趣培养过程中存在的主要问题和幼儿数学学习兴趣培养的策略方面的资料,写出一篇合乎学士学位论文质量的文章。我选择《浅谈幼儿数学学习兴趣的培养》这一课题进行研究原因在于,我所去过的几所幼儿园中,幼儿数学学习现状并不尽人如意。集中教学中,幼儿的数学学习兴致并不高,情绪不愉悦。皮亚杰曾经说过:“所有智力方面的工作都要依赖于兴趣,兴趣是点燃智慧的火种。”试想,幼儿早期的数学学习兴趣开发慢了一步,学习兴趣都没有了,又怎能做到让幼儿现在或者是将来的全面发展呢?因此,我选择《浅谈幼儿数学学习兴趣的培养》的意义在于:有助于幼儿更好地适应下一阶段的学习。培养幼儿的好奇心,探究欲。激发幼儿思维的主动性,最终培养幼儿的学习兴趣。而我选用的资料主要有黄谨编写的学前儿童数学教育,张俊编写的幼儿园数学教育等文献,还在网上也收集了一些资料。
具体来说,我的论文是由幼儿数学学习兴趣培养的意义,幼儿数学学习兴趣培养过程中存在的问题,幼儿数学学习兴趣培养的策略这三部分构成的。第一部分由学习兴趣的含义,幼儿学习兴趣的特点,幼儿数学学习兴趣培养的意义构成。第二部分主要写了四个方面的问题,家长方面,幼儿园方面,幼儿园教师方面,幼儿自身发展所带来的问题。第三部分主要从四个方面着手,1是让幼儿在游戏操作中培养起对数学的学习兴趣。2是让幼儿在自我发现中培养起对数学的学习兴趣。3是幼儿教师通过讲解演示来提高幼儿数学的学习兴趣。4是融入美术元素来提高幼儿数学的学习兴趣。
通过本次的论文写作,一方面使我掌握了论文写作方面相关的技巧,另一方面也使我在培养育儿数学学习兴趣这一课题上有了新的认识与理解。但是由于我自身存在的知识储备方面的缺陷,使得文章中的相关论点还不够成熟,甚至存在错误观点的情形。对此,我热切希望能够得到各位老师的指导。
谢谢!
尊敬的答辩委员会主席、各位委员、各位老师、各位同学,上午好:
我提交的论文题目是《××》对题目的解读有两层含义:基于学生认知的视角;基于教师教的视角
论文的总体框架包括了五个部分
之所以选择该题目进行研究,主要是基于以下的考虑:
1、调查研究与教学实践表明:学生感到物理学习比较困难是不争的事实;而大量的研究结论对高中物理学习困难的归因分析并不到位,对学生的认知发展的认识评价也显得并不中肯。只有少数研究从认知的视角展开探讨,提供了深入研究的视角。
2、教学实践中,多样化的教学策略选择,既要遵循物理学科自身的独有规律,也要尊重学生现实的认知发展水平、兼顾学生潜在的认知发展可能
1、现实和理论上的困惑促使我们进行思考:学生的物理学习到底在哪些环节?陷入了怎样的困顿?我们着重考察了两个方面,尝试从这样两个视角进行解读
2、并最终明确了本研究的方向:
文章基于对认知理论的梳理,结合实践研究,粗浅地将高中学生物理学习的认知过程划分为五个阶段:为什么要划分阶段?划分阶段是为了研究的方便,也有着切实的理论渊源;为什么是5个阶段?基于物理学科的特点,我们认为5个阶段可以比较好的分析学生的物理认知过程。
并基于这五个阶段,着重研究了在教学过程中,如何把握高中生物理学习的认知过程特点;并依据对高中学生认知过程的把握,对高中物理教学策略的选择,进行了理论和实践两个层面的探讨。
研究通过文献梳理,对现有的研究情况进行归纳概述,分析了目前高中学生认知过程的理论基础及教学策略的内涵。通过问卷调查、学习材料元分析等多种形式,为研究收集到了较为可靠的第一手材料,为研究的深入提供了必要的保障。
本研究的核心部分着重分析了高中物理概念教学、物理实验教学的实施中,高中学生物理学习的认知过程的阶段性特点,并进行了教学策略选择的相关研究。
时间关系,下面就以“高中物理实验教学中的认知过程把握与教学策略选择”的研究为重点向委员会作出汇报
综观物理实验所承载的对物理学科问题的研究,我们发现,基于物理实验的物理问题的研究过程一般主要由:
1、观察和感知研究对象的外显特征
2、体察和感悟构成实验现象的基本要素
3、策划和构建探究规律的实验方案
4、实验现象观察及数据的采集
5、完成实验意义建构
等等5个环节构成,对每个认知阶段基于学科的角度进行的深入的探讨(实验认知1张)比如在“物理实验表象化阶段”,着重对“属性为验证性的、属性为探究性的、基于假设或猜想的”三种属性的实验的认知过程进行了认知要素分析并以对高中学生的物理实验认知过程的把握实现高中物理实验教学策略的选择(实验策略1张)
比如“物理实验雏形化阶段的教学策略”,通过辨析学科原理和实验原理的异同,着重研究了引领策略和规划策略两个方面的策略考量
通过研究,我们认为:研究结论:(创新点1张)1、高中物理认知过程五阶段的提法源于对理论的梳理,并对实践中的经验进行了整合,是一次大胆的尝试;对高中生认知过程可以从这样五个阶段进行把握
2、高中物理教学策略可以基于高中学生物理认知的阶段性特征体现出应有的层次结构
不足之处也很明显,由于受到个人理论水平和教学经历的局限,研究视角显得狭窄,研究对问题分析得不够透彻,而且还有很多问题没有分析总结出来。
各位评委老师,同学们:
上午好!我是惠州学院中文系03本2班的学生陈显春。我的毕业论文的题目是《再论苏轼寓惠散文》,我的指导老师是曹国安讲师。我当初之所以选择研究苏轼的寓惠散文,主要是因为苏轼是我比较喜欢的一个作家,他是我国文化发展史上一位多才多艺的“全能”式的通才,在散文创作方面,他更是是继欧阳修之后,宋代诗文革xin运动的卓越领导者和文坛领袖,唐宋散文八大家之一。他的散文代表了北宋古诗文运动的最高成就。在苏轼四十多年的文艺创作生涯中,他写了大量的散文,含括了众多的体裁品类。苏轼在寓惠期间,不仅创作了大量的诗词,同时也写了不少散文作品,包括书信在内共有326篇。这些寓惠散文作品便成了我研究此课题的'最直接的文本基础。此外,在大学学习期间,我选修了苏轼寓惠研究方面的相关课程,对苏轼在贬谪惠州的相关事宜有一定的了解,也积累了一定的写作素材,有利于该课题的研究和写作工作的开展。
我的论文《再论苏轼寓惠散文》主要从苏轼的散文及其寓惠期间的时代背景入手,着手从苏轼的思想品格和人生哲学的角度,结合苏轼寓惠散文的具体作品进行分析,去探讨苏轼寓惠散文的内容题材和艺术特色,并尝试挖掘出苏轼寓惠散文的文化价值来。
具体说来,我的论文分为以下五个部分:
第一部分主要是总体上介绍苏轼散文创作及其在寓惠期间的贬谪生活经历和散文创作。
第二部分主要从四个方面去阐述苏轼寓惠散文的内容题材。苏轼寓惠散文取材广泛,内容丰富,蕴意深邃,感情真挚,充满理趣。或写景状物,寄寓深远;或谈经论道,释说世理;或叙古述今,慨叹人生;或缅怀亲友,诉说真爱。
第三部分主要从五个方面去阐述苏轼寓惠散文的艺术特色。苏轼寓惠散文,艺术形式灵活多变,笔锋清新自然,感情真挚恳切,寓意深远理趣,语言平淡简朴,具有独特的艺术特色。具体表现为:“文理自然,姿态横生,闲适旷达,浑然天成;情如泉涌,随物赋形;辞达;命题立意,新颖深刻,高远幽邃;沉稳渐熟,平淡简朴。”五方面的内容。
第四部分则简明地阐述了苏轼寓惠散文具有三方面的文化价值,包括:苏轼寓惠散文是后人研究苏轼寓惠经历的重要历史文献;苏轼寓惠散文是他晚年文艺思想、审美情趣发生转变的佐证;苏轼寓惠散文是苏轼所有散文的重要组成部分。
第五部分主要是毕业论文结束语。
虽然目前学术界在苏轼散文研究领域取得了较大的进展,近20年来,出版和发表了数量可观的散文研究的著作和论文,但在苏轼寓惠散文研究方面的论文还很少,除了零散的一些论文外,在这个方面几乎是个未开垦的处女地。因此进行苏轼寓惠散文研究具有现实的学术价值。虽然我的论文是《再论苏轼寓惠散文》,但与前人所写的《试论苏轼寓惠散文》相比,具有创新之处,就是我在阐述了苏轼寓惠散文的内容题材和艺术特色的基础上,更进一步指出了苏轼寓惠散文所具有的文化价值来。
在毕业论文的准备和写作过程中,我阅读了大量的苏轼寓惠散文方面的相关书籍和学术期刊论文,并参考了部分毕业论文总结样本。这得得益于我们学校图书馆丰富的参考书籍和中国学术期刊网中的专业论文。本论文经过一二三稿并最终定稿,在这期间,我的论文指导老师曹国安老师对我的论文进行了详细的修改和指正,并给予我许多宝贵的建议和意见。其中,我的论文题目就是在曹老师的提议下而最终拟定的。在这里,我对他表示我最真挚的感谢和敬意!
上就是我的毕业论文答辩自述,希望各评委老师认真阅读论文并给予评价和指正。谢谢!
1、选题尽量与日常工作结合起来一是便于收集数据,二是通过论文写作,对考生今后工作也有帮助,一举两得。反之,选一个与工作毫不相干的题目,从头开始,只能落得个事倍功半的结果。2、选择感兴趣的题目做论文是原创性的工作,因此,考生对某个方面感兴趣,会促使自己积极主动地探讨这方面的问题,强烈的成就动机将是做一篇优秀论文的基础。3、学术类文献综述类题目尽量不要选对所有参加自学考试的考生来讲,做学术论文是一件极具挑战性的工作,绝不是想象中那样轻松。自考过程中,考生可以通过强化复习通过考试,但做研究是完全不同的过程。只有在考生花费精力查阅大量文献后,才能知道可以做什么课题,还需要考生自己去收集数据,分析数据,撰写报告。综述性论文需要查阅大量的参考文献,从选题到提交论文,一般仅有3个月时间,真正码字可能就一两个星期的时间,在这么短的时间内要查阅到写综述的参考文献,难度相当大。时间短难度大,很少考生能将这些类型的论文写得好和有一定深度。不过,如果你实力很强,那也是可以的。当然,每次没能通过论文答辩的考生,绝大部分都是选择了这些雷区类型题目,希望大家吸取教训。
毕业论文写作的基本要求有哪些?
一.基本要求
1.独立性:毕业论文必须经护生本人努力、指导老师指导下独立完成,不得弄虚作假,抄袭或下载他人成果。
2.专业性:毕业论文的选题必须在护理学专业范围之内,并具有护理专业特点。
3.鲜明性:论文应主题鲜明,论题、论点、论据一致,中心突出,论据充分,结论正确;结构紧凑,层次分明,格式规范,文字流畅,切忌错别字。
4.标准化:论文中使用的度量单位一律采用国际标准单位。
5.三线表:论文中图表具有代表性,对所使用的图表要给予解释,统一标注编号和图题,放置在论文的适当位置中,图表要清晰、简洁、比例适当。
6.篇幅字数:篇幅在4000字左右(不含图表、参考文献等),不少于3500字。
7.字形大小:题目为小二号宋体,标题为四号宋体加粗,正文用宋体小4号字,倍行间距,A4纸打印,页边距:上、下各,左、右各,左侧装订,一式三份。护生同时应将毕业论文制作成Word电子文档(含初稿和正稿)上交学院。
完整性:论文形式应完整,按照以下顺序装订毕业论文。
(1) 论文封面(首页)
(2) 论文目录(次页)
(3) 开题报告
(4) 论文选题(论文题目)、中文摘要(目的,方法,结果,结论)、关键词。
(5) 论文正文(前言,方法,结果,讨论,结论)
(6) 参考文献
内容规范
(一) 中文摘要:
语言精练、明确。包括4个主要内容,研究类文章的摘要包括研究目的,方法,结果和结论,约200个汉字左右,能够反应文章的主要内容;综述类文章只要介绍文章的主要内容即可。
“摘要”二字下空一行打印摘要内容(四号宋体)。每段开头空二格,标点符号占一格。4个基本内容:目的、方法、结果、结论.
(二) 选题:
题目要简洁、明确、有概括性,字数不超过20个。自考本科生论文的选题在创新性上不做过度的要求,文题范围要适中,不要太广泛。如有很多考生的题目是XXX疾病的护理,这样的题目就太大,没有针对性,因为我们都知道一个疾病的护理包括很多方面,如急性发作期,稳定期,并发症等的护理,这样的题目没有针对性,不容易出现创新点。考生在选题时可以先抓住一个小的问题进行扩充到一个可以成文有一定创新性的范围。确定题目的同时要进行文献查阅,如果是已经发展完善的护理类别,考生就没必要在该方面浪费精力,应该及时改变方向。
根据护理专业特点,内容和性质,分为临床护理研究,社区护理研究,护理教育研究以及护理管理研究.选题指导见附件样本3.
(三) 关键词:
从论文标题中或正文中选出35个最能表达主要内容的词作为关键词,附在摘要之后,不超过5个,能够代表文中的高频词。摘要内容后下空一行打印“关键词”三字(四号黑体),其后为关键词(四号宋体)。关键词数量为4~6个,每一关键词之间用逗号分开,最后一个关键词后不打标点符号。
(四) 论文主体部分:正文
采用小四号或五号宋体.表格:表的编排一般是内容和测试项目由左至右横读,数据依序竖读,应有自明性。表应有编号,由“表”和从1开始的阿拉伯数字组成,例如“表1”、“表2”等。表的编号应一直连续到附录之前,并与章、条和图的编号无关。只有一个表时,仍应标为“表1”。表宜有表题,表题即表的名称,置于表的编号之后。表的编号和表题应置表上方的居中位置。如某个表需要转页接排,在随后的各页上应重复表的编号。编号后跟表题(可省略)和“(续)”,如所示:表1(续),续表均应重复表头和关于单位的陈述。
1.前言(引言)
是论文的开头部分,主要说明论文写作目的、现实意义、对所研究问题的认识,并提出本研究的重要价值和意义。前言应简明扼要,篇幅不宜过长。
2.研究类型和研究方法
介绍立题的依据,提出问题,本研究的目的和重要性,包括文献回顾的内容。
正文的篇幅在4000字左右(不含表格、程序、参考文献等),不少于3500字。论文形式分为三种不同的文体,研究型论文、综述和经验介绍型论文,每一种论文均有不同的要求。
第一.研究型论文
研究设计应包括如下的内容:
1) 研究对象和地点:有清楚的纳入和排除标准,符合研究目的
2) 抽样方法:科学合理,具有一定的代表性
3) 研究工具:具有较好的信、效度,符合研究目的
4) 观察指标:客观性,特异性,灵敏性,稳定性
5) 资料收集方法:准确,真实,完整
6) 分析方法:科学准确,如计量资料的统计描述、计数资料的统计描述、多个样本均数比较的方差分析、总体均数的估计和假设检验、X2检验等。
7) 伦理学考量:保密、隐私、自主、无伤害、尊重原则
8) 结果:
第二.综述型论文
主体内容:综合文献内容,归纳总结,有自己的想法,分层次进行叙述.对全文内容进行总结,指出研究的前景。
第三.经验介绍型论文
经验介绍:对自己的经验介绍详细,层次清楚
效果评价:有敏感的评价指标,结果使人信服,此部分不可缺少。
讨论:撰写的内容应与文章经验密切相关,分析能够结合理论,文献阅读充分,文笔流畅。
(五) 参考文献:
参考文献应另起一页,所列文件均空两个字起排,回行时顶格排,每个文件之后不加标点符号。⑴按论文中参考文献出现的先后顺序用阿拉伯数字连续编号,将序号置于方括号内,并视具体情况将序号作为上角标,或作为论文的组成部分。如:“……李××[1]对此作了研究,数学模型见文献[2]。”⑵参考文献中每条项目应齐全。文献中的作者不超过三位时全部列出;超过三位时一般只列前三位,后面加“等”字或“etal.”;作者姓名之间用逗号分开;中外人名一律采用姓在前,名在后的著录法。
写到这里,祝大家毕业快乐
一、要求:
1、学生必须严肃认真对待毕业论文的写作。
2、撰写论文的过程中,应充分发挥主观能动性。
3、遵从导师的指导,要在规定的时间之内完成能够反映自己最高水平的论文。
4、不可抄袭别人的研究成果,不可以让人代写论文。
5、四项基本原则:
①观点正确,中心突出;
②层次分明,论述清楚;
③论点明确,论据充分;
④结构严谨,语言简练准确,文字流畅。
6、五新:
注重新观点、新方法、新角度、新材料和新思路,但不要局限于此。
7、毕业论文有规定字数,一般本科8k以上,硕士3w以上,博士10w以上。
8、毕业论文要打印按顺序装订。
网页链接
统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!
医学统计学方法应用的错误解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
统计学专业毕业现状分析与对策研究
本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。
中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。
本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]
一、统计学专业毕业论文质量的现状分析
从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为。
从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。
从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的。二是数学专业教育和数学思维的研究,占总数的。研究统计学专业问题的毕业论文占绝大部分,比例为,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。
此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约分。
二、统计学专业毕业论文存在的问题
毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:
1.创新性不够
学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占,与实证型论文的比例为1︰,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。
2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象
有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。
3.相对前沿的分析方法利用较少
前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约,其他各统计方法使用的比例分别为:聚类分析为,判别分析为,相关性分析为,多元统计方法为,时间序列分析为,极少有学生使用教科书外的相对前沿的分析方法。
4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题
从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。
三、存在问题的原因分析
针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:
1.学生对论文不够重视
部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。
2.缺乏指导教师的针对性指导
指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。
3.学生的专业训练还不够
大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。
四、提高毕业论文质量的建议和 实践
1.加强毕业论文重要性的宣传,提高学生的重视度
加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。
2.选题和教师的科研项目相结合,提高论文的创新性
在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。
3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力
为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。
4.加强学生科技论文写作训练
加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。
5.实施激励措施,激发学生的兴趣和主动性
针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。
6.加强教师责任心,建立完善的机制
加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。
还有三个月就是毕业生们答辩的时间了,但是很多毕业生们目前连选题都还没有选好。时间紧迫,我立马为大家精心整理了一些大学数学系本科毕业论文题目,供毕业生们参考! 1、导数在不等式证明中的应用 2、导数在不等式证明中的应用 3、导数在不等式证明中的应用 4、等价无穷小在求函数极限中的应用及推广 5、迪克斯特拉(Dijkstra)算法及其改进 6、第二积分中值定理“中间点”的性态 7、对均值不等式的探讨 8、对数学教学中开放题的探讨 9、对数学教学中开放题使用的几点思考 10、对现行较普遍的彩票发行方案的讨论 11、对一定理证明过程的感想 12、对一类递推数列收敛性的讨论 13、多扇图和多轮图的生成树计数 14、多维背包问题的扰动修复 15、多项式不可约的判别方法及应用 16、多元函数的极值 17、多元函数的极值及其应用 18、多元函数的极值及其应用 19、多元函数的极值问题 20、多元函数极值问题 21、二次曲线方程的化简 22、二元函数的单调性及其应用 23、二元函数的极值存在的判别方法 24、二元函数极限不存在性之研究 25、反对称矩阵与正交矩阵、对角形矩阵的关系 26、反循环矩阵和分块对称反循环矩阵 27、范德蒙行列式的一些应用 28、方阵A的伴随矩阵 29、放缩法及其应用 30、分块矩阵的应用 31、分块矩阵行列式计算的若干方法 32、辅助函数在数学分析中的应用 33、复合函数的可测性 34、概率方法在其他数学问题中的应用 35、概率论的发展简介及其在生活中的若干应用 36、概率论在彩票中的应用 37、概率统计在彩票中的应用 38、概率统计在实际生活中的应用 39、概率在点名机制中的应用 40、高阶等差数列的通项,前n项和公式的探讨及应用 41、给定点集最小覆盖快速近似算法的进一步研究及其应用 42、关联矩阵的一些性质及其应用 43、关于Gauss整数环及其推广 44、关于g-循环矩阵的逆矩阵 45、关于二重极限的若干计算方法 46、关于反函数问题的讨论 47、关于非线性方程问题的求解 48、关于函数一致连续性的几点注记 49、关于矩阵的秩的讨论 _ 50、关于两个特殊不等式的推广及应用 51、关于幂指函数的极限求法 52、关于扫雪问题的数学模型 53、关于实数完备性及其应用 54、关于数列通项公式问题探讨 55、关于椭圆性质及其应用地探究、推广 56、关于线性方程组的迭代法求解 57、关于一类非开非闭的商映射的构造 58、关于一类生态数学模型的几点思考 59、关于圆锥曲线中若干定值问题的求解初探 60、关于置信区间与假设检验的研究 61、关于周期函数的探讨 62、函数的一致连续性及其应用 63、函数定义的发展 64、函数级数在复分析中与在实分析中的关系 65、函数极值的求法 66、函数幂级数的展开和应用 67、函数项级数的收敛判别法的推广和应用 68、函数项级数一致收敛的判别 69、函数最值问题解法的探讨 70、蝴蝶定理的推广及应用 71、化归中的矛盾分析法研究 72、环上矩阵广义逆的若干性质 73、积分中值定理的再讨论 74、积分中值定理正反问题‘中间点’的渐近性 75、基于高中新教材的概率学习 76、基于最优生成树的'海底油气集输管网策略分析 77、级数求和的常用方法与几个特殊级数和 78、级数求和问题的几个转化 79、级数在求极限中的应用 80、极限的求法与技巧 81、极值的分析和运用 82、极值思想在图论中的应用 83、几个广义正定矩阵的内在联系及其区别 84、几个特殊不等式的巧妙证法及其推广应用 85、几个重要不等式的证明及应用 86、几个重要不等式在数学竞赛中的应用 87、几种特殊矩阵的逆矩阵求法
Scipy库提供了一组用于计算离散型随机变量PMF和连续型随机变量PDF的方法。
简记为:多次进行的抛硬币实验。 特点:只有两种结果,每次试验独立,每次成功的概率相同。 成功次数为x的概率 :
可视化:
简记为:你搞了个抽奖活动,想知道一天内多少人中奖 特点:①事件在任意两个长度相等的区间内,发生一次的机会均相等。②事件在一个区间内发生与否与另一个区间没有关系,即相互独立。 在一段固定时间内,事件发生i次的概率 :
比较泊松分布不同参数λ对应的概率质量函数,可以验证随着参数增大,泊松分布开始逐渐变得对称,分布也越来越均匀,趋近于正态分布
几何分布:0-1分布首次成功 负二项分布:0-1分布第k次成功 超几何分布:从n种里抽指定种类的k个(不放回)
简记为:天女散花,每个面积上落下花的概率相等 记为:X~U(a,b)x在[a,b]区间内概率密度函数相等,等于1/(b-a)。
正态分布X~N(u,d) u:均值,d:标准差,通过下式进行标准化,转化为均值为0,标准差为1 的标准正态分布X~Z(0,1)。
不同均值和标准差下的正态分布对比:
一个特定事件发生所需要的时间,例如:快递点服务的时间间隔。 理解:(1)泊松分布表示的是事件发生的次数,“次数”这个是离散变量,所以泊松分布是离散随机变量的分布。(2)指数分布是两件事情发生的平均间隔时间,“时间”是连续变量,所以指数分布是一种连续随机变量的分布 关系推导如下
不同参数下,指数分布的对比:
Gamma分布:常用来描述某个事件总共要发生n次的等待时间的分布。
在Numpy库中,提供了一组random类可以生成特定分布的随机数
除了Numpy,Scipy也提供了一组生成特定分布随机数的方法
对于未知的总体分布,首先,提出假设,其次,根据统计量的显著性判定假设是否正确,最后得到答案。一般来说:原假设都为不存在差异,不存在关联。备择假设一般是存在差异,存在关联。 简单来说就是:显著接受备择假设,不显著接受原假设。 常用的统计检验包括:回归检验、比较检验、关联检验
简单先行回归、多重线性回归、Logistic回归
均值对比的假设检验方法主要有Z检验和T检验,它们的区别在于Z检验面向总体数据和大样本数据,而T检验适用于小规模抽样样本。 T检验的三种形式: 单样本:一般来说将变量与均值相比较,看有没有差异。 配对样本:实验前与实验后变量有没有差异 独立样本:一个变量的两组类别有没有差异
判断age 的均值是否为30
(3)独立样本t检验 判断来自两个不同抽样组的age 的均值是否相等
2.方差分析(ANOVA) 用于一个变量>=2组的分类情况下均值是否相等。
常用的是卡方检验,判断两组类别变量是相关还是独立
1.一类错误:拒真(通过alpha设置,显著性水平95%时,alpha=,说明有的概率拒真) 2.二类错位:信伪(无法通过错误率直接控制,一般有小样本和高样本方差导致) 3.两者你大我小不可调和。
概率论与数理统计课程的改革与实践论文
摘要: 讨论了概率论与数理统计课程教学改革的必要性与重要性,提出了课程改革的思路与原则,并总结了该课程改革与实践取得的效果。
Abstract: The necessity and importance of teaching reform of the course of probability and mathematical statistics were discussed, ideas and principles of curriculum reform were put forward, and the achieved effect of this curriculum’s reform and practice was summarized.
关键词: 概率论与数理统计;改革;实践
Key words: probability and mathematical statistics; reform; practice
概率论与数理统计是工程、人文、经济、社会等领域研究和处理随机现象的一门重要的随机数学,是目前数学专业大学本科阶段乃至其它理工类专业的唯一一门随机数学的必修课。自上个世纪六十年代引入大学课堂以来,它对于传承人类科学文明、培养人才的综合素质能力、解决实际问题的实践动手能力等起到了非常重要的作用。在信息社会高度发达的今天,随机数学的基本理论与方法作为信息采集、加工、利用的重要的理论基础和方法论基础,已经成为现代专业人才重要的必不可少的知识构成。文献[1-3]对该课程的改革与实践进行了探讨。本文就该课程的特点,结合我院(系)学生的特点就该课程改革与实践的必要性,具体思路与原则,以及改革实践的效果做一探讨。
1 概率论与数理统计课程教学改革的必要性与重要性
教学内容、手段、方法的陈旧反映出教育思想的落后,转变教育思想和更新教育观念是进行一切改革的先导。传统的数学教育理念重视教学过程的理论性,严谨性,逻辑性。但对于学生应用数学的理论和方法解决实际问题能力的培养从教和学两个侧面有所忽视。
现在,有一种流行的教育教学方法称为“案例教学”。“案例教学”就是通过实际问题的描述、假设、建模与求解,演示理论与方法的应用过程。数学上,这样的教学方式就是所谓的‘问题解决’的数学建模的思想。这种方法不拘泥于对理论和方法的阐述,更注重对理论与方法的实际应用过程的展示:包括问题的描述、所涉及的变量及其相互关系、问题的假设与简化、问题的数学模型的建立与求解。
信息社会的加速来临,在实际生活和科技工作中,海量、庞杂的数据不断产生,但是有用的信息并不会自动生成,它需要数学工作者利用数据采集、整理、分析与处理的工具,去发现有用的信息,以解决实际问题。数据采集与信息分析与处理的数学基础就是《概率论与数理统计》这门数学类专业的必修课程,这也是其它理工科专业的一门必修课程,只是对数学专业的`要求既注重理论又兼顾方法的实际应用,而对其它理工科专业,这门课程主要注重方法的应用。
但是,《概率论与数理统计》这门课程不同于以往学习的确定性数学,对于第一次接触这门课程的学生,理解起来会很困难,更不用说去利用它去进行统计数据的采集、整理、处理、分析等。因此,单从这点考虑,我们就有必要对其教学方法、手段等进行改革。从本门课程的应用目的角度来考虑,也必须进行改革,以增加实践性教学环节,培养学生应用概率论与数理统计的理论和方法解决实际问题的能力。
从培养学生利用数学的理论和方法、基于统计数据,建立和求解数学模型的能力的角度看,这完全符合现代大众化高等教育的目的,也符合我校的办学指导思想。
《概率论与数理统计》是其它随机数学的理论和方法的基础,这些课程是:多元统计分析、时间序列分析、随机过程,基于支持向量机的现代非参数统计学习方法等,为了这些知识和方法的学习与应用,我们也必须改变教学方式,为学生打下坚实继续学习的基础。
2 概率论与数理统计课程教学改革的思路与原则
通过以上的分析,我们认为概率论与数理统计课程的改革必须首先改变教学方法,抛弃那种古板的、填鸭式的、纯粹的重视逻辑推理而不重视应用的传统的教学观念,而采取不仅重视理论与方法的学习,为后继课程的学习打下良好基础,又能激发学生学习兴趣,同时还能培养学生应用所学理论和方法解决实际问题的能力的培养。
因此,概率论与数理统计课程的改革是一项系统工程,既要考虑课程本身理论与方法的学习,还要也兼顾后继课程的学习(有些课程是研究生的必修课),又要考虑学生应用理论与方法解决实际问题能力的培养,还要使得学生学习起来兴趣盎然。应用系统工程原理,从理论、实践、计算能力等全方位改革和建设,不能只重视某一个环节,而应从整体上思考。
在学时有限的约束条件下,我们必须改革教学内容,教学方法和教学手段,以期达到预期的改革目的。改革过程必须培养一批从事《概率论与数理统计》课程的课堂教学、实验教学的人才,积累改革的成果,不断总结经验。改革过程不会一番风顺,遇到非议也是可以理解的。但是,改革的决策一旦确定,就要毫不犹豫的进行下去。
3 概率论与数理统计课程教学改革的内容与措施
首先确定合理的教学学时,经过大家集思广益,制定了相应的教学大纲,使教学改革有法可依。为了达到上述改革目标,我们对教材的内容进行必要的增加和删减。由于,《概率论与数理统计》课程是大学生接触的第一门研究随机现象及其规律的数学学科,不同于以往的确定性数学,学生理解起来是相当困难的。为此,考虑到实际课时和课程的难度,在课堂教学中,借助于多媒体技术和计算机编程技术,增加了对一些随机现象的直观演示。删除掉一些陈旧的知识,比如关于一些定理的证明,或者保留这些证明,作为自学内容,提供给有能力学习的学生。这也起到因材施教的目的。经过多年的实践,编写了自己的教材《概率论与数理统计》(陕西师范大学出版社出版),该教材是国家面向21世纪规划教材。
为了达到培养学生利用计算机和数学软件,以及应用概率论与数理统计的理论和方法解决实际问题的能力,我们在自己编写的教材中,首次引入了SAS(Statistical Analysis Systems)高级程序设计语言。
为了使得课堂教学生动、有趣、直观以及指导学生的学习,我们研制开发了多媒体课件,并编写了与本门课程配套的课程学习指导教材。
为了达到培养学生的收集数据、整理数据、建立数学模型、利用相关的理论与方法解决实际问题的能力之目的,我们增加实践性教学环节。从1997级开始,我们在全国首次开设了《概率论与数理统计》的实验教学环节,并且编写相应实验教学大纲和实验指导书,使实验课有纲可循,有事可做而不流于形式。
为了培养学生的综合应用随机数学解决实际问题的能力,我们构建了以《概率论与数理统计》为核心的课程群,包括《多元统计分析》、《时间序列分析》、《教育测量与统计学》、《随机过程》、《数学模型与数学实验》、《数学软件》等选修课程,大大丰富了学生随机数学的理论与方法解决实际问题的数据处理与分析的能力及数学建模能力。
为了开拓学生的视野,在学年论文和毕业论文中,我们加强指导,向学生介绍了一种现代非参数统计学习方法:《基于支持向量机的统计学习方法》,将这种方法用于相关关系的学习中。
为了达到培养学生学习《概率论与数理统计》课程及其课程群的学习及其解决实际问题的能力,我们连续多年组织了对我校参加全国大学生数学建模竞赛的学生的培训工作,特别是随机数学解决实际问题能力的培养。
由于我们改革教学的内容,增加了实验教学环节,并注重学生平时能力的培养,所以我们改革考核方式:学生平时作业及考勤占总成绩的20%,实验占20%,课程考试占60%。
为了传承我们的改革成果,我们注意在改革中积累经验,培养人才,使我们的改革有了传承、继续推进的后备人才,形成本门课程及其课程群的年龄、学历层次和职称结构合理的教师队伍,有博士1个,硕士3个,学士5个;教授1个,副教授6个,讲师2个。
4 概率论与数理统计课程教学改革与实践的效果
通过几年来的改革实践,概率论与数理统计的教学取得了较显著的效果。教学内容、方法手段的改革增加了学生学习该课程的兴趣,使学生真正体会到该课程的内容在工农业生产以及科学研究中的应用价值,充分调动了学生学习的主动性,激发了学生的创造性思维,增加了学生应用概率统计方法解决实际问题的能力。该课程的改革与实践取得了良好的教学效果,提高了教学质量,得到了学生的认可和赞同,问卷调查表明90%以上的学生对现在的教学方式和考试方法给予肯定,大多数学生都认为概率统计课在各学科中有较重要的应用。说明同学们对该门课程的思想方法和应用性有了较深刻的认识,教学改革的总体方向是正确的。
随着本课程及相关课程的深入改革,有许多学生在学年论文及毕业论文的选题上倾向于采用《概率论与数理统计》课程的理论与方法。与本课程相关的多篇毕业论文被评为校级优秀论文。
此外,本课程的任课教师还积极组织、培训、指导学生参加全国大学生数学建模竞赛并取得优异成绩。
参考文献:
[1]朱松涛.师专数学系《概率论与数理统计》课程教学的改革实践[J].数学通报,1998,(4).
[2]邓华玲等.概率论与数理统计课程的改革与实践[J].大学数学,2004,(1).
[3]陈新美等.《概率论与数理统计》教学改革与实践[J].湖南科技学院学报,2006,(11).
1、区别是:用统计量推断参数时,如果参数未知,则这种推断叫参数估计——用统计量估计未知的参数;如果参数已知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时的统计推断即为假设检验。2、联系是:二者都属于推断统计——利用样本的数据得到样本统计量(statistic),然后做出对总体参数(parameter)的论断。3、举例来说:推断全校学生(总体)的平均每天上网时间(参数)。如果参数未知,要靠抽样的数据进行推断,此时进行的就是参数估计,用抽样得到的统计量——样本平均上网时间(比如说3小时)来估计全校学生平均上网时间。 如果先前有人已得出得出论断,学生平均上网时间为5小时(参数已知),而你不知该参数可不可信,这时做的就是假设检验,通过样本得到的平均3小时的上网时间告诉你,先前关于总体的信息很可能是不靠谱的,无法通过检验。
生物医学动物实验研究论文
1实验设计
在开展生物医学研究时,研究者通过正确地运用统计学知识,可直接影响研究的质量。统计学设计的任务在于对研究的部署、实施,直到研究结果的解释进行系统的安排,力争做到以最少的人力、物力获得可靠的结论和信息。其目的在于确定某种处理是否会表现出某种特定的效应。在实验设计时应遵循惟一差异原则,即在进行两组比较时,两者之间仅有因处理因素不同而引起的差异,而其他实验条件相关的非处理因素都应保持等同。然而,处理组与对照组在反应上表现出的差别并不一定意味着是处理的结果。另有两种引起差别的可能性,即偏倚和偶然性。偏倚是指系统性差别,它不是因组间在处理上的不同所引起。生物医学实验中统计学设计和分析的目标就是消除潜在的偏倚,减少偶然性[2]。
实验的偏倚和控制
偏倚是在研究中从设计到实验实施和结果分析的各环节存在一些人为的、有系统倾向的非随机误差,它不是由于抽样造成的,而是某种偏性使得实验结果偏离它的真值。从所选择的生物医学问题到研究方案的制订与实施、实验的完成过程、实验的分析与解释,乃至实验结果的发表,均可能存在各式各样的偏倚[2]。这种偏倚常常表现为系统误差。偏倚的大小取决于研究的方法和具体的实验条件。常见的偏倚主要有选择性偏倚、观察性偏倚和混杂性偏倚。必须认识实验过程的偏倚,从实验设计起直到整个研究过程结束均要加以控制。正确的实验设计可控制选择性的偏倚,事前人为控制和采取相应的措施可避免和减少观察性的偏倚。对于混杂性偏倚,可将重要的混杂因素在设计阶段进行分层随机设计,使混杂因素在组间分布均衡;在统计分析阶段将混杂因素作为分层因素或采用有协变量分析方法,以消除混杂因素的影响。只有有效地控制或消除偏倚,方可减少结果的假阳性或假阴性。
减少偶然性的潜在影响
偶然性因素的作用可以减少,但不能完全排除。因为即使是在精心实施的研究中,接受同样处理的动物,其反应也不可能完全一样。适当的统计分析可使实验人员评估出现假阳性的概率,即根本不存在处理效应的情况下观察到差异的概率。这种概率越小,实验者发现真实效应的可能性就越大。为了更有把握地检测出真实效应,有必要减少偶然性的作用,并通过实验设计确保能在“噪声”之上识别真正的“信号”。
实验设计的要素
要消除生物医学实验中潜在的偏倚,减少偶然性,就应对实验对象、处理因素和实验效应这三个实验设计要素,按照对照、重复、随机化和均衡四项原则进行周到的设计与控制[3]。实验对象实验中处理因素所作用的对象称为实验对象。不同性质的实验研究需要选取不同种类的实验对象,一个完整的实验设计中所需实验对象的总数称为样本含量。生物医学试验中考虑动物实验对象时应关注以下几个方面:①动物种属的选择:选择实验动物的种属与品系时,尤其需要注意其背景反应的水平。为了将反应“信号”水平最大化,常常意味着应避免选择那些背景反应水平极低的动物种属或品系,但如果采用过度反应的动物种属或品系也同样会出现问题。动物物种选择中的其他问题,无论是实际问题(寿命、体型、易得性、对动物学特征的了解情况)或是理论问题(生化、生理或解剖结构与人的相似性),都需要从专业的角度认真加以考虑和权衡。②动物的数量:虽然从统计设计角度考虑可得出某项实验所需的动物数(样本含量),但所得出的数值往往很大。因此,虽然样本含量估计是保证结论可靠性(精度和检验效能)的前提,但基于实验的可操作性及经济原则方面的考虑,应结合统计学的计算结果与以往的生物医学研究经验予以确定。③动物的体重与年龄:为确保实验对象的同质性,实验中所使用的动物体重与年龄应尽可能相近;动物体重的标准差不应超出平均值的10%;啮齿类等小动物年龄相差不应超出1周,大动物年龄相差不应超出1个月。④动物的分层:为了准确检测一种处理因素引起的差别,各处理组在可能影响实验结果的其他非处理因素方面应尽可能具有同质性。当存在动物亚系间的差别时,有两种方法可得到更为准确的结论。一是在结果分析阶段将亚系作为一个“分层变量”处理,包括对两个亚系的结果进行单独分析,然后将结果综合,得出处理效应的总结论;二是将亚系作为实验设计的“区组因素”,这种情况下可使对照组与处理组中每个亚系动物数量相等。除以上所讨论的“亚系”之外,其他的非处理因素,如性别、窝别、体重段等也可作为分层变量进行局部控制,并据此进行分层随机化分组。处理因素设计实验研究时,要明确研究中的处理因素和影响实验效应的非处理因素。研究者希望通过对研究设计进行有计划的安排,从而能科学地考察其效应大小的因素称为处理因素或实验因素;研究者往往忽略对评价实验因素作用大小有一定干扰的重要的非处理因素或非实验因素(如动物的窝别、体重等);其他未加控制的许多因素的综合作用统称为实验误差。实验结果是处理因素和非处理因素共同作用而产生的实验效应,因此如何控制和排除非处理因素的干扰,正确显示处理的效应,是实验设计的基本任务。实验效应实验效应是处理因素作用于受试对象的反应和结果,是反映实验因素作用强弱的标志,它通过观察指标(统计学常将指标称为变量)来体现。如果指标选择不当,未能准确反映处理因素的作用,获得的研究结果就缺乏科学性,因此选择好观察指标是关系整个研究成败的重要环节。指标的观察应避免带有偏性或偏倚,要结合专业知识,尽可能多地选用客观性强的指标,在仪器和试剂允许的条件下,应尽可能多选用特异性强、灵敏度高、准确可靠的客观指标。对一些半客观(如尿液pH试纸读数值)或主观指标(行为测量、病理观察),一定要事先规定读取数值的严格标准,只有这样才能准确地分析实验结果,从而提高实验结果的可信度。
实验设计的原则
为了防止结果的偏倚,保证实验结果的准确性和最大化的表达,在进行生物医学实验设计时必须遵循统计学设计的对照、重复、随机化和均衡四个基本原则。生物医学实验中对照组的设置必须具备三个条件:①对等原则,即惟一差别原则,除处理因素外,对照组具备与实验组对等的非处理因素。在相互比较的各组间,除了给予的处理因素不同外,其他方面应与实验组具有一致性,如相同的实验单位来源(动物种属、体重等)和相同的实验条件、操作方式和喂养环境等。②同步原则,对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。③专设原则,任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往结果或其他研究资料作为本研究之对照。
生物医学中常用的实验设计类型
如果需要在同一实验中同时评价几种不同的效应,实验者应该安排能区别各自效应差别的实验设计方法。生物医学中常用的实验设计有以下几项。完全随机设计完全随机设计是生物医学动物实验中最为常用的一种实验设计方法,它是一种单因素有k个水平(k≥2)组的实验设计。即实验设计可设置一个对照或多个剂量组的实验方案。本设计保证每个实验动物都有相同机会接受任何一种处理,而不受实验人员主观倾向的影响。本设计应用了重复和随机化两个原则,因此能使实验结果受非处理因素的影响基本一致,真实反映出实验的处理效应。随机区组设计随机化完全区组设计,简称随机区组设计,又称配伍组设计,是配对设计的扩展,它将几个条件相同的受试者划分在同一个区组或配伍组,然后再按随机的原则,将同一配伍组的受试者随机分配到各实验组。该设计方法的优点是每个区组内的k个实验单位有较好的同质性,比完全随机设计更容易察觉处理间的差别。这种方法须特别注意的是要求区组内实验单位数与处理数相同,实验结果中若有缺失值,统计分析将损失部分信息。拉丁方设计拉丁方设计从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组,是比随机区组设计多一个区组因素的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。析因设计析因实验设计又称全因子实验设计,属于多因素、多水平单效应的设计。它不仅可以检验每一因素各水平之间的效应差异,而且可以检验各因素之间的交互作用。交互作用是指一个因素不同水平间的效应差受另一因素的影响,包括协同交互作用和拮抗交互作用。析因实验主要用于分析交互作用,当因素及水平数过多时,所需的实验对象数、处理组数和实验次数大幅度增加,故一般采用较简单的析因实验。含有较多因素和水平的实验一般采用正交实验设计[5]。
2生物医学动物实验的描述统计学
生物医学实验资料的类型
生物医学实验对实验对象(动物)进行干预后测定的观测指标通常有以下类型:①连续性数据:测定结果表现为有数字大小和单位的数据,统计上称定量资料,如生理、生化指标,体重值,器官重量等。②分类数据:测定结果表现为按某属性划分的定性类别,统计上称为定性资料,具体又可以分为二值资料、多值名义资料和多值有序资料。如某反应为出现或不出现,死亡或未死亡,有畸形或无畸形;病理损害的严重程度(无、轻度、中度、重度)等。
统计描述指标
描述性统计学(或归纳统计学)是对样本观察/测量数据频率分布的定量研究,描述性统计的目的在于:①对测量值或观察值进行归纳浓缩,用统计量、统计图或统计表的形式表现;②估计总体分布的参数。资料的整理与探索对于某一测量指标,一般应从文献资料中了解其分布类型。如果没有判断概率分布的理论基础,应重复以大样本测定,绘制样本的频数分布图(理论上样本量要大于100),并经统计学检验拟合其分布。数据的描述统计量①连续性数据的频数分布:通过对样本资料编制频数分布表或做茎叶图,以确定资料分布的类型、频数分布的集中趋势和离散趋势、估计总体参数,也便于发现离群值。②中心位置的描述统计量:描述数据分布的集中趋势,常用指标为算术均数、中位数、众数、几何均数等。③离散程度的描述统计量:描述数据分布的离散趋势,常用指标为标准差和方差、极差和四分位数间距、变异系数和离散系数等。④统计学图表:统计图包括连续性数据分布的直方图、茎叶图,表示数据中心位置和离散程度的点杆图(做图时表示均数和标准差)和盒须图(做图时表示中位数、极差、四分位数间距),描述构成比数据资料的百分条图、饼图,描述经时变化趋势的线图,以及预测和检验分布类型的概率-概率图(P-P图)等[6]。统计表具有简单、明了、易于理解、便于比较的优点。编制统计表时原则上应当重点突出、层次分明、避免层次过多或结构混乱。一般的统计表应为三线表,表中只有横线,无竖线和斜线。统计表的标目应层次清楚,不宜过于复杂。
3生物医学动物实验的假设检验
生物医学动物实验中最常见的情况是给予不同受试物后进行组间比较,通过统计学中的假设检验,说明受试物的作用。假设检验时应注意以下问题。
检验方法的选用依据
资料的类型和变量的数目不同类型的资料(定量、定性)的组间比较应采用不同的统计检验方法。单变量、多变量的`统计检验方法也各不相同。实验设计类型应该根据实验设计的具体类型选择对应的统计检验方法,以便得到处理组效应的真实结论。检验方法的前提条件选用假设检验方法前,应了解所分析的数据资料是否满足相应检验方法的前提条件,如t检验和方差分析等参数检验方法要求数据满足正态性和方差齐性,2检验要求样本含量大于40且理论频数大于5。
正态性检验及拟合优度检验
统计学假设检验须判定样本的频数分布是否符合某一理论分布,如符合要求就可按此理论分布来进行统计学处理。对正态分布可采用正态性检验,其他分布可用拟合优度检验。通常可通过查阅文献,了解实验参数符合何种理论分布。
方差齐性检验
连续性数据未达到参数法统计分析前提的第二种原因即为方差不齐。一般而言,数值愈大,其固有的变异性也愈大。例如,若某组动物的平均反应值为100,其数值范围可能为80~120;而另一组动物的平均反应值为300,其数值范围可能会扩大至240~360。解决方差不齐的措施是进行数据转换。若数据的标准差与平均值成正比,在统计分析前宜将数据转换为对数值之后再进行分析,据此,不仅数据的变异度与平均值大小无关,同时还可确保其更符合正态分布。若数据变异度增加幅度与平均值的关系不太明显,采用平方根转换则更易使数据的变异度与平均值大小无关。某些数据经对数或平方根转换后可能仍存在方差不齐,此时宜采用非参数检验。
单侧检验与双侧检验
检验假设选择单侧检验或双侧检验,应事先根据专业知识做出选择。一般而言,若研究目的仅须了解是否存在组间差异、实验者无法预测组间变化的方向以及实验者希望获得正负两方面的结果时,应采用双侧检验。若事先可预测组间差异的变化方向,实验者仅对某一方面的重要性感兴趣,实验者仅希望了解与对照组差异或正或负一个方向,则应采用单侧检验。此外,剂量设计预试验中应采用双侧检验,正式试验在了解相关信息后可采用单侧检验。
多重比较及多重性问题
生物医学实验经常在处理组和对照组之间做多个变量的比较。即使不存在真正的实验效应,也有可能纯粹由于偶然性而有一个或多个变量在5%检验水平出现显著性差别。除了上述均数多重比较导致Ⅰ类错误概率增加的多重性问题之外,其他的多重性问题还包括多次的中期分析、关注多个结局、亚组间的多重比较。处理多重性问题的原则包括:①预先计划进行多重比较;②限制比较的次数;③多重比较时采用更严格的界值标准;④多重比较具有生物学方面的依据。
观察值或实验对象的独立性
许多统计检验方法要求比较的观察值或实验对象相互独立,如二项分布的率检验、t检验和方差分析等。但是,有的生物医学实验中观察单位并不独立。例如,生殖和发育研究中就存在窝效应:由于遗传因素、宫内的发育环境和药物的代谢环境相似,与异窝胎仔相比,同窝胎仔之间对毒性效应的反应概率趋于系统,即同窝内数据为聚集性数据,这就是一种常见的非独立数据。在统计学分析时,忽略数据的窝内相关性具有潜在的风险;因同窝母鼠所产k个胎仔的观察值存在共性,其所提供的信息不及k个独立的来自不同母鼠所产胎仔所提供的信息;窝内相关性愈大,其信息量愈少。聚集性数据的均数标准误小于独立的数据,因此,若基于观察值独立的统计分析方法,就会增加犯Ⅰ类错误的概率,即假阳性的风险增加,降低实验的有效性。
历史对照数据的应用
某些情况下,尤其是在发生率较低的情况下,单项研究可能提示处理可影响肿瘤发生率,但无法得出明确的结论。可能想到的分析办法之一是将处理组的数据与来自其他研究的对照组动物相比较。虽然历史对照数据具有重要意义,但值得强调的是,众多原因可导致不同研究之间的变异度大于研究之内的变异度。动物来源、饲料及饲养条件,研究期限,研究中的动物死亡率、读片的病理学家等均可能影响最终的肿瘤发生率。故此,忽视这些差异,将处理组的肿瘤发生率与合并的对照组发生率相比较,可能得出严重错误的结果,并进而明显夸大统计显著性水平。Tarone[4]曾对历史对照组的比率数据分析进行过综述。
假设检验的局限性
首先,假设检验中的P值并未提供有关处理诱发效应大小的直接信息。某一受试物可诱发一定量的、反应的增加,但增加的幅度是否具有统计显著性则取决于研究的规模和数据的变异性。在规模较小的研究中,有可能错失较大、重要的效应,尤其是在检测终点测量精度不高的情况下。相反,在规模较大的研究中,较小、非重要的效应则具有统计显著性。例如,D药与C药相比,降血压效应相差近30mmHg,但因为例数仅10例,假设检验未发现显著性差异(P=);相反,B药与A药相比,降血压效应仅相差,但因为例数达500例,假设检验却发现存在显著性差异(P<)。由此可见,统计学显著性与效应大小无直接相关性。因此,愈来愈多的统计学家主张以处理组与对照组差异值的95%置信区间表述处理的效应。据此,若处理反应的增加值为10个单位(95%置信区间3~17单位),则该区间包含真实差异的几率为95%。若置信区间的下限大于零,则双侧检验的P值小于。其次,假设检验无法消除实验设计或实施不当所带来的影响。虽然前述的分层分析等有助于发现真实的差异,但若实验设计存在偏倚,或实验实施过程中存在偏差或失误,假设检验方法一般也于事无补。因此,在生物医学实验过程中应注重对实验设计或实施过程进行严格的质量控制和质量保证措施,强化GLP规范意识。其三,对统计学分析本身的质量控制和质量保证也是确保研究质量的重要环节。所用统计分析软件包应经过充分的认证,以确保分析结果的准确、可靠性。数据的录入、核对和分析结果的报告与归档,均应制订并严格执行相关的标准操作规程。综上所述,在动物实验研究的多个环节,统计学中的相关理论和方法都能够发挥重要作用。统计学不仅可以保证结果的科学性和可靠性,在很多情况下也可以极大地提高研究效率,节约研究成本。在这里还必须强调,除了实验后期的数据分析以外,在实验方案的制定阶段也需要统计学人员的早期介入,这样有助于避免实验设计出现大的偏差和漏洞,有利于研究目标的顺利实现。
联系:二者都属于推断统计——利用样本的数据得到样本统计量(statistic),然后做出对总体参数(parameter)的论断。
用统计量推断参数时,如果参数未知,则这种推断叫参数估计——用统计量估计未知的参数;如果参数已知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时的统计推断即为假设检验。
理论描述
置信区间是一种常用的区间估计方法,所谓置信区间就是分别以统计量的置信上限和置信下限为上下界构成的区间。对于一组给定的样本数据,其平均值为μ,标准偏差为σ,则其整体数据的平均值的100(1-α)%置信区间为(μ-Ζα/2σ , μ+Ζα/2σ) ,其中α为非置信水平在正态分布内的覆盖面积 ,Ζα/2即为对应的标准分数。
以上内容参考:百度百科-置信区间
统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。下文是我为大家整理的关于统计相关论文的范文,欢迎大家阅读参考!
浅谈概率在统计学中的应用
摘 要:概率是研究随机现象的数学学科,其理论严谨、 应用广泛、 发展迅速。目前,概率的理论与方法已广泛应用于 统计学中,主要是从正态分布、小概率事件两方面介绍了概率在统计学中的一些应用。
关键词:随机现象;事件;样本;母体;正态分布;小概率原理
统计学主要分为描述性统计学和推断性统计学。给定一组数据统计学可以摘要并且描述这些数据,这个用法称为描述性统计学。另外,观察者以数据的形式建立起一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称为应用统计学。另外,还有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
同一仪器多次测量同一物体的重量,所得的结果彼此总是略有差异,这是由于诸如测量仪器受大气影响,观察者身体或 心理上的变化等等偶然因素引起的。同样的,同一门炮向同一目标发射多发同种炮弹,弹落点也不一样,因为炮弹制造时的种种偶然因素对炮弹质量也会有影响。此外,炮筒位置的误差,天气条件的微小变化等等都影响弹落点。再如从某生产线上用同一种工艺生产出来的灯泡寿命也是有差异的等等。
总之所举这些现象的一个共同点是:在基本条件不变的情况下,经过一系列试验或观察会得到不同的结果。换句话说,就个别的试验结果或观察结果而言,它会时而出现这种结果,时而出现那种结果,呈现出一种偶然性。这种现象称为随机现象。对于随机现象通常关心的是在试验或观察中某个结果是否出现,这种结果称为随机事件,简称事件。为了实际的理由选择研究团体的子集代替研究母体的每一笔资料,这个子集称作样本。推论统计学被用来将资料中的数据模型化,计算它的几率并且做出对于母体的推论,这个推论可能以对或错的答案呈现(假设检验)出对未来观察的预测,关联性的预测,或是将关系模式化(回归)。
随机现象有其偶然性的一面,也有其必然性的一面。这种必然性表现为大量试验中随机事件出现的频率的稳定性,即一个随机事件的频率常在某个固定的常数附近摆动,这种规律我们称之为统计规律性。频率的稳定性说明随机事件发生的可能性的大小是随机事件本身所固有的,不随人们的意志而改变的一种客观属性,因此可以对它进行度量。对于一个随机事件A用一个数p(A)来表示该事件发生的可能性的大小,这个数p(A)就称为随机事件A的概率,因此概率度量了随机事件发生的可能性的大小。
如果样本足以代表母体,那么由样本所做的推论和结论可以引申到整个母体之上,统计学提供了许多方法来估计和修正样本资料过程中的随机性(误差)。要了解随机性的一定几率必须具备基本的数学观念。数理统计是应用数学的分支,它使用几率论来分析并且验证统计的理论基础。
概率在统计学中有着重要的作用,包括总体、抽样研究、统计描述、统计推断、正态分布规律等,正态分布是概率中最重要的一种分布。一方面正态分布是自然界最常见的一种分布,例如测量的误差;炮弹弹落点的分布;人的生理特征的尺寸:身长、体重等;农作物的收获量;工厂产品的尺寸:直径、长度、宽度、高度,都近似服从正态分布。
一般来说若影响某一个数量指标的随机因素很多,而每个因素所起的作用又不太大,则服从正态分布这点可以用概率论的极限定理来加以证明。另一方面正态分布具有许多良好的性质,许多分布可用正态分布来近似,另外一些分布又可由正态分布来导出,因此在理论研究中,正态分布十分重要。如利用正态分布规律统计学校的成绩分布,得出一个阶段的学生总体是否进步,然后寻找原因,得出改进办法。分析一年 经济的发展,预测来年的收入。找出影响发展的主要因素,寻求改进的方法等等。
小概率事件即发生概率很小的事件(p≤),在统计学中有着重要的应用,这样的事件理论上发生的可能性则几乎为零。如买彩票中大奖,就是典型的小概率事件,也许每一期均会有大奖开出(可能性很小),但对于每一个彩民来说,他买一注中大奖的可能性(小概率事件在一次试验中就发生的概率几乎没有。其实,这就是小概率事件在统计学上应用的重要理论依据——小概率原理。)即小概率事件在一次试验中发生的可能性很小,如果真的发生了,根据统计学可怀疑其真实性。
如某接待站在一天内共接待5人单独来访,结果这5人全在周一到访,由此能否推断接待站有规定的接待日?假定没有规定的接待日,一个来访者在五天中任何一天来访都是等可能的用Am(m=1,2,3,4,5,)表示“一周接待了m个人,全都是周一来访”事件,Am的概率如下表示:
事件 A1概率 事件 A2概率
事件 A3概率 事件 A4概率
事件 A5概率
5个人都在周一来访的概率为,大约万分之三。现在概率很小的事件在一次试验中发生了,于是怀疑假定的正确性,从而推断接待站有规定的接待日。
公元1814年,拉普拉斯在他的新作中,记载了一个有趣的统计,世界上男婴与女婴的出生比值是22∶21,即在出生的婴儿中,男婴占,女婴占,可奇怪的是1745-1784年四十年间统计巴黎男婴的出生率时,却得到另一个比是25∶24,男婴占,与前者相差,对于这千分之一点八的微小差异,进行调查研究,发现巴黎人有“重女轻男”的现象,有抛弃男婴的陋习,以至于歪曲了出生率,经过修正出生比依然是22∶21。统计学依据小概率原理作出结论的正确性很高,但也存在犯错误的风险(较低)。
小概率原理在统计上有着非常重要的应用。如假设检验结论的判断,假设检验是用样本信息推测总体的一种统计推断方法,由于抽样误差的存在,样本信息和总体特征间可能不尽相同,所以假设检验实际上就是判断待比较各方的差别是不是由抽样误差造成的。假设检验中p值的大小反映的就是差别由抽样误差造成的概率。在假设检验中就是通过比较p值与检验水准a(通常设为)的大小关系,从而做出差别有无统计学意义。
如果p值小于a统计学则认为差别由抽样误差造成的概率很低,那么根据小概率原理认为,小概率事件在一次抽样中就发生的可能性几乎为零,所以判定差别可能是由于比较各方在本质上的不同导致的。否则认为差别是由抽样误差造成的。在这里检验水准是在假设检验前认为设定的,是研究者能够承受的本次假设检验放弃真错误的概率,也可以理解为是研究者设立的小概率事件的概率。而p值则是通过计算,即在检验假设成立的情况下,差别是由抽样误差造成的概率。
统计在现代化 管理和 社会生活中的地位日益重要,随着社会经济和科学技术的发展统计在现代化国家管理和企业管理中的地位越来越重要,人们的日常生活都离不开统计,统计的影响是这样巨大,故与之密切相关的概率的作用也越来越重要。
浅谈统计学基础教学方法与学生应用能力的培养
摘要:统计学基础知识是一门研究数据的技术性学科,具有综合性,抽象性及应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。在中职教学中需结合本学科的特点,不断改进教学方法,提高学生综合应用统计知识的能力。
关键词:统计学教学方法设计能力培养
统计学基础知识是一门研究数据的技术性学科,学科内容中的调查研究和分析处理问题的方法,不仅应用于各项工作中,也用于其他学科研究过程中的数据搜集、整理、分析并得出结论。故统计学具有综合性,抽象性,应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。现结合本学科的特点探讨其教学方法和学生应用能力的培养。
一、统计学基础课程教学的特点
统计学基础也是社会经济统计学原理,其学科内容的特点:一是基本概念多,理论讲授上较抽象;二是指标类别多,初学时严格划清各种指标内涵难;三是调查分析方法多,正确理解和选择恰当的调查方法难;四是正确的调查方式、方法指标体系的设置,统计范围的界定与是否得出反映事物的正确结论直接相关;五是科学设置调查事物的指标体系又与弄清反映该事物的客观内在本质的相关指标直接相关。因此,对年龄小,分析能力差的中职学生教学对象来讲,即便从概念上掌握了统计学的原理,如果不结合实际的统计案例资料和采用恰当的教学方法,就很难达到正确应用统计知识解决现实社会经济中问题的目的,甚至会因为错误使用方法,得出对事物评判的错误结论。
二、结合本学科知识的特点采用适当的教学方法,增强应用能力的培养
在教学中,首先通过对教材内容体系的全面分析和教学对象知识结构的分析,以及学生对统计学知识学习的兴趣、理解的深度和掌握应用情况的总结,在教学中的不同环节恰当地实施不同的教学方法。
1、通过学科内容体系导入与工作任务联系,提升学生学习兴趣
在讲授本学科内容时,首先给学生介绍统计学基础教材内容的基本框架:统计学的涵义、研究对象、性质、职能和研究的基本方法。其次是介绍学科知识体系:统计学中的基本概念,统计资料调查整理的方式方法,统计数据的显示与提供,以及提供的统计数字资料运用多种指标法进行分析(总量指标法--反映事物的规模状况,平均指标法--反映事物的集中趋势及一般规律,相对指标法--反映事物的纵向横向比较和事物之间的联系,标准差法--反映事物中总体单位标志值之间的离散趋势和程度,分析事物之间的差异。统计指数法--反映事物中各种直接因素的影响。
时间数列法--反映事物在时间段上的发展变化趋势。抽样调查法--统计专门调查方法中最科学的方法。相关回归分析法--分析事物中的因果关系。)通过内容体系的简单讲解导入,让学生在学习具体理论知识前就对该学科有一个总体感性认识,产生兴趣。带着要通过掌握统计知识去解决实际问题的意识和目的去学习。
2、让学生的学习从理性认识过渡到感性认识,增强应用能力
我在教学中介绍统计学的基本概念和统计调查方法内容时,除对每个知识点进行举例说明外,一部分知识讲完后,给出几个典型的统计调查方案让学生弄清在这些调查方案中所涉及的统计总体、总体范围的界定、总体单位、标志、指标以及采用的哪种调查方式等。这不仅让学生把抽象的统计学概念知识从理性认识过渡到了感性认识,而且通过这些案例还进一步让学生明白了调查方式的选用必须要根据调查对象和要解决的问题适当选取,而不是什么调查目的,什么事物都可以用任何一种调查方式。只有正确选用统计方式、方法去调查分析客观事物才能得出正确的结论,才能具备正确利用统计知识去分析解决问题的能力。
3、综合指标应用与典型资料结合法,提高学生的应用能力在讲授综合指标法时,对每一种指标的理解都是
分别举例说明让学生理解该指标的含义和作用。为了让学生能正确理解和区分每一种指标的作用,在所有指标介绍完后,我选用了国民经济年度统计公报资料作为案例,让学生从统计公报资料中找出学习过的每一种综合指标,如:2007年全国GDP总值,人口数等是总量指标。本年度GDP完成百分比是计划完成相对指标,本年度GDP比上年度增长百分比是动态相对指标。人均GDP是强度相对指标。
GDP构成比例是结构相对指标。五年中平均每年增长的百分比是后面要学习的平均发展速度和平均增长速度的应用。通过这样的案例,学生不仅对各种综合指标法的应用有了正确的理解,而且把各种指标的理解认识变成了应用能力,同时还对后面学习动态数列知识奠定了基础。在教学中很好地起到了巩固理解知识和预习下一教学环节内容的潜在作用。还起到了掌握知识综合性的效果。通过这样一个案例,学生进一步明确,研究一个总体的问题时,可以对问题的不同方面运用多种指标进行分析,弄清事物之间客观存在的关联,这些都必须用一定的统计数据来说话。因此进一步强调了学生学习统计知识的必要性,也让他们认识到统计学知识的科学性和实用性。
4、新旧知识在现实案例中的综合运用,提升学生应用能力
在讲授统计指数的内容时,传授给学生统计指数编制的基本方法的原理,教材中举例的商品价格、商品量、以及职工工资水平指数的编制都仅仅是一种计算基本方法的介绍。要培养学生应用能力还必须结合实际统计指数编制的案例进行讲解,让学生能够将理论知识及其计算方法应用到实际工作中去,所以我特意在理论知识和计算方法讲完后,介绍实际工作中零售物价指数的编制。这个经济指数也是民众普遍关注的问题,与人们生活水平息息相关。
告诉学生,物价指数的编制运用了抽样调查的知识,实际工作中不可能对每一种商品都采价调查,而是分大类商品,在商场和集贸市场分别采价。例如集贸市场的蔬菜价格每周至少要采集三次,每次要采集成交价的三人次,进入零售商品物价指数编制的价格实际上是一个多次简单平均的价格,而每天某种商品的三个价格要简单平均,每周三次的平均价格再简单平均。商场的商品价格如较稳定可用期初和期末的平均。通过这样一个案例,既给学生传授了新知识,又复习巩固了平均指标计算方法的具体应用,不仅日常生活中用,而且在经济研究中应用非常广泛。进一步告诉学生加权平均法和调和平均法在编制物价指数和其他社会经济现象指数中的应用。
5、典型调查案例教学法,培养学生综合应用统计知识,分析解决问题的能力
教学中我把学生应用统计知识,分析问题能力的培养放在抽样技术的教学内容中,抽样技术的基本理论也是抽象的。如,抽样误差,抽样平均误差,抽样的组织方式。针对研究对象的特点,都必须具体问题具体分析,而抽样误差的计算既涉及到平均指标的计算又涉及到标准差的计算,新旧知识的交替如何培养学生应用新旧知识计算、分析问题,解决问题是教学的难点。
为了突破这个难点,我在教学中利用了一个草席质量抽样调查的案例,这个案例体现了从制定调查方案中的调查方式的确定,采用主要标志划类,简单随机抽样原则,到调查实施的步骤:草席宽度分类,登记原验级等级,编顺序号,确定抽样总体,计算全级总体标准差,决定抽样数目,设计计算表格,决定样本号,现场调查中的统一验级标准。
验级过程:由5人分别验级,级数的最后确定采用众数办法,5人验级中的3人验级标准为准。以上这些都具有前面介绍的抽样调查方式的代表性,而又用到了平均指标和众数的方法。同时,在计算草席平均等级时,还用到了品质标志值平均指标的计算,即将等级品质标志值过渡成数量标志来计算该批不同尺寸草席的平均等级,再计算抽样指标与原验级指标之间的误差。
这样一个复杂的抽样调查过程和指标的计算结果,更清晰的告诉学生要说明和解决的问题:由于收购草席时,验级人员在判断标准上的误差带来了草席等级误差与价格的差异。而由于误差的存在,根据此抽样调查结果计算出的整个库存草席的总价值与实际价值的差异巨大。对导致这样的结果,进一步结合政策市场以及人为等多种因素进行分析,查找了原因并提出了切实可行的解决方案,促使了草席的收购价实相符。
通过以上几方面的教学方法设计,能让学生对统计学有更全面的认识,对学科基础内容有一个总体框架性把握,让那些学生在学习时感觉模糊的概念和繁杂的理论通过这几个教学环节的反复巩固和练习也逐步变得清晰,并大大提高了其综合应用统计知识的能力。
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.