统计学论文框架
统计学论文框架
统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。下文是我为大家整理的关于统计相关论文的范文,欢迎大家阅读参考!
浅谈概率在统计学中的应用
摘 要:概率是研究随机现象的数学学科,其理论严谨、 应用广泛、 发展迅速。目前,概率的理论与方法已广泛应用于 统计学中,主要是从正态分布、小概率事件两方面介绍了概率在统计学中的一些应用。
关键词:随机现象;事件;样本;母体;正态分布;小概率原理
统计学主要分为描述性统计学和推断性统计学。给定一组数据统计学可以摘要并且描述这些数据,这个用法称为描述性统计学。另外,观察者以数据的形式建立起一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称为应用统计学。另外,还有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
同一仪器多次测量同一物体的重量,所得的结果彼此总是略有差异,这是由于诸如测量仪器受大气影响,观察者身体或 心理上的变化等等偶然因素引起的。同样的,同一门炮向同一目标发射多发同种炮弹,弹落点也不一样,因为炮弹制造时的种种偶然因素对炮弹质量也会有影响。此外,炮筒位置的误差,天气条件的微小变化等等都影响弹落点。再如从某生产线上用同一种工艺生产出来的灯泡寿命也是有差异的等等。
总之所举这些现象的一个共同点是:在基本条件不变的情况下,经过一系列试验或观察会得到不同的结果。换句话说,就个别的试验结果或观察结果而言,它会时而出现这种结果,时而出现那种结果,呈现出一种偶然性。这种现象称为随机现象。对于随机现象通常关心的是在试验或观察中某个结果是否出现,这种结果称为随机事件,简称事件。为了实际的理由选择研究团体的子集代替研究母体的每一笔资料,这个子集称作样本。推论统计学被用来将资料中的数据模型化,计算它的几率并且做出对于母体的推论,这个推论可能以对或错的答案呈现(假设检验)出对未来观察的预测,关联性的预测,或是将关系模式化(回归)。
随机现象有其偶然性的一面,也有其必然性的一面。这种必然性表现为大量试验中随机事件出现的频率的稳定性,即一个随机事件的频率常在某个固定的常数附近摆动,这种规律我们称之为统计规律性。频率的稳定性说明随机事件发生的可能性的大小是随机事件本身所固有的,不随人们的意志而改变的一种客观属性,因此可以对它进行度量。对于一个随机事件A用一个数p(A)来表示该事件发生的可能性的大小,这个数p(A)就称为随机事件A的概率,因此概率度量了随机事件发生的可能性的大小。
如果样本足以代表母体,那么由样本所做的推论和结论可以引申到整个母体之上,统计学提供了许多方法来估计和修正样本资料过程中的随机性(误差)。要了解随机性的一定几率必须具备基本的数学观念。数理统计是应用数学的分支,它使用几率论来分析并且验证统计的理论基础。
概率在统计学中有着重要的作用,包括总体、抽样研究、统计描述、统计推断、正态分布规律等,正态分布是概率中最重要的一种分布。一方面正态分布是自然界最常见的一种分布,例如测量的误差;炮弹弹落点的分布;人的生理特征的尺寸:身长、体重等;农作物的收获量;工厂产品的尺寸:直径、长度、宽度、高度,都近似服从正态分布。
一般来说若影响某一个数量指标的随机因素很多,而每个因素所起的作用又不太大,则服从正态分布这点可以用概率论的极限定理来加以证明。另一方面正态分布具有许多良好的性质,许多分布可用正态分布来近似,另外一些分布又可由正态分布来导出,因此在理论研究中,正态分布十分重要。如利用正态分布规律统计学校的成绩分布,得出一个阶段的学生总体是否进步,然后寻找原因,得出改进办法。分析一年 经济的发展,预测来年的收入。找出影响发展的主要因素,寻求改进的方法等等。
小概率事件即发生概率很小的事件(p≤0.05),在统计学中有着重要的应用,这样的事件理论上发生的可能性则几乎为零。如买彩票中大奖,就是典型的小概率事件,也许每一期均会有大奖开出(可能性很小),但对于每一个彩民来说,他买一注中大奖的可能性(小概率事件在一次试验中就发生的概率几乎没有。其实,这就是小概率事件在统计学上应用的重要理论依据——小概率原理。)即小概率事件在一次试验中发生的可能性很小,如果真的发生了,根据统计学可怀疑其真实性。
如某接待站在一天内共接待5人单独来访,结果这5人全在周一到访,由此能否推断接待站有规定的接待日?假定没有规定的接待日,一个来访者在五天中任何一天来访都是等可能的用Am(m=1,2,3,4,5,)表示“一周接待了m个人,全都是周一来访”事件,Am的概率如下表示:
事件 A1概率 0.2 事件 A2概率 0.22
事件 A3概率 0.23 事件 A4概率 0.24
事件 A5概率 0.25
5个人都在周一来访的概率为0.00032,大约万分之三。现在概率很小的事件在一次试验中发生了,于是怀疑假定的正确性,从而推断接待站有规定的接待日。
公元1814年,拉普拉斯在他的新作中,记载了一个有趣的统计,世界上男婴与女婴的出生比值是22∶21,即在出生的婴儿中,男婴占51.2%,女婴占48.8%,可奇怪的是1745-1784年四十年间统计巴黎男婴的出生率时,却得到另一个比是25∶24,男婴占51.02%,与前者相差0.18%,对于这千分之一点八的微小差异,进行调查研究,发现巴黎人有“重女轻男”的现象,有抛弃男婴的陋习,以至于歪曲了出生率,经过修正出生比依然是22∶21。统计学依据小概率原理作出结论的正确性很高,但也存在犯错误的风险(较低)。
小概率原理在统计上有着非常重要的应用。如假设检验结论的判断,假设检验是用样本信息推测总体的一种统计推断方法,由于抽样误差的存在,样本信息和总体特征间可能不尽相同,所以假设检验实际上就是判断待比较各方的差别是不是由抽样误差造成的。假设检验中p值的大小反映的就是差别由抽样误差造成的概率。在假设检验中就是通过比较p值与检验水准a(通常设为0.05)的大小关系,从而做出差别有无统计学意义。
如果p值小于a统计学则认为差别由抽样误差造成的概率很低,那么根据小概率原理认为,小概率事件在一次抽样中就发生的可能性几乎为零,所以判定差别可能是由于比较各方在本质上的不同导致的。否则认为差别是由抽样误差造成的。在这里检验水准是在假设检验前认为设定的,是研究者能够承受的本次假设检验放弃真错误的概率,也可以理解为是研究者设立的小概率事件的概率。而p值则是通过计算,即在检验假设成立的情况下,差别是由抽样误差造成的概率。
统计在现代化 管理和 社会生活中的地位日益重要,随着社会经济和科学技术的发展统计在现代化国家管理和企业管理中的地位越来越重要,人们的日常生活都离不开统计,统计的影响是这样巨大,故与之密切相关的概率的作用也越来越重要。
浅谈统计学基础教学方法与学生应用能力的培养
摘要:统计学基础知识是一门研究数据的技术性学科,具有综合性,抽象性及应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。在中职教学中需结合本学科的特点,不断改进教学方法,提高学生综合应用统计知识的能力。
关键词:统计学教学方法设计能力培养
统计学基础知识是一门研究数据的技术性学科,学科内容中的调查研究和分析处理问题的方法,不仅应用于各项工作中,也用于其他学科研究过程中的数据搜集、整理、分析并得出结论。故统计学具有综合性,抽象性,应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。现结合本学科的特点探讨其教学方法和学生应用能力的培养。
一、统计学基础课程教学的特点
统计学基础也是社会经济统计学原理,其学科内容的特点:一是基本概念多,理论讲授上较抽象;二是指标类别多,初学时严格划清各种指标内涵难;三是调查分析方法多,正确理解和选择恰当的调查方法难;四是正确的调查方式、方法指标体系的设置,统计范围的界定与是否得出反映事物的正确结论直接相关;五是科学设置调查事物的指标体系又与弄清反映该事物的客观内在本质的相关指标直接相关。因此,对年龄小,分析能力差的中职学生教学对象来讲,即便从概念上掌握了统计学的原理,如果不结合实际的统计案例资料和采用恰当的教学方法,就很难达到正确应用统计知识解决现实社会经济中问题的目的,甚至会因为错误使用方法,得出对事物评判的错误结论。
二、结合本学科知识的特点采用适当的教学方法,增强应用能力的培养
在教学中,首先通过对教材内容体系的全面分析和教学对象知识结构的分析,以及学生对统计学知识学习的兴趣、理解的深度和掌握应用情况的总结,在教学中的不同环节恰当地实施不同的教学方法。
1、通过学科内容体系导入与工作任务联系,提升学生学习兴趣
在讲授本学科内容时,首先给学生介绍统计学基础教材内容的基本框架:统计学的涵义、研究对象、性质、职能和研究的基本方法。其次是介绍学科知识体系:统计学中的基本概念,统计资料调查整理的方式方法,统计数据的显示与提供,以及提供的统计数字资料运用多种指标法进行分析(总量指标法--反映事物的规模状况,平均指标法--反映事物的集中趋势及一般规律,相对指标法--反映事物的纵向横向比较和事物之间的联系,标准差法--反映事物中总体单位标志值之间的离散趋势和程度,分析事物之间的差异。统计指数法--反映事物中各种直接因素的影响。
时间数列法--反映事物在时间段上的发展变化趋势。抽样调查法--统计专门调查方法中最科学的方法。相关回归分析法--分析事物中的因果关系。)通过内容体系的简单讲解导入,让学生在学习具体理论知识前就对该学科有一个总体感性认识,产生兴趣。带着要通过掌握统计知识去解决实际问题的意识和目的去学习。
2、让学生的学习从理性认识过渡到感性认识,增强应用能力
我在教学中介绍统计学的基本概念和统计调查方法内容时,除对每个知识点进行举例说明外,一部分知识讲完后,给出几个典型的统计调查方案让学生弄清在这些调查方案中所涉及的统计总体、总体范围的界定、总体单位、标志、指标以及采用的哪种调查方式等。这不仅让学生把抽象的统计学概念知识从理性认识过渡到了感性认识,而且通过这些案例还进一步让学生明白了调查方式的选用必须要根据调查对象和要解决的问题适当选取,而不是什么调查目的,什么事物都可以用任何一种调查方式。只有正确选用统计方式、方法去调查分析客观事物才能得出正确的结论,才能具备正确利用统计知识去分析解决问题的能力。
3、综合指标应用与典型资料结合法,提高学生的应用能力在讲授综合指标法时,对每一种指标的理解都是
分别举例说明让学生理解该指标的含义和作用。为了让学生能正确理解和区分每一种指标的作用,在所有指标介绍完后,我选用了国民经济年度统计公报资料作为案例,让学生从统计公报资料中找出学习过的每一种综合指标,如:2007年全国GDP总值,人口数等是总量指标。本年度GDP完成百分比是计划完成相对指标,本年度GDP比上年度增长百分比是动态相对指标。人均GDP是强度相对指标。
GDP构成比例是结构相对指标。五年中平均每年增长的百分比是后面要学习的平均发展速度和平均增长速度的应用。通过这样的案例,学生不仅对各种综合指标法的应用有了正确的理解,而且把各种指标的理解认识变成了应用能力,同时还对后面学习动态数列知识奠定了基础。在教学中很好地起到了巩固理解知识和预习下一教学环节内容的潜在作用。还起到了掌握知识综合性的效果。通过这样一个案例,学生进一步明确,研究一个总体的问题时,可以对问题的不同方面运用多种指标进行分析,弄清事物之间客观存在的关联,这些都必须用一定的统计数据来说话。因此进一步强调了学生学习统计知识的必要性,也让他们认识到统计学知识的科学性和实用性。
4、新旧知识在现实案例中的综合运用,提升学生应用能力
在讲授统计指数的内容时,传授给学生统计指数编制的基本方法的原理,教材中举例的商品价格、商品量、以及职工工资水平指数的编制都仅仅是一种计算基本方法的介绍。要培养学生应用能力还必须结合实际统计指数编制的案例进行讲解,让学生能够将理论知识及其计算方法应用到实际工作中去,所以我特意在理论知识和计算方法讲完后,介绍实际工作中零售物价指数的编制。这个经济指数也是民众普遍关注的问题,与人们生活水平息息相关。
告诉学生,物价指数的编制运用了抽样调查的知识,实际工作中不可能对每一种商品都采价调查,而是分大类商品,在商场和集贸市场分别采价。例如集贸市场的蔬菜价格每周至少要采集三次,每次要采集成交价的三人次,进入零售商品物价指数编制的价格实际上是一个多次简单平均的价格,而每天某种商品的三个价格要简单平均,每周三次的平均价格再简单平均。商场的商品价格如较稳定可用期初和期末的平均。通过这样一个案例,既给学生传授了新知识,又复习巩固了平均指标计算方法的具体应用,不仅日常生活中用,而且在经济研究中应用非常广泛。进一步告诉学生加权平均法和调和平均法在编制物价指数和其他社会经济现象指数中的应用。
5、典型调查案例教学法,培养学生综合应用统计知识,分析解决问题的能力
教学中我把学生应用统计知识,分析问题能力的培养放在抽样技术的教学内容中,抽样技术的基本理论也是抽象的。如,抽样误差,抽样平均误差,抽样的组织方式。针对研究对象的特点,都必须具体问题具体分析,而抽样误差的计算既涉及到平均指标的计算又涉及到标准差的计算,新旧知识的交替如何培养学生应用新旧知识计算、分析问题,解决问题是教学的难点。
为了突破这个难点,我在教学中利用了一个草席质量抽样调查的案例,这个案例体现了从制定调查方案中的调查方式的确定,采用主要标志划类,简单随机抽样原则,到调查实施的步骤:草席宽度分类,登记原验级等级,编顺序号,确定抽样总体,计算全级总体标准差,决定抽样数目,设计计算表格,决定样本号,现场调查中的统一验级标准。
验级过程:由5人分别验级,级数的最后确定采用众数办法,5人验级中的3人验级标准为准。以上这些都具有前面介绍的抽样调查方式的代表性,而又用到了平均指标和众数的方法。同时,在计算草席平均等级时,还用到了品质标志值平均指标的计算,即将等级品质标志值过渡成数量标志来计算该批不同尺寸草席的平均等级,再计算抽样指标与原验级指标之间的误差。
这样一个复杂的抽样调查过程和指标的计算结果,更清晰的告诉学生要说明和解决的问题:由于收购草席时,验级人员在判断标准上的误差带来了草席等级误差与价格的差异。而由于误差的存在,根据此抽样调查结果计算出的整个库存草席的总价值与实际价值的差异巨大。对导致这样的结果,进一步结合政策市场以及人为等多种因素进行分析,查找了原因并提出了切实可行的解决方案,促使了草席的收购价实相符。
通过以上几方面的教学方法设计,能让学生对统计学有更全面的认识,对学科基础内容有一个总体框架性把握,让那些学生在学习时感觉模糊的概念和繁杂的理论通过这几个教学环节的反复巩固和练习也逐步变得清晰,并大大提高了其综合应用统计知识的能力。
统计分析论文
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
关于统计学方面的论文啊
世界银行关于中国GDP数据的调整及其存在的问题
(内容提要:论文深入研究了世行调整中国GDP数据的原因、方法和结果,系统地阐述了90年代初以来中国统计体系和价格体制改革所取得的巨大进步,以事实为依据,利用大量翔实的资料,对世行的调整方法进行了逐项剖析,揭示出其存在的问题,阐明了这种调整方法已经不符合中国目前的实际情况、世行不应再调整中国GDP数据的基本观点。
本文发表在《经济研究》1999年第6期。)
90年代初,世界银行派代表团对中国统计体系进行考察之后,发表了一篇考察报告:《转换中的中国统计体系》。报告认为,中国统计体系虽然进行了深入的改革,但其在基本概念、调查范围、调查方法等方面仍存在着很大缺陷:基本概念仍深深扎根于传统的物质产品平衡表体系(MPS),调查范围仍主要限于物质生产领域,调查方法仍以传统的全面行政报表为主;中国价格体制虽然进行了许多重大改革,但仍保留着传统价格体制的许多本质特征,许多产品的价格仍然处于政府控制之中。这些情况导致中国官方国内生产总值(GDP)总量数据的低估和速度的高估。1994年,世行发表了一篇专题报告:《中国人均GNP》。它以上述考察报告为依据,对中国官方1992年GDP数据进行了较大幅度的向上调整。世行公布的1993-1997年的中国人均GNP数据是在其调整后的中国1992年GDP(注1)总量数据和中国官方公布的经济增长率数据基础上计算出来的。因此,世行公布的中国1992-1997年人均GNP数据远大于中国官方人均GNP(注2)的美元折算数。本文阐述世行关于中国官方1992年GDP数据的调整及其存在的问题。
一、世界银行关于中国官方GDP数据的调整
世界银行对中国官方GDP数据的调整包括三个方面内容:一致性调整、范围调整和估价调整,综合调整比率为34.3%。其中一致性调整和范围调整是关于统计体系的不完善所做的调整,估价调整是关于价格体制的影响所做的调整。
世行关于中国官方GDP数据的调整情况简要概括在表1中:
表1:世界银行关于中国官方GDP数据的调整
调整项目 调整幅度 对GDP的影响(%)
自产自用的粮食 上调20% +0.8
存货增加 下调1/3 -1.6
福利服务 10%企业劳动力从事福利服务 +1.6
亏损补贴 补贴视作政府最终支出 +0.8
一致性调整合计 +1.6
粮食产出 上调10% +0.9
蔬菜产出 上调30% +2.3
农村工业产出 上调10-15% +0.6
农村服务业产出 上调50-60% +6.5
住房服务支出 上调40% +1.5
范围调整合计 11.7
住房服务 179.8% 1.5
全部其他行业 -12.1%-43.0% 16.6
估价调整合计 18.3% 18.3
总计 34.3
注:1、农村工业包括农村煤炭开采业、纺织业、消费品制造业和其他工业
2、农村服务业包括人文服务业、原材料服务业和其他服务业
3、全部其他行业包括粮食作物种植业、其他作物种植业、煤炭开采业、纺织业、消费品制造业、其他工业、人文服务业、原材料供应业、其他服务业
(一)一致性调整
从表1可以看出,世行关于中国官方1992年GDP数据的一致性调整包括以下几个方面:
1、农民自产自用的粮食
世行认为,中国统计体系以低于市场的价格估价农民自己生产自己消费的粮食。它假定对这部分粮食进行一致性估价将使其价值增加20%,这种调整使GDP上升0.8%。
2、存货增加
世行认为,中国对不能销售或不能按计算产出时所采用的价格销售的产出存货增加的计算存在严重的不一致性。它认为,一般来说,如果这些存货结转另一年,并最终被废弃或按大打折扣的价格销售,中国没有对GDP中的存货增加做相应的调整。因此,存货增加大于采用一致性估价所应有的价值量。世行因此将中国的存货增加调低1/3,导致GDP下降1.6%。
3、福利服务
世行认为,中国企业改革的最重要组成部分之一,是将目前企业对职工提供的诸如住房、医疗等福利性服务市场化。这种改革的结果将导致GDP上升。世行假定有10%的劳动力从事相应的服务,并假定这些服务转向市场化。通过投入产出计算,这种假定使GDP 上升1.6%。
4、企业亏损补贴
中国统计规定,企业亏损补贴作为GDP的负项。世行认为,在许多情况下,企业亏损是政府价格政策的结果。从经济观点来看,这种补贴是对以优惠价格提供货物和服务的补偿,统计上应当处理为政府的货物和服务购买和政府对相应接受者的分配,即不应当作为GDP的负项,而应当作为正项包括在政府最终支出中。世行对这种处理方法进行了调整,结果使政府支出增加7%,导致GDP上升0.8%。
综合上述结果,世行将中国官方1992年GDP数据上调了1.6%。
(二)范围调整
从表1可以看出,世行关于中国官方1992年GDP数据的范围调整包括以下几个方面:
1、粮食
世行认为,中国的耕地面积被低估了十分之一到三分之一(与卫星测量的耕地面积相比);同时,样本产量可能被高估了,综合两方面因素,将中国的粮食产出调高10%,导致GDP上升0.9%
2、蔬菜
世行认为,中国蔬菜产出价值的计算没有反映单位面积的蔬菜实物产量随时间和收获周期而变化以及市场力量正在鼓励蔬菜的非旺季生产(此时价格较高)情况,同时,蔬菜耕地面积的测算也是不准确的。考虑以上各方面因素,世行将中国的蔬菜产出价值调高30%,导致GDP上升2.3%。
3、农村工业
世行认为,村及村以下工业的产出被低估,因为相应企业通常没有完整的财务报表和不属于国家统计局直接管理的统计调查系统。农村工业的迅速发展和一定程度的偷漏税情况影响到产出的低估。某些迅速增长的农村工业,如建筑材料工业,高价格和高利润鼓励了产出的低估。利润低的行业,如煤炭开采业,也有低报的刺激,因为煤炭的自由市场价格较高。另外,世行也指出,为了夸大地方官员的政绩,农村工业也出现了高估产出的现象。综合上述因素,世行将中国农村工业产出调高10-15%,导致GDP上升0.6%。
4、农村服务业
世行认为,农村服务业,例如农村卡车和拖拉机运输服务业发展的非常迅速,但是中国没有一套系统的测算方案;农村服务业统计基本上没有包括临时生活和工作在城市的农村人从事的服务活动,例如大量的个体维修店的修理人员、小贩、餐馆老板、理发师和家庭佣人,等等。考虑上述因素,世行将农村服务业产出调高50%-60%,导致GDP上升6.5%。
5、居民住房服务
世行认为,中国居民住房服务既存在范围方面的低估,也存在价格方面的低估。从范围方面讲,城市和农村住房服务统计都不完整。中国的住房服务价值是通过住房面积、造价和折旧率等资料推算出来的,但住房面积资料不完整,城市住房面积调查资料没有包括居住在城市里的农村居民住房面积,农村住房面积调查范围的不完整性更加突出。世行假定国家统计调查网络覆盖了中国所有住房的三分之二到四分之三,进而把中国的住房服务价值调高40%,导致GDP上升1.5%。
综合上述结果,世行将中国官方1992年GDP数据上调了11.7%。
(三)估价调整
世行认为,由于扭曲的价格体制和生产率方面的差异,中国工业的土地和资本回报率远高于其他行业,消费品制造业的回报率最高,服务业和煤炭行业的回报率最低,农业的回报率也比较低,中国进一步的价格改革将改变行业的营利状况。世行试图将各行业的土地和资本回报率调整到全国的平均水平。由于纺织行业在中国对外贸易中很重要,世行在估价调整过程中,保持该行业的价格不变,将住房和其他房地产业的价格提高,纺织业以外的消费者制造业的价格降低。世行利用1987年投入产出表对GDP进行了调整,结果使GDP上调18.3%。
综合上述三个方面的调整结果,世行将中国官方1992年GDP数据上调了34.3%。
二、世界银行关于中国GDP数据调整存在的问题
世行关于中国GDP数据的调整是建立在它对80年代末90年代初中国统计体系和价格体制的了解和判断基础上的。90年代初以来,中国统计体系和价格体制改革取得了巨大进步。就统计体系来说,随着国民经济核算制度的改革,基本概念和基本框架已经基本上实现了向国民经济核算最新国际标准--联合国1993年SNA的转换;统计调查范围已经由传统的物质生产领域扩展到非物质生产领域;全面行政报表的统计调查方法已经被以普查为基础,抽样调查为主体的调查方法体系所取代;开展了多项普查,包括农业普查、工业普查、第三产业普查、基本单位普查,等等;许多专业统计采用了抽样调查方法,例如农产品产量调查、农村和城市住户调查、价格调查,等等。这一系列统计改革,使中国统计体系得到不断完善。就价格体制来说,中国进行了广泛而深入的改革,目前,市场价格已经成为中国价格体系的主体。
具体说来,世行关于中国GDP数据的调整至少存在以下若干方面问题:
(一)一致性调整问题
1、农民自产自用粮食的估价
中国农业统计规定,农民自产自用粮食的价值,按出售的综合平均价格计算,这种综合平均价格综合了国家收购价格与市场价格两种因素。近些年来,中国粮食连续获得丰收,为了保护农民种粮的积极性,国家的粮食收购价格已经高于,而不是低于市场价格,因此,上述综合平均价格不会低于市场价格。世行关于中国统计体系以低于市场的价格估价农民自产自用的粮食的判断,已经不符合中国目前的实际情况。
2、存货增加
80年代末90年代初,受传统的计划经济体制的影响,还有相当一部分企业只考虑生产不考虑市场需求和赢利情况。这些企业生产出来的部分产品可能销售不了,只能被废弃或按大打折扣的价格处理。因此,就当时的情况来说,世行把中国的存货增加调低三分之一,可能是不过分的。但是,自从党的十四大把中国经济体制的改革目标确定为市场经济体制以来,情况发生了很大的变化,市场需求和赢利状况已经逐步成为企业生产决策的主要考虑。因此,企业生产的产品被废弃或按打折扣的价格处理的情况明显减少。所以,世行的调整比率不再适合中国目前的存货产品销售的实际情况。
3、福利服务
近些年来,中国进行的一系列企业制度改革,正在推动企业的福利性服务逐步走向市场化,企业从事福利性服务人员的比例正在逐步下降。因此,至少对于中国目前的企业情况来说,世行假定企业有10%的劳动力从事福利性服务的比例太高了,相应地对GDP的调整比例也就不合适了。
(二)范围调整问题
1、粮食
中国官方统计的耕地面积数据确实低于卫星测量数据,但是,卫星测量出来的耕地面积包括25度以上的坡地、河滩地、轮休地、沟渠和田间道路等等。这些地不能视同正常的耕地。所以,中国官方的耕地面积数据与实际耕地面积之间的差距不像世行估计的那么大。另外,除了农业统计包括粮食产量调查外,农村住户调查还编制农村住户农业生产情况表和农村住户粮食收支平衡表,分别反映农村住户粮食生产情况和年初粮食结存、年内粮食收入、年内粮食支出、年末粮食结存情况。这些不同类型调查能够对粮食产量统计起到校对作用。根据以上情况,中国的粮食产出数据与实际情况应当是比较吻合的,世行将其调高10%,必将导致GDP数据的高估。
2、牧业
世行断定中国统计数据低估了农业产出,事实上,中国的经常性农业统计还存在高估的成分。全国农业普查结果表明,1996年统计年报中的肉类产量高估了22%,猪、牛、羊存栏头数分别高估了20.7%,、21.1%和21.8%。因此农业总产出和农业增加值被高估了。针对这种情况, GDP应当相应地向下调整。这是世行所没有料到的。
3、农村工业
全国第三次工业普查结果表明:由农业部乡镇企业管理部门统计的农村工业总产值数据高估了18000亿元(1995年),占全部农村工业总产值的40%。显然,与世行的判断恰好相反,农村工业产出应当向下调整,而不应当向上调整。
4、农村服务业
世行关于中国农村服务业统计不完善的判断和数据调整对于80年代末、90年代初的中国统计状况来说,是不过分的。但是,中国在1993至1995年开展了首次第三产业普查,对包括农村服务业在内的全部服务行业进行了全面调查,同时,根据普查资料对GDP历史数据进行了较大幅度的调整:
表2:第三产业普查关于服务业增加值和GDP数据的调整比率(%)
年度 GDP 第三产业 运输邮电通信业 商业 非物质服务业
1978 1.0 4.4 0.0 0.0 9.3
1980 1.1 5.2 0.0 0.0 9.6
1985 5.1 20.6 0.0 52.2 11.9
1986 5.3 21.2 0.0 58.1 12.4
1987 5.8 23.0 0.0 62.3 13.2
1988 6.1 23.4 0.0 65.1 10.7
1989 5.7 20.3 0.0 66.7 8.8
1990 4.8 17.2 2.7 67.6 8.5
1991 7.1 24.7 10.4 67.6 13.9
1992 9.3 33.1 9.5 88.7 21.7
1993 10.0 32.0 11.7 73.4 24.8
注:本表根据《中国统计年鉴,1994》和《中国统计年鉴,1995》计算。
事实上,这种调整已经大大超过世行对农村服务业的调整。例如,世行对农村服务业数据的调整导致1992年 GDP数据上升6.5%,而第三产业普查之后,中国对同年GDP数据的上调比例达9.3%。因此世行对中国农村服务业统计的判断和数据调整已经不再适合中国目前的实际情况。
(三)估价调整问题
90年代初以来,中国确立了建立社会主义市场价格体制的目标模式,价格改革取得了突破性进展,严重扭曲的价格结构得到明显改善。例如,从1990年到1997年,世行认为土地和资本回报率最低的服务业和煤炭工业价格分别上涨了222%和206%,而属于土地和资本回报率最高的消费品制造业的食品工业和纺织工业价格仅分别上涨96.8%和60.3%。特别重要的是,目前,市场机制在中国货物和服务价格形成中已经起了主导作用。货物的价格基本上由市场决定,除部分服务业,如居民福利性住房服务业仍偏离市场价格外,绝大多数服务业的价格也由市场决定。即使那些偏离市场价格的服务业也正在迅速向市场价格过渡。例如,随着住房制度的改革,住房服务将市场化,福利性住房服务不久将不复存在。
另外,有关部门在对33种具有代表性的商品进行国内外价格比较时发现,1998年11月,国内价格高于国际价格的有22种,占69%,其中包括小麦、玉米、大豆、豆油等农产品,硫酸、盐酸、尿素等化工产品,汽油、柴油等能源产品,铝锭、生铁等冶金产品,等等。
总之,在中国的价格形成机制、价格规模和价格结构发生重大变化的情况下,如果世行仍然依据1987年投入产出表对各行业进行价格方面的调整,也势必导致GDP数据的高估。
注1: 由于中国官方GDP和GNP数据差距不大,世界银行在计算中国官方人均GNP时是以中国官方GDP数据,而不是以GNP数据为基础。由于同样的原因,本文对GDP和GNP不加区别。
注2:中国官方人均GNP是按人民币计算的。
参考文献——
nt of the World Bank No.13580-CHA:China GNP per Capita,December15,1994.
2.世界银行文件:《转换中的中国统计体系》,国家统计局内部翻译件。
3.国家统计局1998年制定:《国家统计报表制度》。
4.国家统计局1998年制定:《农村住户调查方案》。
5.国家统计局编:《中国统计年鉴》(1994,1995 ,1997,1998) ,中国统计出版社 1994、1995、1997和1998年出版。
6.许宪春著:《中国国民经济核算体系改革与发展》,经济科学出版社1997年出版。
7.《价格监测与分析》1998年第22期
上一篇:自我保健杂志社
下一篇:医学生创新论文