这是一个典型的供应链物流的流程。
多元统计方法在产品质量控制中的应用摘要工业用氢氧化钠的主要成份是氢氧化钠、碳酸钠、氯化钠,这三个原素的含量多少决定产品质量。本文用三个随机变量代表这三种成份含量,并假设这三个变量的联合概率分布是多元正态的,在此基础上采用多元统计分析中的τ2统计量和多元控制方法相结合,用于氢氧化钠的生产控制中。
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
强烈建议您看看根据我搜集的一些网站来看,建议看看这个,要做毕业论文以及毕业设计的,推荐一个网站 ,里面的毕业设计什么的全是优秀的,因为精挑细选的,网上很少有,都是相当不错的毕业论文和毕业设计,对毕业论文的写作有很大的参考价值,希望对你有所帮助。别的相关范文很多的,推荐一些比较好的范文写作网站,希望对你有帮助,这些精选的范文网站,里面有大量的范文,也有各种文章写作方法,注意事项,应该有适合你的,自己动手找一下,可不要照搬啊,参考一下,用自己的语言写出来那才是自己的。 如果你不是校园网的话,请在下面的网站找:毕业论文网: 分类很细 栏目很多毕业论文: 毕业设计: 开题报告: 实习论文: 写作指导:
亲,可以来我们这里了解代做流程及报价,我们团队写手比较准成的
你要先有论文的目的和分析思路,然后根据目的的论文和分析思路,确定需要收集的数据和类型,最后才考虑 应该用spss什么方法来实现。下面是我自己写的一个 带数据分析的论文写作指导首先,我要说明这里的指导并非常规意义的指导,我这里说的指导是到底应该如何写论文(应该还是很抽象,不过看完就知道了)。迄今为止,我大约也帮忙做了能有上千份的学生论文数据分析部分,包括一部分的整篇论文写作,其中涉及到有医学类、护理类、人文社科类、教育类、经济学类、心理学类等,单凡需要用到数据分析的论文。因为我是做市场研究与数据分析的,擅长的主要工具是spss,不敢说百分百精通spss,但是应付个八九十应该是足够了,很自然的平时就利用下班和业余时间帮学生做一些论文数据分析以及论文写作指导。很多论文的核心部分都包括数据分析,而统计学也应该是所有学科应该学习的一门重要课程,但是恰恰相反,很多学科只是把统计学和数据分析作为一项选修甚至不重要的课程对待,这样导致学生在最后做论文时完全不懂。而在这种情况下,很多学生因为对数据分析的一窍不通,导致论文从开始的设计到后续的数据收集、整理等都会出现问题,最终导致分析出问题。因此,在对数据分析一窍不通的情况下,应该如何从头构建论文及写作呢?很多论文虽然数据分析部分是核心,但是不管哪种论文的写作,都脱离不了论文的框架。因此,具体的过程应该如下:首先是选题,当然很多时候是导师直接给选题,这个没有太多讨论。其次是选题确定后,马上要做的不是想我应该怎么去写作,或者在哪抱怨“哎~~郁闷,完全不知道怎么写嘛”。而是先通过文献查找,看前人在这个选题方面已经做了哪些研究,都是如何做的。通过查找文献找到跟选题有关的资料,然后对这些资料进行整理,整理不需要计较参考文献的结论和数据细节等,而是要把每篇文献的研究目的、采用的研究方法、采用的分析方法整理出来。当然参考文献中的分析方法你可能还完全不懂,但是没关系,你先把这些参考文献中使用的分析方法全部罗列出来,如线性回归、方差分析、均值t检验、logistic回归等,把这些文献中常用的统计方法罗列出来,你需要弄清楚对应关系,即每种分析方法是用来支持和实现什么样的研究目的,以及能够得出什么样的结论,认真阅读文献就能实现这一步。第三.通过上一步,你应该朦胧的知道你选题相关的参考文献中常用的统计方法名称,以及这些统计方法能够帮助实现哪些目的,或者得出什么结论,同时也不会对自己的选题那么恐惧和迷茫了,因为可能你的选题已经有前人做过了,你的论文只是“复制”一遍而已了,我说的复制是重复一遍前人的研究。在这种情况下,可以构思下自己的选题,这一步属于纯理论层面的,你需要将自己的思路具体化,比如要实现什么目的,很自然的需要什么数据分析方法也就能确定了。当然很多论文会预先设计一系列待验证的假设,也是在这一步完成,因为你找到的文献中可能会存在矛盾的结论,可能会存在一些你认为的研究缺陷(文献看多了,自然自己就会有想法出来了),提出自己的一系列假设,能够很清楚的指导后面的数据收集和分析。第四.选题、假设还有研究方法这些经过前面几步都能确定了,接下来就是要考虑具体研究和收集数据的环节了。这个环节最重要的也是首要的是弄清楚你的数据应该是什么类型的,通过哪种方法来获取。其实也容易了,因为前面你已经确定了统计分析方法,而每种方法有它特定的数据类型要求,比如是分类数据(如性别、民族、年级等)、比如连续性数据(如年龄、身高、体重、温度、长度、距离等)。分类数据简单通俗点的理解就是这些数字本身是没有意义的,是人为赋予它一定的含义,这些数据之间不存在连续性,且加减乘除没有意义,而连续性数据是数据本身有意义,且能够进行一些加减乘除运算。确定了所需要的数据类型,就大致能够知道在数据收集时,应该注意的问题。比如一份问卷调查,其中应该如何设计问题也就大致清楚了,通常问卷设计时就要考虑两种数据类型的问题,因为不同的选项设计会导致不同的数据类型。如你设计一个问题的答案选项是“有/没有”、“是/否”这种是属于分类数据,如果你的答案选项是李克特量表式“非常满意----非常不满意”这种,在处理时可以按照分类数据,只能统计出一些百分比,也可能将其按照连续数据如12345打分形式,这样可以求均值,可以做很多其他多元统计分析。因此这一步确定数据类型很关键,如果数据类型弄错的话,则收集的数据完全无用。第五.具体收集数据过程,不细说了,收集回来之后就是数据的录入。记住一定要录入原始的数据,而不是经过加减整理汇总后的数据。数据录入格式也是有要求的,一般大致同样的情况下,都是一行代表一个个案或者一份问卷的数据,而一列对应表示的是问卷中的一个问题,即变量。因此数据录入完成后,应该是有多少样本数据,就有多少行,数据中包含多少个指标,那就有多少列。第六.这一步才是你应该开始头疼的数据分析不会了怎么办。因为到这里才开始是数据的具体分析过程了。不会怎么办,前面已经知道了分析方法,这种情况,只有找本教材,然后找对应的方法介绍学习即可,或者实在不行找人指导,找人帮忙等等。最后。分析完成后,开始整篇论文的写作。其实完成前面的每一步,到最后写文献综述以及讨论时,自然就会得心应手了,很少会需要绞尽脑汁甚至东拼西凑。
具体要做什么分析,可以
1. 因子分析模型 因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 因子分析的基本思想: 把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子因子分析模型描述如下: (1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。 (2)F = (F1,F2,…,Fm)¢ (m
后期会把每一章的学习笔记链接加上
多元统计分析 是研究多个随机变量之间相互依赖关系及其内在统计规律的一门学科
在统计学的基本内容汇总,只考虑一个或几个因素对一个观测指标(变量)的影响大小的问题,称为 一元统计分析 。
若考虑一个或几个因素对两个或两个以上观测指标(变量)的影响大小的问题,或者多个观测指标(变量)的相互依赖关系,既称为 多元统计分析 。
有两大类,包括:
将数据归类,找出他们之间的联系和内在规律。
构造分类模型一般采用 聚类分析 和 判别分析 技术
在众多因素中找出各个变量中最佳的子集合,根据子集合所包含的信心描述多元系统的结果及各个因子对系统的影响,舍弃次要因素,以简化系统结构,认识系统的内核(有点做单细胞降维的意思)
可采用 主成分分析 、 因子分析 、 对应分析 等方法。
多元统计分析的内容主要有: 多元数据图示法 、 多元线性相关 与 回归分析 、 判别分析 、 聚类分析 、 主成分分析 、 因子分析 、 对应分析 及 典型相关分析 等。
多元数据是指具有多个变量的数据。如果将每个变量看作一个随机向量的话,多个变量形成的数据集将是一个随机矩阵,所以多元数据的基本表现形式是一个矩阵。对这些数据矩阵进行数学表示是我们的首要任务。也就是说,多元数据的基本运算是矩阵运算,而R语言是一个优秀的矩阵运算语言,这也是我们应用它的一大优势。
直观分析即图示法,是进行数据分析的重要辅助手段。例如,通过两变量的散点图可以考察异常的观察值对样本相关系数的影响,利用矩阵散点图可以考察多元之间的关系,利用多元箱尾图可以比较几个变量的基本统计量的大小差别。
相关分析就是通过对大量数字资料的观察,消除偶然因素的影响,探求现象之间相关关系的密切程度和表现形式。在经济系统中,各个经济变量常常存在内在的关系。例如,经济增长与财政收人、人均收入与消费支出等。在这些关系中,有一些是严格的函数关系,这类关系可以用数学表达式表示出来。还有一些是非确定的关系,一个变量产生变动会影响其他变量,使其产生变化。这种变化具有随机的特性,但是仍然遵循一定的规律。函数关系很容易解决,而那些非确定的关系,即相关关系,才是我们所关心的问题。
回归分析研究的主要对象是客观事物变量间的统计关系。它是建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在看起来不确定的现象中的统计规律的方法。回归分析不仅可以揭示自变量对因变量的影响大小,还可以用回归方程进行预测和控制。回归分析的主要研究范围包括:
(1) 线性回归模型: 一元线性回归模型 , 多元线性回归模型 。 (2) 回归模型的诊断: 回归模型基本假设的合理性,回归方程拟合效果的判定,选择回归函数的形式。 (3) 广义线性模型: 含定性变量的回归 , 自变量含定性变量 , 因变量含定性变量 。 (4) 非线性回归模型: 一元非线性回归 , 多元非线性回归 。
在实际研究中,经常遇到一个随机变量随一个或多个非随机变量的变化而变化的情况,而这种变化关系明显呈非线性。怎样用一个较好的模型来表示,然后进行估计与预测,并对其非线性进行检验就成为--个重要的问题。在经济预测中,常用多元回归模型反映预测量与各因素之间的依赖关系,其中,线性回归分析有着广泛的应用。但客观事物之间并不一定呈线性关系,在有些情况下,非线性回归模型更为合适,只是建立起来较为困难。在实际的生产过程中,生产管理目标的参量与加工数量存在相关关系。随着生产和加工数量的增加,生产管理目标的参量(如生产成本和生产工时等)大多不是简单的线性增加,此时,需采用非线性回归分析进行分析。
鉴于统计模型的多样性和各种模型的适应性,针对因变量和解释变量的取值性质,可将统计模型分为多种类型。通常将自变量为定性变量的线性模型称为 一般线性模型 ,如实验设计模型、方差分析模型; 将因变量为非正态分布的线性模型称为 广义线性模型 ,如 Logistic回归模型 、 对数线性模型 、 Cox比例风险模型 。
1972年,Nelder对经典线性回归模型作了进一步的推广,建立了统一的理论和计算框架,对回归模型在统计学中的应用产生了重要影响。这种新的线性回归模型称为广义线性模型( generalized linear models,GLM)。
广义线性模型是多元线性回归模型的推广,从另一个角度也可以看作是非线性模型的特例,它们具有--些共性,是其他非线性模型所不具备的。它与典型线性模型的区别是其随机误差的分布 不是正态分布 ,与非线性模型的最大区别则在于非线性模型没有明确的随机误差分布假定,而广义线性模型的 随机误差的分布是可以确定的 。广义线性模型 不仅包括离散变量,也包括连续变量 。正态分布也被包括在指数分布族里,该指数分布族包含描述发散状况的参数,属于双参数指数分布族。
判别分析是多元统计分析中用于 判别样本所属类型 的一种统计分析方法。所谓判别分析法,是在已知的分类之下,一旦有新的样品时,可以利用此法选定一个判别标准,以判定将该新样品放置于哪个类别中。判别分析的目的是对已知分类的数据建立由数值指标构成的 分类规则 ,然后把这样的规则应用到未知分类的样品中去分类。例如,我们获得了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标中发现两类人的区别。把这种区别表示为一个判别公式,然后对那些被怀疑患胃炎的人就可以根据其化验指标用判别公式来进行辅助诊断。
聚类分析是研究 物以类聚 的--种现代统计分析方法。过去人们主要靠经验和专业知识作定性分类处理,很少利用数学方法,致使许多分类带有主观性和任意性,不能很好地揭示客观事物内在的本质差别和联系,特别是对于多因素、多指标的分类问题,定性分类更难以实现准确分类。为了克服定性分类的不足,多元统计分析逐渐被引人到数值分类学中,形成了聚类分析这个分支。
聚类分析是一种分类技术,与多元分析的其他方法相比,该方法较为粗糙,理论上还不完善,但应用方面取得了很大成功。 聚类分析 与 回归分析 、 判别分析 一起被称为多元分析的三个主要方法。
在实际问题中,研究多变量问题是经常遇到的,然而在多数情况下,不同变量之间有一定相关性,这必然增加了分析问题的复杂性。主成分分析就是一种 通过降维技术把多个指标化为少数几个综合指标 的统计分析方法。如何将具有错综复杂关系的指标综合成几个较少的成分,使之既有利于对问题进行分析和解释,又便于抓住主要矛盾作出科学的评价,此时便可以用主成分分析方法。
因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,但其目的是 用有限个不可观测的隐变量来解释原变量之间的相关关系 。主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多元分析中,变量间往往存在相关性,是什么原因使变量间有关联呢? 是否存在不能直接观测到的但影响可观测变量变化的公共因子呢?
因子分析就是寻找这些公共因子的统计分析方法,它是 在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别 。例如,在研究糕点行业的物价变动中,糕点行业品种繁多、多到几百种甚至上千种,但无论哪种样式的糕点,用料不外乎面粉、食用油、糖等主要原料。那么,面粉、食用油、糖就是众多糕点的公共因子,各种糕点的物价变动与面粉、食用油、糖的物价变动密切相关,要了解或控制糕点行业的物价变动,只要抓住面粉、食用油和糖的价格即可。
对应分析又称为相应分析,由法国统计学家于 1970年提出。对应分析是在因子分析基础之上发展起来的一种多元统计方法,是Q型和R型因子分析的联合应用。在经济管理数据的统计分析中,经常要处理三种关系,即 样品之间的关系(Q型关系)、变量间的关系(R型关系)以及样品与变量之间的关系(对应型关系) 。例如,对某一行业所属的企业进行经济效益评价时,不仅要研究经济效益指标间的关系,还要将企业按经济效益的好坏进行分类,研究哪些企业与哪些经济效益指标的关系更密切一些,为决策部门正确指导企业的生产经营活动提供更多的信息。这就需要有一种统计方法, 将企业(样品〉和指标(变量)放在一起进行分析、分类、作图,便于作经济意义.上的解释 。解决这类问题的统计方法就是对应分析。
在相关分析中,当考察的一组变量仅有两个时,可用 简单相关系数 来衡量它们;当考察的一组变量有多个时,可用 复相关系数 来衡量它们。大量的实际问题需要我们把指标之间的联系扩展到两组变量,即 两组随机变量之间的相互依赖关系 。典型相关分析就是用来解决此类问题的一种分析方法。它实际上是 利用主成分的思想来讨论两组随机变量的相关性问题,把两组变量间的相关性研究化为少数几对变量之间的相关性研究,而且这少数几对变量之间又是不相关的,以此来达到化简复杂相关关系的目的 。
典型相关分析在经济管理实证研究中有着广泛的应用,因为许多经济现象之间都是多个变量对多个变量的关系。例如,在研究通货膨胀的成因时,可把几个物价指数作为一组变量,把若干个影响物价变动的因素作为另一组变量,通过典型相关分析找出几对主要综合变量,结合典型相关系数对物价上涨及通货膨胀的成因,给出较深刻的分析结果。
多维标度分析( multidimensional scaling,MDS)是 以空间分布的形式表现对象之间相似性或亲疏关系 的一种多元数据分析方法。1958年,Torgerson 在其博士论文中首次正式提出这一方法。MDS分析多见于市场营销,近年来在经济管理领域的应用日趋增多,但国内在这方面的应用报道极少。多维标度法通过一系列技巧,使研究者识别构成受测者对样品的评价基础的关键维数。例如,多维标度法常用于市场研究中,以识别构成顾客对产品、服务或者公司的评价基础的关键维数。其他的应用如比较自然属性(比如食品口味或者不同的气味),对政治候选人或事件的了解,甚至评估不同群体的文化差异。多维标度法 通过受测者所提供的对样品的相似性或者偏好的判断推导出内在的维数 。一旦有数据,多维标度法就可以用来分析:①评价样品时受测者用什么维数;②在特定情况下受测者可能使用多少维数;③每个维数的相对重要性如何;④如何获得对样品关联的感性认识。
20世纪七八十年代,是现代科学评价蓬勃兴起的年代,在此期间产生了很多种评价方法,如ELECTRE法、多维偏好分析的线性规划法(LINMAP)、层次分析法(AHP)、数据包络分析法(EDA)及逼近于理想解的排序法(TOPSIS)等,这些方法到现在已经发展得相对完善了,而且它们的应用也比较广泛。
而我国现代科学评价的发展则是在20世纪八九十年代,对评价方法及其应用的研究也取得了很大的成效,把综合评价方法应用到了国民经济各个部门,如可持续发展综合评价、小康评价体系、现代化指标体系及国际竞争力评价体系等。
多指标综合评价方法具有以下特点: 包含若干个指标,分别说明被评价对象的不同方面 ;评价方法最终要 对被评价对象作出一个整体性的评判,用一个总指标来说明被评价对象的一般水平 。
目前常用的综合评价方法较多, 如综合评分法、综合指数法、秩和比法、层次分析法、TOPSIS法、模糊综合评判法、数据包络分析法 等。
R -- 永远滴神~
多元统计分析论文各省市数据可以在国家统计局下设省统计局,市统计局,均可获取各地的数据资料。多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律,很适合农业科学研究的特点。
统计学专业毕业生的就业情况分析论文
随着社会经济发展以及高校扩招,大学生就业竞争日益激烈,大学生就业成为一个社会关注的问题。成都信息工程大学统计学院毕业生在求职过程中,虽然具有良好的就业基础和条件,但在求职过程中因为各种原因而与工作失之交臂的情况也时有发生。怎样有效地根据社会和市场的变化制定和实施人才培养方案,怎样采取切实有效的手段提高教育、教学质量,怎样联通和挖掘各种渠道最大限度提高学生动实践创新能力,都是需要解决的问题
资料显示,2014年我国大学毕业生人数达到727万人,比被称为“史上最难就业季”2013年再增加28万人,创下历史新高,而2015年这个人数更是达到749万人,再创历史新高,再加上往届没有就业以及准备换工作的大学生,想要就业的大学生数量之多难以想象,大学生的就业形势十分严峻,各方面的就业压力都非常巨大。因此大学毕业生能否顺利就业,已经成为社会普遍关注、值得探讨的问题。
统计学专业学生主要就业渠道是统计系统和金融系统的相关行业和企事业单位,就业领域广泛,就业质量良好。但是统计学院与西财、川大等四川高校相比,还有明显差距,所以深入研究我院人才培养方式的特色和不足,搞清楚学生就业方方面面的情况显得尤为必要。
本文通过对106名学生和150名用人单位人员的问卷调查,以及就业登记第一手资料,整理归纳了统计学专业就业方面的各种情况。
1、大部分在校学生认为,社会实践或者工作经验是最大的就业优势,有62名被调查学生将社会实践或者工作经验排在第一位,占。
2、150名用人单位人员调查中,社会实践或者工作经验得分最高,为1270;其次为学习成绩好,得分1155。用人单位普遍认为统计学专业大学生最应该具备社会实践或者工作经验。
3、用人单位对应届统计专业毕业生能力重要程度排序为:“统计调查的组织实施能力”最重要,占比39%;其次为“统计调查的数据整理与分析能力”,占比36%;统计调查的设计能力排名第三,占比25%。
4、用人单位对工作10年的统计人员素质排序则发生了明显变化,统计调查设计能力上升到第一位,统计调查的组织实施能力则下降到第三位。
5、从统计学专业设置的主要课程来看,用人单位认为最需要开设的是《多元统计分析及SPSS实现》,得分高达814;其次是《经济学原理》和《统计学原理》,得分分别为538、504;得分最低的是《社会经济调查与分析》,为459。
由于大学生读书时基本集中在各大城市,应届毕业生在毕业时宁可成为大城市中的“蚁族”或“漂族”,也不愿意去二三线城市或者县城乡镇等基层单位就业。中小企业与民营企业虽然需要大量的应届毕业生,但是工资福利待遇相对而言较低、发展空间相对较小,加上部分企业单位用工不符合国家政策,因此对应届毕业生的吸引力有限;基层医疗、教育、农林技等部门虽然急需人才,但因为编制限制等诸多原因,吸引应届毕业生的能力有限。具体说来就业难主要有以下几方面原因:
(1)我国现阶段中小企业数量规模较小,提供的就业岗位不能满足应届毕业生的就业需求;
(2)人才的培训缺乏专业化,造成专业人才素质未达标,造成部分岗位缺乏专业人士;
(3)部分企业的招聘信息公布范围不够广,使得招聘信息传播存在局限性,最终导致难以找到合适的员工,造成职位长期空闲;
(4)大学应届毕业生人数的增长速度远远高于我国经济的增长速度。同时因为我国各地区之间以及城乡之间存在较大差异,虽然政府多次宣传提出支援西部,大学生西部志愿者等政策,但是大学生很少愿意在经济欠发达地区就业尤其西部地区为主,并且在较长的一段时间里,大学生就业区间不平衡的状况仍旧很难改变。
由此提出两方面的建议:
第一、学生方面:1、大学生应该转变观念,以实现顺利就业。大学生不应该把未来职业的目光定在传统的'“集中”的区域、行业、单位,而应该根据自己的个性、能力、作出个性化的职业选择拓宽求职的视野,尽量做到乐在其中,以求能以更好的心态进入自己的职业生涯。将“短期求职”改变为“较长期求职”,在求职过程中,应届毕业生不应该太过理想化,一个人或许要经过2至3次甚至更多次的选择,才能找到适合自己的工作,因此我们对第一份工作不必要过于挑剔,而应该注意求职中的真实感受。2、大学生在就业过程中应该培养和发扬乐观向上积极进取的品质;良好的团队合作精神;敢于挑战,具有勇于战胜困难的决心;强烈的责任心;规范的行为意识;一定的社会实践经历。3、大学生应该在毕业前应该注意自身修养的提高,在学习之余,同时也应该注意社会实践活动的调高。同时也需要养成良好的心态,能在就业过程中做到胜不骄败不馁,才能在就业过程中实现自我价值。
第二、学校方面:
1、职业生涯规划教育要落到实处,并根据实际情况及时调整。我院在职业规划当中,应该较早引导学生制定一个职业规划,告诉学生未来就业的趋势以及就业状况,但是又不能像定了一个框框,从而对学生造成束缚,形成一种误导,避免毕业生一心只想到银行、当公务员,而相对忽视其他公司单位。事实上,就业情况复杂多变,专业的就业方向也复杂多变,应该帮助学生更多的根据自己的兴趣、自己的能力,甚至自己的价值取向来择业,而不应该仅仅根据以前的就业经验与就业形势来决定自己的就业,而应该根据外部环境以及自己的取向来不断调整就业方向。
2、学校所开的专业课程应能满足学生目标职业的需求。通过调查得知,用人单位虽然对我院开设的专业课程认同度虽然较高,但是就学生而言,对于本专业的课程设置却认同度则相对较低,就我们学院而言,我觉得在原有专业选修课的基础上,可以适度减少专业必修课而适量增加部分专业选修课,使学生能根据自己的目标职业规划选择相对的专业选修课程,同时也能使学生根据自己的兴趣来上课,能增加上课的积极性。同时学校应该与部分企业联系,实现校企合作,为学生提供更多的实习机会,让学生有更多的社会实践机会,以此开阔学生的视野,增强社会适应能力,在就业过程中具有较高的竞争力。另外,我院应让老师去企业观摩,了解企业对专业人才需求的技能,以此为根据来设置我院的专业课程。同时应通过校企合作组建实习基地、毕业生推荐实习等途径进行就业指导,为在校学生拓宽实习实训渠道,练得一手过硬的动手能力。
3、学校应该增强学生的就业适应能力。学院除了开设传统的就业指导课程以外,我觉得还可以组织模拟应聘,鼓励学生参加模拟招聘比赛等方式来增强学生的面试综合应对能力。这样既可以增加学生的面试经验与反应能力,也可以磨练学生的胆量,提高学生的视野,现在的学生越来越喜欢具有双向交流特点的就业指导方式,诸如往届就业好的毕业生传授交流就业心德、求职案例分析、企业的领导专题讲座,与学生互动交流企业需求的人才类型、模拟招聘、短期就业实习、面对面咨询等新型就业指导方法都是不错的选择。同时我们学院应普及和提高我院学生的职业生涯规划意识。实践证明,在大学生从被动就业转向主动择业过程中,职业生涯规划起到了实质性的引导和帮助作用。
4、学校应对重点的学生给予更多关注,能及时对学生的就业心理进行辅导。配置就业指导老师和心里理指导老师,建立与之配套的学校-院系-班级的心理指导体系,并选配有良好沟通能力与专业技能,具有责任心的老师来担任各学院的就业心理指导老师,以保证学生在就业过程中出现心理偏差时能有专人及时进行指导,带领学生走出阴霾。
提供一些经济统计类的学年论文题目,供写作参考。1. 某省各地市经济发展水平的综合评价 2. 工业企业经济效益综合评价的应用研究 3. 某省市经济发展水平分区研究 4. 某省市消费拉动第三产业增长的实证分析 5. 某省市城镇居民消费结构变化趋势研究 6. 某省普通高等教育生源变动趋势与对策研究 7. 某省城镇居民消费结构比较研究 8. 某高校学生的心理健康统计分析 9. 课堂教学评估体系与方法研究 10. 某市各区县经济综合实力评价研究 11. 基于多元统计的某省经济分区研究 12. 因子分析在某省利用外资效果评价中的应用 13. 因子分析在居民消费结构变动分析中的应用 14. 因子分析在企业竞争力评价中的应用 15. 深沪股市收益率分布特征的统计分析 16. 某省市农民收入问题的调查与思考 17. 最优加权组合法在GDP预测中的运用研究 18. 最优加权组合法在粮食产量预测中的运用研究 19. 最优加权组合法在能源消耗预测中的运用研究 20. 我国(某省)实际人均GDP的趋势分析及预测 21. 某省市工业经济效益的综合评价 22. 工业企业科技竞争力的综合评价 23. 某省市城镇居民消费结构的地区差异分析 24. 某省市各地区经济综合实力的评价 25. 基于因子分析法的上市公司财务状况评价研究 26. 某省工业化进程统计测度及实证分析 27. 某省城市化进程统计测度及实证分析 28. 某省城市规模发展水平分析与比较研究 29. 某省市工业行业结构特征的因子分析 30. 城镇居民消费的典型相关分析 31. 我国(某省)各地区人口素质差异的统计分析 32. 我国(某省)三次产业结构变动的统计分析 33. 某省农业产业化发展的实证研究 34. 某省外贸出口与经济发展关系的实证研究 35. 县域经济发展综合评价的实证研究 36. 某省各县市经济发展的聚类分析 37. 某省各县市产业结构的聚类分析 38. 某省(市)信息化实现程度实证评价 39. 某省(市)环境保护综合评价 40. 我国科技进步贡献率的测度 41. 某省(市)居民生活水平与质量实证评价 42. 某省(市)经济外向度实证研究 43. 县级政绩考核指标体系与方法研究 44. 我国城乡居民收入差距实证研究 45. 我国东西部城镇居民收入差距实证研究 46. 某省市城镇居民消费水平与结构变化趋势研究 47. 某省市投资拉动GDP增长的实证研究 48. 耐用品需求预测模型及其应用研究 49. 某省市GDP周期波动实证研究 50. 某省市工业周期波动实证研究 51. 某省市零售市场周期波动实证研究 52. 某省市农民收入周期波动实证研究 53. 某省市人口最优预测模型与应用研究 54. 某省市人口老龄化趋势与对策研究 55. 某省市财政收支变化趋势与对策研究 56. 某省市城镇居收入差距变化趋势与对策研究 57. 某省市农民收入差距变化趋势与对策研究 58. 长江水质的综合评价与预测 59. 多元统计分析方法在股票市场板块中的应用研究 60. ARCH族波动模型研究及其在我国股市中的应用研究
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
1. 因子分析模型 因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 因子分析的基本思想: 把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子因子分析模型描述如下: (1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。 (2)F = (F1,F2,…,Fm)¢ (m
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
后期会把每一章的学习笔记链接加上
多元统计分析 是研究多个随机变量之间相互依赖关系及其内在统计规律的一门学科
在统计学的基本内容汇总,只考虑一个或几个因素对一个观测指标(变量)的影响大小的问题,称为 一元统计分析 。
若考虑一个或几个因素对两个或两个以上观测指标(变量)的影响大小的问题,或者多个观测指标(变量)的相互依赖关系,既称为 多元统计分析 。
有两大类,包括:
将数据归类,找出他们之间的联系和内在规律。
构造分类模型一般采用 聚类分析 和 判别分析 技术
在众多因素中找出各个变量中最佳的子集合,根据子集合所包含的信心描述多元系统的结果及各个因子对系统的影响,舍弃次要因素,以简化系统结构,认识系统的内核(有点做单细胞降维的意思)
可采用 主成分分析 、 因子分析 、 对应分析 等方法。
多元统计分析的内容主要有: 多元数据图示法 、 多元线性相关 与 回归分析 、 判别分析 、 聚类分析 、 主成分分析 、 因子分析 、 对应分析 及 典型相关分析 等。
多元数据是指具有多个变量的数据。如果将每个变量看作一个随机向量的话,多个变量形成的数据集将是一个随机矩阵,所以多元数据的基本表现形式是一个矩阵。对这些数据矩阵进行数学表示是我们的首要任务。也就是说,多元数据的基本运算是矩阵运算,而R语言是一个优秀的矩阵运算语言,这也是我们应用它的一大优势。
直观分析即图示法,是进行数据分析的重要辅助手段。例如,通过两变量的散点图可以考察异常的观察值对样本相关系数的影响,利用矩阵散点图可以考察多元之间的关系,利用多元箱尾图可以比较几个变量的基本统计量的大小差别。
相关分析就是通过对大量数字资料的观察,消除偶然因素的影响,探求现象之间相关关系的密切程度和表现形式。在经济系统中,各个经济变量常常存在内在的关系。例如,经济增长与财政收人、人均收入与消费支出等。在这些关系中,有一些是严格的函数关系,这类关系可以用数学表达式表示出来。还有一些是非确定的关系,一个变量产生变动会影响其他变量,使其产生变化。这种变化具有随机的特性,但是仍然遵循一定的规律。函数关系很容易解决,而那些非确定的关系,即相关关系,才是我们所关心的问题。
回归分析研究的主要对象是客观事物变量间的统计关系。它是建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在看起来不确定的现象中的统计规律的方法。回归分析不仅可以揭示自变量对因变量的影响大小,还可以用回归方程进行预测和控制。回归分析的主要研究范围包括:
(1) 线性回归模型: 一元线性回归模型 , 多元线性回归模型 。 (2) 回归模型的诊断: 回归模型基本假设的合理性,回归方程拟合效果的判定,选择回归函数的形式。 (3) 广义线性模型: 含定性变量的回归 , 自变量含定性变量 , 因变量含定性变量 。 (4) 非线性回归模型: 一元非线性回归 , 多元非线性回归 。
在实际研究中,经常遇到一个随机变量随一个或多个非随机变量的变化而变化的情况,而这种变化关系明显呈非线性。怎样用一个较好的模型来表示,然后进行估计与预测,并对其非线性进行检验就成为--个重要的问题。在经济预测中,常用多元回归模型反映预测量与各因素之间的依赖关系,其中,线性回归分析有着广泛的应用。但客观事物之间并不一定呈线性关系,在有些情况下,非线性回归模型更为合适,只是建立起来较为困难。在实际的生产过程中,生产管理目标的参量与加工数量存在相关关系。随着生产和加工数量的增加,生产管理目标的参量(如生产成本和生产工时等)大多不是简单的线性增加,此时,需采用非线性回归分析进行分析。
鉴于统计模型的多样性和各种模型的适应性,针对因变量和解释变量的取值性质,可将统计模型分为多种类型。通常将自变量为定性变量的线性模型称为 一般线性模型 ,如实验设计模型、方差分析模型; 将因变量为非正态分布的线性模型称为 广义线性模型 ,如 Logistic回归模型 、 对数线性模型 、 Cox比例风险模型 。
1972年,Nelder对经典线性回归模型作了进一步的推广,建立了统一的理论和计算框架,对回归模型在统计学中的应用产生了重要影响。这种新的线性回归模型称为广义线性模型( generalized linear models,GLM)。
广义线性模型是多元线性回归模型的推广,从另一个角度也可以看作是非线性模型的特例,它们具有--些共性,是其他非线性模型所不具备的。它与典型线性模型的区别是其随机误差的分布 不是正态分布 ,与非线性模型的最大区别则在于非线性模型没有明确的随机误差分布假定,而广义线性模型的 随机误差的分布是可以确定的 。广义线性模型 不仅包括离散变量,也包括连续变量 。正态分布也被包括在指数分布族里,该指数分布族包含描述发散状况的参数,属于双参数指数分布族。
判别分析是多元统计分析中用于 判别样本所属类型 的一种统计分析方法。所谓判别分析法,是在已知的分类之下,一旦有新的样品时,可以利用此法选定一个判别标准,以判定将该新样品放置于哪个类别中。判别分析的目的是对已知分类的数据建立由数值指标构成的 分类规则 ,然后把这样的规则应用到未知分类的样品中去分类。例如,我们获得了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标中发现两类人的区别。把这种区别表示为一个判别公式,然后对那些被怀疑患胃炎的人就可以根据其化验指标用判别公式来进行辅助诊断。
聚类分析是研究 物以类聚 的--种现代统计分析方法。过去人们主要靠经验和专业知识作定性分类处理,很少利用数学方法,致使许多分类带有主观性和任意性,不能很好地揭示客观事物内在的本质差别和联系,特别是对于多因素、多指标的分类问题,定性分类更难以实现准确分类。为了克服定性分类的不足,多元统计分析逐渐被引人到数值分类学中,形成了聚类分析这个分支。
聚类分析是一种分类技术,与多元分析的其他方法相比,该方法较为粗糙,理论上还不完善,但应用方面取得了很大成功。 聚类分析 与 回归分析 、 判别分析 一起被称为多元分析的三个主要方法。
在实际问题中,研究多变量问题是经常遇到的,然而在多数情况下,不同变量之间有一定相关性,这必然增加了分析问题的复杂性。主成分分析就是一种 通过降维技术把多个指标化为少数几个综合指标 的统计分析方法。如何将具有错综复杂关系的指标综合成几个较少的成分,使之既有利于对问题进行分析和解释,又便于抓住主要矛盾作出科学的评价,此时便可以用主成分分析方法。
因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,但其目的是 用有限个不可观测的隐变量来解释原变量之间的相关关系 。主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多元分析中,变量间往往存在相关性,是什么原因使变量间有关联呢? 是否存在不能直接观测到的但影响可观测变量变化的公共因子呢?
因子分析就是寻找这些公共因子的统计分析方法,它是 在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别 。例如,在研究糕点行业的物价变动中,糕点行业品种繁多、多到几百种甚至上千种,但无论哪种样式的糕点,用料不外乎面粉、食用油、糖等主要原料。那么,面粉、食用油、糖就是众多糕点的公共因子,各种糕点的物价变动与面粉、食用油、糖的物价变动密切相关,要了解或控制糕点行业的物价变动,只要抓住面粉、食用油和糖的价格即可。
对应分析又称为相应分析,由法国统计学家于 1970年提出。对应分析是在因子分析基础之上发展起来的一种多元统计方法,是Q型和R型因子分析的联合应用。在经济管理数据的统计分析中,经常要处理三种关系,即 样品之间的关系(Q型关系)、变量间的关系(R型关系)以及样品与变量之间的关系(对应型关系) 。例如,对某一行业所属的企业进行经济效益评价时,不仅要研究经济效益指标间的关系,还要将企业按经济效益的好坏进行分类,研究哪些企业与哪些经济效益指标的关系更密切一些,为决策部门正确指导企业的生产经营活动提供更多的信息。这就需要有一种统计方法, 将企业(样品〉和指标(变量)放在一起进行分析、分类、作图,便于作经济意义.上的解释 。解决这类问题的统计方法就是对应分析。
在相关分析中,当考察的一组变量仅有两个时,可用 简单相关系数 来衡量它们;当考察的一组变量有多个时,可用 复相关系数 来衡量它们。大量的实际问题需要我们把指标之间的联系扩展到两组变量,即 两组随机变量之间的相互依赖关系 。典型相关分析就是用来解决此类问题的一种分析方法。它实际上是 利用主成分的思想来讨论两组随机变量的相关性问题,把两组变量间的相关性研究化为少数几对变量之间的相关性研究,而且这少数几对变量之间又是不相关的,以此来达到化简复杂相关关系的目的 。
典型相关分析在经济管理实证研究中有着广泛的应用,因为许多经济现象之间都是多个变量对多个变量的关系。例如,在研究通货膨胀的成因时,可把几个物价指数作为一组变量,把若干个影响物价变动的因素作为另一组变量,通过典型相关分析找出几对主要综合变量,结合典型相关系数对物价上涨及通货膨胀的成因,给出较深刻的分析结果。
多维标度分析( multidimensional scaling,MDS)是 以空间分布的形式表现对象之间相似性或亲疏关系 的一种多元数据分析方法。1958年,Torgerson 在其博士论文中首次正式提出这一方法。MDS分析多见于市场营销,近年来在经济管理领域的应用日趋增多,但国内在这方面的应用报道极少。多维标度法通过一系列技巧,使研究者识别构成受测者对样品的评价基础的关键维数。例如,多维标度法常用于市场研究中,以识别构成顾客对产品、服务或者公司的评价基础的关键维数。其他的应用如比较自然属性(比如食品口味或者不同的气味),对政治候选人或事件的了解,甚至评估不同群体的文化差异。多维标度法 通过受测者所提供的对样品的相似性或者偏好的判断推导出内在的维数 。一旦有数据,多维标度法就可以用来分析:①评价样品时受测者用什么维数;②在特定情况下受测者可能使用多少维数;③每个维数的相对重要性如何;④如何获得对样品关联的感性认识。
20世纪七八十年代,是现代科学评价蓬勃兴起的年代,在此期间产生了很多种评价方法,如ELECTRE法、多维偏好分析的线性规划法(LINMAP)、层次分析法(AHP)、数据包络分析法(EDA)及逼近于理想解的排序法(TOPSIS)等,这些方法到现在已经发展得相对完善了,而且它们的应用也比较广泛。
而我国现代科学评价的发展则是在20世纪八九十年代,对评价方法及其应用的研究也取得了很大的成效,把综合评价方法应用到了国民经济各个部门,如可持续发展综合评价、小康评价体系、现代化指标体系及国际竞争力评价体系等。
多指标综合评价方法具有以下特点: 包含若干个指标,分别说明被评价对象的不同方面 ;评价方法最终要 对被评价对象作出一个整体性的评判,用一个总指标来说明被评价对象的一般水平 。
目前常用的综合评价方法较多, 如综合评分法、综合指数法、秩和比法、层次分析法、TOPSIS法、模糊综合评判法、数据包络分析法 等。
R -- 永远滴神~
1. 因子分析模型 因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 因子分析的基本思想: 把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子因子分析模型描述如下: (1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。 (2)F = (F1,F2,…,Fm)¢ (m