毕业论文数据统计集合分享

发布时间：2023-12-11 23:21:35

毕业论文数据统计集合分享

论文数据处理方法

论文数据处理方法，相信绝大部分的小伙伴都写过毕业论文吧，当然也会有正准备要写毕业论文的小伙伴要写毕业论文了，那么论文数据处理方法大家都知道是什么吗？接下来让我们一起来看看吧。

一是列表法。列表法就是将一组实验数据和计算的中间数据依据一定的形式和顺序列成表格。列表法可以简单明确地表示出物理量之间的对应关系，便于分析和发现资料的规律性，也有助于检查和发现实验中的问题，这就是列表法的优点。设计记录表格时要满足以下几点：

1、表格设计要合理，以利于记录、检查、运算和分析。

2、表格中涉及的各物理量，其符号、单位及量值的数量级均要表示清楚。但不要把单位写在数字后。

3、表中数据要正确反映测量结果的有效数字和不确定度。列入表中的除原始数据外，计算过程中的一些中间结果和最后结果也可以列入表中。

此外，表格要加上必要的说明。通常情况下，实验室所给的数据或查得的单项数据应列在表格的上部，说明写在表格的下部。

二是作图法。作图法是在坐标纸上用图线表示物理量之间的关系，揭示物理量之间的联系。作图法既有简明、形象、直观、便于比较研究实验结果等优点，它是一种最常用的数据处理方法。作图法的基本规则是：

1、根据函数关系选择适当的坐标纸(如直角坐标纸，单对数坐标纸，双对数坐标纸，极坐标纸等)和比例，画出坐标轴，标明物理量符号、单位和刻度值，并写明测试条件。

2、坐标的原点不一定是变量的零点，可根据测试范围加以选择。，坐标分格最好使最低数字的一个单位可靠数与坐标最小分度相当。纵横坐标比例要恰当，以使图线居中。

3、描点和连线。根据测量数据，用直尺和笔尖使其函数对应的实验点准确地落在相应的位置。一张图纸上画上几条实验曲线时，每条图线应用不同的.标记符号标出，以免混淆。连线时，要顾及到数据点，使曲线呈光滑曲线(含直线)，并使数据点均匀分布在曲线(直线)的两侧，且尽量贴近曲线。个别偏离过大的点要重新审核，属过失误差的应剔去。

4、标明图名，即做好实验图线后，应在图纸下方或空白的明显位置处，写上图的名称、作者和作图日期，有时还要附上简单的说明，如实验条件等，使读者一目了然。作图时，一般将纵轴代表的物理量写在前面，横轴代表的物理量写在后面，中间用“～”联接。

实验数据的处理离不开绘制成表，列表法和作图法还是有一定区别的。科研工作者在处理数据时，要注意根据实验数据的特点，选择是用列表法还是作图法。

1、基本描述统计

频数分析是用于分析定类数据的选择频数和百分比分布。

描述分析用于描述定量数据的集中趋势、波动程度和分布形状。如要计算数据的平均值、中位数等，可使用描述分析。

分类汇总用于交叉研究，展示两个或更多变量的交叉信息，可将不同组别下的数据进行汇总统计。

2、信度分析

信度分析的方法主要有以下三种：Cronbach α信度系数法、折半信度法、重测信度法。

Cronbach α信度系数法为最常使用的方法，即通过Cronbach α信度系数测量测验或量表的信度是否达标。

折半信度是将所有量表题项分为两半，计算两部分各自的信度以及相关系数，进而估计整个量表的信度的测量方法。可在信度分析中选择使用折半系数或是Cronbach α系数。

重测信度是指同一批样本，在不同时间点做了两次相同的问题，然后计算两次回答的相关系数，通过相关系数去研究信度水平。

3、效度分析

效度有很多种，可分为四种类型：内容效度、结构效度、区分效度、聚合效度。具体区别如下表所示：

4、差异关系研究

T检验可分析X为定类数据，Y为定量数据之间的关系情况，针对T检验，X只能为2个类别。

当组别多于2组，且数据类型为X为定类数据，Y为定量数据，可使用方差分析。

如果要分析定类数据和定类数据之间的关系情况，可使用交叉卡方分析。

如果研究定类数据与定量数据关系情况，且数据不正态或者方差不齐时，可使用非参数检验。

5、影响关系研究

相关分析用于研究定量数据之间的关系情况，可以分析包括是否有关系,以及关系紧密程度等。分析时可以不区分XY，但分析数据均要为定量数据。

回归分析通常指的是线性回归分析，一般可在相关分析后进行，用于研究影响关系情况，其中X通常为定量数据（也可以是定类数据，需要设置成哑变量），Y一定为定量数据。

回归分析通常分析Y只有一个，如果想研究多个自变量与多个因变量的影响关系情况，可选择路径分析。

论文的数据分析怎么写如下：

首先，针对实证性论文而言，在开始撰写论文之前，必须要提前确定好数据研究方法。而数据研究方法的确定与选择需要根据大家毕业论文的研究课题来确定。

另外，大家也可以跟自己的的论文指导老师多多交流，尽可能多的了解更多关于研究方法的知识，以供自己选择。除此之外，大家还需要大量查找文献资料，见多识广有大量输入之后才能有所输出，本环节需要大家跟导师沟通商议后决定。

接下来一个比较重要的步骤是搜集和整理实验数据。在这一部分，很多同学朋友都会遇到各种各样的问题，比如，不知道去哪里找数据，找到的数据可靠性无法保障，需要的数据总是无法搜集全面等等各种问题。

那么在这里需要跟大家强调一下，推荐大家使用国家统计局、中国统计年鉴、国泰安、万方等等这些比较权威的网站去搜集数据资料。

在此需要注意的是，国泰安和万方等这些网站是需要收费的，上去看了一下，价格不是很亲民。

给大家分享一下，如果有些数据在国家官方网站确实找不到或者毕业论文所需的最新数据还没及时发布，推荐大家可以上某宝，因为某宝上电子版数据往往都很全面，而且价格大都可以接受。

在此提醒大家搜集到数据之后，一定要按照自己的习惯整理保存好，避免后期使用数据时出现差错。

摘要：产业在地理空间上的集聚现象已经成为许多学科领域研究关注的焦点，从一般经济学理论、产业经济学、区域经济学、国际贸易理论、管理学到空间经济学理论都有从各自领域对产业在地理空间上集聚有所解释。我们从江苏沿江产业集聚现象的形成和发展着手研究，试图以地理集中度为衡量指标，以制造业为例，根据各学科的相关理论对产业集聚的形成原因进行剖析，指出影响江苏沿江制造业产业集聚的因素。实证结果说明，本地市场规模、产业关联和FDI是影响江苏沿江产业集聚形成的显著因素。关键词：产业集聚；经济地理；因素分析Abstract： This paper examines the micro-foundations of agglomeration economies for Jiangsu industries. Using industries as observations, we regress the LQ measure of spatial concentration on industry characteristics that proxy for the presence of market scale, labor market pooling, input sharing, product shipping costs, natural advantage, FDI and infrastructure construction. Results indicate that proxies for market scale, input sharing and FDI have the most robust effect, positively influencing words： industrial agglomeration； distribution； important factor产业集聚是市场经济条件下伴随着地区工业快速发展的结果，是一个国家或地区产业竞争力的重要来源和集中体现。从著名的美国硅谷、波士顿128公路到英国的剑桥工业园，以色列的特拉维夫地区等等，都是很有代表性的竞争力很强的产业集聚区域。我国自改革开放以来，在对外开放、市场化取向的体制改革推动下，经济活动的空间分布也发生了很大的变化。逐渐形成了一些制造业集聚的中心、一批高集聚、高度专业化的产业集群。代表我国产业空间集聚最迅速的珠江三角洲区域、长江三角洲区域也是我国经济发展最快的区域。产业在空间的分布趋向于在一些地区集聚，在其他地方分散。那存在这种产业分布的空间上的集聚的原因究竟是什么呢？本文在前人文献研究的基础上，试图结合江苏沿江制造业产业集聚的模式，从新经济地理学的角度找出集聚形成的原因。文章第一部分回顾现有文献，介绍对于制造业产业集聚的研究方法、相关理论；第二部分介绍本文的对产业集聚的分析框架；第三部分对中国制造业的集聚现状描述；第四部分是产业空间集聚与相关因素的计量分析及结果；第五部分是文章的结论和政策建议。一、产业集聚及相关理论对于制造业产业在空间集聚的因素研究很多，国外很多研究从不同的理论角度都曾给过解释。从早先马歇尔从外部规模经济的角度阐述了产业集聚的原因，韦伯从集聚带来成本节约的角度解释集聚的产生，到现在的新产业区位论、新贸易理论、新地理经济学等等都对产业集聚做出解释。（一）产业集聚的定义产业在空间上聚集的现象已经是很多学科的共同关注的焦点。但对产业聚集的定义、产生原因、甚至产业聚集的衡量方法，都没有一致的认定。本文将对产业聚集的定义综合现有的研究成果，在不同领域的共性的基础上，总结出几个方面的定义。1.从空间角度看，产业聚集是发生在某一特定地理区域内的经济过程或现象。2.从产业角度看，产业聚集区域内的企业是属于某几种产业或具有直接上下游产业关联或具有其他密切联系的相关产业的企业。3.从相互关系角度看，产业聚集区域内的企业彼此之间必须以各种可能的方式产生互动，使聚集区域内厂商表现较其他非聚集区域的厂商更好。波特（Porter 1990，1998，2002）的定义是：“产业集群指一群特定产业领域内相关联的企业、生产供应商、服务供应商、相关产业厂商及相关机构（如大学、制定标准化的机构、金融机构、贸易协会等）以彼此既竞争又合作的方式在某一地理区内集中的现象”。（二）产业集聚的形成原因综合前人的研究成果，笔者认为以下几个方面是影响我国产业集聚的重要因素：1.资源要素资源要素包括区位要素和生产要素。区位要素指的是具体产业相关的或必须的自然区位、交通区位、经济区位。从理论上看，企业一般倾向于选择聚集再交通要塞，以降低运输成本。生产要素就包含自然资源和社会资源。产业集聚的的形成表现为区域专业化生产，根据赫克歇尔-俄林理论，区域专业化生产的主要原因是自然资源禀赋。早期的产业集聚形成过程中，自然资源起到了根本性的作用。后来的研究证实，相对于早期自然资源，社会资源的作用在后期产业集聚的形成中，具有更大的作用。包括技术、人才、社会网络、文化、制度等社会资源具有不可量化和无限性，已经成为产业集聚形成的关键因素。2.需求条件靠近特定的市场也是产业集聚形成的重要原因。在一定程度上，接近市场有利于厂商掌握客户偏好，有利于厂商掌握新产品信息与走向，这个过程同时也能够促进厂商对产品或服务的升级，增强自己产业的竞争力。市场需求是产生集聚的动力，同时，市场需求也促使着产业的专业化分工过程。根据斯杨定理，专业化分工会提高效率，企业可以获得递增报酬，但由于其受到市场容量的制约，只有市场容量达到最初的临界点才有可能触发专业化分工自我强化的过程。产业集聚才可能持续良性发展。3.外部经济环境“自发性”是产业集聚形成的一个最根本的特征，而这样自发形成的基础是市场机制。市场自由度越高，外向化程度越高，政府的不合理管制程度越低，产业集聚的效应就越能发挥出来。我国对产业集聚的研究中，经济体制因素是我国特色的一个重要影响因素。随着我国市场化程度逐步提高，产业集聚在我国形成的外部经济环境已经越来越好。实践证明，产业集聚在生产、流通两方面都离不开开放的市场环境。产业集聚的形成和经济开放存在这样的关系：凡是经济开放程度高、市场竞争力量强的地区，产业集群的特征就比较突出；凡是经济相对封闭、市场竞争力量弱的地区，产业集群现象就比较弱（徐康宁，2001）。4.产业特征反映产业特征的很多因素如技术溢出因素、产业规模等都是产业集聚形成的重要因素。在产业集聚的形成过程中，通过技术溢出，以带动整个集聚群内部的技术创新能力的提高。技术水平的提高使得区域内的企业特别是学习型企业得到发展的动力，促进与区域内其他企业的合作，推动技术创新的良性循环，推动技术水平的整体提高。技术进步也是实现集聚区企业升级可持续发展的动力。5.政府政府对产业集聚发展的影响是非常重要的。政府通过对某个地域或某个产业制定的种种优惠措施，对产业集聚形成起着非常关键的作用，这在发展中国家尤为明显。此外，政府的教育、文化、税收等政策都可能影响到生产要素，从而影响产业的集聚的形成、发展。（三）地理集中度的衡量指标衡量区域内企业集中度有很多指标，地理经济学上是地理集中度衡量指标，此处借用区位商（Location Quotient）来衡量产业集聚。区位商是产业效率与效益分析的定量工作，是较普遍的识别地区制造业专业化的方法，是衡量某一产业的某一方面，在特定区域专业化程度的方法，也可以说明各地区各产业的相对集聚程度。起计算公式如下：二、对产业集聚的分析与变量的选取近几年，江苏的产业集群发展迅速，苏州工业园区和高新区、南京江宁开发区、昆山高新区等初具规模。产业集群效益在江苏已经凸显。以沿江高新技术产业带为例，据统计，2004年，高新技术产业带实现产值超过2 000亿元。该产业带创造了江苏八成以上的信息产业产值和15%的工业总产值。总的看来江苏省产业集群这些年的发展前景令人鼓舞：一是有一定的规模，目前江苏成型的产业集群约有一百多个；二是行业分布比较广，几乎涉及了纺织、服装、金属制品、电器、建材、轻工等传统行业，也有IT、环保等新兴产业；三是分布比较广泛，苏南、苏中、苏北三大板块都在各个经济领域都有分布；四是已经形成一批品牌，在全国有一定的知名度和比较高的市场占有率。产业集群已成为江苏经济发展的强劲支撑。影响产业集聚形成的因素很多，从前文的叙述和考虑到数据的可得性，我们假设的与产业集聚形成有关是资源要素、需求条件、产业特征、外部经济环境、政府等。本文选取数个相关指标来分析产业空间集聚的决定设立以下联立方程：EDU为该地区的大专以上学历人口所占比例。TEC为该地区的技术市场合同交易金额，用来说明地区的技术创新。NUM为该地区企业数量，用以说明区域产业规模。FDI为外商直接投资，用以说明外资对产业集聚的影响。SPHWY是该地区在总公路里程数的份额。IM指本地市场效应，用以反映的就是本地市场规模的大小，各地区人均GDP与全国人均GDP的比值来衡量。某地区该比值越大那就意味着某地区越接近本地市场。TER第三产业所占比例，用以描述产业集聚的配套设施。LINK指产业关联系数，新经济地理理论认为，投入产出会影响产业的区位集中。但投入产出数据缺乏，采用王业强、魏后凯（2007）的方法，用工业产值中制造业产值所占比例来估算产业关联效应。所用的数据都出自于2006年、2007年《中国统计年鉴》、《江苏统计年鉴》、《中国工业统计年鉴》。三、结果分析运用SPSS统计软件版对数据进行回归分析，结果见下表。EDU，TEC，NUM，SPHWY未通过显著性检验，应从模型中删去，其余变量如下页表。从以上的数据可以看出，模型修正后，可以从需求条件、产业特征、外部环境等几个方面对产业集聚效应影响因素进行了说明。市场容量有利于产业集聚的形成，根据波特的理论，产业集聚与市场需求有很大的联系。而第三产业的配套设施的显著影响为负，这是一个与常理相违背的地方，笔者对此的解释是目前沿江地区的第三产业发展水平严重落后于制造业的发展，还未能体现对产业集聚形成有利的促进效应。产业关联，产业集聚之所以形成，是由于上下游产业的聚集形成的。而产业集聚对区域经济的影响也在于通过产业链影响其他产业。产业关联越是紧密，越是广泛，越是有可能通过聚集效应和乘数效应的作用带动整个区域经济的发展。FDI对江苏沿江制造业产业集聚的发展有着较为显著的推动作用，从实际情况来看，江苏的产业集聚的形成，尤其是苏南的集聚现象很多都是由外资带动的。预期的产业规模没有对产业集聚形成有显著影响，并不代表没有影响，而说明沿江制造业产业集聚并没有以简单的数量的累积，可以解释为重在质量的集约式发展。四、结论和政策含义本文通过对江苏沿江制造业产业集聚的统计描述，并对制造业产业集聚的决定因素建立了一个基于地理经济学分析的理论框架，最终得出一些启示性结论：江苏沿江制造业产业集聚的形成主要由产业关联、市场规模和外商投资等因素推动，地理因素、人口因素、规模经济等特征的作用效果不明显。根据本文的结论，针对目前江苏沿江制造业产业集聚的现状及存在的问题，可以认为，随着我国市场化改革的不断推进，制造业集聚趋势也在不断加强，江苏沿江的制造业产业集聚也会不断加强。这种加强体现在资源的优化配置，区域经济的高速发展，核心竞争力的不断提高。对于沿江制造业的发展有以下启示：一、重视服务支持对产业集聚效应的巨大促进作用，加快相关配套设施的建设，不断完善配套服务；二、适当扩大产业规模，促进龙头企业和大量中小企业共同发展，形成以小促大，以大助小共同发展的局面；三、外部环境方面继续推进国有企业、三资企业的共同发展，寻求投资主体的多元化，积极吸引外资；四、提高区域企业创新能力，鼓励专利发明和企业间的技术溢出。参考文献：[1]段小梅.台湾制造业投资大陆的产业集群分析[J].台湾研究集刊，2007，（2）：40-49.[2]迈克尔·波特.竞争战略[M].北京：华夏出版社，2002.[3]徐康宁，陈奇.外商直接投资在产业集群形成中的作用[J].现代经济探讨，2003，（12）：3-7.[4]杨树旺，易明.彭响产业集群的因素分析[J].西安财经学院学报，2006，（6）：49-53.[5]王业强，魏后凯.产业特征、空间竞争与制造业地理集中[J].管理世界，2007，（4）：68-77.[6]魏守华.集群竞争力的动力机制及其实证分析[J].中国工业经济，2002，（10）.[7]文玫.中国工业在区域上的重新定位和聚集[J].经济研究，2004，（2）：84-94.参考下吧

论文的数据分析怎么写如下：

那么在这里需要跟大家强调一下，推荐大家使用国家统计局、中国统计年鉴、国泰安、万方等等这些比较权威的网站去搜集数据资料。

在此需要注意的是，国泰安和万方等这些网站是需要收费的，上去看了一下，价格不是很亲民。

在此提醒大家搜集到数据之后，一定要按照自己的习惯整理保存好，避免后期使用数据时出现差错。

毕业论文数据统计集合

当然可以!自己调查的数据资料可以作为毕业论文的依据！毕业论文里的数据，最好在论文中注明来源，做好注释，例如【数据来源：中国统计年鉴2011】等。如果论文顺利通过了答辩，评委们都没异议，学校是不会去核实数据的真实性的。比如说金融专业的毕业论文，宏观数据的话，建议去看统计年鉴，包括中国统计年鉴，金融业统计年鉴和保险业统计年鉴。有些数据另外会在保监会，央行公布。具于未来的发展趋势，建议去看专门的行业报告（也有相关行业数据）和论文。根据我搜集的一些网站来看，建议看看这个，要做毕业论文以及毕业设计的，推荐一个网站：中国毕业论文网，里面的毕业设计什么的全是优秀的，因为精挑细选的，网上很少有，都是相当不错的毕业论文和毕业设计，对毕业论文的写作有很大的参考价值，希望对你有所帮助。别的相关范文很多的，推荐一些比较好的范文写作网站，希望对你有帮助，这些精选的范文网站，里面有大量的范文，也有各种文章写作方法，注意事项，应该有适合你的，自己动手找一下，可不要照搬啊，参考一下，用自己的语言写出来那才是自己的。如果你不是校园网的话，请在下面的网站找：毕业论文网。

这个还是需要一些相关资料吧不然不好做的

毕业论文数据统计与分析

统计描述一般指的是均数、标准差等

数据源：（是什么）研究区域描述：（如果你研究的是区域的话，要写出研究区域你要研究的那一方面的发展概况）数据处理方法：你用了什么方法，仔细描绘，比如怎么选取变量，有无修正参数或部分数据啦等等，怎么检验你处理的方法是否恰当啦

,上去看看。

第一节论文写作的八个环环相联的步骤严格地说，论文写作并不是从提笔写（或在电脑上打字）开始的。此前的许多步骤都属于论文写作的必要环节，一定程度上比实际动手写重要得多。许多过来的人都有体会，完成一篇较大的论文，准备时间少则数月，多则数年，一旦真正准备好了，动手写作的时间不过数天到数周。第一步，确定论文的选题。从广义上说，选任何本专业范围内的题目都能够写出东西来，只要你有新观点、新发现、新角度、新研究方法、新材料等等。但是这后面的“五新”大大限制了硕士论文的选题。这是由于作者多数是第一次写这么长的学术论文，缺乏经验，也缺乏深厚的知识积累，难以把握；同时，二三万字这个条件也对选题有很大的制约，如果题目过大，无法在这个相对狭小的范围内展开。所以，选题是否得当，对于论文的成功，影响很大，甚至有人说，一个好的选题等于成功了一半。根据许多硕士论文的选题经验，这一级论文的选题可从以下几方面考虑：本专业的研究空白、发生争议的话题（自己的观点感到较为充分）、对比性的话题、从其他专业角度研究本专业的话题（这是一种选题的边际效应）、有新的插入角度的老话题、刚刚冒出来的本专业的新问题。第二步，围绕已经确定的论文选题，回顾相关的理论和研究，或者叫“文献检索”。这一步的工作是较为艰苦的，需要有思想准备。在我国，多数中文学术资料目前没有上网，需要手工查找，因而这个步骤中查找中文资料花费的时间和精力可能很大；拉丁文资料，特别是英文资料由于网络传播的方便条件，相对好查询。但是不少资料即使找到了目录，真正能够阅读到，仍需要作者不懈的努力。这一步是必要的，如果没有这一步，你的论文内容很可能重复了别人已经做过的工作，等于白做；查找的过程，也是启发思路、产生观点火花的过程，不走这一步，等于掐掉了自己新观点、新视角、新材料的来源。这也是为下一步做观点、角度、材料上的准备。第三步，提出你自己关于选题的理论假设，或要研究的具体问题。选题是指准备写的论文的大体方向和范围，真要动手写作，就会遇到两类具体的问题。第一类属于观点方面的：我的具体观点是什么？你可以设想出一个或几个观点，但它们仅仅是一种假设，通过许多证据、材料，通过严密的论证和适当的论证框架结构，证明你的假设是成立的，这才能形成论文的主体。第二类属于实用方面的：我要具体论证什么问题？你可以提出许多原因、各种环境条件的影响，它们是不是与所论证的问题相关，相关到什么程度，这需要通过科学的调查和分析。不论哪一种情况，这涉及论文的中心思想或论证主题，一定要明确，并且贯穿论文的始终。由于硕士论文字数相对长，常见的问题之一，在于作者把握不住全文，写着写着，无形中脱离了自己原来确定的假设或具体问题，说了许多无关中心思想或论证主题的内容。第四步，决定采用哪些研究方法。人文－社会科学的研究方法，大体可以归为两大范畴，思辨研究和实证研究，后者又可分为定性研究、定量研究两种具体的研究方法。人们为探究社会事实或社会现象，而采用不同的研究取向，不同的研究取向又有不同的研究方法，不同的研究假设、收集资料的方式和对结果的判断标准。但是各种研究方法在现在的论文写作中，已经越来越多地呈现相容和内在的连接。一般地说，根据自己的选题和讨论的具体问题，可以以一种研究方法为主，辅以其他的方法。例如研究“人”作为大众媒体信息的接受者其接受信息时的状况，这种研究取向就决定了研究本身要以定量分析为主，但同时也需要一些历史的、文化的、政治经济学的思辨研究。在文科硕士论文中，作者直接为论文进行的定量分析，规模一般较小，适应的范围也是有限的，较多地采用别人而不是自己直接的调查结果。这是由于论文的规模较孝给予作者的研究经费有限、作者个人进行社会调查的能力有限等原因造成的。以逻辑分析为主的论文，适当采用一些定量分析的数据，有时会给文章增添一些分量。但是，一定要根据实际需要，而不要为了显示研究方法的多样而有意去做。例如一个很宏观的话题本来适于思辨研究，硬要加进一项微观的量化调查结果证明什么，反而会弄巧成拙。这是现在写好论文要把握的一个具体问题。第五步，设计论文的框架结构。一般文章的写作也需要有这一步，但对硕士论文来说，更为必要，其要求也更细一些。一般情况下，一篇硕士论文要有绪章、入题的第一章、主体章节，以及结束语。章节的设置在写前要有个大体的布局逻辑，使之结构合理；章和章之间有一种逻辑联系，防止盲目写下去，淹没主题，不知所云。这一步很少有一次完成的，往往会根据收集材料的情况、调查访问中遇到的新情况，经常变动。但是就像建筑师在盖房子前必须有图纸一样，到了写硕士论文这个层次上，大体的文章框架不能仅仅存于脑子中，一般要形成文字，相对细致一些，具体到“节”更好（但“节”的层次开始时不要固定化），便于写作时心中有数。到了设计论文框架这一步，因为有了文字化的章节设计，除了请导师指导外，这是在正式动笔写前较广泛地征求其他专家意见的一个好机会。框架还不是厚厚的论文，看时花费的时间不多，又可以大体看出文章的价值或存在的问题。这时修改论文结构比写完后修改要轻松、容易得多，时间也较为宽余，不要错过这个机会。第六步，对已经取得的文献资料、调查材料和各种论据进行分析、归类，分别充实到各章节中，再进行解释、论证。这实际就是论文写作本身，所以这样描述，意在让作者理解论文写作的过程。各种材料和论据，不是天生就可以证明论点或说明具体问题的，需要通过作者对材料的组织和论证，才能使其变得富有生命力，极其自然、有力地为自己所论的题目服务。在这一步，需要温习一下学过的逻辑学或社会调查统计的知识，用正确的逻辑思维和严谨的数据组织方式，紧紧围绕已经确定的理论假设或具体问题，调动自己所学的各种知识，通过正论（这是主要的）、反论、设论、驳论、喻论等等手法，论证观点或问题，得出结论，完成论文。论证中肯定会出现种种材料使用或缺乏的问题、逻辑推理的问题、论据与论题不相配的问题等等，需要停下来再找材料和访问专家，充实或削减原来论文框架中的内容，必要时对框架结构进行局部调整。这种情形是正常的、经常发生的。在时间的安排上，对此要作出计划。如果时间安排不当，有时论文功亏一篑的原因就在于写作时间安排过紧，来不及调整论文结构，这很不值得。第七步，必要时重新估量选题，修正论证对象的范围。这是与第六步同时出现的另一种情形，即通过较为广泛地征求意见和本人的思考，感到原来的选题对自己不适当，或难以完成，那么就要及时调整整个论文写作的计划，改变选题。这种情形也是正常的，关键在于不要长时期犹豫不决，必须较快地作出决定，以便有时间重起炉灶。由于前面已经对本专业的学术研究有过较多的思考和文献检索，即使改变选题，重新做起，花费的时间不会很多，对此过多的担心是不必要的。选题不当、难以完成的另一种情况不在于选题本身，而在于选题论证的范围过大。解决这个问题并不难，把论证对象的范围缩小就是了。这里最大的障碍在于作者舍不得“割爱”，花费了许多功夫准备论文，一旦许多材料用不上，难以割舍。这种情况当然会涉及到重新设计论文框架结构的问题。不过，将较大的论证对象的范围缩小，总比相反的情形要容易得多。硕士论文写作中，论证对象范围过小的情况很少见，因为二三万字的论文，本来大多适宜开口较小的选题。第八步，对论文从技术上进行规范化的检查和调整。章节设计的技术问题（含目录）、文中的引证标示、注释及编号、文后的参考文献编排，以及不属于论文本身的内容提要（包括英文提要）、关键词等等，都要按照规范化的要求进行检查和调整。这些虽然属于技术性问题，但也反映出作者的治学态度。特别是引证，凡是使用了别人观点的地方，都必须注明材料来源，不能含糊不清，更不能将别人的研究成果变成自己的。标明的材料来源也要十分清楚，论著名称、作者或编者、出版社或发表的刊物名称、出版或发表时间等等，一应具全。有时，一篇较有水平的论文，答辩时提出批评的主要问题是引证的不规范，由于这个原因使论文的评价低一档，这很不值得。第二节论文的选题：一个适当的选题等于论文成功了一半由于十年“文化大革命”这场浩劫，我国的人文－社会科学研究遭到了毁灭性的破坏，林彪、“四人帮”在意识形态领域的种种谬论充斥人文－社会科学的各个学科。1978年我国恢复研究生招生时，人文－社会科学研究几乎一切从头开始，因而研究生的论文选题还没有显现为一个问题，因为写什么题目，即使不是空白，也是需要重新认识和论证的。经过改革开放后二十多年几代人文－社会科学研究者的努力，我国的人文－社会科学研究呈现一派繁荣的景象，研究生的招收数量大幅度提高。年年招生，年年写新的论文，而各学科的研究领域是相对稳定的，空白越来越少，新问题的研究又有一定难度，于是现在文科研究生的论文选题，形成一种独特的竞争局面，如何选择好论证的题目，凸现为一个新问题。有鉴于此，需要重点谈谈硕士论文的选题问题。

统计学数据分析毕业论文

1、频数分析：

对一组数据的不同数值的频数，或者数据落入指定区域内的频数进行统计，了解其数据分布状况的方式。通过频数分析，能在一定程度上反映出样本是否具有总体代表性，抽样是否存在系统偏差，并以此证明以后相关问题分析的代表性和可信性。

2、描述性统计：

对调查总体所有变量的有关数据进行统计性描述，包括数据的集中趋势与离散趋势。

3、探索性分析：

正态性检验用于检验数据是否满足正态分布，一些算法需要数据满足正态分布（如单样本T检验，独立样本T检验等）。

这个建议你查十篇左右的文献看看以前发表的毕业论文都是怎么写的然后还可以跟上一级打听下或者跟指导你毕业的老师咨询下找到一个研究样本之后再想怎么做论文题目不急

***统计方法的应用

SPSS软件是“统计产品与服务解决方案”软件，是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的范文，欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法，介绍了统计分析软件SPSS的特点，并通过实例：用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的应用做了详细的介绍，旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件，其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件，目前在各专业毕业论文经常可以看到它的身影，其应用范围广、方便快捷等特点吸引着众多的爱好者。本文通过对统计分析软件SPSS的功特点进行介绍，通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的操作用做了详细的介绍，为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好，除了数据录入及部分命令程序等少数输入工作需要键盘键入外，大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点，告诉系统要做什么，无需告诉怎样做。只要了解统计分析的原理，无需通晓统计方法的各种算法，即可得到需要的统计分析结果。对于常见的统计方法，SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此，用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法，比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件，文本编辑器软件生成的ASCⅡ数据文件， Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt，word，PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析，大多青睐于SPSS，像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS，因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题：为了调查甲、乙两地土壤对种植同一种西瓜有没有影响，从这两个产地分别随机抽取同种的8只和7只西瓜，称重后得重量(市斤)如下：

甲(斤)：、、、、、、、

乙(斤)：、、、、、、

问：根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解：建立假设 H0：甲乙两地的西瓜重量没有显著差异;

H1：甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件，注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具体操作过程如下：

第一步：单击Analyze Nonparametric Test 2 Independent Sample，打开Two-Independent-Sample对话框(见图1)。

第二步：选择检验的变量进入检验框中，选择分组变量进入Grouping Variable框中，单击Define Group键，打开Define Group对话框，将分组变量值分别键入两个框中，单击Continue返回主对话框(见图2)：

第三步：在Test Type栏中，确定检验方法。

SPSS中提供了四种检验方式，几种检验方法侧重点不同，但都是先把两样本数据混合排序，再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样，所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步：选择输出的结果形式及缺失值处理方式;

第五步：单击OK，得输出结果。

所以，以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要： SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤，文中的方法对考试研究人员具有一定的指导意义。

关键词： SPSS软件考试数据统计分析操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度，试题有难度和区分度指标，试卷有效度和信度指标，这些是评价考试最主要的测量指标，但是仅有这些指标不足以反映一份试卷的实际测量效果，考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代，考试成绩统计主要依靠人工阅卷，考试数据无法电子化存储，对考试数据分析统计难以实现。随着计算机的普及和信息化的推广，各种分析数据的软件应运而生，这些软件中汇集了统计学和测量学的分析工具，使得应用电子信息技术分析统计考试成绩数据成为可能，这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中，SPSS是应用最多、影响最广泛的分析工具之一。在本文中，我们以SPSS软件为工具，对教育招生考试成绩的数据进行统计分析，分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”，中文名称为“社会科学统计软件包”，它是世界著名的统计分析软件之一，在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包，它集数据整理、分析于一身，主要功能包括数据管理、统计分析、图表分析、输出管理等，该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析，介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中，考试结果的信度，试题的区分度，每个题目得分与试卷总分的关系，以及题目之间的关系，等等，都是考试研究的重要内容，最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中，Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式：

式中x为第i个考生第j题的得分，y为第i个考生第k题的得分，为第j题的平均分，为第k题的平均分，n为测试样本量。该公式既可以计算两个连续变量之间的相关性，又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式：

r=1-(2)

式中D为两个变量的秩序之差，n为样本容量。

Cronbach a信度系数法计算公式：

α= 1-(3)

式中n为试题数，s为第i题的标准差，s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据，利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性，以及各个题目之间的相关性。我们以Pearson相关系数分析为例，利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷)，数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 版本的软件为例，介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例)：

(1)将考试数据导入SPSS软件，在SPSS数据窗口中，顺序点击【Analyze】→【Correlate】→【Bivariate...】，系统弹出变量相关系数设置对话框。

(2)在该对话框中，将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中，在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中，选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域，可以点选“Two-tailed”选项或者“One-tailed”，我们采用系统默认值。

(4)对话框中的其它选项取软件系统的默认值，点击【OK】，开始相关系数计算，系统弹出新的窗体输出运算的结果。本次输出的情况如下：

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中，但题目T4和题目T5之间的相关程度远高于其它几个题目，我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系，这是我们通过分析获取的重要信息，该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性，这在大规模考试中是不应该出现的，需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似，只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框，程序就会按Pearson相关系数法进行统计分析，如果同时选中“Spearman”和“Pearson”复选框，程序将会同时计算按两种分析方法统计分析的数据，并会以不同的图表进行显示，而Cronbach a信度系数法计算方法与上述方法略有不同，其操作步骤如下：

(1)在SPSS数据窗口中，顺序点击【Analyze】→【Scale】→【Reliability Analysis...】，系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中，在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数)，点击“Statistics”选择项可以进行更为详细的参数设置，我们采用系统的默认值即可。

(3)参数设置完毕之后，点击【OK】，软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型，考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2]，对选择题干扰项的设计及其施测后的实际效果关注甚少，事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设，对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个，其中仅有1个选择项是正确的。命题人员在设计选择项时，应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测，对考生作答的分布情况作出预估。考试结束后，研究人员应该对实测的情况与命题教师预测的情况进行对比分析，以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性，因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理，设变量E是命题者对某道试题的期望值，E=nP，n为样本容量，P为期望的相对频率，引入以下统计量：∑(O-E)/E，其中O为观察频数。

本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文

我们需要进行的假设检验是：零假设H：选项的实测分布与期望分布相同;非零假设H：选项的实测分布与期望分布不同。

检验假设的思想：拟合度检验的统计量在确定的某种显著性水平下如果零假设是真，则检验统计量∑(O-E)/E呈近似χ分布，其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合，就不排除零假设，否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本，利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下：

(1)将考试数据导入SPSS软件，依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】，弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中，本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框，具体操作方法是选中单选框“Values”，输入具体的期望数值，点击“Add”按钮，依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】，输出软件运算结果。

我们需要进行的假设检验，H：选项的实测分布与期望分布相同;H：选项的实测分布与期望分布不同。

假设检验的显著性水平为α=，χ=∑(O-E)/E，自由度为df=4-1=3，查χ分布表或利用相关软件可得P=，由于P>α，因此不能拒绝零假设，即选项的实测分布与期望分布相同。因此，检验结果在显著性水平时，没有足够的证据拒绝零假设，即可认为本题选项的实测分布与期望分布相同，也就是说本题的实际测试效果与命题教师预测的效果是一致的，命题教师准确地估计了考生的实际水平，这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛，但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面，本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看，软件操作步骤和统计分析过程十分简单、快捷，对于测量学和统计学基础不太好的数据分析统计人员来说，只要遵循一定的操作步骤，就可以进行分析。

参考文献：

[1]王孝玲.教育测量(修订版)[M].上海：华东师范大学出版社，2006.

[2]雷新勇.大规模教育考试：命题与评价[M].上海：华东师范大学出版社，2006.

[3]李伟明，冯伯麟，余仁胜.考试的统计分析方法[M].北京：高等教育出版社，1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海：华东师范大学出版社，2007.

毕业论文数据统计集合分享

毕业论文数据统计集合分享

毕业论文数据统计分享

毕业论文数据统计集合

毕业论文数据统计与分析

统计学数据分析毕业论文

相关百科

热门百科