• 回答数

    3

  • 浏览数

    315

点評狂魔
首页 > 职称论文 > 统计数据管理研究方法论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

吃逛吃逛2333

已采纳

摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整Distribution of Small Sample DW StatisticZhang Xiaotong1 Zhao Chuxiao2(1. Institute of International Economics, Nankai University, Tianjin 300071)(2. Management School, Tianjin University, Tianjin 300072)Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW test. Based on that we proposed a method for recognizing spurious regression in ordinary least squares : Monte Carlo simulation, DW distribution, nonstationary, cointegration1.概述八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一. 所涉及的两个变量都取自I(1)过程;二. 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三. 所涉及的两个变量都取自I(0)过程。在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。2.DW统计量的极限分布给定如下随机数据生成系统,yt = yt-1 + ut , y1 = 0, (1)xt = xt-1 + vt , x1 = 0, (2)其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。建立如下回归模型:yt = b0 + b1xt + wt . (3)当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量,(4)因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有DW Þ 0.即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。3.小样本DW分布的蒙特卡罗模拟及其结果分析当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一. DW(0,0)分布的均值为2,不受样本容量大小的影响;二.分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三. 随着样本容量的增大,分布的标准差逐步减小。见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一. 分布均为右偏态,分布左侧有端点,端点为零;二. 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三. 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。表一 DW分布的蒙特卡罗模拟结果类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量1 90 95 9910 (1,1) 20 (1,0) 30 (0,0) 10 注:1. DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值2. DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。3. DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。4. 在每个样本容量条件下各模拟1000次。图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt&nb1、统计范围GDDS将国民经济活动划分为五大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标,鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。规定的数据类别包括:(1)来自综合框架中的核心部分,如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量;(2)追踪分析统计类目,如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计;(3)与该部门相关的统计指标,如实际部门的劳动市场和价格指数统计;(4)社会人口数据,包括人口、保健、教育、卫生等方面统计。除规定的数据类别以外,GDDS鼓励成员国发布更多的统计信息,以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标,财政部门列出利息支付和偿债预计数据等。GDDS认为,系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌,并使各国数据的范围更加一致。但是,将一些由私人机构编制的数据包括在系统内会增加工作的复杂性,比如由官方转发这些数据隐含着对这些数据质量的认可,官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。2、公布频率公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如, GDDS要求国民帐户、国际收支平衡表按年公布,广义货币概览按月公布,汇率则每日公布。3、公布及时性公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限,如按季度统计的GDP数据规定在下一季度内发布,按月度统计的生产指数规定在6周至3个月内公布。GDDS将选定的数据类别分为规定性和鼓励性两类,目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的,条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”,即成员国认为该项统计不符合本国实际的,可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。GDDS有关数据方面的内容及要求如下:GDDS的数据规范A、综合框架核心框架范围、分类和分析框架受鼓励的扩展频率及时性国民帐户编制和公布全套的名义和实际国民帐户总量和平衡项目,得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表年度10-14个月中央政府操作编制和公布交易和债务的综合数据,需强调:1)包括所有的中央政府单位;2)使用适当的分析框架;3)建立一整套详细的分类标准(税收和非税收收入、经常性和资本性支出、国内及国外融资),并适当细分(根据债务持有人、债务工具和币种)。广义政府或公共部门操作数据,在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。年度6-9个月广义货币概览编制和公布综合的数据,需强调:1)包括所有的存款公司(银行机构);2)使用适当的分析框架;3)建立对外资产和负债、按部门分类的国内信贷以及货币(流动性)和非货币债务构成的分类标准。月度2-3个月国际收支编制和公布综合的国际收支主要总量数据和平衡项目,包括:货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额,并适当进行细分。国际投资头寸和总体经济外债数据(如果这些数据具有重要的分析和政策意义)年度6-9个月GDDS的数据规范B、数据类别和指标数据类别核心指标受鼓励的总量及构成频率及时性实际部门国民帐户总量国内生产总值(名义和实际)国民总收入、资本形成、储蓄年度(鼓励季度)6-9个月生产指数制造业或工业初级产品、农业或其他指标视具体情况月度视具体情况所有指标都为6周-3个月价格指数消费者价格指数生产者价格指数月度1-2个月劳动力市场指标就业、失业,工资/收入,视具体情况年度6-9个月财政部门核心指标受鼓励的指标频率及时性中央政府预算总量收入、支出、差额和融资,视具体情况进行细分(根据债务持有人、债务工具和币种)利息支付季度1个季度中央政府债务内债和外债,视具体情况适当细分(按币种、期限、债务持有人和债务工具)政府担保债务年度(鼓励季度)1-2个季度金融部门核心指标受鼓励的指标频率及时性广义货币和信贷总量净对外头寸、国内信贷、广义或狭义货币月度1-3个月中央银行总量储备货币月度1-2个月利率短期和长期政府债券利率,政策可变利率货币或银行间市场利率及一套存贷款利率月度高频率(如月度)股票市场股票价格指数,视具体情况月度对外部门核心指标受鼓励的指标频率及时性国际收支总量货物和服务的进口和出口、经常帐户差额、储备、总差额总体经济的外债和偿债数据,视具体情况年度(十分鼓励季度)6个月国际储备以美元标价的官方储备总额与储备有关的负债月度1-4周商品贸易总进口和总出口较长时间的主要商品的分类月度8周-3个月汇率即期汇率每日高频率(如月度)社会-人口数据核心指标频率人口人口;人口增长率;城市人口;农业人口;人口性别;人口的年龄构成各国公布频率会各不相同;及时性保健每个医生照顾人口数;预期寿命;婴儿/儿童/产妇死亡率也不尽相同教育成年人文盲率、学生-教师比率、小学/中学入学率贫困状况获得洁净水的情况、卫生;每个房间居住的人数;收入分配;最低收入标准以下的家庭数二、公布数据的质量GDDS从两个方面的内容来评估公布的统计数据质量,即:提供统计数据的文字说明和提供统计数据的交叉检验。统计数据质量是个难以界定、因而不易评估的概念。为了便于检查,GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式,包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明(例如,数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等)。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法,以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验,规定在统计框架内公布有关总量数据的分项,公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据,例如,作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个:(1)针对已发现不全的改进计划;(2)最近实施的改进措施;或(3)国家认定不四、公众获取GDDS规定要提前公布数据发布日期,并向各方同时发送。官方统计数据的公布是统计数据作为一项公共产品的基本特征之一,及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划:一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据,又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标,时间表表明不迟于某个既定时间;对于公布频率更高的数据,则可确定一个日期范围,如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品,因此GDDS规定应向所有有关方同时发布统计数据,以体现公平的原则。发布时可先提供概括性数据,然后再提供详细的数据,当局应至少提供一个公众知道并可以进入的地方,数据一经发布,公众就可以公平地获得。

219 评论

芋仔疙瘩牛牛

SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:

甲(斤):、、、、、、、

乙(斤):、、、、、、

问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;

H1:甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:

第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。

第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):

第三步:在Test Type栏中,确定检验方法。

SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步:选择输出的结果形式及缺失值处理方式;

第五步:单击OK,得输出结果。

所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。

关键词: SPSS软件 考试数据 统计分析 操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式:

式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式:

r=1-(2)

式中D为两个变量的秩序之差,n为样本容量。

Cronbach a信度系数法计算公式:

α= 1-(3)

式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):

(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。

(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。

(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:

(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。

(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。

检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下:

(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】,输出软件运算结果。

我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。

假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。

参考文献:

[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.

[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.

[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.

猜你喜欢:

1. 统计学数据分析论文

2. spss统计分析实习心得

3. 统计学学年论文

4. 统计学分析论文

99 评论

fanfanwing

通过数据进行分析的论文用数据是数学方法。

数据分析方法:将数据按一定规律用列表方式表达出来,是记录和处理最常用的方法。表格的设计要求对应关系清楚,简单明了,有利于发现相关量之间的相关关系。

此外还要求在标题栏中注明各个量的名称、符号、数量级和单位等:根据需要还可以列出除原始数据以外的计算栏目和统计栏目等。

数据分析目的:

数据分析的目的是把隐藏在一大批看来杂乱无章的数据中的信息集中和提炼出来,从而找出所研究对象的内在规律。在实际应用中,数据分析可帮助人们做出判断,以便采取适当行动。数据分析是有组织有目的地收集数据、分析数据,使之成为信息的过程。

这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。

例如设计人员在开始一个新的设计以前,要通过广泛的设计调查,分析所得数据以判定设计方向,因此数据分析在工业设计中具有极其重要的地位。

232 评论

相关问答

  • 论文数据分析的研究方法

    论文研究方法 调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。 观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。 实验法:通过主支变

    沙尘暴来袭 3人参与回答 2023-12-10
  • 毕业论文研究方法与数据处理

    毕业论文研究方法如下: 1、调查法 调查法是科学研究中最常用的方法之一。它是有目的、有计划、有系统地搜集有关研究对象现实状况或历史状况的材料的方法。一般是通过书

    YeezyYeezy 3人参与回答 2023-12-08
  • 关于数据的研究方法论文

    数据挖掘的算法及技术的应用的研究论文 摘要: 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的, 但又是

    夏侯将军YY 2人参与回答 2023-12-07
  • 数理统计论文研究方法

    随着人类的发展,统计的重要性已经越来越得到人们的认识了。人类活动的一切领域几乎都已经无法离开统计。下文是我为大家蒐集整理的关于的内容,欢迎大家阅读参考!

    玥玥285966231 4人参与回答 2023-12-10
  • 信息化数据管理方法研究论文

    随着信息时代的到来,计算机技术的飞速发展,计算机信息系统在各行业各部门内的运用也逐渐频繁并深入,计算机信息管理系统在通信工程领域也已经得到了很大的普及和发展。下

    小袅袅09 2人参与回答 2023-12-08