统计软件论文题目

5个回答默认排序

默认排序

按时间排序

请叫我大海哥

已采纳

时代金融摘要:关键词:一、引言一个国家的国民经济有很多因素构成, 省区经济则是我国国民经济的重要组成部分, 很多研究文献都认为中国的省区经济是宏观经济的一个相对独立的研究对象, 因此, 选取省区经济数据进行区域经济的研究, 无疑将是未来几年的研究趋势。而省区经济对我国国民经济的影响, 已从背后走到了台前, 发展较快的省区对我国国民经济的快速增长起到了很大的作用, 而发展相对较慢的省区, 其原因与解决方法也值得我们研究。本文选取华中大省湖北省进行研究, 具有一定的指导和现实意义。湖北省 2006 年 GDP 为 7497 亿元, 人均 GDP13130 元, 达到中等发达国家水平。从省域经济来说, 湖北省是一个较发达的经济实体。另一方面, 湖北省优势的地理位置和众多的人口使之对于我国整体经济的运行起到不可忽视的作用, 对于湖北省 GDP的研究和预测也就从一个侧面反映我国国民经济的走势和未来。尽管湖北省以其重要位置和经济实力在我国国民经济中占据一席之地, 但仍不可避免的面临着建国以来一再的经济波动,从最初的强大势力到如今的挣扎期, 湖北省的经济面临着发展困境。近年来, 湖北省的经济状况一再呈现再次快速发展的趋势, 但是这个趋势能够保持多久却是我们需要考虑的问题。本文选择了时间序列分析的方法进行湖北省区域经济发展的预测。时间序列预测是通过对预测目标自身时间序列的处理来研究其变化趋势的。即通过时间序列的历史数据揭示现象随时间变化的规律, 将这种规律延伸到未来, 从而对该现象的未来作出预测。二、基本模型、数据选择以及实证方法( 一) 基本模型ARMA 模型是一种常用的随机时序模型, 由博克斯, 詹金斯创立, 是一种精度较高的时序短期预测方法, 其基本思想是: 某些时间序列是依赖于时间 t 的一组随机变量, 构成该时序的单个序列值虽然具有不确定性, 但整个序列的变化却具有一定的规律性, 可以用相应的数学模型近似描述。通过对该数学模型的分析,能够更本质的认识时间序列的结构与特征, 达到最小方差意义下的最优预测。现实社会中, 我们常常运用 ARMA模型对经济体进行预测和研究, 得到较为满意的效果。但 ARMA模型只适用于平稳的时间序列, 对于如 GDP 等非平稳的时间序列而言, ARMA模型存在一定的缺陷, 因此我们引入一般情况下的 ARMA模型 ( ARIMA模型) 进行实证研究。事实上, ARIMA模型的实质就是差分运算与 ARMA模型的组合。本文讨论的求和自回归移动平均模型, 简记为 ARIMA ( p, d, q) 模型,是美国统计学家和 enkins 于 1970 年首次提出, 广泛应用于各类时间序列数据分析, 是一种预测精度相当高的短期预测方法。建立 ARIMA ( p, d, q) 模型计算复杂, 须借助计算机完成。本文介绍 ARIMA ( p, d, q) 模型的建立方法, 并利用Eviews 软件建立湖北省 GDP 变化的 ARIMA ( p, d, q) 预测模型。( 二) 数据选择1.本文所有 GDP 数据来自于由中华人民共和国统计局汇编,中国统计出版社出版的《新中国五十五年统计数据汇编》。2.本文的所有数据处理均使用软件进行。( 三) 实证方法ARMA模型及 ARIMA模型都是在平稳时间序列基础上建立的, 因此时间序列的平稳性是建模的重要前提。任何非平稳时间序列只要通过适当阶数的差分运算或者是对数差分运算就可以实现平稳, 因此可以对差分后或对数差分后的序列进行 ARMA( p, q) 拟合。ARIMA ( p, d, q) 模型的具体建模步骤如下:1.平稳性检验。一般通过时间序列的散点图或折线图对序列进行初步的平稳性判断, 并采用 ADF 单位根检验来精确判断该序列的平稳性。对非平稳的时间序列, 如果存在一定的增长或下降趋势等,则需要对数据取对数或进行差分处理, 然后判断经处理后序列的平稳性。重复以上过程, 直至成为平稳序列。此时差分的次数即为ARIMA ( p, d, q) 模型中的阶数 d。为了保证信息的准确, 应注意避免过度差分。对平稳序列还需要进行纯随机性检验 ( 白噪声检验) 。白噪声序列没有分析的必要, 对于平稳的非白噪声序列则可以进行ARMA ( p, q) 模型的拟合。白噪声检验通常使用 Q 统计量对序列进行卡方检验, 可以以直观的方法直接观测得到结论。拟合。首先计算时间序列样本的自相关系数和偏自相关系的值, 根据自相关系数和偏自相关系数的性质估计自相关阶数 p 和移动平均阶数 q 的值。一般而言, 由于样本的随机性, 样本的相关系数不会呈现出理论截尾的完美情况, 本应截尾的相关系数仍会呈现出小值振荡的情况。又由于平稳时间序列通常都具有短期相性, 随着延迟阶数的增大, 相关系数都会衰减至零值附近作小值波动。根据 Barlett 和 Quenouille 的证明, 样本相关系数近似服从正态分布。一个正态分布的随机变量在任意方向上超出 2σ 的概率约为。因此可通过自相关和偏自相关估计值序列的直方图来大致判断在 5%的显著水平下模型的自相关系数和偏自相关系数不为零的个数, 进而大致判断序列应选择的具体模型形式。同时对模型中的 p 和 q 两个参数进行多种组合选择, 从 ARMA ( p,q) 模型中选择一个拟和最好的曲线作为最后的方程结果。一般利用 AIC 准则和 SC 准则评判拟合模型的相对优劣。3.模型检验。模型检验主要是检验模型对原时间序列的拟和效果, 检验整个模型对信息的提取是否充分, 即检验残差序列是否为白噪声序列。如果拟合模型通不过检验, 即残差序列不是为白噪声序列, 那么要重新选择模型进行拟合。如残差序列是白噪声序列, 就认为拟合模型是有效的。模型的有效性检验仍然是使谭诗璟ARIMA 模型在湖北省GDP 预测中的应用—— —时间序列分析在中国区域经济增长中的实证分析本文介绍求和自回归移动平均模型 ARIMA ( p, d, q) 的建模方法及 Eviews 实现。广泛求证和搜集从 1952 年到 2006 年以来湖北省 GDP 的相关数据, 运用统计学和计量经济学原理, 从时间序列的定义出发, 结合统计软件 EVIEWS 运用 ARMA建模方法, 将 ARIMA模型应用于湖北省历年 GDP 数据的分析与预测, 得到较为满意的结果。湖北省区域经济学 ARIMA 时间序列 GDP 预测理论探讨262008/01 总第 360 期图四取对数后自相关与偏自相关图图三二阶差分后自相关与偏自相关图用上述 Q 统计量对残差序列进行卡方检验。4.模型预测。根据检验和比较的结果, 使用 Eviews 软件中的forecas t 功能对模型进行预测, 得到原时间序列的将来走势。对比预测值与实际值, 同样可以以直观的方式得到模型的准确性。三、实证结果分析GDP 受经济基础、人口增长、资源、科技、环境等诸多因素的影响, 这些因素之间又有着错综复杂的关系, 运用结构性的因果模型分析和预测 GDP 往往比较困难。我们将历年的 GDP 作为时间序列, 得出其变化规律, 建立预测模型。本文对 1952 至 2006 年的 55 个年度国内生产总值数据进行了分析, 为了对模型的正确性进行一定程度的检验, 现用前 50 个数据参与建模, 并用后五年的数据检验拟合效果。最后进行 2007年与 2008 年的预测。( 一) 数据的平稳化分析与处理1.差分。利用 EViews 软件对原 GDP 序列进行一阶差分得到图二:对该序列采用包含常数项和趋势项的模型进行 ADF 单位根检验。结果如下:由于该序列依然非平稳性, 因此需要再次进行差分, 得到如图三所式的折线图。根据一阶差分时所得 AIC 最小值, 确定滞后阶数为 1。然后对二阶差分进行 ADF 检验:结果表明二阶差分后的序列具有平稳性, 因此 ARIMA ( p, d,q) 的差分阶数 d=2。二阶差分后的自相关与偏自相关图如下:2.对数。利用 EViews 软件, 对原数据取对数:对已经形成的对数序列进行一阶差分, 然后进行 ADF 检验:由上表可见, 现在的对数一阶差分序列是平稳的, 由 AIC 和SC 的最小值可以确定此时的滞后阶数为 2。因为是进行了一阶差分, 因此认为 ARIMA ( p, d, q) 中 d=1。( 二) ARMA ( p, q) 模型的建立ARMA ( p, q) 模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得。图一 1952- 2001 湖北省 GDP 序列图表 1 一阶差分的 ADF 检验ADF t- Statistic 1% level 5% level 10% level AIC 备注0 - - - - 非平稳1 - - - - - - - - - - - - - - - - 表 2 二阶差分的 ADF 检验Lag Length t- Statistic 1% level 5% level 10% level1 (Fixed) - - - - 表 3 对数一阶差分的 ADF 检验ADF t- Statistic 1% level 5% level 10% level AIC SC 备注0 - - - - - - 平稳 1 - - - - - - - - - - - - - - - - - - 图五对数后一阶差分自相关与偏自相关图理论探讨27时代金融摘要:关键词:使用 EViews 软件对 AR, MA的取值进行实现, 比较三种情况下方程的 AIC 值和 SC 值:表 4ARMA模型的比较由表 4 可知, 最优情况本应该在 AR ( 1) , MA ( 1) 时取得, 但AR, MA都取 1 时无法实现平稳, 舍去。对于后面两种情况进行比较, 而 P=1 时 AIC 与 SC 值都比较小, 在该种情况下方程如下:综上所述选用 ARIMA ( 1, 1, 0) 模型。( 三) 模型的检验对模型的 Q 统计量进行白噪声检验, 得出残差序列相互独立的概率很大, 故不能拒绝序列相互独立的原假设, 检验通过。模型均值及自相关系数的估计都通过显著性检验, 模型通过残差自相关检验, 可以用来预测。( 四) 模型的预测我们使用时间序列分析的方法对湖北省地方生产总值的年度数据序列建立自回归预测模型, 并利用模型对 2002 到 2006 年的数值进行预测和对照:表 5 ARIMA ( 1, 1, 0) 预测值与实际值的比较由上表可见, 该模型在短期内预测比较准确, 平均绝对误差为 , 但随着预测期的延长, 预测误差可能会出现逐渐增大的情况。下面, 我们对湖北省 2007 年与 2008 年的地方总产值进行预测:在 ARIMA模型的预测中, 湖北省的地方生产将保持增长的势头, 但 2008 年的增长率不如 2007 年, 这一点值得注意。GDP毕竟与很多因素有关, 虽然我们一致认为, 作为我国首次主办奥运的一年, 2008 将是中国经济的高涨期, 但是是否所有的地方产值都将受到奥运的好的影响呢? 也许在 2008 年全国的 GDP 也许确实将有大幅度的提高, 但这有很大一部分是奥运赛场所在地带来的经济效应, 而不是所有地方都能够享有的。正如 GDP 数据显示, 1998 年尽管全国经济依然保持了一个比较好的态势, 但湖北省的经济却因洪水遭受不小的损失。作为一个大省, 湖北省理应对自身的发展承担起更多的责任。总的来说, ARIMA模型从定量的角度反映了一定的问题, 做出了较为精确的预测, 尽管不能完全代表现实, 我们仍能以ARIMA模型为基础, 对将来的发展作出预先解决方案, 进一步提高经济发展, 减少不必要的损失。四、结语时间序列预测法是一种重要的预测方法, 其模型比较简单,对资料的要求比较单一, 在实际中有着广泛的适用性。在应用中,应根据所要解决的问题及问题的特点等方面来综合考虑并选择相对最优的模型。在实际运用中, 由于 GDP 的特殊性, ARIMA模型以自身的特点成为了 GDP 预测上佳选择, 但是预测只是估计量, 真正精确的还是真实值, 当然, ARIMA 模型作为一般情况下的 ARMA 模型, 运用了差分、取对数等等计算方法, 最终得到进行预测的时间序列, 无论是在预测上, 还是在数量经济上, 都是不小的进步, 也为将来的发展做出了很大的贡献。我们通过对湖北省地方总产值的实证分析, 拟合 ARIMA( 1, 1, 0) 模型, 并运用该模型对湖北省的经济进行了小规模的预测,得到了较为满意的拟和结果, 但湖北省 2007 年与 2008 年经济预测中出现的增长率下降的问题值得思考, 究竟是什么原因造成了这样的结果, 同时我们也需要到 2008 年再次进行比较, 以此来再次确定 ARIMA ( 1, 1, 0) 模型在湖北省地方总产值预测中所起到的作用。参考文献:【1】易丹辉数据分析与 EViews应用中国统计出版社【2】 Philip Hans Frances 商业和经济预测中的时间序列模型中国人民大学出版社【3】新中国五十五年统计资料汇编中国统计出版社【4】赵蕾陈美英 ARIMA 模型在福建省 GDP 预测中的应用科技和产业( 2007) 01- 0045- 04【5】张卫国以 ARIMA 模型估计 2003 年山东 GDP 增长速度东岳论丛( 2004) 01- 0079- 03【6】刘盛佳湖北省区域经济发展分析华中师范大学学报 ( 2003) 03-0405- 06【7】王丽娜肖冬荣基于 ARMA 模型的经济非平稳时间序列的预测分析武汉理工大学学报 2004 年 2 月【8】陈昀贺远琼外商直接投资对武汉区域经济的影响分析科技进步与对策 ( 2006) 03- 0092- 02( 作者单位: 武汉大学经济与管理学院金融工程)AR(1)MA(1) AR(1) MA(1) 备注AIC - - - 最优为 AR(1)MA(1)SC - - - Coefficient Std. Error t- Statistic (1) squared - Mean dependent var R- squared - . dependent var . of regression Akaike info criterion - resid Schwarz criterion - likelihood Durbin-Watson stat AR Roots .59年份实际值预测值相对误差(%) 平均误差(%)2002 - - - - - 年度 GDP 值增长率(%) — 表 6 ARIMA ( 1, 1, 0) 对湖北省经济的预测一、模糊数学分析方法对企业经营 ( 偿债) 能力评价的适用性影响企业经营 ( 偿债) 和盈利能力的因素或指标很多; 在分析判断时, 对事物的评价 ( 或评估) 常常会涉及多个因素或多个指标。这时就要求根据多丛因素对事物作出综合评价, 而不能只从朱晓琳曹娜用应用模糊数学中的隶属度评价企业经营(偿债)能力问题影响企业经营能力的许多因素都具有模糊性, 难以对其确定一个精确量值; 为了使企业经营 ( 偿债) 能力评价能够得到客观合理的结果, 有必要根据一些模糊因素来改进其评价方法, 本文根据模糊数学中隶属度的方法尝试对企业经营 ( 偿债) 能力做出一种有效的评价。隶属度及函数选取指标构建模型经营能力评价应用理论探讨28

238 评论 2小时前发布

方吉咕咕咕

SPSS软件是“统计产品与服务解决方案”软件，是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的范文，欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法，介绍了统计分析软件SPSS的特点，并通过实例：用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的应用做了详细的介绍，旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件，其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件，目前在各专业毕业论文经常可以看到它的身影，其应用范围广、方便快捷等特点吸引着众多的爱好者。本文通过对统计分析软件SPSS的功特点进行介绍，通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的操作用做了详细的介绍，为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好，除了数据录入及部分命令程序等少数输入工作需要键盘键入外，大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点，告诉系统要做什么，无需告诉怎样做。只要了解统计分析的原理，无需通晓统计方法的各种算法，即可得到需要的统计分析结果。对于常见的统计方法，SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此，用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法，比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件，文本编辑器软件生成的ASCⅡ数据文件， Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt，word，PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析，大多青睐于SPSS，像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS，因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题：为了调查甲、乙两地土壤对种植同一种西瓜有没有影响，从这两个产地分别随机抽取同种的8只和7只西瓜，称重后得重量(市斤)如下：

甲(斤)：、、、、、、、

乙(斤)：、、、、、、

问：根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解：建立假设 H0：甲乙两地的西瓜重量没有显著差异;

H1：甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件，注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具体操作过程如下：

第一步：单击Analyze Nonparametric Test 2 Independent Sample，打开Two-Independent-Sample对话框(见图1)。

第二步：选择检验的变量进入检验框中，选择分组变量进入Grouping Variable框中，单击Define Group键，打开Define Group对话框，将分组变量值分别键入两个框中，单击Continue返回主对话框(见图2)：

第三步：在Test Type栏中，确定检验方法。

SPSS中提供了四种检验方式，几种检验方法侧重点不同，但都是先把两样本数据混合排序，再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样，所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步：选择输出的结果形式及缺失值处理方式;

第五步：单击OK，得输出结果。

所以，以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要： SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤，文中的方法对考试研究人员具有一定的指导意义。

关键词： SPSS软件考试数据统计分析操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度，试题有难度和区分度指标，试卷有效度和信度指标，这些是评价考试最主要的测量指标，但是仅有这些指标不足以反映一份试卷的实际测量效果，考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代，考试成绩统计主要依靠人工阅卷，考试数据无法电子化存储，对考试数据分析统计难以实现。随着计算机的普及和信息化的推广，各种分析数据的软件应运而生，这些软件中汇集了统计学和测量学的分析工具，使得应用电子信息技术分析统计考试成绩数据成为可能，这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中，SPSS是应用最多、影响最广泛的分析工具之一。在本文中，我们以SPSS软件为工具，对教育招生考试成绩的数据进行统计分析，分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”，中文名称为“社会科学统计软件包”，它是世界著名的统计分析软件之一，在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包，它集数据整理、分析于一身，主要功能包括数据管理、统计分析、图表分析、输出管理等，该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析，介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中，考试结果的信度，试题的区分度，每个题目得分与试卷总分的关系，以及题目之间的关系，等等，都是考试研究的重要内容，最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中，Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式：

式中x为第i个考生第j题的得分，y为第i个考生第k题的得分，为第j题的平均分，为第k题的平均分，n为测试样本量。该公式既可以计算两个连续变量之间的相关性，又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式：

r=1-(2)

式中D为两个变量的秩序之差，n为样本容量。

Cronbach a信度系数法计算公式：

α= 1-(3)

式中n为试题数，s为第i题的标准差，s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据，利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性，以及各个题目之间的相关性。我们以Pearson相关系数分析为例，利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷)，数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 版本的软件为例，介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例)：

(1)将考试数据导入SPSS软件，在SPSS数据窗口中，顺序点击【Analyze】→【Correlate】→【Bivariate...】，系统弹出变量相关系数设置对话框。

(2)在该对话框中，将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中，在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中，选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域，可以点选“Two-tailed”选项或者“One-tailed”，我们采用系统默认值。

(4)对话框中的其它选项取软件系统的默认值，点击【OK】，开始相关系数计算，系统弹出新的窗体输出运算的结果。本次输出的情况如下：

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中，但题目T4和题目T5之间的相关程度远高于其它几个题目，我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系，这是我们通过分析获取的重要信息，该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性，这在大规模考试中是不应该出现的，需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似，只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框，程序就会按Pearson相关系数法进行统计分析，如果同时选中“Spearman”和“Pearson”复选框，程序将会同时计算按两种分析方法统计分析的数据，并会以不同的图表进行显示，而Cronbach a信度系数法计算方法与上述方法略有不同，其操作步骤如下：

(1)在SPSS数据窗口中，顺序点击【Analyze】→【Scale】→【Reliability Analysis...】，系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中，在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数)，点击“Statistics”选择项可以进行更为详细的参数设置，我们采用系统的默认值即可。

(3)参数设置完毕之后，点击【OK】，软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型，考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2]，对选择题干扰项的设计及其施测后的实际效果关注甚少，事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设，对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个，其中仅有1个选择项是正确的。命题人员在设计选择项时，应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测，对考生作答的分布情况作出预估。考试结束后，研究人员应该对实测的情况与命题教师预测的情况进行对比分析，以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性，因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理，设变量E是命题者对某道试题的期望值，E=nP，n为样本容量，P为期望的相对频率，引入以下统计量：∑(O-E)/E，其中O为观察频数。

本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文

我们需要进行的假设检验是：零假设H：选项的实测分布与期望分布相同;非零假设H：选项的实测分布与期望分布不同。

检验假设的思想：拟合度检验的统计量在确定的某种显著性水平下如果零假设是真，则检验统计量∑(O-E)/E呈近似χ分布，其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合，就不排除零假设，否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本，利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下：

(1)将考试数据导入SPSS软件，依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】，弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中，本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框，具体操作方法是选中单选框“Values”，输入具体的期望数值，点击“Add”按钮，依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】，输出软件运算结果。

我们需要进行的假设检验，H：选项的实测分布与期望分布相同;H：选项的实测分布与期望分布不同。

假设检验的显著性水平为α=，χ=∑(O-E)/E，自由度为df=4-1=3，查χ分布表或利用相关软件可得P=，由于P>α，因此不能拒绝零假设，即选项的实测分布与期望分布相同。因此，检验结果在显著性水平时，没有足够的证据拒绝零假设，即可认为本题选项的实测分布与期望分布相同，也就是说本题的实际测试效果与命题教师预测的效果是一致的，命题教师准确地估计了考生的实际水平，这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛，但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面，本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看，软件操作步骤和统计分析过程十分简单、快捷，对于测量学和统计学基础不太好的数据分析统计人员来说，只要遵循一定的操作步骤，就可以进行分析。

参考文献：

[1]王孝玲.教育测量(修订版)[M].上海：华东师范大学出版社，2006.

[2]雷新勇.大规模教育考试：命题与评价[M].上海：华东师范大学出版社，2006.

[3]李伟明，冯伯麟，余仁胜.考试的统计分析方法[M].北京：高等教育出版社，1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海：华东师范大学出版社，2007.

统计软件论文题目

5个回答 默认排序 默认排序 按时间排序

相关问答

职称论文

向你推荐

热门问题

5个回答默认排序

默认排序

按时间排序