SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):、、、、、、、
乙(斤):、、、、、、
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
你要先有论文的目的和分析思路,然后根据目的的论文和分析思路,确定需要收集的数据和类型,最后才考虑 应该用spss什么方法来实现。下面是我自己写的一个 带数据分析的论文写作指导首先,我要说明这里的指导并非常规意义的指导,我这里说的指导是到底应该如何写论文(应该还是很抽象,不过看完就知道了)。迄今为止,我大约也帮忙做了能有上千份的学生论文数据分析部分,包括一部分的整篇论文写作,其中涉及到有医学类、护理类、人文社科类、教育类、经济学类、心理学类等,单凡需要用到数据分析的论文。因为我是做市场研究与数据分析的,擅长的主要工具是spss,不敢说百分百精通spss,但是应付个八九十应该是足够了,很自然的平时就利用下班和业余时间帮学生做一些论文数据分析以及论文写作指导。很多论文的核心部分都包括数据分析,而统计学也应该是所有学科应该学习的一门重要课程,但是恰恰相反,很多学科只是把统计学和数据分析作为一项选修甚至不重要的课程对待,这样导致学生在最后做论文时完全不懂。而在这种情况下,很多学生因为对数据分析的一窍不通,导致论文从开始的设计到后续的数据收集、整理等都会出现问题,最终导致分析出问题。因此,在对数据分析一窍不通的情况下,应该如何从头构建论文及写作呢?很多论文虽然数据分析部分是核心,但是不管哪种论文的写作,都脱离不了论文的框架。因此,具体的过程应该如下:首先是选题,当然很多时候是导师直接给选题,这个没有太多讨论。其次是选题确定后,马上要做的不是想我应该怎么去写作,或者在哪抱怨“哎~~郁闷,完全不知道怎么写嘛”。而是先通过文献查找,看前人在这个选题方面已经做了哪些研究,都是如何做的。通过查找文献找到跟选题有关的资料,然后对这些资料进行整理,整理不需要计较参考文献的结论和数据细节等,而是要把每篇文献的研究目的、采用的研究方法、采用的分析方法整理出来。当然参考文献中的分析方法你可能还完全不懂,但是没关系,你先把这些参考文献中使用的分析方法全部罗列出来,如线性回归、方差分析、均值t检验、logistic回归等,把这些文献中常用的统计方法罗列出来,你需要弄清楚对应关系,即每种分析方法是用来支持和实现什么样的研究目的,以及能够得出什么样的结论,认真阅读文献就能实现这一步。第三.通过上一步,你应该朦胧的知道你选题相关的参考文献中常用的统计方法名称,以及这些统计方法能够帮助实现哪些目的,或者得出什么结论,同时也不会对自己的选题那么恐惧和迷茫了,因为可能你的选题已经有前人做过了,你的论文只是“复制”一遍而已了,我说的复制是重复一遍前人的研究。在这种情况下,可以构思下自己的选题,这一步属于纯理论层面的,你需要将自己的思路具体化,比如要实现什么目的,很自然的需要什么数据分析方法也就能确定了。当然很多论文会预先设计一系列待验证的假设,也是在这一步完成,因为你找到的文献中可能会存在矛盾的结论,可能会存在一些你认为的研究缺陷(文献看多了,自然自己就会有想法出来了),提出自己的一系列假设,能够很清楚的指导后面的数据收集和分析。第四.选题、假设还有研究方法这些经过前面几步都能确定了,接下来就是要考虑具体研究和收集数据的环节了。这个环节最重要的也是首要的是弄清楚你的数据应该是什么类型的,通过哪种方法来获取。其实也容易了,因为前面你已经确定了统计分析方法,而每种方法有它特定的数据类型要求,比如是分类数据(如性别、民族、年级等)、比如连续性数据(如年龄、身高、体重、温度、长度、距离等)。分类数据简单通俗点的理解就是这些数字本身是没有意义的,是人为赋予它一定的含义,这些数据之间不存在连续性,且加减乘除没有意义,而连续性数据是数据本身有意义,且能够进行一些加减乘除运算。确定了所需要的数据类型,就大致能够知道在数据收集时,应该注意的问题。比如一份问卷调查,其中应该如何设计问题也就大致清楚了,通常问卷设计时就要考虑两种数据类型的问题,因为不同的选项设计会导致不同的数据类型。如你设计一个问题的答案选项是“有/没有”、“是/否”这种是属于分类数据,如果你的答案选项是李克特量表式“非常满意----非常不满意”这种,在处理时可以按照分类数据,只能统计出一些百分比,也可能将其按照连续数据如12345打分形式,这样可以求均值,可以做很多其他多元统计分析。因此这一步确定数据类型很关键,如果数据类型弄错的话,则收集的数据完全无用。第五.具体收集数据过程,不细说了,收集回来之后就是数据的录入。记住一定要录入原始的数据,而不是经过加减整理汇总后的数据。数据录入格式也是有要求的,一般大致同样的情况下,都是一行代表一个个案或者一份问卷的数据,而一列对应表示的是问卷中的一个问题,即变量。因此数据录入完成后,应该是有多少样本数据,就有多少行,数据中包含多少个指标,那就有多少列。第六.这一步才是你应该开始头疼的数据分析不会了怎么办。因为到这里才开始是数据的具体分析过程了。不会怎么办,前面已经知道了分析方法,这种情况,只有找本教材,然后找对应的方法介绍学习即可,或者实在不行找人指导,找人帮忙等等。最后。分析完成后,开始整篇论文的写作。其实完成前面的每一步,到最后写文献综述以及讨论时,自然就会得心应手了,很少会需要绞尽脑汁甚至东拼西凑。
亲,可以来我们这里了解代做流程及报价,我们团队写手比较准成的
摘要摘要是文章主要内容的摘录,要求短、精、完整。字数少可几十字,多不超过三百字为宜[3]。摘要的规范摘要是对论文的内容不加注释和评论的简短陈述,要求扼要地说明研究工作的目的、研究方法和最终结论等,重点是结论,是一篇具有独立性和完整性的短文,可以引用、推广。关键词关键词是从论文的题名、提要和正文中选取出来的,是对表述论文的中心内容有实质意义的词汇。关键词是用作计算机系统标引论文内容特征的词语,便于信息系统汇集,以供读者检索。每篇论文一般选取3-8个词汇作为关键词,另起一行,排在“提要”的左下方。主题词是经过规范化的词,在确定主题词时,要对论文进行主题分析,依照标引和组配规则转换成主题词表中的规范词语。(参见《汉语主题词表》和《世界汉语主题词表》)。
基于SPSS|的桐庐旅游市场|分析摘要:桐庐旅游资源丰富,旅游业发展迅速。为了更好地迎合市场需求,加大旅游业发展力度,需要对旅游市场有明确认识。通过对桐庐主要景点3 000位游客的问卷调查和访谈,应用spss软件深入分析了桐庐旅游市场的现状及其特点,并为加快桐庐旅游业的发展提出了相应对策。 关键词:桐庐;旅游市场;发展战略 一、桐庐旅游市场现状 桐庐具有优越的地理条件和丰富的旅游资源,每年吸引着众多游客前来旅游。目前,桐庐的旅游市场主要集中在长三角地区,交通上的便利为桐庐旅游市场带来了更多客源。2007年,全县共接待游客万人次,比上年增长;2008年,全县共接待游客万人次,比上年增长;2009年,共接待游客万人次,比上年增长。数据显示桐庐游客人数逐年增加,但是增长率逐年减少。在这样的发展形势下,总结桐庐现有旅游市场特点,在此基础上提出桐庐旅游业未来的开发方向具有实际意义。 二、桐庐旅游市场特点 该调查问卷集中在桐庐主要景区发放,共发放3 000份。收回问卷2 995份,剔除漏题严重和结构不合理的问卷,有效问卷共2 989份。之后利用spss软件进行数据分析,总结桐庐旅游市场特点。 1.长三角地区为游客主要来源市场,江苏游客比重加大。根据调查显示,来自浙江的游客所占比例最大,为%;其次来自江苏游客,有%;再次为上海地区游客,占%。除上海、浙江、江苏外国内其他省份的游客只有%。省内游客来桐庐旅游人数仍占大部分。有关专家对杭州本地居民环城游憩偏好研究时发现,大部分居民喜欢在市区周边游憩[1]。杭州到桐庐交通便利,形成巨大游客市场。江苏游客人数增多,一方面因为该地游客对山水风光感兴趣;另一方面由于长距离旅游盛行,游客到周边省市旅游人数逐渐增多。 2.逗留时间短,平均消费低,多为顺带旅游。目前来桐庐旅游大多将桐庐作为过路市场,在桐庐逗留时间相对短暂。到达桐庐选择驻留天数在两天以内人数占大多数,达到,其次是驻留天数在3到4天的游客,占,选择7天及以上的人数占到。目前桐庐游客市场大致分为三部分:(1)游览杭州和千岛湖景点时,将桐庐作为过路景点的游客;(2)从江苏,上海等临近省市来桐庐游客;(3)本地游憩市场。目前桐庐游客市场构成中,第一部分游客占较大比例,形成桐庐过路市场的原因有以下几点:(1)桐庐周边景区如西湖等游客数量众多。桐庐地处杭州、千岛湖中间地段,全县分布有多处景点,一部分游客在游览西湖、千岛湖途中会选择在桐庐游玩。(2)减少旅行成本。杭州和千岛湖等景区提供的食宿较贵,游客考虑成本问题,会在周边选择合适地区替代。(3)旅行社为了提高旅游产品竞争力,选择增加桐庐景点。从桐庐整个旅游业发展来看,目前桐庐旅游市场仍是以过路市场为主。 3.单位组织出游比例较高,合作性项目倍受青睐。调查中关于旅游组织形式的选择有29%选择单位组织,有19%选择随旅行社出游,有29%选择个人或亲朋好友结伴,另有14%选择自驾游。对比周边景区数据发现桐庐旅游市场中选择单位组织形式人数比其他景区高。桐庐游客大部分来自浙江,其中杭州市区游客占据了绝大部分。杭州市区有众多企业落户,企业经常组织外出旅游来促进员工间的交流合作。杭州到桐庐交通方便,一日游行程紧凑合理,适宜公司组织员工活动。同时在对游客喜好情况调查中发现:游客希望桐庐以后开展户外运动的人数最高,占样本人数的,其次是开展文艺表演,占到总数的,选择度假项目占总数的。结合该地旅游市场的组织方式特点发现户外运动等这些交流合作比较多的项目将是游客的偏好点,因此一些参与合作性的旅游项目是这一部分客源市场青睐的活动。 三、桐庐旅游发展对策 (一)扩大旅游市场半径,增强旅游吸引力 目前,桐庐游客来源集中在长三角地区,全国范围内的辐射半径比较短。即使在长三角也存在着很大的市场空间。应针对不同的地理细分市场,根据其特点采取不同的发展策略。 1.增强桐庐旅游吸引力,扩大长三角客源范围。长三角是桐庐主要客源市场,但来源地区分布相对集中。如,江苏游客主要来自南京、苏州、扬州这些地区;浙江游客来源主要是杭州、宁波、温州等地区。总体而言,桐庐目前在长三角旅游吸引力不是很强,像常州、镇江、舟山和台州这些地区来桐庐旅游人数并不多。针对这部分游客市场,我们应加大宣传力度,注重游客口碑效应,提高旅游产品在长三角地区的竞争力。 2.依托闽、皖、赣,拓展京、津、冀。作为桐庐地理二级市场,临近省市安徽、江西等来浙江旅游人数不是很多,仅占到总量。根据旅游客流规律,旅游流向以近距离旅游为主,并由近及远。近几年,旅游发展态势显示,越来越多游客开始流向远距离景点。桐庐拥有丰富旅游资源,对于周边省市吸引力较大。随着区域旅游合作的加强,桐庐旅游辐射半径的加大,这些省来桐庐旅游的人数必将增多,形成一定影响力。北京、天津、河北距离安徽、江西都较近,容易获得当地旅游信息,并且经济水平相比周边省市较高,因此具备远距离旅行的客观条件。桐庐旅游发展要注重拓展旅市场半径从而获得多方面客源。 3.依托富春山居,拓展台湾、日本、韩国市场。日本和韩国来华旅游人数众多,自1985年以来,日本一直是我国最大旅游客源国。同时,自1992年我国与韩国建立外交关系以后,韩国旅华人数也由最初十几万人增长到2004年的285万人,短短13年就增长了18倍[2]。2005年韩国更是取代日本成为我国最大旅游客源国。韩国和日本的旅游市场存在很大的潜力,这一部分市场是桐庐客源市场的机会市场。依托富春山居图的契机,打开国际市场,将会为桐庐旅游业发展带来另一个机会。 (二)丰富旅游形式,延长逗留时间 桐庐旅游市场一个明显特点就是游客到达该地停留时间短暂,旅游花费低。为了使其在桐庐停留时间变长,必须要丰富旅游形式,提供多样的旅游活动。结合桐庐的旅游资源情况和目前的旅游发展形势,提出三个方向。 1.做大山水游憩市场。山水城市是具有山水文化精神内涵和中国特色的高生态环境的理想城市。由于山水城市拥有优美山水自然景观和丰富历史文化积淀,因而具备了游憩开发的资源基础[3]。桐庐旅游资源丰富,在地域分布上具有一定集聚性:主要集中在富春江、天目溪沿岸的桐庐镇、富春江镇、瑶琳镇等乡镇。它们各具特色,有利于资源优化配置,形成统一的旅游开发体系[4]。从桐庐旅游资源构成来看主要以山水景色为多,拥有丰富游憩开发资源基础。做大山水游憩市场,加强景区合作,形成一定规模的游憩市场,将会延长游客逗留时间,增加平均消费,从而加速桐庐旅游业发展。 2.做精乡野度假市场。随着工业化、城市化的加剧,枯燥的生活环境使城市居民产生脱离模式化生活、寻求田园风光的需求。我国城镇居民可支配收入的提高和国家新的假日制度的实施,也使得这一需求在经济和时间上得到保障[5]。乡野度假市场巨大,同时竞争也很激烈。开发乡野度假产品要注重城乡联动,如果要吸引游客前来桐庐观光体验,必须要有独具特色的乡野产品。 3.做专商务休闲市场。据预测,中国可于2020年超过美国而成为世界第一大商务旅行目的地,我国正在成为全球商务旅游消费的重要市场之一[6]。桐庐有许多金名片,每年来桐庐进行商务活动的游客占很大一部分。在商务休闲市场中,桐庐应该看重会议旅游市场。会议游客旅游淡旺季不明显,存在着巨大的发展空间。目前桐庐具备接待商务会议旅市场的景点并不多。要想占据较大的市场份额,对于商务会议一定要重视专业化的服务,与其他竞争者拉开差距,从而获得更多的市场客源。 (三)优化旅游产业要素结构,加强基础设施建设 旅游业主要有三大支柱产业:一是旅行社,二是饭店业,三是交通运输业,主要通过这三者来满足游客吃、住、行、游、娱、购等各方面的需求,以此为旅行者提供便利服务来获取收入[7]。旅游者到某个城市去旅游,除了要接触旅游行业的各个部门、参观旅游景点、参与旅游活动外,还必然会看到城市的方方面面[8]。问卷显示,游客对于桐庐的餐饮满意度不高,在总共2 989份的有效样本里有1 250人选择餐饮服务需要改善,占总数。桐庐的餐饮服务情况需要得到提升以配合旅游业的发展。从交通角度来看,桐庐县城新区与老城区道路条件和交通状况反差较为明显,老区道路设施水平相对低下,但集中了大量车流、人流,交通显得略为拥挤,新区道路宽阔整齐,但车辆稀少,道路资源没有得到充分利用。并且,据了解,近几年桐庐县机动车呈逐年增长趋势,汽车增多但泊位却没有相应增加,占道停车现象普遍。桐庐的旅游市场中有很大一部分自驾游市场,因此,交通道路及一些公路配套设施的建设要跟上旅游发展的需要。 四、结语 目前,桐庐旅游业发展的明显现象就是作为一个过路市场存在。从长远的角度来看:一个地区要想发展好旅游业,必须成为一个目的地市场。桐庐旅游业的一个战略性指导思想,就是要从过路市场向目的地市场转型。因此,首先要明确桐庐客源市场目标层,有针对性地进行宣传,在此基础上丰富旅游产业形式,创新发展,提高吸引力,从而早日实现市场定位的转变。 参考文献: [1] 吴必虎,伍佳,党宁.旅游城市本地居民环城游憩偏好:杭州案例研究[J].人文地理,2007,(2):27-31. [2] 张佑印,马耀峰,李小亮.旅华日本?韩国游客旅游决策影响因素分析[J].陕西师范大学学报:自然科学版,2006,(1):112-115. [3] 宋秋,帅希权.山水城市的游憩开发——以乐山为例[J].四川烹饪高等专科学校学报,2008,(2):63-65. [4] 黄瑾如,董洁霜.以“大旅游”战略格局发展桐庐旅游业[J].浙江大学学报,2007,(1):75-78. [5] 乔花芳,曾菊新,李伯华.乡村旅游发展的村镇空间结构效应——以武汉市石榴红村为例[J].地域研究与开发,2010,(3):101-105. [6] 胡建杭.义乌商务旅游发展前景初探[J].义乌工商职业技术学院学报,2010,(1):17-21. [7] 李虎.旅游业的主要特点[J].地理教育,2010,(4):13. [8] 姚伟,郑俐.创建桐庐优秀旅游城市的思考[J].浙江建筑,1999,(4):3-4
Hello, 这里是 行上行下 ,我是 喵君姐姐 ~ 在上一期中,我们为大家带来了 利用SPSS软件进行高级统计分析的实操教程第一期 ,内容包括: 描述性统计表格模板、卡方&T检验、相关&回归分析 等。 在本期中,我们继续为大家介绍如何利用SPSS进行:中介、多重中介、链式中介、调节分析、有中介的调节分析等。PS: 后台回复关键词 “高级统计” 即可获得所述的PDF原文啦!一、中介【报告B,SE,t(df),p),置信区间,画中介效应图】 1.回归方程法 算三个回归方程 1) 自—因 2) 自—中 3) 自、中—因 数据分析 2. Process插件法:Model4 部分标准化 效应量/Y的标准差 完全标准化 所有变量的标准化 3. 报告【B、SE、t(df)、P、置信区间+图(标准化系数)】 本研究采用软件SPSS 中文版进行采集录入和统计分析实验数据。中介效应检验:参照Preacher 和Hayes (2004)提出的Bootstrap 方法进行中介效应检验(模型4),样本量选择5000,在95%置信区间下。 为了探讨MIL和FCI的关系中是否存在PA的中介作用,本研究以MIL得分为自变量,FCI得分为因变量,PA得分为中介变量进行中介效应检验。结果表明,PA在MIL和FCI之间起着中介作用。 MIL对PA有显著的预测作用(B=,SE=,t(98)=,p < ),置信区间(LLCT = ,ULCT =)不包含0; 中介检验的结果不包含0( LLCT = , ULCT = ) ,表明 P A 的中介效应显著(中介效应大小为,S E =) ,中介效应如图所示。参考文献:Preacher, K. J. , & Hayes, A. F. . (2004). Spss and sas procedures for estimating indirect effects in simple mediation models. Behavior Research Methods, Instruments & Computers, 36 (4), . 二、多重中介 1. Process插件法:model4 三、链式中介 1. Process插件法:model6 中心化:原始数据-均值 拆分文件:spilt四、调节【报告B、SE、t、β、p、95%CI、Δ+画回归表、交互作用图】 1. 线性回归法 S pss操作 1)算z分数 2)算交互项 3)算回归方程 S pss结果解读 画交互作用图:对调节变量做高低分组 高分组:平均值+标准差= 低分组:平均值—标准差= 拆分文件,做回归 再做一次回归,画图 2. Process插件法:model1 S pss操作 S pss结果解读 报告 利用Process model 1 (Hayes,2018)探讨生命意义感P、社会支持以及二者的交互作用与工作倦怠的关系。 结果表明, 生命意义感P (B = , t = , p = )、 社会支持 (B = , t = , p = )以及二者交互作用(B = , t = , p = ) 对工作倦怠的作用 均不显著 (如表3所示),简单斜率分析图如图2所示。图 2简单斜率效应分析图五、有调节的中介【报告B、SE、β、p、95%CI+画回归表+交互作用图】 1.线性回归法 算两组交互项 自*调 中*调 1) 自、调、自*调—因 2) 自、调、自*调—中 3) 自、调、自*调、中、中*调—因 报告 接下来验证有调节的中介作用,以压力为自变量,生命意义感P为调节变量,自我效能感为中介变量,深层劳动为因变量为例。 根据温忠麟和叶宝娟(2014)的观点,检验有调节的中介模型需要对三个回归方程的参数进行检验:(1)方程1 估计调节变量(生命意义感P)对自变量(压力)与因变量(深层劳动)之间关系的调节效应; (2)方程2 估计调节变量(生命意义感P)对自变量(压力)与中介变量(自我效能感)之间关系的调节效应; (3)方程3 估计调节变量(生命意义感P)对中介变量(自我效能感)与因变量(深层劳动)之间关系的调节效应以及自变量(压力)对因变量(深层劳动)残余效应的调节效应。 根据Muller, Judd 和Yzerbyt (2005)的观点, 如果模型满足以下两个条件则说明有调节的中介效应存在:(1)方程1 中, 压力的总效应显著, 且该效应的大小不取决于生命意义感P; (2)方程2 和方程3 中, 压力对自我效能感的效应显著, 生命意义感P与自我效能感对深层劳动的交互效应显著, 和/或压力与生命意义感P对自我效能感的交互效应显著, 自我效能感对深层劳动的效应显著,本研究中有调节的中介模型检验结果见表2、图3。 由表2、图1可见,方程1 中压力负向预测深层劳动(β=,p<),压力与生命意义感P的交互项对深层劳动的预测作用显著(β=,p<)。 方程2 和方程3 中,压力与生命意义感P的交互项对自我效能感的预测效应显著(β=,p<);压力与生命意义感P的交互项对深层劳动的预测作用显著(β=,p<);同时自我效能感对深层劳动的预测效应显著(β=,p<)。 这表明, 压力、生命意义感P、自我效能感和深层劳动四者之间构成了有调节的中介效应模型 , 自我效能感在压力与深层劳动之间具有中介作用 , 生命意义感P 在 压力与深层劳动、压力与自我效能感间起调节作用 。表2 压力对深层劳动有调节的中介效应检验(以生命意义感P为调节变量、自我效能感为中介变量) 图 3压力对深层劳动有调节的中介效应图(中介变量为自我效能感,调节变量为生命意义感P)参考文献: 温忠麟, & 叶宝娟. (2014). 中介效应分析:方法和模型发展. 心理科学进展, 022 (005), 731-745.由于生命意义感P在压力与深层劳动、压力与自我效能感间起调节作用,因此需要进一步检验简单效应以明确生命意义感P调节作用。 首先将生命意义感P按照正负一个标准差分成高、低组, 采用简单斜率检验考察在生命意义感P不同水平上压力对深层劳动、压力对自我效能感的影响,相应的简单效应分析见图5、图6。 图5结果表明,对于 生命意义感P 较 高 的个体 来说,压力能负向预测深层劳动( B= , SE = , p < ) ;而对于生命意义感P较低的个体来说,压力不能显著预测深层劳动(B =, SE = = ),即 比起低压力情景,高生命意义感P的个体在高压情景下,会有更少的深层劳动。 图 5生命意义感P对压力与深层劳动之间的关系调节作用 图6结果表明,对于生命意义感P较低的个体来说,压力不能预测自我效能感(B = ,SE =,p =);而对于 生命意义感P较高的个体来说 , 压力能负向预测深层劳动( B = , SE = , p <) ;即比起低压力情景时, 高生命意义感P的个体在高压情景下自我效能感更低。 图 6生命意义感P对压力与自我效能感之间的关系调节作用2. Process插件法 调节前半路径:model7 1)Spss操作 2) Spss结果解读 调节后半路径:model14 1) Spss操作 2)Spss结果解读 探索前后:model57 报告 使用Hayes (2019)的SPSS 宏程序PROCESS(Model7),分析自我效能感在压力与深层劳动之间的中介作用(前半段)是否受生命意义感P的调节。 结果表明(如表4所示): 自我效能感显著正向预测深层劳动(B= ,S E = 4 ,p< ) ; 压力与生命意义感P的交互项能显著负向预测自我效能感(B=,S E =,p< ) 。 表4:生命意义感P调节自我效能感在压力与深层劳动之间中介作用的回归分析 在生命意义感P得分为平均数减一个标准差、平均数以及平均数加一个标准差三个水平时,自我效能感在压力与深层劳动之间的中介效应值及其95%Bootstrap 置信区间如表5所示。 综合以上结果,本研究提出的有调节的中介模型得到了支持。 自我效能感 在 压力与深层劳动之间起中介作用, 而且该中介作用 前 半段 受到生命意义感P的调节。 表5:不同生命意义感P水平时压力与自我效能感之间的关系 生命意义感P水平中介效应值Boot标准误Bootstrap下限Bootstrap上限 *** *** M+ *** 注: *** p<进一步采用简单斜率检验来分析生命意义感P在压力与自我效能感关系中的调节作用。按生命意义感P的平均分加减一个标准差将被试分为高生命意义感P水平组(高于平均数加一个标准差的被试)、低生命意义感P水平组(低于平均数减一个标准差的被试)与中生命意义感P水平组(介于两组之间的被试)三组,采用分组回归的方式考察压力与自我效能感的关系,结果如图所示: 随着 生命意义感P水平的升高 , 压力 对 自我效能感 的负向预测作用逐渐 变强 (由B= , p < 减弱为B= < )。
spss使用VIF判断多重共线性标准是10,超过10,说明有共线性,越大共线性越大。多重共线性,计算自变量的偏回归系数时矩阵不可逆。其表现主要有:整个模型的方差分析结果与各个自变量的回归系数的检验结果不一致,专业判断有统计学意义的自变量检验结果却无意义,自变量的系数或符号与实际情况严重不符等。检验方法主要有:容忍度(Tolerance)和方差膨胀系数(Varianceinflationfactor,VIF)。VIF的取值大于1。VIF值越接近于1,多重共线性越轻,反之越重。当多重共线性严重时,应采取适当的方法进行调整。扩展资料VIF判断多重共线性原理Ri为自变量 对其余自变量作回归分析的负相关系数。方差膨胀系数VIF越大,说明自变量之间存在共线性的可能性越大。如果方差膨胀因子超过10,则回归模型存在严重的多重共线性。又根据Hair(1995)的共线性诊断标准,当自变量的容忍度大于,方差膨胀系数小于10的范围是可以接受的,表明自变量之间没有共线性问题存在。参考资料来源:搜狗百科—方差膨胀系数参考资料来源:搜狗百科—方差膨胀因子
SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):、、、、、、、
乙(斤):、、、、、、
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
今天的我总结几个毕业论文问卷分析的几点建议,希望能帮到各位看官 PS:此处的问卷分析,仅代表具有量表的问卷分析。 因为成熟量表往往经历了现实的考验,其信度和效度达标的概率比较大。 而自己设计的量表,很容易出现信度和效度检验结果惨不忍睹的情况。 这样我们在处理信度分析,探索性因子分析,甚至验证性因子分析的时候,都能游刃有余。 另外如果题目是2个,因子分析KMO值是一定等于的,而一般我们最低也得吧 为了信度和效度能出一个比较好的结果,在文字描述部分,同维度的各个题目,尽量能给一些心理暗示,或者描述上尽量相近,这样能使得维度内的题目的相关性较好,从而信度和效度也不至于太差 一般达到就可以了,以上更好。最好是把每个维度的信度都求一下,然后总体再求一个。这个一般没什么难度,也很容易通过。如果你的数据信度不行,那就进行下项目分析,将高低分样本中不具有区分度的样本删掉。 只求量表的KMO值和巴特利球形检验值。这可能是效度检验的最低要求了。除非导师认同,最好不要仅用这两个值 大部分的同学都会用到的,也是比较不容易通过的一个分析。 遇到最多的问题莫过于,假设题目的维度归属,跟实际出的结果不一致。 碰到这种情况,一般进行如下处理: ①只有少数题目不匹配 要么直接删掉,要么暂时保留 ②绝大多数题目不匹配 从新设计量表,重新收集数据,重新来过吧 若非特殊情况,不建议使用。因为实际收集的问卷数据要想探索性因子分析+验证性因子分析,各个指标均达到理想值,那几乎是不可能的。 如果你看到某某人的论文中用了这样的检验方法,指标非常漂亮,我可以负责任的告诉你,其大概率是改过数据了。 特殊情况1:模型验证阶段,使用AMOS结构方程,导师要求效度检验阶段使用验证性因子分析。 特殊情况2:模型验证阶段,未使用AMOS结构方程,导师也要求效度检验使用验证性因子分析。(导师傻x) 这里特别提一点,显著性的p值代表的是两者是否相关,皮尔逊或者斯皮尔曼系数代表的是相关性程度。 显著性检验通过了,皮尔逊或者斯皮尔曼系数大小才有意义,绝对值越大相关性越大,正负代表正相关与负相关。 显著性通过了,但是系数偏小,那相关性也是显著的,只是两者是存在显著的弱相关性,而不是系数小就代表不相关。 可能是最简单的模型了,将自变量和因变量放进,直接跑就行了。 ①要不要放控制变量 这个随意。 如果放控制变量,尽量放一些层级类的变量,不要放多分类变量。 层级变量比如学历(初中,高中,大学,硕士) 多分类变量比如职业 层级变量的赋值尽量与其题项对应。 如果放了多分类的变量,尽量删掉,如果想保留最好做成虚拟变量 ②用标准系数还是标准化系数 标准化系数。 ③要不要做VIF共线性检验 若非导师要求,那就不做。 ④r方多大算好 这个指标没有非常严格的标准,而且跟导师的价值观有非常深刻的影响。 对于现实收集的数据而言,个人认为,一般大于就好了。 不过我遇到过大于,导师也认为可以接受的情况。 这是一个仁者见仁的问题 从科学的角度来看,应该与你研究的场景有密切的关系。 但是,中介效应模型要比调节效应模型容易出通过,而且解释起来也不那么绕口。 所以,如果不是想给自己挖坑,那就用中介效应模型吧。 快捷验证中介效应模型的方式(快速确定是否存在中介,非正式使用) 条件1,中介变量,自变量和因变量,相关性都显著 条件2,自变量和中介变量关于因变量的回归模型,中介变量的系数显著 如果满足上述两个条件,中介效应一定显著,如果条件2中的自变量也显著,那么就是部分中介效应,如果不显著就是完全中介效应。 另外极少数情况是用sobel来检验中介效应的 如果不是导师要求amos验证中介效应,尽量用spss回归的方式检验中介效应。 快捷验证条件效应模型的方式(快速确定是否有调节效应,非正式使用) 先将调节因子计算处理(标准化后的自变量和中介变量相乘即可) 自变量,调节变量和调节因子关于因变量的回归模型,调节因子的系数显著。 公众号:alone5400
SPSS软件主要用于对数据做统计学方面的一些分析和检验,是用于对数据进行一些基本处理、分析,以及做一些统计检验的软件,使用SPSS分析数据通常有以下几步:导入数据——>数据基本处理——>数据分析——>总结并得出结论。打开SPSS后会出现两个界面,如下图;图一是数据处理分析区,包括数据视图(数据处理区)和变量视图(数据包含各字段编辑区);图二是分析结果区,分析的各类结果都会在此显示。导入数据:在数据处理区左上方选择“文件”——>“导入数据”,导入相应格式的数据,此处我以csv文件格式为例。点击之后,出现如下对话框,选择好要处理的数据,点击“打开”,对要导入数据数据按需要进行预处理,再点击确定。
内容如下假设检验、相关、回归、对数线性、交叉数据表、对应、主成分、因子、方差、协方差分析,等分析。当数据信息量庞大,需要确定哪一因素是必要因素时,spss是最好的软件,尤其是主成分分析法spss可以用来数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制等。是统计学用来分析数据的可以进行统计推断。举个例子,现在是信息数据时代,你可以通过大数据分析,判断各种因素之间的关联性,从而为制定政策者提供依据。
1、“回归分析”是指分析因变量和自变量之间关系,回归分析的基本思想是: 虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。2、回归分析有很广泛的应用,例如实验数据的一般处理,经验公式的求得,因素分析,产品质量的控制,气象及地震预报,自动控制中数学模型的制定等等。3、回归分析主要处理变量的统计相关关系。
SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):、、、、、、、
乙(斤):、、、、、、
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
看你问卷上面有哪些类型题目选择统计方法
大数据主要指的是软件开发,现在这个专业比较火,也就是说比较热门,因为现在是一个移动互联时代 ,找到客户的共同点,通过数据来分析,并且研究用户特点,可以起到事倍功半的作用。
统计描述一般指的是均数、标准差等
数据源:(是什么)研究区域描述:(如果你研究的是区域的话,要写出研究区域你要研究的那一方面的发展概况)数据处理方法:你用了什么方法,仔细描绘,比如怎么选取变量,有无修正参数或部分数据啦等等,怎么检验你处理的方法是否恰当啦
数据分析可以分成两部分,一部分是对分析过程及分析结果的描述,另一部分是结合专业知识对结果进一步分析,为什么会出现这样的结果。
如果完全没有思路推荐使用spssau,里面的结果包括智能文字分析可以提供一些思路。