区域城市居民消费结构差异比较分析(基于SPSS)
论文导读::近年来人民生活水平随着经济发展得到了很大的提高,而消费结构是衡量人民生活水平的重要方面。本文基于SPSS 应用软件,利用因子分析方法、聚类分析方法,对全国31个省市的城市居民消费结构进行全面统计分析比较。通过分析和评价影响消费结构的各项指标,总结了各城市居民消费结构的一些特点和规律,以及产生各地区消费差异的原因,并给出理论建议。
论文关键词:SPSS,应用软件因子分析方法,聚类分析方法居民消费水平,地区消费结构
随着我国经济的快速发展,城镇居民的收入不断增加,我国各地区城镇居民的消费支出强劲增长,消费结构发生了巨大的变化。但是,由于各地区的经济发展不平衡及原有经济基础的差异,各地区的消费结构仍存在着明显差别。为了进一步改善消费结构,正确引导消费,提高我国城市居民的消费水平和生活质量,有必要对各地区城镇居民的消费结构之间的异同进行考察与比较,以期发现特点和规律,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平提供决策依据。
一、对地区消费水平的差异的分析方法
1 因子分析模型的建立
因子分析模型是根据变量间的相关性大小,把变量分组毕业论文怎么写,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以由下面的数学模型来表示[[1]]:
其中:,,,…,为p个原有变量,是均值为0、标准差为1 的标准化变量;,,,…,为m个因子变量,m 小于p,表示成矩阵形式为
,
其中:F因子变量或公共因子,可以将它们理解为在高维空间中互相垂直的m个坐标轴;为特殊因子;F 与均为不可观测的随机变量。 A为因子载荷矩阵,称为因子载荷,是第i个原有变量对第j个因子上的载荷系数。在模型中,特殊因子表示了原有变量不能被因子变量所解释的部分,相当于多元回归分析中的残差,被定义为彼此不相关且与公因子也不相关。
2 实证分析
居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。它主要通过消费的物质产品和劳务的数量和质量来反映。
在各种消费指标中,消费结构指标最能够体现出各地区间的消费水平差异,本文引用我国常用的消费资料支出分类方法,将各地区城市居民人均生活费支出分为8个部分,相应的指标分别用X1~X8表示 。其中X1(食品)、X2(衣着)、X3(居住)、X4(家庭设备用品和服务)、X5(医疗保健)、X6(交通和通讯)、X7(娱乐教育文化服务)、X8(其他商品与服务),单位:元
2.1 因子分析
2. 1.1 数据来源
本文数据取自各地区域城镇居民家庭平均每人全年消费性支出(2009年),来自2010年中国统计年鉴[[2]]。具体表格略论文开题报告范文。
2.1.2因子分析的过程
由于多个变量使用的量纲可能各不相同或者变量间的数值大小相差很大,因此, 首先将初始变量标准化,把原变量数列化为均值为0,方差为1的数列。标准化后全国31个省市作为样本,将上述X1~X8八项支出指标作为变量,得到原始数据阵。首先判断数据变量是否适合进行因子分析,算出样本相关系数阵为:
表1:样本相关系数阵
由上述矩阵发现8个消费要素间的相关系数大部分均大于0.3,适合做因子分析。
再进行KMO统计检验,作为比较变量间简单相关系数和偏相关系数的指标,数学定义为,其中是变量与其他变量的简单相关系数,是变量与变量在控制了剩余变量下的偏相关系数。
Kaiser给出了常用的KMO度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。
计算结果如下:
表2
并且通过巴特利特球体检验(P=0.000<0.05),表明说明原有的8个变量具有很强的相关性,它们反映的消费要素有很大重叠毕业论文怎么写,可以做因子分析。
利用SPSS计算后得到主成分的碎石图,分析发现提取2个主因子比较合适。
利用主因子分析法提取2个主因子,用最大方差旋转进行简化,得到因子载荷矩阵(见下表),它代表变量和公因子的相关系数:
表3
由表1 载荷矩阵可得出以下结论:
(1)第1 主成分,为主要消费因子,在食品、居住、交通和通讯、家庭设备用品、服务娱乐教育文化服务和其他商品与服务6个方面有较大的载荷,即该因子综合反映了这6个方面的变动趋势。 因此第1 主因子可以视为代表各地区城市居民在这6个方面的消费指标,可命名为生活必需型因素。
(2)第2 主成分,为次要消费因子,在衣着、医疗保健有较大的载荷,所以第2 主因子可视为各地区城市居民在这2方面的消费指标,可命名为生存型因素。如受此影响的地区多为北方省市,可分析为气候因素的影响。
从二维的旋转空间的成分图可以明显的看到各个消费要素间的类属关系,可以看到主消费因子和次消费因子非常靠近两个因子的坐标轴,表明用两个因子刻画消费要素效果非常好,信息丢失较少,达到了我们综合消费要素,减少解释变量的目的,使得提前的因子含义清晰,有利于我们对消费要素进行归类进行分析解释:
表4
2个因子能解释的方差分别为5.640(70.494 %),1.155(14.440 %),因此这2个主因子能说明总情况的84.935%。8个变量标准化后(不受各变量的不同量纲的影响),最后各变量X1~X8相对应的共性值之和分别为0.916,0.854,0.744,0.783,0.843,0.892,0.926,0.835,除居住外均大于0.75,所以这些变量对各地区城市居民消费结构的分析具有很强的说服力。
根据标准化数据,分别计算各地区城市主要、次要消费因子得分,以各因子方差贡献率作权重进行加权汇总,得出各地区居民消费水平综合评价得分并排名,表中因子得分情况及其正负仅表示该省市与平均水平的相对位置,并不说明该省市的居民消费发展水平为负。
综合评价排名V=0.704 * F1+0.144 * F2
2.1.2.1我国区域居民消费水平排序及解释(由于篇幅限制,在这里只列取前10位)
表5:全国各省市居民消费因子得分及排名表
地区 |
F得分 |
F1排名 |
F2得分 |
F2排名 |
综合得分 |
综合排名 |
|
上海 |
3.34231 |
1 |
0.44751 |
7 |
2.42 |
1 |
|
广东 |
2.23941 |
2 |
-0.75061 |
9 |
1.47 |
2 |
|
北京 |
1.32859 |
4 |
2.06475 |
1 |
1.23 |
3 |
|
浙江 |
1.35439 |
3 |
0.58846 |
6 |
1.04 |
4 |
|
福建 |
1.13345 |
5 |
-0.98121 |
10 |
0.66 |
5 |
|
天津 |
0.69190 |
6 |
1.05934 |
2 |
0.64 |
6 |
|
江苏 |
0.59168 |
7 |
-0.05948 |
8 |
0.41 |
7 |
|
辽宁 |
-0.02806 |
8 |
0.61654 |
5 |
0.07 |
8 |
|
山东 |
-0.17779 |
9 |
0.84007 |
4 |
0.00 |
9 |
|
重庆 |
-0.19444 |
10 |
0.88520 |
3 |
-0.01 |
10 |
|
类别 |
地区 |
第一类 高消费水平 |
北京、上海、广东、浙江 |
第二类 中等消费水平 |
天津、江苏、福建、重庆、辽宁、山东、内蒙古 |
第三类 低消费水平 |
安徽、江西、湖北、湖南、四川、贵州、陕西、甘肃、青海、河北、山西、吉林、黑龙江、河南、宁夏、新疆、广西、海南、云南、西藏 |