Lindahellokitty
实验三 多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。【实验内容】建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为: 。其中,L、K分别为生产过程中投入的劳动与资金,时间变量 反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。表3-1 我国国有独立核算工业企业统计资料年份 时间 工业总产值Y(亿元) 职工人数L(万人) 固定资产K(亿元)1978 1 3289.18 3139 2225.701979 2 3581.26 3208 2376.341980 3 3782.17 3334 2522.811981 4 3877.86 3488 2700.901982 5 4151.25 3582 2902.191983 6 4541.05 3632 3141.761984 7 4946.11 3669 3350.951985 8 5586.14 3815 3835.791986 9 5931.36 3955 4302.251987 10 6601.60 4086 4786.051988 11 7434.06 4229 5251.901989 12 7721.01 4273 5808.711990 13 7949.55 4364 6365.791991 14 8634.80 4472 7071.351992 15 9705.52 4521 7757.251993 16 10261.65 4498 8628.771994 17 10928.66 4545 9374.34资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、建立多元线性回归模型一建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:⒈建立工作文件: CREATE A 78 94⒉输入统计资料: DATA Y L K⒊生成时间变量 : GENR T=@TREND(77)⒋建立回归模型: LS Y C T L K则生产函数的估计结果及有关信息如图3-1所示。 图3-1 我国国有独立核算工业企业生产函数的估计结果因此,我国国有独立工业企业的生产函数为: (模型1) =(-0.252) (0.672) (0.781) (7.433) 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。回归系数的符号和数值是较为合理的。 ,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量 对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的 统计量值为7.433,表明资金对企业产出的影响是显著的。但是,模型中其他变量(包括常数项)的 统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除 统计量最小的变量(即时间变量)而重新建立模型。二建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K则生产函数的估计结果及有关信息如图3-2所示。 图3-2 剔除时间变量后的估计结果因此,我国国有独立工业企业的生产函数为: (模型2) =(-2.922) (4.427) (14.533) 从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为1.2085,资金的边际产出为0.8345,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的 检验值都比较大,显著性概率都小于0.05,因此模型2较模型1更为合理。三建立非线性回归模型——C-D生产函数。C-D生产函数为: ,对于此类非线性函数,可以采用以下两种方式建立模型。方式1:转化成线性模型进行估计;在模型两端同时取对数,得: 在EViews软件的命令窗口中依次键入以下命令:GENR LNY=log(Y)GENR LNL=log(L)GENR LNK=log(K)LS LNY C LNL LNK则估计结果如图3-3所示。 图3-3 线性变换后的C-D生产函数估计结果即可得到C-D生产函数的估计式为: (模型3) = (-1.172) (2.217) (9.310) 即: 从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且拟合优度较模型2还略有提高,解释变量都通过了显著性检验。方式2:迭代估计非线性模型,迭代过程中可以作如下控制:⑴在工作文件窗口中双击序列C,输入参数的初始值;⑵在方程描述框中点击Options,输入精度控制值。控制过程:①参数初值:0,0,0;迭代精度:10-3;则生产函数的估计结果如图3-4所示。 图3-4 生产函数估计结果此时,函数表达式为: (模型4) =(0.313)(-2.023)(8.647) 可以看出,模型4中劳动力弹性 =-1.01161,资金的产出弹性 =1.0317,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。②参数初值:0,0,0;迭代精度:10-5; 图3-5 生产函数估计结果从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。③参数初值:0,0,0;迭代精度:10-5,迭代次数1000; 图3-6 生产函数估计结果此时,迭代953次后收敛,函数表达式为: (模型5) =(0.581)(2.267)(10.486) 从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理, ,具有很高的拟合优度,解释变量都通过了显著性检验。将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。④参数初值:1,1,1;迭代精度:10-5,迭代次数100; 图3-7 生产函数估计结果此时,迭代14次后收敛,估计结果与模型5相同。比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度快;反之,则收敛速度慢甚至发散。因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。二、比较、选择最佳模型估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型:一回归系数的符号及数值是否合理;二模型的更改是否提高了拟合优度;三模型中各个解释变量是否显著;四残差分布情况以上比较模型的一、二、三步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。分别在模型1~模型5的各方程窗口中点击View/Actual, Fitted, Residual/ Actual, Fitted, Residual Table(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。模型1的各期残差中大多数都落在 的虚线框内,且残差分别不存在明显的规律性。但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。模型2、模型3、模型5都具有合理的经济意义,都通过了 检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。最后将模型2与模型3比较发现,模型3的近期预测误差略小,拟合优度比模型2略有提高,因此可以选择模型2为我国国有工业企业生产函数。 图3-8 回归方程的残差分析 图3-9 模型1的残差分布图3-10 模型2的残差分布图3-11 模型3的残差分布图3-12 模型4的残差分布图3-13 模型5的残差分布
苏州齐惠壮士
第十五章 SPSS回归分析与市场预测市场营销活动中常常要用到市场预测。市场预测就是运用科学的方法,对影响市场供求变化的诸因素进行调查研究,分析和预见其发展趋势,掌握市场供求变化的规律,为经营决策提供可靠的依据。预测的目的是为了提高管理的科学水平,减少盲目的决策,通过预测来把握经济发展或者未来市场变化的有关动态,减少未来的不确定性,降低决策可能遇到的风险,进而使决策目标得以顺利实现。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数学模型,以便从一个已知量来推断另一个未知量。15.1 回归分析概述相关回归分析预测法,是在分析市场现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量在预测期变化结果的预测方法。根据市场现象所存在的相关关系,对它进行定量分析,从而达到对市场现象进行预测的目的,就是相关回归分析市场预测法。相关回归分析市场预测法的种类:根据相关关系中自变量不同分类,有以下几种主要类型:1、一元相关回归分析市场预测法,也称简单相关回归分析市场预测法。它是用相关回归分析法对一个自变量与一个因变量之间的相关关系进行分析,建立一元回归方程作为预测模型,对市场现象进行预测的方法。2、多元相关回归市场预测法,也称复相关回归分析市场预测法。它是用相关分析法对多个自变量与一个因变量之间的相关关系进行分析,建立多元回归方程作为预测模型,对市场现象进行预测的方法。回归模型的建立步骤:1)做出散点图,观察变量间的趋势。如果是多个变量,则还应当做出散点图矩阵、重叠散点图和三维散点图。2)考察数据的分布,进行必要的预处理。即分析变量的正态性、方差齐等问题。并确定是否可以直接进行线性回归分析。如果进行了变量变换,则应当重新绘制散点图,以确保线性趋势在变换后任然存在。3)进行直接先行回归,包括变量的初筛、变量选择方法的确定等。4)残差分析。这是模型拟合完毕后模型诊断过程的第一步,主要分析两大方面:残差间是否独立;残差分布是否为正态。5)强影响点的诊断及多重共线性问题的判断。这两个步骤和残差分析往往混在一起,难以完全分出先后。15.2 回归分析熟练使用SPSS中的回归分析过程,对大量样本进行有效的回归分析,并根据回归分析的结果对市场行为进行预测。在市场营销中我们可以根据回归方程判断顾客的满意度、商品的业务量以及他们的相关关系等。进行简单回归分析对数据也有一定的要求,这里给出的是基本适用条件:1)线性趋势:自变量与因变量的关系是线性的,如果不是,则不能采用线性回归来分析。这可以通过散点图来加以判断。2)独立性:可表述为因变量y的取值相互独立,之间没有联系。反应到模型中,实际上就是要求残差间相互独立,不存在自相关,否则应当采用自回归模型来分析。3)正态性:就自变量的任何一个线性组合,因变量y均服从正太分布,反映到模型中,实际上就是要求残差服从正太分布。4)方差齐性:就自变量的任何一个线性组合,因变量y的方差均相同,实质就是要求残差的方差齐性。15.2.1 案例一问题要对中国电信业务总量的影响因素进行计量模型的分析,我们可以对1991年—1999年电信业务总量、邮政业务总量、中国人口数、市镇人口数、人均GDP以及人均消费水平这六个指标进行回归并对市场进行预测。根据回归的结果我们可以得出回归方程,根据回归方程利用往期的数据可以对电信业务总量进行预测。15.2.2 案例一操作打开SPSS 20.0,在其窗口中选择菜单【文件】→ 【打开】→ 【数据】,打开(文件名称:Book\第十五章\中国电信业务总量.sav)数据表,文件包括年份(定序尺度)、电信业务总量、邮政业务总量等7个变量(定距尺度)。选择【分析】→ 【回归】→【线性】,打开线性回归分析对话框。在左侧变量框中选择“电信业务总量变量”将其移动到因变量列表下的方格中,将因素变量“邮政业务总量、中国人口数、市镇人口比重、人均GDP、人均消费水平”移动到自变量下的方格中,如图15-1所示。图15-1 “线性回归”对话框方法(M)下拉框中设置解释变量进入模型的方法:1)进入:将所有变量全部引入模型中2)逐步:每一次按照向前筛选法的标准引入变量后,都要按照向后筛选法的标准对已经引入的所有变量进行检验,剔除掉由于新变量的引入而变得不再显著的变量。3)删除:建立模型时,根据设定的条件剔除部分解释变量。4)向前:与被解释变量有最大相关的变量首先进入方程,如果该解释变量没有通过 F 检验,则变量筛选过程结束,方程中没有引入任何变量;如果通过 F 检验,则在剩余的变量中寻找具有最大偏相关系数的变量,将其引入方程,并再次进行 F 检验,如果通过检验,则保留该变量在模型中,并继续寻找下一个候选变量,否则变量筛选过程结束,方程中仅有一个解释变量;依次类推,直至所有满足判据的变量都被引入到模型为止。5)向后:与向前筛选法的顺序相反,向后筛选法首先将所有变量都引入模型,然后剔除最不显著的变量。如果剩余变量都通过显著性检验,则变量筛选过程结束;否则按同样的标准继续剔除不显著的变量,直至剩余的解释变量都满足显著性检验为止。单击“统计量”按钮,弹出“统计量”子对话框,该对话框用于设置要输出的统计量。估计:输出有关回归系数的统计量,包括回归系数、回归系数的标准差、标准化的回归系数、t统计量及其对应的p值;模型拟合度:输出可决系数、调整的可决系数、回归方程的标准误差、回归方程F检验的方差分析;共线性检验:输出多重共线性分析结果;Durbin-Watson:输出Durbin-Watson检验统计量。在此对话框中选择估计、模型拟合度、共线性诊断,如图15-2所示。图15-2 “线性回归:统计量”子对话框单击“绘制”按钮,弹出绘制子对话框,该对话框主要用于利用图形对残差进行分析。在此选中正态概率图复选框,对残差的正态性进行分析,如图15-3所示。图15-3 “线性回归:图”子对话框单击“保存”按钮,弹出保存子对话框,如图15-4所示,该对话框用于设置将某些有用的分析结果保存到数据文件中,在此选择默认的选项。图15-4 “线性回归:保存”子对话框单击“选项”按钮,弹出选项子对话框,步进方法标准:用于设置解释变量筛选的判定标准;在等式中包含常量:用于设置在模型中是否包含常数项,默认为在模型中包含常数项;缺失值:用于设置缺失值的处理方法。在此选择默认选项,如图15-5所示。图15-5 “线性回归:选项”子对话框单击“继续”按钮,返回线性回归主对话框,单击“确定”按钮,执行现行回归分析命令。得到输出结果。15.2.3 案例一结果分析表15-1给出了解释变量的筛选过程,根据此表,我们可以看出在本例中所有的解释变量均进入进行回归分析。表15-1 解释变量筛选过程模型 输入的变量 移去的变量 方法1 人均消费水平, 市镇人口比重, 邮政业务总量, 中国人口数, 人均GDPb . 输入a. 因变量: 电信业务总量b. 已输入所有请求的变量。表15-2和表15-3给出了回归模型拟合优度评价及方程的方差分析表,根据表15-2得出回归方程的拟合优度调整的R方为0.978,这个R方数值还是比较大的,大致可以认为回归方程有意义。而表15-3是方程的方差分析表,根据此表看一看出回归方程的方差检验对应的p值为0.002小于0.05,说明该模型从整体上看是比较有意义。表15-2 回归模型拟合优度评价模型 R R 方 调整 R 方 标准 估计的误差1 .996a .992 .978 1.47822a. 预测变量: (常量), 人均消费水平, 市镇人口比重, 邮政业务总量, 中国人口数, 人均GDP。b. 因变量: 电信业务总量表15-3 方差分析表模型 平方和 df 均方 F Sig.1 回归 794.319 5 158.864 72.703 .002b残差 6.555 3 2.185 总计 800.874 8 a. 因变量: 电信业务总量b. 预测变量: (常量), 人均消费水平, 市镇人口比重, 邮政业务总量, 中国人口数, 人均GDP。从表15-4可以看出,引入模型的五个解释变量都没有通过t检验。模型整体显著而单个系数均不能通过t检验,这正是解释变量之间存过多重共线性的常见特征。观察表15-4中的容差和方差膨胀因子我们可以看出五个解释变量的容差都很小接近于0,但它们的VIF都很大,这进一步证实了解释变量之间存在严重的多重共线性。1) 容忍度 (Tolerance) :某自变量的容忍度等于1减去以该自变量为反应变量,Independentω 杠中选入的其他自变量为自变量所得到的线性回归模型的决定系数。显然,容忍度越小,多重共线性越严重。有学者提出,容忍度小于 0.1 时,存在严重的多重共线性。2) 方差膨胀因子 (Varianceinflation factor , VIF): 等于容忍度的倒数。显然,VIF 越大,多重共线性问题越大。一般认为VIF不应大于5 ,对应容忍度的标准,也可放宽至不大于10 。3) 特征根 (Eigenvalue) :对模型中常数项及所有自变量计算主成分,如果自变量问存在较强的线性相关关系,则前面的几个主成分数值较大,而后面的几个主成分较小,甚至接近0。4) 条件指数 (ConditionIndex):等于最大的主成分与当前主成分的比值的算术平方根。所以第一个主成分相对应的条件指数总为1。同样,如果几个条件指数较大(如大于30) ,则提示存在多重共线性。表15-4 回归系数估计及其显著性检验系数a模型 非标准化系数 标准系数 t Sig. 共线性统计量B 标准 误差 试用版 容差 VIF1 (常量) -124.504 456.294 -.273 .803 邮政业务总量 35.740 16.047 1.734 2.227 .112 .005 222.177中国人口数 16.970 47.309 .589 .359 .744 .001 987.365市镇人口比重 -300.267 390.878 -.426 -.768 .498 .009 112.937人均GDP -5.317 9.898 -.951 -.537 .628 .001 1149.087人均消费水平 -.270 19.750 -.023 -.014 .990 .001 1057.707a. 因变量: 电信业务总量表15-5给出了方程解释变量的多重共线性诊断结果。从特征根上看,最大的特征根远远大于其他特征根,后 4 个条件指数都大于 10,说明变量之间确实存在多重共线性问题。从方差比例上看,第 5 个特征根解释了人均 GDP 方差的 58%,同时解释了人均消费水平方差的 65%,说明这两个变量之间可能存在多重共线性;第 6 个特征根同时解释了邮政业务总量方差的 77%、人口总数方差的 100%和市镇人口比重方差的60%,说明这 3 个变量之间可能存在多重共线性。表15-5 多重共线性诊断模型 维数 特征值 条件索引 方差比例(常量) 邮政业务总量 中国人口数 市镇人口比重 人均GDP 人均消费水平1 1 5.820 1.000 .00 .00 .00 .00 .00 .002 .174 5.785 .00 .00 .00 .00 .00 .003 .006 31.563 .00 .07 .00 .00 .00 .004 .000 193.583 .00 .01 .00 .02 .22 .325 2.528E-005 479.782 .01 .16 .00 .38 .58 .656 4.476E-007 3606.121 .99 .77 1.00 .60 .20 .02a. 因变量: 电信业务总量为了解决多重共线性带来的问题,可以使用 Backward 法筛选变量。得到结果如下表15-6、表1
VV爱吃007
问题一:多元线性回归分析论文中的回归模型怎么分析 根据R方最大的那个来处理。(南心网 SPSS多元线性回归分析) 问题二:谁能给我列一下多元线性回归分析的步骤,这里正在写论文,第一部分是研究方法,多谢 10分 选题是论文写作关键的第一步,直接关系论文的质量。常言说:“题好文一半”。对于临床护理人员来说,选择论文题目要注意以下几点:(1)要结合学习与工作实际,根据自己所熟悉的专业和研究兴趣,适当选择有理论和实践意义的课题;(2)论文写作选题宜小不宜大,只要在学术的某一领域或某一点上,有自己的一得之见,或成功的经验.或失败的教训,或新的观点和认识,言之有物,读之有益,就可以作为选题;(3)论文写作选题时要查看文献资料,既可了解别人对这个问题的研究达到什么程度,也可以借鉴人家对这个问题的研究成果。 需要指出,论文写作选题与论文的标题既有关系又不是一回事。标题是在选题基础上拟定的,是选题的高度概括,但选题及写作不应受标题的限制,有时在写作过程中,选题未变,标题却几经修改变动。 问题三:用SPSS做多元线性回归,之后得到一些属于表格,该怎样分析这些数据? 200分 你的分析结果没能通过T检验,这可能是回归假设不满足导致的,需要进一步对数据进行验证,有问题可以私信我。 问题四:过于多元线性回归分析,SPSS操作 典型的多重共线。 多元回归分析中,一定要先进行多重共线检验,如VIF法。 对于存在多重共线的模型,一个办法是逐步回归,如你做的,但结果的删除变量太多,所以,这种方法效果不好。 此外,还有其它办法,如岭回归,主成分回归,这些方法都保留原始变量。 问题五:硕士毕业论文中做多元线性回归的实证分析,该怎么做 多元线性,回归,的实证分析 问题六:用SPSS做多元回归分析得出的指标结果怎么分析啊? 表一的r值是复相关系数,r方是决定系数,r方表示你的模型可以解释百分之多少的你的因变量,比如你的例子里就是可以解释你的因变量的百分之八十。很高了。表二的sig是指你的回归可不可信,你的sig是0。000,说明在0.01的水平上你的模型显著回归,方程具有统计学意义。表三的sig值表示各个变量在方程中是否和因变量有线性关系,sig越大,统计意义越不显著,你的都小于0.05,从回归意义上说,你这个模型还蛮好的。vif是检验多重共线性的,你的vif有一点大,说明多重共线性比较明显,可以用岭回归或者主成分回归消除共线性。你要是愿意改小,应该也没关系。 ppv课,大数据培训专家,随时随地为你充电,来ppv看看学习视频,助你成就职场之路。更有精品学习心得和你分享哦。 问题七:如何对数据进行多元线性回归分析? 5分 对数据进行多元线性回归分析方法有很多,除了用pss ,可以用Excel的数据分析模块,也可以用Matlab的用regress()函数拟合。你可以把数据发到我的企鹅邮箱,邮箱名为百度名。 问题八:经济类论文 多元线性回归 变量取对数 40分 文 多元线性回归 变量取对数 知道更多 多了解
最好有以下几块东西1、选定研究对象(确定被解释变量,说明选题的意义和原因等。)2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变
预测未来十年中国经济十大趋势经济国际化、产业高级化、市场深度化成为三大主线站在新中国成立60周年的新起点上,世界都在瞩目中国的复兴之路。新华社经济分析师们经过广
最好有以下几块东西1、选定研究对象(确定被解释变量,说明选题的意义和原因等。)2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变
最好有以下几块东西1、选定研究对象(确定被解释变量,说明选题的意义和原因等。)2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变
一元线性回归很简单~随便看看教材就行了!