整个环节是一体的一个过程,学术容不得造假的,所以自己得亲自体验啊,一元线性回归其实在实际中并不多见,如农业的年份和产量之类可能存在;在试验研究中的某个环节相对来说较多,比如吸光度和浓度的关系等,所以你首先得明确方向,你要做哪一方面的论文。
硕士论/文。可以交给我来写
课题不是很难,之前遇见过,可,。,解决
第一节 一元线性回归方程的显著性检验由上面的讨论知,对于任何的两个变量x和Y的一组观测数据( )(i=1,2,……,n)按公式(10)和(11)都可以确定一个回归方程 然而事前并不知道Y和x之间是否存在线性关系,如果两个变量Y和x之间并不存在显著的线性相关关系,那么这样确定的回归方程显然是毫无实际意义的.因此,我们首先要判断Y和x是否线性相关,也就是要来检验线性假设 是否可信,显然,如果Y和x之间无线性关系,则线性模型的一次项系数 =0;否则 0.所以检验两个变量之间是否存在线性相关关系,归根到底是要检验假设 根据现行假设对数据所提的要求可知,观察值 , ,…… 之间的差异,是有两个方面的原因引起的:(1)自变量x的值不相同;(2)其它因素的影响,检验 是否成立的问题,也就是检验这两方面的影响哪一个是主要的问题.因此,就必须把他们引起的差异从Y的总的差异中分解出来.也就是说,为了选择适当的检验统计量,先导出离差平方和的分解因式.[6]一、离差平方和的分解公式观察值 (i=1,2,……,n),与其平均值 的离差平方和,称为总的离差平方和,记作 因为 = 其中:=2 =2 =2 =2 所以= 由于 中的 , 为(10)和(11)所确定.即它们满足正规方程组(9)的解.因此定义项= 于是得到了总离差平方和的分解公式: 其中(19)是回归直线 上横坐标为 的点的纵坐标,并且 的平均值为 , 是 这n个数的偏差平方和,它描述了 的离散程度,还说明它是来源于 的分散性,并且是通过x对于Y的线性影响而反映出来的,所以, 称为回归平方和而 = 它正是前面讨论的 的最小值,在假设(1)式的条件下它是由不可观察的随机变量 引起的,也就是说,它是由其它未控制的因素及试验误差引起的,它的大小反映了其它因素以及试验误差对实验结果得影响.我们称 为剩余平方和或残差平方和.[7]二、 、 的性质及其分布由以上分析可知,要解决判断Y和x之间是否存在线性相关关系的问题,需要通过比较回归平方和和剩余平方和来实现.为了更清楚地说明这一点,并寻求出检验统计量,考察估计量 , 的性质及其分布.(一) 的分布 由(14)式可知= 在 相互独立且服从同一分布 的假定下由(2)知 , ,…… 是P个相互独立的随机变量,且 (i=1,2,……,n)所以他们的平均值 的数学期望为:因为 是 的线性函数,且有:这说明 是 的无偏估计量且 的方差为所以 即: 同样可证,对于任意给定的 其对应的回归值 (它是 的点估计)适合( , (二) 方差 的估计及分布因为 = = = 由 、 及 可得 = 又由于 及E(L),E(U)得=E(L)+E(U) =(n-2) 从而,说明了 = = 是 的无偏估计量,由此可见,不论假设 成立与否, 是 的一个无偏估计量,而 仅当假设成立时,才是 的一个无偏估计量,否则它的期望值大于 .说明比值 (20)在假设成立时有偏大倾向,也就是说,如果F取得值相当大,则没有理由认为x和Y之间有线性相关关系,也就是下面我们将采用F作为检验统计量的原因.另外,由于 , 是 的最小二乘估计,由(8)式可知=0 , =0这表明 中的n个变量 , …… 之间有两个独立的线性约束条件,
最好有以下几块东西1、选定研究对象(确定被解释变量,说明选题的意义和原因等。)2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变量的影响方向。( 作出相应的说明 )3、确定理论模型或函数式(根据相应的理论和经济关系设立模型形式,并提出假设,系数是正的还是负的等。)(二)数据的收集和整理(三)数据处理和回归分析(先观察数据的特点,观看和输出散点图,最后选择相应的变量关系式进行OLS回归,并输出会归结果。)(四)回归结果分析和检验(写出模型估计的结果)1、回归结果的经济理论检验,方向正确否?理论一致否?2、统计检验,t检验 F 检验 R2— 拟合优度检验3、模型设定形式正确否?可试试其他形式。4、模型的稳定性检验。(五)模型的修正(对所发现的模型变量选择问题、设定偏误、模型不稳定等,进行修正。)(六)确定模型(七)预测
多元线性回归模型表示一种地理现象与另外多种地理现象的依存关系,这时另外多种地理现象共同对一种地理现象产生影响,作为影响其分布与发展的重要因素。设变量Y与变量X1,X2,…,Xm存在着线性回归关系,它的n个样本观测值为Yj,Xj1,Xj2,…Xjm�(j=1,2,n),于是多元线性回归的数学模型可以写为:可采用最小二乘法对上式中的待估回归系数β0,β1,…,βm进行估计,求得β值后,即可利用多元线性回归模型进行预测了。计算了多元线性回归方程之后,为了将它用于解决实际预测问题,还必须进行数学检验。多元线性回归分析的数学检验,包括回归方程和回归系数的显著性检验。回归方程的显著性检验,采用统计量:式中: ,为回归平方和,其自由度为m; ,为剩余平方和,其自由度为(n-m-1)。利用上式计算出F值后,再利用F分布表进行检验。给定显著性水平α,在F分布表中查出自由度为m和(n-m-1)的值Fα,如果F≥Fα,则说明Y与X1,X2,…,Xm的线性相关密切;反之,则说明两者线性关系不密切。回归系数的显著性检验,采用统计量:式中,Cii为相关矩阵C=A-1的对角线上的元素。对于给定的置信水平α,查F分布表得Fα(n-m-1),若计算值Fi≥Fα,则拒绝原假设,即认为Xi是重要变量,反之,则认为Xi变量可以剔除。多元线性回归模型的精度,可以利用剩余标准差来衡量。S越小,则用回归方程预测Y越精确;反之亦然。
如果不是都线性相关,而且因素又多的话,试试R型因子分析
问题一:多元线性回归分析论文中的回归模型怎么分析 根据R方最大的那个来处理。(南心网 SPSS多元线性回归分析) 问题二:谁能给我列一下多元线性回归分析的步骤,这里正在写论文,第一部分是研究方法,多谢 10分 选题是论文写作关键的第一步,直接关系论文的质量。常言说:“题好文一半”。对于临床护理人员来说,选择论文题目要注意以下几点:(1)要结合学习与工作实际,根据自己所熟悉的专业和研究兴趣,适当选择有理论和实践意义的课题;(2)论文写作选题宜小不宜大,只要在学术的某一领域或某一点上,有自己的一得之见,或成功的经验.或失败的教训,或新的观点和认识,言之有物,读之有益,就可以作为选题;(3)论文写作选题时要查看文献资料,既可了解别人对这个问题的研究达到什么程度,也可以借鉴人家对这个问题的研究成果。 需要指出,论文写作选题与论文的标题既有关系又不是一回事。标题是在选题基础上拟定的,是选题的高度概括,但选题及写作不应受标题的限制,有时在写作过程中,选题未变,标题却几经修改变动。 问题三:用SPSS做多元线性回归,之后得到一些属于表格,该怎样分析这些数据? 200分 你的分析结果没能通过T检验,这可能是回归假设不满足导致的,需要进一步对数据进行验证,有问题可以私信我。 问题四:过于多元线性回归分析,SPSS操作 典型的多重共线。 多元回归分析中,一定要先进行多重共线检验,如VIF法。 对于存在多重共线的模型,一个办法是逐步回归,如你做的,但结果的删除变量太多,所以,这种方法效果不好。 此外,还有其它办法,如岭回归,主成分回归,这些方法都保留原始变量。 问题五:硕士毕业论文中做多元线性回归的实证分析,该怎么做 多元线性,回归,的实证分析 问题六:用SPSS做多元回归分析得出的指标结果怎么分析啊? 表一的r值是复相关系数,r方是决定系数,r方表示你的模型可以解释百分之多少的你的因变量,比如你的例子里就是可以解释你的因变量的百分之八十。很高了。表二的sig是指你的回归可不可信,你的sig是0。000,说明在的水平上你的模型显著回归,方程具有统计学意义。表三的sig值表示各个变量在方程中是否和因变量有线性关系,sig越大,统计意义越不显著,你的都小于,从回归意义上说,你这个模型还蛮好的。vif是检验多重共线性的,你的vif有一点大,说明多重共线性比较明显,可以用岭回归或者主成分回归消除共线性。你要是愿意改小,应该也没关系。 ppv课,大数据培训专家,随时随地为你充电,来ppv看看学习视频,助你成就职场之路。更有精品学习心得和你分享哦。 问题七:如何对数据进行多元线性回归分析? 5分 对数据进行多元线性回归分析方法有很多,除了用pss ,可以用Excel的数据分析模块,也可以用Matlab的用regress()函数拟合。你可以把数据发到我的企鹅邮箱,邮箱名为百度名。 问题八:经济类论文 多元线性回归 变量取对数 40分 文 多元线性回归 变量取对数 知道更多 多了解
实验三 多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。【实验内容】建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为: 。其中,L、K分别为生产过程中投入的劳动与资金,时间变量 反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。表3-1 我国国有独立核算工业企业统计资料年份 时间 工业总产值Y(亿元) 职工人数L(万人) 固定资产K(亿元)1978 1 3139 2 3208 3 3334 4 3488 5 3582 6 3632 7 3669 8 3815 9 3955 10 4086 11 4229 12 4273 13 4364 14 4472 15 4521 16 4498 17 4545 资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、建立多元线性回归模型一建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:⒈建立工作文件: CREATE A 78 94⒉输入统计资料: DATA Y L K⒊生成时间变量 : GENR T=@TREND(77)⒋建立回归模型: LS Y C T L K则生产函数的估计结果及有关信息如图3-1所示。 图3-1 我国国有独立核算工业企业生产函数的估计结果因此,我国国有独立工业企业的生产函数为: (模型1) =() () () () 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为,资金的边际产出为,技术进步的影响使工业总产值平均每年递增亿元。回归系数的符号和数值是较为合理的。 ,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量 对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的 统计量值为,表明资金对企业产出的影响是显著的。但是,模型中其他变量(包括常数项)的 统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除 统计量最小的变量(即时间变量)而重新建立模型。二建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K则生产函数的估计结果及有关信息如图3-2所示。 图3-2 剔除时间变量后的估计结果因此,我国国有独立工业企业的生产函数为: (模型2) =() () () 从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为,资金的边际产出为,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的 检验值都比较大,显著性概率都小于,因此模型2较模型1更为合理。三建立非线性回归模型——C-D生产函数。C-D生产函数为: ,对于此类非线性函数,可以采用以下两种方式建立模型。方式1:转化成线性模型进行估计;在模型两端同时取对数,得: 在EViews软件的命令窗口中依次键入以下命令:GENR LNY=log(Y)GENR LNL=log(L)GENR LNK=log(K)LS LNY C LNL LNK则估计结果如图3-3所示。 图3-3 线性变换后的C-D生产函数估计结果即可得到C-D生产函数的估计式为: (模型3) = () () () 即: 从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且拟合优度较模型2还略有提高,解释变量都通过了显著性检验。方式2:迭代估计非线性模型,迭代过程中可以作如下控制:⑴在工作文件窗口中双击序列C,输入参数的初始值;⑵在方程描述框中点击Options,输入精度控制值。控制过程:①参数初值:0,0,0;迭代精度:10-3;则生产函数的估计结果如图3-4所示。 图3-4 生产函数估计结果此时,函数表达式为: (模型4) =()(-)() 可以看出,模型4中劳动力弹性 =,资金的产出弹性 =,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。②参数初值:0,0,0;迭代精度:10-5; 图3-5 生产函数估计结果从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。③参数初值:0,0,0;迭代精度:10-5,迭代次数1000; 图3-6 生产函数估计结果此时,迭代953次后收敛,函数表达式为: (模型5) =()()() 从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理, ,具有很高的拟合优度,解释变量都通过了显著性检验。将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。④参数初值:1,1,1;迭代精度:10-5,迭代次数100; 图3-7 生产函数估计结果此时,迭代14次后收敛,估计结果与模型5相同。比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度快;反之,则收敛速度慢甚至发散。因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。二、比较、选择最佳模型估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型:一回归系数的符号及数值是否合理;二模型的更改是否提高了拟合优度;三模型中各个解释变量是否显著;四残差分布情况以上比较模型的一、二、三步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。分别在模型1~模型5的各方程窗口中点击View/Actual, Fitted, Residual/ Actual, Fitted, Residual Table(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。模型1的各期残差中大多数都落在 的虚线框内,且残差分别不存在明显的规律性。但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。模型2、模型3、模型5都具有合理的经济意义,都通过了 检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。最后将模型2与模型3比较发现,模型3的近期预测误差略小,拟合优度比模型2略有提高,因此可以选择模型2为我国国有工业企业生产函数。 图3-8 回归方程的残差分析 图3-9 模型1的残差分布图3-10 模型2的残差分布图3-11 模型3的残差分布图3-12 模型4的残差分布图3-13 模型5的残差分布
最好有以下几块东西1、选定研究对象(确定被解释变量,说明选题的意义和原因等。)2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变量的影响方向。( 作出相应的说明 )3、确定理论模型或函数式(根据相应的理论和经济关系设立模型形式,并提出假设,系数是正的还是负的等。)(二)数据的收集和整理(三)数据处理和回归分析(先观察数据的特点,观看和输出散点图,最后选择相应的变量关系式进行OLS回归,并输出会归结果。)(四)回归结果分析和检验(写出模型估计的结果)1、回归结果的经济理论检验,方向正确否?理论一致否?2、统计检验,t检验 F 检验 R2— 拟合优度检验3、模型设定形式正确否?可试试其他形式。4、模型的稳定性检验。(五)模型的修正(对所发现的模型变量选择问题、设定偏误、模型不稳定等,进行修正。)(六)确定模型(七)预测
第一节 一元线性回归方程的显著性检验由上面的讨论知,对于任何的两个变量x和Y的一组观测数据( )(i=1,2,……,n)按公式(10)和(11)都可以确定一个回归方程 然而事前并不知道Y和x之间是否存在线性关系,如果两个变量Y和x之间并不存在显著的线性相关关系,那么这样确定的回归方程显然是毫无实际意义的.因此,我们首先要判断Y和x是否线性相关,也就是要来检验线性假设 是否可信,显然,如果Y和x之间无线性关系,则线性模型的一次项系数 =0;否则 0.所以检验两个变量之间是否存在线性相关关系,归根到底是要检验假设 根据现行假设对数据所提的要求可知,观察值 , ,…… 之间的差异,是有两个方面的原因引起的:(1)自变量x的值不相同;(2)其它因素的影响,检验 是否成立的问题,也就是检验这两方面的影响哪一个是主要的问题.因此,就必须把他们引起的差异从Y的总的差异中分解出来.也就是说,为了选择适当的检验统计量,先导出离差平方和的分解因式.[6]一、离差平方和的分解公式观察值 (i=1,2,……,n),与其平均值 的离差平方和,称为总的离差平方和,记作 因为 = 其中:=2 =2 =2 =2 所以= 由于 中的 , 为(10)和(11)所确定.即它们满足正规方程组(9)的解.因此定义项= 于是得到了总离差平方和的分解公式: 其中(19)是回归直线 上横坐标为 的点的纵坐标,并且 的平均值为 , 是 这n个数的偏差平方和,它描述了 的离散程度,还说明它是来源于 的分散性,并且是通过x对于Y的线性影响而反映出来的,所以, 称为回归平方和而 = 它正是前面讨论的 的最小值,在假设(1)式的条件下它是由不可观察的随机变量 引起的,也就是说,它是由其它未控制的因素及试验误差引起的,它的大小反映了其它因素以及试验误差对实验结果得影响.我们称 为剩余平方和或残差平方和.[7]二、 、 的性质及其分布由以上分析可知,要解决判断Y和x之间是否存在线性相关关系的问题,需要通过比较回归平方和和剩余平方和来实现.为了更清楚地说明这一点,并寻求出检验统计量,考察估计量 , 的性质及其分布.(一) 的分布 由(14)式可知= 在 相互独立且服从同一分布 的假定下由(2)知 , ,…… 是P个相互独立的随机变量,且 (i=1,2,……,n)所以他们的平均值 的数学期望为:因为 是 的线性函数,且有:这说明 是 的无偏估计量且 的方差为所以 即: 同样可证,对于任意给定的 其对应的回归值 (它是 的点估计)适合( , (二) 方差 的估计及分布因为 = = = 由 、 及 可得 = 又由于 及E(L),E(U)得=E(L)+E(U) =(n-2) 从而,说明了 = = 是 的无偏估计量,由此可见,不论假设 成立与否, 是 的一个无偏估计量,而 仅当假设成立时,才是 的一个无偏估计量,否则它的期望值大于 .说明比值 (20)在假设成立时有偏大倾向,也就是说,如果F取得值相当大,则没有理由认为x和Y之间有线性相关关系,也就是下面我们将采用F作为检验统计量的原因.另外,由于 , 是 的最小二乘估计,由(8)式可知=0 , =0这表明 中的n个变量 , …… 之间有两个独立的线性约束条件,
1、论点(证明什么)论点应该是作者看法的完整表述,在形式上是个完整的简洁明确的句子。从全文看,它必能统摄全文。表述形式往往是个表示肯定或否定的判断句,是明确的表态性的句子。A.把握文章的论点。 中心论点只有一个(统率分论点)⑴明确:分论点可以有N个(补充和证明中心论点)⑵方法①从位置上找:如标题、开篇、中间、结尾。②分析文章的论据。(可用于检验预想的论点是否恰当)③摘录法(只有分论点,而无中心论点)B.分析论点是怎样提出的:①摆事实讲道理后归结论点;②开门见山,提出中心论点;③针对生活中存在的现象,提出论题,通过分析论述,归结出中心论点;④叙述作者的一段经历后,归结出中心论点;⑤作者从故事中提出问题,然后一步步分析推论,最后得出结论,提出中心论点。2、论据(用什么证明)⑴论据的类型:①事实论据(举例后要总结,概述论据要紧扣论点);②道理论据(引用名言要分析)。⑵论据要真实、可靠,典型(学科、国别、古今等)。⑶次序安排(照应论点);⑷判断论据能否证明论点;⑸补充论据(要能证明论点)。3、论证(怎样证明)⑴论证方法 (须为四个字)①举例论证(例证法)事实论据记叙②道理论证(引证法和说理)道理论据 议论③对比论证(其本身也可以是举例论证和道理论证)④比喻论证 比喻在说明文中为打比方,散文中为比喻。⑵分析论证过程:①论点是怎样提出的;②论点是怎样被证明的(用了哪些道理和事实,是否有正反两面的分析说理);③联系全文的结构,是否有总结。⑶论证的完整性(答:使论证更加全面完整,避免产生误解)⑷分析论证的作用:证明该段的论点。4、议论文的结构⑴一般形式:①引论(提出问题)―――②本论(分析问题)―――③结论(解决问题)。⑵类型:①并列式②总分总式③总分式④分总式⑤递进式。6、驳论文的阅读⑴作者要批驳的错误观点是什么?⑵作者是怎样进行批驳的,用了哪些道理和论据;⑶由此,作者树立的正确的观点是什么?7、常见考点①、议论文的论点考点:第一,分清所议论的问题及针对这个问题作者所持的看法(即分清论题和论点)。第二,注意论点在文中的位置:(1)在文章的开头,这就是所谓开宗明义、开门见山的写法。(2)在文章结尾,就是所谓归纳全文,篇末点题,揭示中心的写法。这种写法在明确表达论点时大多有。所以,总之,因此,总而言之,归根结底等总结性的词语。第三、分清中心论点和分论点:分论一般位于段首或有标志性词语:首先、其次、第三等第四、要注意论点的表述形式:有时题目就是中心论点。一篇议论文只有一个中心论点。第五、通过论据来反推论点:论据是为证明论点服务的,分析论据可以看出它证明什么,肯定什么,支持什么,这就是论点。②、议论文的论据考点:论据是论点立足的根据,一般全为事实论据和道理论据。1、用事实作论据。事例必须真实可靠,有典型意义,能揭示事物本质并与论点有一定的逻辑联系。议论文中,对所举事例的叙述要简明扼要,突出与论点有直接关系的部分。明确论据时,不仅要知道文中哪些地方用了事实论据,还要会概括事实论据。概括时,要做到准确,必须依据论点将论据本质特点把握住,然后用确切的语言进行表述。 2、用作论据的言论,应有一定的权威性,直接引用时要原文照录,以真核对,不能断章取义;间接引用时不能曲解原意。③、议论文的结构、层次考点:结构有:并列式结构、对照式结构、层进式结构、总分式结构。此考点的基本形式:作者如何证明论点的?
1、多元线性回归的理论主体。2、多元线性回归模型的标准形式,多元线性回归模型的参数估计。3、多元线性回归模型的检验和预测原理。
我过能源,消耗量我知道,多员线性回归,我肯定好比
1、多元线性回归的理论主体。2、多元线性回归模型的标准形式,多元线性回归模型的参数估计。3、多元线性回归模型的检验和预测原理。
实验三 多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。【实验内容】建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为: 。其中,L、K分别为生产过程中投入的劳动与资金,时间变量 反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。表3-1 我国国有独立核算工业企业统计资料年份 时间 工业总产值Y(亿元) 职工人数L(万人) 固定资产K(亿元)1978 1 3139 2 3208 3 3334 4 3488 5 3582 6 3632 7 3669 8 3815 9 3955 10 4086 11 4229 12 4273 13 4364 14 4472 15 4521 16 4498 17 4545 资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、建立多元线性回归模型一建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:⒈建立工作文件: CREATE A 78 94⒉输入统计资料: DATA Y L K⒊生成时间变量 : GENR T=@TREND(77)⒋建立回归模型: LS Y C T L K则生产函数的估计结果及有关信息如图3-1所示。 图3-1 我国国有独立核算工业企业生产函数的估计结果因此,我国国有独立工业企业的生产函数为: (模型1) =() () () () 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为,资金的边际产出为,技术进步的影响使工业总产值平均每年递增亿元。回归系数的符号和数值是较为合理的。 ,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量 对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的 统计量值为,表明资金对企业产出的影响是显著的。但是,模型中其他变量(包括常数项)的 统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除 统计量最小的变量(即时间变量)而重新建立模型。二建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K则生产函数的估计结果及有关信息如图3-2所示。 图3-2 剔除时间变量后的估计结果因此,我国国有独立工业企业的生产函数为: (模型2) =() () () 从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为,资金的边际产出为,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的 检验值都比较大,显著性概率都小于,因此模型2较模型1更为合理。三建立非线性回归模型——C-D生产函数。C-D生产函数为: ,对于此类非线性函数,可以采用以下两种方式建立模型。方式1:转化成线性模型进行估计;在模型两端同时取对数,得: 在EViews软件的命令窗口中依次键入以下命令:GENR LNY=log(Y)GENR LNL=log(L)GENR LNK=log(K)LS LNY C LNL LNK则估计结果如图3-3所示。 图3-3 线性变换后的C-D生产函数估计结果即可得到C-D生产函数的估计式为: (模型3) = () () () 即: 从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且拟合优度较模型2还略有提高,解释变量都通过了显著性检验。方式2:迭代估计非线性模型,迭代过程中可以作如下控制:⑴在工作文件窗口中双击序列C,输入参数的初始值;⑵在方程描述框中点击Options,输入精度控制值。控制过程:①参数初值:0,0,0;迭代精度:10-3;则生产函数的估计结果如图3-4所示。 图3-4 生产函数估计结果此时,函数表达式为: (模型4) =()(-)() 可以看出,模型4中劳动力弹性 =,资金的产出弹性 =,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。②参数初值:0,0,0;迭代精度:10-5; 图3-5 生产函数估计结果从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。③参数初值:0,0,0;迭代精度:10-5,迭代次数1000; 图3-6 生产函数估计结果此时,迭代953次后收敛,函数表达式为: (模型5) =()()() 从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理, ,具有很高的拟合优度,解释变量都通过了显著性检验。将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。④参数初值:1,1,1;迭代精度:10-5,迭代次数100; 图3-7 生产函数估计结果此时,迭代14次后收敛,估计结果与模型5相同。比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度快;反之,则收敛速度慢甚至发散。因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。二、比较、选择最佳模型估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型:一回归系数的符号及数值是否合理;二模型的更改是否提高了拟合优度;三模型中各个解释变量是否显著;四残差分布情况以上比较模型的一、二、三步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。分别在模型1~模型5的各方程窗口中点击View/Actual, Fitted, Residual/ Actual, Fitted, Residual Table(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。模型1的各期残差中大多数都落在 的虚线框内,且残差分别不存在明显的规律性。但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。模型2、模型3、模型5都具有合理的经济意义,都通过了 检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。最后将模型2与模型3比较发现,模型3的近期预测误差略小,拟合优度比模型2略有提高,因此可以选择模型2为我国国有工业企业生产函数。 图3-8 回归方程的残差分析 图3-9 模型1的残差分布图3-10 模型2的残差分布图3-11 模型3的残差分布图3-12 模型4的残差分布图3-13 模型5的残差分布