月兮月兮
一、什么是数据包络分析DEA
数据包络分析DEA是一种多指标投入和产出评价的研究方法,其应用数学规划模型计算比较决策单元(DMU)之间的相对效率,对评价对象做出评价。比如有10个学校(即10个决策单元DMU,Decision Making Units),每个学校有投入指标(比如学生人均投入资金),也有产出指标(比如学生平均成绩,学生奥数比赛比例等),有的学校投入多,有的学校投入少,但是投入多或少,均会有对应的产出,那么具体哪个学校的投入产出更加优秀呢,诸如此类投入产出的优劣问题,则可使用数据包络DEA模型进行分析。
最常见的DEA模型为CCR和BBC,此两种模型的区别在于是否假定‘规模报酬可变’,其对比如下:
二、数据包络分析DEA案例
1
当前希望对天津市的城市可持续发展情况进行研究,共收集1990~1999共计10年的相关指标数据。具体说明如下表格:
原始数据如下图,从下图来看,从1990~1999年共计10年里面,人均GDP和城市环境质量指数均在逐步提高,单独从产出指标来看说明每年都在提升。但反过来看,3个投入指标却有高有低,那么到底哪些年的投入产出较好,而哪些年的投入产出还有改进空间并不知晓,这正是需要数据包络分析DEA分析寻找的答案。
2
数据包络分析DEA时,首先需要分析综合效益值θ,即首先判断DMU是否有DEA有效,如果有效,则说明该DMU较优,反之说明‘非DEA有效’,即相对来说还有提升空间,那么提升空间具体在哪里呢,比如提高还是减少规模呢,可以通过规模效益分析得到。与此同时,如果是‘非DEA有效’,那么具体问题是什么,投入冗余还是产出不足,则可以通过对应的投入冗余 或产出不足分析表格得出,具体数字直接查看松驰变量即可。如下表所示:
3
本例子操作截图如下:
分别将3个投入指标和2个产出指标放在对应的框中,与此同时,本案例中年份为决策单元DMU,因此放入对应的框中,当然也可以不放入DMU(如果不放入,SPSSAU默认输出为比如第1项,第2项等)。另外,本案例使用默认的BBC(VRS)模型进行分析。
4
如果是BBC模型时,SPSSAU共输出6个表格和1个图。分别如下:
如果是CCR模型时,SPSSAU共输出4个表格【无规模报酬相关的表格】和1个图。分别如下:
5
有效性分析是指决策单元DMU的总体有效性情况,本案例使用BBC模型进行分析。从上表可以看出:1997,1998和1999这三年的数据均为‘DEA强有效’,即相对于其它年份(DMU)来讲,此3年的投入产出达到相对最有效率。
关于有效性的判断规则说明如下:
如果综合效益值等于1且松驰变量S-和松驰变量均为0,那么为DEA强有效,说明相对来讲某DMU单元达到最有效率;如果综合效益值等于1并且2个松驰变量任意中任意1个大于0,那么为DEA弱有效,说明某DMU单元已经相对有效率但还有一定提升空间;如果说综合效益值小于1(此时不论松驰变量为多少),那么为非DEA有效,即说明相对来讲投入产出比效率较差。
以及关于上表格中各指标的意义说明如下表:
从本案例分析来看,除1997,1998和1999共3个决策单元外,其余年份(决策单元DMU)均为非DEA有效,即还有较大的提升空间,下述中还会进一步对规模效益系数进行分析。
上图为有效性分析的图示化,人上图可以看到,从1990到1999年变迁过程中,综合效益值在不断的提升,也即说明政府的投入产出效率在不断提升。包括规模效益和技术效益均在不断提升,进一步说明投入产出效率的提升,也即说明政府的效率在不断提高。
针对BBC模型即规模报酬可变模型来看,上述分析可知,1997,1998和1999这3年均为DEA强有效,自然其规模报酬达到最优即规模报酬固定。而1997年之前,规模报酬系数值均小于1,也即说明规模报酬递增,加大规模更加速提高投入产出比。可能这也正是政府在逐年提升投入的原因。关于规模报酬系数的判断规则说明如下表:
针对非DEA有效的决策单元DMU,可进一步分析其‘投入冗余’情况。当然DEA强有效的决策单元(本案例中的1997,1998和1999共3年),相对意义上其并没有投入冗余问题,因此松驰变量S-值均为0。
松驰变量S-意义为“减少多少投入时达目标效率”,简单来说就是得到基于当前的产出,投入要减少多少才能达到高效率。该值越小越好,最小值为0(即最优状态),从上表可知:从1990~1996年间,政府财政收入占GDP比例对应的松驰变量S-值一直都大于0,意味着财政收入相对GDP过高(收税相对过多)。与此同时,在1994~1996年这3年里,每千人科技人员数的松驰变量S-值较高,意味着科技人员占比相对过高,可适量减少科技人员投入。
至于投入冗余率,其是一个相对的数字,即‘过多投入’除以‘已投入’,分析时可直接对比该数字,如果该值越大意味着需要减少的比例越大。
针对非DEA有效的决策单元DMU,可进一步分析其‘产出不足’情况。当然DEA强有效的决策单元(本案例中的1997,1998和1999共3年),相对意义上其并没有产出不足问题,因此松驰变量S+值均为0。
松驰变量S+意义为“增加多少产出时达目标效率”,简单来说就是得到基于当前的投入,产出要增加多少才能达到高效率。该值越小越好,最小值为0(即最优状态),从上表可知:人均GDP这一产出变量仅在1995年出现松驰变量S+值大于0,意味着1995年时人均GDP相对产出较低。与此同时,1990~1993共4年时间里,松驰变量S+值大于0,说明此4年里面相对于投入,产出效率还有提升空间(即产出不够)。
至于产出不足率,其是一个相对的数字,即‘产出不足’除以‘已产出’,分析时可直接对比该数字,如果该值越大意味着需要产出增加的比例越大。
描述统计分析表格为各研究指标的平均值和标准差值等,用于查阅数据中是否有缺失或异常情况等,并无其它意义。
6
涉及以下几个关键点,分别如下:
数据包络分析DEA从数学原理上并不要求数据进行量纲化处理,如果需要处理,可使用SPSSAU数据处理里面的生成变量功能进行处理。与此同时,如果数据有负向(逆向)指标,则需要对其进行逆向化处理,让其指标意义变为正向。处理方式为:SPSSAU数据处理里面的生成变量功能中的逆向化处理。
如果指标中有负向(逆向)指标,那么需要对负向(逆向)指标进行逆向化处理,使其意义变为正向。处理方式为:SPSSAU数据处理里面的生成变量功能中的逆向化处理。
数据包络DEA分析有很多模型,BBC和CCR最为经典,如果考虑规模报酬可变则使用BBC,反之如果认为规模报酬不变则应使用CCR,通常情况下使用BBC较多。
数据包络DEA分析进行分析时,其是一个相对对比的过程,即基于所分析数据里面对比相对的优劣,比如不同城市的DEA分析,有的分析发现北京DEA有效,但指标更改后(或对比的DMU更换),可能就会出现北京为非DEA有效。
麦兜爱李公主
数据包络分析(DEA)简介在人们的生产活动和社会活动中常常会遇到这样的问题:经过一段时间之后,需要对具 有相同类型的部门或单位(称为决策单元)进行评价,其评价的依据是决策单元的“输入”数 据和“输出”数据,输入数据是指决策单元在某种活动中需要消耗的某些量,例如投入的资金 总额,投入的总劳动力数,占地面积等等;输出数据是决策单元经过一定的输入之后,产生 的表明该活动成效的某些信息量, 例如不同类型的产品数量, 产品的质量, 经济效益等等. 再 具体些说,譬如在评价某城市的高等学校时,输入可以是学校的全年的资金,教职员工的总 人数,教学用房的总面积,各类职称的教师人数等等;输出可以是培养博士研究生的人数, 硕士研究生的人数,大学生的人数,学生的质量(德,智,体),教师的教学工作量,学校 的科研成果(数量与质量)等等.根据输入数据和输出数据来评价决策单元的优劣,即所谓 评价部门(或单位)间的相对有效性. 1978 年由著名的运筹学家 和 首先提出了一个被称 为数据包络分析(Data Envelopment Analysis,简称 DEA)的方法,去评价部门间的相对 有效性(因此被称为 DEA 有效).他们的第一个模型被命名为 CCR 模型.从生产函数角 度看, 这一模型是用来研究具有多个输入、 特别是具有多个输出的“生产部门”同时为“规模有 效”与“技术有效”的十分理想且卓有成效的方法.1984 年 和 给出了一个被称为 BCC 的模型.1985 年 Charnes,Cooper 和 , , 给出了另一个模型(称为 CCGSS 模型),这两个模型是用来研究生产部 门的间的“技术有效”性的.1986 年 Charnes,Cooper 和魏权龄为了进一步地估计“有效生 产前沿面”,利用 Charnes, Cooper 和 于 1962 年首先提出的半无限规划理论, 研究了具有无穷多个决策单元的情况,给出了一个新的数据包络模型——CCW 模型.1987 年 Charnes, Cooper,魏权龄和黄志民又得到了称为锥比率的数据包络模型——CCWH 模 型. 这一模型可以用来处理具有过多的输入及输出的情况, 而且锥的选取可以体现决策者的 “偏好”.灵活的应用这一模型,可以将 CCR 模型中确定出的 DEA 有效决策单元进行分类或 排队等等.这些模型以及新的模型正在被不断地进行完善和进一步发展. 上述的一些模型都可以看作是处理具有多个输入(输出越小越好)和多个输出(输入越 大越好)的多目标决策问题的方法.可以证明,DEA 有效性与相应的多目标规划问题的 pareto 有效解(或非支配解)是等价的.数据包络分析(即 DEA)可以看作是一种统计分析 的新方法. 它是根据一组关于输入-输出的观察值来估计有效生产前沿面的. 在经济学和计 量经济学中,估计有效生产前沿面,通常使用统计回归以及其它的一些统计方法,这些方法 估计出的生产函数并没有表现出实际的前沿面, 得出得函数实际上是非有效的. 因为这种估 计是将有效决策单元与非有效决策单元混为一谈而得出来的.在有效性的评价方面,除了 DEA 方法以外,还有其它的一些方法,但是那些方法几乎仅限于单输出的情况.相比之下, DEA 方法处理多输入,特别是多输出的问题的能力是具有绝对优势的.并且,DEA 方法不 仅可以用线性规划来判断决策单元对应的点是否位于有效生产前沿面上, 同时又可获得许多 有用的管理信息.因此,它比其它的一些方法(包括采用统计的方法)优越,用处也更广泛.数据包络分析是运筹学的一个新的研究领域.Charnes 和 Cooper 等人的第一个应用 DEA 的十分成功的案例,是在评价为弱智儿童开设公立学校项目的同时,描绘出可以反映 大规模社会实验结果的研究方法.在评估中,输出包括“自尊”等无形的指标;输入包括父母 的照料和父母的文化程度等, 无论哪种指标都无法与市场价格相比较, 也难以轻易定出适当 的权重(权系数),这也是 DEA 的优点之一. DEA 的优点吸引了众多的应用者,应用范围已扩展到美国军用飞机的飞行、基地维修与 保养,以及陆军征兵、城市、银行等方面.目前,这一方法应用的领域正在不断地扩大.它 也可以用来研究多种方案之间的相对有效性(例如投资项目评价);研究在做决策之前去预 测一旦做出决策后它的相对效果如何 (例如建立新厂后, 新厂相对于已有的一些工厂是否为 有效).DEA 模型甚至可以用来进行政策评价. 最引人注目的研究是把 DEA 与其它评价方法进行比较.例如将 DEA 应用于北卡罗来纳 州各医院的有效性评价. 已有的按计量经济学方式给出的回归生产函数认为, 此例中不存在 规模收益.DEA 的研究发现,尽管使用同样的数据,回归生产函数不能象 DEA 那样正确测 定规模收益.其关键在于(a)DEA 和回归方法虽然都使用给定的同样数据,但使用方式不 一样;(b)DEA 致力于每个单个医院的优化,而不是对整个集合的统计回归优化.在其它 的研究中,例如在评价医院经营有效性时,将 DEA 与马萨诸塞州有效性评定委员会使用的 比例方法进行了比较,当使用模拟方法对 DEA 进行检验后认为,尽管由回归函数产生的数 据有利于回归方法的使用,但是 DEA 方法显得更有效. DEA 方法和模型,以及对 DEA 方法的理解和应用还在不断的发展和深入.除了上面提 到的新的模型 BCC、CCGSS、CCW 和 CCWH 模型外,在具体使用 DEA 方法时,例如“窗 口分析”方法, DEA 的应用范围拓广到动态情形; DEA 应用于决策单元为私人部门 使 将 (商 业公司)时,各决策单元之间存在着激烈的相互竞争作用等情况.
成都安美
DEA的特点: (1)适用于多输入多输出的效率评价问题,处理这方面的问题具有优势。 (2)只研究输入输出数据,不对数据进行其他处理,不需要了解数据之间的某些表达式关系
DEA简单介绍:
(1)定义:DEA叫做数据包络分析。它是用来分析个体或单位的效率(或绩效)评价的一种非参数方法。基本原理就是保持决策单元的输入或者输出不变借助我们的线性规划和统计数据确定相对有效的生产前沿面,通过比较决策单元偏离前沿面的程度来判断相对有效性。
(2)生产前沿面的解释:(以两个投入一个产出为例)
比如一个工厂生产产品,投入指标为自然资源为土地,劳动资源为工人,来生产产品。
则我们的投入产出比为:(4,3) (7,3) (8,1) (4,2) (2,4),在图中表示:
对于我们的一个决策单元,我们的投入和产出都有对应的值,我们的投入和产出可以对应一个投入产出的集合,在这个集的边界,即表示以现有的投入获得最大的产出或是在现有的产出条件下最小投入的边界。那么我们以这样一个边界面称为生产前沿面。那么在前沿面上的即为相对有效。偏离生产前沿面的为无效。(此处为投入产出比,即比值越小越好)。
此处ABC点出的效率值为1,D点的距离d=OD/OP,我们的效率值是小于等于1的,效率E=OP/OD,由此从投入产出比出发,效率等于距离的倒数。类似从产出投入比角度出发,效率则等于距离。
zhang太太
Abstract: in many practical problems, the training data is different, usually some training data may be more important than other data. Each group of training data depict different function is usually through each training data gives an incredible weights, based on the fuzzy data, this paper has deduced the classic again in the regression method, and the relative cases of fuzzy regression method, and analyzed their statistical properties. In fuzzy statistic analysis of the traditional methods are incredibly weight by setting the fuzzy membership functions, such as to determine the time sequence function etc. Considering the DEA method in the analysis of the relative effectiveness evaluation decision unit has not underestimate the superiority of the DEA method, then we introduce fuzzy statistic analysis, and usually use the fuzzy membership functions of the incredible weight determined comparing method, fuzzy statistic analysis method in DEA model is superior. Keywords: DEA analysis method, Least-squares regression analysis, Fuzzy statistic,
从人物的语言、动作、神态、心理、外貌方面去描写
论文常用数据分析方法 论文常用数据分析方法,对好的论文分析研究方法应该从哪些方面展开,如何表达才能显得自己对该论文真的有所理解,应该看哪些书呢?下面我整理了论文
文献研究法 文献研究法是根据一定的研究目的或课题,通过调查文献来获得资料,从而全面地、正确地了解掌握所要研究问题的一种方法。文献研究法被子广泛用于各种学科研究中
论文的研究方法有哪些 论文的研究方法有哪些,研究方法是在一个研究中发现新的现象、新的事物,或者提出新理论、观点,论文研究方法需要大量阅读法,找到不足和创新点,来
论文常用数据分析方法 论文常用数据分析方法,对好的论文分析研究方法应该从哪些方面展开,如何表达才能显得自己对该论文真的有所理解,应该看哪些书呢?下面我整理了论文