实验数据的计量经济分析:挑战与机遇
本文全面阐述了实验数据的特征和一系列的计量方法,详细分析了实验数据在经济学应用中的机遇和挑战,由此得出,实验经济学将在经济学和计量经济学的进展中发挥着根本性作用。总之,选择实验经济学方法能使计量经济学家们掌握事物的核心。毫无疑问,这解释了实验经济实验室为什么在全球丛生和为什么经济学院系对实验经济学家有强劲需求。
为了评估环境、制度和激励政策的相对有效性,在不以承受与之相关的社会和私人成本为代价的情况下,实验经济学有助于收集相关、可靠的经验数据,并可以评估在人们的决策中每个特定动机(增益研究、互惠需求、对体制变革的反应等)的重要性。
从应用计量经济学的角度来看,实验经济学最大的优势就是可以立即地和不受限制地访问所掌握的整个数据。此外,通过控制实验数据,减少测量误差和错误。实验室实验也用于研究用调查数据很难去观察或推断的行为。但是,这些实验数据的统计有效性怎样呢?许多经济学家就实验结果对现实经济的可转换性提出了一些疑问。实验经济学家对这一质疑的反驳是,参与者是活生生的、有认知的人,他们被要求做出直接影响到他们收入或福利的决策,研究行为和动机的实验数据的可靠性补偿了此类数据的缺乏代表性。
一、实验数据特征
1、决策变量
根据实验中,参与者被要求对连续或离散变量做出决策。例如,在公共物品实验中,参加者是否捐助公共物品,如果他们决策捐助,希望解释他们的捐助数额。连续或离散形式的决策往往在限定空间和截尾空间,导致托比模型(Tobit)或泊松模型(Possion)。此外,例如,通过使用Probit类型和有序Probit类型的潜变量模型,还可以解释参与者合作或不合作的效用以及合作强度。
2、保留什么样的计量方法
(1)非参数方法
历来,实验分析给予了非参数分析重要的地位,这经常发生在心理学、医学和生物化学领域,例如,实验室的研究协议是很重要的。这种做法究竟是什么呢?
曼-惠特尼(Mann-Whitney)的U检验是非参数检验中功效最强的检验之一。它可以评估同类实验的处理结果之间是否存在差异。例如,给定处理是否导致对公共物品的自愿捐助优于其他处理。因此,这就涉及到要去比较两个独立观测序列。对于这种检验,要求不少于6个独立的观测值,意味着至少要有6次处理。有时使用曼-惠特尼U检验以查看在给定的处理期间,第一阶段提供的结果是否不同于上次阶段的。注意,这意味着早期的观测不影响以往的观测。这并非总是如此,本次检验的使用者并不总是考虑此约束。更一般的,Kruskal-Wallis秩和检验检验零假设,即K个样本或处理来自具有相同位数的同一群体。
(2)参数方法
参数方法通过假定决策变量遵循一个精确的概率密度函数,对数据强加一定的约束(一个例外:普通最小二乘法在参数估计时对数据强加的较少)。作为补偿,除了在计量模型中引入直接与实验相关的变量外,参数方法还允许在计量经济模型中引入被观测者的个体变量,如参与者的性别、年龄、研究专业、是否曾参与过实验等。如果参与者在实验中分别进行了几次测试,未观察到的异质性被面板数据的个体效应所控制。
3、保留方法的选择
在特定情况下,Keser和Montmarquette(2005,2008)在非参数二项式检验上没有发现任何相互效应,但对相互项的测度,他们使用如下定义的偏差:如果参与者i的捐助小于上一期小组其他成员捐助的平均值,那么除了增加其在下一期的捐助,他没做其他回应。
这两种方法之间存在互补性的另一个方面是与以下问题有关:应该通过分化处理来分析数据,还是应该聚集呢?对单一方程的参数回归能够很容易地检验处理是否导致决策或不同的结果,足够证实处理变量的参数之间是否有显著差异。瓦尔德检验(Wald tests)和极大似然比检验(通过施加等于系数的约束)用于验证治疗之间是否存在差异。如果是联立方程,处理之间差异的检验是更复杂的。此外,由于不是相同的人参与不同的处理,单一方程暗含着单个随机变量的假设,这也许是很有争议的。注意,高的或t检验统计值并不意味着处理之间显著的差异效果。还需要进行一些模拟来区分潜在效果和实际效果。
二、实验数据有效利用的其他挑战
1、实验方法对数据拟合的问题
模型对数据的拟合问题(拟合优度)是计量经济分析的一个重要因素。参数方法提供了可决系数R2或伪R2。但是,数值多大才适合呢?例如,在二元Probit模型中,如果主导决策代表了至少60%的情况,几乎不可能比预测主导决策做得更好了。为了更好的预测,必须实现R2(或伪R2)为60%,但是对于微观数据,是一种罕见的情况。事实上,必须要问在实验分析中最大化R2是否是可取的?一般经济学家们希望无论经验或个体特征如何,行为能对激励做出回应。经济学对人们行为做出的贡献是证明了他们会对激励做出反应,而不管他们的个性特征如何!例如,如果要促进合作行为,就必须找到使所有人合作的正确的激励机制。也就是说,理想的情况是社会经济控制变量的估计参数在统计上是不显著的。
2、实验方法验证理论的应用
如何衡量理论模型解释实验数据的价值?预测数据的一阶统计矩是结构模型的一个基本问题。但实验方法是一种结构性的办法。成功实验方案的背后,往往存在一个重要的理论结构。其目标不是从根本上解释决策的方差,而是检验模型的理论预测或实验方案依据的基本思想,必须证实与实验相关的理论预测的有效性。在文献中可以看到许多处理这一问题的有关技术。例如,量子响应模型这种方法的目的是为了衡量检测是否受试者是或不按照他们的理论进行决策,而不是采取随机决策。从计量经济学的视角,量子响应模型对应于多项Logit模型,在m个可能方案中选择的概率与多个不同选项的预期利润的指数函数成正比: 注意到,如果?滋→∞,那么Pi=1/m。这意味着随机和非战略决策。此外,?滋→0,表明参与者们对他们决定带来的利润相对敏感。一些研究已经使用这种方法来确认参与者的战略决策(Goeree,Holt和Palfrey,2002)。但似乎基础参数?滋并不独立于计量单位,多项Logit意味着假设不相干的替代品之间相互独立。
另一种实现起来相对简单、但稳健性尚待观察的技术是群集分析(聚类分析)来确定参与者所使用的主要策略。一些变量被用于确定分区数:例如,在自愿捐助实验中,非零捐助的频率、捐助额的平均值和标准偏差自然就是这类变量。事实上,它似乎有理由认为,非零捐助数较少、弱的捐助额的平均值和标准偏差表明非合作的战略。与此相反,正捐助的频率较高表示合作策略。正捐助的标准偏差识别战略或多或少的恒定性质。沃尔德分层方法(the hierarchical method of Ward)的应用通过总结参与者的策略识别集群。通常,为了对比不同的策略,两到三个集群已足以了。通过计算各群选定变量的描述性统计(平均数、标准偏差、中位数),可以根据处理识别参与者使用的主要策略。注意存在处理参与者利用不同策略问题的另一种方法,即在计量经济模型直接引入具体方程来对这些策略建模。例如,在公共物品的情况下,可以先验区分搭便车者和合作者。通过极大似然法估计参与者是搭便车者或合作者的概率,可以得到参与者不可观测的异质性。允许选择使模型的统计似然性最大化的权重。Bardley和Moffatt(2005)提供了适用于实验数据的这种方法的一个很好的例子。
3、如何调和理论和计量经济学:实验经济学在这个问题上的重要作用
正如所看到的,所面临的挑战在计量经济学方面是显著。在理论层面,需要更好地了解动态的选择。逆向感应是动态理论的一种形式,但基本上达到了极限。机器学习这种模型对于这些问题提供了一些积极的期望。如何教导参加者?哪些机构让他们学得更快?因此,Vernon Smith认为,经验使没有先验经济理论知识的个人去发现和寻找模型的平衡。几项研究采用不同的竞争模型对这个问题进行了研究。例如,依赖于支付和过去的决策效率(向后看)的“强化”模型。也有信念模型(信念学习模型),它是经济学家中颇为主要的方法,基于能够预测其他受试者在实验中怎样决策的一种信仰(前瞻性)。最后,混合模型(经验加权吸引力)更新每个时期的观念。对于以上模型的详细细节,可以查阅Chong、Camerer和Ho(2006)。
三、结论
总之,实验经济学将在经济学和计量经济学的进展中发挥根本性作用。事实上,实验经济学能够产生数据,这对热衷于在各种环境中传播知识的经济学家来说,这样的性质是有相当大的吸引力的。在实践中,相对于纯粹的理论,管理者们总是更愿意接受数据事实。总之,选择实验经济学方法能使经济学家们像医生一样掌握事物的核心。毫无疑问,这解释了实验经济实验室为什么在全球丛生和为什么经济学院系对实验经济学家有强劲需求。
必须知道对一个好的实验经济学家教育的成本。发展实验方案的技术必须以基础理论知识和好的计量经济教育为支持。
可得出以下三个使用规则:第一,在考虑模型和估计方法之前,应该找到一个好的问题,形式不应该凌驾于内容之上。第二,了解他们的实验数据。从事计量经济分析时,以目前现有的IT工具非常人性化为借口,没有关注数据,是一个错误,有可能错过了真正的问题和好的结果。第三,避免过于纯粹:有时承认存在偏差好过试图依据太多的假设和要求太多的数据校正。
作者:岁磊 来源:当代经济 2015年35期