浅论强化理论的发展
论文关键词:效果律 操作强化 认知强化
论文摘要:强化理论是当代学习心理学最重要的理论之一,广义上的强化理论包括桑代克的效果律、斯金纳的操作强化理论和班杜拉的认知强化理论。发展的强化理论已从s-r条件作用理论转向为认知交互作用理论,强化因此而被赋予了特殊的涵义。
强化理论是当代学习心理学最重要的理论之一,实验和实践一致证明:效果律—强化原理确是对人类学习可靠的和有力的概括。需要注意的事实是:学习理论在整个20世纪一直处于发展过程之中,如今的强化理论较之联结主义的“快乐—痛苦原理”已具有重要的扩充、修正乃至颠覆的含义,其实质已从s—r条件作用理论转向为认知交互作用理论。然而,当今的教育领域仍存在着把桑代克的效果律和斯金纳的操作强化在一个“有效”的基础上作为手段而简单、直接运用于实践中的现象。为此,有必要梳理强化理论的发展脉络,把握当代强化理论的要义。
一、桑代克的效果律
桑代克的联结主义心理学依据机能主义的观点,以刺激与反应之间的联结替代了赫尔巴特主义的观念的联结,并将联结分为先天(本能)和习得(习惯)两大类。桑代克认为,学习是联结的形成与巩固[1]。从尝试与错误的动物学习实验中,桑代克得出了著名的快乐—痛苦原理即效果律:一种反应如果伴随着快乐的体验,那么它就会被增加;如果伴随着痛苦,就会被减弱[2]。
桑代克自称是机能主义者,但他的联结主义仍是s—r条件作用理论,因而“联结主义”这个术语在更广泛的意义上也是“行为主义的”。桑代克动物实验中的学习情境与后来斯金纳的白鼠压杆情境在基本特征上并无不同,在桑代克的尝试与错误学习中,当动物通过活动达到一“满意事态”,便设想学习受到了积极影响,即“满意事态”促使之前活动逐渐增强。斯金纳用强化这个概念鉴别出被桑代克称作效果律的事件,因而,可以把桑代克尝试错误学习中最重要的发现更好地描述为强化理论。
二、斯金纳的操作强化理论
斯金纳是激进行为主义者,其基本立场为心理学是研究外部行为而且只研究外部行为的一门科学。斯金纳认为人的行为主要由操作条件反射构成,塑造行为的过程就是学习的过程,强化是其学习理论中的核心概念。“如果一个操作发生后,接着给予一个强化刺激,那么其强度就增加。”斯金纳通过实验发现:操作行为存在消退现象,消退的行为主要缘于以往操作条件作用的结果。与桑代克的效果律作对比,斯金纳的强化理论与效果律的前半段同质,而用“消退”这个概念替换了效果律的后半段,且回避掉桑代克效果律中“快乐”与“痛苦”等字眼。
操作强化理论中,斯金纳区分出两种强化物:积极强化物和消极强化物。当一种刺激的呈现会增强某一行为的发生概率时,这种刺激物就是积极强化物;反之,当一种刺激的消除会增强某一行为的发生概率时,这种刺激物就是消极强化物。从此定义中我们看到,这两类强化物导致的结果相同,都是某一行为发生概率增强,斯金纳强调两类强化物的差异在于刺激条件不同。但是进一步分析刺激条件,刺激呈现或刺激消除实际上具有同一种性质——奖励,那么斯金纳区分两种强化物的依据到底是什么?从两类强化物的具体化罗列中很容易发现,积极强化物多是某种令人愉悦的事物,而消极强化物则多是令人讨厌的事物。但斯金纳却否认下列说法:积极强化物产生令人愉悦的情感,消极强化物产生让人讨厌的结果,也就是说斯金纳宁肯将两类强化物的区分依据只分析至刺激条件(行为)层面,尽管这种区别性质上并无差异,也不愿意作进一步的分析和解释,不愿承认刺激物性质实质上是其区分依据。联想到上文谈及的操作强化理论与效果律的对比分析,可以推断:斯金纳是在刻意回避“快乐”、“痛苦”、“愉悦”、“讨厌”等词汇。对此,斯金纳有过一个解释:强化物不具备“高兴”、“不高兴”此类物理特征。诚然,刺激作为事物本身被分析时,确实不具备“高兴”或“不高兴”等物理特征。但刺激成为强化物时,就不仅仅作为事物本身,而是必将与反应着的个体联系在一起被分析。因此,斯金纳的这个解释实在太多勉强。刺激本身具有的物理特征和强化物所具有的特征是两个不同的概念,这是其一;其二,如果强化物不具备“高兴”、“不高兴”此类特征,将无法解释强化物与反应变化之间的因果关系。事实上,斯金纳解释中的另一句话才是他回避的真正理由:物理学上没有“高兴”、“不高兴”之类的术语。对斯金纳来说,要描述强化物的性质,必然要涉及“愉悦”、“讨厌”此类术语,而一但涉及此类术语,必将研究精神世界,也就必然要使用和行为主义所认为的唯一科学的研究方法——实验分析相抵触的方式。在斯金纳看来,一个行为不管如何不完全,也比心灵主义的解释更有价值。
同样,斯金纳对“惩罚不是强化”之论断的解释亦存在同样的问题。当把强化界定成结果为反应增强的过程时,惩罚已自然地被排除在外。界定强化时,斯金纳恪守着激进行为主义的准则:直接研究刺激与反应之间的相互关系,不要在它们中间加入任何形式的生理或心理假设。而在解释论断时,斯金纳实际上是考虑了情感、动机此类个体心理特征,却囿于激进行为主义的基本假设,刻意回避并拒绝进一步解释。斯金纳强化理论中的自相矛盾和解释的缺乏,已显露出行为主义基本假设及其研究准则存在着严重的问题。
三、班杜拉的认知强化理论
班杜拉因为主张心理学应主要研究外显行为,强调行为的结果对行为的影响及强化的重要作用,常被归为新行为主义者行列。但,班杜拉与行为主义者对人的本质的假定存在着根本的不同。行为主义者认为人本质上是一台设计精良的机器,而班杜拉认为人是有思想的有机体,具有给自己提供某种自我指导力量的潜能”[3]。班杜拉重视观察学习、认知过程以及自我调节过程的作用,其社会学习理论亦应从属于认知交互作用理论范畴。
班杜拉的社会学习理论主要是一个认知强化理论。“结果决定行为”是被行为主义者广泛接受的信条,班杜拉亦同意一个人先前行为的结果在很大程度上决定这个人的将来行为。但传统的行为主义者认为,结果强化行为是一个自动机械的过程,班杜拉反对这一论断。他认为结果之所以能够强化行为,是因为这些结果具有信息和动机价值,即过去行为使得我们产生了预期,希望在将来的相似情境中也能够得到相似的结果。“除非人们意识到事件之间的相关,否则个体就不从重复的配对经验中学到任何东西”[4]。在这一强化过程中,人是有着预见性期望的信息加工者和解释者。人们对于学习意义的认知,在他将来行为的习得和保持中都将发挥重要的作用。在班杜拉这里,强化因此而被赋予了特殊的含义。强化过程既不是环境中心的过程,也不是个体中心的过程,而是个体利用直接经验结果和观察到的经验结果,以认知期望为中介,人们自我激发的过程。
班杜拉认为存在三种形式的强化,这三种强化都具有认知交互的特征。第一种是直接外部强化,斯金纳理论中分析的均是此类强化。与斯金纳不同之处在于,班杜拉强调带来强化效果的奖赏具有信息和动机两种功能。第二种是替代强化,即个体以他人在相似情境中的行为结果为基础来调控和改变自己的行为,众多操作强化理论无法解释的学习现象可以用替代强化来解释。替代强化是通过榜样模仿形成的,认知因素在此过程中起着重要的作用。它在很大程度上决定个体观察什么、赋予它们何种意义,以及它们所预示的信息应该如何被组织以备将来利用。第三种是自我强化,即个体以自己创设的结果标准为基础来调控自己的行为。班杜拉认为,个体的行为并不只是迎合他人的喜好,许多行为变化用刺激—反应理论无法解释;且在并不存在外在奖励或惩罚的情况下,个体依然会有行为的保持或改变,这种保持或改变缘自个体的自我奖励或惩罚。个体通过规范和观察,自己给自己设定了行为标准,依据这些内心准则对自己的行为作出评价,进而调节行为。当外部强化与内部准则发生冲突时,个体如何行动取决于外部力量与内部力量的对比结果。“忽视这种隐蔽的自我强化所具有的作用就等同于忽视人类的独特能力”[5]。
参考文献:
[1]车文博.西方心理学史[m].浙江:浙江教育出版社,1998.343.
[2][4][5]【美】morris l. bigge, samuel s. shermis. 写给教师的学习心理学[m].徐蕴,张军华等译.北京:中国轻工业出版社.2005.35.112.113.
[3]施良方.学习论——学习心理学的理论与原理[m].北京:人民教育出版社,1994.397.