中国高校教师科研业绩评价研究综述
高等学校是国家创新体系的重要组成部分,高校教师是国家科技创新的重要力量,也是科技创新的不竭源泉和社会进步的推动力量。然而,我国高校科研工作中出现的浮躁、急功近利、学术腐败等问题日益严重,具有重要导向作用的高校教师科研业绩评价体系正受到质疑,因此,分析我国高校教师科研业绩评价活动的发展情况,更清晰地了解我国高校教师科研绩效评价的来龙去脉十分必要,以更好地指导我们改进评价工作。首先将详述自90年代中后期以来我国科研业绩评价研究的发展情况。
1 当前高校教师科研活动绩效评价有关研究综述
2000年以来我国已形成了较稳定的教师科研绩效评价体系,这个阶段的一个显著特征是“数量化”,着重考察教师科研工作的内容与产出,运用数学方法确定相应权重,使得考核标准和考核结果能以数量化的形式得以体现。关于这个阶段教师考核评价的主要特点和存在的问题,正是对现行大学教师绩效评价制度所体现的主要特征的反映。
1.1 评价流程基本一致
在绩效评价的流程上,国内高校各不相同,但基本程序却有相似之处,主要经过以下几个阶段:首先是个人撰写年度述职报告(填表),然后上交职能部门或是上级领导进行考核,之后由高校考核小组审定并公示,最后反馈到个人。绩效评价方法主要采用定量方法、定性评议、排序方法、评分表、目标管理、关键事件法等方法。
1.2 定量评价为主,亟待加强定性评价的理论及实践研究
量化评价是与同行评议并存的两种主要的学术评价方法,量化评价广泛应用于我国教师科研业绩评价之中。对事物进行量化处理是人类社会生产生活必不可缺的手段和方法。学术量化评价起源于20世纪初逐渐发展起来的文献计量学,阿兰·普里查德(Pritchard.A.)被认为是“文献计量学”这一概念的正式创造者。文献计量学的兴起为学术量化评价提供了理论基础和具体的方法和工具。当今,世界各国广泛使用量化的方法来进行科学活动评价,如美国国家科学基金会每两年一次向国会提交的《科学与工程索引》,德国教育科研部每年发表的关于德国科学竞争力的年度报告,都是采用基于文献计量学的引文分析技术,来评价本国科学活动的竞争力。
既然量化评价有其存在的科学性和合理性,那么为什么众多学者对其口诛笔伐呢?总结起来,我们认为争论的焦点主要在于:①重数量不重质量倾向,不利于我国科学研究水平的提高。如我国2006年SCI论文发表数量世界第9,但反映论文质量的重要尺度——单篇论文平均引文数只有3.01次,居世界第124位。②重短期不重长远。一个经常被讨论的话题是建国至今中国本土尚无诺奖获得者,过度量化的评价体系也被认为是原因之一。③重产出不重应用。④“一刀切”问题,将不同学科、不同研究类型的科研业绩统一按照研究经费等指标进行评价。在众多的研究观点中,分类评价的原则已经成为共识。
可见,定量评价虽因其可操作性强、客观性强等特点而在我国大行其道,但也有其弊端和局限,在我国评价实践中,亟须采取必要的措施予以防范,众多学者将目光投向了定性评价。
1.3 同行评议——定性评价的发展
同行评议作为一种评价方法应用于学术领域要比定量评价早200年左右。1665年英国皇家学会创办了《哲学通报》,负责编辑工作的秘书亨利·奥尔登伯格从会员和其他科学通讯员那里收取报告他们科学新发现的信件,他天才地想起了将这些信件印发流通。随后英国皇家学会理事会决定,该学会理事会准许引发的小册子,应首先由理事会的某些成员做出评价。同行评议方法由此诞生,并逐渐发展成为一套应用广泛,要求严格的同行评价制度。
由于美国等西方大学历来有学术自由的传统,同行评议被认为是学术共同体实现学术自治、学术自由的体现和保障,在西方大学中有比较一致的认可。例如,中国工程院外籍院士、哈佛大学教授何毓琦在给宋健院士的信中指出:“对质量的衡量是比较深奥的,需要专业知识和深入的理解。在学术工作中,质量恰恰是至高无上的。同行评审是一个被普遍接受和唯一可行的机制。然而,随着多元巨型大学的出现(大学规模越来越大),同行评价的效率和效果也受到质疑。
民国时期,同行评议制度在我国出现,主要发挥了学术审查作用,民国初期的国立大学在判别被聘者学术水平高低与真伪上似乎没有一套健全和可行的制度,即使有同行专家审阅与推荐,也是出自个人之评语为多,缺少组织和团体鉴别。在大学之外成立的学术评审会等机构负责对教员的学术专著与论文进行审定,如1939年在重庆成立的教育部学术审议委员会就担负对学术进行审议和奖励的职责。虽然1986年成立的国家自然科学基金委是我国科学史上规模最大的同行评议实践,但由于其评价对象是研究项目,因此可以说,我国对于教师科研业绩的同行评价,从未大规模开展过。
采用同行评价法评价教师科研业绩的流程大致如下:首先个人按要求准备科研业绩材料,并上交科研业务主管部门。科研业务主管部门进行审核,遴选符合一定条件的同行专家,并将材料送给同行专家。同行专家评价后收集评价意见,根据有关规则形成评价结果,将结果报送主管领导、校学术委员会等上级机构,做出最终决定。
1.4 评价内容(指标)存在较大争议
争议最大的是以SCI论文作为硬性科研业绩评价指标。上世纪80年代末,南京大学率先将SCI引入评价体系,自此以后,由于成本低、可操作性强等因素,SCI在我国不断得到推广,到上世纪90年代中后期,已经出现不少质疑的声音,2003年,科技部、中科院、国家自然基金委、教育部、中国工程院五部委联合发文,反对以论文发表数量来评价个人学术水平和贡献的做法。然而,SCI热并没有消退,反而愈演愈烈,与课题申请、职称晋升、科研业绩评价等均挂钩,甚至连发奖金都与SCI挂钩。客观的说,世界各国广泛将SCI用于科研绩效评价,但是在我国,SCI被滥用是不争的事实。2009年,“SCI之父”尤金·加菲尔德博士在接受《人民日报》记者专访时表示,SCI是一个国际标准数据库,单纯用这样的标准来衡量科研人员是不合适的,以SCI论文数量评价科学水平更是不合适的。评估人、包括评估一个机构或期刊,需要用多个科学评估标准而不是一个评估标准来评估。现如今,SCI被戏谑地称作“stupid Chinese ide
a”,这的确是一个极大的讽刺,由于中国学者争先恐后地将自己的科研成果拿到国际上评审,且发表的SCI文章一年之后国人才能看到,一定程度上可以说,SCI导向制约了我国科研创新能力的进一步提高,因此应当参考SCI,制定适合我国国情的科研评价体系。
用同一指标评价不同类型的科研活动,是属于同一问题的不同层面。不同类型的研究,其影响存在区别。比如,基础研究具有先导性、探索性、国际性等特点,基础类期刊读者层面更广泛,研究论文更容易受到人们的关注和引用,因此偏于科学的期刊其影响因子较高。收入于1994年度的SCI的期刊引用报告中影响因子大于20的13种期刊,绝大部分与生命科学有关。这只能理解为生命科学的研究是最受注意的一类研究内容。将不同学科、不同研究领域的科研业绩放在同一个评价指标体系中进行评价、比较,显然是不合适的。
那么,如何解决不同学科不同领域的科研业绩共同评价的问题呢?这是一所大学内部科研业绩评价工作必须碰到和需要解决的问题。目前主要有两种思路,一种是分类评价的原则,即按照学校、学科类型(甚至教师个人情况,如年龄、职称等)进行划分,选取不同的评价指标,构建不同的指标体系,采取不同的评价方法来评价。另外一种思路则更进一步,即把分类评价的结果,通过数学方法转变为可以进行相互比较的量。这个可以相互比较的量一般是基于绩效理论的“投入产出比”。
1.5 绩效评价——量化评价的进一步发展
“绩效”是人力资源管理理论的重要概念,管理学对于绩效评价有广泛深入的研究,发展出了诸多评价方法,其中结合定量与定性的综合评价被认为是最成功的,也是未来的发展趋势。但是由于企业经理人更关心成本、利润等指标,而高校教师的科研业绩普遍采用“文章发表数量被引次数”、“科技奖励数量及层次”、“专利申请数量”等指标进行评价,因此,针对企业科技人员的评价系统并不能直接适用于高校教师。
“投入产出比”是绩效评价的基本出发点,在企业“产出”被定义为利润,然而高校教师的科研活动很难定义为“产出”,因此我们看到有关高校教师科研绩效评价的研究中,“产出”基本还是指的是论文发表数量层次、专利申请及授权数量、获奖级别等传统量化指标,从这一点看,绩效评价仍然属于量化评价,由于相比传统量化评价,绩效评价运用了较为复杂的数理统计分析方法,因此绩效评价是量化评价的进一步发展。近年来的一些研究以绩效理论为基础构建了高校教师科研绩效评价模型,亦有研究考察了科研管理绩效对高校科研实力变化的影响。
由于绩效评价仍然属于量化评价,所以即使采取绩效评价,我们还是能看到量化评价的弊端。举个例子,美国数学家纳什在1950年和1951年发表的两篇他一生中做出最大学术贡献的论文,奠定了博弈论的思想基础,并最终使其获得诺贝尔经济奖。但是,他的论文发表10年后才逐渐有人发现蕴含的深刻思想,如果按照“投入产出比”的观点来看,纳什对博弈论的研究只属于业余爱好,估计这项研究并没有争取到多少经费的支持,他的产出大概就是那两篇论文,他的科研业绩放在我国大学里,相信是不起眼的。
2 新中国成立到2000年以前高校教师科研业绩评价的发展
建国初期到“文革”前,是教师科研业绩评价工作的初步形成阶段。由于这一时期是我国高等教育体制的改造时期,我国的高等学校在各个方面包括教师考核工作,主要学习了前苏联的经验。1961年9月,中共中央印发《中华人民共和国教育部直属高等学校暂行工作条例(草案)》,第一次明确提出:“学校应该定期地对教师进行考核”,“高等学校教师的根本任务必须以教学为主”;“生产劳动,科学研究,社会活动的时间应该安排得当,以利教学”。由此看出,人才培养是这段时期我国高校的主要任务。《草案》的实施,首次为教师考核形成制度提供了政策保障,明确了教师职称的确定和提升要以考核为基础。这一时期的考核内容以教学工作为主,虽然提出的考核内容包括教师的学术水平,然而实际的评价依据基本是以教师的思想政治素质、教学工作量、生产劳动等内容为主。
文革时期,是教师科研业绩评价工作的受挫瘫痪阶段。教育成为重灾区,我国各级各类高等学校的办学活动受到了严重影响,一批高校被撤销,部分高校教师被下放到基层、农村接受劳动改造,这对已渐有起色的科学研究形成沉重打击。在此期间,高校的各项正常工作次序被完全打乱,刚刚起步的科研业绩评价工作也完全处于停顿状态。
从“文革”结束到20世纪90年代中期,是教师科研业绩评价工作的恢复改善阶段。除人才培养这一基本功能外,高等教育的科学研究功能被从国家层面予以确认,高校教师科研业绩评价工作随之得到发展,目前评价工作的许多做法,都可以追溯到这一时期,如在80年代中后期被引入到我国科技界的SCI,对我国科研业绩评价产生了广泛而深远的影响。
纵观这一时期的教师科研业绩评价工作,主要有以下特点:一是考核方式由改革开放初的行政领导评价转变为注重教师具体科研业绩的量化,重点考察科研时机。二是打破了以往强调照顾教龄、论资排辈的做法,更注重择优晋升。这一时期,我国高校由原来以培养人才为主要任务,逐步转变为人才培养、科学研究、服务社会三大功能。与此同时,大学教师的职责由单纯的教学工作,到同时要从事学术研究和开展社会服务工作。所以这一时期评价工作的第三个特点是评价内容由原来以评价教学工作为主,转变为综合评价教师的教学科研等业绩。四是考核工作逐渐趋于制度化、评价结果普遍与教师职称晋升、薪酬等挂钩。
应该说,这一时期科研业绩评价工作的种种举措有其独特的时代背景,一定程度上促进了我国高校科研事业的发展。然而在进入到21世纪以后,随着时代进步和相关评价研究的开展,我国科研评价体系如过度量化、评价手段单一等问题逐渐暴露出来,引发了科技界的广泛争议。
3 结语
综上所述,我国高校教师科研业绩评价自20世纪80年代末以来取得了较大发展,并在2000年以后形成了相对稳定的评价体系。虽然在评价内容、评价方法等方面存在一些争议,但是其在一定程度上促进了我国科研事业的发展也是不争的事实。近期,要求改革我国科技管理体制的呼声越来越高,在这一背景下,借鉴国外同行评价的经验,研究适用于我国国情的,更有利于科研人员发展的,更有利于促进科研创新的科研业绩评价体系,迫在眉睫。
下一篇:中美产业围绕337调查的博弈分析