中国科技园区域创新能力的智能评价
1.前言
中国自1988年实施火炬计划以来,现已建成国家级科技园区53个,在过去的十多年里,这些科技园区得到超常规的发展,其发展速度远高于同期国家经济发展的速度。2002年,它们总共实现技工贸总收入15326.4亿元,工业总产值12937.1亿元,工业增加值3286.1亿元,出口创汇329.2亿美元,各项指标均为1991年创建初期的150倍左右!由此可见,中国国家级科技园区已成为国民经济发展新的增长极和高新技术产业发展的重要基地,并必将继续对中国经济发展产生重大影响。
与此同时,科技园区的发展也出现了一些问题:产业规模小,缺乏集聚效应;基础设施跟不上;规划不合理;高质量技术人才与管理人才缺乏;企业产品的科技含量较低以及创新能力不足等[21对科技园区尤其是科技园区的创新能力进行评价,对于科技园区的发展具有积极的现实意义。
国内学者对国家级科技园区的评价工作开展了一系列的研究工作,并取得了一定的成果包括建立了更为合理的评价指标体系以及与之对应的权重,本文的主要内容即建立在这些研究基础上。
然而,现有的科技园区评价研究主要是在已建立指标体系的基础上,对各指标的得分进行线性加权求和,最后对求和结果进行简单排序,并按排序结果将科技园区分成若干个类或层次。这种评价方法的优点是容易理解,易于被各方面人士接受。不足是计算过于简单,处理非线性能力不足,评价结果对科技园区的进一步发展所能提供的信息不够。
数据描述(datadiscription)也称为一类分类(one-classclassification)方法丨4,51,是人工智能领域的最新研究成果,主要用于描述现有样本的分布特征本文试图将数据描述方法推广应用到样本数据的聚类中,形成基于数据描述的聚类方法,并将该方法最终应用到国家级科技园区的评价中。
2基于数据描述的聚类方法
数据描述的一种直接方法就是用一个具有最小体积的超球体将样本集中的全体样本包含起来对于样本集X={X2,X2,…,Xn},设将样本集中全体样本完全包围所对应的最小球体的半径为R,对应的球心向量为a,则Ra满足如下优化方程:
根据KKT条件,T中只有部分T>0,正是与这部分T相对应的样本点决定了封闭超球体的半径和球心,不妨将这些样本点称为支持对象(SupponObjeci,SO)
由式(7)获得系数T后,即可由式(6)获得球心向量a,进一步任选一支持对象Xs,由式(10)得到超球体的半径R:
R2-(X,-a)T(X,-a)=0 (10)
由式(7)求得的超球体形式单一,且可能范围过大,往往不能准确地反映实际样本数据的分布特征为此,在上述优化过程中引入核方法[4],即在式(7)中引入核函数:
(Xi-X2)—K(Xi,X2) (11)
此时与式(7)对应的优化方程为:
选择合适的核函数,可以在数据空间中获得较为理想的数据描述边界。
考虑图1所示的两维一类样本分布,如采用一般的方法进行数据描述操作,所得结果如图1(a)所示,以高斯径向基函数作为核函数,采用核方法进行数据描述操作所得结果如图1(b)所示,显然采用核方法后的结果要合理得多,因为它很紧致,基本上没有多余的空间。此外基于核方法的数据描述方法能降低噪声数据的干扰调整核函数式中的参数e可得到的如图2所示的非常有趣的一种现象:当e较大时,所形成的分类区域较大,随着e的减小,边界越来越紧致,但是当e减到某一临界点时,分类区域被分割成几个孤立的小块,如图2(c)所示。当然,随着e的进一步减小,最终会形成每一个样本点对应一个小的区域,也就是说,每一个样本点都是支持对象。造成图2所示的这种现象的原理其实也比较容易解释,因为c越小,对应的高斯函数越尖锐,所形成的“小山包”也就小而陡,即辐射能力小。
不难看出,图2(c)可用于聚类分析。
3科技园区域创新能力智能评价
3.1科技园区域创新能力评价指标体系
根据层次分析法,可建立中国科技园区创新能力评价指标体系如图3所示
创新资源投入能力研究开发与孵化能力技术创新扩散能力创新主体能力•产业政策创新园区管理创新激励机制创新企业内在制度创新•智力资源支撑能力经济技术支撑能力基础设施支撑能力信息资源支撑能力生活环境支撑能力图3表明,科技园区域创新能力包括技术创新、制度创新和支撑创新三个主要方面其中制度创新能力是评价区域创新能力的软件因素,相关的各项具体指标的得分有赖于有经验专家的评定,主观因素大,且往往不易得到。
根据图3所示的指标体系及相应各指标对应的权重,通过对中国52个国家级科技园区(不含杨凌农业示范区)有关数据的收集与处理,得到1999年各个科技园区的技术创新能力和支撑创新能力如表1所示
3.2基于数据描述的科技园区域创新能力智能评价
图4(a)是表1中各科技园区创新能力数据的图形化显示,图中清楚地表明数据分布极不均匀,大部分数据集中在左下角,这对数据的分析既不方便也不合理。为此,对原始数据求对数,所得结果如表2,图形化显示如图4(b)所示。各图中横坐标对应技术创新能力,纵坐标对应支撑创新能力。
与图4(a)相比,图4(b)中数据样本的分布要匀称得多。
选择高斯径向基核函数
对图5稍加分析,即得到如表3所示的聚类结果在表3中,将技术创新能力分为5个等级,支撑创新能力分为4个等级
与传统的科技园区定量分析方法相比,基于数据描述的科技园区创新能力评价方法摆脱了简单的线性排序,而提供了更多的信息,使各科技园区更为清晰地看到了自身所具备的优势和存在的不足。以广州为例,该科技园区具备良好的支撑创新能力,但技术创新能力显然不够,以至严重影响了其整体创新能力。下一步努力的目标应增加创新资源的投入、提高研究开发与孵化能力、注重技术创新的扩散能力以及培植创新主体能力,最终,使技术创新能力得到提高,从而使整个科技园区的创新能力处于更高的地位。
4结论
随着科技园区的发展壮大,对科技园区的评价研究也越来越受到研究人员和管理工作者的重孤对科技园区的合理评价,有助于各科技园区的准确定位,从而对科技园区的全面、协调发展能够产生有力的推动。基于数据描述的聚类方法,属于人工智能研究的前沿,相关的理论研究和实际应用还有待于进一步的深入,包括数据描述本身的研究和如何更好地与应用对象相结合两方面。但其与常规聚类方法相比所表现出来的优势,已受到广泛的重视。本文将将基于数据描述的聚类方法应用于科技园区的综合评价中,与现有方法相比,所得结果不但直观,且能提供更多的信息,但计算量较大。
下一篇:智能照明控制系统的设计