面向专利的电子信息产品TBT预警研究
摘 要:本文面向专利进行文本挖掘,通过主题词抽取确定技术热点及其技术发展趋势,通过技术发展趋势进行TBT预警,通过实例验证说明是一种有效地TBT预警方法,也是文本挖掘技术在TBT预警领域的补充和扩展。幸福的米粒
关键词:专利 文本挖掘 TBT预警
根据世界知识产权组织(WIPO)的统计,90%~95%的研发成果包含在专利文献中,专利文献公开的技术有80%以上未出现在其他技术文献中,全世界90%以上的发明创造信息都是首先通过专利文献反映出来。专利作为技术信息最有效的载体,囊括了全球90%以上的最新技术情报,相比一般技术刊物所提供的信息早5年~6年,而且内容翔实准确。技术标准化存在的一个现象是,技术标准越来越与专利技术联系在一起,专利被不断包容进技术标准中,这无论是在作为正式标准的法定标准还是事实标准都是如此。专利文本挖掘就是利用文本挖掘技术从特定领域的专利中发现潜在的、合理的、对决策有价值的知识。
一、专利文本挖掘在TBT预警中的应用
文本挖掘是利用一系列的数据挖掘技术,从大量的无结构的文本数据中发现潜在的、可能的数据模式及内在联系,获得对用户有价值的知识。文本挖掘在生物医学、邮件过滤、专利分析,舆情监测等领域有广泛的应用研究。本文利用文本挖掘技术对进口国专利进行分析,及时发现进口国技术的动向,是TBT预警中的有效方法。
二、专利文本挖掘TBT预警过程
面向专利的文本挖掘即利用文本挖掘技术的对大量的专利进行分析,从而获得潜在的、可能的数据模式及内在联系,获得对用户有价值的知识。本文运用Text Mining for Clementine对收集到的大量专利文献进行文本挖掘,基本步骤如下:
1.专利数据收集、筛选:专利数据收集是根据具体的需求从原始专利数据库中抽取并汇总成与文本挖掘任务有关的源文本数据的过程。根据本文的实际需要,确定专利检索地区、申请区间。选定进口国比较有权威性的专利库作为数据收集的来源。
2.主题词抽取:用Text Mining for Clementine中的Text Extraction node抽取专利文献的主题词,以含有该主题词的专利数量排序,这样可以清晰显示哪些主题词在专利文档中占的比例最高。
3.技术热点确定:主题词在专利文档中所占的百分比作为技术热度,技术热度越高,则设置技术性贸易壁垒的可能性越大。
4.技术趋势分析:将各个时间点的技术热度放在时间轴上分析其变化趋势,依此来预测将来的关注度变化,如果持续走高,则可认为必然会成为新的技术性贸易壁垒,做出预警。
三、以美国专利文献数据库为例进行专利文本挖掘
1.专利信息收集
选定具有权威性的USPTO Patent Databases(美国专利商标局USPTO网上专利文献数据库)作为数据源,收集2007年1月至12月的关于电子信息产品的所有专利,本文通过对2007年各个月份的专利文献进行文本挖掘,确定电子信息产品领域技术热点,得出技术趋势图,根据技术发展趋势的走向判断实施TBT可能性,以2007年1月的专利文献为例进行挖掘。
2.主题词抽取
利用Text Mining for Clementine中的Text Extraction node对2007年1月的关于电子信息产品专利进行主题词抽取,结果如图1所示,在2007年1月,关于计算机类产品、电子设备类产品、通讯类产品的专利分别约占总数的55.36%、39.88%、10.12%,关于能量问题、噪声问题的专利分别约占总数的13.10%、13.10%,说明在未来时期,设置技术性贸易壁垒的可能性比较大,应该通知相关企业密切关注。
图1 主题词抽取图
3.技术热点确定
通过以上分析,根据主题词在文档中所占的百分比即为技术热度,可确定2007年1月技术热点涉及计算机类产品、电子设备类产品、通讯类产品、能量问题和噪声问题。
4.技术变化趋势分析
按照以上步骤对2007年后11个月的数据进行分析,发现computer 、energy和noise为共有的主题词,将这12个月的技术热点进行统计分析,三者的技术发展趋势图如图2所示:
图2 技术发展趋势图
警情分析
将各个时间点的热点技术关注度放在时间轴上分析其变化趋势,依此来预测将来的关注度变化,如果持续走高,则可认为必然会成为新的技术性贸易壁垒。
从计算机类产品、energy和noise的技术趋势图可以看出,在2007年12个月中,关于计算机类产品、energy和noise的技术一直在增长,相关的专利技术比较多,持续的时间长,可预见在未来相当长的时间内,计算机类产品、energy和noise的相关技术备受关注,认为其可能会成为新的技术性贸易壁垒标准。根据以上分析,向计算机产品企业发送预警信息。认为电子信息产品能耗方面和噪声方面会成为新的技术性贸易壁垒标准,对电子信息产品能效标准提出新的要求。
参考文献:
[1]刘玉琴 汪雪锋:基于文本挖掘技术的专利质量评价与实证研究[J].2007
[2]翟东升 王明吉:专利地图在技术性贸易壁垒预警中的应用.图书与情报,2006(1)
[3]冯晓青:企业技术标准与专利战略研究[J]. 科学管理研究,2007(4)
[4]Yuen-Hsien Tseng Chi-Jen Lin Yu-i Lin:Text mining techniques for patent analysis[J].Information Processing and Management,2007
上一篇:高职计算机软件专业实训研究