中医药信息标准化研究进展
摘要:中医药信息标准在中医信息化中发挥着基础性和关键性的作用。近年来,中医药信息标准化取得了一系列突破性成果。本文介绍了国内在中医药术语标准化和中医药数据标准化等方面的主要工作进展,以及国际标准化组织和世界卫生组织等国际组织在中医药信息标准化方面的工作动态。分析了中医药信息标准化建设存在的问题及解决办法:亟需建设中医药信息标准体系的基本框架,培养中医药信息国际标准研制的专业队伍,深入探讨中医药信息标准化领域的理论和方法。
关键词:中医药信息学;信息标准;中医药术语标准;中医药数据标准;综述
中医药信息标准在中医药标准体系中处于基础性地位,在中医信息化中发挥关键性作用。中医药信息标准规定了信息采集、传输、交换和利用时所采用的统一的规则、概念、名词、术语、代码和技术[1]。中医药信息领域的标准化以中医医疗领域信息标准及其与西医信息标准的关系为研究重点,同时对中医药管理信息、中药信息、中医文献信息以及中医科学研究有关的信息系统可采标准进行研究,旨在使中医药信息和数据达到兼容和一致,减少信息和数据的重复和冗余,促进各个独立信息系统间的“互操作”。目前,国内中医药信息标准化工作的重点是术语标准和数据资源标准的研制,在中医药学主题词表、中医临床标准术语集、中医药学语言系统等领域取得了一系列突破性成果。另外,随着中医药广泛地走向世界,其巨大的医疗价值和市场潜力日益显现,中医药标准化的国际呼声和需求亦日益高涨[2]。为此,我国中医界积极参与国际标准化组织(ISO)和世界卫生组织(WHO)的标准化工作,力争逐步实现中国中医药信息标准的国际化,为中医药信息和知识资源的国际化奠定基础。笔者现就国内在中医药术语标准化和中医药数据标准化等方面的主要工作进展,以及ISO和WHO等国际组织在中医药信息标准化方面的工作动态作一介绍。
1我国中医药信息标准化工作进展
1.1中医药术语标准化工作
术语是专业领域中概念的语言指称(GB/T10112―1999《术语工作:原则与方法》)。中医药术语标准是中医药信息化建设的基础,只有在统一概念和术语的基础上,才能实现信息的规范化表达和有效传播,进而实现信息的深度共享和综合利用。为此,我国中医界研制了一系列术语标准,包括全国科学技术名词审定委员会2005出版《中医药学名词》、世界中医药学会联合会2007年出版《中医基本名词术语中英对照国际标准》,以及发布的国家标准(GB/T20348―2006《中医基础理论术语》、GB/T16751.1―1997《中医临床诊疗术语・疾病部分》、GB/T16751.2―1997《中医临床诊疗术语・证候部分》、GB/T16751.3―1997《中医临床诊疗术语・治法部分》、GB/T12346―2006《腧穴名称与定位》、GB/T13734―2008《耳穴名称与定位》)。近年来,术语规范研究主要集中在中药类术语[3-5]、中医证候类术语[6]、症状体征类术语[7-8]等方面。“十一五”课题“中医疾病分类代码等基础标准示范研究”(2006BAI21B03)术语规范化研究包括:《针灸学通用术语》《中医临床诊疗术语・症状部分》《中药学术语》《中医内科学术语》《方剂名词术语》《中医诊法术语》《脏腑病机基本术语标准》《中医外科学基本术语》等[9]。另外,该领域还出现了分类代码标准、主题词表和结构化术语集等信息资源,它们一般也可归入术语标准的范畴,下面分别进行介绍。
1.1.1分类代码标准分类代码标准通过赋予代码方式规定了一系列类别或范畴,用于对领域对象进行合理分类,从而优化领域信息组织、检索和交换。这方面有国家标准GB/T15657―1995《中医病证分类与代码》、国家军队标准GJB791.22―1990《全军后勤物资分类与代码・中药类》、卫生行业标准WS/T118―1999《全国主要产品分类与代码第1部分:可运输产品(中药部分)》。并开展了《中医内科信息分类与代码》《中医针灸信息分类与代码》《中医骨伤推拿信息分类与代码》等标准的研究工作[10]。近几年发布了5个中药编码相关的标准,其中2项地方标准由上海市质量技术监督局发布:DB31/T703―2013《小包装中药饮片包装剂量规格与色标》、DB31/T826―2014《中药饮片包装编码与条码表示》。3项国家标准2015年新发布,实施时间均为2015年12月1日:GB/T31773―2015《中药方剂编码规则及编码》、GB/T31774―2015《中药编码规则及编码》、GB/T31775―2015《中药在供应链管理中的编码与表示》。
1.1.2主题词表主题词表,又称叙词表、检索表或词库,是一些规范化、有组织、体现主题内容、已定义的名词术语集合体。作为文献与情报检索中用以标引主题的一种检索工具。在医学领域,由美国国立医学图书馆编制的《医学主题词表》(MeSH)已被国际广泛采用[11]。《中文医学主题词表》(CMeSH)[12]是中国医学科学院医学信息研究所出版的MeSH中文版,用于中文医学文献的标引、编目和检索。但MeSH与中医相关的词条只有“气”“阴阳”“经络”等几条,被归入“传统医学”之下的“中国传统医学”,这显然不能满足中医文献标引的需求。
中国中医科学院中医药信息研究所(IITCM)编辑出版了《中国中医药学主题词表》[13]及与之配套的标引手册,以与MeSH兼容为原则,成为全球范围内医学界进行中医药文献标引的依据。该词表于1987年正式出版,1996年出第2版,2008年出第3版,2015年12月网络版发布。该词表具有编制技术先进、词表体系结构科学、词语标准规范、收词完备、一表多用、实用性强、与国际权威医学词表MeSH兼容等特点,在促进中医药学词语标准化和中医药学数据库建设的标准化上发挥着巨大的作用[14]。网络版《中国中医药学主题词表》基于词表编制原则,根据词频统计和数据库检索结果,确定需要新增、删除、修改主题词[15-17],目前收录主题词8437条,入口词13966条。
此外,1987年出版的《中医药主题词表》[18]更多考虑了中医学科特点,与MeSH有较大距离,有研究者认为使用该词表在一定程度上增加国际交流困难[19]。
1.1.3结构化术语集在信息科学领域,本体是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统中使用。近年来,本体技术以其强大的知识表达和推理能力在医学领域中得到了广泛应用。如“统一医学语言系统(UnifiedMedicalLanguageSystem,UMLS)”是由美国国立医学图书馆(NLM)开发的一套医学语言系统,它实现了一系列知识组织系统的整合与传播,覆盖范围相当广泛[20]。
从2002年开始,IITCM借鉴UMLS的成功经验,以本体论方法为指导,研制了“中医药学语言系统(TCMLS)”,对中医药学的名词术语进行了系统梳理,构建了中医药概念术语的层次结构和复杂语义网络[21]。TCMLS已收录约12万个概念、30万个术语及127万条语义关系[22],并建立了基于中医药学语言系统文献检索平台[23]。在应用上,于氏等[24]采用“简单知识组织系统(SKOS)”技术规范,将中医药学语言系统转换为可在万维网上发布的SKOS本体,为各种语义网应用程序提供概念、术语和知识服务。
“中医临床术语系统”是一个专门面向中医临床的大型术语系统,已收录11万多条概念词、27万多个术语,内容覆盖中医物质、临床所见、病证、操作、治则治法和中药等中医临床知识各个领域[25]。该系统有望成为中医临床信息化建设的基础,在中医临床实践、理论研究和新药发现中发挥重要作用。为促进系统完善,目前研究围绕在改进系统措施、系统顶层概念分类框架等问题上[26-27]。
“中医古籍语言系统”[28]在“中医药学语言系统”基础上构建,将古籍术语分11类:阴阳、五行、藏象、疾病、诊断、治疗、本草、方剂针灸、医疗器具、摄生和相关知识,大体上可以包含古籍中涉及的概念知识点。使用和调整“中医药学语言系统”中77语义类型,增加2个语义类型“症状或体征”“疗法”[29]。目前收录概念3843个、关系术语26149个。
“传统针灸知识体系语义网络”[30]对针灸知识进行梳理,将针灸知识本体分为8个大类:刺灸、形体官窍、治疗、病候、经络、脏腑气血津液、腧穴、针灸用具。目前收录概念术语939条、语义关系16个。这些系统验证了本体技术在中医药领域的适用性,为新的技术路径在中医药术语规范化领域的应用进行了有益探索。
1.2中医药数据标准化工作
中医药行业数据库建设起源于20世纪80年代,已建设了近百个规模不同的中医药数据库,初步实现了中医药信息数字化[31]。然而,这些数据资源在数据结构、数据编码和数据语义等方面仍存在着巨大差异,不利于数据在组织之间的共享。为加强数据建设的顶层设计,实现中医药数据资源的有效整合,迫切需要构建中医药数据标准体系,实现中医药数据资源的标准化。数据标准化是按照预定规程对共享数据实施规范化管理的过程,其相关标准包括数据集分类与编码标准、元数据标准和数据元标准等[32]。1.2.1数据集分类与编码标准数据集分类与编码标准,规定了对特定领域中的数据集进行分类和编码时要遵循的原则与方法,对数据集的分类管理及数据分类导航具有重要意义[33]。陈氏[34]研制了中医药科学数据集分类与编码标准,采用面分类法将中医药数据集分为中医药事业、中医、中药、针灸及古籍5大类,并在每个“面”下,应用线分类法分成若干层级的类目,形成了一个有层次的、逐级展开的分类体系。该标准能支持中医药科学数据集的制作、管理、查找和共享等目的。范氏等[35]以相关标准和分类方法作为参考依据,提出了一套中医药数据资源的分类标准,编写了《中医药学数据资源手册》(第1稿)。该分类方案基本涵盖了所有中医药数据资源,为中医药数据资源的调查与规划,以及数据集的组织、整合、汇交、发布和目录查询,提供了系统、规范、实用的分类和编目办法。
1.2.2元数据标准元数据(metadata)是“定义和描述其他数据的数据”(GB/T18391.1―2009《信息技术元数据注册系统(MDR)第1部分:框架》)。元数据以数据集作为描述对象,描述数据集的外部信息。元数据标准为各种形态的数据资源提供规范和统一的描述方法,在数据资源的管理与利用中发挥着日益重要的作用。目前,在国际上应用最广、影响最大的元数据标准被称为都柏林核心元数据元素集(DC)[36],它定义了一组最为核心的术语,通用性强,可用于描述各种资源。我国2010年修改采用ISO标准等资料,发布了中国国家标准GB/T25100―2010《信息与文献都柏林核心元数据元素集》。林氏等研制《中医数据集元数据规范》,它是在DC、科技部《科学数据共享元数据》及《医药卫生科学数据共享元数据标准》基础上制定的一套元数据标准,能基本覆盖中医学数据集的共性元数据[32]。谷氏[37]对中医古籍数据标准化开展研究时,进行了中医古籍元数据研究。
1.2.3数据元标准数据元(dataelement)是用一组属性描述其定义、标识、表示和允许值的数据单元(GB/T18391.1―2009)。数据元标准为数据交换提供了在“数据”层面上统一且可共同遵守的数据交换规范[33]。我国在完成健康档案和电子病历基本框架与数据标准研制的基础上,通过提取公用数据元,初步形成了卫生信息数据字典。2009年12月25日启用“国家卫生数据字典与元数据管理系统(试用)”()。2012年,卫生部通知发布的《电子病历基本数据集(征求意见稿)》中包括了“中药处方子集”“中医住院病案首页子集”等面向中医的数据元子集,适用于指导和规范中医电子病历基本信息采集、存储、共享及信息系统的开发。中医专家已开始借鉴相关行业的数据元标准,遵循WS/T303―2009《卫生信息数据元标准化规则》、WS363―2011《卫生信息数据元目录》等卫生行业标准,研究中医药数据元的提取规则与分类方法,从各种中医药数据库、住院病案中提取数据元,从而构建面向中医药领域的数据元目录[32,38]。
2国际中医药信息标准化工作进展
目前,中医药在世界各地迅速普及,为提升中医药在国际市场上的竞争力,促进中医药知识资源在国际间的传播和共享,需要进一步加强中医药国际标准的研制工作。近年来,我国中医界积极参与ISO和WHO的工作,取得了一系列突破性成果。
2.1国际标准化组织的相关工作
ISO是世界上最大的国际标准研制机构,已发布19000多项国际标准,覆盖各个技术和制造领域,大大促进了经济和技术的发展。
在我国中医界倡议下,ISO于2009年成立了面向中医药领域技术委员会(TC),暂定名为“TraditionalChineseMedicine”,缩写为“ISO/TC249TCM”,秘书处设在中国[39]。ISO/TC249工作范围是研究制定与贸易相关的中医药技术、信息、术语、服务、专用产品设备等相关标准[40]。ISO/TC249成立工作组WG5“InformaticsofTCM”,开展中医药信息学领域标准研发工作。中国中医科学院中医药信息研究所于2011年向ISO/TC249提交了“中医临床术语系统分类结构”国际标准项目提案[41],2013年7月启动立项投票并获通过,2014年10月通过委员会草案(CD)投票,目前在询问阶段标准号与名称为“ISO/DIS19465:TraditionalChineseMedicine-CategoriesofTCMClinicalTerminologicalSystem”,该标准是表示一个基于中医临床术语的核心分类框架,可帮助构建稳固的逻辑化的中医临床术语系统。
ISO健康信息学技术委员会(TC215),旨在研制健康信息领域及健康信息与通讯技术领域的标准。ISO/TC215于2009年4月正式设立了传统医学任务组(TMTF),其主要工作任务是:①确定传统医学(TM)的标准需求;②提出新的传统医学工作提案;③审阅新的工作提案以判断哪部分内容可以融入传统医学的需求[41]。我国2008年成为ISO/TC215正式成员(P成员国)后,向其提交了一系列标准项目提案。2014和2015年正式发布3项技术规范:①ISO/TS19738:2014Healthinformatics-semanticnetworkframeworkoftraditionalChineselanguagesystem(中医药语言系统语义网络框架),该技术规范为中医药学术语信息系统和本体创建提供了语义标准;②ISO/TS17948:2014Healthinformatics-TraditionalChinesemedicineliteraturemetadata(中医药文献元数据),该技术规范为中医药学文献资源提供了一套通用的描述元素;③ISO/TS16277-1:2015HealthInformatics-ProfilingFrameworkandClassificationforTraditionalMedicineinformaticsstandardsdevelopment-Part1TraditionalChinese,JapaneseandKoreanmedicine(健康信息学-传统医学信息标准开发的描述框架和分类方法-第1部分),该技术规范提出一套传统信息标准体系的三维描述框架,实现信息标准开发与管理的顶层设计。2.2世界卫生组织的相关工作
近年来,WHO对传统医学标准化工作高度关注,加大了相关国际合作的支持力度,并成立了西太区办事处,专门开展了有关传统医学标准化的多项工作,包括术语标准、针灸穴位标准,以及循证传统医学临床指南等[40]。自2005年由WHO西太区办事处倡导首次传统医学信息标准化非正式咨询会议,以中国、日本、韩国等为主要代表的多国研究人员及其政府对此项工作相当重视,并积极行动,推动了有关传统医学信息标准化工作的国际合作[42]。
WHO于2010年宣布启动“传统医学国际分类(ICTM)”这一项目,旨在实现传统医学术语和分类体系的规范化,为诊断和治疗等活动提供一个用语规范的传统医学知识库[43]。中、日、韩等国专家参与了ICTM项目。ICTM将首先考虑中医药领域的标准化问题,这有利于中医药学在全球范围内的推广和整合。另外,WHO拟在《国际疾病分类(ICD)》的新版本ICD-11中加入中医药等传统医学的相关内容,中国于2010年提出了ICD-11传统医学部分的推荐方案,强调了将中医药学纳入ICD-11的内容结构和技术框架[44]。正在修订的ICD-11中加入中医药等传统医学的相关内容,目前已进入草案审核阶段。这些工作都将为传统医学的发展和其国际空间的拓展创造良好条件。
3存在的问题和建议
综上所述,中医药信息标准化工作在21世纪初取得了快速发展,初步建立了中医药名词术语的标准体系,在WHO和ISO等国际标准化组织的工作中取得了一系列突破。然而,在中医药领域,信息标准的研制仍滞后于信息化建设。许多方面仍缺乏公认的标准,影响和阻碍了组织间的相互协作和资源整合。信息标准化已成为制约整个信息化工作开展的关键瓶颈。各类标准化工作的进展也不平衡,如术语标准化工作开展较早且已取得突破,但中医药数据标准不多,信息系统和仪器方面的标准化工作则基本上是个空白。“数据孤岛”现象已成为困扰中医药信息化事业发展的老大难问题,其中一个重要原因是缺乏一套行之有效的数据标准。数据标准化领域虽已开展了一些研究工作,出台了一些标准草案,但大都不够成熟,尚处于研制中。因此,今后有必要加强中医药数据标准的研制、发布和推广等工作,规范数据库建设行为,推进数据资源的共享和利用。
与西医及其他领域相比,目前中医药领域的信息标准化工作仍相对滞后。如截止到2015年10月27日,ISO/TC215已正式出版150个国际健康信息标准,其中其中只有3项针对传统医学的信息标准。我国中医界在国际标准化方面起步较晚,在国际标准化组织中参与的工作相对较少。但出于中医药国际推广的需要,我国在传统医学国际标准化工作方面应与时俱进。为此,需要组建一支中医药信息国际标准研制的专业队伍,积极参与国际标准化组织的活动,深入理解国际标准制定的规则,推进中医药信息国际标准的研制工作。
目前,中医药信息标准化工作仍缺乏一个顶层设计,各标准化组织之间缺乏协调,这将导致标准之间缺乏兼容性,难以配合使用。中医团体需要对中医药信息标准化工作做一番统筹规划,建立标准体系框架,并在行业内达成共识。可通过“自上而下”管理驱动的方法建立信息标准体系框架,以及“自下而上”业务驱动的方法建立中医临床信息概念模型;基于中医临床特征信息元素的值域,分析中医临床信息标准的需求,从而构建中医临床信息标准体系表[45]。在标准体系框架的基础上,各组织可加强交流,进行合理分工,明确各自的目标,以达成信息标准化工作的协调发展。
4小结
目前,我国中医界近年来在信息标准化领域尽管取得了一系列突破性进展,但该领域尚未形成科学、完整的信息标准体系,信息标准化工作还有很长的路要走。因此,今后要深入研究中医药信息标准化领域的理论和方法,加强中医药术语、数据和信息系统等方面的标准研制工作,逐步完善中医药信息标准体系,并实现中医药信息标准的国际化,从而推动中医药信息化事业的全面、协调、可持续发展。
作者:董燕于彤朱玲张竹绿李海燕。本文来自《中国中医药信息》杂志
上一篇:中医眼科研究生培养模式研究
下一篇:再谈中医骨伤科思想理念