中医古籍资源数据库及阅览系统的功能设计与实
作者:李斌,符永驰,王蕊,孙海舒,李兵
【摘要】 以中国中医科学院中医古籍阅览系统为例,简述中医古籍资源数据库及阅览系统的功能设计思路和实现的内容。中医古籍阅览系统的主要内容和功能包括:中医古籍的基本信息、电子中医古籍的分类、检索功能、系统管理功能等。利用数字化手段整理开发我国丰富的中医典籍资源,对中医药学的传承和发展具有积极意义。
【关键词】 中医历代典籍;数字化;中医药古籍资源数据库;中医古籍阅览系统
abstract: objectiveto establish the analytical method for the fingerprint of the volatile components of folium apocyni veneti by headspace gas chromatographymass spectrometry (hsgcms) technique, and to estimate the quality of folium apocyni veneti from different habitats. methodsthe volatile components of folium apocyni veneti from different habitats were analyzed and the chromatographic fingerprint were determined by hsgcms. the data were analyzed by fuzzy cluster and the similarity of different fingerprint patterns was calculated and analyzed. resultsthere were 14 main characteristic components found in the volatile components of folium apocyni veneti. hsgcms fingerprint of 14 main peaks was established preliminarily. conclusionthe method is reliable, accurate and with good reproducibility, which can be used for the quality control of folium apocyni veneti.
key words: folium apocyni veneti/chemistry;volatile components/analysis;
中医古籍承载着中医学数千年来积累的丰富的理论知识和临床经验,是中医药学理论的源泉和实践的有力指导。中医古籍的整理和利用是推动中医药学发展的动力。采用信息技术对中医古籍进行整理开发是一个系统工程,数字化古籍兼具保护和利用功能,以其信息量大、检索快捷方便、不受时空限制等特质,使古籍使用者的效率大大提高[1]。
“中医药古籍资源数据库”是科技部科研院所社会公益研究专项《中医药珍贵典籍的保护技术及相关问题研究》项目组所建立的系统。“中医古籍阅览系统”是数字中医古籍资源利用的窗口,阅览系统的功能直接体现了数据库的基本内涵,本课题组在中医古籍资源库的建设过程中根据数字中医古籍的特点,从管理和需求等方面设计了本系统的功能。
1中医古籍的基本信息
每一种中医古籍都有属于自己的基本信息,全面体现这些信息是本数据库的特点。中医古籍阅览系统设计的中医古籍基本信息包括:书名、作者、馆藏地、书籍版本、保管措施、书籍特征、复制状况、内容提要及图片数(书册页数)共9个部分。中医古籍除了书名、作者、版本、馆藏地外,书籍特征、保管措施、复制状况对古籍的管理研究同样重要,这些内容在相关的中医古籍目录书册中是没有的,最新出版的《全国中医古籍总目》中也未体现。在阅读系统中阅读时可得到如下内容(见表1),这样可使读者对阅读的古籍的基本情况一目了然。表1 中医古籍阅览系统所包含的内容(略)
一般古典医籍湿度为55%、温度为22℃;国宝和重要文化典籍要求湿度为50%、温度为20℃;防尘措施为定期用扫除机清扫;防虫措施是使用熏蒸溴化甲醇防虫。 书籍特征325页,正文高19.8 cm,正文宽13.3 cm,半页10行,20字/行;书品状况良好。复制状况拍照;35 mm胶卷 。内容提要该书从《本草纲目》撮要节取有关内容,改写重编。其书分43类,共载药371条(其中或将一类药集为一条,如瓜、蛇类等)。除浓缩《本草纲目》药物功效主治外,该书还集录众多药物相关的典故诗文,间或表达作者个人用药鉴药心得和经验。书前“本草原始”一篇,为本草典籍简介,共载本草42种。 图片数目 502 2电子中医古籍的分类“中医药古籍资源数据库”采用《中国中医古籍总目》分类法分类。按医经、基础理论、伤寒金匮、诊法、针灸推拿、本草、方书、临床各科、养生、医案医话医论、医史、综合性著作、其他等,将电子中医古籍分为13大类。每大类下再细分子类,并以树状结构显示,保留了中医古籍习惯分类,同时也增加了检索阅读途径。中医药古籍资源数据库的中医古籍阅览系统中中医古籍分类概况见图1。
中医古籍阅览系统的设计目的是实现用户在线图文阅览。考虑到不同的检索需求,对系统的搜索平台设计包括了简单查询、组合查询和全文搜索功能3个层次。简单查询包括:书名、作者、馆藏地、内容提要检索功能;组合查询可对书名、作者、馆藏地、内容提要检索功能组合检索;全文搜索功能包括:图片&书籍、仅图片信息、仅书籍信息;模糊搜索、精确搜索;涵盖部分关键词、涵盖全部关键词的多样化检索功能。
3.1内容检索的实现中医药古籍资源数据库中的数字化古籍主要以图片形式存在,要实现内容的检索,就要对古籍图片进行加工处理。我们开发了《古籍编辑器》软件,用于对古籍图片元数据进行标注,古籍图片中的主要知识点就是图片的置标信息。如图片中反映的病名、证名、方、药等。为此我们制定了标注的基本原则标准。经过标注加工处理,实现了对图片内容的检索。这一方法较之全文检索大大地提高了检索的精度。
3.2准确快速检索的实现中医古籍阅览系统分别从静态页面处理、oracle索引、优化sql语句、目录图片分开搜索、生僻字管理等5个部分进行了优化提升。
3.2.1目录结构和电子古籍结构静态化处理技术由于目录结构和书籍图片结构具有非常好的数据稳定性,不会频繁修改,因此采用静态页面处理能极大程度提高目录和电子古籍结构的访问速度。
3.2.2采用oracle索引设计库表结构时,充分考虑到oracle索引对速度优化方面的优点,利用索引来提高数据库检索效率和性能。
3.2.3优化sql语句,提高sql查询速度sql查询语句对数据搜索影响非常大,不同的sql查询语句在时间响应方面可能相差数千甚至数万倍。因此,在编程实现搜索时,尽量优化sql搜索语句,以提高数据查询速度。
3.2.4目录内容和图片内容分开搜索通过分为古籍目录基本信息查询和图片标注查询可以分开查询的功能,能满足用户不需要图片标注信息时,只查询古籍目录基本信息而无需访问图片详细标注内容的要求。
3.2.5生僻字、繁简字对照表通过后控检索技术和生僻字匹配功能,实现对内容的精准检索。另外可以实现繁简汉字的互检功能。利用繁简对照功能,如将现代病名与中医病症关联,用现代病名可检索到相关联的中医病症内容。如设“糖尿病”与“消渴”、“上消”、“中消”、“下消”关联,用“糖尿病”检索可得到有关糖尿病的相关记录439条。
3.3现代语言检索的实现中医古籍的语言和现代常用语言有较大的不同,如中医古籍未出现冠心病、糖尿病、胃炎等病名,这种语言表述的不同成为了当今读者阅读、检索古籍的最大障碍。架设起一座桥梁,让读者能方便阅读和检索中医古籍是本课题组的基本想法。检索要有语言系统的支持,但因至今还无相关的语言系统,要建立中医古籍的语言系统有一定的难度。为解决这一问题,本课题组提出了编制后控词表的设想,这一想法通过中国中医科学院院级自选题的研究得到了实现。古籍阅览系统增加了后控词表检索功能后,系统已初步成功实现了现代语言检索,随着后控词表的不断完善,这一功能将得到加强。
4原图阅读
数字化古籍有多种形式,有文本化的,有扫描图像的。早期的古籍数字化图像多为黑白图像,因为黑白图像储存量小,运行速度快,但失去了原图的色彩,逼真感差。随着计算机和网络运行速度的提高,应用彩色图像已无障碍,所以本库在图像的制作和显示方式上保持了原图色,原图原貌的真实感可使读者如读原本古籍。这也是本数据库的设计特点之一。
5系统管理功能
在阅览系统的管理功能设计上,实现了书籍管理和用户管理功能。
5.1用户管理的实现
5.1.1用户权限管理分为普通用户、vip用户和管理员用户3级。普通用户可浏览古籍的基本信息和检索查询,但不能阅读到古籍原图,要阅读古籍需向管理员提出申请,批准后可阅读被批准的单本古籍;vip用户可以阅读全部古籍,不需申请;管理员用户具有阅读、用户权限审批以及古籍导入等系统中的全部功能。
5.1.2站内短消息互动平台通过系统内收发短消息,实现读者与系统管理员之间进行古籍借阅信息交流,方便读者对系统的使用。
5.2书籍管理的实现
5.2.1电子古籍的导入打包好的电子古籍文件可通过数据导入窗口直接进行单独或批量上传到数据库中。
5.2.2电子古籍借阅信息统计分析通过“阅读明细”和“图书统计”功能实现对读者借阅信息进行统计分析。从而有效地获取读者对古籍的实际需求信息,更有目的地为读者服务。
5.2.3电子古籍借阅管理通过“预约审批”和“读者统计”功能来加强管理员对电子古籍借阅的管理。
5.2.4电子中医古籍数据和版权的保护通过屏蔽系统浏览界面和鼠标右键的拷贝、粘贴、打印功能,实现保障电子中医古籍数据在传播与利用过程中的数据安全、防止数据流失。并对部分古籍图片进行了加水印的版权保护处理。
6古籍学术论坛
古籍学术论坛分为主页面和后台管理页面。主页面即讨论区页面,分为古籍目录学、古籍文献学、古籍版本学、古籍培训4个专区。用户注册后可分别在各专区发帖进行交流互动。后台管理页面主要是管理员操作界面,可对论坛各专区、讨论内容、用户进行维护及管理。古籍论坛的建立,为读者和古籍从业人员提供了获取最新古籍研究成果、古籍培训信息、学术交流、服务咨询的一个交流平台。
7其他辅助功能
在系统中添加了关键词统计、历史年表、古今纪年换算、干支/公元纪年换算、六十四卦表等辅助工具,为古籍研究者对古籍数据进行多角度的分析研究提供了方便。
目前该系统采用oracle9i数据库,利用oracle text数据搜索,可实现古籍全书浏览,也可以进行简单检索、组合检索和全文检索;具有用户分级管理功能;具有辅助研究工具和在线交流论坛。已收录1 456种中医古籍的元数据信息和650多种中医古籍的原文图像,其中部分中医古籍已作文本化处理,实现图文关联。原文图像均采用全彩jpeg格式,具有古籍保护和利用的双重功能。该系统所有的中医古籍图像均经过关键词自由标引,结合后控检索技术和生僻字匹配功能可实现对内容的精准检索。“生僻字管理”功能的研发为 “中医古籍后控词表”的嵌入提供了接口,为中医古籍智能化检索的实现奠定了基础。完善后的“中医古籍阅览系统”是一个具有更加科学、便捷、安全、高效的古籍资源数据平台。利用数字化手段整理开发我国丰富的中医典籍资源对中医药学的传承和发展具有积极意义 。
【参考文献】
[1]符永驰,李斌,郭敏华,等.中医古籍电子化系统的研究与实现[j].中国中医药信息杂志,2008, 2:103.
下一篇:肿瘤患者的心理分析及护理