伊犁河谷植物区系物种资源数据库的发展策略
中图分类号:TP392
伊犁河谷是全国五大陆生生物多样性的分布区之一,但与国内其它山区植物区系研究相比较,伊犁河谷植物区系研究相对滞后。学术界和伊犁州政府关注伊犁河谷植物区系多样性的研究与保护,人大代表将伊犁河谷生物多样的研究和保护作为一项议案提交人大代表讨论,伊犁州政府在《实施生态立州战略构建和和谐伊犁的思路与对策研究》中将伊犁河谷生物多样的调查、研究和保护作为实施可持续发展的一项重要内容。
随着全球物种多样性的不断丧失,生态学家将对区域物种的调查、分类、物种资源库的创建视为21世纪生物学研究的核心内容之一。当前传统植物分类学和DNA条形码(DNA barcoding)技术的结合成为生物多样性的鉴别、保护和利用的主流思路。DNA条形码技术通过一个或几个基因片段鉴别物种,根据确定的基因段组合标准,可以对物种生成对应的DNA条形码。通过计算机技术和网络技术,将生物物种DNA条形码集合起来,组织它们的多态性、结构、性质以及相关描述(包括它们的科学命名、来源物种分类名称、参考文献)等信息的资料库,就是DNA数据库。通过建立DNA条形码数据库,可一次性快速鉴定大量样本,还可以将研究成果不断地加入数据库,成为永久性资料,从而推动分类学科更加快速深入地发展。目前,DNA条形码数据库已成为生物物种资源数据库的重要组成部分。
1 国内外植物区系物种资源数据库的发展现状
西方发达国家早在20世纪60年代就建立起用计算机管理的植物文档,到了80年代便形成了网络结构。国外的植物数据库系统数据量大,资料来源广泛,可靠度高,网络化程度高,与多媒体技术较好结合,数据结构比较完善,并且拥有比较多的大型数据库。由美国农业部自然资源保护局创建的“Plants Database”是现今世界上植物数据库系统的典范。
目前国内已经建成并公开发布的权威植物物种信息数据库是由昆明植物研究所、中科院植物所、武汉植物园和华南植物园联合建设的“中国植物物种信息数据库数据库”。它是一个符合国际和国家标准、有严格质量控制与管理、具有完整性和权威性、具国际领先地位的中国植物物种信息数据库。该数据库已于2011年初整合了来自《中国植物志》、《Species 2000》、《中国种子植物数据库》的中国植物物种名单,形成了目前较为完整的中国植物物种标准名录,并且整合了中科院华南植物园建设完成的植物染色体数据库。
中科院昆明植物所建设的“植物DNA条形码数据管理系统”主要依托中国西南野生生物种质资源库,根据植物DNA条形码的特点,研究并构建了重要植物类群的植物DNA条形码系统。
2011年初,通过建立新疆植物物种质资源数据库和信息共享系统等,新疆维吾尔自治区已初步构建植物遗传多样性有效保育和开发利用科技创新平台。
新疆植物学会已初步建成“生物多样性数据库”,但到目前为止“天山植物区系”仍在建设中。
2 构建伊犁河谷植物区系物种资源数据库的科学意义
在传统植物分类学和DNA条码技术结合生成的植物标本及分类信息的基础上,通过数字化手段将这些信息收集、处理、存储和传输,建设伊犁河谷植物区系数据库系统,通过Web方式发布,是整理和保存伊犁地区植物多样性资源成果并进一步辅助河谷植物多样性保护与管理的重要手段,对其加以合理利用具有重要的现实意义和实用价值:
(1)通过整理和保存伊犁河谷植物区系标本资源,备份伊犁河谷植物区系物种组成及其分布的重要资料,为科研、生产和实施可持续发展提供科学依据;
(2)通过建立DNA条形码数据库,为今后进行植物物种识别和鉴定提供便利,今后更可将新的研究成果不断地加入数据库,使其成为永久性资料;
(3)通过建设物种资源数据库为我院教师和学生提供伊犁河谷植物多样性资源的查询新途径;
(4)通过Web网站促进伊犁河谷植物多样性研究的区内外合作交流。
3 构建伊犁河谷植物区系物种资源数据库所要做的工作
对已搜集好的伊犁河谷植物物种多样性资源以及生成的DNA条形码进行数字化处理,制作数字化植物标本,并对Web平台的展示方式进行一定的研究和讨论,使用合适的数据库管理系统和相关多媒体信息处理技术及动态网页制作技术,按照已有的规范和标准,完成伊犁河谷植物区系物种资源数据库系统的设计与实现。
本数据库涉及伊犁河谷(包括八县一市)的植物物种。基于传统植物分类学标准,提供的数据内容主要包括:植物物种的标准名称、基本信息、系统分类学信息、生态信息、生理生化性状描述信息、生境与分布信息、文献信息等。普通用户利用该数据库可查询到相关植物数据、植物名称信息以及植物分布情况的详细信息。基于DNA条形码技术,将与DNA基因片段匹配的DNA序列文件以标准的文件格式存储起来。注册用户利用该数据库可下载DNA条形码进行后续的植物物种识别和鉴定工作。
建设B/S模式下的动态信息平台,通过公共网络接入,使用户能够使用浏览器进行植物数字化标本的管理、浏览、查询及资源共享等操作。
3.1 面向管理者的功能模块
(1)输入功能:将植物标本的文本和图片及实景视频等的相关信息录入到数据库中。
(2)修改、删除功能:通过程序实现对系统中标本信息的修改、补充或删除。
(3)文件导入功能:通过EXCEL文件导入DNA条形码数据,对应DNA序列文件在数据库中以文件名作为存储标识。
3.2 面向用户的功能模块
(1)物种信息检索:主要提供面向大众的植物信息、标本信息的查询服务,可实现多种途径的单一或组合查询。
(2)DNA条形码检索:主要提供面向专业人士的植物物种DNA条形码的查询和下载服务。
(3)图片及视频的使用:显示与播放植物标本的形态照片和用于描述植物生境的动态信息视频文件。
4 拟采取的方案
本项目采用的是基于J2EE应用服务器技术的B/S体系结构,Web服务架构如“图1”所示:
根据多种动态脚本及数据库管理系统的特点,确定使用具有运行环境独立于硬件配置和操作系统、灵活性高、可移植性强、使用组件开发方式、代码便于维护等优势的JSP作为生
成动态页面的脚本语言,采用开源的Web应用服务器Tomcat 作为虚拟服务器,采用与JSP高度兼容的开源的MySQL数据库作为数据库管理系统。使用基于Java的、开放源码的、可扩展的应用开发平台Eclipse,它提供了集成的Web和应用程序开发平台,并且可以通过插件来实现程序的快速开发。在Eclipse的基础上安装MyEclipse插件,它提供了包含CCS/JS/HTML/XML编辑器、创建Struts项目向导、编辑Hiberbate配置文件和执行SQL语句的工具。在使用MySQL的基础上,使用MySQL-Front图形用户界面对所建数据库进行管理,可以方便地进行数据库的修改、备份和加载。
5 构建伊犁河谷植物区系物种资源数据库的创新之处
目前还没有面向伊犁河谷的植物多样性研究的数字化成果,仅有的药用植物多样性分析也仅仅做到了数据收集,并没有通过数字化形式将成果保存并加以利用。
伊犁河谷植物区系物种资源数据库系统的设计与实现,针对伊犁河谷丰富的植物资源,利用计算机技术和网络技术,并且结合了传统植物学和DNA条形码技术研究成果,按照植物学规范收集、加工、存储和发布伊犁河谷植物多样性成果,制作数字化植物标本和构建伊犁河谷植物区系物种资源数据库,将为深入研究伊犁河谷植物区系物种组成、保护和合理利用植物资源提供第一手资料。
参考文献:
[1]许哲平等.中国生物多样性e-Science平台建设构想[J].生物多样性,2010,18(5):480-488.
[2]沈晓琳等.植物信息系统的设计与应用[J].电脑与电信,2011(08):34-36.
.西安:西安电子科技大学,2006.
[4]李瑞.基于MVC设计模式Struts框架结构的研究[J].大众科技,2009(6):63,66.
[5]曾桢.基于开源平台的网络教育平台应用[J].贵州教育学院学报(自然科学),2009(3):38-41.
[6]沈晓琳等.分布式植物标本数据库的设计与实现[J].电脑与电信,2008(08):20-21.
[7]林春蕊等.广西植物标本馆标本数字化信息统计与分析[J].广西植物,2008,28(2):278-284.
作者简介:马兰(1982-),女,回族,新疆人,讲师,研究方向:计算机应用技术。
作者单位:伊犁师范学院 电子与信息工程学院,新疆伊宁 835000