学科信息门户中网络信息导航系统的规范建设
发布时间:2015-07-04 09:30
【内容提要】根据国家科学数字图书馆(csdl)分布式学科信息门户及其学科信息导航系统建设的总体要求,描述了学科信息导航系统中资源选择、资源搜寻策略、元数据、知识组织体系、维护使用管理机制等的设计规范及其开放描述要求。
【摘 要 题】信息资源建设
【关 键 词】国家科学数字图书馆/学科信息门户/学科信息导航/设计规范
提出vocml[24]采用标准xml dtd方式来定义和描述叙词表和分类表及词表映射表,支持对词表的开放描述、解析、显示、交换和映射。
(3)主题图描述,即利用一定的知识组织体系, 对导航系统资源集合的主题内容结构、主题词汇、主题间相互关系以及主题与具体资源的链接进行描述,形成资源集合的主题图,可直接用于导航系统的知识化浏览,可建立资源集合的主题索引或交叉参照,还可链接复杂主题范围的分布式资源来建立虚拟知识体系,可通过主题概念与资源的不同链接在同一资源体系上建立面向不同主题体系或不同用户的资源界面。例如,xtm[25]利用xml语言标记主题图,从而用计算机可识别的开放方式标记资源集合的主题结构和链接,支持主题浏览和基于词表的智能检索。
(4)概念集描述,即建立符合学科领域要求、 用开放语言描述的概念集体系(ontology systems),利用概念集体系对信息资源内容进行语义标注或语义挖掘,形成基于语义的资源元数据。在此基础上,利用概念集中语义定义、语义关系定义和推理规则,实现基于语义的智能检索和浏览[26]。
实施递进建设的csdl学科信息门户,将首先严格按照元数据规范对知识组织体系进行说明性描述,然后支持以xtm 方式逐步深入地描述分类浏览结构,逐步研究和嵌入词表定义描述,并逐步研究和嵌入基于概念集的语义门户功能。l将通过标准和公开的应用规范对知识组织体系描述方式进行规定,并逐步建立相应的词表、主题图和概念集描述文件。
7 管理机制描述
学科信息门户及其导航系统的可靠运行和可持续发展取决于它在建设和运行中的有效管理以及相应管理机制的规范设计。在csdl学科信息门户中,与学科信息导航系统密切相关的管理机制包括资源组织机制、资源管理机制、元数据规范管理机制、用户使用控制机制等,其中资源组织机制已在前面的资源选择搜寻控制和资源元数据描述中予以讨论。
(1)资源管理机制, 通过一系列规范对学科信息导航库中资源内容的管理方式和程序进行规定,包括资源链接检验规范、资源更新规范、元数据记录维护规范、资源管理流程规范等。其中,资源链接检验规范根据不同资源的变化规律规定对这些资源的可链接性进行检验的时间间隔、检验方式和报告形式,资源更新规范规定对资源内容进行重新审查及其修改描述、修改标引与分类、修改评价信息、删除等处理的标准、责任分配、方式和有关技术要求,资源元数据记录维护规范检验元数据记录的唯一性、一致性、完整性和所链接的其他信息的有效性,资源管理流程规范则建立资源管理工作流程序和控制机制。
(2)元数据规范管理机制, 主要指对学科信息导航系统各种元数据规范和管理规范(包括本节涉及的管理机制规范)本身的管理规定,具体说明各种元数据规范和管理规范的描述格式和描述语言、内容描述或编码规则、公共存放位置(以支持开放搜寻)、公共登记要求(以支持元数据规范登记系统功能)、与相关资源内容的链接要求、与相关定义或标准文件的链接要求、范例记录编制及其存放与指向要求、版本管理制度、定期审查要求、审查责任人员、管理流程规定等,从而保证元数据规范或管理规范的有序、可靠和可持续管理。
(3)用户使用管理机制,指对信息资源使用的控制机制, 包括合法使用范围规范、用户身份认证方式、使用授权方式、使用审计程序、隐私保护政策等。需要区别狭义和广义的资源使用控制。针对学科信息导航系统,狭义控制指对导航系统内学科信息资源的使用控制,广义控制可能包括对导航系统中的扩展信息、词表数据、规范数据等的使用控制。无论是否限制用户范围,都应确定使用控制规范(因为不限制用户只是使用控制的一种特例),界定什么使用主体(subject )在满足什么条件(conditions)下可对什么使用对象(object)行使什么使用行为(actions)。这里,使用主体可能是用户或用户组、 用户代理或另一系统,使用对象可以是具体资源、资源范围或数据对象,使用行为包括读、写、改、转换、析取等,而条件可能是使用登记、身份认证、阅读版权申明、填写保证条款、支付费用等。其中某些条件的验证与实现可通过链接第三方程序来具体实施,例如身份认证、支付费用等。csdl学科信息导航系统将提供学科信息资源的公共浏览检索,但为统计使用情况、了解用户特点,需要进行(往往是隐蔽的)使用统计;对与学科导航信息相链接的用户讨论区、用户发表区等扩展信息和个性化定制等扩展功能,将限制用户范围、要求身份认证;支持各种规范数据的公共查询和阅读,但严格控制对它们的删改;另外,可能只允许其他csdl学科信息门户和授权用户批量搜寻和下载导航资源来支持分布式导航信息组织和集成定制。
8 学科信息导航系统的开放描述
所谓开放描述,指信息系统通过开放语言和规范方式来描述自己系统的数据对象、规则、管理控制机制和操作过程,支持系统间互操作和基于智能代理的运行操作与管理。通过开放描述,将形成关于本系统不同描述对象的描述文件,这些文件置于本系统公知位置或递交公共登记系统,第三方系统可以对这些描述文件进行搜寻,按照开放语言规则进行解析,从而使第三方系统(或智能代理)能自动地识别、理解本系统的格式和规则,并在此基础上实现系统间的互操作。开放描述并不要求采用统一的具体描述格式,而是规定描述时应遵循的基本原则、底层语义和语法表示方法、标准扩展方式、标准转换机制等,因此不同系统可采用符合自己需要的不同具体方法或格式来描述实际内容,从而在保障各个系统的特殊需要和本地控制的同时,支持描述信息的开放搜寻、识别和系统互操作。
对于csdl学科信息门户及其学科信息导航系统而言,开放描述可分为描述方式和描述信息公布方式两方面的要求,目前阶段公布方式可采用在学科信息门户web服务器公知目录下以公开文件名存放描述文件,支持第三方系统开放搜寻;当csdl元数据规范登记系统建立后,将描述文件提交登记系统进行公共查询。对描述方式,可有以下建议:
(1)资源元数据格式描述,采用dublin core作为元数据核心元素集,采用扩展元素或扩展属性从其他标准元数据集中复用相关元素来描述资源的其他特征,采用namespace方式命名所复用的元素或属性, 采用xml dtd或rdf方式定义整个元数据集,采用xml 标记和封装输出的资源元数据。
(2)知识组织体系描述,采用dc subject的encoding scheme属性描述资源元数据中标引分类词表,通过url 链接相应的定义文件或介绍文件;采用xtm描述导航分类体系, 其描述文件在一定的使用控制下也置于公知位置机制,供授权的第三方系统(例如其他csdl学科信息门户)进行查询和调用,支持资源元数据搜寻和整合;逐步支持用vocml 描述的主题词表,相应词表描述文件可能作为第三方定义文件在说明性描述中予以链接,支持嵌入的智能检索功能。
(3)管理机制的描述, 涉及面向内部的管理规范和面向第三方的管理规范,前者包括资源组织、资源管理、元数据维护等,后者主要是用户使用控制。面向内部的管理规范可以是文本文件或html/xml 文件,应存放在系统公知位置,供公共查询;但也可以用xml dtd 方式定义这些规范,一方面可支持这些规范的交换和复用,另一方面可支持对规范的自动解析和处理(当然需要尽量与国内外现有的开放描述格式接轨)。面向第三方的管理规范应尽量采用开放语言描述,例如用户使用控制可采用xacl[26]来规定具体控制规范,在涉及隐私保护时参照p3p[27]制定隐私保护的政策与程序。
(4)整体学科信息导航系统的描述, 可作为学科信息门户信息架构(information architecture)定义及其描述的一部分,采用wsdl[28]开放描述语言等方法,对基本信息(例如名称、uri、学科、 简要描述等)、管理者信息(例如运营者、运营系统、联系方式等)、管理机制信息(例如关于使用管理、权益保护、隐私保护、定制控制等的描述文件名称、uri、描述规范namespace等)、组织机制信息(例如元数据格式、知识组织体系、模块结构体系以及它们的uri 和描述文件地址等)进行描述,以便第三方系统搜寻和解析,支持学科信息导航系统的开放集成定制和作为第三方服务系统的开放嵌入。
我们还将在学科信息门户及其资源导航系统的建设中继续探讨上述问题的规范建设,并希望与国内外其他单位进行合作。
【参考文献】
1 subject based information gateways. 3 nordic interconnected subject-based informationgateways. final report. august 2000.
4 crossroads. /metadata/roads/crossroads/
5 isaac network. research/osaac/
6 imesh toolkit. /toolkit/
7 european link treasury.
8 distributed national electronic resources. /
10 张晓林.开放数字信息服务体系:概念、结构与技术.中国图书馆学报,2002(3)
11 ebxml. /
12 web services activity. /2002/ws/
13 bibliography on evaluating internet resources. documents/dces/
19 ieee learning object metadata. http://itsc.
20 olson n b. cataloguing internet resources: a manualand practical guide. 2nd edition. /
21 day m, cliff p. rdn cataloguing guidelines.
25 xml topic maps (xtm) 1.0 /
26 xml access control language. /
27 platform for privacy preferences. /tr/p3p/
28 web service definition language. /tr/wsdl/
【摘 要 题】信息资源建设
【关 键 词】国家科学数字图书馆/学科信息门户/学科信息导航/设计规范
提出vocml[24]采用标准xml dtd方式来定义和描述叙词表和分类表及词表映射表,支持对词表的开放描述、解析、显示、交换和映射。
(3)主题图描述,即利用一定的知识组织体系, 对导航系统资源集合的主题内容结构、主题词汇、主题间相互关系以及主题与具体资源的链接进行描述,形成资源集合的主题图,可直接用于导航系统的知识化浏览,可建立资源集合的主题索引或交叉参照,还可链接复杂主题范围的分布式资源来建立虚拟知识体系,可通过主题概念与资源的不同链接在同一资源体系上建立面向不同主题体系或不同用户的资源界面。例如,xtm[25]利用xml语言标记主题图,从而用计算机可识别的开放方式标记资源集合的主题结构和链接,支持主题浏览和基于词表的智能检索。
(4)概念集描述,即建立符合学科领域要求、 用开放语言描述的概念集体系(ontology systems),利用概念集体系对信息资源内容进行语义标注或语义挖掘,形成基于语义的资源元数据。在此基础上,利用概念集中语义定义、语义关系定义和推理规则,实现基于语义的智能检索和浏览[26]。
实施递进建设的csdl学科信息门户,将首先严格按照元数据规范对知识组织体系进行说明性描述,然后支持以xtm 方式逐步深入地描述分类浏览结构,逐步研究和嵌入词表定义描述,并逐步研究和嵌入基于概念集的语义门户功能。l将通过标准和公开的应用规范对知识组织体系描述方式进行规定,并逐步建立相应的词表、主题图和概念集描述文件。
7 管理机制描述
学科信息门户及其导航系统的可靠运行和可持续发展取决于它在建设和运行中的有效管理以及相应管理机制的规范设计。在csdl学科信息门户中,与学科信息导航系统密切相关的管理机制包括资源组织机制、资源管理机制、元数据规范管理机制、用户使用控制机制等,其中资源组织机制已在前面的资源选择搜寻控制和资源元数据描述中予以讨论。
(1)资源管理机制, 通过一系列规范对学科信息导航库中资源内容的管理方式和程序进行规定,包括资源链接检验规范、资源更新规范、元数据记录维护规范、资源管理流程规范等。其中,资源链接检验规范根据不同资源的变化规律规定对这些资源的可链接性进行检验的时间间隔、检验方式和报告形式,资源更新规范规定对资源内容进行重新审查及其修改描述、修改标引与分类、修改评价信息、删除等处理的标准、责任分配、方式和有关技术要求,资源元数据记录维护规范检验元数据记录的唯一性、一致性、完整性和所链接的其他信息的有效性,资源管理流程规范则建立资源管理工作流程序和控制机制。
(2)元数据规范管理机制, 主要指对学科信息导航系统各种元数据规范和管理规范(包括本节涉及的管理机制规范)本身的管理规定,具体说明各种元数据规范和管理规范的描述格式和描述语言、内容描述或编码规则、公共存放位置(以支持开放搜寻)、公共登记要求(以支持元数据规范登记系统功能)、与相关资源内容的链接要求、与相关定义或标准文件的链接要求、范例记录编制及其存放与指向要求、版本管理制度、定期审查要求、审查责任人员、管理流程规定等,从而保证元数据规范或管理规范的有序、可靠和可持续管理。
(3)用户使用管理机制,指对信息资源使用的控制机制, 包括合法使用范围规范、用户身份认证方式、使用授权方式、使用审计程序、隐私保护政策等。需要区别狭义和广义的资源使用控制。针对学科信息导航系统,狭义控制指对导航系统内学科信息资源的使用控制,广义控制可能包括对导航系统中的扩展信息、词表数据、规范数据等的使用控制。无论是否限制用户范围,都应确定使用控制规范(因为不限制用户只是使用控制的一种特例),界定什么使用主体(subject )在满足什么条件(conditions)下可对什么使用对象(object)行使什么使用行为(actions)。这里,使用主体可能是用户或用户组、 用户代理或另一系统,使用对象可以是具体资源、资源范围或数据对象,使用行为包括读、写、改、转换、析取等,而条件可能是使用登记、身份认证、阅读版权申明、填写保证条款、支付费用等。其中某些条件的验证与实现可通过链接第三方程序来具体实施,例如身份认证、支付费用等。csdl学科信息导航系统将提供学科信息资源的公共浏览检索,但为统计使用情况、了解用户特点,需要进行(往往是隐蔽的)使用统计;对与学科导航信息相链接的用户讨论区、用户发表区等扩展信息和个性化定制等扩展功能,将限制用户范围、要求身份认证;支持各种规范数据的公共查询和阅读,但严格控制对它们的删改;另外,可能只允许其他csdl学科信息门户和授权用户批量搜寻和下载导航资源来支持分布式导航信息组织和集成定制。
8 学科信息导航系统的开放描述
所谓开放描述,指信息系统通过开放语言和规范方式来描述自己系统的数据对象、规则、管理控制机制和操作过程,支持系统间互操作和基于智能代理的运行操作与管理。通过开放描述,将形成关于本系统不同描述对象的描述文件,这些文件置于本系统公知位置或递交公共登记系统,第三方系统可以对这些描述文件进行搜寻,按照开放语言规则进行解析,从而使第三方系统(或智能代理)能自动地识别、理解本系统的格式和规则,并在此基础上实现系统间的互操作。开放描述并不要求采用统一的具体描述格式,而是规定描述时应遵循的基本原则、底层语义和语法表示方法、标准扩展方式、标准转换机制等,因此不同系统可采用符合自己需要的不同具体方法或格式来描述实际内容,从而在保障各个系统的特殊需要和本地控制的同时,支持描述信息的开放搜寻、识别和系统互操作。
对于csdl学科信息门户及其学科信息导航系统而言,开放描述可分为描述方式和描述信息公布方式两方面的要求,目前阶段公布方式可采用在学科信息门户web服务器公知目录下以公开文件名存放描述文件,支持第三方系统开放搜寻;当csdl元数据规范登记系统建立后,将描述文件提交登记系统进行公共查询。对描述方式,可有以下建议:
(1)资源元数据格式描述,采用dublin core作为元数据核心元素集,采用扩展元素或扩展属性从其他标准元数据集中复用相关元素来描述资源的其他特征,采用namespace方式命名所复用的元素或属性, 采用xml dtd或rdf方式定义整个元数据集,采用xml 标记和封装输出的资源元数据。
(2)知识组织体系描述,采用dc subject的encoding scheme属性描述资源元数据中标引分类词表,通过url 链接相应的定义文件或介绍文件;采用xtm描述导航分类体系, 其描述文件在一定的使用控制下也置于公知位置机制,供授权的第三方系统(例如其他csdl学科信息门户)进行查询和调用,支持资源元数据搜寻和整合;逐步支持用vocml 描述的主题词表,相应词表描述文件可能作为第三方定义文件在说明性描述中予以链接,支持嵌入的智能检索功能。
(3)管理机制的描述, 涉及面向内部的管理规范和面向第三方的管理规范,前者包括资源组织、资源管理、元数据维护等,后者主要是用户使用控制。面向内部的管理规范可以是文本文件或html/xml 文件,应存放在系统公知位置,供公共查询;但也可以用xml dtd 方式定义这些规范,一方面可支持这些规范的交换和复用,另一方面可支持对规范的自动解析和处理(当然需要尽量与国内外现有的开放描述格式接轨)。面向第三方的管理规范应尽量采用开放语言描述,例如用户使用控制可采用xacl[26]来规定具体控制规范,在涉及隐私保护时参照p3p[27]制定隐私保护的政策与程序。
(4)整体学科信息导航系统的描述, 可作为学科信息门户信息架构(information architecture)定义及其描述的一部分,采用wsdl[28]开放描述语言等方法,对基本信息(例如名称、uri、学科、 简要描述等)、管理者信息(例如运营者、运营系统、联系方式等)、管理机制信息(例如关于使用管理、权益保护、隐私保护、定制控制等的描述文件名称、uri、描述规范namespace等)、组织机制信息(例如元数据格式、知识组织体系、模块结构体系以及它们的uri 和描述文件地址等)进行描述,以便第三方系统搜寻和解析,支持学科信息导航系统的开放集成定制和作为第三方服务系统的开放嵌入。
我们还将在学科信息门户及其资源导航系统的建设中继续探讨上述问题的规范建设,并希望与国内外其他单位进行合作。
【参考文献】
1 subject based information gateways. 3 nordic interconnected subject-based informationgateways. final report. august 2000.
4 crossroads. /metadata/roads/crossroads/
5 isaac network. research/osaac/
6 imesh toolkit. /toolkit/
7 european link treasury.
8 distributed national electronic resources. /
10 张晓林.开放数字信息服务体系:概念、结构与技术.中国图书馆学报,2002(3)
11 ebxml. /
12 web services activity. /2002/ws/
13 bibliography on evaluating internet resources. documents/dces/
19 ieee learning object metadata. http://itsc.
20 olson n b. cataloguing internet resources: a manualand practical guide. 2nd edition. /
21 day m, cliff p. rdn cataloguing guidelines.
25 xml topic maps (xtm) 1.0 /
26 xml access control language. /
27 platform for privacy preferences. /tr/p3p/
28 web service definition language. /tr/wsdl/
上一篇:没有重量的空间
下一篇:基于信息技术的研究性学习