基于本体的多媒体信息的组织技术研究
摘 要: 为了有效利用多媒体资源,挖掘资源背后语义内容并分析它们,本文通过本体理论来建立一个统一描述多媒体资源框架。选用了OWL (Web Ontology Language)作为本体形式化描述语言, 而多媒体信息资源适合于网络传播和浏览。另外RDF (S)资源描述框架提供了一种标准化的,具有互操作性的多媒体元数据模型。在实际中,本框架对多媒体进行组织、查询和交换得到应用。
关键词:本体;多媒体;信息组织;信息管理
1.引言
随着现代计算机技术、网络技术和多媒体技术的迅速发展,各种多媒体数据的急剧增长,多媒体信息在网络上的表示和获取已经成为计算机及其相关学科的研究热点课题。过去的组织和应用多媒体资源呈现了一系列缺点:混乱、逻辑差、扩展和缺乏的必要的组织架构,对不同的多媒体资源有较弱的识别和管理。如何克服上述缺陷,在统一的描述框架集成了众多的多媒体资源,并基于此框架支持不同的应用程序,对于数据处理和识别、管理多媒体资源都是必要的。本文采用本体方法通过RDF(资源描述框架)和XML提供一个统一的资源描述框架多媒体资源。基于这个框架, 通过部分逻辑和推理的过程,可以有效地组织和应用多媒体资源。
2.本体及相关技术
2.1本体的基本概念
本体论(Ontology)的概念最初起源于哲学领域,是形而上学理论研究的一个分支,与认识论相对。1991年,在人工智能领域,Neches等人最早给出Ontology定义,Neches认为“An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the vocabulary.”即“一个本体给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规则定义这些词汇的外延规则。1993年美国斯坦福大学知识系统实验室(Knowledge System Laborary,简称KSL)的Gruber给出了本体在信息科学领域被广泛接受的定义:“An ontology is an explicit specification of a conceptualization”。即“本体是概念化的明确的规范化说明”。这也是最著名并被引用最为广泛的定义。
尽管本体的定义有很多不同的方式和不同的侧重点,但从内涵上来讲,本体的概念有下面四层含义:
第一,概念化(conceputalization):通过抽象出客观世界中一些现象(phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态。
第二, 明确(explicit):概念与概念之间的联系及使用这些概念的约束都被明确定义。
第三,形式化(formal):有精确的数学描述,是计算机可读的。
第四,共享(Share):本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。
2.2多媒体技术
所谓多媒体技术, 就是利用计算机技术把文本、图形、图像、声音等多媒体综合一体化, 使之建立起逻辑连接,并能对它们获取、编辑、加工处理、存储和展示。从研究和发展的角度看, 多媒体技术具有如下的特征:
(1)信息载体的多样化
信息载体的多样化指的是信息媒体的多样化, 即把计算机所能处理的信息空间范围扩展和放大, 而不再局限于数值、文本或是被特别对待的图形或图像, 这是计算机变得更加人类化所必须的条件。
(2)集成性
多媒体信息的集成性首先是指可将多种不同的媒体信息(如文本、 图形、 图像、 声音)有机地进行同步组合成一个完整的多媒体信息。集成性的另一层含义是把不同的输入媒体(键盘、摄像机、光笔、话筒等设备)或输出媒体(显示器、 喇叭等)集成在一起, 形成一个整体。
(3)实时性
多媒体技术由于是多种媒体集成的技术, 其中声音及活动的视频图像是和时间密切相关的, 甚至是强实时的。这决定了多媒体技术必然要支持实时处理。
3多媒体信息的组织管理技术
3.1如何组织多媒体信息
信息及数据管理是信息系统的核心问题之一。多媒体的数据量巨大、多媒体的种类繁多、每种媒体之间的差别又是那么明显, 但又具有种种信息上的关联, 这些都给数据与信息的管理带来了新的问题。如何管理和组织这些数据? 如何从各种各样媒体数据中找到所要信息?如何表现这些多媒体信息?这些都是传统的数据库理论和方法尚没有很好解决的问题。关系数据库的方法推动了数据库的研究和发展, 但在处理非规则数据方面又不那么适应, 而多媒体数据大多都是非规则化的数据。
3.2 构建多媒体信息领域本体
出于本体资源可重用性和开发协同性的考虑,一般不会将所有媒体概念和属性类本体定义在一个文件里,而是按照不同的媒体格式分别定义在不同的本体文件里,在文件中利用owl: imports属性可以在各个本体文件之间实现资源调用(见下图,所有的owl文档存储于关系数据库中,通过查询获取关系数据库中相关信息的存储地址),如果需要,我们还可以将单个媒体类型本体文件按照概念定义到多个本体文件中。本文选用了OWL (Web Ontology Language)作为本体形式化描述语言, OWL的优点是定义完备,以Web资源为描述对象,而且是W3C的推荐标准,而多媒体信息资源适合于网络传播和浏览。另外RDF (S)资源描述框架提供了一种标准化的,具有互操作性的多媒体元数据模型。MPEG-7提供的描述语言DDL可用于深刻描述多媒体信息的各项特征,用户可以有效地搜寻、过滤和定义想要的影音资料。
选用对以上技术提供良好支持的Protégé-2000+OWL插件作为本体构建工具, Protégé-2000是由斯坦福大学医学院的医学情报学研究组开发研制并在Java环境中开发出来的,与其它工具相比其优势在于: (1)具有图形化的用户界面; (2)对Unicode字符集输入的支持; (3)可以免费下载系统安装软件和插件(如OWL插件); (4)有为数众多的用户的支持,有利于本体的交流与合并。
3.3.本体对多媒体信息组织的作用
本体方法作为一种全新的信息组织方法,具有传统信息组织方法所不具备的功能和特点,为多媒体信息组织带来新的变革,并成为多媒体信息组织的核心概念。首先,它是一种直接体现语义的多媒体信息组织。基于分类或主题的多媒体信息组织,所表达的语义都是隐含的,只能被它们的建立者或开发人员所理解、掌握和使用,不能直接表达为机器(计算机)所理解的形式化的语义。而基于本体的多媒体信息组织借助本体描述语言,就可以直接表达为机器“可理解”的、显式的、明确的、形
式化的语义,方便计算机的“理解和处理”。同时,由于本体中定义的概念是在一定的语义环境或限制规则下完成的,因此,在表达概念及其含义时更加清晰和准确,在进行信息组织时也更加规范。其次,它是多维、网状的信息组织方式。传统的基于分类或主题的信息组织方式是线性的、一维的,本体则采用了容易为计算机所接受和处理的体现描述逻辑的知识表现和信息组织方式,概念及其之间的关系形成了一个多维的语义网络。这不仅有利于网上各种不同类型、不同结构的信息资源的集中与整合,而且更加有利于它们之间关系的描述和揭示。
4.结论
基于本体的多媒体信息组织,能将多媒体信息提炼成知识,对多媒体信息资源进行知识重组和表示,实现计算机对多媒体信息资源的自动组织,从而为用户提供智能的检索与服务。本体的出现和发展为现代信息组织,特别是多媒体信息组织注入了新的活力,其体现的思想和方法必将促进信息组织向知识组织转变。
参考文献:
[1]杨学良. 多媒体计算机技术及其应用. 北京: 电子工业出版社,1995
[2]邓志鸿,唐世渭等.ontology研究综述[J].北京大学学报(自然科学版),第38卷,第5期,2002年9月.
[3]邓志鸿, 唐世渭, 杨冬青 基于本体的多 Agent 分布式数字图书馆资源信息发现服务模型之研究1 计算机工程, 2002 , 28(6) : 37~38
[4]赵斌. MPEG-7与多媒体信息描述[J].图书馆杂志,2005, 24 (2): 48-49。