欢迎来到学术参考网

基于内容的图像检索技术研究

发布时间:2015-08-19 13:41

摘 要:摘要:本文首先介绍了基于内容的图像检索系统的一般结构,然后详细介绍了国内外被广泛应用的特征提取和描述方法,主要对几种常用的基于单一特征和多特征的相似性度量方法进行分析。

关键词:关键词: 图像检索 单一特征 多特征 相似度


中图分类号:TP752      文献标识码:A     文章编号:


    0 引言
    图像数据库是目前一个研究热门领域,怎样对这些图像数据进行快速检索,则需要用到图像检索技术,而基于内容的图像检索技术是用于对海量图像数据进行检索的新技术。
    1.基于内容的图像检索系统一般结构
     在基于内容的图像数据库中,首先把被检索图像的颜色、纹理、形状等特征信息提取出来,然后再与图像数据库中图像的特征信息进行相似性比较,根据相似度大小输出查询结果,要求基于内容图像检索技术需要包括数据模型、图像内容获取、人机接口、以及完成检索框架等功能,以下描述基于内容的图像检索系统的体系结构划分为特征提取和查询两个子系统,一般框架如图1-1所示:
 
                     图1 基于内容的图像检索系统一般结构
    各个模块的作用分别是:
    (1)预处理:对图像进行一些预处理操作,包括图像去噪、增强、格式转换、规格化等,方便后面对图像进行特征提取;
    (2)目标识别:识别出图像中用户感兴趣的区域或对象,以方便进行特征提取和检索;
    (3)特征提取:这是基于内容的图像检索系统的核心部分。目前使用较多、比较成熟的检索算法大部分是基于图像低层视觉特征的。数据库由图像库、特征库和知识库组成。其中特征库是包含提取出的图像的各种特征;知识库包含专门和通用知识,能实现查询优化和快速匹配。
    (4)查询接口:为用户提供一个友好的查询界面和多样的查询手段,主要的查询方式有外部图例查询、内部图例查询、草图查询和综合查询。外部图例查询是实例图像来源于图像检索系统的外部,不是图像库中存储的图像。内部图例查询则是实例图像来源于图像检索系统的图像库中。草图查询是实例图像由用户自己创建。综合查询方法则是综合应用了以上的几种查询方式。
    (5)检索引擎:包含一个有效可靠的相似性测度函数集,用于对查询图像和图像库中的图像进行相似性度量。
    (6)索引/过滤:对图像库中的图像按某种标准进行筛选,以提高检索的速度。

    2. 特征提取与描述
    特征提取是基于内容的图像检索技术研究的核心内容,是把图像的内容信息提取出来,据此进行图像检索。图像的特征主要包括低层特征和高层语义特征。低层特征如颜色、形状、纹理是图像的一些定量的特征,可以通过计算机自动或人机交互的方式提取。而高层语义特征是图像的一种定性的特征,更接近于智能化的理解,主要通过人机交互或人工的方式提取。基于语义的图像检索技术是最符合用户要求的检索技术,它的发展可能是基于内容的图像检索技术走向成熟与实用的关键。但是由于低层视觉特征和高层语义之间存在沟通鸿沟,难以找到图像语义的有效描述方式、提取图像语义描述的方法以及语义的处理方法,所以目前应用较多、比较成熟的检索方法都是基于低层特征的。

    2.1 颜色特征
    颜色是描述一幅图像的最简便而有效的特征,因为颜色往往和图像中所包含的物体和场景十分有关。而且与其他低层特征相比,颜色特征对于图像缩放、旋转、遮挡及其他形变有着更强的鲁棒性,是基于内容的图像检索采用的最早最广泛的低层特征。

    (1) 颜色空间介绍
    对图像的处理需要在特定的颜色空间中进行,选择不同的颜色空间就会有不同的处理效果。颜色空间通常可以分为面向硬件和面向视觉感知两类。面向硬件的颜色空间包括RGB、CMY等;面向视觉感知的颜色空间包括HSV、YUV、L*a*b*等。
    ① RGB空间
    现有的图像采集设备采集到的信息都是RGB值,所以RGB空间是最基础的颜色空间,图像处理中其它的颜色空间也是从RGB空间转换而来。RGB的三个分量R、G、B即是自然界中的三原色,红色、绿色、蓝色。它是一种与人的视觉系统密切相关的颜色模型。它的模型如图2所示,三个坐标轴分别代表R、G、B三个分量,图中坐标为(1,0,0)、(0,1,0)、(0,0,1)的三个点分别对应于红色、绿色、蓝色,原点对应于黑色,坐标为(1,1,1)的点就代表白色。每一幅彩色图像的颜色值都可以用这个模型进行分解。
 
                  图2 RGB颜色空间模型
    RGB空间的缺点主要有两个,一是不符合人的视觉感知心理,不能与人的视觉特征相匹配,不够直观;二是RGB空间属于不均匀颜色空间,R、G、B这三个分量存在着密切的关联性,所以不能通过直接计算两个颜色点之间的距离来表示它们之间的颜色差异。
    ② HSV空间
    与RGB空间相比,HSV空间是一种均匀的颜色空间,而且它与人类的视觉感知相符合。三个分量H、S、V分别是色调、饱和度和亮度。色调(H)是指光的颜色,它与混合光谱中主要光波长相联系。波长不同,光呈现的颜色就不同。饱和度(S)是指彩色的深浅程度,饱和度越高的,颜色程度越深,越低的颜色程度就越浅。亮度(V)是指人眼感受到的光的明暗程度。从RGB空间到HSV空间的转换方式如公式2-1所示:

 
           

    除了以上两类方法以外,当图像中物体的数目较少时,一般只有一个目标物体时,通常也用物体的几何参数作为形状特征,如轮廓的周长、面积、离心率、曲率、重心、偏心率等等。这些特征的提取较之以上两类特征来说比较简单,计算方便。
    2.3 纹理特征
    有关纹理特征的描述方法主要统计法、结构法、模型法和频谱法等。统计法是根据Julesz发现的人类视觉系统是通过统计特征来区分不同纹理发展起来的,据此产生了一系列的算法,比较典型的有灰度共生矩阵法],能量谱函数法和自相关函数法等。用统计法来描述纹理特征适合于山脉、森林、草地等一类图像。结构法是将纹理分解为若干个纹理基元,统计每个基元的特征和基元之间的组合规律,据此作为特征来进行描述。因为纹理特征是多样的而且很多是随机的,所以很难做到准确的分割每个纹理基元,因此这种方法的局限性比较大。模型法则是假定纹理的分布是按照某种模型的特征来分布的,用该模型的特征作为纹理的特征。比较常用的模型有马尔可夫随机场模型、Gibbs随机场模型、分形模型法等。频谱法是将图像的纹理当做二维信号来处理,计算它的频域特性来进行描述。
    基于纹理特征的图像检索已经得到了广泛的应用,如在医学上识别癌细胞、工业上检测金属的形变和产品的缺陷、遥感图像中的城市、海洋 、山脉分析等等。目前对纹理的研究主要还要集中在以下几个方面:有关纹理特征的提取和描述、如何对纹理进行准确的分割、如何由纹理特征恢复出物体原来的形状。这将是以后研究的热点问题。
    2.4 空间关系特征
     空间关系特征指的是空间对象之间具有的空间上的相互关系。所谓图像中的对象可以用不同的形式来表示。一种是用对象中的某个点来表示该对象,比如用质心、角点、最小矩形等来表示;一种是用骨架法表示,就是用对象的大体形状和尺寸来表示该对象。空间关系特征就是指图像中各个对象之间的空间特性。空间关系的类别主要有拓扑、方向、度量三大类关系。拓扑关系是指在拓扑变换下的不变量,如相接关系、对象间的分离等。拓扑关系具有平移、缩放和旋转不变性,而且图像中任何两个对象之间只存在一种拓扑关系,这就使得这种方法有简单易行的优点。方向关系也称方位关系,它定义的是对象之间的方位,比如各个对象与X轴的角度关系就是其中的一种表示方法。
    2.5 多特征
    由于用单一特征难以描述图像丰富的内容,所以基于单一特征的图像检索效果往往不理想,综合多种特征则可以更全面的描述图像,大大提高检索的精度。目前基于颜色特征和形状提取该区域的特征作为图像的特征。
    在第二类方法中,常用的分割方法有对图像直接进行固定分块、全阈值分割和利用颜色特征进行的分割等。这种利用图像的颜色特征进行的分割方法,因为结合了图像的低层特征,所以分割效果比以上两种要好,检索精度要高。这类多特征检索的方法对图像各种特征之间的关系进行了深层发掘和充分利用,真正实现了图像各种特征之间的关联和融合。

    3.相似性度量
    提取出图像的特征后,用相似性度量来匹配待检索图像与数据库中的图像。当两幅图像特征间的距离小于设定值时,认为两幅图像相似,完成近似匹配。相似性度量技术是基于内容的图像检索技术的又一核心研究内容,算法的性能直接影响检索结果的好坏。不同的匹配方法又有各自的优点和缺点,要根据图像的特点选择合适的匹配方法。

     (2) 异步组合方法
    异步组合方法,就是首先针对一种特征做一次相似性度量,输出相似的图像;然后从第一次输出的图像中针对第二种特征再做相似性度量,再一次输出相似的图像。依次类推,上一级输出的图像结果作为下一级特征提取与比较的输入,直至比较完所有的特征,输出最后结果。这种度量方法可以逐渐的缩小检索空间,提高精度。
    4.本文小节
    本文主要介绍了基于内容的图像检索系统的一般结构,然后对基于内容的图像检索的关键技术特征提取和相似性度量等常用方法进行分析,这些都是基于图像低层次特征内容检索,随着相关应用领域对图像检索技术要求不断提高,该技术还需要进一步改善,而基于图像高层次特征检索如时间、地点等以及集成性检索将成为研究的一个重要方向。


参考文献
Xiang-Yang Wang, Jun-Feng Wu, Hong-Ying Yang. Robust image retrieval based on color histogram of local feature regions, 2009.

上一篇:车牌图像阈值分割的一种简化方法

下一篇:浅析计算机网络问题及安全对策分析