基于对象的彩信图像检索系统的研究与实现
作者:武晓岛 袁津生 郭敏哲 李浩
论文关键词:彩信查询 图像检索 对象识别 图像分析
论文摘要:墓于对象的彩信图像检索系统是继图像检索和彩信检索结合的新一代信息检索技术,介绍了目前热门的墓于对象的图像检索系统的概念,以及应用到彩信检索领域的工作原理。在基于对象的图像检索墓础上,加入了对图像中区域对象的识别过程,并将识别结果存入图像属性索引数据库,然后在检索过程中根据用户输入的对象查询请求,到数据库里进行检索,最终将检索结果返回给彩信用户。
0引言
随着彩信技术的快速发展和多媒体编码技术的不断进步,其数字化图像资源日益丰富,并在彩信领域中扮演着越来越重要的角色。面对如此庞大的图像数据资源,如何方便快捷地获取自己需要的图像显得尤为重要。由于在图像检索过程中,图像中的对象(如图像的主体和背景)往往才是人们感兴趣的检索内容。因此,基于对象的图像检索成为了一项重要研究课题。本论文的主要工作是针对彩信图像中主体对象的识别问题进行了一项有益的尝试。wwW.lw881.com
本研究在图像分析和彩信图像文本提取的基础上,实现一种利用图像对象的视觉特征和知识库来识别对象(图像中的主要区域)的方法,并将图像对象名、对象的视觉特征等存人图像属性索引数据库中,实现基于对象语义的图像检索。
1基于文本的图像检索技术
传统的图像检索技术,主要是通过图像进行人工分析,对图像特征进行文字标注,也称为基于文本的图像检索tbir(textbasedimageretrieval)。这种检索方式是用关键词和描述性的文本的检索,是先对图像文件建立相应的关键词或描述字段,并对图像的存储标识和关键词对应起来,以结构化的查询语言或超链接方式进行检[1]。
这种传统的图像检索技术在图像信息飞速增长的今天有很大的局限性:
l)手工操作,劳动强度大,不能充分揭示和描述图像有代表性的特征;
2)主观性大,由于个人的感知差异,不同的人对相同的图像有不同的理解;
3)处理速度慢,不能快速提出检索的相关结果;
4)漏检,检索中不能充分利用各种特征,容易忽略事先没有注意到的特征。由于这种检索技术根据图像的文本等一些与图像相关的因素来确定图像的内容,而不是抽取图像本身的外部特征或从更高的语义层次来获取图像的内容,由此确定的图像内容可能与图像实际内容存在着偏差,从而直接影响图像检索结果的可靠性。
2基于对象的图像检索系统
2.1cbir的概念
为了解决基于文本的图像检索存在的问题,基于对象的图像检索cbir(eontentbasedlm路eretrieval)逐渐被人们所重视。这种技术由机器自动提取包含图像内容的可视特征:颜色、纹理、形状、对象的位置和相互关系等,对数据库中图像和查询样本图像在特征空间进行相似匹配,检索出与样本相似的图像[2]。
2.2cbir的检索方法
其主要的cbir的检索方法有:基于颜色特征、纹理特征、轮廓特征、形状特征、空间特征、时间关系及时空关系、语义特征等特征的检索[3]。
3墓于对象的彩信图像检索系统
基于对象的彩信图像检索系统使用visualc++6.0作为开发工具,采用面向对象的体系结构,具有较好的可移植性和可扩展性。后台数据库系统采用microsoftacces 2000,访问方法为ado访问。该系统的功能是:用对象识别系统将图像分析和对象识别的结果存入图像属性索引数据库;根据用户输人的检索要求,检索系统利用图像属性索引数据库进行检索,根据相似度由大到小排列检索结果,然后将检索结果信息(包括图像的缩微图)发送到彩信群发器,再发送到用户。
3.1系统设计思想
3.1.1图像数据库组成
图像数据库系统是在传统数据库、数字图像处理与模式识别等技术的基础上发展起来的一门新兴的综合技术。图像数据库技术一直致力于解决海量数字图像的有效存储和管理问题。图像数据库的产生拓展了传统数据库技术的应用,又为图像处理技术提供了有力的支持[4]。
3.1.2图像属性索引数据库建设
图像属性索引数据库中存放着从彩信页中获得的所有图像及其属性,以供用户查询使用。
3.1.3动态链接库(dll)中执行函数的实现
在试验平台imagehuntplatform中特征生成和图像检索函数的实现,采用了动态链接库(dll)中的执行函数。动态链接库(dll)是用作共享函数库的可执行文件。dll中的代码在运行时动态加载。
visualc++中的类库mfc以3种不同的方式支持dll的开发,即:
l)与mfc静态链接的常规dll与mfc动态链接的常规dll及与mfc动态链接的扩展dll。
2)与mfc动态链接的常规dll与mfc动态链接的常规dll也是内部使用mfc的dll,dll中的导出函数可以被mfc和非mfc可执行程序调用。与前者的区别是,这种类型的dll在建立时使用的是mfc动态链接库。导出函数使用的也是标准c接口,但必须使用宏afx_manage_state兀来设置mfc模块状态[5]。
3)与mfc动态链接的扩展dll与mfc动态链接的扩展dll是从已有的mfc来派生新的可再用类的dll。扩展dll在建立时使用的是mfc动态链接库。扩展dll中的导出函数只能由动态链接mfc的mfc应用程序调用。使用扩展dll,可以从mfc派生新的自定义类,然后提供mfc扩展版给调用dll的应用程序。
在试验平台中,要求特征生成和图像检索函数作为dll库的导出函数。特征生成函数的原型为voidgeneratechar(),无参数。图像检索函数的原型为b00lcolorhuni(cstringust*positivepath,cstringust*nagetivepath,cobarray*fsimi-lararray),其中positivepath为正例图像的路径链表,nagetive-path为反例图像的路径链表,fsimilararray为返回结果的对象链表(包括检索图像的id、检索图像的路径和示例图像的相适度)。动态链接库的方式可采用与mfc动态链接的常规dll或与mfc动态链接的扩展dll。以图像检索函数为例,在试验平台中动态加载dll库的主要代码如下:
hinstance hdll;
ypedefbool(callback·myproc)(cstringliat*,cstringlist*,cobarray*);
myproc dllproc;
hdll=loadlibrrary(“dll所在路径”); //可与从windows注册表中动态取得
if(hdll!=null)
{dllproc=(myproc)cetprocaddress(hdll,funname);
if(dllproc==null)
{afxmessagebox(“输入检索图像的函数名称有错误!”);return;}
dllproc(…,…,…);
}
3.2系统工作流程
其主要的工作流程为:用户根据自己的需求输人所孺要的图像模型;将对象的轮廓区域从背景中区分出来;分析、提取并识别对象区域的视觉特征(颇色、形状、纹理、位置、大小、方向等),建立数据参数或语义级的文字描述;根据对象视觉特征知识库和相关文本(彩信中的相关对象名和对象特征关键词)识别对象,建立概念级的图像对象文本标注;利用对象的文本标注和视觉特征描述,实现基本对象的图像检索;将检索到的图像通过彩信群发器发送出去。具体工作流程如图l所示。
3.3应用实例
假设用户要搜索一个牡丹花的图片并且给出了关键图,根据检索结果,用户根据关键图的直方图和边缘图使用绝对值距离的方法,从图像库中检索出符合要求的图片,并从中选择满意的图片通过彩信群发器发给他的用户。其检索界面如图2所示。