哆啦Y梦
摘 要 针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点,本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处理硬件平台,DSP/BIOS为实时操作系统,利用CCS开发环境来构建应用程序;并通过摄像头提取视频序列,实现对边缘检测Sobel算子改进[1]。 关键词 DM642;Sobel算子;程序优化;图像边缘检测 1 引言 边缘是图像中重要的特征之一,是计算机视觉、模式识别等研究领域的重要基础。图像的大部分主要信息都存在于图像的边缘中,主要表现为图像局部特征的不连续性,是图像中灰度变化比较强烈的地方,也即通常所说的信号发生奇异变化的地方。经典的边缘检测算法是利用边缘处的一阶导数取极值、二阶导数在阶梯状边缘处呈零交叉或在屋顶状边缘处取极值的微分算法。图像边缘检测一直是图像处理中的热点和难点。 近年来,随着数学和人工智能技术的发展,各种类型的边缘检测算法不断涌现,如神经网络、遗传算法、数学形态学等理论运用到图像的边缘检测中。但由于边缘检测存在着检测精度、边缘定位精度和抗噪声等方面的矛盾及对于不同的算法边缘检测结果的精度却没有统一的衡量标准,所以至今都还不能取得令人满意的效果。另外随着网络和多媒体技术的发展,图像库逐渐变得非常庞大;而又由于实时图像的目标和背景间的变化都不尽相同,如何实现实时图像边缘的精确定位和提取成为人们必须面对的问题。随着DSP芯片处理技术的发展,尤其是在图像处理方面的提高如TMS320C6000系列,为实现高效的、实时的边缘检测提供了可能性[5]。在经典的边缘检测算法中,Sobel边缘检测算法因其计算量小、实现简单、处理速度快,并且所得的边缘光滑、连续等优点而得到广泛的应用。本文针对Sobel算法的性能,并借助于TMS320DM642处理芯片[3],对该边缘检测算法进行了改进和对程序的优化,满足实时性需求。2 Sobel边缘检测算法的改进 经典的Sobel图像边缘检测算法,是在图像空间利用两个方向模板与图像进行邻域卷积来完成的,这两个方向模板一个是检测垂直边缘,一个是检测水平边缘。算法的基本原理:由于图像边缘附近的亮度变化较大,所以可以把那些在邻域内,灰度变化超过某个适当阈值TH的像素点当作边缘点。Sobel算法的优点是计算简单,速度快。但由于只采用了两个方向模板,只能检测水平方向和垂直方向的边缘,因此,这种算法对于纹理较复杂的图像,其边缘检测效果欠佳;同时,经典Sobel算法认为,凡灰度新值大于或等于阈值的像素点都是边缘点。这种判定依据是欠合理的,会造成边缘点的误判,因为多噪声点的灰度新值也很大。2.1 图像加权中值滤波 由于图像中的边缘和噪声在频域中均表现为高频成分,所以在边缘检测之前有必要先对图像进行一次滤波处理,减少噪声对边缘检测的影响。中值滤波是一种非线性信号的处理方法[2],在图像处理中,常用来保护边缘信息;保证滤波的效果。加权中值滤波,首先对每个窗口进行排序,取适当的比例,进行曲线拟合,拟合后的曲线斜率表征了此窗口的图像特征,再根据图像各部分特性适当的选择权重进行加权。2.2 增加方向模板 除了水平和垂直两方向外,图像的边缘还有其它的方向,如135o和45o等,为了增加算子在某一像素点检测边缘的精度,可将方向模板由2个增加为8个即再在经典的方向模板的基础上增加6个方向模板,如图1所示。2.3 边缘的定位及噪声的去除 通常物体的边缘是连续而光滑的,且边缘具有方向和幅度两个特征,而噪声是随机的。沿任一边缘点走向总能找到另一个边缘点,且这两个边缘点之间的灰度差和方向差相近。而噪声却不同,在一般情况下,沿任一噪声点很难找到与其灰度值和方差相似的噪声点[4]。基于这一思想,可以将噪声点和边缘点区分开来。对于一幅数字图像f(x,y),利用上述的8个方向模板Sobel算子对图像中的每个像素计算,取得其中的最大值作为该点的新值,而该最大值对应的模板所表示的方向为该像素点的方向。若|f(x,y)-f(x+i,y+j)|>TH2,对于任意i=0,1,-1;j=0,1,-1均成立,则可判断点(x,y)为噪声点。图2给出了图像边缘检测系统改进算法的软件流程图。图1 边缘检测8个方向模板图2 系统结构图3 基于TMS320DM642的图像处理的设计及算法优化3.1 TMS320DM642功能模块及图像处理系统的硬件结构 DSP以高速数字信号处理为目标进行芯片设计,采用改进的哈佛结构(程序总线和数据总线分开)、内部具有硬件乘法器、应用流水线技术、具有良好的并行性和专门用于数字信号处理的指令及超长指令字结构(VLIW)等特点;能完成运算量大的实时数字图像处理工作。 TMS320DM642是TI公式最近推出的功能比较强大的TMS320C6x系列之一,是目前定点DSP领域里性能较高的一款[6]。其主频是600MHz,8个并行运算单元、专用硬件逻辑、片内存储器和片内外设电路等硬件,处理能力可达4800MIPS。DM642基于C64x内核,并在其基础上增加了很多外围设备和接口,因而在实际工程中的应用更为广泛和简便。本系统使用50 MHz晶体震荡器作为DSP的外部时钟输入,经过内部锁相环12倍频后产生600 MHz的工作频率。DM642采用了2级缓存结构(L1和L2),大幅度提高了程序的运行性能。片内64位的EMIF(External Memory Interface)接口可以与SDRAM、Flash等存储器件无缝连接,极大地方便了大量数据的搬移。更重要的是,作为一款专用视频处理芯片,DM642包括了3个专用的视频端口(VP0~VP2),用于接收和处理视频,提高了整个系统的性能。此外,DM642自带的EMAC口以及从EMIF 口扩展出来的ATA口,还为处理完成后产生的海量数据提供了存储通道。本系统是采用瑞泰公司开发的基于TI TMS320DM642 DSP芯片的评估开发板——ICETEK DM642 PCI。在ICETEK DM642 PCI评估板中将硬件平台分为五个部分,分别是视频采集、数据存储、图像处理、结果显示和电源管理。视频采集部分采用模拟PAL制摄像头,配合高精度视频A/D转换器得到数字图像。基于DSP的视频采集要求对视频信号具备采集,实时显示、对图像的处理和分析能力。视频A/D采样电路—SAA7115与视频端口0或1相连,实现视频的实时采集功能。视频D/A电路—SAA7105与视频口2相连,视频输出信号支持RGB、HD合成视频、PAL/NTSC复合视频和S端子视频信号。通过I2C总线对SAA7105的内部寄存器编程实现不同输出。 整个系统过程由三个部分组成:图像采集—边缘处理—输出显示,如图2所示。摄像头采集的视频信号经视频编码器SAA7115数字化,DM642通过I2C总线对SAA7115进行参数配置。在SAA7115内部进行一系列的处理和变换后形成的数字视频数据流,输入到核心处理单元DM642。经过DSP处理后的数字视频再经过SAA7105视频编码器进行D/A转换后在显示器上显示最终处理结果。3.2 图像处理的软件设计和算法优化的实现 由于在改进Sobel边缘检测算子性能的同时,也相对增加了计算量,尤其是方向模板的增加,每个像素点均由原来的2次卷积运算增加为8次卷积运算,其实时性大大减弱。为了改进上述的不足,在深入研究处理系统和算法后,针对TMS320DM642的硬件结构特点,研究适合在TMS320DM642中高效运行的Sobel改进算法,满足实时处理的要求。整个程序的编写和调试按照C6000软件开发流程进行,流程分为:产生C代码、优化C代码和编写线性汇编程序3个阶段。使用的工具是TI的集成开发环境CCS。在CCS下,可对软件进行编辑、编译、调试、代码性能测试等工作。在使用C6000编译器开发和优化C代码时[7-8],对C代码中低效率和需要反复调用的函数需用线性汇编重新编写,再用汇编优化器优化。整个系统的控制以及数字图像处理是用C程序实现,大部分软件设计采用C程序实现,这无疑提高了程序的可读性和可移植性,而汇编程序主要是实现DM642的各部分初始化。其边缘检测优化算法在DM642中的实现步骤具体如下: S1:根据DM642的硬件结构要求和控制寄存器设置,初始化系统并编写实现边缘检测算法的C程序。 S2:借助CCS开发环境的优化工具如Profiler等产生.OUT文件。 S3:根据产生的附件文件如.MAP文件,分析优化结果及源程序结构,进一步改进源程序和优化方法。 S4:使用CCS中调试、链接、运行等工具,再生成.OUT可执行文件。 S5:运行程序,如果满足要求则停止;否则重复步骤S2~S4直至满足使用要求。4 实验结果 本文以Lena图像为例根据上述的硬件环境和算法实现的原理和方法,图4~图6分别给出了在该系统下采集的视频Lena图像及使用边缘检测算子和改进后处理的结果。由实验结果可以看出,在该系统下能实时完成视频图像的处理,并且给出的边缘检测算子能较好的消除噪声的影响,边缘轮廓清晰。该算法不仅能抑制图像中大部分噪声和虚假边缘,还保证了较高的边缘点位精度。图4 Lena原始图像 图5 传统Sobel算子 图6 改进Sobel算子5 总结 本文实现了在TMS320DM642评估板上用改进的Sobel算子对实时图像进行边缘检测,无延迟地得到边缘图像。边缘检测效果较好,既提高了图像检测的精度又满足了实时性的要求。从检测结果看,利用该改进后的算子在边缘精确定位、边缘提取都达到了很好的效果,且抗噪声能力强,并为目标跟踪、无接触式检测、自动驾驶、视频监控等领域的应用提供了坚实的基础。参考文献[1] 王磊等. 基于Sobel理论的边缘提取改善方法[J].中国图像图形学报,2005.10[2] 陈宏席. 基于保持平滑滤波的Sobel算子边缘检测.兰州交通大学学报,2006,25(1):86—90[3] 熊伟. 基于TMS320DM642的多路视频采集处理板卡硬件设计与实现[ M]. 国外电子元器件,2006[4] 朱立.一种具有抗噪声干扰的图像边缘提取算法的研究[J].电子技术应用.2004,25(1)[5] 刘松涛,周晓东.基于TMS320C6201的实时图像处理系统[J].计算机工程,2005(7):17—23[6] TI TMS320DM642 video/imaging fixed-point digital signal processor data manual,2003[7] TMS320C6x Optimizing C Compiler User’s Guide’ TEXAS INSTRUMENTS”,2002[8] TMS320C32x Optimizing C/C++ Compiler User's Guide,Texas Instruments Incorporated,2001
花香盈路
中北大学2012届毕业论文 第1页 共47页 1 引言 1 课题的提出以及研究意义 使计算器具有人类的感知的能力,能够识图认字,能听话和说话,能与人们自然的进行信息交互,是人们长期以来的梦想。经过二十余年的奋斗,这些梦想已逐渐部分成真。赋予计算机识图认字的智能,能够解脱人们将汉字输入计算机的繁重劳动,克服计算机汉语信息的汉字输入困难的问题,对我国信息化发展更具有特殊重要的价值。随着计算机技术、通信技术、多媒体技术以及Internet的迅速发展,人们越来越深刻地感受到了计算机处理事情的便捷。提取并识别图像中的文字,在图像数据库的组织与管理、视频索引、公交、交通、旅游、摄影等方面将有着极其广泛的应用。随着电力系统的规模增大,电力设备也越来越多,且设备分布具有跨地域性的特点,因此怎样管理维护这些设备,并可随时查看这些设备的信息成为一个急需解决的问题。 图像中往往包含着丰富的文字信息,若能将图像中的文字进行自动检测、分割、提取和识别,则对图像高层语义内容的自动理解、索引和检索非常有价值。因此,90年代,随着多媒体技术的发展以及对基于内容的多媒体检索的需求,图像中的文字获取又逐渐成为研究热点之一。电力设备标牌图像中的文字获取对图像识别、检索有重要意义。从电力设备标牌图像中提取文字需要首先定位包含文字的图像区域,由于电力设备标牌中的文字在字体、大小、对齐方式和排列上变化多端,文字背景复杂,而许多应用场合还要求算法具有一定处理速度,这些都使得从其图像中有效地提取文字变得困难,对其深入研究很有意义。电力设备标牌图像中有丰富的文字信息,对图像中的文字信息的提取将是图像处理方面研究的一个重要方向。在电力系统中,电力设备种类繁多,通过对设备图像的采集,识别出电力设备标牌的文字信息,建立设备信息图文库,对电力设备的年检、统计等工作更加便捷、高效,对提高电力系统的设备管理水平非常重要。在电力管理上的技术需求越来越引起人们的关注和期待,而在此方向的技术研究目前还是一个空白点,因此,研究设备图片中的字符识别技术具有广泛的实际应用价值和重要的学术意义。 2 相关技术研究现状 中北大学2012届毕业论文 第2页 共47页 目前电力设备标牌识别的研究还是一个空白点。其相关技术包括车牌识别技术和对图像中的文字识别技术[1]。电气标牌字符的识别研究还很滞后,目前仍没有相对成熟的系统。随着电力系统的规模增大,电力设备也越来越多,怎样管理维护这些设备,是我们现在需要努力研究并有待应用的一门技术。 当前,图像作为一种重要的可视化信息媒体,已被应用到几乎所有的科学技术领域和日常生活的各个方面。随着图像信息的快速增长,从海量的图像资源中快速高效地提取并识别信息已成为人们迫切的需求。因此,20世纪90年代,基于内容的图像检索(CBIR)[2]技术应运而生,从可视化角度开辟了一条更为直观 、准确的途径,并很快成为智能信息处理领域的研究热点。 如今牌照定位是从一张图片中找到标牌的位置,将包括牌照的子图像从这张图片中切割出来。主要有边缘特征法[3]、神经网络法[4,5]、基于灰度的检测方法、基于数学形态学法、基于颜色的分割方法、基于区域特征的方法、小波变换的方法等。 文字识别技术已经广泛应用到了各个领域中,它作为计算机智能接口的重要组成部分,在信息处理领域中可以大大提高计算机的使用效率。字符识别的对象是汉字、字母和数字。我国牌照的独有的特点是包括汉字的识别。汉字因为其结构复杂,使得识别过程有别于数字和字母。目前主要的字符识别方法有:模板匹配法、统计特征字符识别法、结构特征字符识别法、人工神经网络法。模板匹配对噪声比较敏感,并对字符的字体变化具有不适应的特点。基于统计特征的字符识别法对于形近字符区分能力弱,而且需要寻找特征,特征有时随图像变化而失效。结构特征的描述和比较要占用大量的存储和计算资源,因此算法在实现上相对复杂、识别速度慢。神经网络法也存在找寻特征和计算量大的问题。光学字符识别(OCR)技术是计算机自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术。它是新一代计算器智能接口的一个重要组成部分,也是模式识别领域的一个重要分支。因此,在电力标牌的字符识别中,OCR技术也得到了广泛的应用,是其进行识别不可或缺的技术力量。Lienhart等[6,7]先后开发出两个视频中的文字检测、分割和识别系统。这两个系统都是利用文字的单色性相对于背景的高对比度和视频字幕的简单纹理来进行图像分割。 近几年,国内学者也开始关注并积极投身到电力设备标牌的字符检测领域来,但中北大学2012届毕业论文 第3页 共47页 是都仅限于在进行基于内容的多媒体检索的研究时,附带地介绍了图像和视频中的文字获取,并没有进行系统深入的研究,也没有开发出相应可行的系统。如何识别图像中的文字仍然是一个有待研究解决的问题。 3 本课题主要内容 电力设备标牌字符识别涉及到的技术和车牌识别技术有些相似处,车牌识别技术已经较为成熟,但是,电力设备标牌识别与之有很多不同之处。主要包括: (1)图像的预处理技术。标牌中有很多钢印信息,通过二值化[8,9]提取标牌特征时,需要完整的提取其特征量。而车牌上的信息在提取时不存在上述问题。 (2)电力设备标牌中的信息识别技术。标牌中的字符很多,尤其是所涉及的汉字比较丰富,而车牌中字符构成比较简单。 本文对电力系统中设备标牌中的字符识别技术进行了研究,对设备标牌中的字符识别系统的每一个模块进行了研究及实现。电力设备图片在识别前首先需要对图像进行预处理,以更好的提取标牌中的信息。其次,分割图像。最后进行标牌上的字符识别。因此,本课题主要研究内容为: (一)电力设备标牌的图像预处理方法的研究。采集到的设备图片不可避免的会受到噪声的污染,需要对设备图片进行处理以及修正,突出图片中的标牌信息,增强图像,以便更好的进行字符识别。 (二)分析电力设备标牌特点,结合设备标牌特点研究适合标牌图像的二值化方法。 (三)研究边缘检测算子并对图像进行边缘检测处理,分析实验结果,并进行图像的分割。 (四)应用光学字符识别(OCR)[12,13,14,15]技术和字符识别技术进行电力设备标牌的识别[16,17,18,19]。 在拟采用的研究手段上分别从设备图像预处理、标牌的二值化算法以及标牌图像的分割和字符的识别四个方面进行阐述: 1)进行图像的滤波处理、经灰度直方图灰度修正以及灰度图像对比处理把我们感兴趣的部分突出出来。 2)为了进行有效的识别,采用阈值法进行标牌图像的二值化。通过对其标牌二值化,提取标牌图像中的钢印信息。 中北大学2012届毕业论文 第4页 共47页 3)进行标牌图像的边缘检测和分割。 4)采用基于光学字符识别(OCR)的技术以及MATLAB软件算法完成对标牌字符的识别。 中北大学2012届毕业论文 第5页 共47页 2 电力设备标牌图像预处理 电力设备标牌图像由于背景的灰度值介于标头字符的灰度值和钢印灰度值之间,所以用单一的一个阈值无法将标头字符和钢印同时提取出来。为了进行有效的识别,首先需要对数字图像进行处理。 二维物理图像被栅格划分成小的区域,这些小的区域称为数据元素(Picture Element),简称像素。对每个像素进行采样和量化,得到相应的整数值。这个值代表像素的明暗程度和颜色深浅等信息。 每个引入噪声。图像可以分为二值图像、灰度图像、彩色图像。灰度图像只含亮度信息,不含彩色信息。灰度值用8位(Bit)表示,从0到255,一共256级,从黑(0)到白(255)。二值图像就只有代表黑白两色的两个灰度值,归一化后灰度值是黑(0)到白(1)。彩色图像每个像素值都有三个分量,分别表示红色(R),绿色(G)和蓝色(B)。每个分量又按各分量的灰度分为0到255共256级。根据RGB的不同组合就可以表示256 ×256×256种颜色,也就是常说的24位真彩色。 2.1 图像的读取 clear; close all; I=imread('bae.jpg'); imshow(I);(结果见图2(a)) 2.2 去噪 在图像形成、传输或变换的过程中,由于受到其它客观因素诸如系统噪声、曝光不足或过量、相对运动等影响,获取图像往往会与原始图像之间产生某种差异(称为降质或退化)。退化后的图像通常模糊不清或者经过机器提取的信息量减少甚至错误,因此必须对其采取一些手段进行改善。图像增强技术正是在此意义上提出的,目的就是为了改善图像的质量。图像增强根据图像的模糊情况采用各种特殊的技术突出图像中的某些信息,削弱或消除无关信息,达到强调图像的整体或局部特征的目的。图像增强尚没有统一的理论方法。 利用巴特沃斯(Butterworth)低通滤波器对受噪声干扰的图像进行平滑处理:
食品检测与食品安全姓名: 姓名:卢周舟 学号: 学号:43208419 得分: 得分: 摘要: 由于我国处于社会主义初级阶段, 我国食品相关行业生产力水平远远达
(部分)张冬至,胡国清,夏伯锴,基于模态辨识的原油含水率智能组合测量模型[J],华南理工大学学报,2009, Vol.37, pp73~78郭强,吕浩杰,胡国清
摘 要 针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点,本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处
图像分割是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。我整理了图像分割技术论文,欢迎阅读! 图像分割技术研究 摘要:图像分割是图像处理与计
摘 要 针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点,本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处