灰度图像边缘检测技术研究论文

发布时间：2023-12-08 23:55:08

灰度图像边缘检测技术研究论文

应该是这句的问题if(in->nChannels != 1)return 0;一般加载进来的图片的通道是3，这样的话就直接返回0了，没有create image

这里IplImage* img=cvLoadImage("D:\\demo2.jpg");如果不加参数，默认读取图像的原通道数。假如你载入的图像不是单通道的，if(in->nChannels != 1) return 0;这句就直接被执行然后return了，Img2自然什么都么有。改正：把IplImage* img=cvLoadImage("D:\\demo2.jpg");改成IplImage* img=cvLoadImage("D:\\demo2.jpg",0);//强制转化读取的图像为灰度图附：cvLoadImage函数使用方法cvLoadImage( filename, -1 ); //默认读取图像的原通道数cvLoadImage( filename, 0 ); //强制转化读取图像为灰度图cvLoadImage( filename, 1 ); //读取彩色图

图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。我整理了图像分割技术论文，欢迎阅读!

图像分割技术研究

摘要：图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。本文介绍了基于阈值的分割方法和图像分割的图像分割性能的评价、应用现状;最后总结出图像分割的发展趋势。

关键词：图像分割、阈值、边缘检测、区域分割

中图分类号： TN957.52 文献标识码： A

1引言

随着图像分割技术研究的深入，其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题，是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的，有很大的针对性和局限性，到目前为止还不存在一个通用的方法，也不存在一个判断分割是否成功的客观标准。因此，对图像分割的研究目前还缺乏一个统一的理论体系，使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation)，简单地说就是将一幅数字图像分割成不同的区域，在同一区域内具有在一定的准则下可认为是相同的性质，如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

2.1基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一，它是用一个或几个阈值将图像的灰度级分为几个部分，认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种：

(1)单阈值法，用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时，选择两峰之间的谷底作为阈值。

(2)双阈值法，用两个阈值区分背景和目标。通过设置两个阈值，以防单阈值设置阈值过高或过低，把目标像素误归为背景像素，或把背景像素误归为目标像素。

(3)多阈值法，当存在照明不均，突发噪声等因素或背景灰度变化较大时，整幅图像不存在合适的单一阈值，单一阈值不能兼顾图像不同区域的具体情况，这时可将图像分块处理，对每一块设一个阈值。

2.2 边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有：差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况，其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

2.3基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割，效果较好。

区域生长方法是把一幅图像分成许多小区域开始的，这些初始的小区域可能是小的邻域甚至是单个像素，在每个区域中，通过计算能反映一个物体内像素一致性的特征，作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数，即特征。接下来对相邻区域的所有边界进行考查，如果给定边界两侧的特征值差异明显，那么这个边界很强，反之则弱。强边界允许继续存在，而弱边界被消除，相邻区域被合并。没有可以消除的弱边界时，区域合并过程结束，图像分割也就完成。

2.4结合特定工具的图像分割技术

20世纪80年代末以来，随着一些特殊理论的出现及其成熟，如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等，大量学者致力于将新的概念、新的方法用于图像分割，有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

2.4.1基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中，将一幅图像比为一个具有不同高度值的地形，高灰度值处被认为是山脊，底灰度值处被认为是山谷，将一滴水从任一点流下，它会朝地势底的地方流动，最终聚于某一局部最底点，最后所有的水滴会分聚在不同的吸引盆地，由此，相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良，能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息，对噪声较敏感。

2.4.2基于模糊数学的分割算法

目前，模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合，形成一系列的集成模糊分割技术，例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理，使真正的边缘处于较低灰度级，但还有一些不是边缘的像素点的灰度也在较低灰度级中，虽然算法的计算简明，且边缘细腻，但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述，通过计算图像的模糊熵来选取图像的分割阈值，后用阈值法处理图像得到边界。

2.4.3基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法，它使用参数编码集而不是参数本身，通过模拟进化，以适者生存的策略搜索函数的解空间，它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作，它唯一需要的信息是适应值，通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索，且可以降低搜索空间维数，降低算法对模板初始位置的敏感，计算时间也大为减少。其缺点是容易收敛于局部最优。

2.4.4基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力，适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题，因而也适合解决比较复杂的图像分割问题。原则上讲，大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚，只有多层前馈NN，多层误差反传(BP)NN，自组织NN，Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割，输入层神经元的数目取决于输入特征数，而输出层神经元的数目等同于分类的数目。

2.5图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法，有关图像分割方法和文献很多，新方法不断产生，这些方法有的只对特定的情形有效，有的综合了几种方法，放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法，这种方法将图像欲分割成的几个区域各以一个不同的标号来表示，用一定的方式对图像中的每一个像素赋以标号，标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法，基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割，由于新的数学工具的引入，纹理分割技术取得了一些进展，张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法，直接建立在先验知识的基础上，使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容：一是研究各分割算法在不同情况下的表现，掌握如何选择和控制其参数设置，以适应不同需要。二是分析多个分割算法在分割同一图像时的性能，比较优劣，以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能，而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣，由于缺乏可靠理论依据，并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的，不同的评价方法只能反映分割算法性能的某一性能。另一方面，每一种分割算法的性能是由多种因素决定的，因此，有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用，图像分割技术呈现出以下的发展趋势：(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦，等译.北京：电子工业出版社，2003

[2] 章毓晋.图像分割[M].北京：科学出版社，2001.

[3] 李弼程，彭天强，彭波等.智能图像处理技术[M].北京：电子工业出版社，2004.

[4] 杨晖，曲秀杰.图像分割方法综述[J].电脑开发与应用。2005，18(3)：21-23.

点击下页还有更多>>>图像分割技术论文

数字图像边缘检测技术论文

摘要针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点，本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处理硬件平台，DSP/BIOS为实时操作系统，利用CCS开发环境来构建应用程序；并通过摄像头提取视频序列，实现对边缘检测Sobel算子改进[1]。关键词 DM642；Sobel算子；程序优化；图像边缘检测 1 引言边缘是图像中重要的特征之一，是计算机视觉、模式识别等研究领域的重要基础。图像的大部分主要信息都存在于图像的边缘中，主要表现为图像局部特征的不连续性，是图像中灰度变化比较强烈的地方，也即通常所说的信号发生奇异变化的地方。经典的边缘检测算法是利用边缘处的一阶导数取极值、二阶导数在阶梯状边缘处呈零交叉或在屋顶状边缘处取极值的微分算法。图像边缘检测一直是图像处理中的热点和难点。近年来，随着数学和人工智能技术的发展，各种类型的边缘检测算法不断涌现，如神经网络、遗传算法、数学形态学等理论运用到图像的边缘检测中。但由于边缘检测存在着检测精度、边缘定位精度和抗噪声等方面的矛盾及对于不同的算法边缘检测结果的精度却没有统一的衡量标准，所以至今都还不能取得令人满意的效果。另外随着网络和多媒体技术的发展，图像库逐渐变得非常庞大；而又由于实时图像的目标和背景间的变化都不尽相同，如何实现实时图像边缘的精确定位和提取成为人们必须面对的问题。随着DSP芯片处理技术的发展，尤其是在图像处理方面的提高如TMS320C6000系列，为实现高效的、实时的边缘检测提供了可能性[5]。在经典的边缘检测算法中，Sobel边缘检测算法因其计算量小、实现简单、处理速度快，并且所得的边缘光滑、连续等优点而得到广泛的应用。本文针对Sobel算法的性能，并借助于TMS320DM642处理芯片[3]，对该边缘检测算法进行了改进和对程序的优化，满足实时性需求。2 Sobel边缘检测算法的改进经典的Sobel图像边缘检测算法，是在图像空间利用两个方向模板与图像进行邻域卷积来完成的，这两个方向模板一个是检测垂直边缘，一个是检测水平边缘。算法的基本原理：由于图像边缘附近的亮度变化较大，所以可以把那些在邻域内，灰度变化超过某个适当阈值TH的像素点当作边缘点。Sobel算法的优点是计算简单，速度快。但由于只采用了两个方向模板，只能检测水平方向和垂直方向的边缘，因此，这种算法对于纹理较复杂的图像，其边缘检测效果欠佳；同时，经典Sobel算法认为，凡灰度新值大于或等于阈值的像素点都是边缘点。这种判定依据是欠合理的，会造成边缘点的误判，因为多噪声点的灰度新值也很大。2.1 图像加权中值滤波由于图像中的边缘和噪声在频域中均表现为高频成分，所以在边缘检测之前有必要先对图像进行一次滤波处理，减少噪声对边缘检测的影响。中值滤波是一种非线性信号的处理方法[2]，在图像处理中，常用来保护边缘信息；保证滤波的效果。加权中值滤波，首先对每个窗口进行排序，取适当的比例，进行曲线拟合，拟合后的曲线斜率表征了此窗口的图像特征，再根据图像各部分特性适当的选择权重进行加权。2.2 增加方向模板除了水平和垂直两方向外，图像的边缘还有其它的方向，如135o和45o等，为了增加算子在某一像素点检测边缘的精度，可将方向模板由2个增加为8个即再在经典的方向模板的基础上增加6个方向模板，如图1所示。2.3 边缘的定位及噪声的去除通常物体的边缘是连续而光滑的，且边缘具有方向和幅度两个特征，而噪声是随机的。沿任一边缘点走向总能找到另一个边缘点，且这两个边缘点之间的灰度差和方向差相近。而噪声却不同，在一般情况下，沿任一噪声点很难找到与其灰度值和方差相似的噪声点[4]。基于这一思想，可以将噪声点和边缘点区分开来。对于一幅数字图像f(x，y)，利用上述的8个方向模板Sobel算子对图像中的每个像素计算，取得其中的最大值作为该点的新值，而该最大值对应的模板所表示的方向为该像素点的方向。若｜f(x，y)－f(x+i，y+j)｜＞TH2，对于任意i=0，1，-1；j=0，1，-1均成立，则可判断点(x，y)为噪声点。图2给出了图像边缘检测系统改进算法的软件流程图。图1 边缘检测8个方向模板图2 系统结构图3 基于TMS320DM642的图像处理的设计及算法优化3.1 TMS320DM642功能模块及图像处理系统的硬件结构 DSP以高速数字信号处理为目标进行芯片设计，采用改进的哈佛结构(程序总线和数据总线分开)、内部具有硬件乘法器、应用流水线技术、具有良好的并行性和专门用于数字信号处理的指令及超长指令字结构(VLIW)等特点；能完成运算量大的实时数字图像处理工作。 TMS320DM642是TI公式最近推出的功能比较强大的TMS320C6x系列之一，是目前定点DSP领域里性能较高的一款[6]。其主频是600MHz，8个并行运算单元、专用硬件逻辑、片内存储器和片内外设电路等硬件，处理能力可达4800MIPS。DM642基于C64x内核，并在其基础上增加了很多外围设备和接口，因而在实际工程中的应用更为广泛和简便。本系统使用50 MHz晶体震荡器作为DSP的外部时钟输入，经过内部锁相环12倍频后产生600 MHz的工作频率。DM642采用了2级缓存结构(L1和L2)，大幅度提高了程序的运行性能。片内64位的EMIF(External Memory Interface)接口可以与SDRAM、Flash等存储器件无缝连接，极大地方便了大量数据的搬移。更重要的是，作为一款专用视频处理芯片，DM642包括了3个专用的视频端口(VP0～VP2)，用于接收和处理视频，提高了整个系统的性能。此外，DM642自带的EMAC口以及从EMIF 口扩展出来的ATA口，还为处理完成后产生的海量数据提供了存储通道。本系统是采用瑞泰公司开发的基于TI TMS320DM642 DSP芯片的评估开发板——ICETEK DM642 PCI。在ICETEK DM642 PCI评估板中将硬件平台分为五个部分，分别是视频采集、数据存储、图像处理、结果显示和电源管理。视频采集部分采用模拟PAL制摄像头，配合高精度视频A/D转换器得到数字图像。基于DSP的视频采集要求对视频信号具备采集，实时显示、对图像的处理和分析能力。视频A/D采样电路—SAA7115与视频端口0或1相连，实现视频的实时采集功能。视频D/A电路—SAA7105与视频口2相连，视频输出信号支持RGB、HD合成视频、PAL/NTSC复合视频和S端子视频信号。通过I2C总线对SAA7105的内部寄存器编程实现不同输出。整个系统过程由三个部分组成：图像采集—边缘处理—输出显示，如图2所示。摄像头采集的视频信号经视频编码器SAA7115数字化，DM642通过I2C总线对SAA7115进行参数配置。在SAA7115内部进行一系列的处理和变换后形成的数字视频数据流，输入到核心处理单元DM642。经过DSP处理后的数字视频再经过SAA7105视频编码器进行D/A转换后在显示器上显示最终处理结果。3.2 图像处理的软件设计和算法优化的实现由于在改进Sobel边缘检测算子性能的同时，也相对增加了计算量，尤其是方向模板的增加，每个像素点均由原来的2次卷积运算增加为8次卷积运算，其实时性大大减弱。为了改进上述的不足，在深入研究处理系统和算法后，针对TMS320DM642的硬件结构特点，研究适合在TMS320DM642中高效运行的Sobel改进算法，满足实时处理的要求。整个程序的编写和调试按照C6000软件开发流程进行，流程分为：产生C代码、优化C代码和编写线性汇编程序3个阶段。使用的工具是TI的集成开发环境CCS。在CCS下，可对软件进行编辑、编译、调试、代码性能测试等工作。在使用C6000编译器开发和优化C代码时[7-8]，对C代码中低效率和需要反复调用的函数需用线性汇编重新编写，再用汇编优化器优化。整个系统的控制以及数字图像处理是用C程序实现，大部分软件设计采用C程序实现，这无疑提高了程序的可读性和可移植性，而汇编程序主要是实现DM642的各部分初始化。其边缘检测优化算法在DM642中的实现步骤具体如下： S1：根据DM642的硬件结构要求和控制寄存器设置，初始化系统并编写实现边缘检测算法的C程序。 S2：借助CCS开发环境的优化工具如Profiler等产生.OUT文件。 S3：根据产生的附件文件如.MAP文件，分析优化结果及源程序结构，进一步改进源程序和优化方法。 S4：使用CCS中调试、链接、运行等工具，再生成.OUT可执行文件。 S5：运行程序，如果满足要求则停止；否则重复步骤S2～S4直至满足使用要求。4 实验结果本文以Lena图像为例根据上述的硬件环境和算法实现的原理和方法，图4～图6分别给出了在该系统下采集的视频Lena图像及使用边缘检测算子和改进后处理的结果。由实验结果可以看出，在该系统下能实时完成视频图像的处理，并且给出的边缘检测算子能较好的消除噪声的影响，边缘轮廓清晰。该算法不仅能抑制图像中大部分噪声和虚假边缘，还保证了较高的边缘点位精度。图4 Lena原始图像图5 传统Sobel算子图6 改进Sobel算子5 总结本文实现了在TMS320DM642评估板上用改进的Sobel算子对实时图像进行边缘检测，无延迟地得到边缘图像。边缘检测效果较好，既提高了图像检测的精度又满足了实时性的要求。从检测结果看，利用该改进后的算子在边缘精确定位、边缘提取都达到了很好的效果，且抗噪声能力强，并为目标跟踪、无接触式检测、自动驾驶、视频监控等领域的应用提供了坚实的基础。参考文献[1] 王磊等. 基于Sobel理论的边缘提取改善方法[J]．中国图像图形学报，2005.10[2] 陈宏席. 基于保持平滑滤波的Sobel算子边缘检测.兰州交通大学学报，2006，25(1)：86—90[3] 熊伟. 基于TMS320DM642的多路视频采集处理板卡硬件设计与实现[ M]. 国外电子元器件，2006[4] 朱立.一种具有抗噪声干扰的图像边缘提取算法的研究[J]．电子技术应用.2004，25(1)[5] 刘松涛，周晓东.基于TMS320C6201的实时图像处理系统[J].计算机工程，2005(7)：17—23[6] TI TMS320DM642 video/imaging fixed-point digital signal processor data manual，2003[7] TMS320C6x Optimizing C Compiler User’s Guide’ TEXAS INSTRUMENTS”，2002[8] TMS320C32x Optimizing C/C++ Compiler User's Guide，Texas Instruments Incorporated，2001

Canny边缘检测教程作者：比尔绿色（ 2002 ）主页电子邮件本教程假定读者：（ 1 ）知道如何发展的源代码阅读栅格数据（ 2 ）已经阅读我Sobel边缘检测教程本教程将教你如何：（ 1 ）实施Canny边缘检测算法。导言边的特点，因此，边界问题，根本的重要性在图像处理中。在图像的边缘地区，强度强的反差？猛增强度从一个像素的下一个。边缘检测的图像大大减少了大量的数据，并过滤掉无用的信息，同时保持重要的结构性能的形象。这也是我在索贝尔和拉普拉斯边缘检测教程，但我只是想再次强调这一点的，为什么您要检测的边缘。的Canny边缘检测算法是众所周知的许多人视为最佳边缘检测。精明的意图是要加强许多边缘探测器已经在的时候，他开始了他的工作。他很成功地实现他的目标和他的思想和方法中可以找到他的论文“计算方法的边缘检测” 。在他的文件中，他遵循的标准清单，以改善目前的边缘检测方法。第一个也是最明显的错误率低。重要的是，发生在图像边缘不应错过的，没有任何反应，非边缘。第二个标准是，边缘点很好地本地化。换言之，之间的距离边缘像素作为探测器发现和实际边缘要在最低限度。第三个标准是，只有一个回应单一优势。这是第一次实施，因为并没有实质性的2足以完全消除的可能性，多反应的优势。根据这些标准， Canny边缘检测器的第一个平滑的图像，以消除和噪音。然后认定的形象，以突出地区梯度高空间衍生物。该算法然后轨道沿着这些地区和抑制任何像素这不是在最高（ nonmaximum制止）。梯度阵列现在进一步减少滞后。磁滞用来追踪沿其余像素，但没有压制。磁滞使用两个阈值，如果规模低于第一道门槛，这是设置为零（发了nonedge ）。如果是规模以上的高门槛，这是一个优势。如果震级之间的2阈值，那么它设置为零，除非有一条从这个像素一个像素的梯度上述时刻。第1步为了落实Canny边缘检测算法，一系列步骤必须遵循。第一步是筛选出任何噪音的原始图像在寻找和发现任何边缘。而且因为高斯滤波器可以用一个简单的计算面具，它是专门用于在Canny算法。一旦合适的面罩已计算，高斯平滑可以用标准的卷积方法。阿卷积掩模通常远远小于实际的形象。因此，该面具是下跌的形象，操纵一个正方形像素的时间。较大的宽度高斯面具，较低的是探测器的敏感性噪音。定位误差检测边缘也略有增加的高斯宽度增加。高斯遮罩使用我在执行下面显示。第2步经过平滑的形象，消除噪音，下一步就是要找到优势兵力，采取梯度的形象。的Sobel算子进行二维空间梯度测量的形象。然后，大约绝对梯度幅度（边缘强度）各点可以找到。 Sobel算子的使用对3x3卷积口罩，一个梯度估计在X方向（栏）和其他的梯度估计的Y方向（行）。它们如下所示：的规模，或EDGE强度，梯度近似然后使用公式： | G | = | GX的| + |戈瑞| 第3步寻找边缘方向是小事，一旦梯度在X和Y方向是众所周知的。然而，你会产生错误时sumX等于零。因此，在代码中必须有一个限制规定只要发生。每当梯度在x方向等于零，边缘的方向，必须等于90度或0度，取决于什么的价值梯度的Y方向等于。如果青的值为零，边缘方向将等于0度。否则边缘方向将等于90度。公式为寻找边缘方向是：论旨= invtan （戈瑞/ GX的）第4步一旦边缘方向众所周知，下一步是与边缘方向为方向，可以追溯到在一个图像。因此，如果一个5x5像素图像对齐如下： x x x x x x x x x x x x 1 x x x x x x x x x x x x 然后，可以看到看像素的“ A ” ，只有4个可能的方向时，描述了周围的像素- 0度（水平方向）， 45度（沿积极对角线）， 90度（垂直方向），或135度（沿负对角线）。所以，现在的边缘方向已经得到解决纳入其中四个方向取决于哪个方向，它是最接近于（如角被发现有3度，使零摄氏度）。认为这是采取了半圆形和分裂成5个地区。因此，任何先进的方向范围内的黄色范围（ 0至5月22日＆ 157.5至180度）设置为0度。任何先进的方向下滑的绿色范围（ 22.5至67.5度）设置为45度。任何先进的方向下滑的蓝色范围（ 67.5至112.5度）设置为90度。最后，任何先进的方向范围内的红色范围（ 112.5到157.5度）设置为135度。第5步在被称为边缘方向， nonmaximum制止目前适用。 Nonmaximum抑制是用来追踪沿边缘方向和制止任何像素值（套等于0 ）这是不被认为是优势。这将让细线在输出图像。第6步最后，滞后是用来作为一种手段，消除条纹。裸奔是打破的边缘轮廓线的经营者造成的产量波动上面和下面的门槛。如果一个门槛， T1讯号适用于图像，并具有优势的平均强度相等的T1 ，然后由于噪声，将先进的情况下，逢低低于阈值。同样它也将延长超过阈值决策的优势看起来像一个虚线。为了避免这种情况，滞后使用2的门槛，高和低。任何像素的图像，其值大于表＃ t1推定为边缘像素，并标示为这种立即。然后，任何像素连接到这个边缘像素，并有一个值大于时刻还选定为边缘像素。如果您认为以下的优势，您需要一个梯度的时刻开始，但你不停止直到触及梯度低于表＃ t1 。

本教程将教你如何：（ 1 ）实施图像边缘检测算法。导言边的特点，因此，边界问题，根本的重要性在图像处理中。在图像的边缘地区，强度强的反差？猛增强度从一个像素的下一个。边缘检测的图像大大减少了大量的数据，并过滤掉无用的信息，同时保持重要的结构性能的形象。这也是我在索贝尔和拉普拉斯边缘检测教程，但我只是想再次强调这一点的，为什么您要检测的边缘。图像边缘检测算法是众所周知的许多人视为最佳边缘检测。精明的意图是要加强许多边缘探测器已经在的时候，他开始了他的工作。他很成功地实现他的目标和他的思想和方法中可以找到他的论文“计算方法的边缘检测” 。在他的文件中，他遵循的标准清单，以改善目前的边缘检测方法。第一个也是最明显的错误率低。重要的是，发生在图像边缘不应错过的，没有任何反应，非边缘。第二个标准是，边缘点很好地本地化。换言之，之间的距离边缘像素作为探测器发现和实际边缘要在最低限度。第三个标准是，只有一个回应单一优势。这是第一次实施，因为并没有实质性的2足以完全消除的可能性，多反应的优势。根据这些标准，图像边缘检测器的第一个平滑的图像，以消除和噪音。然后认定的形象，以突出地区梯度高空间衍生物。该算法然后轨道沿着这些地区和抑制任何像素这不是在最高（非最大限度制止）。梯度阵列现在进一步减少滞后。磁滞用来追踪沿其余像素，但没有压制。磁滞使用两个阈值，如果规模低于第一道门槛，这是设置为零（发了nonedge ）。如果是规模以上的高门槛，这是一个优势。如果震级之间的2阈值，那么它设置为零，除非有一条从这个像素一个像素的梯度上述时刻。第1步为了落实图像边缘检测算法，一系列步骤必须遵循。第一步是筛选出任何噪音的原始图像在寻找和发现任何边缘。而且因为高斯滤波器可以用一个简单的计算面具，它是专门用于在Canny算法。一旦合适的面罩已计算，高斯平滑可以用标准的卷积方法。阿卷积掩模通常远远小于实际的形象。因此，该面具是下跌的形象，操纵一个正方形像素的时间。较大的宽度高斯面具，较低的是探测器的敏感性噪音。定位误差检测边缘也略有增加的高斯宽度增加。高斯遮罩使用我在执行下面显示。第2步经过平滑的形象，消除噪音，下一步就是要找到优势兵力，采取梯度的形象。的Sobel算子进行二维空间梯度测量的形象。然后，大约绝对梯度幅度（边缘强度）各点可以找到。 Sobel算子的使用对3x3卷积口罩，一个梯度估计在X方向（栏）和其他的梯度估计的Y方向（行）。它们如下所示：的规模，或EDGE强度，梯度近似然后使用公式： | G | = | GX的| + |戈瑞| 第3步寻找边缘方向是小事，一旦梯度在X和Y方向是众所周知的。然而，你会产生错误时sumX等于零。因此，在代码中必须有一个限制规定只要发生。每当梯度在x方向等于零，边缘的方向，必须等于90度或0度，取决于什么的价值梯度的Y方向等于。如果青的值为零，边缘方向将等于0度。否则边缘方向将等于90度。公式为寻找边缘方向是：论旨= invtan （戈瑞/ GX的）第4步一旦边缘方向众所周知，下一步是与边缘方向为方向，可以追溯到在一个图像。因此，如果一个5x5像素图像对齐如下： x x x x x x x x x x x x 1 x x x x x x x x x x x x 然后，可以看到看像素的“ A ” ，只有4个可能的方向时，描述了周围的像素- 0度（水平方向）， 45度（沿积极对角线）， 90度（垂直方向），或135度（沿负对角线）。所以，现在的边缘方向已经得到解决纳入其中四个方向取决于哪个方向，它是最接近于（如角被发现有3度，使零摄氏度）。认为这是采取了半圆形和分裂成5个地区。因此，任何先进的方向范围内的黄色范围（ 0至5月22日＆ 157.5至180度）设置为0度。任何先进的方向下滑的绿色范围（ 22.5至67.5度）设置为45度。任何先进的方向下滑的蓝色范围（ 67.5至112.5度）设置为90度。最后，任何先进的方向范围内的红色范围（ 112.5到157.5度）设置为135度。第5步在被称为边缘方向，非最大限度制止目前适用。非最大限度抑制是用来追踪沿边缘方向和制止任何像素值（套等于0 ）这是不被认为是优势。这将让细线在输出图像。第6步最后，滞后是用来作为一种手段，消除条纹。裸奔是打破的边缘轮廓线的经营者造成的产量波动上面和下面的门槛。如果一个门槛， T1讯号适用于图像，并具有优势的平均强度相等的T1 ，然后由于噪声，将先进的情况下，逢低低于阈值。同样它也将延长超过阈值决策的优势看起来像一个虚线。为了避免这种情况，滞后使用2的门槛，高和低。任何像素的图像，其值大于表＃ t1推定为边缘像素，并标示为这种立即。然后，任何像素连接到这个边缘像素，并有一个值大于时刻还选定为边缘像素。如果您认为以下的优势，您需要一个梯度的时刻开始，但你不停止直到触及梯度低于表＃ t1 。

图像边缘检测论文开题报告

首先，要深入了解毕业设计（论文）题目的研究背景和国内外研究现状。你的毕业论文是关于什么主题的？该主题的国内外研究现状是什么？有哪些代表性的成果、前沿技术、代表性人物？该主题的历史发展脉络怎样？现在存在哪些问题？将来的发展趋势是什么？等等。这需要你去阅读大量的参考文献。可以从知网、维普获取论文。阅读关于你的论文主题的综述性文章会非常有效。例如我指导的学生要从事农业领域图像处理与分析方面的研究，我就会建议他查阅一些农业信息化、图像处理、Python、scikit-image方面的文献、计算机编程语言、和图像处理API。有了这些基础，学生就会大概知道应该怎么去开展毕业设计工作。其次，要弄清楚你的毕业论文任务是什么，即搞明白“做什么”的问题。毕业论文题目一般是经过老师与学生双选、师生反复沟通、明确任务后确定下来的。题目确定下来后，你要认真搞清楚论文是要做什么。比如同样是图像处理，有图像分割、图像识别、视频编辑等不同问题。那么你就要搞清楚你的任务究竟是做那一块。也有的老师可能会把一个系统分成不同的模块，让每个同学做其中的一个模块。那么你就要搞清楚整个系统要实现什么样的功能，自己负责的模块在整个系统中的作用，你的模块与其他同学所负责的模块的联系与区别。避免与其他同学造成重复。第三，要制订设计方案或调查研究方案，即解决“怎么做”的问题。明确了“做什么”，下一步就是要确定“怎么做”。对实验类、设计类，要制订合理的实验方案、设计方案，选择实验工具、设备、仪器、材料。对社会调查类，要制订调研方案，比如去什么地方调查，调查什么人，调查什么现象等等。实验方案、设计方案、调查方案是开展毕业设计或论文必不可少的一个步骤。好的方案会非常有助于你的任务开展。如果方案不合理，可能会导致研究走向错误的方向。制订方案需要参考同行、前辈的研究，也要与老师沟通，得到老师的指导。

在进行研究思路撰写时要将研究问题、研究方法、研究逻辑和研究目标相同一。课题研究的基本思路回答的是用什么理论方法去研究课题，主要的写作逻辑为“以…为切入点，运用…的理论和方法，通过…环节或途径，最终实现了…目标”。下面我们通过图片和范例的形式，为大家详细说明怎么写研究思路：（一）研究思路：1、以文献研究法为指导，通过建立健全有关的规章制度，完善学校对党员的评价。2、通过开展党员贯彻落实学校“双主协调，共同发展”的教学理念示范性教学为主导的教学研究活动，进行新一轮教学思想大解放活动。3、通过访问等形式向广大群众了解和征求意见，研究党支部的学校思想大解放中的推动作用。（二）实施步骤：分为3个阶段：1、准备阶段a.筹建课题研究主要成员小组，撰写课题申请报告；b.撰写课题开题报告。2、申报与立项阶段a.正式申报课题，等待批准立项；b.修改开题报告，确定细化研究内容与方向，召开开题会；3、实施阶段

【关键词】图像配准; 多源传感器; 位置约束; 特征提取; 多种特征组合【摘要】随着遥感技术迅速发展和新型传感器的不断涌现,人们获取遥感图像数据的能力不断提高。在利用这些多源遥感图像进行数据融合、目标变化检测、目标识别等多源协同处理工作之前,必须进行多源图像配准工作,配准精度的高低直接影响到后续应用效果的好坏。为此,本文主要研究了多源遥感图像间的配准技术,作为协同系统中的关键技术,要求配准方法在运算能力和配准精度方面都能够达到较好的效果。首先,本文对现有的多源图像配准技术进行原理上的分析与介绍。通过对多种配准方法的分类与比较,指出了遥感图像配准的通用技术环节与技术要点。并在研究过程中分析关键技术环节的难点与所面临问题。其次,本文针对传统多源配准方法在进行控制点对应时运算量大,误配情况多的现状,提出了一种基于位置约束的多源遥感影像配准技术。该方法首先利用人工粗略选取少量控制点对,得到粗略位置映射关系,之后利用位置信息以及分辨率信息建立局部窗函数进行搜索匹配,对两幅图像中提取的Harris角点进行筛选,最终得到的控制点对作为求取配准参数的控制点输入,并利用此方法进行了多组图像的实验来证明方法的通用性。然后,本文针对传统配准方法需要人工参与,并且仅使用单一特征进行匹配效...更多果差的缺点,提出了一种基于多特征组合的多源遥感图像自动配准技术。这种方法利用了由粗至精的配准思想,结合使用点、线、面特征分别进行粗配准及精细配准两个过程。重点解决了其中少量初始控制点对的匹配和更多控制点对的获取。完成了存在闭合区域的多源遥感图像间的自动配准过程,并实验验证了方法的配准精度。最后,为了对配准后的遥感图像进行直观的视觉评价,本文介绍了配准后图像间的镶嵌以及融合等简单应用。通过实验,可以很直观的看出配准的效果,完成配准的定性评价。

图像分割与边缘检测实验分析论文

中北大学2012届毕业论文第1页共47页 1 引言 1 课题的提出以及研究意义使计算器具有人类的感知的能力，能够识图认字，能听话和说话，能与人们自然的进行信息交互，是人们长期以来的梦想。经过二十余年的奋斗，这些梦想已逐渐部分成真。赋予计算机识图认字的智能，能够解脱人们将汉字输入计算机的繁重劳动，克服计算机汉语信息的汉字输入困难的问题，对我国信息化发展更具有特殊重要的价值。随着计算机技术、通信技术、多媒体技术以及Internet的迅速发展，人们越来越深刻地感受到了计算机处理事情的便捷。提取并识别图像中的文字，在图像数据库的组织与管理、视频索引、公交、交通、旅游、摄影等方面将有着极其广泛的应用。随着电力系统的规模增大，电力设备也越来越多，且设备分布具有跨地域性的特点，因此怎样管理维护这些设备，并可随时查看这些设备的信息成为一个急需解决的问题。图像中往往包含着丰富的文字信息，若能将图像中的文字进行自动检测、分割、提取和识别，则对图像高层语义内容的自动理解、索引和检索非常有价值。因此，90年代，随着多媒体技术的发展以及对基于内容的多媒体检索的需求，图像中的文字获取又逐渐成为研究热点之一。电力设备标牌图像中的文字获取对图像识别、检索有重要意义。从电力设备标牌图像中提取文字需要首先定位包含文字的图像区域，由于电力设备标牌中的文字在字体、大小、对齐方式和排列上变化多端，文字背景复杂，而许多应用场合还要求算法具有一定处理速度，这些都使得从其图像中有效地提取文字变得困难，对其深入研究很有意义。电力设备标牌图像中有丰富的文字信息，对图像中的文字信息的提取将是图像处理方面研究的一个重要方向。在电力系统中，电力设备种类繁多，通过对设备图像的采集，识别出电力设备标牌的文字信息，建立设备信息图文库，对电力设备的年检、统计等工作更加便捷、高效，对提高电力系统的设备管理水平非常重要。在电力管理上的技术需求越来越引起人们的关注和期待，而在此方向的技术研究目前还是一个空白点，因此，研究设备图片中的字符识别技术具有广泛的实际应用价值和重要的学术意义。 2 相关技术研究现状中北大学2012届毕业论文第2页共47页目前电力设备标牌识别的研究还是一个空白点。其相关技术包括车牌识别技术和对图像中的文字识别技术[1]。电气标牌字符的识别研究还很滞后，目前仍没有相对成熟的系统。随着电力系统的规模增大，电力设备也越来越多，怎样管理维护这些设备，是我们现在需要努力研究并有待应用的一门技术。当前，图像作为一种重要的可视化信息媒体，已被应用到几乎所有的科学技术领域和日常生活的各个方面。随着图像信息的快速增长，从海量的图像资源中快速高效地提取并识别信息已成为人们迫切的需求。因此，20世纪90年代，基于内容的图像检索（CBIR）[2]技术应运而生，从可视化角度开辟了一条更为直观、准确的途径，并很快成为智能信息处理领域的研究热点。如今牌照定位是从一张图片中找到标牌的位置，将包括牌照的子图像从这张图片中切割出来。主要有边缘特征法[3]、神经网络法[4,5]、基于灰度的检测方法、基于数学形态学法、基于颜色的分割方法、基于区域特征的方法、小波变换的方法等。文字识别技术已经广泛应用到了各个领域中，它作为计算机智能接口的重要组成部分，在信息处理领域中可以大大提高计算机的使用效率。字符识别的对象是汉字、字母和数字。我国牌照的独有的特点是包括汉字的识别。汉字因为其结构复杂，使得识别过程有别于数字和字母。目前主要的字符识别方法有：模板匹配法、统计特征字符识别法、结构特征字符识别法、人工神经网络法。模板匹配对噪声比较敏感，并对字符的字体变化具有不适应的特点。基于统计特征的字符识别法对于形近字符区分能力弱，而且需要寻找特征，特征有时随图像变化而失效。结构特征的描述和比较要占用大量的存储和计算资源，因此算法在实现上相对复杂、识别速度慢。神经网络法也存在找寻特征和计算量大的问题。光学字符识别（OCR）技术是计算机自动、高速地辨别纸上的文字，并将其转化为可编辑的文本的一项实用技术。它是新一代计算器智能接口的一个重要组成部分，也是模式识别领域的一个重要分支。因此，在电力标牌的字符识别中，OCR技术也得到了广泛的应用，是其进行识别不可或缺的技术力量。Lienhart等[6,7]先后开发出两个视频中的文字检测、分割和识别系统。这两个系统都是利用文字的单色性相对于背景的高对比度和视频字幕的简单纹理来进行图像分割。近几年，国内学者也开始关注并积极投身到电力设备标牌的字符检测领域来，但中北大学2012届毕业论文第3页共47页是都仅限于在进行基于内容的多媒体检索的研究时，附带地介绍了图像和视频中的文字获取，并没有进行系统深入的研究，也没有开发出相应可行的系统。如何识别图像中的文字仍然是一个有待研究解决的问题。 3 本课题主要内容电力设备标牌字符识别涉及到的技术和车牌识别技术有些相似处，车牌识别技术已经较为成熟，但是，电力设备标牌识别与之有很多不同之处。主要包括： (1)图像的预处理技术。标牌中有很多钢印信息，通过二值化[8,9]提取标牌特征时，需要完整的提取其特征量。而车牌上的信息在提取时不存在上述问题。 (2)电力设备标牌中的信息识别技术。标牌中的字符很多，尤其是所涉及的汉字比较丰富，而车牌中字符构成比较简单。本文对电力系统中设备标牌中的字符识别技术进行了研究，对设备标牌中的字符识别系统的每一个模块进行了研究及实现。电力设备图片在识别前首先需要对图像进行预处理，以更好的提取标牌中的信息。其次，分割图像。最后进行标牌上的字符识别。因此，本课题主要研究内容为：（一）电力设备标牌的图像预处理方法的研究。采集到的设备图片不可避免的会受到噪声的污染，需要对设备图片进行处理以及修正，突出图片中的标牌信息，增强图像，以便更好的进行字符识别。（二）分析电力设备标牌特点，结合设备标牌特点研究适合标牌图像的二值化方法。（三）研究边缘检测算子并对图像进行边缘检测处理，分析实验结果，并进行图像的分割。（四）应用光学字符识别（OCR）[12,13,14,15]技术和字符识别技术进行电力设备标牌的识别[16,17,18,19]。在拟采用的研究手段上分别从设备图像预处理、标牌的二值化算法以及标牌图像的分割和字符的识别四个方面进行阐述： 1)进行图像的滤波处理、经灰度直方图灰度修正以及灰度图像对比处理把我们感兴趣的部分突出出来。 2)为了进行有效的识别，采用阈值法进行标牌图像的二值化。通过对其标牌二值化，提取标牌图像中的钢印信息。中北大学2012届毕业论文第4页共47页 3）进行标牌图像的边缘检测和分割。 4）采用基于光学字符识别（OCR）的技术以及MATLAB软件算法完成对标牌字符的识别。中北大学2012届毕业论文第5页共47页 2 电力设备标牌图像预处理电力设备标牌图像由于背景的灰度值介于标头字符的灰度值和钢印灰度值之间，所以用单一的一个阈值无法将标头字符和钢印同时提取出来。为了进行有效的识别，首先需要对数字图像进行处理。二维物理图像被栅格划分成小的区域，这些小的区域称为数据元素（Picture Element），简称像素。对每个像素进行采样和量化，得到相应的整数值。这个值代表像素的明暗程度和颜色深浅等信息。每个引入噪声。图像可以分为二值图像、灰度图像、彩色图像。灰度图像只含亮度信息，不含彩色信息。灰度值用8位（Bit）表示，从0到255，一共256级，从黑（0）到白（255）。二值图像就只有代表黑白两色的两个灰度值，归一化后灰度值是黑（0）到白（1）。彩色图像每个像素值都有三个分量，分别表示红色（R），绿色（G）和蓝色（B）。每个分量又按各分量的灰度分为0到255共256级。根据RGB的不同组合就可以表示256 ×256×256种颜色，也就是常说的24位真彩色。 2.1 图像的读取 clear; close all; I=imread('bae.jpg'); imshow(I);（结果见图2（a）） 2.2 去噪在图像形成、传输或变换的过程中,由于受到其它客观因素诸如系统噪声、曝光不足或过量、相对运动等影响,获取图像往往会与原始图像之间产生某种差异(称为降质或退化)。退化后的图像通常模糊不清或者经过机器提取的信息量减少甚至错误,因此必须对其采取一些手段进行改善。图像增强技术正是在此意义上提出的,目的就是为了改善图像的质量。图像增强根据图像的模糊情况采用各种特殊的技术突出图像中的某些信息,削弱或消除无关信息,达到强调图像的整体或局部特征的目的。图像增强尚没有统一的理论方法。利用巴特沃斯（Butterworth）低通滤波器对受噪声干扰的图像进行平滑处理:

图像边沿检测的论文

（部分）张冬至，胡国清，夏伯锴，基于模态辨识的原油含水率智能组合测量模型[J]，华南理工大学学报，2009， Vol.37, pp73~78郭强,吕浩杰,胡国清.新型接触式电容压力传感器[J].仪表技术与传感器,2008, No.3,1-3.黄玉程; 胡国清; 吴雄英; 刘文艳; 人脸图像边缘检测的方法研究和应用[J], 计算机工程, Vol. 32, Sep. 20, 2006, pp: 220-221, （EI收录）黄玉程，胡国清，吴雄英，刘文艳，人脸识别系统中图像噪声去除方法研究[J]，微型计算机信息，Vol. 12, 2005, pp: 187~189, 40.胡国清，刘文艳，工程控制理论[M]，北京，机械工业出版社，2004, 3陈广文, 许高攀，胡国清，静电式微开关硅悬臂梁的变形分析[J]，传感技术，2001年20卷第12期，pp29~31许高攀，陈广文，胡国清, 微机电系统(MEMS)技术及其动态[J]。压电与声光，2001.Vol.5. pp: 34~37高攀，陈广文，胡国清，双面接触电容压力传感器的设计及制造工艺流程[J]，仪表技术与传感器，2001年， No.9, PP33~35刘文艳，胡国清，陶瓷液压阀的应力计算及分析[J]，机械工程学报 2000, Vol.9 PP: 44~47 (EI 收录)胡国清, 机电控制工程基础与应用[M](专著46万字, 独立撰写), 机械工业出版社, 1997年8月.胡国清等，张光函，吴持恭，SIMPLE方法的改进[J]，四川联合大学学报, Vol.1, No.3, 1997，pp: 72~75; (EI 收录)胡国清等，张光函，吴持恭，混合充分法研究[J], 四川联合大学学报, Vol.1, No.3, 1997, pp: 61~63 (EI 收录)胡国清，张光函，吴持恭，LDA和k¾e紊流模型研究液压集成块流流场[J], 成都科技大学学报1996, No.1, pp: 64~71, (EI 收录)

HED 论文： Holistically-Nested Edge Detection HED（Holistically-Nested Edge Detection）是一个端到端的边缘检测网络，特点是提取不同尺度的特征，和多输出的多监督及融合。 HED 在产业上应用比较广泛。 Holistic：指该方法的预测和训练都是端到端的；Neted：指通过多层级的输出，渐进地优化最终结果。作者的命名逻辑... 看这篇边缘检测的论文主要是想知道边缘检测的损失函数应该怎么设计。我本来的想法是直接像语义分割一样，用 IoU ，后来想想不对，如果一个边缘检测结果是 GT 平移了几个像素，那它仍可称得上好，但它的 IoU 却会骤降至和随机结果差不了多少。如果对边缘检测问题用 IoU 做优化对象，恐怕在优化时根本找不到可以下降的梯度方向。边缘检测的任务是提取图像内每个对象的边界，而排除对象的纹理。HED 被设计以解决两个问题：（1）对图像整体的训练和预测，End-to-end；（2）多尺度的特征提取。端到端很容易实现，因为边缘检测任务的输入和输出都是一张图片，只是通道数不同，很明显可以应用一个全卷积的网络来实现。HED 的骨干网络采用 VGG，并将 VGG 后面的全连接层结构全部移除，只保留卷积层。一些曾被应用过或正在被应用的多尺度特征提取方法。 (a) 多通路并行网络，通过不同的网络深度得到不同的感受野，输出聚合在一起； (b) 跳线连接，将来自不同卷积层的输出通过跳线连接在一起，作为特征提取结果（实际上跳线连接也可以在各个卷积层之间连接，而不仅限于到输出层，比如 U-Net 结构）； (c) 同一个网络，采用不同尺寸的输入； (d) 不同深度的网络完全分立（这个方法感觉最拉跨，各个尺度上的特征没有相关性，也没听说过有人这么搞）； (e) HED 提出的结构，在卷积网络的不同深度引出“侧输出”，将这些侧输出聚合成最终输出（和 (b) 的不同在于每个侧输出都能被监督并进行反向传播，这里应用了中继监督的思想，也是一个很泛用的做法）。这篇文章也用了中继监督，之前看的 Stacked Hourglass 也是。不过 Stacked Hourglass 的侧输出是还要被输入到下个特征提取网络里继续 refine 的，旨在迭代地优化输出结果。 HED 的侧输出和 GoogLnet 等一些常见的侧输出比较像，前面也说了，浅层的特征保留了更多的信息，但是相对而言感受野更小，那么 HED 就取多个不同深度的特征，分别在这些位点设置输出层。具体地，HED 在每个 VGG 内尺寸的特征图上引出一个卷积层作为侧输出层。HED 将边缘检测任务归纳为对每个像素点的二分类任务——“边缘”和“非边缘”。对于 HED 的单个输出而言，其损失函数为所有像素点的二分类损失函数的和，另外，由于边缘占的像素总数一般都会少于非边缘，所以实际是边缘的像素提供的二分类损失函数会乘以一个更大的权重，以进行正负样本平衡。HED 整体的损失函数就是它所有输出的损失函数的加权和。转化成数学语言就是：其中指特征提取网络（VGG）的权重，指 HED 第层输出的输出层权重，为平衡每层输出为最终损失贡献的系数，为平衡正负样本的系数，和分别指代边缘像素和非边缘像素，为像素输出的置信度。上面的损失函数是针对每个侧输出进行优化，HED 的最终输出是每个侧输出按照一定的权重加总得到的融合输出，这些权重是通过训练学习到的，而非人为设定的。融合输出的损失函数如下：其中融合输出，是每个侧输出在融合时的权重，计算输出和 GT 之间的距离，这里采用交叉熵函数。整个模型在训练时的优化目标权重为：可以看到，最终的损失函数中存在一定的冗余，由于融合输出是由侧输出得到的，侧输出似乎被不止一次地惩罚了。不过，先不论这种冗余是不是必要的，据作者言，只对融合输出进行惩罚得到的效果是不够好的，因为模型总会区域学习更大尺度上的特征。 HED 的损失函数是一种很直接的思路，不过任然有这样的问题：当一个被预测为“边缘”的像素点实际上是“非边缘”时，不管它和 GT 离得有多近，体现在损失函数上，都和一个差 GT 十万八千里的像素点没有区别。这种设计——就我个人的理解——会让损失函数的梯度出现大面积的平坦区域，梯度下降难以工作。但目前的工作似乎都是在用交叉熵作为损失函数，虽然今年也提出了 G-IoU、D-IoU 等将 IoU 调整后作为损失函数的方法，但是限于数学表达上的困难，目前只能应用于矩形边界框，而不能应用于像素集分割。

索引序列
灰度图像边缘检测技术研究论文
数字图像边缘检测技术论文
图像边缘检测论文开题报告
图像分割与边缘检测实验分析论文
图像边沿检测的论文
返回顶部

灰度图像边缘检测技术研究论文