搬运自本人 CSDN 博客: 《图像纹理特征总体简述》
纹理是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性。纹理具有三大标志:
不同于灰度、颜色等图像特征,纹理通过 像素及其周围空间邻域的灰度分布 来表现,即局部纹理信息。另外,局部纹理信息不同程度上的重复性,就是全局纹理信息。 纹理特征体现全局特征的性质的同时,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。 在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这些虚假的纹理会对检索造成“误导”。
参考地址: 《图像特征提取(纹理特征)》 《纹理特征简介》
纹理特征分类图如下所示:
纹理特征的提取,一般都是通过设定一定大小的窗口,然后从中取得纹理特征。然而窗口的选择,存在着矛盾的要求:
这种情况下,会出现困难是:窗口太小,则会在同一种纹理内部出现误分割;而分析窗太大,则会在纹理边界区域出现许多误分割。
后文介绍纹理特征描述方法时,会从下面四个角度,分别对各方法进行比较:
按照纹理特征描述方法,可以分为以下几类:
统计方法是基于像素及其邻域的灰度属性,来研究纹理区域的统计特性。统计特性包括像素及其邻域内灰度的一阶、二阶或高阶统计特性等。 统计方法的典型代表,是一种被称为 灰度共生矩阵(GLCM) 的纹理分析方法。它是建立在估计图像的二阶组合条件概率密度基础上的一种方法。这种方法通过实验,研究了共生矩阵中各种统计特性,最后得出灰度共生矩阵中的四个关键特征: 能量、惯量、熵和相关性 。 尽管GLCM提取的纹理特征具有较好的鉴别能力,但是这个方法在计算上是昂贵的,尤其是对于像素级的纹理分类更具有局限性。并且,GLCM的计算较为耗时,好在不断有研究人员对其提出改进。 其他的统计方法,还包括 图像的自相关函数 , 半方差图 等。
几何法是建立在纹理基元理论基础上的一种纹理特征分析方法,其中的纹理基元即为基本的纹理元素。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元按照一定规律的形式重复排列构成。 在几何法中,比较有影响的算法有 Voronio棋盘格特征法 。 但几何法应用和发展极其受限,且后继研究很少。
模型法中存在假设:纹理是以某种参数控制的分布模型方式为基础而形成的。 由于模型法从纹理图像的实现来估计计算模型参数,同时以参数为特征,或采用某种分类策略进行图像分割,所以 模型参数的估计 是模型法的核心问题。 模型型纹理特征提取方法以随机场模型方法和分形模型方法为主。
随机场模型法的典型方法,如马尔可夫随机场(MRF)模型法、Gibbs随机场模型法、分形模型和自回归模型。
信号处理的方法是建立在时域、频域分析,以及多尺度分析的基础上。这种方法对纹理图像某个区域内实行某种变换后,再提取出能够保持相对平稳的特征值,并以该特征值作为特征,表示区域内的一致性以及区域之间的相异性。 信号处理类的纹理特征主要是利用某种线性变换、滤波器或者滤波器组将纹理转换到变换域,然后应用某种能量准则提取纹理特征。因此,基于信号处理的方法也称之为滤波方法。大多数信号处理方法的提出,都基于这样一个假设:频域的能量分布能够鉴别纹理。 信号处理法的经典算法有: 灰度共生矩阵 、 Tamura纹理特征 、 自回归纹理模型 、 小波变换 等。
结构分析法认为,纹理是由纹理基元的类型、数目、以及基元之间的“重复性”的空间组织结构与排列规则来描述的,而且纹理基元几乎具有规范的关系。假设纹理图像的基元可以被分离出来,以基元特征和排列规则进行纹理分割,显然结构分析法要解决的问题,就是确定与抽取基本的纹理单元,以及研究存在于纹理基元之间的“重复性”结构关系。 由于结构分析法强调纹理的规律性,所以比较适用于分析人造纹理,然而真实世界大量自然纹理通常是不规则的。此外,解耦股的变化是频繁的,所以结构分析法的应用受到很大程度的限制。 结构分析法的典型算法: 句法纹理描述算法 、 数学形态学方法 。
综上所述,在提取纹理特征的有效性方面,统计方法、模型法和信号处理法相较于几何法与结构分析法,可以说相差无几,都获得了认可。
纹理特征 纹理也是描述图像内容的一个重要特征 ,特别是对灰度呈梯度变化的图像。它是一种不依赖于颜色或亮度的反应图像中同质现象的可视化特征,它能反映宏观意义上灰度变换的一些规律。从人类的感知经验出发,纹理特征主要有粗糙性、方向性和对比度这也是用于检索的主要特征。 基于纹理特征的图像检索技术与纹理分类技术密切相关。纹理分类就是通过图像处理技术提取纹理特征,研究这些纹理在图像中反复出现的局部模式和它们的排列规则,获得对纹理的定量描述,进而对图像或物体进行正确分类。讯维
企业信息系统开发战略
人眼的视觉特性 首先人眼的视觉特性,是因人而异的,我们在这里讨论的是正常人的统计平均状况。 01视觉范围 1.人眼的光谱灵敏度 (1)人眼可识别的电磁波长大约为400-800nm。波长由长至短,光色分别为红橙黄绿青蓝紫。同时含有400-800nm各色电磁波的光,称为白光。 (2)人眼对不同的颜色的可见光灵敏程度不同,对黄绿色最灵敏(在较亮环境中对黄光最灵敏,在较暗环境中对绿光最灵敏),对白光较灵敏。但无论在任何情况下,人眼对红光和蓝紫光都不灵敏,假如,将人眼对黄绿色的比视感度(灵敏度)设为100%,则蓝色光和红色光的比视感度(灵敏度)就只有10%左右了。 (3)在很暗的环境中(亮度低于10-2cd/m2时),如无灯光照射的夜间,人眼的锥状细胞失去感光作用,视觉功能由杆状细胞取代,人眼失去感觉彩色的能力,仅能辨别白色和灰色.。 2.人眼能感受的亮度范围 人眼能感受的亮度范围约为10-3—106cd/m2。当平均亮度适中时(亮度范围约为10—104cd/m2),能分辨的最大和最小亮度比为1000:1(当亮度为1000cd/m2时,识别能力最高,有资料称:最小可识别黑度差ΔDmin≈0.08);当平均亮度很低时,能分辨的最大和最小亮度比不到10:1。 3.人眼视觉的空间特性 (1)空间分辨率为≤12LP/mm; (2)灰度分辨能力为64级。 4.人眼的时间特性 (1)活动图像的帧率至少为15fps时,人眼才有图像连续的感觉; (2)活动图像的帧率在25fps时,人眼才感受不到闪烁。 注:;监控视频15fps,电视25fps,电脑屏幕60fps。 02视觉的适应性 亮度适应能力 亮度适应现象:人眼通过改变其整个灵敏度来适应非常大的光强变动范围的现象。 主观亮度:人的视觉系统感觉到的亮度,是进入人眼内的光强度的对数函数。 亮度Ba,短交叉曲线表示当眼镜适应这一强度级别时,人眼能感受的主观亮度的范围 Bb以下,眼睛响应为黑,曲线上部的虚线部分实际无限制 1.明适应 人由暗处走到亮处时的视觉适应过程,称为明适应。当人由暗处走到亮处时,人眼一时无法辨认清物体,需要大约一分钟的调整适应时间。 2.暗适应 人由亮处走到暗处时的视觉适应过程,称为暗适应。当人由亮处走到暗处时,人眼一时无法辨认物体,需要大约三十分钟的调整适应时间 3.视觉惰性(视觉暂留) 光像一旦在视网膜上形成,在它消失后,视觉系统对这个光像的感觉仍会持续一段时间,大约为(1/20--1/10)s。 4.视觉连带集中 人眼一旦发现缺陷,视觉立即集中在这片小区域,密集缺陷比较容易发现。 5.视觉的心理学特性 视觉过程,除了包括基于生理基础的一些物理过程之外,还有许多先验知识在起作用。这些先验知识被归结为视觉的心理学知识,它们往往引导出现视错觉。 空间错觉和假轮廓 6.对比灵敏度 实验表明,人眼睛刚能分布的强度差 deta I 是I的函数,而且韦伯分数deta I/I在相当宽的范围内近似为常数,约等于0.02 7.马赫带效应(Mach Band) 8.同时对比度 人眼睛无法判断出视场中目标的绝对亮度。因为人类视觉对亮度的主观响应与目标物的背景亮度有着密切的关系。 参考: 人眼的视觉特性 视觉感知特性 【1】人类视觉系统的信息处理机制的4个特性 计算机视觉中的注意力机制(Visual Attention)
工具面板技巧1. 快速打开文件双击Photoshop的背景空白处(默认为灰色显示区域)即可打开选择文件的浏览窗口。2. 随意更换画布颜色选择油漆桶工具并按住Shift点击画布边缘,即可设置画布底色为当前选择的前景色。如果要还原到默认的颜色,设置前景色为25%灰度(R192,G192,B192)再次按住Shift点击画布边缘。3. 选择工具的快捷键可以通过按快捷键来快速选择工具箱中的某一工具,各个工具的字母快捷键如下:选框-M 移动-V 套索-L 魔棒-W喷枪-J 画笔-B 铅笔-N 橡皮图章-S历史记录画笔-Y 橡皮擦-E 模糊-R 减淡-O钢笔-P 文字-T 度量-U 渐变-G油漆桶-K 吸管-I 抓手-H 缩放-Z默认前景和背景色-D 切换前景和背景色-X编辑模式切换-Q 显示模式切换-F另外,如果我们按住Alt键后再单击显示的工具图标,或者按住Shift键并重复按字母快捷键则可以循环选择隐藏的工具。4. 获得精确光标按Caps Lock键可以使画笔和磁性工具的光标显示为精确十字线,再按一次可恢复原状。5. 显示/隐藏控制板按Tab键可切换显示或隐藏所有的控制板(包括工具箱),如果按Shift+Tab则工具箱不受影响,只显示或隐藏其他的控制板。6. 快速恢复默认值有些不擅长Photoshop的朋友为了调整出满意的效果真是几经周折,结果发现还是原来的默认效果最好,这下傻了眼,后悔不该当初呀!怎么恢复到默认值呀?试着轻轻点按选项栏上的工具图标,然后从上下文菜单中选取“复位工具”或者“复位所有工具”。7. 自由控制大小缩放工具的快捷键为“Z”,此外“Ctrl+空格键”为放大工具,“Alt+空格键”为缩小工具,但是要配合鼠标点击才可以缩放;相同按Ctrl+“+”键以及“-”键分别也可为放大和缩小图像;Ctrl+Alt+“+”和Ctrl+Alt+“-” 可以自动调整窗口以满屏缩放显示,使用此工具你就可以无论图片以多少百份比来显示的情况下都能全屏浏览!如果想要在使用缩放工具时按图片的大小自动调整窗口,可以在缩放工具的属性条中点击“满画布显示”选项。8. 使用非Hand Tool(手形工具)时,按住空格键后可转换成手形工具,即可移动视窗内图像的可见范围。在手形工具上双击鼠标可以使图像以最适合的窗口大小显示,在缩放工具上双击鼠标可使图像以1:1的比例显示。9. 在使用Erase Tool(橡皮擦工具)时,按住Alt 键即可将橡皮擦功能切换成恢复到指定的步骤记录状态。10. 使用Smudge Tool(指尖工具)时,按住Alt键可由纯粹涂抹变成用前景色涂抹。11. 要移动使用Type Mask Tool(文字蒙版工具)打出的字形选取范围时,可先切换成快速蒙版模式(用快捷键Q切换),然后再进行移动,完成后只要再切换回标准模式即可。12. 按住Alt键后,使用Rubber Stamp Tool(橡皮图章工具)在任意打开的图像视窗内单击鼠标,即可在该视窗内设定取样位置,但不会改变作用视窗。13. 在使用Move Tool(移动工具)时,可按键盘上的方向键直接以1 pixel的距离移动图层上的图像,如果先按住Shift键后再按方向键则以每次10 pixel的距离移动图像。 而按Alt键拖动选区将会移动选区的拷贝。14. 使用磁性套索工具或磁性钢笔工具时,按“[”或“]”键可以实时增加或减少采样宽度(选项调板中)。15. 度量工具在测量距离上十分便利(特别是在斜线上),你同样可以用它来量角度(就像一只量角器)。在信息面板可视的前提下,选择度量工具点击并拖出一条直线,按住Alt键从第一条线的节点上再拖出第二条直线,这样两条线间的夹角和线的长度都显示在信息面板上。用测量工具拖动可以移动测量线(也可以只单独移动测量线的一个节点),把测量线拖到画布以外就可以把它删除。16. 使用绘画工具如(如画笔,向笔等),按住Shift键单击鼠标,可将两次单击点以直线连接。17. 按住Alt键用吸管工具选取颜色即可定义当前背景色。通过结合颜色取样器工具(Shift+I)和信息面板监视当前图片的颜色变化。变化前后的颜色值显示在信息面板上其取样点编号的旁边。通过信息面板上的弹出菜单可以定义取样点的色彩模式。要增加新取样点只需在画布上用颜色取样器工具随便什么地方再点一下,按住Alt键点击可以除去取样点。但一张图上最多只能放置四个颜色取样点。当Photoshop中有对话框(例如:色阶命令、曲线命令等等)弹出时,要增加新的取样点必须按住Shift键再点击,按住Alt+Shift点击可以减去一个取样点。18. 裁切工具大家都一定用过,这种情况你也一定遇到过;在你调整裁切握、而裁切框又比较接近图像边界的时候,裁减框会自动地贴到图像的边上,令你无法精确的裁切图像。不过只要在调整裁切边框的时候接下“Ctrl”键,那么裁切框就会服服帖帖,让你精确裁切。复制技巧19. 按住Ctrl+Alt键拖动鼠标可以复制当前层或选区内容。20. 如果你最近拷贝了一张图片存在剪贴板里,Photoshop在新建文件(Ctrl+N)的时候会以剪贴板中图片的尺寸作为新建图的默认大小。要略过这个特性而使用上一次的设置,在打开的时候按住Alt键(Ctrl+Alt+N)。21. 如果创作一幅新作品,需要与一幅已打开的图片有一样的尺寸、解析度、格式的文件。选取“文件”→“New”,点Photoshop菜单栏的Windows选项,在弹出菜单的最下面一栏点击已开启的图片名称,是的,就是这么简单!22. 在使用自由变换工具(Ctrl+T)时按住Alt键(Ctrl+Alt+T)即可先复制原图层(在当前的选区)后在复制层上进行变换;Ctrl+Shift+T为再次执行上次的变换,Ctrl+Alt+Shift+T为复制原图后再执行变换。23. 使用“通过复制新建层(Ctrl+J)”或“通过剪切新建层(Ctrl+J)”命令可以在一步之间完成拷贝到粘贴和剪切到粘贴的工作;通过复制(剪切)新建层命令粘贴时仍会放在它们原来的地方,然而通过拷贝(剪切)再粘贴,就会贴到图片(或选区)的中心。24. 若要直接复制图像而不希望出现命名对话框,可先按住Alt键,再执行“图像”→“副本”命令。25. Photoshop的剪贴板很好用,但你更希望直接使用Windows系统剪贴板,直接处理从屏幕上截取的图像。好的,按下Ctrl+K,在弹出的面板上将“输出到剪贴板”点中吧!26. 在Photoshop内实现有规律复制在做版面设计的时候我们会经常把某些元素有规律地摆放以寻求一种形式的美感,在Photoshop内通过四个快捷键的组合就可以轻易得出。(1)圈选出你要复制的物体;(2)按Ctrl+J产生一个浮动 Layer;(3)按旋转并移动到适当位置后确认;(4)现在可以按住Ctrl+Alt+Shift 后连续按“T”就可以有规律地复制出连续的物体。(只按住Ctrl+Shift则只是有规律移动)27. 当我们要复制文件中的选择对象时,要使用编辑菜单中的复制命令。复制一次你也许觉不出麻烦,但要多次复制,一次一次的点击就相当不便了。这时你可以先用选择工具选定对象,而后点击移动工具,再按住“Alt”键不放。当光标变成一黑一白重叠在一起的两个箭头时,拖动鼠标到所需位置即可。若要多次复制,只要重复的放松鼠标就行了。28. 可以用选框工具或套索工具,把选区从一个文档拖到另一个上。29. 要为当前历史状态或快照建立一个复制文档可以:(1)点击“从当前状态创建新文档”按钮;(2)从历史面板菜单中选择新文档;(3)拖动当前状态(或快照)到“从当前状态创建新文档”按钮上;(4)右键点击所要的状态(或快照)从弹出菜单中选择新文档把历史状态中当前图片的某一历史状态拖到另一个图片的窗口可改变目的图片的内容。按住Alt键点击任一历史状态(除了当前的、最近的状态)可以复制它。而后被复制的状态就变为当前(最近的)状态。按住Alt拖动动作中的步骤可以把它复制到另一个动作中。选择技巧30. 把选择区域或层从一个文档拖向另一个时,按住Shift键可以使其在目的文档上居中。如果源文档和目的文档的大小(尺寸)相同,被拖动的元素会被放置在与源文档位置相同的地方(而不是放在画布的中心)。如果目的文档包含选区,所拖动的元素会被放置在选区的中心。31. 在动作调板中单击右上角的三角形按钮,从弹出的菜单中选择载入动作,进入PhotoshopGoodiesActions目录下,其下有按钮、规格、命令、图像效果,文字效果、纹理、帧六个动作集,包含了很多实用的东西哟!另外,在该目录下还有一个ACTIONS.PDF文件,可用Adobe Acrobat软件打开,里面详细介绍了这些动作的使用方法和产生的效果。32. 单击工具条中的画笔类工具,在随后显示的属性条中单击画笔标签右边的小三角,在弹出的菜单中再点击小箭头选择“载入画笔…”。到Photoshop目录的Brushes文件夹中选择*.abr。原来这里还有这么多可爱的东西。33. 画出一个漂亮的标记,想在作品中重复使用?好办,用套索工具选好它,在Brushes的弹出菜单中选“储存画笔…”,然后用画笔工具选中这个新笔头……朋友,想做居室喷涂吗?34. 如果想选择两个选择区域之间的部分,在已有的任意一个选择区域的旁边同时按住Shift和Alt键进行拖动,画第二个选择区域(鼠标十字形旁出现一个乘号,表示重合的该区域将被保留)。35. 在选择区域中删除正方形或圆形,首先增加任意一个选择区域,然后在该选择区域内,按Alt键拖动矩形或椭圆的面罩工具。然后松开Alt键,按住Shift键,拖动到你满意为止。然后先松开鼠标按钮再松开Shift键。36. 从中心向外删除一个选择区域,在任意一个选择区域内,先按Alt键拖动矩形或椭圆的面罩工具,然后松开Alt键后再一次按住Alt键,最后松开鼠标按钮再松开Alt键。37. 在快速蒙版模式下要迅速切换蒙版区域或选取区域选项时,先按住Alt键后将光标移到快速遮色片模式图标上单击鼠标就可以了。38. 使用选框工具的时候,按住Shift键可以划出正方形和正圆的选区;按住Alt键将从起始点为中心勾划选区。39. 使用“重新选择”命令(Ctrl+Shift+D)来载入/恢复之前的选区。40. 在使用套索工具勾画选区的时候按Alt键可以在套索工具和多边形套索工具间切换。勾画选区的时候按住空格键可以移动正在勾画的选区。41. 按住Ctrl键点击层的图标(在层面板上)可载入它的透明通道,再按住Ctrl+Alt+Shift键点击另一层为选取两个层的透明通道相交的区域。42. 在缩放或复制图片之间先切换到快速蒙板模式[Q]可保留原来的选区。43. “选择框”工具中Shift和Alt键的使用方法:当用“选择框”选取图片时,想扩大选择区,这时按住Shift键,光标“+”会变成“十+”,拖动光标,这样就可以再原来选取的基础上扩大你所需的选择区域。或是在同一副图片中同时选取两个或两个 以上的选取框。当用“选择框”选取图片时,想在“选择框”中减去多余的图片,这时按住“Alt”键,光标“+”会变成“十-”,拖动光标,这样就可以留下你所需要的图片。当用“选择框”选取图片时,想得到两个选取框叠加的部分,这时按住“Shift+Alt”键,光标“+”会变成“十í”,拖动光标,这样就你想要的部分。想得到“选取框”中的正圆或正方形时,按住“Shift”键,就可以。44. “套索”工具中Shift和Alt键的使用方法:增加选取范围按“Shift”键。(方法和“选择框”中的1相同)减少选取范围按“Alt”键。(方法和“选择框”中的2相同)两个选取框叠加的区域按“Shift+Alt”键。(方法和“选择框”中的3相同)45. “魔杖”工具中Shift和Alt键的使用方法:增加选取范围按“Shift”键。(方法和“选择框”中的1相同)减少选取范围按“Alt”键。(方法和“选择框”中的2相同)两个选取框叠加的区域按“Shift+Alt”键。(方法和“选择框”中的3相同)快捷键技巧46. 你可以用以下的快捷键来快速浏览你的图像:Home卷动至图像的左上角;End卷动至图像的右下角;Page UP卷动至图像的上方;Page Down卷动至图像的下方;Ctrl+Page Up卷动至图像的左方;Ctrl+Page Down卷动至图像的右方。
数字图像处理方面了解的了。
目录 一.引言……………………………………………………………………2 二.设计方法和创意 ………………………………………………………2 三.实例制作 …………………………………………………………………3 小结 …………………………………………………………………………8 参考文献 ………………………………………………8 一.引言 近年来,计算机图像技术的飞速发展和应用使个人电脑上的美术创作进入一个新的阶段,各种图像处理软件也越来越完善,普及程度不断的提高。其中的图像软件处理工具Photoshop是目前公认的、较好的通用平面美术设计软件,它功能完善,性能稳定,使用方便。Photoshop所具有的功能包括:可以对图像进行修饰、对图形进行编辑、对图像的色彩进行处理等,此外,还有绘图和输出功能。在实际生活和工作中,人们可以将数码照相机拍摄下来的照片利用Photoshop进行编辑和修饰,还可以利用PhotoShop为图像制作特效效果,如果和其它工具软件配合使用,则可以进行高质量的广告设计、美术创意和三维动画制作。由于PhotoShop功能强大,目前,正在被越来越多的图像编排、广告和形象设计以及婚纱影楼等领域广泛使用,是一个非常受欢迎的应用软件。本毕业论文中的设计实例就采用了Photoshop这一图像处理软件。 二.设计方法和创意 利用图像处理软件制作图形,要产生一个好的作品包括三个方面的内容:创意、构图能力、计算机表达。即首先要有好的创意,然后对其进行粗略构图,最后借助计算机手段,制作出所构想的最终效果图。当然,也有一些经典的创意,只用寥寥数笔即可表现,但这种情况非常少。上述所说的三个方面的内容,其中的创意需要具备跳跃思维,灵活善变,也与创作者的美术素养相关;而构图则主要指平面构成,色彩构成和立体构成。对于平面设计来说,平面构成和色彩构成尤为重要,它需要通过合理组织各种元素,确定视觉中心,使画面美观并能引导读者的目光和兴趣;计算机表达则是利用有关的图像处理软件工具,将构思的图像效果制作出来。本毕业论文的实例制作,就是利用Photoshop来制作水滴的效果图,设计思想是利用已有的素材,制作出将一个杯子的水倒入另一个杯子后产生水滴的效果。 三.实例制作 本实例制作通过制作相关素材,并运用了Photoshop中的笔刷、扭曲/波浪滤镜、自由变形等工具,最终合成所制作的素材以得到所构思的效果图。具体制作步骤如下: 1.新建一个100x100像素图像文件,背景为蓝色; 2.新建透明图层2,建立该图层的目的是因为本设计的主要操作是在图层2中进行的; 3.利用工具面板中的椭圆选框工具在图层2中选出一个圆形区域。 4.选取工具面板画笔工具(画笔颜色选白色,画笔大小13,不透明度100%)在选区的四周绘制线条。 5.再将画笔的不透明度调节为50%,绘制如下的线条;此时可以看到,所绘制的效果已经很像一颗水珠了。 6.选中图层2,可按Ctrl+A全选,拷贝图层2;然后新建一新的图像文件,大小为200x200,背景设为蓝色;把前一图像文件中的图层2中所制作好的水珠粘贴到该新建图像文件中,多粘贴几个,并调节好大小,然后合并为图层7。 7.选中当前图层(图层7),利用菜单命令:滤镜→扭曲→波浪,调节好参数值。即可得到 8.对图层7再进行波浪变形,参数要有所不同,以产生随机效果。 9.复制粘贴图层7以得到图层8,在图层8中利用自 由变换工具调节大小和角度。 10.再粘贴一次,完成后的效果。 11.对图层8、图层9分别再使用一次波浪变形滤镜; 12.将图层7、8、9合并,并作拷贝,导入一幅图片。 13.粘贴图层,用自由变换工具调整到合适位置,到此为止,整个效果图即制作完毕。 小结 平面设计是一项相当复杂的工作,要设计一件比较理想的平面作品,设计者需要具有一定的美术知识和素养。并且需要知道色彩的构成、分类与感情的关系,以及调和与配色等一系列美术知识,需要具备一定的设计经验。还要懂得如何使用相关平面设计软件,通过这次的毕业设计通过本次毕业设计,使我对Photoshop有了很深的认识,对平面设计的布局、创意都有了一定的提高。
我有B/S架构的人事管理系统 毕业论文
,我当时做的是一个网站,弄个主页再弄几个副页,主要是弄的漂亮一点,在找个懂asp的同学给弄个留言板。网站上的内容丰富点,素材漂亮点就差不多。当时我们辅导员给我们要求的不是很高,很容易就过去了。不知道你们的怎么样,当时我好多同学也是很多做 图书馆管理系统,学籍管理系统,餐饮管理系统 ,他们的辅导员要求他们的管理系统能做到 添加--删除--查找--提示 就差不多了。也是把布局弄的合理,漂亮(找会插图或能把界面用图片代替的朋友帮忙弄一下,请人家吃顿饭!)祝你毕业论文顺利完成!你们计科系网站上应该有题目找个自己拿手的做,下面是我们当时的题目:1--住宅小区智能化物业管理系统总体设计-2--网上测评系统的设计-3--基于web网站的综合考评系统的设计-4--基于web网站的考试系统设计-5--网上教育资源库系统的设计-6--浅谈网络协议的选用对网络性能的影响-7--高校校园网信息管理平台研制-8--实验室管理信息系统设计与实现-9--基于互联网的学习课件的研制-10--基于环联网的辅导答疑系统研制-11--智能网络入侵检测技术初步研究-12--电子政府信息处理总体实现架构研究-13--企业管理信息系统设计与实现-14--人事管理信息系统设计与实现-15--学生信息管理系统设计与实现-16--职工信息系统设计与实现-17--职工工资管理系统设计与实现-18--客房管理系统设计与实现-19--中学考试管理信息系统设计与实现-20--自学考试管理系统设计与实现-21--超市管理系统设计与实现-22--考试管理系统-23--考务管理信息系统-24--高校数学试题库-25--拓扑排序算法的改进(给出AOV网的所有拓扑有序序列)-26--哈希函数构造方法研究-27--试卷自动生成系统设计-28--自动检测系统设计-29--教学中常见表现手法在AW平台上的实现-30--教学中常见表现手法在PPT平台上的实现-31--多媒体课件制作中的跨平台操作-32--个人网络设计-33--单片机时间控制器开发-34--单片机通用数据采集和处理系统-35--数据库系统开发-36--网页制作-37--网络数据库开发-38--试题库软件设计-39--图书馆管理系统-40--学籍管理系统--41--基于教学型软件的设计与实现- 42--基于练习型交互软件的设计与实现-43--基于游戏型学习软件的设计与实 44--VC实现windows文件管理-45--单片机与微机通信-46--单片机与红外技术-47--电子阅览室收费系统-48--用户登陆与权限管理子系统-49--网络环境中的数据共享问题的分析与对策-50--Unix与Windows NT网络互联技术-51--单片机控制的CO2焊机的设计(mcs-51系列)-52--单片机控制的点焊控制器设计(mcs-51系列)-53--利用网络实现互动功能54--利用网络实现管理功能56--如何防止IP地址盗用-57--局域网主干网络的选型-58--动态网站设计-59--企业物流管理-60--药品管理-61--单片机遥控技术-62--单片机与通讯-63--家用电器与单片控制-64--计算机教育教学探讨-65--计算机硬件技术理解与应用-66--计算机辅助教学理论与实践- 1 SMART芯片仿真器系统设计2 程序执行结果模拟器3 计算机硬件检测系统4 图象处理软件5 ITS信息平台的设计与分析6 基于B/S的职工信息管理系统7 iButton及其应用8 工作备忘录的设计与实现9 基于MATLAB数据仿真10 基于Delphi的数据通信系统11 **中学籍管理软件12 动态网站制作13 数据库信息管理系统14 网站视频点播15 24点游戏16 趣味绘图17 聊天程序18 小学算术加减法教学软件设计19 个人网页设计与友情连接 20 图像处理软件包21 学生英语试题题库及判分系统软件设计 22 家庭理财管理信息系统设计 23 人事信息管理系统设计 24 计量管理信息系统 25 字符智能识别方法研究 25 基于图像分析的公路路面破损统计系统企业信息管理系统27 VB数据采集系统设计28 VC数据采集系统设计29 虚拟仪器数据采集系统设计30 光栅位移传感器原理图制作及仿真31 网络搜索引擎性能分析系统模型及设计32 基于短信的智能导行系统模型及设计34 远程异步视频授课系统研究35 规划设计中图形处理技术36 计算机图形学在装饰设计中的应用37 公路工程试验数据处理与分析(VB与Matlab)38 城市信号交叉口禁左仿真39 随机仿真模型40 高等级公路新线中线坐标放样CAE41 **大学上下水地下管网地理信息系统设计42 油田测井数据绘图软件开发42 企业管理系统43 "**"课程的网络教学系统设计与开发44 "**"课程试题库的设计45 地球物理数据反演系统中的图形处理46 电子教案中电路图的绘制方法研究47 .NET实现Internet消息平台48 远程打印及计费管理系统49 机房无人值守系统50 高速公路路网描述仿真模型构建51 基于XML的数据交换在分布式WEB系统中的应用52 基于关系数据库的OLAP研究53 等值线自动生成方法及程序实现54 基于LDAP的语音服务(IP电话)中心研究55 人工智能多媒体教学软件56 BUG系统的设计57 教学管理系统58 虚拟现实技术应用研究60 客户管理系统61 基于Web的教学系统设计与实现62 信息工程学院资料室信息管理系统63 基于网络的教材管理系统64 石油工业仪器仪表质量监督检验中心网站设计 65 非线性流水线调度算法动态演示程序设计66 存储体系地址映象及替换算法动态演示程序设计67 医院药房管理系统68 门诊划价收费系统69 公交公司人事管理系统70 固定资产管理系统71 网上图书馆(在线浏览及在线查询)72 工资计算系统73 网上超市(电子商务网站的建设)74 客户关系管理系统75 旅游资源研发网的开发与设计76 《****》试题库的设计77 餐饮娱乐管理系统的开发与设计78 文语转换系统79 远程数据服务平台(网站设计,数据管理系统)80 室外环境检测模拟平台(下分:控制台软件设计,网络传输程序,监测软件设计,硬件电路设计4个子题目)81 图像识别技术(计算特定物体的个数,图像检索技术)82 图像检索系统设计与开发83 视频会议系统设计与开发84 多媒体毕业纪念册及播放系统设计开发85 网络媒体播放器设计与实现86 《数据结沟》算法的动态演示87 基于B/S结构的毕业设计题目管理系统88 **大学计算机应用研究所网站89 客户管理系统90 设备管理系统91 实验室管理系统92 《多媒体软件设计技术》课程CAI的开发93 新闻网页自动生成系统的开发94 网站开发95 电子白板的设计与实现96 蚁群算法在动态TSP问题种的应用研究97 基于Web的异步按需点播学习系统98 多媒体同步实时授课系统中应用程序共享研究99 协作编辑系统100 基于web的远程测控制系统研究101 基于B/S模式文献检索系统的设计与开发102 在线课题项目选题系统的设计及实现103 学生档案信息管理系统的开发104 在线图书馆信息管理系统的设计及实现105 浏览器过滤软件实现106 基于局域网的IP数据包监控软件实现107 WDM设备驱动程序开发-键盘过滤器108 WDM设备驱动程序开发-鼠标过滤器109 基于OpengGL的虚拟场景漫游软件设计 110 城市公交查询系统111 J2EE框架的构建(Weblogic+JBuilder)112 BrokerTool Project (C/S 结构)113 多媒体开发与应用(Java2D,Java3D,JMF,Java图形制作与动画设计)114 计算机辅修远程教学系统设计与实现115 《操作系统》典型算法实现116 "***"网站设计与实现117 门禁管理系统实现118 计算机系网站设计及建设119 基于Internet的网络教学系统120 视频点播系统121 基于Internet的车辆管理、调度系统122 武装工作管理系统123 门禁式网络机房计费系统124 成人教育学生档案及成绩管理系统125 汽车综合性能工位测控系统设计与软件实现126 汽车制动性能虚拟检测仪器设计与软件实现127 基于LAN的汽车性能微机检测系统128 汽车制动信号数字滤波及曲线拟合优化方法研究129 动态存储器的刷新130 电磁机构的计算机设计131 服务器端安全监控软件的设计132 校园网络地址管理模型的设计与实现
医学影像毕业论文题目很多的,原创的最好。我写的《基于PACS的网络教学在医学影像学实习中的应用》,当时也是雅文网的专家帮忙弄的,一周就过了CT/MRI医学影像分割算法研究基于IHE的医学影像协作网的构建研究基于DICOM标准的医学影像数据库的建立多模态医学影像鲁棒配准方法研究医学影像学课程网络CAI教学系统的分析与设计医学影像数据库的图像检索技术应用研究基于PACS的医学影像学网络教学软件的开发研究基于Retinex理论的X射线医学图像算法的改进与应用医学影像图像分割与存储若干问题的研究医学影像三维可视化系统设计及关键技术研究OCT医学影像血管分割与三维重建关键技术研究PACS医学影像文件存储方法的研究医学影像二维处理及三维重建系统的研究与实践医学影像设备维护与管理技术的研究医学影像三维重建的算法研究及应用DICOM医学影像自适应显示技术的研究与实现医学影像后处理技术的研究及其在X线影像优化中的应用基于LBM的三维医学影像非刚体配准算法研究嵌入式医学影像平台设计研究医学影像按需打印系统关键技术研究多模态医学影像融合方法研究DICOM标准下医学影像数据库的建立与研究基于语义的图像检索技术在医学影像系统中的研究与应用基于核匹配追踪的医学影像辅助诊断基于几何代数理论的医学图像配准研究医学影像的数字化采集与存储基于Level Set的医学影像分割面向医学影像处理领域的软件框架研究与应用随机森林在医学影像数据分析中的应用医学影像处理及三维重建技术在医学TPS中的应用
又到了写毕业论文的时候了,小编为大家送上毕业论文经典选题,希望可以帮助大家写出好的论文!1. 高等教育成本分担机制研究2. 基于提高大学生素质的审美教育研究3. “非正式组织”及其对大学生管理教育影响研究4. 广西高等教育国际化及对策研究5. 英国高等教育改革中的管理主义6. 中国石油管道局职业教育培训发展规划研究7. 论学习策略教育对于提高非英语专业大学生英语口语能力的作用8. 国际教育与国际人才培养路径研究9. 二战后德国政治教育在政治文化变迁中的作用研究10. 内蒙古地区体育教育专业课程设置的系统研究11. 弗洛姆爱的哲学思想及其教育启示12. 深入发展时期教育技术理论演变的研究13. 大学生绿色教育若干问题研究14. 法制教育的功能探究15. 高校网络思想政治教育环境研究16. 以构建和谐校园为基点加强贫困大学生的思想政治教育17. 中小学校教育服务研究18. 深圳中小学教育财政支出研究19. 运用教育技术实现有效教学20. 高职会计教育模式改革的研究21. 义务教育阶段办学模式选择与财政政策22. 中小学心理健康教育评估的探索23. 高校马克思主义理论教育实效性研究24. 当代大学生价值观教育探析25. 试论魏书生的家庭教育思想26. 我国北方农村家庭教育社会支持体系的研究27. 初中学生环境教育的实践与思考28. 基于情报检索语言互操作技术的集成词库构建研究29. 《爱的教育》在中国百年的译文与接受30. 基于ASP开发的在线教育系统的分析与设计31. 我国教育中介组织失灵与治理之研究32. 涂尔干的道德教育理论及其当代价值33. 天津市基础教育管理信息系统建设的研究34. 思想政治教育的理论探源及其相应意义35. 普及农村义务教育对城乡收入差距的影响研究36. 新世纪我国会计人员后续教育问题研究37. 我国教育不平等与经济增长关系的实证研究38. 活动理论在信息技术教育中的应用39. 梁启超的教育现代化思想研究40. 从近代化的角度看严复的教育思想与实践41. 远程教育中情感信息的建模与处理方法研究42. 基于情感计算的图像检索系统在现代远程教育中的应用研究43. GDP危险期美国思想政治教育的状况及其对我国的启示44. 构建和谐社会背景下的教育公平研究45. 基于现代教育技术的教育改革问题研究46. 论当前美国高等教育改革47. 生活与教育的涵义及其辩证关系48. 教师教育智慧的涵义、基本要素及生成49. 当代知识观的新发展及其对我国基础教育课程改革的影响50. 内蒙古地区民族基础教育面临的挑战及应对措施51. 普通高等学校国防教育应有的哲学理念52. 西方近现代思想道德教育方法的探究及其启示53. 唐代岭南谪宦及其对该地区教育的贡献54. 人文精神视角下的中学数学教育55. 重庆电力公司教育培训中心发展战略及实施方案研究56. “知识经济与高等教育”思想与理论述评57. 高校体育教育专业教育实习质量管理评价研究58. 现代远程开放教育运营模式探究59. 我国职业教育发展中的政府行为研究60. 学生的教育消费需求与高校面临的挑战61. 中韩民办(私立)高等教育比较研究62. 高等教育功能的实现与和谐社会的构建63. 高等教育自学考试课程体系研究64. 高等职业院校教育质量的理论研究与实证分析65. 多元文化音乐教育观与高师视唱练耳课程发展研究
论文原文:
YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:
如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:
每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:
其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。
每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)
举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:
在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:
等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。
得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。
1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。
2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。
3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。
4、损失函数公式见下图:
在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:
解决方法:
只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。
作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为0.88(ImageNet2012 validation set),与GoogleNet模型准确率相当。
然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。
作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}=0.5 。
作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为0.9,学习速率延迟为0.0005。Learning schedule为:第一轮,学习速率从0.001缓慢增加到0.01(因为如果初始为高学习速率,会导致模型发散);保持0.01速率到75轮;然后在后30轮中,下降到0.001;最后30轮,学习速率为0.0001。
作者还采用了dropout和 data augmentation来预防过拟合。dropout值为0.5;data augmentation包括:random scaling,translation,adjust exposure和saturation。
YOLO模型相对于之前的物体检测方法有多个优点:
1、 YOLO检测物体非常快
因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。
2、 YOLO可以很好的避免背景错误,产生false positives
不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。
3、 YOLO可以学到物体的泛化特征
当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。
尽管YOLO有这些优点,它也有一些缺点:
1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。
2、YOLO容易产生物体的定位错误。
3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。
目标检测(object detection)是计算机视觉中非常重要的一个领域。在卷积神经网络出现之前,都利用一些传统方法手动提取图像特征进行目标检测及定位,这些方法不仅耗时而且性能较低。而在卷积神经网络出现之后,目标检测领域发生了翻天覆地的变化。最著名的目标检测系统有RCNN系列、YOLO和SSD,本文将介绍RCNN系列的开篇作RCNN。 RCNN系列的技术演进过程可参见 基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN 。 目标检测分为两步:第一步是对图像进行分类,即图像中的内容是什么;第二步则是对图像进行定位,找出图像中物体的具体位置。简单来说就是图像里面有什么,位置在哪。 然而,由于不同图片中物体出现的大小可能不同(多尺度),位置也可能不同,而且摆放角度,姿态等都可以不同,同时一张图片中还可以出现多个类别。这使得目标检测任务异常艰难。上面任务用专业的说法就是:图像识别+定位两个不同的分支分别完成不同的功能,分类和定位。回归(regression)分支与分类分支(classification)共享网络卷积部分的参数值。 还是刚才的分类识别+回归定位思路。只是现在我们提前先取好不同位置的框,然后将这个框输入到网络中而不是像思路一将原始图像直接输入到网络中。然后计算出这个框的得分,取得分最高的框。 如上,对于同一个图像中猫的识别定位。分别取了四个角四个框进行分类和回归。其得分分别为0.5,0.75,0.6,0.8,因此右下角得分最高,选择右下角的黑框作为目标位置的预测(这里即完成了定位任务)。 这里还有一个问题——检测位置时的框要怎么取,取多大?在上面我们是在257x257的图像中取了221x221的4个角。以不同大小的窗口从左上角到右下角依次扫描的话,数据量会非常大。而且,如果考虑多尺度问题的话,还需要在将图像放缩到不同水平的大小来进行计算,这样又大大增加了计算量。如何取框这个问题可以说是目标检测的核心问题之一了,RCNN,fast RCNN以及faster RCNN对于这个问题的解决办法不断地进行优化,这个到了后面再讲。 总结一下思路: 对于一张图片,用各种大小的框将图片截取出来,输入到CNN,然后CNN会输出这个框的类别以及其位置得分。 对于检测框的选取,一般是采用某种方法先找出可能含有物体的框(也就是候选框,比如1000个候选框),这些框是可以互相重叠互相包含的,这样我们就可以避免暴力枚举所有框了。讲完了思路,我们下面具体仔细来看看RCNN系列的实现,本篇先介绍RCNN的方法。 R-CNN相比于之前的各种目标检测算法,不仅在准确率上有了很大的提升,在运行效率上同样提升很大。R-CNN的过程分为4个阶段: 在前面我们已经简单介绍了selective search方法,通过这个方法我们筛选出了2k左右的候选框。然而搜索出的矩形框大小是不同的。而在AlexNet中由于最后全连接层的存在,对于图像尺寸有固定的要求,因此在将候选框输入之前,作者对这些候选框的大小进行了统一处理——放缩到了统一大小。文章中作者使用的处理方法有两种: (1)各向异性缩放因为图片扭曲可能会对后续CNN模型训练产生影响,于是作者也测试了各向同性缩放的方法。有两种方法: 此外,作者对于bounding box还尝试了padding处理,上面的示意图中第1、3行就是结合了padding=0,第2、4行结果采用padding=16的结果。经过最后的试验,作者发现采用各向异性缩放、padding=16的精度最高。 卷积神经网络训练分为两步:(1)预训练;(2)fine-tune。 先在一个大的数据集上面训练模型(R-CNN中的卷机模型使用的是AlexNet),然后利用这个训练好的模型进行fine-tune(或称为迁移学习),即使用这个预训练好的模型参数初始化模型参数,然后在目标数据集上面进行训练。 此外,在训练时,作者还尝试采用不同层数的全连接层,发现一个全连接层比两个全连接层效果要好,这可能是因为使用两个全连接层后过拟合导致的。 另一个比较有意思的地方是:对于CNN模型,卷积层学到的特征其实就是基础的共享特征提取层,类似于传统的图像特征提取算法。而最后的全连接层学到的则是针对特定任务的特征。譬如对于人脸性别识别来说,一个CNN模型前面的卷积层所学习到的特征就类似于学习人脸共性特征,然后全连接层所学习的特征就是针对性别分类的特征了。 最后,利用训练好的模型对候选框提取特征。 关于正负样本的问题:由于选取的bounding box不可能与人工label的完全相同,因此在CNN训练阶段需要设置IOU阈值来为bounding box打标签。在文章中作者将阈值设置为0.5,即如果候选框bounding box与人工label的区域重叠面积大于0.5,则将其标注为物体类别(正样本),否则我们就把他当做背景类别(负样本)。 作者针对每一个类别都训练了一个二分类的SVM。这里定义正负样本的方法与上面卷积网络训练的定义方法又不相同。作者在文章中尝试了多种IoU阈值(0.1~0.5)。最后通过训练发现,IoU阈值为0.3的时候效果最好(选择为0精度下降了4个百分点,选择0.5精度下降了5个百分点)。即当IoU小于0.3的时候我们将其视为负样本,否则为正样本。 目标检测问题的衡量标准是重叠面积:许多看似准确的检测结果,往往因为候选框不够准确,重叠面积很小。故需要一个位置精修步骤。在实现边界回归的过程中发现了两个微妙的问题。第一是正则化是重要的:我们基于验证集,设置λ=1000。第二个问题是,选择使用哪些训练对(P,G)时必须小心。直观地说,如果P远离所有的检测框真值,那么将P转换为检测框真值G的任务就没有意义。使用像P这样的例子会导致一个无望的学习问题。因此,只有当提案P至少在一个检测框真值附近时,我们才执行学习任务。“附近”即,将P分配给具有最大IoU的检测框真值G(在重叠多于一个的情况下),并且仅当重叠大于阈值(基于验证集,我们使用的阈值为0.6)。所有未分配的提案都被丢弃。我们为每个目标类别执行一次,以便学习一组特定于类别的检测框回归器。 在测试时,我们对每个提案进行评分,并预测其新的检测框一次。原则上,我们可以迭代这个过程(即重新评估新预测的检测框,然后从它预测一个新的检测框,等等)。但是,我们发现迭代不会改进结果。 使用selective search的方法在测试图片上提取2000个region propasals ,将每个region proposals归一化到227x227,然后再CNN中正向传播,将最后一层得到的特征提取出来。然后对于每一个类别,使用为这一类训练的SVM分类器对提取的特征向量进行打分,得到测试图片中对于所有region proposals的对于这一类的分数,再使用贪心的非极大值抑制(NMS)去除相交的多余的框。再对这些框进行canny边缘检测,就可以得到bounding-box(then B-BoxRegression)。 参考: Rich feature hierarchies for accurate object detection and semantic segmentation. RCNN-将CNN引入目标检测的开山之作-晓雷的文章 基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN R-CNN 论文翻译