运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 1.1 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 0.1%以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 0.1%以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 1.2 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min:2.8% Avg:37.5% Max:23 Min:1.14 Avg:15 运动区域占 1/3 左右时 Max:45% Min:2.8% Avg:20% Max:18 Min:1.14 Avg:8 1.3 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 1.4 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 2.1 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。
一种用于三维空间杂波环境机动目标跟踪的数据互联方法,《电子与信息学报》2009年 第4期被动传感器阵列中基于粒子滤波的目标跟踪,《电子与信息学报》2009年 第4期一种新的嵌入式Linux高性能定时器实现方法,《信号处理》2009年 第3期一种新的红外弱小目标检测与跟踪算法,《信号处理》2008年 第6期被动传感器网基于修正Riccati方程的系统优化设计,《信号处理》2008年 第5期基于SIS框架和蚁群算法的非线性多目标跟踪,《电子与信息学报》2008年 第9期基于人类视觉系统的自适应数字水印算法,《上海交通大学学报》2008年 第7期一种基于电子签章的二值图像数字水印算法,《信号处理》2008年 第3期基于身份的网络化制造安全协同商务平台,《计算机工程》2008年 第13期基于Clifford代数传感器网络覆盖理论的路径分析,《电子学报》2007年 第B12期传感器网络高阶模糊覆盖分析,《电子学报》2007年 第B12期传感器网络最佳情况模糊覆盖问题研究,《电子学报》2007年 第B12期一种基于蚁群算法的多目标跟踪数据关联方法,《电子学报》2008年 第3期基于数据仓库的投资决策支持系统设计研究,《微电子学与计算机》2008年 第2期量子球壳聚类,《西安电子科技大学学报》2008年 第1期基于身份的安全邮件认证体系设计与分析,《计算机科学》2008年 第2期异类传感器系统目标快速定位方法,《系统工程与电子技术》2007年 第12期一种基于并行计算熵迁移策略的多分辨DOM数据生成算法,《中国科学技术大学学报》2007年 第12期基于模糊Hough变换的被动传感器系统航迹起始方法,《系统工程与电子技术》2007年 第11期THz信号处理与分析的研究现状和发展展望,《电子学报》2007年 第10期模糊数据互联滤波器及其在机动目标跟踪中的应用,《系统仿真学报》2007年 第20期分布式异类传感器网异步采样下的航迹起始算法,《系统工程与电子技术》2007年 第9期机动目标跟踪中数据互联新方法,《电子与信息学报》2007年 第10期一种新的视界覆盖遗传算法,《西安电子科技大学学报》2007年 第5期基于运动特征的远距离红外目标检测方法,《电子与信息学报》2007年 第8期被动传感器网基于模糊综合贴近度的航迹起始,《电子学报》2007年 第8期基于IBE的跨网络电子公文安全交换平台,《微计算机信息》2007年 第18期一种基于身份的无可信第三方签名方案,《深圳大学学报:理工版》2007年 第3期基于图像梯度场序列的双向GDIM光流计算方法,《电子学报》2007年 第7期一种基于身份的短数字签名方案,《微计算机信息》2007年 第21期分布式异类传感器网Hough变换航迹起始算法,《深圳大学学报:理工版》2007年 第2期基于DWT和DCT域的二值图像数字水印算法,《计算机与数字工程》2007年 第3期基于并行计算熵的同构集群负载均衡算法,《深圳大学学报:理工版》2007年 第1期基于unscented粒子滤波的红外弱小目标跟踪,《系统工程与电子技术》2007年 第1期一种空域DCT与时域DWT相结合的鲁棒视频数字水印算法,《中国体视学与图像分析》2006年 第4期图像插值方法对互信息局部极值的影响分析,《电子与信息学报》2006年 第10期网状被动传感器系统优化设计, 《系统工程与电子技术》2006年 第12期基于小波变换和目标运动特性的红外弱小目标检测, 《红外》2006年 第9期基于小波变换的红外弱小目标检测新方法,《红外技术》2006年 第7期在线CA的安全增强方案研究,《计算机工程》2006年 第11期基于ADSP—BF561车载多媒体系统,《现代电子技术》2006年 第3期空间分析中视界覆盖问题的研究,《系统工程与电子技术》2005年 第11期模糊观测数据的关联和目标跟踪,《信号处理》2005年 第4期从航空影像中自动提取高层建筑物,《计算机学报》2005年 第7期城市航空影像中基于模糊Retinex的阴影消除,《电子学报》2005年 第3期一种新的自适应图像模糊增强算法,《西安电子科技大学学报》2005年 第2期基于OAR模型的航空影像高层建筑自动提取,《深圳大学学报:理工版》2005年 第1期红外热图像序列中基于人体模型的目标头部定位方法,《激光与红外》2005年 第2期直线Snakes及其在建筑物提取中的应用,《西安电子科技大学学报》2005年 第1期网状被动传感器系统视线交叉目标定位方法,《电子与信息学报》2005年 第1期一种新的道路描述子:对称边缘方向直方图,《电子学报》2005年 第1期基于对称边缘方向直方图自动提取主要道路,《中国体视学与图像分析》2005年 第2期分布式被动传感器网异步采样下的机动目标跟踪,《系统仿真学报》2005年 第6期一种基于频带一致性的多模态图像校准算法,《通信学报》2005年 第4期基于模糊熵的自适应图像多层次模糊增强算法,《电子学报》2005年 第4期一种安全增强的基于椭圆曲线可验证门限签名方案,《计算机研究与发展》2005年 第4期密码学与数字水印在电子印章中的应用,《微机发展》2004年 第11期一种安全实用的电子公文系统设计与实现, 《现代电子技术》2004年 第21期基于DSP的PCI图像采集卡设计,《现代电子技术》2004年 第4期基于DSP组建短波电台无线数据传输网络的系统设计,《电子设计应用》2004年 第2期基于直方图的自适应高斯噪声滤波器,《系统工程与电子技术》2004年 第1期短波电台无线数据传输网络的组建,《现代电子技术》2004年 第3期半抑制式模糊C-均值聚类算法,《中国体视学与图像分析》2004年 第2期基于模糊推理的自动多级图像分割,《中国体视学与图像分析》2004年 第1期航空影像中立交桥的自动检测,《中国体视学与图像分析》2004年 第1期网状被动传感器系统航迹初始状态估计,《信号处理》2004年 第6期被动传感器系统分层快速关联算法,《电子学报》2004年 第12期一种基于模糊运算的多目标多传感器跟踪算法,《系统工程与电子技术》2004年 第11期异步被动传感器系统模糊Hough变换航迹起始算法,《系统工程与电子技术》2004年 第11期窗户纹理的时频描述及其在建筑物提取中的应用,《中国图象图形学报:A辑》2004年 第10期基于模糊熵的支撑矢量预选取方法,《复旦学报:自然科学版》2004年 第5期基于物方几何约束提取建筑物垂直边缘,《中国图象图形学报:A辑》2004年 第9期分布式网状被动传感器系统定位误差分析,《西安电子科技大学学报》2004年 第5期分布式网状被动传感器系统量测数据关联,《系统工程与电子技术》2004年 第12期基于核方法的分类型属性数据集模糊聚类算法,《华南理工大学学报:自然科学版》2004年 第9期基于模糊决策的密集多回波环境下航迹起始算法,《雷达与对抗》2004年 第3期红外传感器阵列基于信息冗余性的目标定位,《系统工程与电子技术》2004年 第8期基于核方法的模糊聚类算法,《西安电子科技大学学报》2004年 第4期一种用于模式识别的多色Voronoi图,《系统工程与电子技术》2004年 第7期基于DSP的短波电台无线数据传输网络实现,《深圳大学学报:理工版》2004年 第3期基于直方图的自适应图像去噪滤波器,《电子学报》2004年 第7期自适应模糊Hough变换,《电子学报》2004年 第6期基于主动秘密共享的安全容忍入侵方案,《兰州交通大学学报》2004年 第1期基于模糊熵的多值图像恢复方法,《西安电子科技大学学报》2004年 第2期
运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 1.1 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 0.1%以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 0.1%以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 1.2 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min:2.8% Avg:37.5% Max:23 Min:1.14 Avg:15 运动区域占 1/3 左右时 Max:45% Min:2.8% Avg:20% Max:18 Min:1.14 Avg:8 1.3 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 1.4 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 2.1 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。
论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :
机械自动化论文参考文献
文后参考文献的著录来源是被著录的文献本身。专著、连续出版物等可依次按题名页、封面、刊头等著录。缩微制品、录音制品等非书资料可依据题名帧、片头、容器上的标签、附件等著录。下面是我和大家分享的机械自动化论文参考文献,更多内容请关注(www.oh100.com/bylw)。
篇一:参考文献
[1] 王飞,刘洪才,潘立冬. 分层式结构变电站自动化通信系统研究综述[J]. 华北电力大学学报(自然科学版). 2007(01)
[2] 周文瑜,温刚,王钇,苏迪. SCL在变电站自动化系统的应用[J]. 继电器. 2007(15)
[3] 郭嘉,韩力,罗建,高仕红. SCL在变电站智能电子装置通信配置中的应用[J]. 重庆大学学报(自然科学版). 2006(12)
[4] 谢志迅,邓素碧,臧德扬. 数字化变电站通信网络冗余技术[J]. 电力自动化设备. 2011(09)
[5] 刘洋,罗毅,易秀成,涂光瑜,陈维莉,江伟. 变电站综合自动化系统的软件可靠性研究[J]. 继电器. 2006(18)
[6] 唐富华,郭银景,杨阳. 基于IEC61850和嵌入式以太网的变电站网络通信系统[J]. 电气自动化. 2006(03)
[7] 李俊刚,宋小会,狄军峰,魏勇. 基于IEC 62439-3的智能变电站通信网络冗余设计[J]. 电力系统自动化. 2011(10)
[8] 王凤祥,方春恩,李伟. 基于IEC61850的SCL配置研究与工具开发[J]. 电力系统保护与控制. 2010(10)
[9] 于敏,何正友,钱清泉. 基于Markov过程的硬/软件综合系统可靠性分析[J]. 电子学报. 2010(02)
[10] 窦晓波,胡敏强,吴在军,杜炎森,闵涛. 数字化变电站通信网络的组建与冗余方案[J]. 电力自动化设备. 2008(01)
[11] 唐富华,郭银景,杨阳. 基于IEC61850和嵌入式以太网的变电站网络通信系统[J]. 电气自动化. 2006(03)
[12] 张沛超,高翔. 全数字化保护系统的可靠性及元件重要度分析[J]. 中国电机工程学报. 2008(01)
[13] 许铁峰,徐习东. 高可用性无缝环网在数字化变电站通信网络的应用[J]. 电力自动化设备. 2011(10)
[14] 童晓阳,廖晨淞,周立龙,李映川,章力,王晓茹,许克崃. 基于IEC 61850-9-2的变电站通信网络仿真[J]. 电力系统自动化. 2010(02)
[15] 王丽华,马君华,王传启,马长武,江涛,韩明峰,王志华,张丽胜,种惠敏. 变电站配置描述语言SCL的应用研究[J]. 电网技术. 2006(S1)
[16] 陈原子,徐习东. 基于并行冗余网络的数字化变电站通信网络构架[J]. 电力自动化设备. 2011(01)
[17] 方晓洁,季夏轶,卢志刚. 基于OPNET的数字化变电站继电保护通信网络仿真研究[J]. 电力系统保护与控制. 2010(23)
篇二:参考文献
[1] 杜厚鹏. 基于监控视频的`运动车辆检测与违章分析[D]. 南京邮电大学 2014
[2] 尹雪雯. 中波发射台自动化监控系统的实践和完善[J]. 电子技术与软件工程. 2014(16)
[3] 李宗辰. 基于Android的多路视频监控用户平台的研究与实现[D]. 南京邮电大学 2014
[4] 孙娜. 中波发射台自动化监控系统的实践和完善[J]. 视听. 2013(05)
[5] 朱少坡. 视频监控中目标的空间定位优化技术研究[D]. 南京邮电大学 2014
[6] 沈忱. 视频监控中的预处理、目标检测和跟踪方法研究[D]. 南京邮电大学 2014
[7] 高滨,孙长海. 论广播电视发射台自动化监控桌系统[J]. 西部广播电视. 2013(Z2)
[8] 邬雪梅. 广播电视发射台自动化监控系统[J]. 科技传播. 2013(02)
[9] 张琦等编着.数字电视制播技术[M]. 中国广播电视出版社, 2003
[10] 曹金泉. 广播电视发射台站自动化监控系统建设[J]. 电子世界. 2012(19)
[11] 廖楚加. 自动化监控技术在电视发射台系统中的应用研究[J]. 信息通信. 2012(04)
[12] 王涛. 基于OMAP的嵌入式视频监控系统[D]. 南京邮电大学 2014
[13] 朱兴华. 中波发射台实现自动化监控如何解决干扰问题[J]. 内蒙古广播与电视技术. 2011(01)
[14] 刘剑波等编着.有线电视网络[M]. 中国广播电视出版社, 2003
[15] 张红波. 嵌入式系统视频会议控制技术的研究与实现[D]. 南京邮电大学 2014
[16] 李松. 天网高清视频监控存储系统设计与实现[D]. 南昌大学 2015
[17] 刘翔. 城市视频监控系统设计与实现[D]. 南京邮电大学 2013
[18] 李森. 在广播发射台中实现监控自动化设计[J]. 信息通信. 2013(08)
[19] 赵栖平. 监控视频中基于在线学习的车辆跟踪检测算法与实现[D]. 南京邮电大学 2014
篇三:参考文献
[1] 吴莹. 基于Selenium的Web自动化测试框架[J]. 科技传播. 2011(18)
[2] 顾国庆. 移动图书馆的研发与实现[D]. 南昌大学 2015
[3] 高凌琴. 基于STAF的自动化测试框架的研究[J]. 曲阜师范大学学报(自然科学版). 2011(03)
[4] 王玉蓉. 青南村村务信息管理系统的研究与开发[D]. 浙江农林大学 2013
[5] 李斌. 工控软件的层次化设计及应用[D]. 苏州大学 2014
[6] 李首文,何贵兵. 自动技术在软件测试过程中的研究与实施[J]. 科技信息. 2011(15)
[7] 周宁. 移动考勤管理的应用与研究[D]. 南昌大学 2014
[8] 姚砺,束永安. 软件测试自动化关键技术的研究[J]. 安徽大学学报(自然科学版). 2003(04)
[9] 张永梅,陈立潮,马礼,郭韶升. 软件测试技术研究[J]. 测试技术学报. 2002(02)
[10] 吕诚昭,孟洛明. 一个软件测试自动化系统:TSBAG[J]. 北京邮电学院学报. 1993(01)
[11] 徐磊. 烟草行业商零物流在途监管信息系统设计[D]. 南昌大学 2014
[12] 黄彪贤,熊建斌,李振坤. 金融软件功能自动化测试的分析及应用[J]. 计算机工程与设计. 2012(02)
[13] 兰欣. 微信公众平台CMS的设计与实现[D]. 南昌大学 2015
[14] 刘腾. 软件测试技术与自动化测试框架模型的研究与应用[J]. 电脑知识与技术. 2009(26)
[15] 中国农业银行股份有限公司江苏省南通市分行课题组. 银行软件自动化测试技术的应用[J]. 中国金融电脑. 2009(12)
[16] 郭巍,龚兵,张武光. 基于数据操作的自动化测试技术研究与应用[J]. 飞行器测控学报. 2009(04)
[17] 赵杰,张晶,高继森. 基于XML的测试用例复用[J]. 重庆工学院学报(自然科学版). 2007(09)
[18] 刘星,蔡勉,李燕,郭颖. 基于关键字驱动机制的安全操作系统的测评系统[J]. 计算机安全. 2009(10)
[19] 蒋云,赵佳宝. 自动化测试脚本自动生成技术的研究[J]. 计算机技术与发展. 2007(07)
#包括“简历。”#包括“highgui。”#包括<高>时间。#包括<数学的。”#包括< ctype小时>。#包括<工作室的。“#包括<字符串>的。一双mhi_duration =0.1;一双max_time_delta =0.5;一双min_time_delta =0.05;整型常量=3;整型常量contour_max_aera =10;iplimage * * BCN =0;最后=0;iplimage *三菱重工=0;cvfilter cv_gaussian_5x5滤波器;cvconnectedcomp * cur_comp,min_comp;cvconnectedcomp补偿;cvmemstorage*;cvpoint铂[ 4];无效update_mhi(iplimage * - *,iplimage夏令时,国际diff_threshold){双时间戳= clock() / 1。;cvsize大小= cvsize(- - - - > >宽度,高度);在我,idx1,idx2;iplimage * silh;iplimage *芘= cvcreateimage(cvsize((size.width及- 2)/ 2,(size.height及- 2)/2),8,1);cvmemstorage *站;cvseq *续;先进行数据的初始化/ * * /如果(!三菱重工| |三菱重工- >宽度!= size.width | |三菱重工- >高度!= size.height){如果(缓冲区= =0){但是=(iplimage * *(*)内存大小(字节[ 0]));memset(缓冲区,0,* size of(字节[ 0]));}为(=0;我的;我+ +){cvreleaseimage(&,[我]);但是[我] = cvcreateimage(大小,ipl_depth_8u,1);cvzero(字节[我]);}cvreleaseimage(与三菱重工);三菱重工= cvcreateimage(大小,ipl_depth_32f,1);cvzero(三菱重工);}cvcvtcolor(1mg,但是[上],cv_bgr2gray);最后idx1=;idx2=(上+1)%氮;最后idx2=;silh =但是[ idx2];cvabsdiff(缓冲区缓冲区idx2[ idx1],[ ],silh);cvthreshold(silh,silh,30,255,cv_thresh_binary);cvupdatemotionhistory(silh,三菱重工,时间戳,mhi_duration);cvcvtscale(三菱重工,测试,255/ mhi_duration,(mhi_duration -时间)* 255/ mhi_duration。);cvcvtscale(三菱重工,测试,255/ mhi_duration,0。);cvsmooth(夏令时间,日光节约时间,cv_median,3,0,0,0);cvpyrdown(夏令时,芘,7);cvdilate(吡啶酚,酚,0,1);cvpyrup(芘,测试,7);故事= cvcreatememstorage(0);续= cvcreateseq(cv_seq_eltype_point,size of(cvseq),大小(cvpoint),故事);cvfindcontours(夏令时,故事,和控制,尺寸(cvcontour),cv_retr_list,cv_chain_approx_simple,cvpoint(0 , 0));为(;控制;控制=续- > h_next){cvrect =((cvcontour *)续)- >矩形;如果(r.height * r.width > contour_max_aera){cvrectangle(1mg,cvpoint(支持,酵母),cvpoint(支持+ r.width,酵母+ r.height),cv_rgb(255,0,0),1,cv_aa,0);}}cvreleasememstorage(与故事);cvreleaseimage(与他们);}cvreleasememstorage(与故事);cvreleaseimage(与他们);诠释主体(国际argc,字符* * argv){iplimage *运动=0;cvcapture *捕捉=0;拍摄cvcapturefromfile(“:/ / capture1的。”);如果(捕获)cvnamedwindow(“视频分析”,1);{为(;;){iplimage *图像;如果(!cvgrabframe(捕获))打破;图像cvretrieveframe(捕获);如果(图像){如果(!运动){运动= cvcreateimage(cvsize(图像- >宽度,图像- >高度),8,1);cvzero(运动);运动- >起源=图像- >起源;}}update_mhi(图像,运动,60);cvshowimage(“视频分析”,形象);如果(cvwaitkey(10)> =0)打破;}cvreleasecapture(捕捉);cvdestroywindow(“视频分析”);}返回0;}希望采纳
纳闷,opencv书上不是有各个函数的功能吗,也可以上网查啊,我不具体看了,大概看一下吧如果你知道目标提取的一些方法,这个看懂不难,抱歉没啥时间给你看,自己努力下吧。大致的思路是:通过背景差或帧差的方法获取两者的差别,并通过设定阈值,将差别较大的认为是前景目标,然后通过一些腐蚀、膨胀、滤波(比如中值滤波)提取出前景目标,然后去除小目标减少干扰,并用矩形框将结果框出来,很简单,自己对照着这个思想好好看看代码吧,凡是要靠自己努力才能成长。祝学业有成~void update_mhi( IplImage* img, IplImage* dst, int diff_threshold ){ double timestamp = clock()/1.; CvSize size = cvSize(img->width,img->height); int i, idx1, idx2; IplImage* silh; IplImage* pyr = cvCreateImage( cvSize((size.width & -2)/2, (size.height & -2)/2), 8, 1 ); CvMemStorage *stor; CvSeq *cont; /*先进行数据的初始化*/ if( !mhi || mhi->width != size.width || mhi->height != size.height ) { if( buf == 0 ) { buf = (IplImage**)malloc(N*sizeof(buf[0])); memset( buf, 0, N*sizeof(buf[0])); } for( i = 0; i < N; i++ ) { cvReleaseImage( &buf[i] ); buf[i] = cvCreateImage( size, IPL_DEPTH_8U, 1 ); cvZero( buf[i] ); } cvReleaseImage( &mhi ); mhi = cvCreateImage( size, IPL_DEPTH_32F, 1 ); cvZero( mhi ); } cvCvtColor( img, buf[last], CV_BGR2GRAY ); //前面没看,我想是将rgb图像转为灰度图像,可能create一下单通道的图像,存放转换结果的。 idx1 = last; idx2 = (last + 1) % N; last = idx2; silh = buf[idx2]; cvAbsDiff( buf[idx1], buf[idx2], silh ); //做差,我想是通过差分的方法,提取前景目标的,也就是当前图像与背景图像作差,提取前景目标。 cvThreshold( silh, silh, 30, 255, CV_THRESH_BINARY );//这里阈值化,相差30像素以上为前景目标 cvUpdateMotionHistory( silh, mhi, timestamp, MHI_DURATION ); cvCvtScale( mhi, dst, 255./MHI_DURATION, (MHI_DURATION - timestamp)*255./MHI_DURATION ); cvCvtScale( mhi, dst, 255./MHI_DURATION, 0 ); cvSmooth( dst, dst, CV_MEDIAN, 3, 0, 0, 0 );//滤波,平滑,去噪 cvPyrDown( dst, pyr, 7 );//降采样 cvDilate( pyr, pyr, 0, 1 ); //膨胀处理,让前景变得圆滑,以及一些小碎片连接起来 cvPyrUp( pyr, dst, 7 ); stor = cvCreateMemStorage(0); cont = cvCreateSeq(CV_SEQ_ELTYPE_POINT, sizeof(CvSeq), sizeof(CvPoint) , stor);//创序列 cvFindContours( dst, stor, &cont, sizeof(CvContour), CV_RETR_LIST, CV_CHAIN_APPROX_SIMPLE, cvPoint(0,0));//找轮廓及个数 for(;cont;cont = cont->h_next) { CvRect r = ((CvContour*)cont)->rect;//加上矩形框,也就是将前景目标框出来 if(r.height * r.width > CONTOUR_MAX_AERA) { cvRectangle( img, cvPoint(r.x,r.y), cvPoint(r.x + r.width, r.y + r.height), CV_RGB(255,0,0), 1, CV_AA,0); } } cvReleaseMemStorage(&stor); cvReleaseImage( &pyr );} cvReleaseMemStorage(&stor); cvReleaseImage( &pyr );}
你可以到七七计算机毕业论文的毕业设计题目列表中找一份。有完整的论文和源码等,很详细
这种运动目标检测的方法还是很经典的,下面写了一些注释仅作参考,希望对你有所帮助。#include "stdafx.h"#include "cv.h"#include "highgui.h"#include
一、毕业设计(论文)的目的
应该用一句话说明你的毕业设计(论文)的研究内容和研究目标。再列出拟解决的关键问题,可以列二到三个问题。不宜太少也不宜太多。
图一
二、毕设任务的内容和要求
此部分可分两项来写。
任务内容:可填写诸如“认真查找资料,研读相关文献,了解该研究主题的国内外研究现状”等比较笼统的任务,再具体到到熟悉本研究相关的理论,如何收集合适的数据(或语料),如何处理数据,如何进行研究等,简单说明即可。
图二
任务要求:可以笼统写“论文要在观点、逻辑、用语、语法格式等各方面符合学术论文的基本要求,做到逻辑层次清晰,中心突出,内容丰富,材料运用得当,论据充分,结论合理,并有一定创新。工作态度积极。”
三、主要参考文献
列出与选题相关的参考文献15条以上,注意外文文献和中文文献各占一半,既有期刊文献,也有学术著作。学位论文和会议论文也可以作为参考文献。
如果撰写的是外语类毕业论文,建议外语文献占2/3。文献要有新有旧,必须有最近三五年发表的参考文献,以示本研究既有前人研究作为基础,又跟踪到该研究的最新成果,说明本研究选题不会过于陈旧。
参考文献的写法必须根据各个学校本科毕业论文格式规范来撰写。
选题目的与意义,即回答为什么要研究,交代研究的价值及需要背景。一般先谈现实需要——由存在的问题导出研究的实际意义,然后再谈理论及学术价值,要求具体、客观,且具有针对性,注重资料分析基础,注重时代、地区或单位发展的需要,切忌空洞无物的口号。国内外研究现状,即文献综述,要以查阅文献为前提,所查阅的文献应与研究问题相关,但又不能过于局限。与问题无关则流散无穷;过于局限又违背了学科交叉、渗透原则,使视野狭隘,思维窒息。所谓综述的“综”即综合,综合某一学科领域在一定时期内的研究概况;“述”更多的并不是叙述,而是评述与述评,即要有作者自己的独特见解。要注重分析研究,善于发现问题,突出选题在当前研究中的位置、优势及突破点;要摒弃偏见,不引用与导师及本人观点相悖的观点是一个明显的错误。综述的对象,除观点外,还可以是材料与方法等。扩展资料:毕业论文的目录一般说来,篇幅较长的毕业论文,都设有分标题。设置分标题的论文,因其内容的层次较多,整个理论体系较庞大、复杂,故通常设目录。设置目录的目的主要是:1、使读者能够在阅读该论文之前对全文的内容、结构有一个大致的了解,以便读者决定是读还是不读,是精读还是略读等。2、为读者选读论文中的某个分论点时提供方便。长篇论文,除中心论点外,还有许多分论点。当读者需要进一步了解某个分论点时,就可以依靠目录而节省时间。目录一般放置在论文正文的前面,因而是论文的导读图。要使目录真正起到导读图的作用,必须注重:1、准确。目录必须与全文的纲目相一致。也就是说,本文的标题、分标题与目录存在着一一对应的关系。2、清楚无误。目录应逐一标注该行目录在正文中的页码。标注页码必须清楚无误。3、完整。目录既然是论文的导读图,因而必然要求具有完整性。也就是要求文章的各项内容,都应在目录中反映出来,不得遗漏。
文秀网论文预期目标范文2020-11-28 13:04:51论文预期目标怎么写1.使读者能够在阅读该论文之前对全文的内容、结构有一个大致的了解,以便读者决定是读还是不读,是精读还是略读等。2.为读者选读论文中的某个分论点时提供方便。长篇论文,除中心论点外,还有许多分论点。当读者需要进一步了解某个分论点时,就可以依靠目录而节省时间。目录一般放置在论文正文的前面,因而是论文的导读图。要使目录真正起到导读图的作用,必须注意:1.准确。目录必须与全文的纲目相一致。也就是说,本文的标题、分标题与目录存在着一一对应的关系。2.清楚无误。目录应逐一标注该行目录在正文中的页码。标注页码必须清楚无误。3.完整。目录既然是论文的导读图,因而必然要求具有完整性。也就是要求文章的各项内容,都应在目录中反映出来,不得遗漏。论文中的预期成果形式和预期目标怎么写题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用文体,这种文字体裁是随着现代科学研究活动计划性的增强和科研选题程序化管理的需要应运而生的。开题报告一般为表格式,它把要报告的每一项内容转换成相应的栏目,这样做,既便于开题报告按目填写,避免遗漏;又便于评审者一目了然,把握要点。开题报告包括综述、关键技术、可行性分析和时间安排等四个方面 。开题报告作为毕业论文答辩委员会对学生答辩资格审查的依据材料之一。由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题。开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法。开题报告是由选题者把自己所选的课题的概况(即"开题报告内容"),向有关专家、学者、科技人员进行陈述。然后由他们对科研课题进行评议。亦可采用"德尔菲法"评分;再由科研管理部门综合评议的意见,确定是否批准这一选题。开题报告的内容大致如下:课题名称、承担单位、课题负责人、起止年限、报名提纲。报名提纲包括:(1)课题的目的、意义、国内外研究概况和有关文献资料的主要观点与结论;(2)研究对象、研究内容、各项有关指标、主要研究方法(包括是否已进行试验性研究);(3)大致的进度安排;(4)准备工作的情况和目前已具备的条件(包括人员、仪器、设备等);(5)尚需增添的主要设备和仪器(用途、名称、规格、型号、数量、价格等);(6)经费概算;(7)预期研究结果;(8)承担单位和主要协作单位、及人员分工等。同行评议,着重是从选题的依据、意义和技术可行性上做出判断。即从科学技术本身为决策提供必要的依据。开题报告的格式(通用)由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题说清楚,应包含两个部分:总述、提纲。1 总述开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法、必要的数据等等。2 提纲开题报告包含的论文提纲可以是粗线条的,是一个研究构想的基本框架。可采用整句式或整段式提纲形式。在开题阶段,提纲的目的是让人清楚论文的基本框架,没有必要像论文目录那样详细。3 参考文献开题报告中应包括相关参考文献的目录4 要求开题报告应有封面页,总页数应不少于4页。版面格式应符合以下规定。开 题 报 告学 生:一、 选题意义1、 理论意义2、 现实意义二、 论文综述1、 理论的渊源及演进过程2、 国外有关研究的综述3、 国内研究的综述4、 本人对以上综述的评价三、 论文提纲前言、一、1、2、3、··· ···二、1、2、3、··· ···三、1、2、3、结论四、论文写作进度安排毕业论文开题报告提纲一、开题报告封面:论文题目、系别、专业、年级、姓名、导师二、目的意义和国内外研究概况三、论文的理论依据、研究方法、研究内容四、研究条件和可能存在的问题五、预期的结果六、进度安排毕业论文开题报告中设计的方法及预期目标应该写什么啊根据我搜集的一些网站来看,建议看看这个,要做毕业论文以及毕业设计的,推荐一个网站 ,里面的毕业设计什么的全是优秀的,因为精挑细选的,网上很少有,都是相当不错的毕业论文和毕业设计,对毕业论文的写作有很大的参考价值,希望对你有所帮助。别的相关范文很多的,推荐一些比较好的范文写作网站,希望对你有帮助,这些精选的范文网站,里面有大量的范文,也有各种文章写作方法,注意事项,应该有适合你的,自己动手找一下,可不要照搬啊,参考一下,用自己的语言写出来那才是自己的。 如果你不是校园网的话,请在下面的网站找: 毕业论文网: 分类很细 栏目很多 毕业论文: 开题报告: 实习论文: 写作指导: 。大学生未来规划范文大学生职业规划范文 我的大学职业生涯规划总论:不少人都曾经这样问过自己:“人生之路到底该如何去走?”记得一位哲人这样说过:“走好每一步,这就是你的人生。”是啊,人生之路说长也长,因为它是你一生意义的诠释;人生之路说短也短,因为你生活过的每一天都是你的人生。每个人都在设计自己的人生,都在实现自己的梦想。对于我们大学生来说,职业生涯目标的设定,是职业生涯规划的核心。一个人事业的成败,很大程度上取决于有无正确适当的目标。没有目标如同驶入大海的孤舟,四野茫茫,没有方向,不知道自己走向何方。只有树立了目标,才能明确奋斗方向,犹如海洋中的灯塔,引导你避开险礁暗石,走向成功。一. 意义及自我分析有了成功的目标。明确自己人生的大目标,对把握好目标有直接的促进作用。认真策划人生每一步。有道是:"凡事预则立,不预则废",千真万确。对自己做的或将要做的事没有任何准备,就是在为失败做准备。(1)学历目标:大专毕业(以后有必要了 还有要"充电"。(2)经济目标:年薪25万(3) 方 向:企业高级管理人员 建立自己的公司(生化)二.社会环境规划和职业分析(三年规划)1、社会一般环境中国政治稳定,经济持续发展。在全球经济一体化环境中的重要角色。经济发展有强劲的势头,加入wto后,会有大批的外国企业进入中国市场,中国的企业也将走出国门。2、管理职业特殊社会环境由于中国的管理科学发展较晚,管理知识大部分源于国外,中国的企业管理还有许多不完善的地方。中国急需管理人才,尤其是经过系统培训的高级管理人才。因此企业管理职业市场广阔。三.大学三年规划:1.职业目标:(2006-2008年)(1)职务目标:先从学生会干,勤工俭学,逐步了解企业对大学生的要求。(2)能力目标:掌握专业知识,了解其他方面对自己有用的 知识。(3)经济目标:在校期间兼职,年收入1万元左右;一年级:为试探期和定向期:首先要适应由高中生到大学生的角色转变,重新确定自己的学习目标和要求;其次,要开始接触职业和职业生涯的概念,特别要重点了解自己未来所希望从事的职业或与自己所学专业对口的职业,进行初步的职业生涯设计;熟悉环境,建立新的人际关系,提高交际沟通能力,在职业认识方面可以向高年级学生尤其是大四的毕业生询问就业情况;积极参加各种各样的社团活动,增加交流技巧;在学习方面,要巩固扎实专业基础知识,加强英语.计算机能力的培养,掌握现代职业者所应具备的最基本技能;要初步了解职业,提高人际沟通能力。大一学习任务不重,应多参加学校活动,增加交流技巧,但不要盲目地参加。在定向期,应考虑未来是否深造或就业,通过参加学生会或社团等组织,锻炼自己的能力,同时检验自己的知识技能;提高自己的责任感,主动性和受挫能力,并开始有选择地辅修其他专业的知识来填充自己。二年级:为准备期.加强专业知识学习的同时,考取与目标职业有关的职业资格证书或相应地通过职业技能鉴定。因为临近毕业,所以目标应锁定在提高求职技能、搜集公司信息上。参加与专业有关的暑期工作,和同学交流求职工作心得体会,学习写简历、求职信等求职技巧,了解搜集就业信息的渠道,并确定自己是否要升本或考研。要积极锻炼自己得到独立解决问题的能力和创造性;积极常识并加入校友网络,了解往年的求职情况。三年级:为分化期(冲刺就业):目标应锁定在工作申请及成功就业上.这时可先对前两年的准备做一个总结:首先检验自己已确立的职业目标是否明确,前两年的准备是否充分;然后开始毕业后工作的申请,积极参加招聘活动,在实践中检验自己的积累和准备;最后,预习或模拟面试。积极利用学校提供的条件,强化求职技巧,进行模拟面试等训练,尽可能地做出充分准备。在撰写毕业论文的时,可大胆提自己的见解,锻炼自己独立解决问题的能力和创造性。另外,要重视实习机会,通过实习从宏观上了解单位的工作方式、运转模式、工作流程,从微观上明确个人在岗位上的职责要求及规范,为正式走上工作岗位奠定良好的基础。四.目标分解与目标组合](大学三年)(1) 目标分解:目标可分解成两个大的目标—— 一个是顺利毕业,一个是成为一个有一家公司的 生化方面的 技术人员。对于第一个目标,又可分解为把专业课学好和把选修课学好,以便修完足够的学分,顺利毕业。接下来,还可以细分:在专业课程中,如何学好每一门课程(精通一两门自己喜欢的课,如有机化学);在选修课程中,需要选择哪些课程,如何学好…….对于第二目标,又可分解为接触社会阶段,了解市场阶段、熟悉公司运营阶段。接下来,还可以细分:在接触社会阶段,要采用什么办法,和哪些公司保持联系.如何锻炼自己…….(2) 目标组合:顺利毕业的前提是学好专业课程,而专业课程的学习则对职业目标(成为一个有一家公司的 生化方面的 技术人员)有促进作用。(1)自身现状英语水平可以,能流利沟通;生化专业扎实,略通经贸知识;具有较强的人际沟通能力;思维敏捷,表达较流畅;在大学期间长期担任学生干部,有较强的组织协调能力;有很强的学习。论文关于大学生目标的范文韩愈曾说:“凡事预则立,不预则废。”这里的“预”可理解为一种预见性、计划性。以下几个小故事,也许可以说明一些问题: 人生之旅从选定方向开始。没有方向的帆永远是逆风,没有方向的人生不过是在绕圈子。西撒哈拉沙漠中的旅游胜地——比赛尔,在很久以前,是一个只能进、不能出的贫瘠地方。在一望无际的沙漠里,一个人如果凭着感觉往前走,他只会走出许多大小不一的圆圈。后来,一位青年在北斗星的指引下,成功地走到了大漠边缘。这位青年成了比赛尔的开拓者,他的铜像被竖在小城的中央,铜像的底座上刻着一行字:新生活是从选定方向开始的。 有什么样的目标就有什么样的人生。这话出自世界顶尖潜能大师安东尼·罗宾之口。仅仅有了方向还不够,还要沿着这个方向设定目标并不断调整目标。澳大利亚的一个草原上草儿长得特别好,羊群规模越来越大。羊为了争夺食物,都不愿意落在后面,开始不断地往前奔跑,到最后所有的羊只想吃到最前面的草而都朝一个方向不停奔跑,结果成批的羊一直跑到草原尽头的悬崖边缘并跳了下去——它们已经完全忘记了自己奔跑的目标是吃草,而把奔跑本身当作了目标。用一年的时间赢得一生的成功。世界著名投资公司“软银”的创始人孙正义,曾经在23岁时花了1年多的时间来想自己到底要做什么。他把自己想做的40多种事情都列出来,而后逐一地做详细的市场调查,并做出了10年的预想损益表、资金周转表和组织结构图,40个项目的资料全部合起来足有10多米高。然后他列出了25项选择事业的标准,包括该工作是否能使自己全身心投入50年不变、10年内是否至少能成为全日本第一等等。依照这些标准,他给自己的40个项目打分排队,计算机软件批发业务脱颖而出。用十几米厚的资料做事业选择,目光放在几十年之后,这样的深思熟虑,这样的周密规划,注定了他日后的成功。把80%的时间留给未来。一成功人士说,用20%的时间去处理眼前的紧要事情,而用80%的时间去做那些暂时没有收益但以后会有的重要事情。有一则报道说,300 条鲸鱼在追逐沙丁鱼时,不知不觉被困在一个海湾里而死亡。弗里德里克·布朗·哈里斯说:“海上巨人因为追逐小利而惨死,为了微不足道的目标而空耗了自己的大力。”要为自己定一个10年规划,如果要发挥潜能,你还必须全神贯注于自己有优势并会有高回报的方面,反过来,这些优势会进一步发展并帮助你实现目标。 1953年,耶鲁大学对毕业生进行了一次有关人生目标的调查。当被问及是否有清楚明确的目标以及达成的书面计划时,结果只有3%的学生选择了肯定回答。20年后,通过跟踪调查发现,那3%有达成目标书面计划的学生,在财务状况上远高于其他97%的学生。人生的路很长,但紧要处只有几步,尤其在年轻的时候。许多人埋头苦干,却不知所为何来,到发现搭错了方向却为时已晚。因此,我们必须树立真正的目标,澄明思想,凝聚继续向前的力量。毕业论文开题报告中可行性分析是对技术的环境可行、经济可行、政策可行、技术可行进行分析,以此来判断方案的可行或不可行。并作出总结。您的开题报告有什么要求呢开题报告是需要多少字呢你可以告诉我具体的排版格式要求,希望可帮到你,祝顺利开题报告主要包括以下几个方面:(一)论文名称论文名称就是课题的名字第一,名称要准确、规范。准确就是论文的名称要把论文研究的问题是什么,研究的对象是什么交待清楚,论文的名称一定要和研究的内容相一致,不能太大,也不能太小,要准确地把你研究的对象、问题概括出来。第二,名称要简洁,不能太长。不管是论文或者课题,名称都不能太长,能不要的字就尽量不要,一般不要超过20个字。(二) 论文研究的目的、意义研究的目的、意义也就是为什么要研究、研究它有什么价值。这一般可以先从现实需要方面去论述,指出现实当中存在这个问题,需要去研究,去解决,本论文的研究有什么实际作用,然后,再写论文的理论和学术价值。这些都要写得具体一点,有针对性一点,不能漫无边际地空喊口号。主要内容包括:⑴ 研究的有关背景(课题的提出): 即根据什么、受什么启发而搞这项研究。 ⑵ 通过分析本地(校) 的教育教学实际,指出为什么要研究该课题,研究的价值,要解决的问题。(三) 本论文国内外研究的历史和现状(文献综述)。 规范些应该有,如果是小课题可以省略。一般包括:掌握其研究的广度、深度、已取得的成果;寻找有待进一步研究的问题,从而确定本课题研究的平台(起点)、研究的特色或突破点。(四)论文研究的指导思想指导思想就是在宏观上应坚持什么方向,符合什么要求等,这个方向或要求可以是哲学、政治理论,也可以是政府的教育发展规划,也可以是有关研究问题的指导性意见等。(五) 论文写作的目标论文写作的目标也就是课题最后要达到的具体目的,要解决哪些具体问题,也就是本论文研究要达到的预定目标:即本论文写作的目标定位,确定目标时要紧扣课题,用词要准确、精练、明了。常见存在问题是:不写研究目标;目标扣题不紧;目标用词不准确; 目标定得过高, 对预定的目标没有进行研究或无法进行研究。确定论文写作目标时,一方面要考虑课题本身的要求,另一方面要考率实际的工作条件与工作水平。(六)论文的基本内容研究内容要更具体、明确。并且一个目标可能要通过几方面的研究内容来实现,他们不一定是一一对应的关系。大家在确定研究内容的时候,往往考虑的不是很具体,写出来的研究内容特别笼统、模糊,把写作的目的、意义当作研究内容。基本内容一般包括:⑴对论文名称的界说。应尽可能明确三点:研究的对象、研究的问题、研究的方法。⑵本论文写作有关的理论、名词、术语、概念的界说。(七)论文写作的方法具体的写作方法可从下面选定: 观察法、调查法、实验法、经验总结法、 个案法、比较研究法、文献资料法等。(八)论文写作的步骤论文写作的步骤,也就是论文写作在时间和顺序上的安排。论文写作的步骤要充分考虑研究内容的相互关系和难易程度,一般情况下,都是从基础问题开始,分阶段进行,每个阶段从什么时间开始,至什么时间结束都要有规定。课题研究的主要步骤和时间安排包括:整个研究拟分为哪几个阶段;各阶段的起止时间 希望可以帮你。您的调查报告有什么要求呢调查报告是需要多少字呢调查报告准备往哪个方向写你可以告诉我具体的排版格式要求,希望可帮到你,祝顺利怎么写开题报告呢? 首先要把在准备工作当中搜集的资料整理出来,包括课题名称、课题内容、课题的理论依据、参加人员、组织安排和分工、大概需要的时间、经费的估算等等。第一是标题的拟定。课题在准备工作中已经确立了,所以开题报告的标题是不成问题的,把你研究的课题直接写上就行了。比如我曾指导过一组同学对伦教的文化诸如“伦教糕”、伦教木工机械、伦教文物等进行研究,拟定的标题就是“伦教文化研究”。 第二就是内容的撰写。开题报告的主要内容包括以下几个部分: 一、课题研究的背景。 所谓课题背景,主要指的是为什么要对这个课题进行研究,所以有的课题干脆把这一部分称为“问题的提出”,意思就是说为什么要提出这个问题,或者说提出这个课题。比如我曾指导的一个课题“伦教文化研究”,背景说明部分里就是说在改革开放的浪潮中,伦教作为珠江三角洲一角,在经济迅速发展的同时,她的文化发展怎么样,有哪些成就,对居民有什么影响,有哪些还要改进的。当然背景所叙述的内容还有很多,既可以是社会背景,也可以是自然背景。关键在于我们所确定的课题是什么。 二、课题研究的内容。课题研究的内容,顾名思义,就是我们的课题要研究的是什么。比如我校黄姝老师的指导的课题“佛山新八景”,课题研究的内容就是:“以佛山新八景为重点,考察佛山历史文化沉淀的昨天、今天、明天,结合佛山经济发展的趋势,拟定开发具有新佛山、新八景、新气象的文化旅游的可行性报告及开发方案。”三、课题研究的目的和意义。 课题研究的目的,应该叙述自己在这次。热门推荐2021年这四大星座,桃花入命,恋爱上上签!在线排盘,详批你的人生12宫,据说非常准。占星师详解:解密你生肖中不为人知的故事!在线排盘,详批你的人生12宫,据说非常准。注定走不到一起的人,命运为什么安排他们相遇异性魅力评估,来看看你的异性魅力有多高?你和ta将会经历怎样的姻缘?最后的宿命又如何?你们关系结束了吗?塔罗说未必点灯招好运,祈福保平安,快来许愿点灯好运预定!2021-2025年你将迎来哪些好运?公司工会救助申请书范文2019-12-31阅读(31)纪录片策划书范文2019-12-31阅读(29)职业期望英文范文2019-12-31阅读(17)关水龙头看图说话范文2019-12-31阅读(480)社会调查报告穹顶之下谁治霾范文2019-12-31阅读(16)高速公路半年工作总结范文2019-12-31阅读(13)向市政府打报告范文2019-12-31阅读(54)社会保险人员增加表范文2019-12-31阅读(53)考试前调整心态的范文2019-12-31阅读(19)异常交易范文2019-12-31阅读(21)幼儿园收预交费的范文2019-12-31阅读(292)入党了以后怎么做范文2019-12-31阅读(18)药厂灯检岗位总结范文2019-12-31阅读(271)榆树市范文军2019-12-31阅读(80)Copyright © 2015 - 2020文秀网论文预期目标范文首页范文
运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 1.1 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 0.1%以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 0.1%以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 1.2 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min:2.8% Avg:37.5% Max:23 Min:1.14 Avg:15 运动区域占 1/3 左右时 Max:45% Min:2.8% Avg:20% Max:18 Min:1.14 Avg:8 1.3 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 1.4 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 2.1 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。
从哪些方面验证需求的正确性 需求分析阶段的工作结果是开发系统的重要基础,大量统计数字表明,系统中 15% 的错误起源于错误的需求。为了提高质量,确保开发成功,降低开发成本,一旦对目标系统提出一组要求之后,必须严格验证这些需求的正确性。一般说来,应该从下述 4 个方面进行验证: (1) 一致性 所有需求必须是一致的,任何一条需求不能和其他需求互相矛盾。 (2) 完整性 需求必须是完整的,规格说明书应该包括用户需要的每一个功能或性能。 (3) 现实性 指定的需求应该是用现有的硬件技术和技术基本上可以实现的。对硬件技术的进步可以做些预测,对技术的进步则很难做出预测,只能从现有技术水平出发判断需求的现实性。 (4) 有效性 必须证明需求是正确有效的,确实能解决用户面对的问题。 验证需求的方法 1. 验证需求的一致性 当需求分析的结果是用自然语言书写的时候,除了靠人工技术审查验证系统规格说明书的正确性之外,目前还 没有其他更好的 “ 测试 ” 方法。但是,这种非形式化的规格说明书是难于验证的,特别在目标系统规模庞大、规格说 明书篇幅很长的时候,人工审查的效果是没有保证的,冗余、遗漏和不一致等问题可能没被发现而继续保留下来,以致开发工作不能在正确的基础上顺利进行。 为了克服上述困难,人们提出了形式化的描述需求的方法。当需求规格说明书是用形式化的需求 陈述语言书写的时候,可以用工具验证需求的一致性,从而能有效地保证需求的一致性。 2. 验证需求的现实性 为了验证需求的现实性,分析员应该参照以往开发类似系统的经验,分析用现有的软、硬件技术实现目标 系统的可能性。必要的时候应该采用仿真或性能模拟技术,辅助分析需求规格说明书的现实性。 3. 验证需求的完整性和有效性 只有目标系统的用户才真正知道需求规格说明书是否完整、准确地描述了他们的需求。因此,检验需 求的完整性,特别是证明系统确实满足用户的实际需要 (即,需求的有效性 ) ,只有在用户的密切合作下才能 完成。然而许多用户并不能清楚地认识到他们的需要 ( 特别在要开发的系统是全新的,以前没有使用类似系统的经验时,情况更是如此 ) ,不能有效地比较陈述需 求的语句和实际需要的功能。只有当他们有某种工作着的系统可以实际使用和评价时,才能完整确切 地提出他们的需要。 理想的做法是先根据需求分析的结果开发出一个系统,请用户试用一段时间以便能认识到他们的实际需要是什么,在此基础上再写出正式的 “ 正确的 ” 规格说明书。但是,这种做法将使成本增加一倍,因此实际上几乎不可 能采用这种方法。使用原型系统是一个比较现实的替代方法,开发原型系统所需要的成本和时间可以大大少于开发 实际系统所需要的。用户通过试用原型系统,也能获得许多宝贵的经验,从而可以提出更符合实际的要求。
姓名:刘帆;学号:20021210609;学院:电子工程学院 【嵌牛导读】基于深度学习的算法在图像和视频识别任务中取得了广泛的应用和突破性的进展。从图像分类问题到行人重识别问题,深度学习方法相比传统方法表现出极大的优势。与行人重识别问题紧密相关的是行人的多目标跟踪问题。 【嵌牛鼻子】深度多目标跟踪算法 【嵌牛提问】深度多目标跟踪算法有哪些? 【嵌牛正文】 第一阶段(概率统计最大化的追踪) 1)多假设多目标追踪算法(MHT,基于kalman在多目标上的拓展) 多假设跟踪算法(MHT)是非常经典的多目标跟踪算法,由Reid在对雷达信号的自动跟踪研究中提出,本质上是基于Kalman滤波跟踪算法在多目标跟踪问题中的扩展。 卡尔曼滤波实际上是一种贝叶斯推理的应用,通过历史关联的预测量和k时刻的预测量来计算后验概率: 关联假设的后验分布是历史累计概率密度的连乘,转化为对数形式,可以看出总体后验概率的对数是每一步观察似然和关联假设似然的求和。但是若同时出现多个轨迹的时候,则需要考虑可能存在的多个假设关联。 左图为k-3时刻三个检测观察和两条轨迹的可能匹配。对于这种匹配关系,可以继续向前预测两帧,如图右。得到一种三层的假设树结构,对于假设树根枝干的剪枝,得到k-3时刻的最终关联结果。随着可能性增加,假设组合会爆炸性增多,为此,只为了保留最大关联性,我们需要对其他的节点进行裁剪。下式为选择方程 实际上MHT不会单独使用,一般作为单目标追踪的扩展添加。 2)基于检测可信度的粒子滤波算法 这个算法分为两个步骤: 1、对每一帧的检测结果,利用贪心匹配算法与已有的对象轨迹进行关联。 其中tr表示一个轨迹,d是某一个检测,他们的匹配亲和度计算包含三个部分:在线更新的分类学习模型(d),用来判断检测结果是不是属于轨迹tr; 轨迹的每个粒子与检测的匹配度,采用中心距离的高斯密度函数求和(d-p)表示;与检测尺寸大小相关的阈值函数g(tr,d),表示检测与轨迹尺度的符合程度, 而α是预设的一个超参数。 计算出匹配亲和度矩阵之后,可以采用二部图匹配的Hungarian算法计算匹配结果。不过作者采用了近似的贪心匹配算法,即首先找到亲和度最大的那个匹配,然后删除这个亲和度,寻找下一个匹配,依次类推。贪心匹配算法复杂度是线性,大部分情况下,也能得到最优匹配结果。 2、利用关联结果,计算每个对象的粒子群权重,作为粒子滤波框架中的观察似然概率。 其中tr表示需要跟踪的对象轨迹,p是某个粒子。指示函数I(tr)表示第一步关联中,轨迹tr是不是关联到某个检测结果,当存在关联时,计算与关联的检测d 的高斯密度P{n}(p-d );C{tr}§是对这个粒子的分类概率;§是粒子通过检测算法得到的检测可信度,(tr)是一个加权函数,计算如下: 3)基于马尔科夫决策的多目标跟踪算法 作者把目标跟踪看作为状态转移的过程,转移的过程用马尔科夫决策过程(MDP)建模。一个马尔科夫决策过程包括下面四个元素:(S, A, T(.),R(.))。其中S表示状态集合,A表示动作集合,T表示状态转移集合,R表示奖励函数集合。一个决策是指根据状态s确定动作a, 即 π: SA。一个对象的跟踪过程包括如下决策过程: 从Active状态转移到Tracked或者Inactive状态:即判断新出现的对象是否是真。 从Tracked状态转移到Tracked或者Lost状态:即判断对象是否是持续跟踪或者暂时处于丢失状态。 从Lost状态转移到Lost或者Tracked或者Inactive状态:即判断丢失对象是否重新被跟踪,被终止,或者继续处于丢失状态。 作者设计了三个奖励函数来描述上述决策过程: 第一个是: 即判断新出现的对象是否为真,y(a)=1时表示转移到跟踪状态,反之转移到终止状态。这是一个二分类问题,采用2类SVM模型学习得到。这里用了5维特征向量:包括x-y坐标、宽、高和检测的分数。 第二个是: 这个函数用来判断跟踪对象下一时刻状态是否是出于继续跟踪,还是处于丢失,即跟踪失败。这里作者用了5个历史模板,每个模板和当前图像块做光流匹配,emedFB表示光流中心偏差, 表示平均重合率。 和 是阈值。 第三个是: 这个函数用来判断丢失对象是否重新跟踪,或者终止,或者保持丢失状态不变。这里当丢失状态连续保持超过 (=50)时,则转向终止,其他情况下通过计算M个检测匹配,来判断是否存在最优的匹配使上式(3-14)奖励最大,并大于0。这里涉及两个问题如何设计特征以及如何学习参数。这里作者构造了12维与模板匹配相关的统计值。而参数的学习采用强化学习过程,主要思想是在犯错时候更新二类分类器值。 第二阶段 深度学习应用 1)基于对称网络的多目标跟踪算法 关于Siamese网络在单目标跟踪深度学习中有了介绍,在这里不再介绍,可以向前参考。 2)基于最小多割图模型的多目标跟踪算法 上述算法中为了匹配两个检测采用LUV图像格式以及光流图像。Tang等人在文献中发现采用深度学习计算的类光流特征(DeepMatching),结合表示能力更强的模型也可以得到效果很好的多目标跟踪结果。 基于DeepMatching特征,可以构造下列5维特征: 其中MI,MU表示检测矩形框中匹配的点的交集大小以及并集大小,ξv和ξw表示检测信任度。利用这5维特征可以学习一个逻辑回归分类器。 同样,为了计算边的匹配代价,需要设计匹配特征。这里,作者采用结合姿态对齐的叠加Siamese网络计算匹配相似度,如图9,采用的网络模型StackNetPose具有最好的重识别性能。 综合StackNetPose网络匹配信任度、深度光流特征(deepMatching)和时空相关度,作者设计了新的匹配特征向量。类似于[2], 计算逻辑回归匹配概率。最终的跟踪结果取得了非常突出的进步。在MOT2016测试数据上的结果如下表: 3)通过时空域关注模型学习多目标跟踪算法 除了采用解决目标重识别问题的深度网络架构学习检测匹配特征,还可以根据多目标跟踪场景的特点,设计合适的深度网络模型来学习检测匹配特征。Chu等人对行人多目标跟踪问题中跟踪算法发生漂移进行统计分析,发现不同行人发生交互时,互相遮挡是跟踪算法产生漂移的重要原因[4]。如图10。 在这里插入图片描述 针对这个问题,文献[4]提出了基于空间时间关注模型(STAM)用于学习遮挡情况,并判别可能出现的干扰目标。如图11,空间关注模型用于生成遮挡发生时的特征权重,当候选检测特征加权之后,通过分类器进行选择得到估计的目标跟踪结果,时间关注模型加权历史样本和当前样本,从而得到加权的损失函数,用于在线更新目标模型。 该过程分三步,第一步是学习特征可见图: 第二步是根据特征可见图,计算空间关注图(Spatial Attention): 其中fatt是一个局部连接的卷积和打分操作。wtji是学习到的参数。 第三步根据空间注意图加权原特征图: 对生成的加权特征图进行卷积和全连接网络操作,生成二元分类器判别是否是目标自身。最后用得到分类打分选择最优的跟踪结果。 4)基于循环网络判别融合表观运动交互的多目标跟踪算法 上面介绍的算法采用的深度网络模型都是基于卷积网络结构,由于目标跟踪是通过历史轨迹信息来判断新的目标状态,因此,设计能够记忆历史信息并根据历史信息来学习匹配相似性度量的网络结构来增强多目标跟踪的性能也是比较可行的算法框架。 考虑从三个方面特征计算轨迹历史信息与检测的匹配:表观特征,运动特征,以及交互模式特征。这三个方面的特征融合以分层方式计算。 在底层的特征匹配计算中,三个特征都采用了长短期记忆模型(LSTM)。对于表观特征,首先采用VGG-16卷积网络生成500维的特征ϕtA,以这个特征作为LSTM的输入计算循环。 对于运动特征,取相对位移vit为基本输入特征,直接输入LSTM模型计算没时刻的输出ϕi,对于下一时刻的检测同样计算相对位移vjt+1,通过全连接网络计算特征ϕj,类似于表观特征计算500维特征ϕm,并利用二元匹配分类器进行网络的预训练。 对于交互特征,取以目标中心位置周围矩形领域内其他目标所占的相对位置映射图作为LSTM模型的输入特征,计算输出特征ϕi,对于t+1时刻的检测计算类似的相对位置映射图为特征,通过全连接网络计算特征ϕj,类似于运动模型,通过全连接网络计算500维特征ϕI,进行同样的分类训练。 当三个特征ϕA,ϕM,ϕI都计算之后拼接为完整的特征,输入到上层的LSTM网络,对输出的向量进行全连接计算,然后用于匹配分类,匹配正确为1,否则为0。对于最后的网络结构,还需要进行微调,以优化整体网络性能。最后的分类打分看作为相似度用于检测与轨迹目标的匹配计算。最终的跟踪框架采用在线的检测与轨迹匹配方法进行计算。 5)基于双线性长短期循环网络模型的多目标跟踪算法 在对LSTM中各个门函数的设计进行分析之后,Kim等人认为仅仅用基本的LSTM模型对于表观特征并不是最佳的方案,在文献[10]中,Kim等人设计了基于双线性LSTM的表观特征学习网络模型。 除了利用传统的LSTM进行匹配学习,或者类似[5]中的算法,拼接LSTM输出与输入特征,作者设计了基于乘法的双线性LSTM模型,利用LSTM的隐含层特征(记忆)信息与输入的乘积作为特征,进行匹配分类器的学习。 这里对于隐含层特征ht-1,必须先进行重新排列(reshape)操作,然后才能乘以输入的特征向量xt。 其中f表示非线性激活函数,mt是新的特征输入。而原始的检测图像采用ResNet50提取2048维的特征,并通过全连接降为256维。下表中对于不同网络结构、网络特征维度、以及不同LSTM历史长度时,表观特征的学习对跟踪性能的影响做了验证。 可以看出采用双线性LSTM(bilinear LSTM)的表观特征性能最好,此时的历史相关长度最佳为40,这个值远远超过文献[5]中的2-4帧历史长度。相对来说40帧历史信息影响更接近人类的直觉。