移动目标检测论文

发布时间：2023-12-08 11:15:15

移动目标检测论文

论文名称：Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间：2014年论文地址：针对问题：从Alexnet提出后，作者等人思考如何利用卷积网络来完成检测任务，即输入一张图，实现图上目标的定位（目标在哪）和分类（目标是什么）两个目标，并最终完成了RCNN网络模型。创新点： RCNN提出时，检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢，作者采用的是Selective Search候选区域提取算法，来获得当前输入图上可能包含目标的不同图像块，再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。参考博客：。论文题目：OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间：2014年论文地址：针对问题：该论文讨论了，CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后，在网络后端组织两组卷积或全连接层，一组用于实现定位，输出当前图像上目标的最小外接矩形框坐标，一组用于分类，输出当前图像上目标的类别信息。也是以此为起点，检测网络出现基础主干网络(backbone)+分类头或回归头（定位头）的网络设计模式雏形。创新点：在这篇论文中还有两个比较有意思的点，一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的，而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制，那用1x1卷积来替换FC层，是否可行呢？作者在测试时通过将全连接层替换为1x1卷积核证明是可行的；二是提出了offset max-pooling，也就是对池化层输入特征不能整除的情况，通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练，然后切换分类头为回归头，再训练回归头的参数，最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。参考博客：论文题目：Scalable Object Detection using Deep Neural Networks 提出时间：2014年论文地址：针对问题：既然CNN网络提取的特征可以直接用于检测任务（定位+分类），作者就尝试将目标框（可能包含目标的最小外包矩形框）提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。创新点：本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心，（800个anchor box）然后学习预测不考虑目标类别的二分类网络，背景or前景。用到了多尺度下的检测。参考博客：论文题目：DeepBox: Learning Objectness with Convolutional Networks 提出时间：2015年ICCV 论文地址：主要针对的问题：本文完成的工作与第三篇类似，都是对目标框提取算法的优化方案，区别是本文首先采用自底而上的方案来提取图像上的疑似目标框，然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序；而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点：本文作者想通过CNN学习输入图像的特征，从而实现对输入网络目标框是否为真实目标的情况进行计算，量化每个输入框的包含目标的可能性值。参考博客：论文题目：AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间：2015年ICCV 论文地址：主要针对的问题：对检测网络的实现方案进行思考，之前的执行策略是，先确定输入图像中可能包含目标位置的矩形框，再对每个矩形框进行分类和回归从而确定目标的准确位置，参考RCNN。那么能否直接利用回归的思路从图像的四个角点，逐渐得到目标的最小外接矩形框和类别呢？创新点：通过从图像的四个角点，逐步迭代的方式，每次计算一个缩小的方向，并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。参考博客：论文题目：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间：2014年论文地址：针对问题：如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络，在处理过程中就造成了图像块信息的损失。在实际的场景中，输入网络的目标尺寸很难统一，而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点：作者提出的SPPnet中，通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸，在训练的时候，池化的操作还是通过滑动窗口完成的，池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。参考博客：论文题目：Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间：2015年论文地址：针对问题：既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位，本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点：作者通过对输入网络的region进行一定的处理（通过数据增强，使得网络利用目标周围的上下文信息得到更精准的目标框）来增加网络对目标回归框的精度。具体的处理方式包括：扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置，使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性，从而提高了回归框的精度。参考博客：论文题目：Fast-RCNN 提出时间：2015年论文地址：针对问题： RCNN中的CNN每输入一个图像块就要执行一次前向计算，这显然是非常耗时的，那么如何优化这部分呢？创新点：作者参考了SPPNet（第六篇论文），在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸，从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图，再将原图上用Selective Search算法得到的目标框映射到特征图上，避免了特征的重复提取。参考博客：论文题目：DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间：2015年论文地址：主要针对的问题：本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文，作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。创新点：作者在不同的激活层上以滑动窗口的方式生成了假设，并表明最终的卷积层可以以较高的查全率找到感兴趣的对象，但是由于特征图的粗糙性，定位性很差。相反，网络的第一层可以更好地定位感兴趣的对象，但召回率降低。论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间：2015年NIPS 论文地址：主要针对的问题：由multibox（第三篇）和DeepBox（第四篇）等论文，我们知道，用CNN可以生成目标待检测框，并判定当前框为目标的概率，那能否将该模型整合到目标检测的模型中，从而实现真正输入端为图像，输出为最终检测结果的，全部依赖CNN完成的检测系统呢？创新点：将当前输入图目标框提取整合到了检测网络中，依赖一个小的目标框提取网络RPN来替代Selective Search算法，从而实现真正的端到端检测算法。参考博客：

基于FPGA的数字下变频技术

能不能给我发一份呢？

基于FPGA的跳频检测技术就是用高速PFGA的高速AD，现在通信技术比如CDMA是用的跳频技术，如果能用一种方法把跳频的频率抓到某时刻的频点的话我们就可以在这个频点上发射一个功率比被测频率功率大的信号去淹没对方的信号，这样就达到信息对抗的作用，对军方具有重要意义

格子达移动端论文检测

格子达论文查重严格。毕业论文查重其实就是学术不端行为的检测，那么最常见的学术不端的行为就是抄袭，所以诞生出了各种查重系统内对论文进行检测，检测的结果作为论文是否存在学术不端的依据，现在基本上所有高校都要求答辩前，进入相应的系统进行检测，重复率本科一般在百分之三十及以下，有些学校可能有专升本的同学，可能会要求在百分之二十五，然后才能进行毕业答辩。当论文上传至系统以后，系统采用相关技术提取论文的句子和关键词，采用分类技术对用户的论文领域进行分类，为了不让经常用的短语在查重中被检测出与论文同领域的相似之处。

严格，格子达检测时，所有引用的内容绝对会认定为重复，也就是只要文中标了[1]，[2]，[3]引用符号，那么这整句内容，不管怎么改动，无论重复与否都会直接算进引用率，而这个引用率会计入全文重复率。

格子达与知网由于数据库的不同和检测算法的不同，检测报告的结果会有一些差异，但是这种差异在同类软件里面来说是最小的，格子达对网络资源的抓取识别速度和精准度要好于知网，是一种作为知网初检最好的工具。

规避论文查重方法

一、翻译法

估计很多人都是会参考外国的一些文献内容，这样直接将英文内容进行翻译，自然也就可以有效规避论文查重。毕竟我们的论文还是属于在中文论文查重系统内来查询的，而且翻译之后的内容一般都是需要我们修改成语句通顺的内容，所以基本上不会出现重复的情况。

二、插入引文

如果我们要进行引用，又想要规避论文查重，那么也可以适当进行插入，将一些文字内容直接通过插入的方式放入到自己的论文中，这样重新进行编辑之后可以直接成为引文。

三、原创法

规避论文查重更好的方法就是直接原创内容，不用担心查重率，但是可能论文内容专业度不是很高。

有。格子达论文选题不通过是由后台系统发送短信到自己手机上，所以是有显示的。格子达是面向公众开放并提供服务第一个智能论文检测系统，作为互联网论文检测系统，面向广大论文写作者提供论文检测服务。

运动目标检测论文免费

能不能给我发一份呢？

information purposes信息目的；信息用途The interpretive geotechnical report is enclosed within the special conditions of contract for information purposes only.解释性土工技术报告附于合同特别条款之后，仅供参考之用。

information purposes 信息目的

运动目标检测数模论文

运动目标的检测的其主要目的是获取目标对象的运动参数（位置、速度、加速度等）及运动轨迹，通过进一步分析处理，实现对目标行为更高层级上的理解。运动目标检测技术目的是从序列图像中将变化区域从背景图像中提取出来，常用于视频监视、图像压缩、三维重构、异常检测等。

运动目标检测主流方法有帧差法、背景差法、光流法等。光流法源于仿生学思想，更贴近于直觉，大量昆虫的视觉机理便是基于光流法。二十世纪五十年代心理学家Gibson在他的著作“The Perception of Visual World”中首次提出了以心理学实验为基础的光流法基本概念，而直到八十年代才由Horn、Kanade、Lucash和Schunck创造性地将灰度与二维速度场相联系，引入光流约束方程的算法，对光流计算做了奠基性的工作。

光流（optical flow）：由于目标对象或者摄像机的移动造成的图像对象在连续两帧图像中的移动。

通俗说，对于一个图片序列，把每张图像每个像素在连续帧之间的运动速度和方向（某像素点在连续两帧上的位移矢量）找出来就是光流场。

第t帧的时A点的位置是(x1, y1)，第t+1帧时A点位置是(x2,y2)，则像素点A的位移矢量：(ux, vy) = (x2, y2) - (x1,y1)

如何知道第t+1帧的时候A点的位置涉及到不同的光流计算方法，主要有四种：基于梯度的方法、基于匹配的方法、基于能量的方法、基于相位的方法。

光流法依赖于三个假设：

根据所形成的光流场中二维矢量的疏密程度，光流法可分为稠密光流与稀疏光流。

稀疏光流只对有明显特征的组点（如角点）进行跟踪，计算开销小。

（1）calcOpticalFlowPyrLK 基于金字塔LK光流算法，计算某些点集的稀疏光流。参考论文《Pyramidal Implementation of the Lucas Kanade Feature TrackerDescription of the algorithm》（2）calcOpticalFlowFarneback 基于Gunnar Farneback 的算法计算稠密光流。参考论文《Two-Frame Motion Estimation Based on PolynomialExpansion》（3）CalcOpticalFlowBM 通过块匹配的方法来计算光流（4）CalcOpticalFlowHS 基于Horn-Schunck 的算法计算稠密光流。参考论文《Determining Optical Flow》（5）calcOpticalFlowSF 论文《SimpleFlow: A Non-iterative, Sublinear Optical FlowAlgo》的实现

你的问题问的太宽泛了，我就是搞建模的，都不到从何开始回答你，想要进一步讨论的话可以hi我。论文七大部分肯定是必不可少的:问题重述，模型假设，问题分析，模型建立，模型求解，结果分析及检验，(包括灵敏度分析，如果需要的话)模型推广，当然还得有目录和摘要以及参考文献了

重点：数模论文的格式及要求难点：团结协作的充分体现一、写好数模论文的重要性 1. 数模论文是评定参与者的成绩好坏、高低、获奖级别的惟一依据. 2. 数模论文是培训(或竞赛)活动的最终成绩的书面形式。 3. 写好论文的训练，是科技论文写作的一种基本训练。二、数模论文的基本内容 1，评阅原则：假设的合理性；建模的创造性；结果的合理性；表述的清晰程度 2，数模论文的结构 0、摘要 1、问题的提出：综述问题的内容及意义 2、模型的假设：写出问题的合理假设，符号的说明 3、模型的建立：详细叙述模型、变量、参数代表的意义和满足的条件，进行问题分析，公式推导，建立基本模型，深化模型，最终或简化模型等 4、模型的求解：求解及算法的主要步骤，使用的数学软件等 5、模型检验：结果表示、分析与检验，误差分析等 6、模型评价：本模型的特点，优缺点，改进方法 7、参考文献：限公开发表文献，指明出处 8、附录：计算框图、计算程序，详细图表三、需要重视的问题 0．摘要表述：准确、简明、条理清晰、合乎语法。字数300-500字，包括模型的主要特点、建模方法和主要结果。可以有公式，不能有图表简单地说，摘要应体现：用了什么方法，解决了什么问题，得到了那些主要结论。还可作那些推广。 1、建模准备及问题重述：了解问题实际背景，明确建模目的，搜集文献、数据等，确定模型类型，作好问题重述。在此过程中，要充分利用电子图书资源及纸质图书资源，查找相关背景知识，了解本问题的研究现状，所用到的基本解决方法等。 2、模型假设、符号说明基本假设的合理性很重要（1）根据题目条件作假设；（2）根据题目要求作假设；（3）基本的、关键性假设不能缺；（4）符号使用要简洁、通用。 3、模型的建立（1）基本模型 1) 首先要有数学模型：数学公式、方案等 2) 基本模型：要求完整、正确、简明，粗糙一点没有关系（2）深化模型 1）要明确说明：深化的思想，依据，如弥补了基本模型的不足…… 2）深化后的模型，尽可能完整给出 3）模型要实用，有效，以解决问题有效为原则。数学建模面临的、是要解决实际问题，不追求数学上的高（级）、深（刻）、难（度）。 ▲能用初等方法解决的、就不用高级方法； ▲能用简单方法解决的，就不用复杂方法； ▲能用被更多人看懂、理解的方法，就不用只有少数人看懂、理解的方法。 4）鼓励创新，但要切实，不要离题搞标新立异,数模创新可出现在 ▲建模中：模型本身，简化的好方法、好策略等； ▲模型求解中； ▲结果表示、分析，模型检验； ▲推广部分。 5）在问题分析推导过程中，需要注意的： ▲分析要：中肯、确切； ▲术语要：专业、内行； ▲原理、依据要：正确、明确； ▲表述要：简明，关键步骤要列出； ▲忌：外行话，专业术语不明确，表述混乱、繁琐，冗长。 4、模型求解（1）需要建立数学命题时：命题叙述要符合数学命题的表述规范，论证要尽可能严密；（2）需要说明计算方法或算法的原理、思想、依据、步骤。若采用现有软件，要说明采用此软件的理由，软件名称；（3）计算过程，中间结果可要可不要的，不要列出。（4）设法算出合理的数值结果。 5、模型检验、结果分析（1）最终数值结果的正确性或合理性是第一位的；（2）对数值结果或模拟结果进行必要的检验。当结果不正确、不合理、或误差大时，要分析原因，对算法、计算方法、或模型进行修正、改进；（3）题目中要求回答的问题，数值结果，结论等，须一一列出；（4）列数据是要考虑：是否需要列出多组数据，或额外数据；对数据进行比较、分析，为各种方案的提出提供可依赖的依据；（5）结果表示：要集中，一目了然，直观，便于比较分析。（最好不要跨页） ▲数值结果表示：精心设计表格；可能的话，用图形图表形式。 ▲求解方案，用图示更好（6）必要时对问题解答，作定性或规律性的讨论。最后结论要明确。 6．模型评价优点要突出，缺点不回避。若要改变原题要求，重新建模则可在此进行。推广或改进方向时，不要玩弄新数学术语。 7、参考文献限于公开发表的文章、文献资料或网页规范格式： [1] 陈理荣，数学建模导论（M），北京：北京邮电大学出版社，1999. [2] 楚扬杰，快速聚类分析在产品市场区分中的应用（J）,武汉理工大学学报，2004，23(2)，20－23. 8、附录详细的数据、表格、图形，计算程序均应在此列出。但不要错，错的宁可不列。主要结果数据，应在正文中列出。 9、关于写答卷前的思考和工作规划答卷需要回答哪几个问题――建模需要解决哪几个问题问题以怎样的方式回答――结果以怎样的形式表示每个问题要列出哪些关键数据――建模要计算哪些关键数据每个量，列出一组还是多组数――要计算一组还是多组数…… 10、答卷要求的原理 ▲ 准确――科学性 ▲ 条理――逻辑性 ▲ 简洁――数学美 ▲ 创新――研究、应用目标之一，人才培养需要 ▲ 实用――建模。实际问题要求。四、建模理念 1. 应用意识：要让你的数学模型能解决或说明实际问题，其结果、结论要符合实际；模型、方法、结果要易于理解，便于实际应用；站在应用者的立场上想问题，处理问题。 2. 数学建模：用数学方法解决问题，要有数学模型；问题模型的数学抽象，方法有普适性、科学性，不局限于本具体问题的解决。相同问题上要能够推广。 3. 创新意识：建模有特点，要合理、科学、有效、符合实际；要有普遍应用意义；不单纯为创新而创新五、格式要求参赛论文写作格式论文题目（三号黑体，居中）一级标题（四号黑体，居中）论文中其他汉字一律采用小四号宋体，单倍行距。论文纸用白色A4，上下左右各留出厘米的页边距。首页为论文题目和作者的专业、班级、姓名、学号，第二页为论文题目和摘要，论文从第三页开始编写页码，页码必须位于每页页脚中部，用阿拉伯数字“1”开始连续编号。第四页开始论文正文正文应包括以下八个部分：问题提出：叙述问题内容及意义；基本假设：写出问题的合理假设；建立模型：详细叙述模型、变量、参数代表的意义和满足的条件及建模的思想；模型求解：求解、算法的主要步骤；结果分析与检验：（含误差分析）；模型评价：优缺点及改进意见；参考文献：限公开发表文献，指明出处；参考文献在正文引用处用方括号标示参考文献的编号，如[1][3]等。参考文献按正文中的引用次序列出，其中书籍的表述方式为： [编号] 作者，书名，出版地：出版社，出版年参考文献中期刊杂志论文的表述方式为： [编号] 作者，论文名，杂志名，卷期号：出版年参考文献中网上资源的表述方式为： [编号] 作者，资源标题，网址，访问时间（年月日）附录：计算框图，原程序及打印结果。六、分工协作取佳绩最好三人一组，这三人中尽量做到一人数学基础较好，一人应用数学软件和编程的能力较强，一人科技论文写作水平较好。科技论文的写作要求整篇论文的结构严谨，语言要有逻辑性，用词要准确。三人之间要能够配合得起来。若三人之间配合不好，会降低效率，导致整个建模的失败。在合作的过程中，最好是能够找出一个组长，即要能够总揽全局，包括任务的分配，相互间的合作和进度的安排。在建模过程中出现意见不统一时，要尊重为先，理解为重，做到 “给我一个相信你的理由”和“相信我，我的理由是……”，不要作无谓的争论。要善于斗争，勇于妥协。还要注意以下几点：注意存盘，以防意外写作与建模工作同步注意保密，以防抄袭数学建模成功的条件和模型: 有兴趣，肯钻研；有信心，勇挑战；有决心，不怕难；有知识，思路宽；有能力，能开拓；有水平，善协作；有办法，点子多；有毅力，轻结果。

数学建模论文写作一、写好数模答卷的重要性1. 评定参赛队的成绩好坏、高低，获奖级别，数模答卷，是唯一依据。2. 答卷是竞赛活动的成绩结晶的书面形式。3. 写好答卷的训练，是科技写作的一种基本训练。二、答卷的基本内容，需要重视的问题1．评阅原则假设的合理性，建模的创造性，结果的合理性，表述的清晰程度。2．答卷的文章结构题目（写出较确切的题目；同时要有新意、醒目）摘要（200-300字，包括模型的主要特点、建模方法和主要结论）关键词（求解问题、使用的方法中的重要术语）1）问题重述。2）问题分析。3）模型假设。4）符号说明。5）模型的建立（问题分析，公式推导，基本模型，最终或简化模型等）。6）模型求解（计算方法设计或选择；算法设计或选择，算法思想依据，步骤及实现，计算框图；所采用的软件名称；引用或建立必要的数学命题和定理；求解方案及流程。）7）进一步讨论（结果表示、分析与检验，误差分析，模型检验）8）模型评价（特点，优缺点，改进方法，推广。）9）参考文献。10）附录（计算程序，框图；各种求解演算过程，计算中间结果；各种图形，表格。）3. 要重视的问题1）摘要。包括：a. 模型的数学归类（在数学上属于什么类型）；b. 建模的思想（思路）；c. 算法思想（求解思路）；d. 建模特点（模型优点，建模思想或方法，算法特点，结果检验，灵敏度分析，模型检验……）；e. 主要结果（数值结果，结论；回答题目所问的全部“问题”）。▲ 注意表述：准确、简明、条理清晰、合乎语法、要求符合文章格式。务必认真校对。2）问题重述。3）问题分析。因素之间的关系、因素与环境之间的关系、因素自身的变化规律、确定研究的方法或模型的类型。5）模型假设。根据全国组委会确定的评阅原则，基本假设的合理性很重要。a. 根据题目中条件作出假设b. 根据题目中要求作出假设关键性假设不能缺；假设要切合题意。6）模型的建立。a. 基本模型：ⅰ）首先要有数学模型：数学公式、方案等；ⅱ）基本模型，要求完整，正确，简明；b. 简化模型：ⅰ）要明确说明简化思想，依据等；ⅱ）简化后模型，尽可能完整给出；c. 模型要实用，有效，以解决问题有效为原则。数学建模面临的、要解决的是实际问题，不追求数学上的高（级）、深（刻）、难（度大）。ⅰ）能用初等方法解决的、就不用高级方法；ⅱ）能用简单方法解决的，就不用复杂方法；ⅲ）能用被更多人看懂、理解的方法，就不用只能少数人看懂、理解的方法。d．鼓励创新，但要切实，不要离题搞标新立异。数模创新可出现在：▲ 建模中，模型本身，简化的好方法、好策略等；▲ 模型求解中；▲ 结果表示、分析、检验，模型检验；▲ 推广部分。e．在问题分析推导过程中，需要注意的问题：ⅰ）分析：中肯、确切；ⅱ）术语：专业、内行；ⅲ）原理、依据：正确、明确；ⅳ）表述：简明，关键步骤要列出；ⅴ）忌：外行话，专业术语不明确，表述混乱，冗长。7）模型求解。a. 需要建立数学命题时：命题叙述要符合数学命题的表述规范，尽可能论证严密。b. 需要说明计算方法或算法的原理、思想、依据、步骤。若采用现有软件，说明采用此软件的理由，软件名称。c. 计算过程，中间结果可要可不要的，不要列出。d. 设法算出合理的数值结果。8）结果分析、检验；模型检验及模型修正；结果表示。a. 最终数值结果的正确性或合理性是第一位的；b. 对数值结果或模拟结果进行必要的检验；结果不正确、不合理、或误差大时，分析原因，对算法、计算方法、或模型进行修正、改进。c. 题目中要求回答的问题，数值结果，结论，须一一列出；d. 列数据问题：考虑是否需要列出多组数据，或额外数据对数据进行比较、分析，为各种方案的提出提供依据；e. 结果表示：要集中，一目了然，直观，便于比较分析。▲ 数值结果表示：精心设计表格；可能的话，用图形图表形式。▲ 求解方案，用图示更好。9）必要时对问题解答，作定性或规律性的讨论。最后结论要明确。10）模型评价优点突出，缺点不回避。改变原题要求，重新建模可在此做。推广或改进方向时，不要玩弄新数学术语。11）参考文献12）附录详细的结果，详细的数据表格，可在此列出，但不要错，错的宁可不列。主要结果数据，应在正文中列出，不怕重复。检查答卷的主要三点，把三关：a. 模型的正确性、合理性、创新性b. 结果的正确性、合理性c. 文字表述清晰，分析精辟，摘要精彩三、关于写答卷前的思考和工作规划答卷需要回答哪几个问题――建模需要解决哪几个问题；问题以怎样的方式回答――结果以怎样的形式表示；每个问题要列出哪些关键数据――建模要计算哪些关键数据；每个量，列出一组还是多组数――要计算一组还是多组数。四、答卷要求的原理1. 准确――科学性；2. 条理――逻辑性；3. 简洁――数学美；4. 创新――研究、应用目标之一，人才培养需要；5. 实用――建模、实际问题要求。五、建模理念1. 应用意识要解决实际问题，结果、结论要符合实际；模型、方法、结果要易于理解，便于实际应用；站在应用者的立场上想问题，处理问题。2. 数学建模用数学方法解决问题，要有数学模型；问题模型的数学抽象，方法有普适性、科学性，不局限于本具体问题的解决。3. 创新意识建模有特点，更加合理、科学、有效、符合实际；更有普遍应用意义；不单纯为创新而创新。

运动目标检测论文总结

一、图片输入层面基于以上结论，采用多尺度训练过程中，要在避免那些极小的和极大的（多尺度后）带来的不好的影响时，考虑保证目标有足够的多样性。所以在进行多尺度训练过程中，将每种输入尺度下，不满足要求的proposal以及anchor忽略。论文中使用了三种尺度如图所示，比一般的多尺度训练的尺度跨度要大。二、 Neck部分（采用金字塔结构改进方案的）一般意义的FPN网络结构是最右边似的结构，而本文中采用的结构则是该方法首先无疑是增加了计算量，优点就是最终输出的每一层的特征不是一个线性的变换（应该想表述的说不是从一层特征直接到另一层特征），而是使用共享的多层特征。最终相比RetinaNet提升一个点左右吧，效果一般。VisDrone2020检测的冠军团队采用了这个结构该文章利用多个TUM模块试图更充分构建的特征金字塔的网络结构，靠前的TUM提供浅层特征，中间的TUM提供中间层特征，靠后的TUM提供深层特征，通过这种方式能够多次将深层浅层特征融合，参数量多了。和RetinaNet对比可以看到，512输入，都不采用multi-scale推理，mAP由33提升到，小目标精度也提升了一点；以参数量和计算量堆砌的精度提升，不是好方法。文章认为不同层的重要程度应该和目标的绝对尺度分布有关系，所以在FPN自上而下融合的时候，加入了一个尺度因子用来平衡金字塔不同层的重要性。个人感觉意义不大，实际提升也不明显。三、 Head部分的改进方案在VisDrones上的冠军方案和若干其他方案都采用了这种“双头部”的方案。soft-NMS似乎可以提升几个点。四、小目标目前检测不好，主要原因不是小，应该是小且和背景接近，对比度不高。所以可以借鉴伪装物体检测的思路；

姓名：刘帆；学号：20021210609；学院：电子工程学院【嵌牛导读】目标跟踪算法研究难点与挑战在于实际复杂的应用环境、背景相似干扰、光照条件的变化、遮挡等外界因素以及目标姿态变化，外观变形，尺度变化、平面外旋转、平面内旋转、出视野、快速运动和运动模糊等。而且当目标跟踪算法投入实际应用时，不可避免的一个问题——实时性问题也是非常的重要。正是有了这些问题，才使得算法研究充满着难点和挑战。【嵌牛鼻子】目标跟踪算法，传统算法【嵌牛提问】利用目标跟踪检测算法要达到何目的?第一阶段的单目标追踪算法包括什么?具体步骤有哪些?它们有何特点? 【嵌牛正文】第一阶段目标跟踪分为两个部分，一个是对指定目标寻找可以跟踪的特征，常用的有颜色，轮廓，特征点，轨迹等，另一个是对目标特征进行跟踪。 1、静态背景 1）背景差：对背景的光照变化、噪声干扰以及周期性运动等进行建模。通过当前帧减去背景图来捕获运动物体的过程。 2）帧差：由于场景中的目标在运动，目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧或三帧图像进行差分运算，不同帧对应的像素点相减，判断灰度差的绝对值，当绝对值超过一定阈值时，即可判断为运动目标，从而实现目标的检测功能。与二帧差分法不同的是，三帧差分法（交并运算）去除了重影现象，可以检测出较为完整的物体。帧间差分法的原理简单，计算量小，能够快速检测出场景中的运动目标。但帧间差分法检测的目标不完整，内部含有“空洞”，这是因为运动目标在相邻帧之间的位置变化缓慢，目标内部在不同帧图像中相重叠的部分很难检测出来。帧间差分法通常不单独用在目标检测中，往往与其它的检测算法结合使用。 3）Codebook 算法为图像中每一个像素点建立一个码本，每个码本可以包括多个码元（对应阈值范围），在学习阶段，对当前像素点进行匹配，如果该像素值在某个码元的学习阈值内，也就是说与之前出现过的某种历史情况偏离不大，则认为该像素点符合背景特征，需要更新对应点的学习阈值和检测阈值。如果新来的像素值与每个码元都不匹配，则可能是由于动态背景导致，这种情况下，我们需要为其建立一个新的码元。每个像素点通过对应多个码元，来适应复杂的动态背景。在应用时，每隔一段时间选择K帧通过更新算法建立CodeBook背景模型，并且删除超过一段时间未使用的码元。 4）GMM 混合高斯模型（Gaussian of Micture Models，GMM）是较常用的背景去除方法之一（其他的还有均值法、中值法、滑动平均滤波等）。首先我们需要了解单核高斯滤波的算法步骤：混合高斯建模GMM（Gaussian Mixture Model）作为单核高斯背景建模的扩展，是目前使用最广泛的一种方法，GMM将背景模型描述为多个分布，每个像素的R、G、B三个通道像素值的变化分别由一个混合高斯模型分布来刻画，符合其中一个分布模型的像素即为背景像素。作为最常用的一种背景建模方法，GMM有很多改进版本，比如利用纹理复杂度来更新差分阈值，通过像素变化的剧烈程度来动态调整学习率等。 5）ViBe（2011） ViBe算法主要特点是随机背景更新策略，这和GMM有很大不同。其步骤和GMM类似。具体的思想就是为每个像素点存储了一个样本集，样本集中采样值就是该像素点过去的像素值和其邻居点的像素值，然后将每一个新的像素值和样本集进行比较来判断是否属于背景点。其中pt（x）为新帧的像素值，R为设定值，p1、p2、p3….为样本集中的像素值，以pt（x）为圆心R为半径的圆被认为成一个集，当样本集与此集的交集大于设定的阈值#min时，可认为此为背景像素点（交集越大，表示新像素点与样本集越相关）。我们可以通过改变#min的值与R的值来改变模型的灵敏度。 Step1：初始化单帧图像中每个像素点的背景模型。假设每一个像素和其邻域像素的像素值在空域上有相似的分布。基于这种假设，每一个像素模型都可以用其邻域中的像素来表示。为了保证背景模型符合统计学规律，邻域的范围要足够大。当输入第一帧图像时，即t=0时，像素的背景模型。其中，NG（x,y）表示空域上相邻的像素值，f(xi,yi)表示当前点的像素值。在N次的初始化的过程中，NG（x,y）中的像素点(xi,yi)被选中的可能次数为L=1,2,3,…,N。 Step2：对后续的图像序列进行前景目标分割操作。当t=k时，像素点(x,y)的背景模型为BKm(x,y)，像素值为fk(x,y)。按照下面判断该像素值是否为前景。这里上标r是随机选的；T是预先设置好的阈值。当fk(x,y)满足符合背景#N次时，我们认为像素点fk(x,y)为背景，否则为前景。 Step3：ViBe算法的更新在时间和空间上都具有随机性。每一个背景点有1/ φ的概率去更新自己的模型样本值，同时也有1/ φ的概率去更新它的邻居点的模型样本值。更新邻居的样本值利用了像素值的空间传播特性，背景模型逐渐向外扩散，这也有利于Ghost区域的更快的识别。同时当前景点计数达到临界值时将其变为背景，并有1/ φ的概率去更新自己的模型样本值（为了减少缓慢移动物体的影响和摄像机的抖动）。可以有如下总结，ViBe中的每一个像素点在更新的时候都有一个时间和空间上随机影响的范围，这个范围很小，大概3x3的样子，这个是考虑到摄像头抖动时会有坐标的轻微来回变化，这样虽然由于ViBe的判别方式仍认为是背景点，但是也会对后面的判别产生影响，为了保证空间的连续性，随机更新减少了这个影响。而在样本值保留在样本集中的概率随着时间的增大而变小，这就保证了像素模型在时间上面的延续特性。 6）光流光流是由物体或相机的运动引起的图像对象在两个连续帧之间的视在运动模式。它是2D矢量场，其中每个矢量是一个位移矢量，显示点从第一帧到第二帧的移动。光流实际上是一种特征点跟踪方法，其计算的为向量，基于三点假设： 1、场景中目标的像素在帧间运动时亮度（像素值或其衍生值）不发生变化；2、帧间位移不能太大；3、同一表面上的邻近点都在做相同的运动；光流跟踪过程：1）对一个连续视频帧序列进行处理；2）对每一帧进行前景目标检测；3）对某一帧出现的前景目标，找出具有代表性的特征点（Harris角点）；4）对于前后帧做像素值比较，寻找上一帧在当前帧中的最佳位置，从而得到前景目标在当前帧中的位置信息；5）重复上述步骤，即可实现目标跟踪 2、运动场（分为相机固定，但是视角变化和相机是运动的） 1）运动建模（如视觉里程计运动模型、速度运动模型等）运动学是对进行刚性位移的相机进行构型，一般通过6个变量来描述，3个直角坐标，3个欧拉角（横滚、俯仰、偏航）。 Ⅰ、对相机的运动建模由于这个不是我们本次所要讨论的重点，但是在《概率机器人》一书中提出了很多很好的方法，相机的运动需要对图像内的像素做位移矩阵和旋转矩阵的坐标换算。除了对相机建立传统的速度运动模型外，也可以用视觉里程计等通关过置信度的更新来得到概率最大位置。 Ⅱ、对于跟踪目标的运动建模该方法需要提前通过先验知识知道所跟踪的目标对象是什么，比如车辆、行人、人脸等。通过对要跟踪的目标进行建模，然后再利用该模型来进行实际的跟踪。该方法必须提前知道要跟踪的目标对象是什么，然后再去跟踪指定的目标，这是它的局限性，因而其推广性相对比较差。（比如已知跟踪的物体是羽毛球，那很容易通过前几帧的取点，来建立整个羽毛球运动的抛物线模型） 2）核心搜索算法（常见的预测算法有Kalman(卡尔曼)滤波、扩展卡尔曼滤波、粒子滤波） Ⅰ、Kalman 滤波 Kalman滤波器是通过前一状态预测当前状态，并使用当前观测状态进行校正，从而保证输出状态平稳变化，可有效抵抗观测误差。因此在运动目标跟踪中也被广泛使用。在视频处理的运动目标跟踪里，每个目标的状态可表示为(x,y,w,h)，x和y表示目标位置，w和h表示目标宽高。一般地认为目标的宽高是不变的，而其运动速度是匀速，那么目标的状态向量就应该扩展为(x,y,w,h,dx,dy)，其中dx和dy是目标当前时刻的速度。通过kalman滤波器来估计每个时刻目标状态的大致过程为：对视频进行运动目标检测，通过简单匹配方法来给出目标的第一个和第二个状态，从第三个状态开始，就先使用kalman滤波器预测出当前状态，再用当前帧图像的检测结果作为观测值输入给kalman滤波器，得到的校正结果就被认为是目标在当前帧的真实状态。(其中，Zt为测量值，为预测值，ut为控制量，Kt为增益。) Ⅱ、扩展卡尔曼滤波（EKF）和无迹卡尔曼滤波（UKF）由于卡尔曼滤波的假设为线性问题，无法直接用在非线性问题上，EKF和UKF解决了这个问题（这个线性问题体现在用测量量来计算预测量的过程中）。EKF是通过构建线性函数g(x)，与非线性函数相切，并对每一时刻所求得的g（x）做KF，如下图所示。 UKF与EKF去求解雅可比矩阵拟合线性方程的方法不同，通过对那个先验分布中的采集点，来线性化随机变量的非线性函数。与EKF所用的方法不同，UKF产生的高斯分布和实际高斯分布更加接近，其引起的近似误差也更小。 Ⅲ、粒子滤波 1、初始状态：基于粒子滤波的目标追踪方法是一种生成式跟踪方法，所以要有一个初始化的阶段。对于第一帧图像，人工标定出待检测的目标，对该目标区域提出特征； 2、搜索阶段：现在已经知道了目标的特征，然后就在目标的周围撒点(particle), 如：a)均匀的撒点;b)按高斯分布撒点，就是近的地方撒得多，远的地方撒的少。论文里使用的是后一种方法。每一个粒子都计算所在区域内的颜色直方图，如初始化提取特征一样，然后对所有的相似度进行归一化。文中相似性使用的是巴氏距离； 3、重采样：根据粒子权重对粒子进行筛选，筛选过程中，既要大量保留权重大的粒子，又要有一小部分权重小的粒子； 4、状态转移：将重采样后的粒子带入状态转移方程得到新的预测粒子； 5、测量及更新：对目标点特征化，并计算各个粒子和目标间的巴氏距离，更新粒子的权重； 6、决策阶段：每个粒子都获得一个和目标的相似度，相似度越高，目标在该范围出现的可能性越高，将保留的所有粒子通过相似度加权后的结果作为目标可能的位置。 3）Meanshift算法 MeanShift算法属于核密度估计法，它不需要任何先验知识而完全依靠特征空间中样本点的计算其密度函数值。对于一组采样数据，直方图法通常把数据的值域分成若干相等的区间，数据按区间分成若干组，每组数据的个数与总参数个数的比率就是每个单元的概率值；核密度估计法的原理相似于直方图法，只是多了一个用于平滑数据的核函数。采用核函数估计法，在采样充分的情况下，能够渐进地收敛于任意的密度函数，即可以对服从任何分布的数据进行密度估计。 Meanshift算法步骤 1、通过对初始点（或者上一帧的目标点）为圆心，绘制一个半径为R的圆心，寻找特征和该点相似的点所构成的向量； 2、所有向量相加，可以获得一个向量叠加，这个向量指向特征点多的方向； 3、取步骤二的向量终点为初始点重复步骤一、二，直到得到的向量小于一定的阈值，也就是说明当前位置是特征点密度最密集的地方，停止迭代，认为该点为当前帧的目标点； 4）Camshift算法 Camshift算法是MeanShift算法的改进，称为连续自适应的MeanShift算法。Camshift 是由Meanshift 推导而来 Meanshift主要是用在单张影像上，但是独立一张影像分析对追踪而言并无意义，Camshift 就是利用MeanShift的方法，对影像串列进行分析。 1、首先在影像串列中选择目标区域。 2、计算此区域的颜色直方图（特征提取）。 3、用MeanShift演算法来收敛欲追踪的区域。 4、通过目标点的位置和向量信息计算新的窗口大小，并标示之。 5、以此为参数重复步骤三、四。 Camshift 关键就在于当目标的大小发生改变的时候，此算法可以自适应调整目标区域继续跟踪。 3、小结第一阶段的单目标追踪算法基本上都是传统方法，计算量小，在嵌入式等设备中落地较多，opencv中也预留了大量的接口。通过上面的两节的介绍，我们不难发现，目标检测算法的步骤分为两部分，一部分是对指定目标寻找可以跟踪的特征，常用的有颜色，轮廓，特征点，轨迹等，另一部分是对目标特征进行跟踪，如上文所提及的方法。所以目标检测方法的发展，也可总结为两个方面，一个是如何去获得更加具有区分性的可跟踪的稳定特征，另一个是如何建立帧与帧之间的数据关联，保证跟踪目标是正确的。随着以概率为基础的卡尔曼滤波、粒子滤波或是以Meanshift为代表向量叠加方法在目标检测的运用，使得目标检测不再需要假设自身的一个状态为静止的，而是可以是运动的，更加符合复杂场景中的目标跟踪。

能不能给我发一份呢？

索引序列
移动目标检测论文
格子达移动端论文检测
运动目标检测论文免费
运动目标检测数模论文
运动目标检测论文总结
返回顶部

移动目标检测论文