图像识别狗分类毕业论文

6个回答默认排序

默认排序

按时间排序

baby梓瑜

已采纳

图像分类是计算机视觉中最基础的任务，其中可以分为跨物种语义级别的图像分类，子类细粒度图像分类，以及实例级图像分类三大类别。在不同物种的层次上识别不同类别的对象，例如猫狗分类，这样的分类任务的特征是，较大的类间方差，较小的类内方差，例如典型的cifar10是在交通工具以及动物内部进行区分，都是语义上完全可以区分开的对象细粒度图像分类，是一个大类中的子类的分类，例如不同鸟类的分类，不同狗类的分类，不同车型的分类等等。例如Caltech-UCSD Birds-200-2011数据集，他是包含200类，11788张图像的鸟类书籍，为每一张图提供了15哥局部区域位置，1个标注框。这种细粒度级别的检测需要更为精细的分类器设计如果我们需要区分不同的个体，不仅仅是物种类别或者子类，其就是一个识别问题，例如最典型的任务就是人脸识别。人脸识别对于计算机视觉领域落地是十分有意义的，它能够完成很多任务，例如安全维稳，考勤打卡，人脸解锁等应用场景都是和人脸识别这个实例级图像分类任务密切相关的。 MNIST数据集在当时是一个baseline，其包含60000个训练数据，10000个测试数据，图像均为灰度图像，大小为32*32。在这个数据集中，其实传统方法表现的也不错，例如SVM以及KNN，SVM为代表的方法可以将MNIST分类错误率降低到, 超过当时的人工神经网络。后来经过多次迭代，LeNet5在1998年诞生，这是一个经典的卷积神经网络，饱含着一些重要的特性：虽然LeNet5的错误率在左右，不如SVM方法，但随着网络结构的发展，神经网络方法很快的超过了其他的所有方法，有着很好的效果。为了在工业界落地更加复杂的图像分类任务，李飞飞等人数年时间的整理下，2009年，ImageNet数据集发布了。ImageNet数据集共有1400多万张图片，共有2万多个类别，不过论文中常用的都是1000类的基准。 AlexNet在2012年时横空出世，是第一个真正意义上的深度网络，与LeNet5的5层相比，它的层数增加了3层，网络的参数量也大大增加，输入也从28变成了224，同时GPU的面世，也使得深度学习从此进行GPU为王的训练时代。 AlexNet有以下的特点： VGGNet探索了卷积神经网络的深度与其性能之间的关系，成功地构筑了16~19层深的卷积神经网络，证明了增加网络的深度能够在一定程度上影响网络最终的性能，使错误率大幅下降，同时拓展性又很强，迁移到其它图片数据上的泛化性也非常好。到目前为止，VGG仍然被用来提取图像特征。 VGGNet可以看成是加深版本的AlexNet，都是由卷积层、全连接层两大部分构成.全部使用3×3的卷积核和2×2的最大池化核，简化了卷积神经网络的结构。VGGNet很好的展示了如何在先前网络架构的基础上通过简单地增加网络层数和深度就可以提高网络的性能。虽然简单，但是却异常的有效，在今天，VGGNet仍然被很多的任务选为基准模型。 GoogLeNet也是将网络层次加深了，不过GoogLeNet做了更加大胆的网络结构的尝试，其深度只有22层，从参数数量来看，GoogleNet参数为500万个，AlexNet参数个数是GoogleNet的12倍，VGGNet参数又是AlexNet的3倍，因此在内存或计算资源有限时，GoogleNet是比较好的选择；但是从模型结果来看，GoogLeNet的性能却更加优越。一般来说，提升网络性能最直接的办法就是增加网络深度和宽度，深度指网络层次数量、宽度指神经元数量。但这种方式存在以下问题：（1）参数太多，如果训练数据集有限，很容易产生过拟合；（2）网络越大、参数越多，计算复杂度越大，难以应用；（3）网络越深，容易出现梯度弥散问题（梯度越往后穿越容易消失），难以优化模型。解决这些问题的方法当然就是在增加网络深度和宽度的同时减少参数，为了减少参数，自然就想到将全连接变成稀疏连接。但是在实现上，全连接变成稀疏连接后实际计算量并不会有质的提升，因为大部分硬件是针对密集矩阵计算优化的，稀疏矩阵虽然数据量少，但是计算所消耗的时间却很难减少。比较通用的方法是使用dropout的方法，相当于从原始的网络中找到一个更”瘦“的网络(有待考究) GoogLeNet团队提出了Inception网络结构，就是构造一种“基础神经元”结构，来搭建一个稀疏性、高计算性能的网络结构。什么是Inception呢？Inception历经了V1、V2、V3、V4等多个版本的发展，不断趋于完善，下面一一进行介绍通过设计一个稀疏网络结构，但是能够产生稠密的数据，既能增加神经网络表现，又能保证计算资源的使用效率。谷歌提出了最原始Inception的基本结构：该结构将CNN中常用的卷积（1x1，3x3，5x5）、池化操作（3x3）堆叠在一起（卷积、池化后的尺寸相同，将通道相加），一方面增加了网络的宽度，另一方面也增加了网络对尺度的适应性。网络卷积层中的网络能够提取输入的每一个细节信息，同时5x5的滤波器也能够覆盖大部分接受层的的输入。还可以进行一个池化操作，以减少空间大小，降低过度拟合。在这些层之上，在每一个卷积层后都要做一个ReLU操作，以增加网络的非线性特征然而这个Inception原始版本，所有的卷积核都在上一层的所有输出上来做，而那个5x5的卷积核所需的计算量就太大了，造成了特征图的厚度很大，为了避免这种情况，在3x3前、5x5前、max pooling后分别加上了1x1的卷积核，以起到了降低特征图厚度的作用，这也就形成了Inception v1的网络结构对上图说明如下：（1）GoogLeNet采用了模块化的结构（Inception结构），方便增添和修改；（2）网络最后采用了average pooling（平均池化）来代替全连接层，该想法来自NIN（Network in Network），事实证明这样可以将准确率提高。但是，实际在最后还是加了一个全连接层，主要是为了方便对输出进行灵活调整；（3）虽然移除了全连接，但是网络中依然使用了Dropout ; （4）为了避免梯度消失，网络额外增加了2个辅助的softmax用于向前传导梯度（辅助分类器）。辅助分类器是将中间某一层的输出用作分类，并按一个较小的权重（）加到最终分类结果中，这样相当于做了模型融合，同时给网络增加了反向传播的梯度信号，也提供了额外的正则化，对于整个网络的训练很有裨益。而在实际测试的时候，这两个额外的softmax会被去掉。 Inception V2版本的解决方案就是修改Inception的内部计算逻辑，提出了比较特殊的“卷积”计算结构。卷积分解(Factorizing Convolutions) GoogLeNet团队提出可以用2个连续的3x3卷积层组成的小网络来代替单个的5x5卷积层，即在保持感受野范围的同时又减少了参数量降低特征图大小如果想让图像缩小，可以有如下两种方式：先池化再作Inception卷积，或者先作Inception卷积再作池化。但是方法一（左图）先作pooling（池化）会导致特征表示遇到瓶颈（特征缺失），方法二（右图）是正常的缩小，但计算量很大。为了同时保持特征表示且降低计算量，将网络结构改为下图，使用两个并行化的模块来降低计算量（卷积、池化并行执行，再进行合并）使用Inception V2作改进版的GoogLeNet，网络结构图如下： Inception V3一个最重要的改进是分解（Factorization），将7x7分解成两个一维的卷积（1x7,7x1），3x3也是一样（1x3,3x1），这样的好处，既可以加速计算，又可以将1个卷积拆成2个卷积，使得网络深度进一步增加，增加了网络的非线性（每增加一层都要进行ReLU）。 Inception V4主要利用残差连接（Residual Connection）来改进V3结构，得到Inception-ResNet-v1，Inception-ResNet-v2，Inception-v4网络。

339 评论 2小时前发布

无敌花花Nancy

哇塞~~我的毕设题目是神经网络在图像处理中的应用研究。。。咱俩差不多呀~~我给你留消息了，加QQ吧~~

127 评论 3小时前发布

画布大小

你的论文准备往什么方向写，选题老师审核通过了没，有没有列个大纲让老师看一下写作方向？老师有没有和你说论文往哪个方向写比较好？写论文之前，一定要写个大纲，这样老师，好确定了框架，避免以后论文修改过程中出现大改的情况！！学校的格式要求、写作规范要注意，否则很可能发回来重新改，你要还有什么不明白或不懂可以问我，希望你能够顺利毕业，迈向新的人生。（一）选题毕业论文（设计）题目应符合本专业的培养目标和教学要求，具有综合性和创新性。本科生要根据自己的实际情况和专业特长，选择适当的论文题目，但所写论文要与本专业所学课程有关。（二）查阅资料、列出论文提纲题目选定后，要在指导教师指导下开展调研和进行实验，搜集、查阅有关资料，进行加工、提炼，然后列出详细的写作提纲。（三）完成初稿根据所列提纲，按指导教师的意见认真完成初稿。（四）定稿初稿须经指导教师审阅，并按其意见和要求进行修改，然后定稿。一般毕业论文题目的选择最好不要太泛，越具体越好，而且老师希望学生能结合自己学过的知识对问题进行分析和解决。不知道你是否确定了选题，确定选题了接下来你需要根据选题去查阅前辈们的相关论文，看看人家是怎么规划论文整体框架的；其次就是需要自己动手收集资料了，进而整理和分析资料得出自己的论文框架；最后就是按照框架去组织论文了。你如果需要什么参考资料和范文我可以提供给你。还有什么不了解的可以直接问我，希望可以帮到你，祝写作过程顺利毕业论文选题的方法: 一、尽快确定毕业论文的选题方向在毕业论文工作布置后,每个人都应遵循选题的基本原则,在较短的时间内把选题的方向确定下来。从毕业论文题目的性质来看,基本上可以分为两大类:一类是社会主义现代化建设实践中提出的理论和实际问题;另一类是专业学科本身发展中存在的基本范畴和基本理论问题。大学生应根据自己的志趣和爱好,尽快从上述两大类中确定一个方向。二、在初步调查研究的基础上选定毕业论文的具体题目在选题的方向确定以后,还要经过一定的调查和研究,来进一步确定选题的范围,以至最后选定具体题目。下面介绍两种常见的选题方法。浏览捕捉法 :这种方法就是通过对占有的文献资料快速地、大量地阅读,在比较中来确定论文题目地方法。浏览,一般是在资料占有达到一定数量时集中一段时间进行,这样便于对资料作集中的比较和鉴别。浏览的目的是在咀嚼消化已有资料的过程中,提出问题,寻找自己的研究课题。这就需要对收集到的材料作一全面的阅读研究,主要的、次要的、不同角度的、不同观点的都应了解,不能看了一些资料,有了一点看法,就到此为止,急于动笔。也不能“先入为主”,以自己头脑中原有的观点或看了第一篇资料后得到的看法去决定取舍。而应冷静地、客观地对所有资料作认真的分析思考。在浩如烟海,内容丰富的资料中吸取营养,反复思考琢磨许多时候之后,必然会有所发现,这是搞科学研究的人时常会碰到的情形。浏览捕捉法一般可按以下步骤进行: 第一步,广泛地浏览资料。在浏览中要注意勤作笔录,随时记下资料的纲目,记下资料中对自己影响最深刻的观点、论据、论证方法等,记下脑海中涌现的点滴体会。当然,手抄笔录并不等于有言必录,有文必录,而是要做细心的选择,有目的、有重点地摘录,当详则详,当略则略,一些相同的或类似的观点和材料则不必重复摘录,只需记下资料来源及页码就行,以避免浪费时间和精力。第二步,是将阅读所得到的方方面面的内容,进行分类、排列、组合,从中寻找问题、发现问题,材料可按纲目分类,如分成: 系统介绍有关问题研究发展概况的资料; 对某一个问题研究情况的资料; 对同一问题几种不同观点的资料; 对某一问题研究最新的资料和成果等等。第三步,将自己在研究中的体会与资料分别加以比较,找出哪些体会在资料中没有或部分没有;哪些体会虽然资料已有,但自己对此有不同看法;哪些体会和资料是基本一致的;哪些体会是在资料基础上的深化和发挥等等。经过几番深思熟虑的思考过程,就容易萌生自己的想法。把这种想法及时捕捉住,再作进一步的思考,选题的目标也就会渐渐明确起来。

347 评论 11小时前发布

坚吃不懈1208

我简单说一下，举个例子，比如说我们现在搭建一个识别苹果和橘子的网络模型：我们现在得需要两组数据，一组表示特征值，就是网络的输入（p），另一组是导师信号，告诉网络是橘子还是苹果（网络输出t）：我们的样本这样子假设（就是）：p t1 0 3 12 1 4 2这两组数据是这样子解释的：我们假设通过3个特征来识别一个水果是橘子还是苹果：形状，颜色，味道，第一组形状、颜色、味道分别为：1 0 3（当然这些数都是我随便乱编的，这个可以根据实际情况自己定义），有如上特征的水果就是苹果（t为1），而形状、颜色、味道为：2 1 4的表示这是一个橘子（t为2）。好了，我们的网络模型差不多出来了，输入层节点数为3个（形状、颜色，味道），输出层节点为一个（1为苹果2为橘子），隐藏层我们设为一层，节点数先不管，因为这是一个经验值，还有另外的一些参数值可以在matlab里设定，比如训练函数，训练次数之类，我们现在开始训练网络了，首先要初始化权值，输入第一组输入：1 0 3 ,网络会输出一个值，我们假设为4，那么根据导师信号（正确的导师信号为1，表示这是一个苹果）计算误差4-1=3，误差传给bp神经网络，神经网络根据误差调整权值，然后进入第二轮循环，那么我们再次输入一组数据：2 0 4（当仍然你可以还输入1 0 3，而且如果你一直输入苹果的特征，这样子会让网络只识别苹果而不会识别橘子了，这回明白你的问题所在了吧），同理输出一个值，再次反馈给网络，这就是神经网络训练的基本流程，当然这两组数据肯定不够了，如果数据足够多，我们会让神经网络的权值调整到一个非常理想的状态，是什么状态呢，就是网络再次输出后误差很小，而且小于我们要求的那个误差值。接下来就要进行仿真预测了t_1=sim(net,p)，net就是你建立的那个网络，p是输入数据，由于网络的权值已经确定了，我们这时候就不需要知道t的值了，也就是说不需要知道他是苹果还是橘子了，而t_1就是网络预测的数据，它可能是1或者是2，也有可能是，之类的数（绝大部分都是这种数），那么你就看这个数十接近1还是2了，如果是，我们就认为他是苹果和橘子的杂交，呵呵，开玩笑的，遇到x<=0,5、x=、x>=，我一般都是舍弃的，表示未知。总之就是你需要找本资料系统的看下，鉴于我也是做图像处理的，我给你个关键的提醒，用神经网络做图像处理的话必须有好的样本空间，就是你的数据库必须是标准的。至于网络的机理，训练的方法什么的，找及个例子用matlab仿真下，看看效果，自己琢磨去吧，这里面主要是你隐含层的设置，训练函数选择及其收敛速度以及误差精度就是神经网络的真谛了，想在这么小的空间给你介绍清楚是不可能的，关键是样本，提取的图像特征必须带有相关性，这样设置的各个阈值才有效。OK，好好学习吧，资料去matlab中文论坛上找，在不行就去baudu文库上，你又不需要都用到，何必看一本书呢！祝你顺利毕业！

83 评论 11小时前发布

德古拉之吻~

基于Python的SIFT和KCF的运动目标匹配与跟踪毕业论文+项目源码基于Python决策树算法的学生学习行为数据分析设计报告+代码及数据基于Sring+bootstrap+MySQL的住房公积金管理系统课程报告+项目源码及数据库文件基于C++的即时通信软件设计毕业论文+项目源码

153 评论 12小时前发布

多多吃多多评价

首先要看下神经网络方面的书，模式识别相关的书一般都会讲到神经网络的，也有专门讲神经网络的书。个人认为，神经网络用于图像识别的话，应该是对图像分类，首先从图像样本中提取特征量（多个特征量组成矢量），然后用神经网络相关的matlab函数直接，对样本特征量进行训练和测试，欢迎交流！

173 评论 12小时前发布

图像识别狗分类毕业论文

6个回答 默认排序 默认排序 按时间排序

相关问答

毕业论文

向你推荐

热门问题

6个回答默认排序

默认排序

按时间排序