深度学习研究的论文

发布时间：2023-12-09 06:48:20

深度学习研究的论文

硕士深度学习毕业论文难吗深度学习毕业论文难度取决于学生的技术能力，以及论文的难度。如果学生具有良好的技术能力，并且清楚论文的要求，深度学习毕业论文并不是很难，只要把握好时间，可以顺利完成。但如果学生技术能力不足，或缺乏全面的理解，深度学习毕业论文则比较难以完成，需要更多的时间以及精力去完成。总之，深度学习毕业论文的难度取决于学生的技术能力以及论文的难度。

被誉为深度学习的顶级论文首先，这个来头不小，由位列深度学习三大巨头之二的 Yoshua Bengio 和 Yann LeCun 牵头创办。Yoshua Bengio 是蒙特利尔大学教授，深度学习三巨头之一，他领导蒙特利尔大学的人工智能实验室（MILA）进行 AI 技术的学术研究。MILA 是世界上最大的人工智能研究中心之一，与谷歌也有着密切的合作。而 Yann LeCun 就自不用提，同为深度学习三巨头之一的他现任 Facebook 人工智能研究院（FAIR）院长、纽约大学教授。作为卷积神经网络之父，他为深度学习的发展和创新作出了重要贡献。至于创办 ICLR 的原因何在，雷锋网尝试从 Bengio 和 LeCun 于 ICLR 第一届官网所发布的公开信推测一二。

1.《基于深度学习的自然语言处理技术研究》2.《基于深度学习的计算机视觉技术研究》3.《基于深度学习的语音识别技术研究》4.《基于深度学习的机器翻译技术研究》5.《基于深度学习的自动驾驶技术研究》6.《基于深度学习的智能家居技术研究》7.《基于深度学习的智能机器人技术研究》8.《基于深度学习的智能推荐系统技术研究》9.《基于深度学习的自然语言理解技术研究》10.《基于深度学习的智能安全技术研究》

沈雨娇为我院2012级英语专业本科学生，2017年考上上海外国语大学英语语言文学专业研究生，研究方向为跨文化交际，师从上外跨文化中心主任顾力行教授（Steve J. Kulich）和复旦大学人类社会学博士张晓佳老师。2021年1月获得日本早稻田大学的博士录取通知书，6月获得国家留学基金委员会公派奖学金，将于2022年4月赴日进行为期三年的博士学习，专业为国际文化与交流，研究方向为视觉文化，师从早稻田大学国际文化与交流学院主任吉本光弘教授。

深度学习研究论文

深度学习论文投稿需要提供实验数据。论文是需要实验数据作为基础的，论文的一切实验数据都必须是真实的，否则没有意义。

硕士深度学习毕业论文难吗深度学习毕业论文难度不一，取决于论文的选题、论文的内容、论文的技术要求、导师的要求等。因此，深度学习毕业论文的难度可能会有所不同，但一般来说，深度学习毕业论文的难度较高，因为需要深入研究论文的技术细节，同时也要充分利用所学的知识和技能。因此，深度学习毕业论文的难度较高，需要充分利用学习的时间，深入研究相关技术，做好论文准备工作，才能取得好的成绩。

在学术界中，诚实和透明是非常重要的，因此大部分深度学习论文的实验数据都应该是真实可靠的。为了确保数据的真实性，研究人员应该遵循一系列共同约定的实践，比如采用一些常见的数据集，如MNIST、CIFAR、ImageNet等，或者充分公开数据集来源和预处理方法，在论文中详细描述实验步骤和参数设置，并允许其他人重复实验来验证其结果。而这些步骤在学术界中也经常被称为“实验复现”。但是，也存在一些在实验数据上作弊或篡改数据的行为。一些研究人员可能会使用实验结果的最佳情况，而隐藏失败的实验结果，或者通过微调模型或其他方式来优化结果。这种行为是不道德的，也违反了学术界的伦理道德。总的来说，在学术界中，大部分深度学习论文的实验数据都是真实可靠的，但仍需保持警惕，判断这些数据的可靠性需要综合考虑多种因素。

深度学习论文期刊

可以。期刊可以发表的内容有很多，相似的也是正常现象，只要审核通过，是可以发布的。期刊，定期出版的刊物。

有。有水刊。

深度学习目标检测论文

【嵌牛导读】目标检测在现实中的应用很广泛，我们需要检测数字图像中的物体位置以及类别，它需要我们构建一个模型，模型的输入一张图片，模型的输出需要圈出图片中所有物体的位置以及物体所属的类别。在深度学习浪潮到来之前，目标检测精度的进步十分缓慢，靠传统依靠手工特征的方法来提高精度已是相当困难的事。而ImageNet分类大赛出现的卷积神经网络（CNN）——AlexNet所展现的强大性能，吸引着学者们将CNN迁移到了其他的任务，这也包括着目标检测任务，近年来，出现了很多目标检测算法。【嵌牛鼻子】计算机视觉【嵌牛提问】如何理解目标检测算法——OverFeat 【嵌牛正文】一、深度学习的典型目标检测算法深度学习目标检测算法主要分为双阶段检测算法和单阶段检测算法，如图1所示。双阶段目标检测算法先对图像提取候选框，然后基于候选区域做二次修正得到检测结果，检测精度较高，但检测速度较慢;单阶段目标验测算法直接对图像进行计算生成检测结果，检测速度快,但检测精度低。 1、双阶段目标检测算法双阶段目标检测方法主要通过选择性搜索（Selective Search）或者Edge Boxes等算法对输入图像选取可能包含检测目标的候选区域（Region Proposal），再对候选区域进行分类和位置回归以得到检测结果。 OverFeat 算法《OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks》 Sermanet 等改进AlexNet 提出 OverFeat 算法。该算法结合AlexNet通过多尺度滑动窗口实现特征提取功能，并且共享特征提取层，应用于图像分类、定位和目标检测等任务。关键技术： 1、FCN（全卷积神经网络）对于一个各层参数结构都设计好的网络模型，要求输入图片的尺寸是固定的（例如，Alexnet要求输入图片的尺寸为227px*227px）。如果输入一张500*500的图片，希望模型仍然可以一直前向传导，即一个已经设计完毕的网络，可以输入任意大小的图片，这就是FCN。 FCN的思想在于： 1、从卷积层到全连接层，看成是对一整张图片的卷积层运算。 2、从全连接层到全连接层，看成是采用1*1大小的卷积核，进行卷积层运算。如上图所示，绿色部分代表卷积核大小。假设一个CNN模型，其输入图片大小是14*14，通过第一层卷积后得到10*10大小的图片，然后接着通过池化得到了5*5大小的图片。像但是对于像素值为5*5的图片到像素值为1*1的图片的过程中：（1）传统的CNN：如果从以前的角度进行理解的话，那么这个过程就是全连接层，我们会把这个5*5大小的图片，展平成为一维向量进行计算。（2）FCN：FCN并不是把5*5的图片展平成一维向量再进行计算，而是直接采用5*5的卷积核，对一整张图片进行卷积运算。二者本质上是相同的，只是角度不同，FCN把这个过程当成了对一整张特征图进行卷积，同样，后面的全连接层也是把它当做是以1*1大小的卷积核进行卷积运算。当输入一张任意大小的图片，就需要利用以上所述的网络，例如输入一张像素为16*16的图片：根据上图，该网络最后的输出是一张2*2的图片。可见采用FCN网络可以输入任意大小的图片。同时需要注意的是网络最后输出的图片大小不在是一个1*1大小的图片，而是一个与输入图片大小息息相关的一张图片。 Overfeat就是把采用FCN的思想把全连接层看成了卷积层，在网络测试阶段可以输入任意大小的图片。 2、offset max-pooling 简单起见，不用二维的图像作为例子，而是采用一维作为示例：如上图所示，在X轴上有20个神经元，并且选择池化size=3的非重叠池化，那么根据之前所学的方法应该是：对上面的20个神经元，从1位置开始进行分组，每3个连续的神经元为一组，然后计算每组的最大值(最大池化)，19、20号神经元将被丢弃，如下图所示：或者可以在20号神经元后面，添加一个数值为0的神经元编号21，与19、20成为一组，这样可以分成7组:[1,2,3]，[4,5,6]……, [16,17,18],[19,20,21]，最后计算每组的最大值。如果只分6组，除了以1作为初始位置进行连续组合之外，也可以从位置2或者3开始进行组合。也就是说其实有3种池化组合方法： A、△=0分组:[1,2,3]，[4,5,6]……,[16,17,18]； B、△=1分组:[2,3,4]，[5,6,7]……,[17,18,19]； C、△=2分组:[3,4,5]，[6,7,8]……,[18,19,20]；对应图片如下：以往的CNN中，一般只用△=0的情况，得到池化结果后，就送入了下一层。但是该文献的方法是，把上面的△=0、△=1、△=2的三种组合方式的池化结果，分别送入网络的下一层。这样的话，网络在最后输出的时候，就会出现3种预测结果了。前面所述是一维的情况，如果是2维图片的话，那么(△x,△y)就会有9种取值情况(3*3)；如果我们在做图片分类的时候，在网络的某一个池化层加入了这种offset 池化方法，然后把这9种池化结果，分别送入后面的网络层，最后的图片分类输出结果就可以得到9个预测结果(每个类别都可以得到9种概率值，然后我们对每个类别的9种概率，取其最大值，做为此类别的预测概率值)。算法原理：文献中的算法，就是把这两种思想结合起来，形成了文献最后测试阶段的算法。 1、论文的网络架构与训练阶段 (1)网络架构对于网络的结构，文献给出了两个版本——快速版、精确版，一个精度比较高但速度慢；另外一个精度虽然低但是速度快。下面是高精度版本的网络结构表相关参数：表格参数说明：网络输入：图片大小为221px*221px；网络结构方面基本上和AlexNet相同，使用了ReLU激活，最大池化。不同之处在于：(a)作者没有使用局部响应归一化层；(b)然后也没有采用重叠池化的方法；(c)在第一层卷积层，stride作者是选择了2，这个与AlexNet不同（AlexNet选择的跨步是4，在网络中，如果stride选择比较大得话，虽然可以减少网络层数，提高速度，但是却会降低精度）。需要注意的是把f7这一层，看成是卷积核大小为5*5的卷积层，总之就是需要把网络看成前面所述的FCN模型，去除了全连接层的概念，因为在测试阶段可不是仅仅输入221*221这样大小的图片，在测试阶段要输入各种大小的图片，具体请看后面测试阶段的讲解。 (2)网络训练训练输入：对于每张原图片为256*256，然后进行随机裁剪为221*221的大小作为CNN输入，进行训练。优化求解参数设置：训练的min-batchs选择128，权重初始化选择高斯分布的随机初始化：然后采用随机梯度下降法，进行优化更新，动量项参数大小选择，L2权重衰减系数大小选择10-5次方。学习率初始化值为，根据迭代次数的增加，每隔几十次的迭代后，就把学习率的大小减小一半。然后就是DropOut，这个只有在最后的两个全连接层，才采用dropout，dropout比率选择。 2、网络测试阶段在Alexnet的文献中，预测方法是输入一张图片256*256，然后进行multi-view裁剪，也就是从图片的四个角进行裁剪，还有就是一图片的中心进行裁剪，这样可以裁剪到5张224*224的图片。然后把原图片水平翻转一下，再用同样的方式进行裁剪，又可以裁剪到5张图片。把这10张图片作为输入，分别进行预测分类，在后在softmax的最后一层，求取个各类的总概率，求取平均值。然而Alexnet这种预测方法存在两个问题：一方面这样的裁剪方式，把图片的很多区域都给忽略了，这样的裁剪方式，刚好把图片物体的一部分给裁剪掉了；另一方面，裁剪窗口重叠存在很多冗余的计算，像上面要分别把10张图片送入网络，可见测试阶段的计算量还是较大的。 Overfeat算法：训练完上面所说的网络之后，在测试阶段不再是用一张221*221大小的图片了作为网络的输入，而是用了6张大小都不相同的图片，也就是所谓的多尺度输入预测，如下表格所示：当网络前向传导到layer 5的时候，就利用了前面所述的FCN、offset pooling这两种思想的相结合。现以输入一张图片为例(6张图片的计算方法都相同)，讲解layer 5后面的整体过程，具体流程示意图如下：步骤一：对于某个尺度的图片，经过前五层的卷积后得到特征图。上图中特征图的分辨率是20x23，256个通道。步骤二：对于该特征图，重复多次使用非重叠的池化，每次池化的偏置不同，有行偏置和列偏置。上图中偏置池化3次，偏置分别为为(0,1,2)。这就是offset pooling，也被称为fine stride。offset pooling得到的特征图的维度为6x7x3x3xD，其中6x7是特征图的分辨率，3x3是偏置池化的次数，D是通道数。上图中是以1维显示的。步骤三：池化后得到的特征图将被送入分类器。步骤四：分类器的输入是的5x5xD，输出是C(类别数)维向量。但是offset pooling后得到的特征图并不是5x5xD，比如上图中的特征图大小为6x7xD，因此分类器以滑动窗口的方式应用在特征图上，每个滑动窗口经过分类器输出一个C维向量。比如上图中输入的6x7xD的特征图最终得到2x3xC的输出，其中2x3是滑动窗口的个数。步骤五：而2x3xC只是一组偏置池化的输出，总的输出为2x3x3x3xC，将输出的张量reshape，得到6x9xC输出张量。最终输出分类张量为3d张量，即两个分辨率维度 x C维。然后需要在后面把它们拉成一维向量，这样在一个尺度上，可以得到一个C*N个预测值矩阵，每一列就表示图片属于某一类别的概率值，并且求取每一列的最大值，作为本尺度的每个类别的概率值。最后一共用了6种不同尺度(文献使用了12张，另外6张是水平翻转的图片)进行做预测，然后把这六种尺度结果再做一个平均，作为最最后的结果。从上面过程可以看到整个网络分成两部分：layer 1~5这五层称之为特征提取层；layer 6~output称之为分类层。六、定位任务用于定位任务的时候，就把分类层(上面的layer 6~output)给重新设计一下，把分类改成回归问题，然后在各种不同尺度上训练预测物体的bounding box。

目标检测论文整理最近开始看一些object detection的文章，顺便整理一下思路。排版比较乱，而且几乎所有图片都是应用的博客或论文，如有侵权请联系我。文章阅读路线参考目前已完成的文章如下，后续还会继续补充（其中加粗的为精读文章）：RCNNOverfeatMR-CNNSPPNetFast RCNNA Fast RCNNFaster RCNNFPNR-FCNMask RCNNYOLOYOLO 9000YOLO v3SSDDSSDR-SSDRetinaNet（focal loss）DSODCascade R-CNN（待续）吐槽一下，博客园的markdown竟然没有补齐功能，我还是先在本地补全再传上来吧。。。RCNN之前的故事Histogram of Gradient (HOG) 特征在深度学习应用之前，图像的特征是人工定义的具有鲁棒性的特征，如SIFT，HOG等，下面简要介绍一下HOG。8x8像素框内计算方向梯度直方图：HOG Pyramid特征金字塔，对于不同大小的物体进行适应，设计尺度不变性特征HOG特征 -> SVM分类DPM模型 Deformable Part Model加组件组合的HOG特征，组件间计算弹性得分，优化可变形参数如果没有弹性距离，就是BoW (Bag of Word)模型，问题很大，位置全部丢失:n个组件的DPM计算流程:Selective Search 思想过分割后基于颜色纹理等相似度合并,然后，过分割、分层合并、建议区域排序基于Selective Search + DPM/HoG + SVM的物体识别此时的框架就是RCNN的雏形，因为DPM就是基本由RBG和他导师主导，所以大神就是大神。AlexNet的图像分类（深度学习登场）2012年AlexNet赢得LSVRC的ImageNet分类竞赛。深度CNN结构用来图像特征提取。bounding-box regression 框回归BBR 在DPM时代就和SVM分类结合，一般直接使用线性回归，或者和SVR结合RCNN: Rich feature hierarchies for accurate object detection and semantic segmentationRCNN作为深度学习用于目标检测的开山之作，可以看出是基于Selective Search + DPM/HoG + SVM框架，只不过将是将手工特征转变为CNN提取特征，本文主要贡献如下：CNN用于object detection解决数据集不足的问题主要流程如下：regional preposals（selective research）CNN feature extractionSVM ClassificationNMSbounding-box regression（BBR）为啥能work？优秀的目标检测框架，region proposal 和 regression offset降低了目标检测的难度，强大的CNN特征提取器，代替传统的已经到瓶颈的手工特征迁移训练降低了对数据集的要求MR-CNN：Object detection via a multi-region & semantic segmentation-aware CNN modelMulti-Region的提出，开始对Box进一步做文章，相当于对Box进一步做增强，希望改进增强后的效果，主要改善了部分重叠交叉的情况。特征拼接后使得空间变大，再使用SVM处理，效果和R-CNN基本类似.OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks不得不说虽然OverFeat在但是比赛成绩不是太好，但是它的思想还是很有启发性的。OverFeat直接抛弃了Selective Search，采用CNN上slide windows来进行框推荐，并且把Bounding box Regression整合一起使用全连接层搞定，解决了后面一端的问题（取代了SVM分类器和BBR线性回归器），这个思想影响了后来的Fast RCNN。是第一个End to End 的目标检测模型，模型虽然简陋，但是可以验证网络强大的拟合能力注意整合目标检测的各项功能（分类，回归）。亮点：先用CNN得到feature map再做slide windows推荐区域，避免了特征重复计算。设计了End to End模型，方便优化和加快检测速度设计全卷积网络，并进行多尺度图像训练maxpool offset（没有Fast RCNN的ROI Pooling自然）为啥能work？可以看出OverFeat将不同的两个问题物体分类和位置回归采用了两个分支网络，共用前面的CNN特征表述，而CNN提取的特征正如OverFeat所言，是一种类似于SIFT，HOG等人工描述子的一种稳定的描述子（底层抽象），可以用于构建不同的任务（高层表述），也就是模型为什么能work的原因。SPPNetR-CNN和Overfeat都存在部分多尺度，重叠效果的问题。某种意义上，应对了HoG特征，这样对于物体来说类似BoW模型，我们知道DPM里面，是带有组件空间分布的弹性得分的，另外也有HoG Pyramid的思想。如何把Pyramid思想和空间限制得分加入改善多尺度和重叠的效果呢？ MR-CNN里面尝试了区域增强， Overfeat里面尝试了多尺度输入。但是效果都一般。这里我们介绍另外一个技术Spatial Pyramid Matching, SPM，是采用了空间尺度金字塔的特点。和R-CNN相比做到了先特征后区域，和Overfeat相比自带Multi-Scale。SPP pooling layer 的优势：解决了卷积层到全连接层需要固定图片大小的问题，方便多尺度训练。能够对于任意大小的输入产生固定的输出，这样使得一幅图片的多个region proposal提取一次特征成为可能。进一步强调了CNN特征计算前移，区域处理后移的思想，极大节省计算量也能看出文章还是强调用CNN做特征的提取，还是用的BBR和SVM完成回归和分类的问题Fast RCNN可以看出Fast RCNN结合了OverFeat和Sppnet的实现，打通了高层表述和底层特征之间的联系主要流程：任意size图片输入CNN网络，经过若干卷积层与池化层，得到特征图；在任意size图片上采用selective search算法提取约2k个建议框；根据原图中建议框到特征图映射关系，在特征图中找到每个建议框对应的特征框【深度和特征图一致】，并在RoI池化层中将每个特征框池化到H×W【VGG-16网络是7×7】的size；固定H×W【VGG-16网络是7×7】大小的特征框经过全连接层得到固定大小的特征向量；将上一步所得特征向量经由各自的全连接层【由SVD分解实现(全连接层加速)】，分别得到两个输出向量：一个是softmax的分类得分，一个是Bounding-box窗口回归；利用窗口得分分别对每一类物体进行非极大值抑制剔除重叠建议框其中ROI POOL层是将每一个候选框映射到feature map上得到的特征框经池化到固定的大小，其次用了SVD近似求解实现全连接层加速。这里需要注意的一点，作者在文中说道即使进行多尺度训练，map只有微小的提升，scale对Fast RCNN的影响并不是很大，反而在测试时需要构建图像金字塔使得检测效率降低。这也为下一步的多尺度改进埋下了伏笔。为啥能更好的work？也是结合了OverFeat的和SPPnet的work，同时规范了正负样本的判定（之前由于SVM和CNN对区域样本的阈值划分不同而无法统一网络，当然这只是其中的一个原因。更多的估计是作者当时没想到），将网络的特征抽取和分类回归统一到了一个网络中。A Fast RCNN： Hard Positive Generation via Adversary for Object Detection这篇论文是对,CMU与rbg的online hard example mining(OHEM)改进，hard example mining是一个针对目标检测的难例挖掘的过程，这是一个更充分利用数据集的过程。实际上在RCNN训练SVM时就已经用到，但是OHEM强调的是online，即如何在训练过程中选择样本。同期还有S-OHEM的改进。而随着但是GAN的火热，A-Fast-RCNN尝试生成hard example（使用对抗网络生成有遮挡和有形变的两种特征，分别对应网络ASDN和ASTN）结论如下：ASTN 和随机抖动（random jittering）做了对比，发现使用AlexNet，mAP分别是和，使用VGG16，mAP分别是和，ASTN 的表现都比比随机抖动效果好。作者又和OHEM对比，在VOC 2007数据集上，本文方法略好（ vs. ），而在VOC 2012数据集上，OHEM更好（ vs. ）。gan用于目标检测还没有很好的idea，这篇论文相当于抛砖引玉了。同时需要注意的一个问题，网络对于比较多的遮挡和形变情况识别情况更好；但是对于正常目标的特征抽象能力下降，所以有时候创造难例也要注意样本的数量。下面是一些由于遮挡原因造成的误判。Faster RCNN：Towards Real-Time Object Detection with Region Proposal Networks这篇文章标志着two-stage目标检测的相对成熟，其主要改进是对候选区域的改进，将候选区域推荐整合进了网络中。结合后面的一系列文章，可以马后炮一下它的缺点：虽然Faster RCNN已经共享了绝大部分卷积层运算，但是RoI之后还有部分ConvNet的计算，有没有可能把ROI之上的计算进一步前移？请看R-FCNFaster RCNN还是没有很好的解决多尺度问题，如何解决，请看FPNYOLO：You Only Look Once作者的论文简直是一股论文界的泥石流，作者本身是一个喜欢粉红小马的大叔，萌萌哒。实际上YOLO一直发展到v3都是简单粗暴的目标检测方法，虽然学术界模型繁杂多样，但是在实际应用工业应用上YOLO绝对是一个首选的推荐。YOLO v1版本现在看来真是简单粗暴，也印证了网络抽象的强大之处。可以看出作者没有受到太多前辈的影响，将对象检测重新定义为单个回归问题，直接从图像像素到边界框坐标和类概率（当然这也是一个缺少坐标约束也是一个缺点）。YOLO的明显缺点，如多尺度问题，密集物体，检测框耦合，直接回归坐标等在yolo 9000中也做了比较好的改进。SSD：Single Shot MultiBox DetectorSSD作为one stage的代表模型之一，省去了判断推荐候选区域的步骤(实际上可以认为one-stage就是以feature map cell来抽象代替ROI Pooling功能），虽然SSD和Faster RCNN在Anchor box上一脉相承，但是Faster RCNN却还是有一个推荐候选区域（含有物体的区域）的监督部分（注意后面其实也是整合到了最终Loss中），因此one-stage优势是更快，而含有区域推荐的two-stage目前是更加准确一些。（更看好one-stage，其实区域推荐不太符合视觉系统，但是可以简化目标检测问题），主要贡献：用多尺度feature map来预测，也生成了更多的default box检测框对每一类对象产生分数（低耦合，对比yolo）缺点：底层feature map高级语义不足（FPN)正负样本影响 (focal loss)feature map抽象分类和回归任务只用了两个卷积核抽象性不足（DSSD）为啥能更好的工作？SSD的出现对多尺度目标检测有了突破性进展，利用卷积层的天然金字塔形状，设定roi scale让底层学习小物体识别，顶层学习大物体识别FPN：feature pyramid networksSSD网络引入了多尺度feature map，效果显著。那Faster RCNN自然也不能落后，如何在Faster RCNN中引入多尺度呢？自然有FPN结构同时FPN也指出了SSD因为底层语义不足导致无法作为目标检测的feature map注意原图的候选框在Faster RCNN中只固定映射到同一个ROI Pooling中，而现在如果某个anchor和一个给定的ground truth有最高的IOU或者和任意一个Ground truth的IOU都大于，则是正样本。如果一个anchor和任意一个ground truth的IOU都小于，则为负样本。本文算法在小物体检测上的提升是比较明显的，另外作者强调这些实验并没有采用其他的提升方法（比如增加数据集，迭代回归，hard negative mining），因此能达到这样的结果实属不易。DSSD：Deconvolutional Single Shot Detector一个SSD上移植FPN的典型例子，作者主要有一下改动：将FPN的Upsampling变成deconv复杂了高层表述分支（分类，回归）网络的复杂度R-SSD：Enhancement of SSD by concatenating feature maps for object detection本文着重讨论了不同特征图之间的融合对SSD的影响（水论文三大法宝），这篇论文创新点不是太多，就不说了DSOD： Learning Deeply Supervised Object Detectors from Scratch这篇文章的亮点：提出来了不需要预训练的网络模型DSOD实际上是densenet思想+SSD，只不过并不是在base model中采用densenet，而是密集连接提取default dox的层，这样有一个好处：通过更少的连接路径，loss能够更直接的监督前面基础层的优化，这实际上是DSOD能够直接训练也能取得很好效果的最主要原因，另外，SSD和Faster RCNN直接训练无法取得很好的效果果然还是因为网络太深（Loss监督不到）或者网络太复杂。Dense Prediction Structure 也是参考的densenetstem能保留更多的信息，好吧，这也行，但是对效果还是有提升的。YOLO 9000：Better, Faster, Stronger很喜欢这个作者的论文风格，要是大家都这么写也会少一点套路，多一点真诚。。。。文章针对yolo做了较多的实验和改进，简单粗暴的列出每项改进提升的map。这个建议详细的看论文。下面列举几个亮点：如何用结合分类的数据集训练检测的网络来获得更好的鲁棒性将全连接层改为卷积层并结合了细粒度信息（passthrough layer）Multi-Scale TraningDimension Clustersdarknet-19更少的参数Direct locaion prediction对offset进行约束R-FCN：Object Detection via Region-based Fully Convolutional Networks本文提出了一个问题，base CNN网络是为分类而设计的（pooling 实际上是反应了位置的不变性，我一张人脸图片只要存在鼻子，两只眼睛，分类网络就认为它是人脸，这也就是Geoffrey Hinton 在Capsule中吐槽卷积的缺陷），而目标检测则要求对目标的平移做出准确响应。Faster RCNN是通过ROI pooling让其网络学习位置可变得能力的，再次之前的base CNN还是分类的结构，之前讲过R-FCN将Faster RCNN ROI提取出来的部分的卷积计算共享了，那共享的分类和回归功能的卷积一定在划分ROI之前，那么问题来了，如何设计让卷积对位置敏感？主要贡献：将用来回归位置和类别的卷积前置共享计算，提高了速度。巧妙设计score map（feature map）的意义（感觉设计思想和yolo v1最后的全连接层一样），让其何以获得位置信息，之后在经过ROI pooling和vote得到结果为啥能work？实际上rfcn的feature map设计表达目标检测问题的方式更加抽象（ROI pool前的feature map中每一个cell的channel代表定义都很明确），loss在监督该层时更能通过论文中关于ROI pool和vote设计，在不同的channel上获得高的响应，这种设计方式可能更好优化（这个是需要大量的实验得出的结论），至于前面的resnet-base 自然是抽象监督，我们本身是无法理解的，只是作为fintuning。实际上fpn的loss监督也是非常浅和明确的，感觉这种可以理解的优化模块设计比较能work。Focal Loss: Focal Loss for Dense Object Detection这篇文章实际上提供了另外一个角度，之前一直认为Single stage detector结果不够好的原因是使用的feature不够准确（使用一个位置上的feature），所以需要Roi Pooling这样的feature aggregation办法得到更准确的表示。但是这篇文章基本否认了这个观点，提出Single stage detector不好的原因完全在于：极度不平衡的正负样本比例: anchor近似于sliding window的方式会使正负样本接近1000：1，而且绝大部分负样本都是easy example，这就导致下面一个问题：gradient被easy example dominant的问题：往往这些easy example虽然loss很低，但由于数量众多，对于loss依旧有很大贡献，从而导致收敛到不够好的一个结果。所以作者的解决方案也很直接：直接按照loss decay掉那些easy example的权重，这样使训练更加bias到更有意义的样本中去。很直接地，如下图所示:实验中作者比较了已有的各种样本选择方式：按照class比例加权重：最常用处理类别不平衡问题的方式OHEM：只保留loss最高的那些样本，完全忽略掉简单样本OHEM+按class比例sample：在前者基础上，再保证正负样本的比例（1：3）Focal loss各种吊打这三种方式，coco上AP的提升都在3个点左右，非常显著。值得注意的是，3的结果比2要更差，其实这也表明，其实正负样本不平衡不是最核心的因素，而是由这个因素导出的easy example dominant的问题。RetinaNet 结构如下实际上就是SSD+FPN的改进版

论文名称：Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间：2014年论文地址：针对问题：从Alexnet提出后，作者等人思考如何利用卷积网络来完成检测任务，即输入一张图，实现图上目标的定位（目标在哪）和分类（目标是什么）两个目标，并最终完成了RCNN网络模型。创新点： RCNN提出时，检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢，作者采用的是Selective Search候选区域提取算法，来获得当前输入图上可能包含目标的不同图像块，再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。参考博客：。论文题目：OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间：2014年论文地址：针对问题：该论文讨论了，CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后，在网络后端组织两组卷积或全连接层，一组用于实现定位，输出当前图像上目标的最小外接矩形框坐标，一组用于分类，输出当前图像上目标的类别信息。也是以此为起点，检测网络出现基础主干网络(backbone)+分类头或回归头（定位头）的网络设计模式雏形。创新点：在这篇论文中还有两个比较有意思的点，一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的，而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制，那用1x1卷积来替换FC层，是否可行呢？作者在测试时通过将全连接层替换为1x1卷积核证明是可行的；二是提出了offset max-pooling，也就是对池化层输入特征不能整除的情况，通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练，然后切换分类头为回归头，再训练回归头的参数，最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。参考博客：论文题目：Scalable Object Detection using Deep Neural Networks 提出时间：2014年论文地址：针对问题：既然CNN网络提取的特征可以直接用于检测任务（定位+分类），作者就尝试将目标框（可能包含目标的最小外包矩形框）提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。创新点：本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心，（800个anchor box）然后学习预测不考虑目标类别的二分类网络，背景or前景。用到了多尺度下的检测。参考博客：论文题目：DeepBox: Learning Objectness with Convolutional Networks 提出时间：2015年ICCV 论文地址：主要针对的问题：本文完成的工作与第三篇类似，都是对目标框提取算法的优化方案，区别是本文首先采用自底而上的方案来提取图像上的疑似目标框，然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序；而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点：本文作者想通过CNN学习输入图像的特征，从而实现对输入网络目标框是否为真实目标的情况进行计算，量化每个输入框的包含目标的可能性值。参考博客：论文题目：AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间：2015年ICCV 论文地址：主要针对的问题：对检测网络的实现方案进行思考，之前的执行策略是，先确定输入图像中可能包含目标位置的矩形框，再对每个矩形框进行分类和回归从而确定目标的准确位置，参考RCNN。那么能否直接利用回归的思路从图像的四个角点，逐渐得到目标的最小外接矩形框和类别呢？创新点：通过从图像的四个角点，逐步迭代的方式，每次计算一个缩小的方向，并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。参考博客：论文题目：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间：2014年论文地址：针对问题：如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络，在处理过程中就造成了图像块信息的损失。在实际的场景中，输入网络的目标尺寸很难统一，而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点：作者提出的SPPnet中，通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸，在训练的时候，池化的操作还是通过滑动窗口完成的，池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。参考博客：论文题目：Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间：2015年论文地址：针对问题：既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位，本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点：作者通过对输入网络的region进行一定的处理（通过数据增强，使得网络利用目标周围的上下文信息得到更精准的目标框）来增加网络对目标回归框的精度。具体的处理方式包括：扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置，使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性，从而提高了回归框的精度。参考博客：论文题目：Fast-RCNN 提出时间：2015年论文地址：针对问题： RCNN中的CNN每输入一个图像块就要执行一次前向计算，这显然是非常耗时的，那么如何优化这部分呢？创新点：作者参考了SPPNet（第六篇论文），在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸，从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图，再将原图上用Selective Search算法得到的目标框映射到特征图上，避免了特征的重复提取。参考博客：论文题目：DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间：2015年论文地址：主要针对的问题：本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文，作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。创新点：作者在不同的激活层上以滑动窗口的方式生成了假设，并表明最终的卷积层可以以较高的查全率找到感兴趣的对象，但是由于特征图的粗糙性，定位性很差。相反，网络的第一层可以更好地定位感兴趣的对象，但召回率降低。论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间：2015年NIPS 论文地址：主要针对的问题：由multibox（第三篇）和DeepBox（第四篇）等论文，我们知道，用CNN可以生成目标待检测框，并判定当前框为目标的概率，那能否将该模型整合到目标检测的模型中，从而实现真正输入端为图像，输出为最终检测结果的，全部依赖CNN完成的检测系统呢？创新点：将当前输入图目标框提取整合到了检测网络中，依赖一个小的目标框提取网络RPN来替代Selective Search算法，从而实现真正的端到端检测算法。参考博客：

论文研究的深度和广度

外刊论文撰写的五个基本要求

即5C：正确(correctness)、清楚(clarity)、简洁(concision)、完整 (completion)和一致性(consistency) 。只有在满足这5点要求的情况下才可以算是一篇合格的外刊文章。对此，我深表同意。下面，从外刊论文的基本结构分别来说明我的看法：

1)Introduction

我一直认为Introduction是外刊文章最为难写的部分之一(另外一个是Discussion)。

中文文章的缺陷就在于 Introduction没有内涵，过于简单，没有真正体现出一篇论文的研究起初和创新要素。应该说外刊论文对于Introduction的要求是非常高的，可以毫不夸张的说，一个好的Introduction就相当于文章成功了一半。所以大家应该在Introduction上集中足够的精力。

我认为要写好一个Introduction，最重要的是要保持鲜明的层次感和极强的逻辑性，这两点是结合在一起的，即在符合逻辑性的基础上建立层层递进的关系。

一开始，我们要首先阐述自己研究领域的基本内容，要尽量的简洁明了，不要罗里罗嗦一大堆。须知看文章的人都是该领域的专家，所以一些显而易见的知识要用概括性的而不是叙述性的语言来描述。

接下来，就是Introduction的重头戏之一：文献的总结回顾。这一点要特别着重笔墨来描写。一方面要把该领域内的过去和现在的状况全面的概括总结出来，不能有丝毫的遗漏，特别是最新的进展和过去经典文献的引用。这是两个最容易出现的问题，应该是我们要极力避免的。如果一旦审稿人之处这两个毛病，很可能意味着说你做的不够深入或者全面，负面作用是非常明显的。另一方面，文献的应用和数据的提供一定要准确。片面的摘录部分结果而不反映文献的总体结果是千万要不得的。引用的数据也要正确，特别是间接引用的数据(即不是从原文献中查到的数据，而是从别人的文献中发现的另外一篇文献的数据)。数据出错会导致文章的印象大大失分。此外，引用文献的时候注意防止造成抄袭的印象，即不要原文抄录，要用自己的话来进行总结描述。如果审稿人正好是文献的引用者的话，这样做就会糟糕的。

然后就是分析过去研究的局限性并且阐明自己研究的创新点，这是整个Introduction的高潮所在，所以更是要慎之又慎。阐述局限性的时候，需要注意的问题是要客观公正评价别人的工作，不要把抬高自己研究的价值建立在贬低别人的工作之上，这往往是我们写中文文章中容易犯的毛病。在外刊论文的写作中，这是万万要不得的，一定要遵循实事求是的原则来分析。在阐述自己的创新点时，要仅仅围绕过去研究的缺陷性来描述，完整而清晰的描述自己的解决思路。需要注意的是文章的摊子不要铺的太大，要抓住一点进行深入的阐述。只要能够很好的解决一个问题，就是一篇很好的文章了。创新性描述的越多越大，越容易被审稿人抓住把柄。中文文章的特点是创新性要多要大，而英文文章的特点恰恰相反：深入系统的解决一到两个问题就算相当不错。

最后，就是总结性的描述论文的研究内容，可以分为一二三四等几个方面来描述，为Introduction做最后的收尾工作。

至此，Introduction的写作算是大功告成。但是写完之后，还是要慎之又慎的仔细修改，仔细的琢磨里面的每一个句子是否表达的恰当准确，这对Introduction的修改完善是至关重要的。

2)Methods

Methods部分是描述我们论文的实验过程(这是针对理工科而言，文科我不知道不能妄言)。这一过程的写作相对来说较为简单，但是需要注意的问题却不少，重要的在于完整和科学。完整就是实验当中的每一个环节都要注意到，不要顾此失彼，遗漏一些重要的内容。

Methods部分一般可以按照实验对象、实验设备、实验材料、实验记录、实验分析方法等几个方面来进行组织。实验对象一般是人或者动物或者是一些组织等等，它们的基本信息要描述明确。此外需要注意的是国外的刊物大多对牵扯到人或者动物的实验都有一些特定的要求，有些是不允许在人或者动物身上进行的实验操作的，这需要认真阅读投稿刊物中关于实验的详细规定。如果违反这一规定的话，可能会不接受评审或者发表，这一点要特别注意。

实验设备的描述中，要对仪器的型号、生产厂家、实验过程中的用途等做详细的说明(牵扯到保密项目的可能有另外的写法，我不清楚)。对实验设备之间的链接要做到科学正确，不要给人混乱或者操作错误的感觉。设备使用的时候一些必要的步骤不可或缺，尤其是有可能对实验结果造成特定影响的操作更是要详细说明。这样做的好处，是为了在Discussion中能够进行对应的分析。比如，一些设备在使用之前要首先进行校正(calibration)，有的要求每个阶段实验之后都要重新校正，以保证结果的正确性。这一点一定要详细说明你的操作步骤或者校正过程，便于评审人分析你的结果。

实验材料的描述根据不同的学科应该有不同的要求，这里很难加以详细的描述。总体上来说要注意说明材料选择的必要性，也就是对为什么选择这种材料最好有一定的说明。如果这一点上描述不清的话，可能会导致整个实验过程是不成立的。

实验过程就是讲自己实验的整个操作流程描述清楚，一般都要附加以实验的流程图进行说明。流程图的画法很多，有的是文字式的.，有的式文字和示意图结合的，根据不同的实验有不同的做法。一般来说，可能后者多一些(对一些实验性学科来说尤其如此)，因为这样做能够使评审人对你的实验过程一目了然。如果示意图花的漂亮的话，还可以增强一些印象分。描述的时候，要有鲜明的层次感，对每个步骤之间的顺序和关联要描述清楚，不要造成实验过程混乱不堪的印象。因为最终评审人判断你的实验是否合理，是从这个过程的描述来的。

只要能在上述4个方面做到完整和科学的描述，相信写好Methods不是问题。

3)Results

不少人在写论文的时候会把Results和Discussion两部分放在一起写，但是大多数的论文都是分成两个部分。这两种做法的选择，取决于文章的类型。如果你的结果在分析的同时进行讨论更加合适，并不适合单独拿出来分析(或者是那样做很困难，导致Discussion成为鸡肋的时候)，那么合在一起写是合适的;反之就要放在一起写。因为我没有放在一起写的经验，所以这里就只好单独分开来说了。希望有合在一起写经验的人能够补充这方面的内容。

Results部分的要求是四个字：翔实准确。翔实就是要提供最为全面的分析结果，一切从你的实验当中能够得到的结果都应该提供给读者，不要故意的隐瞒或者遗漏某些重要的结果。准确就是结果必须是要真实的，不能是伪造合篡改的。从某种意义上来说，结果不够翔实并不会导致论文直接被拒，但是结果的真实性被人怀疑的话就肯定会被拒。

在结果的提供上，一般是表格和图两种方式。不同的杂志对于图表的要求并不完全一致，应该要根据杂志的要求分别对待。表格的优点是能够清晰的展示论文获得的第一手结果，便于后人在研究时进行引用和对比。图的优点在于能够讲数据的变化趋势灵活的表现出来，表达上更为直接和富于感染力。应该来说，图表应该结合起来使用，这样能各自取长补短，使得结果的展现更加丰富。应该要提出的一点是：现在大家越来越喜欢给各种各样的图，但是杂志社的要求却是要尽量限制图的个数。因为这样子会增加排版的困难，版面也会增加，出版社的支出也就会增加。因此，我的建议是大家在提供图的时候，尽量用最少的图提供最多的信息，一般来说最多不要超过8个。图太多了，会显得过于罗索和累赘，主编那里就不会很欣赏。必要的时候可以用表格来替代一些图。图片的格式每个杂志不太一样，要求 tif格式的比较多，不推荐使用bmp(jpg就更不能用)。有人说用矢量图清楚些，我的感觉和tif格式的没什么区别，只要足够清晰也就可以了。彩色图片的使用要慎重，因为黑白图片可以免费，但是彩色图片是绝对要收费，而且价格不菲。

在Results和Discussion分开写的情况下，Results部分尽量不要设计对结果的评论，最多是总结的陈述结果也就可以了。否则造成这两部分的内容上的重叠，会显得很累赘，对Discussion的描述不利。结果的描述上也要注意层次之间的安排，要按照条理性的要求分别描述，显得有逻辑性一些。不要乱七八糟的堆在一起，只是给出来了就可以了。结果给的一团糟，会大大降低论文的可读性，吃亏的最终是自己。

Results中大多都要提供统计性的结果，例如方差分析等。方差分析的结果形式要根据刊物的格式来给出，有的要求对分析值、自由度和概率都要详细的给出，有的则只要分析值和概率就可以了。概率可以用p=或者p<等形势给出，自由度的表达也有一些特殊要求。这些细节问题虽然关系不大，但是注意格式要统一，不要乱七八糟各自为战。统计分析结果过多时，可以用表格的方式来给出，具体上可以参照SPSS软件分析之后的结果。如果论文结果部分通篇都是统计分析的数据，会显得凌乱不堪，表格的形式会避免这种情况的发生。

4)Discussion

前面已经说过，Introduction和Discussion是整篇论文当中最为难写的两个部分。Discussion部分之所以难写，是因为这里面最能够显示一个作者研究问题的深度和广度。深度就是论文对于提出问题的研究到了一个什么样的程度，广度就是是否能够从多个较多来分析解释实验中的结果。要写好Discussion，我想大概可以分为下面两个步骤：

第一，选择要深入讨论分析的问题。Results部分中，有的结果是重要的，有的则是一笔带过的。选择合适的结果在Discussion部分中进行深入的讨论，是写好该部分首先面临的一个问题。一般来说，可以根据一个简单的原则来判断：如果你得到的结果体现了实验的独特性，是其他研究中没有得到的结果，那么这个结果就是应该要重点讨论的问题。有些结果是和前人的研究相一致的，并没有显著性的差异，那么就应该一笔带过不要深入讨论，否则那只是重复别人的工作而已，没有任何价值。Discussion的一个重要作用就是要突出自己研究的创新性，体现出显著区别于他人的特点，区别大和小是另外一个问题，重要的在于有区别。

第二，对选中的问题按照一定的层次从多个角度来进行讨论。选择的问题有时候不只一个(实际上多数情况下是2个以上)，所以描述的时候就要按照一定的层次描述清楚。一般来说要把最重要的放在中间，次之的放在开头和末尾。我觉得放在中间能够将评审人的情绪带至最高潮，前面是一个铺垫，后面是一个总结。这样的顺序似乎更合适一些，不妥之处还请诸位大家指正。无论问题大小，重要与否，都要从多个较多展开深入的讨论。这方面首先要有类似结果的对比，说明自己结论的独特性。其次，就要系统的阐述为什么会有这样的结果，方法可以有多种：从实验设计的角度，从理论原理的角度，从分析方法的角度，或者借鉴别人分析的方法等等。这并没有所谓一定的规则，重要的在于将这个问题深入的阐述清楚，不能让人有意犹未尽之感(这样其实很困难，因为评审人总是会提出新的问题，我们只能尽量做到这一点)。

在Discussion中，需要特别指出的是要保持和Results的一致性，也就是结果和讨论要一一对应，前后呼应，相互衬托才可以。千万不要出现按照讨论的内容会推出与实验相反的结论这种事情，那就证明你的讨论思路是彻底的失败或者你的实验压根儿就是失败的。

所以在Discussion的文字描述中，语言表达的精确性尤为重要。由于中英文表达习惯上的不同，总是会出现一些误解的情况，这一点要尽量在投稿之前解决好，否则由于这个问题导致被拒是很冤枉。

到此为止，外刊论文的四个主题部分都介绍完了。有人说还少了Abstract和Conclusion，不过我认为只要上述四个部分解决好了，这两个写起来轻而易举，并且这两个部分也不属于评审人重点关注的问题(Abstract的重要性要略微高点)。下面再介绍一下另外两个部分：Acknowledge和 References。

关于Acknowledge部分，主要的内容分为两个：第一是表明研究的基金来源，象中国的话一般都是Nature Science Foundation of China (NSFC，国家自然科学基金)，美国的话大多是National Institute of Health(NIH，美国国家卫生研究院)。写上基金的时候一般都要标注清楚基金的号码(Grant Number)，只有这样才算是该项基金的研究成果，也可以算做实验室的研究成果。须知没有任何一项研究成果是在没有资金资助的情况下完成的，所以这一点非常必要。第二是对参与人员(没有列在作者中的研究人员)和单位表示感谢，如果通过一审和最终接受发表，还要添加上对editor和anonymous reviewers的感谢，这是一种最基本的礼貌。中国人的文章中很多人会少掉这部分，这一点很不好。

关于References，重要的在于格式。不同的杂志对于参考文献的格式要求不一样，具体下来有所区别的可以分为：作者的写法，有的是简写在前，有的简写在后，有的简写有点，有的简写没有点;文章的名字，有的要加上引号，有的没有引号;期刊的写法，有的要简写，有的要全称，有的要斜体，有的则不需要;年和期卷号的顺序，有的是年在前，有的是年在后;期刊论文、书、学位论文、会议论文，四种引用的格式各不相同;文献的排列顺序，有的是按照字母的顺序，有的则是按照在论文中出现的顺序用阿拉伯数字排序。

基本上就是这些问题，看来很是琐碎，但是如果你的参考文献排列的乱七八糟，那就会使得评审人对你论文的印象很差，认为你没有认知组织和撰写论文，造成一定的负面影响。

所以，事情虽小，影响却大，还是要认真组织为好。

此外，论文在撰写的时候要自始至终都用英语来写，千万不要先写中文再翻译成英文。这样写出来的文章肯定是中不中，英不英，而且还极大的浪费精力。宁可一开始写得语法差一些，但是慢慢修改都要比这种写法好。况且如果有同专业英语比较好的人帮助的话，那这样写就更加省事了。写作的时候，行文的时态要注意。中文没有时态的问题，但是英文有，而且要求还相当严格。一般来说，大多数情况下是过去时态，在Introduction文献的回顾，Methods的整个部分，Results结果的总结，Discussion中的大部分，都要用过去时态来陈述。其他情况下可以用一般时态来描述。时态之间的界限是比较严格的，最好是仔细的通读国外的论文好好分析一下，或者让有经验的人帮你把把关，这样比较好一些。

一个人的时间和精力是有限的，因此知识结构能做到兼容并包，深刻通透的人是少数。那么我们怎么做到广度和深度的协调发展呢？首先，知识的广度代表着你知道的东西很多，洋洋洒洒，世间事物都略懂略懂，跟谁说话都能聊的来，说什么话题都不陌生，就连你吹牛别人都听不出来，因为你吹牛肯定会把你了解的知识说给不了解的人听，但是因为没有深度，当专业人员听到你的话时，肯定会觉得你的话漏洞很多，一看就是在吹牛。其次，知识的深度是指你的专业能力很强，只要是这个专业的问题你都表示so easy。你跟圈内人可以谈笑风生，但是当你跟圈外人聊的时候发现你根本就插不上话，觉得自己什么都不会。然后，我们来看下职业人群的知识面。销售人员，保险员工，管理人员的知识面广度绝对满分。博士生，技术人员，程序员知识深度绝对够深。再其次，一个人准备发表论文，知识广博的人肯定把各种知识综合一下，一篇论文一下午写完了，顺便还能喝个下午茶。知识深邃的人研究近一个月写完了一篇，而知识面够宽的人早就发了7、8篇，虽然你影响因子一篇顶我三篇，但奈何我有8篇论文。当然，知识深度和广度也跟年龄有关，如果你20多岁可以研究更深的东西，等到30多岁你还可以增加知识的广度，但是30多岁再想增加知识的深度就会因为各方面原因感觉力不从心了吧。因此，我得出如下结论：如果你不想做技术宅男或者只想做做咸鱼，忽悠忽悠别人，追求知识的广度非你莫属，如果你想改变点什么，想做点深刻的东西，顺便改变下世界，知识的深度势在必行。当然想做到深度就要做好做冷板凳的准备，在你没有做出成果之前，那些知识广博的人早已香车宝马，舒服自在去了。

论文拟解决的问题，就是指你的论文里最终要解决什么难点，你认为在论文中，哪一块比较难做比如收集处理资料，问题的处理方法等都可以写开题报告主要包括以下几个方面：（一）论文名称论文名称就是课题的名字第一，名称要准确、规范。准确就是论文的名称要把论文研究的问题是什么，研究的对象是什么交待清楚，论文的名称一定要和研究的内容相一致，不能太大，也不能太小，要准确地把你研究的对象、问题概括出来。第二，名称要简洁，不能太长。不管是论文或者课题，名称都不能太长，能不要的字就尽量不要，一般不要超过20个字。（二）论文研究的目的、意义研究的目的、意义也就是为什么要研究、研究它有什么价值。这一般可以先从现实需要方面去论述，指出现实当中存在这个问题，需要去研究，去解决，本论文的研究有什么实际作用，然后，再写论文的理论和学术价值。这些都要写得具体一点，有针对性一点，不能漫无边际地空喊口号。主要内容包括：⑴ 研究的有关背景(课题的提出)：即根据什么、受什么启发而搞这项研究。 ⑵ 通过分析本地（校）的教育教学实际，指出为什么要研究该课题，研究的价值，要解决的问题。（三）本论文国内外研究的历史和现状（文献综述）。规范些应该有，如果是小课题可以省略。一般包括：掌握其研究的广度、深度、已取得的成果；寻找有待进一步研究的问题，从而确定本课题研究的平台(起点)、研究的特色或突破点。（四）论文研究的指导思想指导思想就是在宏观上应坚持什么方向，符合什么要求等，这个方向或要求可以是哲学、政治理论，也可以是政府的教育发展规划，也可以是有关研究问题的指导性意见等。（五）论文写作的目标论文写作的目标也就是课题最后要达到的具体目的,要解决哪些具体问题，也就是本论文研究要达到的预定目标：即本论文写作的目标定位，确定目标时要紧扣课题,用词要准确、精练、明了。常见存在问题是：不写研究目标；目标扣题不紧；目标用词不准确；目标定得过高, 对预定的目标没有进行研究或无法进行研究。确定论文写作目标时，一方面要考虑课题本身的要求，另一方面要考率实际的工作条件与工作水平。（六）论文的基本内容研究内容要更具体、明确。并且一个目标可能要通过几方面的研究内容来实现，他们不一定是一一对应的关系。大家在确定研究内容的时候，往往考虑的不是很具体，写出来的研究内容特别笼统、模糊，把写作的目的、意义当作研究内容。基本内容一般包括：⑴对论文名称的界说。应尽可能明确三点：研究的对象、研究的问题、研究的方法。⑵本论文写作有关的理论、名词、术语、概念的界说。（七）论文写作的方法具体的写作方法可从下面选定：观察法、调查法、实验法、经验总结法、个案法、比较研究法、文献资料法等。（八）论文写作的步骤论文写作的步骤，也就是论文写作在时间和顺序上的安排。论文写作的步骤要充分考虑研究内容的相互关系和难易程度，一般情况下，都是从基础问题开始，分阶段进行，每个阶段从什么时间开始，至什么时间结束都要有规定。课题研究的主要步骤和时间安排包括：整个研究拟分为哪几个阶段；各阶段的起止时间希望我们可以帮你。毕业设计(论文)是学生毕业前最后一个重要学习环节，是学习深化与升华的重要过程。它既是学生学习、研究与实践成果的全面总结，又是对学生素质与能力的一次全面检验，而且还是对学生的毕业资格及学位资格认证的重要依据。为了保证我校本科生毕业设计(论文)质量，特制定“同济大学本科生毕业设计(论文)撰写规范”。一、毕业设计（论文）资料的组成A．毕业设计(论文)任务书；B．毕业设计(论文)成绩评定书；C．毕业论文或毕业设计说明书（包括：封面、中外文摘要或设计总说明（包括关键词）、目录、正文、谢辞、参考文献、附录）；D．译文及原文复印件；E．图纸、软盘等。二、毕业设计(论文)资料的填写及有关资料的装订毕业设计(论文)统一使用学校印制的毕业设计(论文)资料袋、毕业设计(论文)任务书、毕业设计(论文)成绩评定书、毕业设计(论文)封面、稿纸（在教务处网上下载用，学校统一纸面格式，使用A4打印纸）。毕业设计(论文)资料按要求认真填写，字体要工整，卷面要整洁，手写一律用黑或蓝黑墨水；任务书由指导教师填写并签字，经院长（系主任）签字后发出。毕业论文或设计说明书要按顺序装订：封面、中外文摘要或设计总说明（包括关键词）、目录、正文、谢辞、参考文献、附录装订在一起，然后与毕业设计(论文)任务书、毕业设计(论文)成绩评定书、译文及原文复印件（订在一起）、工程图纸(按国家标准折叠装订)、软盘等一起放入填写好的资料袋内交指导教师查收，经审阅评定后归档。三、毕业设计说明书(论文)撰写的内容与要求一份完整的毕业设计(论文)应包括以下几个方面：1．标题标题应该简短、明确、有概括性。标题字数要适当，不宜超过20个字，如果有些细节必须放进标题，可以分成主标题和副标题。2．论文摘要或设计总说明论文摘要以浓缩的形式概括研究课题的内容，中文摘要在300字左右，外文摘要以250个左右实词为宜，关键词一般以3～5个为妥。设计总说明主要介绍设计任务来源、设计标准、设计原则及主要技术资料，中文字数要在1500～2000字以内，外文字数以1000个左右实词为宜，关键词一般以5个左右为妥。3．目录目录按三级标题编写（即：1……、……、……），要求标题层次清晰。目录中的标题应与正文中的标题一致，附录也应依次列入目录。4．正文毕业设计说明书(论文)正文包括绪论、正文主体与结论，其内容分别如下：绪论应说明本课题的意义、目的、研究范围及要达到的技术要求；简述本课题在国内外的发展概况及存在的问题；说明本课题的指导思想；阐述本课题应解决的主要问题，在文字量上要比摘要多。正文主体是对研究工作的详细表述，其内容包括：问题的提出，研究工作的基本前提、假设和条件；模型的建立，实验方案的拟定；基本概念和理论基础；设计计算的主要方法和内容；实验方法、内容及其分析；理论论证，理论在课题中的应用，课题得出的结果，以及对结果的讨论等。学生根据毕业设计(论文)课题的性质，一般仅涉及上述一部分内容。结论是对整个研究工作进行归纳和综合而得出的总结，对所得结果与已有结果的比较和课题尚存在的问题，以及进一步开展研究的见解与建议。结论要写得概括、简短。5．谢辞谢辞应以简短的文字对在课题研究和设计说明书（论文）撰写过程中曾直接给予帮助的人员（例如指导教师、答疑教师及其他人员）表示自己的谢意，这不仅是一种礼貌，也是对他人劳动的尊重，是治学者应有的思想作风。6．参考文献与附录参考文献是毕业设计(论文)不可缺少的组成部分，它反映毕业设计(论文)的取材来源、材料的广博程度和材料的可靠程度，也是作者对他人知识成果的承认和尊重。一份完整的参考文献可向读者提供一份有价值的信息资料。一般做毕业设计(论文)的参考文献不宜过多，但应列入主要的文献可10篇以上，其中外文文献在2篇以上。附录是对于一些不宜放在正文中，但有参考价值的内容，可编入毕业设计（论文）的附录中，例如公式的推演、编写的程序等；如果文章中引用的符号较多时，便于读者查阅，可以编写一个符号说明，注明符号代表的意义。一般附录的篇幅不宜过大，若附录篇幅超过正文，会让人产生头轻脚重的感觉。四、毕业设计(论文)要求我校毕业设计(论文)大致有设计类、理论研究类（理科）、实验研究类、计算机软件设计类、经济、管理及文科类、综合类等，具体要求如下：1．设计类（包括机械、建筑、土建工程等）：学生必须独立绘制完成一定数量的图纸，工程图除了用计算机绘图外必须要有1～2张（2号以上含2号图）是手工绘图；一份15000字以上的设计说明书（包括计算书、调研报告）；参考文献不低于10篇，其中外文文献要在2篇以上。2．理论研究类（理科）：对该类课题工科学生一般不提倡，各院系要慎重选题，除非题目确实有实际意义。该毕业设计报告或论文字数要在20000字以上；根据课题提出问题、分析问题，提出方案、并进行建模、仿真和设计计算等；参考文献不低于15篇，其中外文文献要在4篇以上。3．实验研究类：学生要独立完成一个完整的实验，取得足够的实验数据，实验要有探索性，而不是简单重复已有的工作；要完成15000字以上的论文，其包括文献综述，实验部分的讨论与结论等内容；参考文献不少于10篇，包括2篇以上外文文献。4．计算机软件类：学生要独立完成一个软件或较大软件中的一个模块，要有足够的工作量；要写出10000字以上的软件说明书和论文；毕业设计(论文)中如涉及到有关电路方面的内容时，必须完成调试工作，要有完整的测试结果和给出各种参数指标；当涉及到有关计算机软件方面的内容时，要进行计算机演示程序运行和给出运行结果。5．经济、管理及文科类：学生在教师的指导下完成开题报告；撰写一篇20000字以上的有一定水平的专题论文（外国语专业论文篇幅为5000个词以上。）；参考文献不少于10篇，包括1-2篇外文文献。6．综合类：综合类毕业设计(论文)要求至少包括以上三类内容，如有工程设计内容时，在图纸工作量上可酌情减少，完成10000字以上的论文，参考文献不少于10篇，包括2篇以上外文文献。每位学生在完成毕业设计(论文)的同时要求:(1)翻译2万外文印刷字符或译出5000汉字以上的有关技术资料或专业文献（外语专业学生翻译6000～8000字符的专业外文文献或写出10000字符的外文文献的中文读书报告），内容要尽量结合课题（译文连同原文单独装订成册）。(2)使用计算机进行绘图，或进行数据采集、数据处理、数据分析，或进行文献检索、论文编辑等。绘图是工程设计的基本训练，毕业设计中学生应用计算机绘图，但作为绘图基本训练可要求一定量的墨线和铅笔线图。毕业设计图纸应符合制图标准，学生应参照教务处2004年3月印制的《毕业设计制图规范》进行绘图。五、毕业设计(论文)的写作细则1．书写毕业设计(论文)要用学校规定的文稿纸书写或打印（手写时必须用黑或蓝墨水），文稿纸背面不得书写正文和图表，正文中的任何部分不得写到文稿纸边框以外，文稿纸不得随意接长或截短。汉字必须使用国家公布的规范字。2．标点符号毕业设计(论文)中的标点符号应按新闻出版署公布的"标点符号用法"使用。3．名词、名称科学技术名词术语尽量采用全国自然科学名词审定委员会公布的规范词或国家标准、部标准中规定的名称，尚未统一规定或叫法有争议的名称术语，可采用惯用的名称。使用外文缩写代替某一名词术语时，首次出现时应在括号内注明其含义。外国人名一般采用英文原名，按名前姓后的原则书写。一般很熟知的外国人名（如牛顿、达尔文、马克思等）可按通常标准译法写译名。4．量和单位量和单位必须采用中华人民共和国的国家标准GB3100～GB3102-93，它是以国际单位制（SI）为基础的。非物理量的单位，如件、台、人、元等，可用汉字与符号构成组合形式的单位，例如件/台、元/km。5．数字毕业设计(论文)中的测量统计数据一律用阿拉伯数字，但在叙述不很大的数目时，一般不用阿拉伯数字，如"他发现两颗小行星"、"三力作用于一点"，不宜写成"他发现2颗小行星"、"3力作用于1点"。大约的数字可以用中文数字，也可以用阿拉伯数字，如"约一百五十人"，也可写成"约150人"。6．标题层次毕业设计(论文)的全部标题层次应有条不紊，整齐清晰。相同的层次应采用统一的表示体例，正文中各级标题下的内容应同各自的标题对应，不应有与标题无关的内容。章节编号方法应采用分级阿拉伯数字编号方法，第一级为"1"、"2"、"3"等，第二级为""、""、""等,第三级为""、""、""等，但分级阿拉伯数字的编号一般不超过四级，两级之间用下角圆点隔开，每一级的末尾不加标点。各层标题均单独占行书写。第一级标题居中书写；第二级标题序数顶格书写，后空一格接写标题，末尾不加标点；第三级和第四级标题均空两格书写序数，后空一格书写标题。第四级以下单独占行的标题顺序采用.…和.两层，标题均空两格书写序数，后空一格写标题。正文中对总项包括的分项采用⑴、⑵、⑶…单独序号，对分项中的小项采用①、②、③…的序号或数字加半括号，括号后不再加其他标点。7．注释毕业设计(论文)中有个别名词或情况需要解释时，可加注说明，注释可用页末注（将注文放在加注页的下端）或篇末注（将全部注文集中在文章末尾），而不可行中注（夹在正文中的注）。注释只限于写在注释符号出现的同页，不得隔页。8．公式公式应居中书写，公式的编号用圆括号括起放在公式右边行末，公式和编号之间不加虚线。9．表格每个表格应有表序和表题，表序和表题应写在表格上放正中，表序后空一格书写表题。表格允许下页接写，表题可省略，表头应重复写，并在右上方写"续表××"。10．插图毕业设计的插图必须精心制作，线条粗细要合适，图面要整洁美观。每幅插图应有图序和图题，图序和图题应放在图位下方居中处。图应在描图纸或在白纸上用墨线绘成，也可以用计算机绘图。11．参考文献参考文献一律放在文后，参考文献的书写格式要按国家标准GB7714－87

索引序列
深度学习研究的论文
深度学习研究论文
深度学习论文期刊
深度学习目标检测论文
论文研究的深度和广度
返回顶部

深度学习研究的论文