• 回答数

    2

  • 浏览数

    205

gangyaya037
首页 > 学术论文 > 学位论文千字错误率是什么意思啊

2个回答 默认排序
  • 默认排序
  • 按时间排序

岁月静好-静静

已采纳

Abstract

我们训练了一个大型的深度卷积神经网络,将ImageNet lsvprc -2010竞赛中的120万幅高分辨率图像分类为1000个不同的类。在测试数据上,我们实现了top-1和top-5的错误率,分别为和,这与前的最高水平相比有了很大的提高。该神经网络有6000万个参数和65万个神经元,由5个卷积层(其中一些后面接了最大池化层)和3个全连接层(最后的1000路softmax)组成。为了使训练更快,我们使用了非饱和神经元和一个非常高效的GPU实现卷积运算。为了减少全连通层的过拟合,我们采用了一种最近发展起来的正则化方法——dropout,结果显示它非常有效。我们还在ILSVRC-2012比赛中输入了该模型的一个变体,并获得了的top-5测试错误率,而第二名获得了的错误率.

1 Introduction

当前的物体识别方法主要利用机器学习方法。为了提高它们的性能,我们可以收集更大的数据集,学习更强大的模型,并使用更好的技术来防止过度拟合。直到最近,标记图像的数据集在成千上万的图像(例如,NORB [16], Caltech-101/256 [8,9], CIFAR-10/100[12])中相对较小。使用这种大小的数据集可以很好地解决简单的识别任务,特别是如果使用保存标签的转换来扩展它们。例如,MNIST数字识别任务的当前最佳错误率(<)接近人类性能[4]。但是现实环境中的物体表现出相当大的可变性,所以为了学会识别它们,有必要使用更大的训练集。的确,小图像数据集的缺点已经被广泛认识(例如,Pinto等人的[21]),但直到最近才有可能收集数百万张图像的标记数据集。新的更大的数据集包括LabelMe[23],它由成千上万的全分段图像组成,和ImageNet[6],它由超过22000个类别的超过1500万标记的高分辨率图像组成。

要从数百万张图像中了解数千个物体,我们需要一个具有巨大学习能力的模型。 然而,对象识别任务的巨大复杂性意味着即使像ImageNet这样大的数据集也无法指定这个问题,因此我们的模型也应该具有大量的先验知识来补偿我们没有的所有数据。卷积神经网络(Convolutional neural networks, CNNs)就是这样一类模型[16,11,13,18,15,22,26]。它们的能力可以通过改变深度和宽度来控制,而且它们还对图像的性质(即统计的平稳性和像素依赖的局部性)做出了强有力且最正确的假设。 因此,与具有相似大小层的标准前馈神经网络相比,CNNs具有更少的连接和参数,因此更容易训练,而其理论上最好的性能可能只会稍微差一些。

尽管CNNs的质量很吸引人,尽管它们的本地架构相对高效,但在高分辨率图像上大规模应用仍然非常昂贵。幸运的是,当前的gpu与高度优化的2D卷积实现相结合,已经足够强大,可以方便地训练有趣的大型CNNs,而最近的数据集(如ImageNet)包含了足够多的标记示例,可以在不严重过拟合的情况下训练此类模型。

本文的具体贡献如下:

最后,网络的大小主要受到当前gpu上可用内存的大小和我们愿意忍受的训练时间的大小的限制。我们的网络需要5到6天的时间来训练两个GTX 580 3GB GPU。我们所有的实验都表明,只要等待更快的gpu和更大的数据集可用,我们的结果就可以得到改善。

2 The Dataset

ImageNet是一个包含超过1500万张高分辨率图像的数据集,属于大约22000个类别。这些图片是从网上收集来的,并由人工贴标签者使用亚马逊的土耳其机械众包工具进行标记。从2010年开始,作为Pascal视觉对象挑战赛的一部分,每年都会举办一场名为ImageNet大型视觉识别挑战赛(ILSVRC)的比赛。ILSVRC使用ImageNet的一个子集,每个类别大约有1000张图片。总共大约有120万张训练图像、5万张验证图像和15万张测试图像。

ILSVRC-2010 是唯一可用测试集标签的 ILSVRC 版本,因此这是我们进行大多数实验的版本。由于我们也在 ILSVRC-2012 竞赛中加入了我们的模型,在第6节中,我们也报告了我们在这个版本的数据集上的结果,对于这个版本的数据集,测试集标签是不可用的。在 ImageNet 上,通常报告两个错误率:top-1 和 top-5,其中 top-5 错误率是测试图像的一部分,其中正确的标签不在模型认为最可能的五个标签中。

ImageNet由可变分辨率的图像组成,而我们的系统需要一个恒定的输入维数。 因此,我们将图像降采样到256 * 256的固定分辨率。给定一个矩形图像,我们首先重新调整图像的大小,使其短边长度为256,然后从结果图像中裁剪出中心的256%256块。除了从每个像素中减去训练集上的平均活动外,我们没有以任何其他方式对图像进行预处理。因此,我们将网络训练成像素的原始RGB值(居中)。

3 The Architecture

ReLU Nonlinearity

Training on Multiple GPUs

Local Response Normalization

Overlapping Pooling

Pooling layers in CNNs summarize the outputs of neighboring groups of neurons in the same kernel map. Traditionally, the neighborhoods summarized by adjacent pooling units do not overlap (.,[17, 11, 4]). To be more precise, a pooling layer can be thought of as consisting of a grid of pooling units spaced s pixels apart, each summarizing a neighborhood of size z z centered at the location of the pooling unit. If we set s = z, we obtain traditional local pooling as commonly employed in CNNs. If we set s < z, we obtain overlapping pooling. This is what we use throughout our network, with s = 2 and z = 3. This scheme reduces the top-1 and top-5 error rates by and , respectively, as compared with the non-overlapping scheme s = 2; z = 2, which produces output of equivalent dimensions. We generally observe during training that models with overlapping pooling find it slightly more difficult to overfit.

Overall Architecture

Now we are ready to describe the overall architecture of our CNN. As depicted in Figure 2, the net contains eight layers with weights; the first five are convolutional and the remaining three are fully-connected. The output of the last fully-connected layer is fed to a 1000-way softmax which produces a distribution over the 1000 class labels. Our network maximizes the multinomial logistic regression objective, which is equivalent to maximizing the average across training cases of the log-probability of the correct label under the prediction distribution.

4 Reducing Overfitting

Data Augmentation

Dropout

结合许多不同模型的预测是减少测试错误的一种非常成功的方法[1,3],但是对于已经需要几天训练的大型神经网络来说,这似乎太昂贵了。然而,有一个非常有效的模型组合版本,它在训练期间只花费大约2倍的成本。最近介绍的技术称为dropout[10],它将每个隐藏神经元的输出设置为0,概率为。以这种方式丢弃的神经元不参与正向传递,也不参与反向传播。所以每次输入时,神经网络都会对不同的结构进行采样,但是所有这些结构都共享权重。这种技术减少了神经元之间复杂的相互适应,因为神经元不能依赖于特定的其他神经元的存在。因此,它被迫学习与其他神经元的许多不同随机子集结合使用的更健壮的特征。在测试时,我们使用所有的神经元,但将它们的输出乘以,这是一个合理的近似值,近似于取由指数型多退出网络产生的预测分布的几何平均值。

我们在图2的前两个完全连接的层中使用了dropout。没有dropout,我们的网络显示出大量的过拟合。Dropout使收敛所需的迭代次数增加了一倍。

5 Details of learning

7 Discussion

324 评论

大眼睛鱼儿

学术论文摘要格式规范

导语:学术论文摘要的格式规范是怎样的呢?摘要是一份文献内容的准确压缩,不加解释或评论,是论文的重要组成部分。下面是我分享的学术论文摘要的格式规范,欢迎阅读!

1 摘要的定义与三类摘要的写法

国际标准ISO214-1976指出:摘要是一份文献内容的准确压缩,不加解释或评论。中国国家标准规定:摘要是报告、论文的内容不加注释和评论的简短陈述。摘要是读者判断论文价值,判断论文是否值得阅读的依据。会议所征摘要是决定是否录用全文的依据。写好摘要是科技人员写作所必备的基本功。如果一篇内容价值较高的学术论文,其摘要写得平平淡淡,不能体现论文的特点和学术价值,将带来一系列不利影响:失去被刊载的机会,需要本文的读者不会阅读全文,从而失去应有的学术影响;对中文期刊论文而言,难以进入国际检索系统等。

摘要分为报道性摘要、指示性摘要、报道—指示性摘要、结构性摘要等种类。学术期刊多采用报道性摘要,特别是试验研究和有定量数据的论文。对新内容较少,或数据少的论文用指示性摘要或报道—指示性摘要。摘要的内容一般由3部分组成:研究目的,研究方法,研究结果或结论。中文摘要一般200-300字,外文摘要字数不超过250个实词。摘要的详简程度和篇幅大小根据具体情况及要求而定,如期刊论文摘要、会议征稿摘要、博士学位论文摘要的差别很大。期刊论文摘要通常位于署名和单位地址之后。

报道性摘要

报道性摘要要求反映作者的主要成果,提供比较完整的定量及定性信息。篇幅一般为200-300字。示例如下:

示例1: (题名:BiSrCaCuO高温超导纤维)

采用激光加热小基座法(LHPG)成功地制备出BiSrCaCuO超导纤维。它性能稳定,工艺可重复性高。纤维最大长度达60mm,直径范围35-500um,其中细径纤维有挠性。超导纤维的起始转变温度为118K,零电阻温度为87K,临近电流密度为 (77K,H=0,直流电流量)。纤维中超导相(2212相),显微结构有典型的取向性。纤维的超导电性与其生长条件及后处理过程密切相关。首次指出,a轴平行于纤维的轴向。

示例2:(篇名: 约瑟夫森结Alx-Al隧道势垒的实验研究)

通过X光电子能谱、阳极氧化电压谱和FISKE台阶电压的测量,研究了约瑟夫森结中ALOX-AL隧道势垒。发现结的隧道势垒最佳沉积AL层厚度为7nm,AL上形成了ALOX厚度只取决于氧化条件,与沉积AL厚无关,势垒AL氧化物可能含有一个像ALOOH态的OH基团。

指示性摘要

指示性摘要的目的是使读者对论文有一个概括的了解,适用于新内容较少,或数据少的论文。篇幅一般为50-100字。示例如下:

示例1: (题名 :冷轧槽楔外端与摩擦影响的定量分析)

建立了与Avitzuer不同的连续速度场,经变上限积分与参量积分求的槽楔冷轧变形力上界解解,并侧重定量的讨论了外端与摩擦对变形力的影响。

示例2: (题名 :白薯线虫的防治)

对密西西比州种植的白薯由于根节线虫所引起的问题作了讨论,叙述了1967年由蔬菜收获分公司实验站所进行的商品熏剂和杀虫剂的试验。对行间撒播的施用方法作了比较。列出了包括商品杀线虫剂vorlex、DOW WV W─85、DD和试验的固体杀线虫剂68 138及Dasanit的试验结果。

示例3: (题名:湘江水体中硒的分布)

[目的] 为给综合防治污染提供一定依据,对湘江水体中硒的分布进行了探讨。

[方法] 在湘江上游兴安县至洞庭湖的河口采集了28个底泥样品, 用气相色谱法进行分析。

[结果] 结果表明:湘江底泥已受到不同程度的污染,其中有些硒含量超过本底值数的十倍甚至百倍,大多数样品中硒含量较一般土壤和底泥为高。还分析了污染严重的霞湾港水样,结果表明此段江水中硒含量尚不高,在地面水最高容许浓度范围内。

报道—指示性摘要

报道—指示性摘要是对论文中价值最高部分内容采用报道性摘要,其余部分以指示性摘要报道。篇幅一般为100-200字。

示例1: (题名:柴油机燃用棉籽油的试验研究)

介绍了不经任何改装的S195型柴油机燃用棉籽油与柴油混合油或纯棉籽油的试验研究情况。结果表明,燃用棉柴混合油或纯棉籽油时,发动机性能良好,无异常现象;适当调整供油提前角、加大循环供油量,可以达到原机功率,而且烟度有所下降。还分析了S195型柴油机在试验工况下的燃烧特性和放热规律。

2 写作中的常见问题

要有摘要与论文分离单独出版的写作思想,对随文摘要,不要认为“全文在后边”,编写摘要可简单、随便。

应用“用(采用)...方法”、“报告了...现状”、“进行了...调查”等记述方法编写摘要。即,要用第三人称编写,不要用第一、二人称编写,不要用“本文”、“我们”、“作者”、 “THIS PAPER"、"THIS ARTICLES"等作为主语。

不用图表、示意图、公式、结构式和非公用的符号和术语。

要采用规范化的名词术语、缩略语、略语、代号、法定计量单位、简化字和标点符号。

避免与标题和引言在用词上明显重复,忌罗列正文中目次,小标题和段落标题,或结论部分的文字。

要排除在本学科领域已成为常识的内容和教材中已有的东西。

除非该论文证实或否定了他人已出版的著作,否则不必引用。

不要作自我评价。如:本文以变量代换为工具,利用高等代数的知识,证明了齐线性微分方程组的降阶定理,给出了一种实际的解题方法。因此,这个结论的证明不仅具有一定的理论意义,而且在解题过程中也具有重要的指导意义。

不要对题名等进行注解。如论文“分类指导重点突破加速农机化步伐”的摘要写成:农机化是农业生产力发展到一定阶段的必然过程,是现代农业的产物,在我国它的发展只能与农村经济发展水平相适用。因此分类指导即根据不同经济力、生产组织形式和现实物质技术条件,进行有效地指导、协调、组织带层次性的农机化生产。重点突破即在提高经济效率的前提下,在“化”水平上有所突破。

3 成功写作摘要的要点

摘要写作成功的诀窍是突出新贡献,并使之尖锐化。用精辟语句使新东西出现在摘要的突出位置。所谓新贡献包括:新技术、新理论、新方法、新观点、新规律、纠正前人错误、解决争议、补充和发展前人成果等。有的作者常常不在摘要中体现重要的研究成果,而到论文的后部分经分析推论等才指明,这是错误的观点和写作方式。

使自己新贡献尖锐化。即区别他人工作和自己新贡献不同之处(如:“想法”、“设想”和“已给出数学定义、模型”等的.区别),使之分离,使自己新东西尖锐化。新贡献不要多谈,要精辟。不能模棱两可,让读者去分析作者的贡献“新”在何处。而应指出来让读者看。但不能自我评价。

知识扩展:毕业论文报道性摘要范文

目的公共卫生硕士学位论文英文摘要是学位论文的重要组成部分,是展示学习者的专业知识和科研能力的重要途径。英文摘要的规范性、准确性、严谨性也直接影响到公共卫生硕士论文的最终评审。为繁荣医学教育,推动公共卫生事业发展,促进公共卫生领域的国际学术交流,撰写高质量的公共卫生专业学术论文英文摘要显得尤为重要。通过对收集的210篇预防医学与流行病学专业的优秀硕士学位论文英文摘要的结构和语言进行分析研究,发现论文英文摘要中存在的语言问题,对其进行确认、分类、统计和分析,探究导致这些语言错误出现的原因及影响因素,并对如何减少和避免这些错误,提高公共卫生硕士专业学位论文英文摘要的语言写作水平提出建议。

方法本研究釆用文献分析法与数理统计法,从公共卫生专业硕士学位论文中,即预防医学与卫生学一级学科下的环境卫生、劳动卫生、放射卫生、营养卫生食品卫生、个人卫生与保健、计划生育与妇幼保健和流行病学与防疫七个专业类别中,分层抽样,随机选取了 210篇优秀硕士学位论文,对其英文摘要的语篇结构、单词量、错误量、错误率和在摘要中出现的10种常见语言错误的分类统计,根据专业不同和错误类别的差异,比较分析可能导致各类语言错误产生的原因。

结果通过查找、确认、统计和分析,得出以下结果:(1)公共卫生硕士学位论文英文摘要总单词平均数为±个,各专业每篇平均单词数为环境卫生专业±个,放射卫生专业±个,劳动卫生专业±个,流行病学与防疫专业±个,营养与食品卫生专业±个,个人卫生与保健专业±个,计划生育与妇幼保健专业±个;(2)公共卫生专业硕士学位论文英文摘要平均每篇的错误数量为±个,每篇错误率(即错误数量/总单词数量)为±个。营养卫生食品卫生专业的错误量和错误率最高,环境卫生专业其次,流行病学与防疫专业错误量和错误率最低。

环境卫生专业平均每篇错误量为±个,错误率为±;放射卫生专业每篇错误量为±个,错误率为±;劳动卫生专业每篇错误量为士个,错误率为±;流行病与防疫专业每篇错误量为±个,错误率为±;营养卫生食品卫生专业每篇错误量为±个,错误率为±;个人卫生与保健专业,每篇错误量为±个,错误率为±;计划生育与妇幼保健专业每篇错误量为±个,错误率为±; (3)对各类常见语法错误进行分类和统计分析,所得结果为单词拼写错误在摘要中错误率为,单复数错误在摘要中错误率为,冠词使用错误在摘要中错误率为,介词搭配错误在摘要中错误率为,形容词和副词使用错误在摘要中错误率为,时态和语态错误在摘要中错误率为,用词不当(或称选词不当)在摘要在错误率为,主谓一致在摘要中错误率为,指代不清在摘要中错误率为,汉式英语现象(又称中式英语)在摘要中错误率为.其中时态和语态错误在摘要中错误率最高,其次为汉式英语现象(又称中式英语),主谓一致错误率最少。相关分析结果表明,公共卫生硕士学位论文英文摘要的语言错误出现与摘要写作语篇结构和摘要单词数量无关,七类专业方向在10类常见语法错误方面有差异,差异有显着统计学意义。

结论导致公共卫生硕士学位论文英文摘要中出现多种语言错误的原因是多方面的,分析其中主要原因可能是:大学阶段对公共英语基础知识的学习不够扎实、研究生录取时的英语分数线较低、大学及研究生阶段对于医学专业的英文学习自主性低、研究生自身及导师对学位论文英文摘要不够重视、主要精力都投注于专业学习和实验调查中等等。为提高公共卫生硕士研究生学位论文英文摘要的写作水平,有必要从强化教学、提高自我认识、优化学习方法、加强写作练习与讨论、增进国际交流等多方面入手。

230 评论

相关问答

  • cn级论文是什么意思啊

    刊号,评职称要求的

    核桃丫头 6人参与回答 2023-12-06
  • 论文模板是什么意思啊

    1、论文题目:要求准确、简练、醒目、新颖。2、目录:目录是论文中主要段落的简表。(短篇论文不必列目录)3、提要:是文章主要内容的摘录,要求短、精、完整。字数少可

    馨悦心辰辰 3人参与回答 2023-12-09
  • 时政类论文是什么意思啊

    一、怎样定标题标题在全文中的作用非常重要,标题列出后的最佳效果是使人读来觉得“触目惊心”。1、批驳型。题目中直接列出批驳的靶子,并直接表明作者的态度。这种题目容

    丁国栋3 3人参与回答 2023-12-08
  • 外文学位论文是什么意思啊

    问题一:毕业论文的外文文献是什么意思?是说找一篇外文文献,然后把它翻译成中文吗? 5分 是在知网上(应该是Ebhos罚差不多是这个,具体记不清了)找到一篇与你论

    健康&平安 3人参与回答 2023-12-07
  • 论文格式错误什么意思

    毕业论文终稿电子版格式有错误,则是会会该论文造成一定程度的影响。因为,论文的写作有严格的格式要求。论文的格式要求如下: 1、准确得体:要求论文题目能准确表达论文

    佐必林家具2013 2人参与回答 2023-12-10