目标检测论文笔记目录

发布时间：2023-12-06 04:30:48

目标检测论文笔记目录

对于目标检测方向并不是特别熟悉，本文记录一下RCNN, fast-RCNN, faster-RCNN, mask-RCNN这4篇有关目标检测的论文笔记和学习心得。

R-CNN的意思就是Region based，主要思路就是根据一张图像，提取多个region，再将每个Region输入CNN来进行特征的提取。因此RCNN就可以分为 Region proposals , Feature extraction 两个主要部分，提取的特征就可以输入任意一个分类器来进行分类。模型的流程图如下：

在训练的时候，首先使用的是已经训练好的CNN网络作为特征提取器，但是由于预训练是在分类数据集上，因此在应用到检测之前要做finetune。也就是说，为了将用ImageNet数据集训练的网络应用到新的任务（检测），新的数据集（region）上，作者将原来的CNN最后的1000类的fc层，更改为了层，代表待检测的物体的类别数。然后，对于所有的region，如果它和ground truth的重叠率大于，就认为是正类。对于分类器的训练，作者发现选择多大的IoU来区分正类和负类非常关键。并且，对于每一类，都会训练一个分类器。

框的回归非常重要，在对每一个region proposal使用分类器进行打分评价之后，作者使用一个回归器来预测一个新的框作为结果。这个回归器使用的特征是从CNN中提取的特征。回归器的训练中，输入是 region proposal 的和ground truth的，目标是学习一种变换，使得region proposal通过该变换能够接近ground truth。同时，希望这种变换拥有尺度不变性，也就是说尺度变化的话，变换不会改变。如下图所示，每一个regressor会学习一组参数，特征输入是pool 5的特征输出，拟合的目标是。

Fast-RCNN 主要解决的问题是在RCNN中对于每一个region proposal都进行特征提取，会产生非常多的冗余计算，因此可以先对一张图像进行特征提取，再根据region proposal在相应的特征上进行划分得到对应region的特征（映射关系）。这样便可以实现共享计算提高速度，但是与SPPnets不同，SPPnets在一副图像得到对应的特征后，从这张图像的特征上proposal对应的部分，采用空间金字塔池化，如下图：

RoI pooling的方法很简单，类似于空间金字塔pooling，它将proposal部分对应卷积层输出的特征（称之为RoI，因为用于做pooling的特征是 region of interest，也就是我们感兴趣的区域）划分成块，然后对每一块求最大值，最终得到了一个的特征图。可以看出，它只是空间金字塔pooling的一部分。但是SPP-nets的空间金字塔也是可以求导的，那么它到底不好在哪里呢？因为当每一个RoI都可能来源于不同的图像的时候（R-CNN和SPPnets的训练策略是从一个batch的不同图像中，分别挑选一个proposal region），SPPNets的训练非常地低效，这种低效来源于在SPPnets的训练中，每个RoI的感受野都非常地大，很可能对应了原图的整个图像，因此，得到的特征也几乎对应了整张图像，所以输入的图像也就很大。为了提高效率，Fast-RCNN首先选取个图像，再从每个图像上选择个RoI，这样的效率就比从每个图像提取一个RoI提高了倍。

为了将分类和框回归结合起来，作者采用了多任务的loss，来进行联合的训练。具体来说就是将分类的loss和框回归的loss结合起来。网络的设计上非常直接，就是将RoI得到的特征接几个FC层后，分别接不同的输出层。对应于分类部分，特征会接一个softmax输出，用于分类，对于框回归部分，会接一个输出4维特征的输出层，然后分别计算loss，用于反向传播。loss的公式如下：

回归的target可以参考前面的R-CNN部分。

notes

为什么比fast还fast呢？主要原因是在这篇论文中提出了一个新的层：RPN（region proposal networks）用于替代之前的selective search。这个层还可以在GPU上运算来提高速度。 RPN的目的：

为了能够进行region proposal，作者使用了一个小的网络，在基础的卷积层输出的特征上进行滑动，这个网络输入大小为，输入后会映射（用的卷积）为一个固定长度的特征向量，然后接两个并联的fc层（用的卷积层代替），这两个fc层，一个为box-regressoin，一个为box-classification。如下图：

在每一个滑动窗口（可以参考），为了考虑到尽可能多的框的情况，作者设计了anchors来作为region proposal。anchors就是对于每一个滑动窗口的中心位置，在该位置对应的原图位置的基础上，按照不同的尺度，长宽比例框出个不同的区域。然后根据这些anchors对应的原始图像位置以及区域，和ground truth，就可以给每一个滑动窗口的每一个anchor进行标记，也就是赋予label，满足一定条件标记为正类（比如和ground truth重叠大于一个值），一定条件为负类。对于正类，就可以根据ground truth和该anchor对应的原图的区域之间的变换关系（参考前面的R-CNN的框回归），得到回归器中的目标，用于训练。也就是论文中的loss function部分：

自然地，也就要求RPN的两个并联的FC层一个输出2k个值用于表示这k个anchor对应的区域的正类，负类的概率，另一个输出4k个值，用于表示框回归的变换的预测值。

对于整个网络的训练，作者采用了一种叫做 4-step Alternating Training 的方法。具体可以参考论文。

与之前的检测任务稍有不同，mask r-cnn的任务是做instance segmentation。因此，它需要对每一个像素点进行分类。与Faster R-CNN不同，Faster R-CNN对每一个候选框产生两个输出，一个是类别，一个是bounding box的offset。Mask R-CNN新增加了一个输出，作为物体的mask。这个mask类似于ps中的蒙版。

与Faster R-CNN类似的是，Mask R-CNN同样采用RPN来进行Region Proposal。但是在之后，对于每一个RoI，mask r-cnn还输出了一个二值化的mask。

不像类别，框回归，输出都可以是一个向量，mask必须保持一定的空间信息。因此，作者采用FCN来从每个RoI中预测一个的mask。

由于属于像素级别的预测问题，就需要RoI能够在进行特征提取的时候保持住空间信息，至少在像素级别上能够对应起来。因此，传统的取最大值的方法就显得不合适。 RoI Pooling，经历了两个量化的过程：第一个：从roi proposal到feature map的映射过程。第二个：从feature map划分成7*7的bin，每个bin使用max pooling。

为此，作者使用了RoIAlign。如下图

为了避免上面提到的量化过程

可以参考

作者使用ResNet作为基础的特征提取的网络。对于预测类别，回归框，mask的网络使用如下图结构：

整体看完这几篇大佬的论文，虽说没有弄清楚每一个实现细节，但是大体上了解了算法的思路。可以看出，出发点都源于深度神经网络在特征提取上的卓越能力，因此一众大神试图将这种能力应用在检测问题中。从R-CNN中简单地用于特征提取，到为了提高速度减少计算的Fast R-CNN，再到为了将region proposal集成进入整个模型中，并且利用GPU加速的RPN，也就是Faster R-CNN。再到为了应用于instance segmentation任务中，设计的RoIAlign和mask。包括bounding box regression，pooling层的设计，训练方法的选择，loss的设计等等细节，无一不体现了大师们的思考和创造力。可能在我们这些“拿来”者的眼中，这些方法都显得“理所应当”和巧妙，好用，但是，它们背后隐藏的选择和这些选择的思考却更值得我们学习。以及，对待每一个问题，如何设计出合理的解决方案，以及方案的效率，通用性，更是应该我们努力的方向。

肺结节检测论文笔记

肺部炎症是呼吸系统的常见病，主要是由细菌、病毒或某些特殊病因所引起的肺部炎症。下面是我带来的关于肺部炎症的X线表现的内容，欢迎阅读参考!

(一)大叶性肺炎

[图像特征]

X线正位胸片：

(1)左上肺可见大片高密度影，密度均匀;

(2)病灶边界欠清楚。

CT平扫(肺窗)：

(1)右肺下叶背段大片高密度影，病变累及整个肺段;

(2)内可见通气支气管;

(3)左肺下叶见小片状高密度影，境界清。

[影像诊断] 左肺上叶大叶性肺炎;两肺下叶大叶性肺炎，右肺下叶背段较明显。

[临床提醒] X线胸片及CT均可用于大叶性肺炎的诊断，胸片较CT在临床的应用更为广泛。大叶性肺炎典型的影像表现为累及整个肺叶或肺段的实变影，受累肺叶或肺段的体积不缩小，内可见“含气支气管征”。结合典型的影像学表现及临床症状和相关实验室检查，诊断本病较容易，但因抗生素的广泛使用，典型的大叶性肺炎已不常见，偶见于老年人、使用免疫抑制剂等免疫力低下的病人。大叶性肺炎早期在X线上缺乏特异征象，部分可表现正常。CT可显示肺炎早期的充血改变，并能更好的显示病变的范围。

X线胸片及CT检查的目的还在于及时反映病情变化，从而观察治疗效果，指导临床治疗。

(二)支气管肺炎

[图像特征]

X线正位胸片：左下肺见小片状模糊影，左侧心缘模糊不清。

CT平扫(肺窗)：两下肺见多发斑片状高密度影，呈局灶性分布。

[影像诊断] 两下肺支气管肺炎。

[临床提醒] 支气管肺炎的X线表现多样，大多数表现为两下肺野中、内带沿支气管分布的不规则斑点状或小片状致密影，境界较模糊。病变密度不均匀，中心密度较高，多伴有肺纹理增粗。病变可以比较散在且较小，也可集中呈大片融合趋势，但多不局限于某一肺段或肺叶。由于粘液堵塞支气管，病变区域可夹杂有小叶性肺不张或局限性肺气肿。当细支气管阻塞时，也可形成小三角形肺不张影。小儿多首先发生在脊柱旁，然后向心缘发展，因此早期易被心影所掩盖。CT是本病的主要检查手段，结合病史一般能够确诊。少数病例仅表现为不规则粟粒样病变或仅为肺纹理增强。此时，影像诊断比较困难。

(三)病毒性肺炎

[图像特征]

X线正位胸片：

(1)两肺纹理增加，以两下肺野中内带明显;

(2)沿肺纹理分布见密度不均匀斑片状模糊阴影。

CT平扫(肺窗)：

(1)两上肺纹理增多、增粗;

(2)两肺上叶散在小斑片状高密度影。

CT平扫(肺窗)：

(1)两下肺纹理增多、增粗;

(2)两肺下叶散在小斑片状高密度影，左肺下叶外带见多发小结节影，边缘模糊。

[影像诊断] 病毒性肺炎.

[临床提醒] 病毒性肺炎在肺内蔓延方式与细菌性支气管肺炎类似。其影像表现有：①分布于两下肺野中内带的小结节影，结节大小6～8mm，边缘模糊;②分布于两肺中下野内带，密度不均匀斑片状模糊影;③相邻小叶的斑片影可融合成大片状阴影，占据肺段甚至肺叶。病毒性肺炎在影像学上很难与细菌性肺炎鉴别，两者鉴别常需结合临床症状及相关化验检查;另外，通过观察抗炎治疗效果，也有助于两者鉴别。病毒性肺炎的影像表现缺乏特异性，因此影像学检查的目的在于发现病变、观察疗效及排除其他肺部疾病。

(四)过敏性肺炎

[图像特征]

CT平扫：右上肺外带多发小斑片状模糊影，境界欠清。

CT平扫：两周后检查，原病灶消失，右肺下叶可见片状模糊影，边界欠清。

[影像诊断] 过敏性肺炎。

[临床提醒] 过敏性肺炎的影像表现有：①一侧或两侧肺中、下野沿支气管分布的斑片状或云雾状阴影;②两肺弥漫分布的粟粒状和网线状阴影，边缘模糊，以中、下肺野病灶较密集;③病变呈游走性，即在短时间内，处病灶吸收，另一处病灶又出现，为本病特征性的X线表现。结合病人对过敏原的过敏史，可确立诊断。

(五)肺脓肿

[图像特征]

X线正位胸片：

(1)左肺中野可见一类圆形透亮影，为空洞性病灶;

(2)空洞壁厚，外缘毛糙，内壁较光整。

CT平扫(肺窗)：

(1)左肺上叶见含气透亮影，内可见液平;

(2)壁厚，内壁光整;

(3)空洞外侧邻近肺野见小片状模糊影。

CT增强(纵隔窗)：

(1)左肺下叶见类圆形含气透亮影，内可见液平;

(2)壁厚，见强化;

(3)病灶右后方见小片状高密度影，提示肺实变。

[影像诊断] 左肺肺脓肿。

[临床提醒] 胸片及CT发现肺内含液平的厚壁空洞，结合畏寒、发热、胸痛及咯大量脓臭痰等临床症状，肺脓肿的诊断叮确立。胸片基本可以反映肺脓肿的影像特征，急性期肺脓肿表现为浓密的团状阴影中见厚壁的透亮空洞，内壁多光滑，空洞内见气一液平面;慢性期肺脓肿空洞变小，壁变薄，空洞周围见纤维索条。CT则较易显示肺脓肿的早期坏死液化情况，能及早确立诊断。

肺脓肿空洞在临床上常需与肺结核空洞、肺癌空洞鉴别。结核空洞有其好发部位(上叶尖、后段，下叶背段)，空洞较小，壁薄，周围常见卫星灶;肺癌空洞壁厚，多为偏心空洞，内壁不规则，外壁可见毛刺。CT增强检查能为鉴别诊断提供更多的帮助，参照临床症状及相关实验室检查，三者鉴别不难。

(六)肺部炎性假瘤

[图像特征]

X线正位胸片：

(1)右下肺内带见片状高密度影;

(2)病灶与右心缘重叠，显示欠清。

X线右侧位胸片：

(1)病灶位于右肺下叶后基底段，与脊柱重叠，密度欠均匀;

(2)病灶可见分叶，边缘毛糙。

CT平扫(肺窗)：

(1)右下肺见高密度占位;

(2)病灶形态不规则，边缘可见长短不一的条状毛刺。

CT增强(纵隔窗)：

(1)病灶不均匀强化，其内见低密度坏死区;

(2)边缘不光整，见棘状突起，内侧缘与胸膜粘连。

[影像诊断] 右肺下叶炎性假瘤。

[临床提醒] 肺部炎性假瘤是在某些非特异性炎症的增生、帆化基础上进一步发展而成。因此既往有肺炎病史的患者，胸片及CT发现肺内软组织肿块，再结合患者咳嗽、胸痛等症状，基本可诊断本病。当肺部炎性假瘤患者肺炎病史不明确时，X线胸片或CT发现肺内软组织肿块，需与结核瘤和周围型肺癌鉴别。炎性假瘤X线表现为圆形或椭圆形软组织块影，边缘多光滑锐利，密度中等偏高，多数密度均匀，偶有钙化，少数见空洞形成，周围有纤维索条影或斑片状阴影，常伴有局限性胸膜增厚、粘连。追踪观察，炎性假瘤生长多较缓慢;结核瘤内常见钙化影，密度较高，周围散在卫星灶;周围型肺癌常表现为分叶状肿块，其边缘可见细短毛刺，发现肺门或纵隔淋巴结肿大则有助于两者的鉴别。

CT检查(尤其是HRCT)可更清楚显示软组织块影的内部密度及周围情况，对于肺门及纵隔淋巴结是否肿大显示更佳。另外，CT动态增强可为肺炎性假瘤的鉴别诊断提供更多的信息。

参考文献

[1] 陈文彬,潘祥林,等.诊断学.第6版.人民卫生出版社，2004,9,(第6版).

[2] 戴瑞鸿.内科疾病诊断标准.上海：上海科技教育出版社，～198.

猜你喜欢：

1. 气胸的最佳治疗方法

2. 肺部小结节怎么形成的

3. 肺部感染如何治疗

4. 肺结节什么原因形成的

5. 肺炎的早期症状

随着人们生活水平及肺部CT在健康筛查中的运用，定期体检已成为常规。当拿到体检报告时，很多人为报告上的肺部“磨玻璃影”和“小结节”字样而纠结不已。

中医学上并没有“肺结节”之名，现代多认为本病应类属于“咳嗽”、“痰核”“瘰疬”等范畴。本病多为气虚痰瘀痹阻肺络。劳逸失度、外感六淫、饮食失宜、情志内伤、禀赋不足等皆可导致气滞水停而为痰，痰气互结，日久血行受阻而成瘀，由表及里，侵及肺胸，痰瘀痹阻肺络而发为结节。

肺结节除了随访，还可以做什么？

提起肺结节的治疗，目前临床上主要的治疗方法就是对于首次发现肺结节的患者，实行抗生素治疗，不能消失的结节，进行密切随访，具体随访间隔时长由经诊医生根据病史及检查结果综合判断，肺癌高危结节应该缩短随访时间。

然后等这些结节长大，再进行手术切除。可手术切除也有它的弊端，就是对身体伤害大，后遗症比较多，难以耐受。

这时候肺部结节患者在随访观察期间及早采取中医药治疗干预措施，对于控制结节发展、降低肺癌发病率具有重要意义。

2017年9月的某一天，在延边市中心的医院，周女士检测出肺部结节。左肺舌段见结节状致密影，直径约，右肺中叶索条状致密影。

在这之前,北京四惠西区医院中医肿瘤专家张文彭主任的一位患者周女士的身体很健康，平时在家休息没有任何症状，只是干活多了就会感到胸闷，气喘吁吁，少咳。周女士认为这是干活劳累所致，并没有放在心上，简单休息后继续干活，胸闷气喘就休息一会，反反复复。后来就发展到清晨会有白痰，活干多了会感到胸部有轻微疼痛，他才感到身体是出了问题，就去医院检查一下。

等待随访期，何不尝试中医调理看看

拿到检查报告，医生告诉她，这是肺结节的初期。建议她定期观察，然后等这些结节长大，再进行手术切除。她和家人商量过后，认为在这个等待期间何不用中医药调理看看。于是便找到我看诊。

我看到周女士时，她还伴随着些许咳嗽。于是在中医辨证原则下，通过分析、综合，辨清疾病的病因、性质、部位，以及周女士身体邪正之间的关系，进行论治，开出中药和真菌的处方。

服药后，好消息频频传来

在周女士服药期间，我也在不断地关切着周女士的病情。很快到了10月30日复诊日期，她表示在服用组方后，已经没有了咳嗽，痰也减少了，最大的好转是胸部不再疼痛。

又接着服中药2个月，喜讯传来。经过不间断地坚持服药，周女士的病慢慢好转，11月29日周女士去医院做了CT扫描检查。扫描结果显示，周女士的左肺舌段结节影，已经吸收，消掉了。

【温馨提示】中医讲辨证论治，一人一方，因人施治，因地制宜，千人千方！切勿照搬照抄他人“良方”！

日常生活当中查出肺结节的人越来越多，这是因为现在的医疗设施都非常先进，对于微小的病灶能够很清楚地检测出来。

现在人们对身体的健康非常重视，所以更容易发现这类疾病，大多数的肺结节都属于良性的，只要谨遵医嘱按时复查，不会癌变。

如果不定期体检的话，那么如何才能知道肺部长有结节呢？其实背结节患者在晚上的时候身体会出现一些症状，下面我们一起来看一下。

睡觉不安稳，出汗较多

结节的出现会影响肺气的运行，导致肺脏虚弱，凌晨3:00~5:00，肺经比较活跃，结节会影响肺经的正常活跃。

所以说肺结节患者睡眠不是很好，容易半夜醒来，身上还会大量出汗，出汗并不是因为热，而是因为身体虚弱出现的盗汗。

食欲下降

肺结节患者在晚上的时候会出现食欲不振的情况，这是因为肺结节会影响体内阳气的分泌，如果阳气不足会导致食欲下降和消化不良的问题。所以当发现食欲下降，没有精神的话就要引起重视了，可能是因为被结节导致的。

呼吸不顺畅、胸口闷闷的

正常情况下，我们在睡觉的时候呼吸会比较顺畅，只有压到胸口才会感觉到胸闷，没有压到胸口的话，不会有呼吸不顺畅的表现。

如果半夜睡觉的时候感觉胸闷气短，并且不止一次出现，那么就要提高警惕了，可能是肺部出现了结节，也可能是肺部有炎症，不管什么原因都要尽快去医院做肺CT检查。

咳嗽带痰

生活中难免会感冒发烧，也难免会咳嗽，有时会咳中带痰，但是吃药后就能得到缓解，如果吃药后咳嗽的症状没有改善，就可能是肺结节引起的。

如果咳嗽的时候咳出一大块脓状的痰，说明肺部存在结节了，结节的出现会导致大脑神经元过度兴奋，支气管出现收缩和扩张，会将肺部的纤维毛通过咳嗽的方式排出。

临床上，根据肺结节阴影的不同表现，主要分为3类，实性结节、混杂性磨玻璃样结节、纯磨玻璃密度结节。

实性结节恶性相对较高，混杂性结节大多数为恶性，少数为良性。纯玻璃密度结节大多为炎性结节，小部分为恶性。

判断结节会否恶变，一般有以下四个特征：

1、结节越大，恶性可能越大

2、结节长得越“古怪”，恶性可能越大，比如有分叶、毛刺、胸膜牵拉、含气细支气管征和小泡征、偏心厚壁空洞等

3、结节位于上叶，尤其是右肺上叶

4、结节增长速度越快，恶性可能越大

调整所处环境

如果一直呼吸污染的空气，气体进入肺部后就容易诱发肺结节，想要预防肺结节，可以在室内摆放一些绿色的植物，能够使室内的环境更加清新。

微生物感染时及时治疗，减少重体力劳动

如果患有流行性感冒不及时治疗的话，会导致体内的病菌感染出现扩散症状，扩散至肺部的时候就会诱发呼吸系统方面的疾病。

人体在重体力劳动下身体会消耗较多能量，免疫力也会下降，患病的几率就会上升，所以说经常进行剧烈运动或者长期劳累的情况下，会诱发肺部结节。

减少对烟雾、灰尘、汽油、车尾气等物质的接触

这些物质当中含有非特异性离化因子，汽油和汽车尾气当中还含有一定的化学成分，经常吸入这些气体会对呼吸道的感觉神经末梢造成刺激，产生咳嗽的症状，还可能诱发肺结节。

尽我所知所解，无偿提供于你，就为了你能正确面对肺结节而不被忽悠！

前言：肺结节的发现是越来越多，这主要拜高分辨率的CT普及所致，也可能与空气污染、生活节奏、不良生活方式、精神压力、遗传易感性等诸多综合因素有关。但因为目前的肺癌治疗指南滞后于临床，又因大医院过度扩张与绩效考核等制度设计的不合理，过度检查与过度治疗泛滥，在肺结节诊断与治疗领域乱象明显。从临床来看，以磨玻璃为表现的肺癌与传统肺癌有着明显不同的生物学行为，对它们的处理若参照传统肺癌的观点可能会带来偏差，不利于肺结节患者。本文从个人临床经验与多年致力观察总结肺结节诊断与治疗的角度出发，尝试做一个相对全面的总结，供广大肺结节病友就诊时参考，也供同道交流，目前是想为肺结节诊治尽点绵薄之力。本文只述纯磨玻璃结节。

（一）概念

肺磨玻璃结节是指CT上边界清楚或不清楚的肺内密度增高影，其病变密度不足以掩盖其中走行的血管及支气管影。它的性质可能是恶性肿瘤、良性肿瘤、炎症、肺间质性疾病或肺内淋巴结等。其病理基础是肺泡隔增厚或部分肺泡腔充满液体、细胞或组织碎片。如果病灶内含有实性的成份，则为混合磨玻璃结节，混合磨玻璃结节若抗炎治疗无好转，则有较大可能是肿瘤性质的，处理上要较纯磨玻璃结节更积极。

（二）病因

官方些的说法：肺结节或肿瘤发生率高是多种因素综合作用的结果，预防肺癌，从戒烟开始。目前比较流行的说法是三霾五气，包括雾霾、烟霾、心理有阴霾；大气污染、烟气污染、厨房油烟气污染、装修材料释放的气体污染以及爱生闷气等。对大众宣传来讲，这些是能注意到的，比如戒烟，比如注意环境整治，改善大气污染，还大家绿水青山；比如改善厨房吸排油烟的设备；比如装修后延迟入住并经过专业机构检测；比如都大家行善，要看的开，少生气等等，这些都是积极有益的，所以我们讲，肺癌可防可控。但真的肺结节与肺癌就是这些因素引起的吗？注意到这些方面就能防止发生肺癌吗？个人其实也常持怀疑态度，但也参不透到底是什么原因。后来看到一篇文章，题目是肺磨玻璃结节的来源（孙希文教授），文章中也从吸烟、油烟、环境污染、生活方式、遗传等各方面进行了分析，总之也持怀疑态度。这么大牌的教授也认为这些原因其实并不一定是真正的原因，所以我在这里说说自己的观点：其实，肺磨玻璃结节或肺癌的发生难以以单一的因素来解释发生的原因，我的猜想是：农药的广泛使用、转基因食品及其产品的广泛应用、装修材料污染、工作压力大休息不足、汽车尾汽与大气污染的推波助澜、心理问题增多结合遗传易感性等一系列综合因素作用的结果。这其中，农药的广泛使用、转基因食品及其制品可能是重要的因素。它们对机体的毒害作用肯定是经历几十年或影响某一代人的。现在到田间地头看看，小小的一块地里，整袋整袋的化肥等待着施到地里去，难道它们不会对机体造成影响吗？虽然过程也许是漫长的。小时候田里的哇声现在都没有了，以前你辈锄草是重要内容，现在也不用了，药一喷就不长草了，药水都到了土壤里，年年在用，它们总会以自己的方式回馈我们！

（三）病理

先来看一张图，这是总的分类，首先是浸润前病变（包括非典型腺瘤样增生与原位腺癌），其次是微浸润性腺癌（贴壁状生长为主），再次是浸润性腺癌（有贴壁状生长、腺泡性生长及乳头状或微乳头状生长）：

非典型腺瘤样增生（AAH）

病理特点：通常 cm（不绝对的），可以单个或多个孤立性病灶肿瘤细胞沿肺泡壁呈贴壁状生长，与周围正常肺组织有连续，细胞轻－中度非典型，排列较疏松，细胞间有裂隙；生长非常缓慢；

注意：AAH与AIS可是一个连续过程，有时仅凭细胞学难以区分

可以理解为：细胞已经不是正常形态，但还没见到典型癌细胞，是癌前病变；可以观察不手术，若因无法除外浸润性病变而进行了手术，只局部切除就行，切除后不会复发或转移。

原位腺癌（AIS）

病理特点：肿瘤细胞严格地沿着以前存在的肺泡结构生长（贴壁状生长），缺乏间质、血管和胸膜侵犯。与AAH不同点在于细胞密度增加，细胞之间缺乏间隙，与周围正常肺组织界限非常清楚。AIS分为非粘液性和粘液性两型，后者极罕见，可为纯磨玻璃结节或混合磨玻璃结节（相对密度较高），大小 2cm，生长慢；病灶增大或密度增高，可能向浸润型腺癌进展 10mm；粘液型AIS通常表现为实性或大部分实性病变

可以理解为：已经是肺癌了，见到癌细胞，但局限而没有突破肺泡壁；可以观察不手术，若因无法除外浸润性病变而进行了手术，局部切除就行，切除后不会复发或转移。

微浸润性腺癌（MIA）

病理特点：是一种以贴壁状生长为主的孤立性小腺癌（ 3cm），任何一个病灶浸润的最大直径 cm；通常表现为部分实性结节，即主要为毛玻璃成分的中央有一 5mm的实性区。

可以理解为：已经是肺癌，而且有浸润（会向外侵犯），但距离还很短，不会远处转移。需要手术切除；可以亚肺叶切除（楔形切除或肺段切除）；切除后几乎不会复发或转移。

浸润性腺癌（IAC）

病理特点：肿瘤浸润灶最大直径。分为：1、贴壁状生长为主的浸润性腺癌（LPA）：与其它组织学亚型为主浸润性腺癌相比，其预后较好。I期LPA的5年无复发生存率达90%；2、腺泡性为主的浸润性腺癌：圆形或卵圆形腺样构型，腺腔内或瘤细胞内可含有粘液；3、乳头状为主的浸润性腺癌；4、微乳头状为主的浸润性腺癌：此型具有较强的侵袭行为，易发生早期转移。与实性为主腺癌一样，预后很差；5、实性为主的浸润性腺癌；6、浸润性腺癌变异型：少见，此处略去。

可以理解为：我们平常或以前所说的肺癌，恶性度相对较高，有复发或转移风险；需积极手术治疗。

需要注意的是：纯磨玻璃结节在病理可以是上述AAH、AIS、MIA以及浸润性腺癌（贴壁生长型）中任何一种类型。当然绝大部分为腺瘤样不典型增生或原位腺癌，这两者都属于浸润前病变，没有风险，若能在术前确定甚至可不用手术或干预。如果是微浸润性腺癌也可局部切除就能达到治愈的目的。若真是浸润性腺癌贴壁生长型，虽然符合浸润性的病理表现，但仍从来没有发现转移的病例，也就是说仍是经过手术切除治疗基本就能治愈的。

（四）临床表现

肺磨玻璃结节都是无意中检查时或体检时发现，没有临床症状。有的有胸闷或咳嗽不适去检查发现磨玻璃结节，症状也非由于该结节引起。当然如果挺大的磨玻璃结节也不排除可能会稍有症状，比如咳嗽等。

（五）辅助检查

对于肺磨玻璃结节，最主要的检查手段是胸部CT平扫，如果结节较小，细节显示不清，可以加行病灶所在肺叶的靶扫描与重建。它能从各个方向显示病灶形态、边缘、与周围血管支气管的关系等细节。要注意的是非薄层扫描的CT不能准确诊断磨玻璃结节，比如5毫米层厚的扫描可能只扫到结节的外围区域，此时可能显示的是磨玻璃影，但薄层扫描后就会显示是实性结节。

此外需要注意的是：增强CT与PET-CT对于纯磨玻璃结节没有诊断价值，因为它们都是依病灶血供是否丰富为基础的，但纯磨玻璃结节基本上不大会有明显的足以让造影剂可显示出的丰富血供。

普通气管镜一般也到不了磨玻璃结节所在的位置，意义同样有限。

血液检查肿瘤指标基本上不可能有异常。但如果已经查了肿瘤指标显示正常，却根本不能以此为依据排除该病灶是早期肺癌。

（六）良恶性的判断

磨玻璃结节不能等同于肺癌，但从临床观察总结上千例的影像资料来看，以下几点比较可靠：

总之，肺磨玻璃结节有部分是早期肺癌，有的不是，两者不能等同。

（七）随访策略

目前最不统一，最乱的就是纯磨玻璃结节为表现的肺癌了，有让观察、有让手术、有让楔切、有让段切、有让叶切，甚至还有术后让病人基因检测或吃靶向药或化疗的都有。既然纯磨玻璃表现的都是早期肺癌，而且临床从来都没有碰到过有转移的，那么随访观察肯定是安全的。所以：

1、 1厘米以下的纯磨玻璃结节先不要开，半年或一年复查（个人建议应该半年）。1-2厘米的纯磨玻璃结节视结节位置，如果可以楔切的部位则建议楔切；楔切偏深，但能肺段切除的部位则建议段切；若只能肺叶切除的部位则建议先不要切（因为随访到进展或出现实性成份，反正也是肺叶切除，迟个2年、3年，也许有的可迟个4-5年再来开，至少这几年肺功能维护更好，也没有手术导致的相应不适）。能亚肺叶切的部位之所以又要建议切，那是为了保留更多的肺组织，早切可亚肺叶，进展了切可能就得肺叶，所以要早切。况且病灶能长到1-2厘米，接下来的时间段时（几年不一定）肯定会继续进展，迟早是要切的。如果病灶大于2厘米时，虽然也有专家认为可继续安全随访，但我的意见则可以开了，就像前面说的，病灶总是从小长到大的，既然发现时已经有2厘米以上了，再随访下去，迟早是要再进展的，而目前的指南亚肺叶切除的首要条件是小于2厘米，所以建议发现即可切。但个人以为，只要是纯磨玻璃结节，仍不建议都肺叶切除，能楔切与段切的仍可选择亚肺叶（这与指南不符合，但临床来看，效果没有区别的，因为纯磨从未发现转移）。汇总一下，就是下面这张表格的意见：

2、随访进展的纯磨玻璃结节，密度的增加或出现实性成份需立即干预，而仅范围的扩大，则仍可安全随访，具体到多大该手术了，参照上一段的内容。相对来说，经过随访有进展的，可以稍微积极点，因为已经有增大了的话，再等也总是会继续增大的。

3、多发磨玻璃结节的干预要更加保守，因为你切了目前的病灶，还会有新的病灶长出来或者小的大起来，所以对于多发的，应该随访到有出现实性成分了，也就是说再不干预有危险了，那得处理，而且优选楔切或肺段切除。真的如果实在太多，那只处理主病灶，其他能兼顾的兼顾一下，兼顾不到的次病灶则留着观察随访。

（八）手术治疗

我们先来看肺癌治疗指南对于手术方式的推荐：

文中说“解剖性肺切除仍是标准术式，且目前早期肺癌的标准术式仍是解剖性肺叶切除”。这是一个基本，所以在这个指南的批引下，只要病理是肺癌，包括原位腺癌、微浸润性腺癌及浸润性腺癌，医生若做肺叶切除均不违反原则，都是可以的，甚至在部分非典型增生，若位置不佳或已经经过随访持续存在，无法除外肿瘤，行了肺叶切除也不能说错。这正是导致目前肺磨玻璃结节病理上是早期肺癌时乱象丛生的根本所在。如果符合（一）肺功能无法耐受肺叶切除；（二）直径小于2厘米且具备“原位腺癌或微浸润腺癌、磨玻璃成分大于50%、倍增时间大于400天”其中之一，则可选择亚肺叶切除，相比楔形切除更推荐肺段切除。但我一直觉得，段切是不是必要？是一个值得推广的手术方式吗？假如其实段切与楔切一样效果的情况下，把一个不必要的手术做成精品，从对患者的创伤以及医保资金支出方面来讲，从可能发生的意外和并发症来讲，真的是合适的吗？假如病灶确实只位于局部，没有肺内的气腔播散，也无肺门、纵隔淋巴结转移，也无第12-14组的淋巴结转移，那么楔切、段切或肺叶切除三种手术切除的方式从治疗效果上来看是没有区别的。但在我们医院组，均单孔胸腔镜下手术时，目前楔形切除手术大致5-10分钟、肺段切除小时左右、肺叶切除小时左右，如果显露不好或淋巴结比较难分可能会有所增加，若解剖发育非常好，可能会更短时间。手术费用则楔切约2万左右，肺段约万左右，肺叶4万左右（因为肺段用的器械更多）。术后住院楔形切除术后1-3天，肺段5-7天，肺叶也差不多5-7天。大家算算，当治疗效果一样的情况下，哪个是优选，而且风险楔切几乎没什么大的风险。若术前诊断早期肺癌，影像上是纯磨玻璃结节（不管它是AAH、AIS抑或MIA，甚至浸润性腺癌，只要影像上是纯磨，纯磨从来没有碰到转移的），那么：如果没有转移的纯磨，楔切就够了；如果存在转移的纯磨，肺段反正也不够！肺段切除则适合以下情况：如果楔切比较大范围，基本接近肺段需要切除的范围了，做段切余肺舒展更好；如果位置在肺段段门附近，楔切比较难以企及，而段切能肯定切在里面；如果肺功能欠佳的实性结节，肺段也是妥协性的手术方式。还有一种情况就是，楔切有时病灶不一定能在切下标本的中央，但若联合亚段切除倒时非常好，总让病灶在切下标本的中央部位，保证切缘（实际我还想，若没有气腔内播散，切比若已阴性，距离2厘米以上或大于病灶直径，意义何在呢？)

（九）术后辅助治疗问题

当手术后病理报告纯磨玻璃结节是腺瘤样不典型增生、原位腺癌或微浸润性腺癌时，因为不存在转移复发风险，根本不需基因检测与相应的靶向治疗，也不需要放疗、化疗或免疫治疗。中药的治疗从调理身体方面考虑可以采用，但从随访肿瘤发生方面目前无确切证据能有显著效果。虽然我一直觉得肿瘤治疗的最终出路在中药，因为中医讲究天人合一、万物相生相克，有此病症，肯定有克它的药物，也虽然有中药治好肿瘤的个案，但目前的中医水平仍无法大规模复制治疗成功的个案。

如果是浸润性腺癌，纯磨玻璃结节基本上只可能是贴壁生长型的浸润性腺癌。传统肺癌的术后辅助治疗主要用在2A期以后的病例以及部分有高危因素的1B期病例，对于早期肺癌中的1A期是明确不需术后辅助治疗的。

所以磨玻璃结节肺癌都是1A期的，即使是浸润性腺癌，也不需术后辅助治疗。若为多原发磨玻璃肺癌，因为单个评估也都是1A期，应该同样不需要术后辅助治疗。何况此类肺癌多为惰性，也有研究表明化疗对磨玻璃结节肺癌无效：

目前临床在用的辅助治疗，包括化疗、靶向治疗、免疫治疗等方法都是针对晚期肺癌的，或者术后考虑中期有较大复发转移风险的。如果将它们用在早期肺癌病人的身上，或者用对付晚期肺癌的方法来治疗手术无法切除干净的磨玻璃结节多原发肺癌，显然是荒唐的。治疗多少时间？几个周期？如何评估？你不用药仅观察纯磨都可长期不进展，难道你能说病人活了超过5年是这些全身治疗措施的功效？

（十）关于多原发癌问题

近几年碰到的病例，特别是肺磨玻璃结节为表现的早期肺癌，多原发的比例非常高，包括同时性的，也包括异时性的。它们的生物学行为与传统意义的肺癌明显不同。业内称之为懒癌，也就是说发展非常缓慢，5年生存率甚至不用干预都基本能达95%以上（没查文献，自己随便估的），如果及时干预，预后明显好于传统肺癌。

现在的指南中针对多原发癌的表述，只是总纲，是原则上的表达，真到具体病例上如何操作对待，变数过大。比如：主病灶如何确定？是按密度，还是按大小？怎样的主病灶需要处理干预？次病灶1处、2处与N处有没有区别？主病灶处理后，次病灶该如何？建议随访，但若进展如何？肺功能好的病人是否再手术，肺功能差的是化疗，还是靶向治疗，抑或免疫治疗？主病灶确定为肺癌后，有没有必要通过基因检测确定有无靶点，针对次病灶的靶向与免疫用药是否可行？效果如何？能否治愈次病灶？如果不能，予以相应治疗是否有意义或有价值……

多发实性或多发混合磨玻璃的按传统意见处理便可。我们在本文中要讨论的多原发磨玻璃结节都是纯磨，这是最乱的领域。我的考虑是：

1、主病灶在1厘米以上：

2、所有病灶都在亚厘米大小：

此时若个别为8、9毫米，另一些5-7毫米，还有一些更小的5毫米以下，那么我们不能认为最大的就是主病灶，并没有到应该处理干预的阶段（对于多原发癌来说）。个人意见这种情况下进行手术切除较大的结节，甚至做肺段或肺叶切除（为求同时切除与所谓主病灶在同叶的其他结节）并没有临床价值，因为它仍有许多稍小的纯磨玻璃结了，反正仍得随访，仍担心事，仍有可能进展。而不切它，它也是极缓慢进展或不进展，手术没有达到控制疾病、治愈疾病的目的，却经历创伤，损失肺功能。

（十一）磨玻璃肺癌术后的随访问题

我们知道，检查发现磨玻璃结节，需定期复查，若有进展要手术。随访间隔视结节大小与密度综合考虑。假如是亚厘米结节（多发或单发均可），每6-12有月复查，结果发现增大了，达2厘米以上了，予以肺段切除，病理证实肺癌。那么随访意见按目前的肺癌指南（没有专门针对磨玻璃结节肺癌的），该如何随访：

看见了吗？前3年每3-6个月复查，如果医生选择每3个月，则比手术前检查的更勤快了！你说这指南能用在磨玻璃肺癌上吗？所以我的意见是：术后已经没有病灶的，年度复查（其实也可2年复查，但正常人群的单位体检都是一年一次，一个肺癌术后的病人难道还2年查一次，总觉得不对）；术后仍有次病灶在的，视病灶大小半年或一年查一次，直到永远！如果不是为了体检，只为肺癌有没有转移，则根本不用查其他脏器的彩超、CT、MRI或PET-CT。肺部CT的复查也为观察尚存的纯磨结节有没有进展而已。

中国这么多病例，磨玻璃结节肺癌相对于传统肺癌是个全新的领域，真的需要我们做更多的工作，提出自己的见解，引领世界范围磨玻璃结节的诊断、治疗与基础研究，因为我们病人多，量大！制定专门针对肺磨玻璃结节的国内治疗指南，刻不容缓！

# 健康守护者#

检测论文目录

问题一：知网论文查重，会查我目录页吗一般知网论文查重，是你提交什么文件就是检测什么文件的。如果你提交的论文里带了目录部分，则会检测目录部分。关于知网查重的内容，一般学校都会有具体规定检测什么内容。如果没有规定的话就是全文检测，包括目录、摘要、正文、致谢和参考文献这五部分。问题二：我想问下，我参考别人论文的大致目录来写论文，里面还是不一样的，这样能查重的时候查出来吗查重不过是对比一般每个数据库有不同的标准，比如连续多少个字相同就算，但是你用自己的话说出了别人的意思，只要字顺序不一样，是查不出来的问题三：论文查重是只查正文吗，目录和参考文献查不查啊会查的。目录是由正文里的标题产生的，查正文的时候会查标题；参考文献重复一些是没问题的，不能重复太多，比如90%都一样就不行。问题四：毕业论文检测是不包括摘要、目录，只检测正文吗？检测正文和检测全文的重复率会不会不一样？ 5分检测的内容字数都是影响你的重查率的，一般建议全部都要检测一边，这样会得到的结果也是精准的。问题五：目录不计入查重,但需要在论文中是什么意思目录不计入查重,但需要在论文中意思就是说，你提交查重的论文是需要把目录去掉的查重摘要正文等信息。而你的论文本身是必须要有目录的问题六：毕业论文查重会查摘要，目录吗一般只查内容，除了参考文献外都要查。就是从摘要查到总结。问题七：论文中查重会查目录格式一致不一致么为了点明论文的研究对象、研究内容、研究目的，对总标题加以补充、解说，有的论文还可以加副标题。非凡是一些商榷性的论文，一般都有一个副标题，如在总标题下方，添上“与××商榷”之类的副标题。另外，为了强调论文所研究的某个侧重面，也可以加副标题。如《如何看待现阶段劳动报酬的差别――也谈按劳分配中的资产阶级权利》、《开发蛋白质资源，提高蛋白质利用效率――探讨解决吃饭问题的一种发展战略》等。设置分标题的主要目的是为了清楚地显示文章的层次。有的用文字，一般都把本层次的中心内容昭然其上；也有的用数码，仅标明“一、二、三”等的顺序，起承上启下的作用。需要注重的是：无论采用哪种形式，都要紧扣所属层次的内容，以及上文与下文的联系紧密性。目录一般说来，篇幅较长的毕业论文，都没有分标题。设置分标题的论文，因其内容的层次较多，整个理论体系较庞大、复杂，故通常设目录。设置目录的目的主要是： 1．使读者能够在阅读该论文之前对全文的内容、结构有一个大致的了解，以便读者决定是读还是不读，是精读还是略读等。 2．为读者选读论文中的某个分论点时提供方便。长篇论文，除中心论点外，还有许多分论点。当读者需要进一步了解某个分论点时，就可以依靠目录而节省时间。目录一般放置在论文正文的前面，因而是论文的导读图。要使目录真正起到导读图的作用，必须注重： 1．准确。目录必须与全文的纲目相一致。也就是说，本文的标题、分标题与目录存在着一一对应的关系。 2．清楚无误。目录应逐一标注该行目录在正文中的页码。标注页码必须清楚无误。 3．完整。目录既然是论文的导读图，因而必然要求具有完整性。也就是要求文章的各项内容，都应在目录中反映出来，不得遗漏。目录有两种基本类型： 1．用文字表示的目录。 2．用数码表示的目录。这种目录较少见。但长篇大论，便于读者阅读，也有采用这种方式的。内容提要内容提要是全文内容的缩影。在这里，作者以极经济的笔墨，勾画出全文的整体面目；提出主要论点、揭示论文的研究成果、简要叙述全文的框架结构。内容提要是正文的附属部分，一般放置在论文的篇首。写作内容提要的目的在于： 1．为了使指导老师在未审阅论文全文时，先对文章的主要内容有个大体上的了解，知道研究所取得的主要成果，研究的主要逻辑顺序。 2．为了使其他读者通过阅读内容提要，就能大略了解作者所研究的问题，假如产生共鸣，则再进一步阅读全文。在这里，内容提要成了把论文推荐给众多读者的“广告”。因此，内容提要应把论文的主要观点提示出来，便于读者一看就能了解论文内容的要点。论文提要要求写得简明而又全面，不要哩嗦抓不住要点或者只是干巴巴的几条筋，缺乏说明观点的材料。内容提要可分为报道性提要和指示性提要。报道性提要，主要介绍研究的主要方法与成果以及成果分析等，对文章内容的提示较全面。指示性提要，只简要地叙述研究的成果(数据、看法、意见、结论等)，对研究手段、方法、过程等均不涉及。毕业论文一般使用指示性提要。问题八：毕业论文查重会查摘要，目录吗会，因为摘要，只要检测也会重复，所以好多同学，只上传摘要、正文和参考文献，会把目录、致谢词去掉。知网检测，就是用一定的算法将你的论文和知网数据库中已收录的论文进行对比，从而得出你论文中哪些部分涉嫌抄袭。问题九：论文目录不是自动生成会影响查重吗你好，既然标题不限你就写你最拿手的，也就是生活中你感兴味的什么东西为标题，然后写出对这东西的引见以及一些疑惑解答，学问不够就到百度搜索，很用容易的。还是搞不明白的话能够给你发些参考. 问题十：论文查重那个封面还有目录要不要弄进去论文查重是不吃醋封面的目录的 PaperRater论文查重系统查重精准度高，跟知网查重是可以比较的，查重跟知网结果是一样查重要求是最严格的论文查重系统

论文检测目录

所有都查，包括你的论文后记。所以有的抄袭完整的论文，最后这种抄袭论文发现后记中记载的故事都是一样的笑话。

我们都知道毕业论文需要查重，那么需要查论文目录吗？论文内容不重复，主要是论文正文。但即便如此，我们也要写一份好的目录。1.该目录在重复检查的范围内。即使论文查重网站没有对目录进行查重，学校在要求提交论文时也有可能对论文进行两次查重，所以要注意目录的修改和调整。目录部分也占用了一定的字符数，所以如果真的对目录部分进行查重，可能会影响论文的查重率。除了满足导师的相应要求，还需要考虑论文查重网站的查重标准，尽可能修改调整目录，减少重复部分。2.哪些部分一定不会查重？目前的论文查重软件肯定不会检查封面、声明原文、版权声明等部分，但可能会检查摘要部分，具体看学校的要求。可能有些学校也会要求开题报告，这样开题报告也会被查。3.确保目录部分的格式正常。每个学校都有格式要求，不要以为手工排版就没有问题。这样论文查重软件会直接把这部分确定为目录部分。如果担心毕业论文目录核对的问题，先把目录的格式改过来。如果学校不检查查重部分，查重软件会自动跳过，所以目录部分一定不能有格式错误。每个学校对论文查重的要求和标准都不一样，要提前了解清楚。一般学校要到最后才会说出论文的哪些部分需要查重，所以先尽量降低整篇论文的重复率。可能很多人在了解了毕业论文重复目录后，想知道哪些部分不会被查，这样不会被查的部分就不需要修改调整了。

首先，要明确一点，“摘要”，无论是中文还是英文摘要，都属于论文的正文，查重的时候一定要放在论文文档里提交。而且知网查重系统一定会识别，进行查重。其次，目录在格式正确前提下，知网查重系统对目录内容是不计入查重字数的，也不计算重复率。目录正规写法应该是：1.有明显的“目录”两个字，且单独成为一行，让知网查重系统识别到这是“目录”；2.最好是文字编辑工具（Word）自动生成的目录，这样系统最喜欢，更容易识别。至于毕业论文查重要检测哪些内容，大致情况是：目录（要放在论文中提交，尽管系统不查重）、摘要（中文、英文）、正文、致谢、参考文献（道理同“目录”）。不测的部分包括：封面、独创声明、版权声明、综述。开题报告也不会测。其实，具体测哪部分，各大高校通常会有详细的通知，看一下即可，不知道的话，就按我上面说的测，这是普遍性的。在此要提醒大家，最新版本的知网查重系统，已经升级了算法，对论文文档中图片内的文字、公式采用OCR识别算法，而且增加了“源代码库”。

1、论文目录不会查重，论文目录是可以用word手动生成的，查重的时候知网会识别论文的目录，分章节进行检测，显示每个章节的查重率，只会显示总重复率的。另外，学校的封面是不能随意更改，参考也是非常必要的，不能出错，只要合理使用格式，目录是不会参与检测，增加重复率的。 2、论文查重，把自己写好的论文通过论文检测系统资源库的比对，得出与各大论文库的相似比。

目标分类目标检测论文

论文名称：Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间：2014年论文地址：针对问题：从Alexnet提出后，作者等人思考如何利用卷积网络来完成检测任务，即输入一张图，实现图上目标的定位（目标在哪）和分类（目标是什么）两个目标，并最终完成了RCNN网络模型。创新点： RCNN提出时，检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢，作者采用的是Selective Search候选区域提取算法，来获得当前输入图上可能包含目标的不同图像块，再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。参考博客：。论文题目：OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间：2014年论文地址：针对问题：该论文讨论了，CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后，在网络后端组织两组卷积或全连接层，一组用于实现定位，输出当前图像上目标的最小外接矩形框坐标，一组用于分类，输出当前图像上目标的类别信息。也是以此为起点，检测网络出现基础主干网络(backbone)+分类头或回归头（定位头）的网络设计模式雏形。创新点：在这篇论文中还有两个比较有意思的点，一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的，而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制，那用1x1卷积来替换FC层，是否可行呢？作者在测试时通过将全连接层替换为1x1卷积核证明是可行的；二是提出了offset max-pooling，也就是对池化层输入特征不能整除的情况，通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练，然后切换分类头为回归头，再训练回归头的参数，最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。参考博客：论文题目：Scalable Object Detection using Deep Neural Networks 提出时间：2014年论文地址：针对问题：既然CNN网络提取的特征可以直接用于检测任务（定位+分类），作者就尝试将目标框（可能包含目标的最小外包矩形框）提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。创新点：本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心，（800个anchor box）然后学习预测不考虑目标类别的二分类网络，背景or前景。用到了多尺度下的检测。参考博客：论文题目：DeepBox: Learning Objectness with Convolutional Networks 提出时间：2015年ICCV 论文地址：主要针对的问题：本文完成的工作与第三篇类似，都是对目标框提取算法的优化方案，区别是本文首先采用自底而上的方案来提取图像上的疑似目标框，然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序；而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点：本文作者想通过CNN学习输入图像的特征，从而实现对输入网络目标框是否为真实目标的情况进行计算，量化每个输入框的包含目标的可能性值。参考博客：论文题目：AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间：2015年ICCV 论文地址：主要针对的问题：对检测网络的实现方案进行思考，之前的执行策略是，先确定输入图像中可能包含目标位置的矩形框，再对每个矩形框进行分类和回归从而确定目标的准确位置，参考RCNN。那么能否直接利用回归的思路从图像的四个角点，逐渐得到目标的最小外接矩形框和类别呢？创新点：通过从图像的四个角点，逐步迭代的方式，每次计算一个缩小的方向，并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。参考博客：论文题目：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间：2014年论文地址：针对问题：如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络，在处理过程中就造成了图像块信息的损失。在实际的场景中，输入网络的目标尺寸很难统一，而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点：作者提出的SPPnet中，通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸，在训练的时候，池化的操作还是通过滑动窗口完成的，池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。参考博客：论文题目：Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间：2015年论文地址：针对问题：既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位，本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点：作者通过对输入网络的region进行一定的处理（通过数据增强，使得网络利用目标周围的上下文信息得到更精准的目标框）来增加网络对目标回归框的精度。具体的处理方式包括：扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置，使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性，从而提高了回归框的精度。参考博客：论文题目：Fast-RCNN 提出时间：2015年论文地址：针对问题： RCNN中的CNN每输入一个图像块就要执行一次前向计算，这显然是非常耗时的，那么如何优化这部分呢？创新点：作者参考了SPPNet（第六篇论文），在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸，从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图，再将原图上用Selective Search算法得到的目标框映射到特征图上，避免了特征的重复提取。参考博客：论文题目：DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间：2015年论文地址：主要针对的问题：本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文，作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。创新点：作者在不同的激活层上以滑动窗口的方式生成了假设，并表明最终的卷积层可以以较高的查全率找到感兴趣的对象，但是由于特征图的粗糙性，定位性很差。相反，网络的第一层可以更好地定位感兴趣的对象，但召回率降低。论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间：2015年NIPS 论文地址：主要针对的问题：由multibox（第三篇）和DeepBox（第四篇）等论文，我们知道，用CNN可以生成目标待检测框，并判定当前框为目标的概率，那能否将该模型整合到目标检测的模型中，从而实现真正输入端为图像，输出为最终检测结果的，全部依赖CNN完成的检测系统呢？创新点：将当前输入图目标框提取整合到了检测网络中，依赖一个小的目标框提取网络RPN来替代Selective Search算法，从而实现真正的端到端检测算法。参考博客：

原文： Scalable Object Detection using Deep Neural Networks——学术范最近，深度卷积神经网络在许多图像识别基准上取得了最先进的性能，包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络，它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文，但如果不天真地复制每个实例的输出数量，就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型，它预测了一组与类无关的边界框，每个框有一个分数，对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例，并允许在网络的最高级别上进行跨类泛化。目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器，并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中，以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加，这个挑战变得更加困难，因为大多数方法都训练每个类单独的检测器。为了解决这个问题，人们提出了多种方法，从检测器级联到使用分割提出少量的对象假设。关于对象检测的文献非常多，在本节中，我们将重点讨论利用类不可知思想和解决可伸缩性的方法。许多提出的检测方法都是基于基于部件的模型，最近由于有区别学习和精心设计的特征，已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板，这是非常昂贵的。此外，它们在类的数量上是可伸缩的，这对像ImageNet这样的现代数据集来说是一个挑战。为了解决前一个问题，Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题，Song et al.使用了一个低维部件基，在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。另一种不同的工作，与我们的工作更接近，是基于对象可以本地化的想法，而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机，Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分，并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型，分割作为第一层，分割分类作为后续层。尽管它们编码了已证明的感知原理，但我们将表明，有更深入的模型，充分学习可以导致更好的结果。最后，我们利用了DeepLearning的最新进展，最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而，基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能，但由于单个掩模回归的成本，不能扩展到多个类。我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说，我们使用了深度神经网络(DNN)，它输出固定数量的包围盒。此外，它为每个盒子输出一个分数，表示这个盒子包含一个对象的网络信任度。为了形式化上述思想，我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值，可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸，以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的，后面跟着一个sigmoid。我们可以组合边界盒位置sli,i∈{1，…K}为一个线性层。同样，我们可以将所有置信区间ci,i∈{1，…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层在推理时，我们的算法生成kbound盒。在我们的实验中，我们使用ek = 100和K= 200。如果需要，我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此，它们可以通过后续的分类器进行分类，实现目标检测。由于盒子的数量非常少，我们可以提供强大的分类器。在我们的实验中，我们使用另一个dnn进行分类。我们训练一个DNN来预测每个训练图像的边界框及其置信度得分，以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子，对象被标记为boundingboxesgj,j∈{1，…，M}。在实践中，pre- dictionary的数量远远大于groundtruthboxm的数量。因此，我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置，以提高他们的匹配度，最大化他们的信心。与此同时，我们将剩余预测的置信度最小化，这被认为不能很好地定位真实对象。为了达到上述目的，我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1，如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为其中，我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外，我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为最终的损失目标结合了匹配损失和信心损失受式1的约束。α平衡了不同损失条款的贡献。对于每个训练例子，我们通过解决一个最佳的赋值x*的预测到真实的盒子约束执行赋值解决方案。这是二部匹配的一种变体，是一种多项式复杂度匹配。在我们的应用程序中，匹配是非常便宜的——每幅图像中标记的对象的数量少于一打，而且在大多数情况下只有很少的对象被标记。然后，通过反向传播优化网络参数。例如，反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的，但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类，并找到这样的聚类/质心，我们可以使用这些聚类/质心作为每个预测位置的先验。因此，鼓励学习算法为每个预测位置学习一个残差到一个先验。第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配，而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成，就会像之前一样计算目标的置信度。此外，位置预测损失也不变:对于任何一对匹配的(目标，预测)位置，其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配，并假设它促进了预测的多样化。需要注意的是，尽管我们以一种与类无关的方式定义了我们的方法，但我们可以将它应用于预测特定类的对象盒。要做到这一点，我们只需要在类的边框上训练我们的模型。此外，我们可以预测每个类的kbox。不幸的是，这个模型的参数数量会随着类的数量线性增长。此外，在一个典型的设置中，给定类的对象数量相对较少，这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此，我们认为我们的两步过程——首先本地化，然后识别——是一个更好的选择，因为它允许使用少量参数利用同一图像中多个对象类型的数据我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减，128的小批量，以及使用多个相同的网络副本进行并行分布式训练，从而实现更快的收敛。如前所述，我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外，使用非最大抑制对盒进行修剪，Jaccard相似度阈值为。然后，我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络，我们从训练集中生成了大约3000万幅图像，并对训练集中的每幅图像应用以下步骤。最后，样品被打乱。为了训练我们的本地化网络，我们通过对训练集中的每一幅图像应用以下步骤，从训练集中生成了大约3000万幅图像。对于每幅图像，我们生成相同数量的平方样本，使样本总数大约为1000万。对于每幅图像，样本被桶状填充，这样，对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例，都有相同数量的样本，其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中，我们没有探索任何非标准数据生成或正则化选项。在所有的实验中，所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成，其中包含了20种不同的对象类别的边界框。在我们的评估中，我们关注的是2007版VOC，为此发布了一个测试集。我们通过培训VOC 2012展示了结果，其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。我们在一个由1000万作物组成的数据集上训练分类器，该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。在第一轮中，定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络，我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后，保留评分最高的前10个检测项，并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估，并用于计算精确查全曲线。首先，我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量，正如Pascal检测标准所定义的那样，与生成的包围框的数量相对比。在图1中，我们展示了使用VOC2012进行训练所获得的结果。此外，我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的，当使用10个边界框的预算时，我们可以用第一个模型本地化的对象，用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能，例如对象度算法达到42%[1]。此外，这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象，但当使用更高分辨率的图像作物时，我们获得了额外的提升。进一步，我们用21-way分类器对生成的包围盒进行分类，如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是，与先进水平相当。注意，我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是，可视化检测是通过仅使用最大中心方形图像裁剪，即使用全图像获得的。然而，我们设法获得了相对较小的对象，例如第二行和第二列的船，以及第三行和第三列的羊。在本工作中，我们提出了一种新的方法来定位图像中的对象，该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下，对1000个盒子进行非max-suppression，使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则，并学习在未见图像中预测这些位置。我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果，在这两个基准上，所提出的方法具有竞争力。此外，该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明，deepmultibox的方法是可扩展的，甚至可以在两个数据集之间泛化，就能够预测感兴趣的定位，甚至对于它没有训练的类别。此外，它能够捕获同一类物体的多种情况，这是旨在更好地理解图像的算法的一个重要特征。在未来，我们希望能够将定位和识别路径折叠到一个单一的网络中，这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下，双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估，每个评估的速度大约为1个CPU-sec(现代机器)。重要的是，这个数字并不与要识别的类的数量成线性关系，这使得所提出的方法与类似dpm的方法非常有竞争力。

索引序列
目标检测论文笔记目录
肺结节检测论文笔记
检测论文目录
论文检测目录
目标分类目标检测论文
返回顶部

目标检测论文笔记目录