论文原文:
YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:
如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:
每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:
其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。
每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)
举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:
在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:
等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。
得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。
1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。
2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。
3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。
4、损失函数公式见下图:
在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:
解决方法:
只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。
作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。
然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。
作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。
作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。
作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。
YOLO模型相对于之前的物体检测方法有多个优点:
1、 YOLO检测物体非常快
因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。
2、 YOLO可以很好的避免背景错误,产生false positives
不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。
3、 YOLO可以学到物体的泛化特征
当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。
尽管YOLO有这些优点,它也有一些缺点:
1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。
2、YOLO容易产生物体的定位错误。
3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。
作为计算机视觉三大任务(图像分类、目标检测、图像分割)之一,目标检测任务在于从图像中定位并分类感兴趣的物体。传统视觉方案涉及霍夫变换、滑窗、特征提取、边界检测、模板匹配、哈尔特征、DPM、BoW、传统机器学习(如随机森林、AdaBoost)等技巧或方法。在卷积神经网络的加持下,目标检测任务在近些年里有了长足的发展。其应用十分广泛,比如在自动驾驶领域,目标检测用于无人车检测其他车辆、行人或者交通标志牌等物体。
目标检测的常用框架可以分为两类,一类是 two-stage/two-shot 的方法,其特点是将兴趣区域检测和分类分开进行,比较有代表性的是R-CNN,Fast R-CNN,Faster R-CNN;另一类是 one-stage/one-shot 的方法,用一个网络同时进行兴趣区域检测和分类,以YOLO(v1,v2,v3)和SSD为代表。
Two-stage的方式面世比较早,由于需要将兴趣区域检测和分类分开进行,虽然精度比较高,但实时性比较差,不适合自动驾驶无人车辆感知等应用场景。因而此次我们主要介绍一下SSD和YOLO系列框架。
SSD与2016年由W. Liu et al.在 SSD: Single Shot MultiBox Detector 一文中提出。虽然比同年提出的YOLO(v1)稍晚,但是运行速度更快,同时更加精确。
SSD的框架在一个基础CNN网络(作者使用VGG-16,但是也可以换成其他网络)之上,添加了一些额外的结构,从而使网络具有以下特性:
用多尺度特征图进行检测 作者在VGG-16后面添加了一些特征层,这些层的尺寸逐渐减小,允许我们在不同的尺度下进行预测。越是深层小的特征图,用来预测越大的物体。
用卷积网络进行预测 不同于YOLO的全连接层,对每个用于预测的 通道特征图,SSD的分类器全都使用了 卷积进行预测,其中 是每个单元放置的先验框的数量, 是预测的类别数。
设置先验框 对于每一个特征图上的单元格,我们都放置一系列先验框。随后对每一个特征图上的单元格对应的每一个先验框,我们预测先验框的 维偏移量和每一类的置信度。例如,对于一个 的特征图,若每一个特征图对应 个先验框,同时需要预测的类别有 类,那输出的大小为 。(具体体现在训练过程中) 其中,若用 表示先验框的中心位置和宽高, 表示预测框的中心位置和宽高,则实际预测的 维偏移量 是 分别是:
下图是SSD的一个框架,首先是一个VGG-16卷积前5层,随后级联了一系列卷积层,其中有6层分别通过了 卷积(或者最后一层的平均池化)用于预测,得到了一个 的输出,随后通过极大值抑制(NMS)获得最终的结果。
图中网络用于检测的特征图有 个,大小依次为 , , , , , ;这些特征图每个单元所对应的预置先验框分别有 , , , , , 个,所以网络共预测了 个边界框,(进行极大值抑制前)输出的维度为 。
未完待续
参考: chenxp2311的CSDN博客:论文阅读:SSD: Single Shot MultiBox Detector 小小将的知乎专栏:目标检测|SSD原理与实现 littleYii的CSDN博客:目标检测论文阅读:YOLOv1-YOLOv3(一)
作者的其他相关文章: 图像分割:全卷积神经网络(FCN)详解 PointNet:基于深度学习的3D点云分类和分割模型 详解 基于视觉的机器人室内定位
|声明:遵循CC BY-SA版权协议 建立在YOLOv1的基础上,经过Joseph Redmon等的改进,YOLOv2和YOLO9000算法在2017年CVPR上被提出,并获得最佳论文提名,重点解决YOLOv1召回率和定位精度方面的误差。在提出时,YOLOv2在多种监测数据集中都要快过其他检测系统,并可以在速度与精确度上进行权衡。 YOLOv2采用Darknet-19作为特征提取网络,增加了批量标准化(Batch Normalization)的预处理,并使用224×224和448×448两阶段训练ImageNet,得到预训练模型后fine-tuning。 相比于YOLOv1是利用FC层直接预测Bounding Box的坐标,YOLOv2借鉴了FSR-CNN的思想,引入Anchor机制,利用K-Means聚类的方式在训练集中聚类计算出更好的Anchor模板,在卷积层使用Anchor Boxes操作,增加Region Proposal的预测,同时采用较强约束的定位方法,大大提高算法召回率。同时结合图像细粒度特征,将浅层特征与深层特征相连,有助于对小尺寸目标的检测。 下图所示是YOLOv2采取的各项改进带了的检测性能上的提升: YOLO9000 的主要检测网络也是YOLO v2,同时使用WordTree来混合来自不同的资源的训练数据,并使用联合优化技术同时在ImageNet和COCO数据集上进行训练,目的是利用数量较大的分类数据集来帮助训练检测模型,因此,YOLO 9000的网络结构允许实时地检测超过9000种物体分类,进一步缩小了检测数据集与分类数据集之间的大小代沟。 下面将具体分析YOLOv2的各个创新点: BN概述: 对数据进行预处理(统一格式、均衡化、去噪等)能够大大提高训练速度,提升训练效果。BN正是基于这个假设的实践,对每一层输入的数据进行加工。 BN是2015年Google研究员在论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》一文中提出的,同时也将BN应用到了2014年的GoogLeNet上,也就是Inception-v2。 BN层简单讲就是对网络的每一层的输入都做了归一化,这样网络就不需要每层都去学数据的分布,收敛会更快。YOLOv1算法(采用的是GoogleNet网络提取特征)是没有BN层的,而在YOLOv2中作者为每个卷积层都添加了BN层。 使用BN对网络进行优化,让网络提高了收敛性,同时还消除了对其他形式的正则化(regularization)的依赖,因此使用BN后可以从模型中去掉Dropout,而不会产生过拟合。 BN优点: 神经网络每层输入的分布总是发生变化,加入BN,通过标准化上层输出,均衡输入数据分布,加快训练速度,因此可以设置较大的学习率(Learning Rate)和衰减(Decay); 通过标准化输入,降低激活函数(Activation Function)在特定输入区间达到饱和状态的概率,避免梯度弥散(Gradient Vanishing)问题; 输入标准化对应样本正则化,BN在一定程度上可以替代 Dropout解决过拟合问题。 BN算法: 在卷积或池化之后,激活函数之前,对每个数据输出进行标准化,方式如下图所示: 公式很简单,前三行是 Batch内数据归一化(假设一个Batch中有每个数据),同一Batch内数据近似代表了整体训练数据。第四行引入了附加参数 γ 和 β,此二者的取值算法可以参考BN论文,在此不再赘述。 fine-tuning:用已经训练好的模型,加上自己的数据集,来训练新的模型。即使用别人的模型的前几层,来提取浅层特征,而非完全重新训练模型,从而提高效率。一般新训练模型准确率都会从很低的值开始慢慢上升,但是fine-tuning能够让我们在比较少的迭代次数之后得到一个比较好的效果。 YOLO模型分为两部分,分类模型和检测模型,前者使用在ImageNet上预训练好的模型,后者在检测数据集上fine-tuning。 YOLOv1在预训练时采用的是224*224的输入(在ImageNet数据集上进行),然后在检测的时候采用448*448的输入,这会导致从分类模型切换到检测模型的时候,模型还要适应图像分辨率的改变。 YOLOv2则将预训练分成两步:先用224*224的输入在ImageNet数据集训练分类网络,大概160个epoch(将所有训练数据循环跑160次)后将输入调整到448*448,再训练10个epoch(这两步都是在ImageNet数据集上操作)。然后利用预训练得到的模型在检测数据集上fine-tuning。这样训练得到的模型,在检测时用448*448的图像作为输入可以顺利检测。 YOLOv1将输入图像分成7*7的网格,每个网格预测2个Bounding Box,因此一共有98个Box,同时YOLOv1包含有全连接层,从而能直接预测Bounding Boxes的坐标值,但也导致丢失较多的空间信息,定位不准。 YOLOv2首先将YOLOv1网络的FC层和最后一个Pooling层去掉,使得最后的卷积层可以有更高分辨率的特征,然后缩减网络,用416*416大小的输入代替原来的448*448,使得网络输出的特征图有奇数大小的宽和高,进而使得每个特征图在划分单元格(Cell)的时候只有一个中心单元格(Center Cell)。 为什么希望只有一个中心单元格呢?由于图片中的物体都倾向于出现在图片的中心位置,特别是比较大的物体,所以有一个单元格单独位于物体中心的位置用于预测这些物体。 YOLOv2通过引入Anchor Boxes,通过预测Anchor Box的偏移值与置信度,而不是直接预测坐标值。YOLOv2的卷积层采用32这个值来下采样图片,所以通过选择416*416用作输入尺寸最终能输出一个13*13的特征图。若采用FSRCNN中的方式,每个Cell可预测出9个Anchor Box,共13*13*9=1521个(YOLOv2确定Anchor Boxes的方法见是维度聚类,每个Cell选择5个Anchor Box)。 在FSRCNN中,以一个51*39大小的特征图为例,其可以看做一个尺度为51*39的图像,对于该图像的每一个位置,考虑9个可能的候选窗口:3种面积3种比例。这些候选窗口称为Anchor Boxes。下图示出的是51*39个Anchor Box中心,以及9种Anchor Box示例。 YOLOv1和YOLOv2特征图数据结构: YOLOv1:S*S* (B*5 + C) => 7*7(2*5+20) 其中B对应Box数量,5对应边界框的定位信息(w,y,w,h)和边界框置信度(Confidience)。分辨率是7*7,每个Cell预测2个Box,这2个Box共用1套条件类别概率(1*20)。 YOLOv2:S*S*K* (5 + C) => 13*13*9(5+20) 分辨率提升至13*13,对小目标适应性更好,借鉴了FSRCNN的思想,每个Cell对应K个Anchor box(YOLOv2中K=5),每个Anchor box对应1组条件类别概率(1*20)。 聚类:聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。即在没有划分类别的情况下,根据数据相似度进行样本分组。 在FSR-CNN中Anchor Box的大小和比例是按经验设定的,然后网络会在训练过程中调整Anchor Box的尺寸,最终得到准确的Anchor Boxes。若一开始就选择了更好的、更有代表性的先验Anchor Boxes,那么网络就更容易学到准确的预测位置。 YOLOv2使用K-means聚类方法类训练Bounding Boxes,可以自动找到更好的宽高维度的值用于一开始的初始化。传统的K-means聚类方法使用的是欧氏距离函数,意味着较大的Anchor Boxes会比较小的Anchor Boxes产生更多的错误,聚类结果可能会偏离。由于聚类目的是确定更精准的初始Anchor Box参数,即提高IOU值,这应与Box大小无关,因此YOLOv2采用IOU值为评判标准,即K-means 采用的距离函数(度量标准) 为: d(box,centroid) = 1 - IOU(box,centroid) 如下图,左边是聚类的簇个数和IOU的关系,两条曲线分别代表两个不同的数据集。分析聚类结果并权衡模型复杂度与IOU值后,YOLOv2选择K=5,即选择了5种大小的Box 维度来进行定位预测。 其中紫色和灰色也是分别表示两个不同的数据集,可以看出其基本形状是类似的。更重要的是,可以看出聚类的结果和手动设置的Anchor Box位置和大小差别显著——结果中扁长的框较少,而瘦高的框更多(更符合行人的特征)。 YOLOv2采用的5种Anchor的Avg IOU是61,而采用9种Anchor Boxes的Faster RCNN的Avg IOU是,也就是说本文仅选取5种box就能达到Faster RCNN的9中box的效果。选择值为9的时候,AVG IOU更有显著提高。说明K-means方法的生成的boxes更具有代表性。 直接对Bounding Boxes求回归会导致模型不稳定,其中心点可能会出现在图像任何位置,有可能导致回归过程震荡,甚至无法收敛,尤其是在最开始的几次迭代的时候。大多数不稳定因素产生自预测Bounding Box的中心坐标(x,y)位置的时候。 YOLOv2的网络在特征图(13*13)的每一个单元格中预测出5个Bounding Boxes(对应5个Anchor Boxes),每个Bounding Box预测出5个值(tx,ty,tw,th,t0),其中前4个是坐标偏移值,t0是置信度结果(类似YOLOv1中的边界框置信度Confidence)。YOLOv2借鉴了如下的预测方式,即当Anchor Box的中心坐标和宽高分别是(xa,ya)和(wa,wh)时,Bounding Box坐标的预测偏移值(tx,ty,tw,th)与其坐标宽高(x,y,w,h)的关系如下: tx = (x-xa)/wa ty= (y-ya)/ha tw = log(w/wa) th = log(h/ha) 基于这种思想,YOLOv2在预测Bounding Box的位置参数时采用了如下强约束方法: 上图中,黑色虚线框是Anchor Box,蓝色矩形框就是预测的Bounding Box结果,预测出的Bounding Box的坐标和宽高为(bx,by)和(bw,bh),计算方式如图中所示,其中:对每个Bounding Box预测出5个值(tx,ty,tw,th,t0),Cell与图像左上角的横纵坐标距离为(cx,cy),σ定义为sigmoid激活函数(将函数值约束到[0,1]),该Cell对应的Anchor Box对应的宽高为(pw,ph)。 简而言之,(bx,by)就是(cx,cy)这个Cell附近的Anchor Box针对预测值(tx,ty)得到的Bounding Box的坐标预测结果,同时可以发现这种方式对于较远距离的Bounding Box预测值(tx,ty)能够得到很大的限制。 YOLOv2通过添加一个转移层,把高分辨率的浅层特征连接到低分辨率的深层特征(把特征堆积在不同Channel中)而后进行融合和检测。具体操作是先获取前层的26*26的特征图,将其同最后输出的13*13的特征图进行连接,而后输入检测器进行检测(检测器的FC层起到了全局特征融合的作用),以此来提高对小目标的检测能力。 为了适应不同尺度下的检测任务,YOLOv2在训练网络时,其在检测数据集上fine-tuning时候采用的输入图像的size是动态变化的。具体来讲,每训练10个Batch,网络就会随机选择另一种size的输入图像。因为YOLOv2用到了参数是32的下采样,因此也采用32的倍数作为输入的size,即采用{320,352,…,608}的输入尺寸(网络会自动改变尺寸,并继续训练的过程)。 这一策略让网络在不同的输入尺寸上都能达到较好的预测效果,使同一网络能在不同分辨率上进行检测。输入图片较大时,检测速度较慢,输入图片较小时,检测速度较快,总体上提高了准确率,因此多尺度训练算是在准确率和速度上达到一个平衡。 上表反映的是在检测时,不同大小的输入图片情况下的YOLOv2和其他目标检测算法的对比。可以看出通过多尺度训练的检测模型,在测试的时候,输入图像在尺寸变化范围较大的情况下也能取得mAP和FPS的平衡。 YOLOv1采用的训练网络是GoogleNet,YOLOv2采用了新的分类网络Darknet-19作为基础网络,它使用了较多的3*3卷积核,并把1*1的卷积核置于3*3的卷积核之间,用来压缩特征,同时在每一次池化操作后把通道(Channels)数翻倍(借鉴VGG网络)。 YOLOv1采用的GooleNet包含24个卷积层和2个全连接层,而Darknet-19包含19个卷积层和5个最大池化层(Max Pooling Layers),后面添加Average Pooling层(代替v1中FC层),而Softmax分类器作为激活被用在网络最后一层,用来进行分类和归一化。 在ImageNet数据集上进行预训练,主要分两步(采用随机梯度下降法): 输入图像大小是224*224,初始学习率(Learning Rate)为,训练160个epoch,权值衰减(Weight Decay)为,动量(Momentum)为,同时在训练时采用标准的数据增强(Data Augmentation)方式如随机裁剪、旋转以及色度、亮度的调整。 fine-tuning:第1步结束后,改用448*448输入(高分辨率模型),学习率改为,训练10个epoch,其他参数不变。结果表明:fine-tuning后的top-1准确率为,top-5准确率为,若按照原来的训练方式,Darknet-19的top-1准确率是,top-5准确率为。可以看出,两步分别从网络结构和训练方式方面入手提高了网络分类准确率。 预训练之后,开始基于检测的数据集再进行fine-tuning。 首先,先把最后一个卷积层去掉,然后添加3个3*3的卷积层,每个卷积层有1024个卷积核,并且后面都连接一个1*1的卷积层,卷积核个数(特征维度)根据需要检测的类数量决定。(比如对VOC数据,每个Cell需要预测5个Boungding Box,每个Bounding Box有4个坐标值、1个置信度值和20个条件类别概率值,所以每个单元格对应125个数据,此时卷积核个数应该取125。) 然后,将最后一个3*3*512的卷积层和倒数第2个卷积层相连(提取细粒度特征),最后在检测数据集上fine-tuning预训练模型160个epoch,学习率采用,并且在第60和90个epoch的时候将学习率除以10,权值衰减、动量和数据增强方法与预训练相同。 YOLO9000通过结合分类和检测数据集,使得训练得到的模型可以检测约9000类物体,利用带标注的分类数据集量比较大的特点,解决了带标注的检测数据集量比较少的问题。具体方法是:一方面采用WordTree融合数据集,另一方面联合训练分类数据集和检测数据集。 分类数据集和检测数据集存在较大差别:检测数据集只有粗粒度的标记信息,如“猫”、“狗”,而分类数据集的标签信息则更细粒度,更丰富。比如“狗”就包括“哈士奇”、“金毛狗”等等。所以如果想同时在检测数据集与分类数据集上进行训练,那么就要用一种一致性的方法融合这些标签信息。 用于分类的方法,常用Softmax(比如v2),Softmax意味着分类的类别之间要互相独立的,而ImageNet和COCO这两种数据集之间的分类信息不相互独立(ImageNet对应分类有9000种,而COCO仅提供80种目标检测),所以使用一种多标签模型来混合数据集,即假定一张图片可以有多个标签,并且不要求标签之间独立,而后进行Softmax分类。 由于ImageNet的类别是从WordNet选取的,作者采用以下策略重建了一个树形结构(称为WordTree): 遍历ImageNet的标签,然后在WordNet中寻找该标签到根节点(所有的根节点为实体对象)的路径; 如果路径只有一条,将该路径直接加入到WordTree结构中; 否则,从可选路径中选择一条最短路径,加入到WordTree结构中。 WordTree的作用就在于将两种数据集按照层级进行结合。 如此,在WordTree的某个节点上就可以计算该节点的一些条件概率值,比如在terrier这个节点,可以得到如下条件概率值: 进而,如果要预测此节点的概率(即图片中目标是Norfolk terrier的概率),可以根据WordTree将该节点到根节点的条件概率依次相乘得到,如下式: 其中: YOLO9000在WordTree1k(用有1000类别的ImageNet1k创建)上训练了Darknet-19模型。为了创建WordTree1k作者添加了很多中间节点(中间词汇),把标签由1000扩展到1369。 训练过程中GroundTruth标签要顺着向根节点的路径传播:为了计算条件概率,模型预测了一个包含1369个元素的向量,而且基于所有“同义词集”计算Softmax,其中“同义词集”是同一概念下的所属词。 现在一张图片是多标记的,标记之间不需要相互独立。在训练过程中,如果有一个图片的标签是“Norfolk terrier”,那么这个图片还会获得“狗”以及“哺乳动物”等标签。 如上图所示,之前的ImageNet分类是使用一个大Softmax进行分类,而现在WordTree只需要对同一概念下的同义词进行Softmax分类。然后作者分别两个数据集上用相同训练方法训练Darknet-19模型,最后在ImageNet数据集上的top-1准确率为,top-5准确率为;在WordTree数据集上的top-1准确率为,top-5准确率为。 这种方法的好处是有“退而求其次”的余地:在对未知或者新的物体进行分类时,性能损失更低,比如看到一个狗的照片,但不知道是哪种种类的狗,那么就预测其为“狗”。 以上是构造WordTree的原理,下图是融合COCO数据集和ImageNet数据集以及生成它们的WordTree的示意图(用颜色区分了COCO数据集和ImageNet数据集的标签节点), 混合后的数据集对应的WordTree有9418个类。另一方面,由于ImageNet数据集太大,YOLO9000为了平衡两个数据集之间的数据量,通过过采样(Oversampling)COCO数据集中的数据,使COCO数据集与ImageNet数据集之间的数据量比例达到1:4。 对YOLO9000进行评估,发现其mAP比DPM高,而且YOLO有更多先进的特征,YOLO9000是用部分监督的方式在不同训练集上进行训练,同时还能检测9000个物体类别,并保证实时运行。虽然YOLO9000对动物的识别性能很好,但是对衣服或者装备的识别性能不是很好(这跟数据集的数据组成有关)。 YOLO9000的网络结构和YOLOv2类似,区别是每个单元格只采用3个Anchor Boxes。 YOLO9000提出了一种在分类数据集和检测数据集上联合训练的机制,即使用检测数据集(COCO)的图片去学习检测相关的信息即查找对象(例如预测边界框坐标、边界框是否包含目标及目标属于各个类别的概率),使用仅有类别标签的分类数据集(ImageNet)中的图片去扩展检测到的对象的可识别种类。 具体方法是:当网络遇到一个来自检测数据集的图片与标记信息,就把这些数据用完整的损失函数(v2和9000均沿用了v1网络的损失函数)反向传播,而当网络遇到一个来自分类数据集的图片和分类标记信息,只用代表分类误差部分的损失函数反向传播这个图片。 YOLO v2 在大尺寸图片上能够实现高精度,在小尺寸图片上运行更快,可以说在速度和精度上达到了平衡,具体性能表现如下所示。 coco数据集 voc2012数据集
浅议遥感技术在环境污染监测中的应用论文
1概述
随着我国经济的高速发展,环境污染和生态破坏日益严重,突发性环境污染事故也时有发生。环境监测作为环境管理和污染控制的主要手段之一,正在发挥不可替代的作用。但是,由于我国面积辽阔,地面环境监测网点分散,仅依靠现有的监测台站和传统监测技术方法不能满足连续、动态、宏观、快速监测环境污染的要求,也满足不了及时、准确地做出环境质量报告和污染预报的要求。因此,日益恶化的环境迫切需要实时、快速、宏观、准确的监测技术,以便更加全面准确地反映环境污染对生态系统和人体健康的影响。近年来国内外大量实践表明,遥感技术是获取环境信息的强有力手段,是实现这一目的的极其有效的技术。运用遥感技术监测环境污染及生态环境状况,正确评价环境质量,寻求改善生态环境的途径和措施,具有重要的意义。
遥感技术具有监测范围广、速度快、成本低,且便于进行长期的动态监测等优势,还能发现用常规方法往往难以揭示的污染源及其扩散的状态,因此遥感技术正广泛地应用于监测水污染、大气污染等环境问题。它不仅可以快速、实时、动态、省时省力地监测大范围的环境变化和环境污染,具有其它常规方法不可替代的优越性;也可实时、快速跟踪和监测突发环境污染事件的发生、发展,并及时制定处理措施,减少污染造成的损失。因此,发展我国的环境污染遥感监测技术,建立重大环境事故的预报、预警和应急响应系统,对保护我国环境及发展经济都具有重要作用,能产生巨大的社会、经济和环境效益。
2环境污染遥感监测技术
遥感技术是一种利用物体反射或辐射电磁波的固有特性,远距离不直接接触物体而识别、测量并分析目标物性质的技术。根据所利用的波段,遥感监测技术主要分为可见光、反射红外遥感技术,热红外遥感技术,微波遥感技术三种类型。当前,遥感的应用已深入到农业、林业、渔业、地理、地质、海洋、水文、气象、环境监测、地球资源勘探、城乡规划、土地管理、和军事侦察等诸多领域,从室内的工业测量到大范围的陆地、海洋、大气信息的采集以至全球范围的环境变化的监测。
遥感技术在环境污染监测中的应用发展很快,现在已可测出水体的叶绿素含量、泥沙含量、水温、水色;可测定大气气温、湿度、CO、NOx、CO2、O3、ClOx、CH4等主要污染物的浓度分布;可测定固体废弃物的堆放量、分布及其影响范围等,还可对环境污染事故进行遥感跟踪调查,预报事故发生点、污染面积、扩散程度及方向,估算污染造成的损失并提出相应的对策。近几年来,随着全球环境问题日益突出,具有全球覆盖、快速、多光谱、大信息量的遥感技术已成为全球环境变化监测中一种主要的技术手段。国际上相继提出了一系列的全球环境遥感监测计划,其中主要有美国宇航局(NASA)的对地观测计划(EOS)、欧空局的对地观测计划和日本的对地观测计划等。这些计划将极大地推动环境遥感技术的实用化和遥感技术的发展。
3遥感在环境监测中的应用
水环境污染遥感监测
对水体的遥感监测是以污染水与清洁水的反射光谱特征研究为基础的。总的看来,清洁水体反射率比较低,水体对光有较强的吸收性能,而较强的分子散射性仅存在于光谱区较短的谱段上。故在一般遥感影像上,水体表现为暗色色调,在红外谱段上尤其明显。为了进行水质监测,可以采用以水体光谱特性和水色为指标的遥感技术。
遥感监测视野开阔,对大面积范围里发生的水体扩散过程容易通览全貌,观察出污染物的排放源、扩散方向、影响范围及与清洁水混合稀释的特点。从而查明污染物的来龙去脉,为科学地布设地面水样监测提供依据。在江河湖海各种水体中,污染物种类繁多。为了便于遥感方法研究各种水污染,习惯上将其分为泥沙污染、石油污染、废水污染、热污染和水体富营养化等几种类型。
大气污染遥感监测
大气遥感是利用遥感器监测大气结构、状态及变化。大气遥感器除了测量气温、水蒸汽、大气中的微量成分气体、气溶胶等的三维分布以外,还用来进行风的测量及地球辐射收支的测量等。
影响大气环境质量的主要因素是气溶胶含量和各种有害气体。这些物理量通常不可能用遥感手段直接识别。水汽、二氧化碳、臭氧、甲烷等微量气体成分具有各自分子所固有的辐射和吸收光谱,所以,实际上是通过测量大气的散射、吸收及辐射的光谱而从其结果中推算出来的。通过对穿过大气层的太阳(月亮、星星)的直射光,来自大气和云的散射光,来自地表的反射光,以及来自大气和地表的热辐射进行吸收光谱分析或发射光谱分析,从而测量它们的光谱特性来求出大气气体分子的密度。测量中所利用的电磁波的光谱范围很宽,从紫外、可见、红外等光学领域一直扩展到微波、毫米波等无线电波的领域。大气遥感器分为主动式和被动式,主动方式中有代表性的遥感器是激光雷达,被动式遥感器有微波辐射计、热红外扫描仪等。
4国内发展现状
我国环境污染遥感监测技术发展和应用的主要问题有:①环境污染遥感监测系统和技术方法基本上处于起步阶段。虽然我国的遥感理论、技术和应用发展很快,但与国外相比差距甚大,在环境污染监测中的应用基本还没有开展起来,目前在全国范围内基本上没有建立起环境遥感的监测体系与系统。②对于环境监测而言,传感器的技术性能要求较高,不仅要求传感器能提供高分辨率的探测,而且要求具有全天候、全天时、大范围、多谱段和灵敏度高的特点,这样才能满足环境污染动态、实时、多样的监测需求。当前所用的高分辨率传感器基本上依靠进口,在地面和飞机上测量化学成分的遥感技术还处于实验室的摸索阶段,而在环境污染监测中的应用基本空白。③遥感信息源缺乏。目前我国尚未发射自己的环境污染监测遥感卫星,遥感信息源主要来自于国外的相关卫星资料。同时国际上用于环境监测的遥感商业卫星寥寥无几,从而客观上制约了我国环境遥感监测技术和应用水平的发展。④新型遥感技术在环境污染监测上应用的理论和方法有待探索和发展,缺少环境污染遥感监测体系与系统。
5结论与展望
目前,遥感技术正从单一遥感资料的分析,向多时相、多数据源(包括非遥感资料数据)的信息复合与综合分析过渡;从资源环境静态分布研究,向动态过程监测过渡;从动态监测,向预测、预报过渡;从定性调查、系列制图,向计算机辅助的.数字处理、定量自动制图过渡;从对各种事物的表面性的描述,向内在规律分析、定量化分析过渡。就环境污染遥感监测技术而言,有待于在以下几方面加强研究:
(1)利用环境污染遥感监测技术,建立突发性环境污染事故的实时监测和预警系统。通过集成多种遥感传感器,并结合地面环境监测网站的监测数据,进行多环境参数的自动监测,并实时监测各种指标的时空变化趋势,以便在某些指标刚刚接近警戒线时预报可能出现的危机,确定环境污染事故所在的空间位置,并提供其空间影响范围的模拟和模型方法,为突发性事故管理决策提供信息,实现连续、自动监测和总量控制。如利用环境污染遥感监测技术,通过建立城市大气环境质量预测预报系统,可以对城市大气环境质量状况进行预报,并对可能发生的大气污染事件提出预警。
(2)高性能传感器的研制。重点发展能够选择监测某种或某类优先污染物(如氯苯和硝基苯等)浓度的遥感器。
(3)研制环境污染物的定量遥感监测技术。如利用水面反射光谱测量与水质参数进行回归分析,建立某一谱段上光谱反射率与某些水质参数的函数关系式。一般来说,水质参数中的透明度、固体悬浮物浓度、叶绿素含量和水面混浊度与光谱反射率或卫星影像的密度值之间往往存在比较明显的对应关系。
(4)将环境污染遥感监测技术与GIS(地理信息系统)、GPS(全球定位系统)、ES(专家系统)技术集成。利用环境污染遥感监测集成系统,可以大大提高环境监测的科学性、合理性及智能化程度,从而大大扩展环境监测的应用范围。集成技术应用于环境污染遥感监测中的优越性具体体现如下:遥感监测技术为集成系统提供正确、迅速、宏观的环境污染监测数据,GIS可利用其强大的空间信息管理功能,建立各类有毒、有害、易燃、易爆物质的理化特性数据库,有关自然、经济、社会、生态环境数据库和图形库及模型库,同时可结合地面监测数据,经由GPS提供的精确位置信息,在ES技术支持下对监测数据进行有效的管理、分析和计算并将综合数据以直观、形象的图形化方式输出或显示出来,从而使环境管理者迅速了解和掌握各类突发事故的多发地带、发生频率、潜在事故发生源的时空分布、事故发生后污染物的影响范围及时空变化,更好地实现事故的预防、应急处置和灾后恢复。
当前,我国环境污染遥感监测技术应依托我国的对地观测技术和对地观测系统的发展计划,同时充分利用国际上资源环境卫星系统,开展广泛的国际合作和交流,大力发展我国的环境污染遥感监测技术,并充分利用现有的环境监测网点和常规监测方法,采用遥感技术与地面监测相结合的方法,建立我国的环境污染遥感监测系统。
杨武年朱章森
(成都理工大学遥感与GIS研究所,成都610059)
摘要遥感图像显现的地质构造形迹是地史以来地壳运动的综合结果,包含有历次构造变动和有关矿化的特征标识信息,因此,遥感信息场分层解析是无模型矿床预测中有效地进行成矿信息分离的重要手段。无模型矿床预测法的理论依据是,矿床的形成是多种地质因素发生变异的综合结果,特殊地质环境中多期次构造运动复合叠加区具备形成大型、超大型矿床的条件,巨大矿源体的存在势必导致其与周围环境(背景)在物质成分、结构构造等方面的显著差异,包括诸如成矿岩石组合、构造式样、矿化蚀变以及地球物理、地球化学场甚至由深部矿源异常体引起其上方地球生物圈、大气圈等发生变异的信息特征。因而该法不需要事先有已知有矿模型或已知无矿模型作为预测的基础,而以分解和提取上述致矿异常信息建立控矿地质体的自然源模型作为科学找矿的重要途径。由于此法不需要事先有已知有矿模型或已知无矿模型作为预测的基础,因此它不仅对研究程度较低的新区矿床预测,而且对研究程度较高的老区寻找新类型和大型、超大型矿床都具有重大理论意义和实用价值。
关键词遥感地质数学地质遥感信息场分层解析遥感图像分层解析法无模型矿床预测法
1引言
当前国内外成矿预测研究中,传统的基于相似类比理论的矿床模型预测法,通过数十年的实践日趋完善,在地质找矿中取得显著成效。然而这类方法的应用前提是必须有一定数量的已知有矿模型和无矿模型作为类比的基础,因此,它受资料水平、已知矿床模型及研究人员水平的限制,主要适用于地质研究程度较高、矿床模型易于建立的地区;而且因受相似类比理论限制,它只能找到与已知矿床类同的具相当规模的矿床,而难于发现新类型矿床或点状大型、超大型矿床。因此,在找矿难度日益增大的情况下,如何使多学科结合,应用新技术新方法和新思维开拓新区,寻找隐伏矿床和新类型矿床,特别是大型、超大型矿床,已成为现在和今后地质找矿工作中急需解决的重大理论和方法问题。为此,我们通过长期的找矿实践,提出了在求异理论和求同理论指导下的无模型矿床预测法的新思路[1,2],后进一步发展,提出了遥感信息场分层解析与无模型矿床预测的方法理论[3],经在云南、四川、新疆等地找矿实践,取得明显效果[1~~14]。
2理论依据
遥感图像显现的地质构造形迹是地史以来地壳运动的综合结果,包含有历次构造变动和有关矿化的特征标识信息,因此,遥感信息场分层解析是有效地进行成矿信息分离的重要手段[2~6]。无模型矿床预测法的理论依据是,矿床的形成是多种地质因素发生变异的综合结果,特殊地质环境中多期次构造运动复合叠加区具备形成大型、超大型矿床的条件,巨大矿源体的存在势必导致其与周围环境(背景)在物质成分、结构构造等方面的显著差异[15],包括诸如成矿岩石组合、构造式样、矿化蚀变以及地球物理、地球化学场甚至由深部矿源异常体引起其上方地球生物圈、大气圈等发生变异的信息特征。因此,应用无模型矿床预测法不需要事先有已知有矿模型或已知无矿模型作为预测的基础,而以分解和提取上述致矿异常信息、建立控矿地体的自然源模型作为科学找矿的重要途径。由于此法不需要事先有已知有矿模型或已知无矿模型作为预测的基础,所以它不仅对研究程度较低的新区矿床预测,而且对研究程度较高的老区寻找新类型和大型、超大型矿床都具重大理论意义和实用价值。
3方法技术
遥感图像处理和信息提取
遥感图像是地面景观物体按一定比例缩小了的立体模型,地质构造形迹及地质现象的总体和个体的地表几何形态(纹形图案)以及物理特征(电磁波辐射特征)被真实、客观、连续、全面地记录,具有高度的概括性;同时含有大量地下一定深度隐伏地质构造的信息特征。遥感图像上的这些信息特征(解译标志)反映的是地物在内外动力作用过程中,在一定地质、地理条件下物质成分、结构构造、物理性质等方面的差异。隐伏构造信息则通过地壳的机械变形以及地表的地球物理场和地球化学场改造乃至生物圈、大气圈发生异常等方式而显示出来。而且,多波段遥感图像信息特征中除可见光波谱部分外,许多波段的信息特征位于人的肉眼光敏区以外,如红外、微波图像信息等。这类图像揭示了大量肉眼看不见的地物信息特征,大大增加了鉴别地物属性特征的信息量。因此,采用遥感图像处理能有效地提取成矿信息,尤其是提取那些微弱的矿化信息,通过地质解译、分析构造形迹特征及空间分布规律和应力状态,不但真实、客观,而且克服了常规地质方法有时由于点线观测的局限性,大大开拓视野,获得连续、系统、大量的信息特征,有助于将破裂系统与区域构造变形乃至地质建造等有机地联系起来进行深入的分析研究,得出与客观实际相吻合的结论。
遥感构造信息场分“层”解析与致矿异常信息提取
遥感图像显现的地质构造形迹是地史以来地壳运动的综合结果,包含有历次构造变动和有关矿化的标识信息特征。因此,如何通过构造“分层”解析和应用数学方法去描述,实现线性体场的演译和分解,研究线性体场与其它地质异常的关系,找出其控岩控矿规律和提取矿化信息也就成了线性体场研究和成矿预测的主要内容。需要指出的是,以前大多数研究者注意到了线性构造的规模大小及空间尺度在构造解析和成矿预测中的重要性,但并未形成有效解决问题的方法。特别是在对线性构造量化处理时往往主次不分,把不同规模尺度和不同构造层次和期次的线性、环形构造混为一体进行处理,以致不仅使问题复杂化,而且很难确切找到线性、环形构造与相关地质体及有关矿产的内在联系,所得结论令人质疑。由控矿理论可知,特殊地质环境多期次构造复合叠加区具备形成大型、超大型矿床的条件,而这些地区线性体场的研究与分解,各期次构造变形场的建立及其构造应力场反演,在一定程度上是成矿预测的关键。因为构造应力场不仅控制着地壳岩石的机械变形、构造的成生演化及其组合形式,而且在一定程度上控制着沉积建造、岩浆活动及有关矿床的形成与分布。笔者经多年的科研攻关,根据遥感图像信息量大,对地质构造形迹显示的宏观性、信息连续性以及遥感大节理与宏观构造具有成生联系的性质;在理论上提出遥感大节理总是在野外构造小节理优势方位上发育发展的新论点,并提出了将宏观构造和相对微观构造(特别是遥感横张大节理)有机结合进行地质构造的“分层”解析,根据构造变形场特征反演应力场的新方法——“遥感图像分层解析法”及其相应理论[6,7]。该方法经在不同构造复合区试用,取得显著效果[5~7,10~13]。
例如,笔者在四川、贵州等地的构造复合变形区研究中,应用“遥感图像分层解析法”,通过遥感图像处理和褶皱断裂特别是横张大节理系统分层解析,结合野外调研,建立了研究区多期次构造变形场并反演了各时期构造应力场[10~12],获得了与众不同的新认识。
笔者在黔西郎岱地区构造解析和成矿预测中[12],应用航、卫片选择性地解译了该区主要褶皱及与其有关的横张大节理系统,结合野外调研,对该区构造变形特征进行了深入分析。根据该区宏观构造与横张大节理空间分布规律等特征建立了郎岱三角形构造格局的变形场,并据此反演得出该区燕山期在三角形边界条件(大断裂)控制下三边同时受力的联合应力场。其特点是应力和变形强度自三角形边部和顶点向三角形中心呈弧形递减,岩石变形严格按所得应力网络发生,在不同部位形成不同量级的褶皱并伴生相应的节理;三角形边部和顶点褶皱变形强烈,扩展到三角形中部褶皱趋于平缓。九条不同方位的褶皱相互嵌接,总体联系,局部复合,协调统一,控制着本区不同类型的矿床形成与分布。例如,在该三角形构造的北西和南西两个角点附近,集中分布了一系列铁矿床和铅锌矿床及矿化点(成因上与热液活动有关);而煤矿则相对集中分布在三角形构造的内部。这是因为三角形顶点处应力强度最大,断裂发育,为热液活动和矿化富集提供了有利的空间条件,从而形成了一系列金属矿床,但对煤和天然气富集起了破坏作用,未形成具工业价值的矿床。而在三角形构造内部,由于应力减弱,褶皱平缓,断裂不发育,缺乏导矿储矿构造,对金属矿化不利,但褶皱变形有利于煤矿富集。从区域含矿层分布分析,铁矿和铅锌矿的矿源层(泥盆系和石炭系)在区内广泛分布。根据本区三角形构造变形场和应力场特征及北西、南西两个角点处成矿富集规律,可以预测,在三角形构造东部顶点处有望找到相同类型的工业矿床。其次,区域上黔西古生界具备生油气的地质条件,测区南西侧盘县三角形构造内已有煤成气发现,本区地质和构造条件与之类似,因而有望在该三角形构造中部构造平缓处或穹窿构造中找到具工业价值的气田。
遥感线性体信息场的分“层”和相关信息组合量化解析与成矿预测
线性体场的分“层”量化即在前述线性构造分层解析结果基础上,采用网格法等方法分别对各期次各层次线性构造(成矿分析时结合环形构造等组合)进行量化处理和统计分析,以找出各层次各期次线性、环形构造的统计规律性及其与成矿作用的内在联系,定量、半定量地提取有用信息。不同的研究目的采用不同的量化处理方法。笔者在西昌地区有利含油气构造遥感解析和油气远景预测中[13],在全区线性构造和环形构造系统解译基础上,首先对区域性断裂系统进行量化处理,建立了该区区域线性体场(断裂系统)的二维和三维彩色量化解析模式,结合其它资料,在构造活动区中确定了有利于油气生成环境的相对稳定的构造区块(小相岭—米市断块中的二级构造单元——米市断陷);然后再对所选定区进行专题图像处理,提取有关信息,在此基础上,采用环形构造及与其密切相关的环状、放射状大节理有机结合的组合量化处理方法(环形构造采用自环心向环外缘反距离测度加权),结合物探地震、航磁重力及野外调研资料选定有关参数,通过图像图形处理并结合GIS建立了重要构造区块局部构造的二维和三维彩色定量解析自然模型。通过信息场的特征分析和求异,确定了局部构造隆起(异常)和背景的界线,定量提取了地腹隐伏构造的有关信息,作为评价局部构造和油气远景预测的依据。最后,通过综合分析,进行了油气远景预测。
遥感线性体场的背景与异常数学解析
遥感线性体场中包含有许多非地质信息及其它无关的信息。数学分析的目的在于采用数学地质的方法确定线性体场的背景,提取和增强微弱的有用信息,压抑噪声干扰,找出具有地质找矿指示意义的(异常)标志。
异常是针对背景而言的。所谓背景是指研究区空间变量在其分布区域内的空间趋势,它代表了该变量在研究区内的总体分布特征。对线性体场来说,线性构造的区域变化趋势就是背景,反映局部构造存在的环形、线性体是异常,如环状、放射状大节理密集区。确定背景的方法很多,如常用的滑动平均法、趋势分析法、克里格法等。趋势分析将观测值分解为趋势和剩余两部分,前者即为背景,后者代表局部变化的异常特征。也可用矿化标志变量与多个其它变量的自相关分析研究背景场,然后分解不同背景场中的异常。
背景条件按地质总体的多少可以分为单一背景和多背景两种,前者指那些只经历了一次地质作用的地区,各种因素的取值来自于一个总体;后者指经历了多次地质作用的地区,各种因素取值来自于多个总体。多背景的确定方法复杂,但对于多期次构造运动造成的线性体场而言,若采用前述分层解析的方法,先将多期次线性体按“层”分解,那么确定每个层次的线性体场的背景及其求异就可按单背景处理,然后,对各层次(期次)的背景进行综合分析,这样可使问题大大简化,且能有效提高分析精度。
遥感信息场的空域和频域滤波处理是分解和提取线性构造的有效方法。一般而言,低通滤波得出的低频信息能反映遥感信息场中的深部(隐伏地质构造)的信息特征,高通滤波得到的高频信息则能反映地表及浅部有关地质构造的特征信息。不同方位的线性体场可以分别采用不同的定向滤波模板进行处理分解[8]。经滤波处理的图像再经锐化和二值处理,经统计分析或采用特殊的表达方式,如线性体的空间频数图和密度图、中心对称度图、优益度图、变异系数图、空间距离测度图以及各种参数类型的直方图等[9],能减少人为干扰因素,有效地反映、提取地质构造和成矿异常具指示意义的特征参数。
信息熵是复杂程度和非均一化的数学度量,用它来查明或定量表征遥感信息场中的某种控矿因素的地质变异特征和统一性。以相对熵研究线性体场特征,若地质变量取线性体的长度或频数(或长度/频数),则所得空间密度熵能表征线性体密度场在空间内分布上的差异,若变量为线性体的方位,则所得方位熵可以揭示线性体场在方位分布上的非均匀变化程度。线性体的熵异常可以反映构造的多期次活动性和空间叠加等特征。
其次,分形理论等方法也是研究遥感信息场的有用工具。用分形理论研究线性构造和环形构造的空间特征,有助于查明构造活动性及与成矿作用关系,定量描述有关的自然地质指示标志空间变化的规律性。
三“S”支持下的多源信息综合与复合图像处理和找矿靶区快速评价优选
在大区域范围的成矿预测研究中,对于大量地、物、化、遥资料,采用多源信息综合与复合图像处理技术,能快速提取有用信息并得到形象直观的成果图像表达,已在地质找矿中取得较好效果。然而,这一方法存在的问题是,目前一般应用的遥感图像系粗纠正产品,地物点在空间上存在一定畸变(像点位移);而且,物化探信息本身存在一定的空间漂移。如果将这种变了形的图像和移了位的信息异场叠合在一起,将产生虚假的综合异常,有时会致人误入歧途。解决的办法是,采用三“S”支持下的多源信息综合与复合图像处理技术,先在GIS和GPS控制点控制下对遥感图像进行精纠正(尤其是投影差改正),制做正射投影遥感影像图,尔后通过区域化变量的结构分析,找出各种地学信息在不同尺度与水平的结构关联性,建立统一的随机场概念模型,并通过GIS实现各类信息在空间上精确匹配,充分利用计算机的可视化技术建立矿源体的自然信息源模型,定量提取综合找矿信息,达到找矿靶区快速评价优选的目的。笔者利用这一方法在南江区调成矿(金)预测中取得显著效果[14]。
南江地区地处特殊的地质构造环境,成矿地质条件较好,矿种较多,矿点星罗棋布。但相对而言,对金矿床的研究,前人研究程度很低,只在西部万金山和坪河发现沙金矿化点两处。本次研究中利用所研制的遥感正射影像,通过信息提取及金、银、铜等14个化探数据的数据处理、地、物、化、遥多源信息综合、复合图像处理有所新发现,并圈定了找矿远景区,经野外调研发现沿图像处理中识别出的构造带河谷中沙金矿化现象普遍,在金化探异常与遥感图像复合信息图上的较高异常地段采样化验分析,金矿化现象明显,已有数个样品达到金的工业品位,将来通过进一步工作,有望取得较大的进展。
参考文献
[1]朱章森,温世明,杨龙.来利山锡矿盲矿统计预测.地质科学,1987,(2):131~147.
[2]朱章森.无模型预测法刍议.物化探计算技术,1987,14(1):60~62.
[3]杨武年,朱章森.遥感构造信息场“分层”解析与无模型矿产预测的理论、方法及其意义.中国数学地质(6),北京:地质出版社,1995,63~67.
[4]杨武年,朱章森.遥感信息场分层解析与构造应力场定量研究.地质学报,1997,71(1):87~96.
[5]Yang Wunian,Zhu theory and method of Phase-separation analysis of remote sensing information field of metallogenetic environment and nonmodel ore-deposit of the 30th International Geological Science Publishers,The .
[6]Yang analysis of remote sensing images,a new method for determining regional tectonic stress of the 30th International Geological Science Publishers,The .
[7]杨武年,乐光禹等.恢复区域构造应力场的新方法.科学通报,1991,36(12):391~934.
[8]杨武年.遥感图像线性特征检测——匹配滤波模板最佳参数选择的定量公式.成都地质学院学报,1985,1(总34):101~108.
[9]王润生,杨为久.遥感线性体的数量化分析.国土资源遥感,1992,3(总13):49~54.
[10]杨武年,乐光禹等.金佛山菱形构造格局区域变形场和应力场遥感图像解析.成都理工学院学报,1994,21(1):102~109.
[11]杨武年,乐光禹.贵州西部六枝地区复合褶皱及其构造应力场遥感图像解析.见:第八届全国遥感技术学术会议论文集,1993,南宁,441~443.
[12]杨武年,黔西六枝—郎岱地区的构造格局及其构造应力场遥感图像解析.国土资源遥感,1996,2(总28):21~28.
[13]杨武年,李永颐,易显志等.遥感信息量化技术在西昌地区含油气构造地质研究及远景预测中的应用.国土资源遥感,1994,3(总21):63~70.
[14]杨武年,丁纯勤,王大可等.TM遥感正射影像地图在四川南江地区区调研究及成矿预测中的应用,地球科学(数学地质专刊),1997.
[15]赵鹏大,池顺都.初论地质异常.地球科学,1991,16(3):241~248.
随心所欲的写咯
要求中文核心还是科技核心?
中文核心:遥感学报科技核心:遥感技术与应用,遥感信息,国土资源遥感
《遥感学报》是中国科学院遥感应用研究所、中国地理学会遥感分会主办的专业学术性期刊,《中文核心期刊要目总览》(2011版)收录,《中国科学引文数据库》(CSCD)(2013-2014)收录。属于高层次的核心期刊。
《遥感学报》的前身是1986年创刊的《环境遥感》,她诞生于中国遥感事业的初创时期,是随着中国遥感事业的发展而成长起来的第一本遥感刊物。创刊以来,《遥感学报》结合中国遥感事业不同时期的重点和需要,刊登了大量国内最新科研成果和国家重点支持的研究项目的成果论文,对中国遥感科学技术的发展和人才培养发挥了巨大作用,成为目前中国遥感和地理信息科学领域最有影响的学术期刊。作为中国遥感领域唯一一本国家级综合性学术期刊,《遥感学报》致力于报道遥感领域及其相关学科具有国际、国内先进水平的研究报告和阶段性研究简报以及高水平的述评。着重反映本领域的新概念、新成果、新进展。内容涉及遥感基础理论,遥感技术发展及遥感在农业、林业、水文、地矿、海洋、测绘等资源环境领域和灾害监测中的应用,地理信息系统研究,遥感与GIS及空间定位系统(GPS)的结合及其应用等方面。《遥感学报》已被中国以下数据库收录为来源期刊或核心期刊:国际:l 斯高帕斯数据库(Scopus)l 俄罗斯文摘杂志(AJ)l 波兰哥白尼索引(IC)l 日本科学技术文献数据库(JST)l 美国乌利希期刊指南(UPD)l 美国剑桥科学文摘(CSA)l 中国科技论文统计与分析(年度研究报告)l 中国科学引文数据库(CSCD)l 中国学术期刊网络出版总库(CAJD)l 中国学术期刊文摘l Chinese Science Abstracts(A辑)l 中国电子科学文摘l 中文核心期刊要目总览l 中国学术期刊(光盘版)l “中国学术期刊综合评价数据库”通俗点说就是既是国家核心期刊也是sci检索期刊资料来源:
论文什么的都是浮云。东拼西凑一些,说一下自己的研究多么伟大,找个软件做几个个结果图粘一粘,抄一堆公式,再鄙视一下自己的无知,感谢一下大家的帮助,排排版,over。想省事找上一届的要他们的论文,基本每年都是一样的题目。
跟你的导师讨论一个题目,然后让他指点你分几步来写比较好,之后就是相关文献搜寻,然后确定自己的研究思路,需要实践动手的要自己做实验得到结论,然后对结论进行分析,得到优劣点,最后做一个展望即可。
随心所欲的写咯
测绘工程论文题目
测绘工程在整个工程建设过程中所起的作用很大,测绘工程论文题目大家想好了吗?下面是我整理的测绘工程论文题目,欢迎阅读参考!
1、改善GIS数字底图的质量
2、教学实习在土地资源管理专业中的应用
3、数字化土地利用现状调查的数据采编
4、数字化地形测量的几个问题探讨
5、数字化地籍测量在城镇地籍调查中的应用探讨
6、数字化成图几种作业模式的分析比较
7、数字化测图与地籍信息系统研究
8、数字化测图在地籍补测中的两种应用技巧
9、数字化测图技术在郑州高新区房地产测量中的应用
10、数字化测图教学方法探讨
11、数字化测绘技术在地籍图测绘中的应用与建议
12、数字化测绘技术在地籍测量中的应用与实施
13、数字化测绘技术在地籍测量中的应用初探
14、数字化测绘技术在城镇地籍测量中的应用
15、数字化测绘技术在源影寺古砖塔测绘中的应用
16、数字图像边缘检测方法的探讨
17、数字土地利用现状图的制图概括
18、数字土地利用现状图的制图综合
19、数字地图系统设计
20、数字地形图测绘中的几个问题探析
21、数字地籍测绘实施中的技术问题
22、数字地籍测量中GPS控制网的建立
23、数字地籍测量主要误差来源探讨
24、数字地籍测量作业探讨
25、数字地籍测量应用分析
26、数字地籍测量控制网的建立及精度分析
27、数字地籍测量有关作业流程及精度控制的探讨
28、数字地籍测量精度的讨论及控制方法
29、数字平顶山空间数据基础设施建设的初步研究
30、数字摄影测量生产的质量控制
31、数字水准仪SPRINTERM的试验与评述
32、数字水准仪及其在机场跑道板块高程测量中的应用
33、数字水准仪及水准尺的检定与精度分析
34、数字水准仪的测量算法概述
35、数字水准仪自动读数方法研究
36、数字水准仪观测模式及其应用实践
37、数字水准测量外业数据格式的转换与统一的实践
38、数字水果湖水下地形和淤泥厚度测量
39、数字测图中的坐标变换方法
40、数字测图中设站错误的内业改正
41、数字测图技术在罗营口水电站坝址地形测量中的应用
42、数字测绘产品的质量检查与质量控
43、数字综合法用于平坦地区地形图修测
44、数字高程模型与等高线质量相关性研究
45、数字高程模型及其数据结构
46、数字高程模型在农地整理排水渠道规划设计中的应用
47、数字高程模型地形描述精度的研究
48、数字高程模型的生产及更新
49、数字高程模型的裁剪与拼接技术
50、数学形态学在遥感图像处理中的应用
51、数据化测量在河道治理工程中的应用
52、数码相机可量测化的研制
53、斜拉桥变形观测方法及精度分析
54、斜距法在工程中的应用
55、断面测量内外业一体化系统研究
56、断高法在高等级公路测设中的应用
57、新州公路平面控制测量问题研究与施测
58、方位交会法在城区测量中的'应用
59、方向交会法坐标计算之初探——待定点坐标的计算
60、方向后交最佳点位分析
61、施工测量中快速设站方法
62、无像控基础地理空间数据更新方法
63、无反射棱镜全站仪测距性能测试
64、无反射镜测距的目标特性研究
65、无定向导线环在城市地籍测量中的应用
66、无控制DEM表面差异探测研究
67、既有铁路航测数字化测图的特点与质量控制
68、时态地籍数据库设计与宗地历史查询的实现方法
69、明暗等高线自动绘制方法
70、智能全站仪ATR实测三维精度分析
71、智能全站仪快速测量处理系统
72、曲线拟合高程在公路测量中的应用研究
73、曲线放样中的坐标转换及转换精度分析
74、曲线矢量数据压缩算法实现及评析
75、最小二乘平差理论在制图自动综合中的应用
76、最小二乘法在土地复垦场平整中的应用
77、最小二乘法对多周期函数的周期筛选优化
78、有关地籍调查的几个问题探讨
79、有限条件下坐标转换矩阵的确定与精化
80、有非对称缓和曲线的曲线主点测设方法
81、服务城市化的测绘工程专业培养计划探讨
82、村庄地籍测量之初探
83、条码信号复原技术在数字水准仪中的应用
84、条码因瓦水准标尺校准方法的探讨
85、极坐标法测设平面位置的精度分析
86、构建城镇地籍管理系统的研究
87、栅格数据矢量化及其存在问题的解决
88、标准化大比例尺数字测图的实践与体会
89、树状河系自动绘制的结构化实现
90、根据三斜距确定点的三维坐标及精度
91、桥梁墩_台的沉降观测和沉降值的预测
92、模拟GPS控制网精度估算方法研究
93、模糊数学在土地利用更新调查质量评定中的应用探讨
94、模糊综合评判及其在测绘中的应用
95、气象因素对全站仪测量的影响
96、水下地形分析中空间数据存储与管理方法的研究
97、水下地形测量误差分析及对策
98、水下地形测量误差来源及处理方法探讨
99、水下地形测量高程异常点剔除方法研究
100、水位改正中虚拟验潮站的快速内插
洋河流域遥感图像土地利用分类方法研究 【摘要】遥感影像分类方法的确定是LUCC研究中的关键步骤。文章以洋河流域为研究区,分别进行了非监督分类和监督分类。针对监督分类结果中存在的误差,对水域、植被、城镇与工矿用地三种类型地物的提取分别选择了综合阈值法、植被指数法、DEM数据辅助分析法进行了改进,结果表明改进后的提取结果较监督分类直接得到的结果有了很大的改善。【关键词】遥感图像;监督分类;综合阈值法;植被指数法【中图分类号】TP79 【文献标识码】A【文章编号】1671-5969(2007)16-0164-03一、研究区域概况及图像资料(一)研究区域概况洋河流域是张家口经济发展的中心地带,水资源相对丰富。洋河发源于山西省阳高县和内蒙古兴和县,是永定河上游的一大支流,流域面积约14600km2 。在张家口市流域面积为9762km2,流经万全县、怀安县、张家口市区、宣化县、宣化区、下花园区、怀来县等,干流全长106 km,在朱官屯于桑干河汇合后流至官厅水库,是官厅水库的重要水源。洋河流域形状东西向较长,南北向较短,地形总趋势西北高、东南低。流域的东北、北部和西北沿坝头一带海拔高程1200~1500m之间,西部和南部边界海拔高程一般在500~1000m之间。流域内80%以上为丘陵山区,绝大部分为荒山秃岭。流域内大部分为黄色沙壤土,并有部分砂砾土及黄粘土,沿河川地层厚且较肥沃[1]。(二)信息源遥感信息源的选择要综合考虑其光谱分辨率、空间分辨率、时间分辨率等因素, 这是利用遥感图像进行土地利用分类的关键问题。美国的Landsat TM 图像是当前应用最为广泛的卫星遥感信息源之一,它可提供7个波段的信息, 空间分辨率为30~120m。TM数据源各波段各有特点,可进行不同地物类型的信息提取。相关资料表明TM遥感数据各波段间的信息相关关系为:TM1与TM2,TM5与TM7高度相关,相关系数达以上,信息冗余大,可以考虑不选取TM1波段。另外由于第6个波段的分辨率为120m,不利于地物信息的提取,所以亦不选取TM6波段。一般来说, 选择图像类型时,应考虑研究区域的大小、研究的目的,以及要达到的精度要求,另外不同时相遥感图像的选择对分类精度也具有很大的影响。为了能把水域、城市与工矿用地、林地、耕地、裸地区分开,以洋河流域1987年9月17日的TM图像为信息源进行研究。本文中所使用的遥感图像处理工具为美国ERDAS公司的ERDAS 软件,它是一个功能完整的、集遥感与地理信息系统于一体的专业软件,具有数据预处理、图像解译、图像分类、矢量功能、虚拟gis等多个功能。二、现有遥感图像土地利用分类的主要方法及其分析遥感图像土地利用分类就是利用计算机通过对遥感图像中各类地物的光谱信息和空间信息进行分析,选择特征,并用一定的手段将特征空间划分为互不重叠的子空间,然后将图像中的各个像元划归到各个子空间中以实现分类[2]。按照是否有已知训练样本的分类数据,将其分为非监督分类和监督分类。它们最大的区别在于监督分类首先给定类别,而非监督分类则由图像数据本身的统计特征来确定。(一)非监督分类非监督分类是在多光谱特征空间中通过数字操作搜索像元光谱属性的自然群组的过程,这种聚类过程生成一副有m个光谱类组成的分类图。然后分析人员根据后验知识将光谱类划分或转换成感兴趣的专题信息类[3]。洋河流域内有很多山地,在图像上会产生大量的阴影,导致了像元灰度值的空间变化,这对分类结果有很大的影响。为此可以通过比值运算来去除阴影的影响,使向阳处和背阴处都毫不例外地只与地物的反射率的比值有关。常用算法:近红外波段(TM4)/红外波段(TM3),这样所得到的效果比较好,从原始图像和比值运算后的图像(图像略)中,可以清楚地看到山体阴面的阴影得到了有效的去除。经过比值运算后, 就可以对图像进行非监督分类。得到的分类结果如图1所示。非监督分类只根据地物的光谱特征进行分类,受人为因素的影响较少,不需要对地面信息有详细的了解,但由于“同物异谱、异物同谱”等现像的存在,其结果一般不如监督分类令人满意。比如官厅水库旁边的大量建筑物被分到水体一类。是因为在TM3波段上,水体和建筑物的灰度值相近, 同样在TM7波段上,裸山和建筑物的灰度值也相近。总之,在TM的6个波段上,无论采用哪个波段进行非监督分类,总有几种地物的光谱值接近,因此单纯依靠计算机自动分类取得很好的效果是非常困难的。
随心所欲的写咯
通信工程专业本科毕业设计(论文)选题指南(摘自网络)一、通信工程专业的学科领域通信工程专业属于电气信息类专业。电气信息类专业还包括:电气工程及自动化(080601);自动化(080602);电子信息工程(080603);计算机科学与技术(080605);电子科学与技术(080606);生物医学工程(080607)。二、通信工程专业的主要研究方向和人才培养目标1、通信工程专业的主要研究方向(1)数据通信传输问题的研究;(2)信号及信息处理方面的研究;(3)通信系统仿真方面的研究;(4)通信新技术方面的应用;(5)通信电子电路或微机接口方面的研究;(6)通信方面的软件开发,网络层协议研究等;(7)网络信息安全的研究2、通信工程专业的人才培养目标通信工程专业培养具备通信技术、通信系统和通信网等方面的知识,能在通信领域中从事研究、设计、制造、运营及在国民经济各部门和国防工业中从事开发、应用通信技术与设备的高级工程技术人才。本专业学生主要学习通信系统和通信网方面的基础理论、组成原理和设计方法,受到通信工程实践的基本训练,具备从事现代通信系统和网络的设计、开发、调测和工程应用的基本能力。通信工程专业的毕业生应具备以下几方面的知识能力和素质结构:(1)掌握通信领域内的基本理论和基本知识。(2)掌握光波、无线、多媒体等通信技术。(3)掌握通信系统和通信网的分析与设计方法。(4)了解通信系统和通信网建设的基本方针、政策和法规。(5)了解通信技术的最新进展与发展动态。(6)具有设计、开发、调测、应用通信系统和通信网的基本能力。(7)掌握文献检索、资料查询的基本方法、具有一定的科学研究和实际工作能力。(8)善于运用已有知识来学习挖掘新知识,具有能够将所学知识运用到实践活动中去和运用科学知识分析解决实际问题的能力。(9)具有独立观察,分析问题,敢于标新立异,勇于置疑,具备开展科学创新活动的基本能力,能灵活地把所学知识服务于社会。3、通信工程专业课程群分类(1)数字通信与网络交换:概率论与数理统计、随机信号分析、通信原理、无线通信原理、通信组网与程控交换、计算机通信与网络、移动通信、光纤通信、微波通信、电磁波与电磁场;(2)信号及信息处理:信号与系统、数字信号处理、通信原理、数据结构、数字图像处理、信息理论与编码;(3)电子电路:电路分析、模拟电路、数字电路、高频电子线路、DSP原理及应用、EDA技术、混合集成电路;(4)计算机应用方面:计算机文化基础、C语言程序设计、汇编语言、数据库原理及应用、软件工程、面向对象程序设计、多媒体技术、微机原理与接口技术、单片机原理应用等。三、毕业设计(论文)选题原则本专业毕业论文(设计)题目的选择要遵循以下原则:1、要结合所学专业毕业论文主要用来衡量学生对所学知识的掌握程度,所以论文题目不能脱离所学的专业知识。有些学生工作与所学专业没有关系,而本人对所从事的工作有一定的探索或研究,毕业论文就写了这方面的内容。这只能算是工作总结,但不能算是一篇毕业论文。工科学生学习的专业往往和他们从事的工作有较紧密的关系,他们有较丰富的实验经验和感性认识,经过几年的系统学习,可以学到相应的理论知识,使他们对自己的工作有一种新的认识,他们可以利用所学知识对原来的工作方式、工作程序、工作工具进行改进,以提高工作效率。2、内容要新工科论文除了具有理论性之外,更重要的是它的实践性和实际操作性。工科各学科发展非常之快,往往教科书刚进入课堂,内容就已经落后了。待学生毕业时,所学知识可能几近淘汰,所以学生选题要注意所用知识不能陈旧,要能跟上学科的发展。3、题目要大小适当,难易适度论文题目不宜过大,否则必然涉及的范围大广。学生处涉科研,普遍存在着知识面窄、理论功底不足的问题,再加上学生主要以业余学习为主,题目太大,势必讲得不深不透,乃至丢三落四,难以驾驭。因此,选题必须具体适中。题目选择要难易适度。过难,自己不能胜任,最后可能半途而废,无法完成论文;太容易,则论文层次太低,不能很好地反映几年来的学习成绩和科研水平,同时自己也得不到锻炼。选题最好能合乎个性兴趣爱好,如果自己对论题兴趣很高,就会有自发的热情和积极性,文章就容易写出新意来。四、毕业设计(论文)选题选题是决定毕业设计(论文)训练成败与质量好坏的关健之一。1、通信工程专业本科从选题的内容上可以分为理论型毕业设计(论文)和应用型毕业设计(论文)两大类。2、从本科毕业设计(论文)课题的来源,也可以分为教师命题型和自选型毕业设计(论文)两大类。3、学生要根据通信工程专业课程群来确定选题方向,数字通信与网络交换方向及信号及信息处理方向的所有应用方面课程均可以作为选题内容。但是,电子技术应用方向及计算机应用方向必须与通信或信号信息处理相结合,其中要有与通信相关的内容。4、从通信工程专业本科毕业设计(论文)所涉及的研究领域来看,可以是以下内容:(1)网络交换与数据传输分析;(2)通信网络或数字通信仿真(MATLAB,Systemview等);(3)信号及信息处理,(如数据采集,USB接口传输,图像数据处理等);(4)红外线遥感技术(如防盗遥感技术)(5)网络信息安全(如编码技术)(6)通信类软件开发,(如C语言与蓝牙结合)(7)数据传输类接口电路设计或软件设计(如嵌入式蓝牙设计)(8)光纤、无线、移动等通信新技术方面的应用或开发;(9)微波技术,电磁波传输技术,卫星雷达等方面(10)计算机网络或计算机控制方面(11)通信在军事方面的应用研究;(12)程控交换,交互式有线电视网等。(13)其他与通信相关的命题。为了您的安全,请只打开来源可靠的网址打开网站 取消来自: