损失函数发表的论文

1个回答默认排序

默认排序

按时间排序

tianyaguke1968

已采纳

论文: Rethinking Rotated Object Detection with Gaussian Wasserstein Distance Loss

任意朝向的目标在检测数据集中无处不在，相对于水平的目标检测，旋转目标检测仍处于起步阶段。目前，大多数SOTA研究都集中于回归目标的旋转角度，而解决旋转角度则带来新的问题：i) 指标与损失不一致。ii) 旋转角度回归区间不连续。 iii) 方形问题。事实上，以上的问题还没有很好的解决方案，这会极大地影响模型的性能，特别是在角度在范围边界的情况。

为了解决上述问题，论文提出了GWD方法，首先使用二维高斯分布来对旋转目标进行建模，然后使用Gaussian Wasserstein Distance(GWD)来代替不可微的旋转IoU，根据GWD计算loss值，这样就将模型训练和度量标准对齐了。论文的主要贡献有以下几点：

图2展示了两种旋转bbox的定义方式：OpenCV形式和长边形式，前者的角度为和横坐标的夹角，后者的角度则为长边与横坐标的夹角，两种定义可以进行相互的转换(不考虑中心点)：

两种表示方法的主要差异在于边顺序和角度，相同的bbox用不同的表达方式，可能需要交换边的顺序或角度加减90。在现在很多的研究中，将模型的设计与bbox的定义进行耦合来避免特定的问题：如可避免方形问题，可避免边交换问题。

IoU是检测领域的重要评测指标，但在实际训练中使用的回归损失函数(如 -norms)与评测指标往往存在不一致的问题，即更小的损失值并不等于更高的性能。目前，不一致问题在水平目标检测领域已经有了一些应对措施，如DIoU和GIoU。而在旋转目标检测领域，由于角度回归的加入，使得不一致问题更加突出，但目前仍没有很好的解决方案，论文也列举了一些例子来对比IoU损失和smooth L1损失：

从上面的分析可以看出，在旋转目标检测领域，IoU损失更能填补评判准则与回归损失间的差异。但很遗憾，在旋转目标检测领域，两个旋转bbox间的IoU计算是不可微的，不能用于训练。为此，论文基于Wasserstein distance提出可微的损失来替代IoU损失，顺便也可以解决旋转角度回归区间不连续问题和方形问题。

上图的Case1-2总结了旋转角度回归区间不连续问题，以以OpenCV形式的Case 2为例，对于anchor 以及GT ，存在两种回归的方法：

上述的问题通常出现在anchor和GT的角度在角度范围的边界位置时，当anchor和GT的角度不在边界位置时，way1则不会产生巨大的损失值。因此，对于smooth-L1，边界角度和非边界角度的最优处理会太一致，这也会阻碍模型的训练。

方形问题主要出现在使用长边形式的检测方法中，由于方形目标没有绝对的长边，长边形式对方形目标的表达本身就不唯一。以Case3为例，存在anchor 以及GT ，way1可以顺时针旋转一个小角度变成位置与GT一致的。但由于角度差距较大，way1会产生较高的回归损失。因此，需要像way2那样逆时针旋转较大的角度。造成方形问题的主要原因并不是前面提到的PoA和EoE，而是度量标准和损失计算的不一致导致的。

经过上述的分析，论文希望新的旋转目标检测方法的回归损失函数满足以下几点：

目前大多数IoU损失都可认为是距离函数，基于此，论文基于Wasserstein distance提出新的回归损失函数。首先，将旋转bbox 转化为2-D高斯分布：

为旋转矩阵，为特征值的对角向量。对于上的任意两个概率测度和，其Wasserstein距离可表达为：

公式2对所有的随机向量组合进行计算，代入高斯分布，转换得到：

特别要注意：

考虑在可交换的情况(水平目标检测) 下，公式3可转换为：

为Frobenius范数，这里的bbox均是水平的，公式5近似于 -norm损失，表明Wasserstein距离与水平检测任务中常用的损失一致，能够用于回归损失。这里的公式推算比较复杂，有兴趣的可以看看参考文献。

论文采用非线性转化函数将GWD映射为，得到类似于IoU损失的函数：

前面的曲线图也描述了使用不同非线性函数下的损失函数曲线，可以看到公式6十分贴近IoU损失曲线，也能度量无相交的bbox。因此，公式6显然可以满足Requirement1和Requirement2，下面开始分析Requirement3，先给出公式1的特性：

根据特性1可知，GWD损失函数对于OpenCV形式和长边形式是相等的，即模型不需要固定特定bbox表达形式进行训练。以Case2的Way1为例，GT 和预测拥有相同的均值和方差，GWD损失函数不会输出较大的损失值。而根据特性2和特性3，Case2和Case3的way1同样不会产生较大的损失值，所以GWD损失函数也满足Requirement3。整体而言，GWD在旋转目标检测的优势有以下几点：

论文将RetinaNet作为基础检测器，bbox表示为，实验主要采用OpenCV形式，回归目标定义为：

变量 , , 分布代表GT，anchor和预测结果，最终的多任务损失函数为：

为anchor数，为前景或背景的指示器，为预测bbox，为GT，为GT的标签，为预测标签，和为超参数，为focal loss。

对比其他针对特定问题的解决方案。

在DOTA数据集上对比多个模型，论文还有很多其他实验，有兴趣的可以去看看。

论文详细描述了当前旋转目标检测的主要问题，提出将旋转回归目标定义为高斯分布，使用Wasserstein距离度量高斯分布间的距离用于训练。目前，常规目标检测也有很多将回归转化为概率分布函数的做法，本文有异曲同工之妙，值得阅读。

280 评论 1小时前发布

损失函数发表的论文

1个回答 默认排序 默认排序 按时间排序

相关问答

论文发表

向你推荐

热门问题

1个回答默认排序

默认排序

按时间排序