欢迎来到学术参考网

视频监控中的图像拼接与合成算法研究

发布时间:2015-12-14 14:30

摘 要:一个固定的摄像机对某个场景进行监控是目前的视频监控技术中最常采用的方法。然而,例如机场、海关、停车场等较大视场的区域无法用单个摄像机对整个区域进行覆盖。为了使这一问题得到了解决,通常会利用多个固定的摄像机来对整个监控区域进行覆盖,或者在某个区域利用云台摄像机进行重复扫描这两种方法。在本文中,笔者对多摄像机的视频合成算法和云台摄像机的视频拼接算法分别进行了探讨。

关键词:视频监控;多摄像机;云台摄像机;视频拼接
  一、多摄像机的视频合成算法
  在本文中,融合多个摄像机的视频序列采用的是frame-to-mosaic方法。通常,这一方法具有以下几个步骤:
  第一、背景建模
  在本文中,笔者采用了高斯混合模型来进行各个视频学列的背景图像的获得,从而使多模式背景和运动目标的影响被消除掉。设高斯模型的个数K为5,阈值T为0.7,窗口长度L为200,初始标准差σ为20。观察图1和图2,我们可以看出,在高斯混合模型中,运动目标和背景扰动的影响被十分有效地消除了。其中图1是视频序列的莫伊幅图画,图2是该视频序列的背景图像,如下所示。
  
  
  
  
  
  
  
  
  第二、图像对准
  通常在进行图像对准时采用对准精度较高的方法,这主要是因为多个摄像机的集合关系只需在开始阶段标定一次即可。在本文中,笔者检测和匹配了各个背景图像的SIFT特征点,同时以RANSAC方法使其中的外电得以消除。除此之外,本文利用特征点对的对称传递误差计算单应矩阵,从而使对准过程的测量误差的影响被有效地消除掉,该目标函数如下所示:
  
  
  
  其中,当前帧的传递误差由              表示;
     
      前一帧的传递误差由              表示;
      前一帧和当前帧的第i个特征点对由            表示;
      这两幅图画的摄影变换由H来表示。
  第三、图像拼接
  如果摄像机数量叫大伙,为了使误差积累得以消除,并获得各个摄像机的全局对准参数,通常我们都采用全局优化算法。在本文中,笔者在对各个摄像机的全局对准参数进行计算时采用frame-to-mosaic方法,以避免全局方法所产生较大的计算量。假设,C1,C2,C3,C4是4个摄像机的背景图像,在本文中,笔者选择一个摄像机的背景图像,将其设为Ci,然后对准C2到C1,生成一个临时的拼接图像M。对准C3到M,并通过C3来更新M。同理来处理C4,以使所有背景图像的对准参数获得。
  一般情况下,利用这些对准参数把各个视频序列投影到全局坐标系中,便可以将他们合成为一个大的视频序列,这主要是由于各个摄像机之间的单应矩阵一旦确定便不再会发生变化。为了使计算速度得到改进,可以采用线性加权法对重叠区域的颜色融合进行计算。
  二、云台摄像机的视频拼接算法
  第一、消除运动目标的影响
  视频监控环境中的图像对准易受运动目标的影响。Davis利用改进的Mellin变换消除运动目标的影响,该方法的计算复杂度比较高,无法用于视频监控环境。Prati假定相机运动为单一的平移模型,在云台摄像机的跟随拍摄中,平移模型显然具有较大的误差,因而其应用范围比较有限。
  视频监控环境中的图像拼接问题有其自身的特点。一般情况下,云台摄像机的监控过程包括初始的静止阶段和运动阶段。本文把各帧图像分成多个不重叠的小块,然后利用快速搜索算法计算各个小块的运动向量,并统计运动向量的幅度直方图。如果直方图的最大峰值点对应的运动向量接近于零,则认为摄像机处于静止阶段,否则认为摄像机处于运动阶段。
  在摄像机的静止阶段,利用若干帧图像可以训练各个像素位置的高斯混合模型参数,从而得到一个较好的背景图像。当发现有感兴趣目标时,摄像机就进入运动阶段。由于云台摄像机的视频拼接对计算速度的要求比较高,本文采用Harris角点把当前帧对准到背景图像。与多摄像机拼接的情况相同,可以采用对称误差传递函数计算单应矩阵。
  第二、关键帧的选取
  在拍摄过程中,当摄像机跟随感兴趣目标移动时,物距会产生相应的变化,因而摄像机需要不断调整镜头的焦距,该过程会使部分图像产生轻微的模糊,从而影响图像对准的精度。此外,噪声、镜头失真,以及较少的纹理信息等因素也会增大图像对准的误差,并产生误差积累。本文从视频序列中选择若干幅清晰的图像作为关键帧,并利用关键帧之间的约束关系减小误差积累的影响。
  关键帧的选取依据2个准则:重叠区域的大小和纹理的丰富程度,通常可以利用梯度能量或颜色直方图作为后者的判断准则。本文选取摄像机静止阶段的背景图像作为第一个关键帧K1,并将其作为拼接的参考帧M1。当摄像机开始运动时,如果当前帧In与K1的重叠区域大于某个阈值(如80%),则将其直接对准到K1,在更新背景模型参数之后,可以得到一个新的背景图像Mn。反之,如果In与K1的重叠区域小于该阈值,并且重叠区的纹理信息比较丰富,可采用同样的方法得到Mn。不同的是,此时需要把In作为第二个关键帧K2,并且保存K2中与背景图像匹配的那些特征点的坐标,它一般不含有运动目标上的特征点。在后续各帧图像的对准过程中,将各帧图像的特征点与K2的特征点进行匹配,从而消除运动目标的影响。重复上述对准和更新过程,直到一个新的关键帧出现为止。  
  参考文献
  [1] 蔡铮,汪源源,王威琪. 一种改进的基于形变方法的图像拼接算法 [J]仪器仪表学报, 2006,(S1) .
  [2] 田瑞娟. 图像拼接融合技术在网络视频监控系统中的应用探究 [J]. 兵工自动化, 2009, (03) .

上一篇:手机的安全隐患浅析

下一篇:浅析互联网病毒防治