视频信号数字化处理后所带来的信号损伤和畸变
一 取样过程产生的信号损伤
在取样的过程中对信号造成的损伤主要有:孔阑效应、混叠效应、过冲和振铃。为了说明这些损伤所产生的原因,我们在以下叙述中给出分析结果。
取样是指用每隔一定时间的信号样值序列来代替原来在时间上连续的信号,也就是在时间上将模拟信号离散化。根据奈奎斯特取样定理:对于最大频率为fm的信号f(t),当取样频率fs不低于2fm时,由截止频率为fm矩形低通滤波器可以从取样信号中完全恢复原信号。但实际的物理过程与数字模型有不同的工程结果。
1. 孔阑效应
在数学模型的理想化状态下理想的取样脉冲宽度为无穷窄,取样情况及其频域情况如图一所示,但在实际设备中取样脉冲只能是有限宽度的脉冲,它的取样情况及其频域情况如图一所示,很显然具有不等于零的实际的有限宽度的取样脉冲所引起的孔阑效应会产生高频衰落。
由于信号的高频部分反映的是视频图象的细节,因此高频衰落会导致视频画面的细节模糊。针对这种情况实际工程中一般采用在将数字信号恢复成模拟信号以后通过提升高频的办法对这种失真进行补偿和校正。 一般来讲,由于取样信号的频率fs必须满足fs>2fm,而为了减少孔阑效应要求取样脉冲的宽度τ尽量小,因此要满足τ远远小于取样信号的周期t,即取样信号的脉冲宽度要满足1/τ>>2fm。
2.混叠效应
在实际应用中,为满足奈奎斯特定理在取样之前应使用截止频率为取样频率一半的滤波器对原信号进行滤波,滤除可能产生频谱混叠的高频成分,以保证新处理的信号是一个有限带宽的处理信号。理想低通滤波器特性如图二所示,但实际的低通滤波器性能如图三所示,因此为了尽量滤除大于1/2fc的频率成分,就要选择多阶滤波器。如果滤波器的阶数不足以达到滤除1/2fc以上的高频分量,会引起恢复的信号中频谱混叠效应。混叠效应在视频图象上表现为一种被称为morie的涟漪状的干扰。
3.过冲和振铃
在保证有效的消除混叠效应时,在上述情况已建议采用多阶滤波器以满足滤波器的带外特性,但是取样前的低通滤波器如果阶数太大,会引起过冲和振铃从而造成恢复的视频信号过渡的边沿不清晰。
针对以上两种信号损伤造成的矛盾,主观上选用阶数少的滤波器会有利一些,因为频谱混叠效应只有在图象有超过二分之一取样频率以上分量时,特别是有单频分量时才会明显感觉到,因此是偶发事件。但过冲和振铃效应却是只要有过渡边沿就回出现的经常性现象。因此就主观感觉来说,减少过冲和振铃留有一些混叠相对来讲更有利一些。一般工程上出于平衡考虑取样频率选为fc=(2.2---2.5)fm。
另外为克服这一矛盾的方法是采用过抽样方式,即在抽样时用两倍抽样频率抽样,这时频谱按两倍抽样频率周期重复,重复频谱中心频率之间的间隔比正常情况大一倍,如图四所示。这时抽样前的滤波相对简单,可以用阶数少、频率特性缓降的无振铃滤波器,然后在数字域用线形相位滤波器进行二分之一抽取滤波器恢复到原抽样频率样值。另外,在此过程中,取样频率增加了一倍,因此取样脉冲的宽度只有原来的一半,从而也起到了减少孔阑效应的作用。
二 量化误差所带来的信号损伤
取样过程是把模拟信号变成了时间上离散的脉冲信号,量化的过程则是进行幅度上的离散化处理。因此在时间轴的任意一点上量化后的信号电平与原模拟信号电平之间在大多数情况下总是存在有一定的误差,量化所引入的误差是不可避免的同时也是不可逆的,由于信号的随机性这种误差大小也是随机的,这种表现类似于随机噪声效果,具有相当宽度的频谱,因此我们又把量化误差称为量化噪声。但量化误差与噪声是有本质的区别的,因为任一时刻量化误差是可以从输入信号求出的,而噪声与信号之间则没有这种关系。
降低量化误差的方法最直接的就是增加量化级数减小最小量化间隔,但由此带来码率的增加从而要求更大的处理带宽,一般现在的视频信号均采用8比特、10比特,在信号质量要求较高的情况下采用12比特量化。此外,我们在设计一套系统的时候,可以考虑在系统的不同环节采用不同的比特量化,使得在系统的各个环节的量化级相互错开,从而避免量化噪声累积效果所产生的台阶效应,这种均衡的效果可以改善整个系统的量化失真。一般量化比特高的环节应该放在系统的前端,这样可以使系统的前端对信号造成的不可恢复损伤减小到最低限度。
为了减小量化误差我们还要正确的选择量化方式。量化有两种量化方式,一种是取整时只舍不入,此时产生的量化误差总是负的,最大量化误差等于两个相邻量化级的间隔d;另一种是取整时有舍有入,此时量化误差有正有负,量化误差的绝对值最大为1/2d。因此为了减少量化误差,应该采用有舍有入量化方式。
1.轮廓效应
如果信号两个相邻量化电平相差较大,若在图象面积较大的范围内,视频信号缓变区(如渐变的蓝天)能够看出不连续的跳变,即会在图象缓变区出现从一个量化电平到另一个量化电平之间的轮廓线,实际上就是图象的等量化电平线。这种轮廓线是原图象所没有的,所以又称为伪轮廓,即轮廓效应。
一种简单而有效的消除轮廓效应的方法是利用随机的高斯噪声信号发生器产生颤动信号,叠加到被量化的信号当中,当颤动信号的均方根值大于1/3d时人们便觉察不到轮廓效应的存在。在数字电视中使用最多的颤动信号是重复频率为取样脉冲的一半,峰-峰幅度为1/2d的方波,具体步骤如图五所示。
图五 高频颤动的效果
由图五比较可以看出,叠加颤动信号的效果等效于将量化间隔由d减小到1/2d,或者说将量化级数提高了一倍(比特数由n提高到n+1),从而改善了轮廓效应。顺便指出,由于模/数转换中的取样、量化都属于非线形过程,难以避免会出现差拍干扰,采用叠加颤动信号的方法对于消除图象中的差拍干扰也同样有效。同时由于颤动信号的幅度小,频率高,并未对图象细节造成显而易见的损伤。
2.颗粒杂波
如果最小量化电平不够小,则图象较弱信号的缓变区可能会出现在邻近的两个量化电平之间产生由于四舍五入法则而造成的跳变,使得图象在这个区域内出现颗粒状的杂波,而人的视觉对图象弱信号缓变区的噪声则是非常敏感的。
为了克服均匀量化时这种大信号时信噪比有余,而小信号时信噪比不足的特点,我们可以采用小信号时量化级间宽度小而大信号时量化级间宽度大些的非均匀量化,又叫非线形量化。值得说明一点,数字摄象机信号处理大多数采用非均匀量化方式,这是由于摄象机中的光-电转换至电视机显象管中的电-光转换在内的整个电视信道必须保持线形,但是实际的电视系统在没有校正之前是非线形的,因此为了使最终显示出来的光像保持良好的线形关系,在摄象机单元必须对它进行校正,即γ校正。而γ校正类似于非线形量化特性,因此我们可以在量化过程中采用非均匀量化方式,在提高小信号信噪比的同时也满足了γ校正的要求。
另外,由于在实际的信号中,弱信号出现的概率是很大的,为了改善弱信号时的的量化信噪比,可以采用压缩扩张的编解码方法。在量化之前,先利用非线形器件将信号电平高的部分进行压缩,然后对压缩过的信号进行量化,解码后复原出的模拟信号再通过非线形器件对大幅度信号进行扩张恢复没压缩之前的比例关系,这种方法相对扩大了小信号的动态范围,等效于对小信号采用量化间隔小的细量化而大信号采用粗量化,从而改善了弱信号的量化信噪比。
三 压缩编码所带来的信号损伤
数字电视信号数码率太高,数据量非常大。如果直接存储和传输不但开销很大,而且有时设备也承受不了如此大的负荷。压缩编码以压缩信源数码率为目的,尽量减少信源各符号的相关性,使信源的传输效率提高。当然,它是以牺牲图像质量为前提。必定会对信号造成一定的损伤。
下面针对几种常用的图像压缩方式,来看一下他具体会对信号带来什么样的损伤呢?
(一) 差值脉冲编码(dpcm)
电视图像基本上是由面积较大的像块(如蓝天,大地,服装)组成。虽然每个像块的幅值各不相同,但像块内各样值的幅度是相近或相同的。换句话说,相邻象素之间有很强的相关性。我们就可以利用这些相关性对当前的像素进行预测。再利用预测值得到差值。这样在很大的程度上降低了信源的冗余度。这种压缩方法对视频信号会产生以下问题:
1 由于在当前差值中包括当前的量化误差,而输出的前一样值又包括前一样值的量化误差,这就造成了量化误差的积累。而误差会传播,这就使信号抗通道误码能力减弱。
2 边缘清晰度临界。 根据dpcm编码思想,当被预测值处于图象突变边缘时,往往会导致错误预测或产生较大的预测误差。致使边缘清晰度临界。如:边缘为黑白突变,被预测值为x ,x1 x2 x3 x4 x5为已知值,由dpcm编码可得
进行水平一维预测 x=x1=0 产生错误预测
进行二维预测 x=x1+(x4-x5)/2=1/2 产生较大的预测误差
(二) 变换编码
变换编码首先对图象数据进行某种形式的正交变换,并对变换后的数据进行编码,从而达到数据压缩的目的。正交变换的种类很多,比如人们熟知的傅立叶变换,沃尔什哈达码变换,哈尔变换,斜变换,余弦变换,正弦变换,k--l变换。
变换编码中较常用的是离散余弦变换dct,它首先将输入图象分成若干nxn的图象块,对每一小图象块进行正交变换,从空间域变换到频域。为了达到压缩的目的,对dct系数需作量化处理。低频分量采用较小的量化间隔,量化误差小,精度高。频率越高,量化间隔愈大,精度越低。这是因为高频分量只影响图象的细节,对整块图象来讲,没有低频分量重要。读取时采用之字型。这样的处理给信号带来的损伤主要表现在:
由于高频信息的丢失,恢复图象中相邻块在边界上产生较为规则的误差分布,由于人眼对水平和垂直方向的规则误差分布具有特殊的敏感性,使得在主观感觉上认为具有规则误差分布的图象的质量明显降低,从而产生"块效应"。在拍摄一幅绿草如茵的草地中,充斥画面的草坪随风摇摆时,一种细块状的闪烁效应是这一失真的直观表现。
(三) 运动补偿预测
运动补偿预测是一个有力的工具,以便减少帧间的时间冗余度,并作为用于dpcm编码的预测技术。运动补偿概念是以对视频帧间运动的估计为基础的。也就是说,若视频镜头中所有物体均在空间上有一位移,那么用有限的运动参数来对帧间的运动加以描述。为了做到这一点,画面一般划分成一些不连续的象素块,对每个这样的象素块,只对一个运动矢量进行估算、编码和传送。
在mpeg压缩算法中,运动补偿预测技术用来减少帧间的时间冗余度,只对预测误差画面(原始画面与运动补偿预测画面之间的差别)加以编码。 运动补偿去除时间方向的冗余度,最多只能利用前后两帧图象间的相关性,效率不高。而实际上,尤其是在运动缓慢的图象序列中,在连续多帧图象间都存在着很强的时间相关性。正是由于它固有的缺陷,使得在图象活动剧烈或低码率通讯时,编码器只能通过迭用粗量化,降低帧频或舍去更多的dct变换系数来降低码率,因而对信号损伤较大,丢失了许多有用的信息。在恢复图象中将出现明显的块效应和运动物体边缘的蚊音效应。
(四) 混合编码
以两种或两种以上的方法对图象进行编码称为混合编码。我们熟悉的jpeg和mpeg都属于该种类型。
1 jpeg
jpeg是处理彩色或单色静止图象的压缩标准。利用它可以获得较高的压缩比,并保持较好的信噪比,从而大大节省图象存储空间,降低通讯带宽。但是编码过程会使物体在背景中的位置略有移动(即发生几何畸变)。另外,高压缩比场合,jpeg的重建图象在水平和垂直方向可能有晕圈、幻影,产生"方块"效应。
这不难理解.在jpeg系统中,首先把原始图像划分成大小相等的像素块,然后对图像块进行离散余弦变换dct(图像块的能量集中到少量的系数),再利用基于人眼特性的矩阵对变换后得到的系数矩阵进行量化,从而大幅度地压缩了矩阵系数,同时也造成了损失。最后对量化得到的矩阵系数进行无损熵编码。图像的重建过程是编码过程的逆过程。在高压缩比场合,jpeg的重建图像在水平和垂直方向出现晕圈、幻影,产生"方块"效应,就是因为对原始图像进行了分块的dct变换和量化。如果不分块或分块很大而进行dct变换与量化,那么图像块中像素能量集中到少量的系数效果将变的不明显,即不利于对数据进行量化压缩,同时还得使计算复杂度增加。这样一种现象实际上是离散余弦变换dct本身的特性所造成的(采用离散正弦变换dst或离散傅立叶变换dft结果类似)。
2 mpeg
mpeg压缩算法中包含两种基本技术:一种是基于16x16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于dct的压缩,用来减少帧序列的空间冗余。
较为成熟的mpeg技术是mpeg1和mpeg2。mpeg1是为适应在数字存储媒体(如cd-rom)上有效地存取电视图像而制定的标准(最高速率达1.5mb/s)。它的压缩技术基础为:宏模块结构、运动补偿及宏模块的有条件再补给。mpeg2是mpeg1算法的扩展。是为mpeg1最初没有包括在内或未想到的应用提供的一种视频编码方法。特别是对mpeg2提出的一个要求,即它所提供的视频质量,不能低于ntsc/pal,最高应可达到ccir601质量。mpeg2编码算法的基础为通用的混合dct/dpcm编码方案。
随着mpeg1和mpeg2的广泛应用,其缺陷也日渐显露,主要表现在:
(1)现已制定的标准所采用的技术,当码率很低时(低于64kb/s)会产生严重的"方块"效应、"蚊音噪声"以及"动作失真"。而低码率要求是移动通讯信道所必须的。
(2)编码采用了预测编码技术。例如采用基于块的运动补偿来去除时间相关性。但信号的纠错能力主要依赖其相关性,特别在条件较差的信道中传播时,干扰造成的错误会迅速沿视频序列扩散。
(3)仍停留在"帧"水平上处理视频,而无法对视频比特流内的各个对象(object)单独进行编码,解码及操作。而这种能力正是许多交互式应用(如多媒体数据库)所需要的。
虽然电视信号经过数字化处理后会有不同程度的损伤,有些损伤可以修复,并不影响图象的最终质量,而有些损伤是永久性的,只能通过一些补偿措施削弱它的影响,但这并不能影响电视领域向数字化的转变。因为与电视信号数字化后所带来的好处相比,这些经过修复的损伤的影响往往会被人为的忽略。
下一篇:影视审美中的“教”与“乐”