多媒体图像压缩技术姓名:Vencent Lee摘要:多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压和有损压缩两大类,这些压缩技术又各有不同的标准。一、多媒体数据压缩技术仙农(C.E.Shannon)在创立信息论时,提出把数据看作是信息和冗余度的组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内(几到几十毫秒)语音信号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如Huff-man编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为administrato时,立刻就可以猜到最后一个字母为r,那么在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等带来的冗余。通常数据压缩技术可分为无损压缩(又叫冗余压缩)和有损压缩(又叫熵压缩)两大类。无损压缩就是把数据中的冗余去掉或减少,但这些冗余量是可以重新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小(其压缩比一般为2:1至5:1)。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高(其压缩比一般高达20:1以上。最新被称为“E—igen—ID”的压缩技术可将基因数据压缩1.5亿倍)。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准(JPEG标准,即‘JointPhotographicExpertGroup’标准)和动态图像压缩标准(MPEG标准,即‘MovingPictureExpertGroup’标准)。JPEG利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种是基于有失真的压缩算法,另一种是基于空间线性预测技术(DPCM)无失真的压缩算法。为了满足各种需要,它制定了四种工作模式:无失真压缩、基于DCT的顺序工作方式、累进工作方式和分层工作方式。MPEG用于活动影像的压缩。MPEG标准具体包三部分内容:(1)MPEG视频、(2)MPEG音频、(3)MP系统(视频和音频的同步)。MPEG视频是标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变换(DCT)和运动补偿两项技术为基础,在图像质量基不变的情况下,MPEG可把图像压缩至1/100或更MPEG音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即“某些频率的音响在重放其频率的音频时听不到”这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到8:1或更高,音质逼真,与CD唱片可媲美。按照MPEG标准,MPEG数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、音频信号复合及同步后,其数据输率为1.5MB/s。其中压缩图像数据传输率为1.2M压缩声音传输率为0.2MB/s。MPEG标准的发展经历了MPEG—I,MPEG一2、MPEG一4、MPEG-7、MPEG一21等不同层次。在MPEG的不同标准中,每—个标准都是建立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压缩中,应用得较多的是MPEG一4标准,MPEG-是在MPEG-2基础上作了很大的扩充,主要目标是多媒体应用。在MPEG一2标准中,我们的观念是单幅图像,而且包含了一幅图像的全部元素。在MPEG一4标准下,我们的观念变为多图像元素,其中的每—个多图像元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图像。上图既表示了MPEG一4解码器的概念,又比较清楚地描绘了每个部件的用途。这里不是使用单一的视频或音频解码器,而是使用若干个解码器,其中的每一个解码器只接收某个特定的图像(或声音)元素,并完成解码操作。每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。MPEG一4标准对自然元素(实物图像)和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在MPEG一2标准中,图像被看作一个整体来压缩;而在MPEG一4标准下,对图像中的每一个元素进行优化压缩。静止的背景不必压缩到以后的I帧之中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止10秒钟,就只要传送一次(假设我们不必担心有人在该时间内切人此频道),需要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。MPEG一4标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在MPEG一2标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在MPEG一4标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重建伴音。当然,接收器必须能支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其它的节目类型同样可以作类似的规定。MPEG一7标准又叫多媒体内容描述接口标准。图像可以用色彩、纹理、形状、运动等参数来描述,MPEG一7标准是依靠众多的参数对图像与声音实现分类,并对它们的数据库实现查询。二、多媒体数据压缩技术的实现方法目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散余弦变换(DCT)和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做“小片”的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从DNA序列研究中发展出来的模式识别技术,能减少通过WAN链路的流量,最多时的压缩比率能达到90%,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。三、压缩原理由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度(redundancy)的组合。所谓冗余度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。图像的冗余包括以下几种:(1) 空间冗余:像素点之间的相关性。(2) 时间冗余:活动图像的两个连续帧之间的冗余。(3) 信息熵冗余:单位信息量大于其熵。(4) 结构冗余:图像的区域上存在非常强的纹理结构。(5) 知识冗余:有固定的结构,如人的头像。(6) 视觉冗余:某些图像的失真是人眼不易觉察的。对数字图像进行压缩通常利用两个基本原理:(1) 数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。(2) 人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。编码压缩方法有许多种,从不同的角度出发有不同的分类方法,比如从信息论角度出发可分 为两大类:(1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲就是解码图像和压缩 编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。(2)信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定的失真。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分类为:(1)无损压缩编码种类 •哈夫曼编码 •算术编码 •行程编码 •Lempel zev编码(2)有损压缩编码种类 •预测编码:DPCM,运动补偿 •频率域方法:正文变换编码(如DCT),子带编码 •空间域方法:统计分块编码 •模型方法:分形编码,模型基编码 •基于重要性:滤波,子采样,比特分配,矢量量化(3)混合编码 •JBIG,H261,JPEG,MPEG等技术标准衡量一个压缩编码方法优劣的重要指标(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;(2)压缩与解压缩要快,算法要简单,硬件实现容易;(3)解压缩的图像质量要好。四、JPEG图像压缩算法1..JPEG压缩过程JPEG压缩分四个步骤实现:1.颜色模式转换及采样;变换;3.量化;4.编码。2.1.颜色模式转换及采样RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。想要用JPEG基本压缩法处理全彩色图像,得先把RGB颜色模式图像数据,转换为YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则代表色度、饱和度。通过下列计算公式可完成数据转换。Y=+128人类的眼晴对低频的数据比对高频的数据具有更高的敏感度,事实上,人类的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说Y成份的数据是比较重要的。既然Cb成份和Cr成份的数据比较相对不重要,就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式:YUV411和YUV422,它们所代表的意义是Y、Cb和Cr三个成份的资料取样比例。2.变换DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。压缩时,将原始图像数据分成8*8数据单元矩阵,例如亮度值的第一个矩阵内容如下:JPEG将整个亮度矩阵与色度Cb矩阵,饱和度Cr矩阵,视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超过10个。例如,行和列采样的比例皆为4:2:2,则每个MCU将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。当图像数据分成一个8*8矩阵后,还必须将每个数值减去128,然后一一代入DCT变换公式中,即可达到DCT变换的目的。图像数据值必须减去128,是因为DCT转换公式所接受的数字范围是在-128到+127之间。DCT变换公式:x,y代表图像数据矩阵内某个数值的坐标位置f(x,y)代表图像数据矩阵内的数个数值u,v代表DCT变换后矩阵内某个数值的坐标位置F(u,v)代表DCT变换后矩阵内的某个数值u=0 且 v=0 c(u)c(v)=1/>0 或 v>0 c(u)c(v)=1经过DCT变换后的矩阵数据自然数为频率系数,这些系数以F(0,0)的值最大,称为DC,其余的63个频率系数则多半是一些接近于0的正负浮点数,一概称之为AC。3.3、量化图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。量化阶段需要两个8*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。当频率系数经过量化后,将频率系数由浮点数转变为整数,这才便于执行最后的编码。不过,经过量化阶段后,所有数据只保留整数近似值,也就再度损失了一些数据内容,JPEG提供的量化表如下:2.4、编码Huffman编码无专利权问题,成为JPEG最常用的编码方式,Huffman编码通常是以完整的MCU来进行的。编码时,每个矩阵数据的DC值与63个AC值,将分别使用不同的Huffman编码表,而亮度与色度也需要不同的Huffman编码表,所以一共需要四个编码表,才能顺利地完成JPEG编码工作。DC编码DC是彩采用差值脉冲编码调制的差值编码法,也就是在同一个图像分量中取得每个DC值与前一个DC值的差值来编码。DC采用差值脉冲编码的主要原因是由于在连续色调的图像中,其差值多半比原值小,对差值进行编码所需的位数,会比对原值进行编码所需的位数少许多。例如差值为5,它的二进制表示值为101,如果差值为-5,则先改为正整数5,再将其二进制转换成1的补码即可。所谓1的补码,就是将每个Bit若值为0,便改成1;Bit为1,则变成0。差值5应保留的位数为3,下表即列出差值所应保留的Bit数与差值内容的对照。在差值前端另外加入一些差值的霍夫曼码值,例如亮度差值为5(101)的位数为3,则霍夫曼码值应该是100,两者连接在一起即为100101。下列两份表格分别是亮度和色度DC差值的编码表。根据这两份表格内容,即可为DC差值加上霍夫曼码值,完成DC的编码工作。AC编码AC编码方式与DC略有不同,在AC编码之前,首先得将63个AC值按Zig-zag排序,即按照下图箭头所指示的顺序串联起来。63个AC值排列好的,将AC系数转换成中间符号,中间符号表示为RRRR/SSSS,RRRR是指第非零的AC之前,其值为0的AC个数,SSSS是指AC值所需的位数,AC系数的范围与SSSS的对应关系与DC差值Bits数与差值内容对照表相似。如果连续为0的AC个数大于15,则用15/0来表示连续的16个0,15/0称为ZRL(Zero Rum Length),而(0/0)称为EOB(Enel of Block)用来表示其后所剩余的AC系数皆等于0,以中间符号值作为索引值,从相应的AC编码表中找出适当的霍夫曼码值,再与AC值相连即可。例如某一组亮度的中间符为5/3,AC值为4,首先以5/3为索引值,从亮度AC的Huffman编码表中找到1111111110011110霍夫曼码值,于是加上原来100(4)即是用来取[5,4]的Huffman编码1111111110011110100,[5,4]表示AC值为4的前面有5个零。由于亮度AC,色度AC霍夫曼编码表比较长,在此省略去,有兴趣者可参阅相关书籍。实现上述四个步骤,即完成一幅图像的JPEG压缩。
数字技术的出现与应用为人类带来了深远的影响,人们如今已生活在一个几乎数字化的世界之中,而数字音频技术则称得上是应用最为广泛的数字技术之一,CD、 VCD等早已走进千家万户,数字化广播正在全球范围内逐步得到开展,正是这些与广大消费者密切相关的产品及应用成为了本文将要介绍的主题:数字音频压缩技术得以产生和发展的动力。1、音频压缩技术的出现及早期应用 音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。 数字信号的优势是显而易见的,而它也有自身相应的缺点,即存储容量需求的增加及传输时信道容量要求的增加。以CD为例,其采样率为,量化精度为16比特,则1分钟的立体声音频信号需占约10M字节的存储容量,也就是说,一张CD唱盘的容量只有1小时左右。当然,在带宽高得多的数字视频领域这一问题就显得更加突出。是不是所有这些比特都是必需的呢?研究发现,直接采用PCM码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下对声音至少可进行4:1压缩,即只用25%的数字量保留所有的信息,而在视频领域压缩比甚至可以达到几百倍。因而,为利用有限的资源,压缩技术从一出现便受到广泛的重视。 对音频压缩技术的研究和应用由来已久,如A律、u律编码就是简单的准瞬时压扩技术,并在ISDN话音传输中得到应用。对语音信号的研究发展较早,也较为成熟,并已得到广泛应用,如自适应差分PCM(ADPCM)、线性预测编码(LPC)等技术。在广播领域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬时压扩音频复用)等系统中都使用了音频压缩技术。 2、音频压缩算法的主要分类及典型代表 一般来讲,可以将音频压缩技术分为无损(lossless)压缩及有损(lossy)压缩两大类,而按照压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。各种不同的压缩技术,其算法的复杂程度(包括时间复杂度和空间复杂度)、音频质量、算法效率(即压缩比例),以及编解码延时等都有很大的不同。各种压缩技术的应用场合也因之而各不相同。 (1)时域压缩(或称为波形编码)技术是指直接针对音频PCM码流的样值进行处理,通过静音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低,声音质量一般,压缩比小(CD音质> 400kbps),编解码延时最短(相对其它技术)。此类压缩技术一般多用于语音压缩,低码率应用(源信号带宽小)的场合。时域压缩技术主要包括 、ADPCM、LPC、CELP,以及在这些技术上发展起来的块压扩技术如NICAM、子带ADPCM(SB-ADPCM)技术如、 、Apt-X等。 (2)子带压缩技术是以子带编码理论为基础的一种编码方法。子带编码理论最早是由Crochiere等于1976年提出的。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和下面介绍的变换压缩技术都是根据人对声音信号的感知模型(心理声学模型),通过对信号频谱的分析来决定子带样值或频域样值的量化阶数和其它参数选择的,因此又可称为感知型(Perceptual)压缩编码。这两种压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。 由于在子带压缩技术中主要应用了心理声学中的声音掩蔽模型,因而在对信号进行压缩时引入了大量的量化噪声。然而,根据人类的听觉掩蔽曲线,在解码后,这些噪声被有用的声音信号掩蔽掉了,人耳无法察觉;同时由于子带分析的运用,各频带内的噪声将被限制在频带内,不会对其它频带的信号产生影响。因而在编码时各子带的量化阶数不同,采用了动态比特分配技术,这也正是此类技术压缩效率高的主要原因。在一定的码率条件下,此类技术可以达到“完全透明”的声音质量(EBU音质标准)。 子带压缩技术目前广泛应用于数字声音节目的存储与制作和数字化广播中。典型的代表有著名的MPEG-1层Ⅰ、层Ⅱ(MUSICAM),以及用于Philips DCC中的PASC(Precision Adaptive Subband Coding,精确自适应子带编码)等。(3)变换压缩技术与子带压缩技术的不同之处在于该技术对一段音频数据进行“线性”的变换,对所获得的变换域参数进行量化、传输,而不是把信号分解为几个子频段。通常使用的变换有DFT、DCT(离散余弦变换)、MDCT等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获得显著改善,而相应付出的代价则是计算复杂度的提高。变换域压缩具有一些不完善之处,如块边界影响、预回响、低码率时声音质量严重下降等。然而随着技术的不断进步,这些缺陷正逐步被消除,同时在许多新的压缩编码技术中也大量采用了传统变换编码的某些技术。 有代表性的变换压缩编码技术有DolbyAC-2、AT&T的ASPEC(Audio Spectral Perceptual Entropy Coding)、PAC(PerceptualAudioCoder)等。 3、音频压缩技术的标准化和MPEG-1 由于数字音频压缩技术具有广阔的应用范围和良好的市场前景,因而一些著名的研究机构和大公司都不遗余力地开发自己的专利技术和产品。这些音频压缩技术的标准化工作就显得十分重要。CCITT(现ITU-T)在语音信号压缩的标准化方面做了大量的工作,制订了如、、等标准,并逐渐受到业界的认同。 在音频压缩标准化方面取得巨大成功的是MPEG-1音频(ISO/IEC11172-3)。在MPEG-1中,对音频压缩规定了三种模式,即层Ⅰ、层Ⅱ(即MUSICAM,又称MP2),层Ⅲ(又称MP3)。由于在制订标准时对许多压缩技术进行了认真的考察,并充分考虑了实际应用条件和算法的可实现性(复杂度),因而三种模式都得到了广泛的应用。VCD中使用的音频压缩方案就是MPEG-1层Ⅰ;而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用;MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。可以说,MPEG-1音频标准的制订方式决定了它的成功,这一思路甚至也影响到后面将要谈到的MPEG-2和MPEG-4音频标准的制订。 最新进展 1、多声道音频信号压缩与DolbyAC-3 随着技术的不断进步和生活水准的不断提高,原有的立体声形式已不能满足受众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。 更准确地说,环绕声应该是一种声音恢复形式,其新技术的含量实际表现在随着这种形式发展起来的一些数字压缩标准上。环绕声技术发展至今已相当成熟,已日渐成为未来声音形式的主流。有鉴于此,1992年CCIR(ITU-R)以建议的形式约定了多声道声音系统的结构及向下兼容变换的标准,即CCIR Recommendation 775。其中主要约定了大家熟知的声道形式及声道形式,而在对环绕声压缩的研究上也产生了许多专利技术,如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。这些技术在不同的场合,尤其是在影剧院、家庭影院系统,及将来的高清晰度电视(HDTV)等系统中得到广泛的应用。 (1)Dolby AC-3技术是由美国杜比实验室主要针对环绕声开发的一种音频压缩技术。在声道的条件下,可将码率压缩至384kbps,压缩比约为10:1。Dolby AC-3最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之一。Dolby AC-3是一种感知型压缩编码技术。 在Dolby AC-3中,音频输入以音频块为单位,块长度为512个样值,在48KHz采样率时即为毫秒,各声道单独处理;音频输入在经过3Hz高通滤波器去除直流成分后,通过另一高频带通滤波器以检测信号的瞬变情况,并用它来控制TDAC变换的长度,以期在频域分辨率和时域分辨率之间得到最好的折中效果; TDAC变换的长度一般为512点,而数据块之间的重叠长度为256点,即TDAC每毫秒进行一次;在瞬变条件下,TDAC长度被等分为256 点,这样DolbyAC-3的频域分辨率为,时域最小分辨率为毫秒;在图1中的定点/浮点转换类似于MPEG-1中比例因子计算的作用,主要是为了获得宽的动态范围,而在分离后的指数部分经编码后则构成了整个信号大致的频谱,又被称为频谱包络;比特分配主要是通过计算解码后的频谱包络(视为功率谱密度)和掩蔽曲线的相关性来进行的;由于比特分配中采用了前/后向混合自适应比特分配以及公共比特池等技术,因而可使有限的码率在各声道之间、不同的频率分量之间获得合理的分配;在对尾数的量化过程中,可对尾数进行抖晃处理,抖晃所使用的伪随机数发生器可在不同的平台上获得相同的结果;AC -3的帧结构由同步字、CRC、同步信息(SI)、码流信息(BSI)、音频块和附加数据等组成,帧长度与TDAC变换的长度有关,在长度为512点时,帧长为32毫秒,即每秒帧。通过以上叙述可见,在Dolby AC-3中,使用了许多先进的、行之有效的压缩技术。如前/后向混合自适应比特分配、公共比特池、TDAC滤波、频谱包络编码、及低码率条件下使用的多声道高频耦合等。而其中许多技术对其它的多声道环绕声压缩技术的发展都产生了一定的影响。可以说,AC-3的出现是杜比公司几十年来在声音降噪及编码技术方面的结晶(从一定的角度来看,编码技术实际上就是降低编码噪声影响的技术),在技术上它具有很强的优势。因而即使作为一项专利技术,DolbyAC-3仍然在影院系统、HDTV、消费类电子产品(如LD、DVD)及直播卫星等方面获得了广泛的应用,得到了众多厂商的支持,成为业界事实上的标准。 (2)MPEG-2BC(后向兼容方式),即ISO/IEC13818- 3,是另一种多声道环绕声音频压缩技术。早在1992年初,该方面的讨论工作便已初步开展,并于94年11月正式获得通过。MPEG-2BC主要是在 MPEG-1和的基础上发展起来的。与MPEG-1相比较,MPEG-2BC主要在两方面做了重大改进。一是支持多声道声音形式,二是为某些低码率应用场合,如多语声节目、体育比赛解说等而进行的低采样率扩展。同时,标准规定的码流形式还可与MPEG-1的第1和第2层做到前、后向兼容,并可依据CCIR 做到与双声道、单声道形式的向下兼容,还能够与Dolby Surround形式兼容。 在MPEG-2BC中,由于考虑到其前、后向兼容性以及环绕声音形式的新特点,在压缩算法中除承袭了MPEG-1的绝大部分技术外,为在低码率条件下进一步提高声音质量,还采用了多种新技术。如动态传输通道切换、动态串音、自适应多声道预测、中央声道部分编码(Phantom Coding of Center)、预编码(Predistortion)等。 然而,MPEG-2BC的发展和应用并不如MPEG-1那样一帆风顺。通过对一些相关论文的比较可以发现,MPEG-2BC的编码框图在标准化过程中发生了重大的变化,上述的许多新技术都是在后期引入的。事实上,正是与 MPEG-1的前、后向兼容性成为MPEG-2BC最大的弱点,使得MPEG-2BC不得不以牺牲码率的代价来换取较好的声音质量。一般情况下,MPEG -2BC需640kbps以上的码率才能基本达到EBU“无法区分”声音质量要求。由于MPEG-2BC标准化的进程过快,其算法自身仍存在一些缺陷。这一切都成为MPEG-2BC在世界范围内得到广泛应用的障碍。 (3)DVD(DigitalVersatileDisk)是新一代的多媒体数据存储和交换的标准。在视频DVD的伴音方式及音频DVD的声音格式选择上,AC-3和MPEG-2BC之间的争夺十分激烈,最后达成的协议如表1 所示。可见,多声道环绕声音频压缩技术标准亟待统一。
数字图像压缩技术的研究及进展摘要:数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法:JPEG、JPEG2000、分形图像压缩和小波变换图像压缩,总结了它们的优缺点及发展前景。然后简介了任意形状可视对象编码算法的研究现状,并指出此算法是一种产生高压缩比的图像压缩算法。关键词:JPEG;JPEG2000;分形图像压缩;小波变换;任意形状可视对象编码一 引 言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。二 JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。1.JPEG压缩原理及特点 JPEG算法中首先对图像进行分块处理,一般分成互不重叠的 大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的。2. JPEG压缩的研究状况及其前景 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:(1)DCT零树编码 DCT零树编码把 DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比 EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。(2)层式DCT零树编码 此算法对图像作 的DCT变换,将低频 块集中起来,做 反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。三 JEPG2000压缩 JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示。编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作。2.JPEG2000压缩的前景 JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。四 小波变换图像压缩1.小波变换图像压缩原理小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的JPEG2000标准 。2.小波变换图像压缩的发展现状及前景 目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。(1)EZW编码器 1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。(2)SPIHT编码器 由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。(3)EBCOT编码器优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。五 分形图像压缩 1988年,Barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的学生提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。1. 分形图像压缩的原理 分形压缩主要利用自相似的特点,通过迭代函数系统(Iterated Function System, IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。 分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像。2.几种主要分形图像编码技术 随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。(1)尺码编码方法 尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度 随着图像各个组成部分复杂性的不同而改变。(2)迭代函数系统方法 迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。(3)A-E-Jacquin的分形方案 A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。3.分形图像压缩的前景 虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。六 其它压缩算法 除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~ [13]。(1)形状自适应DCT(SA-DCT)算法 SA-DCT把一个任意形状可视对象分成 的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应Gilge DCT[10][11]变换的有效变换,但它比Gilge DCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。(2)Egger方法 Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。(3)形状自适应离散小波变换(SA-DWT) Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。 在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。七 总结 图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。参考文献:[1] 田青. 图像压缩技术[J]. 警察技术, 2002, (1):30-31.[2] 张海燕, 王东木等. 图像压缩技术[J]. 系统仿真学报, 2002, 14(7):831-835.[3] 张宗平, 刘贵忠. 基于小波的视频图像压缩研究进展[J]. 电子学报, 2002, 30(6):883-889.[4] 周宁, 汤晓军, 徐维朴. JPEG2000图像压缩标准及其关键算法[J]. 现代电子技术, 2002, (12):1-5.[5] 吴永辉, 俞建新. JPEG2000图像压缩算法概述及网络应用前景[J]. 计算机工程, 2003, 29(3):7-10.[6] J M Shaprio. Embedded image coding using zerotree of wavelet coefficients[J]. IEEE Trans. on Signal Processing, 1993, 41(12): 3445-3462.[7] A Said, W A Pearlman. A new fast and efficient image codec based on set partitioning in hierarchical trees[J]. IEEE Trans. on Circuits and Systems for Video Tech. 1996, 6(3): 243-250.[8] D Taubman. High performance scalable image compression with EBCOT[J]. IEEE Transactions on Image Processing, 2000, 9(7): 1158–1170.[9] 徐林静, 孟利民, 朱建军. 小波与分行在图像压缩中的比较及应用. 中国有线电视, 2003, 03/04:26-29.[10] M Gilge, T Engelhardt, R Mehlan. Coding of arbitrarily shaped image segments based on a generalized orthogonal transform[J]. Signal Processing: Image Commun., 1989, 1(10): 153–180.[11] T Sikora, B Makai. Shape-adaptive DCT for generic coding of video[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(1): 59–62.[12] T Sikora, S Bauer, B Makai. Efficiency of shape-adaptive 2-D transforms for coding of arbitrarily shaped image segments[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(3): 254–258.[13]邓家先 康耀红 编著 《信息论与编码》
MP3 MP3原本用于表述MPEG1 Layer 3,但是日常应用中已经发展至包含Layer 1, Layer 2以及Fraunhofer Institute所扩展的MPEG 。MP3是得到最高认知度的编解码器之一,在互联网编解码器中具有最大的用户群。但是为达到近CD品质音频,对某些难应付的内容需要高于192kbps速率。 [编辑]MPEG1、Part 3 (ISO/IEC 11172-3) 定义了双声道,采样率为32、或者48KHz,编码率从32 到 384kbps的编解码方法。此标准描述了三个相关方法:Layers I、II、和 III。Layer III提供最高的压缩率,但是复杂度也最高。 [编辑]MPEG2、Part 3 (ISO/IEC 13818-3) 对MPEG1标准提供了两个重要的改进。首先,低比特率需求通过使“低采样率(LSF)”扩展标准化而得到满足。该编解码器提供了16、、和24kHz采样率编码方法;其次,MPEG1模式被扩展为支持上至12声道的音频数据。Fraunhofer的低频率扩展,即,提供了MPEG2一半的采样频率选择:8、和12kHz。 [编辑]数字杜比(AC-3) 目前,数字杜比具有最大的多声道编解码用户群。通过将多声道整合至单一编码对象中,数字杜比实现了高品质、低复杂度音频压缩。尽管该算法与编码声道的数量无关,目前的实现方案已经接受了SMPTE的建议,即采用了由5个全带宽音频声道和1个用于低音的分带宽声道组成声道:分别为左、中、右、左环绕、右环绕和低频扩展(LFE)。 数字杜比支持灵活的播放方式:1声道到声道,32、或者48KHz采样率,比特率从32 到640kbps。解码后的音频可自动匹配播放系统以提供与音响配置无关的最佳品质的音效。 [编辑]aacPlus系列编解码器 Coding Technologies公司已经开发了一系列得到国际标准组织广泛采用的编解码器。MPEG2采用了AAC,以128kbps提供接近CD的品质,即使对于特别复杂的内容也如此。aacPlus v1被DVD论坛、DVB、Digital Radio Mondiale、3GPP2和ISMA等组织定为标准。aacPlus v2在2004年末开始商用,已被指定为3GPP中的高品质音频编解码器,aacPlus v 2的所有组件都是MPEG-4音频规范的组成部分。 [编辑]AAC aacPlus系列编解码器均是围绕MPEG2、Part 7(ISO/IEC 13818-7)所描述的AAC核心而建立。AAC提供8、11、12、16、22、24、32、44、 48、63、88或者96kHz的采样率,以及高达48声道的音频,每个声道比特率可高达288kbps。其定义了三个紧密相关的方案:低复杂度(Low Complexity)、Main和可伸缩采样率(SSR)。低复杂度的AAC-LC需要非常少的处理器资源,因此通常用于嵌入式应用中。 [编辑]MPEG4、Part 3(ISO/IEC 14496-3) 为MPEG2 AAC增加了知觉噪音替代(PNS)工具,因此定义为MPEG4 AAC。PNS通过对类噪声信号的参数化编码,从而简化这些信号的表达方法。不能将PNS与MPEG2、MPEG4中的时域噪声整形(TNS)相混淆。 [编辑]aacPlus V1 该编解码器有时被称为“高效AAC”(HE-AAC)。它整合了基本的AAC编解码器和频带复制(SBR)技术。SBR是一种频带扩展技术,可使几乎任何音频编解码器在比特率下降30%时仍能保证音质。SBR通过使用频带低半部分信息加上一些编码参数来表达频带的高半部分信息。SBR技术也可用于其他编解码器,例如结合带MP3的SBR构成了MP3Pro编解码器。 [编辑]aacPlus V2 在aacPlus V1中增加参数化立体声(PS)技术,形成了aacPlus V2编解码器。PS技术使用左声道和一些额外的编码参数,生成右声道,进一步降低了比特率。aacPlus V2在160 Kbps下可达到声道品质,在48Kbps可达到近CD立体声品质,在32 Kbps下可达到极佳立体声效果,在24Kbps下可达到娱乐品质立体声效果,在低于16Kbps时可达到高品质单声道效果。aacPlus V2的效率使移动数字广播新应用成为可能。 [编辑]WMA WMA是微软授权的Windows Media Series中一系列广泛使用的音频编解码器。此系列中最新版本是WMA9、WMA9 Professional、WMA9 Lossless、WMA9 Voice 和WMA9 Variable Bit Rate(VBR)。在嵌入式应用中,WMA9是此系列中最常见的编解码器;提供16位/320kbps双通道,采样率高达48KHz。“Professional”支持24位、96KHz采样率和高达128到768kbps的声道。与数字杜比相同,解码后的音频可自动匹配播放系统,以提供和音响配置无关最佳品质的音效。“Lossless”用于CD存档,压缩率在2:1和3:1之间。“Voice”用于压缩语音至20kbps。尽管VBR对于大部分的流应用并不理想,但WMA9和“Professional”都能以可变比特率编码。“Lossless”则总是使用VBR功能。 [编辑]Ogg Vorbis 为无需专利费用的开放资源,具有近似于MP3的音质。“ogg”是容器格式,而“Vorbis”为音频编解码器。由于它免除了与MP3游戏音乐相关的按每游戏收取的许可费用,因此Ogg Vorbis在电脑游戏厂商中使用率日益上升。
摘要: 多媒体通信技术是当今世界科技领域中最有活力、发展最快的高新信息技术,它时时刻刻都在影响着世界经济的发展和科学技术进步的速度,并不断改变着人类的生活方式和生活质量。多媒体通信综合了多种媒体信息间的通信,它是通过现有的各种通讯网来传输、转储和接收多媒体信息的通信方式,几乎覆盖了信息技术领域的所有范畴,包括数据、音频和视频的综合处理和应用技术,其关键技术是多媒体信息的高效传输和交互处理。关键词:多媒体 图象 音频 功能The application of multimedia technologyAbstract: Multimedia communications technology is the world's science and technology in the field of the most dynamic and fastest growing high-tech information technology, it always have influence in the world economic development and the pace of scientific and technological progress and changing the human way of life and quality of life . A variety of integrated multimedia communications between the communications media information, it is through the various existing communications network to transmit and receive multimedia information and dump the means of communication, cover nearly the area of information technology in all areas, including data, audio and video The integrated treatment and application technology, its technology is the key to the efficient transmission of multimedia information and interactive processingKey words: Multimedia audio features images引 言随着技术的迅速发展,图像、视频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式。多媒体通信是信息高速公路建设中的一项关键技术,是多媒体、通信、计算机和网络等相互渗透和发展的产物,它将极大地提高人们的工作效率,改变人们的教育、娱乐等生活方式,是21世纪人们通信的基本方式。第一章 多媒体通信技术基础简介多媒体通信的基本概念和特征 基本概念媒体是信息表示和传输的载体,是一个重要的概念。ITU-T I .374建议将媒体划分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体5类。多媒体数据是指多种式样信息的载体,如文本、图形、图像、声音等数据。其特点主要有以下几点:(1)多媒体数据种类繁多(大多是非结构化数据),不同来源的媒体,具有完全不同的形式和格式;(2)多媒体数据量庞大;(3)多媒体数据具有时间特性和版本概念,如在视频点播系统中必须考虑到媒体间以及媒体内部在时间上的同步关系。由此可知多媒体数据与传统的数值和字符不同,因而其存储结构和存取方式也具有特殊性,描述它的数据结构和数据模型也是有差别的。在这种情况下就产生了一种全新的数据库系统--多媒体数据库系统。多媒体数据库是能够有效实现多媒体数据的存储、读取、检索等功能的数据库系统。它的主要特点是:(1)继承了传统数据库的一些优点,例如数据独立性、利用数据库查询语言进行高层次查询、开发控制、容错技术等;(2)能对具有时空关系的数据进行同步和管理。但是目前对于多媒体数据库的功能以及实现方法还没有达成共识,因而出现了多种形式的媒体数据库,并且实现方法也各不相同。从其总体发展上看,多媒体数据库的数据模型可分为关系数据模型、面向对象的数据模型和超媒体数据模型3类。基于不同数据模型的多媒体数据库管理系统(DBMS)的功能也有很大差别,通常基于关系数据模型的多媒体DBMS可以实现多媒体数据的存取,对多媒体数据对象之间的语义关系、时态关系、空间关系不加处理,所以这部分工作就留给应用程序去完成了。面向对象的数据模型和超媒体数据类型可以支持多媒体数据对象之间的语义关系、时态关系、空间关系的处理,其抽象程度更高,但DBMS的实现也相对复杂。在多媒体通信系统中另一个常出现的词汇是"超媒体"。在出版物中经常会出现表示注解意思的"注"字,由"注"你可以找到与之相关的一段文字或一篇文章。这种由"注"而链接到一段文字或一篇文章的链即称为超链拨,同理,超级链也可以将若干不同媒体链接起来,其集合便称为"超媒体"。多媒体通信的特征多媒体通信技术的发展打破了传统通信的单一媒体、单一电信业务的通信系统格局,反映了通信向高层次发展的一种趋势,是人们对未来社会工作和生活方式的向往。多媒体通信技术是一种综合技术,涉及多媒体技术、计算机技术、通信技术等多个领域。多媒体通信系统必须同时兼有集成性、交互性、同步性3个主要特征。 集成性多媒体通信系统的集成性指的是能对内容数据信息、多媒体和超媒体信息、脚本信息和特定的应用信息等4类信息进行存储、传输、处则和显现的能力。(1) 内容数据信息(2) 信息是以某一种结构的形式存在的,典型的结构有两种:一种是对象构,其中可处理的最小单元为对象(Object);另一种是文件结构,其中处理的最小单元为文件(File)。多媒体和超媒体信息多媒体和超媒体信息与单媒体信息不一样,它们是结构化的信息,由结构框架和内容数据2部分组成。多媒体和超媒体信息的最小表达形式由两类,一类称为对象,另一类称为文件。(3) 脚本信息脚本信息是一组特定的用语意关系联系起来的、结构化的多媒体和超媒体信息,需要提供表示这一组多媒体信息的运作过程和与外部处理模块间的关系。(4) 特定的应用信息上述3类信息都是低层信息,可以由标准来定义和表示。特定的应用信息是高层信息,是与应用密切相关的,将随应用场合的不同有很大的不同,它的表示方法是基于上述3类的基础之上的。 交互性交互性指的是在通信系统中人与系统之间的相互控制能力。在多媒体通信系统中,交互性有两个方面的内容。一是人机接口,也就是人在使用系统的终端时用户终端向用户提供的操作界面;二是用户终端与系统之间的应用层通信协议。多媒体通信终端的用户对通信的全过程有完备的交互控制能力,这是多媒体通信系统的一个主要特征,也是区别多媒体通信系统与非多媒体通信系统的一个主要准则。 同步性同步性指的是在多媒体通信终端上显现的图像、声音和文字均以同步方式工作。如用户要检索一个重要的历史事件的片断,该事件的活动图像或静止图像存放在图像数据库中,其文字叙述和语言说明则是放在其他数据库中。多媒体通信终端通过不同传输途径将所需要的信息从不同的数据库中提取出来,并将这些图像、声音、文字同步起来,构成一个整体的信息呈现在用户面前。多媒体通信系统中的同步性是多媒体通信系统最主要的特征之一,信息的同步与否决定了系统是多媒体系统还是非多种媒体系统。同步可在链路层级、表示层级和应用层级3个层面上实现第二章 多媒体音频技术音频技术发展较早,几年前一些技术已经成熟并产品化,甚至进入了家庭,如数字音响。音频技术主要包括四个方面:音频数字化、语音处理、语音合成及语音识别。音频数字化目前是较为成熟的技术,多媒体声卡就是采用此技术而设计的,数字音响也是采用了此技术取代传统的模拟方式而达到了理想的音响效果。音频采样包括两个重要的参数即采样频率和采样数据位数。采样频率即对声音每秒钟采样的次数,人耳听觉上限在20KHz左右,目前常用的采样频率为11KHz,22KHz和44KHz几种。采样频率越高音质越好,存贮数据量越大。CD唱片采样频率为,达到了目前最好的听觉效果。采样数据位数即每个采样点的数据表示范围,目前常用的有8位、12位和16位三种。不同的采样数据位数决定了不同的音质,采样位数越高,存贮数据量越大,音质也越好。CD唱片采用了双声道16位采样,采样频率为,因而达到了专业级水平。音频处理包括范围较广,但主要方面集中在音频压缩上,目前最新的MPEG语音压缩算法可将声音压缩六倍。语音合成是指将正文合成为语言播放,目前国外几种主要语音的合成水平均已到实用阶段,汉语合成几年来也有突飞猛进的发展,实验系统正在运行。在音频技术中难度最大最吸引人的技术当属语音识别,虽然目前只是处于实验研究阶段,但是广阔的应用前景使之一直成为研究关注的热点之一。第三章 多媒体图像视频技术3.1视频技术虽然视频技术发展的时间较短,但是产品应用范围已经很大,与MPEG压缩技术结合的产品已开始进入家庭。视频技术包括视频数字化和视频编码技术两个方面。视频数字化是将模拟视频信号经模数转换和彩色空间变换转为计算机可处理的数字信号,使得计算机可以显示和处理视频信号。目前采样格式有两种:Y:U:V4:1:1和Y:U:V4:2:2,前者是早期产品采用的主要格式,Y:U:V4:2:2格式使得色度信号采样增加了一倍,视频数字化后的色彩、清晰度及稳定性有了明显的改善,是下一代产品的发展方向。视频编码技术是将数字化的视频信号经过编码成为电视信号,从而可以录制到录像带中或在电视上播放。对于不同的应用环境有不同的技术可以采用。从低档的游戏机到电视台广播级的编码技术都已成熟。图像压缩技术图像压缩一直是技术热点之一,它的潜在价值相当大,是计算机处理图像和视频以及网络传输的重要基础,目前ISO制订了两个压缩标准即JPEG和MPEG。JPEG是静态图像的压缩标准,适用于连续色调彩色或灰度图像。它包括两部分:一是基于DPCM(空间线性预测)技术的无失真编码,一是基于DCT(离散余弦变换)和哈夫曼编码的有失真算法。前者图像压缩无失真,但是压缩比很小,目前主要应用的是后一种算法,图像有损失但压缩比很大,压缩20倍左右时基本看不出失真。MJPEG是指MotionJPEG,即按照25帧/秒速度使用JPEG算法压缩视频信号,完成动态视频的压缩。MPEG算法是适用于动态视频的压缩算法,它除了对单幅图像进行编码以外还利用图像序列中的相关原则,将帧间的冗余去掉,这样大大提高了图像的压缩比例。通常保持较高的图像质量而压缩比高达100倍。MPEG算法的缺点是压缩算法复杂,实现很困难。第四章 多媒体通信系统1、 体系结构多媒体通信(multimedia communcations)是在位于不同地理位置的参与者之间召开的一种会议或者进行的交流,通过局域网(LAN)、广域网(WAN)、内联网(intranet)、因特网(Internet)或者电话网来传输压缩的数字图像和声音信号。像电视那样的多目标广播、录象机那样的流式播放、电话会议、电视会议、IP电话、可视电话和IP传真等等都是多媒体通信技术的一些具体的和各有特色的应用。多年来,国际电信联盟(ITU)为公共和私营电信组织制定了许多多媒体计算和通信系统的推荐标准,以促进各国之间的电信合作。ITU的26个(Series A~Z)系列推荐标准中,与多媒体通信关系最密切的7个系列标准如表4-1所示,三种类型的多媒体通信系统的核心技术标准集如表4-1所示。表4-1 ITU系列推荐标准系列名 主要内容Series G 传输系统、媒体数字系统和网络Series H 视听和多媒体系统Series I 综合业务数字网(ISDN)Series J 电视、声音节目和其他多媒体信号的传输Series Q 电话交换和控制信号传输法Series T 远程信息处理业务的终端设备2、网关的功能和结构网关是一台功能强大的计算机或者工作站,它担负线路交换网络(如电话网络)和信息包交换网络(如因特网)之间进行实时的双向通信,提供异种网络之间的连通性,它是传统线路交换网络和现代IP网络之的桥梁。IP电话(见" IP电话")的出现允许电话呼叫在信息包交换网络上进行,从而引发一场电信工业的革命。但IP电话在成为主流电话服务的道路上遇到了许多障碍。其中最大的一个问题是在IP电话网络和公众交换电话网络之间缺乏连通性。一个重要的原因是早期的网关存在对IP电话进入主流电话服务的限制。例如,通过网关建立呼叫比较困难,而且需要使用非常规的电话号码;不同的网关之间的兼容性妨碍呼叫的建立;声音的质量比较差、有回音以及延迟时间比较长等。这就促进了开发允许IP和PSTN客户能够相互通信的网关,其中的一个措施就是提高网关的处理能力。低档的网关有1~6个端口,典型地使用高档奔腾处理器的PC机方案,提供媒体处理、呼叫控制和信息包的处理等网关功能。高档网关把网关功能分散到几个处理器来实现,这叫做计算机基电话集成(computer-telephony integration,CTI)平台,可提供100多个端口。网关的基本功能可归纳为三种:(1) 转换协议(translating protocols):网关作为一个解释器,使不同的网络能够建立联系,例如,允许PSTN和网络相互对话以建立和清除呼叫。(2) 转换信息格式(converting information formats):不同的网络使用不同的编码方法,网关将对信息进行转换,使异种网络之间能够自由地交换信息,例如声音和电视。(3) 传输信息(transferring information):负责在不同网络之间传输信息。网关的主要部件包括:(1) 线路交换网络(switched-circuit network,SCN)接口卡,这是一种典型的T1/E1或者叫做PRI ISDN线路接口卡,它们与线路交换网络进行通信。主速率接口(primary rate interface,PRI)由23个B通道和一个64 kb/s的D通道组成,叫做23B+D,相当于T1线的带宽。(2) 数字信号处理器(digital signal processors,DSP)卡,它执行的任务包括声音信号的压缩和回音的取消等。(3) 网络接口(network interfaces)卡,它用来与网络进行通信,典型的网络卡包括10/100BaseT网络接口卡(network interface cards,NIC),或者把它们的功能集成到主机板上。(4) 控制处理器(control processor),它协调其他网关部件的所有活动,这个部件通常是在系统的主机板上。网关的主要软件包括:(1) 执行所有网关基本功能和选择功能的网关软件。例如,网关平台(Gateway Platform)执行转换协议、转换消息格式和传输信息等基本功能,支持声音压缩、协议转换、实时的传真解调/再调制以及执行系列协议。(2) 特定网关的应用软件,它执行自定义的功能以及管理和控制功能。3、会务器的功能和结构会务器(gatekeepers)是用于连接IP网络上的电视会议客户,是电视会议的关键部件之一,许多人把它当作电视会议的"大脑"。它提供授权和验证、保存和维护呼叫记录、执行地址转换而不需要你去记忆IP地址、监视网络、管理带宽以限制同时呼叫的数目从而保证电视会议的质量、以及提供与现存系统的接口。会务器的功能一般都是用软件来实现。会务器的功能分成两个部分:基本功能和选择功能。会务器必须要提供的基本功能包括:"地址转换(Address Translation):使用一种可由注册消息(Registration messages)更新的转换表,把别名地址转换成传输地址(Transport Address)。这个功能在线路交换网络上的电话企图呼叫IP网络上的PC时显得尤其重要,在确定网关地址时也很重要。准入控制(Admissions Control):使用准入请求/准入确认/准入拒绝ARQ/ARC/ARJ(Admission Request, Confirm and Reject)消息,对访问局域网进行授权。H323标准规定必须要有用来对网络服务进行授权的RAS消息(RAS messages),RAS是一个注册/准入/状态(Registration/Admission/Status)协议,但它不定义授权存取网络资源的规则或者政策,因此服务提供者需要会务器来干预现存的授权方法。此外,企业管理人员和服务提供者也许想使用他自己的标准来授权,例如,根据订金、信用卡等。带宽控制(Bandwidth Control):支持RAS带宽消息(RAS bandwidth messages),即带宽请求/带宽确认/带宽拒绝BRQ/BCF/BRJ(Request, Confirm and Reject)消息,以强制执行带宽控制。至于如何管理则要根据服务提供者或者企业管理人员的政策来确定。在许多情况下,如果在网络或者特定的网关不拥挤的况下,对任何带宽的请求都应该给予满足。区域管理(Zone Management):用于管理所有已经注册的端点(endpoint),为它们提供上面介绍的功能。至于确定哪个终端可以注册以及地理或者逻辑区域的组成(单个会务器管理的终端、网关和多点控制单元MCU)则由网络设计人员决定。会务器提供的选择功能包括:呼叫控制信号传输方法(Call Control Signalling):在中有两种呼叫控制信号传输模型:会务器安排呼叫信号传输模型(Gatekeeper Routed Call Signaling Model)和直接端点呼叫信号传输模型(Direct Endpoint Call Signaling Model)。会务器可根据访问提供者的要求进行选择。呼叫授权(Call Authorization):会务器可根据服务提供者指定的条件对一个给定的呼叫进行授权或者拒绝。其条件可包括会议时间、预定的服务类型、对受限网关的访问权限或者可用的带宽等。带宽管理(Bandwidth Management):根据服务提供者指定的带宽分配确定是否有足够的带宽用于呼叫。呼叫管理(Call Management):提供智能呼叫管理。会务器维护一种呼叫表以指示被呼叫终端是否处于忙状态,并为带宽管理(Bandwidth Management)功能提供信息。会务器的结构会务器通常设计成内外两层,如图4-8所示。会务器的内层叫做核心层,它由执行协议堆的软件和实现多点控制单元MCU(multipoint control unit)功能的软件组成,有的软件开发公司把它叫做会务器核心功能部件。MCU的主要功能是连接多条线路并自动或者在会议主持人的指导下手动交换电视号。会务器的外层由许多应用程序的接口组成,用于连接网络上现有的许多服务。外层软件加分吧!
(1)选题依据及研究意义:这个就是写一下这个技术在现实领域的应用会带来怎样的便利或者好处.多吹一下研究这个课题是多么的有用,多么的重要 (2) 选题研究现状: 就是列举一下前人已经写出的著作(越多越好,把表格添满),还有这个技术目前已经研究到什么程度了,还在哪些方面有待改进等等(3)研究内容(包括基本思路、框架、主要研究方式、方法 等):基本思路就是用语言叙述一下你的论文逻辑;框架就是把你的这个提纲列举一下;主要研究方式、方法就是写总结论文或者实验调查报告或者社会调查报告,本课题方式也就是查阅相关资料然后写总结论文。 本科生的话,尽可能的多写把表格添满、语句通顺,无逻辑错误也就OK了。关键是论文要写的用心一些,答辩时候就比较省事。开题报告没有空白项就可以,一般没听说哪个老师对这个会十分注意抓住不放的。
我觉得你可以上学校图书馆的资源网上,维普或者是中国知网(中国优秀硕士学位论文全文数据库)那边去找吧,有很多很多的资料的,你只要打上关键字:..就可以了。祝你顺利!
The digital video frequency product demand recent years appearincrease suddenly. Mainstream application including videocommunication, safe monitoring and industrial automation, but mostpopular must calculate the entertainment application, like DVD, HDTV,the satellite TV, high is clear (HD) 机顶 the box, the Internetvideo frequency class, the digital camera and the HD camera, the videofrequency light 盘库 (video jukebox), the high end monitor (LCD, theplasma monitor, DLP) as well as individual camera and so is splendid newly also is in the design or the earlierperiod deployment using at present, for example in view of the familywith grasps the equipment and the ground/satellite standard (DVB-T,DVB-H, DMB) high clear DVD (blue light/HD-DVD) and the digital videofrequency broadcast, the high clear video frequency telephone, thedigital camera as well as the IP 机顶 box. Because grasps theterminal computation ability the enhancement as well as the batterytechnology and the high speed wireless connection development, thefinal product mobility and the integration also unceasingly isenhancing. The video frequency compression is all exciting, the new videofrequency product important power. The compression - decompression(arranges decoding) the algorithm to be allowed to realize the digitalvideo frequency memory and the transmission. Typical arranges thedecoding either to use the profession standard, like MPEG2, MPEG4, and AVS, newest arrange the decoding technology ( VC-1) is representing the third generation video frequencycompression technology. In this article, I have carried on the simpleintroduction and the analysis to the digital television receiver andvideo frequency compression technology some development and thecorrelation theory knowledge. The video frequency compression goal iscarries on the code to the digital video frequency - simultaneously totake as far as possible the few spaces in the maintenance videofrequency quality. Arranges the decoding technology theory basis forthe information theory mathematics principle. But, develops practicalarranges the decoding technical requirement artistic carefulconsideration.
基于PLC的温湿度控制系统国内外研究的现状你可以去万方或者知网下载一些硕士学位的论文一般硕士学位的论文都有国内外研究的章节你可以直接拿来用或者几篇综合一下如果是下载问题,我可以帮你下载。一、题目学位论文的题目应能概括整个论文的核心内容。题目所用的词语应简明,具体,确切,符合编制题录、索引和检索等二次文献的有关原则,并有助于选择关键词和分类号。题目要力求引人注目,且与论文内容贴切,应避免使用非公知公用的缩略语、字符、代号、结构式和公式。中文题目的字数不宜过多,一般不超过20个汉字,必要时可加副标题。英文题目与中文题目内容上要一致,但不要求词语一一对应翻译。每个词的首字母大写,但3个或4个字母以下的冠词、连词、介词全部小写。英文题目长度一般不超过2行。二、摘要摘要要以浓缩的形式概括研究的目的、内容、方法、观点及所取得的成果和结论等。突出论文的创造性成果和新的见解。摘要应具有独立性和自含性。使读者在只阅读摘要的情况下,就能获得该论文的中心思想或主要信息。作者要用精练概括的语言来表述,不宜展开论证和说明,也不宜加主观评价。摘要应能反映出论文的整体水平。英文摘要另起一页排列于中文摘要之后,是一篇独立的英文短文,要符合英文写作规范,而不应是中文摘要的勉强翻译。三、关键词关键词是学位论文的文献检索标志,是表达文献主题概念的自然语言词汇。学位论文的关键词是从其题目、层次标题和正文中选出来的,能反映论文主题概念的词或词组。关键词选用是否恰当,关系到该文被检索的概率和利用率。四、目录目录既是学位论文的提纲,也是论文组成部分的小标题。目录应将文内的章节标题依次排列,标题应该简明扼要。目录页中每行均由标题名称和页码组成,包括引言(或前言)、主要内容的篇、章、条、款、项序号和标题、小结、参考文献、注释、附录、可供参考的文献题录、索引等。论文中如图表较多,可以分别列出清单置于目录页之后。图的清单应有序号、图题和页码。表的清单应有序号、表题和页码。
论文开题报告ppt
整理资料时,要注意按照问题来组织文献资料,写文献综述时不是将看过的资料都罗列和陈述出来,而是要按照一定的思路将其提炼出来。只有这样,才能写出好的文献综述,也才能写出好的论文开题报告,进而为写出好的论文打下基础。
(3)研究目标具体而不死板
一般论文开题报告都要求明确学位论文的研究目标,但笔者认为,研究目标不宜规定得太死板,这是因为,即使条件一定,目标是偏高还是偏低,往往难于准确判断,研究工作本身,涉及求知因素,各个实验室条件不同,具体研究时条件也不同。学位论文选题和研究目标体现了研究工作的价值特征。
三、论文开题报告的质量保证
为了保证硕士研究生的培养质量,提高论文质量,就必须对论文开题报告进行评价。论文开题报告会由3~5位相关学科的专家对论文开题报告进行评议,与企业合作的重大科研项目可以聘请1~2位相应企业的具有高级职称的专家参加,不同学科的论文开题报告的侧重点不同。江苏工业学院研究生部规定学生必须进行论文开题报告,并规定了统一的格式,设计了专门的论文开题报告评审表,论文开题报告会上研究生应对课题进行详细汇报,并对专家提问做出必要的解释和说明。论文开题报告的成绩考核以合格、不合格记。评审小组成员最后签名并给出学生是否合格的评审意见,并以百分制打出具体的分数。论文开题报告成绩不合格者,不得进入课题研究。
为了提高论文质量,研究生必须首先从思想上重视论文开题报告,在平时的学习中注意积累,从各个方面提高能力,尤其要注意培养通过理论思维发现研究问题的能力。论文开题报告是研究工作的开始,良好的开端为优秀的学位论文奠定了坚实的基础。
1、会计毕业论文:研究的目的和意义
1、1研究的来源:自选
1、2研究的目的:
当前研发费用占我国的gdp支出比例逐渐提高。2006年较2005年上升了11%。2006年我国发布的.新无形资产准则中对研发费用的处理做了全新的规定。如何在新的发展形势和新准则的要求下对无形资产进行计量,管理和报告成为我国会计人员和财务报告使用者马上面临的一个新问题。本文拟从研发费用的定义入手,对国外,国内目前使用的研发费用会计规范进行比较。分析研发费用的资本化,费用化的判断标准;对我国财务人员的挑战和以及应对;对由于开发费用资本化而产生的无形资产如何管理计量;不同的会计规范下研发费用的处理对公司的股票价格有什么影响。如何在财务报告中向报告使用人揭示公司的研究费用和开发资产的信息。同时对我国的新的无形资产准则在未来使用中有可能遇到的问题进行分析。
1、3研究的意义:
我国已经提出建立创新型国家的发展目标。研发费用在未来的经济发展中占gdp的比例会越来越大。我国的企业将来会有更多的资源投入到研究和开发活动中去。同时随我国的上市公司的规模的扩大,公司所有权和经营权的分离会加剧。投资人对财务报告提供信息的要求会越来越高。而研发费用实际上是公司对未来的投资。自2007年起符合条件的开发费用将资本化,在资产负债表上列示。从公司的研发支出中了解公司未来发展趋势,分析管理层对未来的判断必将成为投资者关注的一个重要方面。
2、会计毕业论文:国内外在该方向上的研究现状及分析
2、1国外在该方向上的研究现状及分析:
2、1、1lev:
研究开发支出对公司生产率和产出的贡献极大。估算出的研究开发投资回报率很高。每年为20%-35%。但在不同的行业和不同时期的估算值变化较大。基础研究(目的在于开发新科技的研究)对公司成长率和生产率的贡献远远大于其他类型的研究开发,如产品开发和加工研究开发。基础研究相对于应用研究的贡献差异比为3:1、他同时建议对所有可能产生收益的无形资产投资确认为资产,但这些可能产生的收益无形资产一定是已经通过了特定的技术可行性测试。因为项目的生存的不确定性已经得到 实质性的降低。
2、1、2loudder&behn:
在采用sfas2前,选择将r&d费用资本化并在一定年限摊销的企业的会计利润与股票收益之间的相关性远高于将r&d费用直接及入损益的企业。
2、1、3lev&sorgiannis
研究认为由r&d支出资本化和摊销而产生的研发资产和研发费用与企业价值的相关性要远超过报表收益和企业价值的相关性。
2、2会计毕业论文:国内在该方向上的研究现状及分析
2、2、1薛云奎,王志台一文中对r&d的重要性进行了分析,以1995-1999年作为研究考察区间,考察了我国上市公司r&d信息披露现状及r&d信息披露对我国上市公司会计信息有用性的影响。
研究结果表明,企业对r&d信息的不当披露是导致我国上市公司会计信息有用性逐年下降的重要因素之一。在借鉴国外对r&d信息披露规范的基础上,提出了改进我国上市公司r&d信息披露的建议。
2、2、2茅宁、王晨在<软财务-基于价值创造的无形资产投资决策与管理方法研究>一书中对研发活动功能的演进过程做了如下阐述:直觉型研发,由技术专家主导;系统型研发:研发和企业的核心业务逐渐产生连结关系;战略型研发,研发活动有明确的战略目的,和企业的发展结成紧密关系;知识型研发,针对未来市场发展所需要的未来技术,同时是属于一种不连续的创新。
由于资产化研发费用也是属于无形资产的一部分,他们将无形资产的信息披露分为内部报告和外部披露两部份。认为处于研发初期的有关信息只能在公司内部特定的范围内流动。
2、2、3宋献中,冯敏红在<研发费用逐利性研究>一文中,描述了研发费用的特征:时间性,风险性及特殊性(具有比一般投资活动更大的不确定性;计量困难)。这是因为知识的创造和投入并不一定代表与经济相关的知识存量的增加。
①研发成果转化为真实的生产力需要时间,有的甚至要经过数年才能取得正的现金流量。
②知识本身就是无形的、难以量化的,从而也是难以计量的。
③新知识的投入有可能导致原有知识存量中的部分知识陈旧过时甚至失效。这就使得知识的累计投入不是简单的一加一的关系。研发费用的投入完全在企业经营者控制之下。
投资者了解研发活动具有众多的不确定性。如果对研发活动投入不足,则不足以令投资者产生兴趣;如果对研发活动投入过度,又会令投资者认为投资风险过大,需要重新评估投资的可行性。因此,这种信息传递的作用只有在研发费用披露金额适当的情况下才能达到预期目标。
3会计毕业论文:前期理论研究和试验验证结果:
通过初步对研发费用的定义和世界上两种主要不同的处理规范的研究,得出结论为研发费用部分确认为资产的方式可以提高会计信息在评估企业价值方面的能力。但在目前无形资产信息披露不够全面前提下,研发费用资本化有可能使企业产生利用其调节利润动机。
4会计毕业论文:论文的主要研究内容、实施方案及其可行性论证
4、1主要研究内容和论文的逻辑框架
4、1、1主要研究内容:
⑴对不同的研发费用的定义(国际会计准则,美国会计准则,我国科学技术部)进行分析和比较。由于对研究活动和发展活动的的定义理解的不同,在将来的会计处理的过程中ifrs会有不同的方式处理。准确理解研究与开发活动的内涵和外延极为重要。
⑵。新会计准则下资本化处理方法的优点和缺点:
①符合新经济时代的要求开发费用资本化有利于增强企业的技术创新能力,实现企业价值的最大化,同时为市场对该企业的估值提供了相关的信息。避免了以前会计准则中外购的专利技术均可以记入无形资产中,而企业本身发生的研发费用全部费用化,这种类似性质的业务,会计处理方法却不一致的的事情。
人脸识别技术流程
人脸识别的技术原理主要包括三大步骤:首先是建立人脸图像数据库,其次是通过各种方式来获得当前要进行识别的目标人脸图像,最后是将目标人脸图像与数据库中既有的人脸图像进行比对和筛选,其技术流程如下:
应用场景广泛,安防和考勤门禁占比较高
目前,人脸识别在考勤/门禁领域的应用最为成熟,约占行业市场的40%左右;安防作为人脸识别最早应用的领域之一,其市场份额占比在30%左右;金融作为人脸识别未来重要的应用领域之一,其市场规模在逐步扩大,目前约占行业的20%。
三维人脸识别技术是发展主流
从人脸识别技术发展过程来看,未来三维人脸识别是人脸识别主要技术手段,二维人脸识别只是人脸识别发展的过渡阶段。实验结果显示,二维人脸识别系统在人脸左右偏转达到40度识别率迅速下降到50%以下;而采用三维人脸识别后,识别率可以提高至少10-20个百分点。
——以上数据来源于前瞻产业研究院《中国人脸识别行业市场前瞻与投资战略规划分析报告》。
身边的图像识别、人脸识别、文字识别应用案例,还有网络延迟方面的改进或创新之处。
1、金融领域。人脸识别当前在金融领域的应用最为广泛,当前国内金融领域监管要求严格,金融相关产品都需要实名认证,并且具有较高的安全性要求,活体识别,银行卡ocr识别,身份证ocr识别,人证对比等在各大手机银行,金融app,保险app等都已经成为不可或缺的一个环节。
2、安保领域。目前大量的企业,住宅,社区,学校等安全管理越来越普及,人脸门禁系统已经成为非常普及的一种安保方式。
3、通行领域。很多城市的火车站已经安装了人脸识别通行设备,进行人证对比过检,有些城市的地铁站也可以通过人脸识别的方式进行地铁进出站通行。
人脸识别技术在中国的发展起步于上世纪九十年代末,经历了技术引进-专业市场导入-技术完善-技术应用-各行业领域使用等五个阶段。目前,国内的人脸识别技术已经相对发展成熟,该技术越来越多的被推广到安防领域,延伸出考勤机、门禁机等多种产品,可以全面覆盖煤矿、楼宇、银行、军队、社会福利保障、电子商务及安全防务等领域,人脸识别的全面应用时代已经到来。
人脸识别技术介绍
(1)人脸识别技术流程
人脸识别的技术原理主要包括三大步骤:首先是建立人脸图像数据库,其次是通过各种方式来获得当前要进行识别的目标人脸图像,最后是将目标人脸图像与数据库中既有的人脸图像进行比对和筛选,其技术流程如下:
(2)人脸识别的主要方法
人脸识别技术是一个跨越多个学科领域知识的高端技术研究工作,涉及图像处理、生理学、心理学、模式识别等知识,目前比较常见的人脸识别方法包括基于特征脸的方法、基于几何特征的方法、基于深度学习的方法、基于支持向量机的方法以及其他综合方法。
(3)常用人脸数据库介绍
目前世界较为常用的人脸数据库包括:ERET人脸数据库、CMU Multi-PIE人脸数据库、YALE人脸数据库、YALE人脸数据库B、MIT人脸数据库、ORL人脸数据库、BioID人脸数据库、年龄识别数据集IMDB-WIKI等。
人脸识别技术具有非侵犯性
人脸识别是生物特征识别技术的一个重要方向,不同的生物识别技术在细分技术上各具优势,人脸识别技术是非接触和不需要主动接受的,具有非侵犯性。此外,人们对这种技术的排斥心理最小,因此人脸识别技术是一种最友好的生物特征识别技术,并且图像采集可以由安防中的摄像头完成,不需要重新再布置新的采集设备。
行业技术环境十分活跃
截至2019年底,在soopat专利搜索引擎上以“人脸识别”为关键词检索得到20208项专利申请记录,行业技术环境十分活跃。
从申请年来看,2010-2018年,我国专利申请数逐年增长,2018年增加至5618项,为近年来最高,2019年我国人脸识别相关专利申请数达3024项。
从公开年来看,我国最早于2002年有人脸识别相关专利公开,当年公开数量为1项,随后专利公开量保持快速增长态势,2019年我国人脸识别相关专利公开数量为6700项。
中国人脸识别技术发明专利申请量超六成
在超2万项的人脸识别技术专利中,发明专利的申请量最多,达12407项,占比为;其次为实用新型专利,占比为。
G06K专利申请量过万
从我国人脸识别相关热门专利技术申请分布领域来看,G06K(数据识别、数据表示、记录载体、记录载体的处理)申请量最多,达10134项;其次为G07C(时间登记器或出勤登记器、登记或指示机器的运行、产生随机数、投票或彩票设备、未列入其他类目的核算装置),申请数量为1302项。
人脸识别错误率逐年降低
经过了40多年的发展,人脸识别技术取得了长足进步,根据LFW测试成绩显示,目前最优的系统在千万分之一的误报下达到识别准确率准确率已经超过,甚至超过了人类的识别程度,错误验证率也控制在以下。
即使是采用评测标准最严格的FRVT测试,根据2019年7月3日NIST公布的FRVT最新报告显示了全球人脸识别算法的最高水平可以做到在千万分之一误报率下,漏报率降低于,这意味着千万分位误报下的识别准确率已经超过99%,人脸识别技术的不断进步无疑会促进其在更广泛范围内的应用。
应用场景广泛,安防和考勤门禁占比较高
目前,人脸识别在考勤/门禁领域的应用最为成熟,约占行业市场的40%左右;安防作为人脸识别最早应用的领域之一,其市场份额占比在30%左右;金融作为人脸识别未来重要的应用领域之一,其市场规模在逐步扩大,目前约占行业的20%。
三维人脸识别技术是发展主流
从人脸识别技术发展过程来看,未来三维人脸识别是人脸识别主要技术手段,二维人脸识别只是人脸识别发展的过度阶段。实验结果显示,二维人脸识别系统在人脸左右偏转达到40度识别率迅速下降到50%以下;而采用三维人脸识别后,识别率可以提高至少10-20个百分点。
以上数据来源于前瞻产业研究院《中国人脸识别行业市场前瞻与投资战略规划分析报告》。
计算机论文是计算机专业毕业生培养方案中的必修环节。学生通过计算机论文的写作,培养综合运用计算机专业知识去分析并解决实际问题的能力,在以后的工作中学以致用,不过我是没时间写,直接联系的诚梦毕业设计,一切搞定而且品质还很高。
计算机论文计算机网络在电子商务中的应用摘要:随着计算机网络技术的飞进发展,电子商务正得到越来越广泛的应用。由于电子商务中的交易行为大多数都是在网上完成的, 因此电子商务的安全性是影响趸易双方成败的一个关键因素。本文从电子商务系统对计算机网络安全,商务交易安全性出发,介绍利用网络安全枝术解决安全问题的方法。关键词:计算机网络,电子商务安全技术一. 引言近几年来.电子商务的发展十分迅速 电子商务可以降低成本.增加贸易机会,简化贸易流通过程,提高生产力,改善物流和金流、商品流.信息流的环境与系统 虽然电子商务发展势头很强,但其贸易额所占整个贸易额的比例仍然很低。影响其发展的首要因素是安全问题.网上的交易是一种非面对面交易,因此“交易安全“在电子商务的发展中十分重要。可以说.没有安全就没有电子商务。电子商务的安全从整体上可分为两大部分.计算机网络安全和商务交易安全。计算机网络安全包括计算机网络设备安全、计算机网络系统安全、数据库安全等。其特征是针对计算机网络本身可能存在的安全问题,实施网络安全增强方案.以保证计算机网络自身的安全性为目标。商务安全则紧紧围绕传统商务在Interne'(上应用时产生的各种安全问题.在计算机网络安全的基础上.如何保障电子商务过程的顺利进行。即实现电子商务的保密性.完整性.可鉴别性.不可伪造性和不可依赖性。二、电子商务网络的安全隐患1窃取信息:由于未采用加密措施.数据信息在网络上以明文形式传送.入侵者在数据包经过的网关或路由器上可以截获传送的信息。通过多次窃取和分析,可以找到信息的规律和格式,进而得到传输信息的内容.造成网上传输信息泄密2.篡改信息:当入侵者掌握了信息的格式和规律后.通过各种技术手段和方法.将网络上传送的信息数据在中途修改 然后再发向目的地。这种方法并不新鲜.在路由器或者网关上都可以做此类工作。3假冒由于掌握了数据的格式,并可以篡改通过的信息,攻击者可以冒充合法用户发送假冒的信息或者主动获取信息,而远端用户通常很难分辨。4恶意破坏:由于攻击者可以接入网络.则可能对网络中的信息进行修改.掌握网上的机要信息.甚至可以潜入网络内部.其后果是非常严重的。三、电子商务交易中应用的网络安全技术为了提高电子商务的安全性.可以采用多种网络安全技术和协议.这些技术和协议各自有一定的使用范围,可以给电子商务交易活动提供不同程度的安全保障。1.防火墙技术。防火墙是目前主要的网络安全设备。防火墙通常使用的安全控制手段主要有包过滤、状态检测、代理服务 由于它假设了网络的边界和服务,对内部的非法访问难以有效地控制。因此.最适合于相对独立的与外部网络互连途径有限、网络服务种类相对集中的单一网络(如常见的企业专用网) 防火墙的隔离技术决定了它在电子商务安全交易中的重要作用。目前.防火墙产品主要分为两大类基于代理服务方式的和基于状态检测方式的。例如Check Poim Fi rewalI-1 4 0是基于Unix、WinNT平台上的软件防火墙.属状态检测型 Cisco PIX是硬件防火墙.也属状态检测型。由于它采用了专用的操作系统.因此减少了黑客利用操作系统G)H攻击的可能性:Raptor完全是基于代理技术的软件防火墙 由于互联网的开放性和复杂性.防火墙也有其固有的缺点(1)防火墙不能防范不经由防火墙的攻击。例如.如果允许从受保护网内部不受限制地向外拨号.一些用户可以形成与Interne'(的直接连接.从而绕过防火墙:造成一个潜在的后门攻击渠道,所以应该保证内部网与外部网之间通道的唯一性。(2)防火墙不能防止感染了病毒的软件或文件的传输.这只能在每台主机上装反病毒的实时监控软件。(3)防火墙不能防止数据驱动式攻击。当有些表面看来无害的数据被邮寄或复制到Interne'(主机上并被执行而发起攻击时.就会发生数据驱动攻击.所以对于来历不明的数据要先进行杀毒或者程序编码辨证,以防止带有后门程序。2.数据加密技术。防火墙技术是一种被动的防卫技术.它难以对电子商务活动中不安全的因素进行有效的防卫。因此.要保障电子商务的交易安全.就应当用当代密码技术来助阵。加密技术是电子商务中采取的主要安全措施, 贸易方可根据需要在信息交换的阶段使用。目前.加密技术分为两类.即对称加密/对称密钥加密/专用密钥加密和非对称加密/公开密钥加密。现在许多机构运用PKI(punickey nfrastructur)的缩写.即 公开密钥体系”)技术实施构建完整的加密/签名体系.更有效地解决上述难题.在充分利用互联网实现资源共享的前提下从真正意义上确保了网上交易与信息传递的安全。在PKI中.密钥被分解为一对(即一把公开密钥或加密密钥和一把专用密钥或解密密钥)。这对密钥中的任何一把都可作为公开密钥(加密密钥)通过非保密方式向他人公开.而另一把则作为专用密钥{解密密钥)加以保存。公开密钥用于对机密�6�11生息的加密.专用密钥则用于对加信息的解密。专用密钥只能由生成密钥对的贸易方掌握.公开密钥可广泛发布.但它只对应用于生成该密钥的贸易方。贸易方利用该方案实现机密信息交换的基本过程是 贸易方甲生成一对密钥并将其中的一把作为公开密钥向其他贸易方公开:得到该公开密钥的贸易方乙使用该密钥对机密信息进行加密后再发送给贸易方甲 贸易方甲再用自己保存的另一把专用密钥对加密后的信息进行解密。贸易方甲只能用其专用密钥解密由其公开密钥加密后的任何信息。3.身份认证技术。身份认证又称为鉴别或确认,它通过验证被认证对象的一个或多个参数的真实性与有效性 来证实被认证对象是否符合或是否有效的一种过程,用来确保数据的真实性。防止攻击者假冒 篡改等。一般来说。用人的生理特征参数f如指纹识别、虹膜识别)进行认证的安全性很高。但目前这种技术存在实现困难、成本很高的缺点。目前,计算机通信中采用的参数有口令、标识符 密钥、随机数等。而且一般使用基于证书的公钥密码体制(PK I)身份认证技术。要实现基于公钥密码算法的身份认证需求。就必须建立一种信任及信任验证机制。即每个网络上的实体必须有一个可以被验证的数字标识 这就是 数字证书(Certifi2cate)”。数字证书是各实体在网上信息交流及商务交易活动中的身份证明。具有唯一性。证书基于公钥密码体制.它将用户的公开密钥同用户本身的属性(例如姓名,单位等)联系在一起。这就意味着应有一个网上各方都信任的机构 专门负责对各个实体的身份进行审核,并签发和管理数字证书,这个机构就是证书中心(certificate authorities.简称CA}。CA用自己的私钥对所有的用户属性、证书属性和用户的公钥进行数字签名,产生用户的数字证书。在基于证书的安全通信中.证书是证明用户合法身份和提供用户合法公钥的凭证.是建立保密通信的基础。因此,作为网络可信机构的证书管理设施 CA主要职能就是管理和维护它所签发的证书 提供各种证书服务,包括:证书的签发、更新 回收、归档等。4.数字签名技术。数字签名也称电子签名 在信息安全包括身份认证,数据完整性、不可否认性以及匿名性等方面有重要应用。数字签名是非对称加密和数字摘要技术的联合应用。其主要方式为:报文发送方从报文文本中生成一个1 28b it的散列值(或报文摘要),并用自己的专用密钥对这个散列值进行加密 形成发送方的数字签名:然后 这个数字签名将作为报文的附件和报文一起发送给报文的接收方 报文接收方首先从接收到的原始报文中计算出1 28bit位的散列值(或报文摘要).接着再用发送方的公开密钥来对报文附加的数字签名进行解密 如果两个散列值相同 那么接收方就能确认该数字签名是发送方的.通过数字签名能够实现对原始报文的鉴别和不可抵赖性。四、结束语电子商务安全对计算机网络安全与商务安全提出了双重要求.其复杂程度比大多数计算机网络都高。在电子商务的建设过程中涉及到许多安全技术问题 制定安全技术规则和实施安全技术手段不仅可以推动安全技术的发展,同时也促进安全的电子商务体系的形成。当然,任何一个安全技术都不会提供永远和绝对的安全,因为网络在变化.应用在变化,入侵和破坏的手段也在变化,只有技术的不断进步才是真正的安全保障。参考文献:[1]肖满梅 罗兰娥:电子商务及其安全技术问题.湖南科技学院学报,2006,27[2]丰洪才 管华 陈珂:电子商务的关键技术及其安全性分析.武汉工业学院学报 2004,2[3]阎慧 王伟:宁宇鹏等编著.防火墙原理与技术[M]北京:机械工业出版杜 2004
汽车故障诊断技术论文篇二 汽车检测与故障诊断技术研究 [摘 要]随着现代汽车技术的快速发展,汽车的结构越来越复杂,高新技术特别是电子技术、计算机技术在汽车上得到了越来越广泛的应用,汽车故障诊断技术从传统的问、看、听、闻、触等经验诊断方式,发展为以集成化、智能化的诊断设备为手段,以信息技术为依托的现代汽车故障诊断技术。 中图分类号: 文献标识码:A 文章编号:1009-914X(2016)13-0364-01 一、定义: 汽车故障的“诊断”和“检测”从广义来讲,两个词没有太大的区别,但要讲究的话,还有一点差异,诊断是运用必要的手段(包括外观、气味、震动、声响、感觉和电气现实及仪器等)和知识、经验对车辆故障(包括故障码、故障症状)做出分析和判断,确定故障部位、器件、电路的过程,诊断的过程是一个完整的过程,不是一个单一的某个内容的检测,而是对一些故障症状从开始接触到测量、到分析判断,最后做出修理方案的思维过程。而检测是指根据判断,对确定的故障部位、器件和电路进行精确的测量,以便证实判断是否正确并准确地确定故障部位、器件、电路的过程。 二、故障诊断技术特征 1、故障分析手段的多样化。现代汽车结构的复杂使故障状态呈现出多样性、模糊性和不确定性,将小波分析技术、模糊集理论、粗糙集理论、灰色关联分析、波形分析、融合技术、神经网络技术等应用于故障诊断 2、故障诊断设备的现代化。车外诊断系统和车载诊断系统仪器的发展融合了机械、电子、流体、声学、光学等技术,还具有自动分析、判断、打印结果的功能,并不断向着集成化和智能化方向发展。 3、故障诊断方式的网络化。现代网络技术的发展可使在汽车故障诊断方面运用现代通信技术,集各种组件如维修企业的管理软件、诊断维修技术信息系统、专家系统为一体,实现各维修企业的软硬件共享。 三、汽车故障诊断技术方法 1、人工经验诊断法:诊断人员凭借丰富的实践经验和理论知识,在汽车不解体或局部解体情况下,借助简单工具,用眼看、耳听、手摸、鼻闻等手段,边检查、边试验、边分析,进而对汽车技术状况作出判断。有直接检测法、换件法、条件改变法、顺序检查法、分段排除法等。特别是对汽车运行中出现的随机故障,直至现在它仍不失为一种行之有效的诊断方法。然而,它只能对故障进行定性的分析,而对于因诸多因素导致的复杂故障则难以诊断,诊断的准确与快慢取决于诊断技术人员的技术水平。经验诊断法经过不断地积累、总结和完善,已朝着人工智能分析、逻辑推理的方向发展。在使用该方法时,一般应先了解汽车的使用和维护情况,搞清楚故障特征及其伴随现象,然后由简到繁、由表及里进行推理分析,做出判断。其诊断方法大致分为望问法、观察法、听觉法、嗅觉法、触摸法、试验法等, 2、仪器设备诊断法 仪器设备诊断法是在传统的人工经验诊断法的基础上,随着社会和科学技术的进步逐渐发展起来的。与人工经验诊断法相比,其不同点在于:一是要借助于仪器;二是可将检查结果定量化。 目前可供利用的仪器设备有:万用表、点火正时灯、汽缸压力表、真空表、油压表、声级计、流量计、油耗仪、示波器、汽缸漏气量检测仪、曲轴箱窜气量检测仪、气体分析仪、烟度计,以及功能比较齐全的测功机、四轮定位仪、制动试验台、侧滑试验台、发动机综合检测仪、底盘测功机,等等。这些仪器设备给人们提供了可靠的工具,使汽车故障诊断从定性诊断发展为定量诊断。 现代仪器设备诊断法具有检测速度快、准确性高、能定量分析、可实现快速诊断等优点,而且采用微机控制的现代电子仪器设备能自动分析、判断、存储并打印出汽车的各项性能参数。但其缺点是投资大,需有专用厂房,需要培训操作人员,检测成本高等。这种诊断方法适用于汽车检测站和大中型维修企业。使用现代仪器设备诊断法是汽车诊断与检测技术发展的必然趋势。 3、汽车故障的自诊断法 随着现代科学技术特别是计算机技术的进步,20世纪末期,汽车故障的自诊断技术随着汽车电子控制技术发展起来。汽车电子控制系统机理与结构的复杂性,要求其自身必须建立可靠的故障自诊断系统。1979年,美国通用公司首次在汽车上运用了电子控制装置ECU自诊断系统,该系统由存储于ECU中的软件及相应的硬件构成,当汽车运行时,ECU不断监控系统中各部分的工作情况,如果发生故障,ECU根据故障的性质和程度,首先进入失效安全模式,使汽车有可能行驶到附近的维修点排除故障。同时,其将故障信息以代码的形式存贮,汽车维修时,利用专门的仪器和方法提取故障代码,据此排除故障后再将其清除。这种汽车故障自身诊断系统又称为OBD。 四、故障诊断、检测过程 1、故障描述。要仔细询问故障出现的状态,比如时间、温度、冷车、热车、加速、减速、行驶里程、晴天还是雨天,在整个修理过程中,故障的描述是非常重要的,千万不可忽略。 2、初步诊断 根据对故障症状的了解,对该故障系统的知识以及积累的经验,可对故障正中做出一个初步的判断。例如,什么系统、何部位、与故障症状相关的器件等。比如发支机系统,有很多子系统,出现的故障和哪些系统有关?这个判断是初步的判断,但是该判断已经有了一个理性的认识,这是根据你对故障的了解以及你的经验,知识进行的判断,它已经不是客观存在的东西,是你的大脑思维做出的阶段,这个结论对不对呢?还要去检测。 利用合适的仪器设备,对初步判断的内容作一个简单快速的检测,比如行到一个相关的故障码。 相关的技术资料,这点非常重要,因为随着车辆更新的加快、技术变更的加快,技术资料也是必不可少的,专修厂因为获得技术支持比较直接有及时。 3、替换试验 替换的原则有两个,一是用性能良好件,而不是新件,新件不等于好件,性能良好指在同类车上正确使用完全没有问题。二是替换的时候应该一个一个换,有人不间断地换,换到最后也不知道是哪个出了问题。 替换后的实验,应该是同故障状态一致,替换后的实验一定应该与故障状态同等,否则的话,替换试验没有意义。 4、路试,有一个原则,一定是谁陪客户验的车,由他去陪客户实验。 一个好的试车员,应该对车况、对路况非常悉。 一个系统所有的功能都要经过验证。现在的车讲究的是,除了良好换挡以外,还有品质的控制,换档的过程、强制换楼的过程,TOC的控制过程,包括发动机的功能等等都有要试,不能说人家有8个功能,修了以后剩3个功能,车主也不会同意。所以说,无论你修的是哪个系统,所有的功能都要去试验。 五、诊断、检测方法技巧 1、熟练掌握手中的各类测试仪器的使用。熟练对仪器的型号、连接、选择、使用都要知道,一个功能应用得好坏,取决于人对仪器的理解。 2、要了解进行测量器件的位置,电路(如接口、针脚、线色、信号类型等),压到电路图、位置图中去找。电路上的故障,有60-80%是根据现象能在电路图上分析出来的,在哪点测量,根据线路图就能分析出来。现在有的修理工都看不清楚电路力这是可行的。 3、选择合适合理的测量部位,正确连接测试设备,全面如实记录测试数据。有些东西,如果用手测非常难,要拆一大堆东西,还下不去手,那么这时候你考虑到同理的设备,也可以进行测量。 4、全面正确的分析所得信息,如果测量错了,你可能得出错误的结论,可是总有人不承认自己的错误。因此,在记录数据的时候也要做到全面、如实,在开始测量的时候并不知道数据是有用,在分析的过程中,就需要各方面的数据。 结语:通过对汽车检测和故障诊断方法的论述,有利于汽车维修工作人员在汽车发生故障时能够快速诊断出故障的原因和部位,及时修复,提高汽车的维修工作效率和汽车的使用效率,使汽车造福于人类。 参考文献: [1]吴波.关于对汽车发动机故障与诊断的研究[J].黑龙江科技信息;2010.(01) [2]甄瑞东.汽车发动机故障检测与维修[J].中小企业管理与科技;2009;28 看了“汽车故障诊断技术论文”的人还看: 1. 浅谈汽车维修研究论文范文 2. 汽车发动机技术论文 3. 汽车地盘电控技术论文 4. 汽车电控技术论文 5. 汽车地盘电控技术论文(2)
关于汽车故障诊断技术的发展与应用现状研究的论文
所谓的汽车故障诊断技术,主要就是利用汽车以及内燃机的相关理论,并且结合汽车故障的诊断学作为理论上的指导,通过汽车以及内燃机在结构原理、计算机控制技术等方面的分析把握来实现工作效率的不断提高。汽车诊断的智能化为汽车故障诊断技术的发展具有十分重要的作用,这就需要借助计算机技术、传感技术等多种高科技技术,注重资料以及数据的精确分析,为技术发展提供保障。
1 汽车故障的基本诊断技术
人工检测的诊断技术
从目前的发展来看,中小城市的汽车故障方面的监测与维修主要是工人凭借其工作经验而进行的直观性诊断。但是其工作的前提是技术工人具有足够丰富的知识来实现进行汽车构造以及汽车运行的原理把握,通过故障的诊断技能和汽车故障的维修技能提高来实现其诊断经验的不断积累。根据目前的相关调查来看,目前差不多每一个汽车的维修公司都会配备经验丰富的故障检测的相关维修人员。凭借着人工经验而进行的汽车故障检测实际上是属于一种相对原始性的技能,进而正在面临着被现代化的高科技检测技术替代的危险。利用人工故障诊断的技术在进行汽车的诊断过程中,经验丰富的专业人员通过车主的反馈以及对于汽车故障的监测就能够实现故障部位的定位。其中人工故障监测的方式主要有:通过道路试驾而进行的`检测方式、借助听力、嗅觉和触感进行监测的感官检测法、对于故障进行直接观察的检测方法、通过模拟性的实验进行的检测法、通过分段排查的检查方式等等,由于该种检测方式具有非常强的灵活性,因此适用范围非常的广泛。然而,人工的故障检测方法也存在着一定的局限性,其检测的精确度直接与相关维修人员的实际工作经验和工作能力挂钩,但是目前却出现了高级维修人员数量有限的问题。
电脑故障诊断技术
所谓的电脑故障诊断技术主要是通过解码仪来支持工作的,解码仪实际上就相当于是一个微型的电脑,其具有人工诊断检测中无法实现的功能,通过将EC U 中的相关存储信息的提取来实现信息的整理,之后便可以借助专门的软件来进行信息的处理,最终通过文字或者折线图等方式传达的信息,工作人员就可以根据屏幕上的信息汇总来实现故障部分的定位。如果解码仪中并没有真正的显示其故障码,或者是技术人员根据所显示的数据却无法检测出其故障,这就需要技术人员根据车主反映的实际情况来进行范围的划定,之后对其中的元件性能进行排查,最终借助排除法的方式来确定故障发生的实际部位。此外,解码仪可以利用汽车电脑发声的质量来对故障进行动静态的监测和诊断。从目前的发展状况来看,在我国的一线和二线的城市之中,电脑故障诊断技术已经得到了广泛的利用,并且在一定的程度上得到了专业的认可,其具有非常广泛的发展空间。
仪器故障诊断技术
随着近些年的发展来看,人们生活水平的不断提高以及出行质量在要求上的不断提高,中国的汽车产业经历了巨大的变化。随着信息以及相关电子空间技术的不断成熟,电子控制单元作为现代汽车构建的重要组成部分,需要其内部构造的掌握来实现汽车故障在诊断难度上的把握。为了能够实现检测技术要求的提高,相关技术人员需要采用科学的仪器故障的诊断技术来进行参数值的监测,通过故障部位的判断来对其进行维护和处理。技术维修人员可以通过使用,诸如,万用表以及电流探针等故障诊断仪器来进行数据流的获取,相关的技术人员则需要根据所获得的数值与标准的数值进行对比,实现故障诊断部位的把握。作为常用仪器的重要一种,示波器与万用表的功能相似,通过电压在值数上的测量、在电阻值数上的测量以及信号脉宽等方式的测量来实现故障的排查。而电流探针则只是对交流和直流的电流进行信号值的监测,但是这些故障的检测仪器却都不能够在其进行现有工作状况上来进行,由于其具有非常强的局限性,这就使得故障判断的准确率受到了非常大的影响,同时在定位上也容易出现偏差等等,这也是现今阻碍仪器故障诊断技术的一个重大问题。
2 现代汽车故障诊断的应用技术
OBDII 系统
所谓的O B D II系统是现今较为先进的汽车故障的自动检测系统。通过O B D II故障检测系统的装载使得其数据网络通讯在电控系统的基础之上建立起来。所谓的B 类数据网络结构主要是通过应用层、物理层以及数据链路层三个部分的结合来实现信息的传递,最终实现O B D II系统能够与车下的相关检测设备之间实现有效的通讯,通过相关约定的遵循来保证通讯过程的通畅性。
车载自诊技术
在现代的汽车故障诊断中,其十分重要的部分就是车载的自诊技术,也是现今存在的主流性的故障诊断技术。但是其在发展的过程中存在一定的局限性,诸如,自身技术设备没有办法准确的检测到车辆在气体排放上的数值,其只能够起到监督的作用;再加上自诊技术的数值的实际真实度上出现了存疑,其监测的成果受到了外界客观环境上的影响。总而言之,车载自诊技术只能够帮助监测处汽车的故障部分,但是对于其维修的方法和步骤却没有任何的作用,这就需要不断的完善相关的诊断技术,通过诊断方法的不断完善来为其故障的部位提供最为准确的信息。
3 结语
随着诊断设备的不断发展,中国的汽车故障诊断技术得到了飞速的发展。与国外的发展相比,我国的汽车诊断技术仍然存在非常大的差距。高新技术行业的不断发展以及国民经济的不断进步使得我国在故障检测诊断技术发展得到了飞速的发展。这就需要把握汽车故障的诊断技术发展,通过研发人员与维修人员的配合来实现优秀的诊断思想的树立,进而形成科学高效实用性强的诊断设备,最终提高我国的汽车故障诊断技术。