由于不同因素之间的复杂作用,在保留原始字体,颜色,大小和背景纹理的同时在场景图像中交换文本是一项具有挑战性的任务。在这项工作中,我们提出了一个三阶段框架SwapText,用于跨场景图像传输文本。 首先,提出了一种新颖的文本交换网络来仅替换前景图像中的文本标签。 其次,背景完成网络来学习以重建背景图像。 最后,通过融合网络将生成的前景图像和背景图像用于生成文字图像。 使用提出的框架,即使出现严重的几何失真,我们也可以巧妙的处理输入图像的文本。 定性和定量结果显示在几个场景文本数据集上,包括规则和不规则文本数据集。 我们进行了广泛的实验以证明我们的方法的有效性,例如基于图像的文本翻译,文本图像合成等。
想象一下,能够在场景图像中交换文本,同时在几秒钟内保持原始字体,颜色,大小和背景纹理,而无需花费数小时进行图像编辑。 在这项工作中,我们旨在通过自动替换场景图像中文本的算法来实现此目标。文本交换的核心挑战在于生成视觉逼真的文本并与原始文本保持一致的样式。
文本交换或文本替换在许多情况下都涉及到,包括文本检测,文本识别,海报中的文本转换和其他创造性应用。 对于文本检测和识别任务,文本交换是一种非常有用的数据增强方法。 见证了深度神经网络(DNN)在各种计算机视觉任务中的巨大成功,获得大量带注释的训练图像已成为训练DNN模型的瓶颈。最简单,使用最广泛的方法是通过几何变换来增加训练图像,例如平移,旋转和翻转等。近来,已经提出了基于图像合成的方法[11、7、39]来训练文本检测和识别模型。这些方法通过结合不同的渲染技术对光和能量的物理行为进行建模来从无文本图像中创建新图像。但是, 合成图像无法与场景中的图像完全融合,这在将合成图像应用于DNN模型训练时至关重要。
近年来,许多图像生成模型,例如生成对抗网络(GAN)[6],可变自动编码器(VAE)[17]和自回归模型[25],为现实的图像生成任务提供了强大的工具。在[9,38,33]中,GAN用于图像补全,可为缺失区域生成视觉上逼真的和语义上合理的像素。 [21,8,28,22]已经利用这些网络生成具有不同姿势或服装的新颖人物图像。
我们的贡献总结如下:
文本图像合成 图像合成已在计算机图形学研究中得到了广泛的研究[4]。文本图像合成被研究为一种数据增强方法,用于训练准确而健壮的DNN模型。例如,Jaderberg等[11]使用单词生成器来生成用于文本识别任务的合成单词图像。Gupta等 [7]开发了一个健壮的引擎来生成用于文本检测和识别任务的合成文本图像。 文本图像合成的目标是将文本插入背景图像中语义上敏感的区域。许多因素都影响合成文本图像的真实相似度,例如文本大小,文本视角,环境光照等。 在[39]中,Zhanet等人通过结合语义连贯,视觉注意力和自适应文本外观这三种设计来实现文本文本图像合成。尽管文本图像合成在视觉上是逼真的,但合成图像与真实图像之间仍存在许多差异。例如, 与真实图像相比,合成图像中文本字体和背景图像非常有限。
在最近,基于GAN的图像合成技术得到了进一步的探索。在[41]中,Zhan等人提出了一种将几何合成器和外观合成器组合在一起的空间融合GAN,以在几何和外观空间中实现合成现实。Yang等人[36]使用双向形状匹配框架通过可调整的参数来控制字形的关键风格。 GA-DAN [40]提出了一项有趣的工作,能够同时在几何空间和外观空间中对跨域移位进行建模。[2]中提出了MC-GAN来实现从A到Z的字母集的字体样式转换。 Wu等人 [34]提出了一个端到端的可训练样式保留网络来编辑自然图像中的文本。
图像生成 随着生成模型(例如GAN [6],VAE [17]和自动回归模型[25])的巨大成功,逼真而清晰的图像生成最近吸引了越来越多的关注。传统的生成模型使用GAN [6]或VAE [17]来将噪声z生成的分布映射到实际数据的分布。例如,GANs [6]用于生成真实面孔[37、3、15]和鸟类[29]。
为了控制所生成的结果,Mirzaet等人[23]提出了有条件的GAN。它们会生成在类别标签上进行分类的MNIST数字。在[12]中,karacanet等。根据语义布局和场景属性(例如日夜,晴天雾天)生成逼真的室外场景图像。 Lassneretal [19]基于细粒度的身体和衣服片段生成了穿着者的全身图像。完整模型可以以姿势,形状或颜色为条件。Ma[21,22]基于图像和姿势生成人图像。在[18]中提出了快速人脸交换,以将输入身份转换为目标身份,同时保留姿势,面部表情和光照。
图像完成 最近,基于GAN的方法已经成为图像完成的一种有希望的范例。 Iizuka等 [9]提议使用全局和局部判别器作为对抗性损失,在其中全局和本地一致性都得到了加强。Yu等人 [38]使用上下文注意力层来显式地参与远距离空间位置上的相关特征补丁。 Wang等 [33]使用多列网络以并行方式生成不同的图像分量,并采用隐式的多样化MRF正则化来增强局部细节。
给定场景文本图像Is,我们的目标是在保持原始样式的基础上基于内容图像Ic替换文本。 如图2所示,我们的框架由文本交换网络,背景完成网络和融合网络组成。文本交换网络首先从Is中提取样式特征从Ic中提取内容特征,然后通过自注意网络合并这两个特征。 为了更好地表示内容,我们使用内容形状转换网络(CSTN)根据样式图像Is的几何属性来转换内容图像Ic。背景完成网络用于重建样式图像Is的原始背景图像Ib。 最后,文本交换网络和背景完成网络的输出被融合网络融合以生成最终的文本图像。
现实情况下的文本实例具有多种形状,例如,呈水平,定向或弯曲形式。 文本交换网络的主要目的是在保留原始样式(尤其是文本形状)的同时替换样式图像Is的内容。 为了提高不规则文本图像生成的性能,我们提出了一个内容形状转换网络(CSTN)将内容图像映射到样式图像的相同几何形状中,然后通过3个下采样卷积层和几个残差块对样式图像和转换后的内容图像进行编码。 为了充分融合样式和内容特征,我们将它们馈入了一个自注意网络。 对于解码,使用3个上采样反卷积层来生成前景图像If。
文本形状的定义对于内容形状的转换至关重要。 受文本检测[20]和文本识别[35]领域中的文本形状定义的启发,可以使用2 K个基准点P = {p1,p2,...,p2K}定义文本的几何尺寸属性,如图3所示。
在对内容和样式图像进行编码之后,我们将两个特征图都馈送到自注意网络,该网络会自动学习内容特征图Fc和样式特征图Fs之间的对应关系。 输出特征图是Fcs,图5(a)给出了自注意力的网络结构。
内容特征Fc和样式特征Fs首先沿其深度轴连接。 然后,我们遵循[42]中类似的自注意力机制来生成输出特征图Fcs。
除了这种单级样式化之外,我们还开发了多级样式化管道,如图5(b)所示。 我们将自注意力网络依次应用于多个特征图层,以生成更逼真的图像。
文本交换网络主要侧重于前景图像生成,而背景图像在最终图像生成中也起着重要作用。为了生成更逼真的文字图像,我们使用背景完成网络来重建背景图像,其结构如表1所示。大多数现有的图像完成方法都是通过借用或复制周围区域的纹理来填充图像的像素。一般的结构遵循编码器-解码器结构,我们在编码器之后使用膨胀卷积层来计算具有较大输入区域的输出像素。通过使用较低分辨率的膨胀卷积,模型可以有效地“看到”输入图像的较大区域。
在此阶段,将文本交换网络和背景完成网络的输出融合以生成完整的文本图像。 如图2所示,融合网络遵循编码器-解码器结构。 类似于[34],我们在融合解码器的上采样阶段将背景完成网络的解码特征图连接到具有相同分辨率的相应特征图。 我们使用Gfuse和Dfuse分别表示生成器和判别器网络。 融合网络的损失函数可计算如下:
为了制作更逼真的图像,我们还遵循样式迁移网络[5,26]的类似思想,将VGG-loss引入融合模块。 VGG损失分为两部分,即知觉损失和风格损失,如下所示:
我们遵循[34]中的类似思想来生成具有相同样式的成对合成图像。我们使用超过1500个字体和10000个背景图像来生成总共100万个狮子训练图像和10000个测试图像。输入图像的大小调整为64×256,批处理大小为32。从权重为零的正态分布初始化所有权重,标准差为0.01。使用β1= 0.9和β2= 0.999的Adam优化器[16]来优化整个框架。在训练阶段将学习率设置为0.0001。我们在Ten-sorFlow框架[1]下实现我们的模型。我们的方法中的大多数模块都是GPU加速的。
我们在几个公共基准数据集上评估了我们提出的方法。
我们采用图像生成中常用的指标来评估我们的方法,其中包括:
在本节中,我们将通过经验研究不同的模型设置如何影响我们提出的框架的性能。我们的研究主要集中在以下方面:内容形状转换网络,自注意力网络和背景完成网络中的膨胀卷积。图6给出了一些定性结果。
自注意力网络 使用自注意力网络来充分结合内容特征和风格特征。根据表2,使用单层自注意力网络,平均l2误差减少约0.003,平均PSNR增加约0.3,平均SSIM增加约0.012。为了使用样式和内容特征的更多全局统计信息,我们采用了一个多层的自注意力网络来融合全局和局部模式。借助多级自我关注网络,所有的度量方法都得到了改进。
膨胀卷积 膨胀卷积层可以扩大像素区域以重建背景图像,因此更容易生成更高质量的图像。 根据表2,具有膨胀卷积层的背景完成网络在所有指标上均具有更好的性能。
为了评估我们提出的方法,我们将其与两种文本交换方法进行了比较:[10]中提出的pix2pix和Wuet等人[34]提出的SRNet。 我们使用生成的数据集来训练和测试这两个模型。根据论文,两种方法都保持相同的配置。
定量结果 在表2中,我们给出了本方法和其他两种竞争方法的定量结果。显然,我们提出的方法在不同语言的所有指标上都有显著改进,平均l2误差减少了0.009以上,平均PSNR增加了0.9以上,平均SSIM增加了0.04以上。第二个最好的方法。
基于图像的翻译是任意文本样式传输的最重要应用之一。在本节中,我们提供一些基于图像的翻译示例,如图7所示。我们在英语和中文之间进行翻译。从结果可以看出,无论目标语言是中文还是英文,都可以很好地保持颜色,几何变形和背景纹理,并且字符的结构与输入文本相同。
在图9中,我们还展示了在场景文本数据集上评估的模型的一些示例结果。根据图9, 我们的模型可以替换输入图像中的文本,同时保留原始字体,颜色,大小和背景纹理。
我们的方法有以下局限性。由于训练数据量有限,因此无法充分利用几何属性空间和字体空间。当样式图像中的文本出现波动时,我们提出的方法将失败,请参见图8(顶部)。图8(底部)显示了使用WordArt中的样式图像的失败案例。
在这项研究中,我们提出了一种健壮的场景文本交换框架SwapText,以解决用预期的文本替换场景文本图像中的文本的新任务。我们采用分而治之的策略,将问题分解为三个子网络,即文本交换网络,背景完成网络和融合网络。在文本交换网络中,内容图像和样式图像的特征被同时提取,然后通过自注意网络进行组合。为了更好地学习内容图像的表示,我们使用内容形状转换网络(CSTN)根据样式图像的几何属性对内容图像进行转换。然后,使用背景完成网络来生成内容图像的背景图像样式图片。最后,将文本交换网络和背景完成网络的输出馈送到融合网络中,以生成更真实和语义一致的图像。在几个公共场景文本数据集上的定性和定量结果证明了我们方法的优越性。在未来的工作中,我们将探索基于字体和颜色生成更多可控制的文本图像。
张玉君史鉴文
(地矿部航空物探总队研究所)
摘要 本文报导了关于深海洋底多金属结核照片的图像复原和图像处理方法技术研究结果。海底照片存在的主要问题是:光照分布不均匀、有时聚焦欠佳、常有铁丝影像、有时有泥浆局部干扰等。本文剖析了光照分布的数学模型,推导了倾斜相机系统和水平相机系统条件下的光照分布及感光光强分布公式。本工作利用图像处理系统研究成功了一套适用于海底照片的图像复原和图像处理技术,给出了详细流程图。做为实例本文附有六幅图片,说明所研究的方法在去除光照不均匀、铁丝干扰、提高反差、增强分辨率、自动分类、科学统计覆盖率等的显著效果,以及通过局部放大研究结核的结构和形态方面的可能性。本文所报导的方法是改善和研究珍贵海底照片的重要工具。
一、前言
地球各大洋海底广泛赋存有锰结核、铁锰结核、多金属结核等丰富宝藏;为了探明其分布和储量,各国在公海正在开展着深海多金属结核的勘探工作,这是一项具有深远意义的造福后代的工作。这种勘探工作所用手段之一是海底照相,根据海底相片估算多金属结核的覆盖率和储量,并对结核的形态进行研究。
深海多金属结核照相由于拍摄环境及装置存在着一系列问题,因此提出图像复原和处理的要求。
在深海洋底照相需要外加光源,数千米深的海水将阳光几乎全部吸收掉了,外加光源与相机的位置相对固定,他们之间的距离大约为20~30cm。相机系统由缆绳绞车控制下降至海洋底,根据重锤触底信号再将相机升起一个高度(1.5~3m),即拍照;这一距离根据海况变化一次下水调整一次。海况是指:海风、洋流、底质等情况。由于洋流的存在,相机系统可能倾斜,拍摄高度随之也有所变化。所获海底多金属结核照片存在一系列影响分辨和研究的问题,主要有:
(1)光照分布不均匀,其中心与照片中心偏离,甚至由于相机倾斜,造成光照分布失去对称规律;
(2)有时聚焦欠佳;
(3)常常出现有铁丝干扰影像;
(4)有时有因重锤搅混海底沉积物而局部模糊。
利用数字图像技术处理深海多金属结核照片的目的在于:
(1)通过图像处理改善照片的质量,主要是图像复原;
(2)通过分类技术分辨裸露核、浅埋及深埋核,并对各类面积进行精确计算,从而得到覆盖率的科学数据;
(3)结核形态研究。
为了达到以上目的首先要对海底照片进行数字化,形成图像数据文件,即可利用数字图像处理系统进行处理。
数字图像处理技术随着计算机技术、遥感科学的发展而在近20年得到极为迅速的发展、成熟与应用。正如图像增强一样,图像复原技术的主要目的,在某种意义上说,是要改善给定的图像。复原是一个过程,这一过程试图利用退化现象的某种先验知识,把已经退化了的图像加以重建或恢复。因此,复原技术是把退化模型化,并运用相反的过程以便恢复原来的图像。
Cannon博士(1983,“Applied Optics”)研究了一种图像复原技术,或称图案去除技术,适用于:规则图形(如纺织品)上手纹处理、散焦图像改善、卫片上探测器与探测间噪声消除、曝光过程中的平移模糊的清晰化等。Srinivasan(1986,“Digital Design”)也阐述了此方法。此技术可分解为明确的三个步骤:
(1)对图像中的“模糊”或“图案”问题进行估计,即分析退化问题的实质;
(2)生成一个近似模型或频率域滤波器,以便准备进行复原或图案去除;
(3)利用威纳(Wiener)滤波器或富里叶(Fouriel)滤波器对图像进行改善。
海底结核图像所存在的具体退化问题有自己的独特性,但Cannon所提出的方法原则仍有重要参考价值。
二、深海多金属结核图像退化问题的剖析
1.光照计算
前言所述噪声中,影响最大的是光照不均匀问题,现将此问题进行数学分析。
已知:光源可认为是点光源;海底假定为一平面,所拍照片对应于abcd四边形;相机底片中心f与光源中心f´之间距离为l,由于相机与光源为硬固定,因此光源永远位于底片平面长对称轴的延长线上;底片中心与abcd四边形的对角线交点o的距离为h;相机倾斜角为α;光源源强为Q,见图1。
求解:写出abcd四边形中任意一点的光照强度函数F=f(Q,h,a,l,x,у)。
解:通过o点作x、y座标轴,任意点g,其座标为x,y,与光源间距离为R。如写出R公式,即求出F方程的表达式。
做h´∥于h,由g点向h´做垂线gK。
张玉君地质勘查新方法研究论文集
光照强度表达示为:当底片平面平行于海底平面时,图1简化为图2,式(4)简化为(5)式。
张玉君地质勘查新方法研究论文集
从图2可见:
图1相机系统倾斜条件下的光照强度计算示意图
图2相机系统水平条件下的光照强度计算示意图
张玉君地质勘查新方法研究论文集
若(5)式中y=0,
则:
张玉君地质勘查新方法研究论文集
(6)式为x轴上各点的光照强度,显然这是一个以о´点为中心的对称曲线,示意于图3。
图3沿x轴光照强度分布曲线
而在abcd平面上光照分布则为一个曲面,它由上图中之曲线,以mo ′为轴旋转而成。
对于式(4),即对于相机系统发生倾斜时,此曲线及曲面显然将变得复杂化,并将失去轴对称性。
2.感光光强计算
在拍照时还要考虑到底片各点感光光强同样与距离有关。
令L为感光光强函数,用与前述类似方法可求出对应于倾斜和水平两种状态L的表达式。
对于倾斜相机系统:
张玉君地质勘查新方法研究论文集
对于水平相机系统,显然公式可较简单:
张玉君地质勘查新方法研究论文集
图像复原的实质是试图用理论的或试验的方法建立起深海结核图像的感光光强分布本底图像,从原图中扣除,便可去除光照不均匀所造成的失真,达到图面基本改善。
从(8)式可知,实际上α角是最大的难点。试图利用底片或照片本身,逆演求解α角也将是十分困难的。故本研究用试验方法建立光强分布本底图像,较好地实现了复原。
三、深海多金属结核图像复原和处理方法流程
经研究,建立了图4所示之方法流程:
图4深海多金属结核图像复原和处理方法流程
流程图由20个步骤组成,其2—8属图像复原,9—20属图像处理,1为准备工作。
数字化使用I2S公司所产C4500扫描仪,将135底片上的短边方向扫成512行,长边方向对中舍去两边。若扫描所获图像不足512行,则进行适当拼接,这是为了减少快速富氏变换时的边界效应。
挖补是为了解决铁丝干扰,否则不仅图面不完整,而且在频率域处理时,干扰范围还会扩大。
在频率域适当选取低通滤波参数,用指数滤波可以获得近似的光强本底分布图像,并适当选取比例因子从原图中扣除,即可得到基础图像。
利用基础图像通过聚类分析,并提取其中对应于裸露核,浅埋核及深埋核三个类别。叠加后,进行邻域滤波,去除零星干扰,便可进行分类统计了。
对于泥浆搅动干扰区,必要时可在统计前挖去,减少这种干扰所带来的误差。
四、图像复原和处理效果
为了开展此项研究,由广州海洋地质调查局提供了三张海底照相底片,其质量分别属于优、中、差三级。通过实验,均获得了成功的结果。现以中等一级的图像复原和处理结果为例,展示方法的效果。
图片1为原始图像,它的主要问题是:反差小,光强不均匀,存在铁丝干扰,行数不足512。
图片2为经过拼接,挖补和增强的图像,图中反差有所改善,消除了铁丝干扰,补足了行数,但光强不均匀问题仍然存在。
图片3为复原后的图像,成功地克服了光强不均匀问题,为计算机自动分类提供了前提。
图片4为分类处理后所提取裸露核(深灰),浅埋核(白色)和深埋核(浅灰)的合成图像。
图片5为对比图像。左上角为三类核的合成图像,右上角为裸露核图像,左下角为浅埋核图像,右下角为深埋核图像。
通过统计和计算,得到各类结核的象元数、全图总象元素及各类结核的覆盖率。见下表:
张玉君地质勘查新方法研究论文集
此外对优质底片,经过上述处理后,还做了局部放大,经四倍放大后的图像(图片6)对于结核形态研究很有用,从图片6可以清晰地看到环形,盘形、菜花形多金属结核的形态和结构。
图片1
图片2
图片3
图片4
图片5
图片6
五、几点结论
本工作所研究的深海多金属结构图像复原方法可以成功地去除光强不均匀造成的干扰,并可消除铁丝影像干扰,增强清晰度,提高反差,效果显著。
经复原后的图像,具备了计算机自动分类处理的条件,经聚类分析成功地提取了裸露核、浅埋核和深埋核信息,并精确地统计了各自的象元数,求出了各类核的覆盖率。
通过局部放大,有可能进一步研究多金属结核的结构以及形态。
本文所研究成功的方法,无疑对于探明数千米以下深海海底蕴藏的丰富矿产资源有着重要意义,希望能投入半生产性批量处理应用。这种方法当然也可以用于其他方面。
本工作得到广州海洋地质调查局王光宇同志、陈邦彦同志、张国祯同志的支持,本所朱月娥同志多次一起商讨,杨星虹同志拍摄了图片,一并向他们致谢。
参考文献
[1]Cannon M.,Lehar A., Preston F.: Background pattern removal by power spectral filtering, Applied Optics, vol.22,No.6,777-779,1983,March.
[2]SrinivasanR.:Software image restoration techinques,Digital Design,Vol.16,No.4,29-34,1986,March.
A STUDY OF IMAGE RECONSTRUCTION AND IMAGE PROCESSING TECHNIQUES FOR PHOTOS OF DEEP-SEA POLYMETALLIC NODULES
Zhang Yu jun,Shi Jian wen
(Institute of Aerogeophysical Survsy,Ministry of Geologyand Mineral Resources)
AbstractThis paper reports the results of research on image reconstruction and image processing techniques for photos of polymetallic nodules from the bottom of deep sea.The major troubles with submarine photos include uneven distribution of illuminance, unsatisfactory focusing,frequent existence of iron wire image, local mud interference etc.The present paper analyses the mathematic model for distribution of illuminance and derives, the formulae for illuminance distribution and light sensitivity distribution under the conditions of inclining camera system and horizontal camera system.Using image processing system,we have successfully developed a suite of image reconstruction and image processing techniques suitable for submarine photos and drawn a datailed flow chart.As examples,four pictures are attached to this paper, which illustrate the obvious effects of our method in such aspects as eliminating uneven illuminance and iron wire interference,raising contrast and resolution power, automatic classification and scientific statistical analysis of coverage, and indicate the possibility of examining textures and shapes of the nodules by means of partial enlargement.The method described in this paper serves as an important tool for improving and studying precious submarine photos.
原载《物探与化探》,1989,No.6。
图像融合是多传感器信息融合领域的一个重要分支[1],它是指将来自同一目标的不同传感器的信息通过一定的算法融合到一幅图上,从而获得比在单幅图上更完整、更精确的信息。图像融合在军事(如军事侦察、识别伪装)和非军事(如医疗诊断、遥感、计算机技术等)领域得到广泛的应用。就遥感图像融合而言,目前大致分4种类型:多种分辨率的融合处理、多时相的融合处理、多种传感器类型的融合处理、多波段大容量的融合处理。本文研究的对象属于最后一种,即不同光谱获得的图像。这里使用基于小波变换的塔式结构的优点是小波变换具有紧凑性、正交性、很好的方向性,这使得小波变换可以很好地提取不同尺度上的显著特征,相对于高斯—拉普拉斯金字塔技术而言,不仅可以产生更好的融合结果,而且进行反向变换时稳定性更好;另外小波变换的塔式结构还使得不管原图像的长度是否2的幂次方,最终变换后的图像与原图像尺寸相同,这使得开发实用的并行算法系统成为可能。本文正是基于这点,在对图像小波多分辨分解叙述的基础上,构造了一种图像融合算法,最后对算法进行了仿真,并对结果进行了分析。1图像的小波变换定义1多分辨分解设fj+1∈V2j+1,由V2j+1=V2j W2j可得,存在fj∈V2j,gj∈W2j,有fj+1=fj+gj对于图像f(x,y)而言,由文献[2]可得图像的Mallat二进小波的塔式分解为fj+1(x,y) =∑k,mCj,k,mj,k,m+∑ε=1,2,3∑k,mDεj,k,mΨεj,k,m(1)式中:Cj,k,m=∑l,nhl-2khn-2mCj+1,l,n;D1j,k,m=∑l,nhl-2kgn-2mCj+1,l,nD2j,k,m=∑l,ngl-2khn-2mCj+1,l,n;D3j,k,m=∑l,ngl-2kgn-2mCj+1,l,n在图像小波分解的表达式中Cj,k,m, D1j,k,m, D2j,k,m, D3j,k,m,分别对应图像的低频子带及水平、垂直与对角线3个方向的高频子带, Cj,k,m为图像在aj分辨率下的离散逼近,D1j,k,m, D2j,k,m, D3j,k,m为2j分辨率下的离散细节。{hk}k∈z可看作低通滤波器系数, {gk}k∈z可看作高通滤波器系数,为尺度函数,Ψ为正交小波函数。{j,k,m|k,m,∈z}构成Vj2的规范正交基,{Ψεj,k,m|j,k,m∈z}构成W2j的规范正交基。另外,通过小波分解,除了低频子带都是一些正的变换值外,其它的3个高频子带都包含了一些在零附近的变换值,在这些子带中,较大的变换值对应着亮度急剧变化的点,也就是图像中的显著特征,如边缘、亮线及区域轮廓。既然小波变换具有很好的空域及频域局部性,融合的效果就是:对来自同一目标的两个不同传感器所获解的图象A和B,融合前在图像A中若比图像B中显著,融合后图像A中的目标就被保留,图像B中的目标就被忽略;对不同的场景,比如图像A中的目标的外部轮廓比较明显,图像B中目标的内部轮廓比较明显,这种情况,图像A、B中目标的小波变换系数将在不同的分辨率水平上占统治地位,从而在最终的融合图像中,图像A中的外部结构与图像B中的内部结构都被保留。因此通过融合可以实现在单幅图像上的片面的、不完整、不精确的信息得到更一致更精确的体现。最后对组合后的变换系数进行反向小波变换,就可得到融合后的图像。2基于区域的图像增强算法在图像的融合算法中,图像不同,图像的数据表征不同,融合算法也各不相同,目前采用的融合方法主要有[3]:基于像素的代数组合法、统计/数值法以及与颜色有关的技术。但是我们知道图像中的有用特征通常大于1个像素,因此基于像素的选择方法可能不是最适合的,近几年又提出了基于区域的选择方法,比较有代表性的是文献[4]中提出的基于区域的均值选择法,该方法用一M×N的窗口对图像块进行求方差运算,计算结果作为与窗口中心像素对应的一种度量方法,中心像素的选择方法为:如果两幅图像方差在对应位置上的度量值相近,取2者的均值作为输出的新值,否则取较大的值作为输出。文献[5]中提出利用不同的特征选择算子,有方向的计算对应细节图像的局域能量,由局部能量构造匹配度及加权因子,从而对图像进行加权运算。这里以均值、方差、相关等统计参量构造一种新的区域融合算法。以下计算以两幅图像为例,对3幅以上的图像融合算法与此类似,具体步骤如下:首先,利用M×N (一般选M,N为奇数,常用的窗口为3×5或5×5)窗口计算小波分解各子带系数的均值和方差,子带中以(x,y)位置为中心的区域均值与方差分别为mi(x,y) =1M×N∑Mm=1∑Mn=1fi(x+ m -M+12,y+ n -N+12) (2)σ2i(x,y) =1M×N∑Mm=1∑Mn=1(fi(x+ m -M+12,y+ n -N+12)- mi(x,y))2(3)图像1以(x,y)位置为中心与图像2对应区域的协方差为β2(x,y)=1M×N∑Mm=1∑Mn=1(fi(x+m-M+12,y+n-N+12)-m1(x,y))×(f2(x+m-M+12,y+n-N+12)-m2(x,y))(4)构造匹配度ρ及加权系数W:ρ=β2σ1σ2;Wmax=1-12ρ;Wmin=1-Wmax然后,利用下式对两幅图像中的对应子带像素进行融合计算f(x,y)=Wmax·MAX(f1(x,y),f2(x,y))+Wmin·MIN(f1(x,y),f2(x,y)) (5)这里f1(x,y),f2(x,y)是上述对应窗口中心位置的两幅图像的像素灰度值。这样就完成了2j分辨率下的数据融合,最后对融合后的子带系数进行反变换就可得到融合后的图像。需要的话给我你的邮箱,发到你邮箱!
我这里有,可以发给你
随着现代化科学技术的快速发展,计算机图形图像处理技术也越来越成熟,为人们的生活、工作和学习提供了极大的便利。然而我们该如何写有关计算机图形图像处理的论文呢?下面是我给大家推荐的计算机图形图像处理相关的论文,希望大家喜欢!
《计算机图形图像处理技术分析》
摘 要:随着现代化科学技术的快速发展,计算机图形图像处理技术也越来越成熟,Photoshop、CAE、CAD等计算机图形图像处理软件被广泛的应用在各个领域,为人们的生活、工作和学习提供了极大的便利。在未来的发展过程中,要不断改进和完善计算机图形图像处理技术,推动计算机图形图像处理技术更加广泛的应用和发展。本文简要介绍了计算机图形图像处理技术,阐述了计算机图形图像处理技术的应用。
关键词:计算机;图形图像;处理技术
中图分类号:TP391.41
计算机图形图像技术以计算机网络系统为平台,实现了人们主观意识中图像和真实存在的图形之间的相互结合,各种各样的计算机图形图像处理软件,为人们的主观处理和操作提供了很多的便利,随着现代化科学技术的快速发展,计算机图形图像处理技术的应用前景会更加广阔。
1 计算机图形图像处理技术概述
1.1 基本含义
计算机图形图像处理技术是指通过几何模型和数据将描述性的形象或者概念在计算机系统软件中进行存储、定稿、优化、修改和显现。计算机图形图像处理技术可以用来设计图形的色彩、做纹理和明暗的贴图处理、对图像进行建模设计和造型、消除图像隐线和隐面、对图形曲线和曲面进行拟合操作、数字化的图像存储、图像分割、分析、编码、增强、复原等操作[1],以及对图像进行形式转换,如投影、缩放、旋转、平移等几何形式。
1.2 基本组成
计算机图形图像处理技术的基本组成主要包括计算机硬件设备和计算机图形图像处理软件。计算机硬件设备性能的好坏对于计算机图形图像处理效果有着直接的影响,计算机图形图像处理软件将终端的显示和计算机结合在一起,由于计算机图形图像处理技术自身具有设计、存储、修改等功能,可以迅速整合图片数据,不仅可以保障计算机图形图像的处理效果,也可以有效地提高计算机中央处理器和计算机图形图像处理软件的运行效果。键盘和鼠标作为终端的输入设备,可以完成对图形的修改和定位,并且利用显示器、绘图仪、打印机等显示设备和输出设备,可以完整的保存计算机图片。
1.3 基本功能
计算机图形图像处理技术主要具有五个基本功能:对话、输入、输出、存储和计算。对话功能是指利用通讯交互设备和计算机显示器实现人机交流。输入和输出功能是指计算机图形图像处理软件可以随时输入和输出相关的图形图像。存数功能是指实时监控计算机的图形图像数据进行有效的检索和维护。计算功能是指计算机图形图像处理软件对相关的图形图像进行必要的数据交换和计算分析。
1.4 计算机图形图像处理技术的运行环境
计算机图形图像处理技术的硬件配置主要包括工作站和微型机,软件配置就是建立在工作站和微型机上的运行软件。计算机图形图像处理技术的工作站软件主要有TDI和Alias两种,工作站的软件主要负责处理计算机工作站中的各种图形图像处理。微型机上的计算机图形图像处理软件主要包括3DStudio、Winimage:morph和Photoshop等,3DStudio是微型机上的一种最主要的图形图像处理软件,被广泛的应用在多个计算机系统中;Winimage:morph是一种常用的二维图形图像处理软件,可以将一个图形或者图像制作成另外一个图形或者图像;Photoshop是一个非常专业的图形图像处理软件,其支持图形图像资料的分色制版,给人们进行图形图像处理带来很多的便利。
2 计算机图形图像处理技术的应用
2.1 用户接口
人们利用计算机系统的用户接口来操作多种计算机软件,计算机图形图像处理技术和用户接口的有效结合,借助于计算机操作系统构建友好的人机交互用户图形界面,极大地提高了计算机图形图像处理的简便性和易用性。近年来,微软公司普及和推广的图像化windows系统,充分发挥了计算机图形图像处理技术和用户接口全面融合的重要作用。
2.2 动画与艺术
随着计算机科学技术的快速发展,计算机硬件设备和计算机图形学也在蓬勃发展,静态的图形图像已经很难再满足人们对高质量、优质的、动态的图形图像的巨大需求,因此近年来,计算机动画技术蓬勃发展,特别是一些美术设计人员,多是依靠计算机图形图像处理软件来进行艺术创作。计算机图形图像处理技术的快速发展,同时推动了艺术设计技术的应用和开发,例如,3DS Studio Max三维设计软件和Photoshop二维平面设计软件[2]。
2.3 可视化科学计算
近年来,我国社会主义市场经济快速发展,各个领域的信息通信越来越频繁,计算机网络技术的广泛应用和普及,使得计算机系统数据库中的信息量日益庞大,计算机数据处理和分析技术面临着严峻的考验。相关的技术操作人员利用计算机数据处理和分析软件,很难准确、快速地从计算机的数据库系统中检索出需要的信息数据,难以总结出数据信息的共性和特征。通过将计算机数据处理技术和计算机图形图像处理技术有效的结合起来,可以通过计算机图形图像技术将大量的复杂结构的信息数据进行归类,操作人员通过计算机数据处理软件可以对有共性特征和本质特征的数据信息进行快速检索,极大地提高了计算机数据处理和分析的效率。可视化的科学计算技术最早出现在美国的科学协会研讨中,目前,可视化的科学计算技术被广泛的应用在气象分析、流体力学、医学等领域中[3],特别是在医学领域,利用可视化的科学计算技术可以实现高精度的远程控制和操作,可以应用在远程的脑部手术中,突破医学难题。在未来的发展过程中,可视化的科学计算技术将会在更多的领域发挥更加重要的作用。
2.4 工业制造和设计
目前,计算机图形图像处理技术在工业制造和设计领域应用的最为广泛,特别是二维三维CAD和CAE等计算机图形图像处理软件,不仅在工业生产的产品制造和产品设计过程中,还有土木工程领域,甚至是集成电路、网络分析和电子线路等电子电工领域都有着广泛的应用。在高精度的工业制造和设计领域中,利用计算机图形图像处理软件,可以在很短的时间内完成高精度的图形图像设计和画图,极大地提高了技术人员的工作效率,同时,标准的计算机图形图像处理程序,提高了工业制造和设计的精确度,有效地降低了设计误差。由于工业产品多是批量化的制造和生产,利用计算机图形图像处理技术,可以极大地提高企业批量化的运行效率和生产质量,降低工业产品的质量检测投入成本,为工业企业带来了更大的经济效益。
3 结束语
计算机图形图像处理技术的广泛应用和快速发展,推动了多个领域的技术革新,充分发挥人们的想象和创造力,创造出很多独特新奇的图形图像效果,丰富人们的日常生活,同时也为企业节约了很多的图形图像处理成本,提高了产品竞争力。在未来的发展过程中,计算机图形图像处理技术的应用前景会更加广阔。
参考文献:
[1]韩晓颖.浅谈计算机图形图像处理技术[J].福建电脑,2011(10):83-84.
[2]和晓娟.计算机图形图像处理技术的探讨[J].信息与电脑(理论版),2013(11):164-165.
[3]王应荣,王静漪.计算机图形图像处理技术[J].天津理工学院学报,2012(03):6-10.
作者简介:刘倩(1981-),女,满族,硕士,讲师,研究方向:图形图像处理与多媒体技术。
作者单位:宁夏大学 数学计算机学院,银川 750001
函数图像的教学研究论文
摘要: 数形结合的思想是数学中一种重要的思想方法,而在函数的教学中把刻画数量关系的数和具体直观的图形有机结合,用代数的语言揭示几何要素及其关系,同时将几何问题转化为代数问题,扬数之长,取数之优,使抽象思维与形象思维珠联璧合,不但可以提高学生对图形世界的直观感知而且可以使学生更好地理解函数,更加快捷准确的求解答案。
关键词: 函数图像 研究
从以往的教学经验来看,学习函数这部分内容要求学生进行数与形相结合的运算,即要求使符号语言、图形语言结合起来,使抽象思维和形象思维结合起来。学生会遇到很多需要“数”与“形”并举或转换的情形。因此,函数的学习是困扰很多学生的难点。作为教师,我们面临的突出问题是:如何在教学中针对学生的思维特点,制定有效的教学策略高质量地完成函数教学任务。笔者从一个数学教师的角度出发浅谈一下自己对函数教学方面的研究以及心得体会。
1加强学生对函数概念的理解
初中课本上运用“变量说”将函数描述为:设在一个变化过程中有两个变量x与y,如果变量y随着x的变化而变化,并对于x在某个变化范围内的每一个值,按照某个对应规则,都有唯一确定的y值和它对应,那么y就是x的函数,x称为自变量,x的取值范围称为函数的定义域,和x的值对应的y值称为函数值,函数值的全体称为函数的值域。高中阶段,运用“对应说”函数被定义为:设A,B是两个非空的数集,如果按某种对应法则f对于集合A中的每一个元素x,在集合B中都有唯一的元素y和它对应,这样的对应叫做从A到B的一个函数记作:y=f(x),x∈A。
以上两种函数的定义,各有各的不同特点。“变量说”是最朴素、最根本的,便于和实际相结合,初学者更容易接受。“对应说”抽象化的`程度较高,对于研究函数的精细性质具有一定的优势。适合在高中阶段介绍给学生。
讲述函数概念时,我们需要注意以下细节问题。
1。1实现由静到动的转变
学生由于长期在常量范围内计算、思维,因此以为变量一直是变,常量永远是不变。在引入函数概念之前,需要完成从常量到变量的转变,这是函数教学的一个重点。
例如“一架飞机每小时飞行1000千米,问5小时此架飞机飞行的距离是多少?”小学生只能给出正确的答案,但很少能够注意到路程S和时间t的关系。对于初中生我们要能引导他得出S=1000t的函数公式。在高中的实际教学中,我们可以把S表示为数轴上的一个定点,而把t看成是一个动点。取自变量t的一系列特定值,列出相应的另一个变量S(t)的对应值,在坐标系上描绘出这些点,这样会使学生能够比较容易地感受到变量的真实意义。
1。2突出变量之间的依赖关系
自变量和因变量之间的依赖关系是函数。通常表示为y=f(x),f表示x和y之间的对应关系。对于定义域内的任意一个x,通过对应关系f,对应唯一的一个y值。我们可以例举生活中的例子,让学生找出自变量x,然后再找出依赖此变量x的变化而变化的因变量y,最后设法找出它们之间的对应关系。从实际事例中寻找函数关系,构造事物变化过程中的具体函数关系,有利于加强学生对函数的理解。
2加强学生对函数图像的应用
在函数的教学中,我们不但要让学生深刻的理解函数的概念。还要不断帮助学生归纳各种初等函数的图形性质,并且教会学生快速画出初等函数的图形,这样在其今后的解题中将会发挥重大的作用。函数一般分为一次函数、二次函数、指数函数、对数函数和幂函数,下面以二次函数为例,来谈一下函数教学的研究体会。
在教学中,我们要引导学生对函数的图像特征进行归纳总结。可以先介绍特殊的二次函数的表达式y=ax2(a≠0),通过赋予x特殊的数值来对其图像进行描绘,进而归纳图像特征:图像形状为抛物线;顶点为原点;对称轴为y轴;a决定其开口方向,a>0时开口向上,a<0时开口向下。进而通过将y=ax2(a≠0)的图像向上下左右平移,引出二次函数的一般表达式y=ax2+bx+c(a≠0),并将其配方为y=a(x+b a="">0时开口向上,a<0时开口向下;(2)函数的对称轴为x=—b c="">0时,图像与y轴交在正半轴,c<0,图像与y轴交在负半轴,c=0,图像与y轴交在原点;(5)△=b2—4ac决定图像与x轴的交点个数,△>0时,图像与x轴有两个交点,△<0时,图像与x轴无交点,△=0时,图像与x轴无交点。
掌握了函数的基本特征后,学生就能对任一个二次函数进行绘制了,进而在一些有关函数的解题过程中就可以通过数形结合进行求解,不仅直观易发现解题途径,而且能避免复杂的计算与推理,大大简化了解题过程。这在解选择题、填空题中更显其尤为重要,因此我们要引导学生加强对函数图形的掌握,培养数形结合的这种思想意识,做到胸中有图,见数想图,以开拓自己的思维视野。
参考文献
[1]吴志鹃。二次函数图像的教学设计[J]。希望月刊(上半月),2007(11):108。
[2]梁小瑜。加强函数图像教学,衔接初高中数学教学[J]。师道·教研,2010(6):27~28。
[3]付尚英。浅谈利用函数的图像特征解题[J]。金色年华(教学参考),2010(12):113。
随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!
图像识别技术研究综述
摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。
关键词:图像处理;图像识别;成像
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02
图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。
1 图像处理技术
图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。
1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。
2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。
3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。
4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。
5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。
2 图像识别技术
图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:
2.1 指纹识别
指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。
2.2 人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。
2.3 文字识别
文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。
3 结束语
人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。
参考文献:
[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.
[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.
[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.
[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.
[6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.
点击下页还有更多>>>图像识别技术论文
图像增强的方法主要又两大类:空间域法和频率域法。
1、空间域法主要是在空间域直接对图像的灰度系数进行处理;
2、频率域法是在图像的某种变化域内,对图像的变化系数值进行某种修正,然后通过逆变换获得增强图像。频率域法属于间接增强的方法,低通滤波、同态图像增强均属于该类;空间域法属于直接增强的方法,它又可分为灰度级校正、灰度变换和直方图修正,直方图均衡属于空间域单点增强的直方图修正法。
扩展资料
遥感技术的应用是人类视觉在波谱范围上的扩展和从物体表面向内部的延伸。即使在可见光部分,人眼可区分的色彩约三千多种,但对于黑白图像,人眼能区分的灰度级只有二三十个;而在非可见光波段,需要将原始图像的灰度值转换到0~255灰度区间才有利于人眼观察。
但是如果以256个灰度级来描述一幅黑白遥感图像,我们获得的原始图像的灰度值很难均匀分布在0~255之间,而是常常集中在某一段灰度范围之内,图像的反差小,对比度差,不利于人眼的分辨,所以需要对遥感图像进行增强处理。
参考资料来源:百度百科—遥感图像处理
参考资料来源:知网—遥感图像增强方法的研究
中国知网()上,你挑挑1. 数字图像增强技术在X线头影测量中的应用曹国刚,胡遒生,王林,鲍旭东 文献来自: 临床口腔医学杂志 2001年 第04期 CAJ下载 PDF下载也为医生完成这一工作提供了便利数字图像增强技术在X线头影测量中的应用@曹国刚!210096江苏南京$东南大学影像科学与技术实验室 @胡遒生$南京医科大学口腔医学院 @王林$南京医科大学口腔医学院 @鲍旭东 ...被引用次数: 6 文献引用-相似文献-同类文献2. 数字图像增强技术及其在VC++6.0下的实现夏明华,张炎生 文献来自: 成都信息工程学院学报 2002年 第04期 CAJ下载 PDF下载数字图像增强技术及其在VC++6.0下的实现@夏明华$湛江海洋大学海滨学院!广东524005 @张炎生$湛江海洋大学海滨学院 ... 空间域法论述了数字图像增强技术中涉及到的图像平滑、中值滤波、梯度锐化和拉普拉斯锐化等基本算法及其在VisualC++6 ...被引用次数: 10 文献引用-相似文献-同类文献3. 数字图像变换及信息隐藏与伪装技术丁玮,齐东旭 文献来自: 计算机学报 1998年 第09期 CAJ下载 PDF下载3按幻方的图像置乱变换以自然数1,2,…,n『为元素的n阶矩阵满足其中则称A为标准幻方.假定数字图像相应於n阶数字矩阵s ... 对数字图像矩阵B,注意B与A元素之间的对应关系,随A转换为人而把B中对应像素信息(灰度,RGB)做相应的移置,产生数字图像矩阵民,记为EB— BI,一般地,有E」B一B。例如,我们考虑一个由4X4像素组成的图像B, ...被引用次数: 193 文献引用-相似文献-同类文献4. 透射电子显微镜数字图像增强技术陈利永,叶锋,陈家祯,郑子华 文献来自: 福建师范大学学报(自然科学版) 2003年 第01期 CAJ下载 PDF下载原始图像和处理后图像的直方图透射电子显微镜数字图像增强技术@陈利永$福建师范大学计算机科学系!福建福州350007 @叶锋$福建师范大学计算机科学系 ...被引用次数: 2 文献引用-相似文献-同类文献5. 数字图像处理技术及其应用李红俊,韩冀皖 文献来自: 计算机测量与控制 2002年 第09期 CAJ下载 PDF下载模拟图像处理 (AnalogImageProcessing)和数字图像处理 (Dig italImageProcessing)。数字图像处理 ,通俗地讲就是利用计算机对图像进行处理。因此也称之为计算机图像处理 (C ... 图像理解[M].北京:国防科技大学出版社,1994. [5]A .罗森费尔德,等.数字图像分析[M ] ...被引用次数: 26 文献引用-相似文献-同类文献6. 棉铃虫数字图像增强技术的研究於新文,沈佐锐 文献来自: 走向21世纪的中国昆虫学——中国昆虫学会2000年学术年会论文集 2000年 CAJ下载棉铃虫数字图像增强技术的研究@於新文$西南林学院!昆明,650224 @沈佐锐$中国农业大学植保学院昆虫学系 ...被引用次数: 3 文献引用-相似文献-同类文献7. DSA数字减影系统中图像增强技术研究华如梅,沈大公 文献来自: 医学信息 1999年 第04期 CAJ下载 PDF下载对数放大和数字滤波算法。这两种算法是根据DSA系统产生减影图像的实际过程和实时性要求,对传统的数字图像增强算法进行改进而设计的,DSA系统采用这两种算法使减影图像基本达到平滑、清晰,并有较一致的对比度?...被引用次数: 2 文献引用-相似文献-同类文献8. 数字图像处理技术郑建英 文献来自: 内蒙古科技与经济 2002年 第05期 CAJ下载 PDF下载内蒙古呼和浩特 010000图像处理;;像素;;矩阵;;滤波本文概迷数字图像处理技术的发展,并讨论其迅速发展的原因,同时介绍了数字图像处理的主要内容和应用领域。[1]KennethR ...被引用次数: 9 文献引用-相似文献-同类文献9. 数字图像的自适应公开水印技术张军,王能超 文献来自: 计算机学报 2002年 第12期 CAJ下载 PDF下载我们将进一步研究基於多小波变换的性能更好的水印技术 .数字图像的自适应公开水印技术@张军$华中科技大学计算机学院!武汉430074 @王能超$华中科技大学计算机学院 ... 一种新的数字图像隐藏方法.计算机学报,2000,23(9):949-952) 11NiuXia-Mu,L uZhe-Ming,SunSheng-He ...被引用次数: 17 文献引用-相似文献-同类文献10. 数字图像的增强黄涛 文献来自: 肇庆学院学报 2004年 第02期 CAJ下载 PDF下载图像增强的目的在於采用一系列技术改善图像的视觉效果,提高图像的清晰度.数字图像增强的方法有频域处理法与空域处理法 ...被引用次数: 3 文献引用-相似文献-同类文献查数字图像 的定义搜数字图像 的学术趋势搜技术 的学术趋势翻译 数字图像增强技术 参考资料百度里面有更完善
1. 重庆工商大学实验实习中心,重庆400033 ; 2. 重庆工商大学图书馆,重庆400033)摘 要:介绍了MATLAB 图像处理工具箱中的函数,给出了图像处理与分析的技术实现,如用直方图均衡进行图像增强,通过形态学方法进行图像特征抽取与分析,借助于分水岭图像分割实现目标检测等。关键词:灰度图像;形态学变换;标记;分割;特征抽取中图分类号:TP 317. 4 文献标识码:AMATLAB6. 1(R12. 1) 是一套功能十分强大的工程计算及数据分析软件,其应用范围涵盖了数学、工业技术、电子科学、医疗卫生、建筑、金融、数字图像处理等各个领域。许多工程师和研究人员发现,MATLAB能迅速测试其构思,综合评测系统性能,并能借此快速设计出更多的解决方案,达到更高的技术要求。MATLAB 的图像处理工具箱,功能十分强大,支持的图像文件格式丰富,如3 . BMP , 3 . JPG, 3 . JPEG,3 . GIF , 3 . TIF , 3 . TIFF , 3 . PNG, 3 . PCX , 3 . XWD , 3 . HDF , 3 . ICO , 3 . CUR 等。利用MATLAB 所提理函数,并给出用MATLAB 实现图像处理与分析的应用技术实例。1 MATLAB 的图像处理工具概述MATLAB6. 1(R12. 1) 提供了20 类图像处理函数,涵盖了图像处理的包括近期研究成果在内的几乎所有的技术方法,是学习和研究图像处理的人员难得的宝贵资料和加工工具箱。这些函数按其功能可分为:图像显示;图像文件I/ O ;图像算术运算;几何变换;图像登记;像素值与统计;图像分析;图像增强;线性滤波;线性二元滤波设计;图像去模糊;图像变换;邻域与块处理; 灰度与二值图像的形态学运算;结构元素创建与处理;基于边缘的处理; 色彩映射表操作;色彩空间变换;图像类型与类型转换。2 应用MATLAB 工具箱进行图像分析处理2. 1 用直方图均衡实现图像增强当图像对比度较低,即灰度直方图分布区间较窄时,可用直方图均衡实现灰度分布区间展宽而达到图像增强的效果。下面是实现的源程序及相关功能的注解:%源程序:test1. mX 收稿日期:2003 - 02 - 27 ;修回日期:2003 - 03 - 30作者简介:何希平(1968 - ) ,男,四川人,博士生,重庆工商大学副教授,从事多媒体数据压缩、网络信息系统研究。. 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.clear , close all %清除所有内存变量、图形窗口I = imread(’pout. tif’); %将图像文件pout. tif 的图像像素数据读入矩阵Iimshow( I) %显示图像I ,图像对比度低,如图1afigure , imhist ( I) %在新图形窗口中显示图像I 的直方图,如图1c。可以注意到图像%亮度范围相当狭窄,并未完全覆盖可能的范围[0 ,255 ]I2 = histeq( I) ; %对图像I 做直方图均衡补偿在整个范围内展宽亮度值并输出到矩阵I2 ,因而改进了图像I 的对比度figure , imshow( I2) %在新图形窗口中显示新图像I2 , 如图1bfigure , imhist ( I2) %在新图形窗口中显示图像I2 的直方图, 如图1dimwrite ( I2 , ’pout2. png’); %将对比度调节的结果图像写入PNG格式的文件a 原图 b 直方图均衡结果图 c 原图像的直方图 d 结果图像的直方图图1 直方图均衡补偿消去图像噪声程序运行后,可得如图1 的对比图像。2. 2 用形态学方法进行图像处理与分析以rice. tif 为图像实例,介绍用形态学方法对灰度图像进行处理与分析的技术要点,即对灰度图像进行如下操作:去除图像的不均匀背景;用设置阈值的方法(thresholding) 将结果图像转换成二值图像;通过成分标记(components labeling) 返回图像中的目标对象属性,并计算目标对象的统计数字特征。其算法步骤描述如下:(1) 用工具箱函数imread 和imshow 读取和显示8 位灰度图,如图2a 。(2) 用形态学开运算(Morphological Opening) 估计背景。通过调用imopen 并对输入图像I 执行形态学开运算, 取半径为15 的圆盘结构元素,且结构元素通过函数strel 建立。形态学开运算有消除不能完全包含在半径为15 的圆盘内的目标对象的作用。注意到图像(如图2b) 中央的背景照度(background illumina2tion) 比底部要亮。(3) 用surf 指令察看背景图像。用Surf 指令创建近似背景的彩色表面图(如图2c) ,使人可以看到在一个矩形区域上的数学函数特征。在表面图中,[0 , 0 ] 表示原点, 或图像左上角,曲面图最高部分表示背景的最亮像素(从而rice. tif 的背景的最亮像素出现在图像中央行的附近,而最暗像素出现在图像的底部) 。(4) 从原图像中减去背景图像。须用图像处理工具箱的图像算术函数imsubtract 产生均匀的背景(如图2d) 。(5) 调节图像对比度。用imadjust 指令增大图像对比度(如图2e) 。imadjust 函数需要一个输入图像且也可带两个矢量: [ low high ] 和[ bottom top ] . 输出图像通过将输入图像中low 值映射到输出图像中的bot2tom 值、high 值映射到输出图像中的top 值,并将low 与high 间的值进行线性缩放而产生。(6) 对图像进行阈值处理。先调用graythresh ,自动计算一个适当的阈值;然后使用graythresh 返回的阈值,调用im2bw 执行阈值处理,将灰度图像转换成二值图像(如图2f) 。(7) 确定图像中的目标对象并予以标记。调用bwlabel 寻找连通成份而且用惟一的数字将他们分类标记。bwlabel 接受一个二值图像和指定各目标对象的连通性的值(4 或8 ,表示4 或8 连通) 作为输入。注意: 结果的准确性依赖于许多因素,包括: 目标对象的大小; 近似背景的准确程度; 是否设定连接3 2 第2 期 何希平等: 基于MATLAB 的图像处理与分析. 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.a 原图b 背景性参数为4 或8 ; 是否任何目标对象均相接(在这种情况下他们可能被标记为同一目标对象) ;在该实例中, rice 的一些谷粒正好相接,因此bwlabel 把它们视为了同一目标对象。(8) 查看标记矩阵。看一看bwlabel 产生的标记的近似形状是有用的。调用imcrop 并用鼠标选择包含某一目标对象的一部分及其一些背景的部分图,则所选部分图的像素值会在MAT2LAB 窗口中返回。若查看上面的结果,你会看到c 背景的表面图d 原图与背景的差一个对象的一角标以某数字标记k ,这意味着它是第k 个被bwlabel 分类的目标对象。imcrop 函数也可带矢量指定剪裁矩形的坐标。在这种情况下,它不执行交互式操作。举例来说,rect = [15 25 10 10 ] ; roi = imcrop (labeled ,rect)这个调用指定一个剪裁矩形的左上角坐标始于(15 ,25) ,而且高度和宽度均为10 。一种查看标记矩阵的好方法是将它显示成e 图像对比度调节结果 f 阈值处理后的二值图一种假彩色索引图像(如图2g) 。在假彩色索引图像中,将标记矩阵中区分每一对象的数字映射成了相关色彩映射矩阵中的一种不同的颜色。当把一个标记矩阵看成一个RGB 图像时,图像中的对象是比较容易区别的。为此, 使用la2bel2rgb 函数。使用该函数时,可以指定色彩映射表,背景颜色,以及标记矩阵中的对象如何映射为色彩映射表中的颜色。(9) 测量图像中的对象属性。regionprops 指令可测量图像中的对象或区域的属性,并返回一g 假彩色标记图h 谷粒大小分布图图2 形态学图像处理的对比分析结果个结构数组。当将其作用于一个图像成分的标记矩阵时,它为每个成分建立一个结构元素,而每一结构元素包含一个标记成分的一些基本属性。regionprops 函数支持对许多不同的属性予以测量, 但是设定属性参数为’basic’旨在返回最常用的三个量: 面积(Area) , 质心或块中心(Centroid) 和边框(BoundingBox) 。边框Bounding2Box 表示能容纳一个区域(所举实例中的谷粒)的最小长方形, 为四元素矢量: [ left top widthheight ] 。(10) 在图像中计算目标对象的统计特性。使用MATLAB 函数max , mean , 和hist 可计算被阈值处理的目标对象的一些统计属性(如图2h) 。图像处理工具箱也有一些统计函数,如mean2 和std2 ,适用于图像数据,因为他们对二维空间的数据返回单一值。下面是算法实现的程序代码:%程序代码:test2. mclear , close all ,I = imread(’rice. tif’); imshow( I) %读取和显示8 位灰度图rice. tif4 2 重庆工商大学学报 (自然科学版) 第20 卷. 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.background = imopen( I ,strel (’disk’,15) ) ; %取半径为15 的圆盘结构元素对图像用开运算估计背景figure ,imshow(background) %显示背景图figure , surf (double (background (1 :8 : end ,1 :8 : end) ) ) ,zlim( [ 0 255 ]) ; %显示背景的彩色表面图,对8 ×8 格点取样set(gca ,’ydir’,’reverse’);I2 = imsubtract ( I ,background) ; figure , imshow( I2) %从原图像中减去背景图像,并显示结果图I3 = imadjust ( I2 , stretchlim( I2) ,[0 1 ]) ;figure , imshow( I3) ; %调节图像对比度,并显示结果图level = graythresh( I3) ;bw = im2bw( I3 ,level) ; figure , imshow(bw) %将灰度图像转换成二值图像[ labeled ,numObjects ] = bwlabel(bw ,4) ; % 成分标记,4 具体指定4 - 连通成分.grain = imcrop (labeled) % 用鼠标选取实现交互式剪裁标记成分的一部分RGB-label = label2rgb(labeled , @spring , ’c’, ’shuffle’); %把一个标记矩阵转换成一个RGB 图像figure ,imshow(RGB-label) ;graindata = regionprops(labeled ,’basic’) %调用regionprops ,为rice 的每一经阈值处理%的谷粒返回一个基本属性的结构。由BoundingBox 的域返回四元素矢量: [ left top width height ]。graindata (51) . Area , graindata(51) .BoundingBox , graindata(51) . Centroidallgrains = [graindata. Area ] %用点号存取graindata 的所有元素的面积域并将该数据存入%新的矢量allgrains。这个步骤简化了对面积量的分析,因为不必使用域名存取面积。max(allgrains) %找最大谷粒的大小。allgrains 中的数据是一维的, 故函数mean 和std 是适用的。biggrain = find(allgrains = = ans) %使用find 指令返回该最大谷粒的成分标记mean(allgrains) %求平均粒径hist (allgrains ,20) %作包含20 个方柱的显示谷粒大小分布的直方图。直方图表明,在rice 图像中谷粒最通常的%大小在300 到400 个像素的范围内(如图2h) 。2. 3 用分水岭分割法检测连通目标在一个图像中检测目标是图像分割的一个例子。为分割连通目标,时常用Watershed 变换。如果把一幅图像看做一个具有山(高亮度) 和低谷(低亮度) 的表面,那么这个变换在一幅图像中找亮度低谷。实现包括下列步骤:(1) 读图像。读入图像afmsurf . tif , 它是一幅原子能显微镜下的衣料表面图像(如图3a) 。(2) 对比度最大化。注意到图像中有许多彼此连通的不同大小的对象。为使通过watershed 变换找到的低谷数目最小,我们使感兴趣的对象的对比度达到最大。对比度增强的一个常用的技术是综合应用top- hat 和bottom - hat 变换。top - hat 变换定义为原图像和它的开之差。图像的开是一与特定结构元素匹配的图像前景部分的集合(如图3b) 。bottom - hat 变换定义为在原图像和它的闭之间的差。图像的闭是一与特定结构元素匹配的图像背景的集合(如图3c) 。通用的结构元素是正方形,长方形,圆盘,菱形,球和线。既然图像中我们感兴趣的目标对象看起来像圆盘,我们用strel 函数建立一个半径为15 个像素的圆盘形结构元素。这个圆盘尺度是图像中的目标对象的平均半径的一个估计。(3) 图像相加减。看到top - hat 图像含有与结构元素匹配的对象的”巅峰”。相反,bottom - hat 图像显示出感兴趣的目标对象之间的间隙。为使目标对象与分隔它们的间隙之间的对比达到最大,用“原图+ top - hat 图像- bottom - hat 图像”得到增强的结果图(如图3d) 。(4) 转换感兴趣的对象。调用watershed 变换找出图像的亮度”低谷”,把imcomplement 函数作用于增强过的图像上,将感兴趣的目标对象转换为亮度低谷,得到增强图的补图(如图3e) 。(5) 检测亮度低谷。对所得补图运用imextendedmin 函数检测低于某特别阈值的所有亮度低谷。imextendedmin 函数的输出是一个二值(逻辑值) 图像(如图3f) 。二值图像中重要的是区域的位置而非区域的大小。用imimposemin 函数把补图改为只含有那些由imextendedmin 函数找到的低谷,并将低谷的像素值变为0 (8 位图像可能的深谷) (如图3g) 。(6) Watershed 分割。通过watershed 变换,可找出来所有含有强加给最小值的区域。用watershed 函数实现Watershed 分割。watershed 函数返回一个标记矩阵,它含有对应于watershed 区域的非负数。凡未落入5 2 第2 期 何希平等: 基于MATLAB 的图像处理与分析. 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.图3 用Watershed 分割法检测连通目标的图像渐近过程任何watershed 区域的像素均被赋予像素值0。用label2rgb把一个标记矩阵变为一幅图像(如图3h) 。(7) 从标记矩阵中抽取目标对象的特征。可用region2props 函数从标记矩阵中抽取特征。比如说,可以计算两个量(面积和方向) 并把他们看成彼此的一个函数。下面给出算法的实现代码:%程序代码:test3. mafm = imread (’afmsurf . tif’); figure , imshow(afm) , title (’surface im2age’);se = strel (’disk’, 15) ;Itop = imtophat (afm , se) ; figure , imshow( Itop , [ ]) , title (’top - hat im2age’);Ibot = imbothat (afm , se) ; figure , imshow( Ibot , [ ]) , title (’bottom - hatimage’);Ienhance = imsubtract (imadd ( Itop , afm) , Ibot) ; figure , imshow( Ien2hance) , title (’original + top - hat - bottom - hat’);Iec = imcomplement ( Ienhance) ; figure , imshow( Iec) , title (’complementof enhanced image’);Iemin = imextendedmin( Iec , 22) ; figure , imshow( Iemin) , title (’extend2ed minima image’);Iimpose = imimposemin ( Iec , Iemin) ; figure , imshow( Iimpose) , title ( ’imposed minima image’);wat = watershed( Iimpose) ;rgb = label2rgb(wat) ; figure , imshow(rgb) ;title (’watershed segmented image’);stats = regionprops (wat , ’Area’, ’Orientation’); area = [ stats ( :) .Area ] ; orient = [ stats( :) . Orientation] ;figure , plot (area , orient , ’b 3 ’); title (’Relationship of Particle Orienta2tion to Area’);xlabel (’particle area (pixels) ’); ylabel (’particle orientation (degrees) ’);参考文献:[1 ] 孙兆林.MATLAB 6. x 图像处理[M] . 北京:清华大学出版社,2002[2 ] 崔屹. 图像处理与分析———数学形态学方法及其应用[M] . 北京:科学出版社,2000[3 ] 张远鹏,董海,周文灵. 计算机图像处理技术基础[M] . 北京:北京大学出版社,1996Image processing and analysis based on MATLABHE Xi - ping1 , ZHANG Qiong - hua2(1. Center of Experiment and Practice ,ChongQing Technology and Business University ,ChongQing 400033 ,China ;2. Library , ChongQing Technology and Business University , ChongQing 400033 ,China)Abstract :This paper first introduces the functions of MATLAB image processing toolbox , then presents sometechniques in image processing and analysis , such as image enhancement by using histogram equalization , image fea2ture extracting and analysis with morphological methods , and objects detection through watershed image segmentation.Key words : grayscale intensity image ; morphological transform; labeling ; segmentation ; feature extraction责任编辑:杨祖彬6 2 重庆工商大学学报 (自然科学版) 第20 卷. 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.收稿日期:2002208224MATLAB 及其在图像处理中的应用许志影,李晋平(中国矿业大学资源学院,江苏徐州 221008)摘要: 介绍了MATLAB 的特点和功能,分析了MATLAB 在图像处理中的应用,并结合实例说明了MATLAB 在图像处理中关键词: MATLAB ; 图像处理; 边缘提取中图分类号: TN911. 73 文献标识码: AMATLAB and Its Application to Digital Image ProcessingXU Zhi2ying ,LI Jin2ping(School of Resource & Geoscience ,China University of Mining and Technology ,Xuzhou 221008 ,China)Abstract :Introduces properties and functions of MATLAB ,and analyses its applications to digital image processing ,finally ,displays the a2bility of MATLAB in image processing with an example.Keywords :MATLAB ;image processing ;edge detectionMATLAB 软件由美国Math Works 公司于1984 年推出,历经十几年的发展和竞争,现已成为( IEEE) 国际公认的最优秀的科技应用软件之一。作为一个跨平台的软件,MATLAB 已推出Unix、Windows 9x/ NT、Linux 和Mac 等十多种操作系统平台下的版本,大大方便了在不同操作系统平台下的研究工作。目前基于Windows 系统的最新版本已上升到MATLAB6. 5 ,它继承了以往版本的优点,非常容易使用。现在,MATLAB 已经发展成为一个系列产品:MATLAB 主包和各种工具箱(TOOLBOX) 。目前已经推出了30 多个工具箱,这些工具箱可分为两大类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能、图示建模仿真功能、文字处理功能以及硬件实时交互功能,能用于多种学科。而学科性工具箱是专业比较强的,如控制工具箱、信号处理工具箱、图像处理工具箱和小波工具箱等多个学科的专业工具箱。借助于这些工具箱,各个层次的研究人员就可方便地进行研究工作,提高工作效率。本文将简要介绍MATLAB6. 5 及其在图像处理中的应用,希望对从事图像处理工作的研究人员有所帮助。1 MATLAB 概述MATLAB 最初是作为矩阵实验室(Matrix Labora2tory) 用来提供通往LINPACK和EISPACK矩阵软件包接口的。后来,它逐渐发展成为通用科技计算和图视交互系统的程序语言,其数据的基本单元是矩阵。它的指令表达与数学、工程中常用的习惯形式十分相似,从而使许多用C 或Fortran 实现起来十分复杂和费时的问题用MATLAB 就可以轻松地解决。MAT2LAB 的典型应用包括:数学计算、算法研究、数据分析和计算结果可视化、建模与仿真等。1. 1 MATLAB的特点MATLAB 有三大特点:一是功能强大。主要包括数值计算和符号计算、计算结果和编程可视化、数学和文字统一处理、离线和在线计算。二是界面友好,编程效率高。MATLAB 是一种以矩阵为基本单元的可视化程序设计语言,语法结构简单,数据类型单一,指令表达与标准教科书的数学表达式相近。三是开放性强。MATLAB 有很好的可扩充性,可以把它当成一种更高级的语言去使用。使用它很容易编写各种通用或专用应用程序。1. 2 MATLAB的主要功能MATLAB 之所以成为世界顶级的科学计算与数学应用软件,是因为它随着版本的升级与不断完善而具有愈来愈强大的功能。
1 基于形态学运算的星空图像分割 主要内容: 在获取星图像的过程中,由于某些因素的影响,获得的星图像存在噪声,而且星图像的背景经常是不均匀的,为星图像的分割造成了极大的困难。膨胀和腐蚀是形态学的两个基本运算。用形态学运算对星图像进行处理,补偿不均匀的星图像背景,然后进行星图像的阈值分割。 要求: 1> 图像预处理:对原始星空图像进行滤波去噪处理; 2> 对去噪后的图像进行形态学运算处理; 3> 选取自适应阈值对形态学运算处理后的图像进行二值化; 4> 显示每步处理后的图像; 5> 对经过形态学处理后再阈值的图像和未作形态学处理后再阈值的图像进行对比分析。 待分割图像 直接分割图像 处理后的分割图像 2 基于数字图像处理的印刷电路板智能检测方法 主要内容: 通过对由相机实时获取的印刷电路板图像进行焊盘识别,从而提高电子元件的贴片质量,有效提高电路板的印刷效率。 要求: 1> 图像预处理:将原始彩色印刷电路板图像转成灰度图像,对灰度图像进行背景平滑和滤波去噪; 2> 对去噪后的图像进行图像增强处理,增强边缘提取的效果。 3> 对增强后的图像进行边缘提取(至少两种以上的边缘提取算法); 4> 显示每步处理后的图像(原始电路板图像可自行查找); 5> 图像处理后要求能对每个焊盘进行边缘提取,边缘清晰。