国外机器视觉识别研究现状论文

发布时间：2023-12-07 16:05:52

国外机器视觉识别研究现状论文

在国外，机器视觉的应用普及主要体现在半导体及电子行业，其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路：各类生产印刷电路板组装技术、设备；单、双面、多层线路板，覆铜板及所需的材料及辅料；辅助设施以及耗材、油墨、药水药剂、配件；电子封装技术与设备；丝网印刷设备及丝网周边材料等。SMT表面贴装：SMT工艺与设备、焊接设备、测试仪器、返修设备及各种辅助工具及配件、SMT材料、贴片剂、胶粘剂、焊剂、焊料及防氧化油、焊膏、清洗剂等；再流焊机、波峰焊机及自动化生产线设备。电子生产加工设备：电子元件制造设备、半导体及集成电路制造设备、元器件成型设备、电子工模具。机器视觉系统还在质量检测的各个方面已经得到了广泛的应用，并且其产品在应用中占据着举足轻重的地位。除此之外，机器视觉还用于其他各个领域。2000年来，零售商和消费者对可导致健康风险或增加零售商成本的不合格产品越来越没有忍耐力。如果视觉检测机制正确执行和管理，就可成为强大的工具用于：-保护制造商、零售商和消费者的利益，不会出现贴错标签和无法识别过敏原标签的包装-有助于保护品牌声誉-遵守行业最佳实践指南和零售商标准研究显示，65%的消费者在购买产品时会参考包装。如果包装贴错标签或标签被损坏，隐藏潜在的有害成分，这会导致产品召回、罚款、甚至是法律诉讼。有调查表明食品行业中55%的召回都是由不正确的标签所导致的，食品过敏原就是一个十分普遍的例子。视觉检测是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。自起步发展至今，已经有20多年的历史，其功能以及应用范围随着工业自动化的发展逐渐完善和推广，其中特别是目前的数字图像传感器、CMOS和CCD摄像机、DSP、FPGA、ARM等嵌入式技术、图像处理和模式识别等技术的快速发展，大大地推动了机器视觉的发展。简而言之，机器视觉解决方案就是利用机器代替人眼来作各种测量和判断。

国外视觉形象设计研究现状论文

我国：我国越来越多的企业在媒体上征集企业标志，公告VI工程招标VI设计已经成为一个固定的“形象工程建设”，成为企业战略的重要组成部份。但是长期以来，国内对VI设计过于呆板和程序化。有人认为做VI，只要标志设计出来工作就完成了一半，很多公司的VI设计手册除了标志和一些基本元素不同以外，应用部分千篇一律，很多都是单调的延续和重复，缺乏个性和新意。造成了标志的孤立更割裂了VI各个要素的相互作用。国外：国际上对现代VI设计形式不是对形式考虑的结果，而是考虑如何解决问题、如何满足大众基本生活需要的形式。德国VI设计师更多考虑的是设计和人的物理关系；北欧的现代VI设计却十分注意人的心理感受，欧洲的VI设计先由理念切入，然后有明确的设计目标；美国的VI设计起源于商业，加之没有社会意识形态为依据，曾经一度跟着市场走，但是它以雄厚的经济实力兼收并蓄、容纳各种积极因素，令自己的设计很快就取得了领先的地位。

当代艺术其实就是要研究特定文化背景下的文化现象,而当代艺术本身就是一种需要深究的文化艺术现象。下面是我为大家整理的视觉艺术研究论文，供大家参考。

【摘要】符号学(semiotics)在其中主要涉及到将人们在视觉感官和心理体验上感知到的对象以点、线、面、体、光、色的方式进行拟造、组合加以运用,然后再在对象视觉中通过转换再生的思维过程。在广义上,我们可以将艺术作品中的象征图象,以及艺术作品本身都理解为符号。

【关键词】视觉艺术;符号;转换;再生

著名符号学家安伯托?艾柯(Umberto Eco)说:“人是符号(sign)的动物。”1人类籍由符号来表达内心世界,传递信息。将日常所思通过一定的语言形式,包括声音、视觉、肢体行为将一个整合的概念传达给对方。符号学(Semiotics)是一种关于符号和运用符号,包括观看符号的理论。符号学并不是一种历史性的学科,而是一种阐释性的学科,但它能够在历史的探索中被加以有效地整合。符号学集中关注构成和表征的问题,将“文本”看作是产生意义的符号的特定合成。这是一种不带霸权和强制要求的有限度的视角。2

艺术的起源不论从模仿说、巫术说、劳动说的角度出发我们都可以看作是人类符号化的开始。原始人用肢体捕捉动物的动作,用声音模仿动物的鸣叫,用矿物质将动物的形态描绘在崖壁上,手舞足蹈用简单的语言交流,于是就有了最初的舞蹈符号、音乐符号、美术符号、语言符号。随着社会分工的日益复杂化,人类社会不断进步与发展,符号内容也就变得越来越复杂化、微妙化,同时也在自然科学、人文科学和社会科学各个不同的领域得到了广泛深入的运用。

视觉艺术作为一门研究经由肉眼产生联想的人文科学,符号学(semiotics)在其中主要涉及到将人们在视觉感官和心理体验上感知到的对象以点、线、面、体、光、色的方式进行拟造、组合加以运用,然后再在对象视觉中通过转换再生的思维过程。在广义上,我们可以将艺术作品中的象征图象,以及艺术作品本身都理解为符号。作为一套工具,符号学提供一系列我发现可以深入细致分析艺术作品的有用思想和观念。当这些思想和观念可能由心理分析、叙述和修饰理论引发产生时,它们就产生与传统艺术史并不发生矛盾的洞察力。事实上,这些思想和观念常常能够使学生在运用主体间的可使用的方法上更为精确,并使阐释更具有系统性。3

一、视觉艺术符号的分类

在符号与其所指涉的对象(即其指向与涉及的事物和领域)的关联上,目前在符号理论研究领域普遍认为可以将符号区分出以下三种不同的类型,同时也是符号的三个层次:4

1、图象符号(ICON):图象符号是通过模拟图形与对象之间的相似而构成的,图象符号是一个直接感知的过程,在图象学中属于写实的范畴。如肖像画、照片等,当我们面对这样的作品的时候通常都能够得到比较直观的感受,比如说“画面上有什么内容。”

2、指示符号(INDEX):指示符号与所指涉的对象之间具有的因果或是时空上的关联。如“指示牌、路标”。从广泛的角度来说,设计艺术中的视觉流程法则也属于指示性符号的范畴,由于生理的特点,眼睛在浏览的时候会表现出一种时间性、方向性与选择性,也就是说视线会沿着画面重心,即最佳视域,向某一个方向有选择性的移动,体现出视觉的流动性特征。

3、象征符号(SYMBOL):象征符号与所指涉对象之间无必然的或是内在的联系,通常是指约定束成的结果,它所指涉的对象以及有关意义的获得,是由长时间多个人的感受所产生的联想集合而来。同时符号的象征性也是是符号学里最深层次的特性,是符号产生与对象思维过程中相关内涵的延伸以及联想。比如线条的曲折、色彩的冷暖、材质的软硬都会给人以相应的情感体验。

二、视觉艺术符号的理解

人类的意识过程,其实是一个将世界符号化的过程,思维无非是对符号的一种挑选、组合、转换、再生的操作过程。因此可以说,人是用符号来思维的,符号是思维的主体。那么我们又如何从符号学的视角和运用符号学的工具去解读图像,符号如何能够使我们从我们已经认知的事物中疏离出来,以便理解某些新的事物?在这里,我想就当代油画家张小刚的作品《男青年》按照符号学的原理进行分析。

张晓刚《男青年》布面油画

1、生成图象意识

要对视觉符号进行阐释有时候是一个非常复杂的过程,需要结合上心理学的以及历史学的概念进行理解。

当我们在欣赏一件视觉艺术作品时,我们首先会在思维中形成一个表象,即作品中有什么内容,是具象符号还是抽象的符号。如,当我们在接触到当代油画家张小刚的作品《男青年》时,首先意识到的是一个男青年,带着眼镜,脸上一块红色的疤,灰蓝色的调子,一块红色的疤痕这些图象性的符号。 2、探询图象的象征性意义

得到以上信息后我们接下来会想知道隐藏在艺术家(即符号创作者)创作意图中的“更深层次的”,或派生出的意义。如果我们说一件作品具有一种更深层的意义,我们通常指的是作品传达了一种我们在最初观察中还无法确定的潜在的观念,以即是符号的象征意义。当然需要找到艺术家的意图我们必须对艺术家本人以及他所处的时代背景有一个基本了解。

我们现在就来试着探询阐释艺术家想要传达的观念信息。我们知道张小刚出生在上个世纪50年代末期,他经历了新中国成立后最动荡的历史时期,特别是“”在他们那个年代的人身上都产生了深远的影响。

那么现在我们回到画面(符号)本身,留着小平头的男青年,干净白皙的肌肤,一幅标准文弱书生的派头。我们知道眼镜是有知识、有文化的人的象征,中山装是那个年代的通用着装。灰兰色的背景衬托阴郁、孤独与冷漠的气氛。面颊上被生生揭开的一块,形状如肩章的伤疤显得尤其冷艳。结合上面的分析,我们也可以将它理解为那个热情火红时代的鲜红烙印。目光被吸引到左下角,略显呆滞,嘴唇微启似在观看一个什么令人震惊的场面,又面无表情,一种孤寂、压抑的情感得到充分的表现。所有的一切符号都在追忆一个时代的伤痕主题,这除了是一种回忆,同时也折射了现实社会人与人之间的冷漠。

视觉艺术符号的创作者在产生一个理念之后,综合自己对象征性符号的理解把握,选择合适恰当的视觉手段,将理念传达出来。然后接收对象即观众再通过自己对象征语言的掌握与理解,把接收到的视觉信息在思维中转换再生。(下转第99页)(上接第98页)当然,鉴于个体情感特质、生活经验、知识结构的差异,一件作品最终还原到观众思维中的形态是各有不同的,所以有了“一千个读者便有一千个哈姆雷特”之说。当一个人看见一幅绘画,表现的是关于一只果盘的荷兰静物画时,这个图像在其他的事物中)就是关于某种别的事物一个符号,或表征。观看者在她或他的脑海中形成有关该事物的一个意象,她或他就会把这个意象与该事物联系起来。心理的意象,而不是形成这个意象的个人,就是解释符。这个解释符指向一个客体。该客体对每一个观看者来说是不同的:对一个人来说它可以是真实的水果,而对另一个人来说也可以是别的静物画,对第三个人来说可以是一笔巨款,而对第四个人来说也可以是“17世纪的荷兰”,等等。而该绘画所表现的客体因此基本上是主观的和由接受者决定的。

视觉艺术本身就是关于符号的表达方式,创作者借由它向观者传达自身的思维过程与结论,达到叙述的目的;换言之,观者也正是通过创作者的作品,与自身经验加以印证,最终了解创作者所希望表达的思想感情。显而易见,作为中间媒体的视觉艺术作品,这时就充当着创作者思想感情符号,而这个符号所需表达的信息是否可以被观者准确的、快速的、有效的接受与认知,就成了创作作品成功与否的标志。这正是由创作者在创作的思维过程中对符号的挑选、组合、转换、再生把握的准确有效程度所决定的。

参考文献

[1]李幼燕著《理论符号学导论》,社会科学文献出版社,1999年6月版。

[2]米克·巴尔:《观看符号/解读绘画——运用符号学理解视觉艺术》载于《世界美术》2007年第1期。

[3]巴尔·布列逊:《符号学与艺术史》1991年。

[4]常宁生《艺术史的图象学方法及其运用》载于《世界美术》2004年第一期。

内容摘要：一部视觉艺术史的发展史也就是色彩的发展史。从上古的色彩崇拜到古典时期的色彩模仿，从浪漫主义时期对色彩的解放到印象主义对光和色的迷恋，在艺术史上，每一次对色彩的再认识和再阐释，总会引起视觉艺术的巨大变革，从而产生新的视觉艺术现象和理论话语。

关键词：色彩随类赋彩固有色民间色彩光印象

所谓色彩，在普遍意义上讲是人对色彩的感觉。对色彩的爱好和对色彩的选择，具有极大的主观性，所以不应把某种色彩标准绝对化，应承认多样的和发展着的色彩标准，从不断变动的色彩观中认识它们各自的特点，研究它们各自的异同之处，把握它们的内在联系，从而在色彩世界中达到“万物皆备于我”，而不是被束缚在一个狭隘的范围之内。偏爱是容许的，但偏执和偏见却无益于艺术的发展。

固有色——永恒美丽的理想色彩

太古之民把色彩作为一种手段，其目的在于将描画对象从背景中显现出来，即从空间背景中分离出物象，所以他们只认识红和黑，因为红色最引人注目，黑色与亮底色对比最大，因而在他们看来红是美的，黑也是美的，所以红黑搭配是美的。诉诸于艺术表现，他们将自然的一切色彩通归结为红与黑。河姆渡新石器时代的木器即以红、黑为装饰;世界各地的彩陶以红、黑为装饰;原始的洞窟壁画大都采用红黑二色……对黑红配置的喜好沿袭至今，这在一些民族的服饰中表现尤为典型，中国的藏族服装、彝族服装等都以红色为主色。

人在实践中丰富了感觉，增加了对外在事物的认识，并且在早期艺术活动中抓住物象永恒的、持久的固有色，寻求它们在空间的恰当联系。这样，人们发现了色彩的静态美，这样便有了对色彩永恒价值的追求，有了固有色的理念。

艺术离不开模仿，德谟克利特和亚里士多德都认为，艺术的力量就是模仿。达·芬奇甚至说：“……假如你在用自己的艺术模仿自然界所产生的形式的全部特质时不是一个万能大师，那么你就不能成为一个好画家。”固有色的色彩观正是产生于对自然的永恒和凝固的色彩美的模仿。

固有色观念曾长期主导美术创作，在西方，文艺复兴的作品最具代表性。在中国可以举出唐代人物、宋代花鸟和许多杰出的民间艺术作品。他们在固有色的表现和色块空间安排上都达到了极高的成就。运用固有色的经验可概括为以下几个方面：

一、色彩配伍。例如文艺复兴大师常采用的玫瑰红、天蓝、银灰，中国民间艺术常采用的朱红、群青、大红、石绿、金黄，这些色彩配伍具有对立统一的美。

二、色彩衔接。中国民间口诀有“工间绿，花簇簇;青问紫，不如死”等等。固有色的不同衔接方式会形成千变万化的色彩观感。

三、纯度对比。这种对比是调整色彩间相对关系的重要手段，其强弱得体，宾主分明，达到色彩在空间中的力度平衡。

四、明度对比。在二维平面上制造三维效果，所用手段就是明暗对比，精到独特的明暗对比不仅使图像具有立体感，还使画面具有了厚重感。

五、面积对比。面积对比更使色彩在体量上有轻重之变，在空间上有互补之美，从而产生鲜明的色彩节奏。

从远古起，艺术的移情说就伴随着模仿说，固有色为模仿自然来服务的同时，也还有浪漫主义的表现一路，他们不以模仿为补色目的，却以“画画无正经好看就中”为旨归。他们抽出固有色的单纯性、凝固性，以固有色的空间平衡为手段，驱便于工作色彩率意为之，以求理想的色彩效果，如苗族刺绣、民间剪纸、蔚县剪纸、绵竹门神就是以固有色观念而作浪漫派处理的色彩典范。

光印象——瞬息即逝的自然色彩

光学发现了色的物理本性，揭露了色与光的内在联系及色光的分解与混合现象;生理学发现了人类的色觉的本质，从而得以了解色衰与补色的关系，全色要求的基础。这些发现给艺术色彩学以伟大启发，由此而产生了印象派色彩观。于是画家用色追寻光，追寻光的颤动、光的流逝、光的迷离恍惚，从固有色的永恒和凝固中走出来，走向空间和时间的流动，得到的是瞬息即逝的光印象。

可以说，印象主义的色彩观和色彩技法，既是光学成就的产物，也是西方艺术传统的产物。只是这些传统到了印象派画家那里更系统化、理论化了，并且以此确立了它在艺术史中的地位。印象主义认为色即是光，因此：

一、凡视觉可感受的物象都是光照射的结果，凡有光必有色，物的色决定于光源色、环境色(反射色)和色彩间的对比。即色彩随光源和环境而变，并且在画面上是相对而存在的。

二、以日光光谱色代替古典的调色板。

三、追求光谱的金色效果，并往往引用光谱的色彩组合。

四、补色关系对于印象主义画家是不可或缺的手段。例如在大自然中日光与天穹光便是一对天然补色。

五、以光的混合代替颜料混合，因而采取色彩细碎分割和并置的手法，使色彩更加“响亮”。

六、在色彩并置时常施以明度相近的，非准确的冷暖并置。这就是同时对比的手法。此时相同的色各自将对方推向自己的补色，以增强双方的色价，同时各自失去稳定性，而获得光的颤动性，呈现一种有生气的活力，于是达到色的非物质化，成为颤动的光。歌德曾经说过：“同时对比决定了色彩美学的实用价值。”

印象主义使色从其所联结的物体中解放出来，排除物的固有色，由此绘画进入一个新的境界。印象派是光的崇拜者，光的虔诚宣教者，他们开启了一个灿烂的世界，但是他们追随光的同时却失去了艺术曾经具有的精神力量和阐明世界的象征内容而停留于事物的物质表层。

表现色——回到主观的现代色彩

实践表明，获得光的华丽外衣，是以牺牲质的内在精神为代价的，这个矛盾在技巧上直接表现为素描与色彩的矛盾，当表现特别需要素描的时候，色光的变幻不能不退居次要地位。古典主义，新古典主义，拉斐尔前派便是这样;当表现特别注重色光的时候，素描不得不退居次要地位，印象派便是如此。毕萨罗教导青年画家勒贝尔说：“多注意形体的色彩，而不要太看重于素描刻划，太准确的素描索然无味，而且不能给人以整体印象……”这正是印象主义者在素描和色彩之间的取舍。

雷诺阿在他的印象主义实验取得非凡成功的同时感到印象主义的危机，于是游意大利向前辈大师学习，他拜倒于拉斐尔画前，并高度赞赏安格尔油画的单纯宏伟。他研究了拉斐尔之后终于感到自己忽略了素描，从意大利归来后，他致力于牺牲色彩以使形体单纯化，加强素描，回到古典的作画方法，取消画面偶然的光，于是他开始了自己的“古典时期”。他的作品“伞”和他在那不勒斯所画的裸女就是开始回归古典和固有色观的记录。

印象派之后诸家正是看到了印象主义色彩观局限于表面的光色变化而忽略其不变的内部结构，所以他们走上了与印象主义相反的道路。首先是塞尚，这位现代艺术的开山者力排事物的闪动模糊的外表，致力于表达所谓不变的真实和内在的结构。就色彩而论，塞尚不同于印象主义的是使之色彩秩序化，经过组织，使色彩变得更规则，更简练，但更强烈，因此更具有安定感、明晰感，从而达成视觉形象的非同寻常的强度。他的艺术观和他的艺术实践深刻地影响了其后的画家，如马蒂斯由塞尚得到启发，抛弃印象派画家的“魅力、光亮和明快”，追求绘画的“稳固性”，认为在一切构成画面的色彩中必须建立一个平衡，因此表面的感觉必须加以提炼，正是提炼了的感觉构成画面。康定斯基说：“内在因素，即感情必须存在，否则艺术作品便是赝品。内在因素决定画面的形式。”毕加索概括说：“我不是模仿自然，而是面临自然——并且利用自然。”塞尚之后诸家竞相与印象主义的客观主义反其道而行之，强调主观意志的作用，因此着意于形式美、抽象美的追求，走向表现主观。在色彩上自然同时从客观色彩走向主观色彩了。

但是现代主义是接过印象主义的手中武器而走向其对立面的，印象主义发现了自然的色彩，现代主义将这些发现秩序化、凝固化、强力化。或者说印象主义捕捉感性的色彩，现代主义挖掘理性的色彩，现代艺术将色彩的主观性及其精神价值提到了前所未有的地位，并且完善于主观的个人感情与客观的色彩规律之结合。

参考文献：

[1]《意大利艺苑名人传》，(意大利)乔尔乔·瓦萨里著，刘耀春译，湖北美术出版社，2003年版

[2]《现代美学体系》，叶朗主编，北京大学出版社，1988年版

[3]《楚艺术史》，皮道坚著，湖北教育出版社，1995年版

[4]《境外谈美》，陈望衡著，花山文艺出版社， 2003年版

[5]《楚史》，张正明著，湖北教育出版社，1995年版

[6]《诗学》，亚里士多德著，人民文学出版社，1982年版

[7]《古画品录》，谢赫著，迪志文化出版有限公司，2001年版

[8]《意大利文艺复兴美术》，徐庆平著，中国人民大学出版社，2004年版

[9]《印象主义》，马凤林著，湖北美术出版社，2005年版

浅谈视觉艺术研究论文相关文章：

1. 浅谈摄影的艺术论文

2. 艺术设计中的视觉形象设计及其重要性研究论文

3. 浅谈平面艺术设计论文

4. 浅谈高校艺术教育论文

5. 浅谈公共艺术毕业论文

视觉传达学术论文篇二视觉经验与视觉传达设计 [摘要]观者的视觉经验对视觉信息的准确传达起着重要的作用。设计者应根据观者的视觉经验充分调动其视觉心理的能动反应,使其“所看”与“所知”同时发生感觉,从而积极主动地参与到设计作品的理解和感悟之中,让观者通过欣赏与设计者的审美体验相沟通,以此达到信息传达的目的。 [关键词]视觉传达;视觉经验;视觉心理在现代设计中,视觉传达设计的主要功能是调动所有平面的因素,达到视觉传达准确的目的,同时给观众以视觉心理满足。当今,视觉传达的方式变得越来越复杂和发达,设计师在视觉传达设计中,应充分考虑受众群体的视觉心理,清醒地认识到信息接受者不是机械的、被动的受纳器,而是一个具有积极主动的内驱力的主体,只有在充分理解和掌握有关视觉心理的知识之后,才能更好地在更大的范围内发挥各种现代制作技术的优势。其中,观者的视觉经验对视觉信息的准确传达起着重要的作用。设计者应根据观者的视觉经验充分调动观者视觉心理的能动反应,使其“所看”与“所知”同时发生感觉,从而积极主动地参与到设计作品的理解和感悟之中,让观者通过欣赏与设计者的审美体验相沟通,以此来达到信息传达的目的。一、视知觉与视觉经验视知觉有时会受到视觉生理机能和生活文化经验积淀的同时作用。人的感觉并非先天固有的功能,没有体验过的东西可能无法感受到,而丰富的生活经验又有可能使某种感觉功能格外发达。视觉所感受到的不仅是眼前所见的信息,过去积累的信息也会参与影响。而且,由于生活环境、视觉经验、生活体验及专业知识的不同,对同一形式的认知会出现差异,这种差异来自生活和社会 ,与先天的个性差异有所不同。正如阿恩海姆在《艺术与视知觉》一书中指出:“眼前所得到的经验,从来都不是凭空出现的,它是从一个人毕生所获取的无数经验当中发展出来的最新经验。因此,新的经验图式,总是与过去所知觉到的各种形状的记忆痕迹相联系。” 1.生理机能上的视觉体验英国著名的视觉心理学家格利高里告诉我们:“对物体的视觉包含了许多信息来源。这些信息来源超出了我们注视一个物体时眼睛所接受的信息。它通常包括由过去经验所产生的对物体的认识。这种经验不限于视觉,可能还包括其他感觉。例如触觉、味觉、嗅觉,或者还有温度觉和痛觉。”由于生活经验的参与,视知觉还具有一种能动作用,“知觉不是简单的被刺激模式觉得的,而是对有效的资料能动地寻找最好的解释”。我们能从倒立的金字塔形上“看出”不稳定感,是来自对实物的印象。我们有了在斜面上的物体会滑落的生活经验,才能在看斜线时感觉到动感。在色彩构成中,白色分量“轻”,黑色分量“重”,红色使人兴奋、刺激,蓝色给人以沉静感,这些感觉同生活中对实物的感受经验也是大致吻合的。再如,我们能从以频闪式样制造的霓虹灯广告牌上看到字母、图案、花边等不停地移动,但实际上仅仅是灯光的时亮时灭,它们自身并没有运动。由于灯光迅速地相继在相距不太远的位置上出现时,会在人们的大脑皮层中产生某种生理短路,神经兴奋就从一个点迅速传向另一个点,与这样一个生理过程相对应的心理经验就是我们看到的同一个光点的位移。正如鲁道夫·阿恩海姆所说:“我们在不动的式样中感受到的‘运动’,就是大脑在对知觉刺激进行组织时激起的生理活动的心理对应物。这种运动性质就是视觉经验的性质,或者说,它与视觉经验密不可分……事实上,一切视觉现实都是视觉的活动造成的。只有视觉的活动,才能赋予视觉对象以表现性,也只有具有表现性的视觉对象,才可能成为艺术创造的媒介。” 因此,在视知觉的能动反应中,有着生理机能基础,虽有智性的成分,但又不同于理性判断。由于感知与经验上的相通,这种“所看”与“所知”同时发生感觉,密不可分。 2.文化经验的视觉体验 (1)个人文化经验的视觉体验。人的感觉能力一部分是先天的功能,也有一部分来自生活的体验和积累。不同的阅历和体验会导致感觉上的差异,专业素质的差别也会影响艺术感受。人们在观看理解物体时,并不满足于把看到的东西“组织”成一种视觉意象,还要进一步把这个直接看到的形象与另一个形象联系起来。由于很多视象都是模棱两可的,可以按照各种不同的结构式样对其加以组织,所以在生活中就会出现有趣的现象:专家和外行人会看到不同的东西,不同的专家从中看到的东西也不相同。例如,美术中的三维空间感来源于生活与专业训练,没有受过美术专业训练的人,不可能在石膏像上看出诸多的“素描关系”。对于红色,观者会联想到革命或恐怖暴力,还有喜庆,这都取决于观者的阅历与体验。“只要头脑中预先形成了所观察目标的意象,不管在多么复杂变换的形状中,都能够将这些意象认出来,知觉对象能从以往的视觉经验中得到填充或补足。” 同样的道理,设计中各种不同的表现形式也不可能让所有的人都有所感悟,对于同一设计作品,感受会有简单与丰富之分,体会也会有高下之别。一个人的现时观察,总会受到以往所见、所闻、所知的影响,积累越多,感受就越丰富。这种潜在的经验图式对观察的影响,在设计活动中同样无时、无处不在。熟悉几何抽象画家蒙德里安绘画的观者一眼就能从服装设计大师依夫·圣·洛朗设计的时装中看出两者之间的联系,而不了解蒙德里安画风的观者则可能只是将它看成大格子式样。过去的视知觉经验和知识修养有助于人们正确地观察面前的对象,也可以妨碍正确地观察,这取决于观者视知觉经验和知识修养的正确程度及水平高低,还有他们与观察对象的关系如何。 (2)集体文化经验的视觉体验。在人的视觉心理中具备一种推论倾向,可以使不连贯的、有缺口的图形尽可能在视觉心理上得到弥补,格式塔心理学家称之为视知觉的“完结效应”。能否在视觉的“完结效应”中正确地“填补空白”是与观者的阅历、感悟、想象有关系的。大量事实表明,对色彩、形状的把握能力会随着观看者所在的物种、文化集团和受训练的不同而不同。这就是说,一个集团能理解的,另一个集团的成员就可能无法理解、把握、比较和记住它们。观者对对象越熟悉,填补的空白就越准确。正如贡布里希所说:“由于我们是生活在一个熟悉的环境中,我们见到的事物总是与我们的预期相符,所以视觉的节省也就越来越增加了。”对此, 社会学家BenedictAnderson也提出了“想象的共同体”这一概念,他认为现代民族国家的形成,源自在地球上不同地方的人类对身为一个命运共同体的集体想象。系统的印刷语言、普及的新媒介(主要是报纸)以及共同的“受难经验”,乃促成“想象共同体”的要素。不经意间,我们的脑海中早已先入为主地为许多未曾谋面的事物定了性,想当然地认为它理应如此。这样一种知觉,其直感性是非常强的,它不是在一件物体和它的用处之间作某种联想,也不是对于某种东西的实际用途的理解,而是对一件因未经实际使用而看不到其功能的物体在视知觉中的直接“补足”或“完结”。在视觉传达中,任何一种图形或符号的意义都会随着时间和地区的变化而变化。博厄斯在其《原始艺术》中提到:不同部落的美洲印地安人所赋予的某些基本图案的各种意义在很大程度上取决于他们不同的文化背景。文化背景的变化会引起人们对纹样的意义作出不同的解释,这种不同的解释反过来又会作用于纹样,使纹样发生进一步的变化。例如, 中国古人素来喜欢莲花,它象征着高洁,出污泥而不染,尤其深得中国文人的喜爱。在佛教传入中国后,莲花更成了清净、圣洁、吉祥的象征,成为吉祥纹样“暗八宝”之一,各种艺术品中到处可以看到莲花的图案,与佛教有关的建筑和建筑物的柱、柱础、砖、瓦等也都有用莲花作纹饰的。而在日本,莲花的意义却大相径庭,它是祭奠的象征。基于这一点,设计师应充分考虑到观者所属集团的文化背景,在设计内容和对象的选择上应具有针对性,否则将导致观者视觉经验的认识混乱。二、视觉经验与视觉传达对象好的设计作品需要知己知彼。所谓知己,就是有从视觉主体方面了解人的视觉功能、研究感知过程的真实状态;所谓知彼,就是从视觉的对象方面认识形式的相对关系。对设计而言,不仅仅是解决传播方式和传播速度问题 ,更重要的是要传播有效的信息。传播有效、准确、可靠的信息是设计信息传播的首要法则,它是设计成功的重要保证。传播的对象是人和人群结构而成的受众群体。设计元素是否能引起观者视觉经验的共鸣,取决于刺激物的结构所拥有的力量与它唤起的有关记忆痕迹的力量相互作用的结果。在视觉传达中,设计是以单一的或连续的作品形式与受众进行对话,如何选择对话的焦点是传播成功与否的关键。观众通过与设计作品的接触(视感、听感、动感等途径),接受某种信息,随即他会以自己的生活经验和审美经验、以社会公众的标准、以生活本身作参照来检验这信息,从而对它作出准确与否、可靠与否的判断,决定是否接受该设计信息,并且以自己的态度影响身边的人们对该设计信息的态度。因而,将视觉传达设计的视觉表现置于特定文化背景中来感染受众的精神世界的确是一个不错的选择。我们可以将东西方文化做一个比较。由于地域环境和人文环境不同,所以东西方形成了不同的文化价值观和不同的心理结构与审美心理,这种差异在视觉传达设计中有突出的表现。例如:中国人有对万物祈福的心理,并由此形成了特有的吉祥文化,希望事物朝着美好的方向发展 ,标志设计中有吉祥的寓意就容易被受众接受。中国联通公司的标志设计(见图?)就是针对人们吉祥如意的心理期待,标志中的“中国红”是蕴含着中国人几千年情结的颜色,无形中又增加了企业形象的亲和力,进一步拉近了与观者的距离。联通标志还采用中国古代盘长纹样的“同心结”图案,造型中的四个方形有四通八达、事事如意之意;六个圆形有路路相通、处处顺畅之意;标志中的十个空穴则有圆圆满满、十全十美之意。总之,无论从对称性还是偶数的讲究来说,该图案都洋溢着古老东方民族流传已久的吉祥气息。正是基于对中国吉祥文化的认同,我们才拥有了许多喜闻乐见的、充满吉祥意味的晶牌名称,如恒源祥、金利来、金六福、万利达、永乐、旺旺、福满多等。同样,外国品牌进入中国市场也要入乡随俗,进行语言文字的文化适应,品牌的翻译要符合中国人的心理,如可口可乐、百事可乐、喜来登、吉百利、都乐等正是注意了这一点。当然,中国的吉祥用语包含着特定的民族文化内涵,在中国乃至全世界的华人圈内是老少皆知的,不需做过多的解释大家都心领神会。而其他文化背景的人们却因为风俗习惯、宗教信仰、思维方式等方面的不同,对事物的联想就会有很大差异,因此中国的某些吉祥物在一些西方国家就会引起误读。如白象、金龙、孔雀、喜鹊等品牌在国外就缺乏认同基础,这是由于白象在英美国家被视为中看不中用的东西,龙在西方许多国家被视为恶魔与灾难的化身,孔雀在英、德、法等国被视为淫祸之鸟,喜鹊在英语里是指爱唠叨、饶舌的人,所以凡是出口商品用象、龙、孔雀、喜鹊等作为商标名称的都要音译或做其他处理,从而避免引起观者的误解与反感。相同的视觉符号放在不同的文化背景中,它所表达的意思也不同,只有当知道在特定文化背景或特定阶段里使用的普通平凡的习俗化的程式时,人们才能把视觉符号的信息译释出来。如十字图形,在宗教中象征着上帝,在医疗中表示看护和更深层次的人类救护之爱,在数字中则理解为数据运用的加号。因此,设计者在为国际流通的商品设计时,要注意各地审美观念和价值观念的差异性,切忌把本国消费者的审美偏好和价值观念强加给目标市场国的消费者,以免造成沟通障碍。在相同的文化背景和地理环境下,民族化、地域化的图形语言是人们了解和熟悉的,不需要任何解释,便于直接解读。设计师可用一种同构的思维方式,将图形语言折射到另一种与其有着某种联系的相通之处的事物上,并造成一种心理暗示,引导人们去联想、想象。心理预设因素显示,人的理解活动发生之前,存在某种根据生活经验而形成的心理期待,它事先设定了理解对象的应有面貌,这种心理定势常常在审视符号时将理解重心导向理解者本人所期待的方向。如,熟悉中国传统文化的观者,能很容易地从图2中领悟出书法、太极、砚台、篆刻、碑拓、章法之间的玄妙。当然,视觉传达设计在体现民族化、地域化的同时,还应利用传统的、地域的图形语言优势来表现现代的精神观念,用解构的民族化图形与现代设计思想相结合,创造一种既有传统文化元素又具现代意识的形象,以独特的个性参与世界文化的发展。香港著名设计师靳埭强的作品就具有浓厚的东方文化色彩。他的构图结构稳健,画面清丽,色泽时而欢悦,时而雅致,立意隽永而弥满禅机。在作品中我们时时发现设计家对简约空灵的水墨语言精妙的阐释,还不时可见中国传统文人智慧与现代商业文明的和谐对话。如图3,设计中既有水墨、笛子等极具中国传统文化意蕴的视觉元素,又有西方设计的构成形式,简洁而意味深长。综上所述,如果一幅画、一个图形、一种抽象的形式可以唤起观赏者丰富的审美感受,那是视觉“调动”了观者以往的生活体验和视觉经验并由专业知识参与的结果。因此,设计作品要想具有强大的感染力,设计者必须与观赏者所处的环境条件相适应,以观者的共有经验为根据,充分考虑到观赏者视觉心理的能动反应,与观赏者一道,把与传达信息有关的知、情、意等心理联系起来并统一到“一种经验”中,从而形成互动。看了“视觉传达学术论文”的人还看： 1. 视觉传达专业论文 2. 视觉传达教学改革毕业论文 3. 视觉传达开题报告范文 4. 艺术设计中的视觉形象设计及其重要性研究论文 5. 2017高考视觉传达设计专业解读

识别技术国外研究现状论文

语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务，对任何事都能够通过语音交互的方式。我整理了浅谈语音识别技术论文，欢迎阅读!

语音识别技术概述

作者：刘钰马艳丽董蓓蓓

摘要：本文简要介绍了语音识别技术理论基础及分类方式，所采用的关键技术以及所面临的困难与挑战，最后讨论了语音识别技术的发展前景和应用。

关键词：语音识别;特征提取;模式匹配;模型训练

Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.

Keywords:Speech identification;Character Pick-up;Mode matching;Model training

一、语音识别技术的理论基础

语音识别技术：是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解)，其最终目标是实现人与机器进行自然语言通信。

不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技术相似，一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外，还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种，具体选择哪一种，由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统，但不适合大词汇系统，原因在于模型库太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。

音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，并且汉语虽然有大约1300个音节，但若不考虑声调，约有408个无调音节，数量相对较少。因此，对于中、大词汇量汉语语音识别系统来说，以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中，但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成，且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母，这样虽然增加了模型数目，但提高了易混淆音节的区分能力。由于协同发音的影响，音素单元不稳定，所以如何获得稳定的音素单元，还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作，它对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，获得影响语音识别的重要信息。对于非特定人语音识别来讲，希望特征参数尽可能多的反映语义信息，尽量减少说话人的个人信息(对特定人语音识别来讲，则相反)。从信息论角度讲，这是信息压缩的过程。

线性预测(LP)分析技术是目前应用广泛的特征参数提取技术，许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型，没有考虑人类听觉系统对语音的处理特点。

Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果。实验证明，采用这种技术，语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取，但目前性能难以与上述技术相比，有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数，而模式匹配则是根据一定准则，使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络 (ANN)。

DTW是较早的一种模式匹配和模型训练技术，它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题，在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统，目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性，其中一个是隐蔽的(不可观测的)具有有限状态的Markor链，另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样，语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述，而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点，HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数，简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数，简称CHMM)以及半连续隐马尔可夫模型(SCHMM，集DHMM和CHMM特点)。一般来讲，在训练数据足够的，CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法，并不断被完善，以增强HMM模型的鲁棒性。

人工神经元网络在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统，模拟了人类神经元活动的原理，具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的，但ANN又不个有HMM模型的动态时间归正性能。因此，现在已有人研究如何把二者的优点有机结合起来，从而提高整个模型的鲁棒性。

二、语音识别的困难与对策

目前，语音识别方面的困难主要表现在：

(一)语音识别系统的适应性差，主要体现在对环境依赖性强，即在某种环境下采集到的语音训练系统只能在这种环境下应用，否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应，使用不方便。

(二)高噪声环境下语音识别进展困难，因为此时人的发音变化很大，像声音变高，语速变慢，音调及共振峰变化等等，这就是所谓Lombard效应，必须寻找新的信号分析处理方法。

(三)语言学、生理学、心理学方面的研究成果已有不少，但如何把这些知识量化、建模并用于语音识别，还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次，把这方面的现有成果用于语音识别，还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决，识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已经大于98%，对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展，这些复杂的语音识别系统也已经完全可以制成专用芯片，大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能，还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好的结果。

语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考文献：

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业专栏.通讯世界,2007.2:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)

[4]陈尚勤等.近代语音识别.西安: 电子科技大学出版社,1991

[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防工业出版社,2005

[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999

点击下页还有更多>>>浅谈语音识别技术论文

1研究现状及存在的问题水果实时分级系统主要功能是水果外部品质和内部品质的自动检测。水果的外部品质检测的项目有大小、形状、颜色、表面缺陷等，内部品质无损检测的项目为水果的硬度、糖含量、酸度、口味及某些内部缺陷等。1.1水果外部品质的自动检测水果的尺寸和颜色检测技术已比较成熟，且在国外已经实现自动化检测，在国内也有按重量或尺寸分级的系统。但果面的缺陷检测却一直成为水果实时分级的障碍。果面缺陷检测的技术比较复杂，目前存在以下几方面难题。1.1.1对水果整个表面进行实时视觉检测比较困难在水果分选生产线上，输送机构输送水果并把水果整个表面呈现给摄像机，这是水果实时分级系统比较关键的组成部分，因为当水果通过时，要求视觉系统能快速检查每个水果的全部果面，即使很小的缺陷面积，也会使得水果级别发生很大变化。同时，设计的视觉分级系统必须满足高生产率的要求。在这方面，国外学者（Growe,1996,Tao,1996)［1，2］采用滚子输送带使水果一边移动一边自身转动，从而使安装在输送带上方的摄像机能采集到水果的多个面的图像，达到全表面检测的目的。但由于水果大小和形状不规则，造成水果旋转速度不一致且难以保证按同一轴线旋转。此外，水果旋转两端的表面部分摄像机无法采集到，因此，分级误差较大。1.1.2快速而准确地测定水果表面的各种缺陷且与梗、萼凹陷区正确区分比较困难Miller等(1991)［3］对桃子的分选试验表明：因不能正确区分水果表面的缺陷和梗、萼凹陷区，由此产生的分级误差为25％左右。Rehkugler等（1986）［4］利用机械定向机构使苹果梗、萼处于垂直方向并绕梗萼轴旋转，CCD线扫描摄像机可扫描苹果的整个表面且形成一幅图像，该方法的特点是由机械定向机构定位水果梗、萼区，摄像机对此区不需要再检查。但因为受定向机构速度的限制，还达不到实时分级的速度，试验结果为每分钟选30个苹果。Yang(1996)［5］利用结构光图像与散射光图像相结合来区分梗、萼区和缺陷区，综合两方面图像处理的结果，共抽取16个特征参数，再利用BP神经网络区分苹果的梗、萼区和缺陷区，分辨精度为95％，但还需要进一步把试验结果应用于实际水果分选生产线中。Growe等（1996）［1］采取在780 nm附近带域内，用结构光由一黑白摄像机进行水果表面的凹陷度检测；在750 nm带域内的散射光照射下，由一黑白摄像机进行水果表面的可疑缺陷区检测。水果的输送旋转装置及摄像机布置如图1a所示，采用的双锥滚筒输送带可使水果一方面沿水平方向作平移运动，另一方面又绕自身水平轴作旋转运动。两个黑白CCD摄像机用来采集750 nm附近的散射光图像和780 nm附近的结构光图像，水果旋转一周摄取两次图像。两个黑白摄像机采集的图像经过设计的接口电路后，被合成为一幅黑白图像，合成过程如图1b所示。图像的处理由流水线图像处理系统完成。试验结果表明：每个水果采集两幅图像时，缺陷检测的速度可达5个/s，但误差较大，如对于苹果，碰伤检测的准确率仅为51％。试验表明，要想得到较高的检测精度，每个水果应采集5幅以上的图像，结构光至少6条以上。此外，由于水果尺寸不同所造成各个水果旋转速度的不一致，也是产生测量误差的原因。徐娟（1997）［6］及Nakano(1997)［7］利用人工神经网络法对缺陷区和梗萼区进行区分，试验表明神经网络的区分准确率较低。在果面各种缺陷的快速检测方面，Throop(1997)［8］等人研究了多光谱测量技术，对10个品种的苹果的22种缺陷，在460～1 030 nm光谱范围内，每隔10 nm试验测定了它们的反射光谱特性，其中对3种苹果同一种缺陷测量的结果如图2所示。图中纵坐标的马氏距离反映了水果缺陷区与正常区反射强度的差别程度，距离越大，两者差别越大。由图中曲线可看出：在中心为540 nm、740 nm、1 030 nm三波段附近，3种苹果同一缺陷与正常区的反射强度的差别表现为最大或最小值，最后通过对3个波段的图像进行简单的减法和阈值处理，即可得到检测的缺陷，下一步应考虑实际应用的实现。(a)(b)图1图像采集布置图与图像合成示意图(a)输送装置及摄像机布置(b) 图像合成示意图图23种苹果同一缺陷在460～1 030 nm范围内与正常区反射强度的差别情况1.1.3球形水果表面引起光照强度在投影面内呈曲面分布，以及二维图像上的透视区域与水果实际表面存在的畸变，给图像的缺陷检测带来困难和造成误差Tao(1996)［2］提出的球形变换法很好地解决了第一个问题。基本思想如图3所示：带缺陷的原始物体图像（OOI）与该物体反表面无缺陷的图像(IOI)相加得到变换后的物体图像（TOI），此图像具有平面物体图像的性质，而缺陷区低于该平面，然后经过简单阈值处理即可得缺陷区。何东健（1997）［9］提出了缺陷透视图像面积发生畸变的校正方法，但对复杂形状的缺陷区进行校正，还存在一定的困难。Nakano(1997)［7］利用一旋转平台使水果旋转，每旋转18°CCD摄像机采集一幅图像，苹果旋转一周可得20幅图像，为消除苹果球面面积的畸变，每幅图像只保留中间13 cm宽度的幅面，再全部合成一幅苹果整个表面的展开图像，此法非常有效，但在分选生产线上实现比较困难。图3球形变换方法1.1.4传统的图像处理及模式识别算法的速度不适合实时分选线的要求国外一般采用高速图像处理硬件与简单有效的图像处理软件相结合的途径，来实现水果的实时分级。如Yang(1996)［5］利用的是Transputer系统、结构光法和洪水算法；Growe等(1996)［1］研制的系统，图像的大部分工作由流水线图像处理硬件系统完成；Tao(1996)［2］采用的是专用Merlin图像处理系统和简单有效的球形变换法，研制的苹果分选系统已应用到水果分选生产线上，其分选速度可达3 165个/min。国内研究者（刘禾，1998，徐娟，1997，杨秀坤，1997，何东健，1997）［6，9～11］大多利用一般的微机和图像采集卡，开发了一些图像处理和模式识别的新算法，如把人工神经网络、模糊理论、遗传算法、图像形态学、分形理论、小波理论及人工智能理论用于图像特征的抽取和识别。但由于图像处理的硬件速度太低，故只能限于静态水果图像分选的算法研究。此外，水果分级的算法应具备人工分级的一些优良性能，如学习与记忆功能，因为目前的一些分级算法的训练样本都比较少，而要分级的水果品种多变且量大。1.2水果内部品质无损检测反映水果内部品质的主要指标有硬度、糖含量、酸度、口味及内部缺陷等。目前国内外研究的主要方法和存在的问题如下。1.2.1水果的硬度检测水果的硬度可间接反映水果的成熟度、运输中的抗损坏性、储藏期等。目前用于水果硬度检测的方法主要有变形法和声学法。变形法就是在一定时间内给水果施加一定的动态力或冲击力，然后根据测得的变形量确定水果的硬度。如Schmilovitch等（1995）［12］研制成功了枣子硬度自动检测系统，其原理是把枣子放在两平板之间，在上面板施加5～8 N的动态力，根据所测变形量的大小把枣子分成4个硬度等级。Delwiche(1991)［13］利用冲击法研制了苹果硬度自动检测系统，发现冲击力会造成苹果表面的轻微损伤。变形法只能测量水果表面的局部硬度，实际上，水果表面硬度变化较大，故限制了变形法的应用。声学法包括声波脉冲响应法和超声波法，声波脉冲响应法（20～1 500 Hz）就是利用一麦克风测量受轻微敲击水果的声波强度，由此确定水果的硬度。Armstrong等（1993）［14］试验研究了所测声波强度与水果硬度的关系，发现二者有很好的相关关系。此法的优点是简单、无损，且能反映水果的整体硬度，缺点是必须注意周围噪声的绝缘及机械振动的消除，此外水果形状也影响测量精度。超声波(＞20 000 Hz)法是根据超声波在水果等介质中传播时，能量衰减系数的大小来确定水果硬度。但由于水果内部含有较多气隙且各向异性，故超声波很难穿透整个水果。1.2.2糖含量、酸度、口味的自动检测糖含量、酸度比较有潜力的检测方法是近红外法（NIR）和磁共振法（MR）。近红外法又分穿透法、反射法和部分穿透法，部分穿透法原理如图4所示。穿透法对水果不适应，反射法一般用于水果表面特征的检测，因此常用的方法是部分穿透法。由图4可看出，在部分穿透法中，光线经过的路径比穿透法短，且入射光线与接收器有一夹角，此夹角的确定对测量起关键作用，此外二者之间必须加一隔板。884 nm和834 nm测得量的比值已用于桃子、苹果（Slaughter ，1995）［15］糖含量的自动测定。Slaughter等（1996）［16］对西红柿，在400～1 100 nm的光谱范围内进行部分穿透性测量试验，结果表明：800～1 000 nm范围的信息对糖含量的确定最有用，测得的相关系数r＝0.92, 但酸度测量比较困难。Mizrach(1997)［17］利用超声波法试验研究了超声波衰减系数和芒果硬度、糖含量、酸度的关系，但其超声波测量探头必须与果面接触，故限制了在线的应用。因此，利用近红外多光谱技术测定水果内部糖含量及其他成分是很有前途的，为达到实时应用的目的，应进一步确定最合适的一两个波段并与计算机视觉技术结合。磁共振及磁共振成像（MRI）技术也是测定水果内部成分的有效方法，其依据是物质内部的某些原子核（H、C、P等）在外部磁场作用下，可与射频区域的电磁波辐射相互作用。Chen等(1996)［18］利用此法对鳄梨的成熟度和鲜杏梅的糖含量进行了一些研究，得到了较好的结果。此法的主要缺点是设备昂贵。图4部分穿透法与水果的口味相关的化学成分主要是可挥发性芳香化合物，当水果成熟时，就会在周围空气中散发这种挥发性芳香气体。Benady等（1995）［19］研制的电子传感器可以测量这种气体的浓度。1.2.3水果内部缺陷的检测西瓜的内部空心用超声波检测已比较成熟。其他缺陷的检测，目前国外正研究利用X射线法、磁共振和磁共振成像技术等方法测量，因成本高及安全性等问题，故很难在农业中推广应用。2研究的途径及方向探讨水果实时分级系统的进一步研究应从两方面入手，一方面要加快水果外部品质的计算机视觉实时分选技术的研究；另一方面也要进行水果内部品质的无损检测技术的研究。因为水果分级的主要目的是选出高质量的水果，故水果内外品质的检测技术都十分重要。在水果的外部品质检测方面，应进行多种技术集成的应用研究。（1）对于水果整个表面机器视觉快速检测的问题，可采用机械与光学技术相结合，设计合理的传送机构，既保证水果在传送带上比较平稳地移动，又可由视觉系统快速检测到水果的全部表面。尽量减小因水果不规则运动造成的分级误差、损伤及图像的模糊。（2）对于果梗、萼区与缺陷的检测与视觉区分方面，应采用多光谱技术与机器视觉技术相结合，研究水果图像上可疑缺陷区的关键特征参数的抽取方法，得到简单、有效、快速的图像处理和识别方法。（3）在球形果面造成的光反射强度呈曲面分布及曲面成像面积的畸变问题，可从光照设计、图像合成及软件补偿3方面综合考虑。光照的充分设计可解决第一个问题；多幅图像的有效合成，可解决畸变问题。我们通过试验表明：一个水果至少应采集5幅图像，然后再合成为一幅，可基本保证水果整个表面上缺陷的有效检测，以避免畸变误差。软件补偿的方法必须简单而有效，以适合高速的要求。（4）在实时系统的图像处理器硬件设计方面，首先应采取先进的并行CPU芯片，如TMS320C80等；其次处理板的设计应与视觉系统结合起来考虑，如采集多路视觉信号的合成问题，机械机构与视觉系统的同步电路设计等。当然，也可引进国外比较成熟的高速图像处理主板，而其他技术可由国内自行开发，这样可以加快国内水果实时分级系统实现自动化的步伐。（5）在图像处理和识别的软件设计方面，应把传统方法与现代新方法（神经网络，并行算法，遗传算法，模糊技术，人工智能，图像形态学，分形学，小波变换等）结合起来，改变传统图像信息的超数据量表达方式，寻求图像表达与解释的新方法，力求图像处理和识别算法的快速性、有效性及鲁棒性。在水果内部品质检测方面，声学振动法是实现硬度自动检测的有效方法，但应设法消除影响测量精度的因素，并进行在生产线上的应用开发；近红外局部投射法和磁共振法是水果糖含量、酸度等内部成分自动检测的有效方法。在国内，近红外局部投射法更有应用前景，应进一步研究其通用性、稳定性和实用性；内部缺陷的无损检测应进一步研究新原理和新方法，应采取自己开发和从国外引进相结合的方式。此外，应进行多种传感器测量信息集成技术的研究，这是水果内外品质实现实时自动检测与分级的有效途径。3结语利用各种现代技术的高度集成，在水果分选生产线上同时完成水果内外品质的检测与分级是将来进一步研究的方向和目的。随着科学技术的飞速发展，在我国近期有望实现农产品品质的自动化检测与分级。

国外数字识别研究现状论文

文章编号:1005 - 0523(2005) 02 - 0063 - 04数字水印及其发展研究石红芹,谢昕(华东交通大学信息工程学院,江西南昌330013)摘要:首先对数字水印的特征进行了分析,阐述了数字水印技术的基本原理,对目前比较流行的水印算法进行了分类和详细地讨论,最后指出目前水印技术存在的局限并对其发展进行了展望.关键词:版权保护;数字水印;水印算法中图分类号:TP391 文献标识码:A1 引言近年来,随着数字化技术的进步和Internet 的迅速发展,多媒体信息的交流达到了前所未有的深度和广度,其发布形式愈加丰富了. 网络发布的形式逐渐成为一种重要的形式,伴随而来的是多媒体数据的版权保护问题. 因此多媒体信息版权保护问题成了一项重要而紧迫的研究课题. 为了解决这一难题,近几年国际上提出了一种新的有效的数字信息产品版权保护和数据安全维护的技术一一数字水印技术. 数字水印技术通过在原始媒体数据中嵌入秘密信息———水印来证实该数据的所有权归属. 水印可以是代表所有权的文字、产品或所有ID、二维图像,视频或音频数据、随机序列等. 主要应用于:媒体所有权的认定. 即辨认所有权信息,媒体合法用户信息; 媒体的传播跟算法研究. 该子模块的研究为解决网络制造产品版权保护问题奠定了基础数字水印技术,又称数字签名技术,成为信息隐藏技术的一种重要研究分支,为实现有效的信息版权保护提供了一种重要的手段.2 数字水印的基本原理从图像处理的角度看,嵌入水印信号可以视为在强背景下迭加一个弱信号,只要迭加的水印信号强度低于人类视觉系统( Human Visual System ,HVS) 的对比度门限,HVS 就无法感到信号的存在.对比度门限受视觉系统的空间、时间和频率特性的影响. 因此通过对原始信号作一定的调整,有可能在不改变视觉效果的情况下嵌入一些信息,从数字通信的角度看,水印嵌入可理解为在一个宽带信道(载体图像) 上用扩频通信技术传输一个窄带信号(水印信号) . 尽管水印信号具有一定的能量,但分布到信道中任一频率上的能量是难以检测到的. 水印的译码(检测) 即是在有噪信道中弱信号的检测问题.一般来说,为了使水印能有效地应用于版权保护中,水印必须满足如下特性:1) 隐蔽性水印在通常的视觉条件下应该是不可见的,水印的存在不会影响作品的视觉效果.2) 鲁棒性水印必须很难去掉(希望不可能去掉) ,当然在理论上任何水印都可以去掉,只要对水印的嵌入过程有足够的了解,但是如果对水印的嵌入只是部分了解的话,任何破坏或消除水印的企图都应导致载体严重的降质而不可用.3) 抗窜改性与抗毁坏的鲁棒性不同,抗窜改性是指水印一旦嵌入到载体中,攻击者就很难改变或伪造. 鲁棒性要求高的应用,通常也需要很强的抗窜改性. 在版权保护中,要达到好的抗窜改性是比较困难的.4) 水印容量嵌入的水印信息必须足以表示多媒体内容的创建者或所有者的标志信息,或是购买者的序列号. 这样在发生版权纠纷时,创建者或所有者的信息用于标示数据的版权所有者,而序列号用于标示违反协议而为盗版提供多媒体数据的用户.5) 安全性应确保嵌入信息的保密性和较低的误检测率. 水印可以是任何形式的数据,比如数值、文本、图像等. 所有的水印都包含一个水印嵌入系统和水印恢复系统. 水印的嵌入和提取过程分别6) 低错误率即使在不受攻击或者无信号失真的情况下,也要求不能检测到水印(漏检、false -negative) 以及不存在水印的情况下,检测到水印(虚检、false - positive) 的概率必须非常小.3 数字水印算法近几年来,数字水印技术研究取得了很大的进步,见诸于文献的水印算法很多,这里对一些典型的算法进行了分析.3. 1 空间域算法数字水印直接加载在原始数据上,还可以细分为如下几种方法[1～4 ] :1) 最低有效位方法(LSB) 这是一种典型的空间域数据隐藏算法,L. F. Tumer 与R. G. Van Schyadel等先后利用此方法将特定的标记隐藏于数字音频和数字图像内. 该方法是利用原始数据的最低几位来隐藏信息(具体取多少位,以人的听觉或视觉系统无法察觉为原则) .LSB 方法的优点是有较大的信息隐藏量,但采用此方法实现的数字水印是很脆弱的,无法经受一些无损和有损的信息处理,而且如果确切地知道水印隐藏在几位LSB 中,数字水印很容易被擦除或绕过.2) Patchwork 方法及纹理块映射编码方法这两种方法都是Bender 等提出的. Patchwork 是一种基于统计的数字水印,其嵌入方法是任意选择N 对图像点,在增加一点亮度的同时,降低另一点的亮度值. 该算法的隐藏性较好,并且对有损的JPEG和滤波、压缩和扭转等操作具有抵抗能力,但仅适用于具有大量任意纹理区域的图像,而且不能完全自动完成.3. 2 变换域算法基于变换域的技术可以嵌入大量比特数据而不会导致可察觉的缺陷,往往采用类似扩频图像的技术来隐藏数字水印信息. 这类技术一般基于常用的图像变换,基于局部或是全部的变换,这些变换包括离散余弦变换(DCT) 、小波变换(WT) 、傅氏变换(FT 或FFT) 以及哈达马变换(Hadamard transform)等等. 其中基于分块的DCT 是最常用的变换之一,现在所采用的静止图像压缩标准JPEG也是基于分块DCT 的. 最早的基于分块DCT 的一种数字水印技术方案是由一个密钥随机地选择图像的一些分块,在频域的中频上稍稍改变一个三元组以隐藏二进制序列信息. 选择在中频分量编码是因为在高频编码易于被各种信号处理方法所破坏,而在低频编码则由于人的视觉对低频分量很敏感,对低频分量的改变易于被察觉. 该数字水印算法对有损压缩和低通滤波是稳健的. 另一种DCT 数字水印算法[5 ]是首先把图像分成8 ×8 的不重叠像素块,在经过分块DCT 变换后,即得到由DCT 系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT 系数中. 该算法是通过对选定的DCT 系数进行微小变换以满足特定的关系,以此来表示一个比特的信息. 在水印信息提取时,则选取相同的DCT 系数,并根据系数之间的关系抽取比特信息. 除了上述有代表性的变换域算法外,还有一些变换域数字水印方法,它们当中有相当一部分都是上述算法的改进及发展,这其中有代表性的算法是I. Podichuk 和ZengWenjun 提出的算法[6 ] . 他们的方法是基于静止图像的DCT 变换或小波变换,研究视觉模型模块返回数字水印应加载在何处及每处可承受的JND(Just Noticeable Difference ,恰好可察觉差别) 的量值(加载数字水印的强度上限) ,这种水印算法是自适应的.3. 3 NEC 算法该算法由NEC 实验室的Cox[5 ]等人提出,该算法在数字水印算法中占有重要地位,其实现方法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯N(0 ,1) 分布,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做DCT 变换,最后用伪随机高斯序列来调制(叠加) 该图像除直流分量外的1 000 个最大的DCT 系数. 该算法具有较强的鲁棒性、安全性、透明性等. 由于采用特殊的密钥,故可防止IBM 攻击,而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则,即水印信号应该嵌入源数据中对人感觉最重要的部分,这种水印信号由独立同分布随机实数序列构成,且该实数序列应具有高斯分布N(0 ,1) 的特征. 随后Podilchuk等利用人类视觉模型又对该算法进行了改进,从而提高了该算法的鲁棒性、透明性等.3. 4 其他一些水印算法1) 近年来,利用混沌映射模型实现数字水印、保密通信等成为混沌应用研究的热点. 特别是自从Cox 等借用通信技术中的扩频原理将水印信号嵌入到一些DCT 变换系数或者多层分解的小波变换系数以来,人们已经提出了一些混沌数字水印方法.水印的嵌入与检测是基于人类视觉系统(HVS) 的亮度掩蔽特性和纹理掩蔽特性,折衷水印的不可见性和鲁棒性之间的矛盾. 结果表明:该方法嵌入的水印具有不可见性和鲁棒性,并且这种基于密钥的混沌水印方法更好的抗破译性能.2) 目前比较流行的还有一种基于盲水印检测的DWT 算法,该算法首先对原始图像进行小波变换,根据人类具有的视觉掩蔽特性对低频分量进行一定的量化,同时可不影响视觉效果,并对作为水印的图像进行压缩和二值化处理,形成一维的二值序列,根据二值序列的值对上述量化后的原始信号的低频分量进行视觉阈值范围内允许的修改,从而实现水印的嵌入. 水印提取过程是对含有水印的图像进行小波变换,对低频分量同样进行量化处理,为了增大算法的安全性,可以对水印形成的二值0 ,1 序列在嵌入前进一步进行伪随机序列调制,相应的在水印提取过程需要增加用伪随机序列解调的步骤. 这样,不知道伪随机序列的攻击者即使推测出水印的嵌入规律,也无法提取水印. 大大增加了水印系统的透明性和鲁棒性.4 水印技术的局限目前水印技术的局限,为了对版权保护中使用水印的成功可能性进行评估,看能否满足实际应用需求,就需要对水印技术有更多了解. 下面介绍数字水印方案普遍存在的一些局限:1) 不知道能够隐藏多少位. 尽管非常需要知道指定大小载体信息上可以隐藏多少比特的水印信息,但这个问题还没有得到圆满解决. 事实上,对给定尺寸的图像或者给定时间的音频,可以可靠隐藏信息量的上界,目前还不清楚. 对图像水印,只能说目前使用的算法可以隐藏几百比特位的水印信息.2) 还没有真正健壮的盲图像水印算法. 对图像水印,鲁棒性还是个问题. 目前还没有能够在经过所有普通图像处理变换后,仍能幸免的盲水印算法. 尤其是能够抵抗几何处理的攻击,被认为是很难实现的目标.3) 所有者能去除标记. 迄今为止提出的所有盲图像水印,实际上都是可逆的. 已知水印的准确内容、以及水印的嵌入和检测算法,则总能在没有严重损坏资料的前提下,使水印不可读取. 目前还不清楚这个缺点在将来还是否存在;同时在设计版权保护系统时,必须考虑如下问题:一旦水印内容已知,则有可能去除水印或者部分水印.此外,迄今为止提出的水印算法,其可逆性使人们提出极大的疑问,即设计能够抗篡改的健壮公开水印技术是否可能? 事实上,如果允许任何人读取水印,则任何人只要知道水印嵌入算法,就可以消除水印.5 结论随着电子商务的加速发展和网络用户的直线增长,媒体的安全要求将更加迫切,作为版权保护和安全认证的数字水印技术具有极大的商业潜力,作为一门学科交叉的新兴的应用技术,它的研究涉及了不同学科研究领域的思想和理论,如数字信号处理、图像处理、信息论、通信理论、密码学、计算机科学及网络、算法设计等技术,以及公共策略和法律等问题,是近几年来国际学术界才兴起的一个前沿研究领域,得到了迅速的发展. 但数字水印技术仍然是一个未成熟的研究领域,还有很多问题需要解决,其理论基础依然薄弱. 随着一些先进的信号处理技术和密码设计思想的引进,必将日趋成熟且得到更为广泛的发展应用.参考文献:[1 ] Eepa Kundur. Dimitrios hatzinakos. Digital watermarking fortelltale tamper proofing and authentication [J ] . Proceeding of the IEEE. 1999 , 87(7) :1167～1180.[2 ] 张春田,苏育挺. 信息产品的版权保护技术———数字水印[J ] . 电信科学,1998 ,14(12) :15～17.[3 ] Bender W, Gruhl D. Techniques for data hiding[J ] . IBM sys2tem journal ,1996 ,35(3～4) :313～336.[4 ] Cox I J , Killian J ,Leighton F T. Secure spread spectrum wa2termarking for multimedia[J ] . IEEE transactions on image pro2cessing ,1997 ,6(12) :1673～1687.[5 ] Zhao J , Koch E. Embedding robust labels into images forcopyright protection[A] . In : Proceedings of the knowright’95conference on intellectual property rights and new technologies[C] . Vienna , Austria , 1995. 241～251.[6 ] Podilchud C I , Zeng W. Image - adaptive watermarking usingvisual model [J ] . IEEE journal on special areas in communica2tions ,1998 ,16(4) :525～539.

相关范文：数据挖掘技术及其应用摘要：随着网络、数据库技术的迅速发畏以及数据库管理系统的广泛应用，人们积累的数据越来越多。数据挖掘(Data Mining)就是从大量的实际应用数据中提取隐含信息和知识，它利用了数据库、人工智能和数理统计等多方面的技术，是一类深层次的数据分析方法。关键词：数据挖掘；知识；分析；市场营销；金融投资随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用，人们积累的数据越来越多。由此，数据挖掘技术应运而生。下面，本文对数据技术及其应用作一简单介绍。一、数据挖掘定义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一种新的商业信息处理技术，其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理，从中提取辅助商业决策的关键性数据。简而言之，数据挖掘其实是一类深层次的数据分析方法。从这个角度数据挖掘也可以描述为：按企业制定的业务目标，对大量的企业数据进行探索和分析，揭示隐藏的、未知的或验证已知的规律性，并进一步将其模型化的先进有效的方法。二、数据挖掘技术数据挖掘技术是人们长期对数据库技术进行研究和开发的结果，代写论文其中数据仓库技术的发展与数据挖掘有着密切的关系。大部分情况下，数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中，因为数据仓库会对数据进行清理，并会解决数据的不一致问题，这会给数据挖掘带来很多好处。此外数据挖掘还利用了人工智能(AI)和统计分析的进步所带来的好处，这两门学科都致力于模式发现和预测。数据库、人工智能和数理统计是数据挖掘技术的三大支柱。由于数据挖掘所发现的知识的不同，其所利用的技术也有所不同。1．广义知识。指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识，反映同类事物的共同性质，是对数据的概括、精炼和抽象。广义知识的发现方法和实现技术有很多，如数据立方体、面向屙性的归约等。数据立方体的基本思想是实现某些常用的代价较高的聚集函数的计算，诸如计数、求和、平均、最大值等，并将这些实现视图储存在多维数据库中。而面向属性的归约是以类SQL语言来表示数据挖掘查询，收集数据库中的相关数据集，然后在相关数据集上应用一系列数据推广技术进行数据推广，包括属性删除、概念树提升、属性阈值控制、计数及其他聚集函数传播等。2．关联知识。它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联，那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是Apriori算法和FP—Growth算法。关联规则的发现可分为两步：第一步是迭代识别所有的频繁项目集，要求频繁项目集的支持率不低于用户设定的最低值；第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心，也是计算量最大的部分。3．分类知识。它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。分类方法有决策树、朴素贝叶斯、神经网络、遗传算法、粗糙集方法、模糊集方法、线性回归和K—Means划分等。其中最为典型的分类方法是决策树。它是从实例集中构造决策树，是一种有指导的学习方法。该方法先根据训练子集形成决策树，如果该树不能对所有对象给出正确的分类，那么选择一些例外加入到训练子集中，重复该过程一直到形成正确的决策集。最终结果是一棵树，其叶结点是类名，中间结点是带有分枝的屙性，该分枝对应该屙性的某一可能值。4．预测型知识。它根据时间序列型数据，由历史的和当前的数据去推测未来的数据，也可以认为是以时间为关键属性的关联知识。目前，时间序列预测方法有经典的统计方法、神经网络和机器学习等。1968年BoX和Jenkins提出了一套比较完善的时间序列建模理论和分析方法，这些经典的数学方法通过建立随机模型，进行时间序列的预测。由于大量的时间序列是非平稳的，其特征参数和数据分布随着时间的推移而发生变化。因此，仅仅通过对某段历史数据的训练，建立单一的神经网络预测模型，还无法完成准确的预测任务。为此，人们提出了基于统计学和基于精确性的再训练方法，当发现现存预测模型不再适用于当前数据时，对模型重新训练，获得新的权重参数，建立新的模型。5．偏差型知识。它是对差异和极端特例的描述，揭示事物偏离常规的异常现象，如标准类外的特例、数据聚类外的离群值等。所有这些知识都可以在不同的概念层次上被发现，并随着概念层次的提升，从微观到中观、到宏观，以满足不同用户不同层次决策的需要。三、数据挖掘流程数据挖掘是指一个完整的过程，该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息，代写毕业论文并使用这些信息做出决策或丰富知识。数据挖掘的基本过程和主要步骤如下：过程中各步骤的大体内容如下：1．确定业务对象，清晰地定义出业务问题。认清数据挖掘的目的是数据挖掘的重要一步，挖掘的最后结构不可预测，但要探索的问题应该是有预见的，为了数据挖掘而挖掘则带有盲目性，是不会成功的。2．数据准备。(1)数据选择。搜索所有与业务对象有关的内部和外部数据信息，并从中选择出适用于数据挖掘应用的数据。(2)数据预处理。研究数据的质量，进行数据的集成、变换、归约、压缩等．为进一步的分析作准备，并确定将要进行的挖掘操作的类型。(3)数据转换。将数据转换成一个分析模型，这个分析模型是针对挖掘算法建立的，这是数据挖掘成功的关键。3．数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善和选择合适的挖掘算法外，其余一切工作都能自动地完成。4．结果分析。解释并评估结果。其使用的分析方法一般应视挖掘操作而定，通常会用到可视化技术。5．知识同化。将分析所得到的知识集成到业务信息系统的组织结构中去。四、数据挖掘的应用数据挖掘技术从一开始就是面向应用的。目前在很多领域，数据挖掘都是一个很时髦的词，尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。1．市场营销。由于管理信息系统和P0S系统在商业尤其是零售业内的普遍使用，特别是条形码技术的使用，从而可以收集到大量关于用户购买情况的数据，并且数据量在不断激增。对市场营销来说，通过数据分析了解客户购物行为的一些特征，对提高竞争力及促进销售是大有帮助的。利用数据挖掘技术通过对用户数据的分析，可以得到关于顾客购买取向和兴趣的信息，从而为商业决策提供了可靠的依据。数据挖掘在营销业上的应用可分为两类：数据库营销(database markerting)和货篮分析(basket analysis)。数据库营销的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客，以便向它们推销产品。通过对已有的顾客数据的辱淅，可以将用户分为不同级别，级别越高，其购买的可能性就越大。货篮分析是分析市场销售数据以识别顾客的购买行为模式，例如：如果A商品被选购，那么B商品被购买的可能性为95％，从而帮助确定商店货架的布局排放以促销某些商品，并且对进货的选择和搭配上也更有目的性。这方面的系统有：Opportunity Ex-plorer，它可用于超市商品销售异常情况的因果分析等，另外IBM公司也开发了识别顾客购买行为模式的一些工具(IntdligentMiner和QUEST中的一部分)。2．金融投资。典型的金融分析领域有投资评估和股票交易市场预测，分析方法一般采用模型预测法(如神经网络或统计回归技术)。代写硕士论文由于金融投资的风险很大，在进行投资决策时，更需要通过对各种投资方向的有关数据进行分析，以选择最佳的投资方向。无论是投资评估还是股票市场预测，都是对事物发展的一种预测，而且是建立在对数据的分析基础之上的。数据挖掘可以通过对已有数据的处理，找到数据对象之间的关系，然后利用学习得到的模式进行合理的预测。这方面的系统有Fidelity Stock Selector和LBS Capital Management。前者的任务是使用神经网络模型选择投资，后者则使用了专家系统、神经网络和基因算法技术来辅助管理多达6亿美元的有价证券。3．欺诈甄别。银行或商业上经常发生行为，如恶性透支等，这些给银行和商业单位带来了巨大的损失。对这类行为进行预测可以减少损失。进行甄别主要是通过总结正常行为和行为之间的关系，得到行为的一些特性，这样当某项业务符合这些特征时，可以向决策人员提出警告。这方面应用非常成功的系统有：FALCON系统和FAIS系统。FALCON是HNC公司开发的信用卡欺诈估测系统，它已被相当数量的零售银行用于探测可疑的信用卡交易；FAIS则是一个用于识别与洗钱有关的金融交易的系统，它使用的是一般的政府数据表单。此外数据挖掘还可用于天文学上的遥远星体探测、基因工程的研究、web信息检索等。结束语随着数据库、人工智能、数理统计及计算机软硬件技术的发展，数据挖掘技术必能在更多的领域内取得更广泛的应用。参考文献：[1]闫建红《数据库系统概论》的教学改革与探索[J]．山西广播电视大学学报，2006，(15)：16—17．其他相关：数据挖掘研究现状及最新进展（CAJ格式）仅供参考，请自借鉴希望对您有帮助补充：如何撰写毕业论文本科专业（含本科段、独立本科段）自考生在各专业课程考试成绩合格后，都要进行毕业论文的撰写（工科类专业一般为毕业设计、医科类一般为临床实习）及其答辩考核。毕业论文的撰写及答辩考核是取得高等教育自学考试本科毕业文凭的重要环节之一，也是衡量自考毕业生是否达到全日制普通高校相同层次相同专业的学力水平的重要依据之一。但是，由于许多应考者缺少系统的课堂授课和平时训练，往往对毕业论文的独立写作感到压力很大，心中无数，难以下笔。因此，对本科专业自考生这一特定群体，就毕业论文的撰写进行必要指导，具有重要的意义。本文试就如何撰写毕业论文作简要论述，供参考。毕业论文是高等教育自学考试本科专业应考者完成本科阶段学业的最后一个环节，它是应考者的总结性独立作业，目的在于总结学习专业的成果，培养综合运用所学知识解决实际问题的能力。从文体而言，它也是对某一专业领域的现实问题或理论问题进行科学研究探索的具有一定意义的论说文。完成毕业论文的撰写可以分两个步骤，即选择课题和研究课题。首先是选择课题。选题是论文撰写成败的关键。因为，选题是毕业论文撰写的第一步，它实际上就是确定“写什么”的问题，亦即确定科学研究的方向。如果“写什么”不明确，“怎么写”就无从谈起。教育部自学考试办公室有关对毕业论文选题的途径和要求是“为鼓励理论与工作实践结合，应考者可结合本单位或本人从事的工作提出论文题目，报主考学校审查同意后确立。也可由主考学校公布论文题目，由应考者选择。毕业论文的总体要求应与普通全日制高等学校相一致，做到通过论文写作和答辩考核，检验应考者综合运用专业知识的能力”。但不管考生是自己任意选择课题，还是在主考院校公布的指定课题中选择课题，都要坚持选择有科学价值和现实意义的、切实可行的课题。选好课题是毕业论文成功的一半。第一、要坚持选择有科学价值和现实意义的课题。科学研究的目的是为了更好地认识世界、改造世界，以推动社会的不断进步和发展。因此，毕业论文的选题，必须紧密结合社会主义物质文明和精神文明建设的需要，以促进科学事业发展和解决现实存在问题作为出发点和落脚点。选题要符合科学研究的正确方向，要具有新颖性，有创新、有理论价值和现实的指导意义或推动作用，一项毫无意义的研究，即使花很大的精力，表达再完善，也将没有丝毫价值。具体地说，考生可从以下三个方面来选题。首先，要从现实的弊端中选题，学习了专业知识，不能仅停留在书本上和理论上，还要下一番功夫，理论联系实际，用已掌握的专业知识，去寻找和解决工作实践中急待解决的问题。其次，要从寻找科学研究的空白处和边缘领域中选题，科学研究还有许多没有被开垦的处女地，还有许多缺陷和空白，这些都需要填补。应考者应有独特的眼光和超前的意识去思索，去发现，去研究。最后，要从寻找前人研究的不足处和错误处选题，在前人已提出来的研究课题中，许多虽已有初步的研究成果，但随着社会的不断发展，还有待于丰富、完整和发展，这种补充性或纠正性的研究课题，也是有科学价值和现实指导意义的。第二、要根据自己的能力选择切实可行的课题。毕业论文的写作是一种创造性劳动，不但要有考生个人的见解和主张，同时还需要具备一定的客观条件。由于考生个人的主观、客观条件都是各不相同的，因此在选题时，还应结合自己的特长、兴趣及所具备的客观条件来选题。具体地说，考生可从以下三个方面来综合考虑。首先，要有充足的资料来源。“巧妇难为无米之炊”，在缺少资料的情况下，是很难写出高质量的论文的。选择一个具有丰富资料来源的课题，对课题深入研究与开展很有帮助。其次，要有浓厚的研究兴趣，选择自己感兴趣的课题，可以激发自己研究的热情，调动自己的主动性和积极性，能够以专心、细心、恒心和耐心的积极心态去完成。最后，要能结合发挥自己的业务专长，每个考生无论能力水平高低，工作岗位如何，都有自己的业务专长，选择那些能结合自己工作、发挥自己业务专长的课题，对顺利完成课题的研究大有益处。选好课题后，接下来的工作就是研究课题，研究课题一般程序是：搜集资料、研究资料，明确论点和选定材料，最后是执笔撰写、修改定稿。第一、研究课题的基础工作———搜集资料。考生可以从查阅图书馆、资料室的资料，做实地调查研究、实验与观察等三个方面来搜集资料。搜集资料越具体、细致越好，最好把想要搜集资料的文献目录、详细计划都列出来。首先，查阅资料时要熟悉、掌握图书分类法，要善于利用书目、索引，要熟练地使用其他工具书，如年鉴、文摘、表册、数字等。其次，做实地调查研究，调查研究能获得最真实可靠、最丰富的第一手资料，调查研究时要做到目的明确、对象明确、内容明确。调查的方法有：普遍调查、重点调查、典型调查、抽样调查。调查的方式有：开会、访问、问卷。最后，关于实验与观察。实验与观察是搜集科学资料数据、获得感性知识的基本途径，是形成、产生、发展和检验科学理论的实践基础，本方法在理工科、医类等专业研究中较为常用，运用本方法时要认真全面记录。第二、研究课题的重点工作———研究资料。考生要对所搜集到手的资料进行全面浏览，并对不同资料采用不同的阅读方法，如阅读、选读、研读。通读即对全文进行阅读，选读即对有用部分、有用内容进行阅读，研读即对与研究课题有关的内容进行全面、认真、细致、深入、反复的阅读。在研读过程中要积极思考。要以书或论文中的论点、论据、论证方法与研究方法来触发自己的思考，要眼、手、脑并用，发挥想象力，进行新的创造。在研究资料时，还要做好资料的记录。第三、研究课题的核心工作―――明确论点和选定材料。在研究资料的基础上，考生提出自己的观点和见解，根据选题，确立基本论点和分论点。提出自己的观点要突出新创见，创新是灵魂，不能只是重复前人或人云亦云。同时，还要防止贪大求全的倾向，生怕不完整，大段地复述已有的知识，那就体现不出自己研究的特色和成果了。根据已确立的基本论点和分论点选定材料，这些材料是自己在对所搜集的资料加以研究的基础上形成的。组织材料要注意掌握科学的思维方法，注意前后材料的逻辑关系和主次关系。第四、研究课题的关键工作―――执笔撰写。考生下笔时要对以下两个方面加以注意：拟定提纲和基本格式。拟定提纲包括题目、基本论点、内容纲要。内容纲要包括大项目即大段段旨、中项目即段旨、小项目即段中材料或小段段旨。拟定提纲有助于安排好全文的逻辑结构，构建论文的基本框架。基本格式：一般毕业论文由标题、摘要、正文、参考文献等4方面内容构成。标题要求直接、具体、醒目、简明扼要。摘要即摘出论文中的要点放在论文的正文之前，以方便读者阅读，所以要简洁、概括。正文是毕业论文的核心内容，包括绪论、本论、结论三大部分。绪论部分主要说明研究这一课题的理由、意义，要写得简洁。要明确、具体地提出所论述课题，有时要写些历史回顾和现状分析，本人将有哪些补充、纠正或发展，还要简单介绍论证方法。本论部分是论文的主体，即表达作者的研究成果，主要阐述自己的观点及其论据。这部分要以充分有力的材料阐述观点，要准确把握文章内容的层次、大小段落间的内在联系。篇幅较长的论文常用推论式（即由此论点到彼论点逐层展开、步步深入的写法）和分论式（即把从属于基本论点的几个分论点并列起来，一个个分别加以论述）两者结合的方法。结论部分是论文的归结收束部分，要写论证的结果，做到首尾一贯，同时要写对课题研究的展望，提及进一步探讨的问题或可能解决的途径等。参考文献即撰写论文过程中研读的一些文章或资料，要选择主要的列在文后。第五、研究课题的保障工作―――修改定稿。通过这一环节，可以看出写作意图是否表达清楚，基本论点和分论点是否准确、明确，材料用得是否恰当、有说服力，材料的安排与论证是否有逻辑效果，大小段落的结构是否完整、衔接自然，句子词语是否正确妥当，文章是否合乎规范。总之，撰写毕业论文是一种复杂的思维活动，对于缺乏写作经验的自考生来说，确有一定的难度。因此，考生要“学习学习再学习，实践实践再实践”，虚心向指导教师求教。

图像识别的发展经历了三个阶段：文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的，一般是识别字母、数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储，传输方便可压缩、传输过程中不易失真、处理方便等巨大优势，这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识，属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向，其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差，一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前，在图像识别的发展中，主要有三种识别方法：统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术，自20世纪70年代，其研究已经有几十年的历史，一直都受到人们的高度重视，至今借助于各种理论提出了数以千计的分割算法，而且这方面的研究仍然在积极地进行着。现有的图像分割的方法有许多种，有阈值分割方法，边缘检测方法，区域提取方法，结合特定理论工具的分割方法等。从图像的类型来分有：灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子，使得边缘检测产生了不少经典算法。但在近二十年间，随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展，有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、方法和工具，如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。

机器人视觉研究论文

随着科技的进步，智能机器人的性能不断地完善，因此也被越来越多的应用于军事、排险、农业、救援、海洋开发等方面。这是我为大家整理的关于机器人的科技论文，供大家参考!机器人的科技论文篇一：《浅谈智能移动机器人》摘要：随着科技的进步，智能机器人性能不断地完善，移动机器人的应用范围也越来越广，广泛应用于军事、排险、农业、救援、海洋开发等。介绍了常见智能移动机器人的基本系统组成及其相关的一些技术，提出一种能够应用于智能移动机器人的越障机构，并简单阐述了其工作原理。在对智能机器人有一定了解的基础上，论述了智能移动机器人的研究现状及其发展动向。关键词：智能移动机器人越障避障伸展收缩 1 引言上世纪60年代智能机器人的出现开辟了智能生产自动化的新时代。在工业机器人问世50多年后的今天，机器人已被人们看作是不可缺少的一种生产工具。由于传感器、控制、驱动及材料等领域的技术进步开辟了机器人应用的新领域。智能移动机器人是机器人学中的一个重要分支。 2 智能移动机器人的基本系统组成及其相关技术由于智能移动机器人在危险与恶劣环境以及民用等各方面具有广阔的应用前景，使得世界各国非常关注它的发展。其共同的五大系统组成要素为：(1)机械机构单元是智能移动机器人的骨架，机器人所有的模块都依靠其支撑，机械机构单元的结构，性能，强度直接影响着整个机器人的稳定性。随着科技发展和新型材料的研制开发，使得智能机器人产品的结构性能有了很大提高，机械机构的各项工艺性及尺寸设计都向着更加合理高效，更加轻便美观，更加环保节能，更加安全可靠等方向发展。(2)动力与驱动单元为智能移动机器人提供动力来源。(3)环境感知单元相当于智能移动机器人的五官，机器人通过感知单元对周围的环境进行感知识别及各种参数的收集，然后通过转换成控制模块可以识别的光电信号，输入到控制单元进行数据处理。(4)执行机构单元为智能移动机器人执行部分，能根据控制中心的命令执行命令，完成任务。不同的机器人有着不同的执行机构，执行机构的设计影响着对要执行动作的效率，精度，稳定性，可靠性等。(5)信息处理与控制单元作为整个机械系统的核心部分，它如人的大脑一样，调控着整个系统，一切的活动都由它指挥。将来自传感器部分采集到的信息进行集中汇总，存储，对所有信息分析，规划决策，输出命令。使机器人有目的的运行。智能移动机器人是一个集环境感知、动态决策与规划、行为控制与执行等多种功能于一体的综合机电系统。它是传感器技术，控制技术，移动技术，信息处理、人工智能、电子工程、计算机工程等多学科的重要研究成果，从某种意义上讲是机器发展进化过程中的产物，是目前科学技术发展最活跃的领域之一。 3 一种越障机器人我们设计的移动机器人(图1)有很好的机动性能，前导轮、前轮和后轮可以实现独立升降运动。前导轮(如图1)由通过曲柄圆盘的转动角度控制摇杆的摆动角度，带动相关的平面连杆机构运动，从而实现前导向轮的伸展和收缩实现攀越。机器人两侧的侧边驱动机构为平面连杆-滑块越障机构，前后轮(如图1)分别通过导杆在槽中的移动，带动平面连杆机构的运动，实现前后轮的伸展和收缩，实现越障功能。本机器人通过尺寸的设计可以实现较大的越障高度，通过合理的控制轮摆动的角度还能实现多种类型障碍物的攀越。 4 智能移动机器人的应用概况随着科技的进步，机器人的功能不断完善，智能移动机器人的应用范围也大大拓宽，不仅在工业、农业、医疗、服务等行业中得到广泛的应用，而且在排险、海洋开发和宇宙探测领域等有害与危险场合(如辐射、灾区、有毒等)得到很好的应用。 4.1 陆地智能移动机器人 20世纪60年代后期，苏美为了完成对宇宙空间的占领，完成月球探测计划，各自研制开发并应用了移动机器人，通过移动机器人实现对外星土壤的样本采集和土壤分析等各种任务。陆地智能移动机器人的出现是为了帮助人类完成无法完成的任务。陆地移动机器人也广泛应用于军事，可以完成排除爆炸物，扫雷，侦查，清除障碍物等等，近年来智能移动机器人也开始渐渐融入人们的日常生活。 4.2 水下智能移动机器人近年来，人们对资源的渴求加大，开始对原子能和海洋资源的开发，加之水下环境十分复杂(能见度差，定位困难，流体变化等)，水下智能移动机器人在海底资源探测上的优势使之受到关注。近年德国基尔大学的科学家研制出新型深水机器人“ROV Kiel 6000”，这架深水机器人能够下探到6000米深的海底，寻找神秘的深水生物和“白色黄金”可燃冰。 4.3 仿生智能移动机器人近年来,全球许多机器人研究机构越来越多的关注仿生学与机构的研究工作.在某些情况下仿生机器人尤其独特优势，例如，蛇形机器人重心低，能够模仿蛇的动作，穿梭在能够穿梭在受灾现场和其他复杂的地形中能够帮助人类完成各种任务。除此之外还有仿生宠物狗、仿生鱼、仿生昆虫等。 5 智能移动机器人的发展方向及前景影响移动机器人发展的因素主要有：导航与定位技术，多传感器信息的融合技术，多机器人协调与控制技术等因而移动机器人技术发展趋势主要包括： (1)高智能情感机器人。随着科学技术的发展，人们对人机交互的技术的要求越来越高，具有人类智能的情感移动机器人是移动机器人未来发展趋势。目前的移动机器人只能说是具有部分的智能，人们渴望能够出现安全可靠的能够沟通交流的高智能的机器人。虽然现在要实现高智能情感机器人还非常的困难，但是终有一天，随着科学技术的突破，它将成为现实。 (2)高适应性多功能化的机器人。机器人的出现是为人类服务的，自然界中还有好多未知的世界等着我们开拓，各种危险的复杂多变的环境，人类无法涉足，因此人们也迫切希望有能够代替人类的机器人出现，高适应性多功能化的机器人也必将是机器人的发展方向之一。 (3)通用服务型的机器人。随着科学技术的发展，机器人也是应该越来越容易融入人们日常生活中的，在日常生活中为人们服务。例如在家庭中，机器人可以帮助人们做各种家务，和人们生活关系密切。 (4)特种智能移动机器人。根据不同应用领域，不同的目的，设计各种各样特种智能移动机器人是未来发展方向，如纳米机器人，宇宙探索机器人，深海探索机器人，娱乐机器人等等。 6 结束语总之，智能移动机器人涉及到传感器技术，控制技术，移动技术，信息处理、人工智能、控制工程等多学科技术。未来智能移动机器人走向生活，安全可靠，操作简单是其趋势。尽管智能移动机器人以惊人的速度在发展着，但是实现高适应性，智能化，情感化，多功能化的移动机器人还有很长的路要走。参考文献： [1]谢进,万朝燕,杜立杰.机械原理(第2版)[M].北京:高等教育出版社,2010. [2]陈国华.机械机构及应用[M].北京:机械工业出版社,2008. [3]徐国保,尹怡欣,周美娟.智能移动机器人技术现状及展望[J].机器人技术与应用,2007(2). [4]肖世德,唐猛,孟祥印,等.机电一体化系统监测与控制[M].四川:西南交通大学出版社,2011. 机器人的科技论文篇二：《浅谈机器人设计方法》摘要：机器人是人类完成智能化中非常重要的工具，随着时代的发展，机器人已经在世界有了一定的发展，甚至很多国家机器人已经运用到实际的生活中去。而机器人的设计方法无疑是很多人非常感兴趣的问题，因此本文针对机器人的设计方法进行了详细的探索。关键词机器人;设计;方法 1.前言纵观人类的发展史，工具的进步才能带动人类的文明，如今设计朝着智能化的方向在发展，机器人就是人类在发展智能化过程洪重要的产物，因此机器人常用的设计方法是设计师们必备的工具。 2.控制系统的硬件设计在现代科学技术不断发展的背景之下，工业现场所涉及到的重体力劳动量不断提升。当中部分劳动任务的实现单单依靠人力是很难实现的。而为了良好的完成工业现场的相关生产作业任务。就需要通过对机器人装置的研究与应用来实现机器人控制系统的硬件部分主要由5个模块组成：控制模块、循迹模块、避障模块、电机驱动模块、电源模块。 (1)控制系统模块。ATmega128为基于AVR RISC结构的8位低功耗CMOS微处理器，运算速度快，具有多路PWM输出，可将测速、避障等电路产生的输入信号进行处理，并输出控制信号给驱动放大电路，从而控制电机转速，此方式产生的PWM信号比用定时器中断产生的PWM信号实时性更好，而且不会占用系统的定时器资源。 (2)循迹模块。循迹是指小车在比赛场地上循白色引导线线行走，循迹模块的原理图如图2所示。循迹模块采用灰度传感器，发射管为普通LED灯，接收管为光敏三极管3DU33。工作原理为：不同颜色的物体对LED发射光反射不同的亮度，光敏三极管3DU33接收这些不同亮度的光线，就会呈现不同的电压Vx。Vx输入到比较器LM339的同相端，并与电位器设定的电压V0相比较，当Vx>V0时，比较器输出高电平，当Vx循迹机器人前后两端均是由7个灰度传感器组成的循迹模块。其中，中间三个灰度传感器起巡线的作用，两端的灰度传感器起探测弯道作用，剩下两个灰度传感器交替进行巡线和探测弯道。实验证明，这样的灰度传感器的布置图，机器人循迹的效果好，且“性价比”非常高。 (3)避障模块。避障模块主要使用的是红外发射接收传感器，当红外感应避障模块靠近物体时，输出低电平信号;当没有感应到物体时，输出高电平信号。将该信号线接入到单片机的控制端口，控制程序就能起到探测障碍物的作用，当在机器人行进的路径上就可以发现有障碍物并及时避开绕行。 (4)驱动模块。循迹避障机器人要求行走灵活、反应快速，因此要求驱动电机具有“转速快、制动及时”等特点。我们设计制作的循迹避障机器人采用中鸣公司的JMP-BE-3508I驱动板模块，其输入电压为11V到24V，最大输出电流为20A，满足快速前进、制动、转弯的要求。并且电机速度达到500rpm，堵转力矩为8KG.CM，具有很强的刹车功能。利用单片机的四路PWM输出信号，分别控制四个轮子的转速。并采用“四轮驱动”、“差速转弯”的方式实现机器人的前进、后退与转弯。 (5)电源模块。循迹机器人的电源模块主要实现以下三大功能：①稳定输出5V工作电压。故我们设计制作的电源模块以7805芯片为核心，把输入电压截止到5V。②提供足够的电流。7805芯片最大输出电流为1.5A，而循迹机器人需要较大电流，所以我们使用了两片7805芯片分别对控制系统和外部设备进行供电。③滤波。在7805芯片的输入、输出端分别并联104贴片电容和10μF的电解电容，过滤高频、低频信号。 3.软硬件模块开发流程和界面程序 (1)图像处理模块：照相机实时捕捉图像，处理转化后和初始图像进行处理比较，找出图像中差异的位置通过TCP传输。 (2)TCP通信模块：视觉系统通过以太网连接贝加莱控制器，控制器可以作客户机或服务器实时传输数据，：定义结构体用于视觉系统传输位姿给机器人和机器人实时反馈位姿和信号状态数据给视觉系统。 (3)位置转换模块：把视觉系统的位姿转换为机器人的位姿传输给机器人，控制机器人运行。 (4)轨迹规划模块：进行运动轨迹规划和速度规划，根据机器人当前的位置和目标位置，选择最优的运动轨迹(直线、圆弧、不规则曲线等运动轨迹)，然后对轨迹、速度进行插补，插补值调用机器人运动学算法计算轨迹的可靠性，再把实时插补的位置、速度传送给运动控制模块。 (5)运动控制模块：根据实时插补的值结合加速度、加加速度等控制参数给驱动器。 (6)伺服模块：根据控制器所发送数据，结合各伺服控制参数，驱动电机以最快响应和速度运行到各个位置。 4.机器人精度标定和视觉软件处理 4.1精度标定精度的标定包括机器人精度标定和机器人相对于视觉照相机位置标定。机器人运动前，需要用激光跟踪仪标定准确各轴杆长、零点、减速比、耦合比等机械参数，给运动学、控制器系统，机器人才能按理论轨迹运行准确。行到指定点。通过三点法、六点法标定机器人相对于视觉照相机的X、Y、Z方向距离给位置转化模块，确定机器人坐标系相对于照相机坐标系的转化关系。 4.2视觉处理软件包括固定视觉系统标定模块和移动视觉系统标定模块。视觉系统安装在固定位置相当于给机器人建立照相机一个用户坐标系，此模块用于运算机器人和固定视觉系统之间位姿转换关系。视觉系统安装在机器人末端法兰位姿相当于给机器人建立照相机一个工具坐标系，随着机器人运动而实时改变位置，此模块用于运算机器人和动态视觉系统之间位姿转换关系。实时处理传输机器人、视觉系统和以太网的运行通信状态以及出错状态处理。 4.3人机界面设计及实现当机器人出现故障，不能自动移动位置时，比如碰到硬件限位或出现碰撞现象时，此时可以进入手动页面，选择机器人操作，移动机器人到指定位置。对于新建码垛工艺线，需要配置系统参数、位置信息、以及产品参数，等必要的信息。码垛数据编辑与创建的功能，产品覆盖了袋子、箱子，以及可变数量抓取的功能。可以添加产品数量，改变产品方向，单步数量修改，产品位置移动以及旋转等设置。本页面中，示例生成了每层五包的袋装产品，编号从1到5，可以通过调整编号的顺序，达到改变产品的实际码垛顺序。 5.结束语总之，在进行机器人的设计过程中，要根据设计的用途进行针对性的设计，对于设计过程中出现的问题要及时的采用上述的思维方法进行解决，随着机器智能化的推广，无疑机器人的设计在未来会有更广阔的天空。参考文献： [1]张海平，陈彦. Wincc在打包机人机界面中的设计与应用[J].HMI与工业软件，2012(3)：70-72. [2]朱华栋，孔亚广.嵌入式人机界面的设计[J].中国水运，2008(11)：125-126. [3]金长新，李伟.基于Windows CE的车载电脑系统人机界面的实现[J].微计算机信息，2005(21)：132-134. 机器人的科技论文篇三：《浅谈igm焊接机器人的故障处理》 [摘要]机器人技术综合了计算机、控制理论、机构学、信息和传感技术、人工智能等多学科而形成的高新技术。本文通过介绍igm焊接机器人的工作原理，以及在实际工作中机器人的常见故障现象，对故障产生的原因进行分析，并提出了相应的维修方法。 [关键词]igm焊接机器人工作原理故障处理 0 前言机器人技术是综合了计算机、控制理论、机构学、信息和传感技术、人工智能等多学科而形成的高新技术。这门新型技术的介入，对维修技术人员提出了更高要求。如何保证焊接机器人的可靠性、稳定性，发挥机器人的最大优势，针对机器人的故障维修及设备维护保养工作就尤显重要。 1 igm焊接机器人组成及工作原理 1.1 igm焊接机器人的组成 igm焊接机器人是从事焊接(包括切割与喷涂)的工业机器人，它加工精细、动作灵巧、焊接精度高、焊缝成形好。在机械行业中得到了广泛的应用。 1.2 igm焊接机器人工作原理 igm焊接机器人内部轴控制原理：通过数字伺服板DSE-IBS处理当前位置的校准、位置驱动、速度驱动等信息，处理后的信息送馈到伺服驱动器，由伺服驱动器内部的脉宽调制器调制，然后放大输出推动伺服电机。伺服电机运动的同时，编码器同步运行，并把采集的位置角度信息反馈给RDW控制板，通过RDW板的增量计算、数据整定后的位置信息回馈给DSE-IBS板，做下一个周期的计算处理，此过程反复进行从而实现了实时位置的更迭过程。 2 igm焊接机器人故障诊断及分析 2.1 焊接机器人故障类型焊接机器人故障类型可分为软件故障和硬件故障，由机器软件造成的故障，如系统停机死机的现象;由机器硬件造成的故障，如驱动单元、电气元件各模块的故障。就故障现象可分为人为故障和自然故障、突发故障三大类。对于维修来说，自然故障和突发故障的排除就显得困难，因为这种维修不仅仅针对故障单元本身，还要对系统进行改进，这就需要周密分析，对故障诊断进行优化和改进，避免排除过的故障重复出现，使系统进一步稳定可靠。 2.2 igm焊接机器人常见故障处理 2.2.1 机器人开机后示教器无报警信息，但机械手无法正常引弧。首先检查系统是否送丝送气，发现送丝系统无法手动送丝，保护气瓶有压力，但是焊枪喷嘴处无保护气。再检查机械手焊接电缆、引弧板及送丝板，都没有发现故障。这说明机械手的功能是正常的，可能是焊接回路不通畅。可以通过测量焊接回路阻抗来判断焊接回路是否正常。回路阻抗的测试步骤： i把连接工件的地线接好，保证地线夹与工件接触部分干净良好; ii接通机器人电柜电源，将福尼斯焊机电源开关拨至“I”位置; iii在焊机二级菜单内选择“r”功能。 iv取下焊枪喷嘴，拧上导电嘴，将导电嘴贴紧工件表面。需要注意的是，测量过程中要确保导电嘴与工件接触处的洁净。测量进行时，送丝机和冷却系统不启动; v轻按焊枪开关或点动送丝键。焊接回路阻抗值测算完成。测量过程中，右显示屏显示“run”; vi焊接回路测算结束后显示屏显示测量值。测得的焊接回路阻抗是18 Ω(正常值以<20Ω为佳)，说明焊接机器人的焊接回路的通畅的。再断电、通电调试，焊接机器人能正常引弧，应该是回路测试过程中通过连接接地夹、拆卸喷嘴、导电嘴等将回路未正常接触处接通了。 2.2.2 igm机器人在焊接过程中，引弧困难、焊接电流极不稳定，且经常断弧，反复出现“Arc fault”电弧故障。 i检查接地电缆，测量回路电阻值为9.7Ω，正常值以<20Ω为佳。 ii检查焊丝直径(Ф1.2)与送丝轮的公称直径相匹配。 iii焊丝材料(G2Si)与焊接方式及焊接母材相匹配。 iv后观察焊枪喷嘴处，存在大量粉尘的切粉，手动送出的焊丝不光滑平整，有小量弯曲及伤丝情况，说明送丝不畅。 v对送丝阻力进行检测。将送丝锁紧杆、压紧杆打开，手盘焊丝盘将焊丝收回，发现阻力很大。多为送丝软管堵塞或软管与机械手夹角过大造成。 vi检查送丝轮磨损情况，V型送丝槽不易过深过宽，以正好放置一根Ф1.2规格的焊丝为佳，间隙过大，将影响送丝的稳定性，焊接电流的稳定性。拆下送丝轮，发现送丝轮磨损严重，圆度误差较大，送丝槽过深。送丝机构一旦出现失控，就会高速送丝，焊接电源得不到正常的信号反馈(送丝速度的反馈采用光电测速)，不能提供稳定的电流、电压，造成不能正常焊接。更换送丝轮、送丝软管，并进行压力调整，故障解除，焊接正常。 2.2.3 igm机器人回零参数自动丢失。igm机器人在下一次开机时，回零参数自动丢失，重新校零、输入参数，保存参数反复丢失。检查示教电缆、接口、程序、轴卡、RDW板指示灯全部正常，检查后备电池(缓冲电瓶，用于关机或意外掉电情况下，为系统提供短时间供电，进行信息的存储)测量电压值，一个为8.9V，一个为12 V，总电压为21 V，正常值为24V，更换一组电池后一切正常，再未出现数据丢失现象。 2.3 突发故障的分析及处理该故障无可预见性，事发突然。实际工作中出现最多。多为受环境影响的系统故障，如焊接机器人控制部分电路板故障、稳压电源故障、通讯故障等，反映在机器人在工作时突然报警且无法消除报警。重新启动又恢复正常，但不久又出现报警，这类故障造成整个系统不稳定。为了进一步判断驱动器的好坏，缩小故障范围，对编码器进行检查，RCI系列的机器人各轴所使用的编码器是绝对编码器，它是一种电磁部件，可以传递旋转角度的信息，由两个固定绕组(sin绕组和cos绕组)及一个参考绕组组成，原理基本上同旋转变压器相似。将X12插头拔下，分别测量11-12、13-5、14-4端子阻值，结果没有一项有阻值，说明编码器出现异常。找到12轴伺服电机，检查发现编码器插头锁紧并帽已退出，插头连接松动。将插头重新安插，锁紧到位，再次测量11-12端子阻值为94Ω，13-5端子阻值为65Ω，14-4端子阻值为65Ω，9-10端子阻值为600Ω，说明各绕组正常。上电后，驱动可正常打开，故障解除。 3 结束语维修工作是理论指导实践，实践促进理论的一个反复过程，理论实践的有机结合才会使维修人员更加深入，更加准确的判断处理各种故障。工作中维修人员必须具有独立思考分析判断的能力，操作中一定要注意观察，不可盲目更改焊接机器人设定、跳线等状态，要养成做工作记录的好习惯，归纳总结各类故障现象以及处理过程，积累故障诊断和维修方面的经验，以提高维修水平。参考文献 [1] 戴光平.《焊接机器人故障诊断及维修技术》. 重庆：中国嘉陵工业股份有限公司，2003. [2] 中国焊接协会成套设备与专业机具分会. 《焊接机器人实用手册》.机械工业出版社，2014. [3] 李德民.《焊接机器人的故障维修》. 长春：长客股份制造中心，2011. 猜你喜欢： 1. 关于科技论文的范文 2. 关于计算机的科技论文3000字 3. 数学科技论文800字 4. 自动化科技论文题目与范文

数字化家庭是未来智能小区系统的基本单元。所谓“数字化家庭”就是基于家庭内部提供覆盖整个家庭的智能化服务，包括数据通信、家庭娱乐和信息家电控制功能。数字化家庭设计的一项主要内容是通信功能的实现，包括家庭与外界的通信及家庭内部相关设施之间的通信。从现在的发展来看，外部的通信主要通过宽带接入。intenet，而家庭内部的通信，笔者采用目前比较具有竞争力的蓝牙(bluetootlh)无线接入技术。传统的数字化家庭采用pc进行总体控制，缺乏人性化。笔者根据人工情感的思想设计一种配备多种外部传感器的智能机器人，将此智能机器人视作家庭成员，通过它实现对数字化家庭的控制。本文主要就智能机器人在数字化家庭医疗保健方面的应用进行模型设计，在智能机器人与医疗仪器和控制pc的通信采用蓝牙技术。整个系统的成本较低，功能较为全面，扩展应用非常广阔，具有极大的市场潜力。2 智能机器人的总体设计 2．1 智能机器人的多传感器系统机器人智能技术中最为重要的相关领域是机器人的多感觉系统和多传感信息的集成与融合[1]，统称为智能系统的硬件和软件部分。视觉、听觉、力觉、触觉等外部传感器和机器人各关节的内部传感器信息融合使用，可使机器人完成实时图像传输、语音识别、景物辨别、定位、自动避障、目标物探测等重要功能；给机器人加上相关的医疗模块(ccd、camera、立体麦克风、图像采集卡等)和专用医疗传感器部件，再加上医疗专家系统就可以实现医疗保健和远程医疗监护功能。智能机器人的多传感器系统框图如图1所示。 2．2 智能机器人控制系统机器人控制系统包含2部分：一是上位机，一般采用pc，它完成机器人的运动轨迹规划、传感器信息融合控制算法、视觉处理、人机接口及远程处理等任务；二是下位机，一般采用多单片机系统或dsp等作为控制器的核心部件，完成电机伺服控制、反馈处理、图像处理、语音识别和通信接口等功能。如果采用多单片机系统作为下位机，每个处理器完成单一任务，通过信息交换和相互协调完成总体系统功能，但其在信号处理能力上明显有所欠缺。由于dsp擅长对信号的处理，而且对此智能机器人来说经常需要信号处理、图像处理和语音识别，所以采用dsp作为智能机器人控制系统的控制器[2]。控制系统以dsp(tms320c54x)为核心部件，由蓝牙无线通信、gsm无线通信(支持gprs)、电机驱动、数字罗盘、感觉功能传感器(视觉和听觉等)、医疗传感器和多选一串口通信(rs-232)模块等组成，控制系统框图如图2所示。 (1)系统通过驱动电机和转向电机控制机器人的运动，转向电机利用数字罗盘的信息作为反馈量进行pid控制。 (2)采用爱立信(ericsson)公司的rokl01007型电路作为蓝牙无线通信模块，实现智能机器人与上位机pc的通信和与其他基于蓝牙模块的医疗保健仪器的通信。 (3)支持gprs的gsm无线通信模块支持数据、语音、短信息和传真服务，采用手机通信方式与远端医疗监控中心通信。 (4)由于tms320c54x只有1个串行口，而蓝牙模块、gsm无线模块、数字罗盘和视觉听觉等感觉功能传感器模块都是采用rs一232异步串行通信，所以必须设计1个多选一串口通信模块进行转换处理。当tms320c54x需要蓝牙无线通信模块的数据时通过电路选通；当t~ms320c54x需要某个传感器模块的数据时，关断上次无线通信模块的选通，同时选通该次传感器模块。这样，各个模块就完成了与1~ms320c54x的串口通信。3 主要医疗保健功能的实现智能机器人对于数字化家庭的医疗保健可以提供如下的服务： (1)医疗监护通过集成有蓝牙模块的医疗传感器对家庭成员的主要生理参数如心电、血压、体温、呼吸和血氧饱和度等进行实时检测，通过机器人的处理系统提供本地结果。 (2)远程诊断和会诊通过机器人的视觉和听觉等感觉功能，将采集的视频、音频等数据结合各项生理参数数据传给远程医疗中心，由医疗中心的专家进行远程监控，结合医疗专家系统对家庭成员的健康状况进行会诊，即提供望(视频)、闻、问(音频)、切(各项生理参数)的服务[3]。 3．1机器人视觉与视频信号的传输机器人采集的视频信号有2种作用：提供机器人视觉；将采集到的家庭成员的静态图像和动态画面传给远程医疗中心。机器人视觉的作用是从3维环境图像中获得所需的信息并构造出环境对象的明确而有意义的描述。视觉包括3个过程： (1)图像获取。通过视觉传感器(立体影像的ccd camera)将3维环境图像转换为电信号。 (2)图像处理。图像到图像的变换，如特征提取。 (3)图像理解。在处理的基础上给出环境描述。通过视频信号的传输，远程医疗中心的医生可以实时了解家庭成员的身体状况和精神状态。智能机器人根据医生的需要捕捉适合医疗保健和诊断需求的图像，有选择地传输高分辨率和低分辨率的图像。在医疗保健的过程中，对于图像传送有2种不同条件的需求： (1)医生观察家庭成员的皮肤、嘴唇、舌面、指甲和面部表情的颜色时，需要传送静态高清晰度彩色图像；采用的方法是间隔一段时间(例如5分钟)传送1幅高清晰度静态图像。 (2)医生借助动态画面查看家庭成员的身体移动能力时，可以传送分辨率较低和尺寸较小的图像，采用的方法是进行合理的压缩和恢复以保证实时性。 3．2机器人听觉与音频信号的传输机器人采集的音频信号也有2种作用：一是提供机器人听觉；二是借助于音频信号，家庭成员可以和医生进行沟通，医生可以了解家庭成员的健康状况和心态。音频信号的传输为医生对家庭成员进行医疗保健提供了语言交流的途径。机器人听觉是语音识别技术，医疗保健智能机器人带有各种声交互系统，能够按照家庭成员的命令进行医疗测试和监护，还可以按照家庭成员的命令做家务、控制数字化家电和照看病人等。声音的获取采用多个立体麦克风。由于声音的频率范围大约是300hz一3400hz，过高或过低频率的声音在一般情况下是不需要传输的，所以只用传送频率范围在1000hz-3000hz的声音，医生和家庭成员就可以进行正常的交流，从而可以降低传输音频信号所占用的带宽，再采用合适的通信音频压缩协议即可满足实时音频的要求。智能机器人的听觉系统如图3所示。3．3各项生理信息的采集与传输传统检测设备通过有线方式连到人体上进行生理信息的采集，各种连线容易使病人心情紧张，从而导致检测到的数据不准确。使用蓝牙技术可以很好地解决这个问题，带有蓝牙模块的医疗微型传感器安置在家庭成员身上，尽量使其不对人体正常活动产生干扰，再通过蓝牙技术将采集的数据传输到接收设备并对其进行处理。在智能机器人上安装1个带有蓝牙模块的探测器作为接收设备，各种医疗传感器将采集到的生理信息数据通过蓝牙模块传输到探测器，探测器有2种工作方式：一是将数据交给智能机器人处理，提供本地结果；二是与internet连接(也可以通过gsm无线模块直接发回)，通过将数据传输到远程医疗中心，达到医疗保健与远程监护的目的。视频和音频数据的传输也采用这种方式。智能机器人的数据传输系统如图4所示。 4 蓝牙模块的应用 4．1蓝牙技术概况蓝牙技术[4]是用于替代电缆或连线的短距离无线通信技术。它的载波选用全球公用的2．4ghz(实际射频通道为f=2402 k×1mhz，k=0，1，2，…，78)ism频带，并采用跳频方式来扩展频带，跳频速率为1600跳/s。可得到79个1mhz带宽的信道。蓝牙设备采用gfsk调制技术，通信速率为1mbit/s，实际有效速率最高可达721kbit/s，通信距离为10m，发射功率为1mw；当发射功率为100mw时，通信距离可达100m，可以满足数字化家庭的需要。 4．2蓝牙模块 rokl01007型蓝牙模块[5]是爱立信公司推出的适合于短距离通信的无线基带模块。它的集成度高、功耗小(射频功率为1mw)，支持所有的蓝牙协议，可嵌入任何需要蓝牙功能的设备中。该模块包括基带控制器、无线收发器、闪存、电源管理模块和时钟5个功能模块，可提供高至hci(主机控制接口)层的功能。单个蓝牙模块的结构如图5所示。 4．3主，从设备硬件组成蓝牙技术支持点到点ppp(point-t0-point pro-tocol)和点对多点的通信，用无线方式将若干蓝牙设备连接成1个微微网[6]。每个微微网由1个主设备(master)和若干个从设备(slave)组成，从设备最多为7台。主设备负责通信协议的动作，mac地址用3位来表示，即在1个微微网内可寻址8个设备(互联的设备数量实际是没有限制的，只不过在同一时刻只能激活8个，其中1个为主，7个为从)。从设备受控于主设备。所有设备单元均采用同一跳频序列。将带有蓝牙模块的微型医疗传感器作为从设备，将智能机器人上的带有蓝牙模块的探测器作为主设备。主从设备的硬件主要包括天线单元、功率放大模块、蓝牙模块、嵌入式微处理器系统、接口电路及一些辅助电路。主设备是整个蓝牙的核心部分，要完成各种不同通信协议之间的转换和信息共享，以及同外部通信之间的数据交换功能，同时还负责对各个从设备的管理和控制。 5 结束语随着社会的进步，经济的发展和人民生活水平的提高，越来越多的人需要家庭医疗保健服务。文中提出的应用于数字化家庭医疗保健服务的智能机器人系统的功能较为全面，且在家用智能机器人、基于蓝牙技术的智能家居和数字化医院等方面的拓展应用非常广阔，具有极大的市场潜力。更多论文请到文秘杂烩网采纳哦

我的论文，基于STM32的多关节机器人设计，图文详细，绝对满足你的需求

网页链接

索引序列
国外机器视觉识别研究现状论文
国外视觉形象设计研究现状论文
识别技术国外研究现状论文
国外数字识别研究现状论文
机器人视觉研究论文
返回顶部

国外机器视觉识别研究现状论文