中国传统的室内设计融合了庄重与优雅双重气质。现在的中式风格更多地利用了后现代手法,把传统的结构形式通过重新设计组合以另一种民族特色的标志符号出现。例如,厅里摆一套明清式的红木家具,墙上挂一幅中国山水画等,传统的书房里自然少不了书柜、书案以及文房四宝。 中式风格的客厅具有内蕴的风格,为了舒服,中式的环境中也常常用到沙发,但颜色仍然体现着中式的古朴,中式风格这种表现使整个空间,传统中透着现代,现代中揉着古典。这样就以一种东方人的“留白”美学观念控制的节奏,显出大家风范,其墙壁上的字画无论数量还是内容都不在多,而在于它所营造的意境。可以说无论现在的西风如何劲吹,舒缓的意境始终是东方人特有的情怀,因此书法常常是成就这种诗意的最好手段。这样躺在舒服的沙发上,任千年的故事顺指间流淌。中国风并非完全意义上的复古明清,而是通过中式风格的特征,表达对清雅含蓄、端庄丰华的东方式精神境界的追求。中国传统的室内设计融合了庄重与优雅双重气质。现在的中式风格更多地利用了后现代手法,把传统的结构形式通过重新设计组合以另一种民族特色的标志符号出现。例如,厅里摆一套明清式的红木家具,墙上挂一幅中国山水画等,传统的书房里自然少不了书柜、书案以及文房四宝。 中式风格的客厅具有内蕴的风格,为了舒服,中式的环境中也常常用到沙发,但颜色仍然体现着中式的古朴,中式风格这种表现使整个空间,传统中透着现代,现代中揉着古典。这样就以一种东方人的“留白”美学观念控制的节奏,显出大家风范,其墙壁上的字画无论数量还是内容都不在多,而在于它所营造的意境。可以说无论现在的西风如何劲吹,舒缓的意境始终是东方人特有的情怀,因此书法常常是成就这种诗意的最好手段。这样躺在舒服的沙发上,任千年的故事顺指间流淌。一是中国传统文化在现代背景下的演绎;一是在对中国当代文化的充分理解基础上的当代设计。中式风格并不是元素的堆砌,而是通过对传统文化的理解和提炼,将现代元素与传统元素相结合,以现代人的审美需求来打造富有传统韵味的空间,让传统艺术在当今社会得以体现。中式风格在设计上继承了唐代、明清时期家居理念的精华,将其中的经典元素提炼并加以丰富,同时摒弃原有空间布局中等级、尊卑等封建思想,给传统家居文化注入了新的气息。中国风并非完全意义上的复古明清,而是通过中式风格的特征,表达对清雅含蓄、端庄丰华的东方式精神境界的追求。中式风格的特点,是在室内布置、线形、色调以及家具、陈设的造型等方面,吸取传统装饰“形”、“神”的特征,以传统文化内涵为设计元素,革除传统家具的弊端,去掉多余的雕刻,糅合现代西式家居的舒适,根据不同户型的居室,采取不同的布置。中国传统居室非常讲究空间的层次感。这种传统的审美观念在中式风格中,又得到了全新的阐释:依据住宅使用人数的不同,做出分隔的功能性空间,采用“哑口”或简约化的“博古架”来区分;在需要隔绝视线的地方,则使用中式的屏风或窗棂。通过这种新的分隔方式,单元式住宅就能展现出中式家居的层次之美。中国风的构成主要体现在传统家具(多为明清家具为主)、装饰品及黑、红为主的装饰色彩上。室内多采用对称式的布局方式,格调高雅,造型简朴优美,色彩浓重而成熟。中国传统室内陈设包括字画、匾幅、挂屏、盆景、瓷器、古玩、屏风、博古架等,追求一种修身养性的生活境界。中国传统室内装饰艺术的特点是总体布局对称均衡,端正稳健,而在装饰细节上崇尚自然情趣,花鸟、鱼虫等精雕细琢,富于变化,充分体现出中国传统美学精神。中国风并非完全意义上的复古明清,而是通过中式风格的特征,表达对清雅含蓄、端庄丰华的东方式精神境界的追求。
说唱音乐是曲艺艺术的一个重要组成部分,音乐是说唱艺术的主要表现手段之一,也是区别各个不同曲种的重要标志。说唱艺术的另一个特点,那就是它们中的多数早期都是农民艺术。
由于曲种的流行地域不同、流传的阶层的审美观念不同,以及南北文化差异,就形成了南北说唱艺术风格上的差异。
少数民族的曲艺音乐具有着强烈的地方色彩和群众性、民族性。其中很多曲种是说唱本民族历史故事的,它的唱词往往就是史诗,唱腔吟诵性强,节奏鲜明而平稳,具有返璞归真的凝重色彩和恢宏雄浑的风格。
浅析现代标志中的文字创意摘要:文字不仅是标志设计中的重要组成部分,而且是最能发挥人聪明才智的设计载体。文字在标志中的具体应用,不仅仅是作为视觉形式的表现,更是一种具有深层含义的精神内涵,展示了这个时代多彩多姿的精神风貌。现代标志中的文字更是一种文化的载体,承载着标志主体赋予它的伟大使命。关键字:汉字 字母 数字 综合 书法 民族 在这个信息化的时代,文字从来没有象现在一样呈现出如此蓬勃的生命力,从丰富的商品到精彩的电视节目,以及街头缤纷夺目的广告……文字及其符号包围了我们,无处不在。文字不仅是标志设计中的重要组成部分,而且是最能发挥人聪明才智的设计载体。在数字化迅速发展的今天,字体符号无疑具有更强的艺术表现力和视觉感染力。通常所讲的文字设计,包括汉字型、字母型、数字型。字体作为人类传达思想的一种视觉符号,本身就包含有特定的造型意念。以文字构成的标志,文字既是语言信息的载体,又是具有视觉识别符号特征的符号系统。文字不仅表达概念,同时也通过视觉的方式传递信息,具备了传达语言概念和强化视觉识别的双重功能,因此普遍为设计者及其客户所看好。汉字型汉字经历了上下数千年的发展与演化,有着博大精深的文化内涵和异乎寻常的艺术魅力,本身就是一个内涵深广的宝藏。中国文字久远的历史,文字结构、虚实、承转的规律具有独特的美学特征,自身的图案美,通过笔划、结构加以美化、变形、夸张、组织等就能创造出形式感强烈、个性鲜明独特的标志来。现举例分析:王国伦教授的92国际拍卖会标志源于汉字“拍”的字体形象,运用标准字体,只是将“白”字一撇重构处理,就传达了一锤定音的专业性形象。简洁明快,凝练概括。中国铁路的标志设计也是笔简意周,将“工人”二字作艺术处理,合而为一呈符号图形,几乎不需任何多余的赘饰,简明扼要描绘了火车头和铁轨端面的形象。王粤飞先生为香格里拉干红设计的标志,直接用汉字“香格里拉”构成,只用藏文形态加以处理,就传达了醒目的效果,既揭示了藏族文化内涵,同时又形成一种全新的视觉感受。汉字是表达思想语言的符号,同时也是一门独特的艺术。中国的汉字起源于“图画文字”,从一开始就有着形象的依据性和高度概括的标识性,并且在不同时期有不同的传统形式、地方风格、民族特征,大大地丰富着标志的表现形式,其特有的造型语言越来越多地在标志设计中有所体现。今天的汉字形式早已发展为一门形式独特,并可鉴赏把玩、陶冶性情的书法艺术。从字体上的草、隶、篆、行等,另有民间的云、水、如意纹等象形文字,都是我们进行创意的源泉,是其他任何文字无可比拟的优势,充分利用和开发,就能创造出民族性与时代感高度统一的标志。 字母型随着我国设计行业与国际化接轨的步伐加快,字母标志应用也日渐广泛,正大显身手施展着不可替代的魅力。英文26个字母作为设计师发挥创意的源头,其几何形的外部形态,变化多端,可塑性极强。运用到标志设计中,常常构思巧妙、造型独特。每个字母皆可单独设计成标志,利用字母内空间变化,笔划变异、装饰等手法,丰富其造型。尤其多字母组合更具有表现力和挑战性,通过各种技巧运用组成庞大气势,来表达预期的构思意图,比如局部视觉焦点,文字组合图形,重复韵律感等。韩家英先生为新大洲设计的标志,以企业英文名称首写字母“S”为设计要素,简洁富有变化,粗犷的“S”代表了新大洲的坚实基础和实干精神,与“S”相连的弧线,仿佛大鹏展翅,冲击力强烈,标明新大洲公司勇于挑战的信心和勇气。广东银城酒店的标志是由陈汉民教授设计的,取“S”为造型元素,涵盖了Satisfactory(满意),Silvery(银),Safe(安全)。整体又似连环的“S”,寓意国家、集体和个人全面发展,阴文 “H”则代表Hotel(酒店)之意。标志简约易懂且内涵丰富。 应用字母的标志创意,重点在字体的个性和编排设计上,形式创造要突破常规,依据字母各自的性格特征,对其进行相应的夸张美化,以独特的图形符号再现,增强其联想性特征,才会给人们带来丰富的审美感受。 数字型阿拉伯数字作为一种世界通用的语言符号,可以超越各民族语系的障碍,正在今天的国际舞台上发挥越来越重要的作用。数字型标志的应用,主要以阿拉伯数字为主,尤其是0-9这十个数字,简洁而易于变换,加以造型变化运用到标志设计中,具有很强的表现力,风格独特,形态变化无穷。操作中常要根据美术字的造型,辅以图形化的联想与发挥,去达到良好的视觉效应。 数字型标志尤其大量运用于企业周年喜庆和各种纪念活动等题材,为提升人们对标志记忆值发挥着重要功效。这方面的典范有:第九届全国美展的标志,以四个“9”字为创意主线,其概念取向为1999年的第九届,四个“9”同时寓意中华人民共和国诞辰于1949年,四个“9”又组成一朵绽放的花蕾,象征“美”的盛宴。书法用笔来表现“美术”的特征,主题明显。著作权70周年活动,以汉字“著”为设计题材,将“土”和“日”结合,加入了数字“70”的元素,稍加变化,便使主题一目了然,简单明了,效果突出。 综合型 标志设计以形达意,以意造形,手法不拘一格。综合型是指文字、图形相结合的一种形式,有汉字与图形的组合,也有字母或数字,要适时选择合适的搭配。有一定相近的文字和图案的结合会更容易进入境界,利于随心所欲达到自己的目标。这种综合应用是字和图的共存共生,兼顾两者形象,都要有识别性,是在似与不似之间追求标志设计的最高境界,也恰是其趣味之处。这方面的成功案例不胜枚举:香港著名设计师靳埭强的任白慈善基金标志,以“任白”两字为切入点,这是源于粤剧大师任剑辉与白雪仙的纪念基金。“任”、“白”两字具有图形意蕴。另有演戏用的扇子,表示两层汉字:第一是扇子作为一种道具,可以借以象征戏曲;第二是“扇形”与“善心”谐音,两扇重叠代表任、白两个的共同心愿。标志以字与图的完美结合很好的渲染了主体思想。高中羽教授的北奇神茶标志,以汉字“北”为主要设计元素,并用西方的形象素材进行改造,使“北”字的身上长出天使的翅膀,形成字图合一的形象,贴切自然。 中国传统书法的应用中国书法是中国传统图形艺术中最辉煌的冠冕,是中国的国粹,它的构成不过是几种简单的墨色线条,然而确是“造型之造型,抽象之抽象,动静之交汇,时空之凝聚,自我之至深至微的表现。”(李砚祖)。书法艺术是从观察自然界万物姿态得到启示,靠了单纯的线条架构,匠心结体而成,经过几千年的发展,演绎出千变万化的视觉艺术形象,形成了不同的个性与风格。如隶书端庄古雅、楷书工整秀丽;行书活泼欢畅、草书飞动流转。从某种意义说,中国汉字的演化历史,就是中国人运用线形设计艺术的历史。在今天,这种线形设计已经走向全世界,成为许多艺术家和设计师常常借鉴的艺术创造手法。靳埭强先生是其中很有成就的一位,他的许多标志作品,都有中国书法艺术的渗透,甚至把书法直接用于设计中。比如“丽晶酒家”,运用三个六角形的“日”字组成一个“晶”字造型,代表盛载佳肴的盘子,而盘中的美味则是用三笔墨色来表现的,同时又是“日”字的一横,揭示了酒店中式口味的经营特色。“一品廊”也是以毛笔书写的“一”字代表东方艺术,与英文首字母“A”结合,表现了画廊中西合璧的艺术风格。还有熟知的“喜之郎”果冻,标志采用草书字体、走势及大小安排,整体表达一种欢乐、喜悦的气氛。中国国际航空公司的标志、中国申奥会徽等,无不体现着中国书法艺术的精神源泉。傅抱石曾经说过:“中国艺术最基本的源泉是书法,对于书法若没有相当的认识与理解,那末,和中国一切的艺术可以说绝了姻缘。”中国书法艺术正是这样从古至今都在启发着、丰富着中国的艺术与设计,同时体现着老庄“弱之胜强,柔之胜刚”的思想,成为艺术家和设计师久用不衰的法宝 。 中国民族艺术的渗透 源远流长的中国文化,给我们留下了无数珍贵的文化遗产,彩陶纹饰、漆器、雕刻、民间绘画等,蕴涵着深厚的历史文化内涵;龙凤纹、如意纹、合耳兔等具有鲜明的民族特色和地域特征,反映了民族审美意识。倍受世界瞩目的北京2008申奥标志,整体结构是取自传统吉祥图案“盘长”,既体现了北京的“京”字,又是舞动的人,同时还蕴涵着中国结、五环的图形,体现了体育、奥运精神,使标志既有强烈的现代审美特征,又有浓郁的中国传统文化意味。恰到好处地传递出“中国结”和“运动员”两个动势与意象,并借以表达标志主题和传达人民的祝愿。 另外,中国邮政的标志也是很好地运用了传统图形来表现,其基本元素是中国古写的“中”字,并在此基础上,根据我国古代“鸿雁传书”这一典故,将大雁飞行的动势融入到标志的造型中。横与直的平行线,形与势互相结合,表达了服务千家万户的企业宗旨,以及快捷、准确、安全、无处不达的企业形象。中国极为丰富的传统图形资源在它的发展和演变中,以多样而又统一的格调,显示出独特并富有魅力的民族传统和民族精神,是设计师用之不竭的宝库。 另外还有花饰字体的浪漫优雅、飘逸灵动;变体字风格特异,视觉冲击力强等等。文字随着商业的发展,正在愈发展现出新的风采。近年现代印刷字体的出现,给字体设计提供了广阔的空间,而新的标志造型从简洁明了的现代派风格走向追求“自然、随意、繁复”的“后现代派”风格,更使文字的创意走向一个五彩缤纷的天地。文字源于生活,它的创意空间是极为广阔的,其在标志中的具体应用,不仅仅是作为视觉形式的表现,更是一种具有深层含义的精神内涵,展示了这个时代多彩多姿的精神风貌。从这个意义上讲,文字是一种文化的载体,承载着标志主体赋予它的伟大使命。
1、论文题目:要求准确、简练、醒目、新颖。2、目录:目录是论文中主要段落的简表。(短篇论文不必列目录)3、提要:是文章主要内容的摘录,要求短、精、完整。字数少可几十字,多不超过三百字为宜。4、关键词或主题词:关键词是从论文的题名、提要和正文中选取出来的,是对表述论文的中心内容有实质意义的词汇。关键词是用作机系统标引论文内容特征的词语,便于信息系统汇集,以供读者检索。 每篇论文一般选取3-8个词汇作为关键词,另起一行,排在“提要”的左下方。主题词是经过规范化的词,在确定主题词时,要对论文进行主题,依照标引和组配规则转换成主题词表中的规范词语。5、论文正文:(1)引言:引言又称前言、序言和导言,用在论文的开头。 引言一般要概括地写出作者意图,说明选题的目的和意义, 并指出论文写作的范围。引言要短小精悍、紧扣主题。〈2)论文正文:正文是论文的主体,正文应包括论点、论据、 论证过程和结论。主体部分包括以下内容:a.提出-论点;b.分析问题-论据和论证;c.解决问题-论证与步骤;d.结论。6、一篇论文的参考文献是将论文在和写作中可参考或引证的主要文献资料,列于论文的末尾。参考文献应另起一页,标注方式按《GB7714-87文后参考文献著录规则》进行。中文:标题--作者--出版物信息(版地、版者、版期):作者--标题--出版物信息所列参考文献的要求是:(1)所列参考文献应是正式出版物,以便读者考证。(2)所列举的参考文献要标明序号、著作或文章的标题、作者、出版物信息。
视觉传达学术论文篇二 视觉经验与视觉传达设计 [摘 要]观者的视觉经验对视觉信息的准确传达起着重要的作用。设计者应根据观者的视觉经验充分调动其视觉心理的能动反应,使其“所看”与“所知”同时发生感觉,从而积极主动地参与到设计作品的理解和感悟之中,让观者通过欣赏与设计者的审美体验相沟通,以此达到信息传达的目的。 [关键词]视觉传达;视觉经验;视觉心理 在 现代 设计中,视觉传达设计的主要功能是调动所有平面的因素,达到视觉传达准确的目的,同时给观众以视觉心理满足。当今,视觉传达的方式变得越来越复杂和发达,设计师在视觉传达设计中,应充分考虑受众群体的视觉心理,清醒地认识到信息接受者不是机械的、被动的受纳器,而是一个具有积极主动的内驱力的主体,只有在充分理解和掌握有关视觉心理的知识之后,才能更好地在更大的范围内发挥各种现代制作技术的优势。其中,观者的视觉经验对视觉信息的准确传达起着重要的作用。设计者应根据观者的视觉经验充分调动观者视觉心理的能动反应,使其“所看”与“所知”同时发生感觉,从而积极主动地参与到设计作品的理解和感悟之中,让观者通过欣赏与设计者的审美体验相沟通,以此来达到信息传达的目的。 一、视知觉与视觉经验 视知觉有时会受到视觉生理机能和生活文化经验积淀的同时作用。人的感觉并非先天固有的功能,没有体验过的东西可能无法感受到,而丰富的生活经验又有可能使某种感觉功能格外发达。视觉所感受到的不仅是眼前所见的信息,过去积累的信息也会参与 影响 。而且,由于生活环境、视觉经验、生活体验及专业知识的不同,对同一形式的认知会出现差异,这种差异来自生活和 社会 ,与先天的个性差异有所不同。正如阿恩海姆在《 艺术 与视知觉》一书中指出:“眼前所得到的经验,从来都不是凭空出现的,它是从一个人毕生所获取的无数经验当中 发展 出来的最新经验。因此,新的经验图式,总是与过去所知觉到的各种形状的记忆痕迹相联系。” 1.生理机能上的视觉体验 英国著名的视觉心 理学 家格利高里告诉我们:“对物体的视觉包含了许多信息来源。这些信息来源超出了我们注视一个物体时眼睛所接受的信息。它通常包括由过去经验所产生的对物体的认识。这种经验不限于视觉,可能还包括其他感觉。例如触觉、味觉、嗅觉,或者还有温度觉和痛觉。”由于生活经验的参与,视知觉还具有一种能动作用,“知觉不是简单的被刺激模式觉得的,而是对有效的资料能动地寻找最好的解释”。我们能从倒立的金字塔形上“看出”不稳定感,是来自对实物的印象。我们有了在斜面上的物体会滑落的生活经验,才能在看斜线时感觉到动感。在色彩构成中,白色分量“轻”,黑色分量“重”,红色使人兴奋、刺激,蓝色给人以沉静感,这些感觉同生活中对实物的感受经验也是大致吻合的。再如,我们能从以频闪式样制造的霓虹灯广告牌上看到字母、图案、花边等不停地移动,但实际上仅仅是灯光的时亮时灭,它们自身并没有运动。由于灯光迅速地相继在相距不太远的位置上出现时,会在人们的大脑皮层中产生某种生理短路,神经兴奋就从一个点迅速传向另一个点,与这样一个生理过程相对应的心理经验就是我们看到的同一个光点的位移。正如鲁道夫·阿恩海姆所说:“我们在不动的式样中感受到的‘运动’,就是大脑在对知觉刺激进行组织时激起的生理活动的心理对应物。这种运动性质就是视觉经验的性质,或者说,它与视觉经验密不可分……事实上,一切视觉现实都是视觉的活动造成的。只有视觉的活动,才能赋予视觉对象以表现性,也只有具有表现性的视觉对象,才可能成为艺术创造的媒介。” 因此,在视知觉的能动反应中,有着生理机能基础,虽有智性的成分,但又不同于理性判断。由于感知与经验上的相通,这种“所看”与“所知”同时发生感觉,密不可分。 2.文化经验的视觉体验 (1)个人文化经验的视觉体验。人的感觉能力一部分是先天的功能,也有一部分来自生活的体验和积累。不同的阅历和体验会导致感觉上的差异,专业素质的差别也会影响艺术感受。 人们在观看理解物体时,并不满足于把看到的东西“组织”成一种视觉意象,还要进一步把这个直接看到的形象与另一个形象联系起来。由于很多视象都是模棱两可的,可以按照各种不同的结构式样对其加以组织,所以在生活中就会出现有趣的现象:专家和外行人会看到不同的东西,不同的专家从中看到的东西也不相同。例如,美术中的三维空间感来源于生活与专业训练,没有受过美术专业训练的人,不可能在石膏像上看出诸多的“素描关系”。对于红色,观者会联想到革命或恐怖暴力,还有喜庆,这都取决于观者的阅历与体验。“只要头脑中预先形成了所观察目标的意象,不管在多么复杂变换的形状中,都能够将这些意象认出来,知觉对象能从以往的视觉经验中得到填充或补足。” 同样的道理,设计中各种不同的表现形式也不可能让所有的人都有所感悟,对于同一设计作品,感受会有简单与丰富之分,体会也会有高下之别。一个人的现时观察,总会受到以往所见、所闻、所知的影响,积累越多,感受就越丰富。这种潜在的经验图式对观察的影响,在设计活动中同样无时、无处不在。熟悉几何抽象画家蒙德里安绘画的观者一眼就能从服装设计大师依夫·圣·洛朗设计的时装中看出两者之间的联系,而不了解蒙德里安画风的观者则可能只是将它看成大格子式样。 过去的视知觉经验和知识修养有助于人们正确地观察面前的对象,也可以妨碍正确地观察,这取决于观者视知觉经验和知识修养的正确程度及水平高低,还有他们与观察对象的关系如何。 (2)集体 文化 经验的视觉体验。在人的视觉 心理中具备一种推论倾向,可以使不连贯的、有缺口的图形尽可能在视觉心理上得到弥补,格式塔心 理学 家称之为视知觉的“完结效应”。能否在视觉的“完结效应”中正确地“填补空白”是与观者的阅历、感悟、想象有关系的。大量事实表明,对色彩、形状的把握能力会随着观看者所在的物种、文化集团和受训练的不同而不同。这就是说,一个集团能理解的,另一个集团的成员就可能无法理解、把握、比较和记住它们。观者对对象越熟悉,填补的空白就越准确。正如贡布里希所说:“由于我们是生活在一个熟悉的 环境中,我们见到的事物总是与我们的预期相符,所以视觉的节省也就越来越增加了。”对此, 社会 学家BenedictAnderson也提出了“想象的共同体”这一概念,他认为 现代 民族国家的形成,源自在地球上不同地方的人类对身为一个命运共同体的集体想象。系统的印刷 语言、普及的新媒介(主要是报纸)以及共同的“受难经验”,乃促成“想象共同体”的要素。不经意间,我们的脑海中早已先入为主地为许多未曾谋面的事物定了性,想当然地认为它理应如此。这样一种知觉,其直感性是非常强的,它不是在一件物体和它的用处之间作某种联想,也不是对于某种东西的实际用途的理解,而是对一件因未经实际使用而看不到其功能的物体在视知觉中的直接“补足”或“完结”。 在视觉传达中,任何一种图形或符号的意义都会随着时间和地区的变化而变化。博厄斯在其《原始 艺术 》中提到:不同部落的美洲印地安人所赋予的某些基本图案的各种意义在很大程度上取决于他们不同的文化背景。文化背景的变化会引起人们对纹样的意义作出不同的解释,这种不同的解释反过来又会作用于纹样,使纹样发生进一步的变化。例如, 中国 古人素来喜欢莲花,它象征着高洁,出污泥而不染,尤其深得中国文人的喜爱。在佛教传入中国后,莲花更成了清净、圣洁、吉祥的象征,成为吉祥纹样“暗八宝”之一,各种艺术品中到处可以看到莲花的图案,与佛教有关的 建筑和建筑物的柱、柱础、砖、瓦等也都有用莲花作纹饰的。而在日本,莲花的意义却大相径庭,它是祭奠的象征。 基于这一点,设计师应充分考虑到观者所属集团的文化背景,在设计 内容 和对象的选择上应具有针对性,否则将导致观者视觉经验的认识混乱。 二、视觉经验与视觉传达对象 好的设计作品需要知己知彼。所谓知己,就是有从视觉主体方面了解人的视觉功能、 研究 感知过程的真实状态;所谓知彼,就是从视觉的对象方面认识形式的相对关系。 对设计而言,不仅仅是解决传播方式和传播速度 问题 ,更重要的是要传播有效的信息。传播有效、准确、可靠的信息是设计信息传播的首要法则,它是设计成功的重要保证。传播的对象是人和人群结构而成的受众群体。设计元素是否能引起观者视觉经验的共鸣,取决于刺激物的结构所拥有的力量与它唤起的有关记忆痕迹的力量相互作用的结果。在视觉传达中,设计是以单一的或连续的作品形式与受众进行对话,如何选择对话的焦点是传播成功与否的关键。观众通过与设计作品的接触(视感、听感、动感等途径),接受某种信息,随即他会以自己的生活经验和审美经验、以社会公众的标准、以生活本身作参照来检验这信息,从而对它作出准确与否、可靠与否的判断,决定是否接受该设计信息,并且以自己的态度 影响 身边的人们对该设计信息的态度。因而,将视觉传达设计的视觉表现置于特定文化背景中来感染受众的精神世界的确是一个不错的选择。 我们可以将东西方文化做一个比较。由于地域环境和人文环境不同,所以东西方形成了不同的文化价值观和不同的心理结构与审美心理,这种差异在视觉传达设计中有突出的表现。 例如:中国人有对万物祈福的心理,并由此形成了特有的吉祥文化,希望事物朝着美好的方向 发展 ,标志设计中有吉祥的寓意就容易被受众接受。中国联通公司的标志设计(见图?)就是针对人们吉祥如意的心理期待,标志中的“中国红”是蕴含着中国人几千年情结的颜色,无形中又增加了 企业 形象的亲和力,进一步拉近了与观者的距离。联通标志还采用中国古代盘长纹样的“同心结”图案,造型中的四个方形有四通八达、事事如意之意;六个圆形有路路相通、处处顺畅之意;标志中的十个空穴则有圆圆满满、十全十美之意。总之,无论从对称性还是偶数的讲究来说,该图案都洋溢着古老东方民族流传已久的吉祥气息。 正是基于对中国吉祥文化的认同,我们才拥有了许多喜闻乐见的、充满吉祥意味的晶牌名称,如恒源祥、金利来、金六福、万利达、永乐、旺旺、福满多等。同样,外国品牌进入中国市场也要入乡随俗,进行语言文字的文化适应,品牌的翻译要符合中国人的心理,如可口可乐、百事可乐、喜来登、吉百利、都乐等正是注意了这一点。当然,中国的吉祥用语包含着特定的民族文化内涵,在中国乃至全世界的华人圈内是老少皆知的,不需做过多的解释大家都心领神会。而其他文化背景的人们却因为风俗习惯、宗教信仰、思维方式等方面的不同,对事物的联想就会有很大差异,因此中国的某些吉祥物在一些西方国家就会引起误读。如白象、金龙、孔雀、喜鹊等品牌在国外就缺乏认同基础,这是由于白象在英美国家被视为中看不中用的东西,龙在西方许多国家被视为恶魔与灾难的化身,孔雀在英、德、法等国被视为淫祸之鸟,喜鹊在 英语 里是指爱唠叨、饶舌的人,所以凡是出口商品用象、龙、孔雀、喜鹊等作为商标名称的都要音译或做其他处理,从而避免引起观者的误解与反感。 相同的视觉符号放在不同的文化背景中,它所表达的意思也不同,只有当知道在特定文化背景或特定阶段里使用的普通平凡的习俗化的程式时,人们才能把视觉符号的信息译释出来。如十字图形,在宗教中象征着上帝,在医疗中表示看护和更深层次的人类救护之爱,在数字中则理解为数据运用的加号。因此,设计者在为国际流通的商品设计时,要注意各地审美观念和价值观念的差异性,切忌把本国消费者的审美偏好和价值观念强加给目标市场国的消费者,以免造成沟通障碍。 在相同的文化背景和地理环境下,民族化、地域化的图形语言是人们了解和熟悉的,不需要任何解释,便于直接解读。设计师可用一种同构的思维方式,将图形语言折射到另一种与其有着某种联系的相通之处的事物上,并造成一种心理暗示,引导人们去联想、想象。心理预设因素显示,人的理解活动发生之前,存在某种根据生活经验而形成的心理期待,它事先设定了理解对象的应有面貌,这种心理定势常常在审视符号时将理解重心导向理解者本人所期待的方向。如,熟悉中国传统文化的观者,能很容易地从图2中领悟出书法、太极、砚台、篆刻、碑拓、章法之间的玄妙。 当然,视觉传达设计在体现民族化、地域化的同时,还应利用传统的、地域的图形语言优势来表现现代的精神观念,用解构的民族化图形与现代设计思想相结合,创造一种既有传统文化元素又具现代意识的形象,以独特的个性参与世界文化的发展。香港著名设计师靳埭强的作品就具有浓厚的东方文化色彩。他的构图结构稳健,画面清丽,色泽时而欢悦,时而雅致,立意隽永而弥满禅机。在作品中我们时时发现设计家对简约空灵的水墨语言精妙的阐释,还不时可见中国传统文人智慧与现代商业文明的和谐对话。如图3,设计中既有水墨、笛子等极具中国传统文化意蕴的视觉元素,又有西方设计的构成形式,简洁而意味深长。 综上所述,如果一幅画、一个图形、一种抽象的形式可以唤起观赏者丰富的审美感受,那是视觉“调动”了观者以往的生活体验和视觉经验并由专业知识参与的结果。因此,设计作品要想具有强大的感染力,设计者必须与观赏者所处的环境条件相适应,以观者的共有经验为根据,充分考虑到观赏者视觉心理的能动反应,与观赏者一道,把与传达信息有关的知、情、意等心理联系起来并统一到“一种经验”中,从而形成互动。 看了“视觉传达学术论文”的人还看: 1. 视觉传达专业论文 2. 视觉传达教学改革毕业论文 3. 视觉传达开题报告范文 4. 艺术设计中的视觉形象设计及其重要性研究论文 5. 2017高考视觉传达设计专业解读
传统的VI设计是静态的,以标准化的图形和颜色作为视觉传达的要素。但仔细观察可口可乐新的中文标识和包装,你会发现设计师在细微之处的调整:新包装及标志的红色背景中加入了暗红色的弧线,整体红色变得更有深度和动感,并产生了多维的透视效果。罐身包装的侧面设计了崭新的“气泡弧型瓶”,既保留了原有弧形瓶的原创性,又体现了新的动感效果。多层次的飘带图案,和飘带中的银色边线及飘带两侧的气泡更强调了活力和现代感。经过微妙的调整和添加,原有的视觉元素“活”了起来。设计师就是通过这种方法力图使设计突破二维媒介的局限,创造一种视觉上动态的效果。 我国的VI设计长期以来也是以一种静止和程式化的形态呈现的,缺乏新意和活力。其原因是设计观念上束缚太深。特别是标志设计,我们常将其理解为一张脸,好比IBM,造型和构成方式在不同的载体和环境中使用都具有一致性和稳定性。20世纪末,数字化媒体出现,社会环境也发生了质的变化。电脑技术在设计上的广泛应用挑战着艺术设计形式,同时也充实着设计的外延。多元化的视觉观念也暗示着新视觉传达方式将要打破传统设计门类的界限,让设计成为一种能融合多种学科的载体。许多设计师已经不再满足于原有VI设计仅局限在平面和静态的状况。尤其是在FLASH等简单而好用的动画软件面世后,各种动画形式的VI设计面世,也有在平面的媒介上表现超平面的动态效果的。总之VI打破了“静”的传统,逐步开始“动”了起来。国外类似的尝试早就在进行着。现在国外的标识设计早已打破传统规则,在静止的二维平面中加入“时间”和“表情”,在应用中丰富和灵活的展现。从可口可乐的VI变化上,我们可以感受到这一点。NIKE 、SONY公司设计的的推广片段更进一步证明了视觉传达设计由静态向动态的新走向。
刊名: 亚太传统医药 Asia-Pacific Traditional Medicine主办: 中国民族医药学会;湖北省科技信息研究院周期: 月刊出版地:湖北省武汉市语种: 中文;开本: 大16开ISSN: 1673-2197CN: 42-1727/R历史沿革:现用刊名:亚太传统医药创刊时间:2005查看本刊出版统计报表 | 同类期刊 | 本刊缺少以下刊期本刊出版汇总:20122011201020092008200720062005第12期第11期第10期第09期第08期第07期第06期第05期第04期第03期第02期第01期同类期刊本刊缺少以下刊期
《亚太传统医药》是正规期刊。它经国家新闻出版总署批准的,中国民族医药学会主办的国家级综合性医药期刊,国内外公开发行,创刊于2005年。详情欢迎对你有所帮助!
亚太传统医药杂志影响因子。《亚太传统医药》是由中国民族医药学会与湖北省科技信息研究院共同主办的优秀科技期刊,被中国期刊全文数据库收录。
1)中国儒家、道家为基干的古代思想文化2)书画文化3)茶文化4)婚嫁文化5)酒文化6)饮食文化7)姓氏文化8)园林建筑文化
中国,泱泱大国,一个有着五千年历史的文明古国,作为一个炎黄子孙,了解中国历史文化是理所当然的。在理解中国历史的过程中,《中华上下五千年》成为了我的良师益友。《中华上下五千年》讲的是五千年来中国——这个大国的改革和变迁,生动有趣地介绍了中国历史上重大的历史事件、重要的历史人物或历史现象。中华民族的历史源远流长,博大精深,从盘古开天到三皇五帝,再到中华民国,世事沧桑,历尽了数不胜数的悲凉与欢喜。中华民族已经有了五千多年的文明历史了,我们祖先所缔造的国家,是世界文明古国之一。中华民族是勤劳、勇敢、热爱自由、热爱和平的民族。我们的祖先,经过原始社会后,首先在人烟稠密、物产丰富的黄河一带的中原大地,建立了以华夏族为中心的多民族国家。从此,各族人民共同建造了中华文明的历史和灿烂的文化。其中,我最佩服的要数古代劳动人民的智慧,最典型的两个代表就是举世闻名的长城和秦兵马俑了。《中华上下五千年》汇集了人间的喜怒哀乐,酸甜苦辣,当读到越王勾践为过牺牲时我为他的满腔热血所振奋:当读到大禹治水时,我被大禹顽强的毅力和不怕困难的精神深深地打动了;当读到夏朝国君暴虐荒淫时,我的心中不禁生起团团怒火,为当时的平民百姓抱不平;当我读到清王朝腐败而签订一条条丧权辱国的不平等条约时,不时觉得心寒。上下五千年,好汉千千万。我们的祖先创造了灿烂的民族文化,我们的民族孕育了许多杰出的人物:如思想家孔子、民族英雄林则徐、文学家陶渊明、科学家张衡等,他们以优异的成绩为中华民族添光增彩。曾几何时,巴比伦、古罗马等国家和中国一样,有着灿烂的历史文化,但在科学技术高速发展的今天却失去了昔日的光泽,惟独中国——这条东方巨龙还闪耀着光辉,中华浩浩五千年创造了无数令人叹为观止的奇迹:世界上最大的皇宫是中国北京的故宫,世界上最高的宫殿是布达拉宫,世界上最早最全的医药书是李时珍的《本草纲目》,最早的兵书是春秋孙武的《孙子兵法》,最早的传记文学是西汉的《史记》……这些都凝聚着中华民族古代劳动人民智慧的结晶。历史是一座取之不竭的知识宝库,蕴藏着人类文明的光辉成果与高深的智慧。“读史使人明智”——这是英国哲学家培根在300多年前说过的一句话。的确,读史能让我头脑变得睿智,让心胸变得开阔,让目光变得敏锐,让志向变得高远,真正成为天地间一个大写的“人”。中华民族的历史上不知有过多少奇迹,我真为我是一个中国人而感到骄傲,为我们的祖国而感到骄傲!书中一个个生动的历史故事,一位位鲜活的历史人物,激励着我在今后的学习中一定要加倍地勤奋。我们在学习现代科技时,也要扎扎实实地学好我国的历史文化,我们要认识中华文化的博大精深,吸收民族文化智慧,尊重多样化,汲取人类优秀文化的营养。我们要继承和发扬中华民族的优秀文化传统,把上下五千年的灿烂文明代代相传,这就是我们义不容辞的责任。如果我的答案对您有帮助,请点击下面的“采纳答案”按钮,送咱一朵小红花鼓励下吧!祝您生活愉快!谢谢!
传统文化播神州,华夏文明永流传。本文整理了弘扬传统文化题目,欢迎阅读。
《永恒的传承》
《我们的骄傲》
《不破不立,无本五行》
《去芜存精》
《爱我中华》
《最令我感动的事》
《德随心动,心随我动》
《你懂得了吗》
《它将飘去哪里》
知儒道孝易,看学苑汶林。
培养中国魂,树立中国心。
传授东方经典,培训传统文化。
发扬优良传统,把握正确方向,坚持改革创新。
传播东方智慧,辉映卓越人生。
秉承祖先智慧,传播华夏文明。
弘扬中华优秀传统文化,培育和践行社会主义核心价值观。
传承弘扬文化,成就美好人生。
往事越千年,传承永不变。
传承东方典藏,智育华夏儿女。
这是文章,不是题目!??????
论文: EfficientDet: Scalable and Efficient Object Detection
目前目标检测领域,高精度的模型通常需要很大的参数量和计算量,而轻量级的网络则一般都会牺牲精度。因此,论文希望建立一个可伸缩的高精度且高性能的检测框架。论文基于one-stage的检测网络范式,进行了多种主干网络、特征融合和class/box预测的结构尝试,主要面临两个挑战:
FPN是目前最广泛的多尺度融合方法,最近也有PANet和NAS-FPN一类跨尺度特征融合方法。对于融合不同的特征,最初的方法都只是简单地直接相加,然而由于不同的特征是不同的分辨率,对融合输出特征的共享应该是不相等的。为了解决这一问题,论文提出简单但高效加权的bi-directional feature pyramid network(BiFPN),该方法使用可学习的权重来学习不同特征的重要性,同时反复地进行top-down和bottom-up的多尺度融合
论文认为除了缩放主干网络和输入图片的分辨率,特征网络(feature network)和box/class预测网络的缩放对准确率和性能也是很重要的。作者借鉴EfficientNet,提出针对检测网络的混合缩放方法(compound scaling method),同时对主干网络,特征网络和box/class预测网络的分辨率/深度/宽度进行缩放
最后,论文将EfficientNet作为主干,结合BiFPN和混合缩放,提出新的检测系列EfficientDet,精度高且轻量,COCO上的结果如图1,论文的贡献有以下3点:
定义多尺寸特征 ,论文的目标是找到变化函数 来高效融合不同的特征,输出新特征 。具体地,图2a展示了top-down FPN网络结构,一般FPN只有一层,这里应该为了对比写了repeat形式。FPN获取3-7层的输入 , 代表一个分辨率为 的特征层
top-down FPN操作如上所示, 为上采用或下采样来对齐分辨率, 通常是特征处理的卷积操作
top-down FPN受限于单向的信息流,为了解决这一问题,PANet(图2b)增加了额外的bottom-up路径的融合网络,NAS_FPN(图2c)使用神经架构搜索来获取更好的跨尺度特征网络的拓扑结构,但需要大量资源进行搜索。其中准确率最高的是PANet,但是其需要太多的参数和计算量,为了提高性能,论文对跨尺寸连接做了几点改进:
大多的特征融合方法都将输入特征平等对待,而论文观察到不同分辨率的输入对融合输出的特征的贡献应该是不同的。为了解决这一问题,论文提出在融合时对输入特征添加额外的权重预测,主要有以下方法:
, 是可学习的权重,可以是标量(per-feature),也可以是向量(per-channel),或者是多维tensor(per-pixel)。论文发现标量形式已经足够提高准确率,且不增加计算量,但是由于标量是无限制的,容易造成训练不稳定,因此,要对其进行归一化限制
,利用softmax来归一化所有的权重,但softmax操作会导致GPU性能的下降,后面会详细说明
,Relu保证 , 保证数值稳定。这样,归一化的权重也落在 ,由于没有softmax操作,效率更高,大约加速30%
BiFPN集合了双向跨尺寸的连接和快速归一化融合,level 6的融合操作如上, 为top-down路径的中间特征, 是bottom-up路径的输出特征,其它层的特征也是类似的构造方法。为了进一步提高效率,论文特征融合时采用depthwise spearable convolution,并在每个卷积后面添加batch normalization和activation
EfficientDet的结构如图3所示,基于one-stage检测器的范式,将ImageNet-pretrained的EfficientNet作为主干,BiFPN将主干的3-7层特征作为输入,然后重复进行top-down和bottom-up的双向特征融合,所有层共享class和box网络
之前检测算法的缩放都是针对单一维度的,从EfficientNet得到启发,论文提出检测网络的新混合缩放方法,该方法使用混合因子 来同时缩放主干网络的宽度和深度、BiFPN网络、class/box网络和分辨率。由于缩放的维度过多,EfficientNet使用的网格搜索效率太慢,论文改用heuristic-based的缩放方法来同时缩放网络的所有维度
EfficientDet重复使用EfficientNet的宽度和深度因子,EfficinetNet-B0至EfficientNet-B6
论文以指数形式来缩放BiFPN宽度 (#channels),而以线性形式增加深度 (#layers),因为深度需要限制在较小的数字
box/class预测网络的宽度固定与BiFPN的宽度一致,而用公式2线性增加深度(#layers)
因为BiFPN使用3-7层的特征,因此输入图片的分辨率必需能被 整除,所以使用公式3线性增加分辨率
结合公式1-3和不同的 ,论文提出EfficientDet-D0到EfficientDet-D6,具体参数如Table 1,EfficientDet-D7没有使用 ,而是在D6的基础上增大输入分辨率
模型训练使用momentum=和weight decay=4e-5的SGD优化器,在初始的5%warm up阶段,学习率线性从0增加到,之后使用余弦衰减规律(cosine decay rule)下降,每个卷积后面都添加Batch normalization,batch norm decay=,epsilon=1e-4,梯度使用指数滑动平均,decay=,采用 和 的focal loss,bbox的长宽比为 ,32块GPU,batch size=128,D0-D4采用RetinaNet的预处理方法,D5-D7采用NAS-FPN的增强方法
Table 2展示了EfficientDet与其它算法的对比结果,EfficientDet准确率更高且性能更好。在低准确率区域,Efficient-D0跟YOLOv3的相同准确率但是只用了1/28的计算量。而与RetianaNet和Mask-RCNN对比,相同的准确率只使用了1/8参数和1/25的计算量。在高准确率区域,EfficientDet-D7达到了,比NAS-FPN少使用4x参数量和计算量,而anchor也仅使用3x3,非9x9
论文在实际的机器上对模型的推理速度进行了对比,结果如图4所示,EfficientDet在GPU和CPU上分别有和加速
论文对主干网络和BiFPN的具体贡献进行了实验对比,结果表明主干网络和BiFPN都是很重要的。这里要注意的是,第一个模型应该是RetinaNet-R50(640),第二和第三个模型应该是896输入,所以准确率的提升有一部分是这个原因。另外使用BiFPN后模型精简了很多,主要得益于channel的降低,FPN的channel都是256和512的,而BiFPN只使用160维,这里应该没有repeat
Table 4展示了Figure 2中同一网络使用不同跨尺寸连接的准确率和复杂度,BiFPN在准确率和复杂度上都是相当不错的
Table 5展示了不同model size下两种加权方法的对比,在精度损失不大的情况下,论文提出的fast normalized fusion能提升26%-31%的速度
figure 5展示了两种方法在训练时的权重变化过程,fast normalizaed fusion的变化过程与softmax方法十分相似。另外,可以看到权重的变化十分快速,这证明不同的特征的确贡献是不同的,
论文对比了混合缩放方法与其它方法,尽管开始的时候相差不多,但是随着模型的增大,混合精度的作用越来越明显
论文提出BiFPN这一轻量级的跨尺寸FPN以及定制的检测版混合缩放方法,基于这些优化,推出了EfficientDet系列算法,既保持高精度也保持了高性能,EfficientDet-D7达到了SOTA。整体而言,论文的idea基于之前的EfficientNet,创新点可能没有之前那么惊艳,但是从实验来看,论文推出的新检测框架十分实用,期待作者的开源
论文:A Dual Weighting Label Assignment Scheme for Object Detection
[图片上传失败...(image-26dcc3-25)]
Anchor作为目标检测器训练的基础单元,需要被赋予正确的分类标签和回归标签,这样的标签指定(LA, label assignment)过程也可认为是损失权重指定过程。对于单个anchor的cls损失计算,可以统一地表示为:
[图片上传失败...(image-2e24aa-25)]
和 为正向权重和反向权重,用于控制训练的方向。基于这个设计,可以将LA方法分为两个大类:
[图片上传失败...(image-372b16-25)]
为了给检测器提供更多的监督信息,论文提出了新的LA方法DW(dual weighting),从不同的角度单独计算 和 并让其能够互补。此外,为了给权重计算函数提供更准确的reg分数,论文还提出了新的bbox精调操作,预测目标的边界位置并根据对应的特征产生更准确的精调信息。
由于NMS的存在,检测器应该预测一致的bbox,既有高分类分数也有准确的位置定位。但如果在训练时平等地对待所有的训练样本,而cls分数越高的预测结果的reg位置不一定越准确,这往往会导致cls head与reg head之间就会存在不一致性。为此,Soft LA通过加权损失来更柔和地对待训练样本,加强cls head与reg head的一致性。基于Soft LA,anchor的损失可以表示为:
[图片上传失败...(image-51f384-25)]
其中 为预测的cls分数。为一致性更高的预测结果分配更大的 和 ,能够使得网络专注于学习高质量的预测结果,减轻cls head与reg head的不一致问题。
[图片上传失败...(image-98093b-25)]
当前的方法直接将 设置为 ,主要关注如何定义一致性以及如何将其集成到损失权重中。表1总结了一些方法对 和 的计算公式,这些方法先定义用于度量一致性的指标 ,随后将 作为不一致性的度量指标,最后添加缩放因子将指标集成到损失权重中。 上述方法的 和 都是高度相关的,而论文认为pos和neg权重应该以prediction-aware的方式单独设置,具体如下:
通过上述定义, 对于pos权重相似的这种模棱两可的anchor,就可以根据不同的neg权重得到更细粒度的监督信息 。
[图片上传失败...(image-535eff-25)]
DW方法的整体流程如图2所示,先根据中心点距离来为每个GT构造候选正样本集,其余的anchor为候选负样本。由于负样本的统计信息十分混乱,所以不参与权重函数的计算。候选正样本会被赋予三个权重 、 以及 ,用于更有效地监督训练。
pos权重需要反映预测结果对检测性能的重要性,论文从目标检测的验证指标来分析影响重要性的因素。在测试时,通常会根据cls分数或cls分数与IoU的结合对单分类的预测结果进行排序,从前往后依次判断。正确的预测需满足以下两点:
上述条件可认为是选择高ranking分数以及高IoU的预测结果,也意味着满足这两个条件的预测结果有更大概率在测试阶段被选择。从这个角度来看,pos权重 就应该与IoU和ranking分数正相关。首先定义一致性指标 ,用于度量两个条件的对齐程度:
[图片上传失败...(image-aac9d-25)]
为了让不同anchor的pos权重的方差更大,添加指数调节因子:
[图片上传失败...(image-3a2156-25)]
最终,各anchor的pos权重会根据对应GT的候选anchor的pos权重之和进行归一化。
pos权重虽然可以使得一致的anchor同时具有高cls分数和高IoU,但无法区分不一致anchor的重要程度。如前面图1所示,anchor D定位校准但分类分数较低,而anchor B恰好相反。两者的一致性程度 一致,pos权重无法区分差异。为了给检测器提供更多的监督信息,准确地体现anchor的重要程度,论文提出为两者赋予更清晰的neg权重,具体由以下两部分构成。
根据COCO的验证指标,IoU不满足阈值的预测结果一律归为错误的检测。所以,IoU是决定achor为负样本的概率的唯一因素,记为 。由于COCO使用的IoU阈值来计算AO,所以 应该满足以下规则:
[图片上传失败...(image-639b1e-25)]
任意 上单调递减的函数都可以作为 中间部分。为了简便,论文采用了以下函数:
[图片上传失败...(image-fa54fb-25)]
公式6需要穿过点 和 ,一旦 确定了,参数 和 可通过待定系数法确定。
[图片上传失败...(image-83052a-25)]
图3展示了不同 下的 曲线。
在推理时,ranking队列中靠前的neg预测结果虽然不会影响召回率,但会降低准确率。为了得到更高的性能,应该尽可能地降低neg预测结果的ranking分数。所以在训练中,ranking分数较高的neg预测结果应该比ranking分数较低的预测结果更为重要。基于此,定义neg预测结果的重要程度 为ranking分数的函数:
[图片上传失败...(image-1f95aa-25)]
最终,整体的neg权重 变为:
[图片上传失败...(image-851912-25)]
与 负相关,与 正相关。对于pos权重相同的anchor,IoU更小的会有更大的neg权重。在兼容验证指标的同时, 能给予检测器更多的监督信息。
pos权重和neg权重都以IoU作为输入,更准确的IoU可以保证更高质量的训练样本,有助于学习更强的特征。为此,论文提出了新的box精调操作,基于预测的四条边的偏移值 进行下一步的精调。
[图片上传失败...(image-98246a-25)]
考虑到目标边界上的点有更大的概率预测准确的位置,论文设计了可学习的预测模块,基于初步的bbox为每条边生成边界点。如图4所示,四个边界点的坐标定义为:
[图片上传失败...(image-a8361b-25)]
其中, 为精调模块的输出。最后,结合边界点的预测和精调模块的输出,最终精调后的anchor偏移 为:
[图片上传失败...(image-935c8b-25)]
DW策略可直接应用到大多数的dense检测器中。论文将DW应用到FCOS中并进行了少量修改,将centerness分支和分类分支合并成cls分数,网络的损失为:
[图片上传失败...(image-5d0fc-25)]
[图片上传失败...(image-1a38af-25)]
这里的 跟公式3是同一个, 和 分别为候选anchor数和非候选anchor数。
[图片上传失败...(image-20568e-25)]
平衡超参数对性能的影响。
[图片上传失败...(image-14e2fa-25)]
候选anchor选择方法对性能的影响。第一种为中心点的距离阈值,第二种选择最近的几个,第三种为距离权重与pos权重乘积排序。
[图片上传失败...(image-74467a-25)]
neg权重计算方式对比。
[图片上传失败...(image-8baa09-25)]
LA研究之间的对比。
[图片上传失败...(image-9d2740-25)]
与SOTA检测算法对比。
论文提出自适应的label assignment方法DW,打破了以往耦合加权的惯例。根据不同角度的一致性和非一致性指标,动态地为anchor分配独立的pos权重和neg权重,可以更全面地监督训练。此外,论文还提出了新的预测框精调操作,在回归特征图上直接精调预测框。
深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。 目标检测可以理解为是物体识别和物体定位的综合 ,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置。 2014年R-CNN算法被提出,基本奠定了two-stage方式在目标检测领域的应用。它的算法结构如下图 算法步骤如下: R-CNN较传统的目标检测算法获得了50%的性能提升,在使用VGG-16模型作为物体识别模型情况下,在voc2007数据集上可以取得66%的准确率,已经算还不错的一个成绩了。其最大的问题是速度很慢,内存占用量很大,主要原因有两个 针对R-CNN的部分问题,2015年微软提出了Fast R-CNN算法,它主要优化了两个问题。 R-CNN和fast R-CNN均存在一个问题,那就是 由选择性搜索来生成候选框,这个算法很慢 。而且R-CNN中生成的2000个左右的候选框全部需要经过一次卷积神经网络,也就是需要经过2000次左右的CNN网络,这个是十分耗时的(fast R-CNN已经做了改进,只需要对整图经过一次CNN网络)。这也是导致这两个算法检测速度较慢的最主要原因。 faster R-CNN 针对这个问题, 提出了RPN网络来进行候选框的获取,从而摆脱了选择性搜索算法,也只需要一次卷积层操作,从而大大提高了识别速度 。这个算法十分复杂,我们会详细分析。它的基本结构如下图 主要分为四个步骤: 使用VGG-16卷积模型的网络结构: 卷积层采用的VGG-16模型,先将PxQ的原始图片,缩放裁剪为MxN的图片,然后经过13个conv-relu层,其中会穿插4个max-pooling层。所有的卷积的kernel都是3x3的,padding为1,stride为1。pooling层kernel为2x2, padding为0,stride为2。 MxN的图片,经过卷积层后,变为了(M/16) x (N/16)的feature map了。 faster R-CNN抛弃了R-CNN中的选择性搜索(selective search)方法,使用RPN层来生成候选框,能极大的提升候选框的生成速度。RPN层先经过3x3的卷积运算,然后分为两路。一路用来判断候选框是前景还是背景,它先reshape成一维向量,然后softmax来判断是前景还是背景,然后reshape恢复为二维feature map。另一路用来确定候选框的位置,通过bounding box regression实现,后面再详细讲。两路计算结束后,挑选出前景候选框(因为物体在前景中),并利用计算得到的候选框位置,得到我们感兴趣的特征子图proposal。 卷积层提取原始图像信息,得到了256个feature map,经过RPN层的3x3卷积后,仍然为256个feature map。但是每个点融合了周围3x3的空间信息。对每个feature map上的一个点,生成k个anchor(k默认为9)。anchor分为前景和背景两类(我们先不去管它具体是飞机还是汽车,只用区分它是前景还是背景即可)。anchor有[x,y,w,h]四个坐标偏移量,x,y表示中心点坐标,w和h表示宽度和高度。这样,对于feature map上的每个点,就得到了k个大小形状各不相同的选区region。 对于生成的anchors,我们首先要判断它是前景还是背景。由于感兴趣的物体位于前景中,故经过这一步之后,我们就可以舍弃背景anchors了。大部分的anchors都是属于背景,故这一步可以筛选掉很多无用的anchor,从而减少全连接层的计算量。 对于经过了3x3的卷积后得到的256个feature map,先经过1x1的卷积,变换为18个feature map。然后reshape为一维向量,经过softmax判断是前景还是背景。此处reshape的唯一作用就是让数据可以进行softmax计算。然后输出识别得到的前景anchors。 另一路用来确定候选框的位置,也就是anchors的[x,y,w,h]坐标值。如下图所示,红色代表我们当前的选区,绿色代表真实的选区。虽然我们当前的选取能够大概框选出飞机,但离绿色的真实位置和形状还是有很大差别,故需要对生成的anchors进行调整。这个过程我们称为bounding box regression。 假设红色框的坐标为[x,y,w,h], 绿色框,也就是目标框的坐标为[Gx, Gy,Gw,Gh], 我们要建立一个变换,使得[x,y,w,h]能够变为[Gx, Gy,Gw,Gh]。最简单的思路是,先做平移,使得中心点接近,然后进行缩放,使得w和h接近。如下:我们要学习的就是dx dy dw dh这四个变换。由于是线性变换,我们可以用线性回归来建模。设定loss和优化方法后,就可以利用深度学习进行训练,并得到模型了。对于空间位置loss,我们一般采用均方差算法,而不是交叉熵(交叉熵使用在分类预测中)。优化方法可以采用自适应梯度下降算法Adam。 得到了前景anchors,并确定了他们的位置和形状后,我们就可以输出前景的特征子图proposal了。步骤如下: 1,得到前景anchors和他们的[x y w h]坐标。 2,按照anchors为前景的不同概率,从大到小排序,选取前pre_nms_topN个anchors,比如前6000个 3,剔除非常小的anchors。 4,通过NMS非极大值抑制,从anchors中找出置信度较高的。这个主要是为了解决选取交叠问题。首先计算每一个选区面积,然后根据他们在softmax中的score(也就是是否为前景的概率)进行排序,将score最大的选区放入队列中。接下来,计算其余选区与当前最大score选区的IOU(IOU为两box交集面积除以两box并集面积,它衡量了两个box之间重叠程度)。去除IOU大于设定阈值的选区。这样就解决了选区重叠问题。 5,选取前post_nms_topN个结果作为最终选区proposal进行输出,比如300个。 经过这一步之后,物体定位应该就基本结束了,剩下的就是物体识别了。 和fast R-CNN中类似,这一层主要解决之前得到的proposal大小形状各不相同,导致没法做全连接。全连接计算只能对确定的shape进行运算,故必须使proposal大小形状变为相同。通过裁剪和缩放的手段,可以解决这个问题,但会带来信息丢失和图片形变问题。我们使用ROI pooling可以有效的解决这个问题。 ROI pooling中,如果目标输出为MxN,则在水平和竖直方向上,将输入proposal划分为MxN份,每一份取最大值,从而得到MxN的输出特征图。 ROI Pooling层后的特征图,通过全连接层与softmax,就可以计算属于哪个具体类别,比如人,狗,飞机,并可以得到cls_prob概率向量。同时再次利用bounding box regression精细调整proposal位置,得到bbox_pred,用于回归更加精确的目标检测框。 这样就完成了faster R-CNN的整个过程了。算法还是相当复杂的,对于每个细节需要反复理解。faster R-CNN使用resNet101模型作为卷积层,在voc2012数据集上可以达到的准确率,超过yolo ssd和yoloV2。其最大的问题是速度偏慢,每秒只能处理5帧,达不到实时性要求。 针对于two-stage目标检测算法普遍存在的运算速度慢的缺点, yolo创造性的提出了one-stage。也就是将物体分类和物体定位在一个步骤中完成。 yolo直接在输出层回归bounding box的位置和bounding box所属类别,从而实现one-stage。通过这种方式, yolo可实现45帧每秒的运算速度,完全能满足实时性要求 (达到24帧每秒,人眼就认为是连续的)。它的网络结构如下图: 主要分为三个部分:卷积层,目标检测层,NMS筛选层。 采用Google inceptionV1网络,对应到上图中的第一个阶段,共20层。这一层主要是进行特征提取,从而提高模型泛化能力。但作者对inceptionV1进行了改造,他没有使用inception module结构,而是用一个1x1的卷积,并联一个3x3的卷积来替代。(可以认为只使用了inception module中的一个分支,应该是为了简化网络结构) 先经过4个卷积层和2个全连接层,最后生成7x7x30的输出。先经过4个卷积层的目的是为了提高模型泛化能力。yolo将一副448x448的原图分割成了7x7个网格,每个网格要预测两个bounding box的坐标(x,y,w,h)和box内包含物体的置信度confidence,以及物体属于20类别中每一类的概率(yolo的训练数据为voc2012,它是一个20分类的数据集)。所以一个网格对应的参数为(4x2+2+20) = 30。如下图 其中前一项表示有无人工标记的物体落入了网格内,如果有则为1,否则为0。第二项代表bounding box和真实标记的box之间的重合度。它等于两个box面积交集,除以面积并集。值越大则box越接近真实位置。 分类信息: yolo的目标训练集为voc2012,它是一个20分类的目标检测数据集 。常用目标检测数据集如下表: | Name | # Images (trainval) | # Classes | Last updated | | --------------- | ------------------- | --------- | ------------ | | ImageNet | 450k | 200 | 2015 | | COCO | 120K | 90 | 2014 | | Pascal VOC | 12k | 20 | 2012 | | Oxford-IIIT Pet | 7K | 37 | 2012 | | KITTI Vision | 7K | 3 | | 每个网格还需要预测它属于20分类中每一个类别的概率。分类信息是针对每个网格的,而不是bounding box。故只需要20个,而不是40个。而confidence则是针对bounding box的,它只表示box内是否有物体,而不需要预测物体是20分类中的哪一个,故只需要2个参数。虽然分类信息和confidence都是概率,但表达含义完全不同。 筛选层是为了在多个结果中(多个bounding box)筛选出最合适的几个,这个方法和faster R-CNN 中基本相同。都是先过滤掉score低于阈值的box,对剩下的box进行NMS非极大值抑制,去除掉重叠度比较高的box(NMS具体算法可以回顾上面faster R-CNN小节)。这样就得到了最终的最合适的几个box和他们的类别。 yolo的损失函数包含三部分,位置误差,confidence误差,分类误差。具体公式如下: 误差均采用了均方差算法,其实我认为,位置误差应该采用均方差算法,而分类误差应该采用交叉熵。由于物体位置只有4个参数,而类别有20个参数,他们的累加和不同。如果赋予相同的权重,显然不合理。故yolo中位置误差权重为5,类别误差权重为1。由于我们不是特别关心不包含物体的bounding box,故赋予不包含物体的box的置信度confidence误差的权重为,包含物体的权重则为1。 Faster R-CNN准确率mAP较高,漏检率recall较低,但速度较慢。而yolo则相反,速度快,但准确率和漏检率不尽人意。SSD综合了他们的优缺点,对输入300x300的图像,在voc2007数据集上test,能够达到58 帧每秒( Titan X 的 GPU ),的mAP。 SSD网络结构如下图: 和yolo一样,也分为三部分:卷积层,目标检测层和NMS筛选层 SSD论文采用了VGG16的基础网络,其实这也是几乎所有目标检测神经网络的惯用方法。先用一个CNN网络来提取特征,然后再进行后续的目标定位和目标分类识别。 这一层由5个卷积层和一个平均池化层组成。去掉了最后的全连接层。SSD认为目标检测中的物体,只与周围信息相关,它的感受野不是全局的,故没必要也不应该做全连接。SSD的特点如下。 每一个卷积层,都会输出不同大小感受野的feature map。在这些不同尺度的feature map上,进行目标位置和类别的训练和预测,从而达到 多尺度检测 的目的,可以克服yolo对于宽高比不常见的物体,识别准确率较低的问题。而yolo中,只在最后一个卷积层上做目标位置和类别的训练和预测。这是SSD相对于yolo能提高准确率的一个关键所在。 如上所示,在每个卷积层上都会进行目标检测和分类,最后由NMS进行筛选,输出最终的结果。多尺度feature map上做目标检测,就相当于多了很多宽高比例的bounding box,可以大大提高泛化能力。 和faster R-CNN相似,SSD也提出了anchor的概念。卷积输出的feature map,每个点对应为原图的一个区域的中心点。以这个点为中心,构造出6个宽高比例不同,大小不同的anchor(SSD中称为default box)。每个anchor对应4个位置参数(x,y,w,h)和21个类别概率(voc训练集为20分类问题,在加上anchor是否为背景,共21分类)。如下图所示: 另外,在训练阶段,SSD将正负样本比例定位1:3。训练集给定了输入图像以及每个物体的真实区域(ground true box),将default box和真实box最接近的选为正样本。然后在剩下的default box中选择任意一个与真实box IOU大于的,作为正样本。而其他的则作为负样本。由于绝大部分的box为负样本,会导致正负失衡,故根据每个box类别概率排序,使正负比例保持在1:3。SSD认为这个策略提高了4%的准确率 另外,SSD采用了数据增强。生成与目标物体真实box间IOU为 的patch,随机选取这些patch参与训练,并对他们进行随机水平翻转等操作。SSD认为这个策略提高了的准确率。 和yolo的筛选层基本一致,同样先过滤掉类别概率低于阈值的default box,再采用NMS非极大值抑制,筛掉重叠度较高的。只不过SSD综合了各个不同feature map上的目标检测输出的default box。 SSD基本已经可以满足我们手机端上实时物体检测需求了,TensorFlow在Android上的目标检测官方模型,就是通过SSD算法实现的。它的基础卷积网络采用的是mobileNet,适合在终端上部署和运行。 针对yolo准确率不高,容易漏检,对长宽比不常见物体效果差等问题,结合SSD的特点,提出了yoloV2。它主要还是采用了yolo的网络结构,在其基础上做了一些优化和改进,如下 网络采用DarkNet-19:19层,里面包含了大量3x3卷积,同时借鉴inceptionV1,加入1x1卷积核全局平均池化层。结构如下 yolo和yoloV2只能识别20类物体,为了优化这个问题,提出了yolo9000,可以识别9000类物体。它在yoloV2基础上,进行了imageNet和coco的联合训练。这种方式充分利用imageNet可以识别1000类物体和coco可以进行目标位置检测的优点。当使用imageNet训练时,只更新物体分类相关的参数。而使用coco时,则更新全部所有参数。 YOLOv3可以说出来直接吊打一切图像检测算法。比同期的DSSD(反卷积SSD), FPN(feature pyramid networks)准确率更高或相仿,速度是其1/3.。 YOLOv3的改动主要有如下几点:不过如果要求更精准的预测边框,采用COCO AP做评估标准的话,YOLO3在精确率上的表现就弱了一些。如下图所示。 当前目标检测模型算法也是层出不穷。在two-stage领域, 2017年Facebook提出了mask R-CNN 。CMU也提出了A-Fast-RCNN 算法,将对抗学习引入到目标检测领域。Face++也提出了Light-Head R-CNN,主要探讨了 R-CNN 如何在物体检测中平衡精确度和速度。 one-stage领域也是百花齐放,2017年首尔大学提出 R-SSD 算法,主要解决小尺寸物体检测效果差的问题。清华大学提出了 RON 算法,结合 two stage 名的方法和 one stage 方法的优势,更加关注多尺度对象定位和负空间样本挖掘问题。 目标检测领域的深度学习算法,需要进行目标定位和物体识别,算法相对来说还是很复杂的。当前各种新算法也是层不出穷,但模型之间有很强的延续性,大部分模型算法都是借鉴了前人的思想,站在巨人的肩膀上。我们需要知道经典模型的特点,这些tricks是为了解决什么问题,以及为什么解决了这些问题。这样才能举一反三,万变不离其宗。综合下来,目标检测领域主要的难点如下: 一文读懂目标检测AI算法:R-CNN,faster R-CNN,yolo,SSD,yoloV2 从YOLOv1到v3的进化之路 SSD-Tensorflow超详细解析【一】:加载模型对图片进行测试 YOLO C#项目参考: 项目实践贴个图。