手势识别技术论文

发布时间：2023-12-05 19:03

手势识别技术论文

虚拟现实(VR)是一种由计算机和电子技术创造的新世界，是一个看似真实的模拟环境，下面是我为大家精心推荐的关于虚拟现实的科技论文2500字，希望能够对您有所帮助。

直觉交互界面与虚拟现实

摘要：为了研发更高水准的直觉交互界面，有必要引入虚拟现实技术，借助具备沉浸性、交互性和想象性的人机交互环境来获得真正意义上的直觉体验。通过特定的物理器件装置，以及先进的手势识别技术，使用者不必学习专门的操作命令，就可以与计算机进行交流并获得实时的反馈，而独特的沉浸式环境更能创造出人机一体的融合感。结果表明，虚拟现实技术有效地提升了用户的体验度，大大简化了操作的复杂性，而且可以应用于从娱乐到专业制造等各种场合，是直觉交互界面的有力驱动平台。

关键词：直觉交互;人机交互;虚拟现实

中图分类号：J0-05 文献标识码：A

本文是在“人―计算机” 交互(Human-Computer Interaction)的意义上来谈论“交互”。随着计算机技术几十年来突飞猛进的发展，计算机已经完全进入了日常生活的方方面面，其影响无处不在，人机之间的互动操作问题也越发显得重要。由于计算机尚未能摆脱冯・诺依曼体系的根本制约，与人类思维模式之间的鸿沟依然如同天堑，人机交互问题的一个重要着眼点就在于如何尽量地缩小人类使用者的操作模式与计算机的操作模式之间的差别。这意味着我们仍在不断地摸索和探讨，去提供更优秀的交互界面，使人可以顺畅地、高效率地与计算机进行对话。

一直以来，交互设计思维首要强调的就是以人为本，换而言之就是让设计物适应人，而非人适应设计物。这种观点在计算机还是国防机密的年代中显得有些奢侈，人们只能痛苦地训练自己去迎合机器(例如，使用完全机器式的编程语言与计算机交谈)。在当下，相对廉价的个人计算机都可以提供可观的计算能力，因此交互界面的设计原则也就顺应了这样的思路，去尽可能地将界面做得人性化，让人用得舒服，而繁重的计算则交给计算机在幕后默默地处理。

正是在这样的大背景下，“直觉”一词吸引了大家的目光。毕竟相对于日常物件，计算机的交互界面还是太不人性了，依旧保持着冰冷的面孔。如果能将我们习以为常的动作引入与计算机的交互之中，在不知不觉中将完成与计算机的沟通，那么这样的人机界面才能称得上是以人为本。而在呈现直觉界面方面，新兴的虚拟现实技术则提供了最有价值的工具。

本文正是拟探讨直觉交互界面及其与虚拟现实技术间的关系，为了完成这样的任务，首先我们要对人机交互意义上的直觉作出一个明确的定义，它实际上与大众文化中的“直觉”概念有着相当的差别。之后我们将谈论如何将上述意义上的直觉与虚拟现实结合起来，并提供具体的案例分析来支撑我们的探讨。

一、直觉交互界面

直觉(Intuition)这个概念属于大众词汇，但实际上不同的学科对直觉都有着不同的定义。本文研究的对象是人机交互，因此将在“凭着直觉去与计算机进行交互” (interaction with computer by intuition)这个上下文中去探讨它。首先要注意到，交互是双方面的，也即人与计算机在进行着双向的互动，但直觉却是人才能拥有的，也是仅仅用来修饰人的判断与感觉的，因此直觉人机交互关心的是以人为中心的交互场景中各参与元素对人是否直觉。从人的角度考虑交互界面，这实际也就奠定了“以人为本”在理论上的基础性质。

一般而言，人们对直觉的交互有着如下诉求：它不需要经过有意识的思考便能做出。例如在翻动一页书的时候，人不需要去有意识地考虑该用多大的力气，手指该走怎样的空间路线，或有意识地等待书页翻动之后出现的非常规情况并作出反应，等等。在这个意义上，一本实体书的交互界面是直觉的。依据以上诉求，Blackler等人的研究指出，直觉是“基于已往经验的无意识的反应”[1]。这个定义强调了两个要点：基于以往经验和无意识。关于直觉往往是无意识的(下意识的)举动，这一点几乎已成共识，这里就不再展开论述。需要厘清的是“基于已往经验”这一点。

在日常生活中，人们或许并不认为直觉与已往经验之间会有什么关联。相反，许多人会认为，如果不需要经验就能进行某种操作，那么这种操作显然更符合直觉。特别地，中国传统文化中的“直觉”概念充满了反智主义的特征，直接将“直觉”与“本能”联系起来，往往意味着“不需要通过知识或经验便可以下意识地完成”。但这实际上是一种错误的观点，它不但误解了人的本能，而且未能认识到已往经验的真实存在及其影响。事实上，现代理论表明，人类绝大多数行动――简单的或复杂的――都是后天习得的，并非先天刻印于脑中。如果仅凭本能，人几乎无法完成什么人机交互操作：拿按钮这种最简单的人机界面元素来说，如果没有事先通过各种例子认识到存在按钮这种东西并且按下它之后会启动某些关联反应，使用者甚至都无法做出按下按钮的行为。或者用[2]的话来说，所有行动都承载着理论――后天习得的理论。

将直觉与已往经验联系起来，这不仅揭示了直觉在人机交互中的真正面貌，而且指出了设计人机交互界面时的一条基础准则：由于不同的人有着不同的生活经验与知识水平，那么他们的已有经验也是不同的，这也就意味着每种类型的人都有着他们对“直觉交互界面”的不同衡量标准。有一个简单的例子可以说明这一点。

考虑一款在电脑上运行的收音机软件，它的作用是播放网络上的各类实时音频流(包括传统电台的在线音频流)。图 1模拟半导体收音机的调频指针窗口，从传统眼光而论这样的界面便是直觉的。然而，对于没有用过半导体收音机的新一代年轻人而言，他们由于频繁地接触电脑，反而会觉得图2的界面是直觉的，因为这样的界面使用的是为电脑用户所熟知的UI(User Interface，用户界面)元素，包括菜单、按钮、列表框和滚动条等等。

习惯半导体收音机操作的用户多半用不惯新式界面，而习惯新式界面、没使用过半导体收音机的用户却很可能对传统界面不知所以。这个例子充分说明了，在考虑直觉交互界面的时候，必须考虑用户群体的已往经验，依据不同的已往经验去断定直觉因素。并不存在唯一的、普适的、通用的直觉界面，这给了设计师以极大的挑战，但同时也是极大的创新动力。　　此外，虽然直觉的定义没有直接体现对审美的考虑，但审美和直觉显然是互有关联的[3]。由于直觉使用与交互过程中唤起的先前知识有关，那么审美判断作为人类感知过程的起点之一，恰是诱发直觉的重要因素。一个富于美感的界面，可以抵消用户使用过程中的不安感和隔膜感，并在潜意识上促使和鼓励用户做出交互行为并保证交互行为的持续性和统一性。上面的例子也表明，对于传统用户，设计精美、极富质感的模拟界面有效地抵消了传统用户对电脑软件的不适感，方便他们使用，并且大大降低了潜在的学习成本。而对于年轻用户，他们也可以在自己熟悉的控件界面中运作自如，拉近了老技术(传统流媒体)与新技术间的距离。简而言之，具备良好审美特性的直觉界面具有重要的价值与意义，体现了人机交互界面的发展趋势。

二、直觉界面与虚拟现实

自上世纪70年代起，虚拟现实(Virtual Reality)技术的发展异常迅猛，从专业研究到商业应用乃至家用娱乐都可见其身影。从根本上而言，虚拟现实恰是交互界面直觉化的总趋势的一个反映，因为人机交互演进的内在逻辑在于，呈现和交互手段总在致力于让用户以更直观、更自然、更简便的操控方式去获得更丰富、更多态、更实时的数据资源。

简而言之，虚拟现实提供了一个具有沉浸性(Immersion)、交互性(Interaction)和想象性(Imagination)的虚拟数字富媒体环境;用户不仅可以如同设身处地一般沉浸在它所提供的丰富多彩的虚拟环境中，更可以通过各种创新的途径来与环境中的元素进行互动。沉浸性、交互性和想象性，正是虚拟现实的三个基本特征[4]：一是沉浸性，通过各种技术手段让用户产生“身临其境”的感觉，包括视觉(利用人的立体视觉原理产生虚拟的三维纵深感)、听觉(利用立体声产生虚拟物体的方位感)、触觉(通过力觉设备使用户以为在与真实的物理实体打交道)等等;二是交互性，用户可以实时地与虚拟现实系统中的各种物体进行互动操作，用户的操作不再局限于传统的键盘、鼠标或游戏杆，还包括先进的数据手套、穿着式回馈服等等;三是想象性，给用户呈现的虚拟现实场景具有超越现实场景的特殊魅力，真正做到某种意义上的“心想事成”。

从虚拟现实的上述特征可以看出，它的基本出发点就是要超越传统人机交互界面的非人性化的一面，不仅要让用户尽量溶入整个交互场景中(沉浸性)，而且要让用户以更直觉的方式去操作计算机(交互性)：首先，虚拟现实技术能够有效地将计算机交互界面直觉化，提供与日常场景尽量类似的界面，完全基于人类日常的视觉直觉。其次，虚拟现实技术能够有效地消除人机交互之间的阻隔，让用户能够通过日常的动作和行为与计算机交互。

从上文的概念分析可知，判定直觉程度要看与使用者本身的已知经验，而且使用情境和审美等其他因素也要考虑在内。虚拟现实技术本身提供了多种多样的方法，但具体的构建和应用也要遵循这样的准则。下一节将提供几个应用案例来说明这些，并综合讨论如何真正地利用虚拟现实技术去设计直觉交互界面。

三、应用案例及讨论

以虚拟现实技术为基础的直觉交互界面被广泛应用于各种层次、各种领域的实践应用之中，其目标用户群体不仅包括非专业人士(普通民众)，也包括熟悉计算机但希望寻求更直观的交互操作方式的专业人士。对于前者，他们需要能够尽量降低学习和记忆成本、兼或附带娱乐趣味性的人机界面。而对于后者，操控感良好的直觉界面可以大大提升生产率和成品率，并推动整个生产流程的优化。

日本大阪大学人机工程实验室的伊藤雄一等人研发了ActiveCube(动态积木)[5]，这个作品将直觉界面引入儿童和青少年认知学习及娱乐之中，并辅以虚拟现实或增强现实设备以提升其应用价值。每个积木都是一个边长五厘米的塑料立方体;积木里面有一块可编程集成电路，控制着一系列可选的感应器或小型设备，包括超声感应器(感知外界物体的接近)、坐标感应器(三维坐标的相对角度)、触觉感应器(最多可装两个，每个可以感应八个方向的触觉)、红外感应器、灯和电动机等。因此，每个积木实际上已经是一个独立的玩具，可以感知环境并产生相应的动态行为。更绝妙的是，这些积木还能彼此连接，连接起来的各个部分之间也可以互相通信，构成整体行为。儿童使用者不需要额外教学就可以通过直觉使用它们。这样的直觉操作界面，很好地避免了其内部的复杂结构对使用者的影响，小学低年级学生就可以独立操作。

ActiveCube的一大特色在于可以在虚拟现实场景里使用。在这种情形中，红外感应器捕捉搭建好的积木形态，并将符合此形态的虚拟物品显示出来。应用了虚拟现实技术之后，规整的积木可以任意变换成为植物、动物、日常器具等，不仅视觉效果有可观的提升，还借此允许用户进行进一步的玩耍和操控。

ActiveCube还可以在虚拟现实场景里使用。在这种情形中，红外感应器捕捉搭建好的积木形态，并将符合此形态的虚拟物品显示出来。由于ActiveCube本身只是一个简单的立方体，其六面自由连接功能限制了表面的装饰性，最后的拼装效果不一定能吸引儿童用户的兴趣。而应用了虚拟现实技术之后，古板规整的积木可以任意变换成为植物、动物、日常器具等，不仅视觉效果有可观的提升，还借此允许用户进行进一步的玩耍和操控。在上面的例子中，外表相对简陋的十字架形积木摇身一变，可成为精美的飞机，并随着积木在实际环境中的位移而在现实设备上呈现相应的飞行轨迹。

另一个实例来自于工业设计领域。当下的设计师一般都有较高的学历和较专业的计算机技能，但进行三维产品建模的时候，复杂的软件界面依然是最重要的阻碍因素，更遑论键盘加鼠标的操控方式根本就与人手的自然行为大相径庭，严重干扰了设计师的思维和创作习惯。荷兰Delft大学工业设计工程团队在这方面进行了大量研究，提出了新的解决方案，其关键就在于引入直观的手势来与计算机交互，于虚拟现实环境中完成建模工作[6-7]。

一般而言，手势比面部表情和眼动更易于捕捉和识别，又比全身姿势更易于实施(特别是在狭小空间中)，因此比较受直觉界面研究者的青睐[8]409-420。但手势也分为几个细类，不一定都适合用于人机交互。Hummels指出了三类手势，第一类是从计算机角度去定义的手势，因而非常便于计算机识别，但需要使用者去刻意学习和掌握，称不上直觉。第二类与之相反，指的是人类日常生活中的手势，优点是非常直观，但计算机程序需要特别的设计才能对其进行识别。综合了以上两种类别之优点而又尽量规避其不足的第三类手势称为描述性手势，原本自身也有着应用范围过窄的缺憾，但辅以虚拟现实技术，便可以成为有效的途径以联通设计师和计算机。　　为了提高描述性手势的效果，研究人员特地设计了一个虚拟现实实验环境，见图3。在此环境中，普通设计师作为被试，不受拘束地使用他们惯常的手势进行设计创作，而这些以直觉为基础挥舞出来的手势被动作感应器记录下来，最后进行统计分析。通过这样的过程，研究人员能够采集到和分析出最适合虚拟现实环境的直觉手势。最后，对设计师而言非常直觉、对计算机而言又是相当便于识别的手势方案即可得到确定。设计师在此系统中，可以像往常操作日常物体(胶泥或板材等)一样与计算机辅助设计软件进行人机对话，不仅直觉高效，而且得益于虚拟现实环境，整个设计流程形同真实体验，大大提高了设计效率。

四、结论与展望

一直以来，“以人为本”都是人机交互设计领域的核心口号之一。但本文的分析指出，这绝不能是一句抽象的口号，而必须落实到具体的应用情境之中。另一方面，近年来关于“用户体验”的声音不绝于耳[9]，它本质上也是“以人为本”的精神的一种体现，但这个提法也存在着过于含糊的缺点，导致了许多不同的理论都以它为逻辑基础。实际上，只要明确了“人”(也即“用户”)的特定性，问题也就解决了。既然不同的人和不同的用户其自身情况多有差异，同样着眼于“以人为本”或“增进用户体验”的产品，也就必须随着人/用户的不同而给出不同的解决方案，提供不同的交互界面，才能在交互过程中让使用者满意。

直觉概念得到了厘清，但这显然并不意味着直觉交互设计的种种问题也就有了答案。如何让某种交互界面更少地占用使用者的逻辑意识(也即做到“无意识地或下意识地被使用”)，以及如何明确地定性定量分析特定用户的已往经验，并以之支持交互界面的设计，这依然是非常复杂的问题。幸而在各领域学者的努力下，此领域已有许多成功的理论或实践得以依循。在这方面最重要的一项就是关于直觉交互中的手势问题，它旨在解决人机交互场景中用什么有效的手势去操作计算机。由于手势不受传统输入设备的限制，它天然地与虚拟现实技术结合在一起[8]409-420。此外，针对现在方兴未艾的商业以及家用娱乐虚拟现实应用，直觉交互界面也是其中的研发热点。限于研究的深度及文章篇幅，本文遗憾地未能在这些方面展开论述，希望能在后继研究中逐步展开。

最后要强调的是，随着普适计算(ubiquitous computing)这个概念在强大的计算机硬件的支持下渐渐变为现实，设计和实现各种直觉交互界面已成为人机交互的核心任务。普适计算要求计算机设备可以感知周围环境的变化并执行相应的任务，在这一过程中如果交互界面做不到直觉易用，那么其计算机人性化的核心价值也就无从体现了。由此，直觉交互界面的理论与实践必将日益凸显其无比的重要性和关键性。

[参考文献]

[1] Blackler A，Popovic V，Mahar igating users' intuitive interaction with complex artefacts[J].Applied Ergonomics，2010，41(1)：72-92.

[2] 波普尔.猜想与反驳：科学知识的增长[M].傅季重，纪树立，周昌忠，等，译.杭州：中国美术学院出版社，2003.

[3] Naumann A，Hurtienne J，Israel J H，et ive use of user interfaces： defining a vague concept[M]∥HARRIS ering Psychology and Cognitive ：Springer-Verlag，2007：128-136.

[4] Alonso M A G，Gutierrez M A，Vexo F，et ng Into Virtual Reality[M].New York： Springer-Verlag New York Inc，2008.

[5] Watanabe R，Itoh Y，Kawai M，et entation of ActiveCube as an intuitive 3D computer interface[M]∥Butz A，Olivier Graphics. Berlin： Springer，2004：43-53.

[6] Hummels C，Overbeeke C J. Kinaesthesia in synaesthesia：the expressive power of gestures in design[C]∥Design and semantics of form and ven：Eindhoven University of Technology，2006：34-41.

[7] Hummels C，Smets G，Overbeeke Intuitive T-wo-handed Gestural Interface for Computer Supported Product Design： International Gesture Workshop[C].Bielefeld：Springer Verlag，1998.

[8] Nielsen M，Strring M，Moeslund T B，et al.A procedure for developing intuitive and ergonomic gesture interfaces for HCI[M]∥Gamurri A，Volpe e-Based Communication in Human-Computer ：Springer，2004：409-420.

[9] Garrett J elements of user experience[M].Berkeley，CA：New Riders，2002.

点击下页还有更多>>>关于虚拟现实的科技论文2500字

浅谈语音识别技术论文

语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务，对任何事都能够通过语音交互的方式。我整理了浅谈语音识别技术论文，欢迎阅读!

语音识别技术概述

作者：刘钰马艳丽董蓓蓓

摘要：本文简要介绍了语音识别技术理论基础及分类方式，所采用的关键技术以及所面临的困难与挑战，最后讨论了语音识别技术的发展前景和应用。

关键词：语音识别;特征提取;模式匹配;模型训练

Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to ,the developing prospect ion and application of the speech-identification technology are discussed in the last part.

Keywords:Speech identification;Character Pick-up;Mode matching;Model training

一、语音识别技术的理论基础

语音识别技术：是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解)，其最终目标是实现人与机器进行自然语言通信。

不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技术相似，一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外，还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种，具体选择哪一种，由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统，但不适合大词汇系统，原因在于模型库太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。

音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，并且汉语虽然有大约1300个音节，但若不考虑声调，约有408个无调音节，数量相对较少。因此，对于中、大词汇量汉语语音识别系统来说，以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中，但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成，且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母，这样虽然增加了模型数目，但提高了易混淆音节的区分能力。由于协同发音的影响，音素单元不稳定，所以如何获得稳定的音素单元，还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作，它对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，获得影响语音识别的重要信息。对于非特定人语音识别来讲，希望特征参数尽可能多的反映语义信息，尽量减少说话人的个人信息(对特定人语音识别来讲，则相反)。从信息论角度讲，这是信息压缩的过程。

线性预测(LP)分析技术是目前应用广泛的特征参数提取技术，许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型，没有考虑人类听觉系统对语音的处理特点。

Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果。实验证明，采用这种技术，语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取，但目前性能难以与上述技术相比，有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数，而模式匹配则是根据一定准则，使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络 (ANN)。

DTW是较早的一种模式匹配和模型训练技术，它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题，在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统，目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性，其中一个是隐蔽的(不可观测的)具有有限状态的Markor链，另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样，语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述，而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点，HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数，简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数，简称CHMM)以及半连续隐马尔可夫模型(SCHMM，集DHMM和CHMM特点)。一般来讲，在训练数据足够的，CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法，并不断被完善，以增强HMM模型的鲁棒性。

人工神经元网络在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统，模拟了人类神经元活动的原理，具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的，但ANN又不个有HMM模型的动态时间归正性能。因此，现在已有人研究如何把二者的优点有机结合起来，从而提高整个模型的鲁棒性。

二、语音识别的困难与对策

目前，语音识别方面的困难主要表现在：

(一)语音识别系统的适应性差，主要体现在对环境依赖性强，即在某种环境下采集到的语音训练系统只能在这种环境下应用，否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应，使用不方便。

(二)高噪声环境下语音识别进展困难，因为此时人的发音变化很大，像声音变高，语速变慢，音调及共振峰变化等等，这就是所谓Lombard效应，必须寻找新的信号分析处理方法。

(三)语言学、生理学、心理学方面的研究成果已有不少，但如何把这些知识量化、建模并用于语音识别，还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次，把这方面的现有成果用于语音识别，还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决，识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已经大于98%，对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展，这些复杂的语音识别系统也已经完全可以制成专用芯片，大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能，还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好的结果。

语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考文献：

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业专栏.通讯世界,2007.2:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)

[4]陈尚勤等.近代语音识别.西安: 电子科技大学出版社,1991

[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防工业出版社,2005

[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999

点击下页还有更多>>>浅谈语音识别技术论文

vr技术浅析论文2000字范文(2)

　　vr技术2000字论文篇二
　　【摘要】VR技术是现今计算机技术领域中一项包含多种学科的一门综合科学技术，该技术已经被应用在现实中许多的领域中。

　　【关键词】VR技术;虚拟现实技术

　　1.虚拟现实技术的概念

　　VR技术就是虚拟现实技术，它是一种能够让现实中的人在计算机所创造的虚拟信息世界中体验与现实世界同样的事和物。它所具有多感知性、沉浸性、交互性和构想性的基本特征。这种虚拟技术集合了计算机图形图像技术、现实仿真技术、多媒体技术等等的多种科学技术。它能够模拟出人的视觉，听觉，触觉等的感官功能。使人在计算机所创造的虚拟世界中通过语言、动作等等的方式进行实时交流，可以说这种技术的发展前景是非常的广阔的。

　　2.虚拟现实技术的特征介绍

　　①多感知性的特征，是指视、力、触、运动、味、嗅等感知系统，从人类理想的虚拟现实技术的发展来说，是希望能够给完全的模拟出现实中所有的感知，但因目前的技术掌握和传感技术的限制，仅仅只能模拟出以上视、力、触、运动、味、嗅等感知系统的。

　　②沉浸性又称浸没感或临场感，存在感等，具体是指人以第一人称存在在虚拟世界中的真实体验。当然，以目前技术还没有达到最理想的程度。

　　③交互性就是指人在虚拟世界中，能够像在现实当中一样，可以通过对一些物体的抓取、使用等动作，感觉到所触碰的物体的重量，形状，色泽等一些人与物体之间的互动信息。

　　④构想性，即在虚拟的世界里面，将所想的物件所做的事情在虚拟世界呈现出来，这样做能达到什么样的效果，那样做又能达到什么样的效果，甚至还可以把在现实世界不可能存在的事和物都可以在虚拟世界中构想出来。

　　3. VR技术的应用范围

　　VR技术由诞生到现今已经历了几个年代，其应用范围也越来越广，如医学方面，可以提供给医生进行模拟手术，这样大大提供了现实中手术的成功几率，还有军事，科技，商业，建筑，娱乐，生活等等。

　　4. VR技术中涉及的相关技术

　　①立体视觉现实技术：人通过视觉所获取到的信息是人本身所有感觉中最多的一种感官，所以虚拟现实技术中立体显示技术占有不可或缺的重要地位。

　　②环境构建技术：在虚拟世界中，构件环境是一个重要的环节，要营造一个区域的环境，首先就要创造环境或建筑模块，然后在这个基础上再进行实时描绘、立体显示，从而形成一个虚拟的区域环境。

　　③真实感实时描绘技术：要在虚拟世界中实现与现实世界相同的事物，仅靠立体显示技术还是远远不够的，虚拟世界中必须存在真实感和实时感，简单来说就是实现一个物体的重量，质量，色泽，相对位置，遮挡关系等的技术。

　　④虚拟世界声音的实现技术：在虚拟世界中虽然视觉是获取信息的重要途径之一，除了视觉还有很多感官系统可以获取到周围的信息。如听觉，这种技术就是在虚拟世界中实现声音，这样人在虚拟世界里不仅能够看得到也能听得到。

　　5. VR技术中所涉及的硬件设备

　　①输入设备

　　与虚拟现实技术相关的硬件输入设备分成两大类：一是基于自然的交互设备，用于虚拟世界的信息输入;另一种是三维定位跟踪设备，主要用于输入设备在虚拟世界中的位置进行判定，并输送到虚拟世界当中。

　　虚拟世界与人实现自然交互的形式有很多，例如有数据手套，数据衣服，三维控制器，三维扫描仪等。

　　数据手套是一种多模式的虚拟现实硬件，通过软件编程，可进行虚拟场景中物体的抓取、移动、旋转等动作，也可以利用它的多模式性，用作一种控制场景漫游的工具。数据手套的出现，为虚拟现实系统提供了一种全新的交互手段，目前的产品已经能够检测手指的弯曲，并利用磁定位传感器来精确地定位出手在三维空间中的位置。这种结合手指弯曲度测试和空间定位测试的数据手套被称为“真实手套”，可以为用户提供一种非常真实自然的三维交互手段。

　　数据衣是为了让VR系统识别全身运动而设计的输入装置。数据衣对人体大约50多个不同的关节进行测量，包括膝盖、手臂、躯干和脚。通过光电转换，身体的运动信息被计算机识别。通过BOOM 显示器和数据手套与虚拟现实交互数据衣。

　　②输出设备

　　人在虚拟世界中要体现沉浸的感觉，就必须实现现实世界中的多种感受，如是视、听、触、力、嗅、味等感官感觉，只不过以目前的虚拟技术只实现了视觉，听觉和触觉罢了。

　　③VR构成设备

　　虚拟现实世界的构成，主要的设备就是计算机本身了，虚拟世界的所有景象都是靠一个个模型造成的，而这些模型则是由计算机制作出来的。一般计算机被划分成四个部分，第一：高配置的个人计算机，专门用于普通的图形配置加速卡，实现于VR技术中的桌面式特征;第二：高性能图形工作站，就是一台高配置的图形处理计算机;第三：高度并行系统计算机;第四：分布式虚拟实现计算机等四个分类。

　　6. VR技术上的难点探讨

　　随着计算机的不断发展，人与计算机的互动性得到了非常好的提现。而这种技术则成为了VR技术建立的主要手段。但是实时现实始终一直阻挡这VR技术前进的一大难点之一，即时在理论上能够分析得到高度逼真、实时漫游的虚拟世界，但至少以目前的状况来说还达不到理论上的要求。这种理论性的技术是需要强大的硬件配置要求支撑的，比如说速度极快的图形工作计算机和三维图形加速卡等等设备，但以目前的设备来看即时最快的图形处理计算机也不能达到十分逼真的同事又是实时互动的虚拟世界。根本的原因就在于，因为引入了人与虚拟世界的互动，需要即时生成新的动态模型时，就不能达到实时的效果了，所以就不得不降低图形模块的清晰度来减少处理的时间，这样直接导致了虚拟世界的逼真在某程度上的减少，这就是所谓的景物复杂度的问题了。

　　图形模块的生成是虚拟世界中的重要瓶颈，虚拟世界的重要特性随着人的位置、方向的不断变更状态下感受虚拟世界的动态特性，简单来说，就是你移动一下位置和方向后所看到的即时生成的图形模块景象。有两种指标可以衡量用户沉浸在虚拟世界中的效果和程度。其一就是之前所说的动态特性;其二就是互动的延迟特性。自然动态图形的形成的帧数是30帧，至少也不能低于10帧，否则整体画面就会出现严重的不连续和调动的感觉。互动延迟是影响用户的另一个重要指标，如人在飞机上飞行时，位置的变换和方向的控制，这时系统应当即时产生相对的图形画面，期间的时间延迟应不大于0.1秒，最多也不能大于1/4秒。否则在长期的工作中，人会容易产生疲劳、烦躁或者恶心的感觉，严重地影响了“真实”的感觉。以上两种指标都以来计算机图形处理的速度。对于动态的模块图形生成而言，每帧的图形生成时间在30～50毫秒之间为较好;而对于互动性的延迟，除互动式输入及其处理时间外，其图形的生成速度也是重要的因素。而以上所叙述的因素都与图形处理的硬件组成有直接的相互关系，除此之外还有赖于应用技术的因素，如虚拟场景的复杂程度和图形模块生成所需的真实感等等。　　7. VR技术在各国的研究情况

　　①VR技术在美国的研究现状

　　美国是虚拟现实技术研究的发源地，虚拟现实技术的诞生可以追溯到上世纪40年代。最初研究的虚拟现实技术只是用于美国军方对飞行驾驶员和宇航员的模拟训练。然而，随着冷战结束后美国军费大大的削减，虚拟现实技术就逐渐转为民用，目前美国在该领域的基础研究主要集中在感知、用户界面、后台软件和硬件四个方面。

　　上个世纪80年代，美国宇航局及美国国防部组织了一系列有关虚拟现实技术的研究，并取得了令人瞩目的研究成果，美国宇航局Ames实验室致力于一个叫“虚拟行星探索”的实验计划。现在美国宇航局已经建立了航空、卫星维护的模拟训练系统，空间站的模拟训练系统，并且已经建立了可供全国使用的模拟教育系统。北卡罗来纳大学的计算机专业就是进行虚拟显示技术研究最早最著名的大学。他们主要研究分子建模、航空驾驶、外科手术仿真、建筑仿真等。乔治梅森大学研制出一套在动态虚拟环境中的流体实时仿真系统。施乐公司研究中心在模拟现实技术领域中主要从事利用VRT建立未来办公室的研究，并努力设计一项基于模拟现实技术使得数据存取更容易的窗口系统。波音公司的波音777运输机采用全无纸化设计，利用所开发的虚拟现实系统将虚拟环境叠加于真实环境之上，把虚拟的模板显示在正在加工的工件上，工人根据此模板控制待加工尺寸，从而简化加工过程。

　　图形图像处理技术和传感器技术是以上VR项目的主要技术。就目前看，空间的动态性和时间的实时性是这项技术的最主要焦点。

　　②VR技术在欧洲的研究现状

　　在欧洲，英国在VR开发的某些方面，特别是在分布并行处理、辅助设备(包括触觉反馈)设计和应用研究方面。在欧洲来说是领先的。英国Bristol公司发现，VR应用的交点应集中在整体综合技术上，他们在软件和硬件的某些领域处于领先地位。英国ARRL公司关于远地呈现的研究实验，主要包括VR重构问题。他们的产品还包括建筑和科学可视化计算。

　　欧洲其它一些较发达的国家如：荷兰、德国、瑞典等也积极进行了VR的研究与应用。

　　瑞典的DIVE分布式虚拟交互环境，是一个基于Unix的，不同节点上的多个进程可以在同一世界中工作的异质分布式系统。

　　荷兰海牙TNO研究所的物理电子实验室(TNO- PEL)开发的训练和模拟系统，通过改进人机界面来改善现有模拟系统，以使用户完全介入模拟环境。

　　德国在VR的应用方面取得了出乎意料的成果。在改造传统产业方面，一是用于产品设计、降低成本，避免新产品开发的风险;二是产品演示，吸引客户争取定单;三是用于培训，在新生产设备投入使用前用虚拟工厂来提高工人的操作水平。2008年10月27-29日在法国举行的ACM Symposi- um on Virtual Reality Software and Technoogy大会，整体上促进了虚拟现实技术的深入发展。

　　③VR技术在日本的研究现状

　　日本的虚拟现实技术的发展在世界相关领域的研究中同样具有举足轻重的地位，它在建立大规模VR知识库和虚拟现实的游戏方面作出了很大的成就。

　　在东京技术学院精密和智能实验室研究了一个用于建立三维模型的人性化界面，称为SpmAR NEC公司开发了一种虚拟现实系统，用代用手来处理CAD中的三维形体模型。通过数据手套把对模型的处理与操作者的手联系起来;日本国际工业和商业部产品科学研究院开发了一种采用x、Y记录器的受力反馈装置;东京大学的高级科学研究中心的研究重点主要集中在远程控制方面，他们最近的研究项目是可以使用户控制远程摄像系统和一个模拟人手的随动机械人手臂的主从系统;东京大学广濑研究室重点研究虚拟现实的可视化问题。他们正在开发一种虚拟全息系统，用于克服当前显示和交互作用技术的局限性;日本奈良尖端技术研究生院大学教授千原国宏领导的研究小组于2004年开发出一种嗅觉模拟器，只要把虚拟空间里的水果放到鼻尖上一闻，装置就会在鼻尖处放出水果的香味，这是虚拟现实技术在嗅觉研究领域的一项突破。

　　④国内虚拟现实技术研究现状

　　在我国虚拟现实技术的研究和一些发达国家相比还有很大的一段距离，随着计算机图形学、计算机系统工程等技术的高速发展，虚拟现实技术已经得到了相当的重视，引起我国各界人士的兴趣和关注，研究与应用VR，建立虚拟环境、虚拟场景模型分布式VR系统的开发正朝着深度和广度发展。国家科委国防科工委部已将虚拟现实技术的研究列为重点攻关项目，国内许多研究机构和高校也都在进行虚拟现实的研究和应用并取得了一些不错的研究成果。

　　北京航空航天大学计算机系也是国内最早进行VR研究、最有权威的单位之一，其虚拟实现与可视化新技术研究室集成了分布式虚拟环境，可以提供实时三维动态数据库、虚拟现实演示环境、用于飞行员训练的虚拟现实系统、虚拟现实应用系统的开发平台等，并在以下方面取得进展：着重研究了虚拟环境中物体物理特性的表示与处理;在虚拟现实中的视觉接口方面开发出部分硬件，并提出有关算法及实现方法。

　　清华大学国家光盘工程研究中心所作的“布达拉宫”，采用了QuickTime技术，实现大全景VR制;浙江大学CAD&CG国家重点实验室开发了一套桌面型虚拟建筑环境实时漫游系统;哈尔滨工业大学计算机系已经成功地合成了人的高级行为中的特定人脸图像，解决了表情的合成和唇动合成技术问题，并正在研究人说话时手势和头势的动作、语音和语调的同步等。

　　8.学习小结和心得

　　虚拟现实技术是一个极具潜力的研究项目，是未来的重要技术之一。它不论在理论，软件或者硬件的领域上都依赖着很多技术，当然其中也有较多的技术只实现了理论，硬件方面还是有待完善的。不过可以遇见，在未来虚拟现实技术绝对会被广泛应用。

　　本论文讲述了虚拟现实技术的概念，特征，应用范围，相关的技术，涉及的设备，技术上实现的难点，各国的研究现状等。最重要的就是，我们通过对这门技术项目的学习，了解到计算机更加多方面的知识，亦同时得知了更加多与计算机之间的硬件设备知识，让我们对虚拟现实技术产生了浓厚的兴趣，日后我们会继续留意虚拟现实技术的发展状况，如有机会定必会该项技术奉献绵薄之力。

猜你喜欢：

1. 科技哲学结课论文3000字

2. 触控技术论文

3. 全息投影技术论文

4. 3d打印技术论文3000字

5. 人工智能应用技术论文

6. 网络新技术论文

英特尔Realsense D435如何读取手部信息

RealSense3D是一套感知计算解决方案，包括世界上最小的3D摄像头，模块比两个硬币摞起来还薄，除了硬件外，英特尔还将提供驱动及软件等全套开发工具，开发者可以自由开发应用。 RealSense3D配有深度传感器和全1080p彩色镜头，能够精确识别手势动作、面部特征、前景和背景，进而让设备理解人的动作和情感。

上一篇：大学期刊分类办法

下一篇：江苏科技大学期刊

手势识别技术论文