每天只睡4小时
语音合成技术给我们带来了很多惊喜,你知道自己每天都在与它们打交道吗?而开车时的导航就是语音合成的一种。虽然目前的"它们"只会相对机械的朗读文章,但可以肯定的是,语音合成技术已经走出实验室,开始商用,其潜在的巨大市场已露出曙光。
我们的身边总是人声鼎沸。
婴儿牙牙学语,男女互诉爱意。在肺部、气管和声带的共同作用下,声音出现,喉内肌肉协调作用下,我们说出能够代表自己想法的字符,再赋予其愤怒或喜悦或悲伤的 情感 ,人类的语音就此形成。
18世纪末,一个因土耳其行棋傀儡的将在多年后臭名昭著的发明家沃尔夫冈·冯·肯佩伦,花费了人生最后20年的时间,试图模拟人类的语音。他做了一个布满孔洞的空箱,空箱连接着一个奇异形状的鼓风机,鼓风机被压动后将使得内置的簧片振动,这一过程模拟了人类的发声,也确实发出了声音,而这也成就了人类最早的语音合成机械之一。
让机器更像人类,是无数科学家的梦想。这样的梦想被多方位的推进,从机器的外形上、内核的思考运算上,以及对外表达的说话上。
如今,电子设备取代了空盒子,算法则比簧片更能够协调发声。在技术发展下,声音的波动被计算机捕捉、计算、指引,最终发出声音。这一项带着前人梦想的技术,不再单单出现在电影和小说里,也承载起了巨大的市场走进千家万户,这就是语音合成。
从Siri开始的热潮,语音合成潜力无限
同时,Siri的热潮也拉开了语音合成技术运用的大门。
2014年微软推出了"小娜"与"小冰",这是将Siri所拥有的语音识别技术及语音合成技术分开来,小娜负责理解复杂的口语指令并进行执行,而小冰主要能够和人类友好地聊天。
随后,这样的运用逐步增多:2014 年底,亚马逊发布了 Echo 智能音箱,语音助理 Alexa也随之亮相;一年半后,Google 也发布了第一代智能音箱 Google Home 和语音助手 Google Assistant。
国内的巨头也不遑多让,京东叮咚智能音箱、天猫精灵智能音箱、小爱系列智能音箱、小度智能音箱,也纷纷进入了国人的家居生活。
Siri的热潮同步开启的,不仅仅是语音合成技术在硬件上的应用,也包括一系列更具想象力的交互场景,带来了巨大的商机。
2015年春节,本就搭载了语音导航的高德地图与郭德纲合作,推出了高德地图欢笑版。用户打开高德地图,不仅能够听到导航播报,还能听到郭德纲的极具特色的段子。这一次尝试,让高德地图一度跃至苹果App Store榜单第2名。
在今年新冠肺炎疫情期间,"宅经济"大行其道,"听书"市场也快速爆发,有声阅读成为新的阅读潮流。
除此以外,短视频中的AI配音,让视频内容者省去大量配音时间;对已故知名艺人的声音采集,实现过去与现在的交互,圆了一代粉丝的梦想……
我们可以看到,语音合成技术的未来拥有巨大的想象空间,根据赛迪智库数据,预计到2021年智能语音市场规模将达195亿元。在这其中,智能语音就由语音识别技术(ASR)和语音合成技术(TTS)共同组成。
而这两项技术也正在被头部企业迅速推进,市场之下,语音合成已经不仅仅代表人类过去的梦想,更是代表着更"大一统"的 科技 格局,毕竟,这一技术改变着人类与机器的交互方式,也将改变未来人类的机器使用习惯,代表着全新的机会与入口。
从过去到现在,语音合成技术一览
1773年,俄国科学家、在哥本哈根生活的生理学教授克里斯蒂安·克拉特齐斯坦(Christian Kratzenstein)制造了一个特别的设备,通过共鸣管和风琴管的连接,几乎可以完美的发出 a、e、i、o、u 这五个元音。
十多年后,前文提到的沃尔夫冈·冯·肯佩伦也制造了一台类似的机械声学语音机器。随后,多位发明家基于这一机器进行改进,都是试图通过物理机模拟人说话发音。
这样的尝试已经令人难以想象,不过,即使这样的物理机发展得登峰造极,也无法模拟出我们说出的每一个音节、无法拥有人说话的音质,也无法停顿、无法带有情绪。
因此,另一种方式出现——拼接系统,让说话人录制语音存入系统,在合成语音时选择对应的片段进行拼接、合成。这样的拼接系统能够相比物理机极大地接近人声,虽然拼接处的瑕疵难以消除,但是随着如今大数据时代的来临,大语料库的出现,让拼接出的语音逐步真人化,直至如今依然有商业系统在使用。
基于参数的合成技术的诞生背景则是基于神经网络架构的深度学习方法的飞速进展。当时,对语音的识别不再是识别一个简单的词和短词组,而是基于统计的方法,运用声学模型帮助计算机认知每个音素单元的声学特征、运用语言模型帮助计算机实现对人类用词习惯的认知,最终给到用户最高可能性的连接。在这其中,典型的模型是隐含马尔可夫模型(HMM),用来描述如何在可变长的时序特征序列上打词标签。
2017年3月,行业的引领者Google 提出了一种新的端到端的语音合成系统:Tacotron。端到端语音合成是在参数合成技术上演进而来的,把两段式预测统一成了一个模型预测,即拼音流到语音特征流的直接转换,省去了主观的中间特征标注,克服了误差积累,也大幅度提高了语音合成的质量。
然而,为了实现真正像人一样的发音,语音合成系统必须学会语调、重音、节奏等表达因素,这一问题,Tacotron也并未解决。
谷歌曾共享了两篇新论文试图解决这一问题,第一篇论文《Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron》介绍了"韵律学嵌入"(prosody embedding)的概念。论文中为 Tacotron 增加了一个韵律学编码器,该嵌入捕捉包括停顿、语调、语速等在内的音频特征可根据一个完全不同的说话者的声音生产语音。
第二篇论文《Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis》则在上一篇论文的架构上进一步展开,并且创新性地提出了一种建模潜在语音"因素"的无监督新方法。这一模型之下,学习的不再是时间对齐的精确的韵律学元素,而是较高层的说话风格模式,并且可以迁移于任意不同的短语之中。
如果论文提到的模型实现,那么我们便可以迫使 Tacotron 使用特定的说话风格,不需要参考语音片段,并能创造出语音长度多样化的不同语句,并带有情绪。
在不远的将来,或许我们就将听到,来自机器的人类声音。
国内:积极商用,进展瞩目
在语音合成的重要研究中,因为国内起步较晚,所以我们很少看到突破性的技术发展。但是,即便停留在艰难的 探索 初期,巨头们之于语音合成仍旧趋之若鹜。
我们也惊喜地看到,不少企业在近期通过语音合成的商用落地,展现出了自己的技术实力。
① 京东数科:AI主播"小妮"上岗
京东数科基于京东多年在人工智能、大数据、云计算等领域的技术沉淀,在2018年就开始组建机器人的团队,研究覆盖生命科学、传感器材料乃至运动力学与人机交互。
在全面的机器人开发体系下,今年5月,京东数科推出了令人瞩目的AI主播"小妮",这是京东数科自主研发的AI虚拟数字人产品首次亮相。
小妮的真实是全方位的,在听感、表情、头部动作乃至口型上,小妮都极像真人。从文字到语音,小妮通过自研的轻量级对抗语音合成技术进行转化;而小妮特色鲜明的声音及极具真实性的呼吸和停顿,则是来源于在多人数据上结合深度神经网络进行个性化建模……
更为重要的是,小妮的出现打通了语音、图像、视频,在语音生成视频的阶段,她的形象同样真实。因为京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。
而除了主播领域以外,AI虚拟数字人还可以用智能客服及招聘领域。在未来,我们可以预见到,AI虚拟数字人在其他高重复性场景的更多运用可能性。而伴随着京东数科全面的机器人体系研发技术的进展,或许也将出现超乎我们想象的AI运用。
② 科大讯飞:为多家企业提供底层技术支持
早在之前,科大讯飞就推出了讯飞录音笔、智能鼠标、阿尔法蛋等涉及语音交互的产品。今年,来自科大讯飞地一款彩色墨水屏阅读器正式面世,一方面,阅读器可以进行常见的新闻播报、语音读书,满足用户的基础要求;另一方面,阅读器结内置了神秘AI主播,可以对话用户、助力用户解决问题。同时,科大讯飞也为多家企业提供底层技术支撑,覆盖智能手机、智能 汽车 等多个领域。
③ 腾讯云:语音累计音色种类达24种
而对于拥有国内最大流量池——微信、QQ的腾讯而言,这家企业则选择为内容创业者提供服务。
今年9月,腾讯云语音合成团队正式开放面向全量用户的合成音频平台,该平台能够帮助用户在零门槛的情况下实现语音合成技术的运用,用户只需要直语音合成控制台上生成和下载文本对应的音频文件即可。该功能的侧重点是帮助内容创作者在公众号、短视频、小视频等内容上更简单、快捷地插入对应所需的音频文件。同时,腾讯云还发布了全新地11种音色,其中甚至包括粤语这样的方言在内,目前累计音色种类达24种。
④ 百度:百度大脑开放全栈语音引擎能力
作为将AI作为战略进行投入的百度,在语音合成上的推进也不容小觑。
去年,已经开放三年的百度发布了语音引擎。这是一套非常全面的系统,覆盖内容非常广泛,包括硬件模组、开发板以及语音交互场景解决方案等。在这其中,百度也专门围绕语音合成的成功进行了发布,推出了6个在线语音合成精品音库和5个离线语音合成精品音库。
未来语音合成将更接近人类的语言
立足现在,我们不禁畅想,未来的语音合成将是什么样,又将出现在哪些地方?
在技术上,毫无疑问,未来的语音合成将更接近人类的语言。一个理想的语音合成系统由三部分组成:文本分析、韵律生成和合成语音,而在这三方面,行业的发展都还有待提高。
在这其中,韵律生成是行业面临的共同问题,如何可以让语音合成更像人类?更具表达力?作为声学模型,还有大量个性化、 情感 化的变化因素需要学习。而值得一提的是,语音合成技术的复杂度也需要降低,从而实现更广度地运用。我们也相信,随着大量语料的有效使用,这一切问题也都将解决,未来,语音合成必将更加"传神"。
而随之而来的,我们的生活也将被改变。
一方面,在 科技 带来革新的同时,传统也将受到冲击。在上文中,小妮被运用与客服以及招聘的部分环节,那么很明显,在不远的未来,具有重复性的语音性质的工作将受到巨大影响。
而另一方面,更为智能的未来也将到来,在将来,人与机器的交互方式或许将被彻底改变,到那时,全新的商业机会也将藏于其中。
为了迎接这一时代,巨头趋之若鹜,而普通人也同样该砥砺前行。
#智能语音##语音合成#
吃客令狐冲
文语转换系统的目的是将文字的输入自动地转换成语音输出,它在信息发布系统、语音应答系统、电子邮件中的语音服务、文稿校对系统以及残疾人语音辅助等许多方面有很大的应用前景。我国对汉语文语转换系统的研究发展迅速,已有许多单位先后研制出汉语文语转换系统。由于汉语的复杂性,使得现有的汉语语音学规则不够完善和精细,目前以此为基础开发出来的汉语文语转换系统的语音质量与实际应用要求还相差一段距离。本文针对现有汉语文语转换系统所存在的核心问题,从完善汉语的韵律规则展开研究工作。本文与传统的研究方法不同,将数据挖掘技术应用到汉语的韵律规则研究上。数据挖掘是从数据库中发现新的有用知识的过程,现已发展了很多数据挖掘算法,神经网络是其中的一种。本文以神经网络作为核心算法,开发了一个基于语音数据的数据挖掘系统—SpeechDM,并用SpeechDM系统对汉语中二字词的声调变化进行了研究,初步寻找出更精细、更可用的声调变化规则,为开发高质量的文语转换系统打下了基础。本文主要包括如下几方面的内容:1.介绍了语音合成的历史与背景,并介绍了汉语语音合成的发展及汉语韵律规则的研究现状。
michelleyi
应用语言学的理论及研究现状论文
应用语言学在语言学研究的范畴之内,目前已经成为语言学的最大组成部分之一。下面是我收集整理的应用语言学的理论及研究现状论文,希望对您有所帮助!
摘要: 应用语言学是与英语教学息息相关的交叉学科,是近些年才出现的新兴学科,在英语教学体系不断优化的过程中,应用语言学对其起着巨大的推动作用。应用语言学提高英语教学时效性和教学质量,有助于完善和改进英语教学系统。本文将以应用语言学作为研究对象,在分析和简述应用语言学的基础上,着重强调探究应用语言学对英语教学的指导作用和积极影响,以帮助教育工作者认识到应用语言学对英语教学的重要意义,为英语教学现代化改革提供有力帮助和有效途径。
关键词: 应用语言学 英语教学改革 有效途径
应用语言学在语言学研究的范畴之内,目前已经成为语言学的最大组成部分之一。应用语言学是指运用语言学理论知识处理具体的实际问题。学习语言的最终目标是运用语言维持人际关系,提高自身的交际能力,然而,语言的基础性知识并不是交际能力好坏的仅有决定性评判依据,交际能力的好坏更依赖于人们对语言技巧使用的熟练度,换言之,语言知识是语言学的基础,技巧是语言学的媒介,而最终的目标是提高自身的交际能力。所以,学生在掌握一定语言学知识的同时还应当加强语言使用能力的培训力度,主要强调听、读、写、练等方面的技能训练。尽管英语教学在国内的推广范围已经很大,但从目前的教学情况上来看,大部分学生的英语水平都不高,基本都属于“哑巴英语”,而应用语言学在英语教学中的有效应用,可以改善这一英语学习现状,激发学生的英语学习兴趣,提高自身的学习能力,对英语教学的顺利进行有着不可替代的实践意义。
1应用语言学的理论及研究现状
应用语言学的理论
最近这些年,教学专家们以应用语言学作为研究对象和教学依据,对其进行多方面的强化和发展,其中主要包括:行为主义、内心主义、对照分析、错误分析以及实践分析等方面的理论研究。应用语言学对英语教学的指导是以理论原则为基础,而教学结果的成败是由应用语言学是否正确的对其进行指导。应用语言学作为实践要求较高的学科,其理论知识的积累固然重要,但若只关注理论知识的学习,没有与实践性活动相结合,就不能够发挥出应用语言学的真正指导作用。尽管我国目前的应用语言学理论体系还不够健全,关于理论知识的理解也不尽相同,但是这也正为应用语言学研究带来前所未有的发展机遇。
当前应用语言学的研究现状
相对与发达国家而言,我国对应用语言学的研究起步较晚,而国内最先对其进行研究的是广东外贸大学。最近这些年,教育工作者们又加大了对应用语言学的研究力度,扩大了其研究范围,使应用语言学的研究内容更加丰富。
2应用语言学与英语教学间的关系
从学生角度出发,明确教学方法
学习语言的第一任务就是口语的练习,而口语是在学好书面语的'前提下慢慢发展起来的。英语教学中的语言学应用方法比较独特,就是确定口语和书面语两者之间的比例。从我国目前的英语教学内容来看,主要分基础和加强两部分,基础是指听说读写,加强是指英语翻译。其中听说读写之间属于协调关系,都是互相扶持的,但同时又有自身的特色和难点,需要不同的教学手段和教学方式来实施教学。在进行英语课程设置时,一定要明确教学的最终目的和根本任务,再按照一定比例安排课时。例如,实时翻译与文学翻译的培养目标就同,所以对课时设置的要求也就不同,换句话说,对应用语言学的教学应当从学生角度出发,明确教学目的,进而加强英语教学的灵活性。
透过学生错误,明确学生不足
对比西方国家的应用语言学教育,我国对其在英语教学中的运用主要存在两点问题,第一,过去强调语法运用方式,忽略语言的情感表达。教师在进行英语授课时,过于注重学生对语法、发音、理解和整理语句的能力,从而忽视了对学生英语情感表现力的教育,特别是在高中的英语教学中,这种现象尤为突出。英语教师在对课文进行分析和讲解时,对语法使用和句子结构组成进行过去的分析,在很大程度上减弱了教学效果,使学生忽略了英语运用的实际环境,只注重语法使用的正确性以及意思表达的完整性。第二,当英语教学发现学生在英语学习过程中的错误时,有立刻纠正的习惯,不会进行深入的观察和分析,而事实上,教师应当针对学生所犯的错误进行分析和研究,最终明确学生学习方式中存在的不足,有针对性的对其进行处理和完善。
3整合应用语言学与高校英语教学改革
基于应用语言学理论的英语教学方法设计
(1)规划英语学习方案。我国英语教学基本上都在课堂内完成,而课堂时间有限,因此,为了强国英语课堂学习的学习效果,学生就应当针对英语的整个学习过程进行方案规划,在对英语教学内容进行分类和整理的基础上,对学习任务进行划分,将其分割成课内任务和课外任务两部门。教师通过对考试任务和教学目标的确认,对学生进行全面的指导和教育,确保英语教学质量以及应用语言学在英语教学中的运用效果,优化英语教学体系。
(2)组织和开展英语实践性教学活动。有很强的英语交际能力和应用能力是所有英语学习者的共同目标。应用语言学中有一个原则就是以学生的具体需求为基础,制定相关的教学方案。例如,学生的英语基础知识掌握程度不佳,就应当对其强化口语的培训力度,使学生养成“口说英语”的习惯。另外,实现应用语言学的有效教学还可以通过广播、报刊等多媒体形式,提高学生的英语学习兴趣,鼓励他们多参加英语实践活动,为学生创造良好的英语学习氛围,进一步提高学生英语技巧应用能力。
应用语言学指导英语教学改革的有效途径
(1)应用语言学对英语教学有指导作用。加强应用语言学的学习可以有效的指导英语教学,深化英语教育改革和创新。英语教育改革的顺利开展同全体教育工作者的积极参与和共同努力是密不可分的。在英语教学改革过程总,所有的英语教师都应当不断加大应用语言学的学习和研究力度,积极有效的将应用语言学融入到英语教学的过程中去,然后在此基础上,加大对其理论知识的探究力度,总结英语教学经验,并完善应用语言学教学体系。
(2)激发英语教师在教学改革中的巨大潜能。激发英语教师在教学改革中的巨大潜能,使其推动英语教学改革的现代化进程。要想应用语言学发挥出巨大作用就必须加大对其的研究力度,组织讨论小组,使所有的英语教师都在熟知应用语言学知识的基础上,进行英语教学的研究工作,使其适应英语教学的未来发展。在英语教学改革过程中,英语教师的作用是不容忽视的,激发英语教师的巨大潜能不但是现代化教学对英语教师的基本要求,同时也是英语教师提高自身综合素养和英语能力的重要前提。英语教师作为教学活动的指导者、组织者和规划者,对应用语言学在英语教学中的运用起着非常重要的推动作用,一方面可以在课堂上强化学生的英语学习能力,另一方面可以将学生作为研究主体切实做到理论和实践的协调工作,使应用语言学发展更好的适应时代要求。
(3)加大对英语说、写能力的培养力度。英语说、写能力的培养与应用语言学的学习密切相关,也是英语教学必不可少的环节之一。随着我国现代化进程的不断加快,国际交流机会越来越多,以往的应试教育已经不能够适应英语教学的发展要求了,因此,英语说、写能力的培养和加强是提高学生英语交流能力的有效保障,可以为社会培养更多的国际型交际人才。为了更好的满足社会需求,教师在教学过程中必须加大对学生英语交流能力的培养力度。
(4)结合具体的教学现状进行英语教学改革。英语教学改革涉及的范围比较广,在具体的实施过程中,英语教师应当结合具体的教学现状进行英语教育改革,强调对学生学习态度和探究态度的培养。另外,高等院校还应当着重强调对学生创意意识和实践能力的培养,提高学生的英语应用能力,使他们更好的适应社会发展。
总而言之,应用语言学与高校英语教学是息息相关的。在英语教学改革中,应用语言学是一项巨大的系统性研究工程,具有复杂、灵活等特点,因此,高等院校在进行英语教学时,必须结合具体的教学情况,只有这样才能发挥应用语言学的潜在力量,提高英语教学水平。
参考文献 :
[1]周慧慧.应用语言学与外语教学[J].辽宁行政学院学报,2011
[2]李素素.浅谈应用语言学对英语教育的意义[J].玉溪师范学院学报,2010.
[3]房明远.外语教学中应用语言学的应用[J].教改聚焦,2012
关键词:影视表演,肢体语言,作用 一、肢体语言的内涵与特征 人类的肢体动作是有表达力和表现力的, 任何的肢体动作都能传达一定的含义, 尤其是富有表现力的肢体动作
汉语言文学专业培养具有汉语言文学基本理论、基础知识和基本技能 ,能在新闻文艺出版部门、科研机构和机关企事业单位从事文学评论、汉语言文学教学与研究工作,以及文化、
美术教育论文开题报告 范文一 一、课题的目的意义: 课题的目的 1、现实的景色不同于绘画表现,绘画是对表现的再创造,它承载了作者对景色认识与对作者内心感受的表现
教学案例的一般要素 背景 所谓背景,即是向读者交待清楚:"故事"发生的时间、地点、人物、事情的起因等。背景介绍也不必面面俱到,重要的是说明"故事"的发生是否有什
曹志耘 100083 北京市学院路15号北京语言文化大学 《语言教学与研究》编辑部编辑部地址:北京市海淀区学院路15号北京语言大学综合楼1118室 通信:1