分子生物技术在微生物降解环境 污染物中的应用 [摘要〕介绍了与环境微生物关键降解酶基因的筛选、克隆及应用相关的分r生物技术,包括聚合酶链式反应技 术、基因重组技术、荧光原位杂交技术和生物信息学等技术,并对这些技术在污染物降解基因检测、筛选和克隆方 面的应用进行了阐述与探讨、 [关键词]分子生物技术;微生物;基因;环境污染物;降解 随着现代j:\地技术的发展,多环芳烃、含氯有 机物和硝基苯类化合物等人工合成井难以降解的 污染物大量排放,造成世界范围内的环境污染和生 态破坏,严重地威胁人类和其他生物的正常生存和 发展。利用微生物修复技术对受污染的水体及土 壤进行处理,凸显了其重要的意义和可行性。研究 人员发现并筛选到一些微生物,它们不仅对环境有 较高的适应性、对污染物有较高的耐受性,而且对 污染物有较强的降解效率和专一性。然而环境中 存在的大量微生物中仅有少于1%可通过传统的培 养方法进行培养、分离和纯化,绝大多数细菌需要 非常严格的营养条件川。因此,为了对修复环境有 所贡献却难以培养的微生物进行更全面了解,也为 了筛选到更多有利于降解环境污染物的微生物菌 种及其关键酶基因,分子生物技术和手段逐渐被广 泛应用到环境可降解污染物及降解机理方面的研 究中。 本文对近年来发展起来的聚合酶链式反应 (PCR)技术、基因重组技术、荧光原位杂交(FISH) 技术和生物信息学等多种分子生物技术进行了介 绍,并总结了它们在污染物降解基因检测、筛选和 克隆方面的应用。 1与环境污染物降解相关的分子生 物技术 及其相关技术 PCR是一种利用脱氧核糖核酸(DNA)半保留 复制原理,在体外扩增位于两段已知序列之间的 DNA区段从而得到大量拷贝的分子生物技术。根 据其模板、引物来源或扩增条件的不同,PcR技术 可分为以下几种:(l)反转录pCR(RT一PeR)技 术,将mRNA反转录为cDNA后再对其进行PCR 扩增,可用来构建cDNA文库,分析不同生长时期 的mRNA表达状况和相关性以及mRNA的定量测 定等;(2)巢式PCR技术,在扩增大片段目的DNA 时,先用非特意性引物扩增再用特意性引物对第一 次扩增产物进行第二次扩增,以获得可供分析的 DNA;(3)竞争PCR技术,是一种定量PCR,向PCR 反应体系中加人人工构建的带有突变的竞争模板, 通过控制竞争模板的浓度来确定目的模板的浓度, 对目的模板作定量研究;(4)实时荧光定量PCR技 术,在PCR反应体系中加人荧光基团,利用荧光信 号积累实时监测整个PCR进程,最后通过标准曲线 对未知模板进行定量分析,该法已广泛用于基因表 达研究、转基因研究等方面;(5)扩增的rDNA限制 酶切分析技术,根据原核生物rDNA序列的保守性, 将扩增的rDNA片段进行酶切,通过酶切图谱来分 析菌间的多样性;(6)RNA随机引导PCR技术,基 于任意寡核昔酸引物与RNA之间可能的配对,在 低严谨度条件下经聚合酶催化使链延伸,将细胞总 RNA或InRNA作为反转录反应的模板,此技术结 合单链构象多态性,用非变性胶分辨大小相同而构 象不同的片段,可用于诊断遗传突变及分析污染条 件下序列的多态性;(7)随机扩增多态DNA (RAPD)技术,是一种基于PCR检测PCR引物结合 位点序列改变的方法,通常以10bp的寡核昔酸序 列为引物,对基因组DNA随机扩增,电泳分离染色 扩‘增产物,再分析多态性。 技术 FISH技术利用荧光标记的探针在细胞内与特 异的互补核酸序列杂交,通过激发杂交探针的荧光 来检测信号。荧光探针比放射性探针更安全,具有 较好的分辨力,不需要额外的检测步骤。近年来, 由于FISH技术具有灵敏、便捷等优点,迅速发展完 善成为研究环境微生物的有力工具。此外,可用不 同激发和散射波长的荧光染料标记探针,在一步反 应中同时检测几个靶序列。该技术主要包括试样 固定、预处理、预杂交、探针和试样变性、杂交、漂洗 去除未结合的探针、检测杂交信号等步骤。由于 165rRNA具有遗传稳定性,因此成为FISH技术检 测最常用的靶序列。 基因重组技术 基因重组技术是从供体生物的基因组中通过 酶切扩增等手段获取目的基因,与载体连接形成重 组DNA分子,再导入到受体细胞中,让外源基因得 以表达。在已经分离出的许多菌株中,与降解能力 有关的基因多在质粒体上。由于质粒很容易在细 菌的繁殖过程中遗失,对细菌降解能力的长期稳定 非常不利,可将其与污染物降解有关的酶基因重组 到大肠杆菌等微生物中进行表达,以此构建的各种 生物降解特性增强的重组菌可用于污染环境的治 理修复或发酵某些废弃物。 生物信息学 20世纪后期,生物学的迅猛发展,从数量上和 质量上极大地丰富了基因组数据库、蛋白质数据 库、酶数据库和文献数据库等许多生物科学的数据 资源。已有多个国家和国际科研组织建立了生物 信息数据库,如欧洲分子生物学实验室(Eur叩ean MolecularBiologyLaboratory)核酸序列数据库和美 国国家生物技术情报中心(Nationaleente:fo:Bio- technologyInformation,NCBI)基因序列数据库等。 科学家利用计算机及生物信息分析软件分析这些 数据资源,确定大分子序列、结构、表达模式和生化 途径与生物数据之间的关系,区分生物个体间遗传 差异,揭示DNA多样性。例如,基本局部比对搜索 工具(BasieLoealAlignmentSearehTool,BLAST), 是一套在蛋白质数据库或DNA数据库中进行相似 性比较的分析工具。它基于Altschul等的方法「2〕, 在序列数据库中对查询序列进行同源性比对工作。 BLAST程序可对一条或多条、任何数量、任何形式的 序列在一个或多个核酸或蛋白序列库中进行比对,甚 至将有缺口的比对序列也考虑在内,利用比较结果中 的得分对序列进行相似性说明。基因的序列分析可 揭示出生物物种之间的关系,在污染治理研究中可用 于生物基因组特殊区域或特异基因的测序。 2分子生物技术在环境污染物降解 中的应用 土壤试样总DNA的提取 用适当方法直接从土壤中提取DNA并纯化, 是从分子生物学角度对土壤微生物进行研究的前 提条件,而后可进行酶切、PCR扩增、核酸分子杂交 等分子生物学技术操作。从土壤中提取微生物 DNA主要分为汽接法和间接法}’{。直接法是在 ogram等的方法基础卜发展起来的,其主要包括2 个步骤:(l)原位细胞裂解;(2)DNA提取和纯化。 直接法提取的DNA超过细菌总DNA的60%且省 力,但提取的DNA常常有折断、腐殖酸污染、甚至 提取物中还夹杂有未知的胞外DNA和真核生物的 DNA。最先报道间接法的是Faegri等[‘〕,其主要包 括4个步骤:(l)分散土壤;(2)分离细胞与土壤; (3)细胞裂解;(4)DNA纯化。间接法提取DNA 产量低且费力,但纯度较高、DNA损伤小,提取的 大片段DNA可用来构建cos而d和细菌人工染色体 文库等。 采用PCR及相关技术扩增分析DNA片段 可降解污染物的微生物必然能产生分解代谢 该污染物的酶。selvaratnam等L’l用编码苯酚单加 氧酶dmpN摹因的RT一PCR技术来检测序列间歇 式活性污泥反应器‘{一,降解酚的假单胞菌。检测结 果表明,RT一PCR技术不仅能检测微生物降解酚的 能力,还能测量dmpN基因的转录水平,从而确定假 单胞菌特殊的分解活性,发现了在转录水平下,酚 浓度与通气时间之问存在正相关关系。 将PCR技术和变性梯度凝胶电泳(DGGE)结 合起来,在变性条件适当的情况下能分辨一个碱基 对,分辨率较高。染色后的凝胶用成像系统进行分 析,可在一定程度l几反应试样的复杂性。条带的多 少能反应试样「 一 }1微生物组成的差异,条带的亮度能 反应试样中微生物的多少。基于以上优点,日前该 技术在微生物群落结构的分析和动态研究方面得 到了厂‘泛应用。DGGE可通过分析PCR扩增的基 因点突变来探索微生物的复杂性。徐玉泉等[“〕从 某废水中分离出一株能以苯酚为惟一碳源的菌株 PHEA一2,使用PCR一DGGE技术对该菌165 rDNA进行分析,发现该菌与醋酸钙不动杆菌同源。 M盯sh等r了)利用PcR一DGGE技术获得了活性污泥 中真核微生物的种群变化情况。王峰等下8〕采用 PCR一DGGE技术对城市污水化学生物絮凝处理中 活性污泥和生物膜微生物种群结构进行了分析,结 果表明活性污泥培养前后微生物种群结构发生r 很大改变。 RAPD技术也是一种应用比较广泛的以多态性 引物来扩增某些片段的技术。RAPD技术可用于检 测含有混合微生物种群的各种微生物反应器中微 生物的多样性。用RAPD技术分析检测实验室规 模的油脂淤泥培养料中的细菌菌群发现,用油脂淤 泥改良过的培养料比未改良的更适于不同的微生 物种群生长[9j。vainio等t’。〕从516种孤立的菌落 中提取出165rDNA,经PCR扩增后进行测序,检测 活性污泥中微生物种群的结构。这些组合技术的 应用显著增强r对微生物的检测和鉴定能力,为理 论研究工艺优化及提高生物处理效率提供了条件。 基因重组 基因工程技术应用于环境保护起始于20世纪 80年代。其基本原理是通过基因分离和重组技术, 将目的基因片段,比如可编码降解某种污染物的 酶,转移到受体生物细胞中并表达,使受体生物具 有该目的基因表达显现的特殊性状,从而达到治理 污染的目的。找到特定污染的抗性基因,利用基因 重组技术转基因后也可获得其他抗性植株以及筛 选到可转化污染物的植物,还可开发超量积累植物 进行污染土壤的生物修复。 罗如新等L”〕用放射性同位素标记tfdc基因片 段作探针,Southemblot杂交定位Ll菌株的邻苯二 酚1,2一双加氧酶基因位于Pstl的I片段和BamH I的M、N片段,回收并将其直接克隆至表达载体 pKT230卜,获得的重组子能转化不具开环酶活性 的甲胺磷降解菌P2,得到高于天然宿主21倍的邻 苯二酚1,2一双加氧酶。stingley等{”〕通过构建基 因文库和重组质粒等基因工程方法证实了NidAB 双加氧酶是降解菲的关键酶类,并首次鉴定出此基 因通过磷苯二甲酸实现降解功能。chae等‘”}发现 不能降解苯酚的su如lobusso扣taricu、98/2菌株中 的儿茶酚2,3一双加氧酶基因与能降解苯酚的 sulfolo右u,,o如taricu、咫有[6J源区,分析得知它们 是山共同祖先进化而来。把儿茶酚2,3一双加氧酶 基因克隆到大肠杆菌中表达,可获得有较高降解活 性的双加氧酶。 重金属污染是环境污染的重要方面之一。随 着分子生物学技术的发展,越来越多的修复性蛋白 基因正被从植物、微生物和动物中陆续分离出来, 如汞离子还原酶基因、有机汞裂解酶基因、汞转运 蛋自基因、金属硫蛋白基因、植物络合素合成酶基 因、铁离子还原酶基因和锌转运蛋白基因L’‘〕。这些 基因通过基因工程的改造,重组到合适的受休细胞 中表达相应的蛋白质和酶,达到治理难以降解的有 毒有害污染物的目的。sorsa等〔”〕把MTS插人 LamB序列的153位点,在中表达MTs,解决 r细胞内MTs对金属离子有限的吸附能力。综L 所述,基因重组技术具有快速、高效的特性,已逐渐 成为环境生物技术的研究热点。 技术 FISH技术利用核糖体内长度适中(约1500bp)、 高度保守的165:RNA序列作为理想的基因分类靶 序列,其中使用的165:RNA寡核普酸探针一般是 进行了荧光标记的20bp左右特异性核昔酸片段, 利用该报告分子(如生物素、地高辛)与荧光素标记 的特异亲和素之间的免疫化学反应,经荧光检测系 统对待测DNA进行定性、定量或相对定位分析。 FISH技术能提供处理过程中微生物的数量、空间分 布和原位生理学等信息。 硝化细菌是一类生理上非常特殊的化能自氧 菌,传统的研究方法要经过富集、分离、分类和鉴定 步骤,耗时长。HSH技术的引人解决了上述困难。 FlsH技术还被广泛用于活性污泥系统、硝化流化床 反应器和膜生物反应器等废水处理系统}’61。 基因工程微生物越来越多地被用于农业害虫 控制和环境污染的生物修复,对人类健康和环境的 影响引起广泛关注。1994年出现了一种新的标记 系统:绿色荧光蛋白(GFP),由于GFP基因表达产 物对细胞没有毒害作用,且由GFP产生的荧光标记 检测卜分方便、简单。在某些被污染的环境中可分 离出降解该污染物的细菌,通过基因重组等手段使 用GFP分子标记,可更容易的分离检测被标记的 细胞叫。 Bastes等[’8]进行了苯酚降解菌染色体GFP基 因标记实验。通过PCR和Southemblot分析,证明 GFP基因已成功整合到宿主细胞的染色体中。对 标记菌与野生型的降解能力比较结果证明,GFP分 子标记的插人并不影响细胞的苯酚降解能力。 用G即标记Pseudomonasputida,研究活性淤 泥中细菌存活情况{’9飞。Pseudomonasputida被转到 活性淤泥2min后,观察到细胞在淤泥絮凝物间自 由游动;培养3d后,发现荧光细胞减少,大部分已 被合并到淤泥絮凝物中,以防止细菌被原生动物捕 食。用oFP标记石.eozi和Serraliamarceseern,考 察菌株附到絮凝物卜的过程{’()j。使用表面荧光显 微镜能将带有GFP标记的细胞从活性污泥中区分 开,井进行观察和记数。而聚焦激光扫描显微镜 (cLsM)可使GFP标记细菌产生三维轮廓,结合表 面荧光显微镜和CLSM观察GFP标记细胞,结果表 明,细胞表面疏水性在细菌附到絮凝物的过程中起 重要作用,两种细菌附在絮凝物上的模式有很大不 同,通过这种方法可更好地理解细菌赫附机理,有 助于提高废水处理效果。 3结语 分子生物技术的应用使研究人员可从微观的 角度更细致深人地了解微生物对污染物降解的具 体生理生化机制,在分子水平 _ _ [揭示生物体吸收、 迁移、积累有害物质最终被毒害,及适应、抗性等生 态问题,从而筛选到更多有利用价值的微生物。随 着越来越多微生物全部基因序列的解码,对各种细 菌体内可降解基因的分布和表达会有更深人的了 解,有关技术的发展和成熟必将对污染物的降解过 程有一个整体的、生态水平上的认识。 参考文献 l李凤,刘世贵 . 分子生物学技术在环境微生物研究中的 应用 . 世界科技研究与发展,2003,25(4):88一92 2AltsehulSF,GishW,MillerW, mentsearehtool . JMolBiol,1990,215(3):403一410 3魏志琴,曾秀敏,宋培勇 . 土壤微生物DNA提取方法研 究进展 . 遵义师范学院学报,2006,8(4):53一56 4FaegriA,TorsvikVL,]andfunga] aetivitiesin5011:seParationofbacteriaandfungibyaraPid fraetionatedeentrifugationteehnique5011BiolBioehem, 1977,9(2):105一112 5SelvaratnamS,SehoedelBA,MeFarlandBL,etal APPlieationofreversetranseriPtasePCRformonitoring exPressionoftheeataboliedmPNgeneinaPhenol- degradingsequencingbatehreaetor . APPIEnviron Microbiol,1995,61(11):3981一3985 6徐玉泉,张维,陈明等 . 一株苯酚降解菌的分离和鉴 定 . 环境科学学报,2000,20(4):450一455 7MarshTL,LiuWT,ForneyLJ . Beginningamoleeular analysisoftheeukiU洲aleollllllunityinaetivatedsludge. WaterSeiTechnol,1998,37(4一5):455一460 8王峰,傅以钢,夏四清等.PCR一DGGE技术在城市污 水化学生物絮凝处理中的特点 . 环境科学,2004,25 (6):74一79 9涂书新,韦朝阳 . 我国生物修复技术的现状与展望 . 地 理科学进展,2004,23(6):20一31 10VainioEJ,MoilanenA,KoivulaTT,etal . ComParison ofpartial165rRNAgenesequeneesobtainedfromactiva- tedsludgebaeteria . APPIMierobiolBioteehnol,1997,48 (l):73一79 11罗如新,张素琴,李顺鹏 . 邻苯二酚1,2一双加氧酶
微生物技术在城市生活垃圾处理中的应用 摘要:本文结合堆肥化、卫生填埋两种现行的城市生活垃圾处理工艺,主要介绍了城市生活垃圾生物处理过程中的微生物种群,以及通过分析开发出的新的微生物技术,指出了应用于城市生活垃圾处理的高效的微生物技术的研究方向。 关键词:城市生活垃圾 微生物 强化微生物处理技术 基因工程 ; 随着城市化进程在全球范围的加速,城市化带来的污染和人类聚居状况恶化等问题,已成为世界各国共同关心的问题。城市生活垃圾(Municipal solid waste, 简称MSW)是在城市日常生活及为城市生活提供服务的活动中产生的固体废弃物,是城市环境的主要污染物之一。目前,城市生活垃圾处理处置的方法主要包括卫生填埋(Sanitary landfill)、堆肥化(Composting)、焚烧(Incineration)三种,其中前两种处理方式均属于生物处理技术。具体来说,MSW生物处理技术就是城市生活垃圾中固有的或外添加的微生物,在一定控制条件下,进行一系列的生物化学反应,使得MSW中的不稳定的有机物代谢后释放能量或转化为新的细胞物质,从而MSW逐步达稳定化的一个生化过程。 1. 城市生活垃圾生物处理中主要的微生物。。。
领域自适应: 多用于文本分类,属于直推式迁移学习,直推式迁移学习定义:给定一个源域和相应的学习任务,一个目标域和相应的学习任务,直推式学习旨在利用源域和目标域中相同的知识来提高目标域中的目标预测函数。 《基于深度学习的体态与手势感知计算关键技术研究》 基于深度学习的肌电手势识别: 并不需要任何附加信息或手工设计的特征提取器,基于高密度肌电信号(HD-sEMG),使用二维阵列电极采集的肌电信号,使得肌肉活动产生的电势场在时间和空间上的变化可被多个紧密分布在皮肤表面的电极同时记录下来。HD-sEMG中的肌电信号描绘了位于电极覆盖区域内的肌肉活动的时空分布,同时HD-sEMG的瞬时值呈现了在特定时间点肌肉活动所涉及的生理过程的相对全局的测量。瞬时HD-sEMG内部可区分出不同手势模式,可以将采集到的HD-Semg描绘出电势在空间的分布,其对应的热度图即为肌电图像,肌电图像中的像素数(分辨率)由其采集设备中的电极阵列决定,即电极的数量及其电极间距离(例如,具有16行8列的电极网格可W采集8*16像素的肌电图像)。主要是将原始肌电信号值从(-1,1)映射到(0,255),即,其中x是原始肌电信号,I是肌电图像。构建一个8层CNN结构,网络的前两个卷积层用于提取公共的底层图片特征,作者发现瞬时肌电图像在不同的空间位置上表现出不同的视觉特征。在不同手势中,肌电图像在中部偏下以及顶部的条状区域上亮度较强,提出在3,4层加入局部连接结构(受人脸识别前沿工作的启发),因为局部连接层在不同空间位置上的卷积模板的权重不共享,可以更好的提取图片上不同位置的特征。并依据单个窗口内每帧识别出的手势标签中所占比例最高的标签,因为上述实验仅适用于肌电幅值较大的数据进行训练和测试可以获得较高的手势识别准确率,因此需要对肌电信号采用全波整流和低通滤波(全波整流和低通滤波是被广泛采用的肌电信号幅值估计方法),以获取更好的肌电信号。基于深度领域自适应的肌电手势识别: 当训练集和测试集的肌电信号来自不同的采集会话的情况。因为电极位移,肌肉疲劳,电极和皮肤之间的阻抗变化等因素的干扰,肌电信号与采集会话高度相关,已经训练好的手势分类器直接被应用在新的会话时通常准确率较低。因为肌电信号的分布在不同的会话之间变化很大,所以来自不同会话的基于瞬时肌电信号的手势识别可以相应地表示为多源领域自适应问题。 当标定数据未标记时,该论文采用自适应批量归一化(AdaBN, Adaptive Batch Normalization)对手势分类器进行适配。假设用于区分不同手势的知识存储在每个层的权重中,AdaBN不需要适配数据的手势标签,而是随着无标签的适配数据的增加,逐步更新少量的网络参数。给定输入U,BN将其转换为V,其中第i个输入特征的转换公式为: l在训练阶段,每个BN层对于每个源域的均值统计量和方差统计量是独立计算的。因为训练阶段的BN对每个数据批次独立计算统计量,所以只需要确保每个数据批次中的样本来自同一个会话。 l识别阶段,对于给定的未标记数据A,AdaBN执行正向传播算法,更新参数。 该方法准确率:单幅,150毫秒窗口,而另一种算法特征集(150毫秒窗口)和线性判断:。 随机选择未标记的测试集的子集(,,1%,5%,10%)进行深度领域自适应,之后再评测整个测试集上的手势识别的准确率。最后观测到大约5%的适配数据后准确率达到巅峰,适配数据20000帧,在CSL-HDEMG的2048赫兹的采样率下大约10秒。 并且适配算法并不需要观测到所有种类的手势,从27种选择5个和13个进行适配,最终结果分别是(),()另一种方法是肌电地势(sEMG topography),定义为肌电信号在时间上的二维平均强度图,其中每个像素是某个通道的肌电信号在特定时间窗口内的均方根,用于手势识别。 《Revealing Critical Channels and Frequency Bands for Emotion Recognition from EEG with Deep Belief Network》 在基于脑电信号的情感识别任务中,多通道脑电信号存在不相关的脑电信号,这不仅会引起噪声,还会降低系统对情感识别能力。该论文提出一种新的深度信念网(DBN)来检查用于情感识别的关键EEG信道和频段。 主要从行为和生理反应进行情感分析,因为EEG与表情手势相比,具有较高的准确性和客观评价性。该论文采用ESI神经扫描系统,从62通道电极帽以采样率为1000Hz记录脑电信号。每个实验有15个测试,每个测试包括15s提示,45s测试及反馈,5s休息。盖论文一共评价了30个实验。 先下采样原始脑电数据到200Hz,之后使用到50Hz的带通滤波器滤除噪声和伪影,之后采用之前提出的微分熵(differential entropy)特征[1][2],对于固定长度的脑电信号,微分熵相当于一定频段内的对数能量谱。此前已经证明微分熵在低频和高频能量之间具有识别EEG模式的能力,因此在五个频段计算微分熵特征(δ:1-3Hz,θ:4 – 7Hz,α:8-13Hz,β:14-30Hz,γ:31-50Hz),使用256点的短时傅里叶变换,并将特征归一化到0-1。利用五个频段的去噪后的62通道的特征作为输入,DBN达到的准确率和标准差,本论文通过分析经过训练的DBN的权重分布来检验关键通道和频带,权重对于识别情感模型是很重要的,因为对于学习任务贡献较大的神经元权值将增加,不相关的神经元权值趋于随机分布,图1为权重在第一层神经网络训练后的分布,可以看出主要在beta和gamma波的权重最大,这说明此频带包含更重要的鉴别信息。 从图2中我们可以看出侧颞区和前额脑区相比其他脑区在beta和gamma频带更容易激活。因此可以得出结论,在识别积极,中性和负面情绪时侧颞叶和前额叶通道是关键通道,beta和gamma是关键频带。如图3所示,依据脑区中权重分布的特点,设计了四种不同的电极放置剖面,包括4通道,6通道,9通道和12通道,其中4通道的最佳平均精度和标准差为,而所有62通道的最佳平均精度和标准差为,这说明四个相对电极阻轮廓(four profiles of relative electrode sets)FT7,T7,FT8,T8是辨别情感特征的电极。 [1]Duan R N, Zhu J Y, Lu B L. Differential entropyfeature for EEG-based emotion classification[C]// International Ieee/embsConference on Neural Engineering. IEEE, 2013:81-84. [2]Zheng W L, Zhu J Y, Peng Y, et al. EEG-based emotionclassification using deep belief networks[C]// IEEE International Conference onMultimedia and Expo. IEEE, 2014:1-6. 脑电论文(大脑解码:行为,情绪): Real-time naive learning of neural correlates in ECoG Electrophysiology 神经实时朴素学习相关的皮层电生理 地址: A Deep Learning Method for Classification of EEG Data Based on MotorImagery 基于运动表象的脑电数据分类的深度学习方法 地址: Affective state recognition from EEG with deep belief networks 基于深层信念网络的脑电情感状态识别 地址: A Novel Semi-Supervised Deep Learning Framework for Affective StateRecognition on EEG Signals 一种用于脑电信号情感状态识别的半监督深度学习框架 地址: Revealing critical channels and frequency bands for emotion recognitionfrom EEG with deep belief network 用深层信念网络揭示脑电情感识别的关键通道和频带 地址: EEG-based emotion recognition using deep learning network withprincipal component based covariate shift adaptation 基于深度学习网络的主成分协移自适应的脑电情感识别 地址: Classifying EEG recordings of rhythm perception 节律性脑电记录分类 地址: Using Convolutional Neural Networks to Recognize Rhythm Stimuli from Electroencephalography Recordings利用卷积神经网络识别脑电记录中的节律刺激 地址: Convolutional neural network with embedded Fourier transform for EEGclassification 基于嵌入傅立叶变换的卷积神经网络在脑电信号分类中的应用 地址: Continuous emotion detection using EEG signals and facial expressions 基于脑电信号和表情的连续情绪检测 地址: ‘Deep Feature Learning for EEG Recordings 脑电记录的深部特征学习 地址: 异常分类论文(阿兹海默症,癫痫,睡眠阶段检测): Classification of Electrocardiogram Signals with Deep Belief Networks 基于深层信念网络的心电信号分类 Modeling electroencephalography waveforms with semi-supervised deepbelief nets: fast classification and anomaly measurement 半监督深信网模拟脑电波形:快速分类和异常测量 Deep belief networks used on high resolution multichannelelectroencephalography data for seizure detection 用于癫痫检测的基于高分辨率多道脑电图数据的深度信念网 地址: Deep Learning in the EEG Diagnosis of Alzheimer’s Disease 深层学习在阿尔茨海默病脑电诊断中的应用 Sleep stage classification using unsupervised feature learning 基于无监督特征学习的睡眠阶段分类 Classification of patterns of EEG synchronization for seizureprediction 癫痫发作的脑电同步模式分类 地址: Recurrent neural network based prediction of epileptic seizures inintra-and extracranial EEG 基于递归神经网络的颅内外脑电癫痫发作预测 EEG-based lapse detection with high temporal resolution 基于脑电信号的高时间分辨率检测 地址:
论新闻播音中的情感一、新闻播音中的情感依据新闻既是对人类社会实践的客观、真实的反映,又是人(记者、报道者、编辑、播音主持人)对于人类社会实践的认识反映,因而是人的主观选择,因此,人不得不把自己的主观选择———进而把自己的立场、观点、态度、倾向,乃至于自己的兴趣爱好、性格特征、爱憎好恶、情感取向等,尽量隐藏于新闻之下,使自己制作的(写作的、播讲的)新闻保持客观、真实、公正的面貌。但是,人乃血肉之躯,是富有感情的灵性。新闻播音员(主持人)必须用自己的声音语言,乃至面部表情、肢体动作等,把新闻内容传达给受众。就是说,新闻播音员(主持人)必须在理性传达———即尽量客观、公正、真实地传达新闻内容的同时,也将自己感性的一面———即使用自己的器官、感官、表情、动作的一面———直接表露在受众面前。在新闻播音主持实践中,新闻播音员(主持人)恰当表露自己的情感,已为广大受众所接受。虽然仍有一些著名新闻播音员(主持人)至今还在坚持客观冷静的风格,坚持自己的情感不为新闻内容所左右的做法,但是,更多的新闻播音员(主持人)已在自己播音、主持新闻节目时,大胆流露自己的情感倾向。而后者,反而比前者更加显得贴切自然,更能与新闻内容融为一体,也更为广大受众所接受。二、新闻播音中情感的分寸把握找到新闻播音(主持)的情感依据———包括实践的依据和理论的依据,并不等于说,新闻播音(主持)可以滥用情感。实际上,新闻播音(主持)的情感流露,只存在于一个狭小的空间。就像用摄影镜头远距离聚焦,如果想要保持摄影对象焦点清晰,焦点前后景深就只有一点点的距离,稍有差池就会造成摄影对象焦点模糊。这也就是所谓的“分寸感”或“情感分寸”。曾经有人在电视新闻播音(主持)中“热泪盈眶”,也有人在广播新闻播音(主持)中“泣不成声”,这些都严重超越“情感分寸”,后来都给人留下极为深刻的教训。为了保持“焦点清晰”,或者说,保持新闻播音(主持)的情感分寸,就得弄清楚所谓“焦点景深”或“情感分寸”的细微界线到底在哪里。应该说“,焦点景深”或“情感分寸”有一前一后两条界线。前面一条界线是新闻的客观性原则和真实性原则。任何新闻都必须严格保证新闻内容的客观性和真实性。这就要求:在以播音(主持)方式传递新闻内容时,必须时刻牢记“客观、公正、真实”是新闻播音(主持、播报)的本质立场,本来态度。后面一条界线是必须牢牢把握新闻播音员(主持人)和新闻内容之间的距离。新闻是对客观事实的报道,因此,新闻内容和播音员(主持人)之间必然存在距离。新闻和新闻播音员(主持人)之间的距离,决定了新闻播音(主持)的“感情分寸”。如果超越这种分寸,就会给人以“假”的感觉,“做作”的感觉,就会丧失新闻播音(主持)的客观性、真实性和公证性原则。新闻播音(主持)的情感表达,应该来源于新闻稿件。这种情感表达绝大部分隐藏于对新闻内容的层次和节奏以及语言逻辑和重音的把握中。新闻播音员(主持人)为恰当表达情感,必须首先找出新闻稿件的主旨和立意在哪里,找到了新闻的主旨和立意,也就找到了新闻的要点和逻辑、层次和节奏。这样,在播音(主持)时才可以通过形象、生动、鲜活的语言,自然而然恰到好处地表露自己的情感倾向。情感是新闻的内核,它深深隐藏于新闻内容之中,因此也深深隐藏于新闻播音(主持)之中。只有很好地把握新闻的主旨和立意,把握新闻的逻辑和要点,才能把隐藏在新闻后面的情感内核发掘出来,表露出来。缺乏情感的播音(主持),就像是缺乏色香味的菜肴一样令人乏味。事实上,许多新闻稿件由于作者的生活经历不同,立场观点不同,情感态度不同,稿件文字本身就渗透了各种不同的情感因素。这个时候,新闻播音(主持)就必须格外小心地处理好自己的情感表露,不能随波逐流,更不能恣意发挥。恰恰相反,当新闻稿件本身明显流露出作者的情感趋向时,新闻播音(主持)就必须更加冷静客观,严格把握分寸。比如,本台新闻综合频率2008年3月15日《738早新闻》节目中,有一条反映某商家损害消费者利益的消息。这条文字稿件虽然没有强烈抨击商家的语言,主要还是以客观陈述为主,但记者的立场明显站在消费者一边,对某些商业行为进行了严肃的揭露和批评。但在我看来,商家尽管犯有一定的错误,但还不致于到达伤天害理的地步,没有对消费者造成严重损害。因此我在播音情感处理中,十分注意把握分寸,尽量做到语速平稳,气息平和,与人为善。这就在一定程度上使稿件播出保持了客观、公正的立场和态度。三、新闻播音中的情感调节新闻播音(主持)的情感表达不能掺入个人好恶。新闻播音员(主持人)富有自己的生活经历、立场观点和情感态度,这在现实生活中属于完全正常的状态。但是,新闻播音(主持)工作,主要以文字稿件为依据,责任在于把文字稿件的内容播报给广大的受众。因此,除了恰当表露稿件文字所含情感元素之外,不应该掺入新闻播音员(主持人)自己的情感立场或情感倾向。日常生活中,有时新闻播音员(主持人)也会遇到某件不愉快的私事,导致心情恶劣,或者完全没有心情。这时候,新闻播音员(主持人)必须尽快调整自己的心态,不以自己的私人感情影响播音(主持),更不能把个人的好恶带入对稿件的再创作中。依照我多年从事新闻播音(主持)工作的经验,许多情况下,即使在一次播音(主持)过程中,情感流露表达也往往处于运动变化之中。这种情感流露表达的运动变化,一般都取决于稿件本身所表露的情感变化。稿件本身的情感变化,又会引发播音(主持)的情感变化。这时候,需要播音员(主持人)恰当地适应和调节这种变化,理智地掌握这种变化,合情合理地表达好这种变化。播音员(主持人)必须学会遵循稿件内容来激发自己的情感,同时又具有对情感的自我调节能力。有时候,在某一次特定节目中的各篇稿件之间,会出现多次情感调整和变化,甚至一篇稿件中的某个段落与层次之间,也会出现情感上的差异和变化。这时候,往往需要播音员(主持人)进行必要的调节和把握。只有这样,才能准确恰当地,恰到好处地表达出稿件本身所含有的情感倾向。四、新闻播音中的情感分配。新闻节目形态十分丰富,一挡新闻节目往往由多种形态稿件组成。比如,会有时政新闻、社会新闻、批评新闻、人物新闻、新闻通讯、新闻背景等。不同的新闻稿件需要进行不同的情感把握,决不能用一种方式,一个腔调,一播到底。这就需要新闻播音员(主持人)进行必要的情感分配。记得2006年底,我主播一期《738晚新闻》,由于对不同形态的新闻作了恰当的情感分配,使整档节目听起来抑扬顿挫,有声有色。不但层次分明,而且既感情饱满,又跌宕起伏。这档节目被评为省广电学会年度优秀播音作品二等奖。仔细分析这档晚新闻节目,实际上是整组稿件围绕一个共同主题———献爱心、送温暖展开。当时正好时近年关,各地开展了各种送温暖活动。稿件中有政府领导给困难群众送温暖的内容,也有社会各界人士自发献爱心活动。还有一条重头稿件是讲一位身患白血病的十六岁女孩,在社会各界的关爱下,成功实施骨髓移植手术的消息。当时这条消息的播出,牵动了整个古城市民的心。节目中,除了记者与在上海的小姑娘养父进行连线采访,以及对小姑娘的主治大夫进行采访属于录音以外,其他内容都要靠播音(主持)来播报传递。在这期节目中,我特别注重情感分配,用不同的情感色彩,向听众介绍手术情况,小姑娘术后恢复情况,社会各界对小姑娘无微不至关怀的情况,以及台湾慈济会为小姑娘进行骨髓配型和捐赠骨髓等一系列详细背景资料等。另外,我还在节目后半段《方月说事》小单元中,向听众详细讲述了这个患白血病的小姑娘和她的养父母,以及许多不知名的社会人士之间一幕幕感人至深的故事。在对这些稿件的处理中,我把主要情感分配到几条重点稿件中,着意加大情感投入的份量。由于稿件文字十分感人,作为播音员,我首先已被深深打动。但我深知自己的责任:我要把我的感动传递给我的听众,感染给我的听众。而对于其他稿件,我作了相对平稳的处理。这样,使重点稿件显得更加突出,更有份量。我一向认为:播音不是简单的吐字发音,播音不是印刷机或铅字,它不但需要播音员用眼用口去播讲,更需要播音员用脑、用心、用感情去表达。它是一项创造性工作。用悦耳的声音吸引人,用真挚的情感打动人,用振奋的精神感召人,我一直在努力。
1、引言 贝叶斯方法是一个历史悠久,朴素贝叶斯中的朴素一词的来源就是假设各特征之间相互独立。这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率。当然有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。 2、贝叶斯公式 贝叶斯公式其实很简单,但是很常用,就一行: 而我们二分类问题的最终目的就是要判断 P(“属于某类”|“具有某特征”) 是否大于1/2就够了。贝叶斯方法把计算“具有某特征的条件下属于某类”的概率转换成需要计算“属于某类的条件下具有某特征”的概率,而后者获取方法就简单多了,我们只需要找到一些包含已知特征标签的样本,即可进行训练。而样本的类别标签都是明确的,所以贝叶斯方法在机器学习里属于有监督学习方法。 这里再补充一下,一般『先验概率』、『后验概率』是相对出现的,比如 P(Y)与 P(Y|X) 是关于 Y的先验概率与后验概率, P(X)与 P(X|Y)是关于 X的先验概率与后验概率。 4、垃圾邮件识别 我们可以通过一个例子来对邮件进行分类,识别垃圾邮件和普通邮件,如果我们选择使用朴素贝叶斯分类器,那目标就是判断 P(“垃圾邮件”|“具有某特征”) 是否大于1/2。现在假设我们有垃圾邮件和正常邮件各1万封作为训练集。需要判断以下这个邮件是否属于垃圾邮件: 也就是判断概率 P(“垃圾邮件”|“我司可办理正规发票(保真)17%增值税发票点数优惠!”)是否大于1/2。我们不难发现:通过上述的理解,也就是将其转换成的这个概率,计算的方法:就是写个计数器,然后+1 +1 +1统计出所有垃圾邮件和正常邮件中出现这句话的次数啊。也就是: 于是当我们接触到了中文NLP中,其中最为重要的技术之一:分词!!!也就是把一整句话拆分成更细粒度的词语来进行表示。另外,分词之后去除标点符号、数字甚至无关成分(停用词)是特征预处理中的一项技术。我们观察(“我”,“司”,“可”,“办理”,“正规发票”,“保真”,“增值税”,“发票”,“点数”,“优惠”),这可以理解成一个向量:向量的每一维度都表示着该特征词在文本中的特定位置存在。这种将特征拆分成更小的单元,依据这些更灵活、更细粒度的特征进行判断的思维方式,在自然语言处理与机器学习中都是非常常见又有效的。因此贝叶斯公式就变成了: 1、朴素贝叶斯(Naive Bayes),“Naive”在何处? 加上条件独立假设的贝叶斯方法就是朴素贝叶斯方法(Naive Bayes)。将句子(“我”,“司”,“可”,“办理”,“正规发票”) 中的 (“我”,“司”)与(“正规发票”)调换一下顺序,就变成了一个新的句子(“正规发票”,“可”,“办理”, “我”, “司”)。新句子与旧句子的意思完全不同。但由于乘法交换律,朴素贝叶斯方法中算出来二者的条件概率完全一样!计算过程如下: 其中“发票”重复了三次。 3、处理重复词语的三种方式 (1)、多项式模型: 如果我们考虑重复词语的情况,也就是说,重复的词语我们视为其出现多次,直接按条件独立假设的方式推导,则有: 统计计算 P(“词语”|S)时也是如此。 我们扫描一下训练集,发现“正规发票”这个词从出现过!!! ,于是 P(“正规发票”|S)=0 …问题严重了,整个概率都变成0了!!!朴素贝叶斯方法面对一堆0,很凄惨地失效了…更残酷的是这种情况其实很常见,因为哪怕训练集再大,也可能有覆盖不到的词语。本质上还是样本数量太少,不满足大数定律,计算出来的概率失真 *。为了解决这样的问题,一种分析思路就是直接不考虑这样的词语,但这种方法就相当于默认给P(“正规发票”|S)赋值为1。其实效果不太好,大量的统计信息给浪费掉了。我们进一步分析,既然可以默认赋值为1,为什么不能默认赋值为一个很小的数?这就是平滑技术的基本思路,依旧保持着一贯的作风,朴实/土但是直接而有效。对于伯努利模型,P(“正规发票”|S)的一种平滑算法是: 接下来的核心问题就是训练出一个靠谱的分类器。首先需要有打好标签的文本。这个好找,豆瓣影评上就有大量网友对之前电影的评价,并且对电影进行1星到5星的评价。我们可以认为3星以上的评论都是好评,3星以下的评论都是差评。这样就分别得到了好评差评两类的语料样本。剩下就可以用朴素贝叶斯方法进行训练了。基本思路如下: 但是由于自然语言的特点,在提取特征的过程当中,有一些tricks需要注意: 当然经过以上的处理,情感分析还是会有一部分误判。这里涉及到许多问题,都是情感分析的难点: (2)、拼写纠错 拼写纠错本质上也是一个分类问题。但按照错误类型不同,又分为两种情况: 真词错误复杂一些,我们将在接下来的文章中进行探讨。而对于非词错误,就可以直接采用贝叶斯方法,其基本思路如下: 训练样本1:该场景下的正常用词语料库,用于计算 P(候选词i)。 训练样本2:该场景下错误词与正确词对应关系的语料库,用于计算 P(错误词|候选词i) 当然,朴素贝叶斯也是有缺陷的。比如我们知道朴素贝叶斯的局限性来源于其条件独立假设,它将文本看成是词袋子模型,不考虑词语之间的顺序信息,例如:朴素贝叶斯会把“武松打死了老虎”与“老虎打死了武松”认作是一个意思。那么有没有一种方法提高其对词语顺序的识别能力呢?当然有,就是这里要提到的N-gram语言模型。接下来详细给大家介绍N-gram语言模型。 1、从假设性独立到联合概率链规则 与我们之前我们垃圾邮件识别中的条件独立假设是一样的: 4、N-gram实际应用举例 (1)、词性标注 词性标注是一个典型的多分类问题。常见的词性包括名词、动词、形容词、副词等。而一个词可能属于多种词性。如“爱”,可能是动词,可能是形容词,也可能是名词。但是一般来说,“爱”作为动词还是比较常见的。所以统一给“爱”分配为动词准确率也还足够高。这种最简单粗暴的思想非常好实现,如果准确率要求不高则也比较常用。它只需要基于词性标注语料库做一个统计就够了,连贝叶斯方法、最大似然法都不要用。词性标注语料库一般是由专业人员搜集好了的,长下面这个样子。其中斜线后面的字母表示一种词性,词性越多说明语料库分得越细;需要比较以下各概率的大小,选择概率最大的词性即可: 将公式进行以下改造,比较各概率的大小,选择概率最大的词性: N-gram分类器是结合贝叶斯方法和语言模型的分类器。这里用 Y1,Y2分别表示这垃圾邮件和正常邮件,用 X表示被判断的邮件的句子。根据贝叶斯公式有: 比较这些概率的大小,找出使得 P(Yi|X)最大的 Yi即可得到 X 所属的分类(分词方案)了。Yi作为分词方案,其实就是个词串,比如(“我司”,“可”,“办理”,“正规发票”)(“我”,“司可办”,“理正规”,“发票”),也就是一个向量了。而上面贝叶斯公式中 P(X|Yi)项的意思就是在分类方案 Yi的前提下,其对应句子为 X的概率。而无论分词方案是(“我司”,“可”,“办理”,“正规发票”)还是(“我”,“司可办”,“理正规”,“发票”),或者其他什么方案,其对应的句子都是“我司可办理正规发票”。也就是说任意假想的一种分词方式之下生成的句子总是唯一的(只需把分词之间的分界符号扔掉剩下的内容都一样)。于是可以将 P(X|Yi)看作是恒等于1的。这样贝叶斯公式又进一步化简成为: 也就是说我们
语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 我整理了浅谈语音识别技术论文,欢迎阅读!
语音识别技术概述
作者:刘钰 马艳丽 董蓓蓓
摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。
关键词:语音识别;特征提取;模式匹配;模型训练
Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to developing prospect ion and application of the speech-identification technology are discussed in the last part.
Keywords:Speech identification;Character Pick-up;Mode matching;Model training
一、语音识别技术的理论基础
语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。
不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
(一) 语音识别单元的选取
选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。
(二) 特征参数提取技术
语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。
线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。
Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。
也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。
(三)模式匹配及模型训练技术
模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元 网络 (ANN)。
DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。
HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。
人工神经元 网络 在语音识别中的 应用是现在研究的又一 热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。
二、语音识别的困难与对策
目前,语音识别方面的困难主要表现在:
(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。
(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。
(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。
(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。
(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。
三、语音识别技术的前景和应用
语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
参考 文献 :
[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,:(总l12期)
[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,
[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界, (总122期)
[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991
[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防 工业 出版社,2005
[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999
点击下页还有更多>>>浅谈语音识别技术论文
自然语言处理(NLP)在旅游领域具有广泛的应用,其中之一是情感分析。情感分析是指通过计算机程序来识别文本中的情感倾向,分析人们对旅游目的地、酒店、餐厅、交通工具等的评价。这种技术可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。
一个典型的旅游情感分析应用是在线评论分析。在线评论是消费者对旅游目的地、酒店、餐厅等的反馈,通过使用 NLP 技术,旅游公司和酒店等机构可以分析这些评论,了解消费者对服务质量、位置、价格、餐饮等的看法。这些信息可以帮助他们改善服务质量、提高客户满意度。
另一个应用是社交媒体情感分析。社交媒体是消费者展示旅游经历的主要渠道,通过使用 NLP 技术,旅游公司和酒店等机构可以分析消费者在社交媒体上发布的文本、图片和视频,了解消费者对旅游目的地、酒店、餐厅等的感受。这些信息可以帮助他们改善服务质量、提高客户满意度、扩大品牌知名度。
此外,NLP还可以用于预测未来趋势,通过分析历史数据来预测旅游需求、价格趋势等,进而帮助旅游公司和酒店等机构调量、提高客户满意度。
NLP技术还可以用于语音识别和语音合成,在旅游领域中应用于语音导航、语音查询等场景。例如,旅游公司可以开发一款语音导航应用,让游客在旅游中使用语音命令来获取信息和导航。
总之,NLP在旅游领域有着广泛的应用,它可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。通过使用NLP技术,旅游行业可以更好地了解客户,并提供更好的服务和体验。
对于目标检测方向并不是特别熟悉,本文记录一下RCNN, fast-RCNN, faster-RCNN, mask-RCNN这4篇有关目标检测的论文笔记和学习心得。
R-CNN的意思就是Region based,主要思路就是根据一张图像,提取多个region,再将每个Region输入CNN来进行特征的提取。因此RCNN就可以分为 Region proposals , Feature extraction 两个主要部分,提取的特征就可以输入任意一个分类器来进行分类。 模型的流程图如下:
在训练的时候,首先使用的是已经训练好的CNN网络作为特征提取器,但是由于预训练是在分类数据集上,因此在应用到检测之前要做finetune。也就是说,为了将用ImageNet数据集训练的网络应用到新的任务(检测),新的数据集(region)上,作者将原来的CNN最后的1000类的fc层,更改为了 层, 代表待检测的物体的类别数。然后,对于所有的region,如果它和ground truth的重叠率大于,就认为是正类。 对于分类器的训练,作者发现选择多大的IoU来区分正类和负类非常关键。并且,对于每一类,都会训练一个分类器。
框的回归非常重要,在对每一个region proposal使用分类器进行打分评价之后,作者使用一个回归器来预测一个新的框作为结果。这个回归器使用的特征是从CNN中提取的特征。回归器的训练中,输入是 region proposal 的 和ground truth的 ,目标是学习一种变换,使得region proposal通过该变换能够接近ground truth。同时,希望这种变换拥有尺度不变性,也就是说尺度变化的话,变换不会改变。 如下图所示,每一个regressor会学习一组参数,特征输入是pool 5的特征输出,拟合的目标是 。
Fast-RCNN 主要解决的问题是在RCNN中对于每一个region proposal都进行特征提取,会产生非常多的冗余计算,因此可以先对一张图像进行特征提取,再根据region proposal在相应的特征上进行划分得到对应region的特征(映射关系)。 这样便可以实现共享计算提高速度,但是与SPPnets不同,SPPnets在一副图像得到对应的特征后,从这张图像的特征上proposal对应的部分,采用空间金字塔池化,如下图:
RoI pooling的方法很简单,类似于空间金字塔pooling,它将proposal部分对应卷积层输出的特征(称之为RoI,因为用于做pooling的特征是 region of interest,也就是我们感兴趣的区域)划分成 块,然后对每一块求最大值,最终得到了一个 的特征图。可以看出,它只是空间金字塔pooling的一部分。 但是SPP-nets的空间金字塔也是可以求导的,那么它到底不好在哪里呢?因为当每一个RoI都可能来源于不同的图像的时候(R-CNN和SPPnets的训练策略是从一个batch的不同图像中,分别挑选一个proposal region),SPPNets的训练非常地低效,这种低效来源于在SPPnets的训练中,每个RoI的感受野都非常地大,很可能对应了原图的整个图像,因此,得到的特征也几乎对应了整张图像,所以输入的图像也就很大。 为了提高效率,Fast-RCNN首先选取 个图像,再从每个图像上选择 个RoI,这样的效率就比从每个图像提取一个RoI提高了 倍。
为了将分类和框回归结合起来,作者采用了多任务的loss,来进行联合的训练。具体来说就是将分类的loss和框回归的loss结合起来。网络的设计上非常直接,就是将RoI得到的特征接几个FC层后,分别接不同的输出层。对应于分类部分,特征会接一个softmax输出,用于分类,对于框回归部分,会接一个输出4维特征的输出层,然后分别计算loss,用于反向传播。loss的公式如下:
回归的target可以参考前面的R-CNN部分。
notes
为什么比fast还fast呢?主要原因是在这篇论文中提出了一个新的层:RPN(region proposal networks)用于替代之前的selective search。这个层还可以在GPU上运算来提高速度。 RPN的目的:
为了能够进行region proposal,作者使用了一个小的网络,在基础的卷积层输出的特征上进行滑动,这个网络输入大小为 ,输入后会映射(用 的卷积)为一个固定长度的特征向量,然后接两个并联的fc层(用 的卷积层代替),这两个fc层,一个为box-regressoin,一个为box-classification。如下图:
在每一个滑动窗口(可以参考 ),为了考虑到尽可能多的框的情况,作者设计了anchors来作为region proposal。anchors就是对于每一个滑动窗口的中心位置,在该位置对应的原图位置的基础上,按照不同的尺度,长宽比例框出 个不同的区域。然后根据这些anchors对应的原始图像位置以及区域,和ground truth,就可以给每一个滑动窗口的每一个anchor进行标记,也就是赋予label,满足一定条件标记为正类(比如和ground truth重叠大于一个值),一定条件为负类。对于正类,就可以根据ground truth和该anchor对应的原图的区域之间的变换关系(参考前面的R-CNN的框回归),得到回归器中的目标,用于训练。也就是论文中的loss function部分:
自然地,也就要求RPN的两个并联的FC层一个输出2k个值用于表示这k个anchor对应的区域的正类,负类的概率,另一个输出4k个值,用于表示框回归的变换的预测值。
对于整个网络的训练,作者采用了一种叫做 4-step Alternating Training 的方法。具体可以参考论文。
与之前的检测任务稍有不同,mask r-cnn的任务是做instance segmentation。因此,它需要对每一个像素点进行分类。 与Faster R-CNN不同,Faster R-CNN对每一个候选框产生两个输出,一个是类别,一个是bounding box的offset。Mask R-CNN新增加了一个输出,作为物体的mask。这个mask类似于ps中的蒙版。
与Faster R-CNN类似的是,Mask R-CNN同样采用RPN来进行Region Proposal。但是在之后,对于每一个RoI,mask r-cnn还输出了一个二值化的mask。
不像类别,框回归,输出都可以是一个向量,mask必须保持一定的空间信息。因此,作者采用FCN来从每个RoI中预测一个 的mask。
由于属于像素级别的预测问题,就需要RoI能够在进行特征提取的时候保持住空间信息,至少在像素级别上能够对应起来。因此,传统的取最大值的方法就显得不合适。 RoI Pooling,经历了两个量化的过程: 第一个:从roi proposal到feature map的映射过程。 第二个:从feature map划分成7*7的bin,每个bin使用max pooling。
为此,作者使用了RoIAlign。如下图
为了避免上面提到的量化过程
可以参考
作者使用ResNet作为基础的特征提取的网络。 对于预测类别,回归框,mask的网络使用如下图结构:
整体看完这几篇大佬的论文,虽说没有弄清楚每一个实现细节,但是大体上了解了算法的思路。可以看出,出发点都源于深度神经网络在特征提取上的卓越能力,因此一众大神试图将这种能力应用在检测问题中。从R-CNN中简单地用于特征提取,到为了提高速度减少计算的Fast R-CNN,再到为了将region proposal集成进入整个模型中,并且利用GPU加速的RPN,也就是Faster R-CNN。再到为了应用于instance segmentation任务中,设计的RoIAlign和mask。包括bounding box regression,pooling层的设计,训练方法的选择,loss的设计等等细节,无一不体现了大师们的思考和创造力。 可能在我们这些“拿来”者的眼中,这些方法都显得“理所应当”和巧妙,好用,但是,它们背后隐藏的选择和这些选择的思考却更值得我们学习。 以及,对待每一个问题,如何设计出合理的解决方案,以及方案的效率,通用性,更是应该我们努力的方向。
这个你可以上中国期刊库网站查找一下。
根据学术堂的了解。毕业论文提纲是学生在正式开始写作论文之前提交给论文指导教师的一份关于论题观点的来源,论文基本观点,论文基本结构的报告.具体要求如下:1.提纲包括这样几个部分:论题观点来源,论文基本观点,论文结构。2.在论题观点来源这一部分,学生需要说清楚自己论文的观点是如何得到的.论题观点来源一般有以下两种:阅读某些著作(包括教科书),文章的时候有感而得;与老师讨论的时候得到的灵感.前者要写清楚著作的名称,作者,出版时间,以及著作的哪些方面给了自己什么样的感受.后者写清楚老师的指导给了自己什么样的启示。3.在论文的基本观点部分,要求学生写清楚整个论文的基本观点都有哪些,这些观点必须逻辑清楚,合理。4.在论文结构部分,学生结合自己的基本观点写清楚整个论文的结构.这是学生向指导教师说明自己如何论证观点的一个部分.例如学生要写清楚正篇文章包含那几个部分,第一部分写什么,其中包括几个小部分,每个小部分写什么等,以此类推。5.提纲没有字数的要求,但是学生必须保证有2,3,4这三个部分的内容.文字方面要求语言流畅,思路清晰,说清楚自己的观点。论文提纲是学生写作论文的开端,提纲是否成功通过指导教师的审查决定了学生能否进入论文的实际写作阶段,所以要求学生认真对待并且按时提交。
能够区分层次清晰、计划周密的重点,有机统一整体观点的历史观点。根据各部分的要求,对资料进行整理、组织和利用,资料的选择,使其效果最大化。简单大纲和详细大纲。每篇论文都需要做一个简单的总结,是对论文水平的总结。它只是指出了论文的要点。不涉及论文的展开方式。不过这个大纲很简单,但是因为是作者经过深思熟虑形成的,所以作者的写作才能顺利进行。如果在写论文之前没有这样的准备,就很难边写边完成。详细的提纲是给出更详细的主要论点和论据列表的起点。与简单提纲不同,详细提纲更注重展开论点。其他结构只需要一个完整的部分。然后论文写作过程才能顺利完成。按照提高的顺序来创作论文就行了,不用担心偏离主题。所以,一个详细的提纲对论文写作很有帮助。
论文提纲就是论文的框架、结构,是作者构思谋篇的具体体现。便于作者有条理地安排材料、展开论证。本科论文的提纲结构:一、中英文摘要二、绪论(前言)1、研究背景2、研究目的和意义3、国内外研究综述4、研究方法三、理论概述与文献概述1、论文用到的相关概念2、相关理论概述四、现状,对研究问题现状进行分析总结(文字描述及数据分析)五、根据现状提出存在的问题及原因分析(列出123)六、对策与建议,针对上面提出的问题提出解决政策,一 一对应进行解决(列出123)。七、结论
具体的范文模板链接:
毕业论文一般由:标题、目录、摘要、正文、结论与建议、参考文献、附件等几部分组成二、目录如果毕业论文的内容、页数较多,为了方便读者阅读,应当使用目录或索引形式列出报告所分的主要章节和附录,并注明标题、有关章节号码及页码,一般来说,目录的篇幅不宜超过一页。三、摘要主要包括四方面内容:第一,简要说明论文目的。第二,简要介绍研究对象和研究内容。第三,简要介绍研究的方法。介绍研究的方法,有助于使人确信研究内容的可靠性,因此对所用方法要进行简短叙述,并说明选用方法的原因。例如,是采用调查法,或者进行实验等。第四,突出分析方法和结论。四、正文为毕业论文(设计)的主体。通常应包括引言(概述)、问题的提出、设计计算的主要方法、内容和方法、分析和讨论、理论在实际中的应用;结论、感想和体会等。论文或设计说明书字数不少于4~6千字,图、表及照片应位于报告的有关内容之中。五、结论与建议 结论是进行归纳和综合而得出的总结,对所得结果与已有结果的比较和课题尚存在的问题,以及进一步开展研究的见解与建议。应明确、精炼、完整及准确,认真阐述论文结论或设计在本领域中的意义。这部分包括对引言和正文部分所提出的主要内容的总结,提出如何利用已证明为有效的措施和解决某一具体问题可供选择的方案与建议。结论和建议与正文部分的论述要紧密对应,不可以提出无证据的结论,也不要没有结论性意见的论证。
论文的特点有六个:论文的创新性、论文的学术性、论文的科学性、论文的平易性、专业性、实践性。
一、论文的创新性
论文要有新意,要从不同层次进行新颖独到的见解;
填补空白的新发现、新发明、新理论。在前人未开拓的土地上进行探索的研究从而提出填补空白的新发现,例如居里夫人发现镭;新发明,如音乐家杰思罗·塔尔,把风琴传声结构的原理用于播种机,解决了种子落地的速度问题,发明出世界上第一台实用的播种机;新理论,如牛顿经过一系列的实验、观测和演算,发现了着名的“万有引力定律”.
更正前说错误。论文的研究成果能更正前人错误的认识。如伽利略推翻了亚里土多德的物体下落学说;李四光否定了中国大陆无石油的所谓权威定论。
弥补前说不足。与前人论述同一事物或现象,但从新的角度研究,补充完善前说观点、内容。学术论文的写作是非常重要的,它是衡量一个人的学术水平和科研能力的主要标志。学术论文就是系统的、专门的知识来讨论或研究某种问题或研究错的学理性文章。
二、论文的学术性
所谓学术,是指较为专门、有系统的学问。学术性是毕业论文的本质特征。论文一般是针对某一个专门学科的建设和发展过程中,揭示事物或现象的本质规律,有一定的理论高度,分析带有学术价值的问题,引述各种事实和道理去论证自己的新见解。其学术性具体体现在:
论点的正确。论点正确是论文的生命力,它必须经得起实践的检验。因面,它要求作者立论要客观,不能带有个人的偏见。
论据的真实。论文中的引用材料、数据水实必须符合客观实际。论文作者必须通过实验、观察、调查、研究,最大限度地占有材料,事实要充分而且要有足够的说服力。
论证周密。论文的论述过程符合人们推理规律,层次清楚,首尾连贯、结构严谨。论证就是用论据来证明论点,其目的在于揭示论点和论据之间必然的逻辑关系。
三、论文的科学性
学术论文的科学性,要求作者在理论上不得带有个人的好恶的偏见,不得主观臆造,必须切实地从客观实际出发,从中引出符合实际的结论。在论据上,尽可能的多地占有资料,以最充分的、确凿优利德 论据作为立论的依据。在论证时,必须经过周密的思考,进行严谨的论证。坚持论文的科学性,就要坚持实事求是,切忌感情用事,更不能凭空臆造、随意发挥。论文的科学性表现在:
论文观点客观。正确鲜明集中。无论是证明还是反驳,论点必须正确。在论证过程中,紧紧围绕论点进行论述,得出令人信服的结论。
论据确凿,足以支撑作者观点。观点需要用充分有力的、真实可靠的论据来支持。要求作者充分掌握第一手资料,查阅大量相关数据,认真核实每个论据。为立论打下良好的基础。
论证合乎逻辑。 用证据说明论点,要善于用科学的方法,充分阐述论点与论据之间内在的逻辑,做到论文结构严谨、推理严密。
四、论文的平易性
平易性是论文在形式与表达方面必不可少的特点。值得是要用通俗的语言表述科学道理,不仅要做到文字从字顺,而且要准确、鲜明、和谐、力求生动。具体如下:
论文的结构要有条理性,主次有别,言而有序。不求章法奇特,但求顺理成章。
做到概念准确。判断正确,事物与事物、事理与事理之间的联系同异分明,说明事物事理的内容、属性和存在形式时要恰如其分,如实反映客观事物、事理的面貌。
论文文句流畅,叙述深人浅出。把深奥的问题尽可能明白无误地表达出来。要求论文写作语言具有明确、简洁周密、规范的特点,遣词造句不仅要合乎语法规范,而且要注意词汇的精确性和单性,避免产生歧义。
要将自然语言和人工语言(图像、照片、表格、符号、公式等)配合使用形成独特的书面语言表达体系,这不仅可以节省篇幅,提高直观性、形象性,还便于读者理解,增添阅读的兴趣。
五、专业性
论文的专业性是区别不同类型论文的主要标志,也是论文分类的主要依据。按研究的学科,可将学术论文分为自然科学论文和社会科学论文。每类又可按各自的门类分下去。如社会科学论文,又可细分为文学、历史、哲学、教育、政治等学科论文。按研究的内容可将=学术论文分为两类研究论文和应用研究论文。理论研究,重在对各自学科的基本概念和基本原理的研究;应用研究,侧重于如何将。
学论文分为理论研究论文和应用研究论文。理论研究重在对各自的学科概念和基本原理的研究;应用研究侧重于对如何将各学科的知识转化于专业技术和生产技术,直接服务于社会。
六、实践性
是论文价值的具体体现。它表内容上,旨在根据一定的各位职责与目标要求培养能力。
毕业论文属科技论文,它应具有以下特点:
1、科学性
科学性――就描述对象而论,是指论文只涉及科学与技术领域的命题;就描述内容来看,是指它要求文章的论述具有可信性。科技论文不能凭主观臆断或个人好恶随意舍取素材或得出的结论。论点的推理要求严密、并正确可信。揭示的是普遍规律或特殊规律。
2、逻辑性
辩证逻辑揭示内在规律和联系。
形式逻辑揭示外部规律和联系。
逻辑性是文章的结构特点,它要求论文的脉络清晰、结构严谨、推论合理、演算正确、符号规范、文字通顺、前呼后应、自成系统。不论文章所涉及的专题大小如何,都应该有自己的前提或假说、论证素材和推断结论,不应该是一堆堆数据罗列或一串串现象的自然描绘。
3、首创性
首创性是对描述的内容区别于其它文献的一种特殊要求,创新是科技论文的灵魂。它要求论文所提示的事物现象、属性、特点、以及事物变化时所遵循的规律,必须是前所未见的、首创的、或部分是首创的,而不是对他人工作的复述或解释。
首创性就是要说出别人没有说过的话,道出别人没有道出的理,有新意,有独道。
4、继承性
就是要站在巨人的肩膀上去看旧问题发现新问题。
论文的特征就是论说、阐明道理,揭示某种规律和特征。因而不是记事状物,也不是叙述过程,更不是抒发情感。