中国方言识别研究现状论文

发布时间：2023-12-09 15:20:53

中国方言识别研究现状论文

中国七大方言概述 1.北方话（简称：北语） 2.广东话（简称：粤语） 3.江浙话（简称：吴语）：4.福建话（简称：闽语）：5.湖南话（简称：湘语）： 6.江西话（简称：赣语）： 7.客家话（简称：客语）： 1、北方方言又称北方话，以北京话为代表，通行语中国北方地区各省区，贵州、四川、云南以及华中地区的部份县市。北方方言分为四个次方言区：（1）华北方言，通行于京津两市几东北三省，河北、山东几河南六省。其中吉林、辽宁、黑龙江三省方言最接近北京话。（2）西北方言，通行于山西、陕西、甘肃、内蒙古、宁夏一部分、青海一部分及新疆等六省一区。（3）西南方言，通行于四川、贵州、云南三省及湖北大部份。湖南、广西北部边沿地区。（4）江淮方言，俗称下江官话，通行于长江中下游，包括安徽、江苏、江西部份沿江地区。 2、吴方言吴方言又称江浙话或江南话。过去以苏州话为代表，现今随着上海市的经济发展，使上海话使用的人口不断的增多，通晓上海话也逐渐多。因此现今吴方言的代表乃是上海话。通行地域主要是江苏省长江以南、镇江以东，南通小部份，上海及浙江大部份地区，可分为五个片：（1）以上海话为代表的太湖片，通行地域：上海市、常州地区、杭州地区和宁波地区。（2）以临海话为代表的台州片。（3）以温州话为代表的东欧片。（4）以金华话为代表婺州片。（5）以丽水话为代表的丽衢片。 3、湘方言 : 湘方言又称湖南话或湖湘话。以长沙话为代表，分布在湖南省大部份地区。湘方言从内部语音差异上看，又有新湘语和老湘语的分别。老湘语广泛流行于湖南中部宁乡、衡阳等地，新湘语流行于长沙、株州等大中城市中。 4、赣方言赣方言又称江西话、赣语或溪语。以南昌话为代表，通行于江西省大部份地区以及福建西部、湖南省部份县市。因历史上多次北方汉人南迁多从江西为中转，家之地理上与江淮官话、湘方言、棚民话区接壤，就使江西省边缘地区深受其他方言影响，也导致赣方言自身特点被淡化。赣方言内部可分为7个片：（1）以南昌话为代表的昌靖片，通行于南昌地区、高安地区。（2）以宜春话为代表的宜浏片，通行于宜春地区、新余地区和湖南省（3）以吉安话为代表的吉茶片，通行于吉安地区、井冈山地区和湖南省的茶陵、攸县、酃县。（4）以抚州话为代表的抚广片，通行于抚州地区。（5）以鹰潭话为代表的鹰弋片，通行于鹰潭地区、贵溪地区、乐平地区、景德镇地区。（6）以赣县话为代表的赣南片（又称赣州片），通行于江西赣南地区。（此片赣语曾被大棚民民系的棚民籍研究者刻意划入棚民方言的分支）（7）以长汀话为代表的闽西片，通行于福建西部的汀州地区。（此片赣语支系同样也被棚民籍的研究者把之划入棚民方言的支系，这是语言学上的大作祟） 5 粤方言又称粤语或广东话，通行于广东省大部份地区，广西自治区的南和东部及港澳地区。（1）以广州话为代表的粤海片，通行地域：广东珠江三角洲地区、粤西地区、粤北地区部份县市和广西梧州地区。（2）以台山话为代表的四邑片，通行地域：广东江门地区（新会、台山、江门市、开平、恩平和鹤山一部分）。（3）以韶关粤语为代表的粤北片，通行地域：广东韶关地区，阳山、佛岗和英德市一部分。（4）以阳江话为代表的高阳片，通行地域：广东茂名地区和阳江地区。（5）以广西钦州话为代表的钦廉片，通行地域：广东湛江地区、广西钦州地区和广东雷州地区一部分。（6）以惠州粤语为代表的惠河片（此片曾被棚民学者误为棚民方言的分支，尤其是广东河源居民，他们也象棚民研究者误认了自己是棚民人）。通行地域：广东惠州地区、河源地区和揭阳地区的普宁、揭西一部分，汕尾地区的陆河县和梅州地区的五华、兴宁一部分。（7）以广西南宁话为代表的邕浔片，通行地域：广西南宁地区、玉林地区一部分。（8）以广西玉林话为代表的勾漏片，通行地域：广西玉林地区和广西梧州一部分。 6、棚民方言棚民方言又称嘉应话、客家话或流话。以广东梅城话为代表，主要通行于广东梅州地区及零星分布于江西南端和福建西部。历史上棚民一族是自东晋开始从中原地区的一群流人为了避免战乱曾好几次向南方迁居。他们集中生活最多的地方是广东梅州地区。海外华人及华侨中亦有部份说棚民话。 7、闽方言闽方言又称福建话或福佬话。过去以福州话为代表，今由于闽方言的闽南居民的人口日益增长，使用闽南方言的人口也由此增多。故此现今的闽方言中一般是以闽南方言的厦门话为代表。闽方言内部可分为5个片。（1）以福州话为代表的闽东片 - （2）以厦门话为代表的闽南片，在闽方言中的闽南片又被分为几个小片：1、泉漳片以福建厦门话为准。2、潮汕片以广东汕头话为准。3、雷州片以海康话为准。4、琼文片以海南海口话为准。（3）以建瓯话为代表的闽北片。（4）以永安话为代表的闽中片。（5）以莆田话为代表的莆仙片。南洋群岛中的华人社区中也有相当多来自闽方言区，但主要是闽南方言。附：还有一种标准是把全国分成八大方言区，即把闽方言分成两支 1、闽北方言，又称为福建话。闽北方言分布在福建北部、浙江南部个别地区和台湾的一部份，此外，南洋华侨也有一部份人说闽北方言。闽北方言以福州话为代表。 2、闽南方言，广东人称为潮州话，福建人称为厦门话。闽南方言分布在福建南部、广东东部和海南岛的一部份，海外部分华人社区亦流通闽南方言。闽南方言以厦门话为代表。（这是按地理的南北来分，如果是综合福建方言来说的话，福州话则属于闽东方言）中国的方言语系———————语言——————方言——————次方言 ┌晋语——————————┬大同话 │ └太原话 │ │ ┌陕甘语—————┬陕西话 │ │ └甘肃话 │ │ ┌东北话 │ │ ├河北话（国语、普通话） ┌北语群————┤ ├北方汉语————┼山东话 │ │ │ ├胶东话 │ │ │ └河南话 │ │ │ ┌鄂北话 │ │ │ ├楚语 │ │ │ ├湖南官话 │ └北语—————┤ ├岑江话 │ ├西南汉语————┼桂柳话 │ │ ├黔北话 │ │ ├黔南话 │ │ ├灌赤话 │ │ ├昆贵话 │ │ └滇西话 │ │ ┌合肥话 │ │ ├扬州话 │ ├江淮语—————┼南通话 │ │ ├九江话 │ │ └南平话 │ └—————————军家话〔中国福建省武平县中山乡〕 │ │ ┌北部———————南昌话 │ ├东部———————鹰潭话 │ ┌赣语 —————┼中部———————抚州话 │ │ ├西部———————宜春话 │ │ └西南部——————吉安话 │ │ ├客赣语群———┤ ┌赣西北客语————铜鼓话 │ │ ├赣西南客语————赣州话 │ │ ├赣东南客语————宁都话 │ │ ├闽西客语————┬长汀话 │ │ │ └连城话 │ │ ├饶平客家话〔潮州市；中国台湾苗栗县卓兰镇〕 │ │ │ ┌梅县话、四县话〔广东省梅州市；中国台湾〕 │ │ │ ├大埔腔〔广东省梅州市；中国台湾台中县〕 │ └客语 —————┼粤东梅江客语——┼惠阳客家话、海陆话〔广东省汕尾市、深圳市、东莞市、清远市；中国台湾〕 │ │ └韶南〔广东省韶关市〕 │ ├四川客语 │ ├粤东东江客语〔广东省河源市、惠州市〕 │ ├粤北客语〔广东省韶关市〕 │ ├惠州客家话 │ ├浙江畲话【畲族】〔浙江省丽水市〕 │ ├江西畲话【畲族】〔江西省吉安市、上饶市‧‧‧〕 │ ├福建畲话【畲族】〔福建省南平市、宁德地区〕 │ └广东畲话【畲族】〔广东省汕头市、揭阳市、汕尾市、惠州市〕 │ │ ┌宣州话 │ │ ┌常州话 ↓ ↓ ├上海话 ↑ ├北部、太湖吴语—┼湖州话〕汉语系┤ │ ├杭州话 ├————————吴语—————┤ ├绍兴话 │ │ └宁波话 │ ├中部、婺州吴语——金华话 │ ├南部、处衢吴语—┬衢州话〕 │ │ └丽水话 │ ├台州话 │ └温州话—————┬温州话 │ └瓯语 │ │ ┌北部、旌-占 ———旌德话 │ ├东部、绩-歙 ———歙县话 ├————————徽语 —————┼西部、休-黟 ———屯溪话 │ ├西南部、祈-德 ——祈门话 │ └严州话 │ │ ┌长-益（新湘话） —长沙话 ├楚语——————湘语—————┼娄-邵（老湘话） —双峰话 │ └吉-溆 ——————吉首话 │ │ ┌闽北语 —————————建瓯话 │ ├闽东语 ——————————福州话 │ │ └泰顺蛮讲 │ ├闽中语 ————————永安话 ├闽语群 ———— ┼莆仙语、兴化话、莆田话 │ │ ┌闽南话—————┬厦门话 │ │ │ └中国台湾话、 │ └闽南语————┼潮汕语—————┬潮州话 │ └汕头话 │ ├雷州话 │ └海南话、琼文话 │ │ ┌粤海——————┬广东话、广州话 │ │ └东莞话 │ ├四邑话—————┬台山话 │ │ └雅瑶话、拉珈话〔 ├————————粤语 —————┼高-雷 ——————阳江话 │ │ ┌梧州话 │ ├桂南粤语————┼南宁话 │ │ └钦廉话 │ ├吴川话〔广东吴川、湛江〕 │ └蜑家话、水上话〔广东省、广西壮族自治区〕 │ ├————————儋州话〔海南省儋州市、昌江黎族自治县〕 │ ├————————猫家话【苗族】〔湖南省、广西壮族自治区〕 │ ├————————伶话【苗族】〔广西壮族自治区龙胜各族自治县〕 │ └————————平地瑶话【汉族、瑶族】〔湖南省、广西壮族自治区〕绪论一．现代汉民话共同语现代汉语是现代汉民族的语言，它既有共同语——普通话，也有不同的方言。（广义）现代汉民族共同语的使用情况：是全体汉族人民之间交际的语言，也是汉族与兄弟民族之间、中国人和外国人之间用来交际的语言。现代汉民族共同语的形成：现代汉民族共同语是汉民族通过长期的互相交往在北方方言的基础上逐渐形成的。现代汉语的前身：春秋时期的“雅言”（又称“夏言”），汉朝时的“通语”，明清时代的“官话”，“五四”运动时的“白话”。“白话文运动”和“国语运动”互相推动，互相影响，使民族共同语的书面形式和口语形式都得到了前所未有的发展。民族共同语的两种形式：口语和书面语。以口耳进行交际的口头形式是口语；用文字记载下来的书面形式是书面语。普通话在台湾省和海外称“国语”，新加坡则称“华语”。二．现代汉语的方言形成方言差异的主要因素：由于人口增长，生活区域扩大；由于社会动乱，人民向远方迁徙；由于山川阻隔、交通闭塞，人民往来不便；由于与异族接触，发生语言的互相影响和融合。汉语方言是汉民族历史发展的产物。汉语方言在长期的历史发展过程中，在语音、词汇和语法方面形成了各种不同程度的差异。其中语音方面的差异最大，词汇次之，语法方面的差异最小。现代汉语方言大致可以分为北方方言、吴方言、湘方言、赣方言、客家方言、闽方言和粤方言等七大方言。（一）北方方言旧称“官话”，以北京话为代表，使用人口最多，约占汉族人口总数的百分之七十以上。北方方言包括四个次方言：1、华北方言；2、西北方言；3、西南方言；4、江淮方言（二）吴方言也叫江浙话，以苏州话或上海话为代表，占汉族人口的百分之八点四。（三）湘方言以长沙话为代表，占汉族人口的百分之五。（四）赣方言以南昌话为代表，占汉族人口的百分之二点四。（五）客家方言以广东东部的梅州话为代表，占汉族人口的百分之四。（六）闽方言通行于福建大部，广东东部潮山地区和南面的雷州半岛以及海南，台湾两大省……，占汉族人口的百分之四点二。包括三次方言：闽南、闽东、闽中。（七）粤方言以广州话为代表，……港澳地区，占汉族人口的百分之五。三、新时期的语言文字工作了解：新时期语言文字工作的方针（第8页第一段新时期语言文字工作的方针……段尾）了解：我国当前语言文字工作最重要的两项任务是：大力推广普通话，促进汉语规范化；加强社会用字管理，促进汉字规范化。现代汉民族共同语的标准，这就是“以北京语音为标准音，以北方话为基础方言，以典范的现代白话文著作为语法规范的普通话“。（现代汉民族共同语的狭义解释）了解：“以北京语音为标准音”，就是以一个具体地点的方言语音作为标准音，使人们有明确的具体的活的语音标准可以遵循。“以北方话为基础方言”，就是说以北方话作为词汇规范的基础。“以典范的现代白话文著作为语法规范”，就是以现当代著名作家的具有代表性作品中的一般用例作为语法规范。（以上三点要理解书第9-11页）绪论部分出题约占3-5分第一章语音语音概括一、语音的性质语音就是人类说话时发出的代表一定意义的声音。它包括生理属性，物理属性、社会属性三个方面。（此名词解释不可少字、差字）（一）语音的生理属性了解：人的发音器官可以分为肺和气管、喉头和声带、口腔和鼻腔三大部分。（二）语音的物理属性语音的四要素（即四个物理要素）：音高、音强、音长和音色。1、音高就是声音的高低，决定于声波的频率。音高在汉语里的作用非常重要。2、音强就是声音的强弱，决定于声波的振幅普通话里的轻音与音强有关。3、音长就是声音的长短，决定于发音体振动的时间。音量与音高、音强、音长有关。4、音色又叫音质，就是声音的特色、本质，是不同的声音能够互相区别的最基本的特征，它决定于声波振动的形式。音色的差别由三种因素造成：第一，发音体不同。第二，发音方式不同。第三，共鸣器的形状不同。（三）语音的社会属性：它首先体现在音义结合的社会性上，还突出地体现了语音的系统性上。社会属性是语音的本质属性。二语音的分析（一）音节音节是语音的基本结构单位，是人们在听觉上自然感受到的最小的语音片断。儿化了的两个汉字一个音节。（二）音素音素是从音色角度划分出来的最小的语音单位。音素分为辅音和元音两大类。发音时气流不一定振动声带，在口腔或咽头受阻碍而形成的音素叫辅音（又称子音）。发音时气流振动声带，在口腔或咽头不受阻碍而形成的音素叫元音（又称母音）。元音与辅音的区别：发音气流在发音器官中是否受到阻碍。元、辅区别的简答形式：1、有无阻碍；（辅音有阻碍，元音无阻碍）2、紧张状态；（辅音局部紧张，元音均衡紧张）3、气流强弱；（辅音气流强，元音气流弱）4、、响度大小；（辅音小，元音大）（三）音位音位是某种语言（或方言）里能够区别意义的最小语音单位，是根据语音的辨义作用归纳出来的。（一）声母、韵母、声调一个音节分声母、韵母、声调三部分。声母指音节开头的辅音，韵母指声母后面的部分。一个音节如果不以辅音开头，则称为“零声母”。声调指的是音节的具有区别意义作用音高变化。三语音的符号汉语拼音方案是记录现代汉语语音系统的法定拼音方案。汉语拼音方案主要用来给汉字注意和作为推广普通话的工具。汉语拼音的五大块：字母表、声母表、韵母表、声调符号、隔音符号。（第24-26页）第二节普通话的辅音和元音一、辅音的发音分析辅音的发音过程有三个阶段：一是成阻，二是持阻，三是除阻。（一）辅音的发音部位发音部位：发音时气流受到阻碍的部位。辅音发音部位的七类：双唇音、唇齿音、舌尖前音、舌尖中音、舌尖后音、舌面音、舌根音。（二）辅音的发音方法发音方法：气流破除发音阻碍的方法。1、阻碍的方式：根据成阻或除阻的方式不同，可以五类1）塞音（暴破音）：b、p、d、t、g、k（结合辅音声母表记，前三组前两位）2）擦音：f、s、sh、r、x、h3）塞擦音：z、c、zh、ch、j、q（结合辅音声母表记，后三组后两位）4）边音：l5）鼻音：m、n、ng2、声带是否振动：分清、浊两类。1）清音：b、p、d、t、g、k、z、c、zh、ch、j、q、f、s、sh、x、h2）浊音：m、n、ng、l、r清、浊音记法：声母中除去浊音，其余都为清音，故记住浊音的5个就可以。3、气流的强弱：分送气音、不送气音两类。1）送气音：p、t、k、c、ch、q2）不送气音：b、d、g、z、zh、j注：声母表里每组第一个音为不送气音；每组第二个音为送气音。只有是塞音、塞擦音时，才考虑送不送气。一、元音的发音分析元音的性质有以下三个方面决定：（舌头的高低、前后和嘴唇的形状）舌头的高低分四度：高元音、半高元音、半低元音、低元音；舌头的前后分三度：前元音、央元音、后元音；嘴唇的形状分两种：圆唇元音、不圆唇元音。普通话的元音分：单元音和复合元音两种。（一）单元音发音时舌位和唇形始终不变的元音叫单元音。单元音分为舌面元音、舌尖元音、卷舌元音。1、舌面元音：i、u、Ü、a、o、e、ê2、舌尖元音：-i[ ]，只出现在声母z、c、s后面。-i[ ]只出现在zh、ch、sh、r后头3、卷舌元音：er注：配第35页的舌面元音舌位图，会方便记忆。（二）复合元音发音时舌位和唇形都有变化的元音叫复合元音。复合元音包括：1、前响二合元音：ai、ei、ao、ou、ao2、后响二合元音：ia、ie、ua、uo、ue3、中响三合元音：iao、iou、uai、uei第三节普通话音节的分析一、声母普通话的22个辅音当中，除知根浊音ng（以韵母中出现）不能出现在音节开头，其余21个辅音都可以充当声母。声母共22个，其中一个为零声母。二、韵母普通话有39个韵母。根据韵母的组成成分，分为单元音韵母、复合元音韵母、鼻音韵母三类。（一）单元音韵母由单元音充当的韵母共有10个，即：i、u、u、a、o、e、ê、-i、-i、er（二）复合元音韵母复合元音充当韵母共有13个。前响复合韵母：ai、ei、ao、ou、ao；后响复合韵母：ia、ie、ua、uo、ue；中响复合韵母：iao、iou、uai、uei（三）鼻音韵母鼻音韵母：则元音和鼻辅音一起构成的韵母。可以出现在音节末尾的辅音只有舌尖中浊鼻音n和舌根浊鼻音ng。n即可出现在音节的开头，又可出现在音节的末尾；ng只出现在音节的末尾。普通话里有16个鼻音韵母。1、舌尖中鼻音韵母8个：an、ian、uan（u加点）、uan、en、in、uen、un（u加点）2、舌根鼻音韵母8个：ang、iang、uang、eng、ing、ueng、ong、iong开口呼：没有韵头而韵腹又不是i、u、u（u加点）的韵母齐齿呼：韵头或韵腹是i的韵母。合口呼：韵头或韵腹是u的韵母。撮口呼：韵头或韵腹是u（u加点）的韵母。三、声调声调主要是由音高决定的。调值即声调的实际读法，是每个音节都具有音高变化形式。调值采用“五度标记法”。线条所表现的高低升降的类型叫做调型。注：要会运用调值标记法及记清第42页的图表示方法。在答题时，要注意题的问法：调值用五度标记法标注；声调用阴、阳、上、去添写。调类指的是声调的类别，是通过归纳一种语言或方言的全部调值而得出的类别。普通话的声调有四个调值：阴平[55]、阳平[35]、上声[214]、去声[51]注：中古汉语的调类演变为普通话的调类，有三条重要规律：第一是“平分阴阳”；第二是“浊上变去”；第三是“入派四声”。四、音节的构成方式（此节为重点，需多看几遍）普通话的音节结构分声母、韵母、声调三部分。韵母又分成韵头、韵腹、韵尾三部分。韵腹又叫主要元音，是韵母中发音开口度较大、声音最响亮的元音。所有的单元音都可以构成韵腹。韵头又叫介音，是介于声母和韵腹之间的高元音。韵头开口度较小，响亮度也较差，只能由i、u、u（u加点）三个高元音构成。韵尾指的是一部分韵母后面的收尾部分，有元音韵尾和辅音韵尾。元音韵尾由i、u构成。辅音韵尾由n、ng构成，韵腹和声调是每一个音节都必须具有的。注：熟记第45页中音节构成类型的十二种格式，注意列表中傲、野、卫、曹、贵几个字的分解方式。十二各格式中，最复杂的格式包含四个音素和一个声调，简单的格式只包含一个音素和一个声调。元音在音节里可以连续排列，最多时达到三个。五、声韵的配合规律普通话有21个辅音声母和一个零声母，有39个韵母。普通话声韵配合规律主要的6点：1、双唇音b、p、m能和开口呼、齐齿呼的韵母配合，和合口呼韵母配合只限于音韵母u,不能得撮口呼韵母配合。2、唇齿音f能和开口呼韵母配合，和合口呼韵母配合只限于单韵母u，不能和齐齿呼、撮口呼的韵母配合。3、舌尖中音d、t和n、l与韵母的配合关系略有不同。 n、l能和四呼的韵母配合， d、t不能和撮口呼韵母配合，能和其他三呼的韵母配合。4、舌尖前音z、c、s，舌尖后音zh、ch、sh、r，舌根音g、k、h，这三套声母的配合关系相同，都能和开口呼、合口呼的韵母配合，不能和齐齿呼、撮口呼的韵母配合。（此点易出选择题）5、舌面音j、q、x与前面三套声母相反，只能和齐齿呼、撮口呼的韵母配合，不能和开口呼、合口呼的韵母配合。6、在全部声母中，唇齿音f能配合的韵母范围最窄；舌尖中音n、l和零声母Ф能配合的韵母范围最宽，它们和四呼的韵母都能配合。配合声母最多的是开口呼，配合声母最少的是撮口呼。（此点重点）第四节方音辨正（非北京同学注意一下书里的例句即可）第五节轻声儿化变调一、轻声轻声：一个词或一句话里有的音节失去原有的声调，变得又短又弱的声调，这种语音现象就是轻声。声调主要决定于音高，而轻声的开成取决于音强和音长。轻声的规律：1、助动词；2、虚词；3、表示方位的成分；4、用在动词后表示趋向的词；5、叠音名词及动词叠用后的第二个音节。（轻声规律留意一下书上例词即可）轻声的作用：轻声有分辨词与非词、分辨词义和分辨词性的作用。二、儿化儿化：普通话的卷舌韵母“er”不与声母拼合，除自成音节外，还可以附加在别的音节的后面，和前面的韵母融为一体。使前面的韵母变成卷舌韵母。这种现像叫“儿化”。儿化的作用：区别词义和词性，有的情况下表示细小、亲切的色彩。三、变调音节和音节连在一起念时，由于互相影响，本调会发生变化，这种变化就叫变调。（一）上声的变调1、上声+上声=阳平+上声（两个上声字相连，前一个上声字变读阳平）2、上声+非上声=半上+非上声1、上声+轻声（非上声）=半上+轻声2、上声+轻声（上声）=阳平/半上+轻声（二）“一”的变调1、在阴平、阳平、上声前读去声。2、在去声前读阳平。3、在重叠的单音动词中间读轻声。（三）“不”的变调1、在去声前读阳平。2、在正反并列提问式中和可能补语否定式中读轻声。注：留意（一）（二）（三）中的例子。第六节语调和朗读一、语调语调：指的就是有表达语义和感情作用，贯穿全句的语音的高低升降、轻重顿挫的变化形式。包括停顿、重音、升降三个方面。（一）停顿停顿可分为语法停顿、逻辑停顿、节奏停顿三种。1、语法停顿：是由句子的语法关系所决定的停顿。标点是语法关系的书面标志。2、逻辑停顿：为了表达感情和强调某一语义的需要而采用的停顿。3、节奏停顿：为了显示韵文的节奏而采用的停顿。（二）重音重音分为语法重音和逻辑重音两种。1、语法重音：指的是根据语法结构的特点而采取的重读。2、逻辑重音：指的是根据语义或感情表达的需要而采取的重读。注：语法与逻辑的对比（书中例句）。（三）升降语调升降指的是整个句子的音高变化，它是语调的主干，最能表达出全句的思想感情。了解语调升降的四种类型：升调、降调、平调、曲折调。

南方方言保留了最完整的古汉语字词、读音和原意，词汇量大，表意清晰优美，读起来朗朗上口，是古汉语口语的活化石，历史底蕴深厚。同时语音因地、因时而异。

江西话是中古汉语，保留了唐宋时期的发音、字词、语义，和客家话、粤语高度相似，大概分化在南宋灭亡时期。其保留了古汉语的入声（饿ngok4）、浊音（金jim1）、字（厥jie1<他>、摄<单肩扛>）、称呼（新妇xin1fu、爷娘ya2yang、嬷嬷ma3ma）。再者，江西话用送气（zh ch sh th）阻音、不送气（z c s t）区分卷舌音、平舌音，元音分短元音（a o e i u v）和长元音（aa oo ee ii uu w），存古代高（我ngo，你ng，厥jie1），这与印欧语系相近（汉人祖先起源于甘肃一带，毗邻印欧人种，基因研究我们和印欧人是近亲）。如果想听宋人怎么讲话，就听江西话（gang1xi wak4）。

可以参考

江西话南方赣方言口语词汇江右民系语言本字，里面有专门的本字和发音收集

呵呵。。我这几天也正在想这个问题。关于泰安土话和普通话的差异。比如：桥冷。麻林儿地。忒孬咧。可以参考《普通话训练教程》。上面有很多关于普通话和泰安本地方言的区别。报考普通话的时候可买到。好像泰安市教育局就有卖的。

湖州，位于浙江省北部，古属吴越之地，楚考烈王十五年（公元前248年），春申君黄歇徙封于此，在此筑城，始置“菰城县”。公元前206年，项羽在吴中起兵，自立西楚霸王，在今湖城中心建 “项王城”。秦王政二十五年(公元前222年)，置“乌程县”。西汉初年,湖州在吴王刘濞封地之内。三国吴甘露二年(公元266年)孙皓取吴国兴盛之意置“吴兴郡”。至南朝,吴兴郡辖地包括今湖州全境及钱塘(今杭州)、阳羡(今宜兴)等县。隋仁寿二年（公元602年），以地滨太湖而名“湖州”，为湖州名称之始。此后湖州一直是当时浙北的重要政治、经济、文化城市。先后置湖州路、湖州府。同样，作为吴方言的一个重要的分区，湖州方言在吴方言中占据着十分重要的地位，而作为毗邻南太湖的湖畔城市。吴语区太湖片苕溪小片的湖州方言有有着其自身所特有的一些特点。本文试以实例和比较的方式，仅从语汇方面介绍部分湖州地区方言的独有特色。（一）湖州方言语汇中的浓厚水乡色彩作为太湖边的水乡城市，湖州有着十分浓厚的水文化，在古代湖州便有着“水晶宫”的美誉。作为太湖平原的农耕区，在此处混合了渔猎文化，因而使得湖州方言呈现出十分浓厚的水乡色彩。这种影响，十分鲜明地从语汇中得到了具体的体现。许多的语汇，在湖州有着与其他地区截然不同的说法，例如虾，这种在东部地区比较常见的小型水产，几乎不分种类被各地称为“虾”而没有任何变化（仅仅在杭州地区会被称为“虾儿”，口气稍微软化）。但在湖州，对于虾，一直都是使用一个独特的称谓：“弯簪”。外地人初来湖州，一般都对“弯簪”这个词极不理解，很难与虾进行联系。事实上，对于很早就将虾列入食用品的湖州人，这主要是取其在烧煮后身体弯蜷的特点而赋予的名称。是一种长期水乡生活的总结与传承。与之类似的，湖州方言对鱼类的分类细致，很多鱼都会在湖州有自己特别的叫法。例如将鳜鱼称为“花鲫鱼”，将鲢鱼细分为花鲢和青鲢等等，都是长期和鱼类接触的水乡人民对于水产的一种具体而朴实的分类。对于太湖边的湖州，水是相当司空见惯的，因而虽然没有临海，湖州人对于水，却是表现出特殊的大气。太湖是全国第三大淡水湖，其主要的两条来水河流均经过湖州流入太湖。对于供养如此巨大的湖泊的河流，他们的名字却十分不起眼。湖州人谦逊地称他们为东苕溪与西苕溪。以至于人们几乎无法想象他们是如何能向无垠的太湖确保供水的。同样的理由，见惯了太湖的湖州人在面对杭州西湖或者北京后海的时候经常发出这样的惊讶：“各么顶都散个宕么（这最多算个池塘么）”。湖州人就是如此，把人家的湖叫塘，把人家的塘叫水坑潭。生来见多了水，一出口就有大气派。这也难怪，除了大海，湖州人大约是不会在水面前失色太多的，如徐迟先生描绘他的故乡南浔（湖州下的一镇）时写到的：在这个水晶晶的地方，一切都是水晶晶的。（二）湖州方言中朴素而形象的语汇表达虽然很多的语汇在湖州方言中的表达与其他语言有着巨大的差异，然而，要理解他们却并不是太难的事情。这就要归功于湖州方言的朴素与形象了。湖州方言有大量的语汇来自于对声音的模仿与表现。例如，对于火柴和划炮（一种小型的鞭炮），湖州人将点燃它们的动词特别地定义为“闭”。而不是其他地区那样统称“划”，而“闭”又仅仅特指这两种动作，不可泛用。原来，这个词模仿的是在划火柴时在滑动摩擦点燃火柴时的那种声音。而这个微妙的声音被用来专指划火柴，因为划其他的东西并没有这样的声音产生。蝉在很多地方称知了，而在湖州被叫做“洋斯塔”，这也是一种细致的拟声，在湖州人看来，这个词，要比“知了”更加准确地表现那种酷暑中令人烦躁的声音。和其他地区一样，湖州人也会把事物用于对人的状态的描摹当中，只是这其中有很多地域特色。例如湖州人会将人傻呆呆地或者反应迟钝的样子称为“木头鸭”或者“癌塘仆”，前者是一种江南常见的鸭，平时就是傻傻的样子，而后者是一种生活于水底层的大型鱼，湖州人就认为它“傻傻地趴在池塘底”。“白板”则是以麻将里的白板比喻什么也不知道的外行。不过这样的描摹多是贬义，但不严重，确是很有情趣的表达。有的语汇在湖州专门是表现人精神状态的，而他的外部表现，就成了写他状态的最好材料。比如“醉醺醺”用于醉酒者，既有醉的本质，又有醺醺的酒气；“嘿哒哒”用于表现人的急迫，直接展现急切的人那种急促呼吸的样子。如此种种，不一而足。另外有些语汇则以指示的方式表达其含义。例如在湖州方言中，男人和女人有称“南宁噶”和“逆宁噶”。用普通话就是“男人家”和“女人家”。上午和下午在湖州方言中表达为“上半天”和“下半天”。一个人如果对某件事的理解产生了困难，一时无法明白，就称之“的弗转”，即转不过弯来。这样的指示，也正符合传播学里用符号表达含义的要求。（三）湖州方言中的文言古语沉淀作为浙江北部重要的城市，湖州在历史上，无论经济还是文化都取得过辉煌的成就。自唐至清末，湖州境内举进士第1530人，其中状元16人。王羲之、王献之、颜真卿、杜牧、苏轼、吴承恩、归有光等著名文人在此任职。在这样一个具有深厚文化底蕴的城市里，到处都有着浓郁的文化气息。在湖州的方言中也是如此。湖州方言的一大重要特点，就是大量出现的古文言语汇。而且这些语汇至今依然被广泛使用着。首先是代词。湖州地区的方言中，代词是最具文言色彩的，它基本完全保留了文言的用词方式。在湖州，至今依然用“吾”来指代自己，用“尔”指代对方，用“其”指代第三人称的事物，甚至依然用“伊”来指代女性。当然，在吴语中这几个字的读法并不和普通话完全一致，需要听者分析。尤其“其”“伊”在湖州方言里发音几乎一样，如果不懂其差别，将很难识别。其次是一些名词，在湖州依旧有许多古文言词汇在使用，例如以“廿”表示二十，以“镬子”表示锅子，“镬糍”表示锅巴，用“铜钿”表示钱。更多的动词与日常用语都有很深的文言色彩，例如“汰”在湖州方言依然使用而不是用“洗”，藏东西则是“囥”东西，湖州人会把脏这个词很自然的说成“龌龊”，而那句中国人经典的“吃了吗”的问候，在湖州则依然保持着它在文言文时的状态：“食既了伐？”。湖州人依然要每天“着”衣“着”裤而不是穿它们。遇到需要否定的东西，湖州人却从不说“不”，“弗”这个似乎是只有在古文里能见的词汇却在湖州人的生活里依然活跃，“弗要”、“弗是”、“弗好”、“弗晓得”……湖州方言还保留了完整的入声韵系统，那些普通话读来无韵的诗词，在湖州人读来都是琅琅上口，“特别急促”这样的四个压入声韵的词，就是最好的例证。湖州有许多四字短语，虽没有收为成语，却可以用一个典故表达一种极其恰当的情形，最有代表性的便是这个发音为“哇里哇咕”的似乎是日语词汇的短语，正字写做“滑履坏瓜”，不是有瓜田不纳履，李下不正冠的避嫌好习惯吗？好啊，你不纳履，鞋子滑了，踢坏了人家的瓜，你自己看着办吧。这样微妙的情景，生活里也可以遇到，却没有任何现代汉语可以如“滑履坏瓜”一样传神地表现它来。另外就是这句只有湖州才有的告别语了。“百坦”，既是指希望对方一路顺风，也是希望对方可以心平气和，事事坦然面对。难怪许多人认为湖州是个养老休闲的好去处，这样“百坦”的生活态度，不正是修养心灵所需要的么？（四）变化的湖州方言语汇随着时代的发展，科学技术不断提高，许多先进的科技成果被用于生活，湖州作为东部发达城市，在清代就引进了许多西方的东西进入我们的生活，这一切，又被湖州方言，以变化记录下来。“洋木头”大概是湖州人第一次见到进口火柴是给的名称，那时的国人怎么也想不明白为什么那个西洋木棍就能点火，虽然这早已不再神秘，这个名字却依旧流传。“水门汀”则是懂英文的知识分子早年的翻译，只是没有人想到，在今天这个时代，湖州人依然这样叫水泥，就好象他们第一次见到的时候一样。“电火”就是电灯，朴素形象。而其他诸如“洋火”、“洋钉”、“洋片”这样的名词则表明了他们的来源皆是进口。大抵因为进口的东西都是比较先进的，湖州人索性把“洋”当成了形容词。一个人自我感觉很好，得意洋洋的样子，在湖州就是“洋”。以上介绍和总结的只是湖州方言中很少部分具有特色的语汇，还有很大的缺陷与遗漏，而湖州方言在发音，吐字，遣词造句等等方面还有起独特的一面。这些都有待于进一步的了解和研究，才能更好地了解湖州深厚的方言文化。

识别技术国外研究现状论文

语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务，对任何事都能够通过语音交互的方式。我整理了浅谈语音识别技术论文，欢迎阅读!

语音识别技术概述

作者：刘钰马艳丽董蓓蓓

摘要：本文简要介绍了语音识别技术理论基础及分类方式，所采用的关键技术以及所面临的困难与挑战，最后讨论了语音识别技术的发展前景和应用。

关键词：语音识别;特征提取;模式匹配;模型训练

Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.

Keywords:Speech identification;Character Pick-up;Mode matching;Model training

一、语音识别技术的理论基础

语音识别技术：是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解)，其最终目标是实现人与机器进行自然语言通信。

不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技术相似，一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外，还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种，具体选择哪一种，由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统，但不适合大词汇系统，原因在于模型库太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。

音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，并且汉语虽然有大约1300个音节，但若不考虑声调，约有408个无调音节，数量相对较少。因此，对于中、大词汇量汉语语音识别系统来说，以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中，但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成，且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母，这样虽然增加了模型数目，但提高了易混淆音节的区分能力。由于协同发音的影响，音素单元不稳定，所以如何获得稳定的音素单元，还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作，它对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，获得影响语音识别的重要信息。对于非特定人语音识别来讲，希望特征参数尽可能多的反映语义信息，尽量减少说话人的个人信息(对特定人语音识别来讲，则相反)。从信息论角度讲，这是信息压缩的过程。

线性预测(LP)分析技术是目前应用广泛的特征参数提取技术，许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型，没有考虑人类听觉系统对语音的处理特点。

Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果。实验证明，采用这种技术，语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取，但目前性能难以与上述技术相比，有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数，而模式匹配则是根据一定准则，使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络 (ANN)。

DTW是较早的一种模式匹配和模型训练技术，它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题，在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统，目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性，其中一个是隐蔽的(不可观测的)具有有限状态的Markor链，另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样，语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述，而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点，HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数，简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数，简称CHMM)以及半连续隐马尔可夫模型(SCHMM，集DHMM和CHMM特点)。一般来讲，在训练数据足够的，CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法，并不断被完善，以增强HMM模型的鲁棒性。

人工神经元网络在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统，模拟了人类神经元活动的原理，具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的，但ANN又不个有HMM模型的动态时间归正性能。因此，现在已有人研究如何把二者的优点有机结合起来，从而提高整个模型的鲁棒性。

二、语音识别的困难与对策

目前，语音识别方面的困难主要表现在：

(一)语音识别系统的适应性差，主要体现在对环境依赖性强，即在某种环境下采集到的语音训练系统只能在这种环境下应用，否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应，使用不方便。

(二)高噪声环境下语音识别进展困难，因为此时人的发音变化很大，像声音变高，语速变慢，音调及共振峰变化等等，这就是所谓Lombard效应，必须寻找新的信号分析处理方法。

(三)语言学、生理学、心理学方面的研究成果已有不少，但如何把这些知识量化、建模并用于语音识别，还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次，把这方面的现有成果用于语音识别，还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决，识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已经大于98%，对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展，这些复杂的语音识别系统也已经完全可以制成专用芯片，大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能，还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好的结果。

语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考文献：

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业专栏.通讯世界,2007.2:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)

[4]陈尚勤等.近代语音识别.西安: 电子科技大学出版社,1991

[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防工业出版社,2005

[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999

点击下页还有更多>>>浅谈语音识别技术论文

1研究现状及存在的问题水果实时分级系统主要功能是水果外部品质和内部品质的自动检测。水果的外部品质检测的项目有大小、形状、颜色、表面缺陷等，内部品质无损检测的项目为水果的硬度、糖含量、酸度、口味及某些内部缺陷等。1.1水果外部品质的自动检测水果的尺寸和颜色检测技术已比较成熟，且在国外已经实现自动化检测，在国内也有按重量或尺寸分级的系统。但果面的缺陷检测却一直成为水果实时分级的障碍。果面缺陷检测的技术比较复杂，目前存在以下几方面难题。1.1.1对水果整个表面进行实时视觉检测比较困难在水果分选生产线上，输送机构输送水果并把水果整个表面呈现给摄像机，这是水果实时分级系统比较关键的组成部分，因为当水果通过时，要求视觉系统能快速检查每个水果的全部果面，即使很小的缺陷面积，也会使得水果级别发生很大变化。同时，设计的视觉分级系统必须满足高生产率的要求。在这方面，国外学者（Growe,1996,Tao,1996)［1，2］采用滚子输送带使水果一边移动一边自身转动，从而使安装在输送带上方的摄像机能采集到水果的多个面的图像，达到全表面检测的目的。但由于水果大小和形状不规则，造成水果旋转速度不一致且难以保证按同一轴线旋转。此外，水果旋转两端的表面部分摄像机无法采集到，因此，分级误差较大。1.1.2快速而准确地测定水果表面的各种缺陷且与梗、萼凹陷区正确区分比较困难Miller等(1991)［3］对桃子的分选试验表明：因不能正确区分水果表面的缺陷和梗、萼凹陷区，由此产生的分级误差为25％左右。Rehkugler等（1986）［4］利用机械定向机构使苹果梗、萼处于垂直方向并绕梗萼轴旋转，CCD线扫描摄像机可扫描苹果的整个表面且形成一幅图像，该方法的特点是由机械定向机构定位水果梗、萼区，摄像机对此区不需要再检查。但因为受定向机构速度的限制，还达不到实时分级的速度，试验结果为每分钟选30个苹果。Yang(1996)［5］利用结构光图像与散射光图像相结合来区分梗、萼区和缺陷区，综合两方面图像处理的结果，共抽取16个特征参数，再利用BP神经网络区分苹果的梗、萼区和缺陷区，分辨精度为95％，但还需要进一步把试验结果应用于实际水果分选生产线中。Growe等（1996）［1］采取在780 nm附近带域内，用结构光由一黑白摄像机进行水果表面的凹陷度检测；在750 nm带域内的散射光照射下，由一黑白摄像机进行水果表面的可疑缺陷区检测。水果的输送旋转装置及摄像机布置如图1a所示，采用的双锥滚筒输送带可使水果一方面沿水平方向作平移运动，另一方面又绕自身水平轴作旋转运动。两个黑白CCD摄像机用来采集750 nm附近的散射光图像和780 nm附近的结构光图像，水果旋转一周摄取两次图像。两个黑白摄像机采集的图像经过设计的接口电路后，被合成为一幅黑白图像，合成过程如图1b所示。图像的处理由流水线图像处理系统完成。试验结果表明：每个水果采集两幅图像时，缺陷检测的速度可达5个/s，但误差较大，如对于苹果，碰伤检测的准确率仅为51％。试验表明，要想得到较高的检测精度，每个水果应采集5幅以上的图像，结构光至少6条以上。此外，由于水果尺寸不同所造成各个水果旋转速度的不一致，也是产生测量误差的原因。徐娟（1997）［6］及Nakano(1997)［7］利用人工神经网络法对缺陷区和梗萼区进行区分，试验表明神经网络的区分准确率较低。在果面各种缺陷的快速检测方面，Throop(1997)［8］等人研究了多光谱测量技术，对10个品种的苹果的22种缺陷，在460～1 030 nm光谱范围内，每隔10 nm试验测定了它们的反射光谱特性，其中对3种苹果同一种缺陷测量的结果如图2所示。图中纵坐标的马氏距离反映了水果缺陷区与正常区反射强度的差别程度，距离越大，两者差别越大。由图中曲线可看出：在中心为540 nm、740 nm、1 030 nm三波段附近，3种苹果同一缺陷与正常区的反射强度的差别表现为最大或最小值，最后通过对3个波段的图像进行简单的减法和阈值处理，即可得到检测的缺陷，下一步应考虑实际应用的实现。(a)(b)图1图像采集布置图与图像合成示意图(a)输送装置及摄像机布置(b) 图像合成示意图图23种苹果同一缺陷在460～1 030 nm范围内与正常区反射强度的差别情况1.1.3球形水果表面引起光照强度在投影面内呈曲面分布，以及二维图像上的透视区域与水果实际表面存在的畸变，给图像的缺陷检测带来困难和造成误差Tao(1996)［2］提出的球形变换法很好地解决了第一个问题。基本思想如图3所示：带缺陷的原始物体图像（OOI）与该物体反表面无缺陷的图像(IOI)相加得到变换后的物体图像（TOI），此图像具有平面物体图像的性质，而缺陷区低于该平面，然后经过简单阈值处理即可得缺陷区。何东健（1997）［9］提出了缺陷透视图像面积发生畸变的校正方法，但对复杂形状的缺陷区进行校正，还存在一定的困难。Nakano(1997)［7］利用一旋转平台使水果旋转，每旋转18°CCD摄像机采集一幅图像，苹果旋转一周可得20幅图像，为消除苹果球面面积的畸变，每幅图像只保留中间13 cm宽度的幅面，再全部合成一幅苹果整个表面的展开图像，此法非常有效，但在分选生产线上实现比较困难。图3球形变换方法1.1.4传统的图像处理及模式识别算法的速度不适合实时分选线的要求国外一般采用高速图像处理硬件与简单有效的图像处理软件相结合的途径，来实现水果的实时分级。如Yang(1996)［5］利用的是Transputer系统、结构光法和洪水算法；Growe等(1996)［1］研制的系统，图像的大部分工作由流水线图像处理硬件系统完成；Tao(1996)［2］采用的是专用Merlin图像处理系统和简单有效的球形变换法，研制的苹果分选系统已应用到水果分选生产线上，其分选速度可达3 165个/min。国内研究者（刘禾，1998，徐娟，1997，杨秀坤，1997，何东健，1997）［6，9～11］大多利用一般的微机和图像采集卡，开发了一些图像处理和模式识别的新算法，如把人工神经网络、模糊理论、遗传算法、图像形态学、分形理论、小波理论及人工智能理论用于图像特征的抽取和识别。但由于图像处理的硬件速度太低，故只能限于静态水果图像分选的算法研究。此外，水果分级的算法应具备人工分级的一些优良性能，如学习与记忆功能，因为目前的一些分级算法的训练样本都比较少，而要分级的水果品种多变且量大。1.2水果内部品质无损检测反映水果内部品质的主要指标有硬度、糖含量、酸度、口味及内部缺陷等。目前国内外研究的主要方法和存在的问题如下。1.2.1水果的硬度检测水果的硬度可间接反映水果的成熟度、运输中的抗损坏性、储藏期等。目前用于水果硬度检测的方法主要有变形法和声学法。变形法就是在一定时间内给水果施加一定的动态力或冲击力，然后根据测得的变形量确定水果的硬度。如Schmilovitch等（1995）［12］研制成功了枣子硬度自动检测系统，其原理是把枣子放在两平板之间，在上面板施加5～8 N的动态力，根据所测变形量的大小把枣子分成4个硬度等级。Delwiche(1991)［13］利用冲击法研制了苹果硬度自动检测系统，发现冲击力会造成苹果表面的轻微损伤。变形法只能测量水果表面的局部硬度，实际上，水果表面硬度变化较大，故限制了变形法的应用。声学法包括声波脉冲响应法和超声波法，声波脉冲响应法（20～1 500 Hz）就是利用一麦克风测量受轻微敲击水果的声波强度，由此确定水果的硬度。Armstrong等（1993）［14］试验研究了所测声波强度与水果硬度的关系，发现二者有很好的相关关系。此法的优点是简单、无损，且能反映水果的整体硬度，缺点是必须注意周围噪声的绝缘及机械振动的消除，此外水果形状也影响测量精度。超声波(＞20 000 Hz)法是根据超声波在水果等介质中传播时，能量衰减系数的大小来确定水果硬度。但由于水果内部含有较多气隙且各向异性，故超声波很难穿透整个水果。1.2.2糖含量、酸度、口味的自动检测糖含量、酸度比较有潜力的检测方法是近红外法（NIR）和磁共振法（MR）。近红外法又分穿透法、反射法和部分穿透法，部分穿透法原理如图4所示。穿透法对水果不适应，反射法一般用于水果表面特征的检测，因此常用的方法是部分穿透法。由图4可看出，在部分穿透法中，光线经过的路径比穿透法短，且入射光线与接收器有一夹角，此夹角的确定对测量起关键作用，此外二者之间必须加一隔板。884 nm和834 nm测得量的比值已用于桃子、苹果（Slaughter ，1995）［15］糖含量的自动测定。Slaughter等（1996）［16］对西红柿，在400～1 100 nm的光谱范围内进行部分穿透性测量试验，结果表明：800～1 000 nm范围的信息对糖含量的确定最有用，测得的相关系数r＝0.92, 但酸度测量比较困难。Mizrach(1997)［17］利用超声波法试验研究了超声波衰减系数和芒果硬度、糖含量、酸度的关系，但其超声波测量探头必须与果面接触，故限制了在线的应用。因此，利用近红外多光谱技术测定水果内部糖含量及其他成分是很有前途的，为达到实时应用的目的，应进一步确定最合适的一两个波段并与计算机视觉技术结合。磁共振及磁共振成像（MRI）技术也是测定水果内部成分的有效方法，其依据是物质内部的某些原子核（H、C、P等）在外部磁场作用下，可与射频区域的电磁波辐射相互作用。Chen等(1996)［18］利用此法对鳄梨的成熟度和鲜杏梅的糖含量进行了一些研究，得到了较好的结果。此法的主要缺点是设备昂贵。图4部分穿透法与水果的口味相关的化学成分主要是可挥发性芳香化合物，当水果成熟时，就会在周围空气中散发这种挥发性芳香气体。Benady等（1995）［19］研制的电子传感器可以测量这种气体的浓度。1.2.3水果内部缺陷的检测西瓜的内部空心用超声波检测已比较成熟。其他缺陷的检测，目前国外正研究利用X射线法、磁共振和磁共振成像技术等方法测量，因成本高及安全性等问题，故很难在农业中推广应用。2研究的途径及方向探讨水果实时分级系统的进一步研究应从两方面入手，一方面要加快水果外部品质的计算机视觉实时分选技术的研究；另一方面也要进行水果内部品质的无损检测技术的研究。因为水果分级的主要目的是选出高质量的水果，故水果内外品质的检测技术都十分重要。在水果的外部品质检测方面，应进行多种技术集成的应用研究。（1）对于水果整个表面机器视觉快速检测的问题，可采用机械与光学技术相结合，设计合理的传送机构，既保证水果在传送带上比较平稳地移动，又可由视觉系统快速检测到水果的全部表面。尽量减小因水果不规则运动造成的分级误差、损伤及图像的模糊。（2）对于果梗、萼区与缺陷的检测与视觉区分方面，应采用多光谱技术与机器视觉技术相结合，研究水果图像上可疑缺陷区的关键特征参数的抽取方法，得到简单、有效、快速的图像处理和识别方法。（3）在球形果面造成的光反射强度呈曲面分布及曲面成像面积的畸变问题，可从光照设计、图像合成及软件补偿3方面综合考虑。光照的充分设计可解决第一个问题；多幅图像的有效合成，可解决畸变问题。我们通过试验表明：一个水果至少应采集5幅图像，然后再合成为一幅，可基本保证水果整个表面上缺陷的有效检测，以避免畸变误差。软件补偿的方法必须简单而有效，以适合高速的要求。（4）在实时系统的图像处理器硬件设计方面，首先应采取先进的并行CPU芯片，如TMS320C80等；其次处理板的设计应与视觉系统结合起来考虑，如采集多路视觉信号的合成问题，机械机构与视觉系统的同步电路设计等。当然，也可引进国外比较成熟的高速图像处理主板，而其他技术可由国内自行开发，这样可以加快国内水果实时分级系统实现自动化的步伐。（5）在图像处理和识别的软件设计方面，应把传统方法与现代新方法（神经网络，并行算法，遗传算法，模糊技术，人工智能，图像形态学，分形学，小波变换等）结合起来，改变传统图像信息的超数据量表达方式，寻求图像表达与解释的新方法，力求图像处理和识别算法的快速性、有效性及鲁棒性。在水果内部品质检测方面，声学振动法是实现硬度自动检测的有效方法，但应设法消除影响测量精度的因素，并进行在生产线上的应用开发；近红外局部投射法和磁共振法是水果糖含量、酸度等内部成分自动检测的有效方法。在国内，近红外局部投射法更有应用前景，应进一步研究其通用性、稳定性和实用性；内部缺陷的无损检测应进一步研究新原理和新方法，应采取自己开发和从国外引进相结合的方式。此外，应进行多种传感器测量信息集成技术的研究，这是水果内外品质实现实时自动检测与分级的有效途径。3结语利用各种现代技术的高度集成，在水果分选生产线上同时完成水果内外品质的检测与分级是将来进一步研究的方向和目的。随着科学技术的飞速发展，在我国近期有望实现农产品品质的自动化检测与分级。

国外数字识别研究现状论文

文章编号:1005 - 0523(2005) 02 - 0063 - 04数字水印及其发展研究石红芹,谢昕(华东交通大学信息工程学院,江西南昌330013)摘要:首先对数字水印的特征进行了分析,阐述了数字水印技术的基本原理,对目前比较流行的水印算法进行了分类和详细地讨论,最后指出目前水印技术存在的局限并对其发展进行了展望.关键词:版权保护;数字水印;水印算法中图分类号:TP391 文献标识码:A1 引言近年来,随着数字化技术的进步和Internet 的迅速发展,多媒体信息的交流达到了前所未有的深度和广度,其发布形式愈加丰富了. 网络发布的形式逐渐成为一种重要的形式,伴随而来的是多媒体数据的版权保护问题. 因此多媒体信息版权保护问题成了一项重要而紧迫的研究课题. 为了解决这一难题,近几年国际上提出了一种新的有效的数字信息产品版权保护和数据安全维护的技术一一数字水印技术. 数字水印技术通过在原始媒体数据中嵌入秘密信息———水印来证实该数据的所有权归属. 水印可以是代表所有权的文字、产品或所有ID、二维图像,视频或音频数据、随机序列等. 主要应用于:媒体所有权的认定. 即辨认所有权信息,媒体合法用户信息; 媒体的传播跟算法研究. 该子模块的研究为解决网络制造产品版权保护问题奠定了基础数字水印技术,又称数字签名技术,成为信息隐藏技术的一种重要研究分支,为实现有效的信息版权保护提供了一种重要的手段.2 数字水印的基本原理从图像处理的角度看,嵌入水印信号可以视为在强背景下迭加一个弱信号,只要迭加的水印信号强度低于人类视觉系统( Human Visual System ,HVS) 的对比度门限,HVS 就无法感到信号的存在.对比度门限受视觉系统的空间、时间和频率特性的影响. 因此通过对原始信号作一定的调整,有可能在不改变视觉效果的情况下嵌入一些信息,从数字通信的角度看,水印嵌入可理解为在一个宽带信道(载体图像) 上用扩频通信技术传输一个窄带信号(水印信号) . 尽管水印信号具有一定的能量,但分布到信道中任一频率上的能量是难以检测到的. 水印的译码(检测) 即是在有噪信道中弱信号的检测问题.一般来说,为了使水印能有效地应用于版权保护中,水印必须满足如下特性:1) 隐蔽性水印在通常的视觉条件下应该是不可见的,水印的存在不会影响作品的视觉效果.2) 鲁棒性水印必须很难去掉(希望不可能去掉) ,当然在理论上任何水印都可以去掉,只要对水印的嵌入过程有足够的了解,但是如果对水印的嵌入只是部分了解的话,任何破坏或消除水印的企图都应导致载体严重的降质而不可用.3) 抗窜改性与抗毁坏的鲁棒性不同,抗窜改性是指水印一旦嵌入到载体中,攻击者就很难改变或伪造. 鲁棒性要求高的应用,通常也需要很强的抗窜改性. 在版权保护中,要达到好的抗窜改性是比较困难的.4) 水印容量嵌入的水印信息必须足以表示多媒体内容的创建者或所有者的标志信息,或是购买者的序列号. 这样在发生版权纠纷时,创建者或所有者的信息用于标示数据的版权所有者,而序列号用于标示违反协议而为盗版提供多媒体数据的用户.5) 安全性应确保嵌入信息的保密性和较低的误检测率. 水印可以是任何形式的数据,比如数值、文本、图像等. 所有的水印都包含一个水印嵌入系统和水印恢复系统. 水印的嵌入和提取过程分别6) 低错误率即使在不受攻击或者无信号失真的情况下,也要求不能检测到水印(漏检、false -negative) 以及不存在水印的情况下,检测到水印(虚检、false - positive) 的概率必须非常小.3 数字水印算法近几年来,数字水印技术研究取得了很大的进步,见诸于文献的水印算法很多,这里对一些典型的算法进行了分析.3. 1 空间域算法数字水印直接加载在原始数据上,还可以细分为如下几种方法[1～4 ] :1) 最低有效位方法(LSB) 这是一种典型的空间域数据隐藏算法,L. F. Tumer 与R. G. Van Schyadel等先后利用此方法将特定的标记隐藏于数字音频和数字图像内. 该方法是利用原始数据的最低几位来隐藏信息(具体取多少位,以人的听觉或视觉系统无法察觉为原则) .LSB 方法的优点是有较大的信息隐藏量,但采用此方法实现的数字水印是很脆弱的,无法经受一些无损和有损的信息处理,而且如果确切地知道水印隐藏在几位LSB 中,数字水印很容易被擦除或绕过.2) Patchwork 方法及纹理块映射编码方法这两种方法都是Bender 等提出的. Patchwork 是一种基于统计的数字水印,其嵌入方法是任意选择N 对图像点,在增加一点亮度的同时,降低另一点的亮度值. 该算法的隐藏性较好,并且对有损的JPEG和滤波、压缩和扭转等操作具有抵抗能力,但仅适用于具有大量任意纹理区域的图像,而且不能完全自动完成.3. 2 变换域算法基于变换域的技术可以嵌入大量比特数据而不会导致可察觉的缺陷,往往采用类似扩频图像的技术来隐藏数字水印信息. 这类技术一般基于常用的图像变换,基于局部或是全部的变换,这些变换包括离散余弦变换(DCT) 、小波变换(WT) 、傅氏变换(FT 或FFT) 以及哈达马变换(Hadamard transform)等等. 其中基于分块的DCT 是最常用的变换之一,现在所采用的静止图像压缩标准JPEG也是基于分块DCT 的. 最早的基于分块DCT 的一种数字水印技术方案是由一个密钥随机地选择图像的一些分块,在频域的中频上稍稍改变一个三元组以隐藏二进制序列信息. 选择在中频分量编码是因为在高频编码易于被各种信号处理方法所破坏,而在低频编码则由于人的视觉对低频分量很敏感,对低频分量的改变易于被察觉. 该数字水印算法对有损压缩和低通滤波是稳健的. 另一种DCT 数字水印算法[5 ]是首先把图像分成8 ×8 的不重叠像素块,在经过分块DCT 变换后,即得到由DCT 系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT 系数中. 该算法是通过对选定的DCT 系数进行微小变换以满足特定的关系,以此来表示一个比特的信息. 在水印信息提取时,则选取相同的DCT 系数,并根据系数之间的关系抽取比特信息. 除了上述有代表性的变换域算法外,还有一些变换域数字水印方法,它们当中有相当一部分都是上述算法的改进及发展,这其中有代表性的算法是I. Podichuk 和ZengWenjun 提出的算法[6 ] . 他们的方法是基于静止图像的DCT 变换或小波变换,研究视觉模型模块返回数字水印应加载在何处及每处可承受的JND(Just Noticeable Difference ,恰好可察觉差别) 的量值(加载数字水印的强度上限) ,这种水印算法是自适应的.3. 3 NEC 算法该算法由NEC 实验室的Cox[5 ]等人提出,该算法在数字水印算法中占有重要地位,其实现方法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯N(0 ,1) 分布,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做DCT 变换,最后用伪随机高斯序列来调制(叠加) 该图像除直流分量外的1 000 个最大的DCT 系数. 该算法具有较强的鲁棒性、安全性、透明性等. 由于采用特殊的密钥,故可防止IBM 攻击,而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则,即水印信号应该嵌入源数据中对人感觉最重要的部分,这种水印信号由独立同分布随机实数序列构成,且该实数序列应具有高斯分布N(0 ,1) 的特征. 随后Podilchuk等利用人类视觉模型又对该算法进行了改进,从而提高了该算法的鲁棒性、透明性等.3. 4 其他一些水印算法1) 近年来,利用混沌映射模型实现数字水印、保密通信等成为混沌应用研究的热点. 特别是自从Cox 等借用通信技术中的扩频原理将水印信号嵌入到一些DCT 变换系数或者多层分解的小波变换系数以来,人们已经提出了一些混沌数字水印方法.水印的嵌入与检测是基于人类视觉系统(HVS) 的亮度掩蔽特性和纹理掩蔽特性,折衷水印的不可见性和鲁棒性之间的矛盾. 结果表明:该方法嵌入的水印具有不可见性和鲁棒性,并且这种基于密钥的混沌水印方法更好的抗破译性能.2) 目前比较流行的还有一种基于盲水印检测的DWT 算法,该算法首先对原始图像进行小波变换,根据人类具有的视觉掩蔽特性对低频分量进行一定的量化,同时可不影响视觉效果,并对作为水印的图像进行压缩和二值化处理,形成一维的二值序列,根据二值序列的值对上述量化后的原始信号的低频分量进行视觉阈值范围内允许的修改,从而实现水印的嵌入. 水印提取过程是对含有水印的图像进行小波变换,对低频分量同样进行量化处理,为了增大算法的安全性,可以对水印形成的二值0 ,1 序列在嵌入前进一步进行伪随机序列调制,相应的在水印提取过程需要增加用伪随机序列解调的步骤. 这样,不知道伪随机序列的攻击者即使推测出水印的嵌入规律,也无法提取水印. 大大增加了水印系统的透明性和鲁棒性.4 水印技术的局限目前水印技术的局限,为了对版权保护中使用水印的成功可能性进行评估,看能否满足实际应用需求,就需要对水印技术有更多了解. 下面介绍数字水印方案普遍存在的一些局限:1) 不知道能够隐藏多少位. 尽管非常需要知道指定大小载体信息上可以隐藏多少比特的水印信息,但这个问题还没有得到圆满解决. 事实上,对给定尺寸的图像或者给定时间的音频,可以可靠隐藏信息量的上界,目前还不清楚. 对图像水印,只能说目前使用的算法可以隐藏几百比特位的水印信息.2) 还没有真正健壮的盲图像水印算法. 对图像水印,鲁棒性还是个问题. 目前还没有能够在经过所有普通图像处理变换后,仍能幸免的盲水印算法. 尤其是能够抵抗几何处理的攻击,被认为是很难实现的目标.3) 所有者能去除标记. 迄今为止提出的所有盲图像水印,实际上都是可逆的. 已知水印的准确内容、以及水印的嵌入和检测算法,则总能在没有严重损坏资料的前提下,使水印不可读取. 目前还不清楚这个缺点在将来还是否存在;同时在设计版权保护系统时,必须考虑如下问题:一旦水印内容已知,则有可能去除水印或者部分水印.此外,迄今为止提出的水印算法,其可逆性使人们提出极大的疑问,即设计能够抗篡改的健壮公开水印技术是否可能? 事实上,如果允许任何人读取水印,则任何人只要知道水印嵌入算法,就可以消除水印.5 结论随着电子商务的加速发展和网络用户的直线增长,媒体的安全要求将更加迫切,作为版权保护和安全认证的数字水印技术具有极大的商业潜力,作为一门学科交叉的新兴的应用技术,它的研究涉及了不同学科研究领域的思想和理论,如数字信号处理、图像处理、信息论、通信理论、密码学、计算机科学及网络、算法设计等技术,以及公共策略和法律等问题,是近几年来国际学术界才兴起的一个前沿研究领域,得到了迅速的发展. 但数字水印技术仍然是一个未成熟的研究领域,还有很多问题需要解决,其理论基础依然薄弱. 随着一些先进的信号处理技术和密码设计思想的引进,必将日趋成熟且得到更为广泛的发展应用.参考文献:[1 ] Eepa Kundur. Dimitrios hatzinakos. Digital watermarking fortelltale tamper proofing and authentication [J ] . Proceeding of the IEEE. 1999 , 87(7) :1167～1180.[2 ] 张春田,苏育挺. 信息产品的版权保护技术———数字水印[J ] . 电信科学,1998 ,14(12) :15～17.[3 ] Bender W, Gruhl D. Techniques for data hiding[J ] . IBM sys2tem journal ,1996 ,35(3～4) :313～336.[4 ] Cox I J , Killian J ,Leighton F T. Secure spread spectrum wa2termarking for multimedia[J ] . IEEE transactions on image pro2cessing ,1997 ,6(12) :1673～1687.[5 ] Zhao J , Koch E. Embedding robust labels into images forcopyright protection[A] . In : Proceedings of the knowright’95conference on intellectual property rights and new technologies[C] . Vienna , Austria , 1995. 241～251.[6 ] Podilchud C I , Zeng W. Image - adaptive watermarking usingvisual model [J ] . IEEE journal on special areas in communica2tions ,1998 ,16(4) :525～539.

相关范文：数据挖掘技术及其应用摘要：随着网络、数据库技术的迅速发畏以及数据库管理系统的广泛应用，人们积累的数据越来越多。数据挖掘(Data Mining)就是从大量的实际应用数据中提取隐含信息和知识，它利用了数据库、人工智能和数理统计等多方面的技术，是一类深层次的数据分析方法。关键词：数据挖掘；知识；分析；市场营销；金融投资随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用，人们积累的数据越来越多。由此，数据挖掘技术应运而生。下面，本文对数据技术及其应用作一简单介绍。一、数据挖掘定义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一种新的商业信息处理技术，其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理，从中提取辅助商业决策的关键性数据。简而言之，数据挖掘其实是一类深层次的数据分析方法。从这个角度数据挖掘也可以描述为：按企业制定的业务目标，对大量的企业数据进行探索和分析，揭示隐藏的、未知的或验证已知的规律性，并进一步将其模型化的先进有效的方法。二、数据挖掘技术数据挖掘技术是人们长期对数据库技术进行研究和开发的结果，代写论文其中数据仓库技术的发展与数据挖掘有着密切的关系。大部分情况下，数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中，因为数据仓库会对数据进行清理，并会解决数据的不一致问题，这会给数据挖掘带来很多好处。此外数据挖掘还利用了人工智能(AI)和统计分析的进步所带来的好处，这两门学科都致力于模式发现和预测。数据库、人工智能和数理统计是数据挖掘技术的三大支柱。由于数据挖掘所发现的知识的不同，其所利用的技术也有所不同。1．广义知识。指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识，反映同类事物的共同性质，是对数据的概括、精炼和抽象。广义知识的发现方法和实现技术有很多，如数据立方体、面向屙性的归约等。数据立方体的基本思想是实现某些常用的代价较高的聚集函数的计算，诸如计数、求和、平均、最大值等，并将这些实现视图储存在多维数据库中。而面向属性的归约是以类SQL语言来表示数据挖掘查询，收集数据库中的相关数据集，然后在相关数据集上应用一系列数据推广技术进行数据推广，包括属性删除、概念树提升、属性阈值控制、计数及其他聚集函数传播等。2．关联知识。它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联，那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是Apriori算法和FP—Growth算法。关联规则的发现可分为两步：第一步是迭代识别所有的频繁项目集，要求频繁项目集的支持率不低于用户设定的最低值；第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心，也是计算量最大的部分。3．分类知识。它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。分类方法有决策树、朴素贝叶斯、神经网络、遗传算法、粗糙集方法、模糊集方法、线性回归和K—Means划分等。其中最为典型的分类方法是决策树。它是从实例集中构造决策树，是一种有指导的学习方法。该方法先根据训练子集形成决策树，如果该树不能对所有对象给出正确的分类，那么选择一些例外加入到训练子集中，重复该过程一直到形成正确的决策集。最终结果是一棵树，其叶结点是类名，中间结点是带有分枝的屙性，该分枝对应该屙性的某一可能值。4．预测型知识。它根据时间序列型数据，由历史的和当前的数据去推测未来的数据，也可以认为是以时间为关键属性的关联知识。目前，时间序列预测方法有经典的统计方法、神经网络和机器学习等。1968年BoX和Jenkins提出了一套比较完善的时间序列建模理论和分析方法，这些经典的数学方法通过建立随机模型，进行时间序列的预测。由于大量的时间序列是非平稳的，其特征参数和数据分布随着时间的推移而发生变化。因此，仅仅通过对某段历史数据的训练，建立单一的神经网络预测模型，还无法完成准确的预测任务。为此，人们提出了基于统计学和基于精确性的再训练方法，当发现现存预测模型不再适用于当前数据时，对模型重新训练，获得新的权重参数，建立新的模型。5．偏差型知识。它是对差异和极端特例的描述，揭示事物偏离常规的异常现象，如标准类外的特例、数据聚类外的离群值等。所有这些知识都可以在不同的概念层次上被发现，并随着概念层次的提升，从微观到中观、到宏观，以满足不同用户不同层次决策的需要。三、数据挖掘流程数据挖掘是指一个完整的过程，该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息，代写毕业论文并使用这些信息做出决策或丰富知识。数据挖掘的基本过程和主要步骤如下：过程中各步骤的大体内容如下：1．确定业务对象，清晰地定义出业务问题。认清数据挖掘的目的是数据挖掘的重要一步，挖掘的最后结构不可预测，但要探索的问题应该是有预见的，为了数据挖掘而挖掘则带有盲目性，是不会成功的。2．数据准备。(1)数据选择。搜索所有与业务对象有关的内部和外部数据信息，并从中选择出适用于数据挖掘应用的数据。(2)数据预处理。研究数据的质量，进行数据的集成、变换、归约、压缩等．为进一步的分析作准备，并确定将要进行的挖掘操作的类型。(3)数据转换。将数据转换成一个分析模型，这个分析模型是针对挖掘算法建立的，这是数据挖掘成功的关键。3．数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善和选择合适的挖掘算法外，其余一切工作都能自动地完成。4．结果分析。解释并评估结果。其使用的分析方法一般应视挖掘操作而定，通常会用到可视化技术。5．知识同化。将分析所得到的知识集成到业务信息系统的组织结构中去。四、数据挖掘的应用数据挖掘技术从一开始就是面向应用的。目前在很多领域，数据挖掘都是一个很时髦的词，尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。1．市场营销。由于管理信息系统和P0S系统在商业尤其是零售业内的普遍使用，特别是条形码技术的使用，从而可以收集到大量关于用户购买情况的数据，并且数据量在不断激增。对市场营销来说，通过数据分析了解客户购物行为的一些特征，对提高竞争力及促进销售是大有帮助的。利用数据挖掘技术通过对用户数据的分析，可以得到关于顾客购买取向和兴趣的信息，从而为商业决策提供了可靠的依据。数据挖掘在营销业上的应用可分为两类：数据库营销(database markerting)和货篮分析(basket analysis)。数据库营销的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客，以便向它们推销产品。通过对已有的顾客数据的辱淅，可以将用户分为不同级别，级别越高，其购买的可能性就越大。货篮分析是分析市场销售数据以识别顾客的购买行为模式，例如：如果A商品被选购，那么B商品被购买的可能性为95％，从而帮助确定商店货架的布局排放以促销某些商品，并且对进货的选择和搭配上也更有目的性。这方面的系统有：Opportunity Ex-plorer，它可用于超市商品销售异常情况的因果分析等，另外IBM公司也开发了识别顾客购买行为模式的一些工具(IntdligentMiner和QUEST中的一部分)。2．金融投资。典型的金融分析领域有投资评估和股票交易市场预测，分析方法一般采用模型预测法(如神经网络或统计回归技术)。代写硕士论文由于金融投资的风险很大，在进行投资决策时，更需要通过对各种投资方向的有关数据进行分析，以选择最佳的投资方向。无论是投资评估还是股票市场预测，都是对事物发展的一种预测，而且是建立在对数据的分析基础之上的。数据挖掘可以通过对已有数据的处理，找到数据对象之间的关系，然后利用学习得到的模式进行合理的预测。这方面的系统有Fidelity Stock Selector和LBS Capital Management。前者的任务是使用神经网络模型选择投资，后者则使用了专家系统、神经网络和基因算法技术来辅助管理多达6亿美元的有价证券。3．欺诈甄别。银行或商业上经常发生行为，如恶性透支等，这些给银行和商业单位带来了巨大的损失。对这类行为进行预测可以减少损失。进行甄别主要是通过总结正常行为和行为之间的关系，得到行为的一些特性，这样当某项业务符合这些特征时，可以向决策人员提出警告。这方面应用非常成功的系统有：FALCON系统和FAIS系统。FALCON是HNC公司开发的信用卡欺诈估测系统，它已被相当数量的零售银行用于探测可疑的信用卡交易；FAIS则是一个用于识别与洗钱有关的金融交易的系统，它使用的是一般的政府数据表单。此外数据挖掘还可用于天文学上的遥远星体探测、基因工程的研究、web信息检索等。结束语随着数据库、人工智能、数理统计及计算机软硬件技术的发展，数据挖掘技术必能在更多的领域内取得更广泛的应用。参考文献：[1]闫建红《数据库系统概论》的教学改革与探索[J]．山西广播电视大学学报，2006，(15)：16—17．其他相关：数据挖掘研究现状及最新进展（CAJ格式）仅供参考，请自借鉴希望对您有帮助补充：如何撰写毕业论文本科专业（含本科段、独立本科段）自考生在各专业课程考试成绩合格后，都要进行毕业论文的撰写（工科类专业一般为毕业设计、医科类一般为临床实习）及其答辩考核。毕业论文的撰写及答辩考核是取得高等教育自学考试本科毕业文凭的重要环节之一，也是衡量自考毕业生是否达到全日制普通高校相同层次相同专业的学力水平的重要依据之一。但是，由于许多应考者缺少系统的课堂授课和平时训练，往往对毕业论文的独立写作感到压力很大，心中无数，难以下笔。因此，对本科专业自考生这一特定群体，就毕业论文的撰写进行必要指导，具有重要的意义。本文试就如何撰写毕业论文作简要论述，供参考。毕业论文是高等教育自学考试本科专业应考者完成本科阶段学业的最后一个环节，它是应考者的总结性独立作业，目的在于总结学习专业的成果，培养综合运用所学知识解决实际问题的能力。从文体而言，它也是对某一专业领域的现实问题或理论问题进行科学研究探索的具有一定意义的论说文。完成毕业论文的撰写可以分两个步骤，即选择课题和研究课题。首先是选择课题。选题是论文撰写成败的关键。因为，选题是毕业论文撰写的第一步，它实际上就是确定“写什么”的问题，亦即确定科学研究的方向。如果“写什么”不明确，“怎么写”就无从谈起。教育部自学考试办公室有关对毕业论文选题的途径和要求是“为鼓励理论与工作实践结合，应考者可结合本单位或本人从事的工作提出论文题目，报主考学校审查同意后确立。也可由主考学校公布论文题目，由应考者选择。毕业论文的总体要求应与普通全日制高等学校相一致，做到通过论文写作和答辩考核，检验应考者综合运用专业知识的能力”。但不管考生是自己任意选择课题，还是在主考院校公布的指定课题中选择课题，都要坚持选择有科学价值和现实意义的、切实可行的课题。选好课题是毕业论文成功的一半。第一、要坚持选择有科学价值和现实意义的课题。科学研究的目的是为了更好地认识世界、改造世界，以推动社会的不断进步和发展。因此，毕业论文的选题，必须紧密结合社会主义物质文明和精神文明建设的需要，以促进科学事业发展和解决现实存在问题作为出发点和落脚点。选题要符合科学研究的正确方向，要具有新颖性，有创新、有理论价值和现实的指导意义或推动作用，一项毫无意义的研究，即使花很大的精力，表达再完善，也将没有丝毫价值。具体地说，考生可从以下三个方面来选题。首先，要从现实的弊端中选题，学习了专业知识，不能仅停留在书本上和理论上，还要下一番功夫，理论联系实际，用已掌握的专业知识，去寻找和解决工作实践中急待解决的问题。其次，要从寻找科学研究的空白处和边缘领域中选题，科学研究还有许多没有被开垦的处女地，还有许多缺陷和空白，这些都需要填补。应考者应有独特的眼光和超前的意识去思索，去发现，去研究。最后，要从寻找前人研究的不足处和错误处选题，在前人已提出来的研究课题中，许多虽已有初步的研究成果，但随着社会的不断发展，还有待于丰富、完整和发展，这种补充性或纠正性的研究课题，也是有科学价值和现实指导意义的。第二、要根据自己的能力选择切实可行的课题。毕业论文的写作是一种创造性劳动，不但要有考生个人的见解和主张，同时还需要具备一定的客观条件。由于考生个人的主观、客观条件都是各不相同的，因此在选题时，还应结合自己的特长、兴趣及所具备的客观条件来选题。具体地说，考生可从以下三个方面来综合考虑。首先，要有充足的资料来源。“巧妇难为无米之炊”，在缺少资料的情况下，是很难写出高质量的论文的。选择一个具有丰富资料来源的课题，对课题深入研究与开展很有帮助。其次，要有浓厚的研究兴趣，选择自己感兴趣的课题，可以激发自己研究的热情，调动自己的主动性和积极性，能够以专心、细心、恒心和耐心的积极心态去完成。最后，要能结合发挥自己的业务专长，每个考生无论能力水平高低，工作岗位如何，都有自己的业务专长，选择那些能结合自己工作、发挥自己业务专长的课题，对顺利完成课题的研究大有益处。选好课题后，接下来的工作就是研究课题，研究课题一般程序是：搜集资料、研究资料，明确论点和选定材料，最后是执笔撰写、修改定稿。第一、研究课题的基础工作———搜集资料。考生可以从查阅图书馆、资料室的资料，做实地调查研究、实验与观察等三个方面来搜集资料。搜集资料越具体、细致越好，最好把想要搜集资料的文献目录、详细计划都列出来。首先，查阅资料时要熟悉、掌握图书分类法，要善于利用书目、索引，要熟练地使用其他工具书，如年鉴、文摘、表册、数字等。其次，做实地调查研究，调查研究能获得最真实可靠、最丰富的第一手资料，调查研究时要做到目的明确、对象明确、内容明确。调查的方法有：普遍调查、重点调查、典型调查、抽样调查。调查的方式有：开会、访问、问卷。最后，关于实验与观察。实验与观察是搜集科学资料数据、获得感性知识的基本途径，是形成、产生、发展和检验科学理论的实践基础，本方法在理工科、医类等专业研究中较为常用，运用本方法时要认真全面记录。第二、研究课题的重点工作———研究资料。考生要对所搜集到手的资料进行全面浏览，并对不同资料采用不同的阅读方法，如阅读、选读、研读。通读即对全文进行阅读，选读即对有用部分、有用内容进行阅读，研读即对与研究课题有关的内容进行全面、认真、细致、深入、反复的阅读。在研读过程中要积极思考。要以书或论文中的论点、论据、论证方法与研究方法来触发自己的思考，要眼、手、脑并用，发挥想象力，进行新的创造。在研究资料时，还要做好资料的记录。第三、研究课题的核心工作―――明确论点和选定材料。在研究资料的基础上，考生提出自己的观点和见解，根据选题，确立基本论点和分论点。提出自己的观点要突出新创见，创新是灵魂，不能只是重复前人或人云亦云。同时，还要防止贪大求全的倾向，生怕不完整，大段地复述已有的知识，那就体现不出自己研究的特色和成果了。根据已确立的基本论点和分论点选定材料，这些材料是自己在对所搜集的资料加以研究的基础上形成的。组织材料要注意掌握科学的思维方法，注意前后材料的逻辑关系和主次关系。第四、研究课题的关键工作―――执笔撰写。考生下笔时要对以下两个方面加以注意：拟定提纲和基本格式。拟定提纲包括题目、基本论点、内容纲要。内容纲要包括大项目即大段段旨、中项目即段旨、小项目即段中材料或小段段旨。拟定提纲有助于安排好全文的逻辑结构，构建论文的基本框架。基本格式：一般毕业论文由标题、摘要、正文、参考文献等4方面内容构成。标题要求直接、具体、醒目、简明扼要。摘要即摘出论文中的要点放在论文的正文之前，以方便读者阅读，所以要简洁、概括。正文是毕业论文的核心内容，包括绪论、本论、结论三大部分。绪论部分主要说明研究这一课题的理由、意义，要写得简洁。要明确、具体地提出所论述课题，有时要写些历史回顾和现状分析，本人将有哪些补充、纠正或发展，还要简单介绍论证方法。本论部分是论文的主体，即表达作者的研究成果，主要阐述自己的观点及其论据。这部分要以充分有力的材料阐述观点，要准确把握文章内容的层次、大小段落间的内在联系。篇幅较长的论文常用推论式（即由此论点到彼论点逐层展开、步步深入的写法）和分论式（即把从属于基本论点的几个分论点并列起来，一个个分别加以论述）两者结合的方法。结论部分是论文的归结收束部分，要写论证的结果，做到首尾一贯，同时要写对课题研究的展望，提及进一步探讨的问题或可能解决的途径等。参考文献即撰写论文过程中研读的一些文章或资料，要选择主要的列在文后。第五、研究课题的保障工作―――修改定稿。通过这一环节，可以看出写作意图是否表达清楚，基本论点和分论点是否准确、明确，材料用得是否恰当、有说服力，材料的安排与论证是否有逻辑效果，大小段落的结构是否完整、衔接自然，句子词语是否正确妥当，文章是否合乎规范。总之，撰写毕业论文是一种复杂的思维活动，对于缺乏写作经验的自考生来说，确有一定的难度。因此，考生要“学习学习再学习，实践实践再实践”，虚心向指导教师求教。

图像识别的发展经历了三个阶段：文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的，一般是识别字母、数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储，传输方便可压缩、传输过程中不易失真、处理方便等巨大优势，这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识，属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向，其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差，一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前，在图像识别的发展中，主要有三种识别方法：统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术，自20世纪70年代，其研究已经有几十年的历史，一直都受到人们的高度重视，至今借助于各种理论提出了数以千计的分割算法，而且这方面的研究仍然在积极地进行着。现有的图像分割的方法有许多种，有阈值分割方法，边缘检测方法，区域提取方法，结合特定理论工具的分割方法等。从图像的类型来分有：灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子，使得边缘检测产生了不少经典算法。但在近二十年间，随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展，有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、方法和工具，如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。

口罩识别研究现状论文

基于yolo算法的口罩人脸识别研究的意义如下：口罩人脸识别是利用计算机视觉技术判断图像或者视频序列中的行人是否存在未带口罩的情况，在一些需要佩戴口罩的特定场合，比如食堂、饭店等员工需要佩戴口罩上岗，或由于特殊情况，需要行人佩戴口罩的场景，都可以适用。目前市面上的口罩人脸识别系统，常用的方式先对人脸进行检测，再对人脸进行区域划分，统计分析脸部下方区域的颜色信息，进而判断人脸是否佩戴口罩的方式。但在实际现场应用中，人脸的倾斜角度不同，不同光线的干扰也不同，导致传统方式的精度并不理想。因此，现有技术需要改进。

口罩佩戴监测识别系统基于智能视频分析技术，对医院、社区、机场、商超等人口密集区域，有效监测工作人员口罩佩戴情况，监测到未佩戴者立即进行提示，有效保障各类出入口及人口密集区域的公共场所安全，减少人力监管的成本。口罩佩戴监测识别系统对视频画面进行实时监测，当发现视频画面内出现人员未佩戴口罩时，及时进行报警，真正做到事前预警，事中常态检测，事后规范管理，将安防操作人员从繁杂而枯燥的“盯屏幕”任务中解脱出来，有效的协助安全管理人员工作，并最大限度地降低误报和漏报现象。口罩佩戴监测识别系统的优势报警精确度高：口罩佩戴监测识别系统，能排除各种气候与环境因素的干扰，自动识别口罩佩戴情况，有效弥补人工监控的不足。人脸抓拍：对未佩戴口罩人员进行人脸抓拍，用于记录和追溯。语音告警：发现未佩戴口罩情况，可以通过语音喊话自动提示，联动报警通知管理人员。全天时运行稳定可靠：口罩佩戴监测识别系统可对监控画面进行 7×24 不间断的工作，大大提高了视频资源的利用率，减少人工监控的工作强度。

大学生使用口罩调查结果写出大学生使用口罩的比例。大学生使用口罩调查结果是一篇调查论文的结果显示，需要写出使用口罩的比例作为结果，并分析这个结果的意义内涵。论文是一个汉语词语，古典文学常见论文一词，谓交谈辞章或交流思想。当代，论文常用来指进行各个学术领域的研究和描述学术研究成果的文章，简称之为论文。

国外机器视觉识别研究现状论文

在国外，机器视觉的应用普及主要体现在半导体及电子行业，其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路：各类生产印刷电路板组装技术、设备；单、双面、多层线路板，覆铜板及所需的材料及辅料；辅助设施以及耗材、油墨、药水药剂、配件；电子封装技术与设备；丝网印刷设备及丝网周边材料等。SMT表面贴装：SMT工艺与设备、焊接设备、测试仪器、返修设备及各种辅助工具及配件、SMT材料、贴片剂、胶粘剂、焊剂、焊料及防氧化油、焊膏、清洗剂等；再流焊机、波峰焊机及自动化生产线设备。电子生产加工设备：电子元件制造设备、半导体及集成电路制造设备、元器件成型设备、电子工模具。机器视觉系统还在质量检测的各个方面已经得到了广泛的应用，并且其产品在应用中占据着举足轻重的地位。除此之外，机器视觉还用于其他各个领域。2000年来，零售商和消费者对可导致健康风险或增加零售商成本的不合格产品越来越没有忍耐力。如果视觉检测机制正确执行和管理，就可成为强大的工具用于：-保护制造商、零售商和消费者的利益，不会出现贴错标签和无法识别过敏原标签的包装-有助于保护品牌声誉-遵守行业最佳实践指南和零售商标准研究显示，65%的消费者在购买产品时会参考包装。如果包装贴错标签或标签被损坏，隐藏潜在的有害成分，这会导致产品召回、罚款、甚至是法律诉讼。有调查表明食品行业中55%的召回都是由不正确的标签所导致的，食品过敏原就是一个十分普遍的例子。视觉检测是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。自起步发展至今，已经有20多年的历史，其功能以及应用范围随着工业自动化的发展逐渐完善和推广，其中特别是目前的数字图像传感器、CMOS和CCD摄像机、DSP、FPGA、ARM等嵌入式技术、图像处理和模式识别等技术的快速发展，大大地推动了机器视觉的发展。简而言之，机器视觉解决方案就是利用机器代替人眼来作各种测量和判断。

索引序列
中国方言识别研究现状论文
识别技术国外研究现状论文
国外数字识别研究现状论文
口罩识别研究现状论文
国外机器视觉识别研究现状论文
返回顶部

中国方言识别研究现状论文