姓名:陈心语 学号:21009102266 书院:海棠1号书院 转自: 人工智能技术在声纹识别方面的应用|解读技术-云+社区-腾讯云() 【嵌牛导读】本文介绍了人工智能在声纹识别方面的应用。 【嵌牛鼻子】人工智能运用于声纹识别。 【嵌牛提问】人工智能在声纹识别方面中有什么运用呢? 【嵌牛正文】 人工智能技术对于传统产业的推进作用越来越凸显,极大提升了传统产品的商业价值。“听声识我,开口即播”长虹CHiQ5人工智能电视成为全球首款搭载 声纹识别 的人工智能电视,可以直接通过每个人说话的声音不同而区分目前使用电视用户是谁,从而实现内容的精准推荐。无需借助遥控和手机等智能设备,通过识别家庭成员的声纹来控制电视。语音助手配备海量语音库,使用语义模糊识别功能,即使说错片名也能自动识别出你想要的内容,但是当人们在观看某一节目的时候谈论提及其他电视节目名称,语音助手功能识别后当即转换到另一个节目影响正常节目的观看。但是在价格方面,55寸售价7597元,65寸售价13997元,75寸售价21997元,价格过高难以普及,但是也从侧面证明人工智能确实可以提升产品附加值。 目前人工智能发力的领域主要集中在指纹、脸、声音、眼睛等等,都是人和人之间相互区分的独一无二的标识上,称之为“生物特征”。声音就是这种一种可以反映人身份的生物特征,参考“指纹”的命名方式,可以叫它“声纹”。 声纹是指人类语音中携带言语信息的声波频谱,它同指纹一样,具备独特的生物学特征,具有身份识别的作用,不仅具有特定性,而且具有相对的稳定性 。声音信号是一维连续信号,将它进行离散化后,就可以得到我们现在常见的计算机可以处理的声音信号。 在实际应用中,声纹识别也存在一些缺点,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提取;……等等。尽管如此,与其他生物特征相比,声纹识别的应用有一些特殊的优势:(1)蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高;(2)获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备;(3)适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路(通讯网络或互联网络)实现远程登录;(4)声纹辨认和确认的算法复杂度低;(5)配合一些其他措施,如通过 语音识别 进行内容鉴别等,可以提高准确率;……等等。这些优势使得声纹识别的应用越来越受到系统开发者和用户青睐,声纹识别的世界市场占有率,仅次于指纹和掌纹的生物特征识别,并有不断上升的趋势。 声纹识别(也称说话人识别)技术也如同现在在智能手机上应用十分广泛的指纹识别技术一样,从说话人发出的语音信号中提取语音特征,并据此对说话人进行身份验证的生物识别技术。每个人都具有独一无二的声纹,这是由我们的发声器官在成长过程中逐渐形成的特征。无论别人对我们的说话模仿的多么相似,声纹其实都是具有显著区别的。声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是"多选一"问题;而后者用以确认某段语音是否是指定的某个人所说的,是"一对一判别"问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的"训练"或"学习"过程。 现实生活中的“未见其人,先闻其声”就是人类通过声音去识别另一个人身份的真实描述,虽然目前计算机还做不到通过一个字就判断出人的身份,但是利用大量的训练语音数据,可以学出一个“智商”还不错的“声纹”大脑,它在你说出8-10个字的情况下可以判断出是不是你在说话,或者在你说1分钟以上的话后,就可以准确地判断出你是否是给定的1000人中的一员。这里面其实包含了大部分生物识别系统都适用的重要概念:1:1 和 1:N,同时也包含了只有在声纹识别技术中存在的独特的概念:内容相关和内容无关。 对于一个生物识别系统而言,如果它的工作模式是需要你提供自己的身份(账号)以及生物特征,然后跟之前保存好的你本人的生物特征进行比对,确认两者是否一致(即你是不是你),那么它是一个1:1的识别系统(也可以叫说话人确认,Speaker Verification);如果它只需要你提供生物特征,然后从后台多条生物特征记录中搜寻出哪个是你(即你是谁),或者哪个都不是你,那么它是一个1:N的识别系统(也可以叫辨认,Speaker Identification)。 技术上,简单的声纹识别的系统工作流程图。 对于声纹识别系统而言,如果从用户所说语音内容的角度出发,则可以分为内容相关和内容无关两大类技术。顾名思义,“内容相关”就是指系统假定用户只说系统提示内容或者小范围内允许的内容,而“内容无关”则并不限定用户所说内容。前者只需要识别系统能够在较小的范围内处理不同用户之间的声音特性的差异就可以,由于内容大致类似,只需要考虑声音本身的差异,难度相对较小;而后者由于不限定内容,识别系统不仅需要考虑用户声音之间的特定差异,还需要处理内容不同而引起的语音差异,难度较大。 目前有一种介于两者之间的技术,可以称之为“有限内容相关”,系统会随机搭配一些数字或符号,用户需正确念出对应的内容才可识别声纹,这种随机性的引入使得文本相关识别中每一次采集到的声纹都有内容时序上的差异,这种特性正好与互联网上广泛存在的短随机数字串(如数字 验证码 )相契合,可以用来校验身份,或者和其他人脸等生物特征结合起来组成多因子认证手段。 具体到声纹识别算法的技术细节,在特征层面,经典的梅尔倒谱系数MFCC,感知线性预测系数PLP、深度特征Deep Feature、以及能量规整谱系数PNCC 等,都可以作为优秀的声学特征用于模型学习的输入,但使用最多的还是MFCC特征,也可以将多种特征在特征层面或者模型层面进行组合使用。在机器学习模型层面,目前还是在2009年提出的iVector框架一统天下,虽然在深度学习大红大紫的今天,声纹领域也难免被影响,在传统的UBM-iVector框架下衍化出了DNN-iVector,也仅仅是使用DNN(或者BN)提取特征代替MFCC或者作为MFCC的补充,后端学习框架依然是iVector。 上图示出了一个完整的声纹识别系统的训练和测试流程,可以看到在其中iVector模型的训练以及随后的信道补偿模型训练是最重要的环节。在特征阶段,可以使用BottleNeck特征取代或者补充MFCC特征,输入到iVector框架中训练模型。 在系统层面,不同的特征及模型,可以从不同的维度刻画说话人的声音特征,加上有效的分数规整,将各子系统融合能有效的提高系统的整体性能。
声纹识别,也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。
声纹识别系统通过采集语音,提取声纹特征,训练模型并建立声纹模型库,把待识别的语音和声纹模型库进行比对,从而实现对说话人的识别。声纹识别系统一般包括两个步骤:声纹建模和声纹验证,典型的声纹识别系统如下图所示。声纹建模过程中涉及到的语音文件采集就是所谓的声纹采集。
在声纹识别的过程中,建立庞大有效的声纹数据库并对数据进行精确标注就成了基础且重要的一环。但在实际的声纹采集过程中,由于不同的设备、不同的信道等等的差异,声纹数据库质量往往参差不齐,这些质量问题往往会影响算法模型的建立,从而导致识别准确率的降低。
为了确保入库声纹的质量,就需要通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,同时研制标准声纹采集设备,建立可操作的标准声纹采集流程,为声纹库建设提供标准支撑,也确保采集入库的各个声纹能够发挥应有的价值。标准声纹采集设备应该特别注重以下几个方面:
通过标准声纹采集设备,就可以采集到符合各类声纹建库要求的高质量声纹数据要求,为声纹识别、声纹鉴定和比对提供坚实的基础。
标准声纹采集设备这里推荐快商通推出的标准声纹采集设备,它是专门为标准声纹采集场景研发的声纹采集设备,采用智能化麦克风集群,支持单向/全向拾音、多种文本采集方式。配套集采集、多标签入库、分类存储、实时检索功能于一体智能化声纹采集系统,可连续性创建采集,批量入库,缩短多人采集入库时间成本,保证声纹信息采集内容的完整性和真实性,提高声纹采集的质量和效率。一次语音录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,为声纹鉴定和比对提供坚实的基础
声纹,也称 “ 语图 ” ,是由专用的电声转换仪器(语图仪)将声波特征绘制成的波谱图形。声纹鉴定就是把未知人的语声和已知人的语声,通过语图仪分别制成声纹图谱,再依据声纹图上的特征进行分析、比较和判断,确定二者是否为同一人的语声。它是文检技术中近些年发展起来的语音识别的先进科学手段。
目前,许多国家都己把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。
( 1 )在获得了犯罪人的语声录音资料时,如在中进行的恐吓、勒索,或在其他性质的犯罪中录到了罪犯说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定犯罪人提供鉴定结论。
( 2 )在案件的侦讯或审理中(包括民事案件),通过声纹鉴定可以审查录音证据材料的其伪。
( 3 )通过声纹分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。
目前,国际声纹鉴定并行两套系统:
一是声纹的自动识别系统,它以电子计算机为主体,具备分析、储存、检索、鉴定多项功能,可以根据语声进行全自动分析,最后给出结论。但这种结论的准确性同专家设定的特征吻合量(阈值)有关。
二是声纹的人工识别系统,它以语图仪为支持,鉴定人直接观察和分析声纹,寻找特征,测量数据并进行比较与评断,最后得出结论。 在声纹资料的存储技术上,已发展到激光光盘存储。先以激光源对待储声纹图谱进行扫描,获得付利叶光谱,再通过电脑把光谱记录的声纹特征转换成数据,最后通过电脑控制的激光针将待储声纹特征的数据存入光盘纹线中。当需检索时,再用激光针通过电脑系统输出光盘中的信号,即可进行声纹比较。这种存储技术容量很大,一张光盘可以储存数百万人的声纹。
国内也有一些专业公司,可提供声纹鉴定软件和服务。如厦门的快商通,凭借其在声纹技术领域的技术积累并结合以往成功的声纹鉴定经验,其研发的声纹鉴定分析系统可进行录音资料的有效声纹鉴定,提供的服务包括:录音资料话者同一性认定;录音资料内容辨识;录音资料的真实性完整性鉴定;录音资料降噪处理等。
1.采集检材
在采集犯罪人或证人的语声作检材时,录音宜采用高保真录音机。天聪采集语声的要求是: ①录音应当尽量在不被对方发觉的情况下进行,以减少假象的干扰,保证语声的真实; ②应尽量防止环境噪声和录音设备的干扰。麦克风与被录对象保持适当距离。尽量不用失真大 的袖珍盒式录音机,电源最好用市电,保持电流稳定。电话录音时应使用传感器,不要将听筒直接对着“麦克”录音。磁带应选用优质新带。
2.采集样本
除了遵照采取检材时要求的器材和注意事项外,应尽量保持同采集检材时相同、相近的语声环境、距离、设备及速度;并建议在样本中有与检材相同的词句,以供特征比对。
3.审听和选择
鉴定人员要先对捡材和样本分别反复审听和记录,从中选择正常而清晰的语声段落,再进一步选取相同的字、词、句,作为供比较的部分。然后使用语图仪分别将选好的检材与样本中的字、词、句做出声纹图。
4.声纹特征
在被比较的两种声纹图谱中,分别选取明显、稳定的特征作为比较特征。一般说,共振峰的频率值及其走向是最稳定的特征,而且具有很强的特定性,利用价值最高;而时长、音强、波形等特征稳定性较差,可做参考。在天聪鉴定过程中,还可以从同一个人的语声中选择多个相同字、词或句的语图,在分析比较中抓住其稳定而特殊的特征作为依据。
5.比较
比对检材与样本中相同字、词的声纹中的同类特征(如共振峰频率、走向及波形),进行比较分析,找出相同点和差异点。
6.综合评断
①如果被比较的全部特征完全吻合;或者稳定性强的特征完全吻合,而只是稳定性差的特征有些差异,均可做同一认定结论;
②如果被比较的稳定性强的特征差异较大,还可以补充样本再做语图比较,倘仍有差异,又无法解释,则可做否定结论。
7.送检
说话人在不同的环境和不同的心态下,以及不同的语气、不同的健康状况都会引起语音的某些变异。录音环境(噪音、回声、距离)的干扰以及录音设备不良,也会使录制的语音产生假性变异。因此,送检时,要把录制检材和样本时的环境状况、录制距离、录制方式、使用机器、以及在什么情况下录制等情况加以详细记载,一并提交鉴定人,以便对差异点进行客观的分析评断。
本次最强大脑人机挑战的项目是听声识人,背后的技术背景是声纹识别技术。实际上声纹识别是一种行为识别技术,是通过测试、采集声音的波形和变化,与登记过的声音模板进行匹配。该项技术最早由40年代末的贝尔实验室开发,主要用于军事情报领域。随着技术发展,逐步在法医鉴定、法庭证据等领域得到广泛使用。 声纹识别的理论基础 每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。 这种特征主要由两个因素决定,第一个是声腔的尺寸,具体包括咽喉、鼻腔和口腔等,这些器官的形状、尺寸和位置决定了声带张力的大小和声音频率的范围。就像指纹一样,每个人的声音也就有独特的特征。第二个因素是发声器官被操纵的方式,发声器官之间相互作用就会产生清晰的语音。人在学习说话的过程中,通过模拟周围不同人的说话方式,就会逐渐形成自己的声纹特征。 理论上来说,声纹就像指纹一样,很少会有两个人具有相同的声纹特征。 小度声纹识别技术解析 最强大脑中,小度机器人拥有的声纹识别技术,实际上属于动态声音实时检测技术,同时还包括VAD、降噪、去混响等(VAD的目的是检测是不是人的声音,降噪和去混响是排除环境干扰)。 考虑到挑战场景是从合唱团中找到特点的人声,难点在于如何对语音信号中说话人相关的信息提取和表示,以及如何去区分类似人声的细微差异。一般而言对一段语音说话人相关特征的提取主要是按照如图所示的流程进行: 对于收集到的语音,首先会进行有效语音检测(VAD),将收集到的语音中非有效部分的语音进行切除,然后进行声学特征提取。由于语音信号是一种短时非平稳不定长的信号,因此一般提取特征都是采取加窗得到以帧为单位的特征。目前采用的声学特征普遍为经典的梅尔频率倒谱系数MFCC、感知现行预测系数PLP,以及目前火热的基于深度学习的特征deep feature。在得到声学特征之后,就是说话人信息的进一步提取。这里采用的建模方法主要采用ivector算法以及带残差处理的深度卷积神经中国络算法。通过建模后,我们就能够对语音进行更深层次的特征表示,使得说话人相关的信息进一步被呈现。最后得到的模型,就能够将特征提取阶段得到的特征进一步转化为能够表征说话人特性的样本。 这样,我们就能够将特定说话人的语音彻底转换为能够表征该说话人特性的模型。(在实际的比赛过程中,21个合唱队员在进行唱歌时,我们通过分别将这21个队员的唱歌声音送入到该模型中,最后得到21个能够表征这些队员信息的模型)。 识别匹配阶段就相对容易理解了,在采集到测试语音之后,进行相应的特征提取操作,然后通过与模版库里面的所有模板样本进行相似距离计算,然后选择距离最近的一个作为最后的判决结果。(在实际比赛过程中,这就相当于三次测试,每次测试,我们将线人的暗号语音送入到模型中,提取特征,然后再分别与21个模型进行打分比较,得分最高者即是机器认为的最有可能的线人)。整个过程如下图所示: 本次声纹识别的难度 可能大家最感兴趣的是,最强人工智能的小度和我们的小选手小宝3题只对了1题。这里我简单说下影响大家发挥的因素,如下: 1、噪音问题 2、多人唱歌 3、声音记忆遗忘 4、特征迁移 排名第一的是噪音问题,包括现场噪音和音乐噪音,这个比上场人脸识别的影响更大(上期存在着光线的影响),音乐本身也会影响机器和选手的判断;第二是多人唱歌,众所周知,声纹的识别主要靠频谱特征,而多人会出现频谱混叠的现象,使得特征分离和识别难度较大;第三,主要是对人类选手的影响,一般的人记忆时间的序列会比空间的要难,尤其是在记忆三串声音序列后,容易出现混淆,这也是为什么doctorWei一再希望小宝多听几遍的原因;最后说下特征迁移,挑战中是通过记忆说话,到辨识唱歌。而往往人们说话和唱歌声纹是不同的,这就存在一个特征迁移的问题,对应到我们的两位选手需要一定的归纳推理能力。 以上4个因素使得最终结果不是那么完美,但是也正是这些不完美才会让我们在技术上不断进步,不断超越过去的自己
声纹识别技术原理是利用声音的独特性来识别人物的,声纹识别简单地说,就是通过声音进行说话人身份识别的过程。语音信号之所以被形容为“形简意丰”,是因为声音包含有内容、身份、情感、年龄及健康状况等丰富的信息。
人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,理论上说,每个人说话时的短时频谱特征、声源特征、时序动态特征、韵律特征、语言学特征等都有差异,因此声纹就像指纹一样具有唯一性和独特性,可以进行识别。
声纹识别具有的优势。
1、声纹识别在金融领域的很多应用场景都是高频使用,对用户体验方面的需求较高,如果验证方式较为繁琐,往往用户难以接受,声音信息一般不涉及用户隐私问题,声音采集通过一个麦克风或者电话、手机就可完成,用户的接受度比较高;
2、更重要的是,声纹不易纂改,再加之声音信号中含有语言信息、副语言信息和非语言信息,综合利用声音中蕴含的丰富信息可以具备较高的安全特性。
以上内容参考 人民网——闻声识人:声纹识别让金融安全听得见
姓名:陈心语 学号:21009102266 书院:海棠1号书院 转自: 人工智能技术在声纹识别方面的应用|解读技术-云+社区-腾讯云() 【嵌牛导读】本文介绍了人工智能在声纹识别方面的应用。 【嵌牛鼻子】人工智能运用于声纹识别。 【嵌牛提问】人工智能在声纹识别方面中有什么运用呢? 【嵌牛正文】 人工智能技术对于传统产业的推进作用越来越凸显,极大提升了传统产品的商业价值。“听声识我,开口即播”长虹CHiQ5人工智能电视成为全球首款搭载 声纹识别 的人工智能电视,可以直接通过每个人说话的声音不同而区分目前使用电视用户是谁,从而实现内容的精准推荐。无需借助遥控和手机等智能设备,通过识别家庭成员的声纹来控制电视。语音助手配备海量语音库,使用语义模糊识别功能,即使说错片名也能自动识别出你想要的内容,但是当人们在观看某一节目的时候谈论提及其他电视节目名称,语音助手功能识别后当即转换到另一个节目影响正常节目的观看。但是在价格方面,55寸售价7597元,65寸售价13997元,75寸售价21997元,价格过高难以普及,但是也从侧面证明人工智能确实可以提升产品附加值。 目前人工智能发力的领域主要集中在指纹、脸、声音、眼睛等等,都是人和人之间相互区分的独一无二的标识上,称之为“生物特征”。声音就是这种一种可以反映人身份的生物特征,参考“指纹”的命名方式,可以叫它“声纹”。 声纹是指人类语音中携带言语信息的声波频谱,它同指纹一样,具备独特的生物学特征,具有身份识别的作用,不仅具有特定性,而且具有相对的稳定性 。声音信号是一维连续信号,将它进行离散化后,就可以得到我们现在常见的计算机可以处理的声音信号。 在实际应用中,声纹识别也存在一些缺点,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提取;……等等。尽管如此,与其他生物特征相比,声纹识别的应用有一些特殊的优势:(1)蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高;(2)获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备;(3)适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路(通讯网络或互联网络)实现远程登录;(4)声纹辨认和确认的算法复杂度低;(5)配合一些其他措施,如通过 语音识别 进行内容鉴别等,可以提高准确率;……等等。这些优势使得声纹识别的应用越来越受到系统开发者和用户青睐,声纹识别的世界市场占有率,仅次于指纹和掌纹的生物特征识别,并有不断上升的趋势。 声纹识别(也称说话人识别)技术也如同现在在智能手机上应用十分广泛的指纹识别技术一样,从说话人发出的语音信号中提取语音特征,并据此对说话人进行身份验证的生物识别技术。每个人都具有独一无二的声纹,这是由我们的发声器官在成长过程中逐渐形成的特征。无论别人对我们的说话模仿的多么相似,声纹其实都是具有显著区别的。声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是"多选一"问题;而后者用以确认某段语音是否是指定的某个人所说的,是"一对一判别"问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的"训练"或"学习"过程。 现实生活中的“未见其人,先闻其声”就是人类通过声音去识别另一个人身份的真实描述,虽然目前计算机还做不到通过一个字就判断出人的身份,但是利用大量的训练语音数据,可以学出一个“智商”还不错的“声纹”大脑,它在你说出8-10个字的情况下可以判断出是不是你在说话,或者在你说1分钟以上的话后,就可以准确地判断出你是否是给定的1000人中的一员。这里面其实包含了大部分生物识别系统都适用的重要概念:1:1 和 1:N,同时也包含了只有在声纹识别技术中存在的独特的概念:内容相关和内容无关。 对于一个生物识别系统而言,如果它的工作模式是需要你提供自己的身份(账号)以及生物特征,然后跟之前保存好的你本人的生物特征进行比对,确认两者是否一致(即你是不是你),那么它是一个1:1的识别系统(也可以叫说话人确认,Speaker Verification);如果它只需要你提供生物特征,然后从后台多条生物特征记录中搜寻出哪个是你(即你是谁),或者哪个都不是你,那么它是一个1:N的识别系统(也可以叫辨认,Speaker Identification)。 技术上,简单的声纹识别的系统工作流程图。 对于声纹识别系统而言,如果从用户所说语音内容的角度出发,则可以分为内容相关和内容无关两大类技术。顾名思义,“内容相关”就是指系统假定用户只说系统提示内容或者小范围内允许的内容,而“内容无关”则并不限定用户所说内容。前者只需要识别系统能够在较小的范围内处理不同用户之间的声音特性的差异就可以,由于内容大致类似,只需要考虑声音本身的差异,难度相对较小;而后者由于不限定内容,识别系统不仅需要考虑用户声音之间的特定差异,还需要处理内容不同而引起的语音差异,难度较大。 目前有一种介于两者之间的技术,可以称之为“有限内容相关”,系统会随机搭配一些数字或符号,用户需正确念出对应的内容才可识别声纹,这种随机性的引入使得文本相关识别中每一次采集到的声纹都有内容时序上的差异,这种特性正好与互联网上广泛存在的短随机数字串(如数字 验证码 )相契合,可以用来校验身份,或者和其他人脸等生物特征结合起来组成多因子认证手段。 具体到声纹识别算法的技术细节,在特征层面,经典的梅尔倒谱系数MFCC,感知线性预测系数PLP、深度特征Deep Feature、以及能量规整谱系数PNCC 等,都可以作为优秀的声学特征用于模型学习的输入,但使用最多的还是MFCC特征,也可以将多种特征在特征层面或者模型层面进行组合使用。在机器学习模型层面,目前还是在2009年提出的iVector框架一统天下,虽然在深度学习大红大紫的今天,声纹领域也难免被影响,在传统的UBM-iVector框架下衍化出了DNN-iVector,也仅仅是使用DNN(或者BN)提取特征代替MFCC或者作为MFCC的补充,后端学习框架依然是iVector。 上图示出了一个完整的声纹识别系统的训练和测试流程,可以看到在其中iVector模型的训练以及随后的信道补偿模型训练是最重要的环节。在特征阶段,可以使用BottleNeck特征取代或者补充MFCC特征,输入到iVector框架中训练模型。 在系统层面,不同的特征及模型,可以从不同的维度刻画说话人的声音特征,加上有效的分数规整,将各子系统融合能有效的提高系统的整体性能。
今天凌晨,一年一度的苹果WWDC 2019全球开发者大会在美国圣何塞举办,苹果更新了自家系统平台macOS、iOS、watchOS、tvOS以及今年刚刚加入的iPad OS。
在常规的软件升级之外,智能菌将带大家细数本届WWDC苹果在AI方面的升级,我们也和大家聊聊苹果关于隐私保护方面的思考。
终于开始“说人话”的智能助手
早在2010年,苹果率先推出了这款搭载于iPhone4S的智能语音控制功能,用户利用Siri可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
从2017年开始,Siri逐渐迎来更丰富的更新,加入了实时翻译功能,支持英语、法语、德语等语言,与此同时,Siri的智能化还进一步得到提升,还支持上下文的预测功能。
但一直以来,由于苹果的封闭性,Siri的可用性还是饱受诟病,在AI技术方面更是被吐槽为“人工智障”,从今年的WWDC来看,苹果希望摆脱智障的帽子,起码让Siri交流起来更像真人了。
具体来讲,随着深度学习技术的不断成熟,基于深度神经网络的语音合成逐渐成为语音合成领域的主流方法,这次苹果采用的就是Neural TTS(神经网络语音合成)技术(如上图),这样的技术应用在国内已经很多,AI合成语音已经可以以假乱真。
声纹识别来了
HomePod是苹果在2017年WWDC推出的智能音箱产品,该音响7英寸高,拥有7个高频扬声器和一个很大的低频扬声器,配备精准的音效喇叭和风向控制。
这是苹果的第一款智能音箱硬件,一经推出便口碑两重天,很多人赞扬它的音质和曼妙的腰线,摆放在哪里都不违和的设计,但更多人的指责它封闭的应用生态和隐私性。
这里提到的隐私性就是指这款产品标榜的Siri唤醒和发布指令,在此之前,任何在它旁边的人都可以唤醒它,只要说出“朗读短信”,用户的秘密就大告天下了。
在今年的WWDC现场,苹果终于为HomePod加入了声纹识别功能,它可以智能区别与它对话的是哪位 ,声纹识别(Voiceprint Recognize)是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术,目前已经广泛应用在了考勤系统、远程认证、门禁系统等场景之中。
在中国厂商发布的智能音箱产品中更是早有应用,这回苹果算是玩大家剩下的,就看它的实际体验能否逆袭领跑了,拭目以待。
保护隐私用户的云端数据苹果也不看
美国消费者保护组织Consumer Watchdog曾出具过一份报告,指责来自亚马逊和谷歌的专利申请曝光了其智能音箱是如何“偷听”用户的。该组织的研究称,这些设备可能被用作收集大量信息和广告推广的监听设备。
事实上,这样的用户反馈确实不绝于耳,Alexa曾将夫妻之间私人谈话的内容偷偷记录下来,并发给了其中一名家庭成员的同事,他当即打电话说这对夫妇:“赶紧拔掉你的Alexa设备!”
针对种种担忧,欧盟更是推出了史上最严的隐私保护条例GDPR(General Data Protection Regulation),目的就在于遏制个人信息被滥用,保护个人隐私。
虽然没有证据表明苹果设备存在这样的隐患,但也足够引起大家的担忧。
而苹果的隐私保护做法在2019 WWDC有了进一步的补充和升级,在Watch OS方面,苹果推出了运动推荐和数据分析的功能,在智能家居应用中,苹果更新了视频分析和数据存储功能。
以上二者的共同点是,苹果将处置数据的权利交给用户,用户可以选择不上传(保存在本地的加密芯片),也可以选择上传到云端,但苹果称用户的数据他们也无能查看。
值得一提都是,苹果还在智能家居的数据保护中加入了路由器的防护,以此来保障用户不在任何的环节遭遇攻击。
在增强现实里畅游“我的世界”
ARKit是苹果在2017年WWDC推出的AR开发平台,开发人员可以使用这套工具iPhone和iPad创建增强现实应用程序。
在WWDC 2019苹果带来了AR应用的更新和全新的RealityKit平台,如上图,苹果在现场展示了《我的世界》 游戏 的AR版本,这是一款堆方块、不断冒险的 游戏 ,融入增强现实之后趣味性十足,还可以多人互动 游戏 。
此外,苹果还带来了RealityKit开发工具,新增了AR模型还可以融合人物,支持动作捕捉,并且可以实现照片级渲染,环境和相机效果。
美国专利局曾批准了苹果的一项申请:头盔将配置摄像头,用于辨认和注释兴趣点和其他对象。大家一度认为苹果会在WWDC推出AR硬件。
库克有言,苹果认为AR增强现实会是未来10年非常重要的技术,我们会在这个领域投入更多。有分析认为,随着5G技术的应用,AR将迎来成熟期,目前AR相关专利申请正在持续攀升。
总结
依然是一场很苹果的开发者大会,在人工智能技术方面不冒进,坚持用产品和体验说话,他们强调自己是一家软件公司,在细枝末节上的打磨确实值得称赞。
但不可否认,苹果的封闭性依然制约着其AI功能大放异彩的机会,Siri本可以做得更多,话不多说,期待开放内测。
走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮。 而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下声纹识别技术研究的前沿观点,总结出五大发展趋势:
语音作为语言的声音表现形式,不仅包含了语言语义信息,同时也传达了说话人语种、性别、年龄、情感、信道、嗓音、病理、生理、心理等多种丰富的副语言语音属性信息。以上这些语言语音属性识别问题从整体来看,其核心都是针对不定时长文本无关的句子层面语音信号的有监督学习问题,只是要识别的属性标注有不同。
近年来,声纹识别的研究趋势正在快速朝着深度学习和端到端方向发展,其中最典型的就是基于句子层面的做法。在网络结构设计、数据增强、损失函数设计等方面还有很多工作去做,还有很大的提升空间。
在实际应用中,由于对基于语音的访问控制需求的不断增长,提升声纹识别系统在短时语音情况下的性能变得尤为迫切。短时语音中说话人信息不足以及注册和测试语音的文本内容不匹配,对于主流的基于统计建模的声纹识别系统是一个严峻的挑战。
目前采用的深度说话人识别方法首先利用神经网络提取前端的帧级特征,然后通过池化映射获得可以表示说话人特性的段级向量,最后采用 LDA/PLDA 等后端建模方法进行度量计算。
相对于传统的 i-vector 生成过程,基于深度学习的说话人识别方法优势主要体现在区分性训练和利用多层网络结构对局部多帧声学特征的有效表示上。如何进一步改进现有的深度说话人学习方法是现阶段的一个研究热点。
生成式对抗网络 (GAN) 的主要目的是用在数据生成、降噪、等很多场景里面。它还被用在领域自适应里面,形成一个新的分布。第三个广泛的应用是生成对抗样本,这会对分类系统产生大的困扰。很多研究者用对抗样本攻击机器学习的系统,在原始数据上增加一些扰动,生成样本,经过神经网络之后就有可能识别成完全不同的结果。这个思想在图像处理领域非常活跃,会造成错误识别,引起了自动驾驶,安全等领域的研究人员的广泛关注。
在语音领域,GAN 可以用在语音识别、口音自适应上,通过多任务学习和梯度反转层来进行口音或信道的自适应,然后加上其他方法可以得到较好的效果。声纹识别也存在各种不匹配的问题,在声纹识别上也可以使用这一思想。同样的思想也用在了 TTS 语音合成领域,目的是把不同的音素解耦成说话人,风格等,去除噪声对建模的影响。
说话人识别和欺检测近年来受到学术界和业界的广泛关注,人们希望在实际应用中设计出高性能的系统。基于深度学习的方法在该领域得到了广泛的应用,在说话人识别和反欺方面取得了新的里程碑。然而,在真实复杂的场景下,面对短语音、噪声的破坏、信道失配、大规模等困难,开发一个鲁棒的系统仍然是非常困难的。深度嵌入学习是进行说话人识别和反欺的一个重要途径,在这方面已有一些著名的研究成果。如之前的 d-vector 特征和当前普遍使用的 x-vector 特征。
目前,指纹识别、人脸识别已经被大众所熟知,但同样作为生物识别的声纹识别,还处于技术挑战的前沿地带。据声纹识别企业快商通分析,当下全球生物识别产业规模庞大,仅声纹识别这一细分方向的市场规模就将近百亿美元,预计2020年更是有望超过200亿美元(合1346亿元人民币),占整个生物识别市场的。
以国内公共安全领域为例,公安部面向全国推广声纹技术,与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库、指纹库相结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一。目前,公安部已在声纹库建设方面进行了重点布局,并选择快商通等通过公安部标准检测的厂商作为声纹采集设备提供方,力求双发共同完成这项专业技术性强、应用领域广、建设难度大的系统工程。
现在手机几乎是人手一个,所以这个安全将主要是保护用户的个人隐私数据、各类账户(淘宝、支付宝等)、支付信息而言的。因为脸部和指纹都是用户的生物特征信息而伴随着人的一生,也就是一个“不会改变的密码”!所以安全不是绝对的,如果你大部分的软件都是通过这些生物特征来保证安全是很有风险的,因为它不像数字密码那样可以随时更换,一旦泄露后果不堪设想!下面就说一下“刷脸”和“指纹”的一些应用与区别。
人脸识别 :当你拿起手机的时候,手机需要主动去捕捉人脸。(机器主动)
指纹识别 :你需要给出你的某个指头去给手机指纹识别模块。(自己主动)
人脸识别技术已经在PC登录、手机登录、日常打卡上下班等信息安全领域得到实际应用,极大地提高了人们在日常生活中的体验。
1、开启“人脸识别解锁”功能。人脸识别解锁是指通过识别人脸来允许用户完全获取设备中存储的个人信息的技术。
2、用户通过摄像头录制自己的面部,使设备预先记忆脸部信息。
3、通过摄像头识别人脸并解锁、登录设备。如果人脸与“预先设定的身份认证信息”相匹配,那么用户就可登入设备。如果有多人想要登入同一台设备,那么当第二名用户来到摄像头前面时,设备软件将自动转至这名新用户的资料。
4、支付宝的人脸识别技术采用在该领域广泛应用的区域特征分析算法,它融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征模板。利用已建成的人脸特征模板与被测者的人的面像进行特征分析,根据分析的结果来给出一个相似值。通过这个值即可确定是否为同一人。
5、阿里巴巴的无人超市实际上布满了人脸识别摄像头,从顾客进店开始,捕捉跟踪顾客在每一个货架前的停留时间、商品选购、行动路线,进入无人超市利用人脸识别将顾客锁定,拿起一样东西,系统会自动记录物品及数量,选完商品不用结账,费用直接从手机里扣除。
不久前,网上曝光了一则用照片做成3D模型轻松过支付宝人脸识别登陆的视频。利用面部模型可以通过支付宝的刷脸认证,从而登录支付宝账号,进行付款、转账的操作。虽然技术方回应称为恶意攻击,但暴露的问题还是不得不让人担心。
指纹、虹膜、指静脉、巩膜以及视网膜,这几个都是常见的生物识别的方式。这些生物特征有一个共同的性质,那就是它们都有一定的隐私、私密性,也就是说如果不近距离接触或者近距离观察,根本没有办法直接获取。但是人脸跟这些传统的生物特征相比,基本没有所谓的隐私性可言。而且指纹已经率先使用到支付领域并且普及,这是人脸识别还没有到达的高度。但是指纹识别也有人用指纹膜甚至仅一块口香糖就破解了!
综上所述,指纹和人脸各有优势,人脸识别在很多时候都比较便捷,而指纹的隐私性更优,或许人脸识别还会有更大的发展,但这都不是绝对安全的,所以建议大家如果能不用生物特征尽量不用!关于将生物特征用于安全认证还有很长的一段路要走,或许到量子计算普及时能有一个质的飞跃!最后关于安全这个问题用黑客界流传的一句话来做最后的回答。
不是我能不能黑你的问题,而是你有没有被黑的价值!
现在手机几乎是人手一个,所以这个安全将主要是保护用户的个人隐私数据、各类账户(淘宝、支付宝等)、支付信息而言的。因为脸部和指纹都是用户的生物特征信息而伴随着人的一生,也就是一个“不会改变的密码”!所以安全不是绝对的,如果你大部分的软件都是通过这些生物特征来保证安全是很有风险的,因为它不像数字密码那样可以随时更换,一旦泄露后果不堪设想!下面就说一下“刷脸”和“指纹”的一些应用与区别。
人脸识别:当你拿起手机的时候,手机需要主动去捕捉人脸。(机器主动)
指纹识别:你需要给出你的某个指头去给手机指纹识别模块。(自己主动)
人脸识别
人脸识别技术已经在PC登录、手机登录、日常打卡上下班等信息安全领域得到实际应用,极大地提高了人们在日常生活中的体验。
1、开启“人脸识别解锁”功能。人脸识别解锁是指通过识别人脸来允许用户完全获取设备中存储的个人信息的技术。
2、用户通过摄像头录制自己的面部,使设备预先记忆脸部信息。
3、通过摄像头识别人脸并解锁、登录设备。如果人脸与“预先设定的身份认证信息”相匹配,那么用户就可登入设备。如果有多人想要登入同一台设备,那么当第二名用户来到摄像头前面时,设备软件将自动转至这名新用户的资料。
4、支付宝的人脸识别技术采用在该领域广泛应用的区域特征分析算法,它融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征模板。利用已建成的人脸特征模板与被测者的人的面像进行特征分析,根据分析的结果来给出一个相似值。通过这个值即可确定是否为同一人。
5、阿里巴巴的无人超市实际上布满了人脸识别摄像头,从顾客进店开始,捕捉跟踪顾客在每一个货架前的停留时间、商品选购、行动路线,进入无人超市利用人脸识别将顾客锁定,拿起一样东西,系统会自动记录物品及数量,选完商品不用结账,费用直接从手机里扣除。
不久前,网上曝光了一则用照片做成3D模型轻松过支付宝人脸识别登陆的视频。利用面部模型可以通过支付宝的刷脸认证,从而登录支付宝账号,进行付款、转账的操作。虽然技术方回应称为恶意攻击,但暴露的问题还是不得不让人担心。
指纹识别
指纹、虹膜、指静脉、巩膜以及视网膜,这几个都是常见的生物识别的方式。这些生物特征有一个共同的性质,那就是它们都有一定的隐私、私密性,也就是说如果不近距离接触或者近距离观察,根本没有办法直接获取。但是人脸跟这些传统的生物特征相比,基本没有所谓的隐私性可言。而且指纹已经率先使用到支付领域并且普及,这是人脸识别还没有到达的高度。但是指纹识别也有人用指纹膜甚至仅一块口香糖就破解了!
综上所述,指纹和人脸各有优势,人脸识别在很多时候都比较便捷,而指纹的隐私性更优,或许人脸识别还会有更大的发展,但这都不是绝对安全的,所以建议大家如果能不用生物特征尽量不用!关于将生物特征用于安全认证还有很长的一段路要走,或许到量子计算普及时能有一个质的飞跃!最后关于安全这个问题用黑客界流传的一句话来做最后的回答。
在智能手机已经逐渐普及的今天,相比之前,智能手机有了更多的解锁和支付方式,这其中就包括“刷脸”和“指纹”。那么这两种方式究竟哪种最安全呢?
早在2014年左右,支付宝和微信两大电子支付平台率先开启了 “刷脸支付” 的 探索 。到2017年左右,各大手机厂商也开始逐渐重视 手机刷脸功能 ,17年以后的手机大多都支持 人脸识别 。
要说“刷脸支付”的安全性如何,不少人觉得不安全,总觉得别人可以盗取自己脸部详细特征来进行解锁或者支付,其实这种担忧有些杞人忧天,开发者早就想到了这种情况,所以 现在的刷脸验证大多都是一种动态验证,验证时多数会要求使用者点点头,眨眨眼等动态动作,以增加刷脸的安全性。
这种动态验证方式可轻易识别出 究竟是真人还是图片 ,会充分提取人脸的 眼睛距离,鼻子长短,嘴巴大小 等详细脸部信息,精确度已经达到 毫米级 。在支持刷脸支付的超市有人曾经做过试验,付款时用马云的照片进行付款,结果只有四个大字,那就是 “不是本人” ,所以 大家大可不必有拿照片刷脸的担忧。
另外随着刷脸技术的不断完善,未来还会更加安全。 因为未来的刷脸技术中还会加入 虹膜识别 以及 声纹识别 等。这里给大家说一下虹膜识别,虹膜是人眼睛的一部分,从胎儿时期虹膜就可以发育完全,并且一生都不会改变,而且 每个人的虹膜都是独一无二的 ,在未来, 虹膜的唯一性也会增加脸部识别的安全性。
声纹识别 也是一种高端的生物识别技术,利用此技术可以 将人的声信号全部转换成电信号,再利用计算机进行处理和识别,安全性也很高。有了这两项技术的加持,未来刷脸验证的安全性还将进一步提升。
指纹,也是手机常用的解锁和支付方式。 作为另一种生物识别技术,它的安全性究竟如何呢?个人认为 指纹解锁最起码比数字密码更安全,而且很方便,解锁或者付款时,只需手指放到手机指纹识别出,立马就可以完成解锁或者付款。
那么人的指纹虽说是独一无二的,但又没可能被复制呢? 之前就曾看到过一篇文章,纽约大学的研究人员经过研究分析大量指纹信息后,曾创造出一套 “万能指纹” ,使用此指纹据说可以过很多指纹识别系统。虽然真实性有待考量,但这条信息也 让更多人开始注重指纹解锁的安全性。
不过指纹解锁或者支付的确有一点不安全,那就是 当你喝醉了或者熟睡的时候,如果别人在你不知情的情况下用你的手指去进行解锁或者支付,那的确会有一些不安全因素。 如果是面部识别,在你熟睡等闭眼情况下, 轻易则不会解开 。
另外我们在使用指纹识别时,必须 先录入自己的指纹数据 ,那么相应的手机厂商或者软件所有者会不会盗取用户的指纹信息呢?这一点大家也可放心,只要是 较大的手机厂商和软件平台,都会严格保密用户的指纹信息 。那么又有人说了, 这些信息会不会被黑客盗取呢?首先指纹扫描时必须通过手机硬件,在软件上不会传输指纹信息;另外,即使是在手机本地存储的指纹信息,存储位置都是十分安全的,这些位置一般都会拒绝各种软件的访问。 这两点在技术上就 给黑客盗取指纹信息增加了难度。
综上来看,指纹和刷脸都是有一定安全保障的,如果非要说两者谁更安全,个人觉得是刷脸支付。首先指纹复制的代价相比脸部复制要高得多;另外指纹在日常生活中很容易遗留下来,例如水杯、门把手等位置,而脸部特征除了照片一般不会泄露出去;还有就是指纹识别容易在睡着时被人利用,面部识别则不会。
理论上肯定是刷脸更加安全,否则苹果手机也不会一直坚持使用3D结构光技术,而不用屏幕指纹识别。和指纹相比,刷脸在安全性上拥有很大的优势。
首先真正的人脸识别自带“活体检测”功能。所谓活体检测就是手机在刷脸的时候首先会判断摄像头前面的是真人,而不是模型或者照片。这是人脸识别最基本的一个功能,如果没有这个功能,人脸识别就不能用于支付。比如现在很多国产手机都支持人脸解锁,但像苹果iPhone X那样能够用于人脸支付的国产手机少之又少。就是因为大多数国产手机的人脸识别不具备活体检测功能,很容易被模型或者照片过,安全度不高。
人脸识别想要支持“活体检测”就需要用到“3D结构光”技术。这项技术被苹果率先应用在iPhone X上。它的原理是利用红外线投射器向人脸投射无数个红外小点,然后在利用红外接收器收集这些红外点的信息,并将它们组成一个立体的面容建模。红外点的数量越多,模型也就越精细,安全系数也就越高。由于这个3D建模是立体的,所以无法用照片来破解。
而在面容识别的过程当中,3D结构光传感器也会根据用户眨眼,或者偏头等细微动作,来验证正在使用面容识别的是用户本人,而并非虚假的模型。这样一来,3D结构光人脸识别几乎不可能被破解。
相比之下,指纹识别的安全性要更低一些。虽然指纹识别也有“活体检测”,但不可能做到人脸识别那么精细。比如有很多实验结果都显示,用导电硅胶来制作的手指倒模,就可以非常轻松的过很多手机的指纹识别传感器。所以一旦用户的指纹信息被第三方获取,那么就意味着指纹识别不再安全了。
当然,指纹识别也有优点,比如它不像人脸识别那样依赖3D结构光。现在一些全面屏手机甚至做到了屏下指纹识别。而人脸识别如果想用于支付,就必须依赖3D结构光技术,这样一来手机屏幕就会像iPhone X那样留出一个缺口,也就是人们俗称的“刘海屏”,在外观颜值上不如屏下指纹识别手机。
智能手机的刷脸和指纹其实哪个都不安全,说句实话,我这个人在老婆面前就是一个透明的人,什么事情我都不会瞒着他。所以我的手机可以放在他手里一整天,我也不会担心有什么绯闻之类的事情发生。但是我们俩之间有一个段子也让我知道刷脸和指纹是最不安全的。 我有一个喝完酒爱睡觉的毛病,那就是喝了一点酒,回到家里倒头就睡,谁也叫不醒发生什么事情也不知道。有一次我真的喝大了,回到家里是下午两点,我睡了一小天儿,等到晚上八点多醒来的时候。发现我的媳妇儿正在玩儿我的手机。我当时就半开玩笑的说我又有指纹又有刷脸的加密措施,你是怎么进来我的手机玩儿的?她很黑,笑着说你的手机我拿着刷你一下脸,或者拿你的指纹在你的手机上按一下不就自然开锁了吗?他这一句玩笑话让我顿时觉得刷脸和按指纹真的是很不安全,幸好自己的媳妇儿知道自己的指纹和能刷脸。如果是这个手机到了别人的手里,我在人家跟前睡着了,那么我手机里的一切东西不都是一露无疑。 所以我说精明的人千万别把手机设置成什么刷指纹和刷脸的功能。还是用那种图形锁和数字密码锁是最安全的。这样别人也偷不了你的信息也看不了你的手机,这样才能更好的保护你个人的隐私。这样才能让你的手机永远是在一种安全的状态。 因此,凭我对手机的理解,我觉得刷指纹和刷脸都没有安全感。
现在手段多多,刷脸和指纹,那个都不太安全,总让人胆心!只有安全没有决对的安全!
智能手机已经变成了我们移动互联网的入口,其中捆绑了大量的业务,甚至很多业务与钱相关。那么,一旦出现信息安全事件,对于每个人的影响都将十分巨大。手机验证登录则是我们的第一道屏障,验证方式分为两种,一种是较为传统的密码验证、图片解锁验证等;一种是利用生物体唯一特征来验证,包括了刷脸、指纹等。那么,智能手机的刷脸和指纹验证哪个更加安全呢?
先来说说刷脸的这种验证方式,做的较好的应该属于苹果公司。苹果手机为了实现刷脸的功能,妥协了全面屏的设计,使用的是较为怪异的刘海屏。这样的好处是使用3D结构光技术,使得人脸验证的安全系数变得更高。当然,如果真是双胞胎来捣乱,这项技术也不能称为十分安全。但是对比于其他手机厂商,仅凭借照片就能够解锁,3D结构光技术相对来说还算安全。
当然,最安全的技术还是虹膜识别,但是由于识别速度较慢、限制较多的问题,现在该技术并未普及。
至于指纹解锁就更简单了,屏幕通过识别您手指指纹的方式来进行验证。实现的方式上具有光学屏幕指纹识别、超声波屏下指纹识别技术等。三星手机主要使用的是超声波屏下指纹识别技术,前不久却爆出了三星S10和Note10系列手机存在安全隐患。国外用户发现使用全包硅胶套之后,未录入指纹的前提下可以登录手机,并且能够使用支付程序。记得当时各大银行、支付宝、微信等也紧急暂停了三星这些型号手机的指纹支付功能。
由此来看,指纹解锁的功能也并非如我们想象中安全。
那么,两种解锁方式哪个更安全呢?从某个角度来说,任何一种技术都会存在漏洞,完全安全的东西并不存在,只是能过说是相对安全。
对于一名普通人来说,即便是各种技术存在着这样或那样的漏洞,但是想要还原破解并不现实,这并不是你我能够做到的事情。这两种技术我更偏向于使用指纹解锁,外人能够接触到您手机的毕竟是少数,我们要防的是“最亲近”的人。刷脸相对指纹解锁就变得较为弱势,我总不能挡着脸睡觉吧!至少睡梦中动用我的手指还是会察觉的!实在不行,咱就用脚趾吗!哈哈哈
无论是过去、现在、还是将来,都不会有任何人的指纹和你的一模一样。但很有可能出现相似度99%以上的两个人。
“指纹”实际上就是凹凸不平的纹理,要复制一个人的“指纹”很容易,使用指纹膜、硅胶就可以轻松的复制指纹。
有极少数皮纹病患者并没有指纹,这可能与基因(SMARCAD1)的突变有关,指纹虽然与DNA有关,但无法通过DNA分析重建指纹纹样。
“指纹”解锁遇到了冬天皮肤褶皱、洗衣服/洗碗皮肤褶皱、细菌/真菌感染性脱皮、酸/碱腐蚀等情况很容易失效。
早期并没有“屏下指纹解锁”,这就意味着指纹解锁模块在“全面屏时代”会极大的占用屏幕的屏占比,影响视觉效果,有些厂商会将指纹解锁模块移到手机背面来改善屏障比,但还是没有“人脸识别”的手机用得爽。
“人脸识别”抬起手机即可解锁,而“指纹解锁”需要将手指移到解锁模块内才能完成解锁。所以“人脸识别”可以化解很多尴尬的局面,比如:
目前“人脸识别”应用较为成熟的技术是3D结构光技术,相较过去的2D人脸识别只能识别屏幕的人脸图像,3D结构光则可以投射出数以万计的红外线对人脸轮廓进行建模识别,极大的提高了安全性。
在FIT2017互联网安全创新大会上,技术人员利用3D建模软件参照“郭富城”照片的面部特征,短时间就做出了对应的3D模型图像,通过人脸建成软件对比结果,假的3D模型足以破解一般的人脸识别。
这就意味着,一旦有人有你的照片就可以通过3D建模然后将你的脸型打印出来,获取一张照片比一个“指纹”的获取容易得多得多。
Face ID首秀时,很多同卵双胞胎们纷纷在网上秀出可以同时解锁Face ID。还有一对来自俄罗斯的双胞胎指责Face ID没有办法区分他们,让他们的个人隐私受到了损坏并造成了精神损伤,还向苹果要求赔偿。
虽然近几年有越来越多的新技术补充到“人脸识别”中提高识别的准确率,但“人脸识别”确实没有想象中的那么安全。假如自己睡着了或喝醉了,别人通过“人脸识别”解锁了手机,获取了很多隐私信息并把钱转走了,这是多么恐怖的一件事。
“数字解锁”、“图像解锁”的主动权完全是掌握在自己手中,记在脑子里别人想获取是一件极度困难的事情,除非是自己主动告诉。
“指纹解锁”和“人脸识别”主要是为便捷性而生,但它们的安全性问题是不容忽视的。
很多手机产商开启“人脸识别”的同时还需要设置“数字解锁”,当手机长时间没有点亮屏幕或重新启动手机时需要先“数字解锁”后才能开启“人脸识别”。
作为用户我们也不能将所有的鸡蛋放在一个篮子里,比如:锁屏密码和银行卡密码设置成一样。这是非常不可取的。
举个例子:
用“人脸识别”解锁,可以用“指纹解锁”打开锁定的APP,然后使用和锁屏密码不同的数字支付密码来转账和付款。
事实上并没有那种单一的验证方法可以做到100%的安全,必要的时候需要多种验证方法相结合,比如在银行办理业务时,需要身份证、签字、按指纹、扫描人脸图像等。
现在“指纹解锁”和“人脸识别”技术已经非常成熟了,不管是从安全性,还是从便捷性来说,很难一较高下。但我们也不能过度地依赖它们,而是应该采用多种认证方式保障自己的个人隐私。
以上个人浅见,欢迎批评指正。
刷脸的分为两种,一种是安卓系统自带的2D图像识别。另一种是iPhoneX开始启用的3D结构光。由于结合了3D建模,这种面部识别按照苹果的说法是百万分之一的破解概率,但是依然会有一些问题,比如双胞胎或是“特制雕像”解锁之类的,这些之前都有新闻爆出来过。
而由于人体指纹的唯一性,目前最安全的显然还是指纹识别,这也是为什么大部分安卓厂商对指纹识别依然很坚定。
多说一句,三星曾有一段时间用过虹膜识别,安全性显然比2D面部要更高,但是由于体验实在太糟心,几代之后三星自己也放弃了。
智能手机刷脸和指纹哪个更安全呢,我认为目前来说指纹更加的安全,刷脸还是比较小儿科一点儿。
现在智能手机的安全做的是相当不错的,与指纹的接触式不同,刷脸感觉是很高大上的,但是它的安全性还是比较差的,因为它是靠的形,虽然现在苹果或是华为手机都使用了3维式的刷脸方式,提高了安全性,也只能说是提高了而已,它并没有解决实质性的问题,那就是可以随意的仿出人脸出来,想想变脸是不是很简单,它真的是可以的,但是指纹就不一样了,指纹必须是活体的,并且指纹本身就是不重复的,它的纹理又非常有判断性,和人脸的简单化不一样的。
所以我认为是指纹更加的安全一点儿,只能说人脸更加的方便,或是未来可能成为主流。但是目前来说,安全性还是差的很远的。
计算机毕业论文一般来说,应该包括论文文档,设计作品,以及作品的相关介绍吧,不一定要毕业设计作品,好像我们以前班,就有一部分用纯论文(对某个论题作研究)去作答辩的,而且还拿了优秀论文呢,呵!
指纹,由于其具有终身不变性、唯一性和方便性,已几乎成为生物特征识别的代名词。指纹是指人的手指末端正面皮肤上凸凹不平产生的纹线。纹线有规律的排列形成不同的纹型。纹线的起点、终点、结合点和分叉点,称为指纹的细节特征点(minutiae)。指纹识别即指通过比较不同指纹的细节特征点来进行鉴别。由于每个人的指纹不同,就是同一人的十指之间,指纹也有明显区别,因此指纹可用于身份鉴定。其实,我国古代早就利用指纹(手印)来签押。1684年,植物形态学家Grew发表了第一篇研究指纹的科学论文。1809年Bewick把自己的指纹作为商标。1823年解剖学家Purkije将指纹分为九类。 1880年,Faulds在《自然》杂志提倡将指纹用于识别罪犯。1891年Galton提出著名的高尔顿分类系统。之后,英国、美国、德国等的警察部门先后采用指纹鉴别法作为身份鉴定的主要方法。随着计算机和信息技术的发展,FBI和法国巴黎警察局于六十年代开始研究开发指纹自动识别系统(AFIS)用于刑事案件侦破。目前,世界各地的警察局已经广泛采用了指纹自动识别系统。九十年代,用于个人身份鉴定的自动指纹识别系统得到开发和应用。 由于每次捺印的方位不完全一样,着力点不同会带来不同程度的变形,又存在大量模糊指纹,如何正确提取特征和实现正确匹配,是指纹识别技术的关键。指纹识别技术涉及图像处理、模式识别、机器学习、计算机视觉、数学形态学、小波分析等众多学科。 指纹识别系统是一个典型的模式识别系统,包括指纹图像获取、处理、特征提取和比对等模块。 指纹图像获取:通过专门的指纹采集仪可以采集活体指纹图像。目前,指纹采集仪主要有活体光学式、电容式和压感式。对于分辨率和采集面积等技术指标,公安行业已经形成了国际和国内标准,但其他还缺少统一标准。根据采集指纹面积大体可以分为滚动捺印指纹和平面捺印指纹,公安行业普遍采用滚动捺印指纹。另外,也可以通过扫描仪、数字相机等获取指纹图像。 指纹图像压缩:大容量的指纹数据库必须经过压缩后存储,以减少存储空间。主要方法包括JPEG、WSQ、EZW等。 指纹图像处理:包括指纹区域检测、图像质量判断、方向图和频率估计、图像增强、指纹图像二值化和细化等。 指纹分类:纹型是指纹的基本分类,是按中心花纹和三角的基本形态划分的。纹形从属于型,以中心线的形状定名。我国十指纹分析法将指纹分为三大类型,九种形态。一般,指纹自动识别系统将指纹分为弓形纹(弧形纹、帐形纹)、箕形纹(左箕、右箕)、斗形纹和杂形纹等。 指纹形态和细节特征提取:指纹形态特征包括中心(上、下)和三角点(左、右)等,指纹的细节特征点主要包括纹线的起点、终点、结合点和分叉点。 指纹比对:可以根据指纹的纹形进行粗匹配,进而利用指纹形态和细节特征进行精确匹配,给出两枚指纹的相似性得分。根据应用的不同,对指纹的相似性得分进行排序或给出是否为同一指纹的判决结果。 现在的计算机应用中,包括许多非常机密的文件保护,大都使用“用户ID+密码”的方法来进行用户的身份认证和访问控制。但是,如果一旦密码忘记,或被别人窃取,计算机系统以及文件的安全问题就受到了威胁。 随着科技的进步,指纹识别技术已经开始慢慢进入计算机世界中。目前许多公司和研究机构都在指纹识别技术领域取得了很大突破性进展,推出许多指纹识别与传统IT技术完美结合的应用产品,这些产品已经被越来越多的用户所认可。指纹识别技术多用于对安全性要求比较高的商务领域,而在商务移动办公领域颇具建树的富士通、三星及IBM等国际知名品牌都拥有技术与应用较为成熟的指纹识别系统,下面就对指纹识别系统在笔记本电脑中的应用进行简单介绍。 众所周知,在两年前就有部分品牌的笔记本采用指纹识别技术用于用户登录时的身份鉴定,但是,当时推出的指纹系统属于光学识别系统,按照现在的说法,应该属于第一代指纹识别技术。光学指纹识别系统由于光不能穿透皮肤表层(死性皮肤层),所以只能够扫描手指皮肤的表面,或者扫描到死性皮肤层,但不能深入真皮层。 在这种情况下,手指表面的干净程度,直接影响到识别的效果。如果,用户手指上粘了较多的灰尘,可能就会出现识别出错的情况。并且,如果人们按照手指,做一个指纹手模,也可能通过识别系统,对于用户而言,使用起来不是很安全和稳定。 因此出现了第二代电容式传感器,电容传感器技术是采用了交替命令的并排列和传感器电板,交替板的形式是两个电容板,以及指纹的山谷和山脊成为板之间的电介质。两者之间的恒量电介质的传感器检测变化来生成指纹图像。但是由于传感器表面是使用硅材料 容易损坏 导致使用寿命降低,还有它是通过指纹的山谷和山脊之间的凹凸来形成指纹图像的 所以对脏手指 湿手指等困难手指识别率低。 发展到今天,出现第三代生物射频指纹识别技术,射频传感器技术是通过传感器本身发射出微量射频信号,穿透手指的表皮层去控测里层的纹路,来获得最佳的指纹图像。因此对干手指,汉手指,干手指等困难手指通过可高达99@%,防伪指纹能力强,指纹敏感器的识别原理只对人的真皮皮肤有反应,从根本上杜绝了人造指纹的问题,宽温区:适合特别寒冷或特别酷热的地区。因为射频传感器产生高质量的图像,因此射频技术是最可靠,最有力有解决方案。除此之外,高质量图像还允许减小传感器,无需牺牲认证的可靠性,从而降低成本并使得射频传感器思想的应用到可移动和大小不受拘束的任何领域中。
免费的?!!
谈谈网络安全技术随着Internet的迅速发展,电子商务已成为潮流,人们可以通过互联网进行网上购物、银行转账等许多商业活动。现在商业贸易、金融财务和其他经济行为中,不少已经以数字化信息的方式在网上流动着。在下个世纪伴随着电子商务的不断发展和普及,全球电子交易一体化将成为可能。“数字化经济”(Digital Economy)初具规模,电子银行及电子货币的研究、实施和标准化开始普及。 然而,开放的信息系统必然存在众多潜在的安全隐患,黑客和反黑客、破坏和反破坏的斗争仍将继续。在这样的斗争中,安全技术作为一个独特的领域越来越受到全球网络建设者的关注。 一、防火墙技术和SET规范 防火墙技术和数据加密传输技术将继续沿用并发展,多方位的扫描监控、对后门渠道的治理、防止受病毒感染的软件和文件的传输等许多问题将得到妥善解决。未来防火墙技术会全面考虑网络的安全、操作系统的安全、应用程序的安全、用户的安全、数据的安全,五者综合应用。在产品及功能上,将摆脱目前对子网或内部网治理方式的依靠,向远程上网集中治理方式发展,并逐渐具备强大的病毒扫除功能;适应IP加密的需求,开发新型安全协议,建立专用网(VPN);推广单向防火墙;增强对网络攻击的检测和预警功能;完善安全治理工具,非凡是可疑活动的日志分析工具,这是新一代防火墙在编程技术上的革新。 理论上,防火墙就是指设置在不同网络(如可信任的企业内部网和不可信任的公共网)或网络安全域之间的一系列部件的组合。在逻辑上它是一个限制器,也是一个分析器,能有效地监控内部网和Internet之间的活动,保证内部网络的安全。由于硬件技术的进步,基于高速Internet上的新一代防火墙,还将更加注重发挥全网的效能,安全策略会更加明晰化、合理化、规范化。由140家高技术公司、大学和美国政府开发的高速网络Internet2是21世纪互联网的雏形,其主干网之一——Abilene横跨10,000英里,网络速度高达2�4GB/秒。技术的进步将进一步减少时延、提高网络效能。目前,全球连入Internet的计算机中约有1/3是处于防火墙保护之下,而到了下个世纪这个比率会大幅提升。电子商务运作全球化是21世纪的一个特色,由电子钱包(e-WALLET)、电子通道(e-POS)、电子银行(e-BANK)、认证机构(Certificate Authority)组成的网上支付系统将被推广应用。高效、安全的新版本SET协议将承担起保证传输数据的安全重任。SET(Secure Electronic Transaction)即安全电子交易协议,它是由VISA和MASTERCARD所开发,是为了在Internet上进行在线交易时保证用卡支付的安全而设立的一个开放的规范。目前SET11.0版本已经公布并可应用于任何银行支付服务。SET规范得到了IBM、HP、Micro-soft、NetScape、VeriFone、GTE、VeriSign等很多大公司的支持,已形成了事实上的工业标准,并获取了IETF标准的认可。就连大名鼎鼎的微软公司亦宣称将来要将其加入到Windows的核心中。符合SET规范的产品会越来越多,SET必将成为21世纪电子商务的基础。 二、生物识别技术 人类在追寻文档、交易及物品的安全保护的有效性与方便性经历了三个阶段的发展。第一阶段也就是最初的方法,是采用大家早已熟悉的各种机械钥匙。第二阶段是由机械钥匙发展到数字密钥,如登录上网的个人密码(Password)以及使用银行自动提款机所需的身份识别码(PIN-Personal Identification Number)、身份证(ID Cards)或条形码等,它是当今数字化生活中较为流行的一种安全密钥系统。随着21世纪的来临,一种更加便捷、先进的信息安全技术将全球带进了电子商务时代,它就是集光学、传感技术、超声波扫描和计算机技术于一身的第三代身份验证技术——生物识别技术。生物识别技术是依靠人体的身体特征来进行身份验证的一种解决方案,由于人体特征具有不可复制的特性,这一技术的安全系数较传统意义上的身份验证机制有很大的提高。人体的生物特征包括指纹、声音、面孔、视网膜、掌纹、骨架等,而其中指纹凭借其无可比拟的唯一性、稳定性、再生性倍受关注。 20世纪60年代,计算机可以有效地处理图形,人们开始着手研究用计算机来处理指纹,自动指纹识别系统AFIS由此发展开来。AFIS是当今数字生活中一套成功的身份鉴别系统,也是未来生物识别技术的主流之一,它通过外设来获取指纹的数字图像并存贮在计算机系统中,再运用先进的滤波、图像二值化、细化手段对数字图像提取特征,最后使用复杂的匹配算法对指纹特征进行匹配。时下,有关指纹自动识别的研究已进入了成熟的阶段。随着指纹识别产品的不断开发和生产,未来该项技术的应用将进入民用市场,服务大众。到时在ATM提款机加装指纹识别功能,持卡人可以取消密码(避免老人和孩子记忆密码的困难),通过指纹直接操作。除了指纹识别技术外,近年来视网膜识别技术和签名识别技术的研究也取得了骄人的成绩。视网膜识别技术分为两个不同的领域:虹膜识别技术和角膜识别技术。虹膜识别系统使用一台摄像机来捕捉样本,而角膜扫描的进行则是用低密度的红外线去捕捉角膜的独特特征。由于该项技术具有高度的准确性,它将被应用在未来军事安全机构和其他保密机关中。签名识别,也被称为签名力学识别(Danamic Signature Verification——DSV),它是建立在签名时的力度上的,分析笔的移动,例如加速度、压力、方向以及笔划的长度,而非签名的图像本身。签名力学的要害在于区分出不同的签名部分,有些是习惯性的,而另一些在每次签名时都不同,DSV系统能被控制在某种方式上去接受变量,此项技术预计在今后十年中会得到进一步发展和应用。 三、加密及数字签名技术 加密技术的出现为全球电子商务提供了保证,从而使基于Internet上的电子交易系统成为了可能,因此完善的对称加密和非对称加密技术仍是21世纪的主流。对称加密是常规的以口令为基础的技术,加密运算与解密运算使用同样的密钥。 不对称加密,即“公开密钥密码体制”,其中加密密钥不同于解密密钥,加密密钥公之于众,谁都可以用,解密密钥只有解密人自己知道,分别称为“公开密钥”和“秘密密钥”。 目前,广为采用的一种对称加密方式是数据加密标准(DES),DES对64位二进制数据加密,产生64位密文数据,实际密钥长度为56位(有8位用于奇偶校验,解密时的过程和加密时相似,但密钥的顺序正好相反),这个标准由美国国家安全局和国家标准与技术局来治理。DES的成功应用是在银行业中的电子资金转账(EFT)领域中。现在DES也可由硬件实现,AT&T首先用LSI芯片实现了DES的全部工作模式,该产品称为数据加密处理机DEP。另一个系统是国际数据加密算法(IDEA),它比DES的加密性好,而且计算机功能也不需要那么强。在未来,它的应用将被推广到各个领域。IDEA加密标准由PGP(Pretty Good Privacy)系统使用,PGP是一种可以为普通电子邮件用户提供加密、解密方案的安全系统。在PGP系统中,使用IDEA(分组长度128bit)、RSA(用于数字签名、密钥治理)、MD5(用于数据压缩)算法,它不但可以对你的邮件保密以防止非授权者阅读,还能对你的邮件加以数字签名从而使收信人确信邮件是由你发出。 在电脑网络系统中使用的数字签名技术将是未来最通用的个人安全防范技术,其中采用公开密钥算法的数字签名会进一步受到网络建设者的亲睐。这种数字签名的实现过程非常简单:首先,发送者用其秘密密钥对邮件进行加密,建立了一个“数字签名”,然后通过公开的通信途径将签名和邮件一起发给接收者,接收者在收到邮件后使用发送者的另一个密匙——公开密钥对签名进行解密,假如计算的结果相同他就通过了验证。数字签名能够实现对原始邮件不可抵赖性的鉴别。另外,多种类型的专用数字签名方案也将在电子货币、电子商业和其他的网络安全通信中得到应用。 总之,网络安全是一个综合性的课题,涉及技术、治理、使用等许多方面,既包括信息系统本身的安全问题,也有物理的和逻辑的技术措施,一种技术只能解决一方面的问题,而不是万能的。因此只有严格的保密政策、明晰的安全策略以及高素质的网络治理人才才能完好、实时地保证信息的完整性和确证性,为网络提供强大的安全服务——这也是21世纪网络安全领域的迫切需要。
数字图像处理是利用计算机对图像信息进行加工以满足人的视觉心理或者应用需求的行为,应用广泛,多用于测绘学、大气科学、天文学、美图、使图像提高辨识等。这里学术堂为大家整理了一些数字图像处理毕业论文题目,希望对你有用。1、基于模糊分析的图像处理方法及其在无损检测中的应用研究2、数字图像处理与识别系统的开发3、关于数字图像处理在运动目标检测和医学检验中若干应用的研究4、基于ARM和DSP的嵌入式实时图像处理系统设计与研究5、基于图像处理技术的齿轮参数测量研究6、图像处理技术在玻璃缺陷检测中的应用研究7、图像处理技术在机械零件检测系统中的应用8、基于MATLAB的X光图像处理方法9、基于图像处理技术的自动报靶系统研究10、多小波变换及其在数字图像处理中的应用11、基于图像处理的检测系统的研究与设计12、基于DSP的图像处理系统的设计13、医学超声图像处理研究14、基于DSP的视频图像处理系统设计15、基于FPGA的图像处理算法的研究与硬件设计
中国知网也好!万方数据也好都有例子!甚至百度文库都有!==================论文写作方法===========================论文网上没有免费的,与其花人民币,还不如自己写,万一碰到人的,就不上算了。写作论文的简单方法,首先大概确定自己的选题,然后在网上查找几份类似的文章通读一些相关资料,对这方面的内容有个大概的了解!参照你们学校的论文的格式,列出提纲,补充内容!实在不会,把这几份论文综合一下,从每篇论文上复制一部分,组成一篇新的文章!然后把按自己的语言把每一部分换下句式或词,经过换词不换意的办法处理后,网上就查不到了!最后,到万方等地进行检测,将扫红部分进行再次修改!祝你顺利完成论文!
主要是你怎么选择了,大哥帮
你哪一个熟悉就写哪方面的,如果都不熟悉,我建议写图像处理方面的。因为直观,可以写的也比较多,比如车牌识别、人脸识别、指纹识别、目标检测与跟踪。