首页 > 学术论文知识库 > 亚洲研究院论文10篇

亚洲研究院论文10篇

发布时间:

亚洲研究院论文10篇

在谷歌学术搜索中,存有高达4亿篇论文的数据库。论文被引用的数据可以作为证明文章影响力的依据。即使这个方法有局限性,但在更大程度上,反映了当今社会的进展和科学的进步。

1《亚当:一种随机优化方法 》 Adam: A Method for Stochastic Optimization。文章发布于2015年,引用数为47774。

截止2020年为止,这篇文章达到了,人类可知的引用最高数。一篇涉及人工智能的文章获得最高引用,证实了科学界对人工智能的注重。不仅是科学界对人工智能领域有巨大的兴趣,而且欧美国家也正在把人工智能作为未来的主要发展对象。美国把对人工智能的投资提高了一倍,欧盟也把投资提高了百分之70。《亚当:一种随机优化方法 》能够获得最高引用,正说明在未来人工智能上,将展开激烈竞争。无独有偶,跟着这篇文章后面,引用最多的文章多是涉及人工智能。

2《图像识别的深度残差学习》 Deep Residual Learning for Image Recognition 文章发布于2016年,引用数为25256。

深度残差学习的概念出自何凯明等4名中国学生。何凯明来自清华大学物理系,现是脸书人工智能的科学家。从文章的引用数量来看,足以显示,他提出的这个方法对该行业的影响。

3《让R-CNN更快: 朝着带有区域建议网络 的实时目标检测》 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks发表于2015,引用数为19507。

4《深度学习》 Deep Learning, 文章发布于2015年,引用数为16750。

5 《带着缠绕走得更深》 Going deeper with Convolutions, 文章发布于2015年,引用数为14424。

这篇文章已经成为计算机图像处理必读论文之一。

6《通过深层强化学习的人类层面的控制》 Human-Level control through deep reinforcement learning 文章发布于2015年,引用数为10394。

7 《语义分割的完全常规网络》 Fully Conventinal Networks for Semantic segmentation 文章发布于2015年,引用数为10153。

9 《 脓毒症与脓毒症休克第三版国际共识 》 The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3) 文章发布于2016年,引用数为8576。

10《RNA测序和微阵列研究中 Limma 强化差异表达分析》 Limma porwers defferential expression analyses for RNA-sequencing and microarray studies 文章发布于2015年,引用数为8328。

第9和第10篇是前十名论文中,和计算机没有关系的两篇医学论文。这是否意味着,未来对人类社会影响最大的,除了人工智能就是医学了呢?

最后要提到的这篇文章,虽然没有进入第10,但值得一提。 《以深度神经网络和树搜索掌握围棋战略》 Mastering the game of Go with deep neural networks and tree search发布于2016年,引用数为8209。

这篇文章涉及的是伦敦大学学院的教授David Silver, 他领导的AlphaGo团队击败了围棋九段棋手柯洁。人工智能击败了最强大脑,没有什么能比这更能说明人工智能的前途,同时也可能是一个细思极恐的大事件。在机器击败人的时代,人怎么办?

2016年11月14日上午9点,中关村丹棱街5号微软大厦,李开复,张亚勤,沈向洋,洪小文,王坚等中国IT界的技术大佬,以及曾在微软亚洲研究院工作过的近200位院友“同框出现”,宣布“微软亚洲研究院院友会”正式成立:沈向洋担任会长,李开复和张亚勤任名誉会长,他们都是这家研究院曾经的院长。

坦率地讲,夹杂在繁芜的科技资讯信息流之中,这很难称得上是一条惹眼新闻,至少相比上述大佬的同框,几天之后张亚勤和沈向洋出现在乌镇的那一张饭局合影要更为被媒体所追捧。

但科技记者无法忽视的是,多年来,在稿子中描述圈内大佬过往履历时,“微软亚洲研究院”是一个高频词汇。翻看人物图谱,这里是阿里云之父,前金山CEO,百度总裁,小米总裁,海尔CTO, 联想CTO……互联网高管,以及浙江大学、中国科学技术大学、人民大学等国内一线大学计算机/信息技术院系负责人的上一处居心之所;这里和跨国巨头在中国的“办事处”关系不大,它更像是一座拥有18年校龄的“大学”。

中国IT界的黄埔军校,有人喜欢这么说。在院友会成立仪式上,院友代表阿里巴巴CTO王坚感喟:没有人可以绕开这个机构去谈论过去十几年的中国科技史。

一切得从往事谈起。

九八年的召唤

九十年代初——在最不可一世的岁月,来自西雅图的软件巨人却为创新乏力所困。微软前任首席技术官麦尔伏德在1991年建议盖茨成立带有“军备竞赛”属性的创新研究院,进行基础科学研究,以主动迎合技术世界的不确定性。这年,微软首座研究院在雷德蒙成立。

六年之后,麦尔伏德送给了盖茨第二个建议:将研究院开到中国。理由颇为机敏,到1990年代为止,美国一直是这个世界上每年诞生计算机博士最多的地方——直至被中国超越,这被麦尔伏德视作中国IT业态苏醒的前奏。

1998年,微软中国研究院在北京成立。37岁的语音识别专家李开复博士成为首任院长。18年后已成谈资的插曲是:当得知李开复要以“研究院”作为这座机构的后缀时,沈向洋博士大笑,“叫个‘所’都大了”——2001年中国研究院升级为微软亚洲研究院则是后事了。

至少在1998年,沈向洋有充分的理由自嘲。现任院长洪小文后来回忆:“研究院建立前,我到北京参与最初一批员工招募。有些候选人是国内高校博士生,我们只能通过固定电话联络,那时学校里通常一幢宿舍大楼只有一部电话,经常需要麻烦宿管老师或同学帮着叫人来接听。没有几个网站,没有太多信息资源,因而沟通时需要花很多时间同步基础信息,效率比较低。Email倒是能用,但拨号上网资费昂贵又不稳定,实时在线不大可能。”

1998年,每小时8块钱的上网费和4块钱的电话费让上网属于奢侈消费;这一年,配备Windows 95的个人电脑也实属高大上的新锐电器;在更为宏大的叙事里,这一年,中国GDP刚突破万亿美元大关,IT产业所占比重仅约为。

然而同样在1998年,互联网作为社会基础设施迎来破茧之日,一批互联网明日巨星集体相约九八:1998年9月4日,谷歌正式创立;中国则更是普遍把这一年视作商业互联网元年:2月,张朝阳创办搜狐;6月,刘强东成立京东;11月,腾讯诞生;12月,新浪上线。

机遇与挑战在1998年显得尤为冲突——但考虑到成立研究院的愿景,天平似乎更偏向挑战一端。

早在筹备阶段,比尔盖茨和里克·雷斯特博士——微软全球研究院体系的缔造者,就为研究院确立了三条宗旨:推动整个计算机科学前沿技术发展;将最新研究成果快速转化到微软关键产品之中,以帮助用户改善计算体验;着眼于下一代革命性技术研究,助力微软实现长远发展战略和对未来计算的美好构想。

所以你可以想象李开复说服海外精英归国的不易,上述宏愿与当时中国的外部环境格格不入。不过事实美好的一端也成为18年后院友会成立仪式上李开复追忆的画面:“我在卡内基梅隆大学读书时有位同学叫沈为民,写代码非常厉害,我说你是怎么做到的。他说我们在国内都是在纸上写代码,老师则用脑子来运行这个程序。当时给我的感触是,如果能在纸上培养出沈为民这样的人,这样的人才肯定还有很多,一起做研究院一定能做出来。我当时也是抱着这样乐观的心态就回来了。”而中国的人才也是当年比尔盖茨所看重的。

后面的事情令人欣喜,研究院开始在全球顶级学术会议与期刊崭露头角,尤其2002年,他们在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文——长久以来这种国际大会鲜有华人身影。

有人后来回忆,当年前去知春路希格玛大厦(研究院旧址)“朝圣”的年轻人一定会颇为失望,一切看上去与其他企业别无二致,除了目光中的这位“理工男”可能刚在国际期刊发表了一篇重要论文。

人工智能的延续

如今十八年过去,微软亚洲研究院当年的愿景已兑换成国际顶级学术会议与期刊上的4000余篇论文。更重要的是,脱胎于这里的技术也转移到微软产品矩阵中——Office,Windows,Bing,Kinect,以及小冰,Cortana,SkypeTranslator等人工智能产品,都有亚洲研究院的身影。

事实上,在人工智能还是个模糊概念,甚至不被学术界普遍承认的岁月,研究院就已将其视作面向未来的基础研究。1999年研究院成立一周年时即确立了最初的几个研究中心:语音组,多媒体组,图形图像组——如今它们都更像是人工智能概念的一部分。

李开复多年后坦言:中国如今能在人工智能领域扮演重要作用,很大程度上要归功于研究院很早开始便在语音识别,自然语言理解等众多人工智能核心技术进行研究。“中国今天的成就真的应该感谢微软亚洲研究院。”

不过,这种“感谢”对于研究院来说,似乎也意味着成长的烦恼。几年前开始,中国科技公司就积极网罗人工智能领域的精英,可以想象,微软亚洲研究院作为最密集的人才聚集地成为了被挖的目标。

事实上,研究院早已熟悉了人才的流动——这也是成立院友会的原因之一。

十八年前,这个国度最顶尖的技术头脑纷纷从美国的高校和科技企业来到微软;十八年后,技术后辈有了更多良禽择木的可能——聪明的大脑不再浓烈地聚集一地,而是稀释在各个地方。他们有些人继续留下来从事自己最热爱的研究,有些人选择离开去领导更大的团队做产品开发,有些人选择到大学任教,有些人则选择在中国这片创业热土圆梦。

命运自有时。如今研究院的愿景落在了醉心于科研的技术信仰者身上。说来宿命的是,就像某种轮回,当人工智能的概念挥别往日的“扭捏”而摇身蜕变为技术界的狂欢,这里的研究员或许比十八年前的前辈更为幸运。他们赶上了人工智能的黄金年代,可以肆意挥洒禀赋,紧跟这一技术的变迁孕育更多可能,且已收获颇丰。

随意摘取几例。去年底在ImageNet计算机视觉识别挑战赛——这一行业标杆属性的赛事上,微软亚洲研究院视觉计算组凭借深层神经网络技术的突破(使用了一种深度高达百层的神经网络,这要比过往任何成功使用的神经网络层数多5倍以上),获得图像分类,图像定位以及图像检测全部三个主要项目的冠军。几乎同一时刻,他们在另一项图像识别挑战赛MS COCO中的图像检测和图像分割项目上同样登顶——而一年过去,今年10月,他们在MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较去年第一名的成绩也有飞跃进步。

在用户一端,承载技术的是应用——这也是微软亚洲研究院近些年最令人欣喜的地方。

去年,在中国登陆的Skype Translator实时语音翻译技术,就凝聚了研究院在语音识别,自动翻译和机器学习等多领域的成果,让世界上使用人数最多的语言和使用最广泛的语言直接对话成为可能。

而在风靡全球的(识别图片中人物的年龄)、(智能识图网站)等应用,同样基于研究院深耕多年的人脸识别技术。

当然,谈及人工智能应用,刷屏无数的小冰是绕不开的名字。抛开插科打诨不谈,我个人更看重的是它与其他行业的嫁接空间。譬如今年9月,小冰就进驻了“敦煌研究院”微信,摇身变为“敦煌小冰”,言谈之间告知人们关于敦煌的一切知识。嫁接得以实现,一项关键技术是微软亚洲研究院推出的自主知识学习技术(Doc Chat):一种基于检索与排序直接从非结构化文档中选取句子作为聊天机器人回复的方法。这一技术也已运用于今年8月发布的第四代微软小冰跨平台商业解决方案,可让小冰更轻松地学习不同领域知识,完成更多嫁接可能。

尽管换了“标题”和讲述者,但这里与人工智能从十八年前开始诉说的故事仍在继续。

基因传承

故事得以延续的前提是传承,研究为先,自由开放的环境与体系得以让这里相对纯粹的“传帮接带”。

事实上,那些离开的人几乎无一例外地珍视这段纯粹的职业生涯。而当他们追忆微软岁月,“感谢”与“传承”总是并列出现。“在现在的创业路上,研究院的文化氛围也深深的影响着我们的公司文化,感谢研究院,感谢当年指导我们的Mentors,感谢一起实习的小伙伴们。”已在创业的蔡东翔院友这样说道,“希望Mentor文化可以在院友会得到一个很好的传承。”

同样作为院友,清华大学计算机系副教授朱军则将传承细化:“我在研究院实习3年多……现在还清晰记得,第一天面试时问我‘为何读博士?’,这成了我现在面试学生必问的题目。Harry(沈向洋)的‘work hard, play harder’是我记得最清楚的一句话,现在也拿来教育学生。”

传承仍在继续。在不少院友看来,如今,院友会的成立可以发挥桥梁与纽带作用,分享经验与资源,甚至在某些奇特的瞬间感到从未离开过一样。这有点像是管理界颇为盛行的联盟关系,当人们离开一个地方,可以通过“同事联络网”成为这个地方的支持者和外部资源,并将它身上的基因散播到更远处。

好吧,也许正如罗振宇所说:世界上至少有两种游戏,一种是有限游戏,一种是无限游戏。有限游戏以游戏结束为目的,比的是谁能赢;无限游戏则是让游戏本身继续下去,而不是让谁赢,卷入的资源越多,参与的人数越多,游戏就能继续下去,这才是无限游戏的目标,也正是那些“老公司”的价值所在。

在我看来,这也正是微软亚洲研究院——这一席“流动的盛宴”,留给技术世界的真正财富。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

亚洲研究论文10篇

征信市场的研究论文篇三 《我国征信市场的培育与发展》 摘要:自20世纪90年代以来,我国信用市场经过十几年的风风雨雨,已逐步走向成熟,征信体系初见成效,且市场化运作模式基本形成。但由于传统的信用观念影响,政府、银行、企业、个人对征信市场的标准化发展在认识上重视不一,操作上“摸石头过河”,因此,我国的征信供给市场不规范,征信需求市场不成熟,征信体系还不够完善。为推动征信体系快速健康发展,必须对征信供需两大市场进行基础性的培育和规范。 关键词:信用;征信市场;征信体系 我国征信业经过十余年的发展,从无到有,逐渐壮大,虽已形成了一定的规模,但信用中介机构仍然处于步履艰难的窘境。究其根源在于全社会缺乏信用观念与政府缺乏信用法制而伴生的整个市场的征信产品供给与有效需求严重不足。如企业使用信用产品的意识普遍淡薄、社会其他主体大多缺乏利用信用产品来保护经济交往中利益的意识。特别是在结束计划经济体制之后,我们还是习惯于操作政府信用需求,不自觉地导致政府信用需求挤出企业特别是个人的信用需求。其表现就是企业离不开银行贷款、银行个人储蓄居高不下。因此,如何淡化政府信用需求,稳定企业信用需求,启动个人信用需求,从而推动征信机构、征信产品、征信从业人员快速健康发展,就成为建设社会征信体系的一个重要问题。本课题分析了征信供需市场的培育与完善和两大市场的协调与管理问题,以期对我国征信市场的发展与完善提供有限的参考。 一、征信供给市场的培育与完善 (一)我国征信供给市场现状分析 1.征信机构的发展状况。 我国的征信机构包括中国人民银行征信中心和一些私营征信机构。中国人民银行组织商业银行已建成的全国统一的企业和个人信用信息基础数据库,成为我国企业和个人征信体系建设的标志性工程,同时,也是我国征信体系的重要基础设施。它在全国范围内为每一个有经济活动的企业和个人建立了一套全面的、综合的信用档案,连接了所有的商业银行、非银行金融机构和有条件的农村信用社,截至2006年12月,已为460多万户贷款企业和近5亿自然人建立了信用档案。其中4800多万自然人拥有信贷记录,收录的企业和个人贷款余额占全国相应贷款余额的90%左右。 私营征信机构主要是指经征信监督管理部门批准的、专门从事征信业务活动的企业法人,即狭义上的征信机构。目前我国私营征信类公司的总体规模普遍较小,几家规模比较大的征信公司,如新华信商业风险管理有限责任公司、华夏国际企业信用咨询有限公司等,其年营业收入也仅有几千万元的水平。目前我国征信机构的主要特征表现为:信用征集和调查公司正处于探索阶段;资信评估机构发育缓慢;信用担保机构存在较大的风险;资产评估机构公信力度较低。 2.征信产品的供给状况。 从供给的角度来看,资本征信产品、企业征信产品、个人征信产品品种较少、普及率低。 首先,各金融机构之间还没有建立一套统一的信用评级体系,对于同一企业各金融机构内部评级结果差距很大,同一企业在不同金融机构常常具有不同的信用等级,这种评级结果在金融机构之间互不认可,不具有可比性,使得企业的真实信用状况难以准确判断。对相同事物的不同描述造成了征信体系建设中各系统间互联互通困难,对数据加载整合造成了很大障碍,降低了征信系统的数据质量,影响了信用信息的准确性和完整性,使信用报告无法全面和客观反映被征信主体的信用状况,在一定程度上制约了征信产品供给市场的健康快速发展。 其次,人民银行信用信息基础数据库的数据采集普遍单薄。2006年11月人民银行渭南市中心支行对渭南市县级金融征信系统的一份调查显示,目前渭南市信用信息基础数据库的数据只能反映客户在信贷方面的内容,数据的采集也只是与金融部门有信贷业务关系的客户群,因而很难独立成为征信产品。 同时,信用信息基础数据库的数据更新也比较慢,信息的真实性难以核实。在调查中中国人民银行延安市宜川县支行和定西市安定区支行都承认,一些县人民银行仅仅通过年审完成数据库的信息更新,企业提供的信息是否真实、准确无法核实。渭南中心支行的工作人员认为,目前信用信息基础数据库信息质量难以保证,部分信息更新与企业变化脱节,不能及时反映企业财务、资产等情况。如渭南市信用信息基础数据库中企业财务状况的数据一般是在办理贷款卡、发生信贷业务以及每年4至6月贷款卡集中年审时进行登记的,大多数企业每次相隔的年审时间为一年,而企业财务的变化却是频繁的,这使得银行信贷登记咨询系统中的财务数据与企业真实财务状况有较大偏差。 再次,商业性的私营征信机构采集信息在很大程度上受到限制。由于信息公开涉及社会各方面的利益,而目前我国尚没有统一的信息公开的相关法规,征信机构采集信息难度大、成本高,严重阻碍了征信机构业务的开展和产品的普及,国家还没有相关的法规,强制性规定掌握征信数据的各机构和企业必须向社会公开有关征信数据,并严格控制信息公开的种类、传播范围和准确性,以保护消费者的利益。 3.从业人员的管理状况。 征信人员是征信事业的关键,征信报告初级资料的搜集、报告的撰写、公司印象的产生及公司利润的来源均依赖于征信员的认真工作。因此征信机构从业人员素质的优劣自然也会影响征信品质的好坏。 征信工作的本质是以现有的数据探求事物真相,预测未来趋势。技术范围颇为广泛,涵盖会计、统计、经济、货银、企管、国贸、税务、市场、行销、商事法及各行各业的专业知识。征信工作已形成一种专业工作,不仅初入门者需要训练培养,而且随着社会的变迁,科技日益发达,征信技能不断更新,征信从业人员须不断接受新信息,高效完成工作。而我国征信机构从业人员较少,人数最多的公司也仅有几百人,通常为几十人,有的征信公司仅有几个人,而且这些从业人员素质参差不齐,具有本科以上学历的比重不高,具有专业知识的人更少。这严重影响了我国征信业的进一步发展。 (二)我国征信供给市场的发展与完善 1.征信机构的专业化。 我国的征信机构应该以国际性征信机构为标准进行完善。如,益百利(Experian)和艾可飞(Equifax),这两个跨国公司都采用先进的计算机和 网络技术 ,对数据进行集中处理,建立了一个庞大的数据中心并异地备份,数据每月进行更新。两个公司对于信息数据的处理在技术上是自动完成的,以防止人工干预出现错误,防止违法使用个人客户信息。两大公司通过对收集数据的加工处理,为金融机构和零售商有偿提供信用产品及服务,主要是提供信用报告。 同时,利用对数据的深加工,帮助金融机构和零售商更深入地了解客户和开发有利润潜力的客户,进行目标营销;利用其先进的信用评分技术,帮助金融机构和零售商快速处理客户申请、准确决策;利用其人才、技术和管理优势,提供特定服务,向外进行技术扩张。再如,美国的信用局,专门从事个人信用资料的收集、加工整理、量化分析、制作和售后服务,形成了个人信用产品的一条龙服务。我国的征信机构也应该就信用信息的收集、信用产品的开发和管理形成一套科学的体系,即:建立起信用资料的收集和登记、信用数据的加工处理和信用评估、信用产品销售使用的系统工程。 2.征信产品的标准化。 征信标准化建设是征信业高效率发展的平台。征信标准化的目的是促进信用信息跨部门、跨行业共享,规范征信业务活动,推动社会信用体系建设。因此,涉及信用信息采集、使用以及从事征信业务的机构。如涉及企业身份登记及个人身份认证、信贷、企业信用、产品质量、社会保障、公积金、纳税、法院执行、通信缴费、学历等信息的机构以及信用调查、信用评级等征信机构。 2006年11月21日,人民银行发布了包括征信数据元标准在内的5个标准,其中征信数据元标准为系列标准,包括《征信数据元数据元设计与管理》、《征信数据元个人征信数据元》及《征信数据元企业征信数据元》,人民银行2006年11月21日发布的是该系列标准其中的两项。《征信数据元数据元设计与管理》是指导性标准,结合征信业务特点,对征信数据元的基本概念和结构、征信数据元的表示规范以及特定属性的设计规则和方法进行规定,明确了征信数据元的动态维护管理机制,为指导征信机构或其他相关信用信息报送或使用机构编制征信数据元目录提供了统一的方法和指南。《征信数据元个人征信数据元》按照《征信数据元数据元设计与管理》的基本原则和方法,对个人征信市场所涉及的基础性、通用性数据元的定义、计量单位、表示等18个属性进行了统一规定。并且,为发挥征信业标准化建设促进社会信用体系健康发展的作用,人民银行优先开展了信贷市场和银行间债券市场信用评级规范的制定工作。 为进一步实现征信业的国际化、标准化,《征信数据元企业征信数据元》等国际性标准应逐步出台。主要涉及:数据元及代码标准、数据包格式标准、信用数据交换统一接口标准、分布式自治数据库统一检索技术指导标准、分布式应用服务访问指导规范、征信数据交换质量过程管理规范、征信数据安全过程管理指导规范等。另外,鉴于国内可能出现较多地方性征信系统的实际情况,应制定征信系统建设指导白皮书,指导各征信系统的建设,从而保证各系统可以有效地与其他征信系统衔接。 3.从业人员的现代化。 社会各界委托征信机构提供征信资料,主要是希望透过征信机构有经验的专业人才,以其专业知识及作业方法,对企业及个人往来客户经调查分析后,提出评鉴意见,作为信用管理的依据。且专业征信机构因处于第三者立场,对委托征信及被征信公司均无任何利害关系,所搜集到的资料能客观公正地分析,使企业交易更有保障。而信用的探讨、分析与评估判断,则依赖征信工作人员求真、求专之精神、敏锐的警觉性及观察能力,缜密的分析与熟练技术的应用与丰富经验之配合。至于如何巧妙运用,与征信工作人员的素养关系重大。因此,征信工作人员必须接受专业培训且应具有良好的道德修养。 征信人员应该通过职业培训分为初级征信人员与中、高级征信人员。初级征信人员必须达到高级商业学校程度,或大专程度(曾修习会计、商业、工商管理等有关课程者)。目前的征信工作人员必须进行训练,训练的方式,应该除了由征信事业或企业内部的主管对员工集体教育及个别辅导、工作会议研讨、举办企业内部演讲会等的内部训练以外,外部训练也十分必要,包括国内、外院校进修及其他外部训练机构,或选派优秀人员赴先进国家同业考察、研习业务等。 针对初级征信人员,应由专门负责单位编列年度训练计划,适度为员工建立一套完整的职业前程发展计划,定期有系统地培育员工,提高其实务处理能力,以提高人力资源的品质。相对地,针对中、高级征信人员的训练,则以不定期训练为主,可视业务需要随时调整、训练或派赴训练机构训练,增强其对社会关系错综变化的应变能力,提升其经营理念层次。 二、征信需求市场的培育与发展 (一)企业征信需求市场的培育与发展 1.企业征信需求存在的问题。 长期以来,我国政府对推动企业广泛使用信用产品没有足够的引导,更加上经济发展水平对企业征信需求拉动不够,因此,我国企业信用仅在大城市大企业有所发展,相当部分的中小城市及中小企业信用能力还不强,广大农村地区更是无从谈起。根据国外的经验,经济发达程度与征信成熟程度呈正相关关系。即,经济越发达对征信的依赖程度就越大,而征信又反过来促进经济的发展。从国际上看,当人均GDP超过3000美元时,企业信用的巨大潜力才会被发掘出来。2005年我国GDP刚刚超过18亿元,人均1400美元,远远低于该标准线。 另外,企业对征信的作用认知程度较低也是企业征信需求市场得不到较好发展的重要原因。长期以来,我国间接融资几乎垄断了企业的资金融通市场。而四大国有商业银行的风险承担主体是国家,企业贷款靠关系、走后门、凭计划,企业的信用意识缺失。中小企业在银行的贷款比例极低,更是缺乏信用意识。亚洲金融危机以后,银行风险的暴露,金融监管的加强,银行体制的改革,使得企业的信用意识有所加强,但被信用机构征集信用的正确理念并没有树立起来。对征信机构缺乏了解,对征信公司的调查报告将成为企业开拓新客户、提供信用额度的重要衡量指标认识不够。相反,由于一些企业信用程度低,即会把征信报告当作“黑名单”,对征信持消极态度。这也是各国征信业发展的历史足迹。如,上世纪初日本的征信业,企业对于早期的信用调查普遍持警惕、排斥、拒绝态度,其中不乏将调查员拒之门外、侮辱谩骂等行为,表现出社会整体的不信任感。这一局面一直持续到上个世纪七八十年代。而在今天,经过无数次市场洗礼,企业已普遍认同其在经济生活中的作用,将其作为参与经济活动的游戏规则。态度转为谨慎警惕、理解和配合。一些企业甚至希望接受信用调查,以便通过征信公司的信用调查网络,向客户、金融机构展现自身良好的资信状况,开拓潜在客户,获得优惠贷款。而国内企业对自身的信用信息缺乏足够的重视和规范的管理机制。 2.企业征信需求市场的培育。 我国实行市场经济体制以来,各类企业都在大力倡导正确的信用理念,但信用信息规范的管理机制却没有建立起来。企业自身的信用信息规范的管理机制既是企业发展的必要条件,也是建设和完善社会征信体系不可或缺的前提。从西方征信体系完善的国家来看,具有一定规模的企业一般都建立了独立的信用管理部门。企业内部征信制度既能服务于企业赊销业务的发展,也有利于企业信用信息的管理。从而可以充实与完善社会征信体系。这种制度一般要求企业建立相对独立的信用管理机构,制定信用政策,对每一笔赊销业务进行前期、中期、后期管理。 但是,建立企业内部征信制度,首先要有相应的法律支持。我国在有关征信法规制定中要考虑为企业内部征信发展提供法律环境。资料是企业内部征信关键环节。法律应当授予企业方便、快捷地获得赊销对象信用信息的权利,并划定较宽松的资料收集范围;应当允许企业从政府部门、专业征信机构获取其债务人的信息;应规定债务人承担提供虚假信息的责任。 另外,政府应采取积极措施,推动企业内部信用制度建立。针对社会信用意识差,传统观念强的状况,政府应采取试点、树立典型,介绍经验,开动宣传舆论机器,形成良好的社会氛围,促使企业,尤其是大中型企业加快建立起内部征信制度。 (二)个人征信需求市场的培育与发展 1.个人征信需求存在的问题。 第一,我国经济发展水平较低导致个人信用利用程度不高。个人信用消费仅在大中城市有所发展,相当部分的中小城市个人信用消费能力还不强,广大农村地区更是无从谈起。目前,除了东部沿海城市和中、西部部分省会城市经济较发达外,我国大多地区经济水平较落后,尚不具备大范围发展个人信用的经济条件。 第二,政府对个人信用征信的引导与规范不够导致个人征信的有效需求不足。1999-2000年,我国相继颁布了《关于开展个人消费信贷的指导意见》、《个人存款账户实名制的规定》等法规,但这些法规的权威性和可操作性都较差,更没有对较为关键的个人信息的使用和传播进行规范。此外,我国的个人破产制度,社会保障制度,个人财产申报制度,个人账户制度等相关 政策法规 尚未出台,影响了个人征信制度的建立。 第三,传统观念直接影响个人信用征信的有效需求。受传统观念影响,我国居民“量入为出”的消费习惯根深蒂固。尽管在一些大中城市,人们的消费观念正在发生变化,一部分人已突破了“零信用”记录,但大多数人仍然对个人贷款持谨慎态度,而储蓄率却高达39%。并且个人还持有相当数量的国库券、债券、股票等金融资产,这些都是重要的个人信用资源。理论上说,18万多亿元的个人信用资产足以产生巨大的个人信贷需求,促进消费信贷的增长,而当前的实际情况是,我国个人贷款占银行贷款总额的比例约为2%-3%,在个人信贷业务发展较好的上海也仅有10%,远远低于西方发达国家30%的比例。庞大的个人信用资源被长期闲置,很大程度上限制了个人信用征信制度的建设与发展。 第四,个人信用资料不全导致个人征信的有效需求不足。目前我国居民能够提供的个人信用文件主要有居民身份证、户籍证明、人事档案和个人财产证明(如存款凭证、实物财产和其他个人财产证明等)。前三种文件仅能说明个人的自然状况,第四种虽然与经济有关,但它仅提供了某一时点个人存款余额和实物资产情况,并不反映个人收入多少、来源及可靠性,也不反映个人债权、债务状况及守信状况。由于我国尚未建立起个人财产申报制度和个人基本账户制度,个人收支和债权债务没有完整系统的记录,个人信用评价的基础数据资料十分缺乏。另外,在我国,绝大部分地区没有专门的征信机构对个人信用记录进行系统的收集记载,普通居民普遍缺乏自己的个人信用记录。个人信用档案一片空白,个人征信成为“空中楼阁”。 第五,个人信用资料的分割封锁降低了个人征信的有效需求。目前,我国居民的个人信用信息“原材料”,要么掌握在公安、法院、人事、工商、税务、劳动保障等政府相关的部门中,要么掌握在银行、公用事业单位、通信、保险等非政府机构,处于极端分散的状态。同时,这些部门和机构的信用数据档案系统相互封闭,条块分割情况严重,制约了个人征信体系建设的步伐。 2.个人征信需求市场的培育。 首先,发挥政府部门作用,运用市场机制积极引导、推动个人信用信息的建设。当前,我国尚处于经济转型时期,市场经济发育状况和社会信用状况都不是很理想,单独依靠市场的力量来推动个人信用信息建设是行不通的,必须重视和依靠政府支持,发挥政府在制定政策、创造环境和监督管理方面的优势,推动个人信用信息建设的快速发展,提高其有效需求。 其次,营造个人信用信息的法律环境,提高对社会公众隐私权的保护。借鉴美国的《公平信用报告法》等,制定类似的法律,全面保护个人隐私权。该法律应包括以下内容: (1)保护被征信者的知情权,即征信必须取得被征信者同意; (2)合法性,即征信必须符合法定程序,以合法手段取得; (3)客观性和时效性,即信息的收集应以事实为基础,进行客观、公正的描述;被征信者有权消除错误的、过时的信息,保证信息的准确性和时效性; (4)保密性,即信息服务对象必须是根据法定的或约定的事由使用信息资料,不得随意向第三者泄密; (5)对征信中侵害个人隐私的行为进行追究和惩处。 再次,立足全民,培育良好的诚实守信社会风尚。个人信用征信工作是一项社会性的系统工程,需要全民的参与,要做好信用知识普及工作,加强全民道德教育,向社会大众宣传、普及信用知识,要注重个人信用的培育。良好的个人信用是一种经济资源,在欧美一些发达国家,信用已经成为一个人在生活中的“第二身份证”。个人信用的培育重在日积月累。日常生活中将不用的钱及时存入银行、使用银行卡刷卡消费、按时归还贷款、避免信用卡恶意透支、按时交纳各种税费等等,都有利于提高自己的信用评分,有利于个人信用的培育。 为使我国征信市场尽快与国际市场接轨,在大力培育征信供需市场的同时,必须努力解决征信的法律法规问题、征信市场监管问题、行业自律不足问题等,实现征信市场的快速协调发展。 猜你喜欢: 1. 金融诚信论文 2. 关于市场与金融的3000字论文 3. 关于市场经济诚信论文 4. 关于个人信用管理论文

化妆品是国家投资比较少,包袱比较轻,同时又是为国家创造高税利,创造大量就业机会的行业。下面是我为大家整理的化妆品营销研究论文,供大家参考。

[摘 要]本文在对国内化妆品百雀羚公司营销现状进行考察分析的基础上,结合化妆品的产品及营销特征,对百雀羚公司的营销策略提出了改进的对策建议。

[关键词]国产化妆品 百雀羚 营销策略 对策

一、国内化妆品市场现状

1.化妆品概述

根据2007年8月27日国家质检总局公布的《化妆品标识管理规定》,化妆品是指以涂抹、喷洒或者其他类似 方法 ,散布于人体表面的任何部位,如皮肤、毛发、指趾甲、唇齿等,以达到清洁、保养、美容、修饰和改变外观,或者修正人体气味,保持良好状态为目的的化学工业品或精细化工产品。

国内市场上的化妆品基本可分为以下三种形态:一是基础护肤类产品,如:护肤霜、洗面奶等;二是洗涤类产品,如洗衣液、沐浴露等;三是彩妆型产品,如粉底液、腮红、BB霜、睫毛膏和香水等。

2.国内化妆品的消费及市场现状

近年来在中国经济快速发展的情况下,化妆品行业也一直保持着快速增长。2001-2011年,中国化妆品零售规模增长了5倍,成为世界上最大的化妆品消费市场之一,其中外资企业的市场份额增长尤为显著。2009年中国化妆品市场,宝洁以亿销售额、19%占有率位列第一,欧莱雅以亿销售额、占有率名列亚军。雅诗兰黛集团,2009年其在中国市场增长了近30倍,中国已成为其全球增长最快的市场之一。2010年,排名前十的化妆品品牌销售额占整个化妆品市场的38%,其中80%是外资品牌,中国本土品牌只有自然堂和佰草集。

另据数据显示:2011年化妆品行业搜索指数为272万,2011年下半年的搜索指数比上半年上涨近30%。2011年美容护肤相关搜索内容中,产品类相关内容搜索占比最高,关注度达到。由此可以看出,化妆品行业的市场前景是非常乐观的。

3.国内化妆品市场的消费趋势

(1)消费日益理性化

消费者在购买化妆品时,会优先考虑产品的质量,然后再综合平衡性价比。这说明,人们对化妆品的消费将会作出更加理智的选择,产品的功效将成为顾客购买的新引擎。消费者会倾向于选择适合自己皮肤的化妆品,倾向于购买性价比更高的产品。人们不再盲目崇拜各种 广告 ,而是更多地关注产品的质量、功效和性能,同时对化妆品的消费也在向更高的档次迈进。本土化妆品企业若能研发出质量较好的高档化妆品,在性价比上无疑更占优势。

(2)产品需求细分化

产品需求细分化,是近年来我国化妆品消费市场呈现的一个明显的特征。细分化不仅仅是指品牌、品类、品种、功能和功效,它还包含着消费者群体化消费习惯,以及消费者个人的消费习惯个性化的消费趋势。由于消费者永远在寻找更适合自己的化妆品,因此,对产品的深度细分是获取目标客户的最直接手段。

二、化妆品的营销特征

在化妆品行业,产品(Product)质量、功能、款式、品牌、包装;价格(Price)合适的定价;促销(Promotion)尤其是好的广告;分销(Place)建立合适的销售 渠道 ,都是相当重要的营销手段。

1.产品策略方面:化妆品不同于其他消费类产品,仅从其外观和包装上并不能看出化妆品所具有的功能。人们在选择化妆品的时候,更多是基于产品外在包装或者其品牌形象所展现出的吸引力。因此,在不能一眼看出产品的好坏的情况下,化妆品的包装及品牌形象尤为重要。直接影响人们对于品牌的认识和感觉,由此影响人们的态度和购买行为。

2.促销策略方面:化妆品的产品使用效果具有滞后性,由于其不属于即时性消费品,所以产品的效果展现过程比较缓慢。随着人们护肤知识的增长,人们也认识到对于所谓宣传“一洗白"或者“一贴白”等具有明显美白效果的产品,通常是由于其产品里面汞、铅超标所致。因此对于化妆品的功效的过于夸张宣传反而会引起人们的怀疑。由此,一个能直击人心的广告,一个让消费者相信功效、愿意购买商品的广告是化妆品营销中的重要手段。

3.分销策略方面:目前化妆品的主要分销策略是专柜营销。在大商场开设自己品牌的专柜,或是直接开专卖店进行销售。假冒化妆品无孔不入,而且大部分消费者对于是否为正品难以区分。由此看来,专柜和专卖店内的商品是最让消费放心的。

三、上海百雀羚公司及其现有营销策略分析

1.公司简介

上海百雀羚日用化学有限公司(英文缩写:SPDC)是一家集研究、开发、生产、销售服务为一体的具有七十多年历史的化妆品专业生产企业。公司拥有知名品牌如:百雀羚、凤凰、小百羚, 主要生产的大类产品有:护肤用品、洗护发用品、个人清洁用品、花露水和美容化妆用品等优质产品。

目前外资品牌占据着中国化妆品市场主导地位,中高端市场基本被外资合资企业所占据,外资或合资企业所占的市场份额已接近80%,欧莱雅、宝洁、资生堂、雅诗兰黛等几家国际巨头形成了寡头竞争之势。中高档化妆品市场几乎完全被洋品牌独霸,国有品牌的四成市场几乎都是局限于一些低档日化用品。就百雀羚化妆品来说,消费者对其的了解程度较低,甚至只是听说过。虽然这个品牌辉煌过,消费者也占有一定比例,但是这个品牌在市场中占有的份额很少。

目前百雀羚集团在中国的主要竞争对手也是国际名牌化妆品,主要有雅诗兰黛(Este’eLander)、P&G公司的玉兰油(Oil&Ulan)、妮维雅(Nivea)、资生堂(Shiseido),等。除了世界品牌在国内的混战外,百雀羚集团还面临着 其它 国内本土品牌的袭击和进攻。

2.公司的营销现状及其效果

(1)处于细分市场的初步阶段,不管是从产品线的横向还是纵向都有所扩张。但对于化妆品这个特殊的行业,百雀羚企业目前的市场细分和定位还是有欠精确。

(2)广告的代言人为莫文蔚,为品牌增加了时尚感,但其广告的投放力度明显不足,在消费者心中并没有留下很深的印象,并在其宣扬产品特色方面也稍有不足。

(3)伴随着产品品种及包装上的提升,价格有了明显的提升,在国产品牌中处于中上水平。但其在各大商场的占柜率还较低。 (4)产品的品牌主要是百雀羚,企业加大了对产品的研发力度,产品的质量有所提升。经调查发现,目前消费者对于百雀羚的态度存在两种:一是受早期的品牌和价格的影响,对现在价格有所提升,包装有所创新的产品就其质量效果有所怀疑;二是使用过产品的顾客表示,产品不会使其产生不良反应,但具体的效果也就无明显感知。

四、完善百雀羚公司营销策略的对策建议

1.产品策略

(1)要在产品的质量和产品的外在设计以及产品的功能方面体现产品的差异化。要强势研发,提高核心竞争力。在众多国际品牌屡次出现质量危机之时,在大众在崇尚自然之时,上海百雀羚以安全护肤的东方护肤理念,为消费者创造天然温和的优质护肤品,对其来说是一种机遇。

(2)品牌提升策略:特色品牌抢占市场。要改善和提高影响品牌的各项要素,通过各种形式的宣传,提高品牌知名度和美誉度。消费者对于百雀羚产品的了解程度较低,甚至只是听说过虽然这个品牌辉煌过,但现今给人的感觉就是低廉的老产品。因此,首先要消除这一观念。

(3)多品牌策略:多品牌策略是宝洁公司首创的,宝洁公司也是运用多品牌策略成功的典范。多种不同的品牌可吸引更多的消费者,提高市场占有率。百雀羚可根据市场细分,对不同的目标市场采用多品牌策略。

2.价格策略

从百雀羚以往的消费格局来看,消费价格需重新改革,突破低档品牌的格调,百雀羚品牌可首先在国内打响,突破老品牌的低端价格,开拓国内市场,在国内设立专柜,提高档次,提升价格,品牌全面包装革新。

3.促销策略

化妆品促销中最重要的是广告。巴黎欧莱雅、玉兰油、美宝莲等品牌的广告随处可见,而且其宣扬的产品理念已经深入人心。在选择产品代言人方面,也都是具有时尚号召力的明星。同样作为国产品牌的上海相宜本草,无论是其在不同的产品系列上采用不同风格的明星代言,还是广告在各大媒体上的投放力度都是值得被借鉴的。因此,百雀羚可在广告设计上和投放力上加深力度。

4.利用STP营销,细分市场,做到精准定位

先对整个市场进行细分,再选择目标市场,最后确定市场定位。要知道自己的顾客是谁。要把顾客分类,“我要把产品卖给所有人”这是一种错误的营销理念,一定要定位好自己的客户群体。找顾客的需求点、定位产品的卖点。产品的卖点必须是独特的。假如有人向你推销一款化妆品,说可以“包治百病”,那一定是不会有人敢买的。因此,策略行销也要考虑顾客购买时的考虑点:(1) 能否解决我的问题;( 2) 能否带来好处;( 3) 能否创造价值。

参考文献:

[1]王国庆.品牌概念战:中国式营销[M].南京大学出版社,

[2](美)菲利普.科特勒,凯文.莱恩.凯勒.营销管理(第12版)[M].上海人民出版社

[3]严碧华.国产美容护肤品急待重树消费者信心中国联合商报[J].

[4]李勤.论全球化的化妆品包装及品牌营销策略,生产力研究[J].

[5]张建民,张晓冬.本土化妆品的品牌推广策略研究,日用化学品科学[J].

[6]周军.女性化妆品消费心理及营销策略研究,中国集体经济[J].

[7]MarkGodfrey.中国市场 报告 [J].SPCChina,2010(3):8-9.

[8]郭俊.复苏、创新、超越[J].中国化妆品,2010(2):36-47.

[9]王炳东.中国化妆品市场大盘点[J]..中国化妆品,2010(2):60-65

摘要: 化妆品行业是我国自改革开放以来发展比较快的行业,同时又是国家投资比较少,包袱比较轻的行业,也是为国家创造高税利,创造大量就业机会的行业,经过几年的培育和发展,我国已成为亚洲第二大,世界第八大化妆品市场,行业品牌化竞争格局已形成。本文首先分析,中国化妆品市场现状,国内化妆品企业在 市场营销 方面应采取的营销战略。

Abstract: After the reform and opening up, the cosmetics industry in China develops relatively fast; at the same time, its investment is relatively small, and it is high profit and the resource of state revenue and creates substantial employment opportunities. After several years of cultivation and development, China has become the second largest industry in Asia, and the eighth largest cosmetics market in the world. Industry competition pattern has been formed. Firstly, it analyzes the status quo of China's cosmetics market; second, it analyzes the marketing strategy that domestic cosmetics enterprises should take.

关键词: 市场现状;存在问题;策略

Key words: market current situation;problems;strategies

中图分类号: 文献标识码:A 文章 编号:1006-4311(2013)12-0165-02

1 目前我国化妆品市场现状

雅芳是中国国内化妆品品牌发展较好的代表之一,在发展的过程中,我国限制了直销的发展,雅芳果断的决定向渠道营销转型。雅芳经过几年的发展,在全国各地建立了数量众多的品牌专柜和专卖店,这些专柜和专卖店的建设,让雅芳迅速的形成了巨大的销售网络,提升了品牌影响力,这是雅芳多年来一直保持重要市场占有地位的主要原因之一。

欧莱雅先后收购了小护士和羽西,占据了化妆品市场的塔尖位置,使得中国化妆品市场形成了金字塔格局。其实,在一开始,欧莱雅进入中国一直在研究和试探中国市场的未来前景,在2003年的时候开始发力,到2005年,欧莱雅全面的出击中国市场。欧莱雅作为全球化妆品领先牌品,它们在中国的目标就是凭借自身产品的高低中端产品全覆盖,来竞争中国化妆品市场的占有率第一的位置。

保洁公司的优势在于广告优势和品牌优势,以及终端的建设方案和销量。保洁公司在抢夺优势资源的方面做得好,并借此使得自身的竞争对手有所下降,并对其他国内品牌形成了巨大的威力,但是同时我们也要看出,目前保洁对市场的稳固仍然是抱有谨慎的心态的。

化妆品是目前中国最为活跃的日用消费品之一,在最近的几年中,我国化妆品行业的产值每年的增长率都在18%左右。伴随着越来越多的国外知名化妆品品牌进入中国市场,我国化妆品市场的竞争更加激烈,各大化妆品公司在增强自己的竞争实力的同时还需要及时的关注着自身的市场占有率,一旦发现市场变化,就会迅速调整自身的发展战略。根据最近的 市场调查 数据显示,雅芳是我国化妆品市场上使用率最高的品牌,随后是全球化品牌欧莱雅、宝洁、联合利华、资生堂等,而其他的一些品牌和这些品牌仍然有不小的差距。

2 我国化妆品营销存在问题

目前中国广大爱美女性的主要活动之一就是去商场选购化妆品,但是,伴随着近几年来,国际品牌的迅速扩张,在大商场里已经很难能看到国内品牌了,在这些国外品牌的排挤下,国产化妆品的发展前景令人担忧。郁美净集团有限公司外宣传部长李部长这样感概到:“虽然我们的产品在农村地区有一些价格上的优势,但是目前国外的品牌也已经盯上了这块最后的市场。”之后的发展可想而知,激烈的竞争会继续下去。

洋品牌垄断高端 根据权威机构的调查显示,在2007年世界化妆品销售额的国家排名中,中国超过了法国和德国,成为了世界第三大化妆品市场,而且中国还具有着巨大的市场潜力。同时,在化妆品的销售额这项数据中,其中占绝大优势的是中高档商场的化妆品专柜。这些商场专柜的销量不大,但是却占据着整个化妆品销售额的一大部门。目前占国内化妆品企业总数30%左右的外资企业和合资企业,其化妆品的销售量和销售额却分别占国内化妆品销售量的60%和40%左右。

低端市场也将不保 伴随着国外品牌进入中国市场,国内化妆品市场竞争越来越激烈,国产化妆品企业的市场空间越来越小,而且仅仅限于在中低端的市场去竞争。

3 我国化妆品市场营销策略

根据目前我国化妆品业存在的现状,提出了以下战略:

目标营销策略 目标营销主要是针对的特定的消费者群体,通过对这部分消费人员的心理研究,制定出有专门的营销策略。因此,在目标营销的策略中,研究女性的消费心理非常的重要。

首尔大学AI团队论文抄袭被曝,一文抄10篇

首尔大学AI团队论文抄袭被曝,一文抄10篇,据报道,首尔大学涉抄袭论文数量在10篇上下。首尔大学AI团队甚至直接照抄某些句子,一个单词都没有改。首尔大学AI团队论文抄袭被曝,一文抄10篇。

据新浪科技报道,韩国SBS电视台25日消息,韩国顶级学府首尔大学人工智能(AI)研究团队23日在全球顶级学术会议(CVPR)上展示了研究成果,但被发现抄袭并受到各方严厉批评。

韩国国内担心,该丑闻有可能发酵为第二起“黄禹锡事件”。该事件就是2006年韩国克隆之父黄禹锡博士干细胞造假风波,曾被改编为电影《举报者》。

CVPR 2022是人工智能和机器学习领域的全球顶级学术会议,于6月19日至24日在美国路易斯安那州新奥尔良举行。

去年11月,首尔大学研究团队向CVPR提交了一篇学术论文,结果被选为“优秀论文”,本月23日,该成果在与会的全球研究人员面前进行了展示。但第二天开始,舆论便出现首尔大学团队论文抄袭的争议。

视频网站YouTube上的一个视频表示,首尔大学论文中的部分英语表达和公式没有标注引用来源,论文还包含不少与已经发表论文相同的内容。

据报道,首尔大学涉抄袭论文数量在10篇左右。被剽窃的论文包括加州大学伯克利分校2018年发表的一篇论文、加拿大多伦多大学2019年发表的一篇论文,以及韩国科学技术研究院和英国牛津大学2021年发表的论文等。

以多伦多大学的论文为例,首尔大学AI团队甚至直接照抄某些句子,一个单词都没有改变。此外,作为论文核心的公式结构,首尔大学的论文与去年某海外研究团队所发表论文的结构也是一模一样。

据韩国SBS电视台报道,韩国顶级学府首尔大学人工智能(AI)研究团队23日在全球顶级学术会议(CVPR)上展示了研究成果,但被发现抄袭并受到各方严厉批评。

图:首尔大学

据悉,该论文于2021年11月被首尔大学研究团队提交,并被CVPR选为“优秀论文”,而就在6月23日CVPR 2022开幕并展示该成果期间,该论文剽窃现象被揭露。

由于几名涉事作者分别来自首尔大学和韩国科学技术研究院,堪称韩国国内水平最高的学术研究团队。韩国国内担心,该丑闻有可能发酵为第二起“黄禹锡事件”。

CVPR是IEEE下设、人工智能和机器学习领域的全球顶级学术会议。“CVPR 2022”于6月19日至24日在美国路易斯安那州新奥尔良举行。

图:首尔大学AI论文

本届大会第二天开始,舆论便出现首尔大学团队论文抄袭的争议。视频网站YouTube上的一个视频表示,首尔大学论文中的部分英语表达和公式没有标注引用来源,论文中还包含不少与已经发表论文相同的内容。

据报道,首尔大学涉抄袭论文数量在10篇上下。被剽窃的论文包括加州大学伯克利分校2018年发表的一篇论文、多伦多大学在2019年发表的一篇论文,以及韩国科学技术研究院和牛津大学2021年发表的`论文等。

以多伦多大学的论文为例,首尔大学AI团队甚至直接照抄某些句子,一个单词都没有改。此外,作为论文核心的公式结构,首尔大学的论文与去年某海外研究团队所发表论文的结构也是完全一模一样。

图:CVPR回应论文抄袭

随着争议的升级,CVPR方面在社交平台推特上发文,称“抄袭是不可接受的”,已委托世界电气和电子工程师协会对首尔大学的论文进行调查,同时宣布撤回该论文。

有海外学者认为,CVPR未充分核验抄袭论文,造成了动摇口碑的恶劣后果。

随后,涉事论文的第一作者首尔大学在读博士兼研究员金某和其他3名合著者在指控抄袭的YouTube视频下留言,承认论文抄袭。

金某表示:“论文所有的错误都在我身上,我将接受任何惩处,不再寻找借口。”其他研究人员也表示,“虽然论文的主要内容是第一作者所写,但作为合著者未能发觉论文剽窃,对此深感歉意。”

韩国最近曝出了一则丑闻,几乎惊呆了众人!

据环球时报消息,韩国SBS电视台本月25日报道,韩国顶级学府首尔大学人工智能(AI)研究团队23日在全球顶级学术会议(CVPR)上展示了研究成果,但第二日就被发现存在抄袭现象。

据悉,这项学术论文于去年11月份提交,还被评为了“优秀”,6月23日,这项论文在与会的全球研究人员面前进行了展示。

不过好景不长,24日,有舆论称首尔大学的团队论文存在抄袭,其中部分英语表达和公式没有标注引用来源,论文还包含不少与已经发表论文相同的内容。

报道称,首尔大学涉抄袭的论文数量在10篇左右,剽窃的对象包括美国加州大学伯克利分校2018年发表的一篇论文、加拿大多伦多大学2019年发表的一篇论文,以及韩国科学技术研究院和英国牛津大学2021年发表的论文等。

其中最为恶劣的是,抄袭的论文不仅连核心的结构样式没有发生改变,甚至照抄了某些句子,连一个单词都没有改变。

抄袭是件曝光后,CVPR在社交媒体上发文称“抄袭是不可接受的”,已委托世界电气和电子工程师协会对首尔大学的论文进行调查,同时宣布撤回该论文。

微软亚洲研究院论文

刘勃,周荷琴,魏铭旭. 一种基于颜色和运动信息的夜间车辆检测方法. 中国图象图形学报,, , 2005.刘勃,魏明旭,周荷琴. 一种基于区间分布的自适应背景提取算法.模式识别与人工智能, 18(3),2005. (EI)刘勃,魏明旭,周荷琴. 混合交通环境中阴影检测算法. 信号处理,21(2), Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. Modeling and Mining of Users' Capture Intention for Home Videos, Accepted by IEEE Trans. on Multimedia (TMM).MEI Tao, ZHOU He-Qin, FENG Huan-Qing. Unsupervised Mining of Sports Video Structure with Mosaic. Journal of University of Science and Technology of China, , , , Apr. Mei, Xian-Sheng Hua, He-Qin Zhou. Tracking Users' Capture Intention: A Novel Complementary View for Home Video Content Analysis. In Proceedings of ACM International Conference on Multimedia (ACM MM), , Singapore, Nov. Mei, Cai-Zhi Zhu, He-Qin Zhou, Xian-Sheng Hua. Spatio-Temporal Quality Assessment for Home Videos. In Proceedings of ACM International Conference on Multimedia (ACM MM), pp. 439-442, Singapore, Nov. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li, Hong-Jiang Zhang. EFFICIENT VIDEO MOSAICING BASED ON MOTION ANALYSIS. In Proceedings of IEEE International Conference on Image Processing (ICIP), Genoa, Italy, Sep. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. To Mine Capture Intention of Camcorder Users. In Proceedings of SPIE International Conference on Visual Communications and Image Processing (VCIP), pp. 268-275, Beijing, China, Jul. Mei, Yu-Fei Ma, He-Qin Zhou, Wei-Ying Ma, Hong-Jiang Video Mining with Mosaic. In Proceedings of IEEE International Multi-Media Modelling Conference (MMM), pp. 107-104, Melbourne, Australia, Jan. 2005.刘勃,魏明旭,周荷琴. 交通场景中分块阴影检测算法研究.计算机工程.31(11),2005周西汉,刘勃,周荷琴. 一种基于对称差分和背景消减的运动检测方法. 计算机仿真,22(4):117-119,123,2005武海澄,刘正敏,周荷琴. 磁共振成像系统中低阶平板式匀场线圈的设计,中国电机工程学报(EI),25(24), 2005: 154-159刘正敏, 周荷琴, 武海澄. 磁共振成像系统的一种快速涡流补偿方法. 中国医疗器械杂志. 29 (6), 2005: 410-413范欣,周荷琴,陈立群. 针对图象自适应显示的视觉注意力模型. 计算机仿真,22(6):53-56,2005诸葛斌,周荷琴等. 中国数字人数据集断层图象自动配准算法. 中国生物医学工程学报,24(4):443-447, 2005 (EI)诸葛斌,冯焕清,周荷琴,袁非牛. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志22(2):351-354, 2005诸葛斌,周荷琴等. 人体切片数据集颜色的自动校正方法. 航天医学与医学工程,18(3) (EI)诸葛斌,赵聪,周荷琴等. 基于裂隙扫描图象的角膜表面三维重建. 中国生物医学工程学报,24(3):353-356,2005 (EI)郎文辉,冯焕清,周荷琴等. 一种基于HIS的距离联合RGB三维场边缘探测方法. 中国图象图形学报,10(3):301-304, 2005郎文辉,冯焕清,周荷琴等. 基于亮度信息的人体解剖照片集直接成像方法. 中国科学技术大学学报,35(1):88-93, 2005袁非牛,廖光煊,范维澄,周荷琴. 基于光线投射算法的混合场景可视化. 中国图象图形学报,10(7): 2005Guodong Feng, Feng Li, Heqin Zhou, Huanqing Feng. A Mini PACS with High-level Image Postprocessing Function. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Wu,Feiniu Yuan,Heqin Zhou, etc. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Xie, Xin Fan, Wei-Ying Ma, He-Qin Zhou. Adapting Images on Proxies for Small Form Factor Devices, 4th IEEE Pacific-Rim Conference on Multimedia 2004.袁非牛,周荷琴等. 基于多重增量递推合采样点分解的求交算法. 北京生物医学工程,2(1):54-58,2004郎文辉,冯焕清,周荷琴,袁非牛. 使用VHD的可视人成像方法研究. 数据采集与处理, 19(2):135-139,2004诸葛斌,冯焕清,周荷琴. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志,22(2):351-354,2005周西汉,刘勃,周荷琴,袁非牛. 一种基于奔腾SIMD指令的快速背景提取方法. 计算机工程与应用. 40(27):81-83, 2004.刘勃,周荷琴. 基于贝叶斯网络的网络安全评估方法研究. 计算机工程,30(22):111-113,2004. (EI04528745431)Liu Bo,Zhou Xihan,Zhou Heqin. Vehicle Detection and Recognition in Multi-traffic Scenes. (5), .吴小培,冯焕清,周荷琴. 结合小波变换和独立分量分析的脑电特征提取. 仪器仪表学报,25(1),2004Ao Li, Minghui Wang, Dan Xie, Heqin Zhou, Huanqing Feng. A Novel Approach for Protein Subcellular Prediction Using PSI-BLAST and Support Vector Machine. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Xie, Ao Li, Minghui Wang, Heqin Zhou, Huanqing Feng. LOCSVMpsi: A Subcellular Localization Web Server Based on A Novel Method Using Profile-based SVM. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Feiniu, LIAO Guangxuan, FAN weicheng, ZHOU Heqin, FENG Huanqing. High Quality Interactive Volume Rendering Based on 3D Texture Mapping Using OpenGL SL. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. . 2004, Nov., Nagoya, Japan.吴小培,李晓辉,冯焕清,周荷琴.基于盲源分离方法的工频干扰消除,信号处理,2003,19(1),81-84,2003诸葛斌,冯焕清,周荷琴.基于有序体数据的最大密度投影算法.中国科学技术大学学报,33(4):473-479,2003袁非牛,周荷琴等. 基于PC图形卡W-Buffer的交互直接体绘制.中国科学技术大学学报,33(4):480-485,2003袁非牛,诸葛斌,周荷琴,冯焕清.基于SIMD技术和阈值分割方法的快速体绘制算法.中国图形图像学报,8(12):2003诸葛斌,冯焕清,周荷琴. 医学图象体绘制中的快速三线性插值算法.航天医学与医学工程,16(3):206-209,2003袁非牛, 周荷琴等. 虚拟内窥镜系统中的自动导航. 航天医学与医学工程,16(3):201-205,2003Li-Qun Chen, Xing Xie, Xin Fan, Wei-Ying Ma, Hong-jiang Zhang, He-Qin Zhou. A visual attention model for adapting images on small displays, ACM Multimedia Systems Journal, , , p353-364, 2003.(SCI)Xin Fan, Xing Xie, He-Qin Zhou, Wei-Ying Ma. Looking into Video Frames on Small Displays. Proceedings of the 11th ACM international conference on Multimedia, p247-250, Berkeley, CA, USA, . (EI)Xin Fan, Xing Xie, Wei-Yang Ma, Hong-Jiang Zhou, Visual Attention Based Image Browsing on Mobile Devices, Proceedings of IEEE International Conference on Multimedia and Expo. 2003, , p53-56, Baltimore, MD, USA, , , , , : A Slicing Tree Based Web Page Representation for Various Display Sizes. The 12th International World Wide Web Conference(WWW2003), Budapest, HUNGRAY, May , , , , . Image Adaptation Based on Attention Model for Small-form-factor Devices, 9th International Conference on Multimedia Modeling, Taipei, Taiwan, Bin, FENG Huan-qing, ZHOU He-qin. Volume Rendering Based on Sorted Volumetric Data.航天医学与医学工程,16(4):243-247, LIU, Heqin ZHOU. Using Object Classification to Improve Urban Traffic Monitoring System. Proceddings of 2003 International Conference on Neural Networks and Signal Processing(ICNN), , 2003, Nanjing, p1155-1159 (ISTP)诸葛斌,冯焕清,周荷琴等. 基于PC机的医学图像三维表面重建. 航天医学与医学工程 , No 4, Mei, Qinghua Huang, Heqin Zhou, He Zhao and Huanqing Feng. An Improved Multiscale Image Enhancement via Laplacian Pyramid, The 2nd International Conference on Image and Graphics (ICIG), SPIE Vol. 4875, No. 1, pp. 402-410, Hefei, China, Aug. 2002.赵何,周荷琴等. 基于PC机的虚拟内窥镜成像算法. 航天医学与医学工程. , , 2002.黄庆华,周荷琴,冯焕清. 一种快速有效的脉冲噪声滤除方法. 计算机工程与应用. YUAN, Heqin ZHOU, He ZHAO, Huanqing FENG. Sampled points decomposing based ray casting for virtual endoscopy. The 2nd International Conference on Image and Graphics(ICIG), Hefei, MEI, Qinghua HUANG, Heqin ZHOU, He ZHAO and Huanqing FENG. An Improved Multiscale Image Enhancement via Laplacian Pyramid. The 2nd International Conference on Image and Graphics(ICIG), Hefei, .周荷琴,王恒良等. 心室Purkinje纤维传导系统的自动生成算法.北京生物医学工程., He, Zhou He-qin, Feng Huan-qing. Study on Imaging Algorithm of Virtual Endoscope System. Proc. Of 2001 Annual National Conference on Biomedical Electronics, Biomedical Measurement, Biomedical Information & Control, Biomedical Sensor techniques.梅 涛, 周荷琴, 冯焕清. 基于JPEG的多比特医学图像压缩方法. Proceedings of 2001 Annual National Conference on Biomedical Electronics, Measurement Information & Control, Sensor Techniques(CBME), Wuhan, Yonggang, Zhou Heqin, Feng Huanqing, Wang Hengliang. Parallel Algorithm for Calculation of Cell Dipoles in ECG Simulation. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, Hengliang, Zhou Heqin, Feng Huanqing, Guo Yonggang. Error Analysis and Improvement on Simulation Algorithm of Excitation Propagation's Process of Cardiac Electricity. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, 2000.周荷琴,王恒良,郭永刚,黄庆华,赵何等. 微机原理及应用多媒体CAI软件设计.中国科大学报., , 1999.周荷琴,冯雷,郭永刚.用屏蔽珠抑制高频电磁干扰.电子技术应用., , 1999.周荷琴,蔡方辉,王恒良,冯焕清,刘 兵.多参数监护仪的设计.中国医疗器械杂志., , 1999.周荷琴,孙景群,刘兵,冯焕清,江朝晖. 基于68HC05的心电OEM模块设计. 中国科技大学学报. , , 1998.周荷琴,杜克强,冯焕清. 基于OEM模块的自动血压血氧监护仪设计. 中国科技大学学报. , , 1998.获奖情况曾获中国科学院重大科研成果二等奖 3 项,安徽省教学成果二等奖 1 项,安徽省多媒体教学软件一、二等奖各 1 项。在研项目简介磁共振成像系统:控制器研发; 序列的自动参数调整; 3.图像伪影校正; 4.磁体的自动设计及优化.医学图像处理:1.图像压缩与增强; 2.三维重建和虚拟内窥; 3.医学图像存档与通信系统; 4.数字人.智能交通系统:1.基于视频的交通流量检测; 2.基于视频的交通事件检测与识别; 车载导航系统,GIS.与微软亚洲研究院合作项目:1.可扩展网页信息表征模型研究; 2.基于统计学习的事件检测.无线通信:1.基于OFDM的无线通信系统中若干技术研究; 2.低密度奇偶校验码(LDPC)的编解码方法研究;音频编码技术研究; 4.数字广播系统DRM在DSP上的实现.2.周荷琴 女,1955年出生,汉族,中共党员,大学学历,中学高级教师1973年——1996年 常州市二十四中工作1996年——1999年 常州市二十六中工作1999年——常州市实验初中工作2009年——常州外国语学校工作获奖情况及荣誉称号常州市优秀教育工作者江苏省优秀教育工作者常州市物理评优课一等奖江苏省物理评优课二等奖江苏省依法治校先进个人

2016年11月14日上午9点,中关村丹棱街5号微软大厦,李开复,张亚勤,沈向洋,洪小文,王坚等中国IT界的技术大佬,以及曾在微软亚洲研究院工作过的近200位院友“同框出现”,宣布“微软亚洲研究院院友会”正式成立:沈向洋担任会长,李开复和张亚勤任名誉会长,他们都是这家研究院曾经的院长。

坦率地讲,夹杂在繁芜的科技资讯信息流之中,这很难称得上是一条惹眼新闻,至少相比上述大佬的同框,几天之后张亚勤和沈向洋出现在乌镇的那一张饭局合影要更为被媒体所追捧。

但科技记者无法忽视的是,多年来,在稿子中描述圈内大佬过往履历时,“微软亚洲研究院”是一个高频词汇。翻看人物图谱,这里是阿里云之父,前金山CEO,百度总裁,小米总裁,海尔CTO, 联想CTO……互联网高管,以及浙江大学、中国科学技术大学、人民大学等国内一线大学计算机/信息技术院系负责人的上一处居心之所;这里和跨国巨头在中国的“办事处”关系不大,它更像是一座拥有18年校龄的“大学”。

中国IT界的黄埔军校,有人喜欢这么说。在院友会成立仪式上,院友代表阿里巴巴CTO王坚感喟:没有人可以绕开这个机构去谈论过去十几年的中国科技史。

一切得从往事谈起。

九八年的召唤

九十年代初——在最不可一世的岁月,来自西雅图的软件巨人却为创新乏力所困。微软前任首席技术官麦尔伏德在1991年建议盖茨成立带有“军备竞赛”属性的创新研究院,进行基础科学研究,以主动迎合技术世界的不确定性。这年,微软首座研究院在雷德蒙成立。

六年之后,麦尔伏德送给了盖茨第二个建议:将研究院开到中国。理由颇为机敏,到1990年代为止,美国一直是这个世界上每年诞生计算机博士最多的地方——直至被中国超越,这被麦尔伏德视作中国IT业态苏醒的前奏。

1998年,微软中国研究院在北京成立。37岁的语音识别专家李开复博士成为首任院长。18年后已成谈资的插曲是:当得知李开复要以“研究院”作为这座机构的后缀时,沈向洋博士大笑,“叫个‘所’都大了”——2001年中国研究院升级为微软亚洲研究院则是后事了。

至少在1998年,沈向洋有充分的理由自嘲。现任院长洪小文后来回忆:“研究院建立前,我到北京参与最初一批员工招募。有些候选人是国内高校博士生,我们只能通过固定电话联络,那时学校里通常一幢宿舍大楼只有一部电话,经常需要麻烦宿管老师或同学帮着叫人来接听。没有几个网站,没有太多信息资源,因而沟通时需要花很多时间同步基础信息,效率比较低。Email倒是能用,但拨号上网资费昂贵又不稳定,实时在线不大可能。”

1998年,每小时8块钱的上网费和4块钱的电话费让上网属于奢侈消费;这一年,配备Windows 95的个人电脑也实属高大上的新锐电器;在更为宏大的叙事里,这一年,中国GDP刚突破万亿美元大关,IT产业所占比重仅约为。

然而同样在1998年,互联网作为社会基础设施迎来破茧之日,一批互联网明日巨星集体相约九八:1998年9月4日,谷歌正式创立;中国则更是普遍把这一年视作商业互联网元年:2月,张朝阳创办搜狐;6月,刘强东成立京东;11月,腾讯诞生;12月,新浪上线。

机遇与挑战在1998年显得尤为冲突——但考虑到成立研究院的愿景,天平似乎更偏向挑战一端。

早在筹备阶段,比尔盖茨和里克·雷斯特博士——微软全球研究院体系的缔造者,就为研究院确立了三条宗旨:推动整个计算机科学前沿技术发展;将最新研究成果快速转化到微软关键产品之中,以帮助用户改善计算体验;着眼于下一代革命性技术研究,助力微软实现长远发展战略和对未来计算的美好构想。

所以你可以想象李开复说服海外精英归国的不易,上述宏愿与当时中国的外部环境格格不入。不过事实美好的一端也成为18年后院友会成立仪式上李开复追忆的画面:“我在卡内基梅隆大学读书时有位同学叫沈为民,写代码非常厉害,我说你是怎么做到的。他说我们在国内都是在纸上写代码,老师则用脑子来运行这个程序。当时给我的感触是,如果能在纸上培养出沈为民这样的人,这样的人才肯定还有很多,一起做研究院一定能做出来。我当时也是抱着这样乐观的心态就回来了。”而中国的人才也是当年比尔盖茨所看重的。

后面的事情令人欣喜,研究院开始在全球顶级学术会议与期刊崭露头角,尤其2002年,他们在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文——长久以来这种国际大会鲜有华人身影。

有人后来回忆,当年前去知春路希格玛大厦(研究院旧址)“朝圣”的年轻人一定会颇为失望,一切看上去与其他企业别无二致,除了目光中的这位“理工男”可能刚在国际期刊发表了一篇重要论文。

人工智能的延续

如今十八年过去,微软亚洲研究院当年的愿景已兑换成国际顶级学术会议与期刊上的4000余篇论文。更重要的是,脱胎于这里的技术也转移到微软产品矩阵中——Office,Windows,Bing,Kinect,以及小冰,Cortana,SkypeTranslator等人工智能产品,都有亚洲研究院的身影。

事实上,在人工智能还是个模糊概念,甚至不被学术界普遍承认的岁月,研究院就已将其视作面向未来的基础研究。1999年研究院成立一周年时即确立了最初的几个研究中心:语音组,多媒体组,图形图像组——如今它们都更像是人工智能概念的一部分。

李开复多年后坦言:中国如今能在人工智能领域扮演重要作用,很大程度上要归功于研究院很早开始便在语音识别,自然语言理解等众多人工智能核心技术进行研究。“中国今天的成就真的应该感谢微软亚洲研究院。”

不过,这种“感谢”对于研究院来说,似乎也意味着成长的烦恼。几年前开始,中国科技公司就积极网罗人工智能领域的精英,可以想象,微软亚洲研究院作为最密集的人才聚集地成为了被挖的目标。

事实上,研究院早已熟悉了人才的流动——这也是成立院友会的原因之一。

十八年前,这个国度最顶尖的技术头脑纷纷从美国的高校和科技企业来到微软;十八年后,技术后辈有了更多良禽择木的可能——聪明的大脑不再浓烈地聚集一地,而是稀释在各个地方。他们有些人继续留下来从事自己最热爱的研究,有些人选择离开去领导更大的团队做产品开发,有些人选择到大学任教,有些人则选择在中国这片创业热土圆梦。

命运自有时。如今研究院的愿景落在了醉心于科研的技术信仰者身上。说来宿命的是,就像某种轮回,当人工智能的概念挥别往日的“扭捏”而摇身蜕变为技术界的狂欢,这里的研究员或许比十八年前的前辈更为幸运。他们赶上了人工智能的黄金年代,可以肆意挥洒禀赋,紧跟这一技术的变迁孕育更多可能,且已收获颇丰。

随意摘取几例。去年底在ImageNet计算机视觉识别挑战赛——这一行业标杆属性的赛事上,微软亚洲研究院视觉计算组凭借深层神经网络技术的突破(使用了一种深度高达百层的神经网络,这要比过往任何成功使用的神经网络层数多5倍以上),获得图像分类,图像定位以及图像检测全部三个主要项目的冠军。几乎同一时刻,他们在另一项图像识别挑战赛MS COCO中的图像检测和图像分割项目上同样登顶——而一年过去,今年10月,他们在MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较去年第一名的成绩也有飞跃进步。

在用户一端,承载技术的是应用——这也是微软亚洲研究院近些年最令人欣喜的地方。

去年,在中国登陆的Skype Translator实时语音翻译技术,就凝聚了研究院在语音识别,自动翻译和机器学习等多领域的成果,让世界上使用人数最多的语言和使用最广泛的语言直接对话成为可能。

而在风靡全球的(识别图片中人物的年龄)、(智能识图网站)等应用,同样基于研究院深耕多年的人脸识别技术。

当然,谈及人工智能应用,刷屏无数的小冰是绕不开的名字。抛开插科打诨不谈,我个人更看重的是它与其他行业的嫁接空间。譬如今年9月,小冰就进驻了“敦煌研究院”微信,摇身变为“敦煌小冰”,言谈之间告知人们关于敦煌的一切知识。嫁接得以实现,一项关键技术是微软亚洲研究院推出的自主知识学习技术(Doc Chat):一种基于检索与排序直接从非结构化文档中选取句子作为聊天机器人回复的方法。这一技术也已运用于今年8月发布的第四代微软小冰跨平台商业解决方案,可让小冰更轻松地学习不同领域知识,完成更多嫁接可能。

尽管换了“标题”和讲述者,但这里与人工智能从十八年前开始诉说的故事仍在继续。

基因传承

故事得以延续的前提是传承,研究为先,自由开放的环境与体系得以让这里相对纯粹的“传帮接带”。

事实上,那些离开的人几乎无一例外地珍视这段纯粹的职业生涯。而当他们追忆微软岁月,“感谢”与“传承”总是并列出现。“在现在的创业路上,研究院的文化氛围也深深的影响着我们的公司文化,感谢研究院,感谢当年指导我们的Mentors,感谢一起实习的小伙伴们。”已在创业的蔡东翔院友这样说道,“希望Mentor文化可以在院友会得到一个很好的传承。”

同样作为院友,清华大学计算机系副教授朱军则将传承细化:“我在研究院实习3年多……现在还清晰记得,第一天面试时问我‘为何读博士?’,这成了我现在面试学生必问的题目。Harry(沈向洋)的‘work hard, play harder’是我记得最清楚的一句话,现在也拿来教育学生。”

传承仍在继续。在不少院友看来,如今,院友会的成立可以发挥桥梁与纽带作用,分享经验与资源,甚至在某些奇特的瞬间感到从未离开过一样。这有点像是管理界颇为盛行的联盟关系,当人们离开一个地方,可以通过“同事联络网”成为这个地方的支持者和外部资源,并将它身上的基因散播到更远处。

好吧,也许正如罗振宇所说:世界上至少有两种游戏,一种是有限游戏,一种是无限游戏。有限游戏以游戏结束为目的,比的是谁能赢;无限游戏则是让游戏本身继续下去,而不是让谁赢,卷入的资源越多,参与的人数越多,游戏就能继续下去,这才是无限游戏的目标,也正是那些“老公司”的价值所在。

在我看来,这也正是微软亚洲研究院——这一席“流动的盛宴”,留给技术世界的真正财富。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

漏译的原因是什么,如何解决这个问题?这方面有很多工作,下面我就从几个方面去讲一下。我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。左边的例子,S1对应3种不同的翻译,(s1,t1) (s1,t2) (s1, t3 t4),它的熵就比较大。我们把所有对应的翻译统一替换为一个特殊词『stoken4s1』,以降低词语翻译的熵值。右边呢是我们提出来的三种方法,去改善翻译结果,包括pre-training, multitask learning, two-pass decoding。大家有兴趣的话,可以去看论文。从实验结果来看,相比Transformer,在中英翻译质量上有显著提高,高熵值词语的漏译比例显著下降。数据稀疏第二个挑战就是数据稀疏。相比于统计机器翻译,这个问题对神经网络翻译而言,更严重。实验表明,神经网络对于数据量更敏感。针对数据稀疏问题,我们提出了一个多任务学习的多语言翻译模型。在进行多语言翻译的时候,源语言共享编码器,在解码端,不同的语言,使用不同的解码器。这样在源语言端就会共享编码器的信息,从而缓解数据稀疏问题。后来,加拿大蒙特利尔大学、Google等在此方向上陆续开展了多个工作。实验表明,我们的方法收敛更快,翻译质量也明显提高。更多细节,请阅读论文。这篇论文是2018年EMNLP上的best paper,提出了一个统一的框架。A)里面蓝色的点和红色的点分别代表两种不同的语言句子。如何通过两种语言的单语数据构建翻译系统呢?首先我要做一个初始化,B)是初始化。首先构建一个词典,把这两种语言之间的词做一下对齐。C)是语言模型,基于单语数据,可以训练语言模型,用来衡量这个语言的流利度。那么D)是什么? D)是一个称作Back Translation的技术,是目前大家常用的一个用于增强数据的方法。用B)初始化后构建的一个词典,就可以从一种语言翻译为另外一种语言,哪怕是先基于词的翻译。然后,用另外一种语言的语言模型去对译文进行衡量。然后把得分高的句子挑出来,再翻译回去,这一过程称作Back Translation,然后再用原来那种语言的语言模型去衡量这个句子好还是不好。这样一轮一轮的迭代,数据就会变得越来越好,系统翻译质量也会越来越好。引入知识第三个挑战就是引入知识,如何将更多丰富的知识引入翻译模型是机器翻译长期面临的挑战。这个例子中,中文句子中『横流』对应到目标语言端是没有翻译出来的,用一个特殊的记号叫UNK(Unknown Word)来标记。那么我们做一个什么样的工作呢?我们引入了几种知识,第一种就是叫短语表或者叫词表。如果发现『横流』这个词没有被翻译出来,我们就去查这个词典,这个词典就作为一个外部知识被引入进来了。同时,那我们还引入了一个语言模型,语言模型去衡量目标语言的这个句子是不是流畅。同时,我们引入一个长度奖励特征去奖励长句子。因为句子越长,可能漏掉的信息就越少。这个工作首次将统计机器翻译中的特征引入神经网络翻译,可以作为引入知识的一个框架。但是目前来说,引入知识还是比较表层的。知识的引入,还需要更多更深入的工作。比如说这个例子, 这个句子是存在歧义的。『中巴』 在没有给上下文的时候,是无法判断『巴』是哪个国家的简称。但是下面的句子,有一个限定,“金砖框架”。这个时候,人们就知道该如何翻译了。但是,机器能不能知道?大家可以去翻译引擎上去验证。因为人是知道中国跟哪些国家是金砖国家,但是机器没有这个知识。怎么把这个知识交给机器去做,这是一个非常挑战的问题。还有一个挑战,是可解释性:神经网络翻译到底是神还是神经?虽然人们可以设计和调整网络结构,去优化系统,提高质量。但是对于该方法还缺乏深入的理解。也有很多工作去试图研究网络内部工作机理。清华大学有一篇文章从注意力的角度去进行研究。比如左边的例子,出现了一个UNK,那个UNK是怎么产生的,它虽然没有被翻译出来,但是出现在正确的位置,占了一个位置。通过Attention对应关系,可以看到这个UNK对应到『债务国』。右边例子是一个重复翻译的现象。神经网络机器翻译除了经常漏翻译之外,还会经常重复翻译。比如说出现了两个“history”。那么通过这个对应关系我们就可以看到,第6个位置上的“history”是重复出现的,它的出现不仅跟第一个位置“美国人”和第二个位置“历史”相关,还跟第5个位置“the”相关。因为产生了一个定冠词“the”,模型认为这个地方应该出现一个“history”,这篇文章对这样的例子进行了大量的分析,并且给出了一些分析结果和解决方案。如需进一步了解,可以看原始论文。还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。语篇翻译还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。我们的方法输出的结果。可以看到,定冠词、代词的加入提升了句子间的连贯性。我们提出了一个两步解码的方法。在第一轮解码中单独生成每个句子的初步翻译结果,在第二轮解码中利用第一轮翻译的结果进行翻译内容润色,并且提出使用增强式学习模型来奖励模型产生更流畅的译文。这是我们系统输出的一个结果,整体上,流畅度提高了。原文链接:打开CSDN,阅读体验更佳机器翻译技术的瓶颈提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言概述一、机器翻译的瓶颈在哪里?二、是否存在第四代机器翻译?三、自然语言处理的可解释性研究之争四、观众问答环节Q1:如何加入先验知识,引入外部知识或融合专业术语是不是一种途径?Q2:有没有可能现在已经出现了一些能超过 Transformer 的模型,但是这种WMT数据加上 BLEU 值的评测手段不能体现出其优势,未来应该设计怎样的评测手段,从而更好地推动机器翻译的发展?Q3:非常认同张民老师认为「翻译是再创造过程」的观点,其实从规继续访问ACL 2018 | TA-NMT:利用大语种语料,提升小语种神经机器翻译能力编者按:随着神经机器翻译的快速发展,英语、法语等大语种之间的翻译任务已经能够达到良好的翻译效果,而小语种的翻译仍然是一个难题。与大语种丰富的语料数据相比,小语种机器翻译面临的主要挑战是语料的稀疏性问题。为了更好地解决这一问题,微软亚洲研究院自然语言计算组提出了一个呈三角结构的神经机器翻译模...继续访问EMNLP 2019 | 大规模利用单语数据提升神经机器翻译BDTC大会官网:作者 | 吴郦军、夏应策来源 | 微软研究院AI头条(ID:MSRAsia)编者按:目前,目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而,目标语言端的无标注数据一旦使用不当,反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据,微软亚洲研究院在 EMNLP 2019 上发表的论文中,提出一...继续访问腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频本文为 1 月 4 日,腾讯 AI Lab 高级研究员——涂兆鹏在第 22 期 PhD Talk 中的直播分享实录。机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕继续访问干货 | 关于机器翻译,看这一篇就够了作者简介俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。机器翻译技术的发展一直与计算机技术、信息论、语言...继续访问人工神经网络的算法原理,人工神经网络算法实例人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征,为人工智能的研究开辟了新的途径,神经网络具有的优点在于:(1)并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的,往往是分层或以一种有规律的序列排列,信号可以同时到达一批神经元的输入端,这种结构非常适合并行计算。(3)鲁棒性和容错性由于采用大量的神经元及其相互连接,具有联想记忆与联想映射能力,可以增强专家系统的容错能力,人工神经网络中少量的神经元发生失效或错误,不会对系统整体功能带来严重的影响。..继续访问神经翻译笔记5扩展b. 常用的机器翻译技巧文章目录神经翻译笔记5扩展b. 常用的机器翻译技巧组合解码单语数据应用重排序领域适配参考文献 神经翻译笔记5扩展b. 常用的机器翻译技巧 本节介绍提升机器翻译系统效果的常见手段。这些手段有些实际上是深度学习的通用技巧,有些在神经翻译出现后不久就被人提出,经过若干发展沿用至今,有些甚至在统计翻译时代就已出现。无论如何,这些手段独立于模型架构存在,都不仅能够增强模型效果,还展现了顽强的生命力以及良好的通用性 本节参考了Koehn的NMT综述、、三小节的内容,并根据个人喜好作了继续访问从冷战到深度学习,一文看懂机器翻译发展史点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!CSDN编者友情提示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经过一个世纪的努力机器翻译的算法竟得以实现,期间甚至有一半的时间我们都觉察不到这项科技的发展。从搜继续访问机器翻译的局限一、多义性识别上的困难多义性指的是人们交际中所发出的信息在不同的语境下可以表现出多种不同的意义。这是机器翻译要解决的最基本的,也是最难解决的一个问题。如,今天是星期六对丈夫说,可能表示提醒孩子对父母说,可能表示这个孩子想放松,想要出去玩。老板对打工者说,可能表示今天上班算加班。从疲劳过度的学生口中说出来,可能表示今天向睡个懒觉。以上所局还可能有更多的例子,但是单单是这些继续访问神经网络机器翻译技术及应用(上)何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...继续访问论机器翻译之浅薄翻译 | shawn编辑 | 波波、费棋【AI科技大本营导读】尽管机器翻译明显玩不转备受期待的长篇内容,但我们得承认,在快速获知单词含义层面,它确实为人们提供了一定便利。可奇怪的是,无论媒体报道还是行业中都似乎营造了一种机器翻译马上要取代人类译者的气氛,这给了人们一种快要成了的错觉。有人要揭开盲目乐观的面纱,因《哥德尔、埃舍尔、巴赫》一书而获得普利策奖的美国学者侯世达是其中之一。他以自己亲身体继续访问机器翻译技术现状评述与展望 | 行业观察今天,你AI了没?关注:决策智能与机器学习,每天学点AI干货正文共:2497字7图预计阅读时间:7分

亚洲研究院精选论文

院长 洪小文博士洪小文博士现任微软亚洲研究院院长,负责研究院在互联网搜索、数据挖掘、语音技术,及自然语言处理技术、系统、无线与网络、平台器件以及媒体通信等领域的研究管理工作。洪博士同时还负责搜索技术中心(STC)及MSN/Live在中国搜索产品的开发。来到中国之前,洪博士曾担任微软公司自然互动服务部门的架构师,在架构和技术层面上对微软语音服务器、自然用户界面平台和微软支持平台等诸多获奖产品的开发做出了突出的贡献。洪博士1995年加入微软总部任高级研究员。此前,洪博士曾任苹果公司的Apple-ISS研究中心的技术总监,带领其团队研发出苹果中文听写机产品并获得多项工业界大奖。洪小文博士是美国电机电子工程师学会院士(IEEEFellow)和《Communication of the ACM》期刊的编委,在多种国际著名学术刊物及大会上发表过100多篇的学术论文。洪博士毕业于台湾大学,获得电机工程学士学位,之后继续深造于卡内基梅隆大学,并先后获得计算机科学硕士及博士学位。常务副院长 马维英博士作为微软亚洲研究院的常务副院长,马维英博士负责带领研究团队从事互联网搜索和数据挖掘、自然语言计算以及人机交互等领域的研究工作。过去几年里,马维英博士的研究团队已经有大量的核心技术转化进微软搜索和在线服务产品中。他的团队还在国际重要学术会议和期刊上发表了许多高水平论文,包括国际信息检索大会(SIGIR)、国际互联网大会(WWW)和国际多媒体大会(ACM Multimedia)等。在马博士的带领下,他的团队在互联网搜索和数据挖掘以及多媒体信息检索等研究领域的突出成就得到国际学术界的广泛认可。在2001年加入微软亚洲研究院之前,马维英博士从1997年开始一直在美国加州的惠普实验室工作,从事多媒体自适应传输和移动因特网的分布式多媒体服务系统的研究。从1994年到1997年攻读博士学位期间,马维英博士参与了加州大学圣芭芭拉分校的Alexandria数字图书馆(Alexandria Digital Library)项目,在此过程中,他开发的互联网图像检索系统Netra被其他研究人员广泛引用,并且被认为是最具代表性的图像检索系统之一。马维英博士是ACM信息系统学刊(TOIS)和ACM/Springer多媒体系统学报的编委。同时,他是第17届国际互联网大会(WWW)的程序委员会联合主席,2007环太平洋多媒体大会(PCM)的程序委员会主席,2008亚洲信息检索研讨会(AIRS)联合主席。马维英博士曾经担任过2005国际多媒体建模大会 (MMM) 、2005国际图像和视频检索大会 (CIVR) 的联合主席。另外,他还参与组织其他许多国际重要会议并担任程序委员会成员,比如ACM Multimedia, SIGIR, CIKM, KDD, 和WWW等学术大会。迄今为止,马维英博士已经在互联网搜索、信息检索、基于内容的图像检索、数据挖掘、自适应内容传输和移动访问等领域发表了250余篇论文。马维英博士于1990年本科毕业于台湾清华大学电气工程系,之后于1994年和1997年分别获得美国加州大学圣芭芭拉分校(UCSB)电气和计算机工程系硕士和博士学位。常务副院长 郭百宁博士郭百宁博士现为微软亚洲研究院副院长,主要从事网络图形学技术、基于网络应用的虚拟环境技术、几何模型、基于图像的模型和绘制、纹理合成、真实感图形图像技术等领域的研究。郭百宁博士是美国电气电子工程师协会视觉及计算机图形学会刊的副主编。他曾经担任过国际程序委员会的委员,参加过多届国际图形学大会,包括美国计算机学会举办的国际计算机图形学大会(ACM SIGGRAPH),美国电气电子工程师协会举办的国际计算机可视化大会(IEEE Visualization),欧洲计算机绘制技术大会(Eurographics Symposium on Rendering),亚太计算机图形学大会(Pacific Graphics),美国计算机学会举办的虚拟现实软件与技术大会(ACM Symposium on Virtual Reality Software and Technology),美国计算机学会举办的固体与物理建模大会(ACM Symposium on Solid and Physical Modeling)。郭博士在国际著名杂志和学术会议上发表了七十多篇学术论文并拥有四十多项技术专利。郭百宁博士于1999年加盟微软中国研究院(亚洲研究院前身)。此前他是美国英特尔公司硅谷总部研究院的资深研究员,负责下一代图形系统的研究。郭百宁博士在美国康乃尔大学获得硕士和博士学位,在北京大学获得学士学位。常务副院长 赵峰博士赵峰博士,微软亚洲研究院常务副院长,主要负责机算机系统、无线与网络、硬件计算、软件分析等领域的研究工作。在加入微软亚洲研究院之前,赵博士是微软总部雷德蒙研究院的首席研究员,负责网络嵌入式计算组。他领导开发了微软研究院传感器尘粒、微型网络服务、SenseWeb和SensorMap、数据中心基因组、焦耳计量器以及GAMPS数据压缩。 借助多项赵博士研发的技术,如今的微软数据中心被誉为全球仪表化与监控最为密集的云计算基础架构。赵博士是美国电机电子工程师学会院士(IEEE Fellow),《美国计算机学会传感网络汇刊》(ACM Transactions on Sensor Networks)的创刊总编辑,并且撰写或合作撰写了超过100篇技术论文和书籍,其中包括摩根考夫曼出版的《无线传感器网络:信息处理方法》(与Leo Guibas合著)。赵博士获得过许多奖项,其中包括美国斯隆研究奖(Sloan Research Fellow), 美国国家科学基金青年研究奖(US National Science Foundation (NSF) Young Investigator Award )与美国海军研究局青年研究奖(Office of Naval Research (ONR) Young Investigator Award)。他的研究曾被BBC国际频道,商业周刊及科技评论等著名新闻媒体报道。赵博士毕业于上海交通大学,并在美国麻省理工学院(MIT) 获得电机工程与计算机科学博士学位。在加入微软之前赵博士曾在位于硅谷的施乐帕洛阿尔托研究中心(Xerox Palo Alto Research Center) 担任首席科学家工作,领导该中心的传感器网络研究,并任教于美国俄亥俄州立大学和斯坦福大学。技术战略总监 张益肇博士张益肇博士于1999年7月加盟微软亚洲研究院,从事语音方面的研究工作。 现任微软亚洲研究院资深技术战略总监,负责研究项目沟通,知识产权资产管理,新的研究课题管理。履任微软亚洲研究院新职位之前,张博士任微软亚洲工程院副院长,是2003年工程院的创建者之一。在工程院,他带领团队开发Windows Mobile和Windows的产品,并建立起一支多学科技术产品孵化的团队。在加入工程院之前,张博士曾担任研究院语音组主任研究员和高校关系总监,他的团队成功的把汉语普通话语音识别引擎转化到了中文版Office和Windows中。他曾是Nuance Communications公司研究部的创始人之一,该公司是电信领域自然语言界面研究的先驱。在Nuance工作期间,他曾从事自信度分析,声学建模,语音检测等领域的研究工作。他领导研究人员开发了 Nuance产品的日文版本,这是世界上第一个开放式日语语音识别系统。他还曾在麻省理工的林肯实验室开发出了新的语音识别算法,在东芝 ULSI 研究中心发明了一种新的电路优化技术,在通用电气公司的研发中心开展了模式识别方面的研究。张博士毕业于麻省理工学院,获电气工程和计算机科学学士、硕士和博士学位。他在国际著名的杂志和学术会议上发表了多篇关于语音技术和机器学习方面的论文,是多项专利的拥有者。副院长 李世鹏博士李世鹏博士于1999年5月加入微软亚洲研究院,现任副院长、首席研究员及多媒体计算组主任研究员。李博士同时负责协调微软亚洲研究院多媒体领域的研究工作。他的研究兴趣为信号与图像处理、媒体内容分析、图像与视频编码、高清电视技术、多媒体在无线与网络上的通信与在线播放技术、可伸缩媒体编码技术、应用层网络技术、数字版权管理、无线通信与网络、P2P网络技术、新媒体格式及系统、多媒体广告技术、数字医疗及用户意向挖掘等等。从1996年10月至1999年5月,李博士在美国Sarnoff公司(前身为David Sarnoff研究中心及RCA实验室)多媒体技术实验室任研究员。李博士致力于广泛的多媒体领域的研究工作。他对MPEG-4和国际标准里图像和视频编码技术作出重大贡献。1998年他发明和研制了世界上第一个高质量低成本的高清电视解码器。早在2000年他就在微软亚洲研究院发起了P2P传输流媒体的研究工作。他带领他的团队在2001年率先成功地研发了横跨太平洋的基于可伸缩视频编码的流媒体系统原型。他是可伸缩编码的倡导者并对国际标准里的可伸缩扩展标准的制定起了巨大的推进作用。他于2006年首先提出5“D”的多媒体概念,对新一代互联网多媒体的研究和发展指出了方向。他在图象/视频处理、压缩和通信、数字电视、多媒体及无线通信领域写作和合著超过200多篇国际学术论文,还拥有60多项被批准的和90多项正在被批准的相关美国专利。他合著了Marcel Dekker出版的专著《多媒体系统、标准和网络》(2000)、Wiley & Sons出版的《Wiley通信大百科全书》(2003)、Academic Press出版的《IP与无线网络中的多媒体》(2005)中的有关多媒体编码的章节。他合编了SPIE出版的《视觉通信及图像处理专刊》(2005)以及Springer出版的《计算机科学讲座:多媒体信息处理进展》(2008)。李博士是IEEE电路和系统协会视频信号处理和通信委员会秘书长、多媒体系统与应用委员会会员,IEEE通信协会多媒体通信委员会委员,IEEE信号处理协会多媒体信号处理委员会历任委员。他现任《IEEE视频技术的电路与系统》期刊及《视频通信和图像表达》期刊的副主编。他担任过IEEE PCM2000特殊程序主席、IEEE PCM2001会务主席、VCIP2005程序主席、Packet Video 2006大会主席、ICME 2006领域主席、IEEE ISM 2006宣传主席、IEEE PSIVT 2006主题主席、IEEE SiPS 2007评奖主席、IEEE ICME 2007特殊程序主席、PCM 2008的程序主席、及ISCAS 2009领域主席。他还担任着VCIP 2010和CIVR 2010的大会主席。李博士同时还在几十个国际多媒体大会上担任过技术委员会委员。李博士是山东大学、四川大学、华中科技大学、上海交通大学、香港中文大学、南开大学和天津大学的客座教授,同时也是中国科学技术大学和上海交通大学的兼职博导。李博士于1988和1991分别获得中国科学技术大学无线电系学士和硕士学位。他于1996年获得美国宾州Lehigh大学的电机系博士学位。他曾于1991至1992在中国科学技术大学无线电系任助教。李博士是中国科学技术大学历史上至今唯一的一个两次(1987、1991)郭沫若奖学金的获得者。他也是第一个同年获得两次Sarnoff成就奖的研究员 (1997)。李博士曾获得VCIP 2007最佳论文奖、MMSP 2008最佳论文奖(海报)、以及《IEEE视频技术的电路与系统》期刊(2009)最佳论文奖。他指导的学生获得了VCIP 2005最佳学生论文奖。在微软亚洲研究院的十年中,李博士培养了三位MIT TR35奖(世界上35岁以下的最有潜力的35位创新者)的获得者。副院长 张峥博士张峥博士于2002年加入微软亚洲研究院多媒体组,任项目负责人。张峥博士是微软亚洲研究院副院长兼首席研究员,负责系统和网络研究领域(含系统研究组和无线和网络研究组)。张峥博士曾任多个国际会议技术委员会委员,包括IPTPS, ICDCS, WWW, USENIX MobiSys,USENIX ATC等。张峥博士1984年就读于复旦大学电子工程系;1987年作为复旦大学首批本科跳级的13名学生之一进入研究生课程;1990年赴美国德州大学达拉斯分校留学;1992年获硕士学位后,于1993年春转至伊利诺思香槟分校求学(UIUC),并于1996年秋获得博士学位。 此后,张峥博士一直在惠普中央实验室工作,其研究领域涉及高性能超级计算机系统结构和大规模分布式系统, 有多项成果在国际相关会议发表,取得专利,并成功转移到产品中。张峥博士也是网络杂志《新语丝》和 《 国风》的创办人之一,以“竹人”为笔名主持编辑《海外留学生年度诗选》首二卷,并曾在 《国风》主持 《艺廊》及 《半瓶诗铺》专栏。副院长 宋罗兰宋罗兰于1994年加入美国微软任系统工程师,之后前往东京负责微软在中国、日本、韩国、台湾、香港等国家及地区的商业应用系统开发,包括销售、市场、客户支持、人事以及行政。她成功管理过多个关键项目并积累了丰富的技术管理经验。她建立了一个全新的亚洲区IT团队:从招聘人才,制定战略计划,到管理几百万美金的运作资金。因为出色的工作,宋罗兰被提升为高级地区IT经理,负责亚洲12个子公司的业务。1999年宋罗兰回到美国总部担任高级项目经理,负责系统设计、开发、测试以及公司网站的后台主要系统运作支持。其后,她作为高级商务经理,开发全球技术社区,并与亚洲、欧洲、非洲、以及拉美的团队一起将“MVP”(最有价值的专家)推广到全球,使之成为全球技术社区最成功的项目之一。经过19年的海外生活,宋罗兰于2004年8月回到北京出任微软亚洲研究院高校关系部总监,负责整个亚洲地区的高校关系。她以极大的热情投入到新的工作中,并希望她的热情与经验能够帮助年轻一代挖掘并能完全发挥他们的潜质。

高文斐和宋犀堃都是非常优秀的回话技术专家,他们在自然语言处理和方面都有深厚的研究和实践经验。因此,无法一概而论哪一个更好。高文斐毕业于清华大学,曾担任微软亚洲研究院研究员,是对话系统领域的专家。他参与主持了多个国家级重点项目,发表了多篇高质量论文。高文斐在对话生成、对话情感分析以及机器翻译等领域均取得了非常显著的成果。宋犀堃毕业于上海交通大学和美国加州大学圣塔芭芭拉分校,目前是谷歌的研究员。他的研究涵盖了自然语言处理和多个领域,在对话系统方面也有着很深的研究。宋犀堃的研究成果广泛应用于谷歌搜索、谷歌助手、YouTube 和 Android 等产品中。总之,无论是高文斐还是宋犀堃,都是对话技术领域的杰出代表,他们的研究成果对于智能客服、智能语音助手等应用都具有非常重要的意义。

尊敬的用户,关于回话技术的比较,我认为高文斐和宋犀堃都是非常优秀的回话技术专家。高文斐擅长的是情感化的回话技巧,能够通过语言和表情传递出温暖和关怀,让用户感到被理解和被关注。而宋犀堃则擅长的是逻辑化的回话技巧,能够通过合理的论述和分析,解决用户的问题并给出有效的建议。不过,我认为回话技术的好坏并不只是看个人的专业能力,更重要的是要看是否能够真正地关注用户的需求和感受,以及是否能够真正地解决用户的问题。因此,无论是高文斐还是宋犀堃,只要能够真正地关注用户,解决用户的问题,就是优秀的回话技术专家。最后,我想说的是,回话技术是一项需要不断学习和提高的技能,只有不断地学习和实践,才能够成为真正优秀的回话技术专家。

刘勃,周荷琴,魏铭旭. 一种基于颜色和运动信息的夜间车辆检测方法. 中国图象图形学报,, , 2005.刘勃,魏明旭,周荷琴. 一种基于区间分布的自适应背景提取算法.模式识别与人工智能, 18(3),2005. (EI)刘勃,魏明旭,周荷琴. 混合交通环境中阴影检测算法. 信号处理,21(2), Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. Modeling and Mining of Users' Capture Intention for Home Videos, Accepted by IEEE Trans. on Multimedia (TMM).MEI Tao, ZHOU He-Qin, FENG Huan-Qing. Unsupervised Mining of Sports Video Structure with Mosaic. Journal of University of Science and Technology of China, , , , Apr. Mei, Xian-Sheng Hua, He-Qin Zhou. Tracking Users' Capture Intention: A Novel Complementary View for Home Video Content Analysis. In Proceedings of ACM International Conference on Multimedia (ACM MM), , Singapore, Nov. Mei, Cai-Zhi Zhu, He-Qin Zhou, Xian-Sheng Hua. Spatio-Temporal Quality Assessment for Home Videos. In Proceedings of ACM International Conference on Multimedia (ACM MM), pp. 439-442, Singapore, Nov. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li, Hong-Jiang Zhang. EFFICIENT VIDEO MOSAICING BASED ON MOTION ANALYSIS. In Proceedings of IEEE International Conference on Image Processing (ICIP), Genoa, Italy, Sep. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. To Mine Capture Intention of Camcorder Users. In Proceedings of SPIE International Conference on Visual Communications and Image Processing (VCIP), pp. 268-275, Beijing, China, Jul. Mei, Yu-Fei Ma, He-Qin Zhou, Wei-Ying Ma, Hong-Jiang Video Mining with Mosaic. In Proceedings of IEEE International Multi-Media Modelling Conference (MMM), pp. 107-104, Melbourne, Australia, Jan. 2005.刘勃,魏明旭,周荷琴. 交通场景中分块阴影检测算法研究.计算机工程.31(11),2005周西汉,刘勃,周荷琴. 一种基于对称差分和背景消减的运动检测方法. 计算机仿真,22(4):117-119,123,2005武海澄,刘正敏,周荷琴. 磁共振成像系统中低阶平板式匀场线圈的设计,中国电机工程学报(EI),25(24), 2005: 154-159刘正敏, 周荷琴, 武海澄. 磁共振成像系统的一种快速涡流补偿方法. 中国医疗器械杂志. 29 (6), 2005: 410-413范欣,周荷琴,陈立群. 针对图象自适应显示的视觉注意力模型. 计算机仿真,22(6):53-56,2005诸葛斌,周荷琴等. 中国数字人数据集断层图象自动配准算法. 中国生物医学工程学报,24(4):443-447, 2005 (EI)诸葛斌,冯焕清,周荷琴,袁非牛. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志22(2):351-354, 2005诸葛斌,周荷琴等. 人体切片数据集颜色的自动校正方法. 航天医学与医学工程,18(3) (EI)诸葛斌,赵聪,周荷琴等. 基于裂隙扫描图象的角膜表面三维重建. 中国生物医学工程学报,24(3):353-356,2005 (EI)郎文辉,冯焕清,周荷琴等. 一种基于HIS的距离联合RGB三维场边缘探测方法. 中国图象图形学报,10(3):301-304, 2005郎文辉,冯焕清,周荷琴等. 基于亮度信息的人体解剖照片集直接成像方法. 中国科学技术大学学报,35(1):88-93, 2005袁非牛,廖光煊,范维澄,周荷琴. 基于光线投射算法的混合场景可视化. 中国图象图形学报,10(7): 2005Guodong Feng, Feng Li, Heqin Zhou, Huanqing Feng. A Mini PACS with High-level Image Postprocessing Function. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Wu,Feiniu Yuan,Heqin Zhou, etc. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Xie, Xin Fan, Wei-Ying Ma, He-Qin Zhou. Adapting Images on Proxies for Small Form Factor Devices, 4th IEEE Pacific-Rim Conference on Multimedia 2004.袁非牛,周荷琴等. 基于多重增量递推合采样点分解的求交算法. 北京生物医学工程,2(1):54-58,2004郎文辉,冯焕清,周荷琴,袁非牛. 使用VHD的可视人成像方法研究. 数据采集与处理, 19(2):135-139,2004诸葛斌,冯焕清,周荷琴. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志,22(2):351-354,2005周西汉,刘勃,周荷琴,袁非牛. 一种基于奔腾SIMD指令的快速背景提取方法. 计算机工程与应用. 40(27):81-83, 2004.刘勃,周荷琴. 基于贝叶斯网络的网络安全评估方法研究. 计算机工程,30(22):111-113,2004. (EI04528745431)Liu Bo,Zhou Xihan,Zhou Heqin. Vehicle Detection and Recognition in Multi-traffic Scenes. (5), .吴小培,冯焕清,周荷琴. 结合小波变换和独立分量分析的脑电特征提取. 仪器仪表学报,25(1),2004Ao Li, Minghui Wang, Dan Xie, Heqin Zhou, Huanqing Feng. A Novel Approach for Protein Subcellular Prediction Using PSI-BLAST and Support Vector Machine. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Xie, Ao Li, Minghui Wang, Heqin Zhou, Huanqing Feng. LOCSVMpsi: A Subcellular Localization Web Server Based on A Novel Method Using Profile-based SVM. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Feiniu, LIAO Guangxuan, FAN weicheng, ZHOU Heqin, FENG Huanqing. High Quality Interactive Volume Rendering Based on 3D Texture Mapping Using OpenGL SL. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. . 2004, Nov., Nagoya, Japan.吴小培,李晓辉,冯焕清,周荷琴.基于盲源分离方法的工频干扰消除,信号处理,2003,19(1),81-84,2003诸葛斌,冯焕清,周荷琴.基于有序体数据的最大密度投影算法.中国科学技术大学学报,33(4):473-479,2003袁非牛,周荷琴等. 基于PC图形卡W-Buffer的交互直接体绘制.中国科学技术大学学报,33(4):480-485,2003袁非牛,诸葛斌,周荷琴,冯焕清.基于SIMD技术和阈值分割方法的快速体绘制算法.中国图形图像学报,8(12):2003诸葛斌,冯焕清,周荷琴. 医学图象体绘制中的快速三线性插值算法.航天医学与医学工程,16(3):206-209,2003袁非牛, 周荷琴等. 虚拟内窥镜系统中的自动导航. 航天医学与医学工程,16(3):201-205,2003Li-Qun Chen, Xing Xie, Xin Fan, Wei-Ying Ma, Hong-jiang Zhang, He-Qin Zhou. A visual attention model for adapting images on small displays, ACM Multimedia Systems Journal, , , p353-364, 2003.(SCI)Xin Fan, Xing Xie, He-Qin Zhou, Wei-Ying Ma. Looking into Video Frames on Small Displays. Proceedings of the 11th ACM international conference on Multimedia, p247-250, Berkeley, CA, USA, . (EI)Xin Fan, Xing Xie, Wei-Yang Ma, Hong-Jiang Zhou, Visual Attention Based Image Browsing on Mobile Devices, Proceedings of IEEE International Conference on Multimedia and Expo. 2003, , p53-56, Baltimore, MD, USA, , , , , : A Slicing Tree Based Web Page Representation for Various Display Sizes. The 12th International World Wide Web Conference(WWW2003), Budapest, HUNGRAY, May , , , , . Image Adaptation Based on Attention Model for Small-form-factor Devices, 9th International Conference on Multimedia Modeling, Taipei, Taiwan, Bin, FENG Huan-qing, ZHOU He-qin. Volume Rendering Based on Sorted Volumetric Data.航天医学与医学工程,16(4):243-247, LIU, Heqin ZHOU. Using Object Classification to Improve Urban Traffic Monitoring System. Proceddings of 2003 International Conference on Neural Networks and Signal Processing(ICNN), , 2003, Nanjing, p1155-1159 (ISTP)诸葛斌,冯焕清,周荷琴等. 基于PC机的医学图像三维表面重建. 航天医学与医学工程 , No 4, Mei, Qinghua Huang, Heqin Zhou, He Zhao and Huanqing Feng. An Improved Multiscale Image Enhancement via Laplacian Pyramid, The 2nd International Conference on Image and Graphics (ICIG), SPIE Vol. 4875, No. 1, pp. 402-410, Hefei, China, Aug. 2002.赵何,周荷琴等. 基于PC机的虚拟内窥镜成像算法. 航天医学与医学工程. , , 2002.黄庆华,周荷琴,冯焕清. 一种快速有效的脉冲噪声滤除方法. 计算机工程与应用. YUAN, Heqin ZHOU, He ZHAO, Huanqing FENG. Sampled points decomposing based ray casting for virtual endoscopy. The 2nd International Conference on Image and Graphics(ICIG), Hefei, MEI, Qinghua HUANG, Heqin ZHOU, He ZHAO and Huanqing FENG. An Improved Multiscale Image Enhancement via Laplacian Pyramid. The 2nd International Conference on Image and Graphics(ICIG), Hefei, .周荷琴,王恒良等. 心室Purkinje纤维传导系统的自动生成算法.北京生物医学工程., He, Zhou He-qin, Feng Huan-qing. Study on Imaging Algorithm of Virtual Endoscope System. Proc. Of 2001 Annual National Conference on Biomedical Electronics, Biomedical Measurement, Biomedical Information & Control, Biomedical Sensor techniques.梅 涛, 周荷琴, 冯焕清. 基于JPEG的多比特医学图像压缩方法. Proceedings of 2001 Annual National Conference on Biomedical Electronics, Measurement Information & Control, Sensor Techniques(CBME), Wuhan, Yonggang, Zhou Heqin, Feng Huanqing, Wang Hengliang. Parallel Algorithm for Calculation of Cell Dipoles in ECG Simulation. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, Hengliang, Zhou Heqin, Feng Huanqing, Guo Yonggang. Error Analysis and Improvement on Simulation Algorithm of Excitation Propagation's Process of Cardiac Electricity. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, 2000.周荷琴,王恒良,郭永刚,黄庆华,赵何等. 微机原理及应用多媒体CAI软件设计.中国科大学报., , 1999.周荷琴,冯雷,郭永刚.用屏蔽珠抑制高频电磁干扰.电子技术应用., , 1999.周荷琴,蔡方辉,王恒良,冯焕清,刘 兵.多参数监护仪的设计.中国医疗器械杂志., , 1999.周荷琴,孙景群,刘兵,冯焕清,江朝晖. 基于68HC05的心电OEM模块设计. 中国科技大学学报. , , 1998.周荷琴,杜克强,冯焕清. 基于OEM模块的自动血压血氧监护仪设计. 中国科技大学学报. , , 1998.获奖情况曾获中国科学院重大科研成果二等奖 3 项,安徽省教学成果二等奖 1 项,安徽省多媒体教学软件一、二等奖各 1 项。在研项目简介磁共振成像系统:控制器研发; 序列的自动参数调整; 3.图像伪影校正; 4.磁体的自动设计及优化.医学图像处理:1.图像压缩与增强; 2.三维重建和虚拟内窥; 3.医学图像存档与通信系统; 4.数字人.智能交通系统:1.基于视频的交通流量检测; 2.基于视频的交通事件检测与识别; 车载导航系统,GIS.与微软亚洲研究院合作项目:1.可扩展网页信息表征模型研究; 2.基于统计学习的事件检测.无线通信:1.基于OFDM的无线通信系统中若干技术研究; 2.低密度奇偶校验码(LDPC)的编解码方法研究;音频编码技术研究; 4.数字广播系统DRM在DSP上的实现.2.周荷琴 女,1955年出生,汉族,中共党员,大学学历,中学高级教师1973年——1996年 常州市二十四中工作1996年——1999年 常州市二十六中工作1999年——常州市实验初中工作2009年——常州外国语学校工作获奖情况及荣誉称号常州市优秀教育工作者江苏省优秀教育工作者常州市物理评优课一等奖江苏省物理评优课二等奖江苏省依法治校先进个人

微软亚洲研究院论文解析

漏译的原因是什么,如何解决这个问题?这方面有很多工作,下面我就从几个方面去讲一下。我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。左边的例子,S1对应3种不同的翻译,(s1,t1) (s1,t2) (s1, t3 t4),它的熵就比较大。我们把所有对应的翻译统一替换为一个特殊词『stoken4s1』,以降低词语翻译的熵值。右边呢是我们提出来的三种方法,去改善翻译结果,包括pre-training, multitask learning, two-pass decoding。大家有兴趣的话,可以去看论文。从实验结果来看,相比Transformer,在中英翻译质量上有显著提高,高熵值词语的漏译比例显著下降。数据稀疏第二个挑战就是数据稀疏。相比于统计机器翻译,这个问题对神经网络翻译而言,更严重。实验表明,神经网络对于数据量更敏感。针对数据稀疏问题,我们提出了一个多任务学习的多语言翻译模型。在进行多语言翻译的时候,源语言共享编码器,在解码端,不同的语言,使用不同的解码器。这样在源语言端就会共享编码器的信息,从而缓解数据稀疏问题。后来,加拿大蒙特利尔大学、Google等在此方向上陆续开展了多个工作。实验表明,我们的方法收敛更快,翻译质量也明显提高。更多细节,请阅读论文。这篇论文是2018年EMNLP上的best paper,提出了一个统一的框架。A)里面蓝色的点和红色的点分别代表两种不同的语言句子。如何通过两种语言的单语数据构建翻译系统呢?首先我要做一个初始化,B)是初始化。首先构建一个词典,把这两种语言之间的词做一下对齐。C)是语言模型,基于单语数据,可以训练语言模型,用来衡量这个语言的流利度。那么D)是什么? D)是一个称作Back Translation的技术,是目前大家常用的一个用于增强数据的方法。用B)初始化后构建的一个词典,就可以从一种语言翻译为另外一种语言,哪怕是先基于词的翻译。然后,用另外一种语言的语言模型去对译文进行衡量。然后把得分高的句子挑出来,再翻译回去,这一过程称作Back Translation,然后再用原来那种语言的语言模型去衡量这个句子好还是不好。这样一轮一轮的迭代,数据就会变得越来越好,系统翻译质量也会越来越好。引入知识第三个挑战就是引入知识,如何将更多丰富的知识引入翻译模型是机器翻译长期面临的挑战。这个例子中,中文句子中『横流』对应到目标语言端是没有翻译出来的,用一个特殊的记号叫UNK(Unknown Word)来标记。那么我们做一个什么样的工作呢?我们引入了几种知识,第一种就是叫短语表或者叫词表。如果发现『横流』这个词没有被翻译出来,我们就去查这个词典,这个词典就作为一个外部知识被引入进来了。同时,那我们还引入了一个语言模型,语言模型去衡量目标语言的这个句子是不是流畅。同时,我们引入一个长度奖励特征去奖励长句子。因为句子越长,可能漏掉的信息就越少。这个工作首次将统计机器翻译中的特征引入神经网络翻译,可以作为引入知识的一个框架。但是目前来说,引入知识还是比较表层的。知识的引入,还需要更多更深入的工作。比如说这个例子, 这个句子是存在歧义的。『中巴』 在没有给上下文的时候,是无法判断『巴』是哪个国家的简称。但是下面的句子,有一个限定,“金砖框架”。这个时候,人们就知道该如何翻译了。但是,机器能不能知道?大家可以去翻译引擎上去验证。因为人是知道中国跟哪些国家是金砖国家,但是机器没有这个知识。怎么把这个知识交给机器去做,这是一个非常挑战的问题。还有一个挑战,是可解释性:神经网络翻译到底是神还是神经?虽然人们可以设计和调整网络结构,去优化系统,提高质量。但是对于该方法还缺乏深入的理解。也有很多工作去试图研究网络内部工作机理。清华大学有一篇文章从注意力的角度去进行研究。比如左边的例子,出现了一个UNK,那个UNK是怎么产生的,它虽然没有被翻译出来,但是出现在正确的位置,占了一个位置。通过Attention对应关系,可以看到这个UNK对应到『债务国』。右边例子是一个重复翻译的现象。神经网络机器翻译除了经常漏翻译之外,还会经常重复翻译。比如说出现了两个“history”。那么通过这个对应关系我们就可以看到,第6个位置上的“history”是重复出现的,它的出现不仅跟第一个位置“美国人”和第二个位置“历史”相关,还跟第5个位置“the”相关。因为产生了一个定冠词“the”,模型认为这个地方应该出现一个“history”,这篇文章对这样的例子进行了大量的分析,并且给出了一些分析结果和解决方案。如需进一步了解,可以看原始论文。还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。语篇翻译还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。我们的方法输出的结果。可以看到,定冠词、代词的加入提升了句子间的连贯性。我们提出了一个两步解码的方法。在第一轮解码中单独生成每个句子的初步翻译结果,在第二轮解码中利用第一轮翻译的结果进行翻译内容润色,并且提出使用增强式学习模型来奖励模型产生更流畅的译文。这是我们系统输出的一个结果,整体上,流畅度提高了。原文链接:打开CSDN,阅读体验更佳机器翻译技术的瓶颈提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言概述一、机器翻译的瓶颈在哪里?二、是否存在第四代机器翻译?三、自然语言处理的可解释性研究之争四、观众问答环节Q1:如何加入先验知识,引入外部知识或融合专业术语是不是一种途径?Q2:有没有可能现在已经出现了一些能超过 Transformer 的模型,但是这种WMT数据加上 BLEU 值的评测手段不能体现出其优势,未来应该设计怎样的评测手段,从而更好地推动机器翻译的发展?Q3:非常认同张民老师认为「翻译是再创造过程」的观点,其实从规继续访问ACL 2018 | TA-NMT:利用大语种语料,提升小语种神经机器翻译能力编者按:随着神经机器翻译的快速发展,英语、法语等大语种之间的翻译任务已经能够达到良好的翻译效果,而小语种的翻译仍然是一个难题。与大语种丰富的语料数据相比,小语种机器翻译面临的主要挑战是语料的稀疏性问题。为了更好地解决这一问题,微软亚洲研究院自然语言计算组提出了一个呈三角结构的神经机器翻译模...继续访问EMNLP 2019 | 大规模利用单语数据提升神经机器翻译BDTC大会官网:作者 | 吴郦军、夏应策来源 | 微软研究院AI头条(ID:MSRAsia)编者按:目前,目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而,目标语言端的无标注数据一旦使用不当,反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据,微软亚洲研究院在 EMNLP 2019 上发表的论文中,提出一...继续访问腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频本文为 1 月 4 日,腾讯 AI Lab 高级研究员——涂兆鹏在第 22 期 PhD Talk 中的直播分享实录。机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕继续访问干货 | 关于机器翻译,看这一篇就够了作者简介俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。机器翻译技术的发展一直与计算机技术、信息论、语言...继续访问人工神经网络的算法原理,人工神经网络算法实例人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征,为人工智能的研究开辟了新的途径,神经网络具有的优点在于:(1)并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的,往往是分层或以一种有规律的序列排列,信号可以同时到达一批神经元的输入端,这种结构非常适合并行计算。(3)鲁棒性和容错性由于采用大量的神经元及其相互连接,具有联想记忆与联想映射能力,可以增强专家系统的容错能力,人工神经网络中少量的神经元发生失效或错误,不会对系统整体功能带来严重的影响。..继续访问神经翻译笔记5扩展b. 常用的机器翻译技巧文章目录神经翻译笔记5扩展b. 常用的机器翻译技巧组合解码单语数据应用重排序领域适配参考文献 神经翻译笔记5扩展b. 常用的机器翻译技巧 本节介绍提升机器翻译系统效果的常见手段。这些手段有些实际上是深度学习的通用技巧,有些在神经翻译出现后不久就被人提出,经过若干发展沿用至今,有些甚至在统计翻译时代就已出现。无论如何,这些手段独立于模型架构存在,都不仅能够增强模型效果,还展现了顽强的生命力以及良好的通用性 本节参考了Koehn的NMT综述、、三小节的内容,并根据个人喜好作了继续访问从冷战到深度学习,一文看懂机器翻译发展史点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!CSDN编者友情提示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经过一个世纪的努力机器翻译的算法竟得以实现,期间甚至有一半的时间我们都觉察不到这项科技的发展。从搜继续访问机器翻译的局限一、多义性识别上的困难多义性指的是人们交际中所发出的信息在不同的语境下可以表现出多种不同的意义。这是机器翻译要解决的最基本的,也是最难解决的一个问题。如,今天是星期六对丈夫说,可能表示提醒孩子对父母说,可能表示这个孩子想放松,想要出去玩。老板对打工者说,可能表示今天上班算加班。从疲劳过度的学生口中说出来,可能表示今天向睡个懒觉。以上所局还可能有更多的例子,但是单单是这些继续访问神经网络机器翻译技术及应用(上)何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...继续访问论机器翻译之浅薄翻译 | shawn编辑 | 波波、费棋【AI科技大本营导读】尽管机器翻译明显玩不转备受期待的长篇内容,但我们得承认,在快速获知单词含义层面,它确实为人们提供了一定便利。可奇怪的是,无论媒体报道还是行业中都似乎营造了一种机器翻译马上要取代人类译者的气氛,这给了人们一种快要成了的错觉。有人要揭开盲目乐观的面纱,因《哥德尔、埃舍尔、巴赫》一书而获得普利策奖的美国学者侯世达是其中之一。他以自己亲身体继续访问机器翻译技术现状评述与展望 | 行业观察今天,你AI了没?关注:决策智能与机器学习,每天学点AI干货正文共:2497字7图预计阅读时间:7分

突出感觉:1、真的是最开心的一段时光,因为接触的case都比较大气及创新,不像其他互联网公司小打小闹一个小App,MS出来的东西相对需要占据市场份额并有突破,所以能接触到很多最新的技术和产品2、同事都是高水平的developer GG/姐姐,所以相处融洽,MS的水果食品供应神马的都算顶级了,如果你不非拿Google比的话3、至于出来去其他互联网公司的话,我觉得主要看的是你是否承接合适的case,与其他互联网公司有相关的工作经验。。MSRA大名必定会增光,但是找工作还有其他很多因素4、技术地位方面我相信在国内的特定领域是非常高的,譬如说百度研究院的搜索肯定强、阿里研究院的金融安全应该蛮牛的,微软在与家庭、娱乐、手机等多个产品线方面有关的技术应该是比较强的。

博士,IEEE和ACM资深会员,2006年加入微软亚洲研究院,现任主管研究员。2008年被评为Microsoft Golden Star。他是轨迹数据挖掘、基于位置的社会网络和城市计算三个研究领域的先驱和倡导者。这些领域已成为新兴研究方向,受到众多学者的追逐。他也是澳大利亚昆士兰大学、韩国GIST等大学的博士论文特邀评审专家和答辩委员会成员、英国伦敦大学学院(UCL)等高校的外请教职评议专家,以及多个欧美项目评审组的专家成员。近年来他以主作者身份发表论文80余篇,其中在SIGMOD、KDD、ICDE、AAAI、WWW和TKDE等顶尖国际会议和刊物上发表论文40余篇。

  • 索引序列
  • 亚洲研究院论文10篇
  • 亚洲研究论文10篇
  • 微软亚洲研究院论文
  • 亚洲研究院精选论文
  • 微软亚洲研究院论文解析
  • 返回顶部