舜井街的猫
达摩院作为阿里的科研结构,似乎它没怎么出来“说话”,因为它一直在低调地做自己的事情。
我们先来看一下达摩院具体是什么。
在2017年的时候,马云说要搞一个达摩院,用了3年的时间就放了1000亿元进去,说是为了探索科技的开销,然后很多搞科技的人才都被马云请了过来这里了,进行技术研发,刚开始的时候马云从全球请了十名不同领域的科学家加入到这里,后来又加入了很多人才,目前科学家的人数大约在七十位左右。达摩院研究的东西都是和科技有关,比如现在很火的网络安全、基础算法等,还有美国一直都在重视的量子计算,除此之外还有下一代人机交互、视觉计算等。
其实要说达摩院到底都取得哪些成就,我觉得达摩院的成就之一就是吸引了人才,可以说这里是一个科技人才聚集地,也是科技人才挑战基地,在这里,这些人才并不是单纯地做科技,而是和商业紧密地联系起来。就比如说现在AI吧,已经被应用到了工业生产中了,也给很多企业创造了很高的利润。
而在2019年4月份的时候,达摩院也宣布了已经研发出了Ali-NPU,这是一款神经网络芯片,是中国自己创新和努力得到的结果,这个Ali-NPU会被运用在图像视频分析、机器学习等相关的AI领域。而且随后,达摩院也宣布了他们已经研制出了现在世界上最强的量子电路模拟器“太章”,而在这之前,美国的谷歌在这一方面可是“老大”,现在我们中国也有了这个东西后难免会让他们觉得面临新挑战。
除此之外,达摩院的影响不仅仅只是中国或者欧洲,达摩院现在已经和很多所世界级的高校建立了合作,在2018年11月的时候达摩院卫星遥感影像AI分析系统也再一次获得了冠军。
草莓天天见
2017年 10 月 11 日,阿里巴巴达摩院正式成立,马云的一句 “ 活得要比阿里巴巴长”,让外界对它的未来发展,有了更 “意味深长” 的期待。
在近三年多的时间里,达摩院在人工智能学术科研与应用上齐头并进,无论在国际学术顶会以及各类竞赛上,还是在推动学术成果的商业化落地上,都交出了亮眼的成绩单,这也反过来吸引着人工智能领域的顶尖研究者们都汇聚于此。
对于这些顶尖研究者们目前正在开展的研究工作,想必大家都充满了探知欲!
7月9日(晚)19:30-21:00 ,AI科技评论就将联合阿里达摩院,外加阿里集团在学术科研上同样“坚挺”的存在——阿里安全,给大家呈上一场 “ACL 2020 系列论文解读·阿里巴巴专场” 直播!
届时,来自阿里达摩院机器智能技术团队和阿里安全安全智能团队的 6 位高级算法专家、算法工程师以及研究型实习生们,将分别聚焦于多任务学习、少样本文本分类、 任务型对话、神经机器翻译、知识蒸馏、跨域分词标注等NLP 细分领域,为大家带来一场论文解读盛宴!
本次分享的嘉宾具体都有谁呢?下面一一揭晓:****分享主题: SpanMlt:一种基于跨度的用于属性词和观点词配对抽取的多任务学习框架 ****分享嘉宾:黄龙涛
分享内容:
属性词和观点词抽取,是细粒度的基于属性的情感分析(ABSA)的两个关键问题。属性-观点词对( aspect-opinion pairs)可以为消费者和观点挖掘系统提供相关产品或服务的全局配置文件。但是,传统方法无法在没有给定属性词和观点词的情况下,直接输出属性-观点词对。尽管研究者最近提出了一些共提取方法来联合提取属性词和观点词,但是并不能配对抽取两者。为此,本文提出了一种端到端方法来解决属性词和观点词的配对抽取(PAOTE)任务。此外,本文从联合词和关系抽取的角度而非此前大多数工作中执行的序列标注方法的角度,来处理该问题。我们提出了一个基于共享跨度的多任务学习框架,其中在跨度边界的监督下提取词。同时,使用跨度表示法来联合识别配对关系。大量实验表明,我们的模型始终优于 SOTA 方法。
分享内容:
现有的工作往往使用元学习(meta learning)的方法,通过在一系列meta-task中切换来获得少样本学习的能力,但是在task间的切换会带来遗忘的问题,因此考虑使用记忆机制来辅助meta learning的训练。在本工作中,我们将监督学习得到的分类参数作为meta learning的全局记忆,并提出了动态记忆路由算法,基于dynamic routing的方式将全局记忆信息融入到meta task的训练和预测阶段。此外,动态记忆路由算法还可以使用query信息来增强归纳类别表示的能力,对口语场景下的语言多样性表达有更好的泛化性能。在中英文场景少样本分类任务数据集上,均取得了STOA的结果。
分享主题:多领域对话动作和回复联合生成****分享嘉宾:田俊峰
分享内容: 在任务型对话中,产生流畅且信息丰富的回复至关重要。现有pipeline方法通常先预测多个对话动作,然后使用它们的全局表示来辅助回复生成。这种方法有两个缺陷:第一,在预测对话动作时,多领域的固有结构被忽略了;其次,在生成回复时没有考虑到对话动作和回复之间的语义联系。为了解决这些问题,我们提出了一种同时生成对话动作和回复的神经联合生成模型。与以往的方法不同,我们的对话动作生成模块可以保留多领域对话动作的层次结构,同时我们的回复生成模块可以动态地关注到相关的对话动作。在训练时,我们采用不确定性损失函数来自适应地调整两个任务的权重。在大规模MultiWOZ数据集上进行了评估,实验结果表明,我们的模型在自动评估和人工评估上都比SOTA模型有很好的提升。****分享主题:神经机器翻译的多尺度协同深度模型******分享嘉宾:魏相鹏**
近年来,神经机器翻译(NMT)方法凭借其出色的翻译性能在大量应用场景中取代了基于统计的机器翻译方法。目前,制约NMT模型性能的因素主要包括模型的特征表达能力和数据规模。因此,我们提出一种基于多尺度协作(MSC)机制的深度神经机器翻译模型,以提高模型对底层(具象化)和高层(抽象化)特征的建模能力。
实验证明,(1) 多尺度协作机制有助于构建极深的NMT模型的同时带来性能上的提升,(2) 基于MSC机制的深度NMT模型能够更好地翻译语义结构复杂的自然语言句子。
****分享主题:多语种序列标注的结构级知识蒸馏******分享嘉宾:王新宇**
多语言序列标注是一项使用单一统一模型预测多语言标签序列的任务。与依赖于多个单语模型相比,使用多语言模型具有模型规模小、在线服务容易和对低资源语言通用的优点。然而,由于模型容量的限制,目前的多语种模型仍然远远低于单独的单语模型。本文提出将多个单语言模型(teachers)的结构知识提取到统一的多语言模型(student)中,以缩小单语言模型与统一的多语言模型之间的差距。我们提出了两种基于结构层次信息的知识挖掘方法:
****分享主题:跨域中文分词的远程标注与对抗耦合训练******分享嘉宾:丁宁**
完全监督神经方法在中文分词(CWS)的任务上取得了重大进展。但是,如果由于域间的分布差异和集外词(OOV)问题导致域迁移,则监督模型的性能始终一直大幅下降。为了实时缓解此问题,本文将跨域中文分词的远程标注和对抗性训练直观地结合在一起。
7月9日,6位来自阿里的分享嘉宾,与大家不见不散!
ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行,因新冠肺炎疫情改为线上会议。为促进学术交流,方便国内师生提早了解自然语言处理(NLP)前沿研究,AI 科技评论将推出「ACL 实验室系列论文解读」内容,同时欢迎更多实验室参与分享,敬请期待!
大熊二的小熊大
简介: 双11背后的万亿人次商品需求:淘宝创造新一代智能 科技 ,淘宝成为超大规模智能APP,前沿 科技 重塑双11人货场。
图:淘宝APP已成为超大规模智能APP
“淘宝APP已成为超大规模智能APP。”阿里巴巴集团资深副总裁周靖人11月3日介绍,基于全球规模最大的商品认知图谱、全球首个每日万亿量级的云端协同图神经网络,2020年双11的智能计算规模和效率再次突破 历史 峰值。
在阿里巴巴双11技术沟通会上,阿里CTO程立认为,智能中台是阿里巴巴数字原生商业操作系统的重要组成部分,智能技术像水一样在经济体流淌。随后,阿里巴巴首次公布,在核心商业技术架构中,已经构建包括全域知识层、认知推理层、用户交互层的“认知智能引擎”。
今年双11前夕,淘宝首页大幅改版。在信息流、搜索、聚划算、会场和直播等用户场景,智能计算调用量日均已高达数千亿次,消费者兴趣宽度显著拓展,各类商家机会趋于多样,新商品孵化周期正在缩短。
此外,各类基础智能 科技 已在淘宝大规模应用,日调用量也在数千亿次。在视觉AI领域,拍立淘目前支持4亿商品对应的图片和视频检索;自然语言学习(NLP)、实时机器翻译、语义识别等技术,也在店小蜜、实时翻译、商品评价分析等关键链路使用。
在信息搜索、推荐和营销领域,传统机器学习机制会不断拟合用户行为。认知智能则能提供更好的发现性、丰富性。
认知智能需要“实时训练”、“千人千模”,计算工程体系既面临效率和成本难点,也能通过差分机制、端侧运算更好保护用户数据隐私。周靖人介绍,目前阿里巴巴以自研AIOS操作系统、图计算框架为底座,结合高压缩率的在线学习模型,能够支持模型分钟级更新1亿参数,单次请求超过200亿次的浮点计算。
图:商品认知图谱基本结构
2014年阿里巴巴上市时,深度学习(Deep Learning)和专有算法(Proprietary algorithms)是对外披露的核心技术之一;2016年提出新零售、新制造、新能源等“五新”计划,开始智能技术深度融合;2017年成立的达摩院,目前已向业务场景输出的200多种智能 科技 能力,日调用量超过5000亿次。
期间,阿里巴巴在全球跨领域引进科学家,开展自动学习、分布式计算、多模态理解、图计算、差分隐私等前沿基础科研,又在核心商业场景积极支持技术验证、融合与扩散。仅认知智能相关领域,已发表300多篇全球顶级会议论文,注册国内外专利180余项。
有。在阿里巴巴发表论文会获得阿里达摩院青橙奖、不同数额的奖金等奖励,奖金使用方式不限。
论文: 论文题目:《Search-based User Interest M
会议论文发表方式有很多种:第一:自己写文章,自己翻译,自己找合适的会议,自己投稿,然后录用,自己注册会议。但是会议信息不是那么好找的,而且网上能够找到的会议信息
1,阿里巴巴本身就是个例子: 阿里巴巴是全球B2B电子商务的著名品牌,是目前全球最大的商务交流社区和网上交易市场。他曾两次被哈佛大学商学院选为MBA案例,在美国
给您推荐《科技传播》杂志 中英文目录 知网万方全文收录 主管中国科学技术协会 主办中国科技新闻学会 您好! 1、硕士学位论文发表在增刊上不合适吧,学校