自然语言处理研究现状与挑战论文

6个回答默认排序

默认排序

按时间排序

大大大吉CQ

已采纳

有乐观和悲观的周期在领域的NLP (我们当前可能到在一个更加乐观的阶段之内); 虽然一些非常真正的前进被做了，一个一般NLP系统的目标依然是逃避。历史上，计算机学家经常是远太过于乐观关于NLP，大概着名的某些的原因以上。是确切正确地从外边因而是重要的任务为什么是困难的。 It也是重要注意到，有自然语言之间的区别。由于美国研究员的重要性更多工作在英语大概被完成了比在其他语言，主要，虽然有非常活跃工作者在欧洲和日本。然而，因为它使用少量变化并且沉重依靠词序，英语在一些方面是一种非典型语言。用英语和其他介绍来源写的课本很少包含关于语言的NLP的充分讨论与明显不同的语法结构。 We可能区别至少三个分明‘水平’在处理NL ： Sounds Grammar Meaning Each可以被划分成两个或多个分段，不需要有关我们这里。什么我在这简要的介绍想要做是说明某些在处理每个水平的问题。 Consider这三个词，讲话由从英国的南部的一个当地讲英语者：输入，入口，收入。是确切全部三个词包含元素与同一个意思。要输入是投入某事; 水泵的入口是水被采取的地方; 您的收入是您赢得，即进来的金钱。 Is元素在发音了同样在所有三个词(由指定的报告人) ？仔细听表示，它不是。词输入是显著的，好象被拼写的imput，而入口发音如被拼写。如果我们让声音通常被拼写的ng的N立场用英语(即在词象唱歌或歌手)，则收入是因为苏格兰语英语许多报告人这样，不表现I指定了从英国的南部的当地讲英语者; 反而他们一贯地发音所有三个词的第一个元素，当它被拼写，即作为(象可以所有讲英语者，当慢慢地和强调地讲话)时。 Interestingly，讲英语者对这些区别通常是相当未察觉的，在他们自己的讲话和其他的讲话上。这不是，因为他们不可能区别在三声音m、n和N.之间。三个词兰姆酒、奔跑和阶在这三声音仅不同并且是相当分明的对所有当地讲英语者。

222 评论 1小时前发布

果冻爱之梦

计算机视觉方向更有前景，不管是现在还是未来。NLP方向无非集中在翻译、推荐、搜索领域，另外的舆情分析，情感分析，语义理解，语义消歧等都是文本处理的一些辅助性手段，还有就是语音处理，科大讯飞做的很好，基本上处于垄断地位。其中翻译领域基本无法变现，没什么太大的商业价值，推荐领域集中在电商，音乐等领域，比较小众，一般公司用不起推荐，搜索领域更不用说。更重要的是NLP领域看不到有什么商用切入点。迄今为止没见过自然语言处理方向有哪个比较大的公司，也没见过过亿的投资，创业公司更是没有做相关内容的。用事实说话反观视觉方向，腾讯、阿里、百度都在投资，商汤、旷试科技都是巨头，过亿投资多的是，更重要的是视觉方向的商业切入点有很多，应用场景非常广阔，创业公司不在少数，现在比较火的是医学影像分析和无人车，都是视觉相关方向，包括直播行业视觉也能切入。可以说视觉可以切入很多场景做分析。阿里布局医学影像 Doctor You - 阿里健康两个一对比就能看出来哪个商业价值更大，现在是cv的，未来也是cv的，十年之内都是，当前机器学习、深度学习越繁荣，视觉方向的应用场景越广阔，视觉方向有比较好的切入点。

295 评论 6小时前发布

桠枫娇娇

在自然语言处理的领域内有乐观与悲观的周期性存在（我们现在大概是出于乐观期）；虽然（技术上）真的有一些进步，但是达到一个全面自然语言处理系统的目标仍然遥不可及。（这里我没有用elusive的直译，难以捉摸，因为放进中文里会很怪，没有人说目标难以捉摸。）历史上，计算机专家有时对于自然语言处理（的挑战性）过于乐观，其原因很可能就是以上提到的（周期性）。因此从一开始就清楚这个（自然语言处理）的难度的原因是很重要的。同时，了解自然语言之间的不同也是很重要的一点。相对于其他自然语言来说，更多的研究重点放在了英文上，主要是因为美国研究者（在这个领域里）的重要性，尽管日本和欧洲也有很积极的研究学者。可是，在某一方面来讲，英文不是一个具有代表性的语言：它没有音调变化，并且严重依赖单词顺序。教课书和其他英文版的（自然语言处理）启蒙书籍几乎没有包括任何有关（与英语有）不同语法结构的语言的自然语言处理的合适论述。我们可以区别起码三个完全不同的自然语言处理级别：声音语法语义每一个都可以被再分为两到三个亚级别，但这不是本文的重点。在这个简介里我想要做的是阐明在处理每个级别中会遇到的一些问题。这里有以英文为母语的南英格兰人说的三个词：输入，纳入，收入(input, intake, income)；（请大家）思考这三个词。很显然的，三个词都有相同语义的元素。输入，指的是把什么东西放进去；抽水机的纳入指的是水被抽进去的地方，你的收入指的是你赚的钱（就是进你口袋的钱）。三个词中的in元素（在指定说话人的情况下）都发一样的音吗？如果注意听的话就会发现并不是这样。Input 这个词在发音的时候听起来像是拼法是imput的词，而intake听起来就和它的拼法一样。如果我们用N代表English 里边ng的发音，那么Income就有点iNcome的感觉。我特地点出了说话者是从南英格兰来的本土人，因为很多苏格兰人说英文的时候都没有这种习惯，就像所有其他英文母语者在慢慢地富有感情的说这三个词的时候一样，他们都会将in的发音发成和它拼法一样。有趣的是，不论在他们自己或是其他人的言语中，以英文为母语者通常都不会注意到这些差别。这不是因为他们没办法分辨m ,n ,N 这三种发音。Rum, Run, Rung这三个词就只有m, n, N这三个发音处不同而已，所有英文母语者都可以很好的区别它们。

293 评论 11小时前发布

MIssMIss兔狗

已经有 NLP( 我们可能地是目前在比较乐观的时期中) 的领域乐观主义和悲观的周期；虽然一些非常真正的进步已经被做，但是一般的 NLP 系统的目标保持难懂。历史地, 计算机科学家时常是甚远地太结束- 乐观的有关 NLP 的事,或许为被记录在上面的一些理由。完全地从着手是清楚的是如此重要工作为什么很困难。它是也重要的在自然语言之间有不同。较多的工作或许已经在英国人上被做比较在任何其他的语言上,因为美国研究员的重要主要地, 虽然有欧洲和日本的非常活跃的工人。然而，英国人是在一些方法中一种不典型的语言,如同它使用很少的屈曲而且很重地仰赖字次序一样。教科书和很少地以英国语写成的其他介绍的来源为和显着不同文法的结构语言包含 NLP 的适当讨论。我们能在处理 NL 方面至少区别三清楚的 '水平': 声音文法意义每个可能被区分为二或较多的次水平,在这里不需要与我们有关。我在这做简短的介绍要在处理每个水平方面举例说明一些问题的。考虑这三个字, 被来自英国的南方一位自然的英国语说者讲: 输入，吸入，收入。很清楚地 , 所有的三个字包含元素在由于相同的意义。到输入要把某物放入；水泵的吸入是水被拿的地方在;你的收入是你赚得的钱,也就是那进来。元素是在发音吗相同的在所有的三个字中?(藉着被叙述的说者) 小心的听将会它不是。字输入是显着的好像 spelt imput, 然而吸入是发音如 spelt。如果我们用英国语通常让 N 代表声音 spelt ng(举例来说在字同类中唱或歌手), 然后收入是因为摊派的款项英国人的许多说者不这样举止；当它是 spelt 的时候 , 改为他们一致地宣告所有的三个字的第一种元素 , 所以我叙述了来自英国的南方自然的英文说者,也就是同样地在.( 当可能之时所有的英文说者当慢慢地而且强调地的时候) 有趣地，英文的说者是通常相当不知道的这些不同,在他们自己的演讲和其它的演讲都。这是不因为他们不能够区别三声音 m, 古怪的 n 和 N. 三个字, 跑，而且脚蹬横木只在这三种声音中和相当不一致对所有的自然英文的说者是清楚的。

203 评论 11小时前发布

海狸鼠小姐

title: 自然语言处理综述 date: 2021-11-18 11:03:11 自然语言是指人类日常使用的语言，比如：中文、英语、日语等。自然语言灵活多变，是人类社会的重要组成部分，但它却不能被计算机很好地理解。为了实现用自然语言在人与计算机之间进行沟通，自然语言处理诞生了。自然语言处理(Natural Language Processing, NLP)是一个融合了语言学、计算机科学、数学等学科的领域，它不仅研究语言学，更研究如何让计算机处理这些语言。它主要分为两大方向：自然语言理解(Natural language Understanding, NLU)和自然语言生成(Natural language Generation, NLG)，前者是听读，后者是说写。本文将从自然语言处理的历史与发展讲起，进而分析目前深度学习在自然语言处理领域的研究进展，最后讨论自然语言处理的未来发展方向。 1950年，计算机科学之父图灵提出了“图灵测试”，标志着人工智能领域的开端。而此时，正值苏美冷战，美国政府为了更方便地破译苏联相关文件，大力投入机器翻译的研究，自然语言处理从此兴起。从这之后的一段时期内，自然语言处理主要采用基于规则的方法，这种方法依赖于语言学，它通过分析词法、语法等信息，总结这些信息之间的规则，从而达到翻译的效果。这种类似于专家系统的方法，泛化性差、不便于优化，最终进展缓慢，未能达到预期效果。到了20世纪80、90年代，互联网飞速发展，计算机硬件也有了显著提升。同时，自然语言处理引入了统计机器学习算法，基于规则的方法逐渐被基于统计的方法所取代。在这一阶段，自然语言处理取得了实质性突破，并走向了实际应用。而从2008年左右开始，随着深度学习神经网络在图像处理、语音识别等领域取得了显著的成果，它也开始被应用到自然语言处理领域。从最开始的词嵌入、word2vec，到RNN、GRU、LSTM等神经网络模型，再到最近的注意力机制、预训练语言模型等等。伴随着深度学习的加持，自然语言处理也迎来了突飞猛进。接下来，我将介绍自然语言处理与深度学习结合后的相关进展。在自然语言中，词是最基本的单元。为了让计算机理解并处理自然语言，我们首先就要对词进行编码。由于自然语言中词的数量是有限的，那就可以对每个词指定一个唯一序号，比如：英文单词word的序号可以是1156。而为了方便计算，通常会将序号转换成统一的向量。简单做法是对单词序号进行one-hot编码，每个单词都对应一个长度为N（单词总数）的向量（一维数组），向量中只有该单词序号对应位置的元素值为1，其它都为0。虽然使用one-hot编码构造词向量十分容易，但并不是一个较好的方法。主要原因是无法很好地表示词的语义，比如苹果和橘子是相似单词（都是水果），但one-hot向量就无法体现这种相似关系。为了解决上述问题，Google的Mikolov等人于2013年发表了两篇与word2vec相关的原始论文[1][2]。word2vec将词表示成一个定长的向量，并通过上下文学习词的语义信息，使得这些向量能表达词特征、词之间关系等语义信息。word2vec包含两个模型：跳字模型（Skip-gram）[1] 和连续词袋模型（continuous bag of words，CBOW）[2]，它们的作用分别是：通过某个中心词预测上下文、通过上下文预测某个中心词。比如，有一句话"I drink apple juice"，Skip-gram模型是用apple预测其它词，CBOW模型则是用其它词预测出apple。首先介绍CBOW模型，它是一个三层神经网络，通过上下文预测中心词。以某个训练数据"I drink apple juice"为例，可以把apple作为标签值先剔除，将"I drink juice"作为输入，apple作为待预测的中心词。 Skip-gram模型与CBOW类似，也是一个三层神经网络模型。不同在于，它是通过中心词预测上下文，即通过"apple"预测出"I drink juice"。接下来简单介绍Skip-gram模型中各层：两种模型训练结束后，会取作为词向量矩阵，第i行就代表词库中第i个词的词向量。词向量可用来计算词之间的相似度（词向量点乘）。比如，输入 I drink _ juice 上下文，预测出中心词为apple、orange的概率可能都很高，原因就是在中apple和orange对应的词向量十分相似，即相似度高。词向量还可以用于机器翻译、命名实体识别、关系抽取等等。其实这两种模型的原型在2003年就已出现[3]，而Mikolov在13年的论文中主要是简化了模型，且提出了负采样与层序softmax方法，使得训练更加高效。词向量提出的同时，深度学习RNN框架也被应用到NLP中，并结合词向量取得了巨大成效。但是，RNN网络也存在一些问题，比如：难以并行化、难以建立长距离和层级化的依赖关系。而这些问题都在2017年发表的论文《Attention Is All You Need》[4]中得到有效解决。正是在这篇论文中，提出了Transformer模型。Transformer中抛弃了传统的复杂的CNN和RNN，整个网络结构完全由注意力机制组成。 Transformer最核心的内容是自注意力机制(Self-Attention)，它是注意力机制(Attention)的变体。注意力的作用是从大量信息中筛选出少量重要信息，并聚焦在这些信息上，比如：人在看一幅图像时，会重点关注较为吸引的部分，而忽略其它信息，这就是注意力的体现。但注意力机制会关注全局信息，即关注输入数据与输出数据以及中间产物的相关性。而自注意力机制则减少了对外部其它数据的关注，只关注输入数据本身，更擅长捕捉数据内部的相关性。自注意力机制的算法过程如下：自注意力机制不仅建立了输入数据中词与词之间的关系，还能并行地高效地计算出每个词的输出。 Transformer的总体架构如下：它分为两部分：编码器（Encoder）和解码器（Decoder）。编码器的输入是词向量加上位置编码（表明这个词是在哪个位置），再通过多头自注意力操作（Multi-Head Attention）、全连接网络（Feed Forward）两部分得到输出。其中，多头自注意力就是输入的每个词对应多组q、k、v，每组之间互不影响，最终每个词产生多个输出b值，组成一个向量。编码器是transformer的核心，它通常会有多层，前一层的输出会作为下一层的输入，最后一层的输出会作为解码器的一部分输入。解码器包含两个不同的多头自注意力操作（Masked Multi-Head Attention和Multi-Head Attention）、全连接网络（Feed Forward）三部分。解码器会运行多次，每次只输出一个单词，直到输出完整的目标文本。已输出的部分会组合起来，作为下一次解码器的输入。其中，Masked Multi-Head Attention是将输入中未得到的部分遮掩起来，再进行多头自注意力操作。比如原有5个输入，但某次只有2个输入，那么q1和q2只会与k1、k2相乘，。如果深度学习的应用，让NLP有了第一次飞跃。那预训练模型的出现，让NLP有了第二次的飞跃。预训练通过自监督学习（不需要标注）从大规模语料数据中学习出一个强大的语言模型，再通过微调迁移到具体任务，最终达成显著效果。预训练模型的优势如下：预训练模型的关键技术有三个：关于预训练模型的架构，以Bert为例：输入是词的one-hot编码向量，乘上词向量矩阵后，再经过多层transformer中的Encoder模块，最终得到输出。本文介绍了NLP领域的流行研究进展，其中transformer和预训练模型的出现，具有划时代的意义。但随着预训练模型越来越庞大，也将触及硬件瓶颈。另外，NLP在一些阅读理解、文本推理等任务上的表示，也差强人意。总而言之，NLP领域依旧存在着巨大的前景与挑战，仍然需要大家的长期努力。 [1]Mikolov, T., Sutskever, I., Chen, K., Corrado, G. S., & Dean, J. (2013). Distributed representations of words and phrases and their compositionality. In Advances in neural information processing systems (pp. 3111-3119). [2]Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv preprint arXiv:. [3]Yoshua Bengio, R´ejean Ducharme, Pascal Vincent, and Christian Janvin. A neural probabilistic language model. The Journal of Machine Learning Research, 3:1137–1155, 2003. [4]Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Advances in neural information processing systems. 2017: 5998-6008. [5]Peters M E, Neumann M, Iyyer M, et al. Deep contextualized word representations[J]. arXiv preprint arXiv:, 2018. [6]Radford A, Narasimhan K, Salimans T, et al. Improving language understanding by generative pre-training[J]. 2018. [7]Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:, 2018. [8]Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International Conference on Machine Learning. PMLR, 2019: 2790-2799.

124 评论 12小时前发布

静静地过

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系，但又有重要的区别。自然语言处理并不是一般地研究自然语言，而在于研制能有效地实现自然语言通信的计算机系统，特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理（NLP）是计算机科学，人工智能，语言学关注计算机和人类（自然）语言之间的相互作用的领域。因此，自然语言处理是与人机交互的领域有关的。在自然语言处理面临很多挑战，包括自然语言理解，因此，自然语言处理涉及人机交互的面积。在NLP诸多挑战涉及自然语言理解，即计算机源于人为或自然语言输入的意思，和其他涉及到自然语言生成。

335 评论 12小时前发布

自然语言处理研究现状与挑战论文

6个回答 默认排序 默认排序 按时间排序

相关问答

学术期刊

向你推荐

热门问题

6个回答默认排序

默认排序

按时间排序