• 回答数

    3

  • 浏览数

    350

sophiabian
首页 > 论文发表 > acl发论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

安妮果果33

已采纳

论文题目:Lexicon Enhanced Chinese Sequence Labeling Using BERT Adapter 论文地址: 这是一篇自表于2021 ACL(NLP顶会)的论文。论文提出将字典融入BERT网络层记作字典加强BERT(Lexicon Enhanced BERT,LEBERT) ,用于提升中文标注效果。新模型在命名实体识别、分词、成份标注实验中均达到了目前最佳水平。 由于存在分词(CWS)问题,中文面临更大的挑战,对多数任务,以字为单位比以词为单位效果更好。 目前大多优化方法都是修改上层(网络末端),而未修改核心网络。文中提出的方法利用字典得到更多可能的分词,动态计算最佳分词方法,并修改了网络的Transformers层,如图-1中的右图所示: 模型的核心结构如图-2所示,相对于BERT,LEBERT有两个明显差别: (1)输入变成了字符特征+字典特征 (2)字典适配层在Transformer层之间 文中方法将基础的字符序列扩展成字符+词对序列,设句S由字符c组成:Sc={c1,c2,c3,...,cn},在字典D中找到在句中包含字符c所有可能的词ws,如图-3所示: 最终生成序列: s_cw={(c1,ws1),(c2,ws2),...(cn,wsn)} 将字符和词信息融入BERT网络的字典适配层,方法如图-4所示: 字典适配层有两个输入:字符和词对,即上图中的h和x,其中h是前一个transformer层输出的字符向量,x是m个可能包含该字符的词组成的词嵌入,其中j是m中的第j个词: 其中e是预训练得到的词向量映射表。 为了对齐长短不一的序列,对词向量进行非线性变换如下: 其中W1是大小为dc-dw的矩阵,W2是大小dc-dc的矩阵,b1和b2是偏移,dw是词向量的维度,c是隐藏层的维度。 由图-3可知,一个字可能对应多个词,对于不同的任务,最匹配的词可能并不相同。 具体算法是使用vi表示第i个字符对应的所有词表,m是该字符可能对应的词个数,计算注意力attention如下: 其中W是注意力权重矩阵。 然后对每个词乘其权重加和,得到位置i对应的词表示: 最终,将词典信息与字符的向量相加,得到了该位置的新向量: 处理后的数据再送入dropout层和归一化层继续处理。 将字符输入词嵌入层,加入token, segment和position信息,然后将该层输出的词嵌入输入Transformer层:输出的 是第l个隐藏层的输出,LN是归一化层,HMAttn是多头注意力机制,FFN是两个前馈网络层,使用ReLU作为激活函数。 在k-th和(k+1)-th Transformer之间加入字典信息考虑到标签的前后关系,使用CRF层来预测最终的标签,将最后一个隐藏层h的输出作为输入,计算输出层O: 然后将输出层代入CRF模型,计算标签y的概率p。 训练时给出句子S和标签Y,计算全句的负对数似然作为误差。 解码时,使用维特比算法计算得分最高的序列。 论文针对命名实体识别NER,分词CWS、位置POS标注进行了实验,实验数据如表-1所示(中文NLP常用实验数据)。 图-5展示了相对于BERT和基于BERT的最新模型,文中模型误差的减少情况。 除了与其它模型比较之外,论文还比较了LEBERT方法与在组装模型的Bert+Word方法的差异。

268 评论

catcat654321

以下是几个顶级会议的列表(不完整的,但基本覆盖)(1)机器学习顶级会议:NIPS, ICML, UAI, AISTATS; (期刊:JMLR, ML, Trends in ML, IEEE T-NN)计算机视觉和图像识别:ICCV, CVPR, ECCV; (期刊:IEEE T-PAMI, IJCV, IEEE T-IP)人工智能:IJCAI, AAAI; (期刊AI)另外相关的还有SIGRAPH, KDD, ACL, SIGIR, WWW等。特别是,如果做机器学习,必须地,把近4年的NIPS, ICML翻几遍;如果做计算机视觉,要把近4年的ICCV, CVPR, NIPS, ICML翻几遍。(2)另外补充一下:大部分顶级会议的论文都能从网上免费下载到。(3)说些自己的感受。对计算机视觉和计算神经科学领域,从方法和模型的角度看,统计模型(包括probabilistic graphical model和statistical learning theory)是主流也是非常有影响力的方法。有个非常明显的趋势:重要的方法和模型最先在NIPS或ICML出现,然后应用到CV,IR和MM。虽然具体问题和应用也很重要,但多关注和结合这些方法也很有意义。

207 评论

好人旦旭

ACL大会由国际计算语言学协会主办,是自然语言处理与计算语言学领域最高级别的学术会议。

351 评论

相关问答

  • 发表顶级会议ACL论文

    目前,公认的计算机视觉三大会议分别为ICCV,ECCV,CVPR。1、ICCV ICCV的全称是 IEEE International Conference o

    彩色珊瑚 3人参与回答 2023-12-10
  • 自然语言处理论文在acl发表

    首先想到的不应该是Michael Collins吗……Michael Collins (Columbia), Jason Eisner (JHU), David

    仟木源家居 4人参与回答 2023-12-07
  • acl发论文

    论文题目:Lexicon Enhanced Chinese Sequence Labeling Using BERT Adapter 论文地址: 这

    sophiabian 3人参与回答 2023-12-07
  • ACL论文发表时间2021

    1. ACL录用Findings分数并不固定,因此无法确定是否足够。2. 通常,ACL会对每篇投稿进行评分,然后选择评分较高的论文进行录用。Findings分数

    我爱微辣 3人参与回答 2023-12-12
  • acl论文能在什么刊物发表

    论文发表被认可的刊物有:EI、 ssci 、sci 1、 SCI 《科学引文索引》收录自然科学方向的核心期刊,分为四个区,一区、二区期刊影响因子高,含金量也很高

    木糖不纯 4人参与回答 2023-12-06