• 回答数

    4

  • 浏览数

    332

redfishchy
首页 > 职称论文 > 机器翻译的相关研究论文

4个回答 默认排序
  • 默认排序
  • 按时间排序

曼特宁先森

已采纳

机器翻译Machine Translation(MT)是指使用计算机进行翻译,文本输入计算机形成文件,然后没有人为的干涉自动进行翻译。常见的机器翻译工具有谷歌翻译、百度翻译、有道翻译、微软翻译等。目前的机器翻译还不能够实现全自动高质量翻译,能够解决这一问题的最好办法就是机器翻译后进行人工修改编辑。另外,如果你需要所有机器翻译引擎集成,而且你需要翻译一个大型文档,那么我推荐qtrans文档快翻这个翻译工具。

计算机辅助翻译的简称为CAT(Computer Aided Translation),是指借助计算机化工具进行的人工翻译。主要的CAT工具有常见的有 SDL Trados、Déjà Vu、Wordfast、Idiom、Catalyst 等。计算机辅助翻译可以通过其核心技术收集或创建翻译记忆库,帮助议员提高翻译效率,消除传统翻译模式中的弊端,实现更加顺畅快捷的翻译,提升翻译的品质。

对于专业译员们来说,Trados是必须学会的一个工具,其实各种机辅翻译工具的使用、操作大体上是没什么差别的。当然,国外的软件都有一些缺点,比如操作比较复杂、购买费用昂贵、软件不稳定,常常自动关闭;一些导入功能无法使用等。所以,如果想要稳定性较高、团队合作性较高的机辅翻译工具,可以尝试一下国内推出的产品。我自己用过最好用的国内的机辅翻译工具就是——一者科技的YiCAT。有兴趣的可以去他们官网试一试,团队版是免费的,功能十分强大,满足一切翻译需求。

274 评论

一碗人间烟火

[1] 邢红兵,语法搭配的分类和作用--多义词的激活机制之一,《机器翻译研究进展》,陈肇雄主编,电子工业出版社,1992年8月。[2] 邢红兵,含“VA”结构的句子的语义分析,《浙江师大学报(社会科学版)》,1994年第4期。[3] 孙宏林、孙德金、黄建平、邢红兵,关于确定现代汉语分词原则的实验报告,《北京语言学院第三届青年科学报告会论文集》(内部发行),北京语言学院教务处,1994年。[4] 孙宏林、孙德金、黄建平、李德钧、邢红兵“现代汉语研究语料库系统”概述(合作),《计算机时代的汉语和汉字研究》,罗振声、袁毓林主编,清华大学出版社,1996年11月。《第五届国际汉语教学讨论会论文选》,胡明扬主编,北京大学出版社,1997年10月。[5] 邢红兵、张普、崔永华,Chinese Character Component Disassembly and Standard of GB 13000. 1 Character Set,(第一作者),《第二届术语学、标准化与技术传播国际学术会议论文集》,中国大百科全书出版社,1997年7月。[6] 邢红兵,现代汉语插入语研究,《语言工程》,陈力为 袁琦主编,清华大学出版社,1997年8月。[7] 邢红兵、张普、崔永华,对部件称说的建议,《计算机世界》,1998年4月27日。[8] 信息处理用 字符集汉字部件规范(主要起草人),语文出版社,1998年4月。[9] 邢红兵、张普,汉字基础部件称谓“音托”键位统计,《1998年中文信息处理国际会议论文》,清华大学出版社,1998年9月。[10] 邢红兵,现代汉语字、词基础部件统计分析,《1998年中文信息处理国际会议论文》,清华大学出版社,1998年9月。[11] 邢红兵,现代汉语词类使用情况统计,《浙江师大学报(社会科学版)》,1999年第3期。[12] 邢红兵,从分词的不一致性看汉语分词的难点,“机器翻译与计算机语言信息处理国际学术研讨会”论文,北京1999年6月。[13] 邢红兵,词性标注中难归类词语分析,黄昌宁 董振东主编,《计算语言学文集》,清华大学出版社,1999年10月。[14] 邢红兵、舒华,语料库建设与汉语认知研究,“第三届华人心理学家学术研讨会”论文,1999年10月北京。[15] 邢红兵,汉语词语重叠结构统计分析,北京语言文化大学第五届青年科学报告会论文(二等奖),1999年11月。[16] 邢红兵,汉语词语重叠结构统计分析,《语言教学与研究》,2000年第1期。人大复印资料中心《语言文字学》,2000年第6期转载。[17] 邢红兵,汉语水平词汇双音节词结构分析,北京语言文化大学第八届科学报告会论文。[18] 邢红兵、舒华、孟祥芝、尚悦,形声字声旁规则性效应调查,“国际华语教学研讨会”论文,2000年6月,新加坡。[19] 邢红兵,基于第三代语料库的信息领域术语动态更新,《语言文字应用》,2000年第2期。[20] 邢红兵,计算机领域汉英术语的特征及其在语料分布规律,Proceedings of 2000 International Conference on Multilingual Information Processing, Augest 9-13 Urumqi, China.[21] Sun Maosong, Zhou Qiang, Sun Honglin, Huang Changning, Zhang Pu, Xing Hongbing, Constructing a Word-segmented & POS-tagged Chinese Corpus and a Chinese Treebank, proceedings of 2000 International Conference on Chinese Language Computing, July 8-9, 2000[22] 邢红兵,计算机领域汉英术语的特征及其在语料分布规律,《术语标准化与信息技术》,2000年第3期。[23] 苑春法,李莼,崔永华,邢红兵(2001). 基于遗传算法的汉语构词研究. 《清华大学学报(自然科学版)》2001年Z1期。[24] Lu Qin, Li Yin, Xing Hongbing, Li Ngai Ling and Chan Shiu Tong(2002),The Hong Kong Glyph Specifications for ISO 10646's Ideographic Characters,Twenty-first International Unicode Conference, Dublin, Ireland, 14-17 May 2002.[25] Xing Hongbing, Shu Hua, LiPing (2002). A self-organizing connectionist model of character acquisition in Chinese. In Proceedings of the Twenty-fourth Annual Conference of the Cognitive Science Society. Mahwah, NJ: Lawrence Erlbaum.[26]张亚旭、舒华、周晓林、邢红兵(2003),汉字识别中声旁与整字语音信息激活的相对优势,《北京大学学报(自然科学版)》2003年,第1期。[27] 邢红兵(2003),留学生形声字声旁规则性效应调查,载于《对外汉语研究的跨学科探索——汉语学习与认知国际学术研讨会论文集》,北京语言大学出版社,2003年3月出版。[28] 邢红兵(2003),现代汉语常用动词带宾语能力调查。孙茂松,陈群秀主编,《语言计算与基于内容的文本处理》。清华大学出版社,2003年8月。[29] 邢红兵(2003),对外汉语教材的汉语拼音注音方法调查. 苏培成主编,《信息网络时代的汉语拼音》。语文出版社,2003年10月。[30] 邢红兵(2003),留学生偏误合成词的统计分析,《世界汉语教学》,2003年第4期。[31] 邢红兵(2004),基于“汉语水平词汇等级大纲”的语素数据库建设,《数字化对外汉语教学理论与方法研究》,清华大学出版社,2004年7月,北京。[32] 邢红兵、舒华(2004),《汉语水平词汇与汉字等级大纲》中形声字声旁表音特点分析,载于《汉语口语与书面语教学——2002年国际汉语教学学术研讨会论文集》,北京大学出版社,2004年10月出版。[33] 邢红兵、张旺熹(2004),现代汉语语法项目的标注与统计研究,“对外汉语研究”学术研讨会论文,2004年11月,北京。[34] Xing, H., Shu, H., & Li, P. (2005). The acquisition of Chinese characters: Corpus analyses and connectionist simulations. Journal of Cognitive Science.[35] 邢红兵(2005),信息技术领域术语用字分析,《术语标准化与信息技术》,2005年第1期。[36] 邢红兵(2005),面向对外汉语教学的动词用法频率词典. “对外汉语词典学国际研讨会”论文,2005年3月,香港。[37] 邢红兵(2005),《(汉语水平)汉字等级大纲》汉字部件统计分析. 《世界汉语教学》,2005年第2期。[38] 邢红兵(2006)对外汉语用字统计分析,张普等主编《数字化汉语教学的研究与应用》语文出版社,2006年6月。[39] 邢红兵(2006)《(汉语水平)词汇等级大纲》双音合成词语素统计分析,《世界汉语教学》,2006年第3期。[40] 张博、邢红兵(2006)对外汉语学习词典多义词义项收录排列的基本原则及其实现条件,第二届对外汉语学习词典学国际研讨会,北京。[41] 邢红兵(2006)基于标注语料库的“实用现代汉语语法项目词典”基本框架,第二届对外汉语学习词典学国际研讨会,北京。[42] 邢红兵、张文坚、江诗鹏(2006),面向对外汉语教学的谓词句法属性统计研究,《语言教学与研究》,2006年第3期。[43] Ping Li & Hongbing Xing(2006),Diease But No Sheep, Science Vol 311, 31 Marth 2006.[44] 张金竹、邢红兵(2007)词语的习得途径及对外汉语词汇教学,“第八届词汇语义学研讨会”论文,2007年5月,中国香港。[45] 邢红兵、舒华、李平(2007),小学儿童词汇获得的自组织模型,《当代语言学》,2007年第3期。[46] 南旭萌、李芬芬、邢红兵(2008),留学生汉语学习词典使用情况调查,郑定欧主编《对外汉语学习词典学国际研讨会论文集(三)》,中国社会科学出版社。[47] 蔡北国、邢红兵(2008),谈基于语料库的词的用法研究与词汇教学,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[48] 弓月亭、邢红兵(2008),语料库建设与语法教学,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[49] 张金竹、邢红兵(2008),小学阶段汉字音节的分布与存储,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[50] 邢红兵、舒华(2008),小学语文教材用字基础部件统计分析,《语言文字应用》,2008年第3期。[51] 邢红兵、张普(2009),《现代常用字部件及部件名称规范》特点解读及使用建议,《小学语文》,第7、8期。[52] 郝瑜鑫、邢红兵(2009),基于语料库和数据库的同义词辨析模式,第十届汉语词汇语义学研讨会,2009年7月,山东烟台。[53] 邢红兵(2009),基于联结主义理论的第二语言词汇习得研究框架,语言教学与研究国际学术研讨会,2009年7月,北京。[54] 邢红兵(2009),中介语词汇与现代汉语词汇对比分析,《对外汉语研究》,第五期。[55] 邢红兵(2009),基于联结主义理论的第二语言词汇习得研究框架,《语言教学与研究》,2009年第5期。人大复印资料中心《语言文字学》2010年第1期转载。[56]郝瑜鑫、邢红兵(2009),汉语学习型词典需求调查和基于大规模语料库的学习型词典编撰构想,汉语国际教育‘三教’问题学术研讨会,2009年10月。[57]郝瑜鑫、邢红兵(2010),基于大规模语料库的学习型同义词辨析模式初探,载亢世勇等主编《词汇语义学的新进展——第十届汉语词汇语义学论文集》,新加坡东方语言信息处理学会出版。[58] 陈永朝、邢红兵(2010),基于联结主义理论模型的留学生复合词习得考察,《现代语文》4月下旬刊。[59] 陈永朝、邢红兵(2010),基于分布表征的语义提取和语义透明度自动评估实验,《现代语文》3月下旬刊。[60] 王娟、邢红兵(2010),留学生单音节多义语素构词习得过程的实验研究,《语言教学与研究》,2010年第2期。[61] 张金竹、邢红兵(2010),留学生语素习得路径探析,《现代语文》第11期。[62] 郝瑜鑫、邢红兵(2010),汉语学习型词典需求调查研究——兼论初中级阶段学习型词典的编撰,载《汉语国际教育‘三教’问题——第六届对外汉语学术研讨会论文集》,外语教学与研究出版社出版。[63] Teuvo Kohonen and Hongbing Xing(2011). Contextually Self-Organized Maps of Chinese Notes in Computer Science, 2011, Volume 6731/2011, 16-29[64]邢红兵(2011),汉字统计研究与对外汉语教学,《汉字教学与研究》,第一辑。[65]邢红兵(2012),第二语言词汇习得的语料库研究方法,《汉语学习》,第2期。[66]郝瑜鑫、徐婷婷、邢红兵(2012),现代汉语常用副词AABB式句法语义研究,《语文学刊》(06) 。[67]邢红兵(2012),基于语料库的词汇知识提取及在二语词汇习得中的应用,第七届国际汉语电脑教学研讨会(TCLT),美国,夏威夷。[68]邢红兵(2012),中介语语料库虚词使用情况统计分析,第五届现代汉语虚词研究与对外汉语教学学术研讨会,吉林,延边大学。[69]邢红兵(2013),基于语料库的词语知识提取与外向型词典编纂,《辞书研究》,第2期。[70]邢红兵、辛鑫(2013). 第二语言词汇习得的中介语对比分析方法[J]. 华文教学与研究,02:64-72。[71]邢红兵(2013). 词语搭配知识与二语词汇习得研究[J]. 语言文字应用,04:117-126。[72]郝瑜鑫、刘汉武、邢红兵(2013). “就是……也/都……”的量级标示功能[J]. 汉语学习,05:65-70。[73]郝瑜鑫、邢红兵(2013). 现代汉语状语和状动结构研究评述[J]. 现代语文(语言研究版),04:13-14。

175 评论

萱萱小宝

对预测的Java对象辈子肇井上,米里stefanovi c ,会员的IEEE ,和Stephanie福里斯特,会员的IEEE 摘要-准确预测对象的寿命是很重要的改善记忆管理系统。目前垃圾收集相对粗粒的预言(例如, "短命"和"长寿命" ) ,并依靠应用独立启发式有关地方特色的分配。本文介绍了一种预测方法,是完全准确,使得其预言基于特定应用的培训,而不是应用独立启发式。由"完全准确" ,就是实现了粒度的预言是相等的最小单位分配。所述的方法,是第一家结合了高精确度和效率,在一个单一的寿命预估。全面准确预报,使我们,这是第一次,以研究零一辈子的对象。文件报告结果显示零一辈子物体的重要组成部分物件分配基准程序,为Java编程语言和表示,他们是与它们的分配语境(调用栈和分配旧址) 。超越zerolifetime 物体时,文件报告结果预测较长的居住对象,而在某些情况下,这是可以预测的寿命物体根据其分配的背景下(调用栈和分配旧址) 。为规范基准节目中,有多少个动态分配的对象,其要求的地点有准确的预测范围之内,由 %至61 % 。这种方法可以潜在性能的改善垃圾收集。该文件提出了一个死命令的收藏家( DOC )的,并分析了其实施间接及其尽可能最佳的性能。这项研究显示,如何记忆体效能,可提高使用额外提供的资料完全准确的预测。 指数计算物体在有生之年,工作量表征, pretenuring ,面向对象编程语言,垃圾收集, 程序行为。 ?导言垃圾收集的语言,如C #和Java等,是越来越重要。垃圾收集( GC )的好转开发人员的生产率,都不再需要外显记忆填海区,从而消除重要的来源编程错误。然而, 垃圾收集的语言招致增加开销,因此,要改善他们的表现对于以持续成功的,这些语言。 许多算法已提出过几次数十年以来,气相色谱法,发明了,但他们的表现已大量应用依赖性。举例来说, 菲茨杰拉德和塔尔迪蒂显示,一个垃圾回收器必须加以调整,以适应计划[ 1 ] 。另一种做法依靠较大的堆的大小和根本背道而驰收集算法不那么频繁。不过,这并不总是产生更好的绩效[ 2 ] 。气相色谱法通常算法做出某些假设有关辈子的申请的对象,并针对收集算法这些假设。如果假设是不传染的, 业绩不佳的结果。什么是需要的是有能力作出准确和精确预测物体在有生之年,并把这些预言成一般的GC算法,工程以及为广泛的申请。 间接的气相色谱法相比,明确deallocation , 源自成本的确定哪些物体仍在活跃(现场直播) ,并不再需要(死亡) 。气相色谱法算法,因此,去一些长度,以收集地区记忆体大多死亡。理想的垃圾回收器将收集所在地区的所有物体最近去世,使这堆太空是没有白费的,由死者的物体和生活物不属于加工不必要的。要做到这一点, 分配表,将需要知道确切的死亡时间的一个物体的时候,它被分配,然后它可以拨这一个地区,所占用的物体具有相同的死亡时间。 至目前为止,此项工作现已完成,只有在一个有限度地由一个过程,所谓" pretenuring " 。 pretenuring算法使粗大的预言对象辈子,预测其中分配将导致长寿命的对象,然后分配给他们的地区,是不是经常收集。 举例来说,在布莱克本等人。奇摩pretenuring计划[ 3 ] 对象分配到短命的,寿命很长,与永恒地区。正如本文将显示,无法预测辈子恰恰是一个障碍,以理想的垃圾收藏家。 现代语言运行时环境,提供一个财富仿形机制,以调查该国申请。在虚拟机(船民)的环境中,如由于C #和爪哇,剖面是一个重要的组成部分(准时化) 编制过程,并可能被利用来改善高性能的所有越南船民组成部分。在这篇文章中,我们查看如何分配-站点信息提供给船民可杠杆比率,以改善对象寿命的预测及如何这种能力可能受到剥削,由JIT编译器和收集系统。 该组织的这份文件具体内容如下:第一,我们证明有显着相关国家对栈上分配点和分配880的IEEE交易电脑上,第一卷。 55 ,没有。 7 , 2006年7月。每小时井上是与学校的计算机科学,卡尔顿大学, 赫兹伯格建设, 11时25分,由上校驾驶,渥太华,安大略省, k1s 5b6 加拿大。电子邮箱: 。 。四stefanovi C和美国福里斯特分别与计算机科学系, msc01 1130名, 1新墨西哥大学,阿尔伯克基,新墨西哥州87131 - 0001 。电子邮箱: (米,福里斯特) @ 。 手稿收到2003年12月19日;修订2004年12月16日;接纳12月7日2005年在网上公布2006年5月22日。 信息获取转载这篇文章,请发送电子邮件至: ,并参考ieeecs登录号码- 0291年至1203年。 0018-9340/06 /二十○点○○二○○六美元的IEEE出版的由IEEE计算机学会物体的一生。接下来,我们描述了如何这方面的资料可以用来预测对象辈子当时,他们正分配完毕。然后,我们显示,有显着比例的对象是零一辈子。接下来,我们分析的行为一个假设性的混合选区(死亡下令收藏家) 利用我们的预测方法,检查其执行情况间接成本,竟将其最佳的情况下的行为。最后,我们比较我们的研究结果与相关工作,并讨论其他应用潜力。 二对象寿命预测我们的方法是启发,巴雷特和佐恩的工作对象寿命预测在C应用[ 4 ] 。特别是, 两种方法都使用类似的资料,预测是建造同样使用运行简况,我们有通过他们的"自我预测"的考验。此外,我们已几次扩建工程。首先,我们用的是垃圾回收的语言, Java的,其中deallocation是含蓄了。 第二,我们推行了全面准确的预测;巴雷特和佐恩只用了两个回收箱-短期和长期的居住。最后, 我们已进行了较详细的分析,内容形成散装这份文件。 如前所述,一个目标对象的一生预测是,以提高性能,提供运行咨询,以内存分配子系统约一反对的,可能在一生的时间,这是分配。同样以巴雷特和佐恩,我们完成这项工作,由建设对象寿命预估指出,它预测资料显示,在分配时间。这包括语境的配置要求,即,动态序列的方法调用,导致了这一请求,并实际类型的对象被分配完毕。我们所说的,这信息作为分配的背景下,如果观察辈子所有的物体具有相同配置的背景是相同的, 那么,预估应预测值在运行时为所有的对象分配地盘。 我们尚未整合,我们预测到内存分配子系统,所以我们的测试是轨迹驱动而不是表现在运行。如果能够得到全面实施,我们的系统的运作,同样以其他简介驱动优化系统。首先,一个小的训练来说,将用来产生预测,而不是采伐迹。 随后运行,然后用预估为各种优化下文讨论。 我们认为,在两种情况下的预测:自我预测与真正的预测。自我预测[ 4 ]使用同样的程序跟踪训练(预估建造)作为为测试(预估使用) 。自预报提供了一个初步测试的假设,即分配的语境是好的预测对象有生之年实现这一目标。虽然自我揣测并不预测什么新的东西,它使我们能够研究在多大程度上其中国家的栈是与寿命对象分配在这一点上。这提供证据真正的预测是可能的。真正的预测是较为现实的情况下,在一间小型训练追查是用来构建预估,以及不同的较大微量(生成从同一程序,但使用不同的投入) 用于试验。如果自我预测业绩欠佳,那么真正的预测是不可能得逞的。但是,准确的自我预测中,并不一定意味着真正的成功预测。虽然我们有没有分析,它在细节, 我们期待着这次后者而言,是最可能发生在大量数据驱动程式。 负载对内存管理子系统定堆分配和死亡的事件,这是独立于其他运算的影响,这一计划。 因此,在一生中的一个对象,在气相色谱法研究会是定字节数的新的记忆体。 之间的分配它的诞生和死亡。更多具体而言,物体的一生,是被界定为总和的大小与其它物体之间的分配给定对象的分配和死亡的,它主要体现在字节或字。 我们评估预估业绩用4个定量措施:精确,范围,准确性和大小: 。精度是粒度的预测中的 全面准确预估精密1字节,例如,它可能预测某一分配点总是产量物体一辈子10304个字节。较少准确预报预测可能从一组几何比例回收箱,如8,192-16,383 (我们提及这些颗粒预测因素) ,或者是,我们以前所说,从一个小的一套回收箱等短命的,寿命很长,和永恒。我们的目的是要实现高精度(窄幅波动) 。在实践中, 理想的精度将取决于如何记忆配置子系统,利用预言。 。涵盖面的百分比为对象,其中预估作出了预测。我们构建预测因素,使他们做出预测只为分配的背景下,可以预见高信心。因此,在某些情况下,预估将没有预测,而不是只有一个,就是不太可能以正确的,以及记忆体分配子系统将需要一个后备分配策略,为这些例。尽管决定预测是百分之分配地盘时,自然衡量覆盖是百分比的实际用途拨款的事件是预言(动态计数) ,而不是百分比地点在哪一个预测,可以取得(一静态计数) 。理想的情况下,涵盖范围应高可能的。 。精度的百分比,就是预言物体预测正确。这就是,在所有的物体分配在运行时,为其中一个预测是, 有些人有一个真正的一生中属于在同一个射程为预测寿命;范围界定由精确参数。准确度应为尽可能地高。 。尺寸是多少作品中预估,那里反馈意见的一个广义的分配网站并预测该网站。由于预估应负有空间和时间开销在运行时,规模较小大小都更好。 有有趣的权衡取舍之间的精确度,范围, 精确度高,规模不大。举例来说,要预测选择范围和精确度。增加预估尺寸(添加更多参赛作品)允许或者更大报道(列明预测物体以前未盖)或更高的精度(通过指定井上等:对预测的Java对象辈子881 不同的预测,这些物体) 。也有一些显而易见贸易小康之间的覆盖面和准确度。 我们构建的预测分两个阶段进行。首先,我们收集了一个执行追踪每个程序,然后我们构建预估本身。微量包括准确记录每对象分配和死亡。每个分配活动,我们记录对象标识的,其类型,并执行语境。执行的背景下,代表国家对整个堆在时间的分配,构成了标识符的方法和字节偏移,储存整数。我们参考这方面的资料,作为栈字符串。在大多数情况下,我们能够减少信息量,由录音只有顶部少数作品栈(栈字符串前缀,或ssp1 )的影响进行研究,更改这么长的前缀。每死亡事件,是有记录到一个精度为1字节。这充分精度是独一无二的对象一生的痕迹,垃圾收集的语言。反对辈子文献报告中,几乎总是有颗粒状粒度为垃圾收集语言[ 3 ] 。这是因为反对死刑的活动,只能被发现,在收集站及收藏品都是相对生疏。我们用了一个实施的Merlin一代微量算法[ 5 ]内部jikesrvm开放源代码Java虚拟机[ 6 ]搜集充分准确的对象寿命数据。 梅兰作出绝对准确的实际,不执行频繁的垃圾藏品。相反,它imprints戳对物体在记忆的根,当分配在收集,一个对象的死亡时间,可计算所定的最后戳在传递闭的一组对象。 预测构成了一套预估参赛作品。 1 预估入境是一个3元组 ,正如显示图。 1 。微量元素,是用来建造一个预估相应的程序。就是一个条目添加到预估当且仅当所有辈子在训练相应的SSP和类型是一致的。这意味着,如果任何两个物体分配在同分配网站有不同的寿命,或发生碰撞, 预估将不会作出预测说,分配地盘。 这种类型的预估计算效率高和可调。举例来说,通常单身称霸预估并增加其大小。单身参赛,其中只有一个对象被分配在训练,所以并没有发生碰撞,可以消除了他们。这些参赛作品可能被拆除,以形成一个较小的预估未经大大减少覆盖面(因为每一个参赛作品。 用如此少见) ,如图所示,在图。 更先进策略,也可以设计出最佳的平衡范围和规模。 我们考虑以下3个方面的寿命预测: 。全面准确寿命预测。对象寿命预计到确切字节。 。粒状寿命预测。低精度办法,其中预估回收箱辈子根据该计划彬? log2elifetime吨排放计划。 因为大部分物体英年早逝,有效精度这种方法仍高。 。零寿命预测。预测只是预测零一辈子对象(那些死在下次对象分配) 。我们发现有些基准产生了一大批零一生物体。预测零一辈子物体是一个很有意思的子的完全精确的预测。 我们说明了这些概念和权衡,就例如基准图。 2显示如何预估覆盖范围和规模,在很大程度上依赖于过磷酸钙长度,因为它是多样从0至20 ,我们充分利用精确的寿命预测和单身被保留在预估。图。二地块过磷酸钙长度沿横轴。每个策划过磷酸钙价值,我们合成了一种预测,从训练得无影无踪。 预测的范围,即百分比对象分配在追查其中的预测作出了预测中,是策划沿纵轴。预估覆盖率提高了越来越过磷酸钙长度随着越来越多的资料,以供disambiguate分配的语境。 但是,这种影响高原上过磷酸钙约长10 , 暗示10是一个充分过磷酸钙长度。图。 2还显示出增长的预估规模,即有多少参赛作品,由于人们日益过磷酸钙长度。 图。三,让我们看看效果去除单身从预估。值得注意的是,预测涵盖面几乎不变,但预估人数急剧减少。 不包括单身揭示有趣相依882的IEEE交易电脑上,第一卷。 55 ,没有。 7 , 2006年7月图。 1 。一个单一的预估入境:过磷酸钙描述的执行路径的该程序。每个整数编码方法和立场,内部方法在下方法调用。整个弦乐指分配网站。所有字节数组( JVM的类[二)获配这个栈字符串前缀过了一生的64个字节。 图。 2 。效果栈前缀长度就预估规模和范围为例子基准pseudojbb (包括单身) 。 1 。这是不容混淆与上司堆栈指针,其中有同样的缩写。 2 。记忆的根是参照对象,程序,可以直接操控。例子是选民登记册及,特别是在爪哇, 提到在节目栈。 3 。基准周长从爪哇古组曲[ 7 ] , [ 8 ]用在这里因为它显示了行为原型。 4 。第3节描述了所用的基准,在我们学习。 其中过磷酸钙长度,预估规模,和覆盖面。有一个贸易小康之间的碰撞和单身人士-如果是过磷酸钙太短,有太多的物体相撞;如果是太长了,过磷酸钙转换进入单身人士和bloats预估大小。这种作用是体现在周边基准, 显示图。 4 ,其中有一个最高约为过磷酸钙全长8 ,然后衰变到一个高原。最高划分制度的碰撞,就在左边,而该制度单身人士,以正确的。 我们报告结果,在物体计数,而不是字节因为我们感兴趣的是如何做好预报的表现而定。对象计数是自然的单位,这考虑。然而,字节通常用在垃圾收藏家文学与我们搜集这些数据以及与类似的结果。这就是说,物体大小并不显着相关能否预测对象有生之年实现这一目标。 三基准和实验试验我们报告的数据就specjvm98和SPECjbb2000是基准。我们还收集了有关爪哇欧登基准[ 9 ] (数据未显示) ,但它们的大小,合成自然产生离群行为。该规范基准构成有用的"真实世界"节目(除的分贝,属于一种合成基准建造,以模拟数据库查询) ,并打算以代表实际应用上运行的Java虚拟机器。他们是写在各种编程风格,并可以行使堆不同。为详细的研究,个人基准'记忆行为,见dieckmann和何¨ lzle [ 10 ] 。表1描述了个别的基准和表2给出了一些一般性的运行特征分析基准。 我们采用了jikesrvm Java虚拟机版本 来自IBM 。具体配置是optbasesemispace 与梅兰扩建[ 5 ] 。这就是说, 优化编译器被用来编纂船民和基线编译器编译基准。该气相色谱法默认semispace收藏家(虽然注意了产生的微量是独立的集电极使用) 。 四自我预测自预报考验预估使用相同的微量元素,从它所建造的。因此,预报精度不一个问题-如果预测作出了预测,它会正确的。感兴趣的是权衡取舍之间的精确度, 覆盖率高,规模不大。我们报告结果进行全面的精度和对数粒度的,我们考虑的影响包括或不包括单身,从预测。 表3显示的结果。每个基准,一套初步运行进行了确定最佳过磷酸钙值(显示在栏目标记的"过磷酸钙" ) 。该过磷酸钙最优值确定,分别为充分精密和对数例。 完全准确的自我预测结果,为全面准确的自我预测(确实粒度) 显示在左侧的一半表3中,为预测指标与无单身人士。 预测因子包括单身所有的基准,显示了某种程度的覆盖面,特别是就在这种合成的基准分贝。大于50 % 井上等:对预测的Java对象辈子883 图。 3 。效果栈前缀长度就预估规模和范围为例子基准pseudojbb (不包括单身) 。 图。 4 。效果栈前缀长度就预估规模和范围为爪哇古代基准周长(不包括单身) 。 表1 基准,并有简短的描述什么样的,他们计算第一组包含specjvm98基准和第二组包含SPECjbb2000是基准。 涵盖面取得了压缩, mpegaudio , mtrt , pseudojbb , 和杰克和20 %以上对其余两个, 陈燕萍和javac 。预测取得更大的百分之九十以上报导只分贝。从我们的经验与DB和一套规模较小的基准不报,在这里,我们相信非常高覆盖数字并不那么典型的现实申请。这些结果表明完全准确预测可以达到合理报导一些,但不是所有的应用程序。正如我们将看到的,但是,即使温和的范围可能有益(第8条) 。 预测因子排除单身当单身条目被删除,从预测因子(栏目4-5 ,在表3 ) ,我们预期覆盖率下降,但我们想知道是多少。 两项基准,压缩和mpegaudio ,有预测因子这包括大批单身人士。涵盖范围每滴大约一半的时候,单身是被排除在外。对于剩下的,覆盖面下降不到一个百分点,而人数预估作品缩水戏剧性:最小的跌幅是百分之三十下降javac ,而分贝是不到1 % ,其以往的规模。该平均跌幅在尺寸大于76 % 。再次,分贝可反常,因为它是合成。 虽然其他研究的寿命,如哈里斯[ 11 ] 根据预测,只有对现行方法和类型,我们没有发现基准哪种仅足以产生的预测有显着的报道。基准陈燕萍和mtrt至少需要方法遏制分配网站(过磷酸钙的长度一)为有显着覆盖和休息需要更多。或许类型是不需要在所有的,但它disambiguates分配稀有案件的不同类型,是分配在同一分配点。注意,我们用的是流量敏感的概念了栈,录制两法和字节偏移每次通话。 概括地说,完全准确的预测范围相当一部分的所有基准。与单身被排除在外,预测仍然有显着的报道同时减少的人数参赛作品平均76 % 。 884的IEEE交易电脑上,第一卷。 55 ,没有。 7 , 2006年7月表2 痕量统计每个追查,物体的数目分配(第3栏)和总规模都分配对象(第4栏)给出。第五栏显示人数分配表;每个站点是算只有一次,即使签一次以上,与网站不会被处死,在这些特殊运行没有什么不好。最高段的表列出的痕迹,用于自我预测研究(第4条) 。底部的一部分,该表列出训练的痕迹,用在真正的预测研究(第5条) ;痕迹,从最高层的科重新用于测试的真正预测。 表3 自我预测结果前两栏的完全准确和对数粒度让结果以预测因素包括单身者使用过磷酸钙的长度20个,其中两例外情况:陈燕萍和javac ,为此,我们采用了较大的过磷酸钙价值报道,在第五纵队。 对数粒度正如我所期望者,表演者的颗粒状预测因素,还表现在表3中,是较充分精确的预测,因为这是一个比较容易的问题。 改善覆盖范围之内,由分贝的不少于1 %至javac的大于60 % 。平均七%的改善。该行为的颗粒状当预测因子去除单身是相似的完全确切的情况。唯一的戏剧性变化是,在压缩,其中象其余的基准; mpegaudio依然离群。 由于其对数斌大小,预测均高度精确的,为大量的短命的物体。 粒状预言已经更为迫切的应用较确切的案例,因为训练期,而在原则上,演出更迅速而不必依赖关于梅兰我们专注于确切的情况下, 然而,由于我们预期信息准确行为将展现新的渠道,为优化。 变异我们研究了一个更广泛的定义的预估,在其中预测辈子处理不同的过每分配作为一个算术级数。举例来说, 考虑一个回路分配对象的一个特定类型一个链表。当环路出入口,有些计算演出名单中,这是当时的搜集。每个对象河套已一辈子是低于其前任所常数是大小的物体。处理好这个,我们需要预测采用的分歧。更正式地, 预估作品成为四元组<过磷酸钙,类型,一生中, 增量> 。一生没有设置在训练中,除非增量被查出为零。这是每一个更新时间一个物体分配加入增量。在我国例如,一进入预估将可创造,如果每个对象的寿命差异由一个不断增量的顺序它被分配完毕。预测的寿命会初始化,由第一个对象分配测试过程中。 随后的预言会被加入增量(这将不利美元)的寿命。注这绝对寿命的预测,不能在网上进行直到后第一个对象匹配的条目已经死亡。 有趣的是,这一新的预测并没有表现良好对于任何的基准。我们发现,只有一个基准为此它做得好, em3d从爪哇古组曲, 其中微分拨款占 % 所有的预言。这不是一个很好的指标预测实力,不过,因为几乎所有的这些物体单身人士。至于其他的基准,调高预测能力平均为 % 。 另一个变化是利用优化编译器都对于运行时间和基准( optoptsemispace 配置) 。我们测试过这种变化,并对结果进行定性类似早先的实验(数据,而不是如图所示) 。 五真实预测巴雷特和佐恩发现真正的预测精度高对于基准有高覆盖在自我预测中,并没有数据驱动的。我们测试过真正的预测对一个子集的基准来看看这持有相关程度较高的精度。我们用陈燕萍, javac , mtrt ,千斤顶,并pseudojbb 。我们用过磷酸钙长度指定表3和包括单身人士。虽然这是不是一个详尽的研究,它表明真实预测做得好,结果可比向巴雷特和佐恩学习,即使有了更严格要求全面精确。 结果为五个例子列在表4 。为双方都充分准确和对数粒度,所有的的预测非常准确。三个基准, 然而,精度高,是在价格的范围。 报导说是微不足道,为陈燕萍, javac ,并mtrt 。其他基准的预测显示出相当大的报道。该差异报导可能是由于程度该计划是由数据驱动。举例来说,训练运行陈燕萍颇为不同,其试运行。在pseudojbb , 唯一不同的是,这么长的运行。尽管不是巨细无遗,这些例子让证据表明高准确的,真实的预测是有可能的一些应用而且,当精确的预报是可能的,这是非常准确的。 六零一辈子物体一场零和寿命的对象是拨,然后去世前明年物体分配。我们的能力,以研究对象辈子充分精确,让我们学习的行为zerolifetime 物体。 表5显示了一小部分零一辈子物体所产生的每一个基准和小部分我们能够预测采用自我预测。 有趣的是,很多的基准拨出大有多少零一辈子的对象。 所有的规格基准,产生了较高的比例。 零一辈子的物体,与javac分配,至少在13 % 。我们探索的潜在后果,这结果在第8条中。 井上等:对预测的Java对象辈子885 5 。这可完成使用世代收藏家中收集整整一代人是被迫在时间的倍数,其以往一代。培训期间,举例来说,第二代会收集一次,每两集苗圃为对数粒度与基地规模的苗圃。这使得为pretenuring 优化型,但属于短期的"理想"的垃圾收集。 表4 真正的预测范围和精度的预测产生的一个基准运行使用一个较小的投入,双方都充分准确和对数粒度对一个单独的,较大的基准。覆盖是百分比的对象,对此我们作出预言和准确度百分比,而这些对象,为我们的预测寿命是正确的。 七日预测和对象类型为了研究如何预测结果,是受一个物体的类型,我们制定了一个简单的分类分配对象根据自己的类型。我们用下列几类:应用类型,图书类型,并虚拟机种(因为虚拟机,我们使用的是写在Java本身) 。图书馆类型,是那些班属于Java的层次。船民班都是很容易确定自己的越南船民的前缀。应用班都是等。 如表6显示,全球覆盖(定义为更大百分之九十以上) ,通常与高覆盖的应用类型。这是有道理的,因为申请各类主宰对于大多数基准。例外,小勺和DB ,拨出许多图书馆的类型,专业性也高报道。预测的涵盖范围将取决于它是否能够预测类型所造成的应用程序行为,而不是超过潜在机制的编译器或船民。

342 评论

candy雨朦

我刚好也看了这个贴子,觉得内容很不错,准备把里面提到的五篇论文好好看看。五篇论文分别是:1.第一个挑战就是漏译,我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。Addressing the Under-translation Problem from the Entropy Perspective To appear in AAAI-20192.第二个挑战就是数据稀疏。多语言翻译 Multi-Task Learning for Multiple Language Translation 2015无监督学习 Phrase-Based & Neural Unsupervised Machine Translation 20183.第三个挑战 引入知识4.第四个挑战 可解释性 清华大学从注意力的角度去研究 Visualizing and Understanding Neural Machine Translation 20175.第五个挑战 语篇翻译Modeling Coherence for Discourse Neural Machine Translation AAAI-2019

336 评论

相关问答

  • 机器翻译方向的论文题目

    Research for How APCE impact the economy of East Asia

    wxb2066472463 6人参与回答 2023-12-07
  • 机器人研究相关论文

    现如今,随着社会经济发展,机器人开始被广泛应用于各行各业中,替工人进行一些复杂、繁重的体力劳动,能减轻人们的工作负担。下面是由我整理的工业机器人技术论文 范文

    你自己觉得 2人参与回答 2023-12-11
  • 关于翻译研究的论文

    英汉翻译过程包括理解和表达两个重要的阶段,只有在正确理解原文词义的基础上,才能正确地表达原文。下文是我为大家整理的关于英汉翻译论文范文的内容,欢迎大家阅读参考!

    ddungmickey 3人参与回答 2023-12-09
  • 论文机器翻译查重率

    毕业论文是大学生迈出学校大门的最后一个关卡,它是一个耗时耗力的事情,不是写完就万事大吉了,因为后面还有毕业论文查重和毕业答辩。今天就跟大家来说说毕业论文查重的问

    靓掣魅影 8人参与回答 2023-12-09
  • 机器翻译与人工翻译论文

    机器翻译长处: 机器翻译劣势: 人工翻译和机器翻译刚好相反,机器的劣势就是人工的优势,反之亦然。 解决方案: 根据文本类型和时间充裕程度决定主要使用哪种翻译。两

    吕鹤是谁 8人参与回答 2023-12-05