欢迎来到学术参考网

论自然语言处理

发布时间:2015-12-14 13:57

摘 要:自然语言处理是人工智能的一个重要应用领域。它的主要目的是克服人机对话中的各种限制,使用户能用自己的语言与计算机对话。本文介绍了自然语言处理的概念、发展历史和应用技术。

关键词:自然语言;自然语言处理
  自然语言是指人们日常使用的语言,如汉语、英语、日语、法语等,它是人类学习环境和互相通讯的工具。在人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机的应用而言,据统计用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。所谓语言信息处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。根据可计算性理论,任一计算机的运算都是按一定程序,分步骤相继作用在离散对象之上所完成的,而这些对象又都以线性序列相邻接地排列组合所构成。而自然语言具有的离散性、序列性和邻接性三个特征其具备了“可计算性”,为自然语言处理奠定了物质基础。
1.自然语言处理概述
  所谓自然语言处理,就是利用计算机技术研究和处理语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。自然语言处理通常又叫自然语言理解,因为处理自然语言的关键是要让计算机“理解”自然语言。但什么是“理解”呢?对于这个术语也存在着各式各样的认识。如心理学家认为,理解是“紧张的思维活动的结果”,哲学家认为,理解是“认识或揭露事物中本质的东西”,而逻辑学家则认为理解是“把新的知识、经验纳入已有的认识结构而产生的”。这样,自然语言的理解过程,实质上是把一种表达转换为另一种表达的过程,这种转换也可视为映射。建立自然语言理解系统就是寻求映射的算法,使机器能够得到同人在理解上相当的输出。判断机器是否理解语言的最直观的方法,当然是依据机器对你所提出问题的回答,来判定机器是否理解了你的问话。
2.自然语言处理的发展历史
  自然语言处理的研究大体上经历了三个时期,即60年代以关键词匹配为主流的早期,70年代以句法-语义分析为主流的中期, 和80年代开始走向实用化和工程化的近期。
2.1以关键词匹配为主流的早期历史
  当通用计算机问世时,人们想到的第一件事就是用计算机把一种语言翻译成另一种语言。在开始的15年(1950-1965年),机器翻译几乎成了所有自然语言处理系统的中心课题。当时人们相信好的译文可以通过分别处理查词典和重新排列词序两步操作来得到。于是那时的学者们普遍认为机器翻译包括两个基本过程,即查词典和语法分析。即首先通过查词典,将源语文章的每个词的对应的目标词查找出来,然后再进行第二步,即语法分析——调整词序、词尾和形式等等。
2.2以句法-语义分析为主流的中期历史
  进入70年代以后,一批采用句法-语义分析技术的自然语言理解系统脱颖而出。这个时期的代表作是LUNAR,SHRDLU和MARGIE系统。这些系统的主要特点是在句法,语义的分析中采用了所需要的知识表达形式和处理模型,尽管它还是局限在某个领域内,但在语言分析的深度和难度方面都比早期系统有了长足的进步,能够更好地理解自然语言,标志着自然语言处理进入了一个新的阶段。下面以LUNAR系统作为例子。
2.3走向实用化和工程化为特征的近期历史
  自然语言的最大特点就是充满了歧义。句法分析达不到令人满意的效果,是由于其不能很好地解决自然语言中的各种歧义现象。因此语义分析就成了自然语言理解的研究主题。其目的是根据上下文辨识一个多义词在指定句子中的确切意义,然后根据该句子的句法结构和各词的词义推导出这个句子的句义,并用形式化的方式表达出来,从而使计算机能够根据这一表示进行推理。到80年代一批新的语法理论脱颖而出,具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG)等。
  基于语料库的方法主要存在两个问题:首先,由于只是根据概率统计值来进行自然语言处理,因此缺乏对语言内部的深入理解,导致正确率受到极大的限制;其次,模型要求大规模语料库和人工标注工作量过大之间存在矛盾。可以通过以下的方法来解决上述的问题:首先,是引入部分规则机制来弥补对语言理解的不足,也就是规则和统计相结合的汉语自动分词;其次,通过引入开放学习机制,不断修正统计数据,弥补语料统计数据的局限性。
3.自然语言处理的应用
  当前在计算机普及应用中,为了让计算机更方便地为人类服务,人们迫切希望用自然语言同计算机进行通讯的时代早日到来,这正是计算机科学家,语言学家,心理学家等寻求的目标。自然语言处理研究的历史虽不很长,但就目前已有的成果足以显示它的重要性和应用前景。在美、英、日、法等发达国家,自然语言处理如今不仅作为人工智能的核心课题来研究,而且也作为新一代计算机的核心课题来研究。从知识产业的角度来看,自然语言处理的软件也占重要地位,专家系统,数据库、知识库,计算机辅助设计系统、计算机辅助教学系统、计算机辅助决策系统,办公室自动化管理系统、智能机器人等,无一不需要用自然语言做人-机界面。从长远看,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引,自动文摘,自动写故事小说等领域,具有广阔的应用领域和令人鼓舞的应用前景。

参考文献:
[1] 孙艳峰,王建荣,冯志勇. Ontology技术在自然语言理解中的应用.青海师范大学学报(自然科学版),2003(3)
[2]辛日华. 计算机自然语言处理. 呼伦贝尔学院学报,2003(2)
[3] 邱君瑞.自然语言处理与信息检索系统.情报杂志,2002(3)
[4] 隋然.自然语言与逻辑语言:人脑与电脑.外语与外语教学,2003(1)
[5]姚佳梅.基于自然语言理解技术的网络搜索.图书馆工作与研究,2003(2)

上一篇:信息时代对提高计算机课程教学质量的思考

下一篇:计算机在医院门诊的应用