• 回答数

    5

  • 浏览数

    137

L张小猛
首页 > 学术期刊 > 关于文献检索的论文3000字

5个回答 默认排序
  • 默认排序
  • 按时间排序

筱晓鱼T3Y

已采纳

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 2.1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2.2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

267 评论

cathy101012

科技文献是科技知识的最基本、最重要的表现形式,是科技情报源。而科技文献检索是获得科技情报的最基本、最重要的途径和手段,主要包括检索工具和检索方法两方面的主要内容。通过这学期的学习和最后亲自上网查阅科技文献期刊,让我受益匪浅。我所查阅的三篇文献来自《中国期刊全文数据库》,让我对文献的检索有了一定的了解,甚至对文献的检索方式都有一定的了解。通过什么方式查询会查到什么样的结果。 科技文献的作用毋庸置疑,对我们学生的学习有着莫大的帮助,无论是拓宽知识面还是巩固所学的知识,我们都能找到一定的文献,阅读并参透别人的思想。对自己的文献的发表,对学生的论文都有一定的助力。而且他的作用并不是如此简单的,你可以通过不同时间的文献可以知道计算机或者通信发展的历程。了解最近发表的文献和明白将来的发展趋势。对自己以后的方向的定位提供了很好很实用的方向标。让我们在以后的学习里,朝着这个方向提供动力,提供一些专业的基础。不仅仅如此,他可以让你的英语水平得到一定的提高,一些国外的文献不仅有科研价值,而且还具备了最前沿的潜质。因此,通过读一些简单的英文文献,提高自己的英语水平。只有自己的英语水平提高了,我们才能读的懂一些大型甚至是高深的文献。赞同2| 评论

260 评论

流浪停吗

你是本科吗?

135 评论

英式风情茶

图书: 著者编者.书名章名。其他作者。出版地。出版射。出版时间。页码 press publsher bookcompany 期刊 著者姓名。文章名。期刊名。 期数。出版年月。页次 journal transaciton proceeding letterannual acta bulletin rewiew progress communiaction 会议文献? 著者名称。文章篇名。会议名称。会议召开事项。数。页次。 conference cgapter pdf symp.osium convention workshop meeting congress assembly seminar 报告 作者。报告名。表示报告次。报告号。报告完成单位。报告完成时间 report 专利 发明人名。发明标题。国际专利号。转移申请日期。专利号:专利国代码-序号 patent'' 标准文献STANDARD 封面: 项目名称 检索单位 委托人 委托时间 完成时间 正文: 项目要点 检索情况:检索系统、选用数据库、检索年限、检索策略(这部分比较重要,体现检索的科学性,也直接影响到检索的查全率和查准率) 检索结果:结论 检索人 检索单位(盖章) 检索时间

336 评论

昆山angelababy

计算机论文,看这里:

355 评论

相关问答

  • 关于文献检索的论文1000字

    科技文献是科技知识的最基本、最重要的表现形式,是科技情报源。而科技文献检索是获得科技情报的最基本、最重要的途径和手段,主要包括检索工具和检索方法两方面的主要内容

    mono默默 3人参与回答 2023-12-11
  • 科技文献检索期末论文3000字

    科技文献是科技知识的最基本、最重要的表现形式,是科技情报源。

    刘彦热茶 3人参与回答 2023-12-06
  • 化工文献检索课程论文3000字

    检索词就是你用来检索的语词,比如你这个,可以分成 人力资源 人力资源管理 算机应用 等检索词 ; 检索策略就是你要怎么检索,比如先查 “人力资源”,在结果中查“

    素颜~红太狼 2人参与回答 2023-12-11
  • 文献信息检索课程论文3000字

    高校文献信息检索的必要性与有效方法论文 在学习、工作中,大家总免不了要接触或使用论文吧,论文可以推广经验,交流认识。如何写一篇有思想、有文采的论文呢?以下是我收

    DP某某某 2人参与回答 2023-12-08
  • 文献检索论文3000字建筑学

    建筑学毕业论文参考文献大全 接地气的大学生活即将结束,毕业论文是每个大学生都必须通过的,毕业论文是一种的检验学生学习成果的形式,怎样写毕业论文才更能吸引眼球呢?

    盖世在在 2人参与回答 2023-12-09