信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。
先跟你讲一下2000字的论文范文格式,照个这个格式来,才能进行论文的写作,也会跟你分享一篇范文,希望可以帮助到你吧,望采纳!2000字论文范文的基本格式本科生毕业论文(设计)格式的统一要求学位论文是表明作者具有开创性研究成果,或在研究工作中具有新的见解,并据此为内容撰写而成,作为提出相应评审用的学术论文。为进一步提高学位论文的质量,规范学位论文的撰写、打印及装订格式,并便于储存、检索、利用及交流等,特制定如下要求:一、毕业论文内容和格式学位论文用纸规格为A4,页面上边距和左边距分别为3 cm,下边距和右边距分别为5 cm。页眉:奇页页眉为“长治学院本科毕业论文(设计)”,偶页页眉为论文题目(不包括副题目),居中,5号宋体字,页边距为2 cm。页脚:需设置页码,页码从正文第一页开始编写,用阿拉伯数字编排,正文以前包括摘要的页码用罗马数字,一律居中。1、封面:封面内容包括论文题目、指导教师、学生姓名、学号、系(部)、专业、毕业时间等信息,此页不编排页码。2、题目:题目应概括整个论文最主要的内容,恰当、简明、引人注目,力求简短,严格控制在20字以内。3、摘要:① 正论文第一页为中文摘要,学位论文摘要约300~500字,应说明工作的目的、研究方法、结果和最终结论。要突出本论文的创造性成果或新的见解,语言力求精炼。为便于文献检索,应在本页下方另起一行注明本文的关键词(3~5个);② 英文摘要在文后(参考文献后),内容与中文同,不超过250个实词,上方应有英文题目。第二行写学生姓名,指导老师…等信息;关键词,应与中文对应,便于交流。外文论文(设计)的中文摘要放在英文摘要后面编排。本内容转载于top期刊论文网中文摘要:(1)标题小4号黑体,5行距,段前0行,段后0行;(2)主体部分用小4号宋体,5倍行距;(3)关键词:小4号宋体。英文摘要:(1)题目用小2号Times New Roman,5行距,段前0行,段后0行;(2)主体部分用5号Times New Roman,5倍行距;(3)关键词:小4号Times New Roman。4、目录:应独立成页,包括论文中全部章、节的标题(即一级、二级标题)及页码。目录要求标题层次清晰,应与正文中的标题一致,附录也应依次列入目录。(1)“目录”二字,中间空2格,小2号黑体,段前段后5行距;(2)主体部分用小4号宋体,左对齐,段前段后为0,5倍行距;5、引言:在论文正文前,应阐述本课题研究的目的、意义、对本研究国内外研究现状有针对性的简要综合评述和本论文所要解决的问题等。6、正文:是学位论文的核心。写作内容可因研究课题性质而不同,一般包括:①理论分析;②研究材料和实验计算方法;③经过整理加工的实验结果的分析讨论,与理论计算结果的比较;本研究方法与已有研究方法的比较等。(1)正文部分① 正文标题:1级标题:黑体4号字,段前5行,段后5行;2级标题:宋体加黑,小4号字,段前5行,段后0行;3级标题:楷体GB2312,小4号字,Times New Roman;② 正文内容:宋体小4号字,首行缩进,5行距。引言和正文凡是引用文献处,应在引用句后括号[ ]内标明1 2 3 ,上标。示例为:[1]。(2)量和单位各种计量单位一律采用国家标准GB3100—GB3102-93。非物理量的单位可用汉字与符号构成组合形式的单位。(3)标点符号标点符号应按照国家新闻出版署公布的“标点符号使用方法”的统一规定正确使用,忌误用和含糊混乱。(4)外文字母外文字母采用我国规定和国际通用的有关标准写法。要分清正斜体、大小写和上下脚码。(5)公式公式一般居中放置;小4号宋体,公式的编号采用阿拉伯数字分级编写,用括号括起写在右边行末,公式与编号之间不加虚线。公式下有说明时,应在顶格处标明“注:”。较长公式的转行应在运算符号处。(6)表格和插图① 表格。每个表格应有自己的表序和表题。表内内容应对齐,表内数字、文字连续重复时不可使用“同上”等字样或符号代替。表内有整段文字时,起行处空一格,回行顶格,最后不用标点符号。表序及表名置于表的上方,中文五号宋体字,Times New R,表采用阿拉伯数字分级编写。表格用三线表。表头文字宋体加粗,表内文字宋体5号。② 插图。每幅图应有自己的图序和图题。一般要求采用计算机制图。 图序及图名置于图的下方,中文为五号宋体字,5号Times New R。图采用阿拉伯数字分级编写。③ 图、表中的附注写在图或表的下方,小5字体,字母顺序编号。7、结论:结论应该明确、精炼、完整、准确。是最终的、总体的结论,不是正文中各段小结的简单重复。应认真阐述自己的创造性工作在本领域中的地位和作用,自己的新见解的意义,也可以在结论中提出建议、研究设想、仪器设备改进意见、尚待解决的问题等。8、参考文献:参考文献一律放在文后,其书写格式应根据GB3469-83《文献类型与文献载体代码》规定,以单字母方式标识:M专著,C论文集,N报纸文章,J期刊文章,D学位论文,R研究报告,S标准,P专利。(1)只列作者阅读过,在正文中被引用过,正式发表的文献资料。(2)标题4号黑体;主体部分可按一般学报格式,5号宋体字,包括作者、题目、来源(出版期刊名称、年份、卷数、期数和页数。书籍须注明出版单位和年份)。段落5倍行距。9、致谢:英文摘要之后。应以简短的文字对在课题研究和设计说明书(论文)撰写过程中曾直接给予帮助的人员(例如指导教师、答疑教师及其他人员)表示自己的谢意,这不仅是一种礼貌,也是对他人劳动的尊重,是治学者应有的思想作风。字数不宜超过300字。10、附录:最后一页。二、学位论文书写及印刷要求1、学位论文一般1万字内,用计算机双面打印,字迹要清楚,标点符号要正确。2、学位论文封面采用全系统一格式(见附件模板)。书脊应包含论文题目和作者姓名,要求用宋体字书写。3、提交的论文,应是根据评阅人和答辩委员的意见认真修改过的,正文中的错别字率不得超过1‰,标点符号一律中文状态下输入的。【如:,;。()】;图表清晰(最好是非复印件,尤其是彩图),以确保质量。2000字论文范文大学生论文撰写浅谈摘要:针对大学生毕业论文撰写的文献信息需求特点和网络环境下图书馆文献资源服务方式的变化与发展,提出了高校图书馆在大学生毕业论文撰写中的服务路径。走进心仪的象牙塔,许多的同学就会发现:论文写作是常见的,但应该如何撰写一篇论文,却没有固定的模式可供参考。然而,无固定模式并不意味着论文的写作就无规律可循,笔者认为在论文的写作过程中应注重以下七个方面:第一方面,确定选题对象(确定论文的选题)。理论上来说,选任何本专业范围内的题目都能够写出东西来,只要你有新观点、新发现、新角度、新研究方法、新材料等。但是请牢记:Well begin is half done!一个好的选题等于论文成功了一半!在明确选题对象时应注意两个问题:一是选择对象要具有实用性,一篇好的论文旨在对社会现实生活具有一定的指导意义,如果仅仅是空谈理论无异于镜中花水中月中看不中用;二是要具有新颖性,尽量选择比较新的对象进行写作,不要重复前人的工作。第二方面,明确选择对象的研究意义。大的方面来说一篇好的论文可以推动一个行业的发展,小的方面来说可以解决企业的实际问题或对问题的解决具有借鉴意义。论文的写作应该站在一个比较高的角度,视野就会宽广看问题就会比较全面,并且更容易抓住事物的本质。而要做到这一点首先应明确选题的意义:首先,注意选题的实用价值,选择具有现实意义的题目。所谓论文的实用价值,就是指我们选的题目,应是与社会生活密切相关、为干百万人所关心的问题,特别是社会主义现代化建设事业中亟待解决的问题。这类问题反映着一定历史时期和阶段社会生活的重点和热点,是与广大人民群众的利益息息相关的。我们运用自己所学的理论知识对其进行研究,提出自己的见解,探讨解决问题的方法,这是很有意义的。这不仅能使自己所学的书本知识得到一次实际的运用,而且能提高自己分析问题和解决问题的能力。其次,要注意选题的理论价值。我们强调选题的实用价值,并不等于急功近利的实用主义,也绝非提倡选题必须有直接的效益作用。作为论文,无论是形式还是内容都和工作总结、调查报告有着区别。一般说来,它由论点、论据、论证三大要素构成,文章要以逻辑思维的方式为展开的依据,在事实的基础上展开严谨的推理过程,得出令人信服的结论。它着重探讨和研究事物发展的客观规律,阐述自己对这些规律的了解与认识,给人以认识上的启迪。因此,选择现实性较强的题目,还要考虑其有无理论和认识上的价值,即有无普遍性的意义,能否能进行理论的分析和综合,从个别上升到一般,从具体上升为抽象。第三方面,论文的整体结构。论文的撰写过程应该遵守基本的原则:提出问题,分析问题,解决问题。提出问题部分应说明研究这一课题的主要内容、理由、意义,这一部分要写得简洁,一定要避免像作文那样,用很长的篇幅写自己的心情与感受,不厌其烦地讲选定这个课题的思考过程。同时应注意,问题的提出要明确、具体,有时要写一点历史的回顾,关于这个课题,谁作了哪些研究,作者本人将有哪些补充、纠正或发展,这便于读者阅读、理解本论文。分析问题部分是具体的展开论题,表达作者个人研究成果的部分,它是论文的主体部分,必须下功夫把它写充分、写好。有些论文,提出的问题很新颖、也很有见地,但是本部分写得却很单薄、论证不够充分、分析不到位,勉勉强强引出的结论也难以站住脚。这样的论文是缺乏科学价值的,所以一定要全力把分析问题部分写好。解决问题部分是对分析、论证的问题加以综合概括,引出基本论点,或是有针对性的提出解决问题的措施和建议,这是论文要解决问题的答案。这部分要写得简要具体,使读者能明确了解作者独到见解之所在。最值得注意的是,这部分必须是论文分析论证后自然得出的结果,论文最忌讳论证得并不充分,而妄下定论。要首尾贯通,成为一个严谨的、完善的整体。第四方面,论文层次。作为一篇论文,从思想的发展来说,要一层一层地讲,讲透了一层,再讲另一层意思。开头提出的问题,文章中要有分析,结尾要有回答,做到前呼后应;章节内容的安排要合理,时间上可以从古至今、亦可由今溯古,空间上由宏观到微观、由国外到国内,尽量要全面合理。文章要有层次,有条理,这和材料的安排处理关系极大,材料之间的相互关系不同,处理方式也就不同,不能错乱,错乱了,层次就不清楚,自然也不会有条理。论文总体结构成型后要看看 各层次是否明白清晰,有无重复或相互矛盾的地方,有无缺少或多余之处,意思上是否连贯通畅,是否达到了各分论点的证明要求。第五方面,论文逻辑。众所周知,人们要进行思维,就要使用概念、判断、推理等思维形式。这些思维形式既是人类用来反映客观现实的手段,又是构筑论文的基本材料。只有掌握了这些思维形式及其有关的逻辑要求,才能写出具有符合逻辑的论文来。因此,我们在撰写论文的过程中,应当遵守逻辑的基本规律,自觉地将这些基本规律,贯穿于写作的各个环节和整篇论文当中,具体说来,则要注意以下几个问题:(1)论文内容符合客观实际,能够令人信服;(2)概念明确,判断恰当,推理连贯;(3)论文的内容之间有着密切的联系,全篇论文形成统一的整体;(4)各层次之间的过渡与照应要吻合,起承转合要自然得体,各段落之间的衔接要紧密。第六方面,语言表达。正如马克思所说的:“语言是思想的直接现实。”论文写作尽管需要具备选题、取材、构思、技巧等多方面的能力,但这一切都必须也只能通过语言来体现,来完成。语言表达的水平直接影响论文的表现力和感染力。只有了解语言的特点,并且有比较丰富的语言储备,才能写好论文。语言的表达效果,直接关系着论文的质量。因此,过好语言关,也是写好论文的重要一环。各类文章尽管文体不同,各具特点,但对语言表达的基本要求是共同的,这就是准确、简练、生动。论文的语言表达同样要求做到简捷、明快、形象、生动、准确、科学。简捷就是造句干净利落。用语“贵乎精要”,以最简洁的语言表达尽可能丰富的内容,做到“文约而事丰,言简而意赅”;“准确”是从总体上要求语言讲求科学性和逻辑性,能准确地表达论文的内容和思想感情;论文在具备观点正确、鲜明,语言准确、简练的前提下,还要力求做到语言生动,让人读起来不枯燥乏味。第七方面,论文内容。论文成功与否、质量高低、价值大小,很大程度上取决于文章是否有创新性。所谓创新性,即论文中表现出自己的新看法、新见解、新观点。有了较新颖的观点,文章就有了灵魂,有了存在的价值。对文章的创新性,可以总结为以下几个方面:第一“破旧”,对已有的观点、材料、研究方法提出质疑,并提出自己新的观点和看法,并证明自己观点的正确性,启发人们重新思考问题。第二“补充”,对已有的观点、材料、论证方法进行全面的考察,发现其不足或者是过时之处并加以修改补充。第三“解难”,从现实生活中发现问题,把握问题的本质,上升到理论高度,进而提出解决问题的措施或建议,在理论上给实践以指导。第四“预知”,对现有事物进行前瞻性的预测,并针对可能出现的问题进行理论上的研究。以上四个方面只是对“创新性”一个大体的概括,但只要能做到其中一点,就可以认为文章的选题有了新意。总结:如上所述,关于大学生论文方面的范文已经为您准备好了,供您学习与参考,如果您有论文发表方面的疑问,可以直接来电咨询我们。
同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。二、信息检索信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。三、知识检索知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。
先跟你讲一下2000字的论文范文格式,照个这个格式来,才能进行论文的写作,也会跟你分享一篇范文,希望可以帮助到你吧,望采纳!2000字论文范文的基本格式本科生毕业论文(设计)格式的统一要求学位论文是表明作者具有开创性研究成果,或在研究工作中具有新的见解,并据此为内容撰写而成,作为提出相应评审用的学术论文。为进一步提高学位论文的质量,规范学位论文的撰写、打印及装订格式,并便于储存、检索、利用及交流等,特制定如下要求:一、毕业论文内容和格式学位论文用纸规格为A4,页面上边距和左边距分别为3 cm,下边距和右边距分别为5 cm。页眉:奇页页眉为“长治学院本科毕业论文(设计)”,偶页页眉为论文题目(不包括副题目),居中,5号宋体字,页边距为2 cm。页脚:需设置页码,页码从正文第一页开始编写,用阿拉伯数字编排,正文以前包括摘要的页码用罗马数字,一律居中。1、封面:封面内容包括论文题目、指导教师、学生姓名、学号、系(部)、专业、毕业时间等信息,此页不编排页码。2、题目:题目应概括整个论文最主要的内容,恰当、简明、引人注目,力求简短,严格控制在20字以内。3、摘要:① 正论文第一页为中文摘要,学位论文摘要约300~500字,应说明工作的目的、研究方法、结果和最终结论。要突出本论文的创造性成果或新的见解,语言力求精炼。为便于文献检索,应在本页下方另起一行注明本文的关键词(3~5个);② 英文摘要在文后(参考文献后),内容与中文同,不超过250个实词,上方应有英文题目。第二行写学生姓名,指导老师…等信息;关键词,应与中文对应,便于交流。外文论文(设计)的中文摘要放在英文摘要后面编排。本内容转载于top期刊论文网中文摘要:(1)标题小4号黑体,5行距,段前0行,段后0行;(2)主体部分用小4号宋体,5倍行距;(3)关键词:小4号宋体。英文摘要:(1)题目用小2号Times New Roman,5行距,段前0行,段后0行;(2)主体部分用5号Times New Roman,5倍行距;(3)关键词:小4号Times New Roman。4、目录:应独立成页,包括论文中全部章、节的标题(即一级、二级标题)及页码。目录要求标题层次清晰,应与正文中的标题一致,附录也应依次列入目录。(1)“目录”二字,中间空2格,小2号黑体,段前段后5行距;(2)主体部分用小4号宋体,左对齐,段前段后为0,5倍行距;5、引言:在论文正文前,应阐述本课题研究的目的、意义、对本研究国内外研究现状有针对性的简要综合评述和本论文所要解决的问题等。6、正文:是学位论文的核心。写作内容可因研究课题性质而不同,一般包括:①理论分析;②研究材料和实验计算方法;③经过整理加工的实验结果的分析讨论,与理论计算结果的比较;本研究方法与已有研究方法的比较等。(1)正文部分① 正文标题:1级标题:黑体4号字,段前5行,段后5行;2级标题:宋体加黑,小4号字,段前5行,段后0行;3级标题:楷体GB2312,小4号字,Times New Roman;② 正文内容:宋体小4号字,首行缩进,5行距。引言和正文凡是引用文献处,应在引用句后括号[ ]内标明1 2 3 ,上标。示例为:[1]。(2)量和单位各种计量单位一律采用国家标准GB3100—GB3102-93。非物理量的单位可用汉字与符号构成组合形式的单位。(3)标点符号标点符号应按照国家新闻出版署公布的“标点符号使用方法”的统一规定正确使用,忌误用和含糊混乱。(4)外文字母外文字母采用我国规定和国际通用的有关标准写法。要分清正斜体、大小写和上下脚码。(5)公式公式一般居中放置;小4号宋体,公式的编号采用阿拉伯数字分级编写,用括号括起写在右边行末,公式与编号之间不加虚线。公式下有说明时,应在顶格处标明“注:”。较长公式的转行应在运算符号处。(6)表格和插图① 表格。每个表格应有自己的表序和表题。表内内容应对齐,表内数字、文字连续重复时不可使用“同上”等字样或符号代替。表内有整段文字时,起行处空一格,回行顶格,最后不用标点符号。表序及表名置于表的上方,中文五号宋体字,Times New R,表采用阿拉伯数字分级编写。表格用三线表。表头文字宋体加粗,表内文字宋体5号。② 插图。每幅图应有自己的图序和图题。一般要求采用计算机制图。 图序及图名置于图的下方,中文为五号宋体字,5号Times New R。图采用阿拉伯数字分级编写。③ 图、表中的附注写在图或表的下方,小5字体,字母顺序编号。7、结论:结论应该明确、精炼、完整、准确。是最终的、总体的结论,不是正文中各段小结的简单重复。应认真阐述自己的创造性工作在本领域中的地位和作用,自己的新见解的意义,也可以在结论中提出建议、研究设想、仪器设备改进意见、尚待解决的问题等。8、参考文献:参考文献一律放在文后,其书写格式应根据GB3469-83《文献类型与文献载体代码》规定,以单字母方式标识:M专著,C论文集,N报纸文章,J期刊文章,D学位论文,R研究报告,S标准,P专利。(1)只列作者阅读过,在正文中被引用过,正式发表的文献资料。(2)标题4号黑体;主体部分可按一般学报格式,5号宋体字,包括作者、题目、来源(出版期刊名称、年份、卷数、期数和页数。书籍须注明出版单位和年份)。段落5倍行距。9、致谢:英文摘要之后。应以简短的文字对在课题研究和设计说明书(论文)撰写过程中曾直接给予帮助的人员(例如指导教师、答疑教师及其他人员)表示自己的谢意,这不仅是一种礼貌,也是对他人劳动的尊重,是治学者应有的思想作风。字数不宜超过300字。10、附录:最后一页。二、学位论文书写及印刷要求1、学位论文一般1万字内,用计算机双面打印,字迹要清楚,标点符号要正确。2、学位论文封面采用全系统一格式(见附件模板)。书脊应包含论文题目和作者姓名,要求用宋体字书写。3、提交的论文,应是根据评阅人和答辩委员的意见认真修改过的,正文中的错别字率不得超过1‰,标点符号一律中文状态下输入的。【如:,;。()】;图表清晰(最好是非复印件,尤其是彩图),以确保质量。2000字论文范文大学生论文撰写浅谈摘要:针对大学生毕业论文撰写的文献信息需求特点和网络环境下图书馆文献资源服务方式的变化与发展,提出了高校图书馆在大学生毕业论文撰写中的服务路径。走进心仪的象牙塔,许多的同学就会发现:论文写作是常见的,但应该如何撰写一篇论文,却没有固定的模式可供参考。然而,无固定模式并不意味着论文的写作就无规律可循,笔者认为在论文的写作过程中应注重以下七个方面:第一方面,确定选题对象(确定论文的选题)。理论上来说,选任何本专业范围内的题目都能够写出东西来,只要你有新观点、新发现、新角度、新研究方法、新材料等。但是请牢记:Well begin is half done!一个好的选题等于论文成功了一半!在明确选题对象时应注意两个问题:一是选择对象要具有实用性,一篇好的论文旨在对社会现实生活具有一定的指导意义,如果仅仅是空谈理论无异于镜中花水中月中看不中用;二是要具有新颖性,尽量选择比较新的对象进行写作,不要重复前人的工作。第二方面,明确选择对象的研究意义。大的方面来说一篇好的论文可以推动一个行业的发展,小的方面来说可以解决企业的实际问题或对问题的解决具有借鉴意义。论文的写作应该站在一个比较高的角度,视野就会宽广看问题就会比较全面,并且更容易抓住事物的本质。而要做到这一点首先应明确选题的意义:首先,注意选题的实用价值,选择具有现实意义的题目。所谓论文的实用价值,就是指我们选的题目,应是与社会生活密切相关、为干百万人所关心的问题,特别是社会主义现代化建设事业中亟待解决的问题。这类问题反映着一定历史时期和阶段社会生活的重点和热点,是与广大人民群众的利益息息相关的。我们运用自己所学的理论知识对其进行研究,提出自己的见解,探讨解决问题的方法,这是很有意义的。这不仅能使自己所学的书本知识得到一次实际的运用,而且能提高自己分析问题和解决问题的能力。其次,要注意选题的理论价值。我们强调选题的实用价值,并不等于急功近利的实用主义,也绝非提倡选题必须有直接的效益作用。作为论文,无论是形式还是内容都和工作总结、调查报告有着区别。一般说来,它由论点、论据、论证三大要素构成,文章要以逻辑思维的方式为展开的依据,在事实的基础上展开严谨的推理过程,得出令人信服的结论。它着重探讨和研究事物发展的客观规律,阐述自己对这些规律的了解与认识,给人以认识上的启迪。因此,选择现实性较强的题目,还要考虑其有无理论和认识上的价值,即有无普遍性的意义,能否能进行理论的分析和综合,从个别上升到一般,从具体上升为抽象。第三方面,论文的整体结构。论文的撰写过程应该遵守基本的原则:提出问题,分析问题,解决问题。提出问题部分应说明研究这一课题的主要内容、理由、意义,这一部分要写得简洁,一定要避免像作文那样,用很长的篇幅写自己的心情与感受,不厌其烦地讲选定这个课题的思考过程。同时应注意,问题的提出要明确、具体,有时要写一点历史的回顾,关于这个课题,谁作了哪些研究,作者本人将有哪些补充、纠正或发展,这便于读者阅读、理解本论文。分析问题部分是具体的展开论题,表达作者个人研究成果的部分,它是论文的主体部分,必须下功夫把它写充分、写好。有些论文,提出的问题很新颖、也很有见地,但是本部分写得却很单薄、论证不够充分、分析不到位,勉勉强强引出的结论也难以站住脚。这样的论文是缺乏科学价值的,所以一定要全力把分析问题部分写好。解决问题部分是对分析、论证的问题加以综合概括,引出基本论点,或是有针对性的提出解决问题的措施和建议,这是论文要解决问题的答案。这部分要写得简要具体,使读者能明确了解作者独到见解之所在。最值得注意的是,这部分必须是论文分析论证后自然得出的结果,论文最忌讳论证得并不充分,而妄下定论。要首尾贯通,成为一个严谨的、完善的整体。第四方面,论文层次。作为一篇论文,从思想的发展来说,要一层一层地讲,讲透了一层,再讲另一层意思。开头提出的问题,文章中要有分析,结尾要有回答,做到前呼后应;章节内容的安排要合理,时间上可以从古至今、亦可由今溯古,空间上由宏观到微观、由国外到国内,尽量要全面合理。文章要有层次,有条理,这和材料的安排处理关系极大,材料之间的相互关系不同,处理方式也就不同,不能错乱,错乱了,层次就不清楚,自然也不会有条理。论文总体结构成型后要看看 各层次是否明白清晰,有无重复或相互矛盾的地方,有无缺少或多余之处,意思上是否连贯通畅,是否达到了各分论点的证明要求。第五方面,论文逻辑。众所周知,人们要进行思维,就要使用概念、判断、推理等思维形式。这些思维形式既是人类用来反映客观现实的手段,又是构筑论文的基本材料。只有掌握了这些思维形式及其有关的逻辑要求,才能写出具有符合逻辑的论文来。因此,我们在撰写论文的过程中,应当遵守逻辑的基本规律,自觉地将这些基本规律,贯穿于写作的各个环节和整篇论文当中,具体说来,则要注意以下几个问题:(1)论文内容符合客观实际,能够令人信服;(2)概念明确,判断恰当,推理连贯;(3)论文的内容之间有着密切的联系,全篇论文形成统一的整体;(4)各层次之间的过渡与照应要吻合,起承转合要自然得体,各段落之间的衔接要紧密。第六方面,语言表达。正如马克思所说的:“语言是思想的直接现实。”论文写作尽管需要具备选题、取材、构思、技巧等多方面的能力,但这一切都必须也只能通过语言来体现,来完成。语言表达的水平直接影响论文的表现力和感染力。只有了解语言的特点,并且有比较丰富的语言储备,才能写好论文。语言的表达效果,直接关系着论文的质量。因此,过好语言关,也是写好论文的重要一环。各类文章尽管文体不同,各具特点,但对语言表达的基本要求是共同的,这就是准确、简练、生动。论文的语言表达同样要求做到简捷、明快、形象、生动、准确、科学。简捷就是造句干净利落。用语“贵乎精要”,以最简洁的语言表达尽可能丰富的内容,做到“文约而事丰,言简而意赅”;“准确”是从总体上要求语言讲求科学性和逻辑性,能准确地表达论文的内容和思想感情;论文在具备观点正确、鲜明,语言准确、简练的前提下,还要力求做到语言生动,让人读起来不枯燥乏味。第七方面,论文内容。论文成功与否、质量高低、价值大小,很大程度上取决于文章是否有创新性。所谓创新性,即论文中表现出自己的新看法、新见解、新观点。有了较新颖的观点,文章就有了灵魂,有了存在的价值。对文章的创新性,可以总结为以下几个方面:第一“破旧”,对已有的观点、材料、研究方法提出质疑,并提出自己新的观点和看法,并证明自己观点的正确性,启发人们重新思考问题。第二“补充”,对已有的观点、材料、论证方法进行全面的考察,发现其不足或者是过时之处并加以修改补充。第三“解难”,从现实生活中发现问题,把握问题的本质,上升到理论高度,进而提出解决问题的措施或建议,在理论上给实践以指导。第四“预知”,对现有事物进行前瞻性的预测,并针对可能出现的问题进行理论上的研究。以上四个方面只是对“创新性”一个大体的概括,但只要能做到其中一点,就可以认为文章的选题有了新意。总结:如上所述,关于大学生论文方面的范文已经为您准备好了,供您学习与参考,如果您有论文发表方面的疑问,可以直接来电咨询我们。
小论文的就不需要太正规的格式了,有个摘要和关键词,就可以开始弄正文了。也可以适当加一个参考文献。所要求的字数是全都包括在内的,包括摘要、关键词以及参考文献的。望采纳。
自己上校内网老实自己做一篇吧!哈哈
楼主一、内容要求 毕业设计报告正文要求: (一)理、工科类专业毕业设计报告正文内容应包括:问题的提出;设计的指导思想;方案的选择和比较论证;根据任务书指出的内容和指标要求写出设计过程、课题所涉及元件结构和相关参数的设计计算,有关基本原理的说明与理论分析;给出所设计课题实际运行的数据或参数,并与理论设计参数进行比较和分析,说明产生误差的原因。最后要对所设计课题实用价值做出评估说明;设计过程中存在的问题,改进意见或其它更好的方案设想及未能采纳的原因等。 (二)经济、管理类专业毕业设计报告或论文正文应包括:问题的提出、设计的指导思想;设计方案提出的依据,设计方案的选择和比较;设计过程;所运用的技术经济分析指标和方法;数学模型及其依据,数据计算方法;对设计方案的实用性和经济效益等方面做出评估;对设计实施过程中存在的问题 ( 或可能发生的问题 ) 提出合理化建议。毕业论文的基本论点、主要论据;根据国家有关方针、政策及规定联系实际展开理论分析。 (三)文科类专业毕业设计报告或论文正文应包括:问题的提出、解决问题的指导思想;解决方案提出的依据,解决方案的选择和比较,结论。 二、论文印装 毕业论文用毕业设计专用纸打印。正文用宋体小四号字,行间距为24磅;版面页边距上3cm,下、左5cm,右2cm。 三、论文结构、装订顺序及要求 毕业论文由以下部分组成: (一)封面。论文题目不得超过20个字,要简练、准确,可分为两行。 (二)内容。 1、毕业设计(论文)任务书。任务书由指导教师填写,经系主任、教务部审查签字后生效。 2、毕业设计(论文)开题报告; 3、毕业设计(论文)学生申请答辩表与指导教师毕业设计(论文)评审表; 4、毕业设计(论文)评阅人评审表; 5、毕业设计(论文)答辩表; 6、毕业设计(论文)成绩评定总表; 7、中英文内容摘要和关键词。 (1)摘要是论文内容的简要陈述,应尽量反映论文的主要信息,内容包括研究目的、方法、成果和结论,不含图表,不加注释,具有独立性和完整性。中文摘要一般为200-400字左右,英文摘要应与中文摘要内容完全相同。“摘要”字样位置居中。 (2)关键词是反映毕业设计(论文)主题内容的名词,是供检索使用的。主题词条应为通用技术词汇,不得自造关键词。关键词一般为3-5个,按词条外延层次(学科目录分类),由高至低顺序排列。关键词排在摘要正文部分下方。 (3)中文摘要与关键词在前,英文的在后。 8、目录。 目录按三级标题编写,要求层次清晰,且要与正文标题一致。主要包括绪论、正文主体、结论、致谢、主要参考文献及附录等。 9、正文。论文正文部分包括:绪论(或前言、序言)、论文主体及结论。 (1)绪论。综合评述前人工作,说明论文工作的选题目的和意义,国内外文献综述,以及论文所要研究的内容。 (2)论文主体。论文的主要组成部分,主要包括选题背景、方案论证、过程论述、结果分析、结论或总结等内容。要求层次清楚,文字简练、通顺,重点突出,毕业设计(论文)文字数,一般应不少于8000字(或20个页码)。外文翻译不少于3000字符,外文参考资料阅读量不少于3万字符。 中文论文撰写通行的题序层次采用以下格式: 1 1 1 1 格式是保证文章结构清晰、纲目分明的编辑手段,毕业论文所采用的格式必须符合上表规定,并前后统一,不得混杂使用。格式除题序层次外,还应包括分段、行距、字体和字号等。 第一层次(章)题序和标题居中放置,其余各层次(节、条、款)题序和标题一律沿版面左侧边线顶格安排。第一层次(章)题序和标题距下文双倍行距。段落开始后缩两个字。行与行之间,段落和层次标题以及各段落之间均为24磅行间距。 第一层次(章)题序和标题用小二号黑体字。题序和标题之间空两个字,不加标点,下同。 第二层次(节)题序和标题用小三号黑体字。 第三层次(条)题序和标题用四号黑体字。 第四层次及以下各层次题序及标题一律用小四号黑体字。 (3)结论(或结束语)。作为单独一章排列,但标题前不加“第XXX章”字样。结论是整个论文的总结,应以简练的文字说明论文所做的工作,一般不超过两页。 10、致谢。对导师和给予指导或协助完成毕业设计(论文)工作的组织和个人表示感谢。文字要简洁、实事求是,切忌浮夸和庸俗之词。 11、参考文献及引用资料目录(规范格式见附文)。 12、附录。 13、实验数据表、有关图纸(大于3#图幅时单独装订)。 (三)封底。 附:规范的参考文献格式 参考文献(即引文出处)的类型以单字母方式标识:M——专著,C——论文集,N——报纸文章,J——期刊文章,D——学位论文,R——报告,S——标准,P——专利;对于不属于上述的文献类型,采用字母“Z”标识。 参考文献一律置于文末。其格式为: 1、专著 示例 [1] 张志建严复思想研究[M] 桂林:广西师范大学出版社, [2] 马克思恩格斯全集:第1卷[M] 北京:人民出版社, [3] [英]蔼理士性心理学[M] 潘光旦译注北京:商务印书馆, 2、论文集 示例 [1] 伍蠡甫西方文论选[C] 上海:上海译文出版社, [2] 别林斯基论俄国中篇小说和果戈里君的中篇小说[A] 伍蠡甫西方文论选:下册[C] 上海:上海译文出版社, 凡引专著的页码,加圆括号置于文中序号之后。 3、报纸文章 示例 [1] 李大伦经济全球化的重要性[N] 光明日报,1998-12-27,(3) 4、期刊文章 示例 [1] 郭英德元明文学史观散论[J] 北京师范大学学报(社会科学版),1995(3) 5、学位论文 示例 [1] 刘伟汉字不同视觉识别方式的理论和实证研究[D] 北京:北京师范大学心理系, 6、报告 示例 [1] 白秀水,刘敢,任保平 西安金融、人才、技术三大要素市场培育与发展研究[R] 西安:陕西师范大学西北经济发展研究中心, 7、对论文正文中某一特定内容的进一步解释或补充说明性的注释,置于本页地脚,前面用圈码标识。 8、其他要求 (1)文字 论文中汉字应采用严格执行汉字的规范。所有文字字面清晰,不得涂改。 (2)表格 论文的表格可以统一编序,也可以逐章单独编序,采用哪种方式应和插图及公式的编序方式统一。表序必须连续,不得重复或跳跃。表格的结构应简洁。 表格中各栏都应标注量和相应的单位。表格内数字须上下对齐,相邻栏内的数值相同时,不能用‘同上’、‘同左’和其它类似用词,应一一重新标注。 表序和表题置于表格上方中间位置,无表题的表序置于表格的左上方或右上方(同一篇论文位置应一致)。 (3)插图 插图要精选。图序可以连续编序,也可以逐章单独编序,采用哪种方式应与表格、公式的编序方式统一,图序必须连续,不得重复或跳跃。仅有一图时,在图题前加‘附图’字样。毕业设计(论文)中的插图以及图中文字符号应打印,无法打印时一律用钢笔绘制和标出。 由若干个分图组成的插图,分图用a,b,c,……标出。 图序和图题置于图下方中间位置。 (4)公式 论文中重要的或者后文中须重新提及的公式应注序号并加圆括号,序号一律用阿拉伯数字连续编序,或逐章编序,序号排在版面右侧,且距右边距离相等。公式与序号之间不加虚线。 (5)数字用法 公历世纪、年代、年、月、日、时间和各种计数、计量,均用阿拉伯数字。年份不能简写。数值的有效数字应全部写出。 (6)软件 软件流程图和源程序清单要按软件文档格式附在论文后面,特殊情况可在答辩时展示,不附在论文内。 (7)工程图按国标规定装订 图幅小于或等于3#图幅时应装订在论文内,大于3#图幅时按国标规定单独装订作为附图。 (8)艺术设计作品 无法用纸质文档保存的艺术设计作品应用光盘或照片保存。 (9)计量单位的定义和使用方法按国家计量局规定执行。 以上是我的毕业论文要求,全国各个学校其实都是一样的 回答完毕
化工类文献综述的论文或范文, 如有需要及时+wo谈
朋友我来吧!
直接去看看(临床医学进展)上的文献吧
科技文献是科技知识的最基本、最重要的表现形式,是科技情报源。
信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。