信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。
现代信息检索论文: 现代信息检索方法的探讨 要想充分利用这些浩如烟海的文献信息资源,必须借助各种各样的检索工具。同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。 一、布尔检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。 下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。 检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。 二、信息检索 信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。 信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。 目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。 三、知识检索 知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。 知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。
我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之!2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁’时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[’“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔’3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔’41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词……………………………………太长 发不全 希望对你有用 实在不行联系我(给我留言)我发给你邮箱。
我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。
网络信息检索方法与应用这个原创。联系看我资料
用法
常用法双称为工具法或直接法,是直接利用文献检索工具来查找文献的方法。在检索工具的选择上,一般应根据课题内容首先利用综合性的检索工具,然后使用专业性的检索工具,两者结合,可提高查全率和查准率。常用法根据时间的范围可分为顺查法、倒查法和抽查法。
顺查法
是以检索课题的起始年代为起点,按时间顺序由远及近的查找,直到查到的文献信息满足要求为止。此法的优点是查全率高,缺点是费时、费力。
倒查法
是一种逆时间由近及远地查找文献的方法。这种方法多用于新开课题或有新内容的老课题,需要的是近期发表的文献,以便掌握最近一段时间该课题所达到的水平及研究动向。因此,一旦掌握了所需的文献信息即可中止搜索。此方法的优点是节约时间,缺点是漏检率高。
抽查法
是针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的一段时期,逐年进行查找的一种方法。此法的优点是能以较少的检索时间获得较多的文献信息,缺点是使用此法必须熟悉学科发展特点为前提,否则难以取得预期效果。
追溯法
追溯法又叫回溯法,是利用已有的文献后面的参考文献,由近及远进行追溯查找的方法。此法的优点是直观、方便、不断追溯可查到某一专题的大量参考文献,这是在没有检索工具或检索工具不全的情况下扩大信息源的一种好方法。缺点是检索效率低、查全率低、漏检率高。
综合法
综合法又称为循环法、分段法或交替法,是常用法和追溯法两种方法的综合。即利用检索工具又利用文献后边的参考文献进行了追溯,两种方法交替使用,知道满足为止,它可得到较高的查全率和查准率。是采用较多的方法之一。
文献检索的途径
在利用检索工具进行检索时,主要利用它的各种索引,即通过检索工具的索引提供的各种检索途径来查找文献的。检索途径主要分以下几种:
内容特征途径
分类途径
是一种按照文献资料所属学科属性进行检索的途径。检索工具的分类表提供了从分类角度检索文献的途径,其检索的关键在于正确理解检索工具中的分类表。按分类途径检索文献便于从学科体系的角度获得较系统的文献线索,即有族性检索功能。
多数检索工具的正文按照分类编排,因此可利用其分类目次表,按类进行查找。分类途径可把同一学科的文献信息集中检索出来,但一些新兴学科、边缘学科的文献难以给出确切的类别,易造成误检和漏检。因此,从分类途径查找文献,一定要掌握学科的分类体系及有关规则。
主体途径
是一种按照文献信息的主题内容进行检索的途径。利用从文献信息中抽出来能代表文献内容的主题词、关键词、叙词,并按字顺排列。检索者只要根据课题确定了检索词,便可像查字典一样,按字顺逐一查找,从检索词之下的索引款目找到所需的线索。主题途径表达概念灵活、准确、能把同一主题内容的文献集中在一起,同时检索出来。
外部特征途径
题名途径
是根据文献题名来检索文献的途径。一般较多用于查找图书、期刊、单篇文献。
著者途径
是根据已知文献著者姓名查找文献的一种途径。通过著者途径可以检索到某一著者对某一专题研究的主要文献信息。
号码途径
是按已知号码来查找文献的途径。如专利号索引,标准文献的标准号索引等。
其他途径
是辅助性检索途径,通过特殊途径找到所需文献的索引。如药物名称索引、分子式索引等。
文献检索步骤
文献检索就是根据课题要求,使用检索工具,按照一定的步骤查找文献的过程。检索步骤的科学安排称为检索策略。检索策略是针对检索提问、运用检索访求和技术而设计的信息检索方案,其目的是要达到一定的查准率和查全率。文献检索一般经过以下步骤:
分析课题、制定检索策略
首先要了解课题的目的、意义,明确课题的主题和研究要点以及主要特征,然后根据课题研究的特点和检索要求制定检索策略。检索策略制定包括检索提问、检索方法选择、检索工具选择以及检索范围(专业、时间、语种、文献类型)的限定等,其中最关键的是确定检索标识,如关键词、主题词、分类号、作者、作者单位等。由检索标识按布尔逻辑关系组成检索提问表达式。
利用检索工具查找文献线索
根据课题检索的需要,选择相关的检索工具,然后用已构成的检索提问,按照相应的检索途径查找有关的索引,再根据索引指示的地址在文献部分或题录部分查得相应的文献线索,如题目、内容摘要、作者及作者单位、文献出处等。
根据文献出处索取原始文献
首先对文献出处要进行文献类型辨识、缩写要还原原名称,然后再按文献出处的全称查找相应的馆藏目录并收藏单位,再索借或复制原文。
用法
常用法双称为工具法或直接法,是直接利用文献检索工具来查找文献的方法。在检索工具的选择上,一般应根据课题内容首先利用综合性的检索工具,然后使用专业性的检索工具,两者结合,可提高查全率和查准率。常用法根据时间的范围可分为顺查法、倒查法和抽查法。
顺查法
是以检索课题的起始年代为起点,按时间顺序由远及近的查找,直到查到的文献信息满足要求为止。此法的优点是查全率高,缺点是费时、费力。
倒查法
是一种逆时间由近及远地查找文献的方法。这种方法多用于新开课题或有新内容的老课题,需要的是近期发表的文献,以便掌握最近一段时间该课题所达到的水平及研究动向。因此,一旦掌握了所需的文献信息即可中止搜索。此方法的优点是节约时间,缺点是漏检率高。
抽查法
是针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的一段时期,逐年进行查找的一种方法。此法的优点是能以较少的检索时间获得较多的文献信息,缺点是使用此法必须熟悉学科发展特点为前提,否则难以取得预期效果。
追溯法
追溯法又叫回溯法,是利用已有的文献后面的参考文献,由近及远进行追溯查找的方法。此法的优点是直观、方便、不断追溯可查到某一专题的大量参考文献,这是在没有检索工具或检索工具不全的情况下扩大信息源的一种好方法。缺点是检索效率低、查全率低、漏检率高。
综合法
综合法又称为循环法、分段法或交替法,是常用法和追溯法两种方法的综合。即利用检索工具又利用文献后边的参考文献进行了追溯,两种方法交替使用,知道满足为止,它可得到较高的查全率和查准率。是采用较多的方法之一。
文献检索的途径
在利用检索工具进行检索时,主要利用它的各种索引,即通过检索工具的索引提供的各种检索途径来查找文献的。检索途径主要分以下几种:
内容特征途径
分类途径
是一种按照文献资料所属学科属性进行检索的途径。检索工具的分类表提供了从分类角度检索文献的途径,其检索的关键在于正确理解检索工具中的分类表。按分类途径检索文献便于从学科体系的角度获得较系统的文献线索,即有族性检索功能。
多数检索工具的正文按照分类编排,因此可利用其分类目次表,按类进行查找。分类途径可把同一学科的文献信息集中检索出来,但一些新兴学科、边缘学科的文献难以给出确切的类别,易造成误检和漏检。因此,从分类途径查找文献,一定要掌握学科的分类体系及有关规则。
主体途径
是一种按照文献信息的主题内容进行检索的途径。利用从文献信息中抽出来能代表文献内容的主题词、关键词、叙词,并按字顺排列。检索者只要根据课题确定了检索词,便可像查字典一样,按字顺逐一查找,从检索词之下的索引款目找到所需的线索。主题途径表达概念灵活、准确、能把同一主题内容的文献集中在一起,同时检索出来。
外部特征途径
题名途径
是根据文献题名来检索文献的途径。一般较多用于查找图书、期刊、单篇文献。
著者途径
是根据已知文献著者姓名查找文献的一种途径。通过著者途径可以检索到某一著者对某一专题研究的主要文献信息。
号码途径
是按已知号码来查找文献的途径。如专利号索引,标准文献的标准号索引等。
其他途径
是辅助性检索途径,通过特殊途径找到所需文献的索引。如药物名称索引、分子式索引等。
文献检索步骤
文献检索就是根据课题要求,使用检索工具,按照一定的步骤查找文献的过程。检索步骤的科学安排称为检索策略。检索策略是针对检索提问、运用检索访求和技术而设计的信息检索方案,其目的是要达到一定的查准率和查全率。文献检索一般经过以下步骤:
分析课题、制定检索策略
首先要了解课题的目的、意义,明确课题的主题和研究要点以及主要特征,然后根据课题研究的特点和检索要求制定检索策略。检索策略制定包括检索提问、检索方法选择、检索工具选择以及检索范围(专业、时间、语种、文献类型)的限定等,其中最关键的是确定检索标识,如关键词、主题词、分类号、作者、作者单位等。由检索标识按布尔逻辑关系组成检索提问表达式。
利用检索工具查找文献线索
根据课题检索的需要,选择相关的检索工具,然后用已构成的检索提问,按照相应的检索途径查找有关的索引,再根据索引指示的地址在文献部分或题录部分查得相应的文献线索,如题目、内容摘要、作者及作者单位、文献出处等。
根据文献出处索取原始文献
首先对文献出处要进行文献类型辨识、缩写要还原原名称,然后再按文献出处的全称查找相应的馆藏目录并收藏单位,再索借或复制原文。
文献检索这门课主要讲授检索文献的一些基本方法,培养学生检索文献的技能.学习和科技需要文献,个人全面素质的提高需文献,生活中也离不开各种信息.以前多是讲解手工检索工具的使用,现在多是讲解文献数据库的使用,如电子图书数据库\电子期刊论文数据库\会议论文数据库\学位论文数据库\科技报告\专利\标准\档案\政府出版物等
信息检索报告―――毕业论文《新型防水涂料的研究》文献检索报告课题分析防水涂料根据其用途可以分成很多种类,我本人毕业论文主要是研究其中应用最为广泛的建筑防水涂料.建筑防水涂料以合成高分子材料,沥青,聚合物改性沥青,无机材料等为主体掺入适量的助剂,改性材料,填充材料等加工制成.与防水卷材相比,防水涂料施工简单方便,适用于任何形状的基面,并可形成致密无缝的涂膜,因此,防水涂料已广泛应用于各种防水工程中,并取得了迅速的发展.对本课题研究主要分三个阶段.研究新型防水,需要做的前期准备工作:(1)了解目前防水涂料在国内外的研究状况,发展前景.(2)了解我国建筑防水涂料的应用状况,与国外相比存在缺点.(3)目前国内外在防水涂料上所做出的进一步相关研究.(4)新型防水涂料的研究状况以及应用状况.(5)防水涂料应用仍需要解决的问题.新型防水涂料研究制备(1)目前已有制备配方研究(2)实验室产品制备(3)产品性能检测(4)成本,大批量生产可行性,产品环保以及应用推广度进行综合核算评价.目前面临问题(1)实验室条件限制(2)各种原料的购买(3)性能检测的费用2.背景资料建筑防水涂料的概念建筑防水材料是建筑材料的一个重要组成部分,属于功能性材料,建筑物和构筑物之所以要采用防水材料其主要目的是为了防潮,防渗,防漏.建筑防水涂料,(简称防水涂料)是一种建筑防水材料.将涂料单独或与胎体增强材料复合,分层涂刷或喷涂在需要进行防水处理的基层表面,即可在常温条件下形成一个连续无缝整体且具有一定厚度的涂膜防水层,从而能满足工业与民用建筑的屋面,地下室,卫生间和外墙等部位防水抗渗要求.防水涂料一般是由沥青,合成高分子聚合物,合成高分子聚合物与沥青,合成高分子与水泥或以无机复合材料等为主要成膜物质,掺入适量的颜料,助剂,溶剂等加工制成的溶剂型,水乳型或反应型的,在常温下无固定形状的黏稠状液态或可液化的固体粉末状态的含高分子合成材料的复合材料,其发展概况见检索结果(1).目前防水涂料在研究和应用上仍待解决的问题(1)防水涂料大多数是溶剂型,对环境污染较大,而水乳型聚合物改性防水涂料的质量还不够稳定.(2)一些聚合物防水涂料在力学性能,防水性能和耐久性等方面尚不是十分理想.(3)部分厂家为了降低成本,偷工减料,以次充好,致使大量不合格的产品流入市场.3.解决的问题(1)检索建筑防水涂料制备的背景知识以及相关基础知识.(2)检索到国内建筑防水涂料研究状况检索建筑防水涂料制备的背景知识.(3)检索到建筑防水涂料目前的应用状况.(4)了解到目前建筑防水涂料迫切需要解决的问题.(5)了解到各种防水涂料的生产配方以及生产工艺.4.检索过程与方法检索过程中甬道的数据库以及搜索引擎(1)检索过程甬道中外文献数据库有:中国期刊网(CNKI),维普中文期刊全文数据库,万方数据库,中国专利数据库,EBSCO数据库,CSA数据库.(2)检索过程中使用的搜索引擎:Google, . 2检索途径关键词:防水涂料Google搜索引擎:搜索词汇有:① 防水涂料②在结果中搜索:建筑防水涂料研究发展③建筑防水涂料 制备cnki数据库检索:①数据库:中国期刊全文数据库②搜索关键词:建筑防水涂料③文献分类:建筑 化工④跨库检索:题名:建筑防水涂料 匹配:模糊 从1960到2006 目录:建筑 化工万方数据库检索①搜索关键词:建筑防水涂料③文献分类:建筑 化工维普中文期刊全文数据库检索关键词:建筑防水涂料主题:研究 制备5.检索结果(1)【主题】我建筑防水涂料的现状与发展【作者】余剑英; 董连宝; 孔宪明;【作者单位】武汉理工大学; 济南钢铁集团总公司原料处; 石油大学(华东); 湖北武汉; 山东济南; 山东东营;【刊名】新型建筑材料, New Building Materials, 编辑部邮箱 2004年 10期期刊荣誉:中文核心期刊要目总览 ASPT来源刊 中国期刊方阵 CJFD收录刊【关键词】建筑防水涂料; 现状; 发展;【摘要】介绍我国建筑防水涂料的现状及存在问题,提出我国建筑防水涂料的发展应由溶剂型向水乳型,由薄质型向厚质型,由深色向浅色,由低档向高弹性,高耐久性,功能性方向发展.大力研究开发和推广高性能,高耐候,环保型防水涂料和多功能防水涂料,研究开发防水涂料系列产品,重点发展环保型聚氨酯,丙烯酸,橡胶改性沥青和水泥基渗透结晶型防水涂料,提高中,高档防水涂料比例,加快施工机具的研制与推广.【DOI】 cnki:ISSN:(2)【主题】浅议我国的建筑防水涂料【作者】 广厦; 【刊名】 建材工业信息, , 编辑部邮箱 2003年 08期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】 cnki:ISSN:(3)【主题】建筑防水涂料【作者】 叶林标;【刊名】 建筑工人, Builders' Monthly, 编辑部邮箱 2006年 03期期刊荣誉:ASPT来源刊 中国期刊方阵 CJFD收录刊【DOI】 cnki:ISSN:(4)【主题】环保型建筑防水涂料【作者】 李长仁; 【报纸中文名】 科技信息快报, 2000-06-23【版号】 002【栏目】 技术市场【DOI】 CNKI:PCN:(5)【主题】 硅橡胶建筑防水涂料【作者】 谭玉春; 【刊名】 砖瓦世界, Brick & Tile World, 编辑部邮箱 1993年 11期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】桂橡胶建筑防水涂料的主要用途为屋面,地下室,卫生间及各种储水构筑的防渗,存水,隔热等.它的特点是无毒,无味,抗龟裂,抗老桂橡胶建筑防水涂料的主要用途为屋面,地下室,卫生间及各种储水构筑的防渗,存水,隔热等.它的特点是无毒,无味,抗龟裂,抗老化,耐高温,耐低温,耐碱和无腐蚀性,1992年末通过鉴定.硅橡胶建筑防水涂料系湖北金龙防水材料有限公司从中国科学院化学研究所引进的最新成果,在湖北独家生产.经武汉大学物理系实验室主体建筑的防水工程等施工表明,该防水涂料性能优越.经湖北省建材产品质量监督检验中心站测试,其性能指标如下:【DOI】 cnki:ISSN:(6)【主题】建筑防水涂料的现状及发展趋势【作者】蓝仁华; 陈立军; 陈焕钦; 【作者单位】 华南理工大学;【刊名】国外建材科技, Science and Technology of Overseas Building Materials, 编辑部邮箱 2004年 04期 期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】 防水涂料; 现状; 发展趋势; 【摘要】 防水涂料是一种建筑防水材料 ,广泛应用于屋面,地下室,厕浴间和外墙等的防水.介绍了防水涂料的概念及分类,防水机理以及国内外的研究现状 ,并对未来的防水涂料的发展进行了展望【DOI】 cnki:ISSN:(7)【主题】美国防水涂料的发展现状与特点【作者】叶林标; 曹乃明; 【作者单位】 北京市建筑工程研究院; 100039;【刊名】建筑技术开发, Building Technique Development, 编辑部邮箱 2001年 12期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】cnki:ISSN:(8)【主题】健康型聚氨酯防水涂料研制【作者】 戴永清; 李亚军; 【作者单位】 北京市顺义鹏程防水材料厂; 【刊名】 化学建材, Chemical Materials For Construction, 编辑部邮箱 2002年 05期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】 聚氨酯; 健康型; 减量; 节能; 高性能; 防水涂料;【摘要】 对聚氨酯防水涂料的原材料选择,配方设计,生产工艺等方面进行了研究 ,以期实现聚氨酯防水涂料达到健康型,减量,节能,多功能,高性能之目的.【DOI】 cnki:ISSN:(9)【主题】国外建筑防水涂料的发展【作者】赵军;【刊名】砖瓦世界, Brick & Tile World, 编辑部邮箱 1987年 22期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】 在世界各国防水材料市场90%左右为沥青卷材和高分子片材的情况下,防水涂料仍以其多变的色泽,灵巧的施工,以及在特殊形状屋面,外墙及地下建筑的防水,防渗,防潮等方【DOI】 cnki:ISSN:(10)【主题】【英文篇名】Application and Development of Waterproof Coatings for Architectures in China【作者】 徐峰;【英文作者】 XU Feng;【作者单位】 安徽省建筑科学研究设计院;【刊名】 现代涂料与涂装, Modern Paint & Finishing, 编辑部邮箱 2006年 07期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】 防水涂料; 环保涂料; 施工机具;【英文关键词】 waterproof coatings; environmentally friendly coatings; application machines;【摘要】 简要介绍了我国防水涂料的主要种类和应用发展情况.我国防水涂料的发展将主要集中在高性能防水涂料的发展与应用,环保型防水涂料的开发,多功能防水涂料以及新型施工机具等方面.【英文摘要】 Main catergories,applications and development of waterproof coatings for architectures in China are introduced development thereof will mainly focus on the reseach and application of high-performance,environmentally friendly,multi-functional waterproof paints and the new type application machines.【DOI】 cnki:ISSN:(11)【主题】一种较好的新型建筑防水涂料【作者】肖新莲;【作者单位】四川攀枝花市十九冶建研所;【刊名】中国建筑防水, China Building Waterproofing, 编辑部邮箱 1990年 02期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】 氯丁胶乳沥青防水涂料是以氯丁橡胶和沥青为基料,经加工而成的一种水乳型建筑防水涂料.特点它兼有橡胶和沥青的双重优点,具有成膜快,强度高,耐候性好,难延燃,基本无毒,无味,不污染环境,冷作业施工,操作方【DOI】 cnki:ISSN:(12)【主题】建筑防水涂料试验方法—标准操作探讨【作者】朱志远;【作者单位】 国家建材局建筑防水材料产品质量监督检验中心;【刊名】 中国建筑防水, CHINA BUILDING WATERPROOFING, 编辑部邮箱 1998年 02期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】『建筑防水涂料试验方法』标准操作探讨朱志远1前言GB/T16777-1997《建筑防水涂料试验方法》为各种防水涂料产品提供了一个统一的尺码来衡量产品性能,规定了一致的试验方法作为产品检测的依据,有利于防水涂料产品质量的提高及推广应用.方法标准主要参考...【DOI】 cnki:ISSN:(13)【主题】新兴防水涂料在民用建筑中的应用【作者】 熊君放;【作者单位】 湖南省建筑工程集团总公司;【刊名】中外建筑, Chinese and Overseas Architecture, 编辑部邮箱 2004年 03期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水涂料的特性; 施工工法;【摘要】随着建筑事业的迅猛发展,新型建筑防水涂料在基础设施建设,住宅建筑,城市建设,市政建设等领域得到了广泛的应用,并取得了显著成效.本文结合工程实践,介绍几种新型建筑防水涂料的特性,施工工法及施工中存在的问题及对策.【DOI】 cnki:ISSN:(14)【主题】建筑防水材料的现状及新型防水卷材和涂料的应用【英文篇名】The present situation of waterproof materials andapplication of new-type waterproofingroll-roofing and waterproofing paint【作者】 石磊; 李青;【英文作者】 Shi Lei Li Qing;【作者单位】 茂名石比检修公司设计室;【刊名】 茂名学院学报, Journal of Guandong College Petrochemical Technology, 编辑部邮箱 1996年 01期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水层; 防水材料; 防水卷材; 防水涂料;【英文关键词】 waterproof layer; waterproof materials; waterproofing roll-roofing; waterproofing paint;【摘要】该文介绍了新型防水卷材,防水涂料的特点和应用.【英文摘要】This paper introduces characters and application of new-type waterproofing roll-roofing, waterproofing paint.【DOI】 cnki:SCN:【作者】 广厦;【刊名】建材工业信息, , 编辑部邮箱 2003年 08期期刊荣誉:ASPT来源刊 CJFD收录刊 96-01-011(15)【主题】防水涂料【刊名】 涂料技术与文摘, , 编辑部邮箱 1995年 03期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】 cnki:ISSN:.小结虽然我我们是化学系,但与化工中的防水涂料还是相隔很远.选择这个题目来自于自己的一个生活体会.实习时正好学校刷油漆,同学对那种油漆味真是达到难以忍受的地步,油漆是钢材防水涂料.当时我就想能不能有一种环保型涂料来代替,没有这种难以忍受的味道,后来选题时候我看到了这个题目就毫不犹豫的选择了.与导师接触以后才知道这个题目不是很简单,要有很好的专业知识和研究精神.可对这个题目我可以说一无所知,就是其中最简单的成分也不清楚.学习了化学检索这门课程,对各大数据库的相互检索,我了解了建筑防水涂料的相关知识,制备方法和配方,一些相关涂料生产地,也知道了目前国外国内在这个方面做出一些相关研究,激起了我对这个题目兴趣,虽然自己还是外行,但我相信兴趣是成功的第一步,以后我会更好的利用信息检索这个工具,圆满的完成这个课题.但有些地方我还感到不足,和很多同学一样,那就是外文检索,对于这个专业的一些英文词语很陌生,这也是自己需要改进的地方,多熟悉相关的英文词语,中英文互通.7.建议学习文献检索课我受益非浅,对学校的数据资源库也不再是任其浪费,知道了怎么样去找自己需要的一些专业性的文献,对做毕业论文以及以后的课题研究有非常大的作用.而杨老师的课件更是做的很让人佩服,学习起来轻松多了.但在教学上,可能因人而异,仍有一些地方需要改进一下.课堂气氛有些时候仍然沉闷,我们应该营造一个轻松愉快的气氛,有利于所有的同学都来参与教学,尤其是大四的学生.老师在讲课的同时应该适当和同学一起完成文献检索,多用一些实例,少介绍一点理论的知识,文献检索是一门应用性非常强的课程,多让学生动手, 而少记一些理论知识.不过在这门课上我学到了很多,这和杨老师的努力是分不开的.
毕业论文资料收集和整理的方法
紧张而又充实的大学生活即将结束,大学毕业前都要通过最后的毕业论文,毕业论文是一种比较正规的检验学生学习成果的形式,那要怎么写好毕业论文呢?下面是我整理的毕业论文资料收集和整理的方法,欢迎大家分享。
毕业论文资料收集和整理的方法
一、毕业论文资料搜集的范围
撰写毕业论文必须详尽地占有资料,一篇五千字左右的论文写成,可能要搜集到几万、甚至几十万字的资料,积累资料的方法 。资料是毕业论文写作的基础,没有资料,“巧妇难为无米之炊”,研究无从着手,观点无法成立,论文不可能形成。所以,详尽地占有资料是毕业论文写作之前的另一项极重要的工作。毕业论文写作之前,至少应当占有如下五个方面的材料:
第一,第一手资料。第一手资料包括与论题直接有关的文字材料、数字材料(包括图表),譬如:统计材料、典型案例、经验总结等等,还包括自己在亲自实践中取得的感性材料。这是论文中提出论点、主张的基本依据。没有这些资料,撰写的毕业论文就只能成为毫无实际价值的空谈。对第一手资料要注意及早收集,同时要注意其真实性、典型性、新颖性和准确性。
第二,他人的研究成果。这是指国内外对有关该课题学术研究的最新动态。撰写毕业论文不是凭空进行的,而是在他人研究成果的基础上进行的,因此,对于他人已经解决了的问题就可以不必再花力气重复进行研究,人们可以以此作为出发点,并可以从中得到有益的启发、借鉴和指导。对于他人未解决的,或解决不圆满的问题,则可以在他人研究的基础上再继续研究和探索。切忌只顾埋头写,不管他人研究,否则,撰写的毕业论文的理性认识会远远低于前人已达到的水平。
第三,边缘学科的材料。当今时代是信息时代,人类的知识体系·呈现出大分化大融合的状态,传统学科的鸿沟分界逐渐被打破了,出现了令人眼花缭乱的分支学科及边缘学科。努力掌握边缘学科的材料,对于所要进行的学科研究,课题研究大有好处。它可以使我们研究的视野更开阔,分析的方法更多样。譬如研究经济学的有关课题,就必须用上管理学、社会学1jl、理学、人口学等学科的知识。大量研究工作的实践表明,不懂一些边缘学科知识,不掌握一些边缘学科的材料,知识面和思路狭窄是很难撰写出高质量的论文的。
第四,名人的有关论述,有关政策文献等。名人的论述极具权威性,对准确有力地阐述论点大有益处。至于党的有关方针、政策既体现了社会主义现代化的实践经验,又能反映出现实工作中面临的多种问题,因此,研究一切现实问题都必须占有和清楚这方面的材料,否则会出现与党的方针、政策不一致的言论,使论文出现很大的缺陷。
第五,背景材料。搜集和研究背景材料,这有助于开阔思路,全面研究、提高论文的质量。例如,要研究马克思的商品经济理论,不能只研究他的著作,还应该大力搜集他当时所处的社会、政治、经济等背景材料,从而取得深入的研究成果。
二、资料搜集和分类的'方法搜集资料的方法很多,常用的主要有以下方法:
第一,做卡片。使用卡片搜集资料,易于分类、易于保存、易于查找,并且可分可合,可随时另行组合。卡片可以自己做,也可以到文化用品商店去购买。一个问题通常写在一张卡片上,内容太多时也可以写在几张卡片上,当然,在搜集资料的过程中,要不要做卡片,可根据各人习惯,不必有死板规定。
第二,做笔记。做笔记这是任何一个毕业论文撰写者都必要的,好记性不如烂笔头,阅读书报杂志时,搞调查研究时,要随身带笔和纸,随时记下所需资料的内容,或有关的感想体会,理论观点等。在做笔记时,最好空出纸面面积的三分之一,以供写对有关摘录内容的理解、评价和体会。
第三,剪贴报刊。将有用的资料从报纸、刊物上剪下来,或用复印机复印下来,再进行剪贴。把应剪贴的资料分类贴在笔记本、活页纸或卡片上,这种方法的优点是可以节省沙写的时间。无论是用卡片收集资料,还是摘录资料,还是剪贴资料,都必须注明出处。如果是著作,则要注明作者、书名、出版单位、发行年月;如果是报纸,则要注明作者、篇名、版次、报纸名称、发行年月日;如果是杂志,则要注明作者、篇名、杂志名称、卷(期)号、页码等,以便附录在毕业论文的后面。对收集来的资料不要随手一放,置之不理,要认真阅读,仔细加以分类,进行研究,论文写作《积累资料的方法 2》。
主要的分类方法有以下两种:
第一种,主题分类法。按照一定的观点把资料编成组,这“一定的观点”,可以是综合而成的观点,也可以是自己拟定的观点。例如,为研究培育建筑劳动力市场的前提条件,作者拟定了自己的四个观点:一是市场经济体制的确定为建筑劳动力市场的产生创造了客观环境;二是建筑产品市场的形成对建筑劳动力市场的培育提出了现实的要求;三是城乡体制改革的深化为劳动力市场的形成提供了可靠的保证;四是建筑劳动力市场的建立是建筑行业用工特殊性的内在要求,并按这四个观点对资料加以分类,这样可以加深对资料的认识,进一步使认识条理化、系统化。
第二种,项目分类法。即按照一定的属性,把收集的资料分项归类。
三、对搜集到资料的整理对搜集到的资料如何进行整理呢?
资料的整理过程实质上是资料的辨析过程,这里有几方面的工作是不可缺少的。
一是辨析资料的适用性。选择资料的依据,只能是作者所要阐明的中心论点。什么资料可用,什么资料不能用,都要根据这个中心论点决定。毕业论文的中心论点一经确定之后,它就是统帅一切的东西,资料必须服从于中心论点的统帅。不能把一些不能充分说明问题的资料搬来作牵强附会的解释,也不能将所有资料统统塞进文章里,搞得文章臃肿庞杂,中心反而不突出,扩大了篇幅。比如《“城市更新”与园林绿化关系的几个问题》一文,作者搜集了大量的有关园林绿化的资料,却没有搜集城市建设与园林绿化关系的资料,这些不适用的资料塞入论文之中,导致论文中心被冲淡,降低了论文质量。
二是辨析资料的全面性。如果材料不全面,缺少了某一方面的材料,论文的论述也往往不圆满、不全面,会出现偏颇、漏洞,或由于证据不足难以自圆其说。以《浅论厂长负责制与职工民主管理》一文为例,由于作者只搜集了两者互相依赖,互相促进的资料,没有搜集两者存在矛盾的资料,结果文章只做了一半,如何处理好两者矛盾这一重要方面被疏漏了,大大影响了论文的质量。
三是辨析资料的真实性。资料真实与否直接关系着论文的成败。只有从真实可靠的资料中才能引出科学的结论,在这方面要注意:其一,要尊重客观实际,避免先入为主的思想,选择资料不能夹杂个人的好恶与偏见,不能歪曲资料本来的客观性;其二,选择资料要有根有据,采用的第一手资料要有来历,选取的第二手资料一定要与原始文献认真核对,以求得最大的准确性;其三,对资料来源要加以辨别,弄清原作者的政治态度、生活背景、写作意图,并加以客观的分析评价,社会科学方面的资料更应该注意这一点。
四是辨析资料是否新颖。所谓新颖的资料包括两方面的含义:一方面是指前所未有,近期才出现的新事物、新思想、新发现、新方向。比如《股份合作制经济几议》一文的作者,选取了当时中国大地上新出现的农村股份合作制经济中的新动向进行研究。另一方面是指某种事物虽早已存在,但人们尚未发现其价值,这同样是新颖的资料。比如《试论人口与经济的循环》一文中,人口与经济的关系早已存在,它们之间存在着良性循环和恶性循环,这也是客观事实,这两种循环会带来两种根本不同的后果,而这以前人们几乎没有认识。现在以两种循环的资料来揭示两种循环的后果,从而阐明控制人口的重要性,不失为一种新颖的资料。所以,所谓新颖,不仅仅对资料产生的时间有所要求(不能太陈旧),更重要的是要从普遍常见的资料中发掘别人尚未利用的东西。五是辨析资料的典型性。所谓资料的典型性就是指这种材料对于它所证实的理性认识来说具有充分的代表性。恩格斯的《论权威》,选择了纺纱厂、铁路、航海三个例子作为论据。第一个论据阐述得最详细,第二个论据比较概括,第三个论据只是轻轻一笔。他没有用更多的阐述,就把问题说明了:“一方面是一定的权威,不管它是怎样造成的,另一方面是一定的服从,这两者,不管社会组织怎样,在产品的生产和流通赖以进行的物质条件下,都是我们所必须的。”材料不多,却具有无可辩驳的逻辑力量。产生这样的效果,一个重要原因,在于材料选得十分精悍典型。
毕业论文资料整理方法与技巧:
广泛地搜集、阅读
论文提出的问题要集中, 材料的收集却要尽可能地广泛。一般说来,至少要做好以下三方面的知识、材料准备。
1)能够反映研究对象本身各种具体特征的专题材料
充分熟悉对象,是正确认识对象的必不可少的前提。除了直接了解对象本身的各种具体特征(通过有关作家的全部作品,有关问题的各种知识,……),还要把握一切能够影响研究对象的生成和发展变化的社会、历史条件或精神、物质因素。只有尽可能全面地掌握这些材料。进行研究时才能充分体现马克思主义的“活的灵魂”———对于具体情况作具体分析。
2)作为明确方向和思想指导的理论准备
所谓科学研究,就是通过正确、严密的分析、概括和抽象工作, 从具体的事物和现象中找出本质性和规律性的东西来。这项工作,本身就要有正确的理论(专业理论和作为世界观和方法论起作用的哲学思想)所指导。科学实践和发展的历史还告诉我们,进行一项研究工作,不仅需求充分的专业理论、知识,最好还能力求广泛通晓其它有关学科的理论和知识。通过不同学科的`理论和方法的相互渗透,相互启发(例如, 用系统的方法分析艺术形象的美学特征和社会功能;把模糊数学的方法引入修辞学研究中去), 往往可以更好地带来新的发现;新的突破。
3)别人对于这一问题已经发表过的意见
这方面的材料要尽量搜集。别人已经解决的问题,自然不必再花力气去作重复劳动; 充分吸收别人已有的经验,或是了解别人所遇疑难的焦点所在,对不同观点仔细进行比较研究,既可以少走弯路,也便于发现问题,就象兵法上所说的那样,只有“知己知彼”,才能“百战不殆”。
认真地整理、辨析
要使材料发挥作用,还需运用科学的观点和方法,下一番辨析、整理的工夫,去粗取精,去伪存真,使材料系统化,条理化,真能有助于分析、解决问题。整理材料的形式大致有以下几种:
1)制成文献、资料的目录索引。可以利用有关的现成材料(图书馆、资料室的目录卡片和报刊索引等),根据自己的选题加以编写。
2)剪报、札记、文摘卡。这一类资料的搜集整理工作,必须力求眉目清楚。一要详细注明每则资料的作者、篇名、出处、发表日期,二要有细致合理的分类。
3)大事记、年谱或著译年表。通过这一类材料的编写,可以加强对于研究对象的总体印象,有助于在胸有全局的基础上深化对于某一专题、某一侧面的研究。
2 毕业论文内容写作的方法与技巧
论文的结构
论文的结构,并没有一成不变的模式,从一般的情况来看,大体上可以分作“引言”“正文”和“结论”三个部分。引言的作用,主要是说明选题的原因,概述前人已有的成果和尚存的疑难、争执,提出本文所要探讨、解决的问题;正文是分析、论证的过程;结论则是整个研究成果的总结性的表述。有的文章在引言之前,还有小标题目录和全文的内容摘要。
提纲的作用
论题拟定,材料大致齐备,动手写作论文之前,应仔细拟出论文提纲。提纲也有个反复修改补充的过程。这步工作做好了,论文已大致成竹在胸。一个成熟的提纲,有助于树立全局观念,从整体出发,去考察每一个局部,并考虑个部分之间应有的逻辑联系。各部分所占的篇幅应与其在全局中的地位和作用相称,避免不必要的重复。既要重点突出,又要照顾全面。
要有正确而多样的研究、分析方法
初学学术论文写作的人,往往容易犯归纳多而分析少的毛病。要么是就事论事的材料罗列,要么是轻易而简单化地得出结论,不善于通过有层次、有根据的分析、论证,充分显示其思想观点的说服力和深刻性。这里就需要注意研究方法或分析方法的改进、提高。一般说来,有以下几种:
1)哲学的方法
这是指如何根据唯物主义辨证法对于哲学基本范畴(现象和本质,存在和运动,原因和结果……)的理解,正确解决具体研究工作中的本体论和一般方法论的问题(比如,从认识对象的现象到认识对象的本质)。
2)历史的方法
这是强调尊重对象本身的历史具体性的方法。它要求研究工作者必须充分熟悉客观对象历史发展的实际进程,占有大量资料,从中寻找出客观对象的特点及其发展规律性。
3)逻辑的方法
这是要求我们必须正确运用形式逻辑和辨证逻辑所揭示的关于人们思维的一般规律(概念、判断、推理、分析与综合、具体与抽象……), 对客观事物的各种现象进行逻辑分析,寻求它们之间的规律性联系,并用理论的形态加以体现。
4)假说的方法
所谓假说,并不是随意的幻想和碰运气的猜测,而是以一定的经验事实材料为基础, 以一定的科学理论为依据,借助于研究者的活跃联想或直觉感受,提出的一种富有预见性、然而尚待继续验证的新观点。它们虽然还不能称为科学的结论,但却常常是新思想、新理论的萌芽。
科研成果的正确获得,往往是和上述各种方法的另国而紧密地结合使用分不开的。
引用材料的方式
材料是文章的血肉。但是,援引不当,交代不清,也会影响文章的质量。引用材料的方式有这么几种:
1)完整引用。照录原文一句或一段话,不能任意删削或添加别的内容。前后要加引号。如果引文单独成一段,每行均比其它文字往后空两格。
2)概括引用。用作者自己的语言将引文的原意转述出来。前后无须加引号,也不用其它格式或符号加以突出。
3)分析引用。将引文的内容拆散、打碎,和论文作者自己的阐述分析文字自然地糅合在一起。这样可以避免由于单独的引文太多而使文章显得累赘或影响风格的统一。
毕业论文参考文献可以从图书馆或者中国知网上找。
毕业论文指的是你在大学期间对你所学专业的现实或理论问题进行科学探索且是有一定意义的论文,一般大学生在大三下半学期就可以为毕业论文做准备了,因为大四的上半学期要准备实习,下半学期要准备毕业答辩,等大四再去慢慢准备毕业论文时间是很仓促的。毕业论文的撰写过程要求是相当高的,学生要在相关教师的指导下,选定要写的课题才行,这也是从总体上考察一名大学生大学四年的学习成果。
毕业论文一般都包含以下部分:题目、署名、中文摘要、中文关键词、英文摘要、英文关键词(其中英文摘要和关键词要与中文摘要和关键词相对应)、引言(前言)、正文、参考文献、致谢辞和附录。其中对参考文献的要求和格式都特别严格,查找参考文献的过程也特别浪费时间,下面我将讲讲一些找参考文献的方法。
1.确定方向
不管你要找什么类型的参考,首先都要确定你的毕业论文写作方向,然后根据根据你的毕业论文主题去寻找你所需要的参考文献。所以,定方向是至关重要的一步。
2.找信息
找信息这一步是最耗费心血也是工作量最大的一步了,因为就算你明确了你要找的参考文献目标,但是这一类的参考文献实在太多了,所以找起来也不方便。这些都是你要面临的挑战。找参考文献的话主要有两种方法:①图书馆。不过这个图书馆的范围就有点大了,你可以利用学校的图书馆,毕竟每一所高校的图书馆都提供了很多的资源供大家使用。同时要是学校图书馆的还是不能找到你所需的参考文献,你也可以去当地的图书馆,每一个县级以上的地区都设有它们专门的图书馆,你可以去看看。
②网站信息。随着大数据时代的来临,我们查找资料也越来越方便了,只用动动手指就可以在网上查找到你所需要的资料。现在网上也有专门的网站为大家提供寻找参考文献的便利。比如中国知网和全国学术快报等。
3.信息来源
毕业论文的参考文献不仅仅是局限于一些专著,它还可以包括论文集、辞书、研究报告、期刊文章和报纸文章等。
所以其实找毕业论文的参考文献其实有多种途径,能找的文献也很多,只是在找的过程中比较麻烦,还有就是一定不要抄袭,要是在毕业论文出现抄袭现象后果是很严重的。
以下四种方式查找参考文献:
1.检索头牌:Pubmed
Pubmed作为美国国家医学图书馆所属的国家生物技术信息中心开发的一款论文搜索引擎,凭借其海量的文献数据和简便快捷的搜索方式,成为了网上使用最广泛的生物医学方面的文献搜索工具。我们可以通过最简单的在标题和摘要中搜寻相关的关键词或相关公式,来寻找相关的文章。
2.用之不易的Google学术
这个其实并不能算是文献检索工具,但其有个很大的特点就是能够对全文进行搜索,而不是像上面说的那两个只是搜索标题和摘要。因此当要搜索事实型依据的时候,比如,要搜索“某病的发病率为36%”这样的出处,在摘要中可能没有具体的数据,所以需要google来进行全文搜索。
Google学术的功能还是挺强大的,不过在天朝却被封了,要是想用还得翻墙。不过不知道是应广大学者的呼唤,据说,最近Google又可以用了,这机会可是来自不易,小伙伴们还是抓紧时机享受这一福利吧。
3.关联检索:Web of Science
这个方法比较适合研究机构,因为Web of Science的数据库是要收费的,但其搜索引擎比Pubmed更高级,不但能够限定文章的学科,还能限定作者的国籍单位等等,非常好用。值得一提的是它里面的逻辑连接词比Pubmed多了一个很实用词——Near,这个能在相邻的两个句子中寻找关键词。比方说要搜索高血压和糖尿病的关系,如果使用一般”AND“来连接,可能会出现头一句是说的糖尿病,然后结尾出来个高血压,其实并无联系。但用”Near”的话,由于两个词之间的距离被限定了,因此相关的概率也会高的多。
4.中文检索:万方,知网,维普等。
这样进行学位论文的检索:
查找国内高校的学位论文一般有一下三个途径
1.学校图书馆。
我国各高校的学位论文在学校的图书馆都有存档,可以在学校的图书馆中进行查阅浏览。学校图书馆中不一定你有想要的相关学位论文,但这也是学位论文检索的一个有效途径。
2.国家图书馆。
每年各高校的毕业学位论文都会派送到国家图书馆进行印刷,国家图书馆会将其进行编号存档,我们可以在国家图书馆的网站上进行基本信息浏览,以查找相关学位论文。
3.论文网站系统。
一些正规的论文网站都有收录高校的学位论文,登录网站进行检索可以浏览论文的基本信息或进行下载查阅。
我国国内有一些正规的学位论文查询系统,例如:CNKI中的《中国优秀硕士学位论文全文数据库》和《中国博士学位论文全文数据库》以及万方数据公司的《中国学位论文全文数据库》,这三个文库都可以直接看到论文全文。
国家科技图书文献中心(NSTL)的《中文学位论文》共有论文万篇,但它只能检索到题录和文摘信息,要查看论文全文需要进行购买。
以上就是关于“学位论文检索途径与方法”的全部内容了,想了解更多论文写作技巧知识,请持续关注PaperPass论文知识频道,小编会为大家收集更多的论文知识哦。
写论文的时候,通常要求大家以后写十篇左右的参考文献。参考文献的要求应该和你写的题目有关。你写的是会计论文,后面的参考文献是体育论文,是完全不行的。下面和小编一起来了解论文怎么查参考文献? 论文参考文献通常需要10~15个左右,有些学校需要两个英文参考文献。参考文献通常有自己独特的格式,参考文献主要分为期刊和论文。许多学生不知道如何查看这些参考文献,其实并不难。最简单的方法就是直接从查重报告上抄下来。小编推荐的查重系统是Paperfree,将论文上传到该系统进行查重,通常等待15-30分钟左右,会有详细的查重报告。本查重报告将列出本文引用的一些参考文献,因此您只需将本查重报告上的一些参考文献原封不动地复制到您的论文中。这种查找参考文献的方法是最简单方便的,可以原封不动的复制,也可以保证参考文献的格式不会出错。 另一种方法是在早期写论文时阅读大量的参考文献,许多学生会记录这些参考文献的名称。您还可以阅读以前做的阅读笔记,并将这些参考文献摘录到论文中。
1、有没有什么比较好的论文写作技巧?例如如何有清晰的思路,或者比较好的论点一般三步法研究背景研究问题研究对策
根据学术堂的了解,论文写作技巧是很多学生头疼的一个问题,掌握一些写作技巧可以起到事半功倍的效果,下面介绍论文的写作技巧:(一)选题技巧选题是毕业论文写作的开端。能否选择恰当的题目,对于整篇毕业论文写作是否顺利,关系极大。好比走路,这开始的第十步是具有决定意义的,第一步迈向何方,需要慎重考虑。否则,就可能走许多弯路,费许多周折,甚至南辕北辙,难以到达目的地。选题,要遵循这样两条基本原则:第一条是价值原则,即论文的选题要有价值。论文价值有理论价值和应用价值之分,选题时,要把应用价值摆在首位。写的毕业论文不是毫无实际意义的“空对空”的文字游戏,而是来源于现实,并为现实服务的。衡量一篇论文是否有价值以及价值之大小,应当首先看它能满足社会需要的程度如何。我们要从现实生活中选取有意义的题目,写出文章来最好能指导现实,为当前的现实服务。第二条是可行原则。选题时要充分考虑主客观条件。客观条件主要是写作的时间、地点、环境;主观条件包括作者的才能、学识和所掌握的材料等。在选择毕业论文题目时,必须考虑自己的主、客观条件,量力而行。即要选择那些客观上需要,主观上又有能力完成的题目。(二)搜集材料技巧材料是文章的血肉,写文章不能没有材料。毕业论文如果缺少翔实的材料,就会像毛泽东同志曾经批评过的党八股那样,“空话连篇,言之无物”,“像个瘪三,瘦得难看”。 写作的材料从哪里来?第一来自生活。人民群众丰富多采的生活实践是文章写作取之不尽、用之不竭的源泉。鲁迅曾对青年作家说过,“此后如要创作,第一须观察”,要去“读‘世间’这一部活书”。党校学员来自党政机关、企事业单位,大都具有较丰富的实践经验,指引导他们从自己的工作实践中,从自己的“生活仓库”中摄取写作材料。第二来自书本,包括各种文献资料、报刊杂志等。宋朝朱熹诗曰:“半亩方塘一鉴开,天光云影共徘徊。问渠哪得清如许,为有源头活水来。”讲的是读书的好处。书籍是人生最好的老师,写作者如能经常向书本请教,文章的材料就像“源头活水”那样源源不断。指时博览群书,浏览各种报刊,发现有用的材料,就可以向学员推荐。材料靠自己去搜集。指导教师可以指导学员先制定一个搜集材料的目录,如是调查材料,可按时、地、对象拟定目录;如是文献资料,可按书刊名称和发行年月安排目录。要着重搜集第一手材料,对第二手材料要查明出处、核对原著。(三)立意技巧立意就是确立文章主题。主题在文章中处于核心地位,是文章的“灵魂”和“统帅”。一篇文章质量高低、价值大小,主题是其衡量的主要尺度。学员立意,要遵循以下原则:第一,符合现实需要,体现时代精神。文章是时代的产物、现实的反映,它的主题应体现出那个时代的特征及发展方向。因此,毕业论文应牢牢把握时代脉膊,回答时代提出的最尖锐、最迫切、最现实的问题,以推动社会向前发展。第二,反映客观事物本质。文章是对客观事物的认识和反映,但并不是像镜子那样机械地反照现实,而应当反映客观事物的某种本质,揭示其内部的规律性。
毕业论文格式要求:
毕业论文设计统一用A4纸打印。
页边距一般设置为:上,下,左3cm,右2cm具体按学校毕业论文格式要求。
封面:使用学校统一的封面格式,题目使用宋体,一号,加粗,居中,题目是对毕业论文(设计)的高度概括,简明、易读,字数应在20以内学生姓名、学号、专业等用宋体。
毕业论文中文题目字体:黑体,字号:小二,加粗,居中。
段落:段前为2行,段后2行。行距固定值23磅。
样式:标题+黑体。下面空一行。
摘 要字体:黑体,居中,字号:三号,段落:段后行.
摘要正文字体:宋体,字号:四号。
段落:左对齐,首行缩进2个字符,倍行距。300字左右摘要应简要说明毕业论文(设计)所研究的内容、目的、实验方法、主要成果和创新点。
论文写作技巧:
1、写论文前先做好规划
无论做什么,都要有一个规划,写论文也不例外,有了规划,就能知道自己每天要完成的事情,以及完成的程度了,就不会糊里糊涂地开始,又糊里糊涂地结束了。
2、先完成论文初稿,再来追求完美
写毕业论文,先不要过分纠结,过分追求完美,我们要先完成论文初稿,然后再来追求完美。在写论文初稿的时候,要记住一个字,那就是“快”了。
可以尝试使用一些写作工具,比如笔杆网的在线写作功能。在线写作服务是笔杆的特色写作服务,不单单只是将传统写作形式升级了一下,在线写作结合了云端的优势同时与大数据服务紧密融合,不仅从写作安全性、便捷性上提升体验,从写作内容辅助服务方面也创新了不少特色。