首页 > 期刊发表知识库 > 文献检索搜索引擎的工作原理

文献检索搜索引擎的工作原理

发布时间:

文献检索搜索引擎的工作原理

tcndle

很多知识明明可以简单的学,只是我们没有接触到好的材料才走弯路。互联网是美国人发明的,看看美国人怎么讲搜索引擎的吧!_show/id_XODQ0Njc5ODhtml

文献检索搜索引擎

检索中文文献用:百度学术、知网、万方、维普(期刊库)、超星读秀(电子书)、全国图书馆参考咨询联盟(电子书)检索外文文献用:谷歌学术(外文学术文献搜索)、sci-hub(外文学术文献下载)、Web of Science(ISI科学引文索引)、ScienceDirect(综合)、springer(电子书)、、PubMed(生物医学)、Wiley(综合)以上是检索中外文献常用数据库,如果没有这些数据库使用权可以通过文献党下载器()访问这些数据库。

文献检索常用的搜索引擎

首先是Web of Science网站。全球领先的跨学科引文数据库,也是SCI查询网站。在这个网站可以查询所有被SCI收录的期刊、文章等。我们经常会有这样的需求:这个期刊是不是SCI?影响因子是多少?

1. 布尔逻辑检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。 2. 截词检索 截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索3. 位置检索 位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。4. 字段限定检索 字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。5. 加权检索 加权检索是某些检索系统中提供的一种定量检索技术。加权检索同布尔检索、截词检索等一样,也是文献检索的一个基本检索手段,但与它们不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。 6. 聚类检索 聚类是把没有分类的事物,在不知道应分几类的情况下,根据事物彼此不同的内在属性,将属性相似的信息划分到同一类下面。

一般文献检索是没有软件的,我们一般都是用中国知网查找国内的一些期刊和文献,呃,用wb去查国外的一些文献。

检索中文文献用:百度学术、知网、万方、维普(期刊库)、超星读秀(电子书)、全国图书馆参考咨询联盟(电子书)检索外文文献用:谷歌学术(外文学术文献搜索)、sci-hub(外文学术文献下载)、Web of Science(ISI科学引文索引)、ScienceDirect(综合)、springer(电子书)、、PubMed(生物医学)、Wiley(综合)以上是检索中外文献常用数据库,如果没有这些数据库使用权可以通过文献党下载器()访问这些数据库。

文献检索搜索引擎技巧

1、选择综合性的搜索引擎(检索系统)2、选择出名的搜索引擎(检索系统)3、选择响应速度快的搜索引擎(检索系统)4、选择用户界面简介友好的搜索引擎(检索系统)5、选择更新周期短、更新速度快的搜索引擎(检索系统)6、选择数据库容量大的搜索引擎(检索系统)7、选择检索结果准确度高的搜索引擎(检索系统)8、选择合适的上网时间,避开上网高峰9、使用恰当的检索词9、使用高级检索10、利用网络导航11、多使用布尔逻辑检索

把你要收缩的东西的关键词一定要找准尝试是用多个相似意思的关键词,和多个搜索引擎

百度啊基本都能搜到你想要的

常用的信检索方法有普通法、追溯法和分段法。1、普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性强,效果较好。2、追溯法是利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。3、分段法是追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。扩展资料:信息检索技巧:(1) 提高查全率的方法:降低检索词的专指度,用上位词或相关词补充到检索式中;尽可能多地罗列同义词;使用多个检索途径;取消某些过严的限制,尽可能在所有检索的字段中检索;使用截词检索方法:使用"OR" 进行检索;使用多元搜索引擎。(2)提高查准率的方法:提高检索式的专指度,增加或换用下位词和专指度较高的词增加概念进行限制;限制检索词出现的可检字段;利用NOT 限制一些不相关的概念;使用"AND"检索;利用进阶检索功能(即利用前一次检索的结果作为后一次检索的范围,逐步缩小检索范围)。(3)加快检索速度的技巧有:利用检索站点的特色服务快速检索;掌握不同引擎的搜索策略,充分利用不同引擎的优点,可以获得最佳最快的检索结果。(4)一般的搜索技术有:逻辑操作符的使用,包括and, not, or; +、-和通配符的使用;不要滥用空格,在输入汉字作关键词时,不要在汉字后追加不必要的空格;注意大小写的敏感性:避免使用一个词查询,输入的主题词尽可能多而且是精确词或词组有利于缩小检索范围"最专指面优先"(5)机检和手检有机结合起来,节约检索费用机检即计算机检索,包括光盘检索、联机检索、网络检索。手检即手工检索,主要是利用工具书和期刊查找资料。计算机检索的出现为情报检索的发展开创了崭新的局面,它改变传统手工检索的方式,能迅速为检索者查找信息资料。不过,即使机检有再多的优点,有时也需要手检与之配合,以达到更好的效果。(6)注意检索策略信息动向,培养信息检索能力。参考资料来源:百度百科-信息检索

文献检索搜索引擎教学

随着技术的进步,搜索引擎其实应用门槛约实际上越来越低,你随意输入的关键词,百度Google这样的搜索引擎都能通过算法和技术模型,快速给你返回你想要找的信息相关的或者看起来“貌似”相关的信息。与此同时的另一端,就是搜索出来的内容,这个生态也在不断演进,内容生产的一些产品和技术手段的进步,带来内容生产的门槛的降低、成本的降低、传播模式的进化等,导致搜索引擎找到所需变得更更困难了。2000年的时候,百度能收录中文500万网页,都已经好厉害了,但是今天,这个数字已经翻了2000倍,随便搜索一个词,都给你几百万条结果。除了难辨真假外,---这,搜索结果太多,不够准确,在搜索结果中的二次筛选,又成了新的搜索技术应用门槛。搜索引擎在面对信息量级的集合级规模增长的时候,还有各种针对搜索和传播的直接cheat,用户通过搜索获取的成本越来越高,甚至夸张点说,信息量巨大,超越搜索引擎的驾驭能力的时候,已经造成了新的信息不对称。社交信息的封闭、invisible web的疯狂增长,让用户在平等获取信息的能力层面,迎来了新的挑战。那如何当前场景下,有效利用好搜索和互联网信息工具,获取信息和使用信息,与若干年前相比的思考和实践相比,我最近做了一些新的归纳和总结,并提出了一些新的问题的开发和解法。如果您也有一些自己的方法和经验,欢迎跟哈斯交流探讨。1 你要清楚自己要找的信息可能会在哪里存在首先你要知道你要什么,这是搜索引擎获取信息的基本前提,清晰的目标认知是基础清楚要什么之后,想想你需要的信息会在哪里,网页里、微博等社交网站里、还是网络存储里,是文档形式、还是音视频文件格式里?不同存在形态,决定了你用什么方式逼近他,用什么工具来获取和消费他。另一种情况,就是他会在墙内还是墙外。会不会被阉割掉,他会以什么特征存在。还有就是他可能不会存在于网络上,如果是传统的存在形式、或者特殊存在态,到底接近真相的最短路径是什么。2 评估其可能的存在形式一般情况这个这句话,有这么三层含义,其一是这个内容会是一个什么类型的信息存在,网页、音视频、数据库的一条资源、一条微博、亦或是一段微信朋友圈的私密信息?其二,是一个文档还是一个应用程序安装包,其三,可能会存在于什么类型的网站上,从事理关系上理解其存在的客观性和可信度的评价【输入“虚假信息”可获取关于哈斯日志此前发布的利用搜索引擎获取信息的信息真伪判断的一些思考】。有了这些基础判断,你可以在使用什么搜索工具的选择上,以及是否需要配套支持的工具等方面做足准备。甚至有时候,前置去先搜索和找到相应的工具。3 搜索工具的选择。在考虑使用什么搜索工具最好时,除了百度Google之外,各种垂直工具其实也很多,比如视频搜索、微博搜索、产品比价搜索、学术论文搜索、电子书等这些垂直工具或者专业搜索引擎,可能在有些特征的内容的搜索上,会帮到你更多。当然,有些时候,可能通用搜索工具百度Google这类工具,只是找到你找信息的一条线索,比如找到特征词、找到相关领域的垂直工具等,比如追踪学术成果类,可能就是用特征关键词+发表等找到具体学术成果的标准描述,然后再学术搜索引擎如cnki、万方等网站进行准确搜索。一般通用搜索工具百度Google里对时效性高、事件速度趋近实时的,这类信息反应都不如twitter、微博里搜索反馈更快。4 找到恰当关键词来表达你的需求。毕竟搜索引擎还没有智能到象阿拉丁神灯一样,你说要啥,他马上就能找出拉给你。搜索结果反馈的只能是互联网世界的一种相对客观的存在。这种存在又是一种生态级的复杂现实的映射,网络上不存在的信息或者不存在的资源,你确实无法通过搜索来获得。网络上存在的,又不是一般性开发Web形式,则需要一些技巧和绕弯。更有很多的时候,你需要查找的信息,是用多重查询的结果中的相关线索,相互验证、互相补充、再加上你的智慧进行黏合获得。虽然搜索结果在很多集成应用上做了优化,比如可以直接处理计算器、汇率转换计算、度量衡、天气预报、车号限行等,相对于各自垂直领域的处理能力,搜索引擎这个处理水平只能说很初级,可以在适当时候使用,别抱有太高期望。5 关键表达的技巧:(1)准确,精悍。多个词组并列表达,以空格分割,不要描述性语言。精确提炼要搜索消息的关键词,配置相关类型的pattern term,比如搜索资讯类,就可以配置发布、报道之类的pattern term。比如你搜索“06版本的越狱工具”与“ios 06 越狱”中间都有空格哦,这两者结果是完全不同,前者的结果基本没用【限于2月24日21:05分搜索测试效果哦】。(2)一般能准确提炼要搜索的信息的核心词表达即可,别加过多的辅助词汇,尤其是明显冗余的词汇,比如腾讯QQ微博。如果非要加的话,可以用|来做分割,表达“或”搜索的关系。当然现在一般都已经引入了统计模型,会对你的搜索关键词进行纠正,甚至会对你的关键词中非准确表达的信息进行自动修正或者忽略,我这里描述的仅限于搜索一些很稀有的内容是需要关注,大众化,遍地都是的那些资讯,这些方法没有太大价值。当然,也不要迷信智能搜索和精确匹配,找不到时换个词、切分一下长搜索关键词的表达方式。想想如果你来表述这段信息的时候,会怎么描述这段文字,别人会用什么样的语汇去描述,这样能帮助你更好的提炼关键词。(3)对于特别强调的关键词特征,要求必须匹配的加双引号,提示搜索引擎这个词不能忽略、不能切分成子term。比如,搜索“哈斯日志“ invisible web,与不加双引号的结果就不一样。(4)能有效利用搜索引擎高级语法,将大大提高搜索目标抵达的速度和获取信息的效率,比如site(限定网站内)、intitle(关键词出现在网页标题中)、inurl(关键词出现在网址中)、filetype(文档类型,泛指除了网页文本类型外的,如PDF、doc、rtf、excel、ppt)、逻辑符号(特意强调一下,排除某关键词用减号-),甚至Google支持通配符、百度filetype:all专有搜索所有文档类文件。一般高级语法与关键词中间需要一个空格,比如,site: mtk,就可以找到很多mtk芯片手机的工具、rom,当然,如果你知道是mtk什么型号,那结果将更精准。搜索引擎的高级搜索能提供更精确的搜索方法,比如相关网页、限制时间、inanchor--锚链接文本、intext--网页正文而不是其他位置等(5)搜索到结果后,有效地分辨目标网页信息资源存在的可能。一般情况下,大站比小站靠谱,个人博客、论坛社区比新闻媒体真实,官方网站gov、edu、ac类后缀网站上信息比其他网站信息权威。当然泛指,这些有个前提就是在墙内的生态状况下。很多作弊网页、搜索结果聚合页面都没有有效信息,从网站知名度、快照打打开网页利用Ctrl+f快速找一下你要找的关键词,看下周边信息是否是你需要的。还有个好处是,很多网站现在都存在钓鱼和挂马之嫌,快照因为不加载网页某些动态载入的代码,所以相对安全些。(6)快速获取别人的搜索经验和技巧比如搜索框下拉的suggestion提示,搜索结果下方的相关搜索,百度搜索结果右侧“搜索这个关键词的人还在搜”等,搜索引擎已经利用众包、大数据的力量替你做了一些推荐性的提示,也许这里能帮你找到抵达目标的其他线索。(7)发挥垂直搜索应用工具的功用对于某些更具体的应用,比如电话号码验证,看是不是骚扰电话、是哪里的,你已经可以直接在搜索框搜索,也可以利用一些垂直搜索工具如ip138、来电通、搜狗号码通这样的垂直工具(后两者,安装相应的APP,在手机上拨一下号码即可查获)另外垂直工具随着互联网业态的丰富也已经都有有了很多,购物、旅游、酒店、机票、文档、模板搜索,电脑软件、手机软件下载搜索,音乐搜索,购物搜索,学术论文、文献检索工具、找人、地图搜索、以图搜图等。著名的个人网站汉典做词典查询做的无比专业,当年在费了很大功夫联系到站长,把这份数据引入百度提供服务。(8)利用微博、twitter等社交网络的搜索,找线索很多信息时效性比较强,通用网页搜索找可能不及时,微博twitter这样的平台解决了这个问题,而且我们经常遇到信息被删除,所以利用这类工具找到相应的线索进行扩展,有效地规避屏蔽的内容。(9)找到信息以后,浏览和消费记得作笔记,摘要,重要内容留存备份。现在这类工具很多,存网页的、存内容copy的,都很容易使用,比如evernote【输入evernote可以看看哈斯日志一年前写的相关文章】。最早我使用信息备份的方法是邮箱、再到后来有furl、百度搜藏这类工具,到现在使用evernote,好记性不如烂笔头,这类工具帮你留存线索,以后再用再查找,都会方便很多。绝大多数情况下,我们都可以使用百度Google这样的搜索引擎工具找到自己需要的一般参考信息,但是对于有些实时传播的信息和话题,通过搜索引擎很难如此及时获取,所以在微博上搜索一下,是可以获知部分相关信息和关联的人物、线索的,然后在充分施展利用搜索引擎探索世界的快感。6 在移动互联时代,搜索将大不相同。在移动互联终端上,有充分利用移动终端特性的一些搜索工具和技巧,比如即拍即搜、比如扫码、比如定位查找附近等,甚至还有在移动设备OS内置的搜索的特性,有效管理自己本地的短信、通讯录、文件等内容。那么在移动设备上,垂直APP的选择就是你重要的信息获取通道,专业垂直类APP要配置到位,地图、音乐、吃饭、购物等等,其实都在不同角度去阐释某一个领域信息获取的需求,与传统一个搜索框不同的是,他们目前是多个地方多个输入框,所以又回到本文之初,你要知道自己需要什么,基于此才能开启你的工具选择和信息消费的旅程。移动设备上,获取信息的形态已经被各种APP推送技术颠覆了,绝大多数情况,我们不用在搜啊搜啊找信息,而是充分利用各种垂直的领域的优秀的APP来去探索和感知这个世界。但是,PC互联网上,搜索的技巧在移动上,用搜索引擎获取信息上依然使用,当然,移动时代这个需求显然被降低了。【输入搜索创新,可获取相关思考的分享】7 根据自己需求,利用网络工具定制自己的信息小助手当然,首先你得知道自己需要什么信息,然后利用工具帮你找到自己关注的、重要的信息,提醒你、推送给你。(1)利用监控关键词给你,把搜索结果变化推送给你,提醒你关注,Google alert。(2)知道你关注那些网站或者网页的,利用feed或者生成feed的工具,推送给你,yahoo pipe、feedspot、feedburner、feedsky等支持订阅转邮件提醒,(3)利用网页定向监控工具跟踪更新和演进,比如,follow the page,提醒新然后你选择去看。这个服务,仅限于本身更新品读较低,但是内容是你特别关注的。比如,我就用这个工具订阅了食品药品监督局网站上公布的食品药品抽检和不合格产品公示信息。有效掌握信息,掌握使用信息的工具和方法,对我们个人实实在在受益。9238的签名“我们若能更妥善地搜寻资料,实在已经改变世界”【输入“俞军”获取相关信息推送】。保持对信息的敏感、掌握适当可用的方法,有效利用信息,又不被各种真真假假困扰、甚至误导,让信息技术成为个人成长、生活娱乐的好帮手,而不要被其奴役,成就愉快的网络之旅!

找相应的数据库搜索引擎,如Google 学术找文献作者要,邮件所取图书馆借找牛人,如知名高校同学

可以利用搜索引擎的高级检索,输入检索词文献检索或具体某个数据库名,文献类型中选择PPT,即可获得

  • 索引序列
  • 文献检索搜索引擎的工作原理
  • 文献检索搜索引擎
  • 文献检索常用的搜索引擎
  • 文献检索搜索引擎技巧
  • 文献检索搜索引擎教学
  • 返回顶部