《医学文献检索》由教学任务是传授文献检索的基本理论、基本知识和基本技能,使学生了解医学专业的文献知识、特点和用途,掌握常用文献检索工具的使用方法,学会利用计算机对医学文献进行检索,提高获取和利用文献信息的能力,为不断地吸收新知识,增强创新能力打下坚实的基础。《医学文献概论》内容结构上分为三部分,共8章。第一部分,即第一章概括论述医学文献信息检索的基本理论。第二部分,包括第二章至第六章,分别介绍主要的中、英文医学文献检索工具与方法,光盘数据检索,网络信息检索和特种文献信息检索;第三部分,包括第七章及第八章,是撰写医学论文及其相关的知识。《医学文献检索》内容丰富、实用,以崭新的面貌呈现在读者面前。该教材可用于医药院校三年制专科各专业的教学;对于广大医学科技工作者及医务管理工作者,也可用于教学、进修学习和自学参考。
一分钟读懂《医学文献检索》
文献由四要素构成:文献信息 符号系统 文献载体 记录方式医学文献特点: 数量庞大 载体多样化 多种文化 学科交叉、出版分散 知识信息更新加快 交流传播速度加快 电子化发展趋势文献检索类型(1)按检出结果形式划分: 书目检索、全文检索、引文检索。(2)从情报检索角度划分:文献检索、数据检索、事实检索(3)按检索手段划分: 手工检索和计算机检索文献检索原理:外表特征 内容特征 文献标引2、文献检索系统类型 目录型、题录型、文摘型、全文型4种。查全率和查准率?检出的相关信息/检索工具中相关信息总量。P=检出的相关信息/检出的信息总量。一、 文献信息的类型1、按文献信息表现形式划分 文字型文献 视频型文献 音频型文献 数字型文献2、按文献信息出版类型划分 图书 专利文献 标准文献 期刊 学位论文 产品样本说明书 科技报告 技术档案 会议文献 政府出版物3、按文献信息的载体形式划分 印刷型 缩微型 声像型 电子型4、按文献信息的加工程度划分 零次文献信息 一次文献信息 二次文献信息 三次文献信息按文献内容加工深度分: 零次文献:书信、手稿、实验数据、观察记录、笔记、内部档案等。 特点:内容新颖,但不成熟,难以查询。一次文献:期刊论文、专利说明书、会议论文、学位论文、科技报告等。 特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。二次文献:目录、索引和文摘等。特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。三次文献:综述、进展、年鉴和百科全书等 文献检索 来源: 潘澍青的日志 l l 范围从大到小:信息〉知识〉情报 >文献 文献是贮存传递知识、情报和信息的介质。知识是文献的实质内容,载体是文献的外在形式。l l 文献由四要素构成:四要素缺一不可。l l 填 文献信息:文献的内容l l 符号系统:信息的携带者l l 文献载体:符号赖以依附的“寄主”l l 记录方式:代表文献的符号进入载体的方法和过程l l 文献是信息、知识、情报的主要载体形式。l 文献信息指文献载体上所承载的信息、知识内容。它属于信息,除具有信息的一切性质和功能外,也有自身的特点。表现为:P3①--⑤l l 文献的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。P4l l 填 选 文献的记录方式是指表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。种类P4按记录手段分:画写,雕刻,印刷,摄制,录音。按记录方法分:手工记录,机械记录,光记录,电记录,声记录,磁记录。l l 文献检索:将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。l l 广义的文献检索包括存储和检索两个过程。l l 填 选 文献检索类型l l (1)按检出结果形式划分:l l 书目检索、全文检索、引文检索。l l (2)从情报检索角度划分:对象l l 文献检索、数据检索、事实检索l l (3)按检索手段划分:l l 手工检索和计算机检索l l 3、文献检索原理l l 外表特征 内容特征 文献标引(indexing)l 文献检索系统定义P7 指根据特定的文献信息需求而建立起来的一种有关文献信息的搜集、加工、存储和检索的程序化系统。l l 文献检索系统类型P8l l 目录型、题录型、文摘型、全文型4种l l 1、按文献信息表现形式划分l l 文字型文献 视频型文献 音频型文献 数字型文献l l 2、按文献信息出版类型划分l l 图书 专利文献 标准文献l l 期刊 学位论文 产品样本说明书l l 科技报告 技术档案 l l 会议文献 政府出版物l l 3、按文献信息的载体形式划分 填l l 印刷型 缩微型 声像型 电子型l l 按文献内容加工深度分: 零次文献:是指未经正式发表或未融入正式交流渠道的最原始的文献,如书信、手稿、实验数据、观察记录、笔记、内部档案等l 特点:内容新颖,但不成熟,难以查询l l一次文献:是指以著者本人的研究成果(如实验、观察、调查研究等结果)为依据而创作的原始文献,如期刊论文、专利说明书、会议论文、学位论文、科技报告等。 l l特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。l l二次文献:是对大量的、分散的、无序的一次文献信息经过加工整序后而形成的文献。如目录、索引和文摘等。l l特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。l l三次文献:是将分散无序的某一范围的一次文献,经过综合整理后而重新组织成有条理有定评的文献,如综述、进展、年鉴和百科全书等。l l特点:对知识信息具有浓缩性和综合性的特点,同时兼有检索文献的作用。l 零次文献是形成一次文献最基本的素材;一次文献是信息的主要来源和检索对象;二次文献是检索的手段和工具;三次文献既是检索对象,同时也具有检索文献之功能。l 《医学主题词表》(MeSh)l 副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。l l2、检索途径l l(1)著者途径:利用已知著者姓名作为检索标识进行文献查检。l l(2)分类途径:利用特定分类体系的分类号或分类类目作为检索标识进行文献查检。l l(3)主题途径:利用从文献中抽出来的、或经过人工规范化的、能代表文献主要内容的检索标识或标引词进行检索。l l(4)其他途径:利用特定的检索标识进行文献查检l (5)号码途径 l 2,3属于反映文献内容特征 1,5和书(刊)名途径反映文献外部特征l l中国期刊全文数据库CNKI l是我国第一个大规模集成化的全文电子学术期刊系统l l目前世界上最大的连续动态更新的中国期刊全文数据库。l l收录年限:1994年---至今,最早回溯到1915年。l l二、检索途径与方式l 初级检索 简单检索、多项单词逻辑组合检索、词频控制、最近词、词扩展等l “主题”检索字段:篇名、关键词、摘要内进行检索。l 高级检索 l 专业检索 所有符号和英文字母,都必须使用英文半角字符l 期刊导航 在主页左边l 查找中华高血压杂志2000年第1期到2009第3期发表的有关原发性高血压的文献。l l 初级检索 查找篇名中出现“高血压”或“肾衰竭” 的文献l 检索黄慧萍 2008年发表在《中华护理杂志》的文章“口腔科门诊护士工作压力情况的调查”被引用过几次 ? 要不要写表达式l 利用中国优秀硕士学位论文全文数据库查找中南大学陈方平导师指导的学位论文。请写出检索式、第一篇学位论文题名及作者。l 数据库:中国优秀硕士学位论文全文数据库l 检索式:((导师单位=中南大学) 或者 (学位授予单位=中南大学))并且(导师=陈方平) (模糊匹配);1999-2009;时间排序; 单库检索l 结果数:2l 第一篇论文题目:rAAV2/hFIX无创途径治疗血友病B的临床研究l l l l l l维 普 中文科技期刊数据库(全文库)类型:期刊全文数据库§收录范围: ?年限:1989年至今?数据量:12000多种期刊,总计1650余万篇文献,逻辑运算符A 逻辑“与”(AND、* ) 检索式:A AND B,表示记录中同时包含检索词A和检索词B的记录才是命中记录。 例如:influenza AND cough influenza * coughB 逻辑“或”(OR、+ ) 检索式:A OR B,表示记录中包含检索词A或检索词B,或者同时包含检索词A和检索词B的记录。 例如: vitamin c OR ascorbic acid vitamin c + ascorbic acidC 逻辑“非”(NOT、- ) 检索式:A NOT B,表示记录中包含检索词A同时不含检索词B的记录为命中记录。 例如:influenza NOT cough, (雌激素减少 AND 冠心病) NOT 更年期妇女 (雌激素减少* 冠心病) - 更年期妇女§维普中刊库中的逻辑运算符 逻辑运算符 * 并且、与、and,在结果中搜索+ 或者 、or,在结果中添加- 不包含、非、not,在结果中除去§ §运算顺序依次为: - > * > +(非>与>或) NOT >AND >OR § §可灵活运用括号“()”改变优先级,括号内的逻辑式优先执行 § §注意:检索过程中,如果检索词中带有括号或逻辑运算符*、+、- 、()、《》等特殊字符,必须在该检索词上用双引号括起来,以免与检索逻辑规则冲突。 数据库检索途径§快速检索 §传统检索 有同义词 在左上方。 还有分类检索,在左下角 §高级检索 §期刊检索作业格式§检索方式:传统检索 同义词功能 §题名/关键词=艾滋病(爱滋病、AIDS、获得性免疫缺陷综合症) §题名/关键词=监测 二次检索 §检索结果数:?篇 §第一篇文献标题: § 作者: § 出处: §检索方式:期刊检索 §刊名:中华医学杂志 §在本刊中检索:甲状腺炎 §结果数: 篇 §抄第一条记录的题录(标题,作者,出处)PubMed数据库简介 是美国NLM所属的国家生物技术信息中心(NCBI)开发的一个以Web方式向用户提供服务的生物医学文献检索系统,是目前世界上查找医学文献利用率最高的网上免费数据库PubMed的数据范围 内容MEDLINE OLDMEDLINE(1950-1965) PreMedline 出版商提供的书目信息l l MEDLINE收录范围:来源于美国和世界上70多个国家和地区、50种语言的7395种(截止到现在)权威生物医学及相关学科期刊,内容涉及生物医学各个领域;85%以上原文为英语,80%±记录有文摘,5%免费全文。目前记录已达约1900万条,约40万篇/年 。 回溯时间:1966年至今。记录中有[indexed for MEDLIEN]标记 使用词表:MeSH(医学主题词表)PreMEDLINE是一种由正在加工处理中的文献记录组成的数据库,这些新记录还未被或正在标引,暂时存放在PreMEDLINE数据库中。l l记录中有[PubMed-in process]的标记。出版商提供的书目信息出版商直接向PubMed提供的非Medline收录的电子刊物,记录标有[Record as supplied by publishers]标记。(如:Science或Nature中的地质文献等)。 Nucleotide:DNA序列数据库Protein:蛋白质序列数据库Genome:基因组序列数据库Structure:分子结构模型数据库OMIM:人类孟德尔遗传学在线数据库PMC: PubMed中心,免费全文期刊检索PubMed的检索途径和方法基本检索 高级检索 主题检索 药物:副主题词是治疗应用(therapeutic use)疾病:副主题词是药物治疗(drug therapy) 期刊检索 Journal Database 专用检索(一)基本检索PUBMED提供了词汇自动转换功能: MeSH转换表 期刊转换表 短语表 作者姓名索引 逻辑运算符检索2检索运算符(1)逻辑运算符: OR、AND、NOT 运算顺序:NOT>AND>OR,可用()改变检索词的处理顺序。(2)截词符:*。eg: cell*:cell、cells、celliferous、cellophane和cellular等词的文献。(3)利用字段标识符进行限定检索: 检索式格式:检索词A[字段标识B],检索在字段中含有检索词A的文献。 如: hepatitis[TI],smith [AU],cell[TA]。(4)“ ”,将短语做为不可分割的整体进行检索。 如:“OXYGEN FREE RADICALS ”注意:AND 必须大写、[ ]和“ ”必须为英文或中文半角。姓在前,名在后 姓全称,名缩写(二)PubMed高级检索Limits (限定)Publication Types:有7种类型Languages:提供常用的7种语种Ages:共有13个年龄段Gender:男性、女性Human or AnimalSubsets(子集):11个主要子集Dates:可检索1965年至今的文献主题检索:1、点击MeSH Database Mesh界面 输入检索词 Go2、选定该主题词 主题词轮排表 点击该主题词 主题词细节屏 3、主题词细节屏(主题词词义注释、副主题词、加权或不扩展、入口词、曾用词、树状结构) 选择合适的副主题词选择加权或不扩展 send to4、search box 点击 search PubMed 检索结果ScienceDirect SD是Elsevier公司的核心产品,是全学科的全文数据库,集世界领先的经同行评审的科技和医学信息之大成,得到130多个国家认可,中国高校每月下载量高达250万篇。二、检索运算符AND 默认算符,要求多个检索词同时出现在文章中 OR 检索词中的任意一个或多个出现在文章中 AND NOT 后面所跟的词不出现在文章中 通配符 * 取代单词中的任意个(0,1,2…)字母 通配符 ? 取代单词中的1个字母 W/n PRE/n 两词相隔不超过n个词,词序不定 两词相隔不超过n个词,词序一定 “ ” 宽松短语检索,标点符号、连字符、停用字等会被自动忽略 ‘ ’{} 精确短语检索,所有符号都将被作为检索词进行严格匹配 ( ) 定义检测词顺序,例:(remote OR satellite) AND education 作者检索 先输入名的全称或缩写,然后输入姓,例: r smith ; jianhua zhang 临近符可以用于作者检索,raymond W/3 smith 可检索到 Raymond Smith, Raymond J Smith and Raymond J §临近检索 §W/n 两词相隔不超过n个词,词序不定。 例:pain W/5 morphine §PRE/n 两词相隔不超过n个词,先后次序固定。 例:behavioural PRE/3 disturbances §两种临近符不能同时使用检索-Search: 检索语言§检索优先级 §默认检索顺序 OR W/n | PRE/n AND AND NOT 例:检索包含kidney或者renal,并且包含therapy的文章 kidney OR renal AND therapy §使用( )限定检索次序 例:(remote AND NOT satellite) AND education增加“Specific author”字段,作者检索更加准确;意味着检索词必须出现在同一个人的名字中。三、检索方法§系统提供了四种检索功能: §Browse 浏览检索 §Quick Search 快速检索 §Advanced Search 高级检索 §Expert Search 专家检索 l 字段名和布尔逻辑符均不区分大小写字段名既可以用字段全称,也可以用简写编码中文医学数据库CBM中国生物医学文献数据库 (CBM) 是中国医学科学院医学信息研究所开发研制的综合性医学文献数据库。l 收录范围: 1978 年以来 1600 多种中国生物医学期刊以及汇编、会议论文的文献题录,年增长量约 40 万条。学科覆盖范围涉及基础医学、临床医学、预防医学、药学、中医学及中药学等生物医学的各个领域。l 数据标引CBM的全部题录均根据美国国立医学图书馆最新版《医学主题词表》(即MeSH词表)、中国中医研究院中医药信息研究所出版的《中国中医药学主题词表》进行主题标引,以及《中国图书馆分类法 · 医学专业分类表》进行分类标引。 (一)数据库结构l lCBM数据库的记录包括30多个可检索数据项l l AB 文摘l l AD 地址 (第一著者地址)l l AU 著者l l CN 国内代码 (国内期刊代码)l l CL 分类号l l CT 特征词l l FS 资助类别l l MH 主题词l l PY 出版年l l IS ISSN (国际期刊代码)l l VI 卷l l PT 文献类型l l RF 参文数 (参考文献数)l l (SO) 出处 (复合字段:TA,PY,VI,IP,PG)l l TA 期刊名称l l TI 中文题目l l TW 关键词CBM数据库检索运算符A 逻辑“与”(AND ) 检索式:A AND B,表示记录中同时包含检索词A和检索词B的记录才是命中记录。 例如:肝炎 AND 肝癌 高血压 AND 糖尿病B 逻辑“或”(OR ) 检索式:A OR B,表示记录中包含检索词A或检索词B,或者同时包含检索词A和检索词B的记录。 例如: 肝炎 OR 肝癌 维生素A OR 维生素BC 逻辑“非”(NOT ) 检索式:A NOT B,表示记录中包含检索词A但同时不含检索词B的记录为命中记录。 例如:流感 NOT 咳嗽, (雌激素减少 AND 冠心病) NOT 更年期妇女二)系统运算符l l布尔逻辑运算符的优先顺序依次为NOT>AND>OR,CBMl l通配符:(1)单字通配符?:替代一个字符。如“门?脉”,可检出:门静脉、门动脉等。l l注意:?必须为半角状态。l l (2)任意通配符%:替代任意个字符。如“肝炎%疫苗”,可检出:肝炎疫苗、肝炎病毒基因疫苗、肝炎减毒活疫苗、肝炎灭活疫苗等。l 强制执行符/短语检索符“”l l检索词做为短语或含有特殊符号“-”、“(”等,用英文半角双引号标识检索词,如: “1,25-(OH)2D3”CBM检索方法l l1、基本检索 也称自由词检索或关键词检索l 关键词:来自于文献的篇名、文摘或正文中的文本词,是指能代表文献主题内容实质的、未经或略经规范化处理的自然语言。l CBMdisc默认的是基本检索状态l2、主题检索 MESH词表、汉语主题词表l l3、分类检索l l4、期刊检索 检索途径:期刊导航、刊名、出版地、出版单位、主题词等。l l5、作者检索l l6、限定检索 点更多限定 是把年代、文献类型、研究对象等常用的限定条件整合到一个对话框,方便检索。 系统默认为题录格式, 显示:标题、作者、作者单位、出处。示例1:微量元素的分析审题:两个主题概念,即阿司匹林和哮喘具体分析:应为阿司匹林/副作用方面的文献、哮喘/化学诱导方面的文献,两者关系为“AND” #1 阿司匹林/副作用 #2 哮喘/化学诱导 #3 #1 and #2审题:两个主题概念,即慢性肾衰竭和贫血具体分析:应为慢性肾衰竭/并发症方面的文献、贫血/病因学方面的文献,两者关系为“AND#1 肾衰竭,慢性/并发症 #2 贫血/病因学 #3 #1 and #2 注意:慢性肾衰竭要倒置为肾衰竭,慢性Internet的基本功能 E-mail FTP(文件传输) Telent(远程登录) WWW(信息检索)搜索引擎一般由三部分组成: 搜索软件 首先由搜索器(或称网络机器人)以特定的策略自动或人工地遍历整个互联网,并对信息进行辨别和收集,同时将它们下载并返回至搜索引擎的临时数据库;索引软件 然后,索引器(或称为标引程序)将这些保存的信息进行自动标引形成有规律的索引,再加入到集中管理的倒排索引数据结构中; 检索软件 最后,由检索软件接受用户的检索提问,向索引数据库提交用户的检索提问,从而使数据库输出与之相匹配的结果按检索功能分: 主题分类指南式搜索引擎 关键词式搜索引擎 按检索范围分: 独立搜索引擎 集成搜索引擎 引擎之引擎按检索内容分: 综合搜索引擎 Google(谷歌)、百度、搜狐和新浪 专业搜索引擎 主题词进行规范词转换 Medical Matrix、Health A to Z、Doctor’s guide、Medscape 专题搜索引擎 专门收录某一专题信息的搜索引擎。如天气预报网、旅游网、导购网、中国眼科医生网等等。搜索引擎的检索途径 通常可以分为以下三种:简单检索 关键词式搜索引擎高级检索分类(分模块)检索——主题分类指南式搜索引擎oogle允许以多种语言进行搜索,在操作界面中提供多达46种语言选择,包括英语、主要欧洲国家语言、日语、中文简繁体、朝语等,同时还可以在多达239个国别进行选择。Google的主要特色 相关的检索词网页快照 类似网页定位检索功能Google的特殊功能高级检索语言工具Google学术搜索
信息的特征 载体依附性,无线共享性,永不枯竭性 开发增值性 应用实效性存在普遍性回复情报的定义和属性 是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研、生产中的具体问题所需要的特定知识和信息。 1、知识性(情报的本质是知识。没有一定的知识内容,就不能成为情报。知识性是情报最重要的属性。) 2、传递性(知识若不进行传递交流,供人们利用 ,就不能构成情报。) 3、效用性(情报为用户服务,用户需要情报,效用性是衡量情报工作的重要标志。信息源的类型 按信息源存在的形式划分为个人信息源、组织机构信息源、实物型信息源、文献型信息源、电子型信息源五个类型。 信息源定义 信息源:个人为满足其信息需要而获得的信息来源。 文献定义 用一定的方式(文字,图像声音)记录在一定载体(纸张磁盘光盘等)上的知识都称之为文献。文献是知识的外在表现形式。文献的四要素: 信息内容(文献中所表达的思想意识和知识观念。是文献的内涵 灵魂之所在,直接体现了文献精神产品的性能,具有知识和情报价值)、信息符号(符号系统是揭示文献信息内容的标识,表达知识情报的手段,记录和传播文献信息内容的媒介)、记录方式(将文献符号系统所代表的信息内容通过特定的人工记录手段和方法,使其附着于一定的文献载体材料上)、载体材料(可供记录信息符号的物质材料,是全部信息信息源组成的三要素: 信息生产者、信息、信息技术。 主题语言: 叙词、元词、标题词、关键词。 文献的类型 按信息源内容深度划分为零次文献、一次文献、二次文献、三次文献。1、 零次文献:未经出版发行或未进入社会交流的最原始的文献。 2、 一次文献:以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,习惯上成为原始文献。 3、 二次文献:二次文献是按照特定目的对一定范围或学科领域的大量分散的、无组织的一次文献进行鉴别、筛选、分析、归纳和加工整理重组而成的系统的有序化的、方便查找使用的浓缩简化产物。4、 三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献。 文献型信息的类型:(1)、图书(2)期刊(3)学位论文(4)科技报告(5)专利文献(6)标准文献(7)产品样本(8)会议文献(9)政府出版物回复狭义信息资源的概念 认为信息资源是指人类社会经济活动中,经过加工处理,有序化,并大量积累起来的,有用信息的集合 广义的概念 认为信息资源是指人类社会信息,活动中积累起来的,信息信息,生产者信息技术等信息,活动要素的集合总体来说,信息资源就是人类信息社会活动中大量积累起来的以信息为核心的各类信息活动要素(信息生产者、信息技术、设备、设施、资金等)的集合。 信息资源的构成要素,信息生产者 信息,信息技术 信息源和信息资源的区别信息源不等于信息资源,信息源与信息资源既紧密相关又有区别。信息源是信息资源的源,是先于信息资源的,信息源可以不断的转化为信息资源;但信息源不等于信息资源,信息源是蕴含信息的一切事物,信息资源则是可利用的信息的集合,信息资源可以是一种高质量、高纯度的信息源,但信息源不全是信息资源。 信息文化的特征 数字化全球化 虚拟性交互性 开放性自治性自律性 自由平等共享医学信息素养的内涵主要包括: 信息意识、信息知识、信息勇气、信息道德。 1、 信息意识:指信息在人脑中的反映即人对各种信息的自觉心理反映,反映人在信息活动过程中对信息的认识、态度、价值趋向和一定需求。2、 信息知识:指与信息有关的理论、知识和方法。 3、 信息勇气:指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。 4、 信息道德:指在获取信息、使用、创造和传播过程中应该遵守一定的伦理规范。 信息检索的类型,文献检索 事实检索 数据检索信息检索的类型 1、文献检索(是查找特定相关内容的文献,如 查找某一专题或者找某一著作的文献,再从查找的文献中获取相关的信息,只是最重要、最基本的检索。)2、事实检索(是以特定事实为检索对象,检索的结果是有关某一事物的具体答案,因此事实检索是一种确定性检索。)3、数据检索(是以特定的数据为检索对象,检索的结果是经过测试、评价过的各种数据,可直接用于比较分析或定量分析,是一种确定性的检索。信息检索系统的组成:一般由计算机硬件、计算机软件及数据库三部分组成。 数据库:信息检索系统的信息源,是按一定方式存储磁盘、磁带或光盘上的相互关联的数据集合。 数据库的组成:文档、记录、字段。 数据库的类型:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库世界上的检索语言有很多种,依其划分方法的不同,划分出不同类型。有表达文献外部特征的检索语言,也有表达文献内容特征的检索语言。 信息检索的语言:分类语言、主题语言。(标题词 元词 叙词,关键词)信息检索的途径:分类途径、主题途径、关键词途径、著者途径、题名途径、号码途径、其他途径。 信息检索技术:布尔逻辑检索、截词检索、位置检索、限定字段检索。 分类语言:是运用逻辑分类原理,按文献内容的学科、专业集中文献、从知识分类的角度揭示各类文献在内容上的区别和联系,将性质相同的文献聚集在一起,性质相近的联系在一起,性质不同的予以分开。分类途径 分类途径是按文献内容所需的学科类别来检索文献的途径,通过分类号或类别进行检索。利用分类途径可以了解学科概念之间的隶属、并列、相关等关系,适用于回溯性检索和广义概念(类目概念较大)的检索,能够满足族性检索(按学科集中文献)的要求。查全率高,但查准率低。信息检索的策略:(1)、分析检索课题,明确目标和要求;(2)、检索系统和数据库的选择;(3)、选择检索途径,确定检索标识;(4)、编制检索表达式,调整检索策略;(5)、获取原始文献。 选择检索系统要掌握以下几个原则:专业要对口,报道文献数量多、信息量大,报道速度快、时差短,检索途径多。查全率:是表示检出的相关文献与全部文献库中实际存储着的相关文献的比例。 查全率=检出的相关文献量\文献库中的相关文献总量*100% 查准率:是表示检出的文献中所需要的相关文献所占的比例。查准率=检准的相关文献量\检出的所有文献量*100% 提高检索效果的措施:(1)、提高查全率的措施:a、尽量采取主题词与关键词相结合进行检索;b、主题词检索时要进行扩展检索和使用全部副主题词检索;c、分类检索时要进行扩展检索和全部复分检索;d、删除某个不甚重要的概念组面,减少AND运算;e、多用同义词进行“OR”运算检索;f、采用截词检索等。(2)、提高查准率的措施:a、采用规范化的主题词与副主题词组配进行检索,少用或不用自由词;b、采用限定主要概念主题词字段的加权方式检索;c、增加概念组面,用AND运算符进行连接;d、用NOT算符排除无关概念;e、限定检索字段,如文献类型、语种、作者、刊名等;f、运用放宽位置算符等。搜索引擎:是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。搜索引擎的工作程序可以分为4个步骤:(1)、信息的采集和存储;(2)、索引数据库的建立;(3)、检索界面的建立;(4)、检索结果的相关性处理。搜索引擎的类型:(1)、按搜索的内容划分:综合性搜索引擎、专业性搜索引擎。(2)、按搜索的方式划分:目录式搜索引擎、全文搜索引擎、元搜索引擎、智能搜索引擎。 搜索引擎的结构和原理 一个搜索引擎一般由搜索器、索引器、索引数据库、检索器和用户接口等5部分组成。
信息的特征 载体依附性,无线共享性,永不枯竭性 开发增值性 应用实效性存在普遍性回复情报的定义和属性 是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研、生产中的具体问题所需要的特定知识和信息。 1、知识性(情报的本质是知识。没有一定的知识内容,就不能成为情报。知识性是情报最重要的属性。) 2、传递性(知识若不进行传递交流,供人们利用 ,就不能构成情报。) 3、效用性(情报为用户服务,用户需要情报,效用性是衡量情报工作的重要标志。信息源的类型 按信息源存在的形式划分为个人信息源、组织机构信息源、实物型信息源、文献型信息源、电子型信息源五个类型。 信息源定义 信息源:个人为满足其信息需要而获得的信息来源。 文献定义 用一定的方式(文字,图像声音)记录在一定载体(纸张磁盘光盘等)上的知识都称之为文献。文献是知识的外在表现形式。文献的四要素: 信息内容(文献中所表达的思想意识和知识观念。是文献的内涵 灵魂之所在,直接体现了文献精神产品的性能,具有知识和情报价值)、信息符号(符号系统是揭示文献信息内容的标识,表达知识情报的手段,记录和传播文献信息内容的媒介)、记录方式(将文献符号系统所代表的信息内容通过特定的人工记录手段和方法,使其附着于一定的文献载体材料上)、载体材料(可供记录信息符号的物质材料,是全部信息信息源组成的三要素: 信息生产者、信息、信息技术。 主题语言: 叙词、元词、标题词、关键词。 文献的类型 按信息源内容深度划分为零次文献、一次文献、二次文献、三次文献。1、 零次文献:未经出版发行或未进入社会交流的最原始的文献。 2、 一次文献:以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,习惯上成为原始文献。 3、 二次文献:二次文献是按照特定目的对一定范围或学科领域的大量分散的、无组织的一次文献进行鉴别、筛选、分析、归纳和加工整理重组而成的系统的有序化的、方便查找使用的浓缩简化产物。4、 三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献。 文献型信息的类型:(1)、图书(2)期刊(3)学位论文(4)科技报告(5)专利文献(6)标准文献(7)产品样本(8)会议文献(9)政府出版物回复狭义信息资源的概念 认为信息资源是指人类社会经济活动中,经过加工处理,有序化,并大量积累起来的,有用信息的集合 广义的概念 认为信息资源是指人类社会信息,活动中积累起来的,信息信息,生产者信息技术等信息,活动要素的集合总体来说,信息资源就是人类信息社会活动中大量积累起来的以信息为核心的各类信息活动要素(信息生产者、信息技术、设备、设施、资金等)的集合。 信息资源的构成要素,信息生产者 信息,信息技术 信息源和信息资源的区别信息源不等于信息资源,信息源与信息资源既紧密相关又有区别。信息源是信息资源的源,是先于信息资源的,信息源可以不断的转化为信息资源;但信息源不等于信息资源,信息源是蕴含信息的一切事物,信息资源则是可利用的信息的集合,信息资源可以是一种高质量、高纯度的信息源,但信息源不全是信息资源。 信息文化的特征 数字化全球化 虚拟性交互性 开放性自治性自律性 自由平等共享医学信息素养的内涵主要包括: 信息意识、信息知识、信息勇气、信息道德。 1、 信息意识:指信息在人脑中的反映即人对各种信息的自觉心理反映,反映人在信息活动过程中对信息的认识、态度、价值趋向和一定需求。2、 信息知识:指与信息有关的理论、知识和方法。 3、 信息勇气:指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。 4、 信息道德:指在获取信息、使用、创造和传播过程中应该遵守一定的伦理规范。 信息检索的类型,文献检索 事实检索 数据检索信息检索的类型 1、文献检索(是查找特定相关内容的文献,如 查找某一专题或者找某一著作的文献,再从查找的文献中获取相关的信息,只是最重要、最基本的检索。)2、事实检索(是以特定事实为检索对象,检索的结果是有关某一事物的具体答案,因此事实检索是一种确定性检索。)3、数据检索(是以特定的数据为检索对象,检索的结果是经过测试、评价过的各种数据,可直接用于比较分析或定量分析,是一种确定性的检索。信息检索系统的组成:一般由计算机硬件、计算机软件及数据库三部分组成。 数据库:信息检索系统的信息源,是按一定方式存储磁盘、磁带或光盘上的相互关联的数据集合。 数据库的组成:文档、记录、字段。 数据库的类型:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库世界上的检索语言有很多种,依其划分方法的不同,划分出不同类型。有表达文献外部特征的检索语言,也有表达文献内容特征的检索语言。 信息检索的语言:分类语言、主题语言。(标题词 元词 叙词,关键词)信息检索的途径:分类途径、主题途径、关键词途径、著者途径、题名途径、号码途径、其他途径。 信息检索技术:布尔逻辑检索、截词检索、位置检索、限定字段检索。 分类语言:是运用逻辑分类原理,按文献内容的学科、专业集中文献、从知识分类的角度揭示各类文献在内容上的区别和联系,将性质相同的文献聚集在一起,性质相近的联系在一起,性质不同的予以分开。分类途径 分类途径是按文献内容所需的学科类别来检索文献的途径,通过分类号或类别进行检索。利用分类途径可以了解学科概念之间的隶属、并列、相关等关系,适用于回溯性检索和广义概念(类目概念较大)的检索,能够满足族性检索(按学科集中文献)的要求。查全率高,但查准率低。信息检索的策略:(1)、分析检索课题,明确目标和要求;(2)、检索系统和数据库的选择;(3)、选择检索途径,确定检索标识;(4)、编制检索表达式,调整检索策略;(5)、获取原始文献。 选择检索系统要掌握以下几个原则:专业要对口,报道文献数量多、信息量大,报道速度快、时差短,检索途径多。查全率:是表示检出的相关文献与全部文献库中实际存储着的相关文献的比例。 查全率=检出的相关文献量\文献库中的相关文献总量*100% 查准率:是表示检出的文献中所需要的相关文献所占的比例。查准率=检准的相关文献量\检出的所有文献量*100% 提高检索效果的措施:(1)、提高查全率的措施:a、尽量采取主题词与关键词相结合进行检索;b、主题词检索时要进行扩展检索和使用全部副主题词检索;c、分类检索时要进行扩展检索和全部复分检索;d、删除某个不甚重要的概念组面,减少AND运算;e、多用同义词进行“OR”运算检索;f、采用截词检索等。(2)、提高查准率的措施:a、采用规范化的主题词与副主题词组配进行检索,少用或不用自由词;b、采用限定主要概念主题词字段的加权方式检索;c、增加概念组面,用AND运算符进行连接;d、用NOT算符排除无关概念;e、限定检索字段,如文献类型、语种、作者、刊名等;f、运用放宽位置算符等。搜索引擎:是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。搜索引擎的工作程序可以分为4个步骤:(1)、信息的采集和存储;(2)、索引数据库的建立;(3)、检索界面的建立;(4)、检索结果的相关性处理。搜索引擎的类型:(1)、按搜索的内容划分:综合性搜索引擎、专业性搜索引擎。(2)、按搜索的方式划分:目录式搜索引擎、全文搜索引擎、元搜索引擎、智能搜索引擎。 搜索引擎的结构和原理 一个搜索引擎一般由搜索器、索引器、索引数据库、检索器和用户接口等5部分组成。
文献检索课是培养学生的信息意识,掌握用手工方式和计算机方式从文献中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。本课程的任务是使学生了解各自专业及相关专业文献的基本知识,学会常用的手工文献检索工具和计算机文献检索工具的使用方法,懂得如何获得与利用文献情报,增强自学能力和研究能力。本教材是为卫生事业管理专业的学生专门编写的。针对该专业的特点和教学要求,对教材内容、结构进行丁规划和设计,强调理论联系实际,具有深入浅出、文字简明等特点。为适应信息电子化、网络化时代的要求,在内容上压缩手工检索比例,突出基本知识和方法,适当扩充计算机检索比例,尤其增加了当前流行的光盘数据库、网络数据库和Internet信息检索与利用方面的知识。从实用的角度出发,还重点讨论了美国《科学引文索引》的检索方法以及特种文献的利用,对于非重点的手工检索工具刊只作简单介绍,使之更适合于卫生事业管理专业的教学需要。另外,对文献信息的分析和利用、学术论文和综述的写作也作了详细介绍。本书适合卫生管理专业学生学习。
一,名解: 1, 文献:记录有知识的一切载体。 2, 知识:是人们在认识和改造客观世界的实践中所得出的认识和经验的总和。是人们通过对信息的感知,获取,选择,处理,加工等一系列思维过程,形成的对客观事物的本质和规律的认识。 3, 信息:是物质存在的一种方式,形态和运动状态,是事物的一种普遍属性,一般指数据,消息中包含的意义,可以使消息中描述事件的不定性减少。 4, 信息素养:人们在解决问题时,利用信息的技术和技能。 5, 信息伦理:是指人们从事信息生产,加工,分析研究,传播,管理,开发利用等信息活动的伦理要求,伦理准则和伦理规范,以及在此基础上形成的新型的伦理关系。 6, 信息检索:是为了达到某一特定目的,将信息源与用户需求连接起来,查询,鉴别,选择并确定相关信息的过程。 7, 检索策略:是为实现检索目标制定的全盘计划和方案。 8, 特种文献:是指专利文献,标准文献,会议文献,科技报告和学位论文的总称。 9, 专利:包含专利权,专利技术,专利文献三重含义。 二,选择(不定项),填空 1, 文献的三个基本要素:知识,记录的方式和手段,物质载体。 2, 记录的方式:文字,图象,符号,声频,视频 3, 记录的手段:书写(刀刻,笔写,石雕),印刷(油印,铅印),光电磁(印刷,照相微缩) 4, 物质载体:(现在):纸张,光盘,录相带,胶片,唱片。 (古):甲骨,金石,竹筒,帛。 5、信息的基本属性:客观性,可知性,传递性。 6、信息、知识、文献的相融关系:信息>知识>文献 7、文献按载体划分为:印刷型,电子型; 按出版形式划分为:图书,期刊,特种文献。 8、属一次文献:专著,期刊论文,科技报告,学位论文。 属二次文献:索引,文摘,目录,相应的数据库。 属三次文献:综述,评述,进展,现状,发展趋势等期刊文献和百科全书,年鉴,手册等参考工具书。 属零次文献:实验数据,观测记录,调查材料。 9、网上的信息资源包括:政府信息,科研信息,教育信息,文化信息,休闲娱乐信息。 10、因特网信息资源的特点如下:无限性和广泛性,多样性,廉价性,共享性,新颖性,无序性。 11、因特网上信息资源的种类:Web信息资源,Telnet,FTP信息资源,用户组信息资源,RSS信息资源,BT信息资源,Gopher信息资源。 12、信息素养的基本内容包括:要有信息意识;能有效的利用信息资源;能对信息进行批 判性的思考;并将有用信息融合成自己的知识体系;能主动鉴别各类信息;获取所需 信息并能评价和分析;具有开发和传播信息的能力等。 13、信息素养的构成体系为:信息意识和情感;信息伦理道德;信息知识和信息能力。 14、广义的信息检索包括:储存(如;建立数据库)和检索; 狭义的信息检索包括:检索 15、广义的检索策略包括:一,分析检索课题的实质要求,选择合适的数据库或参考工具书;二,确定检索途径和检索用语;三,建立检索提问表达式,并准备多种备用检索方案等一系列策略。 狭义的检索策略包括:一,确定检索词,并用布尔逻辑算符;二,必要时用截词和邻近算符等与检索词一起构成检索提问表达式的构思。 16、文献检索的途径分类: 按文献的外表特征形成分为:书名途径,著者途径,序号途径; 按文献的内容特征形成可分为:分类途径,主题途径。(文献检索最常用的途径) 17、1999年出版的第四版《中国法》将图书分成二十二个大类,例如:用英文字母进行类号标致,如R表示医药,卫生。 18、专利的种类:发明专利;实用新型专利;外观设计专利。 19、对授予专利权的发明必须具备“三性”原则;新颖性,创造性,实用性。 20、不授予专利的范围:一,科学发现;二,智力活动的规则和方法;三,疾病诊断和治疗方法;四,动物和植物品种;五,原子核变换方法及用该方法获得的物质;六,违反国家法律,社会公德,防害公共利益的发明创造。 21、专利年限为二十年。 22、专利文献的分类:部;大类;小类;主组;分组。 其中IPC将全部科学技术领域,分“A-H”八个部。 23、国际标准刊号:ISSN 国际标准书号:ISBN 国内统一刊号:CN 24、题录格式:题名+著者+出处 文摘格式:题录+摘要 25、检索词的选词原则: 一,首选主题词编写检索式;用主题词检索能紧扣问题中心,网罗性强,可用副主题词限定,可进行下位词扩检等优点。 二,有部分概念无主题词,可用自由词检索; 三,用自由词检索时,要考虑到同一概念可能不同的表达方式; 四,用自由词检索,若一个检索概念含有两个以上单词,要考虑到词间的相邻距离,用合适的邻近符来连接; 五,少用词组,忌用句子,尽量用概念最小化的词。 26、检索常用的网络数据库; 一,综合性数据库(维普全文数据库;中文期刊网全文数据库;万方数据库) 二,专业性数据库(CMCC;CBMDISC;Medline;药学文献数据库等) 三,其它数据库:学位论文,专利(中国专利信息网);成果(国家科技成果网);引文数据库(维普,万方,清华同方引文库)等。 27、分类检索的优点: A,具有反应学科体系的特点 B,采用族性检索,涉及同一学科概念的文献查找更加适宜 C,能较灵活扩大或缩小检索范围 缺点:分类结构一旦确定,不易更动,对新概念或跨学科文献难于进行或极易漏检 28、主要检索的 A,专指性强,能满足特性检索要求 B,打破学科界限 C,能适应科学发展需要,随时添加、改换主题词 D,具有很强的组配性 缺点:对一些内容复杂和主题分散的课题,主题词选择有一定难度,组配较为困难,容易漏检。 三,逻辑表达式(P115例1) 四,简答题。 1、 构建检索策略流程: 分析课题,明确实际要求 ↓ 选择合适的检索工具或数据库 ↓ 概念分析,并转换成合适检索的语词 ← ↓ ↑ 拟定检索提问式,选择检索途径 ↑ ↓ ↑ 检索 ↑ ↓ No ↑ 检索结果是否满意 → 重新检索调整策略 ↓Yes 输出检索结果 2、Pubmed与Medline区别 答:(1)Medline中的记录均按Mesh主题词表进行了标引,而pubmed有一部分待标引文献。 (2)Pubmed的收录范围较Medline要广泛。Pubmed收录的学科范围包括与生物医学基础研究及临床研究有关的生命科学、行为科学、化学、生物工程各 学科及相关教育领域,其中收录的多为学术期刊,也有少量报纸、杂志、通讯等。 3搜索引擎与数据库的比较 基于数据库的搜索 全文检索者站内搜索软件系统 原 理 数据库搜索 对数据库数据进行html解析、图片缩略,分词,索引,实现站内搜索。 检索效率 非常低下 消耗大量硬件资源 高效 检索范围 无法完成全文检索(可以用sql的单字索引功能最简单的完成索引功能实现最低级的全文检索),只能进行标题检索。 数据库效率太低,无法开展各种附加功能。 标题+内容 基于内容分析的排序方法。基于内容分析排序是最佳的排序方法。 标题和内容可控制,搜索结果准确到位。内容可控,用户可对搜索的内容范围和体现的结果进行精确的控制 检索语法 无 支持标准的国际搜索语法。 动态摘要 无 提供动态摘要,摘要清晰精确,便于用户快速寻找到需要的信息。 关键词飘红 无 有 内容的范 可控制 可有效控制,您可以把多个字段拆分合并,可以确定那些需要,哪些不需要。所有动态网页和没有链接的网页均可有效收入。 栏目控制精准。 图片缩略 无 有 同义词 无 有 相关性排序 无 有 其他 低效率低质量的平台无法开展增值服务 具有持续不断的升级能力和良好的售后服务 成本 低 以产品形式运作,多家客户分摊成本,成本相对低廉。运维成本低。 维护成本 不大 以产品形式运作,多家客户分摊成本,成本相对低廉。运维成本低。 一、搜索速度慢,服务器资源占用大; 二、搜索的准确性差,用户搜索不到想要的结果; 三、用户搜索行为分析,进行智能匹配搜索结果;四、各种方法的组合关键词搜索。跨平台性――适用于Linux与Windows系统,支持SQL Server、ORACLE、MySql、Sybase、Postgresql等数据库大容量性――目前可以支持1000万级的数据在毫秒级的查询时间,每秒100人的并发访问 功 能 性――支持分词、多个关键字、句子查询等实 时 性――数据库数据的实时更新,方便客户,数据加载自动完成,不需要人工的干预,最大限度降低企业成本可制定性――可根据企业的需求对系统进行功能上的修改,包括数据库检索的内容、搜索结果排序算法、显示界面等。 使用搜索引擎搜索引擎系统就不用花钱购买任何设备和软件,提高数据处理能力无须再无止尽的购买设备,再无任何费用。
文献检索课是培养学生的信息意识,掌握用手工方式和计算机方式从文献中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。本课程的任务是使学生了解各自专业及相关专业文献的基本知识,学会常用的手工文献检索工具和计算机文献检索工具的使用方法,懂得如何获得与利用文献情报,增强自学能力和研究能力。本教材是为卫生事业管理专业的学生专门编写的。针对该专业的特点和教学要求,对教材内容、结构进行丁规划和设计,强调理论联系实际,具有深入浅出、文字简明等特点。为适应信息电子化、网络化时代的要求,在内容上压缩手工检索比例,突出基本知识和方法,适当扩充计算机检索比例,尤其增加了当前流行的光盘数据库、网络数据库和Internet信息检索与利用方面的知识。从实用的角度出发,还重点讨论了美国《科学引文索引》的检索方法以及特种文献的利用,对于非重点的手工检索工具刊只作简单介绍,使之更适合于卫生事业管理专业的教学需要。另外,对文献信息的分析和利用、学术论文和综述的写作也作了详细介绍。本书适合卫生管理专业学生学习。