论文关键词图谱
论文关键词图谱
首先,从论文内容来说,作者可以从标题和论文中提取关键词。
(1)从论文标题中提取
科技论文的标题包含了论文的主要信息点,如研究对象,研究方法等。因此,选择关键词应首先考虑从标题中选取。
(2)从论文中提取
有时科技论文的标题较为笼统,不能完全反映论文表述的全部内容。如果仅从标题中选取关键词,不仅无法满足关键词规定数量,而且还会丢失一部分信息。
论文作者在提取关键词时,可以对文献进行主题分析,弄清该文的主题概念和中心内容,并尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组,以此来提取出论文的关键词。
其次,从词语应用来说,作者可以从转化概念和应用词表来提取关键词。
(1)概念转换
为了更准确、适度地表达主题,常常要对主题的概念进行转换,主题概念的转换不能光从字面上进行,而要从主题概念的涵义上进行,因此要特别注意概念的综合分析。
具体解决的方法:主题概念的转换,按复杂程度,有概念直接转换和概念的分解转换两种方式。概念的直接转换只需直接查阅词表就可完成,概念的分解转换却要复杂得多。在概念转换的过程中,标引者不仅需要有广博的知识,还需要有丰富的想像力,如标引“下肢不等长”一词时,可能想到的可以概念转换的词就有:“短肢畸形”、“肢体压缩”、“肢体不等长”等,而正确的标引是:“腿长不等”。
(2)词表应用问题
很多人对于论文关键词的选择有一定的随意性,并不是按照已有的医学论文关键词表来选择适合自己论文的关键词。因此,大家在学术论文写作过程中,对于关键词的确定可以根据《MeSH》词表规定。特别是医学方面的学术论文更加应该重视,因为在医学上很多专业术语与我们平常用的医学术语是不一样的。
第三,如何正确的主题分析是选取关键词?
第一步是文章审读。文章审读的步骤是:①阅读题目,明确文章论述的主题对象;②细读论文摘要,了解作者意图以及文章的内容与重点;③阅读结论,确定其新颖程度和价值;④浏览文中重要段落、图表乃至全文,确定其主要内容与中心、参考价值与应用范围。
第二步是主题提炼。主题的提炼要在认真审读文稿的基础上进行判断,并对文中关键性的语句准确而精炼地进行高度概括,抓住本质的主要内容,舍弃次要内容。人们标引关键词的习惯做法往往是直接从文题中选择,但这必须有一个前提,那就是:文题已基本涵盖了文章的主题。
事实上有相当一部分论文的文题未能直接揭示文章的主题,某些论文的主题内容是隐含的,仅仅阅读和分析标题、摘要难以作出正确的判断,必须通读全文,反复推敲,透过现象抓住本质,才能对主题内容作出全面正确的概括。要注意,关键词往往是文中出现频率最高的词。阅读文稿时要做到心中有数,明确哪些词使用频率最高,这样就不难把关键词提取出来。
最后,为了避免提取关键词时出现一些常规错误,作者要注意以下问题。
(1)必须选用词义明确的词或词组
选择关键词时,应剔除那些概念较为模糊的形容词或词组。如“强烈”、“强劲”、“先进的”、“现代的”、“微型的”、“精密的”等。普通动词的概念也较为宽泛。因此,作为关键词的动词一般均为科学技术性动词,最好不选用一般动词作为关键词。
(2)选用的关键词必须与论文的主题概念保持一致
也就是说,不能随便将论文标题中的词语作为关键词,必须考虑所选用的关键词是否符合论文的主题概念,只有符合论文主题概念的才能选取。
(3)某些词语和符号不能作为关键词
同义词、近义词不能并列为关键词,化学分子式也不能作为关键词,但复杂的有机化合物可以基本结构的名称入选关键词。
论文的关键词怎么提取
论文的关键词可以这样提取:
1、根据论文主题提取关键词 一篇论文有自己的论述内容和方向,有时可以将科学属性概括为关键词,例如与法律相关的论文关键词可以是“法律相关”。
2、根据论文标题提取关键词 通常论文标题是最常被选用成关键词的,很多同学学会截取标题中的某几个字作为关键词,这样的方法不是不可行。
3、选取可扩大或缩小的术语 选取的关键词可以根据论文的主要内容扩大或缩小的去选择关键词论文范围的术语。
4、根据高频词提取关键词 使用论文中出现频率最高的词可以用做关键词,要注意的是,因为论文字数多,信息量大,有时候出现的高频词较多,因此要注意筛选等等。
关键词时区图关键词的背景图怎么改
关键词时区图关键词的背景图怎么改
甄永072
超过338用户采纳过TA的回答
关注
成为第12位粉丝
CiteSpace有一个亮点就是将时间因素加入到了知识图谱的绘制之中。先划分时间段,然后再合并起来一起分析,如关键词时区图,有些文章将其命名为主题演化图,其实不太合适,该图本质呈现的是关键词的一种演化关系,而不是主题的演化。
主题演化应该是主题间的关系,如TE软件所做出的科学主题演化图,或者利用ST软件分时间区间做的战略坐标(主题类型的划分),见下图。
本文主要讲解一下CiteSpace绘制的关键词时区图,即关键词的时区图是怎么生成的,其他高级图谱以后再讲。
上图的数据集时间区间是1998-2018
圆圈
图中的每一个圆圈代表一个关键词,该关键词是在分析的数据集中首次出现的年份【注意:是此数据集中首次出现,并不是关于此主题的所有数据中】。
关键词一旦出现,将固定在首次出现的年份,尽管之后论文里仍会出现该关键词,图中将不再显示,只会在最早出现的年份显示。
如果后来的年份又出现了该关键词,那么该关键词会在首次出现的位置频次加1,出现几次,频次就增加几次。所以就可以解释为什么1998年,文献量很少,而关键词“数据管理”和“高校图书馆”圆圈这么大的原因了。
因为,之后论文关键词中出现的“数据管理”和“高校图书馆”均在1998年进行了累加。
此种方法合不合理呢?
如果一个关键词在1998年出现一次,之后几年没出现,而在2012年出现了80次,那么软件会把该关键词归到1998年,显然结果是不合理的,因为存在异常情况。当然,既然是异常,现实情况出现几率不是很大。
该图显示的仅仅是目标领域关键词首次出现的时间和从整体视角来看的研究热点(研究热点通过关键词频次显示,但是CiteSpace统计的频次是阈值裁剪后的频次,并不是总频次,见推文:CiteSpace关键词共现图谱含义详细解析与注意事项)。
该图无法反映这些热点(关键词)的大致年份分布,如果需要反映研究热点的平均年份分布此时CiteSpace就无能为力了,需要借助COOC或VOSviewer软件进行图谱绘制,其中COOC也可以绘制时区图,具体见下文。
线条
圆圈代表着关键词,线条代表着关键词之间的联系。但在该图中线条存在的意义并不大,不是我们分析的重点。
这里的线条就是关键词之间的共现关系。
例如1998年的“数据管理”和2008年的“科学数据管理”同时出现在了2008年的某一篇论文中,那么“数据管理”和“科学数据管理”之间便存在一条联系,这条线从1998年连到了2008年。
连线表示两关键出现在同一篇或多篇文章中。
总结:
时区图中的每个时间段均是该时间段的所有新出现的关键词,如果与前期关键词共同出现在同一篇文章中将会用线联系起来,前期关键词频次加1,圆圈变大,从而生成此图。该图确实能够从整体上反映研究路径的变化,但如果想要更全面的反映路径变化还需要结合关键词加权时区图、逐年关注度变化、逐年增长率变化和时间加权研究热点变化等图。当然我们也可以逐年统计关键词的变化趋势,来反映研究热点的变化,如SE软件绘制的关键词演进图。
存在的问题1
CieSpace绘制的时区图有一个问题,就是每个时间区间展示的关键词数不能太多,否则图就会很乱,比如本文开头我们做的图,虽然看着挺不错的,但是每个时间区间所展示的关键词数有限(PS.这张图竟被很多人盗用,用于他们的宣传),特别是最新出现的关键词由于频次相对较低,无法在图中显示出来,使我们无法挖掘出最新的前沿。
上文说了,在时区图中线条存在的意义并不大,不是我们分析的重点。所以我们可以利用COOC软件的时区图功能进行绘制,虽然COOC做出的时区图没有CiteSpace好看,但其展示的每年关键词数以及最前沿关键词方面优于CiteSpace,见下图。
该图也是关键词时区图,但是其可以全面反映更多的关键词以及最新关键词,而不仅仅是那些高频关键词。
存在的问题2
这里还存在一个十分严重的问题,很多CiteSpace新手甚至老手都不知道,导致已经发表的很多论文存在问题。即利用不清洗的数据直接作图会导致关键词首次出现时间错误。
因为随着网络首发的推广,很多最新的论文缺失年份信息,而CiteSpace会把缺失年份的论文默认设置为1900年,导致出错。
下面,我们先来了解下网络首发出版模式。网络首发出版模式对文献计量的影响不容低估!
什么时网络首发?
网络首发论文被认定为正式出版论文。经编辑部和《中国学术期刊(光盘版)》电子杂志社审核,可在中国知网提前在线发布。案例图如下:
网络首发的好处?
发表时间不受纸刊限制,出版容量也突破了传统纸刊的束缚。便于研究成果快速传播和使用。
网络首发对文献计量的影响?
【1】重复问题
有时知网里同一篇文章会同时出现【网络首发】和【非网络首发】两条题录,导致在做文献计量分析时重复统计,而现有软件没法去重。
【2】时间问题
网络首发题录信息里没有时间,导致做文献计量时出现错误,而现有软件没法解决。COOC软件除外。
做文献计量分析时,以上两个问题一定要注意,否则会出现严重错误。比如,由于网络首发缺失时间,CiteSpace软件会将2022年网络首发的文献默认设置为1900年,而Vosviewer在做时间关键词分析时也不会考虑这种问题。另外,上述软件均没法进行去重。
而很多文献计量的文章(包括已经发表的文章)经常不注意以上两点,不知道自己做的其实是错误的分析。
针对上述两个问题的解决方案:
(1)利用COOC最新版软件去重
(2)利用COOC最新版软件提取,补充时间即可。
最后且最重要的:
做文献计量数据预处理阶段的5大问题,见推文:CiteSpace关键词共现图谱含义详细解析与注意事项
以后再做文献计量所用的软件应该是COOC+CiteSpace或者COOC+VOSviewer。如果你想做出更好看的网络图谱,还需要结合NSS软件。如果你有一些文本型数据,但是想用CiteSpace、VOSviewer等软件作图,那么你还需要结合TM文本挖掘软件。
论文的关键词怎么提取
关键词应准确地反映论文的主题:作者应在认真研究论文标题、摘要、正文内容及文中各种图表的基础上,提炼主题概念,选用能准确反映论文主题思想和特征内容的规范化的词语。
(1)可借助于图书馆的《汉语主题词分类词表》进行筛选,从而准确无误地把关键词提取出来。还可参考每段的小标题选取。例如论文《生态需水对地下水生态系统的影响机理分析》的关键词:生态需水、地下水生态系统、生态环境等。如果把“系统”一词作为关键词,既可以表示操作系统,也可以服务系统,可以表明管理系统的意义等。因此它不具备本文的检索意义。故应将“系统”一词改为具备独立检索意义的词“生态系统”.
(2)此外,随着科学技术的发展,新的科技名词术语不断出现,许多科技论文选用的关键词都是在现有的有关主题词表中没有列出的新学科或新技术术语。使用这些新的自由词时也应看其是否符合下列条件:具有独立的检索意义;促进新的学科或技术的发展;被国内外科技文献的检索工作接纳和兼容;与国际上着名科技刊物特别是着名检索刊物关键词的选用接轨。
但在下列情况下可选用自由词:
主题词表中明显漏选的主题词;未被词表收录的新学科、新技术中的重要术语以及文章题名中的人名、地名;词表中未收录的地区、人物、文献、产品等名称及重要数据名称;某些概念采用组配‘结果出现多义时,被标引概念也可用自由词。 2、关键词的遴选要点。
由于关键词是检索时的重要依据,所以其写作质量直接影响一篇论文在学术界的影响力、生命力,这就要求论文的关键词能充分表达论文的主题。科技论文关键词的遴选可以从以下四个方面考虑:从题目中找;从摘要中找;从论文的分级标题中找;从结论中找。关键词是从论文结论、摘要、标题中提炼抽取出的具有实质意义的、表达文章主题内容的词或组合词。作者应选用能反映论文内容特征的。通用性强的、为同行所熟知的词。
(1)从题目中找。
(2)从摘要中找关键词的示例。
(3)从论文的分标题中找。
(4)从结论中找。
3、关键词合理使用注意的问题。
3.1 关键词的逻辑组合应能表征论文主题内容。
关键词的主要作用是应能鲜明而直观地表达该论文的主题内容,并有助于查阅、检索。从关键词的一般性描述中可知,每一个关键词都应能表征某个或某一方面的确切含义。要完整准确地提示、表征一篇论文中有一定内涵的主题,就应通过数个关键词的逻辑组合来达到。显然,以一个包含较多内容的词组或短语作为关键词是不符合关键词原意与使用要求的。如:在“中国水利现代化和新水利理论的形成”一文中,关键词为“水利建设、流域规划、生态系统、可持续发展、水资源综合管理”,把水建设新理论都包括在内,有效地表征论文主题的内容。
3.2 有助于读者清晰理解论文主题内容。关键词除了有助于检索外,还应能清晰地提示论文主题。例如:在“鸭河口水库入库面源污染负荷预测研究”一文中,关键词为“面源污染、污染负荷、土壤流失、农田施肥、鸭河口水库”,关键词的写作时通过分析,把面源污染的主要因素“土壤流失、农田施肥”写入关键词,达到清晰地提示论文主题内容的作用。
3.3 有助于读者检索。
所选的关键词清晰地表征、提示了论文主题内容,还应考虑这些关键词是否有助于论文的检索。如采用“生态系统修复工程”这样的检索词进行文献检索,尽管这些检索词确实准确、清晰、完整地提示了要检索对象的主题,但由于这些检索词写作不符合关键词的一般写作要求与规范,用这些词作为关键词进行检索时就将遗漏掉许多与该论文密切相关的文献。例如:“生态系统修复工程”这个关键词就可以拆分为“生态系统”和“修复工程”这两个关键词,检索时通过合理的逻辑组合,一样可以查阅到与该关键词查阅结果完全相同的文献。但反过来,如果以“生态系统修复工程”作为关键词查阅与此相关的文献,若有些文献全文并未出现该词,仅出现“生态系统”和“修复工程”这样的词汇,这些文献就会漏检,使查阅者失去一些有价值的文献。
在科学技术信息迅猛发展的今天,全世界每天有几十万篇科技论文发表,学术界早已约定利用主题概念词去检索最新发表的论文。作者发表的论文不标注关键词或叙词,文献数据库就不会收录此类文章,读者就检索不到。关键词选得是否恰当,关系到该文被检索和该成果的利用率。
论文关键词的格式要求
从论文标题或正文中挑选3~5个(不同院校可能要求不同)最能表达主要内容的词作为关键词。关键词之间需要用分号或逗号分开。关键词为宋体小四号加粗字体,需要顶格写,关键词正文为宋体小四号不加粗字体。
关键词的位置在摘要之下,正文之前,顶格写“关键词”,空两格后依次列出,两词间空一格或用分号,词末不加标点。
从词性上讲,关键词应该属于名词词性,动词、形容词均不适合作为关键词。
如下文所示,论文中的五个关键词主要来源于文题和研究主题,属于主体性关键词。
题目中的“ICU”在关键词中被转化为了“重症监护病房”,不是缩写词,较为规范。
论文中关键词的来源
文题、摘要或文中小标题中选择。
首先,可根据研究主题提取关键词;其次,根据研究框架(论文中使用的理论、方法)提取关键词;最后,可根据研究结论提取关键词。
上一篇:文章阅读网散文
下一篇:中南大学报学报