• 回答数

    3

  • 浏览数

    296

烧仙草AO
首页 > 学术论文 > 有关知识图谱的文献综述论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

中国式话

已采纳

本文主要内容整理自知识图谱两篇代表性综述: 1. 徐增林,盛泳潘,贺丽荣,王雅芳. 知识图谱技术综述[J]. 电子科技大学学报(4期):589-606. 2. 刘峤, 李杨, 段宏, et al. 知识图谱构建技术综述  [J]. 计算机研究与发展, 2016(3):582-600,共19页. 文章从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析。本文是对涉及技术点的罗列,后续会针对单个技术点一一梳理。 所解决的问题  如何从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息。 涉及的关键技术  实体抽取 Entity Extraction 也称命名实体识别(Named Entity Recognition, NER),指从文本数据集中自动识别出命名实体。 关系抽取 Relation Extraction 指从相关语料中提取出实体之间的关联关系,通过关系将实体(概念)联系起来。 属性抽取 Attribute Extraction 指从不同信息源中采集特定实体的属性信息,例如抽取某个公众人物的昵称、生日、国籍、教育背景等信息。 所解决的问题  将现实世界中的各类知识表达成计算机可存储和计算的结构。  涉及的关键技术  传统的知识表示方法主要是以RDF(Resource Description Framework资源描述框架)三元组SPO(subject,property,object)来符号性描述实体之间的关系,近年来,以深度学习为代表的表示学习技术也取得了重要的进展。 所解决的问题 信息抽取结果中可能包含大量的冗余和错误信息,数据之间的关系也是扁平化的,缺乏层次性和逻辑性,通过知识融合,可以消除概念的歧义,剔除冗余和错误概念,确保知识质量。 关键技术 实体链接 Entity Linking指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。主要涉及两方面: ▪ 实体消歧Entity Disambiguation 用于解决同名实体产生歧义问题的技术。例如“李娜”(指称项)可以对应于作为歌手的李娜这个实体,也可以对应于作为网球运动员的李娜这个实体。 ▪ 共指消解Entity Resolution 也称实体对齐(object alignment)、实体匹配(entity matching)、实体同义(entity synonyms)等,用于解决多个指称项对应于同一实体对象的问题。例如在一篇新闻稿中,“Barack Obama”,“president Obama”,“the president”等指称项可能指向的都是“奥巴马”这同一个实体。 知识合并 指从第三方知识库产品或已有结构化数据获取知识输入。 所解决的问题 信息抽取和知识融合可以得到一系列基本的事实表达。但事实不等于知识,要想最终获得结构化、网络化的知识体系,还需要经历知识加工的过程。 涉及的关键技术  本体构建 Ontology Extraction 本体(ontology)是对概念进行建模的规范,是描述客观世界的抽象模型,以形式化方式对概念及其之间的联系给出明确定义。 知识推理 Knowledge Inference 指从知识库中已有的实体关系数据出发,经过计算机推理,建立实体间的新关联,从而拓展和丰富知识网络。 质量评估 Quality Evaluation 对知识的可信度进行量化,通过舍弃置信度较低的知识,保障知识库的质量。 所解决的问题 知识图谱的内容需要与时俱进,其构建过程是一个不断迭代更新的过程。主要包括概念层的更新和数据层的更新。 ▪ 数据层更新: 主要是新增或更新实体、关系和属性值等。 ▪ 模式层更新: 指新增数据后获得了新的模式,需要自动将新的模式添加到知识库的模式层中。

245 评论

每天只睡4小时

知识图谱的构建形式: 自顶向下:先为知识图谱定义好本体与数据模式,再将实体加入到知识库。 自底向上(常用) :从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。 (1)语义信息抽取; (2)多元数据集成与验证(知识融合); (3)知识图谱补全

知识库分类: 开放链接知识库:Freebase、Wikidata、DBpedia、YAGO。包含大量半结构化、非结构化数据。 垂直行业知识库(特定领域):IMDB(影视)、MusicBrainz(音乐)、ConceptNet(概念)等。

基于规则与词典的方法(为目标实体编写模板,然后进行匹配):编写大量规则或模板,覆盖领域有限,难以适应新需求 基于统计机器学习的方法(机器学习,训练模型,识别实体):监督学习算法受训练集限制,准确率和召回率不够理想 ( 召回率:真阳性 / 真阳性 + 假阳性;准确率:真阳性 + 真阴性 / 真阳性 + 假阳性 + 真阴性 + 假阴性 ) 面向开放域的抽取方法(面向海量的Web语料):通过少量实体实例建立特征模型,再通过它应用于新的数据集,给新实体做分类与聚类。(迭代扩展)

早期:人工构造语义规则以及模板的方式; 实体间的关系模型代替了早期的人工构造; 面向开放域的信息抽取框架(OIE):对隐含关系抽取性能低下。 ( 隐含关系抽取:基于马尔科夫逻辑网、基于本体推理的深层隐含关系抽取方法 )

可以将实体属性的抽取问题转换为关系抽取问题

分布式表示 目的在于用 一个综合的向量来表示实体对象的语义信息 ,这种形式在知识图谱的计算、 补全 、推理等方面起到重要的作用: 1、语义相似度计算:实体间的语义关联程度,为自然语言处理(NLP)等提供了极大的便利 2、

消除异构数据中实体冲突、指向不明等不一致性问题。 (1)待对齐数据分区索引; (2)利用相似度函数或相似性算法查找匹配实例; (3)对齐算法(成对实体对齐、全局(局部)集合实体对齐)进行实例融合。

经过实体对齐后得到一系列的基本事实表达,然后事实并不等于知识,它只是知识的基本单位。

本体相当于知识库的模具,使其具有较强的层次结构和较小的冗余程度。

可分为人工构建和数据驱动自动构建。 数据驱动的本体自动构建: ①纵向概念间的并列关系计算:计算两个实体间并列关系的相似度,辨析他们在语义层面是否属于同一个概念。 ②实体上下位关系抽取。 ③本体生成:对各层次得到的概念进行聚类,并为每一类的实体指定1个或多个公共上位词。

通常是与实体对齐任务一起进行:对知识可信度进行量化,保留置信度较高的,舍弃置信度较低的。

主要包括模式层的更新与数据层的更新。

一阶谓词逻辑、描述逻辑以及规则等 (1)一阶谓词逻辑:以命题为基本,命题包含个体(实体)和谓词(属性或关系)。 (2)基于描述逻辑的规则推理:在(1)的基础上发展而来,目的是在知识表示能力与推理复杂度之间追求一种平衡。 (3)通过本体的概念层次推理。

一些算法主要是 利用了关系路径 中的蕴涵信息: 通过图中两个实体间的多步路径来预测它们之间的语义关系,即从源节点开始,在图上根据路径建模算法进行游走,如果能够到达目标节点,则推测源节点和目标节点间存在联系。 ( 关系路径的建模研究仍处于初期阶段,需要进一步探索完成 )

参考文献: [1]徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(04):589-606.

195 评论

水蓝色的风铃

这是一款阿里员工业余时间设计的论文相似性可视化的工具 功能是查找相似论文,并用图表的形式展现这些论文之间的关系。

可以把它理解为这篇论文的祖先们 这些是图表中最常被引用的论文,它们是该领域重要的开创性工作。 选择这些论文的时候,有引用关系的论文会被高亮。

可以把它理解为这篇论文的后代们 这些论文可能是受到图表中的论文启发的近期相关工作,或者是对该领域的调查。 通常包括该领域的现状,系统综述,元分析等。 同样,选择这些论文的时候,有引用关系的论文会被高亮。

我认为这款工具理论上非常适合用于辅助论文中Related Work,和Literature Review部分,比如下面这部分是对Related Work部分如何完成的指导,可以看出需要10到20个相关工作,借助CONNECT PAPERS(以下简称CP)可以很直观地获取更多的相似论文。找到该主题的“先祖“或者“后代”。

204 评论

相关问答

  • 有关音乐的论文文献综述

    在写作音乐论文过程中,正确地标注以及合理地引用参考文献不仅关系到音乐论文的质量 ,也在一定程度上反映了作者的学术态度。下文是我给大家带来的关于音乐论文的参考文献

    璐璐308738 3人参与回答 2023-12-09
  • 关于能源论文的有关文献综述

    文献综述是对某一方面的专题搜集大量情报资料后经综合分析而写成的一种学术论文, 它是科学文献的一种。 格式与写法 文献综述的格式与一般研究性论文的格

    老鼠笨笨 4人参与回答 2023-12-08
  • 已出版的知识图谱主题论文

    知识图谱论文拟投栏目是《计算机科学》。《计算机科学》创刊于1974年1月,是由重庆西南信息有限公司(原科技部西南信息中心)主管、主办的学术期刊,是中国计算机学会

    懒羊羊咩哈哈 2人参与回答 2023-12-09
  • 关于知识产权的论文文献综述

    反不正当竞争法是知识产权制度的重要补充,它可为知识产权制度提供兜底性的保护与救济。[关键词]知识产权法;反不正当竞争法;关系 知识产权法与反不正当竞争法是出现得

    豪门小慧子 9人参与回答 2023-12-12
  • 知识产权论文参考文献综述

    浅析知识产权法与公共利益【摘要】知识产品不仅是一种个人财富,更是一种社会财富,知识产品的推广和应用关系到社会公众的切身利益。这就要求我国在进行知识产权立法时要兼

    美丽依然张 8人参与回答 2023-12-10