基于电网资源知识图谱的全业务智能搜索系统设计(卓工)文献综述

 2022-11-28 17:04:40

一、课题背景与研究意义

2008 年至今,国家电网公司的知识管理经历了协同办公知识管理模块、 网省公司企业级知识管理一体化平台管理模块、 国家电网公司企业级知识管理系统、综合知识库建设4个过程,初步建立了综合知识库、专业知识库和专题知识库。但在丰富知识库域、 实体以及关系的知识图谱构建和智能应用方面还有很大发展空间。

知识图谱(Knowledge Graph)也被称为知识域可视化或知识域映射地图,是一张庞大的语义网络,包括数量繁多的节点以及节点之间的各种语义关系。节点代表实体或者概念, 节点之间的连接即为相互之间的语义关系。 知识图谱旨在通过数据挖掘、信息处理、知识计量、可视化表达方式与智能搜索引擎,为企业内外部的知识共享提供公共信息平台, 最终促进企业的知识积累、传承、应用与提升的目的 [1]

《基于知识图谱与语义计算的智能信息搜索技术研究》[2]中提到传统搜索引擎的页面分析所依据的是存在于页面之间本质上是语义网络,具有关联性的知识集合,把所有不同的链接关系,它主要采用关键词分解、匹配等方式来实现信息检索,缺乏知识处理能力和理解能力。近年来业界开始引入语义网、知识图谱等新一代信息搜索支撑技术,在信息多样性、搜索便捷度、结果准确性等方面大幅提升用户搜索体验。知识图谱在搜索引擎中的应用可以更好地理解用户需求, 并且能够提供给用户更加智能、精准和人性化的服务[3]

二、国内外研究现状

知识图谱本质上是一个知识库,是一个将实体和属性通过关系进行联结和组织的知识网络。 构成知识图谱的基本单元是“实体—关系—实体”或“实体—关系—属性”三元组。将知识图谱表示为图的形式时,实体和属性以节点形式存在,关系以连接两节点的有向边形式存在。这些三元组通过共有的实体或属性进行结合,形成了具有网状结构的知识图谱。

知识图谱分为开放域和封闭域两类。开放域知识图谱不限定知识领域,要求知识覆盖较广,主要用于搜索引擎。开放域知识图谱会存在实体歧义、关系难以穷举、专业性不强、噪声大等问题,因此应用深度受到局限。封闭域知识图谱一般是行业知识图谱,只能应用于特定行业,其知识专业性较强,噪声较小,实体、属性和关系也可根据需求进行限定和穷举,因此应用可以比较深入,更具有针对性[4]

知识图谱构建的一般过程主要分为3步,即知识获取、知识融合、知识加工。构建的知识图谱可以涵盖电网各个方面的知识, 知识的来源主要有两类, 即关系数据库和非关系型文本。

有两种知识获取的方式[5]

1.关系型数据库到 RDF 数据库

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。