CN115408535A - 事故知识图谱构建方法、装置、存储介质及电子设备 - Google Patents

事故知识图谱构建方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115408535A
CN115408535A CN202211014302.5A CN202211014302A CN115408535A CN 115408535 A CN115408535 A CN 115408535A CN 202211014302 A CN202211014302 A CN 202211014302A CN 115408535 A CN115408535 A CN 115408535A
Authority
CN
China
Prior art keywords
accident
data
historical
knowledge
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211014302.5A
Other languages
English (en)
Inventor
李光华
赵小明
张宇
刘名
叶云虎
刘敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoneng Dadu River Dagangshan Power Generation Co ltd
Original Assignee
Guoneng Dadu River Dagangshan Power Generation Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoneng Dadu River Dagangshan Power Generation Co ltd filed Critical Guoneng Dadu River Dagangshan Power Generation Co ltd
Priority to CN202211014302.5A priority Critical patent/CN115408535A/zh
Publication of CN115408535A publication Critical patent/CN115408535A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及语言处理技术领域,具体涉及一种事故知识图谱构建方法、装置、存储介质及电子设备,该方法包括:获取历史应急数据,所述历史应急数据包括针对水电站的历史事故案例的事故处置节点和所述事故处置节点对应的设备状态、历史应急策略以及采用所述历史应急策略后对应的诱发事故;对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;基于预设的特征相似度算法,根据所述语义特征向量和所述事故场景特征向量,确定所述水电站的电力设备的图谱节点特征信息以及所述历史事故案例的相似度;根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构,得到所述事故知识图谱。

Description

事故知识图谱构建方法、装置、存储介质及电子设备
技术领域
本公开涉及语言处理技术领域,具体地,涉及一种事故知识图谱构建方法、装置、存储介质及电子设备。
背景技术
在水电站的管理工作中,对已发生的事故进行快速、准确地处理是极其重要的,目前水电站事故的应急处置高度依赖于应急处置人员的个人能力,但设备事故具有突发性、紧迫性以及不可预见性,在事故发生时下对应急处置人员的能力考验较大。又由于事故信息的收集缺少针对性,导致在水电站发生事故时缺少制定应急决策的技术支撑,进而导致应急策略的准确性不高,制定时间较长,严重影响水电站的正常运作。
发明内容
根据本公开实施例的第一方面,提供一种事故知识图谱构建方法,包括:
获取历史应急数据,所述历史应急数据包括针对水电站的历史事故案例的事故处置节点和所述事故处置节点对应的设备状态、历史应急策略以及采用所述历史应急策略后对应的诱发事故;
对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;
基于预设的特征相似度算法,根据所述语义特征向量和所述事故场景特征向量,确定所述水电站的电力设备的图谱节点特征信息以及所述历史事故案例的相似度;
根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构,得到所述事故知识图谱。
可选地,对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量,包括:
对所述历史应急数据进行知识提取,得到知识图谱构建数据,所述知识图谱构建数据包括所述历史应急数据中的电力设备实体、所述电力设备实体的属性信息以及所述电力设备实体间的实体关系;
根据所述知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据;
对所述融合后的知识图谱构建数据进行特征提取,得到所述语义特征向量和所述事故场景特征向量。
可选地,所述历史应急数据包括结构化数据、半结构化数据和非结构化数据,若所述历史应急数据为结构化数据,所述对所述历史应急数据进行知识提取,得到知识图谱构建数据,包括:
通过预设的映射规则对所述历史应急数据进行知识抽取,得到所述知识图谱构建数据;
若所述历史应急数据为半结构化数据或非结构化数据,所述对所述历史应急数据进行知识提取,得到知识图谱构建数据,包括:
根据预设的目标信息从所述半结构化数据或非结构化数据中筛选出针对水电站的历史事故案例;
通过预设的基于语义标注的关联模型算法,对筛选出的所述针对水电站的历史事故案例进行知识提取,得到所述知识图谱构建数据。
可选地,所述根据所述知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据,包括:
将所述知识图谱构建数据与所述图谱数据合并,得到合并后的多个电力设备实体、每一电力设备实体的属性信息以及所述多个电力设备实体间的实体关系;
根据所述每一电力设备实体的属性信息,将所述合并后的多个电力设备实体中每一电力设备实体与其它电力设备实体进行比对,得到比对结果;
根据所述比对结果对所述合并后的多个电力设备实体进行筛选,得到目标电力设备实体、所述目标电力设备实体的目标属性信息以及所述目标电力设备实体间的目标实体关系;
根据所述目标电力设备实体、所述目标属性信息以及所述目标实体关系,得到融合后的知识图谱构建数据。
可选地,所述根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构中,得到所述事故知识图谱,包括:
根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构中,得到初始事故知识图谱;
通过所述初始事故知识图谱进行知识推理,得到知识推理结果;
对所述知识推理结果进行质量评估,得到质量评估结果;
根据所述质量评估结果补充所初始事故知识图谱,得到补充完整的事故知识图谱;
将所述补充完整的事故知识图谱确定为所述事故知识图谱。
可选地,还包括:
将当前获取到的历史应急数据与所述事故知识图谱中的历史应急数据进行比对,确定所述当前获取到的历史应急数据是否发生变化;
在所述当前获取到的历史应急数据发生变化的情况下,根据所述当前获取到的历史应急数据得到图谱节点特征信息,并对所述事故知识图谱进行知识更新。
可选地,所述获取历史应急数据,包括:
利用网页爬虫工具在预设的数据源中进行数据采集,得到所述历史应急数据。
根据本公开实施例的第二方面,提供一种事故知识图谱构建装置,包括:
获取模块,用于获取历史应急数据,所述历史应急数据包括针对水电站的历史事故案例的事故处置节点和所述事故处置节点对应的设备状态、历史应急策略以及采用所述历史应急策略后对应的诱发事故;
特征提取模块,用于对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;
确定模块,用于基于预设的特征相似度算法,根据所述语义特征向量和所述事故场景特征向量,确定所述水电站的电力设备的图谱节点特征信息以及所述历史事故案例的相似度;
映射模块,用于根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构,得到所述事故知识图谱。
根据本公开实施例的第三方面,提供一种非临时性计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述方法的步骤。
根据本公开实施例的第四方面,提供一种设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面所述方法的步骤。
通过上述技术方案,通过采集水电站的历史事故案例,对历史事故案例进行特征提取,得到语义特征向量和事故场景特征向量,并确定水电站的电力设备的图谱节点特征信息以及历史事故案例的相似度,然后根据历史事故案例的相似度和预设的图谱结构,构建事故知识图谱。如此,使得历史事故案例的每一事故处置节点、每一处置节点的处置要点、设备运行方式、故障部位及事故性质等信息可视化,为事故的应急处理策略的制定提供指导性基础,进而提高事故处理的效率和准确度。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种事故知识图谱构建方法的流程图。
图2是根据一示例性实施例示出的一种事故知识图谱构建装置的框图。
图3是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
发明人研究发现,目前现有的知识图谱多为通用的知识图谱,对针对性较强的领域知识,尤其是水电站安全应急领域的知识图谱没有完整的知识图谱构建方法,在水电站发生事故时缺少制定应急决策的技术支撑,进而导致应急策略的准确性不高,制定时间较长,严重影响水电站的正常运作。
有鉴于此,本公开提供一种事故知识图谱构建方法、装置、介质及设备,以解决上述技术问题。
图1是根据一示例性实施例示出的一种事故知识图谱构建方法,包括以下步骤:
在步骤S101中,获取历史应急数据,历史应急数据包括针对水电站的历史事故案例的事故处置节点和事故处置节点对应的设备状态、历史应急策略以及采用历史应急策略后对应的诱发事故。
在步骤S102中,对历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量。
在步骤S103中,基于预设的特征相似度算法,根据语义特征向量和事故场景特征向量,确定水电站的电力设备的图谱节点特征信息以及历史事故案例的相似度。
在步骤S104中,根据历史事故案例的相似度,将图谱节点特征信息映射到预设的图谱结构,得到事故知识图谱。
首先应当理解的是,本公开是通过采集历史应急数据,并依据预设的方法对应急数据中的特征信息进行提取和处理,得到多个节点及每一节点的特征信息,然后将得到的特征信息映射到预设的图谱结构中,从而完成事故知识图谱的构建。
示例地,历史应急数据可以包括多个针对水电站的历史事故案例。具体地,针对每一历史事故案例,事故处置节点表示在该历史事故中,在哪些节点对水电站的电力设备进行处置。事故处置节点对应的设备状态可以包括该历史事故发生时、对该历史事故进行处置过程中以及对该历史事故进行处置后每一事故处置节点对应的电力设备的状态信息,其中电力设备的状态信息可以包括水电站的监控系统监控到的电力设备的状态信息,以及针对该历史事故,每一事故处置节点对应的处置人员信息。历史应急策略可以包括针对该历史事故,每一事故处置节点对应的历史处置策略。用历史应急策略后对应的诱发事故可以包括采用历史应急策略后,针对该历史事故的每一事故处置节点对应的处置效果。
示例地,语义特征向量和事故场景特征向量的提取可以是基于历史事故案例包括的结构和内容,分析历史事故案例的组成要素,对历史事故案例进行语义信息的标注,然后再进行特征提取,并对提取到语义特征和事故场景特征进行量化,以得到语义特征向量和事故场景特征向量。本公开实施例对特征提取的方法不作具体的限定。另外,可以采用计算余弦相似度、欧几里得距离以及曼哈顿距离等方法计算历史事故案例的相似度,本公开实施例对此也不作具体的限定。
采用上述技术方案,通过采集水电站的历史事故案例,对历史事故案例进行特征提取,得到语义特征向量和事故场景特征向量,并确定水电站的电力设备的图谱节点特征信息以及历史事故案例的相似度,然后根据历史事故案例的相似度和预设的图谱结构,构建事故知识图谱。如此,使得历史事故案例的每一事故处置节点、每一处置节点的处置要点、设备运行方式、故障部位及事故性质等信息可视化,为事故的应急处理策略的制定提供指导性基础,进而提高事故处理的效率和准确性。
在可能的方式中,获取历史应急数据可以是利用网页爬虫工具在预设的数据源中进行数据采集,得到历史应急数据。
示例地,预设的数据源可以包括存储有针对水电站的历史事故案例的本地文件、水电站的电力设备的信息记录手册、以及包括针对水电站的事故处理案例、事故处理方法等数据的网络数据源,本公开实施例对此不作限定。
在可能的方式中,对历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量,可以是首先对历史应急数据进行知识提取,得到知识图谱构建数据,知识图谱构建数据包括历史应急数据中的电力设备实体、电力设备实体的属性信息以及电力设备实体间的实体关系,然后根据知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据,最后对融合后的知识图谱构建数据进行特征提取,得到语义特征向量和事故场景特征向量。
应当理解的是,对历史应急数据进行知识提取主要包括命名实体抽取,实体关系抽取和属性抽取三个要素。其中,实体抽取可以是在历史应急数据包括的文本句中找出包括时间、地点、电力设备、故障名称、故障类型、处置方法、处置人员等的多个实体。本公开实施例对实体抽取的方法不做具体限定。属性抽取可以是利用使用python爬虫爬取网页信息以及水电站的监控数据或其他存储数据,确定每一实体的属性信息。其中,水电站的监控数据或其他存储数据可以包括水电站的电力设备的实时运行数据、水电站内部的监控数据。本公开实施例对实体属性抽取的方法不做具体限定。关系抽取可以是获取抽取到的实体之间的某种语义关系及关系的类别,然后将实体对及联系这一对实体的关系构成的三元组数据,本公开实施例对关系抽取的方法也不做具体限定。
示例地,为了保证事故知识图谱的完整性,且解决实体语义重复和语义矛盾的问题,可以将采集到历史应急数据中的电力设备实体、电力设备实体的属性信息以及电力设备实体间的实体关系与预设知识库中的图谱数据进行知识融合,然后对融合后的知识图谱构建数据进行特征提取,得到语义特征向量和事故场景特征向量。本公开实施例对特征提取的方法也不作具体限定。
在可能的方式中,历史应急数据包括结构化数据、半结构化数据和非结构化数据,若历史应急数据为结构化数据,对历史应急数据进行知识提取,得到知识图谱构建数据可以是通过预设的映射规则对历史应急数据进行知识抽取,得到知识图谱构建数据;
若历史应急数据为半结构化数据或非结构化数据,对历史应急数据进行知识提取,得到知识图谱构建数据可以是首先根据预设的目标信息从半结构化数据或非结构化数据中筛选出针对水电站的历史事故案例,然后通过预设的基于语义标注的关联模型算法,对筛选出的针对水电站的历史事故案例进行知识提取,得到知识图谱构建数据。
应当理解的是,由于数据源不同,获取的历史应急数据的结构化程度不同,具体地,历史应急数据包括结构化数据(比如链接数据、数据库)、半结构化数据(比如网页中的表格、列表)或者非结构化数据(比如纯文本数据),结构化程度越低,知识抽取越为复杂。针对不同结构化程度不同历史应急数据,可以采用不同的方式进行知识抽取。
示例地,针对结构化的历史应急数据,其字段含义、字段数量和数据内容都是明确的,可以通过预设的映射规则对结构化的历史应急数据进行知识抽取,映射规则可以是根据历史应急数据具体进行设置的,本公开实施例对此不作限定。当然,也可以采用针对结构化数据的知识抽取模型对结构化的历史应急数据进行知识抽取,本公开实施例对此也不作限定。
针对半结构化数据或非结构化数据,可以先对其进行筛选,确定出哪些是针对水电站的历史事故案例,即可以根据预设的目标信息,确定出历史应急数据中包括的电力设备、电力设备的状态信息、应急策略、操作人员以及采用历史应急策略后对应的诱发事故的概念本体、各概念本体的含义、概念本体间的关系以及各个节点信息。其中,预设的目标信息可以是根据水电站事故案例的元素组成确定的。然后再采用预设的基于语义标注的关联模型算法进行知识提取,得到知识图谱构建数据。当然也可以采用其他实体抽取模型或方法对半结构化或非结构化的历史应急数据进行知识提取,本公开实施例对此不作限定。
在可能的方式中,根据知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据,可以是首先将知识图谱构建数据与图谱数据合并,得到合并后的多个电力设备实体、每一电力设备实体的属性信息以及多个电力设备实体间的实体关系,再根据每一电力设备实体的属性信息,将合并后的多个电力设备实体中每一电力设备实体与其它电力设备实体进行比对,得到比对结果,然后根据比对结果对合并后的多个电力设备实体进行筛选,得到目标电力设备实体、目标电力设备实体的目标属性信息以及目标电力设备实体间的目标实体关系,最后根据目标电力设备实体、目标属性信息以及目标实体关系,得到融合后的知识图谱构建数据。
示例地,由于获取历史应急数据的数据源不同,获取得到的多个实体可能存在语义信息或属性信息的重复或矛盾,比如针对某一电力设备,其同一参数存在不一致产生实体矛盾,该电力设备的存在多个叫法或采用指代词进行只带后导致提取出多个重复的实体。
因此,可以首先将知识图谱构建数据与图谱数据合并,然后根据实体的属性信息将每一实体与其他实体进行比对,得到目标电力设备实体、目标电力设备实体的目标属性信息以及目标电力设备实体间的目标实体关系。比对的方式以及根据比对结果确定目标电力设备实体的标准可以根据实际应用场景设置,本公开实施例对此不作限定。
在可能的方式中,根据历史事故案例的相似度,将图谱节点特征信息映射到预设的图谱结构中,得到事故知识图谱,可以是首先根据历史事故案例的相似度,将图谱节点特征信息映射到预设的图谱结构中,得到初始事故知识图谱,再通过初始事故知识图谱进行知识推理,得到知识推理结果,然后对知识推理结果进行质量评估,得到质量评估结果,并根据质量评估结果补充所初始事故知识图谱,得到补充完整的事故知识图谱,最后将补充完整的事故知识图谱确定为事故知识图谱。
应当理解的是,在将图谱节点特征信息映射到预设的图谱结构中后,得到的初始事故知识图谱具有不完整性,因此可以围绕初始事故知识图谱中已有的概念和关系信息进行知识推理,以得到新的知识,具体可以采用逻辑规则、嵌入表示和神经网络三类方法进行知识推理,本公开实施例对知识推理的方法不作具体限定。对知识推理的结果进行质量评估可以是对推理得到的新知识的置信度进行评估,并保留置信度高的知识,以保证事故知识图谱的准确度和有效性,当然也可以采用其他方式进行质量评估,本公开实施例对此不作具体限定。
应当理解的是,在水电站的使用过程中,水电站的监控系统采集到的信息在增加,预设数据源中的信息不断更新。因此,为了保证知识图谱的时效性和准确性,在另一种可能的方式中,事故知识图谱构建方法还可以将当前获取到的历史应急数据与事故知识图谱中的历史应急数据进行比对,确定当前获取到的历史应急数据是否发生变化,在当前获取到的历史应急数据发生变化的情况下,根据当前获取到的历史应急数据得到图谱节点特征信息,并对事故知识图谱进行知识更新。
图2是根据一示例性实施例示出的一种事故知识图谱构建装置200的框图。参照图2该装置包括获取模块201、特征提取模块202,确定模块203和映射模块204。
获取模块201,用于获取历史应急数据,历史应急数据包括针对水电站的历史事故案例的事故处置节点和事故处置节点对应的设备状态、历史应急策略以及采用历史应急策略后对应的诱发事故;
特征提取模块202,用于对历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;
确定模块203,用于基于预设的特征相似度算法,根据语义特征向量和事故场景特征向量,确定水电站的电力设备的图谱节点特征信息以及历史事故案例的相似度;
映射模块204,用于根据历史事故案例的相似度,将图谱节点特征信息映射到预设的图谱结构,得到事故知识图谱。
可选地,所述特征提取模块202用于:
对所述历史应急数据进行知识提取,得到知识图谱构建数据,所述知识图谱构建数据包括所述历史应急数据中的电力设备实体、所述电力设备实体的属性信息以及所述电力设备实体间的实体关系;
根据所述知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据;
对所述融合后的知识图谱构建数据进行特征提取,得到所述语义特征向量和所述事故场景特征向量。
可选地,所述历史应急数据包括结构化数据、半结构化数据和非结构化数据,所述特征提取模块202用于:
在所述历史应急数据为结构化数据的情况下,通过预设的映射规则对所述历史应急数据进行知识抽取,得到所述知识图谱构建数据;
在所述历史应急数据为半结构化数据或非结构化数据的情况下,根据预设的目标信息从所述半结构化数据或非结构化数据中筛选出针对水电站的历史事故案例;
通过预设的基于语义标注的关联模型算法,对筛选出的所述针对水电站的历史事故案例进行知识提取,得到所述知识图谱构建数据。
可选地,所述特征提取模块202用于:
将所述知识图谱构建数据与所述图谱数据合并,得到合并后的多个电力设备实体、每一电力设备实体的属性信息以及所述多个电力设备实体间的实体关系;
根据所述每一电力设备实体的属性信息,将所述合并后的多个电力设备实体中每一电力设备实体与其它电力设备实体进行比对,得到比对结果;
根据所述比对结果对所述合并后的多个电力设备实体进行筛选,得到目标电力设备实体、所述目标电力设备实体的目标属性信息以及所述目标电力设备实体间的目标实体关系;
根据所述目标电力设备实体、所述目标属性信息以及所述目标实体关系,得到融合后的知识图谱构建数据。
所述映射模块204用于:
根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构中,得到初始事故知识图谱;
通过所述初始事故知识图谱进行知识推理,得到知识推理结果;
对所述知识推理结果进行质量评估,得到质量评估结果;
根据所述质量评估结果补充所初始事故知识图谱,得到补充完整的事故知识图谱;
将所述补充完整的事故知识图谱确定为所述事故知识图谱。
可选地,知识图谱构建装置200还包括:
比对模块,用于将当前获取到的历史应急数据与所述事故知识图谱中的历史应急数据进行比对,确定所述当前获取到的历史应急数据是否发生变化;
知识更新模块,用于在所述当前获取到的历史应急数据发生变化的情况下,根据所述当前获取到的历史应急数据得到图谱节点特征信息,并对所述事故知识图谱进行知识更新。
可选地,所述获取模块201用于:
利用网页爬虫工具在预设的数据源中进行数据采集,得到所述历史应急数据。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本公开实施例还提供一种非临时性计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的知识图谱构建方法的步骤。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本公开实施例还提供一种非临时性计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的知识图谱构建方法的步骤。
图3是根据一示例性实施例示出的一种电子设备300的框图。如图3所示,该电子设备300可以包括:处理器301,存储器302。该电子设备300还可以包括多媒体组件303,输入/输出(I/O)接口304,以及通信组件305中的一者或多者。
其中,处理器301用于控制该电子设备300的整体操作,以完成上述的知识图谱构建方法中的全部或部分步骤。存储器302用于存储各种类型的数据以支持在该电子设备300的操作,这些数据例如可以包括用于在该电子设备300上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器302可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件303可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器302或通过通信组件305发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口304为处理器301和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件305用于该电子设备300与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件305可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备300可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的知识图谱构建方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的知识图谱构建方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器302,上述程序指令可由电子设备300的处理器301执行以完成上述的知识图谱构建方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的知识图谱构建方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (10)

1.一种事故知识图谱构建方法,其特征在于,包括:
获取历史应急数据,所述历史应急数据包括针对水电站的历史事故案例的事故处置节点和所述事故处置节点对应的设备状态、历史应急策略以及采用所述历史应急策略后对应的诱发事故;
对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;
基于预设的特征相似度算法,根据所述语义特征向量和所述事故场景特征向量,确定所述水电站的电力设备的图谱节点特征信息以及所述历史事故案例的相似度;
根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构,得到所述事故知识图谱。
2.根据权利要求1所述的方法,其特征在于,对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量,包括:
对所述历史应急数据进行知识提取,得到知识图谱构建数据,所述知识图谱构建数据包括所述历史应急数据中的电力设备实体、所述电力设备实体的属性信息以及所述电力设备实体间的实体关系;
根据所述知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据;
对所述融合后的知识图谱构建数据进行特征提取,得到所述语义特征向量和所述事故场景特征向量。
3.根据所述权利要求2所述的方法,其特征在于,所述历史应急数据包括结构化数据、半结构化数据和非结构化数据,若所述历史应急数据为结构化数据,所述对所述历史应急数据进行知识提取,得到知识图谱构建数据,包括:
通过预设的映射规则对所述历史应急数据进行知识抽取,得到所述知识图谱构建数据;
若所述历史应急数据为半结构化数据或非结构化数据,所述对所述历史应急数据进行知识提取,得到知识图谱构建数据,包括:
根据预设的目标信息从所述半结构化数据或非结构化数据中筛选出针对水电站的历史事故案例;
通过预设的基于语义标注的关联模型算法,对筛选出的所述针对水电站的历史事故案例进行知识提取,得到所述知识图谱构建数据。
4.根据所述权利要求2所述的方法,其特征在于,所述根据所述知识图谱构建数据和预设知识库中的图谱数据进行知识融合,得到融合后的知识图谱构建数据,包括:
将所述知识图谱构建数据与所述图谱数据合并,得到合并后的多个电力设备实体、每一电力设备实体的属性信息以及所述多个电力设备实体间的实体关系;
根据所述每一电力设备实体的属性信息,将所述合并后的多个电力设备实体中每一电力设备实体与其它电力设备实体进行比对,得到比对结果;
根据所述比对结果对所述合并后的多个电力设备实体进行筛选,得到目标电力设备实体、所述目标电力设备实体的目标属性信息以及所述目标电力设备实体间的目标实体关系;
根据所述目标电力设备实体、所述目标属性信息以及所述目标实体关系,得到融合后的知识图谱构建数据。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构中,得到所述事故知识图谱,包括:
根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构中,得到初始事故知识图谱;
通过所述初始事故知识图谱进行知识推理,得到知识推理结果;
对所述知识推理结果进行质量评估,得到质量评估结果;
根据所述质量评估结果补充所初始事故知识图谱,得到补充完整的事故知识图谱;
将所述补充完整的事故知识图谱确定为所述事故知识图谱。
6.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
将当前获取到的历史应急数据与所述事故知识图谱中的历史应急数据进行比对,确定所述当前获取到的历史应急数据是否发生变化;
在所述当前获取到的历史应急数据发生变化的情况下,根据所述当前获取到的历史应急数据得到图谱节点特征信息,并对所述事故知识图谱进行知识更新。
7.根据权利要求1-4中任一项所述的方法,其特征在于,所述获取历史应急数据,包括:
利用网页爬虫工具在预设的数据源中进行数据采集,得到所述历史应急数据。
8.一种事故知识图谱构建装置,其特征在于,包括:
获取模块,用于获取历史应急数据,所述历史应急数据包括针对水电站的历史事故案例的事故处置节点和所述事故处置节点对应的设备状态、历史应急策略以及采用所述历史应急策略后对应的诱发事故;
特征提取模块,用于对所述历史应急数据进行特征提取,得到语义特征向量和事故场景特征向量;
确定模块,用于基于预设的特征相似度算法,根据所述语义特征向量和所述事故场景特征向量,确定所述水电站的电力设备的图谱节点特征信息以及所述历史事故案例的相似度;
映射模块,用于根据所述历史事故案例的相似度,将所述图谱节点特征信息映射到预设的图谱结构,得到所述事故知识图谱。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN202211014302.5A 2022-08-23 2022-08-23 事故知识图谱构建方法、装置、存储介质及电子设备 Pending CN115408535A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211014302.5A CN115408535A (zh) 2022-08-23 2022-08-23 事故知识图谱构建方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211014302.5A CN115408535A (zh) 2022-08-23 2022-08-23 事故知识图谱构建方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115408535A true CN115408535A (zh) 2022-11-29

Family

ID=84161516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211014302.5A Pending CN115408535A (zh) 2022-08-23 2022-08-23 事故知识图谱构建方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115408535A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644810A (zh) * 2023-05-06 2023-08-25 国网冀北电力有限公司信息通信分公司 一种基于知识图谱实现的电网故障风险处置方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644810A (zh) * 2023-05-06 2023-08-25 国网冀北电力有限公司信息通信分公司 一种基于知识图谱实现的电网故障风险处置方法及装置
CN116644810B (zh) * 2023-05-06 2024-04-05 国网冀北电力有限公司信息通信分公司 一种基于知识图谱实现的电网故障风险处置方法及装置

Similar Documents

Publication Publication Date Title
Bhardwaj et al. Implementation of ID3 algorithm
CN112365171A (zh) 基于知识图谱的风险预测方法、装置、设备及存储介质
CN111508604A (zh) 一种急性肾损伤患者死亡率预测方法、服务器及存储介质
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN109379228A (zh) 误告警信息识别方法及装置、存储介质、电子终端
CN115357470B (zh) 信息生成方法、装置、电子设备和计算机可读介质
CN112579789A (zh) 一种设备故障诊断的方法和装置及设备
CN107679035A (zh) 一种信息意图检测方法、装置、设备和存储介质
Skvortsova et al. A hybrid intelligent system for risk assessment based on unstructured data
CN115408535A (zh) 事故知识图谱构建方法、装置、存储介质及电子设备
Yang et al. HackRL: Reinforcement learning with hierarchical attention for cross-graph knowledge fusion and collaborative reasoning
CN115878902A (zh) 基于神经网络模型的融媒体平台自动信息关键主题提取系统
CN117666546B (zh) 一种分布式控制系统故障诊断方法及装置
He et al. Research on the dynamic monitoring system model of university network public opinion under the big data environment
CN116628346B (zh) 搜索词推荐模型的训练方法及装置
Tao et al. A traffic accident morphology diagnostic model based on a rough set decision tree
CN115409100A (zh) 电力事故应急方案生成方法、装置、介质及设备
CN112528040A (zh) 基于知识图谱的引导教唆语料的检测方法及其相关设备
Adhikari et al. Privacy policy analysis with sentence classification
CN115051835A (zh) 一种处理数据的方法、电子设备、存储介质及系统
CN112183622B (zh) 一种移动应用bots安装作弊检测方法、装置、设备及介质
Zhou et al. Incorporating expert judgement into Bayesian network machine learning
CN113392221B (zh) 一种对薄实体的处理方法及相关装置
Long Qualitative spatial and temporal representation and reasoning: efficiency in time and space
CN116069832B (zh) 数据挖掘方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination