CN112528043A - 一种基于知识图谱的电网检修单结构化存储方法及系统 - Google Patents
一种基于知识图谱的电网检修单结构化存储方法及系统 Download PDFInfo
- Publication number
- CN112528043A CN112528043A CN202011508172.1A CN202011508172A CN112528043A CN 112528043 A CN112528043 A CN 112528043A CN 202011508172 A CN202011508172 A CN 202011508172A CN 112528043 A CN112528043 A CN 112528043A
- Authority
- CN
- China
- Prior art keywords
- entity
- entities
- maintenance
- relationship
- relations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 230000008439 repair process Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识图谱的电网检修单结构化存储方法及系统,方法包括以下过程:获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;从电网检修单中抽取实体和关系;从检修单相关文件中抽取实体及关系;将检修单及检修单相关文件中抽取的实体及关系进行融合;将融合后的实体及关系以知识图谱形式存储。本发明通过将检修单转化成知识实体和关系,以知识图谱形式结构化存储,方便直观了解实体之间的关系,方便调度员即时高效的提取各个检修单之间的关联关系。
Description
技术领域
本发明属于管理技术领域,具体涉及一种基于知识图谱的电网检修单结构化存储方法,还涉及一种知识图谱的电网检修单结构化存储系统。
背景技术
随着电网规模的不断扩大,电力设备及设备种类不断增加,电力设备检修也逐渐增加,电力检修单随之增加,同时电网检修单所涉及的内容越来越多,包括各部门意见、检修设备信息、检修内容、批准意见、事故预想等等。这些内容在当前检修单系统中采用罗列的方式进行展示,在存储时采用结构存储,无法通过界面或数据存储直观查看相关信息(如:部门意见与检修设备之间的关系;意见中包含什么事件,事件同设备之间的关系),无法帮助工作人员第一时间做出对应的响应,同时无法帮助机器理解检修单中的内容。导致检修单存储的意义大大降低。
当前电网检修单的展示和存储都无法满足直观的获取一张检修单的主体内容,无法准确定位各个检修单内容之间的关系。因此,在查阅大量检修单的时候,需人工分析各个检修单的差异及关联关系。随着电网规模的不断扩大,电力设备及设备种类不断增加,电力设备检修也逐渐增加,电力检修单也随之海量增加。人工分析各个检修单之间的关联关系的工作量愈加巨大,造成人工成本和时间的巨大浪费,也可能因为人为理解偏差造成分析结果错误,甚至影响电网运行安全。
因此,亟需建立一种有效的分析机制,准确获取检修单内容并分析对比找出相互之间的关联关系。避免人为分析所造成的成本浪费,提高分析效率及准确性,提高电网运行安全。
发明内容
本发明的目的在于克服现有技术中的不足,提供了一种基于知识图谱的电网检修单结构化存储方法及系统,将检修单转化成知识实体和关系,以知识图谱形式结构化存储。
为解决上述技术问题,本发明提供了一种基于知识图谱的电网检修单结构化存储方法,包括以下过程:
获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;
从电网检修单中抽取实体和关系;
从检修单相关文件中抽取实体及关系;
将检修单及检修单相关文件中抽取的实体及关系进行融合;
将融合后的实体及关系以知识图谱形式存储。
进一步的,所述从电网检修单中抽取实体和关系,包括:
从电网检修单中抽取实体,并确定实体的属性,所有的实体存储为实体E;
从电网检修单中抽取实体关系,将所有的实体关系存储为关系R。
进一步的,所述从检修单相关文件中抽取实体及关系,包括:
对检修单相关文件中内容进行筛选,将无用的语句删除;
对处理后的内容进行分句,按照标点符号进行切分;
对处理后的结果使用DeepDive工具关系抽取实体及实体关系。
进一步的,所述从检修单相关文件中抽取实体及关系之后,还包括:
对抽取的实体及关系进行清洗。
进一步的,所述对抽取的实体及关系进行清洗,包括:
1)若实体关系在专家关系规则库中存在,则将实体及实体关系暂存为实体E1和关系R1;
2)若实体关系在专家关系规则库中不存在,则将清除关系,对于关系两边的实体,若在实体类型规则库中存在当前实体对应的实体类型,则根据专家关系规则库中实体类型间关系设置为此两边实体之间的默认关系,暂存为实体E2及关系R2;
3)对于2)中无法识别的关系及实体类型暂时无法确定的,实体和关系暂存为实体E3和关系R3。
进一步的,所述将检修单及检修单相关文件中实体及关系进行融合,包括:
1)将实体E1中的实体同实体E中的实体进行匹配,若匹配成功,则将实体E1和关系R1暂存到实体E和关系R中,否则将实体E1和关系R1暂存到实体E3和关系R3中;
2)将实体E2中的实体同实体E中的实体进行匹配,若匹配成功,则将实体E2和关系R2暂存到实体E和关系R中,否则将实体E2和关系R2存入实体E3和关系R3中;
3)若实体E3和关系R3中实体及实体关系满足:将实体E3中的实体名称同实体E中的实体名称进行余弦相似度计算,若余弦相似度超过指定阈值,则认为是同一实体;同时,此实体间的关系R3在专家关系规则库中存在,则将此实体及关系存到实体E和关系R中;否则,删除此实体和关系。
进一步的,所述实体和关系融合之后,还包括:
遍历实体E中的各个实体,如果实体存在属性不全时,补全实体所缺少的属性。
进一步的,所述将融合后的实体及关系以知识图谱形式存储,包括:
将实体和关系存储到Neo4j数据库中,以知识图谱形式进行图形化展示。
相应的,本发明还提供了一种基于知识图谱的电网检修单结构化存储系统,包括:
数据获取模块,用于获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;
第一抽取模块,用于从电网检修单中抽取实体和关系;
第二抽取模块,用于从检修单相关文件中抽取实体及关系;
关系融合模块,用于将检修单及检修单相关文件中抽取的实体及关系进行融合;
结构化存储模块,用于将融合后的实体及关系以知识图谱形式存储。
与现有技术相比,本发明所达到的有益效果是:本发明通过将检修单转化成知识实体和关系,以知识图谱形式结构化存储,方便直观了解实体之间的关系,既可以方便调度员即时高效的提取各个检修单之间的关联关系,也可以方便计算机利用进行新的业务开发。
附图说明
图1为为本发明方法的具体流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明中涉及到的名词解释:
检修单:描述对设备定期或不定期进行预防性的或恢复性的检查与修理工作,称为检修单;
检修意见:各部门为保证电力系统平稳运行,防止生产系统故障,会对检修提出预防意见或出现情况后的应对方案;
余弦相似度:又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度;
知识图谱:知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考;
DeepDive:是一个从暗数据中提取价值的系统,用于提取实体之间复杂的关系,并对涉及这些实体的事实进行推断。
本发明旨在建立一种基于知识图谱的电网检修单结构化存储方法,即将检修单中结构化的数据转换成以实体、边(关系)的方式存储,同时从检修单相关文件中获取实体及关系,并对两边的实体及关系进行融合,最后存储在Neo4j图数据库中通过知识图谱的方式展示,即可直观的看到各个检修单之间的关联关系。
本发明的一种基于知识图谱的电网检修单结构化存储方法,是将结构化存储的电网检修单及意见转化成通过图数据库存储的方法,图1详细介绍了检修单数据抽取及转换的整体过程,具体的步骤如下:
步骤01、数据定义
实体定义:将数据库中的设备信息、人员信息、场站信息等定义成实体,并指定实体类型。如设备信息实体定义成“设备”,设备类实体对应的属性有名称、电压等级、设备分类、设备子类等。
实体关系定义:定义已经明确的实体之间的关系,如设备与厂站的关系是包含关系。
专家关系规则库:定义实体类型间可能的所有关系。
实体类型规则库:定义实体所属实体类型,如设备,人员,场站,检修单等。
步骤02、数据采集
从数据库中根据数据定义把每一张电网检修单所涉及的字段内容抽取到缓存中,避免重复访问数据库。
抽取所有的场站和设备信息到缓存中,方便补充从检修意见、检修内容、事故预想等检修单相关文件中抽取到的实体属性信息。
步骤03、实体及关系抽取
1)实体抽取
根据步骤01中定义的实体,从缓存中每一张电网检修单中抽取实体,并确定实体的属性,如实体类型为设备,其中一个实体名称为“220kV云路变电站220kV2030开关”,电压等级为“220kV”,设备分类为“辅助设备”,设备子类为“开关刀闸”。所有的实体简写为实体E。
2)实体关系抽取
根据步骤01中定义的关系,从电网检修单中抽取实体关系,即有关系的实体进行关联,将当前所有的关系简写关系R。
步骤04、检修单相关文件中实体及关系抽取
从检修意见、检修内容、事故预想等检修单相关文件中抽取实体及关系步骤如下:
1)从缓存中获取检修单对应的意见、检修内容、事故预想等检修单相关文件;
2)对1)中的检修单相关文件中内容(句子)进行筛选,将无用的语句删除,无用的语句是指如句中全是符号数字组成的句子;句的长度小于2的语句;
3)对2)中处理后的句子进行分句,按照中文句子标点符号进行切分;
4)使用DeepDive工具关系抽取3)中结果的实体及实体关系。
步骤05、检修单相关文件中实体及关系清洗
1)清洗步骤04中得到的实体及实体关系。若实体关系在专家关系规则库中存在,则将实体及实体关系暂存为实体E1和关系R1;
2)对于1)中的关系若在专家关系规则库中不存在,则将清除关系,对于关系两边的实体,若在实体类型规则库中存在当前实体对应的实体类型,则根据专家关系规则库中实体类型间关系设置为此两边实体之间的默认关系,暂存为实体E2及关系R2;
3)对于2)中无法识别的关系及实体类型暂时无法确定的,实体和关系暂存为实体E3和关系R3。
步骤06、检修单及检修单相关文件中实体及关系的融合
1)将实体E1中的实体同实体E中的实体进行匹配(实体名称匹配),若匹配成功,则将实体E1和关系R1暂存到实体E和关系R中(实体覆盖,关系存储),否则将实体E1和关系R1暂存到实体E3和关系R3中;
2)将实体E2中的实体同实体E中的实体进行匹配(实体名称匹配),若匹配成功,则将实体E2和关系R2暂存到实体E和关系R中,否则将实体E2和关系R2存入实体E3和关系R3中;
3)若实体E3和关系R3中实体及实体关系满足:将实体E3中的实体名称同实体E中的实体名称进行余弦相似度计算,若余弦相似度超过指定阈值0.9,则认为是同一实体;同时,此实体间的关系R3在专家关系规则库中存在,则将此实体及关系存到实体E和关系R中;否则,删除此实体和关系。
步骤07、实体内容补全
遍历实体E中的各个实体,如果实体存在属性不全时,依据场站和设备信息补全实体所缺少的信息,如设备,补充电压等级、设备类型等。
步骤08、实体及关系存储
将实体E和关系R存储到Neo4j数据库中,以知识图谱形式进行图形化展示,完成结构化检修单转知识图谱存储。
本发明通过将检修单转化成知识实体和关系,以知识图谱形式结构化存储,方便直观了解实体之间的关系,方便调度员即时高效的提取各个检修单之间的关联关系。
实施例2
如有一张检修单为“逸仙站220kV#1PT停电”,抽取结构实体和对应关系如下,结构实体为
人员(P1):{
“名字”:“张水平”,
“部门”:“”
}
检修单(J1):{
“名称”:“逸仙站220kV#1PT停电”,
“编号”:“0300_201906-0056”,
“时间”:“2019-06-20 10:55”
}
设备(D1):{
“名称”:“220kV逸仙变电站\#1电压互感器间隔”,
“电压等级”:“一般设备”,
“电压等级”:“220kV”,
“设备子类”:“PT”
}
关系P1→编制→J1,J1→停电→D1
保护意见:确认#1、2母线并列运行,220kV母差失灵按正常方式投入(即母线不强制互联),原接于#1PT的保护改接于#2PT。从中抽取实体如下:
设备(D2):{
“名称”:“#1母线”
}
设备(D3):{
“名称”:“#2母线”
}
设备(D4):{
“名称”:“#1PT”
}
设备(D5):{
“名称”:“#2PT”
}
关系D2→无→D3,D4→无→D5。J1→包含→D2,J1→包含→D3,J1→包含→D4,J1→包含→D5。
本发明通过将检修单转化成知识实体和关系,方便直观了解实体之间的关系,既可以方便调度员即时高效的提取各个检修单之间的关联关系,也可以方便计算机利用进行新的业务开发,如调度业务推理、问答等。
实施例3
相应的,本发明的一种基于知识图谱的电网检修单结构化存储系统,包括:
数据获取模块,用于获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;
第一抽取模块,用于从电网检修单中抽取实体和关系;
第二抽取模块,用于从检修单相关文件中抽取实体及关系;
关系融合模块,用于将检修单及检修单相关文件中抽取的实体及关系进行融合;
结构化存储模块,用于将融合后的实体及关系以知识图谱形式存储。
本发明系统的各模块的实现方案参考实施例1中方法的各步骤实现过程。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。
Claims (9)
1.一种基于知识图谱的电网检修单结构化存储方法,其特征是,包括以下过程:
获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;
从电网检修单中抽取实体和关系;
从检修单相关文件中抽取实体及关系;
将检修单及检修单相关文件中抽取的实体及关系进行融合;
将融合后的实体及关系以知识图谱形式存储。
2.根据权利要求1所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述从电网检修单中抽取实体和关系,包括:
从电网检修单中抽取实体,并确定实体的属性,所有的实体存储为实体E;
从电网检修单中抽取实体关系,将所有的实体关系存储为关系R。
3.根据权利要求1所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述从检修单相关文件中抽取实体及关系,包括:
对检修单相关文件中内容进行筛选,将无用的语句删除;
对处理后的内容进行分句,按照标点符号进行切分;
对处理后的结果使用DeepDive工具关系抽取实体及实体关系。
4.根据权利要求1所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述从检修单相关文件中抽取实体及关系之后,还包括:
对抽取的实体及关系进行清洗。
5.根据权利要求4所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述对抽取的实体及关系进行清洗,包括:
1)若实体关系在专家关系规则库中存在,则将实体及实体关系暂存为实体E1和关系R1;
2)若实体关系在专家关系规则库中不存在,则将清除关系,对于关系两边的实体,若在实体类型规则库中存在当前实体对应的实体类型,则根据专家关系规则库中实体类型间关系设置为此两边实体之间的默认关系,暂存为实体E2及关系R2;
3)对于2)中无法识别的关系及实体类型暂时无法确定的,实体和关系暂存为实体E3和关系R3。
6.根据权利要求5所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述将检修单及检修单相关文件中实体及关系进行融合,包括:
1)将实体E1中的实体同实体E中的实体进行匹配,若匹配成功,则将实体E1和关系R1暂存到实体E和关系R中,否则将实体E1和关系R1暂存到实体E3和关系R3中;
2)将实体E2中的实体同实体E中的实体进行匹配,若匹配成功,则将实体E2和关系R2暂存到实体E和关系R中,否则将实体E2和关系R2存入实体E3和关系R3中;
3)若实体E3和关系R3中实体及实体关系满足:将实体E3中的实体名称同实体E中的实体名称进行余弦相似度计算,若余弦相似度超过指定阈值,则认为是同一实体;同时,此实体间的关系R3在专家关系规则库中存在,则将此实体及关系存到实体E和关系R中;否则,删除此实体和关系。
7.根据权利要求1所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述实体和关系融合之后,还包括:
遍历实体E中的各个实体,如果实体存在属性不全时,补全实体所缺少的属性。
8.根据权利要求1所述的一种基于知识图谱的电网检修单结构化存储方法,其特征是,所述将融合后的实体及关系以知识图谱形式存储,包括:
将实体和关系存储到Neo4j数据库中,以知识图谱形式进行图形化展示。
9.一种基于知识图谱的电网检修单结构化存储系统,其特征是,包括:
数据获取模块,用于获取电网检修单及检修单相关文件,所述检修单相关文件包括检修意见、检修内容和事故预想;
第一抽取模块,用于从电网检修单中抽取实体和关系;
第二抽取模块,用于从检修单相关文件中抽取实体及关系;
关系融合模块,用于将检修单及检修单相关文件中抽取的实体及关系进行融合;
结构化存储模块,用于将融合后的实体及关系以知识图谱形式存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011508172.1A CN112528043A (zh) | 2020-12-18 | 2020-12-18 | 一种基于知识图谱的电网检修单结构化存储方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011508172.1A CN112528043A (zh) | 2020-12-18 | 2020-12-18 | 一种基于知识图谱的电网检修单结构化存储方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112528043A true CN112528043A (zh) | 2021-03-19 |
Family
ID=75001644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011508172.1A Pending CN112528043A (zh) | 2020-12-18 | 2020-12-18 | 一种基于知识图谱的电网检修单结构化存储方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528043A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113283619A (zh) * | 2021-06-11 | 2021-08-20 | 广西电网有限责任公司南宁供电局 | 基于知识图谱的停电检修计划编排辅助方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180081786A1 (en) * | 2016-09-19 | 2018-03-22 | Grand Rounds, Inc. | Methods and systems for content management and testing |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN111026883A (zh) * | 2019-12-11 | 2020-04-17 | 南方电网数字电网研究院有限公司 | 电力业务数据的知识图谱构建方法、装置、设备和介质 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111881290A (zh) * | 2020-06-17 | 2020-11-03 | 国家电网有限公司 | 一种基于加权语义相似度的配网多源网架实体融合方法 |
-
2020
- 2020-12-18 CN CN202011508172.1A patent/CN112528043A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180081786A1 (en) * | 2016-09-19 | 2018-03-22 | Grand Rounds, Inc. | Methods and systems for content management and testing |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN111026883A (zh) * | 2019-12-11 | 2020-04-17 | 南方电网数字电网研究院有限公司 | 电力业务数据的知识图谱构建方法、装置、设备和介质 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111881290A (zh) * | 2020-06-17 | 2020-11-03 | 国家电网有限公司 | 一种基于加权语义相似度的配网多源网架实体融合方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113283619A (zh) * | 2021-06-11 | 2021-08-20 | 广西电网有限责任公司南宁供电局 | 基于知识图谱的停电检修计划编排辅助方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111768077B (zh) | 一种基于知识图谱的电网跳闸事件智能识别方法 | |
CN107069960B (zh) | 一种二次运维管理系统的在线缺陷诊断方法 | |
MX2013000577A (es) | Aprendizaje de maquina para redes electricas. | |
CN110852697B (zh) | 一种变电站倒闸操作票自动生成系统 | |
CN108921307B (zh) | 电力厂站设备自动生成巡视计划工作对象的方法及系统 | |
CN111832977A (zh) | 一种基于自然语言解析的检修申请自动成票方法 | |
CN112528043A (zh) | 一种基于知识图谱的电网检修单结构化存储方法及系统 | |
CN113095524A (zh) | 电力设备检修工作单据智能生成方法、系统及存储介质 | |
CN114529166A (zh) | 一种配电网运行安全风险预警方法及系统 | |
CN110826735A (zh) | 一种电力scada智能多维查询检修方法 | |
JP2009211164A (ja) | プラント保全計画支援システム及び方法 | |
CN110245163A (zh) | 一种电力系统运行隐患排查方法 | |
CN113010695A (zh) | 一种适用于继电保护装置缺陷分析的专业词典构建方法 | |
CN112906389A (zh) | 一种基于多维度数据分析的故障跳闸判别方法 | |
CN107730123B (zh) | 一种调度自动化图模规范一致性校核方法 | |
CN115333232A (zh) | 变压器启停状态异常的在线监测方法及相关装置 | |
CN114077835A (zh) | 一种市域电网调度操作票生成方法 | |
Sui et al. | Research on multi-node frame early warning system of power grid based on abnormal data extraction | |
JPH0819178A (ja) | 電力系統設備保守支援装置 | |
CN112701678A (zh) | 一种电网演变趋势分析方法 | |
CN110852606A (zh) | 一种基于调控云的生产早报数据对象化分析方法 | |
Mu et al. | Defect Analysis of Secondary Equipment Based on Power Dictionary and Apriori Algorithm | |
CN113111189B (zh) | 可解释性电网作业风险评估方法与装置 | |
CN112256763B (zh) | 在线监控系统及设备 | |
Zeng et al. | Research on Framework and Key Technologies of Text Mining for Operation and Maintenance of Traction Power Supply Equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |