CN110399498A - 一种电力变压器运行规范知识图谱构建方法 - Google Patents
一种电力变压器运行规范知识图谱构建方法 Download PDFInfo
- Publication number
- CN110399498A CN110399498A CN201910633472.3A CN201910633472A CN110399498A CN 110399498 A CN110399498 A CN 110399498A CN 201910633472 A CN201910633472 A CN 201910633472A CN 110399498 A CN110399498 A CN 110399498A
- Authority
- CN
- China
- Prior art keywords
- power transformer
- knowledge mapping
- knowledge
- construction method
- operating standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 26
- 238000010276 construction Methods 0.000 title claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 238000002372 labelling Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 abstract description 4
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 238000001816 cooling Methods 0.000 abstract description 2
- 238000011900 installation process Methods 0.000 abstract description 2
- 230000008439 repair process Effects 0.000 abstract description 2
- 230000007246 mechanism Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力变压器运行规范知识图谱构建方法,其基于语言技术平台LTP进行句法分析和知识抽取;然后基于Neo4j进行知识图谱绘制。本发明能有效的挖掘电力变压器运行规程中的各部件主体,如分接开关、套管、冷却装置、变压器油等在安装过程中或者在不同异常情况下需要进行的操作。并使用Neo4j形成知识图谱,进行可视化。使得需要对电力变压器进行的维护维修操作变得更加明了易读,为变压器运维人员提供了便利。
Description
技术领域
本发明涉及图谱构建领域,具体地说,特别涉及到一种电力变压器运行规范知识图谱构建方法。
背景技术
为保证电力系统的安全可靠运行和实现供电系统的规范化、标准化、科学化管理,电气设备需要严格按照安全运行管理规程进行维护操作。电力变压器是发电厂和变电所的主要设备之一,其可靠运行对电能稳定传输有着重要意义。
目前,随着自然语言处理技术的发展,对电力变压器运行规程进行语义解析和知识图谱可视化已经成为可能。自然语言处理是人工智能技术的一个分支,目前在文本的理解、分类、摘要、信息抽取、知识问答、生成等方面被广泛的研究和应用。针对自然语言的特性,在形式语言理论框架下建立不同的模型,形成了自然语言处理的诸多形式化机制,基于规则的形式化机制包括词汇功能语法、广义短语结构语法、中心词驱动的短语结构语法、依存语法、范畴语法、组合范畴语法等,基于统计的形式化机制包括隐马尔科夫模型、概率上下文无关语法等,基于联结的形式化机制包括卷积神经网络、循环神经网络、长短时记忆模型等。
另一方面,知识图谱本质上是语义网络,是一种基于图的数据结构,由节点和边组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式,是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。在进行非结构化文本知识抽取后,形成知识图谱知识库。利用这个知识库,给定查询内容,然后到知识库中去进行关联分析和推理,机器可以了解用户的意图,反馈给用户查询相关内容的更多关联信息。
发明内容
本发明的目的在于针对现有技术中的不足,提供一种基于语言技术平台LTP和Neo4j图形数据库的知识图谱构建方法,能可靠的构建电力变压器运行规程知识图谱。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种电力变压器运行规范知识图谱构建方法,包括如下步骤:
1)基于语言技术平台进行句法分析和知识抽取;
2)基于Neo4j图形数据库进行知识图谱绘制。
进一步的,所述步骤1)具体包括如下步骤:
1.1)基于Python读取电力变压器运行规程文档作为输入;
1.2)定义电力变压器运行规程的专有名词用户词典,从而配置语言技术平台模型;
1.3)进行电力变压器运行规程的分段、分句、分词、词性标注、命名实体识别、依存语义分析、语义角色标注;
1.4)根据句法分析编写抽取规则,对电力变压器各部件在不同情况下要进行的操作进行知识抽取。
进一步的,所述步骤2)具体包括如下步骤:
2.1)根据知识抽取结果,基于Python在Neo4j图形数据库中创建图、节点和关系;
2.2)访问本地端口,打开页面获得电力变压器运行规程知识图谱。
与现有技术相比,本发明的有益效果在于:
本发明电力变压器运行规范知识图谱构建方方法,其基于语言技术平台LTP和Neo4j图形数据库,能有效的挖掘电力变压器运行规程中的各部件主体,如分接开关、套管、冷却装置、变压器油等在安装过程中或者在不同异常情况下需要进行的操作。并使用Neo4j形成知识图谱,进行可视化。使得需要对电力变压器进行的维护维修操作变得更加明了易读,为变压器运维人员提供了便利。
附图说明
图1为本发明所述的电力变压器运行规范知识图谱构建方法的示意图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参见图1,本发明所述的一种电力变压器运行规范知识图谱构建方法,包括如下步骤:
(1)基于语言技术平台(LTP)进行句法分析和知识抽取
基于Python读取电力变压器运行规程文档作为输入,并定义电力变压器运行规程的专有名词用户词典从而配置LTP模型,进行电力变压器运行规程的分段、分句、分词、词性标注、命名实体识别、依存语义分析、语义角色标注。进一步,根据句法分析编写抽取规则,对电力变压器各部件(主体)在不同情况下要进行的操作(关系)进行知识抽取。
(2)基于Neo4j图形数据库进行知识图谱绘制
根据知识抽取结果,基于Python在Neo4j中创建图、节点和关系。访问本地端口“http://localhost:7474/”打开页面获得电力变压器运行规程知识图谱。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (3)
1.一种电力变压器运行规范知识图谱构建方法,其特征在于,包括如下步骤:
1)基于语言技术平台进行句法分析和知识抽取;
2)基于Neo4j图形数据库进行知识图谱绘制。
2.根据权利要求1所述的电力变压器运行规范知识图谱构建方法,其特征在于,所述步骤1)具体包括如下步骤:
1.1)基于Python读取电力变压器运行规程文档作为输入;
1.2)定义电力变压器运行规程的专有名词用户词典,从而配置语言技术平台模型;
1.3)进行电力变压器运行规程的分段、分句、分词、词性标注、命名实体识别、依存语义分析、语义角色标注;
1.4)根据句法分析编写抽取规则,对电力变压器各部件在不同情况下要进行的操作进行知识抽取。
3.根据权利要求1所述的电力变压器运行规范知识图谱构建方法,其特征在于,所述步骤2)具体包括如下步骤:
2.1)根据知识抽取结果,基于Python在Neo4j图形数据库中创建图、节点和关系;
2.2)访问本地端口,打开页面获得电力变压器运行规程知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910633472.3A CN110399498A (zh) | 2019-07-15 | 2019-07-15 | 一种电力变压器运行规范知识图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910633472.3A CN110399498A (zh) | 2019-07-15 | 2019-07-15 | 一种电力变压器运行规范知识图谱构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110399498A true CN110399498A (zh) | 2019-11-01 |
Family
ID=68325459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910633472.3A Pending CN110399498A (zh) | 2019-07-15 | 2019-07-15 | 一种电力变压器运行规范知识图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399498A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800231A (zh) * | 2021-03-31 | 2021-05-14 | 南方电网数字电网研究院有限公司 | 电力数据校验方法、装置、计算机设备和存储介质 |
CN113269331A (zh) * | 2021-04-25 | 2021-08-17 | 云南电网有限责任公司信息中心 | 一种变压器检修作业的知识库构建方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020052871A1 (en) * | 2000-11-02 | 2002-05-02 | Simpleact Incorporated | Chinese natural language query system and method |
CN107368468A (zh) * | 2017-06-06 | 2017-11-21 | 广东广业开元科技有限公司 | 一种运维知识图谱的生成方法及系统 |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN109241289A (zh) * | 2017-07-04 | 2019-01-18 | 北京国双科技有限公司 | 实体信息图谱扩充方法及装置 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
-
2019
- 2019-07-15 CN CN201910633472.3A patent/CN110399498A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020052871A1 (en) * | 2000-11-02 | 2002-05-02 | Simpleact Incorporated | Chinese natural language query system and method |
CN107368468A (zh) * | 2017-06-06 | 2017-11-21 | 广东广业开元科技有限公司 | 一种运维知识图谱的生成方法及系统 |
CN109241289A (zh) * | 2017-07-04 | 2019-01-18 | 北京国双科技有限公司 | 实体信息图谱扩充方法及装置 |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
Non-Patent Citations (3)
Title |
---|
刘梓权等: "基于知识图谱技术的电力设备缺陷记录检索方法", 《电力系统自动化》 * |
姬源等: "电力领域语义搜索系统的构建方法", 《计算机系统应用》 * |
黄恒琪等: "知识图谱研究综述", 《计算机系统应用》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800231A (zh) * | 2021-03-31 | 2021-05-14 | 南方电网数字电网研究院有限公司 | 电力数据校验方法、装置、计算机设备和存储介质 |
CN112800231B (zh) * | 2021-03-31 | 2021-07-20 | 南方电网数字电网研究院有限公司 | 电力数据校验方法、装置、计算机设备和存储介质 |
CN113269331A (zh) * | 2021-04-25 | 2021-08-17 | 云南电网有限责任公司信息中心 | 一种变压器检修作业的知识库构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177394B (zh) | 基于句法注意力神经网络的知识图谱关系数据分类方法 | |
CN111241295B (zh) | 基于语义句法交互网络的知识图谱关系数据抽取方法 | |
WO2018218705A1 (zh) | 一种基于神经网络概率消歧的网络文本命名实体识别方法 | |
AbdelRahman et al. | Integrated machine learning techniques for Arabic named entity recognition | |
CN111860882A (zh) | 一种电网调度故障处理知识图谱的构建方法及装置 | |
CN107577662A (zh) | 面向中文文本的语义理解系统及方法 | |
CN112101041B (zh) | 基于语义相似度的实体关系抽取方法、装置、设备及介质 | |
CN112905804B (zh) | 一种电网调度知识图谱的动态更新方法及装置 | |
CN111090730A (zh) | 智能语音调度系统及方法 | |
WO2023108991A1 (zh) | 模型的训练方法、知识分类方法、装置、设备、介质 | |
CN110399498A (zh) | 一种电力变压器运行规范知识图谱构建方法 | |
CN113934909A (zh) | 基于预训练语言结合深度学习模型的金融事件抽取方法 | |
CN112434129A (zh) | 一种电网调度领域专业语料库生成方法及系统 | |
CN103309992B (zh) | 一种面向自然语言的位置信息提取方法 | |
Mo et al. | Crf-based named entity recognition for myanmar language | |
Zhao et al. | Classification of natural language processing techniques for requirements engineering | |
CN113869054A (zh) | 一种基于深度学习的电力领域项目特征识别方法 | |
CN111368532B (zh) | 一种基于lda的主题词嵌入消歧方法及系统 | |
Anandika et al. | Named entity recognition in Odia language: a rule-based approach | |
Nejme et al. | AmAMorph: finite state morphological analyzer for amazighe | |
Ren | Networked artificial intelligence English translation system based on an intelligent knowledge base and translation method thereof | |
CN115169370A (zh) | 语料数据增强方法、装置、计算机设备及介质 | |
CN111414747B (zh) | 一种基于弱监督学习的时间知识模糊测度方法及系统 | |
CN110457436B (zh) | 信息标注方法、装置、计算机可读存储介质及电子设备 | |
Han et al. | Using connectives in implicit discourse relation recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191101 |
|
RJ01 | Rejection of invention patent application after publication |