CN111860882B - 一种电网调度故障处理知识图谱的构建方法及装置 - Google Patents
一种电网调度故障处理知识图谱的构建方法及装置 Download PDFInfo
- Publication number
- CN111860882B CN111860882B CN202010552327.5A CN202010552327A CN111860882B CN 111860882 B CN111860882 B CN 111860882B CN 202010552327 A CN202010552327 A CN 202010552327A CN 111860882 B CN111860882 B CN 111860882B
- Authority
- CN
- China
- Prior art keywords
- power grid
- equipment
- fault
- failure
- grid dispatching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 title claims description 91
- 238000002372 labelling Methods 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 29
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000012795 verification Methods 0.000 claims description 16
- 238000005520 cutting process Methods 0.000 claims description 13
- 238000012502 risk assessment Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013179 statistical model Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005065 mining Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 18
- 238000012423 maintenance Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电网故障处理知识图谱的构建方法及装置,通过领域高质量专业短语挖掘、命名实体识别,以及设备、事件、操作等关系抽取,从海量的电网运行数据、故障处理预案等结构化和非结构化数据中自动提取知识,构建电网调度故障处理知识图谱,很好地突破传统电网调度专家系统规则化定制知识、周期长、更新慢的限制,实现电网调度故障处理知识的计算机智能自主获取、跨领域分析和全时段学习。
Description
技术领域
本发明涉及一种电网调度故障处理知识图谱的构建方法及装置,属于电网故障处理技术领域。
背景技术
电网值班调度员故障处理时,需要遵照调度规程和安全稳定运行规定,汇总分系电网运行、电网故障、设备检修、气象环境、调度日志、风险评估等信息,结合故障预案、运行方式安排、负荷快速转移方案等预定方针,形成故障处理方案。其中,调度规程、安全稳定运行规定、故障预案、运行方式安排与调整、负荷快速转移方案等信息通常以文本形式存在,电网运行、电网故障、设备检修、气象环境、调度日志、风险评估等信息分散在不同系统中的不同位置,很多工作需要直板调度员人工查阅和汇总,存在无法自动化搜集、关联、分析信息,处置故障时效率不高等问题。
发明内容
本发明的目的在于针对传统电网调度专家系统无法自动化获取知识的局限,提出一种电网调度故障处理知识图谱的构建方法及装置,通过机器学习、自然语言处理等人工智能技术,从海量的电网运行数据、故障处理预案等结构化和半结构化数据中自动提取知识,构建电网调度故障处理知识图谱,实现电网调度故障处理知识的计算机智能自主获取、跨领域分析和全时段学习,极大地提升电网故障处理的效率。
为达到上述目的,本发明采用的技术方案如下:
本发明一方面提供一种电网调度故障处理知识图谱的构建方法,包括:
对电网调度故障处理领域文本语料进行专业短语识别;
对识别后的电网调度故障处理领域专业短语进行命名实体识别;
对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
进一步的,所述对电网调度故障处理领域文本语料进行专业短语识别,包括:
将故障预案、运行方式和调度日志的领域语料进行中文分词;
采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;
基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电调度故障处理领域不重要的短语;
计算高质量候选短语的质量评分;
基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语。
进一步的,所述基于候选短语的统计指标特征进行高质量候选短语筛选,包括:
将候选短语按照9:1的比例划分训练集和验证集,并人工标注出训练集中高质量候选短语;
针对每一个人工标注样本,采用决策树分类器进行训练、测试与验证,构建基于短语统计指标特征的分类器,用于识别高质量候选短语;所述统计指标特征包括:候选短语u的C-value(u)值、NC-value(u)值、PMI值、左邻字熵和右邻字熵。
进一步的,所述计算高质量候选短语的质量评分,包括:
F(u)=weight(c-value)*(C-value(u))+weight(nc-value)*(NC-value(u))+weight(pmi)*PMI(u)+weight(HL)*HL(u)+weight(HR)*HR(u);
其中,F(u)为候选短语u的质量评分,C-value(u)、NC-value(u)、PMI(u)、HL(u)、HR(u)分别为候选短语u的C-value(u)值、NC-value(u)值、PMI值、左邻字熵、右邻字熵,weight(c-value)、weight(nc-value)、weight(pmi)、weight(HL)、weight(HR)分别为候选短语u的C-value(u)值、NC-value(u)值、PMI值、左邻字熵、右邻字熵值的权重。
进一步的,所述基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语,包括:
将高质量候选短语按质量评分从大到小进行排序,获取质量评分最大的前N个高质量候选短语;
对中文分词后的故障预案、运行方式和调度日志的领域语料基于前N个高质量候选短语进行迭代切割,更新候选短语,并重新计算更新后的候选短语的统计指标特征和质量评分,直至最终的候选短语的质量评分不变,输出最终质量评分最大的前N个候选短语,作为电网调度故障处理领域专业短语。
进一步的,所述对识别后的电网调度故障处理领域专业短语进行命名实体识别,包括:
对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;
将语料标注后生成的标注信息转换为BIO标注格式;
对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;
将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型。
进一步的,所述对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理,包括:
对电网调度故障处理领域专业短语中的分句进行bigram、trigram拼接,生成新的分句;
对于已标注为厂站、设备、事件和操作的实体,利用收集到的命名实体词典,采用随机替换的方式,替换同类型的实体,得到增强语料;
对所有语料去除空行与句号,统一符号状态,统一字母大小写,以及去掉无意义的词。
进一步的,还包括:
在已识别的厂站和设备中,基于名称缩写文本模式,识别厂站和设备的同义词与缩略词,共同作为电网调度故障处理知识图谱构建的实体。
进一步的,所述对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱,包括:
对命名实体识别后的电网调度故障处理领域专业短语进行实体、实体属性,以及实体与实体、实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体、实体与属性间的关系,形成故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型;所述故障预案子图模型表征故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系;所述运行方式调整发文子图模型表征调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系;所述管辖范围信息子图模型表征设备所属厂站和机构,其中,设备为管辖设备或者许可设备;所述检修单子图模型表征设备所属厂站,设备检修单的停电事件、工作内容和工作时间,以及相互之间的关系;所述风险预警子图模型表征设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析和风控要求,以及相互之间的关系;所述历史故障日志子图模型表征故障设备,故障设备所属厂站与机构,故障事件,故障事件时间,故障后运行方式以及相互之间的关系;
将所述故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型中的厂站、设备实体建立等价映射,融合成多领域融合的电网调度故障处理知识图谱。
本发明另一方面提供一种电网调度故障处理知识图谱的构建装置,包括:
识别模块,用于对电网调度故障处理领域文本语料进行专业短语识别;
命名模块,用于对识别后的电网调度故障处理领域专业短语进行命名实体识别;
以及,
构建模块,用于对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
进一步的,所述识别模块具体用于,
将故障预案、运行方式和调度日志的领域语料进行中文分词;
采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;
基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电调度故障处理领域不重要的短语;
计算高质量候选短语的质量评分;
基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语。
进一步的,所述命名模块具体用于,
对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;
将语料标注后生成的标注信息转换为BIO标注格式;
对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;
将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型。
进一步的,所述构建模块具体用于,
对命名实体识别后的电网调度故障处理领域专业短语进行实体、实体属性,以及实体与实体、实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体、实体与属性间的关系,形成故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型;所述故障预案子图模型表征故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系;所述运行方式调整发文子图模型表征调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系;所述管辖范围信息子图模型表征设备所属厂站和机构,其中,设备为管辖设备或者许可设备;所述检修单子图模型表征设备所属厂站,设备检修单的停电事件、工作内容和工作时间,以及相互之间的关系;所述风险预警子图模型表征设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析和风控要求,以及相互之间的关系;所述历史故障日志子图模型表征故障设备,故障设备所属厂站与机构,故障事件,故障事件时间,故障后运行方式以及相互之间的关系;
将所述故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型中的厂站、设备实体建立等价映射,融合成多领域融合的电网调度故障处理知识图谱。
本发明的有益效果为:
(1)本发明对电网调度故障处理领域文本语料进行专业短语识别,实现了自动化、流程化地从故障预案、运行方式、调度日志等电网故障处理领域的历史语料以及未来新增的语料中提取领域专业短语,在全自动化的同时,也能保证短语的高质量。
(2)本发明对识别后的电网调度故障处理领域专业短语进行命名实体识别,消除了非结构化数据中因行文、记录习惯差异导致的歧义。
(3)本发明对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱,用于关联分散的结构化与非结构化信息,为值班调度员处置故障提供全面的、以故障和设备为切片的知识图谱断面,实现电网调度故障处理知识的计算机智能自主获取、跨领域分析和全时段学习。
附图说明
图1为本发明电网故障处理领域短语提取与高质量识别流程图;
图2为本发明电网故障处理领域命名实体识别流程图;
图3为本发明实施例中电网故障处理领域命名实体识别语料人工标注格式图;
图4为本发明实施例中电网故障处理领域命名实体识别语料BIO标注格式图;
图5为本发明电网故障处理领域命名实体识别训练模型图;
图6为本发明电网故障处理知识图谱故障预案子图模型图;
图7为本发明电网故障处理知识图谱运行方式调整发文子图模型图;
图8为本发明电网故障处理知识图谱管辖范围信息子图模型图;
图9为本发明电网故障处理知识图谱检修单子图模型图;
图10为本发明电网故障处理知识图谱安全风险预警子图模型图;
图11为本发明电网故障处理知识图谱历史故障日志子图模型图;
图12为本发明电网故障处理知识图谱知识融合模型图。
具体实施方式
下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明实施例一方面提供一种电网调度故障处理知识图谱的构建方法,包括:
步骤一,通过基于N-Gram的监督学习方法与高质量短语精准识别,从故障预案、运行方式、调度日志等结构化和非结构化数据中挖掘高质量的电网调度故障处理领域专业短语;
步骤二,通过基于Albert+BiLSTM的深度学习NER架构,对电网调度故障处理领域专业短语进行命名实体识别;
步骤三,通过基于文本模式的信息抽取,对电网调度故障处理领域专业短语进行实体,实体属性,以及实体与实体、实体与属性间的关系抽取,实现电网调度故障处理领域设备、事件、操作的关系抽取,构建电网运行、设备检修等多领域融合的故障处理知识图谱。
具体的,通过基于N-Gram的监督学习方法与高质量短语精准识别,从故障预案、运行方式、调度日志等结构化和非结构化数据中挖掘高质量的电网调度故障处理领域专业短语,包括:
进行中文分词:将调度规程中的术语表以及用户已定义的厂站、设备、线路名称等数据集作为自定义词典,按照精确模式,将故障预案、运行方式、调度日志等领域语料进行中文分词。
生成候选短语:在中文分词的基础上,使用N-Gram(此处N设定为6)频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语。
计算统计指标特征:计算候选短语的统计指标特征,包括候选短语u的C-value(u)值、NC-value(u)值、PMI值、左邻字熵和右邻字熵。
基于统计特征指标筛选高质量候选短语:包括人工样本标注和分类机器学习。
人工样本标注:将候选短语按照9:1的比例划分训练集和验证集,并人工标注出训练集中高质量的候选短语,形成正负样本。其中,高质量的候选短语是指频次很高,但是对于电调度故障处理领域不是重要的短语。
分类机器学习:针对每一个人工标注样本,采用决策树分类器完成训练、测试与验证,构建短语统计指标的特征向量,后续新增语料可通过分类器自动识别高质量的候选短语。
计算高质量候选短语的质量评分:将高质量候选短语的C-value(u)值、NC-value(u)值、PMI值、左邻字熵和右邻字熵加权求和,得到高质量候选短语的最终质量评分;
F(u)=weight(c-value)*(C-value(u))+weight(nc-value)*(NC-value(u))+weight(pmi)*PMI(u)+weight(HL)*HL(u)+weight(HR)*HR(u)
其中,F(u)为候选短语u的质量评分,C-value(u)、NC-value(u)、PMI(u)、HL(u)、HR(u)分别为候选短语u的C-value(u)值、NC-value(u)值、PMI值、左邻字熵、右邻字熵,weight(c-value)、weight(nc-value)、weight(pmi)、weight(HL)、weight(HR)分别为候选短语u不同统计指标特征值在计算F(u)时的权重值(0<weight<1)。
再次进行语料切割:将高质量候选短语按质量评分从大到小进行排序,取质量评分最大的前N个高质量候选短语序列,对故障预案、运行方式、调度日志等领域经中文分词后的语料进行迭代切割与统计指标特征更新,直至候选短语的最终质量评分收敛。
本发明实施例中,对故障预案、运行方式、调度日志等领域语料进行迭代切割与统计指标更新,包括:
基于前N个高质量候选短语对语料进行重新切割,比如“天目湖变”之前中文分词分为“天目湖”、“变”,但是基于质量评分后发现“天目湖变”的得分最高,所以对原来的语料进重新切割,为“天目湖变”,然后更新候选短语,并重新计算更新后的候选短语的统计指标特征和质量评分。
本发明实施例中,候选短语的最终质量评分收敛是指,最终的候选短语的质量评分不变。一般情况下连续3-4次迭代质量评分不变。
输出专业短语排序:取最终质量评分最大的前N个候选短语排序输出,作为电网故障处理领域中厂站、设备、事件、操作等电网调度故障处理领域高频率、高一致性的专业短语。
具体的,通过基于Albert+BiLSTM的深度学习NER架构,对电网调度故障处理领域专业短语进行命名实体识别,参照图2,包括:
进行人工语料标注,将步骤一获取的电网调度故障处理领域专业短语作为输入数据集开展语料标注,一行一个分词以及对应的标注符号,标注信息如图3所示,word为分词,lable为分词的tag。其中B_S代表厂站、B_D代表设备、B_E代表事件、B_C代表操作。为缩短标注难度,提高标注效率,标注时并未采用BIO标注系统,方便标注人员理解。模型训练前,将现有标注信息通过标注转化转换为BIO标注格式,如图4所示。
数据线下增强:将步骤一获取的电网调度故障处理领域专业短语中的分句进行bigram、trigram拼接,新生成的分句与原始句子一起作为训练语料,增加噪声数据,提升模型的鲁棒性,防止过拟合;对于已标注为厂站、设备、事件和操作的实体,利用收集到的命名实体词典,采用随机替换的方式,用其替换语料中同类型的实体,得到增强语料,增加训练的数据量,提高模型的泛化能力。
电网故障处理领域文本预处理:在数据增强的基础上,为了简化训练词向量和模型训练的过程,需要预处理训练集、验证集和测试集数据,去除空行与句号,统一“#”、“-”等电网故障处理领域常用符号的全半角状态,避免出现“A变电站#1主变、#2主变”的情况,统一字母大小写状态,避免出现“I段、iv段母线”的情况,构建停用词库,去掉“约、将、会、进一步”等对命名实体识别用处不大的词。
构建电网故障处理命名实体识别模型:使用Albert预训练模型,读取预处理后的文本语料,按照9:1的比例划分训练集和验证集,按照图5所示模型结构,Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,其中,最后得到电网调度故障处理领域厂站、设备、事件、操作的NER(命名实体识别)模型。
本步骤中,本发明实施例还包括:
识别同义词与缩略词:在已识别的厂站、设备(包括变压器、开关、母线、线路等)实体中,采用如表1所示的名称缩写文本模式,识别厂站与设备的同义词与缩略词,所有识别实体作为知识图谱构建的实体节点。
表1电网故障处理领域命名实体同义词与缩略词文本模式
具体的,通过基于文本模式的信息抽取,对电网调度故障处理领域短语进行实体,实体属性,以及实体与实体、实体与属性间的关系抽取,实现电网调度故障处理领域厂站、设备、事件、操作的关系抽取,构建电网运行、设备检修等多领域融合的故障处理知识图谱,包括:
图谱场景规划:规划以故障预案为主,运行方式调整发文、管辖范围信息、检修单、风险预警、历史故障日志等信息为辅的电网故障处理知识图谱模型,明确电网故障处理领域语料在图谱中的应用场景。其中,故障预案作为图谱的主干,用于构建图谱中最主要的故障设备、故障类型、故障前后运行方式与故障处置操作;运行方式调整发文用于更新故障预案中相关运行方式的调整;(变电站/电厂/线路)管辖范围信息,用于明确故障处置时操作的对象是否在管辖范围内,是否具备操作权限;检修单用于故障处置时处置对象的历史检修记录与操作的关联查询;风险预警信息用于故障处置时判断当前电网状态是否在风险范围内;历史故障日志用于检索与当前故障相类似的历史故障供调度员参考。
图谱子图模式设计与关系抽取:经过领域短语识别与命名主体识别后的语料已经消除非结构化数据中因调度员个人行文、记录习惯差异导致的知识歧义,形成固有的文本模式。基于文本模式分别抽取各类不同语料的实体、属性,以及实体与实体、实体与属性间的关系信息,形成电网故障处理知识子图。如图6所示为故障预案的子图模型,包含故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系。图7为运行方式调整发文的子图模型,包含调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系。图8为管辖范围信息的子图模型,包含设备所属厂站和机构,其中,设备为管辖设备或者许可设备。图9为检修单的子图模型,包含设备所属厂站,设备检修单的停电事件、工作内容以及工作时间。图10为风险预警的子图模型,包含设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析与风控要求。图11为历史故障日志的子图模型,包含故障设备、故障设备所属厂站与机构、故障事件、故障事件时间、故障后运行方式以及相互之间的关系。
图谱融合:如图12所示,基于已识别的厂站、设备实体,关联故障预案、运行方式调整发文、管辖范围信息、检修单、风险预警、历史故障日志等子图中的厂站、设备实体建立等价映射,融合成电网故障处理总图,并以具体设备故障为切片,形成图谱断面。至此,以故障预案为主,运行方式调整发文、管辖范围信息、检修单、风险预警、历史故障日志等信息为辅的电网故障处理知识图谱构建完成。
本发明实施例另一方面提供一种电网调度故障处理知识图谱的构建装置,包括:
识别模块,用于对电网调度故障处理领域文本语料进行专业短语识别;
命名模块,用于对识别后的电网调度故障处理领域专业短语进行命名实体识别;
以及,
构建模块,用于对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
具体的,所述识别模块具体用于,
将故障预案、运行方式和调度日志的领域语料进行中文分词;
采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;
基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电调度故障处理领域不重要的短语;
计算高质量候选短语的质量评分;
基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语。
具体的,所述命名模块具体用于,
对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;
将语料标注后生成的标注信息转换为BIO标注格式;
对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;
将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型。
具体的,所述构建模块具体用于,
对命名实体识别后的电网调度故障处理领域专业短语进行实体、实体属性,以及实体与实体、实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体、实体与属性间的关系,形成故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型;所述故障预案子图模型表征故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系;所述运行方式调整发文子图模型表征调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系;所述管辖范围信息子图模型表征设备所属厂站和机构,其中,设备为管辖设备或者许可设备;所述检修单子图模型表征设备所属厂站,设备检修单的停电事件、工作内容和工作时间,以及相互之间的关系;所述风险预警子图模型表征设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析和风控要求,以及相互之间的关系;所述历史故障日志子图模型表征故障设备,故障设备所属厂站与机构,故障事件,故障事件时间,故障后运行方式以及相互之间的关系;
将所述故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型中的厂站、设备实体建立等价映射,融合成多领域融合的电网调度故障处理知识图谱。
值得指出的是,该装置实施例是与上述方法实施例对应的,上述方法实施例的实现方式均适用于该装置实施例中,并能达到相同或相似的技术效果,故不在此赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (8)
1.一种电网调度故障处理知识图谱的构建方法,其特征在于,包括:
对电网调度故障处理领域文本语料进行专业短语识别,包括:将故障预案、运行方式和调度日志的领域语料进行中文分词;采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电网调度故障处理领域不重要的短语;计算高质量候选短语的质量评分;基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语;
对识别后的电网调度故障处理领域专业短语进行命名实体识别,包括:对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;将语料标注后生成的标注信息转换为BIO标注格式;对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型;
所述对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理,包括:对电网调度故障处理领域专业短语中的分句进行bigram、trigram拼接,生成新的分句;对于已标注为厂站、设备、事件和操作的实体,利用收集到的命名实体词典,采用随机替换的方式,替换同类型的实体,得到增强语料;对所有语料去除空行与句号,统一符号状态,统一字母大小写,以及去掉无意义的词;
对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
4.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,所述基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语,包括:
将高质量候选短语按质量评分从大到小进行排序,获取质量评分最大的前N个高质量候选短语;
对中文分词后的故障预案、运行方式和调度日志的领域语料基于前N个高质量候选短语进行迭代切割,更新候选短语,并重新计算更新后的候选短语的统计指标特征和质量评分,直至最终的候选短语的质量评分不变,输出最终质量评分最大的前N个候选短语,作为电网调度故障处理领域专业短语。
5.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,还包括:
在已识别的厂站和设备中,基于名称缩写文本模式,识别厂站和设备的同义词与缩略词,共同作为电网调度故障处理知识图谱构建的实体。
6.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,所述对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱,包括:
对命名实体识别后的电网调度故障处理领域专业短语进行实体、实体属性,以及实体与实体、实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体、实体与属性间的关系,形成故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型;所述故障预案子图模型表征故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系;所述运行方式调整发文子图模型表征调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系;所述管辖范围信息子图模型表征设备所属厂站和机构,其中,设备为管辖设备或者许可设备;所述检修单子图模型表征设备所属厂站,设备检修单的停电事件、工作内容和工作时间,以及相互之间的关系;所述风险预警子图模型表征设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析和风控要求,以及相互之间的关系;所述历史故障日志子图模型表征故障设备,故障设备所属厂站与机构,故障事件,故障事件时间,故障后运行方式以及相互之间的关系;
将所述故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型中的厂站、设备实体建立等价映射,融合成多领域融合的电网调度故障处理知识图谱。
7.一种电网调度故障处理知识图谱的构建装置,其特征在于,包括:
识别模块,用于将故障预案、运行方式和调度日志的领域语料进行中文分词;采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电网调度故障处理领域不重要的短语;计算高质量候选短语的质量评分;基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语;
命名模块,用于对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;将语料标注后生成的标注信息转换为BIO标注格式;对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型;所述对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理,为:对电网调度故障处理领域专业短语中的分句进行bigram、trigram拼接,生成新的分句;对于已标注为厂站、设备、事件和操作的实体,利用收集到的命名实体词典,采用随机替换的方式,替换同类型的实体,得到增强语料;对所有语料去除空行与句号,统一符号状态,统一字母大小写,以及去掉无意义的词;
以及,
构建模块,用于对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
8.根据权利要求7所述的一种电网调度故障处理知识图谱的构建装置,其特征在于,所述构建模块具体用于,
对命名实体识别后的电网调度故障处理领域专业短语进行实体、实体属性,以及实体与实体、实体与属性间的关系抽取;
基于实体、实体属性,以及实体与实体、实体与属性间的关系,形成故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型;所述故障预案子图模型表征故障设备、设备所属厂站、故障事件、故障前运行方式、故障后运行方式、故障处置操作以及相互之间的关系;所述运行方式调整发文子图模型表征调整通知相关的设备、调整目的、调整时间、调整后的正常运行方式、检修运行方式、设备的稳定限额以及相互之间的关系;所述管辖范围信息子图模型表征设备所属厂站和机构,其中,设备为管辖设备或者许可设备;所述检修单子图模型表征设备所属厂站,设备检修单的停电事件、工作内容和工作时间,以及相互之间的关系;所述风险预警子图模型表征设备所属厂站,设备风险事件,风险事件的停电事由、运行安全风险分析和风控要求,以及相互之间的关系;所述历史故障日志子图模型表征故障设备,故障设备所属厂站与机构,故障事件,故障事件时间,故障后运行方式以及相互之间的关系;
将所述故障预案子图模型,运行方式调整发文子图模型,管辖范围信息子图模型,检修单子图模型,风险预警子图模型和历史故障日志子图模型中的厂站、设备实体建立等价映射,融合成多领域融合的电网调度故障处理知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010552327.5A CN111860882B (zh) | 2020-06-17 | 2020-06-17 | 一种电网调度故障处理知识图谱的构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010552327.5A CN111860882B (zh) | 2020-06-17 | 2020-06-17 | 一种电网调度故障处理知识图谱的构建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860882A CN111860882A (zh) | 2020-10-30 |
CN111860882B true CN111860882B (zh) | 2022-09-30 |
Family
ID=72986689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010552327.5A Active CN111860882B (zh) | 2020-06-17 | 2020-06-17 | 一种电网调度故障处理知识图谱的构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860882B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112383052B (zh) * | 2020-11-16 | 2021-11-19 | 国网电子商务有限公司 | 基于电力物联网的电网故障修复方法和装置 |
CN112487789B (zh) * | 2020-11-27 | 2023-12-01 | 贵州电网有限责任公司 | 一种基于知识图谱的操作票调度逻辑合法性验证方法 |
CN112685608A (zh) * | 2020-12-30 | 2021-04-20 | 北京科东电力控制系统有限责任公司 | 一种基于cypher的电网调度领域知识属性图模型构建方法 |
CN112883197B (zh) * | 2021-02-08 | 2023-02-07 | 广东电网有限责任公司广州供电局 | 一种用于封闭开关设备的知识图谱构建方法与系统 |
CN112836019B (zh) * | 2021-02-19 | 2023-04-25 | 中国科学院新疆理化技术研究所 | 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质 |
CN112905804B (zh) * | 2021-02-22 | 2022-08-26 | 国网电力科学研究院有限公司 | 一种电网调度知识图谱的动态更新方法及装置 |
CN113326700B (zh) * | 2021-02-26 | 2024-05-14 | 西安理工大学 | 一种基于ALBert的复杂重型装备实体抽取方法 |
CN113094512B (zh) * | 2021-04-08 | 2024-05-24 | 达观数据有限公司 | 一种工业生产制造中故障分析系统及方法 |
CN113360641B (zh) * | 2021-05-07 | 2023-05-30 | 内蒙古电力(集团)有限责任公司乌兰察布电业局 | 一种基于深度学习的电网故障处置预案语义建模系统及方法 |
CN113240289B (zh) * | 2021-05-17 | 2022-07-29 | 国电南瑞南京控制系统有限公司 | 一种电网调度控制系统运行状态评估方法及系统 |
CN113435195B (zh) * | 2021-07-01 | 2023-10-03 | 贵州电网有限责任公司 | 一种基于主变负载特性的缺陷智能诊断模型构建方法 |
CN113987183A (zh) * | 2021-10-29 | 2022-01-28 | 广西电网有限责任公司南宁供电局 | 一种基于数据驱动的电网故障处置预案辅助决策方法 |
CN116452130B (zh) * | 2023-03-17 | 2023-09-05 | 国网山东省电力公司淄博供电公司 | 一种基于知识图谱的变电设备信息管理系统及方法 |
CN116644810B (zh) * | 2023-05-06 | 2024-04-05 | 国网冀北电力有限公司信息通信分公司 | 一种基于知识图谱实现的电网故障风险处置方法及装置 |
CN116774569B (zh) * | 2023-07-25 | 2024-04-05 | 博纯材料股份有限公司 | 基于人工智能的氧氩分离设备运行系统更新方法及系统 |
CN116882494B (zh) * | 2023-09-07 | 2023-11-28 | 山东山大鸥玛软件股份有限公司 | 面向专业文本的无监督知识图构建方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008309A (zh) * | 2019-03-21 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种短语挖掘方法及装置 |
CN110825881A (zh) * | 2019-09-26 | 2020-02-21 | 中国电力科学研究院有限公司 | 一种建立电力知识图谱的方法 |
-
2020
- 2020-06-17 CN CN202010552327.5A patent/CN111860882B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008309A (zh) * | 2019-03-21 | 2019-07-12 | 腾讯科技(深圳)有限公司 | 一种短语挖掘方法及装置 |
CN110825881A (zh) * | 2019-09-26 | 2020-02-21 | 中国电力科学研究院有限公司 | 一种建立电力知识图谱的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111860882A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860882B (zh) | 一种电网调度故障处理知识图谱的构建方法及装置 | |
CN111985653B (zh) | 基于知识图谱的电网故障知识推荐与知识管理系统及方法 | |
CN112905804B (zh) | 一种电网调度知识图谱的动态更新方法及装置 | |
CN110888973B (zh) | 一种监控信息表自动结构化梳理的方法 | |
CN115357726A (zh) | 基于知识图谱的故障处置预案数字化模型建立方法 | |
CN112419096B (zh) | 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法 | |
CN111090730A (zh) | 智能语音调度系统及方法 | |
CN109582963A (zh) | 一种基于极限学习机的档案自动分类方法 | |
CN113095050A (zh) | 一种智能成票方法、系统、设备及存储介质 | |
CN112818008A (zh) | 核电调试故障智能诊断的方法、系统、介质及电子设备 | |
CN112182249A (zh) | 针对航空安全报告的自动分类方法和装置 | |
CN112036179B (zh) | 基于文本分类与语义框架的电力预案信息抽取方法 | |
CN117390198A (zh) | 构建电力领域科技知识图谱的方法、装置、设备及介质 | |
CN113378024A (zh) | 一种基于深度学习面向公检法领域的相关事件识别方法 | |
CN112000708A (zh) | 一种基于调控配用数据融合的异常数据处理方法及系统 | |
CN116523042A (zh) | 一种电网调度实体关系联合抽取方法及系统 | |
CN115563968A (zh) | 水电运检知识自然语言人工智能系统及方法 | |
CN115544235A (zh) | 一种基于文本解析的电网规划智能问答系统 | |
CN115619117A (zh) | 基于值班系统的电网智能调度方法 | |
CN114298819A (zh) | 一种企业信用风险预测方法 | |
CN113360680A (zh) | 一种基于电力审计制度的无监督知识图谱构建方法 | |
Zhang et al. | Research on knowledge graph construction for intelligent operation and maintenance of electrical transformers | |
Zheng et al. | A CNN-Based Warning Information Preprocessing Method for Power Grid Fault Diagnosis Analytical Model | |
CN111553158A (zh) | 一种基于BiLSTM-CRF模型的电力调度领域命名实体识别方法及系统 | |
Gao et al. | Research on power entity recognition technology base on BiLSTM-CRF |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |