CN113657437B - 一种电网检修告警确认方法及系统 - Google Patents

一种电网检修告警确认方法及系统 Download PDF

Info

Publication number
CN113657437B
CN113657437B CN202110772602.9A CN202110772602A CN113657437B CN 113657437 B CN113657437 B CN 113657437B CN 202110772602 A CN202110772602 A CN 202110772602A CN 113657437 B CN113657437 B CN 113657437B
Authority
CN
China
Prior art keywords
circuit
overhaul
feature
words
power grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110772602.9A
Other languages
English (en)
Other versions
CN113657437A (zh
Inventor
杨志敏
洪丹轲
黄强
贺云
冯晓芳
谢俊毅
陈一童
吴桂龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202110772602.9A priority Critical patent/CN113657437B/zh
Publication of CN113657437A publication Critical patent/CN113657437A/zh
Application granted granted Critical
Publication of CN113657437B publication Critical patent/CN113657437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种电网检修告警确认方法及系统,包括:获取电网检修数据集合;将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。本发明通过运用大数据及人工智能分析,结合电网通信调度相关业务专业知识,对通信运行检修与资源管理系统电路进行智能化分析,实现检修单据与电路自动关联,提升通信运行和管理工作的智能化水平。

Description

一种电网检修告警确认方法及系统
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种电网检修告警确认方法及系统。
背景技术
现有的电网检修工作中,需要获取现网大量的检修单数据,然后由人工完成检修单核对和匹配工作。
由于现网大多采用的人工作业,容易出现检修单与告警关联确认处理不及时、检修告警确认需人工操作以及关联准确率不高等问题;同时存在检修工作量巨大,容易出现匹配错误以及效率低下的问题。
因此需要提出新的针对上述问题的电网检修告警确认方法。
发明内容
本发明提供一种电网检修告警确认方法及系统,用以解决现有技术中存在的缺陷。
第一方面,本发明提供一种电网检修告警确认方法,包括:
获取电网检修数据集合;
将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
在一个实施例中,所述电路多分类识别模型,通过以下步骤获得:
获取所述电网输入样本集合;
基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果;
基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合;
将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征;
基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型。
在一个实施例中,所述获取所述电网输入样本集合,具体包括:
分别获取检修数据、电路数据、告警数据和电话录音;
所述检修数据为运行控制模块检修工单数据,所述运行控制模块检修工单数据包括检修影响范围、批复编号、许可开工时间、受令人信息和受令时间信息;
所述电路数据为资源管理模块电路数据信息,所述资源管理模块电路数据信息包括电路名称、电路编号和端口信息;
所述告警数据为综合监视模块告警数据,所述综合监视模块告警数据包括告警描述、告警类型、告警时间和告警设备;
所述电话录音包括通话双方姓名、通话开始结束时间、检修票编号和检修工作内容。
在一个实施例中,所述基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果,具体包括:
获取检修单文本和线路列表文本;
分别对所述检修单文本和所述线路列表文本进行分词操作,得到第一词典集合和第二词典集合,从所述第一词典集合中减去所述第二词典集合,获得停词集合;
根据所述线路列表文本构建第三词典集合;
确定分句关键字符,通过正则表达式模式匹配所述分句关键字符获得连续合法字符串,生成初步分句结果;
基于所述停词集合筛选所述初步分句结果,舍弃其中存在停词的所有分句;
基于所述第三词典集合进行有效词频分析,统计分句中的各个字是否存在于所述第三词典中,并采用存在字个数除以分句长度获得有效词频,舍弃所述有效词频小于预设阈值的无效句,得到电路识别输入数据;
将所述电路识别输入数据的电路分句样本向量化,基于word2vec提取每个分词的向量编码,经过预处理得到任一分句中任一分词的编码向量,基于所述编码向量长度集合所有编码向量得到电路识别输入矩阵,将所述电路识别输入矩阵输入至预设卷积网络模型中,计算得到识别电路标号。
在一个实施例中,所述基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合,具体包括:
获取检修单中所包含的电路表,计算所述电路表中电路和告警信息所含电路的重合度,获得电路关联度;
统计同时出现在所述检修单与所述告警信息中的字个数,获取检修单字数与告警信息字数的字数较小值,由所述字个数除以所述字数较小值得到字的重合度特征;
对所述检修单和所述告警信息分别进行分词,获得检修单分词个数和告警信息分词个数,统计所述检修单分词个数和所述告警信息分词个数的共同分词个数,基于所述共同分词个数以及所述检修单分词个数和所述告警信息分词个数的最小值,获得词的重合度特征;
基于Text-Matching网络计算得到所述检修单与所述告警信息的整体匹配程度特征;
将所述检修电话录音转换为检修电话录音文本,基于所述Text-Matching网络匹配任一检修单对应的所述检修电话录音文本,获得检修下令时间,计算所述检修下令时间与告警发生时间的第一差值,并对所述第一差值进行归一化处理,获得下令时间特征;
计算检修许可开工时间与所述告警发生时间的第二差值,并对所述第二差值进行归一化处理,获得许可开工时间特征;
对所述电路关联度、所述字的重合度特征、所述词的重合度特征、所述整体匹配程度特征、所述下令时间特征和所述许可开工时间特征所构成的原特征进行非线性映射,分别得到平方特征和指数特征;
将所述原特征与所述平方特征和所述指数特征进行拼接,得到整体特征,基于逻辑回归函数对所述整体特征进行处理,输出所述电路提取特征集合。
在一个实施例中,所述将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征,具体包括:
构建包含若干样本的训练数据集,所述训练数据集包括所述整体特征中的任一样本特征以及任一样本的标签;
基于所述训练数据集训练二分类逻辑回归分类器,得到所述融合电路识别特征。
在一个实施例中,所述基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型,具体包括:
针对任一给定测试样本和所述整体特征,采用所述预设逻辑回归判别式进行判定,输出所述检修单和所述告警信息的关联程度,获得所述电路多分类识别模型。
第二方面,本发明还提供一种电网检修告警确认系统,包括:
获取模块,用于获取电网检修数据集合;
处理模块,用于将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述电网检修告警确认方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述电网检修告警确认方法的步骤。
本发明提供的电网检修告警确认方法及系统,通过运用大数据及人工智能分析,结合电网通信调度相关业务专业知识,对通信运行检修与资源管理系统电路进行智能化分析,实现检修单据与电路自动关联,提升通信运行和管理工作的智能化水平。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的电网检修告警确认方法的流程示意图;
图2是本发明提供的分析模型示意图;
图3是本发明提供的数据预处理示意图;
图4是本发明提供的用于电路分句识别的卷积网络模型示意图;
图5是本发明提供的特征融合与关联度分析示意图;
图6是本发明提供的检修单与告警关联案例示意图:
图7是本发明提供的检修告警确认图例示意图;
图8是本发明提供的电网检修告警确认装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有技术存在的不足,为实现更加规范、高效和智能的通信运行管控,建设智能化运行管控系统,运用大数据及人工智能分析,结合电网通信调度相关业务专业知识,对通信运行检修与资源管理系统电路进行智能化分析,实现检修单据与电路自动关联,提升通信运行和管理工作的智能化水平,本发明提出一种电网检修告警确认方法,如图1所示,包括:
S1,获取电网检修数据集合;
S2,将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
具体地,在获得电网多个场景下的检修数据集合后,将该检修数据集合输入至本发明构建的电路多分类识别模型中,得到电路信息的识别结果,其中该电路多分类识别模型是基于对电网输入样本集合的一系列AI处理,包括数据预处理、特征提取、特征融合和结果判决的处理所得到的。
本发明通过运用大数据及人工智能分析,结合电网通信调度相关业务专业知识,对通信运行检修与资源管理系统电路进行智能化分析,实现检修单据与电路自动关联,提升通信运行和管理工作的智能化水平。
基于上述实施例,所述电路多分类识别模型,通过以下步骤获得:
获取所述电网输入样本集合;
基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果;
基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合;
将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征;
基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型。
具体地,如图2所示,本发明所提出的电路多分类识别模型,采用如下步骤所构建:
首先是获取多个电网告警数据所组成的电网输入样本集合,基于分词文本信息对电网输入样本集合进行数据预处理,得到数据预处理结果,再将得到的数据预处理结果与其它电路相关信息进行特征提取,即得到电路提取特征集合,进一步将该电路提取特征集合中的多个特征进行特征融合,获得融合电路识别特征,将其中的多个特征进行特征融合处理,便得到融合的电路识别特征,最后根据预设逻辑回归判别式对融合电路识别特征进行结果判决,得到最终的电路多分类识别模型。
本发明通过训练得到的电路多分类识别模型,解决了通信运行管控检修单与告警关联确认处理不及时、检修告警确认需人工操作、关联准确率不高等问题,提高通信工作人员的工作效率以及提升通信运维工作质量。
基于上述任一实施例,所述获取所述电网输入样本集合,具体包括:
分别获取检修数据、电路数据、告警数据和电话录音;
所述检修数据为运行控制模块检修工单数据,所述运行控制模块检修工单数据包括检修影响范围、批复编号、许可开工时间、受令人信息和受令时间信息;
所述电路数据为资源管理模块电路数据信息,所述资源管理模块电路数据信息包括电路名称、电路编号和端口信息;
所述告警数据为综合监视模块告警数据,所述综合监视模块告警数据包括告警描述、告警类型、告警时间和告警设备;
所述电话录音包括通话双方姓名、通话开始结束时间、检修票编号和检修工作内容。
具体地,本发明所采用的获取电网输入样本集合包括如下几个方面:
1)检修数据:包括运行控制模块检修工单数据,检修工单数据包含检修影响范围、批复编号、许可开工时间、受令人、受令时间等信息。其中检修影响范围中包含受影响的资源电路名称;
2)电路数据:包括资源管理模块电路数据信息,包括电路名称、电路编号、端口等信息;
3)告警数据:综合监视模块告警数据,包含告警描述、告警类型、告警时间、告警设备等信息;
4)电话录音:检修单申请开工时,由实施单位通过电话进行申请,电话内容将会录音保存作为检修单开工凭证,录音内容包括双方姓名,通话开始结束时间,对应的检修票编号、工作内容。
本发明通过获取多个维度的电网检修数据,能全面覆盖多种检修场景,较为全面的提供了各场景的告警处理机制处理方法。
基于上述任一实施例,所述基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果,具体包括:
获取检修单文本和线路列表文本;
分别对所述检修单文本和所述线路列表文本进行分词操作,得到第一词典集合和第二词典集合,从所述第一词典集合中减去所述第二词典集合,获得停词集合;
根据所述线路列表文本构建第三词典集合;
确定分句关键字符,通过正则表达式模式匹配所述分句关键字符获得连续合法字符串,生成初步分句结果;
基于所述停词集合筛选所述初步分句结果,舍弃其中存在停词的所有分句;
基于所述第三词典集合进行有效词频分析,统计分句中的各个字是否存在于所述第三词典中,并采用存在字个数除以分句长度获得有效词频,舍弃所述有效词频小于预设阈值的无效句,得到电路识别输入数据;
将所述电路识别输入数据的电路分句样本向量化,基于word2vec提取每个分词的向量编码,经过预处理得到任一分句中任一分词的编码向量,基于所述编码向量长度集合所有编码向量得到电路识别输入矩阵,将所述电路识别输入矩阵输入至预设卷积网络模型中,计算得到识别电路标号。
具体地,如图3所示,本发明所提供的的数据预处理流程具体如下:
1)对检修单文本和线路列表文本分别进行分词操作,得到各自的第一词典集合,记作词典集合A,以及第一词典集合,记作词典集合B,从集合A中减去集合B,从而获得停词集合C,即所有在检修单中而不在线路信息列表中的词的集合;
2)根据线路列表文本构建字典D,即第三词典集合,该字典D包含线路列表中所有不重复的单字符;
3)进一步定义分句关键字符,并通过正则表达式模式匹配来获得连续的合法字符串,从而生成初步分句结果;
4)使用集合C筛选分句:若某一分句中存在停词,则视为无效句,将其舍弃;
5)利用字典D进行有效词频分析:统计分句中各个“字”是否存在于D中,并利用“存在字个数E”除以“分句长度L”获得有效词频若ρ≤0.9则视为无效句,舍弃,再将保留下来的分句作为电路识别模块的输入数据;
6)最后进行电路识别:
首先将电路分句样本向量化,运用word2vec提取每个分词的向量编码。设预处理得到的一个分句中包含n个分词,其中第i个分词的编码向量记为这里l表示编码向量的长度,则该分句的编码向量记为:
上式中的Φ表示一个n行l列的矩阵,将该矩阵输入到图4所示的卷积网络模型中,经过计算获得识别电路的标号。该卷积网络模型构架如图4所示,其核心模块描述如下:
1)卷积核与激活函数:采用1000组大小分别为2×l、3×l、4×l的卷积核,每组均包含20个独立的卷积核。一般来讲,对于任意卷积核在输入编码矩阵Φ上做从上到下的滑动窗口操作。设第i次滑动窗口后,卷积核所覆盖的编码矩阵内容为Φi:i+a-1,即Φ矩阵的第i行至第i+a-1行,则对应的卷积操作可表示为:
ci=ReLU(wTΦi:i+a-1+b1), (2)
上式中b1表示该卷积核的偏置量参数,ReLU表示神经网络中常用的线性整流函数,表示卷积操作的结果。每次滑动窗口操作均会执行上述卷积操作,滑动窗口结束时,输出特征图:
c=[c1,c2,...,cn-a+1]. (3)
2)最大池化与等长特征提取:不同电路的字符串长度可能是不等的,为获得统一长度的特征图,需对步骤卷积操作输出的特征图执行最大池化操作:比较c中所有元素即c1,c2,...的大小,并输出最大值,对每个卷积核所输出的特征图执行最大池化,然后把同一组卷积核的最大池化输出结果拼接成长度为20的特征向量,最后把1000组卷积核所拼接的特征向量整体拼接起来,获得一个长度为20000的特征向量
3)分类结果计算:首先计算分数向量:
s=vTΨ+b2. (4)
上式中为网络全连接层的参数,b2表示该层的偏置量参数,为一个长度为K的分数向量,K表示标准电路的个数。最终分类结果取s中分数最高的元素的下标。
本发明通过数据预处理,能够把电路分析问题转换成多分类问题,进而采用机器学习算法训练多分类模型,从而实现准确的电路信息识别。
基于上述任一实施例,所述基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合,具体包括:
获取检修单中所包含的电路表,计算所述电路表中电路和告警信息所含电路的重合度,获得电路关联度;
统计同时出现在所述检修单与所述告警信息中的字个数,获取检修单字数与告警信息字数的字数较小值,由所述字个数除以所述字数较小值得到字的重合度特征;
对所述检修单和所述告警信息分别进行分词,获得检修单分词个数和告警信息分词个数,统计所述检修单分词个数和所述告警信息分词个数的共同分词个数,基于所述共同分词个数以及所述检修单分词个数和所述告警信息分词个数的最小值,获得词的重合度特征;
基于Text-Matching网络计算得到所述检修单与所述告警信息的整体匹配程度特征;
将所述检修电话录音转换为检修电话录音文本,基于所述Text-Matching网络匹配任一检修单对应的所述检修电话录音文本,获得检修下令时间,计算所述检修下令时间与告警发生时间的第一差值,并对所述第一差值进行归一化处理,获得下令时间特征;
计算检修许可开工时间与所述告警发生时间的第二差值,并对所述第二差值进行归一化处理,获得许可开工时间特征;
对所述电路关联度、所述字的重合度特征、所述词的重合度特征、所述整体匹配程度特征、所述下令时间特征和所述许可开工时间特征所构成的原特征进行非线性映射,分别得到平方特征和指数特征;
将所述原特征与所述平方特征和所述指数特征进行拼接,得到整体特征,基于逻辑回归函数对所述整体特征进行处理,输出所述电路提取特征集合。
具体地,本发明所提出的基于数据预处理结果和其它相关信息提取多种特征具体为:
1)电路关联度:运用图4所示的卷积网络模型,获得检修单中所含电路表,并计算电路表中电路和告警信息所含电路的重合度,记为α;
2)字的重合度特征:统计同时出现在检修单与告警信息中字的个数,记为c,记检修单字数与告警信息字数的较小值为s,则字的重合度特征为
3)词的重合度特征:对检修单和告警信息分别进行分词,它们的分词个数分别记作Ni和Nw,并统计二者的共同分词,个数记为Nc,则词的重合度特征为这里min表示取最小值;
4)整体匹配度特征:基于Text-Matching网络计算检修单与告警信息的整体匹配程度,记为η;
5)下令时间特征:利用音频转文本工具将检修电话录音转换为文本。针对某个检修单,利用Text-Matching网络匹配该检修单对应的检修电话录音文本,从而获得检修下令时间,计算检修下令时间与告警发生时间的差值,并进行归一化处理,结果记为t1
6)许可开工时间特征:计算检修许可开工时间与告警发生时间的差值,并进行归一化处理,结果记为t2
7)得到的平方特征为:
8)得到的指数特征为:
Q=[exp(-α),exp(-β),exp(-γ),exp(-η),exp(-δ),exp(-t2),exp(-t1)];
如图5所示,将各个特征进行非线性映射(平方和指数运算);然后将输出特征与原特征进行拼接,获得整体特征u;最后利用逻辑回归函数对整体特征进行处理,并输出检修单与告警信息的关联度。
该统一特征向量为:
u=[α,β,γ,η,S,Q]. (5)
本发明通过进行特征提取,能更准确地提高电力通信智能分析工具的易用性,还提升了电力通信网数据分析工作的稳定性和准确性。
基于上述任一实施例,所述将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征,具体包括:
构建包含若干样本的训练数据集,所述训练数据集包括所述整体特征中的任一样本特征以及任一样本的标签;
基于所述训练数据集训练二分类逻辑回归分类器,得到所述融合电路识别特征。
具体地,在构建的统一特征向量基础上,构建包含N个样本的训练数据集这里u(i)表示第i个样本的特征,y(i)∈{0,1}表示第i个样本的标签,y(i)=1表示检修单和告警信息相关,而y(i)=0表示检修单和告警信息无关,基于该数据集训练一个二分类的逻辑回归分类器:
上式,g表示需要从训练数据学习的模型参数,λ是一个常数,在训练时采用机器学习中常用的交叉验证方法确定。最优化问题公式(5)是一个凸优化问题,采用机器学习领域常用的随机梯度下降算法求解最优参数g*
基于上述任一实施例,所述基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型,具体包括:
针对任一给定测试样本和所述整体特征,采用所述预设逻辑回归判别式进行判定,输出所述检修单和所述告警信息的关联程度,获得所述电路多分类识别模型。
需要说明的是,如图5所示,针对任一给定测试样本及其特征向量u,采用如下逻辑回归判别式:
在上式中,P(u)∈[0,1]表示计算输出的检修单和告警信息的关联程度。
基于上述任一实施例,下面结合具体的实施例来说明本发明所提出的方法的有效性。
具体地,如图6所示,初步分句结果包含较多无关句子,而依据本专利所定义的停词进行过滤,能够消除无关分句。进一步采用有效词频阈值ρ进行过滤,获得如图6左下所示的纯净电路文字,再将预处理模块输出的所有分句批量输入到所训练的TextCNN网络中,最终识别出每个分句对应的标准电路;然后,利用本发明所述方法提取检修单和告警信息的多种特征并融合,获得关联分析模型所需的特征向量u;最后,计算关联度P(u)=0.74来表示图6中的检修单和告警信息的关联程度为74%>>50%,因此可以做出判断:相关告警是由检修引起的。
其中,图6中红色文字表示检修单中的不标准或冗余部分,绿色文字表示利用TextCNN模型修正后的结果。基于电路识别结果和告警信息提取多种特征并融合,再利用训练好的逻辑回归分类器(参数是g*)输出检修单与告警的关联程度(0.74)。
进一步地,根据图6检修单与告警的关联程度分析结果,对历史存量数据进行分析关联,输出如图7所示的分析结果图。
本实施例输入检修单11704条、告警287663条、电路数6456条、电话录音12596个;提取有效电路数123993条,识别标准电路数115963条,检修关联电路准确率达93%;检修告警确认数274987条,检修告警AI确认率达95%。
根据目前需运维人员每天手工确认和关联的检修告警数为30条左右,应用本发明后检修告警AI自动确认准确率达95%以上,大幅减少通信运维人员的工作量,提高交接班效率,降低值班工作强度。
另外,本发明提出的检修告警AI机制确认结合半监督学习策略不断扩充数据库规模,凝聚了电网电路智能化分析的数据核心竞争力。
下面对本发明提供的电网检修告警确认装置进行描述,下文描述的电网检修告警确认装置与上文描述的电网检修告警确认方法可相互对应参照。
图8是本发明提供的电网检修告警确认装置的结构示意图,如图8所示,包括:获取模块81和处理模块82;其中:
获取模块81用于获取电网检修数据集合;处理模块82用于将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
本发明通过运用大数据及人工智能分析,结合电网通信调度相关业务专业知识,对通信运行检修与资源管理系统电路进行智能化分析,实现检修单据与电路自动关联,提升通信运行和管理工作的智能化水平。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、电接口(CommunicationsInterface)920、存储器(memory)930和电总线940,其中,处理器910,电接口920,存储器930通过电总线940完成相互间的电。处理器910可以调用存储器930中的逻辑指令,以执行电网检修告警确认方法,该方法包括:获取电网检修数据集合;将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的电网检修告警确认方法,该方法包括:获取电网检修数据集合;将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的电网检修告警确认方法,该方法包括:获取电网检修数据集合;将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种电网检修告警确认方法,其特征在于,包括:
获取电网检修数据集合;
将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的;
所述电路多分类识别模型,通过以下步骤获得:
获取所述电网输入样本集合;
基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果;
基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合;
将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征;
基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型;
获取检修单中所包含的电路表,计算所述电路表中电路和告警信息所含电路的重合度,获得电路关联度;
统计同时出现在所述检修单与所述告警信息中的字个数,获取检修单字数与告警信息字数的字数较小值,由所述字个数除以所述字数较小值得到字的重合度特征;
对所述检修单和所述告警信息分别进行分词,获得检修单分词个数和告警信息分词个数,统计所述检修单分词个数和所述告警信息分词个数的共同分词个数,基于所述共同分词个数以及所述检修单分词个数和所述告警信息分词个数的最小值,获得词的重合度特征;
基于Text-Matching网络计算得到所述检修单与所述告警信息的整体匹配程度特征;
将检修电话录音转换为检修电话录音文本,基于所述Text-Matching网络匹配任一检修单对应的所述检修电话录音文本,获得检修下令时间,计算所述检修下令时间与告警发生时间的第一差值,并对所述第一差值进行归一化处理,获得下令时间特征;
计算检修许可开工时间与所述告警发生时间的第二差值,并对所述第二差值进行归一化处理,获得许可开工时间特征;
基于数据预处理结果和其它相关信息提取多种特征包括电路关联度、字的重合度特征、词的重合度特征、整体匹配程度特征、下令时间特征和许可开工时间特征构成的原特征,对原特征进行非线性映射,将输出特征与原特征进行拼接,获得整体特征,利用逻辑回归函数对整体特征进行处理,得到电路提取特征集合。
2.根据权利要求1所述的电网检修告警确认方法,其特征在于,所述获取所述电网输入样本集合,具体包括:
分别获取检修数据、电路数据、告警数据和电话录音;
所述检修数据为运行控制模块检修工单数据,所述运行控制模块检修工单数据包括检修影响范围、批复编号、许可开工时间、受令人信息和受令时间信息;
所述电路数据为资源管理模块电路数据信息,所述资源管理模块电路数据信息包括电路名称、电路编号和端口信息;
所述告警数据为综合监视模块告警数据,所述综合监视模块告警数据包括告警描述、告警类型、告警时间和告警设备;
所述电话录音包括通话双方姓名、通话开始结束时间、检修票编号和检修工作内容。
3.根据权利要求1所述的电网检修告警确认方法,其特征在于,所述基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果,具体包括:
获取检修单文本和线路列表文本;
分别对所述检修单文本和所述线路列表文本进行分词操作,得到第一词典集合和第二词典集合,从所述第一词典集合中减去所述第二词典集合,获得停词集合;
根据所述线路列表文本构建第三词典集合;
确定分句关键字符,通过正则表达式模式匹配所述分句关键字符获得连续合法字符串,生成初步分句结果;
基于所述停词集合筛选所述初步分句结果,舍弃其中存在停词的所有分句;
基于所述第三词典集合进行有效词频分析,统计分句中的各个字是否存在于所述第三词典集合中,并采用存在字个数除以分句长度获得有效词频,舍弃所述有效词频小于预设阈值的无效句,得到电路识别输入数据;
将所述电路识别输入数据的电路分句样本向量化,基于word2vec提取每个分词的向量编码,经过预处理得到任一分句中任一分词的编码向量,基于所述编码向量长度集合所有编码向量得到电路识别输入矩阵,将所述电路识别输入矩阵输入至预设卷积网络模型中,计算得到识别电路标号。
4.根据权利要求1所述的电网检修告警确认方法,其特征在于,所述基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合,具体包括:
对所述电路关联度、所述字的重合度特征、所述词的重合度特征、所述整体匹配程度特征、所述下令时间特征和所述许可开工时间特征所构成的原特征进行非线性映射,分别得到平方特征和指数特征;
将所述原特征与所述平方特征和所述指数特征进行拼接,得到整体特征,基于逻辑回归函数对所述整体特征进行处理,输出所述电路提取特征集合。
5.根据权利要求4所述的电网检修告警确认方法,其特征在于,所述将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征,具体包括:
构建包含若干样本的训练数据集,所述训练数据集包括所述整体特征中的任一样本特征以及任一样本的标签;
基于所述训练数据集训练二分类逻辑回归分类器,得到所述融合电路识别特征。
6.根据权利要求4所述的电网检修告警确认方法,其特征在于,所述基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型,具体包括:
针对任一给定测试样本和所述整体特征,采用所述预设逻辑回归判别式进行判定,输出所述检修单和所述告警信息的关联程度,获得所述电路多分类识别模型。
7.一种电网检修告警确认系统,其特征在于,包括:
获取模块,用于获取电网检修数据集合;
处理模块,用于将所述电网检修数据集合输入至预先训练好的电路多分类识别模型,得到电路信息识别结果;其中所述电路多分类识别模型是基于电网输入样本集合进行数据预处理,结合特征提取以及特征融合之后进行结果判决所得到的;
所述电路多分类识别模型,通过以下步骤获得:
获取所述电网输入样本集合;
基于分词文本信息对所述电网输入样本集合进行数据预处理,得到数据预处理结果;
基于所述数据预处理结果和其它电路相关信息进行特征提取,得到电路提取特征集合;
将所述电路提取特征集合中的多个特征进行特征融合,得到融合电路识别特征;
基于预设逻辑回归判别式对所述融合电路识别特征进行结果判决,得到所述电路多分类识别模型;
获取检修单中所包含的电路表,计算所述电路表中电路和告警信息所含电路的重合度,获得电路关联度;
统计同时出现在所述检修单与所述告警信息中的字个数,获取检修单字数与告警信息字数的字数较小值,由所述字个数除以所述字数较小值得到字的重合度特征;
对所述检修单和所述告警信息分别进行分词,获得检修单分词个数和告警信息分词个数,统计所述检修单分词个数和所述告警信息分词个数的共同分词个数,基于所述共同分词个数以及所述检修单分词个数和所述告警信息分词个数的最小值,获得词的重合度特征;
基于Text-Matching网络计算得到所述检修单与所述告警信息的整体匹配程度特征;
将检修电话录音转换为检修电话录音文本,基于所述Text-Matching网络匹配任一检修单对应的所述检修电话录音文本,获得检修下令时间,计算所述检修下令时间与告警发生时间的第一差值,并对所述第一差值进行归一化处理,获得下令时间特征;
计算检修许可开工时间与所述告警发生时间的第二差值,并对所述第二差值进行归一化处理,获得许可开工时间特征;
基于数据预处理结果和其它相关信息提取多种特征包括电路关联度、字的重合度特征、词的重合度特征、整体匹配程度特征、下令时间特征和许可开工时间特征构成的原特征,对原特征进行非线性映射,将输出特征与原特征进行拼接,获得整体特征,利用逻辑回归函数对整体特征进行处理,得到电路提取特征集合。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述电网检修告警确认方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述电网检修告警确认方法的步骤。
CN202110772602.9A 2021-07-08 2021-07-08 一种电网检修告警确认方法及系统 Active CN113657437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110772602.9A CN113657437B (zh) 2021-07-08 2021-07-08 一种电网检修告警确认方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110772602.9A CN113657437B (zh) 2021-07-08 2021-07-08 一种电网检修告警确认方法及系统

Publications (2)

Publication Number Publication Date
CN113657437A CN113657437A (zh) 2021-11-16
CN113657437B true CN113657437B (zh) 2024-04-19

Family

ID=78489220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110772602.9A Active CN113657437B (zh) 2021-07-08 2021-07-08 一种电网检修告警确认方法及系统

Country Status (1)

Country Link
CN (1) CN113657437B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115314362B (zh) * 2022-08-08 2023-11-03 中国南方电网有限责任公司 一种基于遥测网络的远端调度终端故障检测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107730117A (zh) * 2017-10-17 2018-02-23 中国电力科学研究院 一种基于异质数据综合分析的电缆检修预警方法及系统
CN108074021A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种配电网风险辨识系统及方法
CN108830457A (zh) * 2018-05-14 2018-11-16 国网辽宁省电力有限公司 基于人工智能的电网运行监视与控制全景管理系统
CN110263172A (zh) * 2019-06-26 2019-09-20 国网江苏省电力有限公司南京供电分公司 一种电网监控告警信息事件化自主识别方法
CN110942163A (zh) * 2019-12-23 2020-03-31 国网湖北省电力公司咸宁供电公司 一种基于大数据的智能检修方法和系统
CN112732934A (zh) * 2021-01-11 2021-04-30 国网山东省电力公司电力科学研究院 电网设备分词词典和故障案例库构建方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108074021A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种配电网风险辨识系统及方法
CN107730117A (zh) * 2017-10-17 2018-02-23 中国电力科学研究院 一种基于异质数据综合分析的电缆检修预警方法及系统
CN108830457A (zh) * 2018-05-14 2018-11-16 国网辽宁省电力有限公司 基于人工智能的电网运行监视与控制全景管理系统
CN110263172A (zh) * 2019-06-26 2019-09-20 国网江苏省电力有限公司南京供电分公司 一种电网监控告警信息事件化自主识别方法
CN110942163A (zh) * 2019-12-23 2020-03-31 国网湖北省电力公司咸宁供电公司 一种基于大数据的智能检修方法和系统
CN112732934A (zh) * 2021-01-11 2021-04-30 国网山东省电力公司电力科学研究院 电网设备分词词典和故障案例库构建方法

Also Published As

Publication number Publication date
CN113657437A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
CN110826320A (zh) 一种基于文本识别的敏感数据发现方法及系统
CN111274814B (zh) 一种新型的半监督文本实体信息抽取方法
CN113591866B (zh) 基于db与crnn的特种作业证件检测方法及系统
CN110704616B (zh) 设备告警工单识别方法及装置
CN113869052B (zh) 基于ai的房屋地址匹配方法、存储介质及设备
CN113657437B (zh) 一种电网检修告警确认方法及系统
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN117115581A (zh) 一种基于多模态深度学习的智能误操作预警方法及系统
CN114997169A (zh) 一种实体词识别方法、装置、电子设备及可读存储介质
CN112307130A (zh) 一种文档级远程监督关系抽取方法及系统
CN111882034A (zh) 神经网络处理及人脸识别方法、装置、设备和存储介质
CN114357171A (zh) 一种应急事件处理方法、装置、存储介质及电子设备
CN116383742B (zh) 基于特征分类的规则链设置处理方法、系统及介质
CN115357718B (zh) 主题集成服务重复材料发现方法、系统、设备和存储介质
CN110414229B (zh) 操作命令检测方法、装置、计算机设备及存储介质
CN109960707B (zh) 一种基于人工智能的高校招生数据采集方法及系统
CN113824580A (zh) 一种网络指标预警方法及系统
CN111507850A (zh) 核保方法及相关装置、设备
CN116226747A (zh) 数据分类模型的训练方法、数据分类方法和电子设备
CN115482075A (zh) 财务数据的异常分析方法、装置、电子设备及存储介质
CN112732865B (zh) 一种刑事案件情节对刑期影响比例的测算方法及装置
CN114611399A (zh) 一种基于NGBoost算法的PM2.5浓度长时间序列预测方法
CN113094567A (zh) 一种基于文本聚类的恶意投诉识别方法及系统
CN110569277A (zh) 一种配置数据信息自动识别与归类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant