CN115098687A - 面向电力sdh光传输系统调度运行的告警排查方法及装置 - Google Patents

面向电力sdh光传输系统调度运行的告警排查方法及装置 Download PDF

Info

Publication number
CN115098687A
CN115098687A CN202210843969.XA CN202210843969A CN115098687A CN 115098687 A CN115098687 A CN 115098687A CN 202210843969 A CN202210843969 A CN 202210843969A CN 115098687 A CN115098687 A CN 115098687A
Authority
CN
China
Prior art keywords
alarm
entity
target
entities
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210843969.XA
Other languages
English (en)
Inventor
高德荃
刘广旭
张媛
赵子岩
冯宝
陈亮
卞宇翔
黄俊桦
完颜绍澎
曹津平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
NARI Group Corp
Original Assignee
State Grid Information and Telecommunication Co Ltd
NARI Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd, NARI Group Corp filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN202210843969.XA priority Critical patent/CN115098687A/zh
Publication of CN115098687A publication Critical patent/CN115098687A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Water Supply & Treatment (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种面向电力SDH光传输系统调度运行的告警排查方法及装置,首先构建电力SDH光传输系统调度运行所对应的知识图谱,并将该知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组;进而对于电力SDH光传输系统实时运行中所输出的告警文本,可以对该告警文本进行实体识别得到目标告警实体以及该目标告警实体的特征向量;进一步,由于实体向量组包含每个三元组中作为头实体的告警实体的特征向量,因此通过对目标告警实体的特征向量与实体向量组中各告警实体的特征向量分别进行相似度计算,可以将相似度最高的告警实体作为所述目标告警实体的链接实体,最后输出所述链接实体的关联信息。

Description

面向电力SDH光传输系统调度运行的告警排查方法及装置
技术领域
本发明涉及电力通信技术领域,涉及一种告警排查方法、装置、电子设备及存储介质,更具体地说,涉及一种面向电力SDH光传输系统调度运行的告警排查方法、装置。
背景技术
目前,电力通信骨干传输网广泛采用SDH(Synchronous Digital Hierarchy,同步数字体系)、OTN(Optical Transport Network,光传送网)等技术,其中电网生产控制类业务主要是由SDH光传输系统承载。一般情况下,光传输系统告警发生后的重要告警排查、故障处置工作主要依赖于通信调度人员的经验进行主观性诊断和决策,由调度人员根据告警类型,实时分析告警发生后光传输通信系统的状态、参数变化情况,分析告警对所承载电网业务的影响后,制定相应的告警处置措施。
随着电力SDH光传输系统的高速建设和不断扩容,光传输系统的通信网架结构和运行方式愈加复杂,发生告警后的排查、处置难度不断提高,依赖于人工经验的传统调度决策机制越来越难以应对复杂电力SDH光传输系统的通信告警诊断分析和告警处置。
发明内容
有鉴于此,为解决上述问题,本发明提供一种电力SDH光传输系统告警排查方法、装置及电子设备,技术方案如下:
一种面向电力SDH光传输系统调度运行的告警排查方法,所述方法包括:
构建电力SDH光传输系统调度运行所对应的知识图谱,并将所述知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,所述实体向量组包含每个三元组中作为头实体的告警实体的特征向量;
获取所述电力SDH光传输系统实时运行中所输出的告警文本,并对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量;
对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为所述目标告警实体的链接实体,并输出所述链接实体的关联信息。
优选的,所述构建电力SDH光传输系统调度运行所对应的知识图谱,包括:
获取所述电力SDH光传输系统的通信告警文本,并进行清洗与预处理;
构建预处理后的通信告警文本所对应的模式层,并按照所述模式层对预处理后的通信告警文本进行分类得到多个告警类型;
对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体;
对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组;
将所构建的多个三元组存入图数据库中,得到所述知识图谱。
优选的,所述对各告警类型下的多个告警实体进行关系抽取,包括:
采用引入注意力机制的双向长短期记忆网络对各告警类型下的多个告警实体进行关系抽取。
优选的,所述获取所述电力SDH光传输系统实时运行中所输出的告警文本,所述方法还包括:
对所述告警文本进行分类得到目标告警类型;
相应的,所述对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量,包括:
对所述告警文本进行实体识别得到所述目标告警类型下的目标告警实体以及所述目标告警实体的特征向量;
相应的,所述对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,包括:
将所述目标告警类型下的、在所述知识图谱各三元组中作为头实体的多个告警实体分别作为候选告警实体;
对所述目标告警实体的特征向量与所述实体向量组中各候选告警实体的特征向量分别进行相似度计算。
一种面向电力SDH光传输系统调度运行的告警排查装置,所述装置包括:
知识图谱构建模块,用于构建电力SDH光传输系统调度运行所对应的知识图谱,并将所述知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,所述实体向量组包含每个三元组中作为头实体的告警实体的特征向量;
告警排查模块,用于获取所述电力SDH光传输系统实时运行中所输出的告警文本,并对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量;对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为所述目标告警实体的链接实体,并输出所述链接实体的关联信息。
优选的,所述知识图谱构建模块,具体用于:
获取所述电力SDH光传输系统的通信告警文本,并进行清洗与预处理;构建预处理后的通信告警文本所对应的模式层,并按照所述模式层对预处理后的通信告警文本进行分类得到多个告警类型;对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体;对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组;将所构建的多个三元组存入图数据库中,得到所述知识图谱。
优选的,用于对各告警类型下的多个告警实体进行关系抽取的所述知识图谱构建模块,具体用于:
采用引入注意力机制的双向长短期记忆网络对各告警类型下的多个告警实体进行关系抽取。
优选的,所述告警排查模块,还用于:
对所述告警文本进行分类得到目标告警类型;
相应的,用于对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量的所述告警排查模块,具体用于:
对所述告警文本进行实体识别得到所述目标告警类型下的目标告警实体以及所述目标告警实体的特征向量;
相应的,用于对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算的所述告警排查模块,具体用于:
将所述目标告警类型下的、在所述知识图谱各三元组中作为头实体的多个告警实体分别作为候选告警实体;对所述目标告警实体的特征向量与所述实体向量组中各候选告警实体的特征向量分别进行相似度计算。
相较于现有技术,本发明实现的有益效果为:
本发明提供一种面向电力SDH光传输系统调度运行的告警排查方法及装置,首先构建电力SDH光传输系统调度运行所对应的知识图谱,并将该知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组;进而对于电力SDH光传输系统实时运行中所输出的告警文本,可以对该告警文本进行实体识别得到目标告警实体以及该目标告警实体的特征向量;进一步,由于实体向量组包含每个三元组中作为头实体的告警实体的特征向量,因此通过对目标告警实体的特征向量与实体向量组中各告警实体的特征向量分别进行相似度计算,可以将相似度最高的告警实体作为所述目标告警实体的链接实体,最后输出所述链接实体的关联信息(诸如告警线路所承载的电网业务情况、发生告警的原因以及调度处置策略等)。本发明基于知识图谱实现对电力SDH光传输系统的告警排查,对通信告警信息进行知识抽取管理,可以在系统产生告警时精确定位告警所承载的业务、发生告警的原因以及解决办法等,以便于辅助调度人员做出下一步处置,避免因辅助调度人员知识体系不完善引起的故障处置事故,或由于辅助调度人员请求专家帮助导致的故障处置不及时,可有效提升电力SDH光传输系统应急处理能力与调度智能化水平。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的告警排查方法的方法流程图;
图2为本发明实施例提供的告警排查方法的部分方法流程图;
图3为本发明实施例提供的模式层的示例图;
图4为本发明实施例提供的告警类型分类的示例图;
图5为本发明实施例提供的实体识别的示例图;
图6为本发明实施例提供的关系抽取的示例图;
图7为本发明实施例提供的告警排查装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为方便理解,以下对本发明出现的相关概念进行说明:
SDH:同步数字体系(Synchronous Digital Hierarchy),是一种基于时分复用的同步数字传输技术。
电力SDH光传输系统:基于SDH技术体制,实现电力系统各类业务信息的传送。
知识图谱(Knowledge Graph KG):旨在描述客观世界的概念、实体、事件及其之间的关系,知识图谱把信息表达成更接近人类认知世界的形式,把互联网内容转化成计算机可理解和深度关联的语义。大数据时代需要把数据转化成知识,为数据增添语义信息,获得对大数据的洞察,使数据产生智慧,以提供决策支持等智能服务。
文本分类(text classification):是将预案文本按预先定义的类别进行自动分类标记。
实体识别(named entity recognition,NER):是对文本中具有特定含义的实体进行边界确定和类别识别。
实体间关系抽取(named entity relation extraction,NRE):是在实体识别的基础上判断实体间是否存在预定义的关系,从而构成一系列三元组知识。
实体链接(entity linking):是找到自然语言中的实体提及在知识图谱的对应实体的过程。
本发明提供一种面向电力SDH光传输系统调度运行的告警排查方法,利用知识图谱技术将结构化、半结构化、非结构化的通信告警文本抽取提炼为知识,并将这些知识组织成结构化、可视化的表示形式,在通信告警发生时,帮助辅助调度人员快速分析告警对所承载业务的影响,制定相应的告警处置措施进行辅助决策,可有效提升电力SDH光传输系统应急处理能力与调度智能化水平。参见图1,图1为本发明实施例提供的告警排查方法的方法流程图,该告警排查方法包括如下步骤:
S10,构建电力SDH光传输系统调度运行所对应的知识图谱,并将知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,实体向量组包含每个三元组中作为头实体的告警实体的特征向量。
本发明实施例中,以电力SDH光传输系统的通信告警文本的研究对象,利用知识图谱技术对其进行知识抽取、表示和管理。具体的,对相关领域内实体、实体间关系进行分析,在领域专家的帮助下对文本内容进行详细分析,提炼出通信领域里有意义的概念类型与概念之间关系,从而形成领域知识体系,即知识图谱的模式层;在模式层的指导下用深度学习方法进行告警类型分类,对分类后的文本进行实体识别以及关系识别以减少对规则模板的需求;将抽取的知识利用Neo4j图数据库进行存储和可视化表示,以此得到电力SDH光传输系统对应的知识图谱。
具体实现过程中,步骤S10中“构建电力SDH光传输系统调度运行所对应的知识图谱”可以采用如下步骤,方法流程图如图2所示:
S101,获取电力SDH光传输系统的通信告警文本,并进行清洗与预处理。
本发明实施例中,可以在现网上获取电力SDH光传输系统告警领域的结构化、半结构化、非结构化数据,即通信告警文本。具体的包括:
对于电力SDH光传输系统每次告警信息,调度监控维护人员都会保存相应的故障报告信息(主要包括板卡、接口、光口、光缆等产生的告警信息,这些信息存储在文档,属于非结构化的数据);在综合资源管理库中保存设备、运行方式等的相关信息(主要包括设备的型号,设备架构,设备的所属地方等,以及承载的电网业务,属于结构化的数据);对于各厂家设备、光缆等产生的告警,会有各厂家相应的产品文档与告警说明(主要包括板卡、接口、光口、电源的告警原因、解决方法和处置措施等,属于半结构化的数据)。
进一步,对所获得的通信告警文本进行清洗与预处理。主要包括去除不需要的字段(格式不一致、内容中有不需要的字符)以及进行统一编码转换和繁简转换的操作。此外,对于其中半结构化和非结构化数据采用通信领域专家构建的通信词典作为分词工具的扩展词,使用自然语言处理工具HanLP对数据进行分词。
S102,构建预处理后的通信告警文本所对应的模式层,并按照模式层对预处理后的通信告警文本进行分类得到多个告警类型。
本发明实施例中,对于清洗与预处理后的通信告警文本,使用自顶向下和自底向上的结合的方法建立相应的模式层。模式层是知识图谱的知识组织架构,是对通信领域内实体、实体间关系以及属性进行描述的数据模型,为知识图谱中的文本分类、实体识别、实体间关系抽取提供指导。根据经上述步骤S101处理后的通信告警文本,在通信领域专家的帮助下对这些数据提炼出通信领域里有意义的概念类型与相关的属性、以及概念之间关系,形成领域知识体系。模式层由设备、板块、光口、电口、电源、风扇等硬件,以及板卡类告警、发/收光类告警、网元类告警、环境类告警等核心要素组成。参见图3,图3为本发明实施例提供的模式层的示例图。对预处理后的通信告警文本进行分析,分成设备、板卡、光口、脱管、高温、失电、板卡告警、收光告警、环境告警、网元告警等实体类,以及包含、产生、承载、告警、伴随5个关系。
进一步,根据所构建的模式层对预处理后的通信告警文本进行分类。具体的,告警类型的文本分类是将预处理后的通信告警文本按预先定义的类别进行自动分类标记,为下面查找进行更精确的定位。例如,告警类型常分为板卡类告警、发/收光类告警、网元类告警、环境类告警4类情况。而在实际应用中可以采用TextRNN(Text RecurrentNeuralNetwork)+Attention(注意力机制)的文本分类模型进行分类。其中,TextRNN+Attention模型用于通信告警文本分类,最大的特点在于,可以先利用双向RNN得到每个词的前向和后向上下文的表示,这样词的表示就变成词向量和前向后向上下文向量拼接起来的形式,最后再接跟TextCNN(Text Convolutional Neural Network)相同卷积层,池化层即可,提高文本分类的准确率。
参见图4,图4为本发明实施例提供的告警类型分类的示例图。利用HanLP分词工具对预处理后的通信告警文本中的句子进行分词,比如“通信设备监控发现2M出线板有线路信号丢失”分为“通信,设备,监控,发现,2M,出线板,有,线路,信号,丢失”,进而将分好的词进行向量初始化输入到TextRNN+Attention模型中进行每个单词的表征提取得到词向量,最后将词向量合并为句向量输入到Softmax层进行告警类型的分类(板卡类告警、收光类告警、环境类告警、网元类告警)。
S103,对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体。
本发明实施例中,对于分类后的通信告警文本,可以对每一个告警类型对应的部分文本分别进行实体识别,具体的,实体识别是对分类后的通信告警文本中具有特定含义的实体进行边界确定和类别识别,比如定义的实体类别板卡、光口、设备、业务、层次、现象、原因、方法等。由于通信告警文本属于特定领域的文本,因此在构建实体识别模型时应充分考虑文本的特点,在实际应用中,可以采用BERT(Bidirectional Encoder Representationfrom Transformers)+CRF(conditional random field)的实体识别模型进行识别。其中,BERT+CRF模型用于通信告警文本实体识别,最大特点在于,采用MLM(masked languagemodel)对双向的Transformers进行预训练,以生成深层的双向语言表征,预训练后,只需要添加一个额外的输出层进行fine-tune(微调),就可以在各种各样的下游任务中取得最优表现。在这过程中并不需要对BERT进行任务特定的结构修改。
参见图5,图5为本发明实施例提供的实体识别的示例图。将分类后的通信告警文本输入到预训练好的BERT模型中,利用BERT模型对输入向量进行特征的提取,再输出每个位置的向量表示,加上CRF层,能够对标签之间的转移进行进一步的约束,最后输入Softmax层得到对每个标签的预测。比如“通信设备监控发现2M出线板有线路信号丢失”输入到模型后的结果“O,O,O,O,O,O,O,O,B-BOA,I-BOA,I-BOA,I-BOA,I-BOA,O,O,O,O,O,O,O”,其中不需要识别的字则标注为O、需要识别的字则采用BI标注,BI表示标注的字组成一个单词,B表示单词的开头,BOA表示字的类别是板卡类别。
此外,CRF层可以为最后预测的标签添加一些约束来保证预测的标签是合法的。在训练数据训练过程中,这些约束可以通过CRF层自动学习到的。具体公式如下:
Figure BDA0003751524390000091
其中,P(y|x)表示给定一个输入序列(通信设备监控发现2M出线板有线路信号丢失),可以计算出输出序列为标注y(O,O,O,O,O,O,O,O,B-BOA,I-BOA,I-BOA,I-BOA,I-BOA,O,O,O,O,O,O,O)的概率;tk、sl表示特征函数;λk、μl表示对应的权值,其中k、l、i都表示每个字在序列中的位置,z(x)表示规范化因子。
S104,对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组。
本发明实施例中,对于各告警类型下的多个告警实体,对其实体间关系进行抽取。而实体间关系抽取是在上述步骤S103的基础上判断告警实体间是否存在预定义的关系,从而构成一系列三元组知识。比如(板卡,承载,业务)、(光口,告警,层次)等,实际应用中,关系抽取模型采用Attention(注意力机制)+Bi-LSTM(Bi-directional Long Short-TermMemory,双向长短期记忆网络),即引入注意力机制的双向长短期记忆网络进行关系识别,分类后的通信告警文本先通过Bi-LSTM层学习每个单词的表征向量,再通过Attention层学习词级别的注意力权重,更精细化句子向量,最终通过对句子级别特征向量进行关系分类。其中,Attention+Bi-LSTM模型用于通信告警文本关系抽取,最大特点在于将Attention机制融合进来,Attention机制达到了解码当前时刻时,仅仅只接受与当前时刻有关的输入,类似与先对信息做了一个筛选(注意力选择)。
参见图6,图6为本发明实施例提供的关系抽取的示例图。利用HanLP分词工具对分类后的通信告警文本进行分词,比如“通信设备监控发现2M出线板有线路信号丢失”分为“通信,设备,监控,发现,2M,出线板,有,线路,信号,丢失”;将分好的词进行向量初始化输入到Bi-LSTM层中进行每个单词的表征提取,然后利用Attention机制进一步精细化词向量,比如“2M,出线板,有,线路”这几个单词,在“出线板”这个单词上加入Attention机制会使得“出线板”这个单词的特征更加突出,而区别与其他单词,词向量得到更加的精细化;最后将得到的每个特征词向量{h1,h2,h3,h4,h5,h6,h7,h8,h9,h10}累加成句向量y进行关系分类(包含、产生、承载、告警、伴随)。
此外,使用Bi-LSTM获得每个单词的前向状态以及后向状态,并将单词的前向状态
Figure BDA0003751524390000101
和后向状态
Figure BDA0003751524390000102
拼接得到的结果作为单词的状态表示。具体公式如下:
Figure BDA0003751524390000103
其中,前向状态为文本序列{通信设备监控发现2M出线板有信号丢失}的输出,后向状态为文本序列{失丢号信有板线出M2现发控监备设信通}的输出。
需要说明的是,步骤S102中文本分类模型所采用的Attention机制、以及步骤S104中关系抽取模型所采用的Attention机制对输入的每个元素考虑不同的权重参数,从而更加关注与输入元素相似的部分,而抑制其他无用的信息。具体公式如下:
Figure BDA0003751524390000111
其中,ci表示当前的时刻的中间语义向量对输入信息注意力加权求和之后得到的向量;hj表示编码端的第j个单词的隐向量;αij表示解码端的第i个单词的注意力大小,即输入的第j个单词对生成的第i个单词的影响程度。比如输入序列为{通信,设备,监控,发现,2M,出线板,有,线路,信号,丢失},如果要求得“出线板”经过Attention机制后特征向量值,则在“出线板”特征向量的基础上加上其他单词的特征向量与其对应的注意力值αij的乘积。
在完成对告警实体进行关系抽取后,利用告警实体、以及告警实体之间的关系构建三元组,比如三元组(11槽1口光板los,告警,紧急),将所构建的三元组存储至Neo4j图数据库中,形成结构化的知识存储,以此得到电力SDH光传输系统对应的知识图谱。
S105,将所构建的多个三元组存入图数据库中,得到知识图谱。
在此基础上,对于知识图谱中的各三元组,可以采用TransE(翻译模型)将各三元组嵌入到低维度向量空间得到实体向量组,其中,实体向量组中包含每个三元组中作为头实体的告警实体的特征向量,以便于系统发生告警时进行告警实体的语义匹配来进行正确的告警实体定位。
需要说明的是,TransE模型是基于实体和关系的分布式向量表示,将各三元组(head,relation,tail)中的relation(关系)看做从head(作为头实体的告警实体)到tail(作为尾实体的告警实体)的翻译,通过不断调整h(head的特征向量)、l(relation的特征向量)和t(tail的特征向量),使(h+l)尽可能与t相等,具体公式如下:
L=∑(h,l,t),(h′,l,t′)[γ+d(h+l,t)-d(h′+l,t′)]+ (4)
其中,h表示作为头实体的告警实体的特征向量,l表示关系的特征向量,t表示作为尾实体的告警实体的特征向量,d表示距离,h′表示负样本头实体的特征向量,t′表示负样本尾实体的特征向量,γ表示惩罚因子,通过加入负样本和惩罚因子进行三元组的向量更新。
比如,三元组(2M出线板,承载,西南安控),这是正样本,其中,“2M出线板”作为头实体、“承载”表示关系、“西南安控”作为尾实体。负样本可以为(2M出线板,承载,电扇),其中,“电扇”是错误的尾实体,通过上述公式中的第一范式算得它们的距离,同时通过加入负样本,经过交叉熵损失函数来更新头实体、尾实体和关系的特征向量。
继续以图4所示的“通信设备监控发现2M出线板有线路信号丢失”为例,对于构建的三元组(2M出现板,产生,线路信号丢失),首先初始化“2M出现板”、“产生”以及“线路信号丢失”为768维度的特征向量,通过TransE模型交叉熵损失函数得“2M出现板”的特征向量加上“产生关系”的特征向量等于“线号信号丢失”的特征向量。
S20,获取电力SDH光传输系统实时运行中所输出的告警文本,并对告警文本进行实体识别得到目标告警实体以及目标告警实体的特征向量。
本发明实施例中,电力SDH光传输系统产生告警时,需要正确的定位到告警所承载的业务。因此,当电力SDH光传输系统产生告警时,获得产生的告警文本,并将该告警文本输入到实体识别模型BERT+CRF模型进行实体识别,得到相应的目标告警实体,同时,将BERT对该目标告警实体所加入的CLS标签向量作为该目标告警实体的特征向量。
优选的,本发明实施例中在对告警文本进行实体识别之前,还可以对告警文本进行分类得到目标告警类型,进而对告警文本进行实体识别得到目标告警类型下的目标告警实体以及目标告警实体的特征向量。具体的:
可以采用文本分类模型TextRNN+Attention模型对告警文本分类其告警类型,缩小后续的候选实体集。比如,对于“监控发现2M出线板有线路信号丢失”的告警文本,通过TextRNN+Attention模型可以确定目标告警类型为“板卡类告警”,后续可以将“板卡类告警”下的告警实体(主控板、交叉板、2M处理板、出线板等)作为候选实体集。将告警文本输入到BERT+CRF模型进行实体识别,将CLS标签向量作为目标告警类型下的目标告警实体的特征向量。
以告警文本为“通信设备调度监控发现1口光板los发生光路中断”为例进行说明,首先经过TextRNN+Attention模型得到目标告警类型为:“收光类告警”,进而经过BERT+CRF模型提取出目标告警实体“1口光板los”、并将CLS标签向量作为其特征向量E。此外,可以将“收光类告警”下的告警实体作为候选实体集。
S30,对目标告警实体的特征向量与实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为目标告警实体的链接实体,并输出链接实体的关联信息。
本发明实施例中,对于目标告警实体与实体向量组中各告警实体的特征向量,可以对两者进行相似度计算,进而确定目标告警实体与各告警实体的相似度,将相似度最高的告警实体作为目标告警实体所需要链接的链接实体,输出该链接实体的关联信息,即将告警实体承载的电网业务情况、发生告警的原因、以及调度处置策略等进行输出以便为辅助调度人员做出下一步做出具体针对告警的措施做准备,由此可以输出电力SDH光传输系统通信告警对电力业务的影响、产生的原因与消除告警的解决方案。
优选的,在对告警文本进行分类得到目标告警类型之后,还可以将目标告警类型下的告警实体作为候选实体集,即将目标告警类型下的、在知识图谱各三元组中作为头实体的多个告警实体作为候选实体集中的候选告警实体。此时,可以对目标告警实体的特征向量与实体向量组中各候选告警实体的特征向量分别进行相似度计算,这就可以实现对低维度的实体向量组进行实体消歧,同时,还可以将候选实体集中的候选告警实体进一步细化,将中选出包含目标告警实体、或者被目标告警实体所包含的候选告警实体作为新的候选实体集,比如,目标告警实体“2M出线板”,可以从候选实体集中选出“2M”、“出线板”、“2M出线板”等告警实体作为新的候选实体集。
对于新的候选实体集,可以将目标告警实体的特征向量与新的候选实体集中的告警实体的特征向量进行相似度计算,选择相似度最高的告警实体进行链接。
继续以告警文本为“通信设备调度监控发现1口光板los发生光路中断”为例进行说明,可以将候选实体集中包含目标告警实体“1口光板los”或者被目标告警实体“1口光板los”所包含的告警实体作为新的候选实体集。从实体向量组中查找新的候选实体集中各告警实体的特征向量
Figure BDA0003751524390000141
将目标告警实体“1口光板los”的特征向量E与新的候选实体集中各告警实体的特征向量
Figure BDA0003751524390000142
进行相似度计算,同时,还可以将目标告警实体“1口光板los”与新的候选实体集中各告警实体的字符串做相似度计算,两项相似度计算的综合作为新的候选实体集中各告警实体的最终的相似度。最后,将最终的相似度最该的告警实体作为目标告警实体“1口光板los”的链接实体。
经过上述通信告警实体链接后,可以将知识图谱中正确对应告警实体的承载业务进行输出。继续以告警文本为“通信设备调度监控发现1口光板los发生光路中断”为例进行说明,经过上述步骤可以正确链接到告警知识图谱中的“11槽1口光板los”,使用Cyper语句{MATCHp=(:Fibre{name:”11槽1口光板los”})-[r:承载]-()RETURN p}输出“其上承载西南安控业务及宾金直流保护安控业务”、{MATCH p=(:Fibre{name:”11槽1口光板los”})-[r:原因]-()RETURN p}输出“OTDR有断点出线”、{MATCH p=(:Fibre{name:”11槽1口光板los”})-[r:解决]-()RETURN p}输出“调整纤芯”。
此外,目标告警实体与候选实体集/新的候选实体集中告警实体的相似度计算如下所示:
Figure BDA0003751524390000143
其中,E表示目标告警实体的特征向量,
Figure BDA0003751524390000144
表示候选实体集/新的候选实体集中告警实体的特征向量,en表示目标告警实体的字符串,
Figure BDA0003751524390000145
表示候选实体集/新的候选实体集中告警实体的字符串,sim表示字符串的相似度,β表示预定义的权重(用于平衡相似项),Score表示目标告警实体与候选实体集/新的候选实体集中告警实体的最终的相似度。比如,对于告警文本{通信设备监控发现2M出线板有信号丢失},经过实体识别确定目标告警实体“2M出线板”、并将CLS标签向量作为“2M出线板”的特征向量,告警文本经过分类后得到候选实体集{1M出线板,11口光板,5口光板,2m出线板,出线板},将候选实体集中的候选告警实体进一步细化得到“,2m出线板”作为新的候选实体集、且其中单个告警实体作为告警实体的字符。
本发明实施例提供的面向电力SDH光传输系统调度运行的告警排查方法,首先对电力SDH光传输系统结构化、半结构化、非结构化的通信告警文本进行数据清洗和预处理;然后采用自顶向下和自底向上的结合的方法定义知识图谱的知识组织架构、概念类型、概念间关系,形成知识图谱的模式层;之后,针对电网故障处置预案文本的特性,综合使用多种深度学习模型进行知识抽取,自底向上构建知识图谱的数据层,使用基于字向量的TextRNN+Attention模型进行分类、使用BERT+CRF模型进行实体识别、在实体识别的基础上使用Attention+Bi-LSTM模型对告警实体间关系进行抽取,从而将抽取到的告警实体以及关系形成三元组存入Neo4j图数据库中。最后,为了证明了上述知识图谱构建的有效性。对构建的知识图谱进行了可视化并对其在智能信息检索和辅助故障诊断中的应用进行了分析:
使用TransE模型将三元组嵌入到低维度向量空间;当电力SDH光传输系统发生通信告警时,通过实体链接技术正确的将告警实体所承载的业务、原因以及解决方法输出,为下一步判断做准备。
基于上述实施例提供的告警排查方法,本发明实施例则对应提供执行上述告警排查方法的装置,该装置的结构示意图如图7所示:
知识图谱构建模块10,用于构建电力SDH光传输系统调度运行所对应的知识图谱,并将知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,实体向量组包含每个三元组中作为头实体的告警实体的特征向量;
告警排查模块20,用于获取电力SDH光传输系统实时运行中所输出的告警文本,并对告警文本进行实体识别得到目标告警实体以及目标告警实体的特征向量;对目标告警实体的特征向量与实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为目标告警实体的链接实体,并输出链接实体的关联信息。
可选的,知识图谱构建模块10,具体用于:
获取电力SDH光传输系统的通信告警文本,并进行清洗与预处理;构建预处理后的通信告警文本所对应的模式层,并按照模式层对预处理后的通信告警文本进行分类得到多个告警类型;对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体;对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组;将所构建的多个三元组存入图数据库中,得到知识图谱。
可选的,用于对各告警类型下的多个告警实体进行关系抽取的知识图谱构建模块10,具体用于:
采用引入注意力机制的双向长短期记忆网络对各告警类型下的多个告警实体进行关系抽取。
可选的,告警排查模块20,还用于:
对告警文本进行分类得到目标告警类型;
相应的,用于对告警文本进行实体识别得到目标告警实体以及目标告警实体的特征向量的告警排查模块20,具体用于:
对告警文本进行实体识别得到目标告警类型下的目标告警实体以及目标告警实体的特征向量;
相应的,用于对目标告警实体的特征向量与实体向量组中各告警实体的特征向量分别进行相似度计算的告警排查模块20,具体用于:
将目标告警类型下的、在知识图谱各三元组中作为头实体的多个告警实体分别作为候选告警实体;对目标告警实体的特征向量与实体向量组中各候选告警实体的特征向量分别进行相似度计算。
需要说明的是,本发明实施例中各模块的细化功能可以参见上述告警排查方法实施例对应公开部分,在此不再赘述。
基于上述实施例提供的告警排查方法,本发明实施例还提供一种电子设备,电子设备包括:至少一个存储器和至少一个处理器;存储器存储有应用程序,处理器调用存储器存储的应用程序,应用程序用于实现告警排查方法。
基于上述实施例提供的告警排查方法,本发明实施例还提供一种存储介质,存储介质存储有计算机程序代码,计算机程序代码执行时实现告警排查方法。
以上对本发明所提供的一种告警排查方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种面向电力SDH光传输系统调度运行的告警排查方法,其特征在于,所述方法包括:
构建电力SDH光传输系统调度运行所对应的知识图谱,并将所述知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,所述实体向量组包含每个三元组中作为头实体的告警实体的特征向量;
获取所述电力SDH光传输系统实时运行中所输出的告警文本,并对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量;
对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为所述目标告警实体的链接实体,并输出所述链接实体的关联信息。
2.根据权利要求1所述的方法,其特征在于,所述构建电力SDH光传输系统调度运行所对应的知识图谱,包括:
获取所述电力SDH光传输系统的通信告警文本,并进行清洗与预处理;
构建预处理后的通信告警文本所对应的模式层,并按照所述模式层对预处理后的通信告警文本进行分类得到多个告警类型;
对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体;
对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组;
将所构建的多个三元组存入图数据库中,得到所述知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述对各告警类型下的多个告警实体进行关系抽取,包括:
采用引入注意力机制的双向长短期记忆网络对各告警类型下的多个告警实体进行关系抽取。
4.根据权利要求2所述的方法,其特征在于,所述获取所述电力SDH光传输系统实时运行中所输出的告警文本,所述方法还包括:
对所述告警文本进行分类得到目标告警类型;
相应的,所述对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量,包括:
对所述告警文本进行实体识别得到所述目标告警类型下的目标告警实体以及所述目标告警实体的特征向量;
相应的,所述对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,包括:
将所述目标告警类型下的、在所述知识图谱各三元组中作为头实体的多个告警实体分别作为候选告警实体;
对所述目标告警实体的特征向量与所述实体向量组中各候选告警实体的特征向量分别进行相似度计算。
5.一种面向电力SDH光传输系统调度运行的告警排查装置,其特征在于,所述装置包括:
知识图谱构建模块,用于构建电力SDH光传输系统调度运行所对应的知识图谱,并将所述知识图谱中各三元组嵌入至低纬度向量空间得到实体向量组,所述实体向量组包含每个三元组中作为头实体的告警实体的特征向量;
告警排查模块,用于获取所述电力SDH光传输系统实时运行中所输出的告警文本,并对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量;对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算,将相似度最高的告警实体作为所述目标告警实体的链接实体,并输出所述链接实体的关联信息。
6.根据权利要求5所述的装置,其特征在于,所述知识图谱构建模块,具体用于:
获取所述电力SDH光传输系统的通信告警文本,并进行清洗与预处理;构建预处理后的通信告警文本所对应的模式层,并按照所述模式层对预处理后的通信告警文本进行分类得到多个告警类型;对分类后的通信告警文本进行实体识别得到各告警类型下的多个告警实体;对各告警类型下的多个告警实体进行关系抽取,以构建多个由两个告警实体及其关系所组成的三元组;将所构建的多个三元组存入图数据库中,得到所述知识图谱。
7.根据权利要求6所述的装置,其特征在于,用于对各告警类型下的多个告警实体进行关系抽取的所述知识图谱构建模块,具体用于:
采用引入注意力机制的双向长短期记忆网络对各告警类型下的多个告警实体进行关系抽取。
8.根据权利要求6所述的装置,其特征在于,所述告警排查模块,还用于:
对所述告警文本进行分类得到目标告警类型;
相应的,用于对所述告警文本进行实体识别得到目标告警实体以及所述目标告警实体的特征向量的所述告警排查模块,具体用于:
对所述告警文本进行实体识别得到所述目标告警类型下的目标告警实体以及所述目标告警实体的特征向量;
相应的,用于对所述目标告警实体的特征向量与所述实体向量组中各告警实体的特征向量分别进行相似度计算的所述告警排查模块,具体用于:
将所述目标告警类型下的、在所述知识图谱各三元组中作为头实体的多个告警实体分别作为候选告警实体;对所述目标告警实体的特征向量与所述实体向量组中各候选告警实体的特征向量分别进行相似度计算。
CN202210843969.XA 2022-07-18 2022-07-18 面向电力sdh光传输系统调度运行的告警排查方法及装置 Pending CN115098687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210843969.XA CN115098687A (zh) 2022-07-18 2022-07-18 面向电力sdh光传输系统调度运行的告警排查方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210843969.XA CN115098687A (zh) 2022-07-18 2022-07-18 面向电力sdh光传输系统调度运行的告警排查方法及装置

Publications (1)

Publication Number Publication Date
CN115098687A true CN115098687A (zh) 2022-09-23

Family

ID=83298268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210843969.XA Pending CN115098687A (zh) 2022-07-18 2022-07-18 面向电力sdh光传输系统调度运行的告警排查方法及装置

Country Status (1)

Country Link
CN (1) CN115098687A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116633433A (zh) * 2023-05-12 2023-08-22 国网吉林省电力有限公司 一种基于模型驱动的opgw光缆故障诊断与定位方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116633433A (zh) * 2023-05-12 2023-08-22 国网吉林省电力有限公司 一种基于模型驱动的opgw光缆故障诊断与定位方法
CN116633433B (zh) * 2023-05-12 2024-03-08 国网吉林省电力有限公司 一种基于模型驱动的opgw光缆故障诊断与定位方法

Similar Documents

Publication Publication Date Title
CN112084337B (zh) 文本分类模型的训练方法、文本分类方法及设备
CN110727779A (zh) 基于多模型融合的问答方法及系统
CN113268609B (zh) 基于知识图谱的对话内容推荐方法、装置、设备及介质
CN113392209B (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
CN109241199B (zh) 一种面向金融知识图谱发现的方法
CN113742733B (zh) 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置
CN113705315B (zh) 视频处理方法、装置、设备及存储介质
CN113743119B (zh) 中文命名实体识别模块、方法、装置及电子设备
CN117033571A (zh) 知识问答系统构建方法及系统
CN112528658B (zh) 层次化分类方法、装置、电子设备和存储介质
CN116661805B (zh) 代码表示的生成方法和装置、存储介质及电子设备
CN116089873A (zh) 模型训练方法、数据分类分级方法、装置、设备及介质
CN115688920A (zh) 知识抽取方法、模型的训练方法、装置、设备和介质
CN114239574A (zh) 一种基于实体和关系联合学习的矿工违规行为知识抽取方法
CN114691864A (zh) 文本分类模型训练方法及装置、文本分类方法及装置
CN117494051A (zh) 一种分类处理的方法、模型训练的方法以及相关装置
CN113705192B (zh) 文本处理方法、装置与存储介质
CN115098673A (zh) 基于变体注意力及层次结构的业务文书信息抽取方法
CN115098687A (zh) 面向电力sdh光传输系统调度运行的告警排查方法及装置
CN113918710A (zh) 文本数据处理方法、装置、电子设备和可读存储介质
CN115905187B (zh) 一种面向云计算工程技术人员认证的智能化命题系统
CN116680392A (zh) 一种关系三元组的抽取方法和装置
CN116595023A (zh) 地址信息的更新方法和装置、电子设备及存储介质
CN116975161A (zh) 电力设备局放文本的实体关系联合抽取方法、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination