CN115222058A - 调控系统运行状态分析模型构建方法及装置、介质及设备 - Google Patents
调控系统运行状态分析模型构建方法及装置、介质及设备 Download PDFInfo
- Publication number
- CN115222058A CN115222058A CN202210598867.6A CN202210598867A CN115222058A CN 115222058 A CN115222058 A CN 115222058A CN 202210598867 A CN202210598867 A CN 202210598867A CN 115222058 A CN115222058 A CN 115222058A
- Authority
- CN
- China
- Prior art keywords
- data
- ternary group
- entity
- operation state
- control system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种调控系统运行状态分析模型构建方法及装置、介质及设备,涉及电力系统技术领域。此方法通过对调控系统的运行数据进行数据转换、知识抽取、知识融合,构建出三元组数据,其中,三元组数据包括实体‑关系‑实体三元组数据和实体‑属性‑属性值三元组数据。然后基于三元组数据构建第一运行状态知识图谱,并通过图谱补全生成第二运行状态知识图谱,最后根据第二运行状态知识图谱中提取的训练特征向量进行机器学习模型的训练,获得运行状态分析模型。可以实现了对海量系统运行数据的快速关联挖掘,能够对多源异构数据进行综合分析,提高了数据的使用价值,能够准确和支撑对运行状态的分析。
Description
技术领域
本公开涉及电力系统技术领域,尤其涉及一种调控系统运行状态分析模型构建方法及装置、介质及设备。
背景技术
调度控制系统作为电网企业进行电网运行控制和调度生产管理的重要技术手段,是保障电网安全运行的关键基础设施。近年来随着电网规模扩大、接入对象不断增加,调度控制系统架构也由传统的集中式向着分布分散、统一互联等方向不断发展,所具备的功能也在持续拓展。
目前技术中,由于电网调度控制系统各类对象产生告警信息种类多、分布广、相关性强,现有技术中对多源异构数据进行分析使用的工具比较传统,无法全面地对数据进行信息提取,不能够准确和支撑对运行状态的分析。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种调控系统运行状态分析模型构建方法及装置、介质及设备,至少在一定程度上克服由于相关技术中不能准确识别和支撑分析的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种调控系统运行状态分析模型构建方法,包括:
获取调控系统的运行数据,其中,所述运行数据包括结构化数据和半结构化数据;
将所述结构化数据进行数据转换,构建第一三元组数据;
将所述半结构化数据进行数据预处理,获得有效文本数据;
将所述有效文本数据进行知识抽取,构建第二三元组数据;
将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;
将所述第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;
对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;
根据所述第二运行状态知识图谱进行特征提取,得到训练特征向量;
根据所述训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
在本公开一个实施例中,所述半结构化数据包括:历史运行告警数据和状态监测信息数据。
在本公开一个实施例中,所述将所述半结构化数据进行数据预处理,获得有效文本数据,包括:根据正则表达式对所述半结构化数据进行筛选,去除非文本内容以及与调控系统无关的内容,获得所述有效文本数据。
在本公开一个实施例中,所述将所述有效文本数据进行知识抽取,构建第二三元组数据,包括:
通过LSTM+CRF机器学习模型对所述有效文本数据进行命名实体识别,获得实体数据集;
通过依存关系模型对所述实体数据集进行属性、关系抽取,构建实体属性关系数据集;
根据所述实体属性关系数据集构建所述第二三元组数据。
在本公开一个实施例中,所述将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,包括:
对所述第一三元组数据与所述第二三元组数据进行实体消歧和共指消解,获得处理后的数据;
对所述处理后的数据进行三元组知识转换,构建第三三元组数据。
在本公开一个实施例中,所述对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱,包括:
获取待补全的第一运行状态知识图谱;
通过训练好的概率预测模型对所述待补全的第一运行状态知识图谱的缺失部分进行预测,获得多个预测结果及每个预测结果对应的概率;
将概率最大的预测结果作为最终预测值对所述待补全的第一运行状态知识图谱的缺失部分进行补全,生成第二运行状态知识图谱。
在本公开一个实施例中,所述运行状态分析模型用于分析调控系统中实体对象之间的关系,以及分析实体对象的特征属性变化对调控系统运行状态影响的范围。
根据本公开的另一个方面,提供一种调控系统运行状态分析模型构建装置,包括:
数据获取模块,用于获取调控系统的运行数据,其中,所述运行数据包括结构化数据和半结构化数据;
第一数据处理模块,用于将所述结构化数据进行数据转换,构建第一三元组数据;
第二数据处理模块,用于将所述半结构化数据进行数据预处理,获得有效文本数据;
第三数据处理模块,用于将所述有效文本数据进行知识抽取,构建第二三元组数据;
第四数据处理模块,用于将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;
图谱构建模块,用于将所述第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;
图谱补全模块,用于对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;
特征提取模块,用于根据所述第二运行状态知识图谱进行特征提取,得到训练特征向量;
模型构建模块,用于根据所述训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
根据本公开的再一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的调控系统运行状态分析模型构建方法。
根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的调控系统运行状态分析模型构建方法。
本公开的实施例所提供的调控系统运行状态分析模型构建方法,通过对调控系统的运行数据进行数据转换、知识抽取、知识融合,构建出三元组数据,其中,三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据。然后基于三元组数据构建第一运行状态知识图谱,并通过图谱补全生成第二运行状态知识图谱,最后根据第二运行状态知识图谱中提取的训练特征向量进行机器学习模型的训练,获得运行状态分析模型。这样实现了对海量系统运行数据的快速关联挖掘,能够对多源异构数据进行综合分析,提高了数据的使用价值,能够准确和支撑对运行状态的分析。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开实施例中一种调控系统运行状态分析模型构建方法的流程图。
图2是图1中一种调控系统运行状态分析模型构建方法的一种流程图。
图3是图1中一种调控系统运行状态分析模型构建方法的另一种流程图。
图4是图1中一种调控系统运行状态分析模型构建方法的又一种流程图。
图5示出本公开实施例中一种电子设备的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出本公开实施例中一种调控系统运行状态分析模型构建方法的流程图。
参考图1,应用于一种调控系统运行状态分析模型构建方法,包括:
步骤S102:获取调控系统的运行数据,其中,运行数据包括结构化数据和半结构化数据。
步骤S104:将结构化数据进行数据转换,构建第一三元组数据。
步骤S106:将半结构化数据进行数据预处理,获得有效文本数据。
步骤S108:将有效文本数据进行知识抽取,构建第二三元组数据。
步骤S110:将第一三元组数据和第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据。
步骤S112:将第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱。
步骤S114:对第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱。
步骤S116:根据第二运行状态知识图谱进行特征提取,得到训练特征向量。
步骤S118:根据训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
以上步骤104与106之间无先后顺序。
具体的,通过对调控系统的运行数据进行数据转换、知识抽取、知识融合,构建出三元组数据,其中,三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据。然后基于三元组数据构建第一运行状态知识图谱,并通过图谱补全生成第二运行状态知识图谱,最后根据第二运行状态知识图谱中提取的训练特征向量进行机器学习模型的训练,获得运行状态分析模型。可以实现了对海量系统运行数据的快速关联挖掘,能够对多源异构数据进行综合分析,提高了数据的使用价值,能够准确和支撑对运行状态的分析。
下面分别对图1中的各个步骤进行具体说明。
在步骤S102中,获取调控系统的运行数据,其中,运行数据包括结构化数据和半结构化数据。
结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层,数据的结构和内容混在一起,没有明显的区分,因此,它也被称为自描述的结构,简单的说半结构化数据就是介于完全结构化数据和完全无结构的数据之间的数据。
本示例实施方式中,可以通过软件接口对接方式、开放数据库方式或者基于底层数据交换的数据直接采集方式,进行采集数据,获取调控系统的运行数据。运行数据可以包括:调控系统中各个设备、通道、网络链路、程序和应用的运行状态、运行参数、生产数据、报警信息等等数据。其中,结构化数据可以是二维表形式;半结构化数据可以包括历史运行告警数据和状态监测信息数据,可以是HTML文档,JSON,XML形式。
在步骤S104中,将结构化数据进行数据转换,构建第一三元组数据。
三元组是知识图谱的一种通用表示方式,三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。知识图谱又可以叫语义网,用来描述真实世界中存在的各种实体或概念及其关系,构成一张巨大的语义网络图,知识图谱中每个节点都有若干个属性及其属性值,实体与实体之间的边表示节点之间的关系,边的指向表示关系的方向,边上的标记表示关系的类型。
本示例实施方式中,定义对应的三元组转换规则,然后根据三元组转换规则对结构化数据进行转换为三元组数据。以二维表为例,从待处理二维表中读取数据后,以预设数据格式对数据进行存储;然后,提取待处理二维表中数据的元数据,并基于该元数据生成三元组转换规则。最后,将以预设数据格式存储的数据,按照该三元组转换规则转换成三元组数据。
例如,为计算机设备建立CPU使用率、硬盘分区使用率等属性,构建(计算机,CPU使用率,90%)这样形如(实体,属性,属性值)的三元组描述;为计算机设备与SCADA应用之间建立运行关系,构建(计算机,运行,SCADA应用)这样形如(实体,关系,实体)的三元组描述。
在步骤S106中,将半结构化数据进行数据预处理,获得有效文本数据。
正则表达式,又称规则表达式。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
本示例实施方式中,根据正则表达式对半结构化数据进行筛选,去除非文本内容以及与调控系统无关的内容,获得有效文本数据。其中,有效文本数据可以包括调控系统中各个设备、通道、网络链路、程序和应用的运行状态、运行参数、生产数据、历史运行告警数据和状态监测信息等等数据。
在步骤S108中,将有效文本数据进行知识抽取,构建第二三元组数据。
知识抽取,就是从文本数据中抽取出来结构化的知识,然后填到知识体系所定义的框架中的过程,也就是抽取一个又一个三元组的过程。
实体抽取,又名命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分:实体边界识别;确定实体类别(人名、地名、机构名或其他)。命名实体识别通常是知识抽取的第一步,被广泛应用在自然语言处理领域。深度循环神经网络LSTM结合CRF或者是BERT结合CRF,可以学习上下文的特征,然后进行序列信号的记忆和传递,这是一种比较常见的做法。
参考图2,上述步骤S108,可以包括:
步骤S202,通过LSTM+CRF机器学习模型对所述有效文本数据进行命名实体识别,获得实体数据集;
步骤S204,通过依存关系模型对所述实体数据集进行属性、关系抽取,构建实体属性关系数据集;
步骤S206,根据所述实体属性关系数据集构建所述第二三元组数据。
在步骤S110中,将第一三元组数据和第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据。
知识融合是将来自多个来源的关于同一个实体或概念的描述信息融合起来。
第三三元组数据可以是(计算机,CPU使用率,90%)的实体-属性-属性值三元组数据;也可以是(计算机,运行,SCADA应用)的实体-关系-实体三元组数据。
参考图3,上述步骤S110,可以包括:
步骤S302,对所述第一三元组数据与所述第二三元组数据进行实体消歧和共指消解,获得处理后的数据;
步骤S304,对所述处理后的数据进行三元组知识转换,构建第三三元组数据。
在步骤S112中,将第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱。
根据Neo4j数据集原理,将构建的第三三元组数据导入Neo4j数据库,生成第一运行状态知识图谱。
在步骤S114中,对第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱。
参考图4,上述步骤S114,可以包括:
步骤S402,获取待补全的第一运行状态知识图谱;
步骤S404,通过训练好的概率预测模型对所述待补全的第一运行状态知识图谱的缺失部分进行预测,获得多个预测结果及每个预测结果对应的概率;
步骤S406,将概率最大的预测结果作为最终预测值对所述待补全的第一运行状态知识图谱的缺失部分进行补全,生成第二运行状态知识图谱。
在步骤S116中,根据第二运行状态知识图谱进行特征提取,得到训练特征向量。
对第二运行状态知识图谱进行进一步提取,提取出不同知识层次下的适合进行模型训练的训练特征向量。
在步骤S118中,根据训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
在本实施例中,运行状态分析模型用于分析调控系统中实体对象之间的关系,以及分析实体对象的特征属性变化对调控系统运行状态影响的范围。
一种调控系统运行状态分析模型构建装置,包括数据获取模块、第一数据处理模块、第二数据处理模块、第三数据处理模块、第四数据处理模块、图谱构建模块、图谱补全模块、特征提取模块和模型构建模块。
数据获取模块,用于获取调控系统的运行数据,其中,所述运行数据包括结构化数据和半结构化数据;
第一数据处理模块,用于将所述结构化数据进行数据转换,构建第一三元组数据;
第二数据处理模块,用于将所述半结构化数据进行数据预处理,获得有效文本数据;
第三数据处理模块,用于将所述有效文本数据进行知识抽取,构建第二三元组数据;
第四数据处理模块,用于将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;
图谱构建模块,用于将所述第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;
图谱补全模块,用于对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;
特征提取模块,用于根据所述第二运行状态知识图谱进行特征提取,得到训练特征向量;
模型构建模块,用于根据所述训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示的步骤S104,将结构化数据进行数据转换,构建第一三元组数据;步骤S106,将半结构化数据进行数据预处理,获得有效文本数据;步骤S108,将有效文本数据进行知识抽取,构建第二三元组数据;步骤S110,将第一三元组数据和第二三元组数据进行知识融合,构建第三三元组数据,其中,第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;步骤S112,将第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;步骤S114,对第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;步骤S116,根据第二运行状态知识图谱进行特征提取,得到训练特征向量;步骤S118,根据训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
描述了根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
Claims (10)
1.一种调控系统运行状态分析模型构建方法,其特征在于,包括:
获取调控系统的运行数据,其中,所述运行数据包括结构化数据和半结构化数据;
将所述结构化数据进行数据转换,构建第一三元组数据;
将所述半结构化数据进行数据预处理,获得有效文本数据;
将所述有效文本数据进行知识抽取,构建第二三元组数据;
将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,其中,所述第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;
将所述第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;
对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;
根据所述第二运行状态知识图谱进行特征提取,得到训练特征向量;
根据所述训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
2.根据权利要求1所述的调控系统运行状态分析模型构建方法,其特征在于,所述半结构化数据包括:历史运行告警数据和状态监测信息数据。
3.根据权利要求1所述的调控系统运行状态分析模型构建方法,其特征在于,所述将所述半结构化数据进行数据预处理,获得有效文本数据,包括:根据正则表达式对所述半结构化数据进行筛选,去除非文本内容以及与调控系统无关的内容,获得所述有效文本数据。
4.根据权利要求1至3任一权利要求所述的调控系统运行状态分析模型构建方法,其特征在于,所述将所述有效文本数据进行知识抽取,构建第二三元组数据,包括:
通过LSTM+CRF机器学习模型对所述有效文本数据进行命名实体识别,获得实体数据集;
通过依存关系模型对所述实体数据集进行属性、关系抽取,构建实体属性关系数据集;
根据所述实体属性关系数据集构建所述第二三元组数据。
5.根据权利要求1所述的调控系统运行状态分析模型构建方法,其特征在于,所述将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,包括:
对所述第一三元组数据与所述第二三元组数据进行实体消歧和共指消解,获得处理后的数据;
对所述处理后的数据进行三元组知识转换,构建第三三元组数据。
6.根据权利要求1所述的调控系统运行状态分析模型构建方法,其特征在于,所述对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱,包括:
获取待补全的第一运行状态知识图谱;
通过训练好的概率预测模型对所述待补全的第一运行状态知识图谱的缺失部分进行预测,获得多个预测结果及每个预测结果对应的概率;
将概率最大的预测结果作为最终预测值对所述待补全的第一运行状态知识图谱的缺失部分进行补全,生成第二运行状态知识图谱。
7.根据权利要求1所述的调控系统运行状态分析模型构建方法,其特征在于,所述运行状态分析模型用于分析调控系统中实体对象之间的关系,以及分析实体对象的特征属性变化对调控系统运行状态影响的范围。
8.一种调控系统运行状态分析模型构建装置,其特征在于,包括:
数据获取模块,用于获取调控系统的运行数据,其中,所述运行数据包括结构化数据和半结构化数据;
第一数据处理模块,用于将所述结构化数据进行数据转换,构建第一三元组数据;
第二数据处理模块,用于将所述半结构化数据进行数据预处理,获得有效文本数据;
第三数据处理模块,用于将所述有效文本数据进行知识抽取,构建第二三元组数据;
第四数据处理模块,用于将所述第一三元组数据和所述第二三元组数据进行知识融合,构建第三三元组数据,其中,所述第三三元组数据包括实体-关系-实体三元组数据和实体-属性-属性值三元组数据;
图谱构建模块,用于将所述第三三元组数据导入Neo4j数据库,构建第一运行状态知识图谱;
图谱补全模块,用于对所述第一运行状态知识图谱中缺失的实体、属性和关系的部分进行图谱补全,生成第二运行状态知识图谱;
特征提取模块,用于根据所述第二运行状态知识图谱进行特征提取,得到训练特征向量;
模型构建模块,用于根据所述训练特征向量对预设的机器学习模型进行训练,获得运行状态分析模型。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求 1~7中任意一项所述调控系统运行状态分析模型构建方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任意一项所述的调控系统运行状态分析模型构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210598867.6A CN115222058A (zh) | 2022-05-30 | 2022-05-30 | 调控系统运行状态分析模型构建方法及装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210598867.6A CN115222058A (zh) | 2022-05-30 | 2022-05-30 | 调控系统运行状态分析模型构建方法及装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115222058A true CN115222058A (zh) | 2022-10-21 |
Family
ID=83607512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210598867.6A Pending CN115222058A (zh) | 2022-05-30 | 2022-05-30 | 调控系统运行状态分析模型构建方法及装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115222058A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116355A (zh) * | 2023-08-30 | 2023-11-24 | 中国农业科学院农业信息研究所 | 一种优异多效基因的挖掘方法、装置、设备及介质 |
-
2022
- 2022-05-30 CN CN202210598867.6A patent/CN115222058A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116355A (zh) * | 2023-08-30 | 2023-11-24 | 中国农业科学院农业信息研究所 | 一种优异多效基因的挖掘方法、装置、设备及介质 |
CN117116355B (zh) * | 2023-08-30 | 2024-02-20 | 中国农业科学院农业信息研究所 | 一种优异多效基因的挖掘方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230004721A1 (en) | Method for training semantic representation model, device and storage medium | |
KR101542195B1 (ko) | 비정형 데이터로부터 특성을 추출하여 지식 베이스를 구축하는 시스템 및 방법 | |
US20140122535A1 (en) | Extracting Semantic Relationships from Table Structures in Electronic Documents | |
WO2023221408A1 (zh) | 深度学习框架的算子处理方法、装置、设备和存储介质 | |
CN111859969B (zh) | 数据分析方法及装置、电子设备、存储介质 | |
CN115170344A (zh) | 调控系统运行事件智能处理方法及装置、介质及设备 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN113656590B (zh) | 行业图谱的构建方法、装置、电子设备及存储介质 | |
CN107103363A (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN114281968B (zh) | 一种模型训练及语料生成方法、装置、设备和存储介质 | |
CN112287114A (zh) | 一种知识图谱服务处理方法和装置 | |
US20220129635A1 (en) | Semantic model instantiation method, system and apparatus | |
CN110727659A (zh) | 基于sql语句的决策树模型生成方法、装置、设备及介质 | |
CN111930912A (zh) | 对话管理方法及系统、设备和存储介质 | |
CN115222058A (zh) | 调控系统运行状态分析模型构建方法及装置、介质及设备 | |
CN115062617A (zh) | 基于提示学习的任务处理方法、装置、设备及介质 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
CN111400414B (zh) | 一种基于标准化企业数据的决策方法、系统及电子设备 | |
CN116611813B (zh) | 一种基于知识图谱的智能运维管理方法及系统 | |
CN116992051A (zh) | 一种电网调度业务的知识图谱构建方法和装置 | |
CN117473054A (zh) | 基于知识图谱的通用智能问答方法及装置 | |
CN115983383A (zh) | 面向电力设备的实体关系抽取方法及相关装置 | |
CN115269862A (zh) | 一种基于知识图谱的电力问答与可视化系统 | |
CN115238009A (zh) | 基于血缘分析的元数据管理方法、装置、设备及存储介质 | |
CN114328956A (zh) | 文本信息的确定方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |