CN113762716B - 基于深度学习和注意力的台区运行状态评估方法及系统 - Google Patents
基于深度学习和注意力的台区运行状态评估方法及系统 Download PDFInfo
- Publication number
- CN113762716B CN113762716B CN202110870930.2A CN202110870930A CN113762716B CN 113762716 B CN113762716 B CN 113762716B CN 202110870930 A CN202110870930 A CN 202110870930A CN 113762716 B CN113762716 B CN 113762716B
- Authority
- CN
- China
- Prior art keywords
- state
- running state
- platform
- data
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 44
- 230000008859 change Effects 0.000 claims abstract description 35
- 238000012512 characterization method Methods 0.000 claims abstract description 32
- 230000007246 mechanism Effects 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000013210 evaluation model Methods 0.000 claims abstract description 16
- 238000013136 deep learning model Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 51
- 230000015654 memory Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000008570 general process Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Probability & Statistics with Applications (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
Abstract
本发明提出了一种基于深度学习和注意力的台区运行状态评估方法及系统,包括:获取台区运行状态序列数据及潜在影响因素序列数据;基于所获取的数据进行特征提取,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,得到与台区状态变化相关的状态上下文特征;基于状态上下文特征进行联合分布嵌入,获得联合嵌入表征;基于联合嵌入表征进行融合注意力机制的深度学习模型训练,获得评估模型,基于该模型进行台区运行状态评估。
Description
技术领域
本发明属于电力信息处理的技术领域,尤其涉及基于深度学习和注意力的台区运行状态评估方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着智能电网的深入发展,用户对电能质量的要求也不断提高。部分台区由于配电网结构复杂、规模巨大、不确定因素较多等因素的影响,无法保证用户用电的质量。这些问题如果没有得到及时发现和解决,会对用户的用电体验造成很大的影响。如何准确评估台区的运行状态,为台区科学管理提供决策支撑,是需要解决的一个关键问题。
在对台区进行运行状态评估时,面临着一些问题和挑战,包括:
台区运行中产生大量的数据、指标等,这些运行数据从不同维度表征台区的运行状态,这些运行数据具有不同的物理意义,具有不同的含义,如何选择合适的运行数据对台区运行状态进行评估,是需要解决的首要问题。
另外,影响或表征台区运行状态的运行数据之间存在着复杂的关联关系,同时,这些运行数据影响或表征台区运行状态的重要程度不同,这些都对台区运行状态评估带来了困难。
同一运行数据在台区运行的不同时刻,表征着台区运行的运行状态,不同时刻运行数据对台区运行状态的影响权重是不同的。为实现对台区运行状态的准确评估,需要准确度量不同时刻不同因素的影响程度。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于深度学习和注意力的台区运行状态评估方法,能够确保台区运行状态评估的准确性。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
第一方面,公开了一种基于深度学习和注意力的台区运行状态评估方法,包括:
获取表征台区运行状态的运行数据序列及影响台区运行的潜在影响因素序列数据;
基于所获取的数据进行特征提取,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,抽取得到与台区运行状态变化的相关的状态上下文特征;
基于状态上下文特征进行联合分布嵌入,获得联合嵌入表征;
基于联合嵌入表征进行融合注意力机制的深度学习模型训练,获得评估模型,基于该模型进行台区运行状态评估。
进一步的技术方案,基于所获取的台区运行数据序列数据及潜在影响因素序列数据,首先进行数据预定义,然后进行数据规范化处理,接着进行特征相关统计量计算,基于计算的统计量获取筛选特征,基于筛选特征获得与台区状态变化相关的状态上下文特征。
进一步的技术方案,针对在给定时间区间范围的台区运行状态序列数据和各个潜在影响因素的序列数据,基于Person相关选择影响台区运行状态评估变化的特征选择,消除特征的冗余并提取与台区运行状态评估变化高关联度的特征,在台区运行过程中,筛选特征与台区运行状态评估之间的相关统计量随着时间的变化而改变。
进一步的技术方案,通过公开数据服务,如天气预报网等,采集台区潜在影响因素序列数据,包括温度、雷雨、风力及雾霾影响因素;
对采集的上述影响因素数据进行向量化,转换为对应的影响因素向量,在一个时间间隔内的变化可构成一个轨迹数据。
进一步的技术方案,所述台区运行数据序列获取时,首先获得台区在某时刻产生的运行向量,以及其在一个时间区间内的变化可构成运行数据变化的轨迹数据。
进一步的技术方案,所述特征提取的具体过程是:
针对N个不同的台区,定义任一台区的运行状态向量变化,以及其对应的状态上下文标识;
对上述台区运行状态向量进行规范化处理;
给定一个包含N个台区的样本集合,对每一个样本基于Person相关计算其与上下文特征中不同影响因素的相关度;
设置阈值,抽取Person相关系数超过阈值的某影响因素,将相关统计量大于阈值的影响因素作为筛选特征,基于筛选特征数据,获得抽取的特征。
进一步的技术方案,构建台区运行状态的联合分布嵌入表征的过程是:
获取台区运行状态向量序列数据及上下文特征数据,将特征数据映射为索引表示,构建特征-索引映射矩阵,得到对应的低维稠密的向量集合;
基于低维特征向量集合,构建由输入门、候选记忆单元、输出门和遗忘门组成的长短期记忆网络;
基于构建的长短期记忆网络,计算出一系列正向隐状态;
基于长短期记忆网络的隐状态数据,采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态,从而获得台区运行状态的联合分布嵌入表征。
进一步的技术方案,基于联合嵌入表征进行融合注意力机制的深度学习模型训练,以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入,通过注意力机制,基于特征之间相互影响以及特征内部之间时间因素影响复杂关联关系的考虑进行协同建模。
进一步的技术方案,基于联合嵌入表征进行融合注意力机制的深度学习模型训练,训练过程为:
利用台区运行状态向量序列数据及状态上下文特征,对其进行联合嵌入表征;
将得到的联合嵌入表征输入到双向长短期记忆网络中进行训练,其得到隐藏状态;
对于隐藏状态,通过Attention机制进行学习,并通过Softmax函数得到目前时刻台区的二元运行状态良好、糟糕的概率;
通过不断迭代,直到模型收敛,或达到最大训练次数。
进一步的技术方案,针对某台区某一时间间隔内的运行状态向量序列和上下文序列,得到联合表征,然后输入评估模型,得到台区在此时间间隔结束时的运行状态。
第二方面,公开了一种基于深度学习和注意力的台区运行状态评估系统,包括:
特征提取模块,被配置为:基于所获取的数据进行特征提取,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,抽取得到与台区运行状态变化的相关的状态上下文特征,获取的数据为台区运行状态序列数据及潜在影响因素序列数据;
联合分布嵌入模块,被配置为:基于状态上下文特征进行联合分布嵌入,获得联合嵌入表征;
融合注意力机制的深度学习模块,被配置为:基于联合嵌入表征进行融合注意力机制的深度学习模型训练,学习台区运行状态序列数据和上下文特征的联合嵌入表征,获得评估模型;
台区运行状态评估模块,基于给定的台区运行状态序列和上下文状态序列,输入至评估模型,输出在序列结束时的台区运行状态评估结果。
以上一个或多个技术方案存在以下有益效果:
本发明通过基于深度学习的方法自动抽取与台区运行相关的特征,并通过注意力机制,实现对特征之间相互影响以及特征内部之间时间因素影响等复杂关联关系的协同建模,确保台区运行状态评估的准确性。
本发明通过对台区运行情况的分析,提取与台区运行状态评估变化相关的特征,将其作为台区运行状态评估的影响因素,将其与台区运行状态序列作为联合嵌入表征,以更好地表征台区运行状态的真实情况。
本发明通过双向长短期记忆网络深度学习方法,自动抽取与台区运行状态评估相关的特征,减少人工特征工程的不完备性。
本发明通过融合注意力机制,挖掘台区运行不同状态序列间相互影响,以及特征内部之间时间因素影响等复杂关联关系,提高台区运行状态评估的准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本公开实施例提供的基于深度学习和注意力的台区运行状态评估方法的整体流程图;
图2为本公开实施例提供的基于Relief算法的台区运行状态评估相关联的特提取流程图;
图3为本公开实例提供的台区运行状态序列数据与运行上下文特征序列数据的联合嵌入表征流程图;
图4为公开实施例提供的基于深度学习和注意力机制的台区运行状态评估生成图;
图5为本公开实施例提供的基于深度学习和注意力机制的台区运行状态评估生成装置结构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
如图1所示,本实施例公开了基于深度学习和注意力的台区运行状态评估方法,首先接收台区运行数据序列数据等运行状态信息和潜在影响台区运行状态评估的上下文特征序列数据,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,得到与台区运行状态变化相关的特征;
基于与台区运行状态评估变化相关的上下文特征,基于长短期记忆网络,构建台区运行状态的联合嵌入表征;
结合双向长短期记忆网络和注意力机制,构建台区运行状态评估模型,输入台区运行状态序列数据及其联合表征,输出为台区运行状态评估结果,对双向长短期记忆网络和注意力机制进行训练;
基于训练后的台区运行状态评估模型,输入台区运行的状态序列和上下文序列,得到台区运行状态评估。
具体步骤包括:
步骤A:采集台区运行的相关信息,包含台区运行中接收到的台区运行数据序列及台区设备运行环境数据,对获取的序列数据进行预处理,提取台区运行状态评估相关的特征数据。具体地,基于某台区为应用实例,将该台区某时间间隔内的台区运行的序列状态数据及台区运行的上下文数据作为训练样本。
特征提取的一般过程为:
A1.分析台区运行的各种影响因素。通过专家分析,从公开数据服务,如天气预报网等,得到如下潜在影响因素:温度、雷雨、风力、雾霾等。
表1台区运行的部分潜在影响因素
本发明对表1中的影响因素进行数据收集,并对其进行向量化,转换为对应的影响因素向量。对某台区cx,某时刻ti影响因素上下文可标识为
其在一个时间间隔[ti,tj]内的上下文变化可构成一个影响因素上下文序列,即轨迹数据
A2.台区运行状态数据收集及预处理。
为简便起见,对某台区cx,假定其在某时刻ti产生的运行状态向量为其在一个时间区间内的变化可构成状态变化的轨迹数据即台区状态向量序列为:
对于该台区,其评估状态序列为
A3.对不同台区的状态向量序列及对应的上下文序列进行规范化处理,进行影响因素的特征选择,消除特征的冗余并提取与台区运行状态评估变化高度关联的特征。
其中,对获取的台区状态向量序列进行预处理,包括缺失值处理、数据归一化,并采用卡方检验进行简单的相关性分析,消除重复影响因素及因子选择的任意性,降低问题的复杂度,从而消除台区运行状态评估影响因素特征的冗余。
针对在时间区间范围[ti,tj]的台区状态向量序列和各个潜在影响因素的变化/>基于Person相关选择影响台区运行状态评估变化的特征选择,消除特征的冗余并提取与台区运行状态评估变化高关联度的特征,在台区运行过程中,筛选特征与台区运行状态评估之间的相关统计量随着时间的变化而改变。
具体地,如图2所示,所述步骤A3中进行影响台区运行状态评估的特征选择的一般生成过程为:
A3.1.假定有N个不同的台区,第x个台区的状态向量变化定义为如公式(2)所示,其对应的状态上下文如公式(1)所示。
A3.2.对台区状态向量进行规范化处理,采用min-max标准化方法进行归一化处理,特征数据取值为[0,1]。
A3.3.给定一个包含N个台区的样本集合对每一个样本/>基于Person相关计算其与上下文特征/>中不同影响因素的相关度。
A3.4.设置阈值τ,抽取Person相关系数超过阈值τ的某影响因素将相关统计量大于阈值τ的影响因素作为筛选特征,记为/>基于选择数据,抽取的上下文特征数据为:
步骤B:
基于与台区运行状态变化相关的上下文特征,构建台区运行状态序列的联合分布嵌入表征,如图3所示,其构建台区运行状态的联合分布嵌入表征的一般过程为:
B1.基于步骤A获取台区运行状态向量序列数据及抽取的上下文特征数据采用embedding层将特征数据映射为索引表示,构建特征-索引映射矩阵A,通过embedding映射,得到对应的低维稠密的向量集合v={vi,vi+1,…,vj}。
式中,K为embedding层的维度,K=j-i,A∈R|C|·K表示特征映射矩阵,C为中相关影响因素的个数。Φ为针对台区运行状态数据/>与上下文特征数据的聚合函数,可以采用不同的聚合函数。
B2.基于低维特征向量集合v,构建由输入门、候选记忆单元、输出门和遗忘门组成的长短期记忆网络LSTM,模型构建原理过程如下:
ft=sigmoid(Wf·[ht-1,vt]+bf) (9)
it=sigmoid(Wi·[ht-1,vt]+bi) (10)
Ct=tanh(Wc·[ht-1,vt]+bc) (11)
Ct=ft×Ct-1+it×Ct (12)
ot=sigmoid(Wo·[ht-1,vt]+bo) (13)
ht=ot×tanh(Ct) (14)
式中,vt表示t时刻的输入向量,ht-1表示上一个时刻的输出向量,{Wf,Wi,Wc,Wo}为对应单元的权重系数矩阵,{bf,bi,bc,bo}为对应单元的偏移向量,sigmoid为激活函数,式(9)为遗忘门数据处理过程,t时刻遗忘门值由vt和ht-1计算获取,旨在对数据记录进行保留或遗弃;式(10)是以sigmoid函数激活Wi·[ht-1,vt]+bi细胞状态的值,式(11)是获取候选记忆单元的值;式(12)是以ft、it对候选记忆单元Ct-1、Ct进行取值调节;式(13)和式(14)是在t时刻由ht-1和vt进行的内部循环和更新,从而获取长短期记忆网络LSTM最后的隐状态的输出hj;
基于构建的LSTM,LSTM读取从vi到vj序列计算出一系列正向隐状态
B3.基于长短期记忆网络的隐状态数据,采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态Hj,即台区运行状态向量和上下文状态向量的联合嵌入表征。
台区cx运行状态的联合分布嵌入表征则为将其表征为:
式中,
步骤C:基于深度学习和注意力机制,构建台区运行状态评估学习模型,以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入,通过注意力机制,实现对特征之间相互影响以及特征内部之间时间因素影响等复杂关联关系的考虑和协同建模。如图4所示,基于深度学习和注意力机制的训练过程为:
C1.利用台区运行状态向量序列数据及状态上下文特征/>基于步骤B对其进行联合嵌入表征,得到/>
C2.将得到的联合嵌入表征输入到双向长短期记忆网络中进行训练,其得到隐藏状态{Hti,Hti+1,…,Htj}。
C3.对于隐藏状态{Hti,Hti+1,…,Htj},通过Attention机制进行学习,并通过Softmax函数得到目前时刻tj台区cx的二元运行状态良好(Good,G)、糟糕(Bad,B)的概率,输出为Status。
C4.不断迭代,直到模型收敛,或达到最大训练次数Num。
步骤D:
通过基于深度学习和注意力机制的台区运行状态评估模型,输入某台区cx某一时间间隔内的运行状态向量序列和上下文序列,得到联合表征,然后输入台区运行状态评估模型,得到台区在此时间间隔结束时的运行状态。其一般处理过程为:
D1.设台区cx运行状态向量序列为和上下文序列将其输入到联合嵌入模块中,得到联合嵌入表征/>
D2.将联合嵌入表征输入到台区运行状态评估模块中,得到台区cx在tj的评估Evaluation。
如图5所示,本实施例提供了一种基于深度学习和注意力的台区运行状态评估装置,包括:
特征提取模块,其用于从潜在影响因素序列数据中提取与台区运行状态序列数据变化关联度大于预设阈值的特征;
联合分布嵌入模块,其用于将台区运行状态序列数据与其相关的上下文特征进行联合表征;
融合注意力机制的深度学习模块,其用于学习台区运行状态序列数据和上下文特征的联合嵌入表征;
台区运行状态评估模块,其用于基于给定的台区运行状态序列和上下文状态序列,输出在序列结束时的台区运行状态评估,该评估结果可用于提示管理者进行必要的介入提醒。
在另一实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如图1所示的基于深度学习和注意力的台区运行状态评估方法中的步骤。
在又一实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示的基于深度学习和注意力的台区运行状态评估方法中的步骤。
以上实施例的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (6)
1.一种基于深度学习和注意力的台区运行状态评估方法,其特征是,包括:
获取台区运行状态序列数据及潜在影响因素序列数据;
基于所获取的数据进行特征提取,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,抽取得到与台区状态变化的相关的状态上下文特征;
基于状态上下文特征进行联合分布嵌入,获得联合嵌入表征;
基于联合嵌入表征进行融合注意力机制的深度学习模型训练,获得评估模型,基于该模型进行台区运行状态评估;
所述特征提取的具体过程是:
针对N个不同的台区,定义任一台区的状态向量变化,以及其对应的状态上下文标识;
对上述台区状态向量进行规范化处理;
给定一个包含N个台区的样本集合,对每一个样本基于Person相关计算其与上下文特征中不同影响因素的相关度;
设置阈值,抽取Person相关系数超过阈值的某影响因素,将相关统计量大于阈值的影响因素作为筛选特征,基于筛选特征数据,获得抽取的特征;
构建台区运行状态的联合分布嵌入表征的过程是:
获取台区运行状态向量序列数据及上下文特征数据,将特征数据映射为索引表示,构建特征-索引映射矩阵,得到对应的低维稠密的向量集合;
基于低维特征向量集合,构建由输入门、候选记忆单元、输出门和遗忘门组成的长短期记忆网络;
基于构建的长短期记忆网络,计算出一系列正向隐状态;
基于长短期记忆网络的隐状态数据,采用数据加权求和获取最终台区运行状态向量和上下文状态向量的组合隐状态,从而获得台区运行状态的联合分布嵌入表征;
基于联合嵌入表征进行融合注意力机制的深度学习模型训练,以不同台区的运行状态向量序列数据和上下文特征向量序列数据的嵌入表征作为输入,通过注意力机制,基于特征之间相互影响以及特征内部之间时间因素影响复杂关联关系的考虑进行协同建模;
基于联合嵌入表征进行融合注意力机制的深度学习模型训练,训练过程为:
利用台区运行状态向量序列数据及状态上下文特征,对其进行联合嵌入表征;
将得到的联合嵌入表征输入到双向长短期记忆网络中进行训练,其得到隐藏状态;
对于隐藏状态,通过Attention机制进行学习,并通过Softmax函数得到目前时刻台区的二元运行状态良好、糟糕的概率;
通过不断迭代,直到模型收敛,或达到最大训练次数。
2.如权利要求1所述的一种基于深度学习和注意力的台区运行状态评估方法,其特征是,基于所获取的台区运行状态序列数据及潜在影响因素序列数据,首先进行数据预定义,然后进行数据规范化处理,接着进行特征相关统计量计算,基于计算的统计量获取筛选特征,基于筛选特征获得与台区状态变化相关的状态上下文特征。
3.如权利要求1所述的一种基于深度学习和注意力的台区运行状态评估方法,其特征是,针对某台区某一时间间隔内的运行状态向量序列和上下文序列,得到联合表征,然后输入评估模型,得到台区在此时间间隔结束时的运行状态。
4.一种基于深度学习和注意力的台区运行状态评估系统,执行如权利要求1-3任一项所述的基于深度学习和注意力的台区运行状态评估方法,其特征是,包括:
特征提取模块,被配置为:基于所获取的数据进行特征提取,提取与台区运行状态评估变化关联度大于预设关联度阈值的特征,抽取得到与台区状态变化的相关的状态上下文特征,获取的数据为台区运行状态序列数据及潜在影响因素序列数据;
联合分布嵌入模块,被配置为:基于状态上下文特征进行联合分布嵌入,获得联合嵌入表征;
融合注意力机制的深度学习模块,被配置为:基于联合嵌入表征进行融合注意力机制的深度学习模型训练,学习台区运行状态序列数据和上下文特征的联合嵌入表征,获得评估模型;
台区运行状态评估模块,基于给定的台区运行状态序列和上下文状态序列,输入至评估模型,输出在序列结束时的台区运行状态评估结果。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-3任一所述的基于深度学习和注意力的台区运行状态评估方法中的步骤。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-3任一所述的基于深度学习和注意力的台区运行状态评估方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110870930.2A CN113762716B (zh) | 2021-07-30 | 2021-07-30 | 基于深度学习和注意力的台区运行状态评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110870930.2A CN113762716B (zh) | 2021-07-30 | 2021-07-30 | 基于深度学习和注意力的台区运行状态评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113762716A CN113762716A (zh) | 2021-12-07 |
CN113762716B true CN113762716B (zh) | 2023-07-25 |
Family
ID=78788207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110870930.2A Active CN113762716B (zh) | 2021-07-30 | 2021-07-30 | 基于深度学习和注意力的台区运行状态评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113762716B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114548510A (zh) * | 2022-01-18 | 2022-05-27 | 国网江西省电力有限公司南昌供电分公司 | 基于混合注意力机制的电力负荷预测方法及系统 |
CN114565779B (zh) * | 2022-04-08 | 2022-08-05 | 武汉中原电子信息有限公司 | 一种低压台区户变拓扑辨识方法及系统 |
CN114897111B (zh) * | 2022-07-15 | 2022-09-30 | 深圳市协和传动器材有限公司 | 一种用于监控间歇式凸轮分割器运行状况的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861032A (zh) * | 2020-07-29 | 2020-10-30 | 广州海关技术中心 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492866A (zh) * | 2018-10-08 | 2019-03-19 | 南昌科晨电力试验研究有限公司 | 一种配电网运行状态智能评估方法 |
AU2018101514A4 (en) * | 2018-10-11 | 2018-11-15 | Chi, Henan Mr | An automatic text-generating program for Chinese Hip-hop lyrics |
US11727243B2 (en) * | 2019-01-30 | 2023-08-15 | Baidu Usa Llc | Knowledge-graph-embedding-based question answering |
CN110288157A (zh) * | 2019-06-27 | 2019-09-27 | 电子科技大学 | 一种基于注意力机制和lstm的径流预测方法 |
CN110287495A (zh) * | 2019-07-01 | 2019-09-27 | 国网江苏省电力有限公司电力科学研究院 | 一种电力营销专业词识别方法及系统 |
CN110674772B (zh) * | 2019-09-29 | 2022-08-05 | 国家电网有限公司技术学院分公司 | 电力作业现场智能安全管控辅助系统及方法 |
CN112685207A (zh) * | 2019-10-18 | 2021-04-20 | 伊姆西Ip控股有限责任公司 | 错误评估的方法、设备和计算机程序产品 |
CN111488734B (zh) * | 2020-04-14 | 2022-02-22 | 西安交通大学 | 基于全局交互和句法依赖的情感特征表示学习系统及方法 |
CN111582571A (zh) * | 2020-04-30 | 2020-08-25 | 中国电力科学研究院有限公司 | 模型驱动和数据驱动融合的电网运行态势感知方法及系统 |
CN111695779B (zh) * | 2020-05-14 | 2023-03-28 | 华南师范大学 | 一种知识追踪方法、装置及存储介质 |
CN112132430B (zh) * | 2020-09-14 | 2022-09-27 | 国网山东省电力公司电力科学研究院 | 一种配电主设备分布式状态传感器可靠性评估方法及系统 |
CN112215230A (zh) * | 2020-09-18 | 2021-01-12 | 支付宝实验室(新加坡)有限公司 | 一种信息审核方法、装置及电子设备 |
CN112990500B (zh) * | 2021-04-01 | 2022-12-23 | 国网山东省电力公司营销服务中心(计量中心) | 基于改进加权灰色关联分析的台区线损分析方法及系统 |
CN112926322A (zh) * | 2021-04-28 | 2021-06-08 | 河南大学 | 融合自注意力机制和深度学习的文本分类方法及系统 |
-
2021
- 2021-07-30 CN CN202110870930.2A patent/CN113762716B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861032A (zh) * | 2020-07-29 | 2020-10-30 | 广州海关技术中心 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113762716A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113762716B (zh) | 基于深度学习和注意力的台区运行状态评估方法及系统 | |
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
Stephenson et al. | Bayesian inference for extremes: accounting for the three extremal types | |
Yang et al. | A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region | |
Li et al. | An integrated missing-data tolerant model for probabilistic PV power generation forecasting | |
CN111144644B (zh) | 基于变分异方差高斯过程回归的短期风速预测方法 | |
CN111160626B (zh) | 一种基于分解融合的电力负荷时间序列控制方法 | |
CN112100911B (zh) | 一种基于深度bilstm的太阳辐射预测方法 | |
CN114492922A (zh) | 一种中长期发电量预测方法 | |
CN116628510A (zh) | 一种自训练可迭代的人工智能模型训练方法 | |
Li et al. | GMM-HMM-based medium-and long-term multi-wind farm correlated power output time series generation method | |
Sánchez et al. | Obtaining transparent models of chaotic systems with multi-objective simulated annealing algorithms | |
CN116245259B (zh) | 基于深度特征选择的光伏发电预测方法、装置和电子设备 | |
CN116760017A (zh) | 一种光伏发电的预测方法 | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统 | |
CN112348700B (zh) | 一种结合som聚类与ifou方程的线路容量预测方法 | |
El Marghichi | A Solar PV Model Parameter Estimation Based on the Enhanced Self-Organization Maps | |
CN113723707A (zh) | 一种基于深度学习模型的中长期径流趋势预测方法 | |
El Genidy et al. | Algorithms of solar energy prediction combined with percentile root estimation of three-parameters distributions | |
Lee et al. | Teaching and learning the AI modeling | |
CN117688367B (zh) | 一种基于即时学习的风力发电超短期功率预测方法及装置 | |
Hwang et al. | CC-GAIN: Clustering and Classification-Based Generative Adversarial Imputation Network for Missing Electricity Consumption Data Imputation | |
Emmanuel Cruz de la Cruz et al. | Prediction of power of a photovoltaic system in height using hybrid models of Shinkrage regularization with RFE and SFS | |
Jeon et al. | Experimental validation of an LSTM-based solar irradiance forecasting model | |
Chen et al. | A novel prediction approach for runoff based on hybrid HMM-SVM Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |