CN117472898A - 一种基于融合的配电网异常数据纠错方法及系统 - Google Patents
一种基于融合的配电网异常数据纠错方法及系统 Download PDFInfo
- Publication number
- CN117472898A CN117472898A CN202311797861.2A CN202311797861A CN117472898A CN 117472898 A CN117472898 A CN 117472898A CN 202311797861 A CN202311797861 A CN 202311797861A CN 117472898 A CN117472898 A CN 117472898A
- Authority
- CN
- China
- Prior art keywords
- data
- power
- abnormal
- target
- distribution network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 325
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012937 correction Methods 0.000 title claims abstract description 40
- 230000004927 fusion Effects 0.000 title claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 28
- 230000005611 electricity Effects 0.000 claims description 25
- 230000010354 integration Effects 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于融合的配电网异常数据纠错方法及系统,方法包括采集配电网数据判断配电网数据中是否存在异常数据;若配电网数据中存在第二功率异常数据,则获取功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将功率数据序列划分为正常功率数据子序列以及异常功率数据子序列;将正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;将异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至第一目标LSTM模型中,得到预测功率数据,并将预测功率数据替换某一异常功率数据。实现了有选择地针对不同的数据采用不同地纠错方式,使得纠错结果更准确。
Description
技术领域
本发明属于配电网数据处理技术领域,尤其涉及一种基于融合的配电网异常数据纠错方法及系统。
背景技术
随着电网及电气测量技术的发展,目前的电压监测点和负荷监测点采集电流电压的装置在配电网中安装使用也越来越普遍,多业务系统采集的数据量急剧增加,电力系统中积累的数据量现已呈现爆炸性增长态势。与此同时,在获取到的海量电网数据中,数据质量较低,存在较多的存在冗余和偏差现象,给电网公司线损分析工作带来了很大的困难。传统的配电网异常数据辨识与纠错方法已不能适应如今海量的电网数据。
在配电网异常数据辨识方面,常用的方法是功率与电量对比分析法,通过计算功率积分与电量的偏差率,当偏差率大于阈值,即认为配电网存在异常数据。然而这一辨识方法的评价指标过于单一,且精度有限,并不能全面反映配电网数据的真实水平。
在配电网异常数据纠错方面,常采用均值分析法、线性插值法等来对配电网异常数据进行纠错,然而上述方法仅适用于数据量较少的情况,对于配电网中的海量数据,上述方法的纠错结果并不能很好的匹配数据。
发明内容
本发明提供一种基于融合的配电网异常数据纠错方法及系统,用于解决现有方法适用于数据量较少的情况,对于配电网中的海量数据无法很好匹配的技术问题。
第一方面,本发明提供一种基于融合的配电网异常数据纠错方法,包括:
采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据;
若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
第二方面,本发明提供一种基于融合的配电网异常数据纠错系统,包括:
采集模块,配置为采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断模块,配置为判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据;
第一替换模块,配置为若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
划分模块,配置为若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
训练模块,配置为将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
第二替换模块,配置为将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的基于融合的配电网异常数据纠错方法的步骤。
第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行本发明任一实施例的基于融合的配电网异常数据纠错方法的步骤。
本申请的基于融合的配电网异常数据纠错方法及系统,采集配电网数据,并判断配电网数据中是否存在异常数据,异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据,对比传统的容量与电量匹配分析法,考虑的因素以及评价指标更加全面,且辨识精度更高,能更加准确地反映配电网数据的水平;而且在配电网数据中存在第一功率异常数据时,采用目标日异常功率平均值替换功率数据序列中所有的异常功率数据,在配电网数据中存在第二功率异常数据,采用LSTM 模型得到的预测功率数据替换某一异常功率数据,实现了有选择地针对不同的数据采用不同地纠错方式,得到了更加准确,更加有说服力地纠错结果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种基于融合的配电网异常数据纠错方法的流程图;
图2为本发明一实施例提供的一种基于融合的配电网异常数据纠错系统的结构框图;
图3是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本申请的一种基于融合的配电网异常数据纠错方法的流程图。
如图1所示,基于融合的配电网异常数据纠错方法具体包括以下步骤:
步骤S101,采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据。
步骤S102,判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据。
在本步骤中,基于功率积分结果与目标日电量偏差率大于指定阈值判断配电网数据中是否存在异常数据;基于容量按照功率因数为0.9计算的日电量,目标日电量大于基于容量计算的日电量判断配电网数据中是否存在异常数据;和/或基于利用箱线图直接对目标日电量数据进行异常检测判断配电网数据中是否存在异常数据。
需要说明的是,基于功率积分结果与目标日电量偏差率大于指定阈值判断配电网数据中是否存在异常数据包括:
给定目标阈值,计算功率积分结果与目标日电量偏差率= |目标日功率积分值-目标日电量| /目标日电量,当功率积分结果与目标日电量偏差率大于目标阈值时,即认为配电网数据中存在异常数据。
基于容量按照功率因数为0.9计算的日电量,目标日电量大于基于容量计算的日电量判断配电网数据中是否存在异常数据包括:
基于容量计算的日电量=变压器额定容量*0.9*24小时,当目标日电量大于基于容量计算的日电量时,即认为配电网数据中存在异常数据。
基于利用箱线图直接对目标日电量数据进行异常检测判断配电网数据中是否存在异常数据包括:
对目标日电量数据序列中的各个日电量数据按从小到大的顺序进行排序,分别取第一个数为最小值;取25%位置的数为第一分位数;取50%位置的数为中位数;取75%位置的数为第三分位数,取最后一个数为最大值共计五个统计量;
计算目标差值=第三分位数–第一分位数;
计算目标上限=第三分位数+ 3*目标差值;
计算目标下限=第一分位数–3*目标差值;
当目标日电量数据序列中的某一个日电量数据大于目标上限的值或小于目标下限的值,即将某一个日电量数据视为异常数据。
在实际应用中,若配电网数据中存在电量数据异常数据,则获取目标日电量数据序列中各个异常电量数据的位置,并根据各个异常电量数据的位置将目标日电量数据序列划分为正常电量数据子序列以及异常电量数据子序列;将正常电量数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第二目标LSTM模型;将异常电量数据子序列中与某一异常电量数据关联的至少一个正常电量数据输入至第二目标LSTM模型中,得到预测用电量数据,并将预测用电量数据替换某一异常电量数据,其中,至少一个正常电量数据为正常电量数据子序列中且时间节点为某一异常电量数据之前的连续五个正常电量数据。
步骤S103,若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据。
在本步骤中,异常功率数据数量大于总的功率数据数量的5%,也就是正常功率数据数量占总的功率数据数据必须大于95%。
步骤S104,若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据。
步骤S105,将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型。
在本步骤中,LSTM神经网络共有五层,第一层是第一LSTM层,设置了100个神经元;第二层是Dropout层,参数设置为0.4;第三层是第二LSTM层,设置了120个神经元;第四层是Dropout层,参数设置为0.4;最后一层是Dense层,参数设置为1。
步骤S106,将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
综上,本申请的方法,采集配电网数据,并判断配电网数据中是否存在异常数据,异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据,对比传统的容量与电量匹配分析法,考虑的因素以及评价指标更加全面,且辨识精度更高,能更加准确地反映配电网数据的水平;而且在配电网数据中存在第一功率异常数据时,采用目标日异常功率平均值替换功率数据序列中所有的异常功率数据,在配电网数据中存在第二功率异常数据,采用LSTM 模型得到的预测功率数据替换某一异常功率数据,实现了有选择地针对不同的数据采用不同地纠错方式,得到了更加准确,更加有说服力地纠错结果。
在一个具体实施例中,基于融合的配电网异常数据纠错方法具体为:
1. 获取配电网中 天电量数据/>,需要注意的是,/>为第j天的电量数据,下角标的取值范围是/>;
2. 采用多方法融合辨识异常数据
(1)功率与电量对比分析法:
a.定义目标日功率积分与目标日电量偏差率,计算/>的表达式为:
,(1)
式中,表示第j天t 时刻的功率,可直接获取,由于目标日电量数据来源于表计设备,单位是千瓦时,这里为了便于计算,对 /> 进行0-24小时共计一天时间进行积分。
b.判断是否存在异常数据。
,(2)
式中,表示取值范围在0-1之间的目标阈值,可根据实际情况制定,/>表示配电网目标日数据中存在异常数据,/>表示配电网目标日数据中不存在异常数据。
c. 检查配电网目标日中功率数据是否存在缺失,如果功率数据缺失,认为配电网目标日中功率数据异常;如果功率数据没有缺失,认为配电网目标日中电量数据异常。
d. 对不同的目标日数据重复上述的a, b, c 步骤。
(2)容量与电量匹配分析法:
a. 定义基于容量计算的目标日电量。
,(3)
式中,表示变压器额定容量,可直接获取。
b.判断是否存在异常数据。
,(4)
式中,表示目标日电量数据满足容量与电量匹配分析法中异常数据的判定,/>表示目标日电量数据不满足容量与电量匹配分析法中异常数据的判定。
c. 对不同的目标日数据重复上述的a, b步骤。
(3)箱线图分析法:
a. 在对目标日电量数据进行箱线图分析之前,需要对电量数据 进行从小到大的排序,得到统计电量数据/>,各个统计电量数据满足下述关系:
,(5)
需要注意的是,对于单个统计电量数据 ,下角标的取值范围是。
b. 定义中间变量目标差值。
,(6)
式中,表示统计电量数据/>中的第一分位数,是式(5)中25%位置的数据,/>表示统计电量数据/>中的第3分位数,是式(5)中75%位置的数据。
c. 判断是否存在异常数据。
,(7)
式中,表示目标日电量数据满足容量与电量匹配分析法中异常数据的判定,/>表示目标日电量数据不满足容量与电量匹配分析法中异常数据的判定。
d. 对不同的目标日数据重复上述的a, b, c步骤。
(4)三种方法融合
,(8)
其中,式(8)中的表示表示配电网目标日数据中存在异常数据,/>表示配电网目标日数据中不存在异常数据。式(8)也表明了只要配电网目标日数据满足三种辨识方法的任意一个即认为配电网目标日中存在异常数据。
3. 替换异常数据
配电网中的数据异常主要分为三类,下面我们针对这三类异常分别进行处理。
(1)功率数据较多异常
a. 对目标日功率数据进行分类 。
,(9)
式中,表示目标日异常功率数据的集合,/>表示目标日正常功率数据的集合,表示所有目标日功率数据的集合。
b. 计算目标日异常功率产生总电量。
,(10)
c. 计算目标日异常功率平均值。
,(11)
d. 用目标日异常功率平均值替换所有的目标日异常功率/>。
,(12)
e. 对不同的目标日数据重复上述的a, b, c, d步骤。
(2)功率数据较少异常
a. 对所有的功率数据进行分类,定义异常功率数据的的个数为m,目标日正常功率数据的个数为n。
,(13)
b. 为了便于后续表示,将正常功率数据重新定义为/>。
,(14)
,(15)
c. 利用LSTM模型训练正常功率数据,LSTM的计算流程如下所示:
,(16)
,(17)
,(18)
,(19)
,(20)
,(21)
,(22)
,(23)
式中,、/>、/>分别代表遗忘门,输入门和输出门,/>表示第x个输出,/>表示第x–1个输出,/>表示细胞状态,/>表示候补细胞状态,/>和/>分别表示权重向量和偏置向量,/>和/>表示的是激活函数。
本步骤中,为了提高LSTM神经网络的预测精度,训练集和测试集均进行归一化处理;与之相对应的,LSTM神经网络输出的预测数据,在被输出前对应的进行反归一化处理;
本步骤中,所构建的LSTM神经网络共有五层,第一层是第一LSTM层,设置了100个神经元;第二层是Dropout层,参数设置为0.4;第三层是第二LSTM层,设置了120个神经元;第四层是Dropout层,参数设置为0.4;最后一层是Dense层,由于只需要输出一维数据,因此设置为1。
本步骤中,利用for循环将每个子序列的第1个至第5个数据作为第一组输入,第6个数据作为第一组数据的标签;将第2个至第7个数据作为第二组输入,第8个数据作为第二组数据的标签;以此类推,直到第x-6个至x-1个数据作为输入,第x个输入作为最后一组数据的标签,循环结束。模型的迭代次数设置为200。
d. 在训练好的LSTM模型中输入异常功率数据的前五个正常功率数据,得到基于正常功率数据趋势预测的功率数据。
e.用预测功率数据代替异常功率数据。
,(24)
,(25)
(3)电量数据较少异常
电量数据较少异常的处理流程与上述功率数据较少异常的处理流程基本相同。由于电量数据与功率数据的长度不一致,这里仅对LSTM模型内部的参数进行更改,其它的计算流程同上述功率数据较少异常的处理流程。
本步骤中,所构建的LSTM神经网络共有五层,第一层是第一LSTM层,设置了50个神经元;第二层是Dropout层,参数设置为0.4;第三层是第二LSTM层,设置了60个神经元;第四层是Dropout层,参数设置为0.4;最后一层是Dense层,由于只需要输出一维数据,因此设置为1。
请参阅图2,其示出了本申请的一种基于融合的配电网异常数据纠错系统的结构框图。
如图2所示,配电网异常数据纠错系统200,包括采集模块210、判断模块220、第一替换模块230、划分模块240、训练模块250以及第二替换模块260。
其中,采集模块210,配置为采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;判断模块220,配置为判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数;第一替换模块230,配置为若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;划分模块240,配置为若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;训练模块250,配置为将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;第二替换模块260,配置为将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
应当理解,图2中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行上述任意方法实施例中的基于融合的配电网异常数据纠错方法;
作为一种实施方式,本发明的计算机可读存储介质存储有计算机可执行指令,计算机可执行指令设置为:
采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据,
若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于融合的配电网异常数据纠错系统的使用所创建的数据等。此外,计算机可读存储介质可以包括高速随机存取存储器,还可以包括存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至基于融合的配电网异常数据纠错系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图3是本发明实施例提供的电子设备的结构示意图,如图3所示,该设备包括:一个处理器310以及存储器320。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例基于融合的配电网异常数据纠错方法。输入装置330可接收输入的数字或字符信息,以及产生与基于融合的配电网异常数据纠错系统的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
上述电子设备可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于基于融合的配电网异常数据纠错系统中,用于客户端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据,
若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于融合的配电网异常数据纠错方法,其特征在于,包括:
采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据;
若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
2.根据权利要求1所述的一种基于融合的配电网异常数据纠错方法,其特征在于,所述判断所述配电网数据中是否存在异常数据包括:
基于功率积分结果与目标日电量偏差率大于指定阈值判断所述配电网数据中是否存在异常数据;
基于容量按照功率因数为0.9计算的日电量,目标日电量大于基于容量计算的日电量判断所述配电网数据中是否存在异常数据;和/或
基于利用箱线图直接对目标日电量数据进行异常检测判断所述配电网数据中是否存在异常数据。
3.根据权利要求2所述的一种基于融合的配电网异常数据纠错方法,其特征在于,所述基于功率积分结果与目标日电量偏差率大于指定阈值判断所述配电网数据中是否存在异常数据包括:
给定目标阈值,计算功率积分结果与目标日电量偏差率= |目标日功率积分值-目标日电量| /目标日电量,当功率积分结果与目标日电量偏差率大于目标阈值时,即认为配电网数据中存在异常数据。
4.根据权利要求2所述的一种基于融合的配电网异常数据纠错方法,其特征在于,所述基于容量按照功率因数为0.9计算的日电量,目标日电量大于基于容量计算的日电量判断所述配电网数据中是否存在异常数据包括:
基于容量计算的日电量=变压器额定容量*0.9*24小时,当目标日电量大于基于容量计算的日电量时,即认为配电网数据中存在异常数据。
5.根据权利要求2所述的一种基于融合的配电网异常数据纠错方法,其特征在于,所述基于利用箱线图直接对目标日电量数据进行异常检测判断所述配电网数据中是否存在异常数据包括:
对目标日电量数据序列中的各个日电量数据按从小到大的顺序进行排序,分别取第一个数为最小值;取25%位置的数为第一分位数;取50%位置的数为中位数;取75%位置的数为第三分位数,取最后一个数为最大值共计五个统计量;
计算目标差值=第三分位数–第一分位数;
计算目标上限=第三分位数+ 3*目标差值;
计算目标下限=第一分位数–3*目标差值;
当目标日电量数据序列中的某一个日电量数据大于目标上限的值或小于目标下限的值,即将某一个日电量数据视为异常数据。
6.根据权利要求1所述的一种基于融合的配电网异常数据纠错方法,其特征在于,所述LSTM神经网络共有五层,第一层是第一LSTM层,设置了100个神经元;第二层是Dropout层,参数设置为0.4;第三层是第二LSTM层,设置了120个神经元;第四层是Dropout层,参数设置为0.4;最后一层是Dense层,参数设置为1。
7.根据权利要求1所述的一种基于融合的配电网异常数据纠错方法,其特征在于,在判断所述配电网数据是否异常之后,所述方法还包括:
若所述配电网数据中存在电量数据异常数据,则获取所述目标日电量数据序列中各个异常电量数据的位置,并根据各个异常电量数据的位置将所述目标日电量数据序列划分为正常电量数据子序列以及异常电量数据子序列;
将所述正常电量数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第二目标LSTM模型;
将所述异常电量数据子序列中与某一异常电量数据关联的至少一个正常电量数据输入至所述第二目标LSTM模型中,得到预测用电量数据,并将所述预测用电量数据替换所述某一异常电量数据,其中,至少一个正常电量数据为所述正常电量数据子序列中且时间节点为所述某一异常电量数据之前的连续五个正常电量数据。
8.一种基于融合的配电网异常数据纠错系统,其特征在于,包括:
采集模块,配置为采集配电网数据,所述配电网数据包括目标日电量数据序列,功率数据序列以及变压器容量数据;
判断模块,配置为判断所述配电网数据中是否存在异常数据,所述异常数据包括第一功率异常数据、第二功率异常数据以及电量数据异常数据;
第一替换模块,配置为若所述配电网数据中存在第一功率异常数据,则统计所述功率数据序列中异常功率数据的个数,计算目标日异常功率产生总电量,并根据所述目标日异常功率产生总电量计算目标日异常功率平均值,用所述目标日异常功率平均值替换所述功率数据序列中所有的异常功率数据,其中,所述第一功率异常数据为功率数据序列中异常功率数据个数小于预设阈值时的各个异常功率数据;
划分模块,配置为若所述配电网数据中存在第二功率异常数据,则获取所述功率数据序列中各个异常功率数据的位置,并根据各个异常功率数据的位置将所述功率数据序列划分为正常功率数据子序列以及异常功率数据子序列,其中,所述第二功率异常数据为功率数据序列中异常功率数据个数不小于预设阈值的各个异常功率数据;
训练模块,配置为将所述正常功率数据子序列输入至预设的LSTM神经网络中对LSTM神经网络进行训练,得到第一目标LSTM模型;
第二替换模块,配置为将所述异常功率数据子序列中与某一异常功率数据关联的至少一个正常功率数据输入至所述第一目标LSTM模型中,得到预测功率数据,并将所述预测功率数据替换所述某一异常功率数据,其中,至少一个正常功率数据为所述正常功率数据子序列中且时间节点为所述某一异常功率数据之前的连续五个正常功率数据。
9.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311797861.2A CN117472898B (zh) | 2023-12-26 | 2023-12-26 | 一种基于融合的配电网异常数据纠错方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311797861.2A CN117472898B (zh) | 2023-12-26 | 2023-12-26 | 一种基于融合的配电网异常数据纠错方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117472898A true CN117472898A (zh) | 2024-01-30 |
CN117472898B CN117472898B (zh) | 2024-04-02 |
Family
ID=89629654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311797861.2A Active CN117472898B (zh) | 2023-12-26 | 2023-12-26 | 一种基于融合的配电网异常数据纠错方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117472898B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107992520A (zh) * | 2017-11-01 | 2018-05-04 | 广州供电局有限公司 | 一种基于用电行为轨迹的异常用电识别方法 |
KR101960755B1 (ko) * | 2018-12-20 | 2019-03-21 | 문경훈 | 미취득 전력 데이터 생성 방법 및 장치 |
CN110263866A (zh) * | 2019-06-24 | 2019-09-20 | 苏州智睿新能信息科技有限公司 | 一种基于深度学习的电力用户负荷区间预测方法 |
CN112035544A (zh) * | 2020-08-29 | 2020-12-04 | 国网信通亿力科技有限责任公司 | 一种配电网数据异常监测和诊断方法 |
CN113516192A (zh) * | 2021-07-19 | 2021-10-19 | 国网北京市电力公司 | 一种用户用电异动识别方法、系统、装置及存储介质 |
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN117034169A (zh) * | 2023-08-14 | 2023-11-10 | 中国科学院合肥物质科学研究院 | 基于时序因果关系网络的电网主变设备异常状态预测方法 |
-
2023
- 2023-12-26 CN CN202311797861.2A patent/CN117472898B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107992520A (zh) * | 2017-11-01 | 2018-05-04 | 广州供电局有限公司 | 一种基于用电行为轨迹的异常用电识别方法 |
KR101960755B1 (ko) * | 2018-12-20 | 2019-03-21 | 문경훈 | 미취득 전력 데이터 생성 방법 및 장치 |
CN110263866A (zh) * | 2019-06-24 | 2019-09-20 | 苏州智睿新能信息科技有限公司 | 一种基于深度学习的电力用户负荷区间预测方法 |
CN112035544A (zh) * | 2020-08-29 | 2020-12-04 | 国网信通亿力科技有限责任公司 | 一种配电网数据异常监测和诊断方法 |
CN113516192A (zh) * | 2021-07-19 | 2021-10-19 | 国网北京市电力公司 | 一种用户用电异动识别方法、系统、装置及存储介质 |
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN117034169A (zh) * | 2023-08-14 | 2023-11-10 | 中国科学院合肥物质科学研究院 | 基于时序因果关系网络的电网主变设备异常状态预测方法 |
Non-Patent Citations (2)
Title |
---|
WENYUE ZHOU 等: "Online error correction method of PMU data based on LSTM model and Kalman filter", 《2020 12TH IEEE PES ASIA-PACIFIC POWER AND ENERGY ENGINEERING CONFERENCE (APPEEC)》, 13 October 2020 (2020-10-13), pages 1 - 6 * |
梁捷;梁广明;: "基于ARMA和K-means聚类的用电量数据异常识别", 湖北电力, no. 04, 28 August 2019 (2019-08-28), pages 69 - 74 * |
Also Published As
Publication number | Publication date |
---|---|
CN117472898B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106779505B (zh) | 一种基于大数据驱动的输电线路故障预警方法及系统 | |
CN113887846B (zh) | 一种电容式电压互感器的超差风险预警方法 | |
CN102521080A (zh) | 电力用户用电信息采集系统的计算机数据修复方法 | |
CN117783745B (zh) | 用于换电柜的数据在线监测方法及系统 | |
CN110738346A (zh) | 一种基于威布尔分布的批次电能表可靠度预测方法 | |
CN111881124A (zh) | 一种基于改进算法的状态估计的数据处理方法及系统 | |
CN116148753A (zh) | 一种智能电能表运行误差监测系统 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN113723844A (zh) | 一种基于集成学习的低压台区理论线损计算方法 | |
CN106875124A (zh) | 一种电能计量装置状态评估方法、装置及系统 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统 | |
CN115508770A (zh) | 一种基于kl-nb算法的电能表运行状态在线评估方法 | |
CN117311295B (zh) | 基于无线网络设备的生产质量提升方法及系统 | |
CN115809805A (zh) | 基于边缘计算的电网多源数据处理方法 | |
CN115616333A (zh) | 一种配电网线损预测方法及系统 | |
CN115128468A (zh) | 一种化学储能电池phm欠压故障预测方法 | |
CN117708735A (zh) | 一种基于多点校核的量测数据拟合方法、介质及系统 | |
CN117553840A (zh) | 一种基于智能化管理的仪表及其系统 | |
CN112345972A (zh) | 基于停电事件的配电网线变关系异常诊断方法、装置及系统 | |
CN117472898B (zh) | 一种基于融合的配电网异常数据纠错方法及系统 | |
CN112595918A (zh) | 一种低压集抄故障的检测方法及装置 | |
CN116910655A (zh) | 一种基于装置量测数据的智能电能表故障预测方法 | |
CN117113202A (zh) | 基于联合误差堆叠模型的电力回路能耗检测方法及设备 | |
CN116933201A (zh) | 低压充电桩违约用电行为识别的方法和系统 | |
CN113793077B (zh) | 一种配电网用户故障停电影响分析方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |