CN115586399A - 一种基于Flink和回归模型的分时线损异常诊断方法 - Google Patents
一种基于Flink和回归模型的分时线损异常诊断方法 Download PDFInfo
- Publication number
- CN115586399A CN115586399A CN202211236807.6A CN202211236807A CN115586399A CN 115586399 A CN115586399 A CN 115586399A CN 202211236807 A CN202211236807 A CN 202211236807A CN 115586399 A CN115586399 A CN 115586399A
- Authority
- CN
- China
- Prior art keywords
- data
- line loss
- time
- regression model
- loss data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000002159 abnormal effect Effects 0.000 claims abstract description 69
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000005259 measurement Methods 0.000 claims abstract description 31
- 238000003860 storage Methods 0.000 claims abstract description 29
- 230000005856 abnormality Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 10
- 230000005611 electricity Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/088—Aspects of digital computing
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于Flink和回归模型的分时线损异常诊断方法,包括步骤:通过离线历史线损数据建立并训练回归模型;基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。本申请一方面提高了通过分时线损进行用电行为异常诊断时效性,另一方面通过在线更新回归模型提高用电行为异常诊断准确度。
Description
技术领域
本申请涉及电网故障检测技术领域,特别地,涉及一种基于Flink和回归模型的分时线损异常诊断方法。
背景技术
随着智能电网信息化不断发展,各类控制系统和信息系统产生海量的量测数据,电网量测数据作为电网数字化转型的数据基础,支撑新型电力系统源网荷储各领域终端实时互动,推动了电网的积极发展。电网数字化转型推动了输电线路的线损监测工作,现阶段基于线变关系、电能表冻结示数等量测数据已经实现线损计算时效由日级提升至小时级,对输电线路的分时线损状态监控有助于实现窃电、违规用电等异常行为,有效保障电网安全生产稳定。
目前通过分时线损进行用电行为异常诊断受限于数据量太大导致时效性较低,诊断准确度也不高。
发明内容
本申请提供了一种基于Flink和回归模型的分时线损异常诊断方法,以解决现有通过分时线损进行用电行为异常诊断时效性较低,诊断准确度也不高的技术问题。
本申请采用的技术方案如下:
一种基于Flink和回归模型的分时线损异常诊断方法,包括步骤:
通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
进一步地,所述通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型之前,还包括步骤:
得到新的历史线损数据集合,即:
D={D1,D2,…,DN};
设置与历史线损数据相关的时间信息集合包括:
令W={W1,W2,…,WN}表示历史线损数据所对应的时间是星期几的集合,其中Wn∈{1,2,3,4,5,6,7}表示线损数据Dn是星期Wn采集的数据;
令Y={Y1,Y2,…,YN}表示历史线损数据所对应的时间是特殊日期的集合,其中Yn∈{1,2,…,K},K值可以根据需求进行拓展,相应的Yn的不同的取值的含义根据需求进行定义;
令H={H1,H2,…,HN}表示历史线损数据所对应的小时时间,其中Hn∈{0,1,…,23}表示采集历史线损数据Dn的时间是该天的第Hn个小时;
根据历史线损数据和对应的时间信息生成训练数据集合T:令集合T={T1,T2,…,TM}表示训练数据集合,TM由q个历史线损数据和TM所对应的时间信息所组成,
M=N-q,TM={DM,DM+1,…,DM+q-1,Wq+M,Yq+M,Hq+M},TM对应的标签为Dq+M,由此相应的标签集合T={Dq+1,Dq+2,…,Dq+M}。
进一步地,所述通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型,具体包括步骤:
基于历史数据建立q个线损数据和相关的时间信息为自变量的回归模型:
进一步地,所述残差等同于损失loss,即:
或者,
所述损失loss采用平方损失或均方差损失,所述回归模型训练方法至少包括梯度下降法、拟牛顿法。
进一步地,所述基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据,具体包括步骤:
利用Flink从DataHub实时接入量测数据,然后计算出每条线路的分时线损数据;
对当前某一条线路的分时线损数据Dz进行预处理,将Dz的分时线损数据和时间信息组成输入特征{Dz-q,Dz-q-1,…,Dz-1,Wz,Yz,Hz},将输入特征作为该线路对应的回归模型的输入得到预测值令表示预测误差,取Dz的前K个线损数据的预测误差,表示为集合E={ez-K,ez-K+1,…,ez-1},集合E的均值和方差分别为μ和σ2,根据下式对数据Dz作异常诊断,并将所述分时线损数据区分标记为正常数据或异常数据:
其中,λ为实数。
进一步地,当分时线损数据诊断为异常数据后,还包括步骤:
根据下式将诊断为异常数据的分时线损数据根据预测误差进一步判断为轻度异常、中度异常和极端异常:
其中,为了使得上式不存在冲突,λ小于2。
进一步地,利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数,具体包括步骤:
若所述分时线损数据被区分标记为正常数据时,则直接将数据写入缓存数据库redis;
若所述分时线损数据被区分标记为异常数据时,则将异常情况反馈给应用侧,显示告警信息,然后对所述线损数据进行复查,其中对不同程度的异常的处理的方法不同,根据业务逻辑制定相应的处理措施;
如果经过了复查后,所述线损数据确实是异常的,则标记所述线损数据为相应的异常数据并写入缓存数据库redis;若线损数据并不是异常的,标记线损数据为正常数据并写入缓存数据库redis,同时,在满足预设的区间约束下自适应调整λ,即λ=λ+γ,γ是一个设定的常数;
当所有标记为正常数据的线损数据累积到设定数量时,将其反馈给所述回归模型,用于继续训练回归模型,实时调整回归模型的参数。
本申请另一方面还提供了一种基于Flink和回归模型的分时线损异常诊断装置,包括:
回归模型构建模块,用于通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
异常诊断模块,用于基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
诊断结果存储及反馈模块,用于利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
本申请另一方面还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述基于Flink和回归模型的分时线损异常诊断方法的步骤。
本申请另一方面还提供了一种存储介质,所述存储介质包括存储的程序,在所述程序运行时控制所述存储介质所在的设备执行所述的基于Flink和回归模型的分时线损异常诊断方法的步骤。
相比现有技术,本申请具有以下有益效果:
本申请提供了一种基于Flink和回归模型的分时线损异常诊断方法,该方法通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
本申请一方面利用Flink和DataHub组件实现海量量测数据实时并发接入和分时线损计算,提高了通过分时线损进行用电行为异常诊断时效性,另一方面,本申请在利用离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型完成海量分时线损数据的异常诊断的同时,还不断将实时高速存储的正常的线损数据反馈给相应的回归模型,实现在线更新回归模型参数,显然,随着数据量的增加,回归模型的适应力将随着时间的推移逐步增强,从而自适应地提高用电行为异常诊断准确度。
除了上面所描述的目的、特征和优点之外,本申请还有其它的目的、特征和优点。下面将参照附图,对本申请作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请优选实施例的基于Flink和回归模型的分时线损异常诊断方法流程示意图。
图2是本申请另一优选实施例的基于Flink和回归模型的分时线损异常诊断方法流程示意图。
图3是本申请优选实施例对一条线路的分时线损的数据进行异常诊断的流程示意图。
图4是本申请优选实施例的基于Flink和回归模型的分时线损异常诊断装置模块示意图。
图5是本申请优选实施例的电子设备实体示意框图。
图6是本申请优选实施例的计算机设备的内部结构图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参照图1和图2,本申请的优选实施例提供了一种基于Flink和回归模型的分时线损异常诊断方法,包括步骤:
S1、通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
S2、基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
S3、利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
本实施例提供了一种基于Flink和回归模型的分时线损异常诊断方法,该方法通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
本实施例一方面利用Flink和DataHub组件实现海量量测数据实时并发接入和分时线损计算,其中,Flink框架以其出色的流处理、分布式和高性能等特性使得其成为高效计算和深度挖掘海量数据的主流技术,能很好的满足业务的实时性需求,提高了通过分时线损进行用电行为异常诊断时效性,另一方面,本实施例在利用离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型完成海量分时线损数据的异常诊断的同时,还不断将实时高速存储的正常线损数据反馈给相应的回归模型,实现在线更新回归模型参数,显然,随着数据量的增加,回归模型的适应力将随着时间的推移逐步增强,从而自适应地提高用电行为异常诊断准确度。
具体地,所述通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型之前,还包括步骤:
S101、令表示一条线路的历史线损数据的集合(假设历史线损值都经过了修整,即对存在数据缺失、跳变、离群值等不可用或不可算数据进行了修复,换言之,假设集合中不存在异常的数据值,所有的值都是真实的无异常的线损值),对历史线损数据集合进行差分处理得到集合D,使得数据的平稳性更强:
得到新的历史线损数据集合,即:
D={D1,D2,…,DN};
S102、设置与历史线损数据相关的时间信息集合包括:
令W={W1,W2,…,WN}表示历史线损数据所对应的时间是星期几的集合,其中Wn∈{1,2,3,4,5,6,7}表示线损数据Dn是星期Wn采集的数据;
令Y={Y1,Y2,…,YN}表示历史线损数据所对应的时间是特殊日期的集合,其中Yn∈{1,2,…,K},K值可以根据需求进行拓展,相应的Yn的不同的取值的含义根据需求进行定义,例如Yn=1表示采集线损数据Dn的时间是普通的日期,Yn=2表示采集线损数据Dn的时间是春节;
令H={H1,H2,…,HN}表示历史线损数据所对应的小时时间,其中Hn∈{0,1,…,23}表示采集历史线损数据Dn的时间是该天的第Hn个小时;
S103、根据历史线损数据和对应的时间信息生成训练数据集合T:令集合T={T1,T2,…,TM}表示训练数据集合,TM由q个历史线损数据和TM所对应的时间信息所组成,M=N-q,
TM={DM,DM+1,…,DM+q-1,Wq+M,Yq+M,Hq+M},TM对应的标签为Dq+M,由此相应的标签集合T={Dq+1,Dq+2,…,Dq+M}。
具体地,所述通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型,具体包括步骤:
S11、基于历史数据建立q个线损数据和3个相关的时间信息为自变量的回归模型:
其中,所述残差等同于损失loss,即:
或者,
所述损失loss采用平方损失或均方差损失等,相应地,所述回归模型训练方法包括梯度下降法、拟牛顿法等,本领域技术人员可以根据需要进行相应的选择。
本实施例在输入特征中考虑星期、小时和特殊日期属性的原因在于:一是用电数据可能与是否周末有关,例如周末不进行作业,则某条线路的用电量会降低;二是用电数据可能分时段的,例如凌晨、上班时间等,某些线路的用电量会降低,而下班时间则用电量会相对上升;三是用电数据可能与特殊节日有关,例如节假日放假,那么某些线路的用电量也会随之变化。综上所述,考虑时间信息可以使得预测的依据更加充足,进而提高预测结果的精度,降低异常诊断的误判率。
具体地,所述基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据,具体包括步骤:
S21、利用Flink从DataHub实时接入量测数据,接着利用Flink高性能的计算能力快速计算出每条线路的分时线损数据;
S22、对当前某一条线路的分时线损数据Dz进行预处理,将Dz的分时线损数据和时间信息组成输入特征{Dz-q,Dz-q-1,…,Dz-1,Wz,Yz,Hz},将输入特征作为该线路对应的回归模型的输入得到预测值令表示预测误差,取Dz的前K个线损数据的预测误差,表示为集合E={ez-K,ez-K+1,…,ez-1},集合E的均值和方差分别为μ和σ2,根据下式对数据Dz作异常诊断,并将所述分时线损数据区分标记为正常数据或异常数据:
其中,λ为实数。
优选地,如图3所示,当分时线损数据诊断为异常数据后,还包括步骤:
S23、根据下式将诊断为异常数据的分时线损数据根据预测误差进一步判断为轻度异常、中度异常和极端异常:
其中,为了使得上式不存在冲突,λ小于2,λ一个可行的取值范围为[1.5,2),当然λ也可根据实际情况进行调整。
具体来说,本实施例在诊断时,首先判断线损数据是否正常,如果异常则进行二次判断;如果是正常则诊断结束,标记线损数据为正常。对于二次判断,首先判断线损数据是否是极端异常,如果不是极端异常则进行三次判断;如果是极端异常,则诊断结束,标记线损数据为极端异常。对于三次判断,首先判断线损数据是否是中度异常,如果是中度异常情况则诊断结束,标记线损数据为中度异常;反之,则标记线损数据为轻度异常。
具体地,如图3所示,利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数,具体包括步骤:
S31、若所述分时线损数据被区分标记为正常数据时,则直接将数据写入缓存数据库redis;
S32、若所述分时线损数据被区分标记为异常数据时,则将异常情况反馈给应用侧,显示告警信息,然后对所述线损数据进行复查,其中对不同程度的异常的处理的方法不同,根据业务逻辑制定相应的处理措施;
S33、如果经过了复查后,所述线损数据确实是异常的,则标记所述线损数据为相应的异常数据并写入缓存数据库redis;若线损数据并不是异常的,标记线损数据为正常数据并写入缓存数据库redis,显然此时模型诊断失误,可能的原因之一是λ太小了导致模型将正常数据误判为异常数据,此时,在满足预设的区间约束下,自适应调整λ,即λ=λ+γ,γ是一个足够小的设定常数;
S34、当所有标记为正常数据的线损数据累积到设定数量时,将其反馈给所述回归模型,用于继续训练回归模型,实时调整回归模型的参数。
本实施例在标记为正常数据的线损数据累积到一定数量时,将正常数据反馈给回归模型,用于继续训练模型。显然,将模型预测失误的数据反馈给模型继续训练模型,这样做可以修正模型的参数,使得模型的泛化能力得到实时的增强。
如图4所示,本申请另一实施例还提供了一种基于Flink和回归模型的分时线损异常诊断装置,包括:
回归模型构建模块,用于通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
异常诊断模块,用于基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
诊断结果存储及反馈模块,用于利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
如图5所示,本申请的优选实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例中的基于Flink和回归模型的分时线损异常诊断方法的步骤。
如图6所示,本申请的优选实施例还提供了一种计算机设备,该计算机设备可以是终端或活体检测服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的其他计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现上述基于Flink和回归模型的分时线损异常诊断方法的步骤。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请的优选实施例还提供了一种存储介质,所述存储介质包括存储的程序,在所述程序运行时控制所述存储介质所在的设备执行上述实施例中的基于Flink和回归模型的分时线损异常诊断方法的步骤。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例方法所述功能若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个或者多个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory),磁碟或者光盘等各种可以存储程序代码的介质。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种基于Flink和回归模型的分时线损异常诊断方法,其特征在于,包括步骤:
通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
2.根据权利要求1所述的基于Flink和回归模型的分时线损异常诊断方法,其特征在于,所述通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型之前,还包括步骤:
得到新的历史线损数据集合,即:
D={D1,D2,…,DN};
设置与历史线损数据相关的时间信息集合包括:
令W={W1,W2,…,WN}表示历史线损数据所对应的时间是星期几的集合,其中Wn∈{1,2,3,4,5,6,7}表示线损数据Dn是星期Wn采集的数据;
令Y={Y1,Y2,…,YN}表示历史线损数据所对应的时间是特殊日期的集合,其中Yn∈{1,2,…,K},K值可以根据需求进行拓展,相应的Yn的不同的取值的含义根据需求进行定义;
令H={H1,H2,…,HN}表示历史线损数据所对应的小时时间,其中Hn∈{0,1,…,23}表示采集历史线损数据Dn的时间是该天的第Hn个小时;
根据历史线损数据和对应的时间信息生成训练数据集合T:令集合T={T1,T2,…,TM}表示训练数据集合,TM由q个历史线损数据和TM所对应的时间信息所组成,
M=N-q,TM={DM,DM+1,…,DM+q-1,Wq+M,Yq+M,Hq+M},TM对应的标签为Dq+M,由此相应的标签集合T={Dq+1,Dq+2,…,Dq+M}。
5.根据权利要求3所述的基于Flink和回归模型的分时线损异常诊断方法,其特征在于,所述基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据,具体包括步骤:
利用Flink从DataHub实时接入量测数据,然后计算出每条线路的分时线损数据;
对当前某一条线路的分时线损数据Dz进行预处理,将Dz的分时线损数据和时间信息组成输入特征{Dz-q,Dz-q-1,…,Dz-1,Wz,Yz,Hz},将输入特征作为该线路对应的回归模型的输入得到预测值令表示预测误差,取Dz的前K个线损数据的预测误差,表示为集合E={ez-K,ez-K+1,…,ez-1},集合E的均值和方差分别为μ和σ2,根据下式对数据Dz作异常诊断,并将所述分时线损数据区分标记为正常数据或异常数据:
其中,λ为实数。
7.根据权利要求6所述的基于Flink和回归模型的分时线损异常诊断方法,其特征在于,利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数,具体包括步骤:
若所述分时线损数据被区分标记为正常数据时,则直接将数据写入缓存数据库redis;
若所述分时线损数据被区分标记为异常数据时,则将异常情况反馈给应用侧,显示告警信息,然后对所述线损数据进行复查,其中对不同程度的异常的处理的方法不同,根据业务逻辑制定相应的处理措施;
如果经过了复查后,所述线损数据确实是异常的,则标记所述线损数据为相应的异常数据并写入缓存数据库redis;若线损数据并不是异常的,标记线损数据为正常数据并写入缓存数据库redis,同时,在满足预设的区间约束下自适应调整λ,即λ=λ+γ,γ是一个设定的常数;
当所有标记为正常数据的线损数据累积到设定数量时,将其反馈给所述回归模型,用于继续训练回归模型,实时调整回归模型的参数。
8.一种基于Flink和回归模型的分时线损异常诊断装置,其特征在于,包括:
回归模型构建模块,用于通过离线历史线损数据建立并训练以线损数据和时间信息为自变量的回归模型;
异常诊断模块,用于基于DataHub组件实现海量量测数据实时并发接入,通过Flink实时处理接收到的量测数据后计算出线路的分时线损,并结合所述回归模型完成海量分时线损数据的异常诊断,将所述分时线损数据标记区分为正常数据或异常数据;
诊断结果存储及反馈模块,用于利用缓存数据库Redis对诊断后标记区分为正常数据或异常数据的分时线损数据进行实时高速存储,并将正常的分时线损数据反馈给所述回归模型,实时调整回归模型的参数。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1至7中任一项所述基于Flink和回归模型的分时线损异常诊断方法的步骤。
10.一种存储介质,所述存储介质包括存储的程序,在所述程序运行时控制所述存储介质所在的设备执行如权利要求1至7中任一项所述基于Flink和回归模型的分时线损异常诊断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211236807.6A CN115586399A (zh) | 2022-10-10 | 2022-10-10 | 一种基于Flink和回归模型的分时线损异常诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211236807.6A CN115586399A (zh) | 2022-10-10 | 2022-10-10 | 一种基于Flink和回归模型的分时线损异常诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115586399A true CN115586399A (zh) | 2023-01-10 |
Family
ID=84780533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211236807.6A Pending CN115586399A (zh) | 2022-10-10 | 2022-10-10 | 一种基于Flink和回归模型的分时线损异常诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115586399A (zh) |
-
2022
- 2022-10-10 CN CN202211236807.6A patent/CN115586399A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104811344A (zh) | 网络动态业务监控方法及装置 | |
CN110717671B (zh) | 一种确定参与方贡献度的方法及装置 | |
EP3850451B1 (de) | Verfahren zur verbesserung der messperformance von feldgeräten der automatisierungstechnik | |
CN111159157A (zh) | 一种企业报表数据的指标化处理方法及装置 | |
CN106529704A (zh) | 月最大电力负荷预测方法及装置 | |
CN110991985A (zh) | 一种项目进度数据处理方法 | |
CN115640935A (zh) | 电力系统碳排放量的计算方法、装置和计算机设备 | |
CN116992274B (zh) | 基于改进主成分回归模型的短期风速预测方法及系统 | |
CN114186855A (zh) | 监控预警方法、装置、计算机设备、存储介质和程序产品 | |
CN114092275A (zh) | 企业经营异常监测方法、装置、计算机设备和存储介质 | |
WO2021237459A1 (zh) | 基于工业对象模型的数据处理方法、装置及设备 | |
CN115586399A (zh) | 一种基于Flink和回归模型的分时线损异常诊断方法 | |
CN117575481A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN115907307B (zh) | 面向电网实时数据交互的电力系统碳排放流在线分析方法 | |
Maksood et al. | Sustainability in Oman: energy consumption forecasting using R | |
CN112053181A (zh) | 一种农产品价格预测方法及系统 | |
CN110941646A (zh) | 基于10kv工程三率数据挖掘的项目进度管控系统 | |
CN115481767A (zh) | 面向配电网检修的运行数据处理方法、装置和计算机设备 | |
CN112329178B (zh) | 角钢塔三维造价模型建立方法、装置及终端设备 | |
CN114116742A (zh) | 一种基于地铁综合监控系统的时序数据填补方法及装置 | |
CN113191854A (zh) | 一种电力市场现货交易方法及装置 | |
CN113723717A (zh) | 系统日前短期负荷预测方法、装置、设备和可读存储介质 | |
WO2020029529A1 (zh) | 针对金融产品的行情数据波动的量化描述方法及装置 | |
Paulos et al. | Load and electricity prices forecasting using Generalized Regression Neural Networks | |
CN113836293B (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |