CN111833583A - 电力数据异常检测模型的训练方法、装置、设备和介质 - Google Patents

电力数据异常检测模型的训练方法、装置、设备和介质 Download PDF

Info

Publication number
CN111833583A
CN111833583A CN202010674998.9A CN202010674998A CN111833583A CN 111833583 A CN111833583 A CN 111833583A CN 202010674998 A CN202010674998 A CN 202010674998A CN 111833583 A CN111833583 A CN 111833583A
Authority
CN
China
Prior art keywords
power data
trained
long
term memory
loss value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010674998.9A
Other languages
English (en)
Other versions
CN111833583B (zh
Inventor
钱斌
肖勇
石少青
周密
赵云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSG Electric Power Research Institute
China Southern Power Grid Co Ltd
Research Institute of Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Research Institute of Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd, Research Institute of Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202010674998.9A priority Critical patent/CN111833583B/zh
Publication of CN111833583A publication Critical patent/CN111833583A/zh
Application granted granted Critical
Publication of CN111833583B publication Critical patent/CN111833583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C19/00Electric signal transmission systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/60Arrangements in telecontrol or telemetry systems for transmitting utility meters data, i.e. transmission of data from the reader of the utility meter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/80Arrangements in the sub-station, i.e. sensing device
    • H04Q2209/82Arrangements in the sub-station, i.e. sensing device where the sensing device takes the initiative of sending data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/80Arrangements in the sub-station, i.e. sensing device
    • H04Q2209/82Arrangements in the sub-station, i.e. sensing device where the sensing device takes the initiative of sending data
    • H04Q2209/823Arrangements in the sub-station, i.e. sensing device where the sensing device takes the initiative of sending data where the data is sent when the measured values exceed a threshold, e.g. sending an alarm

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种电力数据异常检测模型的训练方法、装置、设备和介质,将待训练电力数据序列输入长短期记忆网络进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与网络下一时刻的输入值的残差和第一损失值,全连接层对残差进行处理,softmax层对全连接层的输出进行处理,输出分类预测概率;根据第一损失值、待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数计算网络的第二损失值;基于第二损失值反向更新网络参数,直至第二损失值低于预置损失值,得到电力数据异常检测模型,解决了现有技术中采用统计方法进行电力数据异常检测存在的检测准确率低和检测效率低的技术问题。

Description

电力数据异常检测模型的训练方法、装置、设备和介质
技术领域
本申请涉及数据异常检测技术领域,尤其涉及一种电力数据异常检测模型的训练方法、装置、设备和介质。
背景技术
随着用电信息采集系统的推广,越来越多的用电数据被采集,为基于用电数据的各种应用分析提供了坚实的数据基础。但由于电能表异常、互感器异常以及系统通讯故障等原因,不可避免地采集到异常的用电数据,进而影响基于用电数据的应用分析的准确性。因此,需要对用电信息采集的用电数据进行异常检测。
目前,大多数电力部门采用传统的统计方法进行电力数据异常检测,例如,在用电信息采集系统中,通过母线电量报表来判断采集到的用电数据是否异常,在不同的电压等级下对其进行判别,进而给出判别结果,该统计方法的检测准确率不高且检测效率较低。
发明内容
本申请提供了一种电力数据异常检测模型的训练方法、装置、设备和介质,用于解决现有技术中采用统计方法进行电力数据异常检测存在的检测准确率低和检测效率低的技术问题。
有鉴于此,本申请第一方面提供了一种电力数据异常检测模型的训练方法,包括:
获取待训练电力数据序列;
将所述待训练电力数据序列输入至长短期记忆网络,使得所述长短期记忆网络的隐含层对所述待训练电力数据序列进行特征提取,将当前时刻的所述隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的所述预测值与所述长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对所述残差进行处理,softmax层对所述全连接层的输出进行处理,输出所述待训练电力数据序列的分类预测概率;
根据所述第一损失值、所述待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定所述长短期记忆网络的第二损失值;
基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出。
可选的,所述将所述待训练电力数据序列输入至长短期记忆网络,之前还包括:
对所述待训练电力数据序列进行预处理。
可选的,所述第一损失值的计算公式为:
Figure BDA0002583730800000021
其中,Lt为第t个时间步的第一损失值,
Figure BDA0002583730800000022
ht为第t个时间步的隐含层的输出值,W为权重矩阵,xt+1为第t+1个时间步的输入值。
可选的,所述联合损失函数的公式为:
Figure BDA0002583730800000023
其中,T为待训练电力数据序列的长度,
Figure BDA0002583730800000024
ht为第t个时间步的隐含层的输出值,W为权重矩阵,xt+1为第t+1个时间步的输入值,λ为常量,
Figure BDA0002583730800000025
是类别i的真实概率,
Figure BDA0002583730800000026
是类别i的分类预测概率。
可选的,所述基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出,之后还包括:
将获取的待检测训练电力数据序列输入至所述电力数据异常检测模型进行数据异常检测,输出所述待检测训练电力数据序列对应的检测结果。
本申请第二方面提供了一种电力数据异常检测模型的训练装置,包括:
获取单元,用于获取待训练电力数据序列;
输入单元,用于将所述待训练电力数据序列输入至长短期记忆网络,使得所述长短期记忆网络的隐含层对所述待训练电力数据序列进行特征提取,将当前时刻的所述隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的所述预测值与所述长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对所述残差进行处理,softmax层对所述全连接层的输出进行处理,输出所述待训练电力数据序列的分类预测概率;
确定单元,用于根据所述第一损失值、所述待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定所述长短期记忆网络的第二损失值;
输出单元,用于基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出。
可选的,还包括:
预处理单元,用于对所述待训练电力数据序列进行预处理。
可选的,还包括:
检测单元,用于将获取的待检测训练电力数据序列输入至所述电力数据异常检测模型进行数据异常检测,输出所述待检测训练电力数据序列对应的检测结果。
本申请第三方面提供了一种电力数据异常检测模型的训练设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的电力数据异常检测模型的训练方法。
本申请第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的电力数据异常检测模型的训练方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种电力数据异常检测模型的训练方法,包括:获取待训练电力数据序列;将待训练电力数据序列输入至长短期记忆网络,使得长短期记忆网络的隐含层对待训练电力数据序列进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对残差进行处理,softmax层对全连接层的输出进行处理,输出待训练电力数据序列的分类预测概率;根据第一损失值、待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定长短期记忆网络的第二损失值;基于第二损失值反向更新长短期记忆网络的参数,直至第二损失值低于预置损失值,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型输出。
本申请中的电力数据异常检测模型的训练方法,将获取的待训练电力数据序列输入至长短期记忆网络进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,残差可以直观的反映预测值和真实值的差别,差别越大说明当前时刻的输入更有可能是异常值,通过使用残差作为全连接层的输入对全连接层进行训练,可以使网络的训练过程更加稳定,提高网络的预测性能;根据softmax层输出的待训练电力数据序列的分类预测概率和其真实概率、第一损失值确定第二损失值,通过第二损失值对网络参数进行更新,可以提高网络的预测性能,当第二损失值低于预置损失值时,停止训练,得到电力数据异常检测模型,通过电力数据异常检测模型可以实现端到端的数据异常检测,检测速度快,准确率高,从而解决了现有技术中采用统计方法进行电力数据异常检测存在的检测准确率低和检测效率低的技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种电力数据异常检测模型的训练方法的一个流程示意图;
图2为本申请实施例提供的一种电力数据异常检测模型的训练方法的另一个流程示意图;
图3为本申请实施例提供的一种电力数据异常检测模型的训练装置的一个结构示意图。
具体实施方式
本申请提供了一种电力数据异常检测模型的训练方法、装置、设备和介质,用于解决现有技术中采用统计方法进行电力数据异常检测存在的检测准确率低和检测效率低的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种电力数据异常检测模型的训练方法的一个实施例,包括:
步骤101、获取待训练电力数据序列。
可以从用电采信息集系统获取历史电力数据,对历史电力数据进行标记,标记历史电力数据是否异常,得到历史电力数据的标签,将有标签的历史电力数据基于时间排序得到待训练电力数据序列。
步骤102、将待训练电力数据序列输入至长短期记忆网络,使得长短期记忆网络的隐含层对待训练电力数据序列进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对残差进行处理,softmax层对全连接层的输出进行处理,输出待训练电力数据序列的分类预测概率。
长短期记忆网络包括若干个隐含层、全连接层和softmax层,将待训练电力数据序列逐时刻输入到长短期记忆网络进行训练,隐含层对输入的数据进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,用来预测下一时刻网络的输入值。计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差作为全连接层的输入,全连接层对输入的残差进行处理,还可以基于下一时刻的预测值与长短期记忆网络的下一时刻的输入值计算得到隐含层的预测损失,得到第一损失值;softmax层对全连接层的输出进行处理,得到待训练电力数据序列的分类预测概率,即待训练电力数据序列为异常数据的分类预测概率和待训练电力数据序列为正常数据的分类预测概率。
步骤103、根据第一损失值、待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定长短期记忆网络的第二损失值。
根据待训练电力数据序列的分类预测概率和真实概率可以计算得到分类损失,进而通过联合损失函数计算得到长短期记忆网络的第二损失值,以结合步骤102中的预测损失和分类损失对长短期记忆网络进行联合训练。
步骤104、基于第二损失值反向更新长短期记忆网络的参数,直至第二损失值低于预置损失值,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型输出。
根据计算得到第二损失值反向传播,对长短期记忆网络的参数进行更新,直至第二损失值低于预置损失值,网络达到收敛条件,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型进行输出。
本申请实施例中的电力数据异常检测模型的训练方法,将获取的待训练电力数据序列输入至长短期记忆网络进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,残差可以直观的反映预测值和真实值的差别,差别越大说明当前时刻的输入更有可能是异常值,通过使用残差作为全连接层的输入对全连接层进行训练,可以使网络的训练过程更加稳定,提高网络的预测性能;根据softmax层输出的待训练电力数据序列的分类预测概率和其真实概率、第一损失值确定第二损失值,通过第二损失值对网络参数进行更新,可以提高网络的预测性能,当第二损失值低于预置损失值时,停止训练,得到电力数据异常检测模型,通过电力数据异常检测模型可以实现端到端的数据异常检测,检测速度快,准确率高,从而解决了现有技术中采用统计方法进行电力数据异常检测存在的检测准确率低和检测效率低的技术问题。
以上为本申请提供的一种电力数据异常检测模型的训练方法的一个实施例,以下为本申请提供的一种电力数据异常检测模型的训练方法的另一个实施例。
为了便于理解,请参阅图2,本申请提供的一种电力数据异常检测模型的训练方法的另一个实施例,包括:
步骤201、获取待训练电力数据序列。
可以从用电采信息集系统获取历史电力数据,对历史电力数据进行标记,标记历史电力数据是否异常,得到历史电力数据的标签,将有标签的历史电力数据基于时间排序得到待训练电力数据序列。
步骤202、对待训练电力数据序列进行预处理。
可以对待训练电力数据序列进行均值归一化处理。
步骤203、将预处理后的待训练电力数据序列输入至长短期记忆网络,使得长短期记忆网络的隐含层对待训练电力数据序列进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对残差进行处理,softmax层对全连接层的输出进行处理,输出待训练电力数据序列的分类预测概率。
将待训练电力数据序列逐时刻输入到长短期记忆网络进行训练,隐含层对输入的数据进行特征提取,在时间步t,长短期记忆网络的隐含层的输出ht更新如下:
it=σ(Wi[ht-1,xt]+bi)
ft=σ(Wf[ht-1,xt]+bf)
ot=σ(Wo[ht-1,xt]+bo)
Figure BDA0002583730800000071
Figure BDA0002583730800000072
Figure BDA0002583730800000073
其中,ht-1是时间步t-1的长短期记忆网络隐藏层输出,xt是时间步t的输入数据,it、ft、ot分别是长短期记忆网络的输入门,遗忘门和输出门。
Figure BDA0002583730800000074
是当前加入的信息,ct是记忆单元cell的信息,σ(·)、tanh(·)是非线性激活函数,
Figure BDA0002583730800000075
是逐元素的乘法,Wi、Wf、Wo、Wc是由可训练参数组成的仿射变换矩阵,即权重参数,bi、bf、bo、bc是偏置项。
将当前时刻的隐含层的输出值ht乘以权重矩阵W得到下一时刻的预测值
Figure BDA0002583730800000081
用来预测下一时刻网络的输入值,即:
Figure BDA0002583730800000082
其中,ht为第t个时间步的隐含层的输出值,W为权重矩阵,由可训练参数组成的仿射变换矩阵。
计算下一时刻的预测值
Figure BDA0002583730800000083
与长短期记忆网络的下一时刻的输入值xt+1的残差Rt作为全连接层的输入,即:
Figure BDA0002583730800000084
还可以基于下一时刻的预测值
Figure BDA0002583730800000085
与长短期记忆网络的下一时刻的输入值xt+1计算得到隐含层的预测损失,得到第一损失值,第一损失值的计算公式为:
Figure BDA0002583730800000086
其中,Lt为第t个时间步的第一损失值,
Figure BDA0002583730800000087
ht为第t个时间步的隐含层的输出值,W为权重矩阵,由可训练参数组成的仿射变换矩阵,xt+1为第t+1个时间步的输入值。
全连接层对输入的残差Rt进行处理,softmax层对全连接层的输出进行处理,得到待训练电力数据序列的分类预测概率,即待训练电力数据序列为异常数据的分类预测概率和待训练电力数据序列为正常数据的分类预测概率,进而预测待训练电力数据序列的类别,其中,全连接层和softmax层的处理过程为:
Figure BDA0002583730800000088
其中,vt是全连接层的输出,
Figure BDA0002583730800000089
是预测输出分布,Relu(·)是非线性激活函数,softmax(·)是归一化指数函数,Wfc和Wsm是全连接层和softmax层的权重矩阵,bfc和bsm是偏置项。
分类过程的训练目标是减少分类损失,即:
Figure BDA00025837308000000810
其中,yt是人工标记的真实类别分布,
Figure BDA00025837308000000811
是预测输出分布,
Figure BDA00025837308000000812
是类别i的真实概率,
Figure BDA00025837308000000813
是类别i的分类预测概率,
Figure BDA00025837308000000814
是两个分布的交叉熵函数。
步骤204、根据第一损失值、待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定长短期记忆网络的第二损失值。
通过联合损失函数计算得到长短期记忆网络的第二损失值,以结合前述步骤的预测损失和分类损失对长短期记忆网络进行联合训练,通过联合预测损失和分类损失可以进一步提高网络性能。其中,联合损失函数为:
Figure BDA0002583730800000091
其中,T为待训练电力数据序列的长度,
Figure BDA0002583730800000092
ht为第t个时间步的隐含层的输出值,W为权重矩阵,xt+1为第t+1个时间步的输入值,λ为常量,
Figure BDA0002583730800000093
是类别i的真实概率,
Figure BDA0002583730800000094
是类别i的分类预测概率。
步骤205、基于第二损失值反向更新长短期记忆网络的参数,直至第二损失值低于预置损失值,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型输出。
根据计算得到第二损失值反向传播,对长短期记忆网络的参数进行更新,直至第二损失值低于预置损失值,网络达到收敛条件,停止训练,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型进行输出。
步骤206、将获取的待检测训练电力数据序列输入至电力数据异常检测模型进行数据异常检测,输出待检测训练电力数据序列对应的检测结果。
从用电信息采集系统实时获取电力数据,进而得到待检测训练电力数据序列,可以对待检测训练电力数据序列进行均值归一化等预处理,将预处理后的待检测训练电力数据序列输入至电力数据异常检测模型进行数据异常检测,输出待检测训练电力数据序列对应的检测结果,以得到当前时刻的待检测训练电力数据是否异常。通过电力数据异常检测模型进行数据异常检测,不需要过多的干预,检测速度快,检测准确率高。
以上为本申请提供的一种电力数据异常检测模型的训练方法的一个实施例,以下为本申请提供的一种电力数据异常检测模型的训练装置的一个实施例。
为了便于理解,请参阅图3,本申请提供的一种电力数据异常检测模型的训练装置的一个实施例,包括:
获取单元301,用于获取待训练电力数据序列。
输入单元302,用于将待训练电力数据序列输入至长短期记忆网络,使得长短期记忆网络的隐含层对待训练电力数据序列进行特征提取,将当前时刻的隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的预测值与长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对残差进行处理,softmax层对全连接层的输出进行处理,输出待训练电力数据序列的分类预测概率。
确定单元303,用于根据第一损失值、待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定长短期记忆网络的第二损失值。
输出单元304,用于基于第二损失值反向更新长短期记忆网络的参数,直至第二损失值低于预置损失值,得到训练好的长短期记忆网络,将训练好的长短期记忆网络作为电力数据异常检测模型输出。
作为进一步的改进,还包括:
预处理单元305,用于对待训练电力数据序列进行预处理。
作为进一步的改进,还包括:
检测单元306,用于将获取的待检测训练电力数据序列输入至电力数据异常检测模型进行数据异常检测,输出待检测训练电力数据序列对应的检测结果。
本申请实施例还提供一种电力数据异常检测模型的训练设备的,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述电力数据异常检测模型的训练方法实施例中的电力数据异常检测模型的训练方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行前述电力数据异常检测模型的训练方法实施例中的电力数据异常检测模型的训练方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种电力数据异常检测模型的训练方法,其特征在于,包括:
获取待训练电力数据序列;
将所述待训练电力数据序列输入至长短期记忆网络,使得所述长短期记忆网络的隐含层对所述待训练电力数据序列进行特征提取,将当前时刻的所述隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的所述预测值与所述长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对所述残差进行处理,softmax层对所述全连接层的输出进行处理,输出所述待训练电力数据序列的分类预测概率;
根据所述第一损失值、所述待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定所述长短期记忆网络的第二损失值;
基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出。
2.根据权利要求1所述的电力数据异常检测模型的训练方法,其特征在于,所述将所述待训练电力数据序列输入至长短期记忆网络,之前还包括:
对所述待训练电力数据序列进行预处理。
3.根据权利要求1所述的电力数据异常检测模型的训练方法,其特征在于,所述第一损失值的计算公式为:
Figure FDA0002583730790000011
其中,Lt为第t个时间步的第一损失值,
Figure FDA0002583730790000012
ht为第t个时间步的隐含层的输出值,W为权重矩阵,xt+1为第t+1个时间步的输入值。
4.根据权利要求1所述的电力数据异常检测模型的训练方法,其特征在于,所述联合损失函数的公式为:
Figure FDA0002583730790000013
其中,T为待训练电力数据序列的长度,
Figure FDA0002583730790000014
ht为第t个时间步的隐含层的输出值,W为权重矩阵,xt+1为第t+1个时间步的输入值,λ为常量,
Figure FDA0002583730790000015
是类别i的真实概率,是类别i的分类预测概率。
5.根据权利要求1所述的电力数据异常检测模型的训练方法,其特征在于,所述基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出,之后还包括:
将获取的待检测训练电力数据序列输入至所述电力数据异常检测模型进行数据异常检测,输出所述待检测训练电力数据序列对应的检测结果。
6.一种电力数据异常检测模型的训练装置,其特征在于,包括:
获取单元,用于获取待训练电力数据序列;
输入单元,用于将所述待训练电力数据序列输入至长短期记忆网络,使得所述长短期记忆网络的隐含层对所述待训练电力数据序列进行特征提取,将当前时刻的所述隐含层的输出值乘以权重矩阵得到下一时刻的预测值,计算下一时刻的所述预测值与所述长短期记忆网络的下一时刻的输入值的残差和第一损失值,全连接层对所述残差进行处理,softmax层对所述全连接层的输出进行处理,输出所述待训练电力数据序列的分类预测概率;
确定单元,用于根据所述第一损失值、所述待训练电力数据序列的分类预测概率和真实概率,通过联合损失函数确定所述长短期记忆网络的第二损失值;
输出单元,用于基于所述第二损失值反向更新所述长短期记忆网络的参数,直至所述第二损失值低于预置损失值,得到训练好的长短期记忆网络,将所述训练好的长短期记忆网络作为电力数据异常检测模型输出。
7.根据权利要求6所述的电力数据异常检测模型的训练装置,其特征在于,还包括:
预处理单元,用于对所述待训练电力数据序列进行预处理。
8.根据权利要求6所述的电力数据异常检测模型的训练装置,其特征在于,还包括:
检测单元,用于将获取的待检测训练电力数据序列输入至所述电力数据异常检测模型进行数据异常检测,输出所述待检测训练电力数据序列对应的检测结果。
9.一种电力数据异常检测模型的训练设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-5任一项所述的电力数据异常检测模型的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-5任一项所述的电力数据异常检测模型的训练方法。
CN202010674998.9A 2020-07-14 2020-07-14 电力数据异常检测模型的训练方法、装置、设备和介质 Active CN111833583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010674998.9A CN111833583B (zh) 2020-07-14 2020-07-14 电力数据异常检测模型的训练方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010674998.9A CN111833583B (zh) 2020-07-14 2020-07-14 电力数据异常检测模型的训练方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN111833583A true CN111833583A (zh) 2020-10-27
CN111833583B CN111833583B (zh) 2021-09-03

Family

ID=72923125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010674998.9A Active CN111833583B (zh) 2020-07-14 2020-07-14 电力数据异常检测模型的训练方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN111833583B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308402A (zh) * 2020-10-29 2021-02-02 复旦大学 基于长短期记忆网络的电力时间序列数据的异常检测方法
CN112991704A (zh) * 2021-05-19 2021-06-18 武汉工程大学 用于充电储能系统的过压数据处理方法、装置及存储介质
CN116738049A (zh) * 2023-06-13 2023-09-12 湖北华中电力科技开发有限责任公司 基于大数据技术的用电监测系统、方法、装置和存储介质
CN117034180A (zh) * 2023-10-10 2023-11-10 国网湖北省电力有限公司武汉供电公司 电力通信设备数据异常检测方法、系统及存储介质
CN117318312A (zh) * 2023-11-28 2023-12-29 南方电网调峰调频发电有限公司工程建设管理分公司 电力能耗数据展示的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334889A (zh) * 2017-11-30 2018-07-27 腾讯科技(深圳)有限公司 摘要描述生成方法和装置、摘要描述模型训练方法和装置
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
CN109711465A (zh) * 2018-12-26 2019-05-03 西安电子科技大学 基于mll和asca-fr的图像字幕生成方法
CN109741604A (zh) * 2019-03-05 2019-05-10 南通大学 基于平稳化长短期记忆网络模型预测交叉口交通流量方法
US20190385060A1 (en) * 2018-06-14 2019-12-19 International Business Machines Corporation Integration of external applications into deep neural networks
CN111047094A (zh) * 2019-12-12 2020-04-21 国网浙江省电力有限公司 一种基于深度学习算法的抄表数据异常分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334889A (zh) * 2017-11-30 2018-07-27 腾讯科技(深圳)有限公司 摘要描述生成方法和装置、摘要描述模型训练方法和装置
US20190385060A1 (en) * 2018-06-14 2019-12-19 International Business Machines Corporation Integration of external applications into deep neural networks
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
CN109711465A (zh) * 2018-12-26 2019-05-03 西安电子科技大学 基于mll和asca-fr的图像字幕生成方法
CN109741604A (zh) * 2019-03-05 2019-05-10 南通大学 基于平稳化长短期记忆网络模型预测交叉口交通流量方法
CN111047094A (zh) * 2019-12-12 2020-04-21 国网浙江省电力有限公司 一种基于深度学习算法的抄表数据异常分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑贵林等: "基于小波和长短期记忆混合神经网络的电力用户异常用电模式检测", 《电测与仪表》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308402A (zh) * 2020-10-29 2021-02-02 复旦大学 基于长短期记忆网络的电力时间序列数据的异常检测方法
CN112308402B (zh) * 2020-10-29 2022-04-12 复旦大学 基于长短期记忆网络的电力时间序列数据的异常检测方法
CN112991704A (zh) * 2021-05-19 2021-06-18 武汉工程大学 用于充电储能系统的过压数据处理方法、装置及存储介质
CN116738049A (zh) * 2023-06-13 2023-09-12 湖北华中电力科技开发有限责任公司 基于大数据技术的用电监测系统、方法、装置和存储介质
CN117034180A (zh) * 2023-10-10 2023-11-10 国网湖北省电力有限公司武汉供电公司 电力通信设备数据异常检测方法、系统及存储介质
CN117034180B (zh) * 2023-10-10 2023-12-22 国网湖北省电力有限公司武汉供电公司 电力通信设备数据异常检测方法、系统及存储介质
CN117318312A (zh) * 2023-11-28 2023-12-29 南方电网调峰调频发电有限公司工程建设管理分公司 电力能耗数据展示的方法及装置
CN117318312B (zh) * 2023-11-28 2024-02-06 南方电网调峰调频发电有限公司工程建设管理分公司 电力能耗数据展示的方法及装置

Also Published As

Publication number Publication date
CN111833583B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN111833583B (zh) 电力数据异常检测模型的训练方法、装置、设备和介质
CN114386537B (zh) 基于CatBoost的锂电池故障诊断方法、装置及电子设备
CN110264270B (zh) 一种行为预测方法、装置、设备和存储介质
CN113067798B (zh) Ics入侵检测方法、装置、电子设备和存储介质
CN113902946A (zh) 电力系统故障方位判别方法、装置、终端设备及存储介质
CN113807469A (zh) 一种多能源用户价值预测方法、装置、存储介质和设备
CN115905959A (zh) 基于缺陷因子的电力断路器关联性故障分析方法及装置
CN115577643A (zh) 一种电缆终端头的温度预测方法及装置
CN111340287A (zh) 配电柜运行状态预测方法及装置
CN114881286A (zh) 一种基于深度学习的短时降水预测方法
CN117407770A (zh) 基于神经网络的高压开关柜故障模式分类及预测方法
CN112767190B (zh) 一种基于多层堆叠式神经网络的台区相序识别方法及装置
CN113283222A (zh) 自动化报表生成方法、装置、计算机设备及存储介质
CN115952928B (zh) 一种短期电力负荷预测方法、装置、设备及存储介质
CN117156442A (zh) 基于5g网络的云数据安全保护方法及系统
CN112801315A (zh) 电力二次设备的状态诊断方法、装置及终端
CN111738348A (zh) 一种电力数据异常检测方法和装置
CN115017828A (zh) 基于双向长短时记忆网络的电力电缆故障识别方法及系统
CN113468701A (zh) 一种配网故障识别的方法及相关装置
CN112819067A (zh) 一种配电网不良数据的处理方法、装置、设备和存储介质
CN112686330A (zh) Kpi异常数据检测方法及装置、存储介质及电子设备
CN108876393B (zh) 判断用户风险程度的方法、装置
Liao et al. An Open-Source Toolbox with Classical Classifiers for Electricity Theft Detection
CN117278313A (zh) 一种计算机网络结构优化的安全检测方法及系统
Cui et al. GIS Fault Rate Prediction Method Based on Convolutional Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant