CN117574238A - 基于多门控专家网络的高频电器识别模型构建方法及系统 - Google Patents

基于多门控专家网络的高频电器识别模型构建方法及系统 Download PDF

Info

Publication number
CN117574238A
CN117574238A CN202311585398.5A CN202311585398A CN117574238A CN 117574238 A CN117574238 A CN 117574238A CN 202311585398 A CN202311585398 A CN 202311585398A CN 117574238 A CN117574238 A CN 117574238A
Authority
CN
China
Prior art keywords
electric appliance
data
network
appliance
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311585398.5A
Other languages
English (en)
Inventor
谈竹奎
邓松
刘斌
唐赛秋
徐长宝
杨尹青
党林
林呈辉
张后谊
王扬
张历
杨一帆
代奇迹
丁超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202311585398.5A priority Critical patent/CN117574238A/zh
Publication of CN117574238A publication Critical patent/CN117574238A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了基于多门控专家网络的高频电器识别模型构建方法及系统包括,获取高频电器功率数据,并进行电器种类划分,同时对高频电器功率数据进行预处理;对预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对各电器种类的典型功率波形库进行抽样,生成总线功率数据集;将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。减少了现有识别方法中事件检测和混叠分解所造成的数据畸变,有效提高了电器识别的效率和准确率。

Description

基于多门控专家网络的高频电器识别模型构建方法及系统
技术领域
本发明涉及高频电器识别技术领域,尤其涉及基于多门控专家网络的高频电器识别模型构建方法及系统。
背景技术
近年来,非侵入式电器识别发挥着极为重要的积极作用,它有助于提高能源效率、降低碳排放、优化电力系统,并鼓励用户更加积极地参与和理解能源消耗。目前,非侵入式高频电器识别技术在国内外已经有部分学者进行了一定的研究。现有大部分研究均是在总线处采集电器数据,通过事件检测和混叠分解的方法得到单体电器数据,再利用识别算法判断电器信息。但是,现有高频电器识别方法在真实用电场景中识别准确率低,实用性差,具体的不足有:
1、在实际环境中,用电设备运行状况复杂,现有事件检测方法难以准确捕捉电器的投切事件,进而使得高频数据混叠分解的波形畸变率大,难以提取到与高频电器对应的有效特征,导致高频电器识别的准确率较低。
2、目前大部分电器识别均采用单任务学习模型,不同的电器识别任务需要构建不同的模型,存在着部署运行后计算资源需求大,实用性差的问题,并且忽视了不同电器识别任务之间存在的关联信息。
3、用于训练高频电器识别模型的数据集大多只包含有对应电器一种或少数几种运行特性下的高频电器功率数据,并未考虑真实用电场景中多种电器在不同运行特性下组合运行的可能,模型泛化性较弱。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了基于多门控专家网络的高频电器识别模型构建方法及系统,能够解决背景技术中提到的问题。
为解决上述技术问题,本发明提供如下技术方案,基于多门控专家网络的高频电器识别模型构建方法,包括:
获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理;
对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于所述总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理包括:
所述的高频功率数据指功率数据的采样频率不低于7.5kHz;
记采集到的高频电器功率数据为L,高频电器功率数据为L包含M种电器数据其中/>为需要进行电器识别的高频电器功率数据集合,nclass为数据集中需要进行电器识别的电器种类个数,nclass<M,第i种电器的功率数据集合Li中存储有第i种电器在不同运行特性下的高频电器功率数据;
所述预处理包括异常值检测和归一化处理;
所述异常值检测的判据的计算如下式所示:
abn=I(|xi+1-xi|>T),i=1,2,...,w
其中,I(·)为指示函数,若括号内的条件满足则返回1,否则返回0;xi+1与xi分别表示单条片段数据中的第i+1和第i个功率采样点;T表示相邻功率采样点绝对差分值的阈值;若abn等于1则判定为存在异常值,删除该条片段数据;
所述归一化是指将各电器种类的片段数据减去片段数据自身的均值,再除以片段数据自身的标准差。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库包括:
所述切片包括将预处理后的各电器种类的高频功率数据按采样周期Tsamp进行截取,截成采样周期长度的片段功率数据;
所述聚类包括分别对不同种类电器的片段功率数据集合进行K-Means聚类,对于第i种电器做聚类,其目标函数如下式所示:
其中,为第i种电器所有片段功率数据的总数;/>为第i种电器聚类簇的个数;xiv为第i种电器的第v条片段功率数据;centerij为第i种电器的第j个聚类簇中心;
在聚类过程中根据肘部法则确定最佳的聚类中心的个数;
所述肘部法则包括对第i种电器的条数据,聚类中心个数ρ从1到/>遍历,每次聚类完成后计算每个数据到其所属的聚类簇中心的误差平方和,误差平方和会随着聚类中心个数ρ的增大而减小,误差平方和的计算方法如下式所示
其中,ρi为第i种电器的聚类中心个数;n为第i种电器第γ个聚类簇所包含的数据个数;uiγη为第i种电器第γ个聚类簇中的第η个数据;为第i种电器第γ个聚类簇中心的数据。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述肘部法则还包括:
当聚类中心个数ρ从1到遍历完成后,使聚类中心个数ρ从2到/>遍历,计算聚类中心个数为ρ-1与聚类中心个数为ρ时对应的误差平方和的变化率Kρ-1,ρ以及聚类中心个数为ρ与聚类中心个数为ρ+1时对应的误差平方和的变化率Kρ,ρ+1,误差平方和的变化率的计算方法如下式所示:
Ka,b=(SSEa-SSEb)/(a-b)
其中,a,b为聚类中心个数的两个取值;Ka,b为聚类中心个数为a与聚类中心个数为b时对应的误差平方和的变化率;SSEa为当聚类中心个数为a时的误差平方和;SSEb为当聚类中心个数为b时的误差平方和,当Kρ-1,ρ/Kρ,ρ+1<Thr时,取此时的聚类中心个数为ρ为最佳的聚类中心个数,Thr表示第一阈值;
按照上述聚类方法得到的聚类簇构建典型功率波形库其中,/>为需要进行电器识别的电器的数据库,/>为不需要进行电器识别的电器的数据库;第i种电器的数据库存储的是第i种电器按数据归一化后的聚类结果得到的/>个聚类簇中心的典型波形数据。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集包括:
所述抽样包括对所述典型功率波形库进行有放回的抽取;
选取参与组合过程的电器类别,总共有种抽样方案,其中,表示从M种电器中抽取0种电器,/>表示从M种电器中抽取1种电器,依此类推;
遍历这2M种抽样方案,再对于每一种抽样方案抽样出来的电器进一步抽取,在每一种电器中随机选择对应电器的一个典型波形;
经过上述一个抽样过程,即得到2M组参与组合过程的电器的典型波形数据;
所述生成总线功率数据集包括遍历上述抽样所得到的2M组参与组合过程的电器的典型波形数据,将每一组中的各电器的典型波形数据按相位对齐后相加,即得到该组对应的总线功率数据,且该组对应的标签数据为其中,Yi=0或1,i∈(1,nclass),若该组包含有第i种电器,则Yi=1,若该组不包含有第i种电器,则Yi=0。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型包括:
所述共享模块由门控网络和专家网络组成,负责提取各电器识别任务间所存在的关联信息;
所述专家网络采用时序卷积神经网络,所述时序卷积神经网络由膨胀因果卷积和残差网络构成,时序卷积神经网络的膨胀因果卷积运算公式如下:
其中,Hκ(t)为第κ层时间序列,h(·)为激活函数,*为卷积操作,ωκ,i为第κ层的第i个卷积核的权重,k为卷积核的宽度,表示第κ层的输入是对第κ-1层k个时刻的输出进行卷积运算得到;d为膨胀因子,表示跨时间步的步数;Hκ-1(t-d×i)为第κ-1层时间序列在不同时间步的值;
所述并行的电器识别子任务模块均包含有三个全连接层,负责提取对应任务中的独有特征信息,子任务模块的个数由所参与电器识别的电器个数决定,将共享模块提取到的数据间的关联信息接入到多个并行的子任务模块中,得到最终的电器识别结果。
作为本发明所述的基于多门控专家网络的高频电器识别模型构建方法的一种优选方案,其中:所述将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型还包括:
损失函数采用交叉熵损失,各电器识别子任务的损失函数所占权重比相等,将所有子任务的损失函数值相加,即得到模型的总损失函数值,单个子任务的损失函数loss的计算方法如下式所示:
其中,ntotal为数据集的总样本数;nclass为数据集中需要进行电器识别的电器种类个数;为数据集中第p种电器所对应的样本个数;/>为多任务学习模型对第p种电器的第q条样本的分类概率值;
所述多任务学习模型为:
yk=hk(fk(x))
其中,nexpert为模型中专家网络的个数;k为电器识别任务编号;为第i个专家网络对于第k个子任务所占的权重;Wki为门控网络的变换矩阵;fi(x)为专家网络的输出;hk(x)为子任务模块中全连接层的输出;yk为模型对于第k种电器是否工作的判别结果。
基于多门控专家网络的高频电器识别模型构建系统,其特征在于,包括:预处理模块、数据集获取模块以及模型建立与训练模块,
预处理模块,所述预处理模块用于获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理;
数据集获取模块,所述数据集获取模块用于对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
模型建立与训练模块,所述模型建立与训练模块用于将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于所述总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本发明的有益效果:本发明提出基于多门控专家网络的高频电器识别模型构建方法及系统,获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理;对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集;将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于所述总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。本发明根据总线处的高频功率数据直接进行高频电器的电器识别,减少了现有识别方法中事件检测和混叠分解所造成的数据畸变,有效提高了电器识别的效率和准确率。本发明采用多任务学习模式,通过多门控专家网络学习各高频电器识别任务之间的关联信息,并且专家网络采用时序卷积神经网络,可以有效提取高频功率序列的特征,提高电器识别的准确率;本发明提出一种新型的构建电器识别数据集的方法,对于多种高频电器不同运行特性下的功率波形数据进行抽样组合,使得电器识别算法在复杂用电场景中具有更强的实用性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例提供的基于多门控专家网络的高频电器识别模型构建方法及系统的方法流程图;
图2为本发明一个实施例提供的基于多门控专家网络的高频电器识别模型构建方法及系统的多任务学习示意图;
图3为本发明一个实施例提供的基于多门控专家网络的高频电器识别模型构建方法及系统的专家网络结构示意图;
图4为本发明一个实施例提供的基于多门控专家网络的高频电器识别模型构建方法及系统的子任务模块结构示意图;
图5为本发明一个实施例提供的基于多门控专家网络的高频电器识别模型构建方法及系统的计算机设备的内部结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1-5,为本发明的第一个实施例,该实施例提供了基于多门控专家网络的高频电器识别模型构建方法及系统,包括:
获取高频电器功率数据,并进行电器种类划分,同时对高频电器功率数据进行预处理;
在本申请实施例中,使用智能量测终端采集高频电器功率数据,智能量测终端包括智能插座、智能电表;
应说明的是,高频功率数据指功率数据的采样频率不低于7.5kHz;
在本申请实施例中,功率数据的采样频率fsamp取7.5kHz;
更进一步的,记采集到的高频电器功率数据为L,高频电器功率数据为L包含M种电器数据其中/>为需要进行电器识别的高频电器功率数据集合,nclass为数据集中需要进行电器识别的电器种类个数,nclass<M,第i种电器的功率数据集合Li中存储有第i种电器在不同运行特性下的高频电器功率数据;
在本申请实施例中,M取为15,nclass取为10。
更进一步的,预处理包括异常值检测和归一化处理;
应说明的是,异常值检测的判据的计算如下式所示:
abn=I(|xi+1-xi|>T),i=1,2,...,w
其中,I(·)为指示函数,若括号内的条件满足则返回1,否则返回0;xi+1与xi分别表示单条片段数据中的第i+1和第i个功率采样点;T表示相邻功率采样点绝对差分值的阈值;若abn等于1则判定为存在异常值,删除该条片段数据;
在本申请实施例中,T设为10000。
更进一步的,归一化是指将各电器种类的片段数据减去片段数据自身的均值,再除以片段数据自身的标准差。
更进一步的,对预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
其中,对预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库包括:
切片包括将预处理后的各电器种类的高频功率数据按采样周期Tsamp进行截取,截成采样周期长度的片段功率数据;
采样周期的计算方法如下式所示:
其中,fsamp为采样时的高频采样频率;
更进一步的,聚类包括分别对不同种类电器的片段功率数据集合进行K-Means聚类,对于第i种电器做聚类,其目标函数如下式所示:
其中,为第i种电器所有片段功率数据的总数;/>为第i种电器聚类簇的个数;xiv为第i种电器的第v条片段功率数据;centerij为第i种电器的第j个聚类簇中心;
在本申请实施例中,第i种电器的片段功率数据总数取为100。
更进一步的,在聚类过程中根据肘部法则确定最佳的聚类中心的个数;
肘部法则包括对第i种电器的条数据,聚类中心个数ρ从1到/>遍历,每次聚类完成后计算每个数据到其所属的聚类簇中心的误差平方和,误差平方和会随着聚类中心个数ρ的增大而减小,误差平方和的计算方法如下式所示
其中,ρi为第i种电器的聚类中心个数;n为第i种电器第γ个聚类簇所包含的数据个数;uiγη为第i种电器第γ个聚类簇中的第η个数据;为第i种电器第γ个聚类簇中心的数据。
更进一步的,当聚类中心个数ρ从1到遍历完成后,使聚类中心个数ρ从2到/>遍历,计算聚类中心个数为ρ-1与聚类中心个数为ρ时对应的误差平方和的变化率Kρ-1,ρ以及聚类中心个数为ρ与聚类中心个数为ρ+1时对应的误差平方和的变化率Kρ,ρ+1,误差平方和的变化率的计算方法如下式所示:
Ka,b=(SSEa-SSEb)/(a-b)
其中,a,b为聚类中心个数的两个取值;Ka,b为聚类中心个数为a与聚类中心个数为b时对应的误差平方和的变化率;SSEa为当聚类中心个数为a时的误差平方和;SSEb为当聚类中心个数为b时的误差平方和,当Kρ-1,ρ/Kρ,ρ+1<Thr时,取此时的聚类中心个数为ρ为最佳的聚类中心个数,Thr表示第一阈值;
在本申请实施例中,第一阈值Thr取为0.3。
更进一步的,按照上述聚类方法得到的聚类簇构建典型功率波形库其中,/>为需要进行电器识别的电器的数据库,/>为不需要进行电器识别的电器的数据库;第i种电器的数据库存储的是第i种电器按数据归一化后的聚类结果得到的/>个聚类簇中心的典型波形数据。
更进一步的,对各电器种类的典型功率波形库进行抽样,生成总线功率数据集包括:抽样包括对典型功率波形库进行有放回的抽取;
选取参与组合过程的电器类别,总共有种抽样方案,其中,表示从M种电器中抽取0种电器,/>表示从M种电器中抽取1种电器,依此类推;
更进一步的,遍历这2M种抽样方案,再对于每一种抽样方案抽样出来的电器进一步抽取,在每一种电器中随机选择对应电器的一个典型波形;
更进一步的,经过上述一个抽样过程,即得到2M组参与组合过程的电器的典型波形数据;
更进一步的,生成总线功率数据集包括遍历上述抽样所得到的2M组参与组合过程的电器的典型波形数据,将每一组中的各电器的典型波形数据按相位对齐后相加,即得到该组对应的总线功率数据,且该组对应的标签数据为其中,Yi=0或1,i∈(1,nclass),若该组包含有第i种电器,则Yi=1,若该组不包含有第i种电器,则Yi=0。
应说明的是,经过一轮组合即得到了2M条包含有总线功率数据和对应电器标签的数据。经过Nextract次上述抽样组合的过程,得到最终电器识别训练集。
在本申请实施例中,Nextract取为2。
将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型包括:
更进一步的,共享模块由门控网络和专家网络组成,负责提取各电器识别任务间所存在的关联信息;
更进一步的,专家网络采用时序卷积神经网络,时序卷积神经网络由膨胀因果卷积和残差网络构成,时序卷积神经网络的膨胀因果卷积运算公式如下:
其中,Hκ(t)为第κ层时间序列,h(·)为激活函数,*为卷积操作,ωκ,i为第κ层的第i个卷积核的权重,k为卷积核的宽度,表示第κ层的输入是对第κ-1层k个时刻的输出进行卷积运算得到;d为膨胀因子,表示跨时间步的步数;Hκ-1(t-d×i)为第κ-1层时间序列在不同时间步的值;
更进一步的,并行的电器识别子任务模块均包含有三个全连接层,负责提取对应任务中的独有特征信息,子任务模块的个数由所参与电器识别的电器个数决定,将共享模块提取到的数据间的关联信息接入到多个并行的子任务模块中,得到最终的电器识别结果。
在本申请实施例中,本发明中专家网络有三层时序卷积神经网络,卷积核宽度k取为4,输入层和三个时序卷积神经网络层的膨胀因子d依次取为1、2、4、8。
其中,激活函数采用Sigmoid激活函数,计算方法如下式所示:
其中,x为Sigmoid激活函数的输入。
更进一步的,将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型还包括:
损失函数采用交叉熵损失,各电器识别子任务的损失函数所占权重比相等,将所有子任务的损失函数值相加,即得到模型的总损失函数值,单个子任务的损失函数loss的计算方法如下式所示:
其中,ntotal为数据集的总样本数;nclass为数据集中需要进行电器识别的电器种类个数;为数据集中第p种电器所对应的样本个数;/>为多任务学习模型对第p种电器的第q条样本的分类概率值;
更进一步的,多任务学习模型为:
yk=hk(fk(x))
其中,nexpert为模型中专家网络的个数;k为电器识别任务编号;为第i个专家网络对于第k个子任务所占的权重;Wki为门控网络的变换矩阵;fi(x)为专家网络的输出;hk(x)为子任务模块中全连接层的输出;yk为模型对于第k种电器是否工作的判别结果。
在一个优选的实施例中,基于多门控专家网络的高频电器识别模型构建系统,包括:预处理模块、数据集获取模块以及模型建立与训练模块,
预处理模块,预处理模块用于获取高频电器功率数据,并进行电器种类划分,同时对高频电器功率数据进行预处理;
数据集获取模块,数据集获取模块用于对预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
模型建立与训练模块,模型建立与训练模块用于将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
上述各单元模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现基于多门控专家网络的高频电器识别模型构建方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取高频电器功率数据,并进行电器种类划分,同时对高频电器功率数据进行预处理;
对预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
实施例2
参照图2-4,为本发明的一个实施例,提供了基于多门控专家网络的高频电器识别模型构建方法及系统,为了验证本发明的有益效果,通过对比实验进行科学论证。
如图2所示构建并行的电器识别子任务模块,负责提取对应任务中的独有特征信息。子任务模块的个数由所参与电器识别的电器个数决定。将共享模块提取到的数据间的关联信息接入到多个并行的子任务模块中,得到最终的电器识别结果。如图4所示,本发明中的每个子任务模块均包含有三个全连接层,所有子任务模块的第一个全连接层神经元数目为64;第二个全连接层神经元数目为32;第三个全连接层神经元数目为16。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.基于多门控专家网络的高频电器识别模型构建方法,其特征在于,包括:
获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理;
对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于所述总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
2.如权利要求1所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理包括:
所述的高频功率数据指功率数据的采样频率不低于7.5kHz;
记采集到的高频电器功率数据为L,高频电器功率数据为L包含M种电器数据其中/>为需要进行电器识别的高频电器功率数据集合,nclass为数据集中需要进行电器识别的电器种类个数,nclass<M,第i种电器的功率数据集合Li中存储有第i种电器在不同运行特性下的高频电器功率数据;
所述预处理包括异常值检测和归一化处理;
所述异常值检测的判据的计算如下式所示:
abn=I(|xi+1-xi|>T),i=1,2,...,w
其中,I(·)为指示函数,若括号内的条件满足则返回1,否则返回0;xi+1与xi分别表示单条片段数据中的第i+1和第i个功率采样点;T表示相邻功率采样点绝对差分值的阈值;若abn等于1则判定为存在异常值,删除该条片段数据;
所述归一化是指将各电器种类的片段数据减去片段数据自身的均值,再除以片段数据自身的标准差。
3.如权利要求2所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库包括:
所述切片包括将预处理后的各电器种类的高频功率数据按采样周期Tsamp进行截取,截成采样周期长度的片段功率数据;
所述聚类包括分别对不同种类电器的片段功率数据集合进行K-Means聚类,对于第i种电器做聚类,其目标函数如下式所示:
其中,为第i种电器所有片段功率数据的总数;/>为第i种电器聚类簇的个数;xiv为第i种电器的第v条片段功率数据;centerij为第i种电器的第j个聚类簇中心;
在聚类过程中根据肘部法则确定最佳的聚类中心的个数;
所述肘部法则包括对第i种电器的条数据,聚类中心个数ρ从1到/>遍历,每次聚类完成后计算每个数据到其所属的聚类簇中心的误差平方和,误差平方和会随着聚类中心个数ρ的增大而减小,误差平方和的计算方法如下式所示
其中,ρi为第i种电器的聚类中心个数;n为第i种电器第γ个聚类簇所包含的数据个数;uiγη为第i种电器第γ个聚类簇中的第η个数据;为第i种电器第γ个聚类簇中心的数据。
4.如权利要求3所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述肘部法则还包括:
当聚类中心个数ρ从1到遍历完成后,使聚类中心个数ρ从2到/>遍历,计算聚类中心个数为ρ-1与聚类中心个数为ρ时对应的误差平方和的变化率Kρ-1,ρ以及聚类中心个数为ρ与聚类中心个数为ρ+1时对应的误差平方和的变化率Kρ,ρ+1,误差平方和的变化率的计算方法如下式所示:
Ka,b=(SSEa-SSEb)/(a-b)
其中,a,b为聚类中心个数的两个取值;Ka,b为聚类中心个数为a与聚类中心个数为b时对应的误差平方和的变化率;SSEa为当聚类中心个数为a时的误差平方和;SSEb为当聚类中心个数为b时的误差平方和,当Kρ-1,ρ/Kρ,ρ+1<Thr时,取此时的聚类中心个数为ρ为最佳的聚类中心个数,Thr表示第一阈值;
按照上述聚类方法得到的聚类簇构建典型功率波形库其中,/>为需要进行电器识别的电器的数据库,/>为不需要进行电器识别的电器的数据库;第i种电器的数据库存储的是第i种电器按数据归一化后的聚类结果得到的/>个聚类簇中心的典型波形数据。
5.如权利要求4所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集包括:
所述抽样包括对所述典型功率波形库进行有放回的抽取;
选取参与组合过程的电器类别,总共有种抽样方案,其中,/>表示从M种电器中抽取0种电器,/>表示从M种电器中抽取1种电器,依此类推;
遍历这2M种抽样方案,再对于每一种抽样方案抽样出来的电器进一步抽取,在每一种电器中随机选择对应电器的一个典型波形;
经过上述一个抽样过程,即得到2M组参与组合过程的电器的典型波形数据;
所述生成总线功率数据集包括遍历上述抽样所得到的2M组参与组合过程的电器的典型波形数据,将每一组中的各电器的典型波形数据按相位对齐后相加,即得到该组对应的总线功率数据,且该组对应的标签数据为其中,Yi=0或1,i∈(1,nclass),若该组包含有第i种电器,则Yi=1,若该组不包含有第i种电器,则Yi=0。
6.如权利要求5所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型包括:
所述共享模块由门控网络和专家网络组成,负责提取各电器识别任务间所存在的关联信息;
所述专家网络采用时序卷积神经网络,所述时序卷积神经网络由膨胀因果卷积和残差网络构成,时序卷积神经网络的膨胀因果卷积运算公式如下:
其中,Hκ(t)为第κ层时间序列,h(·)为激活函数,*为卷积操作,ωκ,i为第κ层的第i个卷积核的权重,k为卷积核的宽度,表示第κ层的输入是对第κ-1层k个时刻的输出进行卷积运算得到;d为膨胀因子,表示跨时间步的步数;Hκ-1(t-d×i)为第κ-1层时间序列在不同时间步的值;
所述并行的电器识别子任务模块均包含有三个全连接层,负责提取对应任务中的独有特征信息,子任务模块的个数由所参与电器识别的电器个数决定,将共享模块提取到的数据间的关联信息接入到多个并行的子任务模块中,得到最终的电器识别结果。
7.如权利要求6所述的基于多门控专家网络的高频电器识别模型构建方法,其特征在于,所述将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型还包括:
损失函数采用交叉熵损失,各电器识别子任务的损失函数所占权重比相等,将所有子任务的损失函数值相加,即得到模型的总损失函数值,单个子任务的损失函数loss的计算方法如下式所示:
其中,ntotal为数据集的总样本数;nclass为数据集中需要进行电器识别的电器种类个数;为数据集中第p种电器所对应的样本个数;/>为多任务学习模型对第p种电器的第q条样本的分类概率值;
所述多任务学习模型为:
yk=hk(fk(x))
其中,nexpert为模型中专家网络的个数;k为电器识别任务编号;为第i个专家网络对于第k个子任务所占的权重;Wki为门控网络的变换矩阵;fi(x)为专家网络的输出;hk(x)为子任务模块中全连接层的输出;yk为模型对于第k种电器是否工作的判别结果。
8.基于多门控专家网络的高频电器识别模型构建系统,其特征在于,包括:预处理模块、数据集获取模块以及模型建立与训练模块,
预处理模块,所述预处理模块用于获取高频电器功率数据,并进行电器种类划分,同时对所述高频电器功率数据进行预处理;
数据集获取模块,所述数据集获取模块用于对所述预处理后的数据按周期进行切片,分别对各电器种类的片段数据集合进行聚类,得到各电器种类的典型功率波形库,对所述各电器种类的典型功率波形库进行抽样,生成总线功率数据集;
模型建立与训练模块,所述模型建立与训练模块用于将门控网络和时序卷积神经网络作为专家网络,结合建立共享模块与多个并行的子任务模块构成的多任务学习模型,并且基于所述总线功率数据集以及对应的电器种类标签数据完成对该多任务学习模型的训练。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202311585398.5A 2023-11-24 2023-11-24 基于多门控专家网络的高频电器识别模型构建方法及系统 Pending CN117574238A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311585398.5A CN117574238A (zh) 2023-11-24 2023-11-24 基于多门控专家网络的高频电器识别模型构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311585398.5A CN117574238A (zh) 2023-11-24 2023-11-24 基于多门控专家网络的高频电器识别模型构建方法及系统

Publications (1)

Publication Number Publication Date
CN117574238A true CN117574238A (zh) 2024-02-20

Family

ID=89862183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311585398.5A Pending CN117574238A (zh) 2023-11-24 2023-11-24 基于多门控专家网络的高频电器识别模型构建方法及系统

Country Status (1)

Country Link
CN (1) CN117574238A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118277893A (zh) * 2024-06-03 2024-07-02 国网辽宁省电力有限公司信息通信分公司 基于非侵入式监测的多元关联发电设备能量状态识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118277893A (zh) * 2024-06-03 2024-07-02 国网辽宁省电力有限公司信息通信分公司 基于非侵入式监测的多元关联发电设备能量状态识别方法
CN118277893B (zh) * 2024-06-03 2024-09-27 国网辽宁省电力有限公司信息通信分公司 基于非侵入式监测的多元关联发电设备能量状态识别方法

Similar Documents

Publication Publication Date Title
de Oliveira et al. Deep learning for power quality
CN110659207B (zh) 基于核谱映射迁移集成的异构跨项目软件缺陷预测方法
CN114493014B (zh) 多元时间序列预测方法、系统及计算机产品、存储介质
CN107909212B (zh) 基于中尺度风电功率发展过程序列化的爬坡事件预测方法
CN109784388A (zh) 窃电用户识别方法和装置
CN117574238A (zh) 基于多门控专家网络的高频电器识别模型构建方法及系统
Lai et al. Application of big data in smart grid
CN111224805A (zh) 一种网络故障根因检测方法、系统及存储介质
CN114530258A (zh) 一种深度学习药物相互作用预测方法、装置、介质和设备
CN104133143A (zh) 一种基于Hadoop云计算平台的电网线路故障诊断系统及方法
Zu et al. A simple gated recurrent network for detection of power quality disturbances
Yoon et al. Deep learning-based method for the robust and efficient fault diagnosis in the electric power system
CN115577259A (zh) 高压直流输电系统故障选极方法、装置和计算机设备
CN117435901B (zh) 一种工业互联网数据获取方法、系统、终端及储存介质
Li CNN-GRU model based on attention mechanism for large-scale energy storage optimization in smart grid
Hu et al. Graph transformer based dynamic multiple graph convolution networks for traffic flow forecasting
CN117634668A (zh) 一种配电网多元负荷的预测模型建立、预测方法及装置
Copiaco et al. Exploring deep time-series imaging for anomaly detection of building energy consumption
Liu et al. Automatic classification and recognition of geomagnetic interference events based on machine learning
CN113835964B (zh) 基于小样本学习的云数据中心服务器能耗预测方法
Bosma et al. Estimating solar and wind power production using computer vision deep learning techniques on weather maps
Bedi et al. Performance analysis of machine learning and deep learning algorithms for smart cities: the present state and future directions
Nussipova et al. Optimizing loss functions for improved energy demand prediction in smart power grids.
Zuin et al. An Ensemble Approach for Inconsistency Detection in Medical Bills: A Case Study
CN115238805B (zh) 异常数据识别模型的训练方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination