CN116167654A - 一种基于多任务学习的非侵入式负荷监测方法 - Google Patents
一种基于多任务学习的非侵入式负荷监测方法 Download PDFInfo
- Publication number
- CN116167654A CN116167654A CN202310101545.0A CN202310101545A CN116167654A CN 116167654 A CN116167654 A CN 116167654A CN 202310101545 A CN202310101545 A CN 202310101545A CN 116167654 A CN116167654 A CN 116167654A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- electrical equipment
- sequence
- target electrical
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012544 monitoring process Methods 0.000 title claims abstract description 20
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 52
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 238000001514 detection method Methods 0.000 claims abstract description 32
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims description 26
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 4
- 238000012805 post-processing Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 8
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 239000000284 extract Substances 0.000 abstract description 2
- 230000007704 transition Effects 0.000 description 15
- 238000005406 washing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000010287 polarization Effects 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明属于智能电网领域,具体涉及一种基于多任务学习的非侵入式负荷监测方法,多任务学习通过参数共享,利用任务之间的相关性与正则化,提高模型的学习能力与泛化能力,软参数共享架构能够进行更加灵活的特征融合,并保持任务之间的特异性;本发明构建了一个并行高频特征提取模块,对功率信号进行db2离散小波分解,并对第一层细节系数进行重构,以此为基础提取功率信号中的高频信息,获得功率信号中的突变信息,为模型检测电器状态转换提供辅助特征;本发明分别构建两个子任务门控网络,实现特征融合,将底层共享特征与高频辅助特征进行加权融合;最后模型的输出为两个子任务各自输出的乘积,获得不同电器负荷分解量。
Description
技术领域
本发明属于智能电网领域,涉及非侵入式负荷监测技术,具体涉及一种基于多任务学习的非侵入式负荷监测方法。
背景技术
非侵入式负荷监测(Non-Intrusive Load Monitoring,NILM),亦称负荷分解,仅需在供电入口处部署一个智能电表用以获取总负荷,以低成本方式向用户提供详细的用电信息,帮助用户改善自身用电习惯,提高用电效率。同时,NILM技术为节能、电器故障检测、电力需求管理等领域的研究提供有效数据支持。
NILM模型主要分为基于事件(Event-based)与基于非事件(Event-free)两种方案。基于事件模型需要首先对输入电气值进行事件检测,获得稳态特征与暂态特征,然后将包含多个负荷特征的特征集输入到模型中进行负荷分解,因此基于事件NILM模型依赖于10kHz到100kHz的高频采样数据,尤其是对于暂态特征的提取。但大多数智能电表通常只支持1Hz左右的低频采样率,难以满足暂态特征提取要求。考虑到实际应用成本与可操作性,基于深度学习的NILM模型通常基于非事件,利用神经网络优秀的特征提取能力,由CNN,RNNs等神经网络单元自动学习得到负荷特征,无需进行事件检测,采取1Hz左右的低频采样数据即可实现端到端的负荷分解。
然而,现有的很多方法主要针对于具有简单恒定工作模式的电器,例如冰箱。该类电器通常以较为固定的工作周期与工作功率,在后台保持着长时间的规律运行,能够为模型提供相对充足的训练样本。并且,较固定的工作模式也更容易被模型所学习。因此,在分解该类电器时,模型通常都能获得不错的性能。然而,当面对具有稀疏性、多状态和快速状态转换电器时,现有很多方法均无法获得较好分解结果。其中,具有稀疏性的电器通常只会在一天中的某些时段偶尔开启,且运行时间短暂,如微波炉;具有多状态和快速状态转换的电器,通常具有多个工作模式或档位,且会在模式之间快速转换,如洗衣机,洗碗机等电器。针对这两类电器的负荷分解,现有方法容易丢失一部分快速的电器状态转换以及功率突变,难以学习到小功率工作模式以及稀疏性开关事件。
发明内容
本发明针对NILM传统方法对于稀疏性、多状态以及快速状态转换电器分解性能不佳的问题,提出了一种基于多任务学习的非侵入式负荷监测方法,包括以下步骤:
S1.采集某一住宅在某一时间段内的电气数据,电气数据包括住宅中所有电器设备的总功率消耗序列,以及目标电器设备自身的功率消耗序列;
S2.根据目标电器设备自身的功率消耗序列生成对应的状态检测标签;
S3.分别对住宅中所有电器设备的总功率消耗序列,以及目标电器设备自身的功率消耗序列进行预处理;
S4.在预处理后的总功率消耗序列上采用长度为T的滑动窗口,以步长1进行滑动取样;以一个滑动窗口内的序列数据作为输入,并将该序列数据中点时间对应的目标电器设备的预处理后的功率消耗作为输出,最终得到样本数据集;
S5.将样本数据集划分为训练集和测试集,采用训练集对基于软参数共享的多任务学习模型进行训练,所述多任务学习模型包括底层特征提取模块、高频特征提取模块、特征加权融合模块和任务特定特征提取模块;
S6.实时获取待识别总功率消耗数据,通过训练好的多任务学习模型输出目标电器设备的功率消耗。
S7.对多任务学习模型输出的目标电器设备的功率消耗进行后处理,并计算得到目标电器设备的开关状态序列。
进一步的,底层特征提取模块包括依次级联的第一卷积层、第一残差块、第二残差块和第二卷积层。
进一步的,高频特征提取模块包括离散小波变换单元和特征提取单元;所述特征提取单元的结构与底层特征提取模块的结构相同,其包括依次级联的第一卷积层、第一残差块、第二残差块和第二卷积层。
进一步的,第一残差块包括三个依次级联的第一卷积块,且第一卷积块的卷积核大小为7,步长为1;第二残差块包括三个依次级联的第二卷积块,且第二卷积块的卷积核大小为3,步长为1。
进一步的,离散小波变换单元通过Daubechies小波基函数对输入序列进行小波分解得到第一层细节系数,对第一层细节系数进行重构后输入特征提取单元。
进一步的,特征加权融合模块包括门控网络A和门控网络B;门控网络A和门控网络B的结构相同。
进一步的,任务特定特征提取模块包括分类子网络和回归子网络,分类子网络用于进行分类任务,输出目标电器设备的状态序列;回归子网络用于进行回归任务,输出目标电器设备的预测功率消耗序列;将分类子网络的输出与回归子网络的输出相乘得到目标电器设备的最终预测功率消耗序列。
进一步的,分类子网络采用二元交叉熵损失函数计算损失,表示为:
其中,表示分类子网络输出的目标电器设备i状态序列,si表示目标电器设备i真实的状态序列,si(t)表示目标电器设备i在t时刻的开关状态真实值,/>表示分类子网络输出的目标电器设备i在t时刻的开关状态,T表示滑动窗口长度。
进一步的,回归子网络采用均方误差损失函数计算损失,表示为:
其中,表示多任务学习模型最终输出的目标电器设备i的功率消耗序列,/>表示目标电器设备i预处理后的真实功率消耗序列,/>表示目标电器设备i在t时刻的预处理后的功率消耗真实值,/>表示多任务模型最终输出的目标电器设备i在t时刻的功率消耗。
本发明的有益效果:
本发明提出了一种基于多任务学习的非侵入式负荷监测方法,其多任务学习核心在于软参数共享,与硬参数共享相比,软参数共享架构能够进行更加灵活的特征融合,既充分利用了负荷分解与状态检测任务的相关性,同时保持了两个任务的特异性,提高了模型的学习能力与泛化能力,使得状态检测子网络能够更好地辅助模型完成负荷分解。
本发明提出了一种基于软参数共享的多任务学习模型,所述多任务学习模型包括底层特征提取模块、高频特征提取模块、特征加权融合模块和任务特定特征提取模块;高频特征提取模块中加入离散小波分解,从频域角度,为模型检测信号突变提供辅助的高频信息,提高了模型对功率突变的检测能力。
附图说明
图1为本发明的负荷分解结果示意图;
图2为本发明的基于多任务学习的非侵入式负荷监测方法训练测试流程图;
图3为本发明基于软参数共享的多任务学习模型结构图;
图4为本发明的Identity block结构图;
图5为本发明的原始功率信号与db2小波分解第一层细节系数重构模值对比图;
图6为本发明提出模型在REDD数据集中对四个电器进行负荷分解的结果示意图;
图7为本发明实施例的三种模型在REDD数据集中的负荷分解结果对比图;
图8为本发明提出模型在UK-DALE数据集中对四个电器进行负荷分解的结果示意图;
图9为本发明实施例的三种模型在UK-DALE数据集中的负荷分解结果对比图;
图10为本发明的基于多任务学习的非侵入式负荷监测方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
通常,智能电表测量得到的一个住宅在t时刻的总负荷消耗y(t)可以表示为:
其中,N表示该住宅内的电器设备总数量,xn(t)表示电器设备n在t时刻的功率消耗,e(t)表示t时刻的测量噪声。
NILM模型主要解决负荷分解与状态检测两个问题,其中负荷分解是指从总负荷消耗中单独分离出电器设备I的功率消耗,则公式(1)重写为:
y(t)=xI(t)+e′(t) (2)
其中,xI(t)表示电器设备I在t时刻的功率消耗。由于只关心电器设备I的功率消耗,故其他电器设备的功率消耗可以视为新噪声e′(t)的一部分。与鸡尾酒会问题,语音分解,降噪等领域相似,NILM是一个典型单通道盲源分离(Single Channel Blind SourceSeparation,SCBSS)问题,即将某个单独目标信号从混合信号中分离出来。
其次,状态检测是指从总负荷消耗中求出电器设备I的开关状态序列。电器设备I在t时刻的开关状态sI(t)表示如下:
其中,δ为设定功耗阈值,若电器设备I在t时刻的功率消耗大于设定功耗阈值,则判定电器设备I在t时刻处于开启状态,反之则处于关闭状态。
基于公式(1),大多数基于深度学习的NILM模型都将一段时间内的总负荷消耗序列作为模型的唯一输入,输出分解得到的电器设备I的功率消耗序列,如图1所示。但现有方法主要针对于具有简单恒定工作模式的电器,例如冰箱;在面对具有稀疏性、多状态和快速状态转换电器时,现有很多方法均无法获得较好分解结果。
针对NILM传统方法对于稀疏性、多状态以及快速状态转换电器分解性能不佳的问题,本发明提出了一种基于多任务学习的非侵入式负荷监测方法,对负荷分解以及状态检测任务同时进行训练。多任务学习是通过参数共享,利用任务之间的相关性与正则化,以提高多任务学习模型的学习能力与泛化能力。与硬参数共享的多任务学习相比,软参数共享架构能够进行更加灵活的特征融合,并保持任务之间的特异性。如图2、图10所示,本实施例中基于多任务学习的非侵入式负荷监测方法,包括以下步骤:
S1.采集某一住宅在某一时间段内的电气数据,电气数据包括住宅中所有电器设备的总功率消耗序列,以及目标电器设备i自身的功率消耗序列;
具体地,本实施例多任务学习模型是基于低频功率数据,因此仅需若干采样频率为1Hz左右的智能电表,用以同步采集住宅供电入口处所有电器设备的总功率消耗序列(总负荷消耗序列)y,并获取目标电器设备i的功率消耗序列xi,前者(总功率消耗序列y)为多任务学习模型的输入,后者(目标电器设备i自身的功率消耗序列xi)为多任务学习模型训练时所需的真实值与标签。为了给多任务学习模型提供充足的训练数据,采集持续时间应至少持续数日。
S2.根据目标电器设备i自身的功率消耗序列生成对应的状态检测标签;
具体地,根据目标电器设备i的功率消耗序列xi手动生成目标电器设备i的开关状态序列真实值(状态检测标签)si,作为本实施例多任务学习模型中状态检测子网络的标签。现有的状态检测方法主要是通过人工设置阈值的方式决定此刻目标电器设备i的开关状态,本实施例设置该阈值为15W。因此,目标电器设备i的开关状态序列可由下式计算得到:
其中,δ=15。
S3.分别对住宅中所有电器设备的总功率消耗序列,以及目标电器设备i自身的功率消耗序列进行预处理;具体地,由于采集设备与电路的原因,采集到的电气数据中可能会产生异常值与缺失值,需要首先进行检查与手动移除。为了便于多任务学习模型训练时的梯度下降,需对总功率消耗序列y进行标准化处理,表示为:
作为训练标签的目标电器设备i的真实功率消耗序列同样需要进行异常值移除与标准化处理,表示为:
S4.在预处理后的总功率消耗序列上采用长度为T的滑动窗口,以步长1进行滑动取样;以一个滑动窗口内的序列数据作为输入,并将该序列数据中点时间对应的目标电器设备i的预处理后的功率消耗作为输出,最终得到样本数据集;
具体地,为了更好地处理长时间功率序列,并为多任务学习模型提供更多训练数据,本实施例采用一个长度为T的滑动窗口,且以1为步长在总功率消耗序列上进行滑动取样。为了让多任务学习模型更好地学习到电器设备功率的快速突变,并为多任务学习模型输出提供额外的上下文信息,本实施例使用“序列到点”的输入输出关系,意味着在多任务学习模型中输入一个滑动窗口内长度为T的总功率消耗序列该多任务学习模型只会输出在某一个时间点上目标电器设备i的功率消耗值,且该时间点为该滑动窗口内长度为T的总功率消耗序列的中间时间点。本实施例多任务学习模型的输入输出关系可表示如下:
本实施例分别对标准化后的总功率消耗序列,即的首尾进行了长度为/>的零填充,保证/>的首尾点能够被成功映射。随着窗口从/>的序列头滑动至尾,得到M个滑动窗口,M为/>的长度。每一个滑动窗口都对应一个输出值,M个输出点构成了完整输出序列。对于不同类别的目标电器设备,其滑动窗口长度T的设置不同,但都应至少能够包含该目标电器设备的一个工作周期,便于多任务学习模型完整地学习到该目标电器设备的工作模式。
S5.按照7:1左右的比例将样本数据集划分为训练集和测试集,采用训练集对基于软参数共享的多任务学习模型进行训练,所述多任务学习模型包括底层特征提取模块、高频特征提取模块、特征加权融合模块和任务特定特征提取模块;
具体地,对于每一类别的目标电器设备都需要单独训练一个多任务学习模型,其目标是,当某一类别的目标电器设备对应多任务学习模型完成训练后,将任意电器设备组合的总功率序列输入该模型,都将能输出该类别的目标电器设备单独运行时的功率序列。本实施例设定最大epoch数为Ne轮,以最小化损失函数为目标,进行多轮梯度下降与模型参数更新。
S6.完成训练后多任务学习模型具有最优参数,可输入测试集进行负荷分解。将测试集输入多任务学习模型,多任务学习模型将输出滑动窗口内序列数据的中间时间点的负荷分解值,随着窗口不断滑动,最终得到目标电器设备i的完整功率序列。
S7.对多任务学习模型输出的目标电器设备i的功率消耗进行后处理,并计算得到目标电器设备i的开关状态序列。
具体地,由于作为训练标签的目标电器设备i的真实功率消耗序列已经过标准化处理,因此模型的输出需进行反标准化,也即乘以目标电器设备i真实功率消耗序列的方差σi并加上均值/>进而与真实值进行评估对比,并根据反标准化后的/>获得模型分解得到的目标电器设备i的开关状态序列/>
同样,δ=15。
在实施例中,基于软参数共享的多任务学习模型如图3所示,与硬参数共享的多任务学习相比,软参数共享架构能够进行更加灵活的特征融合,并保持任务之间的特异性。
首先为获得功率信号中的突变信息,根据本发明内容,在本实施例中构建一个并行高频特征提取模块,对功率信号进行db2离散小波分解,并对第一层细节系数进行重构,以此为基础提取功率信号中的高频信息,为多任务学习模型检测电器状态转换提供辅助特征。然后为了实现特征融合,分别为两个子任务构建门控网络,将底层共享特征与高频辅助特征进行加权融合。最后,多任务学习模型的输出为两个子任务各自输出的乘积。
具体地,如图3所示,底层特征提取模块包括依次级联的第一卷积层Conv1D_1、第一残差块Identity Block_1、第二残差块Identity Block_2和第二卷积层Conv1D_2。滑动窗口中的序列数据输入到多任务学习模型中,首先通过底层特征提取模块进行特征提取,输出底层共享特征图fshd。第一卷积层Conv1D_1可迅速提取输入的序列数据的全局特征,并实现降采样功能。为避免卷积层多次堆叠而造成梯度消失问题,使用了第一残差块Identity Block_1和第二残差块Identity Block_2两个残差块,且两个残差块均为identity block,残差结构如图4所示。第一残差块包括三个依次级联的第一卷积块,且其输入与最后的第一卷积块的输出相融合;第二残差块包括三个依次级联的第二卷积块,且其输入与最后的第二卷积块的输出相融合;底层特征提取模块的具体参数如表1所示:
表1卷积层网络参数设置
具体地,如图3所示,高频特征提取模块包括离散小波变换单元和特征提取单元;所述特征提取单元包括依次级联的第一卷积层Conv1D_1、第一残差块Identity Block_1、第二残差块Identity Block_2和第二卷积层Conv1D_2。特征提取单元的结构与底层特征提取模块的结构相同,网络参数设置与表1相对应。
电器状态转换对应负荷功率信号突变,是实现负荷分解的关键信息。本实施例根据Mallat提出的信号奇异性理论,离散小波变换(Discrete Wavelet Transform,DWT)具有检测信号中奇异点与突变的能力,对输入总功率信号进行离散小波分解,并重构其细节系数,以此为基础学习负荷高频特征,为多任务学习模型检测电器状态转换提供辅助信息。本实施例选择Daubechies小波基函数进行小波分解,该小波基具有良好正交性与紧支撑性,且具有较高的消失矩阵阶数,能够更好地检测出电器状态的转换并进行功率信号的边缘检测。二阶Daubechies(Db2)小波是该小波簇中的常用小波,近年来被广泛应用于电力系统故障检测等依赖于信号突变的领域。
离散小波变换单元通过Daubechies小波基函数对输入序列进行小波分解得到第一层细节系数,对第一层细节系数进行重构后输入特征提取单元。第一层细节系数往往保留更多的信号能量,并携带更多的信息。图5为原始功率信号与db2小波分解后得到的第一层细节系数重构模值。由图可知,分解后得到的信号的高频部分中包含着信号的突变信息。将第一细节系数重构输入后续网络进行高频特征提取,输出高频辅助特征fhf。
具体地,如图3所示,为了更好地将底层共享特征fshd与高频辅助特征fhf进行融合,本实施例中特征加权融合模块,其包括为了两个子任务分别构建的门控网络A(Gate A)和门控网络B(Gate B),用以自动学习权值,并对两个特征进行加权求和,最终送入各自任务的上层分支。门控网络A和门控网络B的结构相同,由一个全连接(Fully Connected,FC)层构成,其神经元数量为2,且使用softmax激活函数,保证输出的两个权值之和为1。因此子任务j对应的门控网络Gj的输出gj可计算如下:
其中,表示门控网络Gj的参数,j=A,B,分别表示负荷分解对应的回归任务与状态检测对应的分类任务。/>为任务j对应的特征权值向量,且满足/>通过权值向量对扁平化后的两个特征进行加权求和,得到的融合特征/>可计算如下:
由于softmax激活函数可能会产生极化现象,即输出的其中一个权值接近1,另一个接近0,而导致特征融合失效,因此本模块对softmax激活函数的输出进行了dropout处理,通过对权值进行随机丢弃,避免多任务学习模型在训练时过度依赖某个特征,从而避免极化现象发生。
本实施例中多任务学习模型基于软参数共享,通过门控网络的特征融合,为负荷分解任务与状态检测任务提供了适应于自身需求的特征。
具体地,如图3所示,任务特定特征提取模块包括分类子网络和回归子网络这两个独立的特征提取分支,分类子网络用于进行分类任务(状态检测任务),输出目标电器设备的状态序列;回归子网络用于进行回归任务(负荷分解任务),输出目标电器设备的预测功率消耗序列;将分类子网络的输出与回归子网络的输出相乘得到目标电器设备的最终预测功率消耗序列。融合特征被送至对应任务特定的特征提取分支以专注于各自的目标。
这两个独立的特征提取分支均由两个FC层构成。其中第一个FC层的神经元数量均为1024,作为各自任务的特定特征学习器,同时作为最终输出的过渡。第二个FC层将直接映射出各自任务的输出。对于回归任务,输出目标电器设备i的功耗序列对于分类任务,输出目标电器设备i的状态序列/>
当目标电器设备i在t时刻处于关闭状态时,应该为0,而此时的功耗值也应该为0;反之,如果目标电器设备i在t时刻处于开启状态时,/>应该为1,此时的功耗值则一定不为0。基于上述基本事实,本实施例中多任务学习模型的最终输出由回归任务和分类任务各自的输出相乘得到:
具体地,分类子网络采用二元交叉熵损失函数计算损失,表示为:
其中,表示分类子网络输出的目标电器设备i的状态序列,si表示目标电器设备i的状态检测标签,si(t)表示目标电器设备i在t时刻的状态检测标签,/>表示分类子网络输出的目标电器设备i在t时刻的开关状态,T表示滑动窗口长度。
回归子网络采用均方误差损失函数计算损失,表示为:
其中,表示多任务学习模型最终输出的目标电器设备i的功率消耗序列,/>表示目标电器设备i预处理后的真实功率消耗序列,/>表示目标电器设备i在t时刻的预处理后的功率消耗真实值,/>表示多任务模型最终输出的目标电器设备i在t时刻的功率消耗。
在实施例中,使用REDD数据集与UK-DALE数据集进行一系列实验,以验证实施例多任务学习模型性能。表2为美国REDD数据集与英国UK-DALE数据集的主要特点。由于电力系统不同,电气特性存在差异,选择这两个数据集有助于验证实施例多任务学习模型在不同电力系统中的性能表现。
表2 REDD数据集与UK-DALE数据集
本实施例选择四个具有代表性的电器作为负荷分解的实验对象,即冰箱,微波炉,洗碗机以及洗衣机,它们分别代表具有恒定工作模式、稀疏性、多状态和快速状态转换的电器。本实施例选择数据分布相对集中的住宅楼数据进行训练和测试,如表3所示。
表3训练集与测试集的划分
根据本发明方法对本实施例多任务学习模型的数据预处理与模型训练。其中为两个数据集中各个电器所设置的滑动窗口长度如表4所示。
表4各电器的滑动窗口长度设置
多任务学习模型训练超参数设置如表5所示。多任务学习模型训练依赖的GPU为GTX Geforce 2080Ti,模型搭建与训练由Tensorflow2.5.0以及CUDA11.2实现。
表5模型训练超参数设置
为了验证所提出模型性能,本实施例将选择Seq2Seq模型与同样使用多任务学习的SGN模型进行仿真对比。对于负荷分解任务与状态检测任务,分别使用回归任务常用的平均绝对误差(Mean absolute error,MAE)与均方根误差(Root Mean Square Error,RMSE),以及分类任务常用的F1分数作为模型性能评估指标:
1)平均绝对误差
其中,M表示总功率序列的长度。
2)均方根误差
对于负荷分解任务,均方根误差(Root Mean Square Error,RMSE)比MAE更能够检测出模型输出的异常值,可用如下公式求得:
3)F1分数
对于状态检测任务,F1分数用以衡量模型对电器开关状态分类的准确性,可用如下公式求得:
图6与图8分别给出本实施例在REDD数据集以及UK-DALE数据集中对四个电器进行负荷分解的输入与输出结果图。
图7与图9分别对三种模型在两个数据集中的分解结果进行了对比,本实施例在如下方面获得了改进:
对于具有快速工作模式的稀疏性电器,它们只会在一天当中的某些时候偶尔开启,且运行时间短暂,因此其开关事件难以被模型所检测,如图7(b)与图9(b)所示的微波炉。对于这类电器,功率中的信号突变信息尤为重要。Seq2Seq模型由于完全依赖“序列到序列”的输入输出关系,求取滑动窗口重叠点的平均值使得该模型难以学习到微波炉的快速工作模式,几乎完全丢失了微波炉的开关事件。同样使用了多任务学习架构,虽然SGN模型能够在状态检测子网络的辅助下实现对微波炉开启事件的检测与定位,但得益于本发明多任务学习模型中基于细节系数重构的高频特征对信号突变检测的辅助,能够更加准确地检测并定位其开关事件。
对于具有多状态和快速状态转换的电器,小功率的工作模式容易“湮没”在大功率当中,从而被很多模型“忽略”,因此它们只能学习并分解出单一的工作模式。如图7(c),图9(c)与图7(d),图9(d)所示的洗碗机和洗衣机,它们都具有多个快速转换的工作状态,以图7中的REDD数据集为例,洗碗机具有200W与1200W两种工作模式,洗衣机具有500W与3000W两种工作模式,并且,两种工作模式之间还存在着多次的状态转换与功率突变。在三个模型当中,Seq2Seq模型的分解性能最差,只能分解得到电器运行时的功率轮廓,而丢失了几乎所有细节信息。SGN模型能够检测到并分解出两个电器的大功率工作模式,但丢失了小功率工作模式。只有本发明多任务学习模型能够同时分解出该类电器的大功率和小功率工作模式,并基本能够检测到快速的状态转换以及功率的突变。
对于工作模式较为固定的电器,三种模型均能较好地完成负荷分解,如图7(a)与图9(a)所示的冰箱。但只有本发明多任务学习模型学习到了该类电器中非规律的工作模式。以图7中的REDD数据集为例,只有本发明多任务学习模型能够较为准确地还原出第1000个样本点附近425W左右的功率波形。
表6分别给出了三种模型在两个数据集中对四个电器的分解性能评估对比。由表可知,在大部分场景中,本发明模型的MAE值与RMSE值最低。对于微波炉,洗碗机和洗衣机,本发明模型在上述更具挑战性的场景下取得了明显的性能提升。相比于Seq2Seq模型,MAE值分别平均降低44.4%,33.0%与39.7%,RMSE值分别平均降低14.3%,25.7%与19.0%;相比于SGN模型,MAE值分别平均降低14.9%,15.0%与10.2%,RMSE值分别平均降低5.9%,11.7%与17.9%。
表6三种模型在REDD数据集以及UK-DALE数据集中的性能比较
对于状态检测任务而言,F1分数衡量模型对于电器开关状态的检测和分类准确度。得益于本发明多任务学习模型使用额外的高频特征对状态检测任务进行辅助,本发明多任务学习模型在几乎所有场景下取得了更高F1分数,尤其对于洗碗机以及洗衣机这种具有多状态和快速状态转换电器,Seq2Seq模型与SGN模型均丢失掉了小功率工作模式,导致它们漏检了一部分开关事件。而本发明多任务学习模型显著提升上述两种电器开关事件检测能力,相比于Seq2Seq模型,F1分数分别平均提高35.7%与71%;相比于SGN模型,F1分数分别平均提高24.3%与28.7%。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (9)
1.一种基于多任务学习的非侵入式负荷监测方法,其特征在于,包括以下步骤:
S1.采集某一住宅在某一时间段内的电气数据,电气数据包括住宅中所有电器设备的总功率消耗序列,以及目标电器设备自身的功率消耗序列;
S2.根据目标电器设备自身的功率消耗序列生成对应的状态检测标签;
S3.对住宅中所有电器设备的总功率消耗序列,以及目标电器设备自身的功率消耗序列进行预处理;
S4.在预处理后的总功率消耗序列上采用长度为T的滑动窗口,以步长1进行滑动取样;以一个滑动窗口内的序列数据作为输入,并将该序列数据中点时间对应的目标电器设备的预处理后的功率消耗作为输出,最终得到样本数据集;
S5.将样本数据集划分为训练集和测试集,采用训练集对基于软参数共享的多任务学习模型进行训练,所述多任务学习模型包括底层特征提取模块、高频特征提取模块、特征加权融合模块和任务特定特征提取模块;
S6.实时获取待识别总功率消耗数据,通过训练好的多任务学习模型输出目标电器设备的功率消耗;
S7.对多任务学习模型输出的目标电器设备的功率消耗进行后处理,并计算得到目标电器设备的开关状态序列。
2.根据权利要求1所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,底层特征提取模块包括依次级联的第一卷积层、第一残差块、第二残差块和第二卷积层。
3.根据权利要求1所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,高频特征提取模块包括离散小波变换单元和特征提取单元;所述特征提取单元的结构与底层特征提取模块的结构相同,其包括依次级联的第一卷积层、第一残差块、第二残差块和第二卷积层。
4.根据权利要求2或3所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,第一残差块包括三个依次级联的第一卷积块,且第一卷积块的卷积核大小为7,步长为1;第二残差块包括三个依次级联的第二卷积块,且第二卷积块的卷积核大小为3,步长为1。
5.根据权利要求3所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,离散小波变换单元通过Daubechies小波基函数对输入序列进行小波分解得到第一层细节系数,对第一层细节系数进行重构后输入特征提取单元。
6.根据权利要求1所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,特征加权融合模块包括门控网络A和门控网络B;门控网络A和门控网络B的结构相同。
7.根据权利要求1所述的一种基于多任务学习的非侵入式负荷监测方法,其特征在于,任务特定特征提取模块包括分类子网络和回归子网络,分类子网络用于进行分类任务,输出目标电器设备的状态序列;回归子网络用于进行回归任务,输出目标电器设备的预测功率消耗序列;将分类子网络的输出与回归子网络的输出相乘得到目标电器设备的最终预测功率消耗序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310101545.0A CN116167654A (zh) | 2023-02-10 | 2023-02-10 | 一种基于多任务学习的非侵入式负荷监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310101545.0A CN116167654A (zh) | 2023-02-10 | 2023-02-10 | 一种基于多任务学习的非侵入式负荷监测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116167654A true CN116167654A (zh) | 2023-05-26 |
Family
ID=86421507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310101545.0A Pending CN116167654A (zh) | 2023-02-10 | 2023-02-10 | 一种基于多任务学习的非侵入式负荷监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116167654A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117498543A (zh) * | 2023-10-27 | 2024-02-02 | 中国矿业大学 | 一种基于任务特征融合的非侵入式负荷监测功率分解方法 |
-
2023
- 2023-02-10 CN CN202310101545.0A patent/CN116167654A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117498543A (zh) * | 2023-10-27 | 2024-02-02 | 中国矿业大学 | 一种基于任务特征融合的非侵入式负荷监测功率分解方法 |
CN117498543B (zh) * | 2023-10-27 | 2024-06-07 | 中国矿业大学 | 一种基于任务特征融合的非侵入式负荷监测功率分解方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Short-term wind speed forecasting based on long short-term memory and improved BP neural network | |
CN109598451B (zh) | 一种基于pca与lstm神经网络的非侵入式负荷辨识方法 | |
Lin et al. | Non-intrusive residential electricity load decomposition via low-resource model transferring | |
Wang et al. | A compound framework for wind speed forecasting based on comprehensive feature selection, quantile regression incorporated into convolutional simplified long short-term memory network and residual error correction | |
CN108899892A (zh) | 一种基于cnn非侵入式用电负荷分解方法 | |
CN112215406B (zh) | 一种基于时间卷积神经网络的非侵入式居民用电负荷分解方法 | |
Liu et al. | Super resolution perception for smart meter data | |
CN113837894A (zh) | 基于残差卷积模块的非侵入式居民用户负荷分解方法 | |
CN114037178B (zh) | 基于无监督预训练神经网络的非侵入式负荷分解方法 | |
Wang et al. | Short-term wind speed prediction using support vector regression | |
CN113902104A (zh) | 联合无监督域自适应策略和注意力机制的非侵入式负荷监测方法 | |
CN116167654A (zh) | 一种基于多任务学习的非侵入式负荷监测方法 | |
de Diego-Otón et al. | Recurrent LSTM architecture for appliance identification in non-intrusive load monitoring | |
CN115130830B (zh) | 基于级联宽度学习和麻雀算法的非侵入式负荷分解方法 | |
Azad et al. | Non-intrusive load monitoring (nilm) using deep neural networks: A review | |
CN116742795A (zh) | 基于迁移学习与自注意力特征融合的非侵入式负荷监测方法 | |
Li et al. | Adaptive fusion feature transfer learning method for NILM | |
Liu et al. | Non-intrusive load disaggregation based on deep learning and multi-feature fusion | |
CN117272230A (zh) | 一种基于多任务学习模型的非侵入式负荷监测方法和系统 | |
Xiong et al. | An improved sequence-to-point learning for non-intrusive load monitoring based on discrete wavelet transform | |
Irankhah et al. | A parallel CNN-BiGRU network for short-term load forecasting in demand-side management | |
Liu et al. | Nonintrusive load disaggregation combining with external attention mechanism and Seq2Piont | |
Li et al. | A self-training multi-task attention method for NILM | |
Zhang et al. | A lightweight neural network for energy disaggregation employing depthwise separable convolution | |
Shen et al. | Aiot-empowered smart grid energy management with distributed control and non-intrusive load monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |