CN112732748A

CN112732748A - 一种基于自适应特征选择的非侵入式家电负荷识别方法

Info

Publication number: CN112732748A
Application number: CN202110019049.1A
Authority: CN
Inventors: 张志禹; 周咪
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2021-01-07
Filing date: 2021-01-07
Publication date: 2021-04-30
Anticipated expiration: 2041-01-07
Also published as: CN112732748B

Abstract

本发明公开了一种基于自适应特征选择的非侵入式家电负荷识别方法，具体按照以下步骤实施：数据预处理，对选取的REDD数据集进行去噪处理；通过改进的广义似然比检验对处理后的数据进行事件检测；对检测到的事件变点，提取多维负荷特征；根据功率进行分段，针对多维特征，用自适应mRmR算法分别提取各区段对应特征；将选择后的特征作为负荷印记，通过改进的K‑means算法建立负荷特征库；以负荷特征库为基础，使用kNN算法对用户内部家电负荷工作状态进行识别。解决了现有技术中存在的易出现误判情况的问题，提高了识别准确率。

Description

一种基于自适应特征选择的非侵入式家电负荷识别方法

技术领域

本发明属于家用电器负荷识别技术领域，涉及一种基于自适应特征选择的非侵入式家电负荷识别方法。

背景技术

随着坚强智能电网和新一轮电力体制改革的持续推进，利用非侵入式负荷监测(NILM)技术充分挖掘用电信息，对用户行为分析、用户与电网的双向实时互动具有理论指导意义。

非侵入式家电负荷识别是面向用户侧的非侵入式负荷监测技术，它的过程可以概括为四步：数据量取、事件检测、特征提取、负荷识别。在事件检测方面，以广义似然比检验(GLR)为代表的概率模型凭借其严谨的数学推导和变点检测的原理被惯用，但同时易出现误判情况，故很有必要对其进行二次判别；在特征提取方面，学者关注较少，通常根据经验主观确定特征类型，而基于最大相关与最小冗余(mRmR)的过滤式特征选择可以充分量化数据自身固有性质，具有通用性和可解释性；在负荷识别方面，研究成果诸多，其中聚类算法以其无监督而备受关注，K-means聚类算法简单快速、易于实现，kNN原理简单，在多分类问题表现效果良好。综上，针对非侵入式家电负荷识别这一问题，基于GLR与快速事件再检验的事件检测、自适应mRmR的特征选择、K-means和kNN的负荷识别亟待提出。

发明内容

本发明的目的是提供一种基于自适应特征选择的非侵入式家电负荷识别方法，解决了现有技术中存在的易出现误判情况的问题，提高识别准确度。

本发明所采用的技术方案是，一种基于自适应特征选择的非侵入式家电负荷识别方法，具体按照以下步骤实施：

步骤1、数据预处理，对选取的REDD数据集进行去噪处理；

步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测，若检测到事件则执行步骤3，否则返回步骤1；

步骤3、对检测到的事件变点，提取多维负荷特征；

步骤4、根据功率进行分段，针对步骤3得到的多维特征，用自适应mRmR算法，分别提取各区段对应特征；

步骤5、将步骤4得到的特征作为负荷印记，通过改进的K-means算法建立负荷特征库；

步骤6、根据步骤5得到的负荷特征库，使用kNN算法对用户内部家电负荷工作状态进行识别。

本发明的特点还在于：

步骤1具体按照以下步骤实施：

步骤1.1、数据集的选取，选择REDD公开数据集做测试，它包含六个家庭三个礼拜左右的数据，表现为15kHz的高频数据和1Hz的秒级低频数据；

步骤1.2、功率信号的去噪处理，由于孤立的噪声点易被事件检测算法错误识别为事件，故选取中值滤波方法，对原始的功率信号进行处理，保证其消除噪声的同时，不改变边缘信息：假设存在一个数字信号序列x_j(-∞<j<+∞)，对其进行滤波处理时，首先定义一个长度为奇数L的窗口，L＝2N+1，N为正整数，假设在某一时刻i，窗口内的信号样本为x_i-N,…,x_i,…,x_i+N，其中x_i是位于窗口中心的信号样本值，对这L个信号从小到大重新排列后，其中值便定义为中值滤波器的输出值。

步骤2具体按照以下步骤实施：

步骤2.1、根据公式(1)计算基波有功功率P₁，将其联合有功功率P作为二维功率时间序列

根据公式(2)提出二元假设检验；

式中，V₁为基波电压，I₁为基波电流，

为二者的相位差；n_c为变点发生时刻，k为窗口总长度，n为窗口中最后一个样本时刻，μ₀,∑₀为假设检验H₀条件下的高斯分布均值，协方差矩阵，μ_a,∑_a为H₁条件下变点发生之前的多维信号均值、多维协方差矩阵，μ_b,∑_b为H₁条件下变点发生之后的多维信号均值、多维协方差矩阵；

步骤2.2、在此时间序列内定义两个连续的窗口W_a和W_b，两窗口内样本为X_n＝{x_m,m＝n-k+1,…,n}，两窗口长度均为k/2，根据公式(3)、公式(4)分别计算两窗口内的μ和Σ，之后根据公式(5)计算决策函数g_n；

步骤2.3、将g_n与阈值h₁比较，寻找事件发生的可疑点：当决策函数值大于h₁时，拒绝H₀，两窗口内部数据分布不一致，在变点时刻n_c有发生事件的可能；当决策函数小于h₁时，拒绝H₁，两窗口数据分布一致，无事件发生；由于GLR适用于低阈值检测，故易出现误检；

步骤2.4、以可疑事件点为基点，进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别；根据公式(6)、公式(7)、公式(8)计算n_c点相邻样本的差值变化，考虑到噪声的影响，根据公式(9)计算综合变化量R；将R与阈值h₂比较，当R大于10时则判断该点有事件发生；

δ(n_c)＝|x(n_c)-x(n_c-1)| (6)

δ(n_c-1)＝|x(n_c-1)-x(n_c-2)| (7)

步骤3具体按照以下步骤实施：

步骤3.1、提取变点的功率特征，具体有：有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数；

步骤3.2、提取变点处的谐波特征，具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率；电流波形特征，包括其波峰值、平均值、波峰系数；

步骤3.3、提取变点处的V-I轨迹特征，具体有：对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。

步骤4具体按照以下步骤实施：

步骤4.1、根据功率对样本进行分段，在每个功率段内，根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC)，对其根据公式(11)进行整合，再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R；

式中，I^*(X,Y)表示不同X×Y网格划分下的互信息最大值，In(min(X,|Y))表示将不同划分下的最大互信息值归一化，F_i表示第i个特征，Y为电器标签；

步骤4.2、建立特征候选集H，选择最大相关度D_max对应特征作为候选集首项H₁，根据公式(13)依次选择第k个特征F_k放入H中；

步骤4.3、选择H中前i个特征成为特征组H_i，根据公式(14)计算特征组与类标签间的相似度，根据公式(15)取其平均值；建立特征集HH,当

时，在H中选择前i个特征放入HH中；

式中，i＝1,…,N代表共有N个特征；

步骤4.4、根据公式(16)计算未被选入HH的特征增益，若ΔD(H_i,Y)＞α,则选取第i个特征进入HH；

ΔD(H_i,Y)＝D(H_i,Y)-D(H_i-1,Y) (16)

式中，|X’|为HH的已选特征属性数量，r为特征组增益标记，正为0，负为1，|r|为增益为负的特征组数量；

步骤4.5、在得到各功率区段的特征后，根据公式(18)计算得到各特征权重；

步骤5具体按照以下步骤实施：

步骤5.1、确定K-means初始聚类中心；a、计算整个功率段数据集的平均值

记距平均值最远的样本点为C₁；b、根据公式(19)计算每个数据点与已选聚类中心的最小距离D_x，选择D_x最大值点作为新的聚类中心，c、重复步骤b直至选出k个初始聚类中心；

D_x＝min d(x_i,C’_k)k’＝1,…,kselected (19)

式中，k为已选择的聚类中心，ω_i为各特征所占权重；

步骤5.2、聚类并形成负荷库；计算所有样本x_i与各中心C₁,C₂,…,C_K的距离并升序排列

进而计算第二小距离与最小距离的比值r_i，将所有r_i＞ε的样本x_i划分到最小距离对应类别中，ε一般为1.5；若r_i≤ε，则观察x_i的最近邻样本类别，若近邻样本类别已知，则x_i与其类别一致；若近邻样本类别未知，则根据公式(21)计算空间密度相似距离，若L(x_i,C’₁)＜L(x_i,C’₂)，则x_i属于C’₁类别，若L(x_i,C’₁)＞L(x_i,C’₂)，则x_i属于C’₂类别；根据公式(22)计算聚类误差，若其小于10^-8，则聚类结束，将最终的多维聚类中心放入负荷特征库，否则，计算质心作为新的聚类中心，重复步骤5.2；

式中，mean为C’_i簇内样本的平均欧氏距离。

步骤6具体按照以下步骤实施：

步骤6.1、对于待分类电器x，首先根据公式(23)判断它是否为负荷特征库内的已知电器，如果没有任何簇类满足该不等式，则直接将其归类为新出现的攻击类型，k∈[2,20]，选择识别率最高的记为k值；

d(x,C_i)≤maxD(C_i) (23)

式中，maxD(C_i)表示簇类中距离簇中心最大的距离；

步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响，根据公式(26)对其组合，确定kNN的最终样本权重；

式中，d为待测样本到近邻点的距离，C取0.5，d_1c表示第c类近邻点的近邻平均距离，d_2c表示待测样本点x与第c类近邻点的平均距离，N_c为类别c的近邻点数，k_i为样本点x的近邻个数，也是x近邻点的近邻个数，d_mn为待测样本类别c的近邻点与其邻域点n之间的距离，d_j为近邻点j到待测样本的距离；

步骤6.3、将待测样本进行分类，对同属一类的加权距离进行求和，计算每类样本的加权距离总和与类权重之和的比值，将各个分类的比值进行对比，最大比值对应的类别即为算法的识别结果，其中，加权距离为近邻样本权重Wj与其高斯距离dj的乘积。

本发明的有益效果是：本发明一种基于自适应特征选择的非侵入式家电负荷识别方法，解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测，可以有效减少事件的误判，正确定位变点发生时刻；针对功率重叠问题，通过自适应mRmR算法，在不同功率段的变点提取不同的特征，充分考虑特征与标签的相关性，降低特征冗余，提高识别准确度；在家电负荷识别时，结合不同特征，通过基于K-means和kNN的算法进行负荷识别，原理简单，收敛快速，易于实现，在不同场景下多电器识别中效率高。

附图说明

图1是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的流程图；

图2是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于GLR与二次判别的事件检测流程图；

图3是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于自适应mRmR的特征选择流程图；

图4是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于改进K-means的负荷特征库的流程图；

图5是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于kNN的负荷辨识流程图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明一种基于自适应特征选择的非侵入式家电负荷识别方法，如图1所示，具体按照以下步骤实施：

步骤1、数据预处理，对选取的REDD数据集进行去噪处理；

步骤1具体按照以下步骤实施：

如图2所示，步骤2具体按照以下步骤实施：

根据公式(2)提出二元假设检验；

式中，V₁为基波电压，I₁为基波电流，

δ(n_c)＝|x(n_c)-x(n_c-1)| (6)

δ(n_c-1)＝|x(n_c-1)-x(n_c-2)| (7)

步骤3、对检测到的事件变点，提取多维负荷特征；

步骤3具体按照以下步骤实施：

部分特征的具体表达如表1所示。

如图3所示，步骤4具体按照以下步骤实施：

式中，I^*(X,Y)表示不同X×Y网格划分下的互信息最大值，In(min(|X|,|Y|))表示将不同划分下的最大互信息值归一化，F_i表示第i个特征，Y为电器标签；

时，在H中选择前i个特征放入HH中；

式中，i＝1,…,N代表共有N个特征；

ΔD(H_i,Y)＝D(H_i,Y)-D(H_i-1,Y) (16)

如图4所示，步骤5具体按照以下步骤实施：

D_x＝min d(x_i,C’_k)k’＝1,…,kselected (19)

式中，k为已选择的聚类中心，ω_i为各特征所占权重；

式中，mean为C’_i簇内样本的平均欧氏距离。

如图5所示，步骤6具体按照以下步骤实施：

d(x,C_i)≤maxD(C_i) (23)

式中，maxD(C_i)表示簇类中距离簇中心最大的距离；

本发明一种基于自适应特征选择的非侵入式家电负荷识别方法，解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测，可以有效减少事件的误判，正确定位变点发生时刻；针对功率重叠问题，通过自适应mRmR算法，在不同功率段的变点提取不同的特征，充分考虑特征与标签的相关性，降低特征冗余，提高识别准确度；在家电负荷识别时，结合不同特征，通过基于K-means和kNN的算法进行负荷识别，原理简单，收敛快速，易于实现，在不同场景下多电器识别中效率高。

Claims

1.一种基于自适应特征选择的非侵入式家电负荷识别方法，其特征在于，具体按照以下步骤实施：

步骤1、数据预处理，对选取的REDD数据集进行去噪处理；

步骤3、对检测到的事件变点，提取多维负荷特征；

2.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤1具体按照以下步骤实施：

3.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤2具体按照以下步骤实施：

根据公式(2)提出二元假设检验；

式中，V₁为基波电压，I₁为基波电流，

δ(n_c)＝|x(n_c)-x(n_c-1)| (6)

δ(n_c-1)＝|x(n_c-1)-x(n_c-2)| (7)

4.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤3具体按照以下步骤实施：

5.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤4具体按照以下步骤实施：

时，在H中选择前i个特征放入HH中；

式中，i＝1,…,N代表共有N个特征；

ΔD(H_i,Y)＝D(H_i,Y)-D(H_i-1,Y) (16)

式中，|X′|为HH的已选特征属性数量，r为特征组增益标记，正为0，负为1，|r|为增益为负的特征组数量；

6.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤5具体按照以下步骤实施：

步骤5.1、确定K-means初始聚类中心；a、计算整个功率段数据集的平均值x，记距平均值最远的样本点为C₁；b、根据公式(19)计算每个数据点与已选聚类中心的最小距离D_x，选择D_x最大值点作为新的聚类中心，c、重复步骤b直至选出k个初始聚类中心；

D_x＝min d(x_i,C′_k) k′＝1,…,kselected (19)

式中，k为已选择的聚类中心，ω_i为各特征所占权重；

进而计算第二小距离与最小距离的比值r_i，将所有r_i＞ε的样本x_i划分到最小距离对应类别中，ε一般为1.5；若r_i≤ε，则观察x_i的最近邻样本类别，若近邻样本类别已知，则x_i与其类别一致；若近邻样本类别未知，则根据公式(21)计算空间密度相似距离，若L(x_i,C′₁)＜L(x_i,C′₂)，则x_i属于C′₁类别，若L(x_i,C′₁)＞L(x_i,C′₂)，则x_i属于C′₂类别；根据公式(22)计算聚类误差，若其小于10^-8，则聚类结束，将最终的多维聚类中心放入负荷特征库，否则，计算质心作为新的聚类中心，重复步骤5.2；

式中，mean为C′_i簇内样本的平均欧氏距离。

7.根据权利要求1所述的一种非侵入式家电负荷识别方法，其特征在于，所述步骤6具体按照以下步骤实施：

d(x,C_i)≤maxD(C_i) (23)

式中，maxD(C_i)表示簇类中距离簇中心最大的距离；