CN112732748A - 一种基于自适应特征选择的非侵入式家电负荷识别方法 - Google Patents

一种基于自适应特征选择的非侵入式家电负荷识别方法 Download PDF

Info

Publication number
CN112732748A
CN112732748A CN202110019049.1A CN202110019049A CN112732748A CN 112732748 A CN112732748 A CN 112732748A CN 202110019049 A CN202110019049 A CN 202110019049A CN 112732748 A CN112732748 A CN 112732748A
Authority
CN
China
Prior art keywords
formula
sample
point
calculating
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110019049.1A
Other languages
English (en)
Other versions
CN112732748B (zh
Inventor
张志禹
周咪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202110019049.1A priority Critical patent/CN112732748B/zh
Publication of CN112732748A publication Critical patent/CN112732748A/zh
Application granted granted Critical
Publication of CN112732748B publication Critical patent/CN112732748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自适应特征选择的非侵入式家电负荷识别方法,具体按照以下步骤实施:数据预处理,对选取的REDD数据集进行去噪处理;通过改进的广义似然比检验对处理后的数据进行事件检测;对检测到的事件变点,提取多维负荷特征;根据功率进行分段,针对多维特征,用自适应mRmR算法分别提取各区段对应特征;将选择后的特征作为负荷印记,通过改进的K‑means算法建立负荷特征库;以负荷特征库为基础,使用kNN算法对用户内部家电负荷工作状态进行识别。解决了现有技术中存在的易出现误判情况的问题,提高了识别准确率。

Description

一种基于自适应特征选择的非侵入式家电负荷识别方法
技术领域
本发明属于家用电器负荷识别技术领域,涉及一种基于自适应特征选择的非侵入式家电负荷识别方法。
背景技术
随着坚强智能电网和新一轮电力体制改革的持续推进,利用非侵入式负荷监测(NILM)技术充分挖掘用电信息,对用户行为分析、用户与电网的双向实时互动具有理论指导意义。
非侵入式家电负荷识别是面向用户侧的非侵入式负荷监测技术,它的过程可以概括为四步:数据量取、事件检测、特征提取、负荷识别。在事件检测方面,以广义似然比检验(GLR)为代表的概率模型凭借其严谨的数学推导和变点检测的原理被惯用,但同时易出现误判情况,故很有必要对其进行二次判别;在特征提取方面,学者关注较少,通常根据经验主观确定特征类型,而基于最大相关与最小冗余(mRmR)的过滤式特征选择可以充分量化数据自身固有性质,具有通用性和可解释性;在负荷识别方面,研究成果诸多,其中聚类算法以其无监督而备受关注,K-means聚类算法简单快速、易于实现,kNN原理简单,在多分类问题表现效果良好。综上,针对非侵入式家电负荷识别这一问题,基于GLR与快速事件再检验的事件检测、自适应mRmR的特征选择、K-means和kNN的负荷识别亟待提出。
发明内容
本发明的目的是提供一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题,提高识别准确度。
本发明所采用的技术方案是,一种基于自适应特征选择的非侵入式家电负荷识别方法,具体按照以下步骤实施:
步骤1、数据预处理,对选取的REDD数据集进行去噪处理;
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤4、根据功率进行分段,针对步骤3得到的多维特征,用自适应mRmR算法,分别提取各区段对应特征;
步骤5、将步骤4得到的特征作为负荷印记,通过改进的K-means算法建立负荷特征库;
步骤6、根据步骤5得到的负荷特征库,使用kNN算法对用户内部家电负荷工作状态进行识别。
本发明的特点还在于:
步骤1具体按照以下步骤实施:
步骤1.1、数据集的选取,选择REDD公开数据集做测试,它包含六个家庭三个礼拜左右的数据,表现为15kHz的高频数据和1Hz的秒级低频数据;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列xj(-∞<j<+∞),对其进行滤波处理时,首先定义一个长度为奇数L的窗口,L=2N+1,N为正整数,假设在某一时刻i,窗口内的信号样本为xi-N,…,xi,…,xi+N,其中xi是位于窗口中心的信号样本值,对这L个信号从小到大重新排列后,其中值便定义为中值滤波器的输出值。
步骤2具体按照以下步骤实施:
步骤2.1、根据公式(1)计算基波有功功率P1,将其联合有功功率P作为二维功率时间序列
Figure BDA0002887751410000031
根据公式(2)提出二元假设检验;
Figure BDA0002887751410000032
Figure BDA0002887751410000033
式中,V1为基波电压,I1为基波电流,
Figure BDA0002887751410000034
为二者的相位差;nc为变点发生时刻,k为窗口总长度,n为窗口中最后一个样本时刻,μ0,∑0为假设检验H0条件下的高斯分布均值,协方差矩阵,μa,∑a为H1条件下变点发生之前的多维信号均值、多维协方差矩阵,μb,∑b为H1条件下变点发生之后的多维信号均值、多维协方差矩阵;
步骤2.2、在此时间序列内定义两个连续的窗口Wa和Wb,两窗口内样本为Xn={xm,m=n-k+1,…,n},两窗口长度均为k/2,根据公式(3)、公式(4)分别计算两窗口内的μ和Σ,之后根据公式(5)计算决策函数gn
Figure BDA0002887751410000035
Figure BDA0002887751410000036
Figure BDA0002887751410000037
步骤2.3、将gn与阈值h1比较,寻找事件发生的可疑点:当决策函数值大于h1时,拒绝H0,两窗口内部数据分布不一致,在变点时刻nc有发生事件的可能;当决策函数小于h1时,拒绝H1,两窗口数据分布一致,无事件发生;由于GLR适用于低阈值检测,故易出现误检;
步骤2.4、以可疑事件点为基点,进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别;根据公式(6)、公式(7)、公式(8)计算nc点相邻样本的差值变化,考虑到噪声的影响,根据公式(9)计算综合变化量R;将R与阈值h2比较,当R大于10时则判断该点有事件发生;
δ(nc)=|x(nc)-x(nc-1)| (6)
δ(nc-1)=|x(nc-1)-x(nc-2)| (7)
Figure BDA0002887751410000041
Figure BDA0002887751410000042
步骤3具体按照以下步骤实施:
步骤3.1、提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;
步骤3.2、提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;
步骤3.3、提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
步骤4具体按照以下步骤实施:
步骤4.1、根据功率对样本进行分段,在每个功率段内,根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC),对其根据公式(11)进行整合,再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R;
Figure BDA0002887751410000051
Figure BDA0002887751410000052
Figure BDA0002887751410000053
式中,I*(X,Y)表示不同X×Y网格划分下的互信息最大值,In(min(X,|Y))表示将不同划分下的最大互信息值归一化,Fi表示第i个特征,Y为电器标签;
步骤4.2、建立特征候选集H,选择最大相关度Dmax对应特征作为候选集首项H1,根据公式(13)依次选择第k个特征Fk放入H中;
Figure BDA0002887751410000054
步骤4.3、选择H中前i个特征成为特征组Hi,根据公式(14)计算特征组与类标签间的相似度,根据公式(15)取其平均值;建立特征集HH,当
Figure BDA0002887751410000055
时,在H中选择前i个特征放入HH中;
Figure BDA0002887751410000056
Figure BDA0002887751410000057
式中,i=1,…,N代表共有N个特征;
步骤4.4、根据公式(16)计算未被选入HH的特征增益,若ΔD(Hi,Y)>α,则选取第i个特征进入HH;
ΔD(Hi,Y)=D(Hi,Y)-D(Hi-1,Y) (16)
Figure BDA0002887751410000061
式中,|X’|为HH的已选特征属性数量,r为特征组增益标记,正为0,负为1,|r|为增益为负的特征组数量;
步骤4.5、在得到各功率区段的特征后,根据公式(18)计算得到各特征权重;
Figure BDA0002887751410000062
步骤5具体按照以下步骤实施:
步骤5.1、确定K-means初始聚类中心;a、计算整个功率段数据集的平均值
Figure BDA0002887751410000063
记距平均值最远的样本点为C1;b、根据公式(19)计算每个数据点与已选聚类中心的最小距离Dx,选择Dx最大值点作为新的聚类中心,c、重复步骤b直至选出k个初始聚类中心;
Dx=min d(xi,C’k)k’=1,…,kselected (19)
Figure BDA0002887751410000064
式中,k为已选择的聚类中心,ωi为各特征所占权重;
步骤5.2、聚类并形成负荷库;计算所有样本xi与各中心C1,C2,…,CK的距离并升序排列
Figure BDA0002887751410000065
进而计算第二小距离与最小距离的比值ri,将所有ri>ε的样本xi划分到最小距离对应类别中,ε一般为1.5;若ri≤ε,则观察xi的最近邻样本类别,若近邻样本类别已知,则xi与其类别一致;若近邻样本类别未知,则根据公式(21)计算空间密度相似距离,若L(xi,C’1)<L(xi,C’2),则xi属于C’1类别,若L(xi,C’1)>L(xi,C’2),则xi属于C’2类别;根据公式(22)计算聚类误差,若其小于10-8,则聚类结束,将最终的多维聚类中心放入负荷特征库,否则,计算质心作为新的聚类中心,重复步骤5.2;
Figure BDA0002887751410000071
Figure BDA0002887751410000072
式中,mean为C’i簇内样本的平均欧氏距离。
步骤6具体按照以下步骤实施:
步骤6.1、对于待分类电器x,首先根据公式(23)判断它是否为负荷特征库内的已知电器,如果没有任何簇类满足该不等式,则直接将其归类为新出现的攻击类型,k∈[2,20],选择识别率最高的记为k值;
d(x,Ci)≤maxD(Ci) (23)
式中,maxD(Ci)表示簇类中距离簇中心最大的距离;
步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响,根据公式(26)对其组合,确定kNN的最终样本权重;
Figure BDA0002887751410000073
Figure BDA0002887751410000074
Figure BDA0002887751410000075
式中,d为待测样本到近邻点的距离,C取0.5,d1c表示第c类近邻点的近邻平均距离,d2c表示待测样本点x与第c类近邻点的平均距离,Nc为类别c的近邻点数,ki为样本点x的近邻个数,也是x近邻点的近邻个数,dmn为待测样本类别c的近邻点与其邻域点n之间的距离,dj为近邻点j到待测样本的距离;
步骤6.3、将待测样本进行分类,对同属一类的加权距离进行求和,计算每类样本的加权距离总和与类权重之和的比值,将各个分类的比值进行对比,最大比值对应的类别即为算法的识别结果,其中,加权距离为近邻样本权重Wj与其高斯距离dj的乘积。
本发明的有益效果是:本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测,可以有效减少事件的误判,正确定位变点发生时刻;针对功率重叠问题,通过自适应mRmR算法,在不同功率段的变点提取不同的特征,充分考虑特征与标签的相关性,降低特征冗余,提高识别准确度;在家电负荷识别时,结合不同特征,通过基于K-means和kNN的算法进行负荷识别,原理简单,收敛快速,易于实现,在不同场景下多电器识别中效率高。
附图说明
图1是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的流程图;
图2是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于GLR与二次判别的事件检测流程图;
图3是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于自适应mRmR的特征选择流程图;
图4是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于改进K-means的负荷特征库的流程图;
图5是本发明一种基于自适应特征选择的非侵入式家电负荷识别方法的基于kNN的负荷辨识流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,如图1所示,具体按照以下步骤实施:
步骤1、数据预处理,对选取的REDD数据集进行去噪处理;
步骤1具体按照以下步骤实施:
步骤1.1、数据集的选取,选择REDD公开数据集做测试,它包含六个家庭三个礼拜左右的数据,表现为15kHz的高频数据和1Hz的秒级低频数据;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列xj(-∞<j<+∞),对其进行滤波处理时,首先定义一个长度为奇数L的窗口,L=2N+1,N为正整数,假设在某一时刻i,窗口内的信号样本为xi-N,…,xi,…,xi+N,其中xi是位于窗口中心的信号样本值,对这L个信号从小到大重新排列后,其中值便定义为中值滤波器的输出值。
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
如图2所示,步骤2具体按照以下步骤实施:
步骤2.1、根据公式(1)计算基波有功功率P1,将其联合有功功率P作为二维功率时间序列
Figure BDA0002887751410000101
根据公式(2)提出二元假设检验;
Figure BDA0002887751410000102
Figure BDA0002887751410000103
式中,V1为基波电压,I1为基波电流,
Figure BDA0002887751410000104
为二者的相位差;nc为变点发生时刻,k为窗口总长度,n为窗口中最后一个样本时刻,μ0,∑0为假设检验H0条件下的高斯分布均值,协方差矩阵,μa,∑a为H1条件下变点发生之前的多维信号均值、多维协方差矩阵,μb,∑b为H1条件下变点发生之后的多维信号均值、多维协方差矩阵;
步骤2.2、在此时间序列内定义两个连续的窗口Wa和Wb,两窗口内样本为Xn={xm,m=n-k+1,…,n},两窗口长度均为k/2,根据公式(3)、公式(4)分别计算两窗口内的μ和Σ,之后根据公式(5)计算决策函数gn
Figure BDA0002887751410000105
Figure BDA0002887751410000106
Figure BDA0002887751410000107
步骤2.3、将gn与阈值h1比较,寻找事件发生的可疑点:当决策函数值大于h1时,拒绝H0,两窗口内部数据分布不一致,在变点时刻nc有发生事件的可能;当决策函数小于h1时,拒绝H1,两窗口数据分布一致,无事件发生;由于GLR适用于低阈值检测,故易出现误检;
步骤2.4、以可疑事件点为基点,进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别;根据公式(6)、公式(7)、公式(8)计算nc点相邻样本的差值变化,考虑到噪声的影响,根据公式(9)计算综合变化量R;将R与阈值h2比较,当R大于10时则判断该点有事件发生;
δ(nc)=|x(nc)-x(nc-1)| (6)
δ(nc-1)=|x(nc-1)-x(nc-2)| (7)
Figure BDA0002887751410000111
Figure BDA0002887751410000112
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤3具体按照以下步骤实施:
步骤3.1、提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;
步骤3.2、提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;
步骤3.3、提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
部分特征的具体表达如表1所示。
Figure BDA0002887751410000121
步骤4、根据功率进行分段,针对步骤3得到的多维特征,用自适应mRmR算法,分别提取各区段对应特征;
如图3所示,步骤4具体按照以下步骤实施:
步骤4.1、根据功率对样本进行分段,在每个功率段内,根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC),对其根据公式(11)进行整合,再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R;
Figure BDA0002887751410000122
Figure BDA0002887751410000131
Figure BDA0002887751410000132
式中,I*(X,Y)表示不同X×Y网格划分下的互信息最大值,In(min(|X|,|Y|))表示将不同划分下的最大互信息值归一化,Fi表示第i个特征,Y为电器标签;
步骤4.2、建立特征候选集H,选择最大相关度Dmax对应特征作为候选集首项H1,根据公式(13)依次选择第k个特征Fk放入H中;
Figure BDA0002887751410000133
步骤4.3、选择H中前i个特征成为特征组Hi,根据公式(14)计算特征组与类标签间的相似度,根据公式(15)取其平均值;建立特征集HH,当
Figure BDA0002887751410000134
时,在H中选择前i个特征放入HH中;
Figure BDA0002887751410000135
Figure BDA0002887751410000136
式中,i=1,…,N代表共有N个特征;
步骤4.4、根据公式(16)计算未被选入HH的特征增益,若ΔD(Hi,Y)>α,则选取第i个特征进入HH;
ΔD(Hi,Y)=D(Hi,Y)-D(Hi-1,Y) (16)
Figure BDA0002887751410000137
式中,|X’|为HH的已选特征属性数量,r为特征组增益标记,正为0,负为1,|r|为增益为负的特征组数量;
步骤4.5、在得到各功率区段的特征后,根据公式(18)计算得到各特征权重;
Figure BDA0002887751410000141
步骤5、将步骤4得到的特征作为负荷印记,通过改进的K-means算法建立负荷特征库;
如图4所示,步骤5具体按照以下步骤实施:
步骤5.1、确定K-means初始聚类中心;a、计算整个功率段数据集的平均值
Figure BDA0002887751410000142
记距平均值最远的样本点为C1;b、根据公式(19)计算每个数据点与已选聚类中心的最小距离Dx,选择Dx最大值点作为新的聚类中心,c、重复步骤b直至选出k个初始聚类中心;
Dx=min d(xi,C’k)k’=1,…,kselected (19)
Figure BDA0002887751410000143
式中,k为已选择的聚类中心,ωi为各特征所占权重;
步骤5.2、聚类并形成负荷库;计算所有样本xi与各中心C1,C2,…,CK的距离并升序排列
Figure BDA0002887751410000144
进而计算第二小距离与最小距离的比值ri,将所有ri>ε的样本xi划分到最小距离对应类别中,ε一般为1.5;若ri≤ε,则观察xi的最近邻样本类别,若近邻样本类别已知,则xi与其类别一致;若近邻样本类别未知,则根据公式(21)计算空间密度相似距离,若L(xi,C’1)<L(xi,C’2),则xi属于C’1类别,若L(xi,C’1)>L(xi,C’2),则xi属于C’2类别;根据公式(22)计算聚类误差,若其小于10-8,则聚类结束,将最终的多维聚类中心放入负荷特征库,否则,计算质心作为新的聚类中心,重复步骤5.2;
Figure BDA0002887751410000151
Figure BDA0002887751410000152
式中,mean为C’i簇内样本的平均欧氏距离。
步骤6、根据步骤5得到的负荷特征库,使用kNN算法对用户内部家电负荷工作状态进行识别。
如图5所示,步骤6具体按照以下步骤实施:
步骤6.1、对于待分类电器x,首先根据公式(23)判断它是否为负荷特征库内的已知电器,如果没有任何簇类满足该不等式,则直接将其归类为新出现的攻击类型,k∈[2,20],选择识别率最高的记为k值;
d(x,Ci)≤maxD(Ci) (23)
式中,maxD(Ci)表示簇类中距离簇中心最大的距离;
步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响,根据公式(26)对其组合,确定kNN的最终样本权重;
Figure BDA0002887751410000153
Figure BDA0002887751410000154
Figure BDA0002887751410000155
式中,d为待测样本到近邻点的距离,C取0.5,d1c表示第c类近邻点的近邻平均距离,d2c表示待测样本点x与第c类近邻点的平均距离,Nc为类别c的近邻点数,ki为样本点x的近邻个数,也是x近邻点的近邻个数,dmn为待测样本类别c的近邻点与其邻域点n之间的距离,dj为近邻点j到待测样本的距离;
步骤6.3、将待测样本进行分类,对同属一类的加权距离进行求和,计算每类样本的加权距离总和与类权重之和的比值,将各个分类的比值进行对比,最大比值对应的类别即为算法的识别结果,其中,加权距离为近邻样本权重Wj与其高斯距离dj的乘积。
本发明一种基于自适应特征选择的非侵入式家电负荷识别方法,解决了现有技术中存在的易出现误判情况的问题。能有效地减少事件错判、弱相关特征、功率重叠对负荷识别精度的影响。通过基于GLR与快速事件再检验的方法进行事件检测,可以有效减少事件的误判,正确定位变点发生时刻;针对功率重叠问题,通过自适应mRmR算法,在不同功率段的变点提取不同的特征,充分考虑特征与标签的相关性,降低特征冗余,提高识别准确度;在家电负荷识别时,结合不同特征,通过基于K-means和kNN的算法进行负荷识别,原理简单,收敛快速,易于实现,在不同场景下多电器识别中效率高。

Claims (7)

1.一种基于自适应特征选择的非侵入式家电负荷识别方法,其特征在于,具体按照以下步骤实施:
步骤1、数据预处理,对选取的REDD数据集进行去噪处理;
步骤2、通过改进的广义似然比检验对步骤1中的数据进行事件检测,若检测到事件则执行步骤3,否则返回步骤1;
步骤3、对检测到的事件变点,提取多维负荷特征;
步骤4、根据功率进行分段,针对步骤3得到的多维特征,用自适应mRmR算法,分别提取各区段对应特征;
步骤5、将步骤4得到的特征作为负荷印记,通过改进的K-means算法建立负荷特征库;
步骤6、根据步骤5得到的负荷特征库,使用kNN算法对用户内部家电负荷工作状态进行识别。
2.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤1具体按照以下步骤实施:
步骤1.1、数据集的选取,选择REDD公开数据集做测试,它包含六个家庭三个礼拜左右的数据,表现为15kHz的高频数据和1Hz的秒级低频数据;
步骤1.2、功率信号的去噪处理,由于孤立的噪声点易被事件检测算法错误识别为事件,故选取中值滤波方法,对原始的功率信号进行处理,保证其消除噪声的同时,不改变边缘信息:假设存在一个数字信号序列xj(-∞<j<+∞),对其进行滤波处理时,首先定义一个长度为奇数L的窗口,L=2N+1,N为正整数,假设在某一时刻i,窗口内的信号样本为xi-N,…,xi,…,xi+N,其中xi是位于窗口中心的信号样本值,对这L个信号从小到大重新排列后,其中值便定义为中值滤波器的输出值。
3.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤2具体按照以下步骤实施:
步骤2.1、根据公式(1)计算基波有功功率P1,将其联合有功功率P作为二维功率时间序列
Figure FDA0002887751400000021
根据公式(2)提出二元假设检验;
Figure FDA0002887751400000022
Figure FDA0002887751400000023
式中,V1为基波电压,I1为基波电流,
Figure FDA0002887751400000024
为二者的相位差;nc为变点发生时刻,k为窗口总长度,n为窗口中最后一个样本时刻,μ0,∑0为假设检验H0条件下的高斯分布均值,协方差矩阵,μa,∑a为H1条件下变点发生之前的多维信号均值、多维协方差矩阵,μb,∑b为H1条件下变点发生之后的多维信号均值、多维协方差矩阵;
步骤2.2、在此时间序列内定义两个连续的窗口Wa和Wb,两窗口内样本为Xn={xm,m=n-k+1,…,n},两窗口长度均为k/2,根据公式(3)、公式(4)分别计算两窗口内的μ和Σ,之后根据公式(5)计算决策函数gn
Figure FDA0002887751400000025
Figure FDA0002887751400000026
Figure FDA0002887751400000031
步骤2.3、将gn与阈值h1比较,寻找事件发生的可疑点:当决策函数值大于h1时,拒绝H0,两窗口内部数据分布不一致,在变点时刻nc有发生事件的可能;当决策函数小于h1时,拒绝H1,两窗口数据分布一致,无事件发生;由于GLR适用于低阈值检测,故易出现误检;
步骤2.4、以可疑事件点为基点,进行快速事件再检验,即利用相邻检测点之间的差值变化对可疑事件点进行二次判别;根据公式(6)、公式(7)、公式(8)计算nc点相邻样本的差值变化,考虑到噪声的影响,根据公式(9)计算综合变化量R;将R与阈值h2比较,当R大于10时则判断该点有事件发生;
δ(nc)=|x(nc)-x(nc-1)| (6)
δ(nc-1)=|x(nc-1)-x(nc-2)| (7)
Figure FDA0002887751400000032
Figure FDA0002887751400000033
4.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤3具体按照以下步骤实施:
步骤3.1、提取变点的功率特征,具体有:有功功率、基波有功功率、无功功率、基波无功功率、视在功率、失真功率、功率因数角、基波功率因数;
步骤3.2、提取变点处的谐波特征,具体有电压、电压的一至九次的各次谐波幅值、各次谐波含有率、各次谐波含有率之差、总谐波畸变率;电流波形特征,包括其波峰值、平均值、波峰系数;
步骤3.3、提取变点处的V-I轨迹特征,具体有:对称性、环绕方向、环绕面积、交点个数、Y轴截距、Y轴跨距、中线曲率、轨迹中间部分峰值、左右部分面积、中间部分形状、瞬时导纳标准差。
5.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤4具体按照以下步骤实施:
步骤4.1、根据功率对样本进行分段,在每个功率段内,根据公式(10)计算各特征与样本标签的最大信息系数(MIC)、绝对值余弦(AC),对其根据公式(11)进行整合,再根据公式(12)分别计算各特征与样本标签的相关度D和冗余度R;
Figure FDA0002887751400000041
Figure FDA0002887751400000042
Figure FDA0002887751400000043
式中,I*(X,Y)表示不同X×Y网格划分下的互信息最大值,In(min(|X|,|Y|))表示将不同划分下的最大互信息值归一化,Fi表示第i个特征,Y为电器标签;
步骤4.2、建立特征候选集H,选择最大相关度Dmax对应特征作为候选集首项H1,根据公式(13)依次选择第k个特征Fk放入H中;
Figure FDA0002887751400000044
步骤4.3、选择H中前i个特征成为特征组Hi,根据公式(14)计算特征组与类标签间的相似度,根据公式(15)取其平均值;建立特征集HH,当
Figure FDA0002887751400000051
时,在H中选择前i个特征放入HH中;
Figure FDA0002887751400000052
Figure FDA0002887751400000053
式中,i=1,…,N代表共有N个特征;
步骤4.4、根据公式(16)计算未被选入HH的特征增益,若ΔD(Hi,Y)>α,则选取第i个特征进入HH;
ΔD(Hi,Y)=D(Hi,Y)-D(Hi-1,Y) (16)
Figure FDA0002887751400000054
式中,|X′|为HH的已选特征属性数量,r为特征组增益标记,正为0,负为1,|r|为增益为负的特征组数量;
步骤4.5、在得到各功率区段的特征后,根据公式(18)计算得到各特征权重;
Figure FDA0002887751400000055
6.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤5具体按照以下步骤实施:
步骤5.1、确定K-means初始聚类中心;a、计算整个功率段数据集的平均值x,记距平均值最远的样本点为C1;b、根据公式(19)计算每个数据点与已选聚类中心的最小距离Dx,选择Dx最大值点作为新的聚类中心,c、重复步骤b直至选出k个初始聚类中心;
Dx=min d(xi,C′k) k′=1,…,kselected (19)
Figure FDA0002887751400000061
式中,k为已选择的聚类中心,ωi为各特征所占权重;
步骤5.2、聚类并形成负荷库;计算所有样本xi与各中心C1,C2,…,CK的距离并升序排列
Figure FDA0002887751400000062
进而计算第二小距离与最小距离的比值ri,将所有ri>ε的样本xi划分到最小距离对应类别中,ε一般为1.5;若ri≤ε,则观察xi的最近邻样本类别,若近邻样本类别已知,则xi与其类别一致;若近邻样本类别未知,则根据公式(21)计算空间密度相似距离,若L(xi,C′1)<L(xi,C′2),则xi属于C′1类别,若L(xi,C′1)>L(xi,C′2),则xi属于C′2类别;根据公式(22)计算聚类误差,若其小于10-8,则聚类结束,将最终的多维聚类中心放入负荷特征库,否则,计算质心作为新的聚类中心,重复步骤5.2;
Figure FDA0002887751400000063
Figure FDA0002887751400000064
式中,mean为C′i簇内样本的平均欧氏距离。
7.根据权利要求1所述的一种非侵入式家电负荷识别方法,其特征在于,所述步骤6具体按照以下步骤实施:
步骤6.1、对于待分类电器x,首先根据公式(23)判断它是否为负荷特征库内的已知电器,如果没有任何簇类满足该不等式,则直接将其归类为新出现的攻击类型,k∈[2,20],选择识别率最高的记为k值;
d(x,Ci)≤maxD(Ci) (23)
式中,maxD(Ci)表示簇类中距离簇中心最大的距离;
步骤6.2、根据公式(24)、公式(25)分别计算近邻点的不同距离、不同类别对样本x类别的影响,根据公式(26)对其组合,确定kNN的最终样本权重;
Figure FDA0002887751400000071
Figure FDA0002887751400000072
Figure FDA0002887751400000073
式中,d为待测样本到近邻点的距离,C取0.5,d1c表示第c类近邻点的近邻平均距离,d2c表示待测样本点x与第c类近邻点的平均距离,Nc为类别c的近邻点数,ki为样本点x的近邻个数,也是x近邻点的近邻个数,dmn为待测样本类别c的近邻点与其邻域点n之间的距离,dj为近邻点j到待测样本的距离;
步骤6.3、将待测样本进行分类,对同属一类的加权距离进行求和,计算每类样本的加权距离总和与类权重之和的比值,将各个分类的比值进行对比,最大比值对应的类别即为算法的识别结果,其中,加权距离为近邻样本权重Wj与其高斯距离dj的乘积。
CN202110019049.1A 2021-01-07 2021-01-07 一种基于自适应特征选择的非侵入式家电负荷识别方法 Active CN112732748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110019049.1A CN112732748B (zh) 2021-01-07 2021-01-07 一种基于自适应特征选择的非侵入式家电负荷识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110019049.1A CN112732748B (zh) 2021-01-07 2021-01-07 一种基于自适应特征选择的非侵入式家电负荷识别方法

Publications (2)

Publication Number Publication Date
CN112732748A true CN112732748A (zh) 2021-04-30
CN112732748B CN112732748B (zh) 2024-03-15

Family

ID=75591112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110019049.1A Active CN112732748B (zh) 2021-01-07 2021-01-07 一种基于自适应特征选择的非侵入式家电负荷识别方法

Country Status (1)

Country Link
CN (1) CN112732748B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313294A (zh) * 2021-05-19 2021-08-27 国网山东省电力公司淄博供电公司 一种电力系统重要节点、重要输电线路预测算法
CN113935329A (zh) * 2021-10-13 2022-01-14 昆明理工大学 基于自适应特征识别与去噪的非对称文本匹配方法
CN114636113A (zh) * 2022-02-22 2022-06-17 中国特种设备检测研究院 一种油库管道泄漏检测方法
CN116780537A (zh) * 2023-08-24 2023-09-19 国网天津市电力公司宝坻供电分公司 非侵入式负荷监测方法、装置、存储介质
CN116865451A (zh) * 2023-09-04 2023-10-10 湖南巨森电气集团有限公司 智慧用电控制管理系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015059272A1 (en) * 2013-10-24 2015-04-30 Universite Libre De Bruxelles Improved non-intrusive appliance load monitoring method and device
KR20160141032A (ko) * 2015-05-27 2016-12-08 전자부품연구원 S-fhmm을 이용한 비접촉식 기기 부하 식별 방법 및 시스템
CN108345906A (zh) * 2018-02-09 2018-07-31 无锡英臻科技有限公司 一种基于Boost模型的非侵入式用电器识别方法
CN109387712A (zh) * 2018-10-09 2019-02-26 厦门理工学院 基于状态矩阵决策树的非侵入式负荷检测与分解方法
CN110954744A (zh) * 2019-11-18 2020-04-03 浙江工业大学 一种基于事件检测的非侵入式负荷监测方法
CN111860600A (zh) * 2020-06-22 2020-10-30 国家电网有限公司 一种基于最大相关最小冗余判据的用户用电特征选择方法
CN112067918A (zh) * 2020-07-27 2020-12-11 南京航灵信息科技有限公司 基于事件检测的非侵入式负荷识别方法和系统
CN112101110A (zh) * 2020-08-13 2020-12-18 西安理工大学 一种电力系统用户侧非侵入式负荷识别的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015059272A1 (en) * 2013-10-24 2015-04-30 Universite Libre De Bruxelles Improved non-intrusive appliance load monitoring method and device
KR20160141032A (ko) * 2015-05-27 2016-12-08 전자부품연구원 S-fhmm을 이용한 비접촉식 기기 부하 식별 방법 및 시스템
CN108345906A (zh) * 2018-02-09 2018-07-31 无锡英臻科技有限公司 一种基于Boost模型的非侵入式用电器识别方法
CN109387712A (zh) * 2018-10-09 2019-02-26 厦门理工学院 基于状态矩阵决策树的非侵入式负荷检测与分解方法
CN110954744A (zh) * 2019-11-18 2020-04-03 浙江工业大学 一种基于事件检测的非侵入式负荷监测方法
CN111860600A (zh) * 2020-06-22 2020-10-30 国家电网有限公司 一种基于最大相关最小冗余判据的用户用电特征选择方法
CN112067918A (zh) * 2020-07-27 2020-12-11 南京航灵信息科技有限公司 基于事件检测的非侵入式负荷识别方法和系统
CN112101110A (zh) * 2020-08-13 2020-12-18 西安理工大学 一种电力系统用户侧非侵入式负荷识别的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PAULO RICARDO ZAMBELLI TAVEIRA ET AL.: "Non-Intrusive Identification of Loads by Random Forest and Fireworks Optimization" *
张志禹 等: "改进随机森林算法的图像分类应用" *
程祥 等: "非侵入式负荷监测与分解研究综述" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313294A (zh) * 2021-05-19 2021-08-27 国网山东省电力公司淄博供电公司 一种电力系统重要节点、重要输电线路预测算法
CN113935329A (zh) * 2021-10-13 2022-01-14 昆明理工大学 基于自适应特征识别与去噪的非对称文本匹配方法
CN113935329B (zh) * 2021-10-13 2022-12-13 昆明理工大学 基于自适应特征识别与去噪的非对称文本匹配方法
CN114636113A (zh) * 2022-02-22 2022-06-17 中国特种设备检测研究院 一种油库管道泄漏检测方法
CN116780537A (zh) * 2023-08-24 2023-09-19 国网天津市电力公司宝坻供电分公司 非侵入式负荷监测方法、装置、存储介质
CN116865451A (zh) * 2023-09-04 2023-10-10 湖南巨森电气集团有限公司 智慧用电控制管理系统及方法
CN116865451B (zh) * 2023-09-04 2023-11-28 湖南巨森电气集团有限公司 智慧用电控制管理系统及方法

Also Published As

Publication number Publication date
CN112732748B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN112732748A (zh) 一种基于自适应特征选择的非侵入式家电负荷识别方法
CN107273920A (zh) 一种基于随机森林的非侵入式家用电器识别方法
CN112821559B (zh) 一种非侵入式家电负荷深度再识别方法
Yeckle et al. Detection of electricity theft in customer consumption using outlier detection algorithms
CN111027408A (zh) 一种基于支持向量机和v-i曲线特征的负荷识别方法
CN110907762A (zh) 一种非侵入式负荷匹配辨识方法
CN110444011B (zh) 交通流高峰识别方法、装置、电子设备及存储介质
CN102521534B (zh) 一种基于粗糙熵属性约简的入侵检测方法
CN116595426B (zh) 一种工业物联网数据智能采集管理系统
CN111401785A (zh) 一种基于模糊关联规则的电力系统设备故障预警方法
CN116796271A (zh) 一种居民用能异常识别方法
CN110084169A (zh) 一种基于K-Means聚类和轮廓拓扑约束的违章建筑物识别方法
CN110334508B (zh) 一种主机序列入侵检测方法
CN114355298B (zh) 一种雷达复合调制脉冲信号识别方法
CN109389172B (zh) 一种基于无参数网格的无线电信号数据聚类方法
CN113496440B (zh) 一种用户异常用电检测方法及系统
CN114239762A (zh) 基于结构化负荷特征图谱的非侵入式负荷辨识方法及系统
CN115375921A (zh) 两级非侵入式负荷识别方法及终端
CN115345203A (zh) 一种基于vmd和多特征融合的管道信号识别方法及系统
CN114004285A (zh) 一种基于改进kNN算法的非侵入式负荷辨识方法
CN113642421A (zh) 周期性多状态电器的事件检测方法及系统、设备、存储介质
JP3415342B2 (ja) 文字切り出し方式
CN112256766A (zh) 用于能源采集终端的用电行为分析方法
CN115086019B (zh) 一种工业物联网物理层数据波形特征入侵检测方法
CN113722607B (zh) 一种基于改进聚类的托攻击检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant