CN111062502B - 用户用电行为细分方法及其故障分析方法 - Google Patents
用户用电行为细分方法及其故障分析方法 Download PDFInfo
- Publication number
- CN111062502B CN111062502B CN201911301560.XA CN201911301560A CN111062502B CN 111062502 B CN111062502 B CN 111062502B CN 201911301560 A CN201911301560 A CN 201911301560A CN 111062502 B CN111062502 B CN 111062502B
- Authority
- CN
- China
- Prior art keywords
- user
- electricity consumption
- users
- matrix
- subdivision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 78
- 238000004458 analytical method Methods 0.000 title claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 69
- 230000006399 behavior Effects 0.000 claims abstract description 32
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 229910052739 hydrogen Inorganic materials 0.000 claims description 16
- 230000002776 aggregation Effects 0.000 claims description 13
- 238000004220 aggregation Methods 0.000 claims description 12
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 4
- 238000009833 condensation Methods 0.000 abstract 1
- 230000005494 condensation Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 8
- 230000002354 daily effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005054 agglomeration Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户用电行为细分方法,包括获取待分析用户用电数据;采用奇异值分解获取用户和日期的初始化表示特征;获取用户表示特征和日期表示特征;使用聚类算法完成用户用电行为的细分。本发明还提供了一种包括所述用户用电行为细分方法的故障分析方法。本发明根据获得的用户和日期的初始化表示特征,融合地理和用户类型信息,采用矩阵分解算法将居民根据时间序列用电的情况投影到潜在特征空间,并约束地理位置相近的用户在潜在特征空间相近,最后采用凝聚层次和聚类算法在潜在特征空间上对用户聚类细分,得到的用户聚类结果不仅保证用户的地理位置接近,类型一致且具有相似的用电行为;本发明方法可靠性强且准确性高。
Description
技术领域
本发明属于智能电网领域,具体涉及一种用户用电行为细分方法及其故障分析方法。
背景技术
随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。而随着智能电网的应用普及和大数据技术快速发展,海量用户用电数据被记录和存储,带动了用户用电行为分析等新方向的实践和理论研究。
特征学习可以被分为两类:监督的和无监督的。在监督特征学习中,被标记过的数据被当做特征用来学习,如神经网络。在无监督特征学习中,未被标记过的数据被当做特征用来学习,例如矩阵分解,各种聚类分析及其变形。
传统的智能电网用户细分模型主要为启发式的聚类算法。根据经验,预先定义两个用户的行为相似性度量方法,然后采用聚类方法基于该相似度度量对用户聚类。相似度计算作用在用户的用电序列向量上,常用的相似度度量方法有欧氏距离、余弦相似度或者皮尔逊系数。这样的理论框架可以聚类用户,但对于电网企业而言,由于供电运输是与地理和用户类型相关的,对地理相近(比如同市、乡镇、社区等)、用户类型一致且用电需求相似的用户群,提供特定的供电服务更为科学。这对传统聚类方法提出了新的挑战。
由于采用常规的矩阵分解方法获得用户和日期的表示特征时,所利用的数据类型单一(仅用户的用电情况),诸如地理位置、用户类型等大量信息得不到有效利用。在获取用户表示特征时会遭遇冷启动问题(用电信息丢失),分析效果也不理想。
发明内容
本发明的目的之一在于提供一种可靠性高且准确性好的用户用电行为细分方法
本发明的目的之二在于提供一种包括所述用户用电行为细分方法的故障分析方法。
本方法中采用的符号说明:
本发明提供的这种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);
S2.采用奇异值分解获取用户和日期的初始化表示特征;
S3.基于矩阵分解,获取用户表示特征和日期表示特征;
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分。
步骤S1所述的获取待分析用户的近若干天的用电数据,具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数。
步骤S3所述的基于矩阵分解,获取用户表示特征和日期表示特征,具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式迭代更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵。
B.迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征。
步骤S4所述的采用聚类算法对用户进行细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分。
步骤b所述的采用K-means聚类算法对用户进行细分,具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用户数少于设定阈值的簇,从而得到最终的用户簇。
本发明还提供了一种包括了基于上述用户用电行为细分方法的故障分析方法,包括如下步骤:
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家系统智能诊断方法对用户故障进行分析。
本发明提供的这种用户用电行为细分方法及其故障分析方法,通过首先采用奇异值分解获得用户和日期的初始化表示特征,然后融合地理信息和用户类型信息,采用矩阵分解算法,将居民根据其时间序列用电的情况投影到潜在特征空间,并约束地理位置相近的用户在潜在特征空间相近,类型一致的用户在潜在特征空间也相近,最后采用凝聚层次和Kmeans聚类算法,在潜在特征空间上对用户聚类细分,使得用户聚类结果不仅保证用户的地理位置接近,类型一致且具有相似的用电行为;因此,本发明方法的可靠性强且准确性高。
附图说明
图1为本发明方法的方法流程示意图。
图2为本发明方法的实施例一中参数C对平均相似比的影响示意图。
图3为本发明方法的实施例一中参数C对最终簇数的影响示意图。
图4为本发明方法的实施例一中参数C取值为10时不同簇的用电行为对比示意图。
图5为本发明方法的实施例一中每个簇的平均使用电量示意图。
图6为本发明方法的实施例二中参数C对平均相似比的影响示意图。
图7为本发明方法的实施例二中参数C对最终簇数的影响示意图。
图8为本发明方法的实施例二中参数C取值为10时不同簇的用电行为对比示意图。
图9为本发明方法的实施例二中每个簇的平均使用电量示意图。
图10为本发明方法的故障分析方法的方法流程示意图。
具体实施方式
如图1所示为本发明方法的方法流程示意图:本发明提供的这种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数;
在具体实施时,优选采用近10天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
式中max为取矩阵的最大元素操作,min为取矩阵的最小元素操作,归一化后的矩阵W和H构造出了用户和日期的初始表示特征。
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
在具体实施时,首先引入描述分解逼近的目标函数,即:
L(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
s.t.Wij≥0,Hij≥0
此外,为了避免分解过度拟合,同时为了保证提取的特征为标准化特征,分别对W和H加两个约束项tr(WWT-IW)和tr(HHT-IH),即:
LGE(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
+tr(WWT-IW)+tr(HHT-IH)
s.t.Wij≥0,Hij≥0
其中DG和DM均为对角矩阵,且对角线上第(i,j)个元素分别等于矩阵SG和SM的第i行之和,IW和IH分别为大小为N*N和M*M的单位矩阵;
同时,令φ和ψ为拉格朗日乘子来分别约束Wij≥0和Hij≥0,则上述目标函数对应的拉格朗日函数Lf(W,H)为:
Lf(W,H)=||Y-WHT||+2tr(WTLGW)+2tr(WTLMW)+tr(φWT)+tr(ψHT)
+tr(WWT-IW)+tr(HHT-IH)
根据KKT条件,φikWik=0且ψikHik=0,从而可以获得以下等式:
-(YH)ikWik+(WHTH)ikWik+(LGW)ikWik+(LMW)ikWik+(W)ikWik=0
-(YTW)ikHik+(HWTW)ikHik+(H)ikHik=0
然后,根据以下公式分别更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
不断更新非负矩阵W和H,直至收敛或迭代次数达到设置的上限,最终获得用户和日期的表示特征,如第i个用户的标识特征为Wi(W的第i行向量),第j个日期的表示特征为Hj(H的第j行向量);
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分;具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用户数少于设定阈值的簇,从而得到最终的用户簇。
本发明提供的用户用电行为细分方法,可以用于构建客户精准画像、智能电表数据应用、供电服务的线上应用、基于大数据分析的差异化客户服务、电力大数据增信应用、电网服务移动作业应用、客户服务全程可视化、基于专家系统智能诊断的用户故障分析应用等。并且用户数据量越多,本发明方法得到的结果越精准。
为了验证本发明方法的有效性,以下结合两个实施例对本发明进行说明:
将本发明方法应用于衡阳地区和常德地区的用户十天用电情况数据集上。用户用电情况数据均为真实数据。衡阳地区数据集包含26个街道(或乡镇)的,9种用户类型的443个用户。常德地区数据集包含48个街道(或乡镇)的,12种用户类型的1682个用户。对于用电情况数据中的缺失值,本方法采用平均值替代。
在本实例中,将传统聚类方法凝聚层次聚类和K-means应用在本发明方法框架中,并进行了实验结果对比。引入了平均相似性比例(ASR)来衡量凝聚层次聚类和K-means方法识别的用户簇的簇内紧密和簇间宽松程度,进而表明本发明方法识别用户簇的有效性。同时,在本实例中,还展示了初始簇数C对最终用户簇结果的影响,各用户簇中每个用户的用电量以及各用户簇的用户平均用电量。
实施例一:
1)不同聚类方法实验对比,验证本发明算法的有效性:
图2给出了凝聚层次聚类和K-means中参数C取不同值时,获得的最终用户簇的ASR的值。整体上K-means方法获得ASR值比凝聚层次聚类方法获得ASR值更大。此外,K-Means方法在C=10时获得最大的ASR值1.2441,凝聚层次聚类方法在C=8时获得最大的ASR值1.22868,因此,可以说在本发明方法框架中,K-Means方法的性能优于凝聚层次聚类方法的性能。图3给出了初始簇数C值和最终用户簇之间的关联关系。从图3可以看出,随着C值的增大,K-Means方法获得的最终用户簇也逐渐增多,然而,随着C值的增大,凝聚层次聚类方法获得的最终用户数之间的关联关系没有那么大。综合图2和图3的显示结果,在之后的实验中,设置初始簇数C为10,然后根据权利要求书中K-means的实施步骤,将用户数少于10的簇删除,得到的最终簇数为5个。
2)实验结果各簇中用户用电量分析,验证结果的有效性
本发明方法得到的最终用户簇是具有共同特性的。在本次实例中,图4描述了不同簇中用户不同日期的用电行为,纵坐标为用户用电量,横坐标为日期点。图4(a)共含有229个用户,这些用户1-10日用电量较为平稳,整体用电量集中在10-400瓦;图4(b)共含有12个用户,这些用户用电量较多,集中在6000-10000瓦中,且1、2、9、10日用电量明显高于其他时间段的用电量;图4(c)共含有30个用户,这些用户的用电量集中在3000-5000瓦中,同样呈现1、2、9、10日用电量明显高于其他时间段的用电量的现象;图4(d)共含有101个用户,这些用户的用电量集中300-1000瓦,且9、10日的用电量稍微高于其他时间段的用电量;图4(e)共含有59个用户,这些用户的用电量集中在1200-2200瓦之间,且9、10日的用电量明显高于其他时间段的用电量。此外,如图4(d)所示,某一用户在8日的用电量极高,达到3600瓦左右(可能因为公司文化节、电表设备故障等特殊原因),但该用户仍然被聚类到图4(d)中,这得益于本发明融合了多源数据(如:用户类型和地理位置),从而进一步说明了本发明具有较强的抗干扰能力。图5显示每个簇内每天平均用电情况,从中可以看出不同簇中每天平均电量具有明显差异,且与图4中各簇中用户的用电量趋势吻合。例如:第4个用户簇前几天平均每天用电量呈平稳状态,而在9-10日出现明显上升趋势。
实施例2:
1)不同聚类方法实验对比,验证算法有效性
图6给出了凝聚层次聚类和K-means中参数C取不同值时,获得的常德最终用户簇的ASR值。类似地,K-means方法整体上能获得比凝聚层次聚类方法更大的ASR。此外,当C=10时,K-means方法能够获得最大的ASR=1.239值,当C=12时,凝聚层次聚类能够获得最大的ASR=1.078值,因此,同样地,K-means方法在常德地区数据方面也能获得更好的性能。图7描述了初始簇数C值和最终常德地区最终用户簇之间的关联关系。同样地,K-means方法获得的最终用户数与C值得关联性更高。综合图6和图7的显示结果,在针对常德地区数据的实验中,设置初始簇数C为10,然后根据权利要求书中K-means的实施步骤,将用户数少于10的簇删除,得到的最终簇数为7个。
2)实验结果各簇中用户用电量分析,验证结果的有效性
本发明方法所识别的常德地区最终用户簇是具有共同特性的。在本次实例中,图8描述了七个不同簇中常德地区用户不同日期的用电行为,纵坐标为用户用电量,横坐标为日期。图8(a)共含有1017个用户,这些用户的日用电量集中在0-600瓦,且每日用电量较为平稳;图8(b)共含有80个用户,这些用户的用电量集中在2200-4000瓦之间,4、5日的用电量略高于其他时间的用电量;图8(c)共含有41个用户,这些用户的用电量集中在4000-6000瓦中,且9、10日的用电量明显低于其他时间段;图8(d)共含有357个用户,这些用户的用电量集中在200-1400之间,且先呈现上升趋势后呈现下降趋势;图8(e)共含有132个用户,这些用户的用电量集中在1000-1500瓦之间,且整体较为平稳;图8(f)共含有31个用户,这些用户的用电量集中在6000-9000瓦,4日左右用电量高于其他时间段的用电量;图8(g)共含有12个用户,这些与用户的用电量集中在11000-21000之间,且4、7、8日用电量往往略低于其他时间段用电量。类似地,综合图片中出现的用电量极高或极低点,可以得到如下总结:本发明能够融合多源数据从而加强了用户细分方法的抗噪声干扰能力。图9显示了七个最终用户簇的每天平均用电情况,从中可以看出不同簇每天平均用电量具有明显差异,且与图8中各簇的单个用户用电量趋势吻合。例如:图8(f)在四日左右的用电量达到高峰期。
如图10所示为本发明方法的故障分析方法的方法流程示意图:本发明提供的这种包括上述用户用电行为细分方法的故障分析方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据(包括用户地理信息和类型信息);具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数;
在具体实施时,优选采用近10天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
式中max为取矩阵的最大元素操作,min为取矩阵的最小元素操作,归一化后的矩阵W和H构造出了用户和日期的初始表示特征。
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
在具体实施时,首先引入描述分解逼近的目标函数,即:
L(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
s.t.Wij≥0,Hij≥0
此外,为了避免分解过度拟合,同时为了保证提取的特征为标准化特征,分别对W和H加两个约束项tr(WWT-IW)和tr(HHT-IH),即:
LGE(W,H)=||Y-WHT||+2tr(WT(DG-SG)W)+2tr(WT(DM-SM)W)
+tr(WWT-IW)+tr(HHT-IH)
s.t.Wij≥0,Hij≥0
其中DG和DM均为对角矩阵,且对角线上第(i,j)个元素分别等于矩阵SG和SM的第i行之和,IW和IH分别为大小为N*N和M*M的单位矩阵。
同时,令φ和ψ为拉格朗日乘子来分别约束Wij≥0和Hij≥0,则上述目标函数对应的拉格朗日函数Lf(W,H)为:
Lf(W,H)=||Y-WHT||+2tr(WTLGW)+2tr(WTLMW)+tr(φWT)+tr(ψHT)
+tr(WWT-IW)+tr(HHT-IH)
根据KKT条件,φikWik=0且ψikHik=0,从而可以获得以下等式:
-(YH)ikWik+(WHTH)ikWik+(LGW)ikWik+(LMW)ikWik+(W)ikWik=0
-(YTW)ikHik+(HWTW)ikHik+(H)ikHik=0
然后,根据以下公式分别更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
不断更新非负矩阵W和H,直至收敛或迭代次数达到设置的上限,最终获得用户和日期的表示特征,如第i个用户的标识特征为Wi(W的第i行向量),第j个日期的表示特征为Hj(H的第j行向量);
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分;具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的额收敛要求;
(6)剔除用于数少于设定阈值的簇,从而得到最终的用户簇;
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家系统智能诊断方法对用户故障进行分析。
Claims (5)
1.一种用户用电行为细分方法,包括如下步骤:
S1.获取待分析用户的近若干天的用电数据;
S2.采用奇异值分解获取用户和日期的初始化表示特征;
S3.基于矩阵分解,获取用户表示特征和日期表示特征;具体为采用如下步骤获取用户表示特征和日期表示特征:
A.采用如下算式更新用户表示特征Wik和日期表示特征Hjk:
式中Y为用户用电数据,H为日期特征,W为用户特征,LG为矩阵SG的拉普拉斯矩阵,SG为用户地理信息矩阵,LM为矩阵SM的拉普拉斯矩阵,SM为用户类型信息矩阵,YT、HT、WT分别为Y、H、T矩阵对应的转置矩阵;
B.迭代更新的Wik、Hjk与各自上一次更新对应的矩阵相减得到残差矩阵,计算残差矩阵的二范数之和,并进行判断:
若残差矩阵的二范数之和大于设定的阈值,则重复步骤A进行更新;
若残差矩阵的二范数之和小于或等于设定的阈值,则直接获取用户表示特征和日期表示特征;
S4.根据获取的用户表示特征和日期表示特征,采用聚类算法对用户进行细分,从而完成用户用电行为的细分。
2.根据权利要求1所述的用户用电行为细分方法,其特征在于步骤S1所述的获取待分析用户的近若干天的用电数据,具体为获取待分析用户的近N天的用电数据,并采用近N天的用电数据的平均值填充用电数据缺失日的用电数据;N为自然数。
3.根据权利要求2所述的用户用电行为细分方法,其特征在于步骤S4所述的采用聚类算法对用户进行细分,具体为采用如下步骤进行细分:
a.进行凝聚层次聚类;
b.采用K-means聚类算法对用户进行细分。
4.根据权利要求3所述的用户用电行为细分方法,其特征在于步骤b所述的采用K-means聚类算法对用户进行细分,具体为采用如下步骤进行细分:
(1)设定聚类的个数C;
(2)任意生成C个簇中心;
(3)计算每个用户到簇中心的距离,并将该用户细分至最近的簇中心所在的簇中;
(4)重新计算簇的中心点;
(5)重复步骤(1)~(4),直至满足事先设定的收敛要求;
(6)剔除用于数少于设定阈值的簇,从而得到最终的用户簇。
5.一种包括权利要求1~4之一所述的用户用电行为细分方法的故障分析方法,其特征在于还包括如下步骤:
S5.根据步骤S4得到的用户用电行为的细分结果,采用基于专家系统智能诊断方法对用户故障进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301560.XA CN111062502B (zh) | 2019-12-17 | 2019-12-17 | 用户用电行为细分方法及其故障分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301560.XA CN111062502B (zh) | 2019-12-17 | 2019-12-17 | 用户用电行为细分方法及其故障分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062502A CN111062502A (zh) | 2020-04-24 |
CN111062502B true CN111062502B (zh) | 2023-07-14 |
Family
ID=70301999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911301560.XA Active CN111062502B (zh) | 2019-12-17 | 2019-12-17 | 用户用电行为细分方法及其故障分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062502B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381351B (zh) * | 2020-10-15 | 2022-10-11 | 广西电网有限责任公司 | 一种基于奇异谱分析的用电行为变化检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN107358368A (zh) * | 2017-07-21 | 2017-11-17 | 国网四川省电力公司眉山供电公司 | 一种面向电力用户细分的鲁棒k‑means聚类方法 |
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN109740790A (zh) * | 2018-11-28 | 2019-05-10 | 国网天津市电力公司 | 一种基于时序特征提取的用户用电量预测方法 |
-
2019
- 2019-12-17 CN CN201911301560.XA patent/CN111062502B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093394A (zh) * | 2013-01-23 | 2013-05-08 | 广东电网公司信息中心 | 一种基于用户用电负荷数据细分的聚类融合方法 |
CN107358368A (zh) * | 2017-07-21 | 2017-11-17 | 国网四川省电力公司眉山供电公司 | 一种面向电力用户细分的鲁棒k‑means聚类方法 |
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN109740790A (zh) * | 2018-11-28 | 2019-05-10 | 国网天津市电力公司 | 一种基于时序特征提取的用户用电量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111062502A (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021208516A1 (zh) | 一种非侵入式负荷分解方法 | |
WO2022105117A1 (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN111709397B (zh) | 一种基于多头自注意力机制的无人机变尺寸目标检测方法 | |
CN109558873B (zh) | 一种基于变样本栈式自编码网络的模式识别方法 | |
CN108197425B (zh) | 一种基于非负矩阵分解的智能电网数据分解方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN109190890A (zh) | 一种基于用户电力消费数据的用户行为分析方法 | |
CN108805213B (zh) | 计及小波熵降维的电力负荷曲线双层谱聚类方法 | |
CN111724039B (zh) | 一种向电力用户推荐客服人员的推荐方法 | |
CN109375116A (zh) | 一种基于自编码器的电池系统异常电池识别方法 | |
CN109634940A (zh) | 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法 | |
CN111783879B (zh) | 基于正交注意力机制的层次化压缩图匹配方法及系统 | |
CN113902304A (zh) | 一种基于总负荷曲线相似性的可控负荷筛选方法 | |
CN112308341B (zh) | 电力数据的处理方法和装置 | |
CN106067034A (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN112650894A (zh) | 一种基于层次分析法和深度信念网络相结合的用户用电行为多维分析诊断方法 | |
CN112330078A (zh) | 用电量预测方法、装置、计算机设备和存储介质 | |
Mohammadi et al. | An unsupervised learning schema for seeking patterns in rms voltage variations at the sub-10-minute time scale | |
CN111062502B (zh) | 用户用电行为细分方法及其故障分析方法 | |
Miraftabzadeh et al. | Knowledge Extraction from PV Power Generation with Deep Learning Autoencoder and Clustering-Based Algorithms | |
CN109800677A (zh) | 一种跨平台掌纹识别方法 | |
CN110503145A (zh) | 一种基于k-shape聚类的典型负荷曲线获取方法 | |
CN102930007A (zh) | 大面积停电应急处理中的用户复电紧急程度分类方法 | |
CN105447767A (zh) | 一种基于联合矩阵分解模型的电力用户细分方法 | |
CN117493922A (zh) | 一种基于数据驱动的配电网户变关系识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |