CN117132312B - 一种用户用电行为分析方法 - Google Patents
一种用户用电行为分析方法 Download PDFInfo
- Publication number
- CN117132312B CN117132312B CN202311387216.3A CN202311387216A CN117132312B CN 117132312 B CN117132312 B CN 117132312B CN 202311387216 A CN202311387216 A CN 202311387216A CN 117132312 B CN117132312 B CN 117132312B
- Authority
- CN
- China
- Prior art keywords
- user
- load
- electricity
- cluster
- curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 235
- 238000004458 analytical method Methods 0.000 title abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 78
- 239000011159 matrix material Substances 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 28
- 230000000694 effects Effects 0.000 claims description 22
- 238000011156 evaluation Methods 0.000 claims description 22
- 230000002354 daily effect Effects 0.000 claims description 20
- 230000009191 jumping Effects 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 238000011524 similarity measure Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 230000003203 everyday effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 6
- 238000005065 mining Methods 0.000 abstract description 6
- 238000012935 Averaging Methods 0.000 abstract description 3
- 230000007547 defect Effects 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000007689 inspection Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电力数据分析技术领域,公开一种用户用电行为分析方法,采用改进的K‑means算法对负荷数据进行聚类分析提取用户典型负荷曲线,所得用户典型负荷曲线结果更加精细、准确,提取的用户典型负荷曲线具有广泛代表性,可有效反映用户典型用电特征,利用聚类结果与综合相似度确定用户典型用电负荷曲线,克服均值化聚类中心不能体现典型负荷特征的不足,同时,基于用户典型负荷曲线开展用电行为分析应用,可为多元综合应用提供辅助决策支撑,解决了现有的用户用电分析聚类算法用户负荷曲线提取不够精细准确和基于用户典型负荷曲线开展用电行为分析应用的深度不足,场景单一,未能有效实现用电行为数据资产价值挖掘与价值释放的技术问题。
Description
技术领域
本发明涉及电力数据分析技术领域,尤其涉及一种用户用电行为分析方法。
背景技术
当前供电企业常利用用户单日负荷曲线及负荷均值曲线开展用户用电行为分析与应用,但上述负荷曲线代表性不足,不能有效反映用户典型用电特征。配用电数据呈现数据海量、类型多样、维度高、价值密度低等特点,需采用数据挖掘方法开展数据资产价值挖掘与价值释放。其中,K-means算法被尝试用于用户典型负荷曲线提取与用电行为分析,然而,因算法聚类簇数目需人为设定、初始聚类中心随机选取、距离测度无法全面刻画数据分布的局域和全局相似性、均值化聚类中心不能体现典型负荷特征等问题,导致用户负荷曲线提取不够精细、准确。此外,基于用户典型负荷曲线开展用电行为分析应用的深度不足,场景单一,未能有效实现用电行为数据资产价值挖掘与价值释放。
发明内容
本发明提供了一种用户用电行为分析方法,用于解决现有的用户用电分析聚类算法用户负荷曲线提取不够精细准确和基于用户典型负荷曲线开展用电行为分析应用的深度不足,场景单一,未能有效实现用电行为数据资产价值挖掘与价值释放的技术问题。
有鉴于此,本发明提供了一种用户用电行为分析方法,包括:
获取用户用电负荷数据矩阵和用户用电类型信息;
采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,得到用户典型用电负荷曲线;
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性、计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算负荷偏离阈值、平均值与偏离度,分析用电负荷特性和用户无功负荷情况;
根据用户用电类型信息,分别基于用户典型用电负荷曲线与电网负荷曲线的相似性、用户典型用电负荷曲线与峰谷电费曲线的相似性、负荷偏离阈值、平均值、偏离度、用电负荷特性和用户无功负荷情况,开展综合应用。
可选地,获取用户用电负荷数据矩阵和用户用电类型信息,包括:
在计量自动化系统中,依据时间顺序获取用户用电负荷曲线;
以日为单位,将用户用电负荷曲线重构为用户用电负荷数据矩阵,用户用电负荷数据矩阵为:
;
其中,为用户用电负荷数据矩阵,为用户第1天的负荷数据向量,为用户第e天的负荷数据向量,为用户第m天的负荷数据向量,为用户第e天时刻j的负荷数据,m为提取的负荷数据总天数,n为每天采集的负荷数据总时刻数;
在营销系统中,获取用户用电类型信息,用户用电类型信息包括居民用电、工业用电、商业用电和农业用电。
可选地,采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,得到用户典型用电负荷曲线,包括:
S1、设聚类中心个数k=2;
S2、若,则从用户用电负荷数据矩阵P中随机选取k个负荷数据向量作为初始聚类中心,,跳转至步骤S3,否则,跳转至步骤S8,其中,为最大聚类中心个数;
S3、计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个聚类簇的综合相似度,将各负荷数据向量归于相似度最大的聚类簇;
S4、当用户用电负荷数据矩阵P中所有负荷数据向量完成分簇后,令各簇内向量均值为新聚类中心,完成各聚类中心的更新;
S5、计算聚类平方误差,若聚类平方误差不大于误差限值,则跳转至步骤S6,否则,跳转至步骤S3;
S6、计算聚类结果中负荷数据向量的聚类距离,聚类距离包括簇内距离与簇间距离;
S7、保存聚类中心数为k时对应的聚类距离与聚类平方误差,并令k=k+1,跳转至步骤S2;
S8、根据保存的聚类距离与聚类平方误差,计算聚类效果评价指标,并根据聚类效果评价指标确定最优聚类中心个数;
S9、输出最优聚类中心聚类个数对应的聚类结果,得到用户典型用电负荷曲线。
可选地,步骤S3具体包括:
S31、计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,计算公式为:
;
其中,为用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,为第i个簇聚类中心的平均值,为第i个簇聚类中心第j个时刻点的负荷数据,为用户用电负荷数据矩阵P中第e个负荷数据向量的平均值;
S32、计算用户负荷数据向量与第i个聚类簇的全局相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的全局相似度,为第i个聚类簇的负荷数据向量,为第i个聚类簇的向量个数,f为聚类簇中负荷数据向量的编号,为用户负荷数据向量与聚类簇中第f个负荷数据向量的局域相似度;
S33、计算用户负荷数据向量与第i个聚类簇的综合相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的综合相似度;
S34、将用户负荷数据向量归于综合相似度最大的聚类簇。
可选地,聚类平方误差的计算公式为:
;
其中,为聚类中心个数为k时的聚类平方误差。
可选地,步骤S6中,簇内距离的计算公式为:
;
其中,为负荷数据向量的簇内距离;
簇间距离的计算公式为:
;
其中,为负荷数据向量的簇间距离,为第g个负荷数据向量。
可选地,步骤S8中,聚类效果评价指标的计算公式为:
;
其中,为聚类效果评价指标,取对应的计算结果,为聚类中心个数为k-1时的聚类平方误差,为聚类中心个数为k+1时的聚类平方误差,当k取值为1时,,。
可选地,步骤S9具体包括:
S91、输出最优聚类中心聚类个数对应的聚类簇,计算各聚类簇中所有用户负荷数据向量与所归属聚类簇的全局相似度,以各聚类簇中全局相似度最大的负荷数据向量作为对应聚类簇的聚类中心;
S92、令聚类中心为初始聚类中心,重新执行步骤S3-S5,得到用户用电负荷数据的最终聚类结果;
S93、根据用户用电负荷数据的最终聚类结果,以各聚类结果簇中全局相似度最大的负荷数据向量为用户典型用电负荷曲线。
可选地,基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性、计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算负荷偏离阈值、平均值与偏离度,分析用电负荷特性和用户无功负荷情况,包括:
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性,计算公式为:
;
其中,为用户典型用电负荷曲线与电网负荷曲线的相似性,为电网负荷曲线时刻j的负荷数据,为电网负荷曲线的平均值,为用户第i个典型用电负荷曲线时刻j的负荷数据,为用户第i个典型用电负荷曲线的平均值,为最优聚类中心个数,为用户用电负荷数据的最终聚类结果中第i个聚类簇的向量个数;
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算公式为:
;
其中,为用户典型用电负荷曲线与峰谷电费曲线的相似性,为峰谷电费曲线时刻j的电费数值,为峰谷电费曲线的平均值;
计算负荷偏离阈值、平均值与偏离度,计算公式为:
;
;
;
其中,为用户用电负荷偏离阈值,c为偏离阈值系数,为用户用电负荷偏离平均值,为用户用电偏离度;
计算用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率;
提取用户典型用电负荷曲线对应日期的无功负荷曲线,计算用户典型用户负荷曲线的无功因数。
可选地,根据用户用电类型信息,分别基于用户典型用电负荷曲线与电网负荷曲线的相似性、用户典型用电负荷曲线与峰谷电费曲线的相似性、负荷偏离阈值、平均值、偏离度、用电负荷特性和用户无功负荷情况,开展综合应用,包括:
对于用户用电类型信息为工业用电和商业用电的用户,将用户典型用电负荷曲线与电网负荷曲线的相似性大于峰谷一致性阈值的用户纳入需求响应潜在目标用户集合,用于开展用户需求响应应用;
对于用户用电类型信息为工业用电、商业用电和农业用电的用户,将用户典型用电负荷曲线与峰谷电费曲线的相似性大于电费曲线一致性阈值的用户纳入生产经营类用电综合能源服务潜在目标用户集合,用于开展综合能源应用,将用户典型用电负荷曲线的无功因数大于无功因数阈值的用户纳入无功负荷治理及电能质量检测潜在目标用户集合,用于开展用户无功负荷治理、电能质量检测与治理应用;
对于用户用电类型信息为工业用电、商业用电、居民用电和农业用电的用户,根据负荷偏离阈值、平均值与偏离度分析用电异常情况,根据用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率安排作业计划。
从以上技术方案可以看出,本发明提供的用户用电行为分析方法具有以下优点:
本发明提供的用户用电行为分析方法,采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析提取用户典型负荷曲线,所得用户典型负荷曲线结果更加精细、准确,提取的用户典型负荷曲线具有广泛代表性,可有效反映用户典型用电特征,利用聚类结果与综合相似度确定用户典型用电负荷曲线,克服均值化聚类中心不能体现典型负荷特征的不足,同时,基于用户典型负荷曲线开展用电行为分析应用,可为多元综合应用提供辅助决策支撑,解决了现有的用户用电分析聚类算法用户负荷曲线提取不够精细准确和基于用户典型负荷曲线开展用电行为分析应用的深度不足,场景单一,未能有效实现用电行为数据资产价值挖掘与价值释放的技术问题。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明中提供的一种用户用电行为分析方法的流程示意图;
图2为本发明中提供的用户用电行为分析方法的逻辑框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1和图2,本发明中提供了一种用户用电行为分析方法的实施例,包括:
步骤101、获取用户用电负荷数据矩阵和用户用电类型信息。
需要说明的是,在计量自动化系统中,依据用户编号提取用户历史时期的用电负荷数据,依据时间顺序形成用户用电负荷曲线,以日为单位,将用户用电负荷曲线重构为用户用电负荷数据矩阵P:
;
其中,为用户用电负荷数据矩阵,为用户第1天的负荷数据向量,为用户第e天的负荷数据向量,为用户第m天的负荷数据向量,为用户第e天时刻j的负荷数据,m为提取的负荷数据总天数,n为每天采集的负荷数据总时刻数。
在营销系统中,依据用户编号提取用户用电类型信息,用户用电类型信息分为居民用电、工业用电、商业用电和农业用电。
步骤102、采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,得到用户典型用电负荷曲线。
需要说明的是,采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,具体步骤包括:
S1、设聚类中心个数k=2;
S2、若,则从用户用电负荷数据矩阵P中随机选取k个负荷数据向量作为初始聚类中心,,跳转至步骤S3,否则,跳转至步骤S8,其中,为最大聚类中心个数;
S3、计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个聚类簇的综合相似度,将各负荷数据向量归于相似度最大的聚类簇;
计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,计算公式为:
;
其中,为用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,为第i个簇聚类中心的平均值,为第i个簇聚类中心第j个时刻点的负荷数据,为用户用电负荷数据矩阵P中第e个负荷数据向量的平均值;
计算用户负荷数据向量与第i个聚类簇的全局相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的全局相似度,为第i个聚类簇的负荷数据向量,为第i个聚类簇的向量个数,f为聚类簇中负荷数据向量的编号,为用户负荷数据向量与聚类簇中第f个负荷数据向量的局域相似度;
计算用户负荷数据向量与第i个聚类簇的综合相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的综合相似度;
将用户负荷数据向量归于综合相似度最大的聚类簇。
S4、当用户用电负荷数据矩阵P中所有负荷数据向量完成分簇后,令各簇内向量均值为新聚类中心,完成各聚类中心的更新,更新公式为:
;
S5、计算聚类平方误差,若聚类平方误差不大于误差限值,即,则跳转至步骤S6,否则,跳转至步骤S3;
聚类平方误差的计算公式为:
;
其中,为聚类中心个数为k时的聚类平方误差。
S6、计算聚类结果中负荷数据向量的聚类距离,聚类距离包括簇内距离与簇间距离;
簇内距离的计算公式为:
;
其中,为负荷数据向量的簇内距离;
簇间距离的计算公式为:
;
其中,为负荷数据向量的簇间距离,为第g个负荷数据向量。
S7、保存聚类中心数为k时对应的聚类距离与聚类平方误差,并令k=k+1,跳转至步骤S2;
S8、根据保存的聚类距离与聚类平方误差,计算聚类效果评价指标,并根据聚类效果评价指标确定最优聚类中心个数,最优聚类中心个数为聚类效果评价指标最大值对应的聚类数。
聚类效果评价指标的计算公式为:
;
其中,为聚类效果评价指标,取对应的计算结果,为聚类中心个数为k-1时的聚类平方误差,为聚类中心个数为k+1时的聚类平方误差,当k取值为1时,,。
S8、根据聚类效果评价指标,确定最优聚类中心个数,最优聚类中心个数为聚类效果评价指标最大值对应的聚类数。
S9、输出最优聚类中心聚类个数对应的聚类结果,得到用户典型用电负荷曲线。具体地,根据最优聚类中心个数得到对应的聚类簇。计算各聚类簇中所有用户负荷数据向量与所归属聚类簇的全局相似度,以各聚类簇中全局相似度最大的负荷数据向量作为对应聚类簇的聚类中心。令聚类中心为初始聚类中心,即,重新执行步骤S3-S5,得到用户用电负荷数据的最终聚类结果;根据用户用电负荷数据的最终聚类结果,以各聚类结果簇中全局相似度最大的负荷数据向量为用户典型用电负荷曲线。
步骤103、基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性、计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算负荷偏离阈值、平均值与偏离度,分析用电负荷特性和用户无功负荷情况。
结合电网负荷曲线,基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性,分析用电负荷与电网负荷的峰谷一致性,计算公式为:
;
其中,为用户典型用电负荷曲线与电网负荷曲线的相似性,为电网负荷曲线时刻j的负荷数据,为电网负荷曲线的平均值,为用户第i个典型用电负荷曲线时刻j的负荷数据,为用户第i个典型用电负荷曲线的平均值,为最优聚类中心个数,为用户用电负荷数据的最终聚类结果中第i个聚类簇的向量个数;
结合峰谷电费曲线,基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与峰谷电费曲线的相似性,分析用电负荷的用电经济性,计算公式为:
;
其中,为用户典型用电负荷曲线与峰谷电费曲线的相似性,为峰谷电费曲线时刻j的电费数值,为峰谷电费曲线的平均值;
计算负荷偏离阈值、平均值与偏离度,计算公式为:
;
;
;
其中,为用户用电负荷偏离阈值,c为偏离阈值系数,为用户用电负荷偏离平均值,为用户用电偏离度;
计算用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率,其中:
用户典型用电负荷曲线的日最大负荷时刻为:
;
为时刻求取符号,获得符号内条件对应的时刻。
日最小负荷时刻为:
;
日负荷率为:
;
其中,为负荷限值。
峰期负载率为:
;
谷期负载率为:
;
平期负载率为:
;
峰期时段对应10:00—12:00和14:00—19:00,谷期时段对应0:00—8:00,平期时段对应8:00—10:00、12:00-14:00和19:00—24:00。、、分别为峰、谷、平期采集负荷数据的时刻数。
在计量自动化系统中提取用户典型用电负荷曲线对应日期的无功负荷曲线,计算用户典型用户负荷曲线的无功因数q,用于分析用户无功负荷情况,其中:
;
其中,为第i个无功负荷曲线时刻j的无功负荷值。
步骤104、根据用户用电类型信息,分别基于用户典型用电负荷曲线与电网负荷曲线的相似性、用户典型用电负荷曲线与峰谷电费曲线的相似性、负荷偏离阈值、平均值、偏离度、用电负荷特性和用户无功负荷情况,开展综合应用。
对于用户用电类型信息为工业用电和商业用电的用户,将用户典型用电负荷曲线与电网负荷曲线的相似性大于峰谷一致性阈值的用户纳入需求响应潜在目标用户集合,需求响应潜在目标用户集合可用于需求响应业务,开展用户需求响应应用。
对于用户用电类型信息为工业用电、商业用电和农业用电的用户,将用户典型用电负荷曲线与峰谷电费曲线的相似性大于电费曲线一致性阈值的用户纳入生产经营类用电综合能源服务潜在目标用户集合,生产经营类用电综合能源服务潜在目标用户集合可用于开展综合能源应用。对于用户用电类型信息为工业用电、商业用电和农业用电的用户,还可以将用户典型用电负荷曲线的无功因数大于无功因数阈值的用户纳入无功负荷治理及电能质量检测潜在目标用户集合,用于开展用户无功负荷治理、电能质量检测与治理应用。
对于用户用电类型信息为工业用电、商业用电、居民用电和农业用电的用户,根据负荷偏离阈值、平均值与偏离度分析用电异常情况,根据用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率安排作业计划。若日负荷率大于负载率限值,则将用户纳入高负载率重点关注用户集合,高负载率重点关注用户集合用于设备巡视与安全用电检查等业务,若峰期负载率大于负载率限值,则将用户纳入峰期高负载率重点关注用户集合,若谷期负载率大于负载率限值,则将用户纳入谷期高负载率重点关注集合,若平期负载率大于负载率限值,则将用户纳入平期高负载率重点关注用户集合。以日最大负荷时刻为基准安排用电检查与设备巡视计划。以日最小负荷时刻为基准,安排设备停电、检修、转负荷等作业计划,最小化操作作业对用户用电的影响。
其中,根据负荷偏离阈值、平均值与偏离度分析用电异常情况具体为:
a.由计量自动化系统抽取过去t天的用户用电负荷数据,重构组建用户用电负荷数据矩阵:
;
为重构的用户用电负荷数据矩阵,为用户第1天的负荷数据向量,为用户第e天的负荷数据向量,为用户第t天的负荷数据向量,为用户第e天时刻j的负荷数据,t为提取的负荷数据总天数,n为每天采集的负荷数据总时刻数;
b.计算用户负荷数据向量与典型用电负荷曲线的距离:
;
其中,为用户用电负荷曲线与典型用电负荷曲线的距离,为用户第e天的负荷数据向量,为典型用电负荷曲线;
c.根据负荷偏离阈值、平均值与偏离度计算用电异常判断指标,计算公式为:
;
;
;
其中,为第一个判断函数,为第二个判断函数,为用电异常判断指标,TF为逻辑判断标识符,括号中条件为真,则结果为1,否则,结果为0;
d.若,为异常率阈值,则将用户纳入用电异常潜在目标用户集合,用户集合可用于用电异常检查业务,开展用电稽查与异常用电检查应用。
本发明提供的用户用电行为分析方法,采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析提取用户典型负荷曲线,所得用户典型负荷曲线结果更加精细、准确,提取的用户典型负荷曲线具有广泛代表性,可有效反映用户典型用电特征,利用聚类结果与综合相似度确定用户典型用电负荷曲线,克服均值化聚类中心不能体现典型负荷特征的不足,同时,基于用户典型负荷曲线开展用电行为分析应用,可为多元综合应用提供辅助决策支撑,解决了现有的用户用电分析聚类算法用户负荷曲线提取不够精细准确和基于用户典型负荷曲线开展用电行为分析应用的深度不足,场景单一,未能有效实现用电行为数据资产价值挖掘与价值释放的技术问题。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种用户用电行为分析方法,其特征在于,包括:
获取用户用电负荷数据矩阵和用户用电类型信息;
采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,得到用户典型用电负荷曲线;
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性、计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算负荷偏离阈值、平均值与偏离度,分析用电负荷特性和用户无功负荷情况;
根据用户用电类型信息,分别基于用户典型用电负荷曲线与电网负荷曲线的相似性、用户典型用电负荷曲线与峰谷电费曲线的相似性、负荷偏离阈值、平均值、偏离度、用电负荷特性和用户无功负荷情况,开展综合应用;
获取用户用电负荷数据矩阵和用户用电类型信息,包括:
在计量自动化系统中,依据时间顺序获取用户用电负荷曲线;
以日为单位,将用户用电负荷曲线重构为用户用电负荷数据矩阵,用户用电负荷数据矩阵为:
;
其中,为用户用电负荷数据矩阵,为用户第1天的负荷数据向量,为用户第e天的负荷数据向量,为用户第m天的负荷数据向量,为用户第e天时刻j的负荷数据,m为提取的负荷数据总天数,n为每天采集的负荷数据总时刻数;
在营销系统中,获取用户用电类型信息,用户用电类型信息包括居民用电、工业用电、商业用电和农业用电;
采用基于综合相似性测度与聚类效果评价指标改进的K-means算法对用户用电负荷数据矩阵中的负荷数据进行聚类分析,得到用户典型用电负荷曲线,包括:
S1、设聚类中心个数k=2;
S2、若,则从用户用电负荷数据矩阵P中随机选取k个负荷数据向量作为初始聚类中心,,跳转至步骤S3,否则,跳转至步骤S8,其中,为最大聚类中心个数;
S3、计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个聚类簇的综合相似度,将各负荷数据向量归于相似度最大的聚类簇;
S4、当用户用电负荷数据矩阵P中所有负荷数据向量完成分簇后,令各簇内向量均值为新聚类中心,完成各聚类中心的更新;
S5、计算聚类平方误差,若聚类平方误差不大于误差限值,则跳转至步骤S6,否则,跳转至步骤S3;
S6、计算聚类结果中负荷数据向量的聚类距离,聚类距离包括簇内距离与簇间距离;
S7、保存聚类中心数为k时对应的聚类距离与聚类平方误差,并令k=k+1,跳转至步骤S2;
S8、根据保存的聚类距离与聚类平方误差,计算聚类效果评价指标,并根据聚类效果评价指标确定最优聚类中心个数;
S9、输出最优聚类中心聚类个数对应的聚类结果,得到用户典型用电负荷曲线。
2.根据权利要求1所述的用户用电行为分析方法,其特征在于,步骤S3具体包括:
S31、计算用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,计算公式为:
;
其中,为用户用电负荷数据矩阵P中第e个负荷数据向量与第i个簇聚类中心的局域相似度,为第i个簇聚类中心的平均值,为第i个簇聚类中心第j个时刻点的负荷数据,为用户用电负荷数据矩阵P中第e个负荷数据向量的平均值;
S32、计算用户负荷数据向量与第i个聚类簇的全局相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的全局相似度,为第i个聚类簇的负荷数据向量,为第i个聚类簇的向量个数,f为聚类簇中负荷数据向量的编号,为用户负荷数据向量与聚类簇中第f个负荷数据向量的局域相似度;
S33、计算用户负荷数据向量与第i个聚类簇的综合相似度,计算公式为:
;
其中,为用户负荷数据向量与第i个聚类簇的综合相似度;
S34、将用户负荷数据向量归于综合相似度最大的聚类簇。
3.根据权利要求2所述的用户用电行为分析方法,其特征在于,步骤S5中,聚类平方误差的计算公式为:
;
其中,为聚类中心个数为k时的聚类平方误差。
4.根据权利要求3所述的用户用电行为分析方法,其特征在于,步骤S6中,簇内距离的计算公式为:
;
其中,为负荷数据向量的簇内距离;
簇间距离的计算公式为:
;
其中,为负荷数据向量的簇间距离,为第g个负荷数据向量。
5.根据权利要求4所述的用户用电行为分析方法,其特征在于,步骤S8中,聚类效果评价指标的计算公式为:
;
其中,为聚类效果评价指标,取对应的计算结果,为聚类中心个数为k-1时的聚类平方误差,为聚类中心个数为k+1时的聚类平方误差,当k取值为1时,,。
6.根据权利要求5所述的用户用电行为分析方法,其特征在于,步骤S9具体包括:
S91、输出最优聚类中心聚类个数对应的聚类簇,计算各聚类簇中所有用户负荷数据向量与所归属聚类簇的全局相似度,以各聚类簇中全局相似度最大的负荷数据向量作为对应聚类簇的聚类中心;
S92、令聚类中心为初始聚类中心,重新执行步骤S3-S5,得到用户用电负荷数据的最终聚类结果;
S93、根据用户用电负荷数据的最终聚类结果,以各聚类结果簇中全局相似度最大的负荷数据向量为用户典型用电负荷曲线。
7.根据权利要求6所述的用户用电行为分析方法,其特征在于,基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性、计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算负荷偏离阈值、平均值与偏离度,分析用电负荷特性和用户无功负荷情况,包括:
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与电网负荷曲线的相似性,计算公式为:
;
其中,为用户典型用电负荷曲线与电网负荷曲线的相似性,为电网负荷曲线时刻j的负荷数据,为电网负荷曲线的平均值,为用户第i个典型用电负荷曲线时刻j的负荷数据,为用户第i个典型用电负荷曲线的平均值,为最优聚类中心个数,为用户用电负荷数据的最终聚类结果中第i个聚类簇的向量个数;
基于用户典型用电负荷曲线,计算用户典型用电负荷曲线与峰谷电费曲线的相似性,计算公式为:
;
其中,为用户典型用电负荷曲线与峰谷电费曲线的相似性,为峰谷电费曲线时刻j的电费数值,为峰谷电费曲线的平均值;
计算负荷偏离阈值、平均值与偏离度,计算公式为:
;
;
;
其中,为用户用电负荷偏离阈值,c为偏离阈值系数,为用户用电负荷偏离平均值,为用户用电偏离度,为用户第i个典型用电负荷曲线;
计算用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率;
提取用户典型用电负荷曲线对应日期的无功负荷曲线,计算用户典型用户负荷曲线的无功因数。
8.根据权利要求7所述的用户用电行为分析方法,其特征在于,根据用户用电类型信息,分别基于用户典型用电负荷曲线与电网负荷曲线的相似性、用户典型用电负荷曲线与峰谷电费曲线的相似性、负荷偏离阈值、平均值、偏离度、用电负荷特性和用户无功负荷情况,开展综合应用,包括:
对于用户用电类型信息为工业用电和商业用电的用户,将用户典型用电负荷曲线与电网负荷曲线的相似性大于峰谷一致性阈值的用户纳入需求响应潜在目标用户集合,用于开展用户需求响应应用;
对于用户用电类型信息为工业用电、商业用电和农业用电的用户,将用户典型用电负荷曲线与峰谷电费曲线的相似性大于电费曲线一致性阈值的用户纳入生产经营类用电综合能源服务潜在目标用户集合,用于开展综合能源应用,将用户典型用电负荷曲线的无功因数大于无功因数阈值的用户纳入无功负荷治理及电能质量检测潜在目标用户集合,用于开展用户无功负荷治理、电能质量检测与治理应用;
对于用户用电类型信息为工业用电、商业用电、居民用电和农业用电的用户,根据负荷偏离阈值、平均值与偏离度分析用电异常情况,根据用户典型用电负荷曲线的日最大负荷时刻、日最小负荷时刻、日负荷率、峰期负载率、谷期负载率和平期负载率安排作业计划。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311387216.3A CN117132312B (zh) | 2023-10-25 | 2023-10-25 | 一种用户用电行为分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311387216.3A CN117132312B (zh) | 2023-10-25 | 2023-10-25 | 一种用户用电行为分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117132312A CN117132312A (zh) | 2023-11-28 |
CN117132312B true CN117132312B (zh) | 2024-02-13 |
Family
ID=88861318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311387216.3A Active CN117132312B (zh) | 2023-10-25 | 2023-10-25 | 一种用户用电行为分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117132312B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
CN109103874A (zh) * | 2017-11-27 | 2018-12-28 | 广东电网有限责任公司佛山供电局 | 考虑负荷特性与分布式电源接入的配电网可靠性评估方法 |
CN110659699A (zh) * | 2019-09-30 | 2020-01-07 | 重庆大学 | 一种基于特征指标降维的分布式双层聚类分析方法 |
CN114565293A (zh) * | 2022-03-03 | 2022-05-31 | 国网经济技术研究院有限公司 | 一种工业负荷提供长周期需求响应能力的评估方法 |
CN115759590A (zh) * | 2022-11-03 | 2023-03-07 | 国网四川省电力公司经济技术研究院 | 一种基于用电行为特征的工业用户需求响应潜力计算方法 |
CN116485071A (zh) * | 2023-04-12 | 2023-07-25 | 山东科技大学 | 一种基于概率基线负荷的电力用户需求响应潜力评估方法 |
CN116842405A (zh) * | 2023-06-30 | 2023-10-03 | 国电南瑞科技股份有限公司 | 一种电力负荷数据聚类方法、系统、设备及存储介质 |
-
2023
- 2023-10-25 CN CN202311387216.3A patent/CN117132312B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446967A (zh) * | 2016-10-28 | 2017-02-22 | 国网福建省电力有限公司 | 一种新型电力系统负荷曲线聚类方法 |
CN109103874A (zh) * | 2017-11-27 | 2018-12-28 | 广东电网有限责任公司佛山供电局 | 考虑负荷特性与分布式电源接入的配电网可靠性评估方法 |
CN110659699A (zh) * | 2019-09-30 | 2020-01-07 | 重庆大学 | 一种基于特征指标降维的分布式双层聚类分析方法 |
CN114565293A (zh) * | 2022-03-03 | 2022-05-31 | 国网经济技术研究院有限公司 | 一种工业负荷提供长周期需求响应能力的评估方法 |
CN115759590A (zh) * | 2022-11-03 | 2023-03-07 | 国网四川省电力公司经济技术研究院 | 一种基于用电行为特征的工业用户需求响应潜力计算方法 |
CN116485071A (zh) * | 2023-04-12 | 2023-07-25 | 山东科技大学 | 一种基于概率基线负荷的电力用户需求响应潜力评估方法 |
CN116842405A (zh) * | 2023-06-30 | 2023-10-03 | 国电南瑞科技股份有限公司 | 一种电力负荷数据聚类方法、系统、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于近邻传播算法的电力用户负荷曲线聚类分析;彭勃;李作红;李猛;杨燕;徐蔚;麻敏华;;机电工程技术(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117132312A (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A cluster-based method for calculating baselines for residential loads | |
Chen et al. | Day-ahead prediction of hourly subentry energy consumption in the building sector using pattern recognition algorithms | |
CN115375205B (zh) | 一种用水用户画像的确定方法、装置及设备 | |
Mutanen | Improving electricity distribution system state estimation with AMR-based load profiles | |
Mi et al. | Low-carbon generation expansion planning considering uncertainty of renewable energy at multi-time scales | |
CN116681450B (zh) | 一种支撑智能催费的客户信用评价方法及系统 | |
Wang et al. | Adaptive horizontal federated learning-based demand response baseline load estimation | |
Bashawyah et al. | Machine learning based short-term load forecasting for smart meter energy consumption data in london households | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN112614004A (zh) | 用电信息的处理方法及装置 | |
CN112381433A (zh) | 一种实用的面向现货市场结算的电量数据处理方法 | |
CN117132312B (zh) | 一种用户用电行为分析方法 | |
Fujiwara et al. | Load forecasting method for Commercial facilities by determination of working time and considering weather information | |
Zhang et al. | Two-stage characteristic recognition of demand side resource for load aggregator based on bias-SVD matrix factorization and Bayesian inference | |
Panapakidis et al. | Application of the load profiling methodology in short-term bus load forecasting | |
Asghari et al. | Selecting and prioritizing the electricity customers for participating in demand response programs | |
Kumar et al. | A deep clustering framework for load pattern segmentation | |
Shirsat et al. | Identification of the potential of residential demand response using artificial neural networks | |
CN116543198A (zh) | 一种基于多粒度近邻图的智能电表故障分类方法 | |
Shamim et al. | Novel technique for feature computation and clustering of smart meter data | |
Davarzani et al. | Study of missing meter data impact on domestic load profiles clustering and characterization | |
CN112308338A (zh) | 电力数据处理方法及装置 | |
CN118350680B (zh) | 基于动态多目标引力搜索的电费异常识别方法及系统 | |
Panagoulias et al. | Circumstance Evaluation Using Extreme Value Analysis on Charging Station Data: The Case of DEI Blue in Greece | |
Oliver et al. | NTL Detection in Smart Grids by means of a Reservoir Computing-based Solution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |