CN110826641B - 一种基于聚类分析归类居民用电情况的系统及方法 - Google Patents
一种基于聚类分析归类居民用电情况的系统及方法 Download PDFInfo
- Publication number
- CN110826641B CN110826641B CN201911105180.9A CN201911105180A CN110826641B CN 110826641 B CN110826641 B CN 110826641B CN 201911105180 A CN201911105180 A CN 201911105180A CN 110826641 B CN110826641 B CN 110826641B
- Authority
- CN
- China
- Prior art keywords
- data
- electricity
- value
- values
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000007621 cluster analysis Methods 0.000 title claims description 14
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 238000011835 investigation Methods 0.000 claims description 3
- 238000007418 data mining Methods 0.000 claims 1
- 230000005612 types of electricity Effects 0.000 abstract description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
居民用电安全在目前的社区管理中愈发受到重视,如何迅速对用电人群用电情况类型进行识别,通过大数据,智能化的方法迅速识别用电风险群体用户的需求在近年来也愈发增加。本发明公开了一种通过运用聚类分析的方式,根据实时的电力负荷情况来识别居民用电安全隐患的系统及方法,主要包括居民用电情况rank‑sum寻找特征值,聚类分析以及识别模型建立。
Description
技术领域
本发明涉及电力大数据应用领域,具体涉及一种基于聚类分析归类居民用电情况的系统及方法。
背景技术
居民用电安全在目前的社区管理中愈发受到重视,如何迅速对用电人群用电情况类型进行识别,通过大数据,智能化的方法迅速识别用电风险群体用户的需求在近年来也愈发增加。运用用电负荷数据对居民用电安全进行监测和管理在近年来的社区管理中越来越多的被应用,对于识别出的用电安全隐患或特殊情况,如何进行分类管理也越来越成为社区管理中的课题。群租房,独居老人,社区作坊等在特定时刻的非规律性用电的类别需要不同的社区管理政策,这就要求在社区管理中针对居民用电情况以及用电安全进行聚类分析,筛选归类相似类别的用户,在管理上引用不同的方法,这也可以在一定程度加大居民用电的安全性。随着智能电表在城市中的广泛推广应用,越来越多的实时用电负荷数据被供电方很好的收集到,应用这些实时的用电负荷数据的分析可以建立起用户的用电情况画像。在社区的尺度中,这些用户特征的画像的聚类分析,将帮助社区管理者更好的进行用电安全管理。本发明旨在通过对实时的用电负荷数据,运用多种数理统计的模型来识别用户用电特征,分类用户用电情况,为城市管理者及供电,用电方对居民用电的综合管理提出决策性的意见。
发明内容
本发明提出了一种基于电力负荷数据聚类分析居民用电情况的系统及方法,其主要的应用在于在分类用户用电特征,识别潜在用电风险。整个过程包括了数据收集模块,数据Rank-sum排序模块, 聚类分析模块以及识别报告模块,如图1所示。电力负荷数据收集模块通常通过智能电表等终端设备采集, 存储并处理原始居民用电负荷数据,并对这些数据进行分析, 整合, 校正, 填补缺失值, 以及标准化处理。Rank-Sum排序模块将电力负荷数据根据负荷大小或其他参数进行排序后求和,对每一位居民用户求出时间段用电特征值。聚类分析分析模块主要运用k-means模型,通过计算K均值,使用误差平方和(Sum ofthe Squared Error,SSE)作为聚类的目标函数,寻找最小的SSE,将不同居民用电情况分类。识别类别用电类型模块根据已经分类完成的几类用户情况,通过历史情况比对,现场调研等方式,确定报告用电异常用户。
附图说明
图1是本发明实施中居民用电安全聚类分析模块的流程图。
具体实施方式
步骤一、数据收集模块:居民电表将被居民用电负荷将采集于,收集的用电负荷数据将根据电表序列针对每一户居民编号。用电负荷数据将根据采集不同采集频率进行初步处理,求和或再分配为小时,30分钟,15分钟等不同时间段颗粒度的用电负荷值。原始数据缺失的情况,将使用平均值,中位数或移动平均等方法补全缺失用电值以保证数据的完整性,通过Shaprio-Wilk检验或Kolmogorov-Smirnov检验法检验数据的离散情况及是否正态分布,如果数据之间偏差过大,将对原始数据进行标准化处理。
步骤二、根据步骤一得的处理后的用电负荷数对每个居民用户一个设置期间T1(24小时)内每一个固定时间段T2(15分钟,30分钟,1小时)内的用电数据进行排序,并将排序数据在一段时间T3内(周,双周,月)对每一个固定时间段T2的轶值求和,得出T1 (24小时)内的轶和特征值分布(分布精度为T2)。居民用户的用电轶和特征值将被集合为统一数据集以用于下一步聚类分析。
步骤三、根据步骤二中所取得的处理后的所有居民用户的用电轶和特征值带入K-means聚类分析,主要遵循以下几个子步骤
1)根据居民用户数量及数据均值等,随机选定K簇核心值(质心),构成核心值矩阵,表达为:
,C是所有K簇核心值(质心)矩阵,并根据后续结果迭代计算;
2)通过计算每个用户用电轶和特征值与每个设定的质心之间的欧几里得(L2)距离来分配用户至不同的簇。
,其中Ci是第i位的选定质心值,x为用户在统计时段的用户特征值,dist()是特纸值与质心之间距离。欧几里得距离计算方式为:
计算x到ci的球形几何距离;
3)通过获取分配给该聚合簇中的所有点的平均值来迭代设定新的质心值,
4)重复子步骤2)3)直到所有群集分配都不在进行变化为止,由具体数据情况判断最后分成的类别总数。通过计算SSE值,最小化优化计算SSE来保证分类完整可靠,记录SSE值,值计算方式为:
其中Ci是第i位的选定质心值,x为用户在统计时段的用户特征值,SSE值统计意义为总的观察值与质心之间距离的误差平方和。
步骤四、通过步骤三的K-means聚类分析结果,可对用户进行组别编号,按同一类别用户计算平均轶和特征值的小时分布情况,进行类别群体用户代表性用电情况特征画像,以供后续调研分析以及用电安全管理。
本发明通过对用电负荷的深度数据分析挖掘,提出了一种轶和排序与K-means聚类分析连用的方式针对一个社区区域内同一类别用电情况的用户进行聚类,并建立群体代表性用电情况画像,将在规模化管理特定区域的用电安全情况有十分多的应用,并在很大程度上节省相关人员工作量与筛查速率,将改善行政管理和用电安全的效率。
Claims (1)
1.一种居民用电数据挖掘中应用聚类分析归类居民用电情况的系统和方法,其特征在于,包括:
步骤一、数据收集模块:对被居民电表收集的用电负荷数据将根据电表序列针对每一户居民编号,用电负荷数据将根据采集不同采集频率进行初步处理,分为1小时,30分钟,15分钟三种不同时间段颗粒度用电负荷值,原始数据缺失的情况,将使用平均值,中位数和移动平均方法补全缺失用电值以保证数据的完整性,通过Shaprio-Wilk检验或Kolmogorov-Smirnov检验法检验数据的离散情况及是否正态分布,如果数据之间偏差过大,将对原始数据进行标准化处理;
步骤二、根据步骤一得的处理后的用电负荷数对每个居民用户一个设置期间T1内每一个固定时间段T2内的用电数据进行排序,并将排序数据在一段时间T3内对每一个固定时间段T2的秩值求和,得出设置期间T1内的秩和特征值分布,居民用户的用电秩和特征值将被集合为统一数据集以用于下一步聚类分析;其中,设置期间T1为24小时,固定时间段T2包括15分钟、30分钟和1小时,时间T3包括周、双周和月;
步骤三、根据步骤二中所取得的处理后的所有居民用户的用电秩和特征值带入K-means聚类分析,主要遵循以下几个子步骤
经过处理后的所有居民用户的用电秩值带入K-means聚类分析,主要遵循以下几个子步骤
1)根据居民用户数量及数据均值,随机选定K簇核心值,即质心值,构成核心值矩阵,表达为:
C=C1,C2,...,C2,
C是所有K簇核心值构成的质心矩阵,并根据后续结果迭代计算;
2)通过计算每个用户用电秩和特征值与每个设定的质心之间的欧几里得距离L2来分配
用户至不同的簇,
其中Ci是第i位的选定质心值,x为用户在统计时段的用户特征值,dist()是特征值与质心之间距离,
欧几里得距离计算方式为:
计算x到ci的球形几何距离;
3)通过获取分配给该聚合簇中的所有点的平均值来迭代设定新的质心值,
其中Si是对ith簇中点的集合;
4)重复子步骤2)3)直到所有群集分配都不再进行变化为止,由具体数据情况判断最后分成的类别总数;
通过计算SSE值,最小化优化计算SSE来保证分类完整可靠,记录SSE值,值计算方式为:
其中Cj是第i位的选定质心值,x为用户在统计时段的用户特征值,SSE值统计意义为总的观察值与质心之间距离的误差平方和;
步骤四、通过步骤三的K-means聚类分析结果,可对用户进行组别编号,按同一类别用户计算平均秩和特征值的小时分布情况,进行类别群体用户代表性电情况特征画像,以供后续调研分析以及用电安全管理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911105180.9A CN110826641B (zh) | 2019-11-13 | 2019-11-13 | 一种基于聚类分析归类居民用电情况的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911105180.9A CN110826641B (zh) | 2019-11-13 | 2019-11-13 | 一种基于聚类分析归类居民用电情况的系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110826641A CN110826641A (zh) | 2020-02-21 |
CN110826641B true CN110826641B (zh) | 2023-07-07 |
Family
ID=69554682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911105180.9A Active CN110826641B (zh) | 2019-11-13 | 2019-11-13 | 一种基于聚类分析归类居民用电情况的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110826641B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506635A (zh) * | 2020-05-11 | 2020-08-07 | 上海积成能源科技有限公司 | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 |
CN112396087B (zh) * | 2020-09-28 | 2024-04-26 | 国网浙江省电力有限公司杭州供电公司 | 基于智能电表的独居老人用电数据分析方法及装置 |
CN112906736A (zh) * | 2021-01-13 | 2021-06-04 | 国网山东省电力公司日照供电公司 | 一种基于住户用电量的社区安全精准管控方法和系统 |
CN112906790B (zh) * | 2021-02-20 | 2023-08-18 | 国网江苏省电力有限公司营销服务中心 | 一种基于用电数据的独居老人识别方法和系统 |
CN113377760A (zh) * | 2021-07-06 | 2021-09-10 | 国网江苏省电力有限公司营销服务中心 | 基于电力数据和多元数据建立低压居民特征画像的方法和系统 |
CN117787572B (zh) * | 2024-02-27 | 2024-05-17 | 国网山西省电力公司临汾供电公司 | 一种异常用电用户识别方法、装置、存储介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730046A (zh) * | 2017-10-23 | 2018-02-23 | 上海积成能源科技有限公司 | 一种电力短期负荷预测系统及方法 |
CN107895211A (zh) * | 2017-11-27 | 2018-04-10 | 上海积成能源科技有限公司 | 一种基于大数据的中长期电力负荷预测方法和系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573947A (zh) * | 2014-12-29 | 2015-04-29 | 国家电网公司 | 区域智能配电网低压台区综合评价方法 |
CN106096805A (zh) * | 2016-05-10 | 2016-11-09 | 华北电力大学 | 一种基于熵权法特征选择的居民用电负荷分类方法 |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN106548301B (zh) * | 2016-11-30 | 2020-11-03 | 南方电网科学研究院有限责任公司 | 电力用户聚类方法及装置 |
CN108460410A (zh) * | 2018-02-08 | 2018-08-28 | 合肥工业大学 | 居民需求侧的用电模式识别方法和系统、存储介质 |
CN108830324A (zh) * | 2018-06-20 | 2018-11-16 | 国网上海市电力公司 | 一种基于数据挖掘技术的公共建筑用电异常判别方法 |
CN109634940A (zh) * | 2018-11-12 | 2019-04-16 | 国网天津市电力公司电力科学研究院 | 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法 |
-
2019
- 2019-11-13 CN CN201911105180.9A patent/CN110826641B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730046A (zh) * | 2017-10-23 | 2018-02-23 | 上海积成能源科技有限公司 | 一种电力短期负荷预测系统及方法 |
CN107895211A (zh) * | 2017-11-27 | 2018-04-10 | 上海积成能源科技有限公司 | 一种基于大数据的中长期电力负荷预测方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110826641A (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110826641B (zh) | 一种基于聚类分析归类居民用电情况的系统及方法 | |
CN110689279B (zh) | 一种居民用电安全隐患的分析方法 | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN106780121B (zh) | 一种基于用电负荷模式分析的用电异常识别方法 | |
CN106022509B (zh) | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 | |
CN111680764B (zh) | 一种行业复工复产程度监控方法 | |
CN111624931B (zh) | 工业园区用电互联网智能运维管控系统及其方法 | |
CN111724278A (zh) | 一种面向电力多元负荷用户的精细分类方法及系统 | |
CN111680937B (zh) | 基于电力数据分级赋权的小微企业复工率评估方法 | |
CN111784093B (zh) | 一种基于电力大数据分析的企业复工辅助判断方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN110378510B (zh) | 一种基于时间序列和层次聚合的配网物资需求预测方法 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 | |
CN117611015B (zh) | 一种建筑工程质量实时监测系统 | |
CN111626614A (zh) | 一种基于电费回收的用户分类方法 | |
CN113191585A (zh) | 一种输电线路的台风致灾风险评估方法 | |
CN112668821A (zh) | 一种基于风沙区域绝缘子故障概率的配电线路风险分析方法 | |
CN116467648A (zh) | 一种基于物联表的非线性台区电力故障的早期监测方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN111612054A (zh) | 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN112765549B (zh) | 一种用于修复建筑能耗监测异常数据的KNN-Matrix方法 | |
CN114897097A (zh) | 一种电力用户画像方法、装置、设备及介质 | |
CN113902485A (zh) | 一种专变电力用户行业识别方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |