CN113723671B - 一种基于用电情况大数据的数据聚类分析方法 - Google Patents
一种基于用电情况大数据的数据聚类分析方法 Download PDFInfo
- Publication number
- CN113723671B CN113723671B CN202110934458.4A CN202110934458A CN113723671B CN 113723671 B CN113723671 B CN 113723671B CN 202110934458 A CN202110934458 A CN 202110934458A CN 113723671 B CN113723671 B CN 113723671B
- Authority
- CN
- China
- Prior art keywords
- data
- electricity
- user
- users
- consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 242
- 238000004458 analytical method Methods 0.000 title claims abstract description 33
- 230000002159 abnormal effect Effects 0.000 claims abstract description 36
- 230000002776 aggregation Effects 0.000 claims abstract description 22
- 238000004220 aggregation Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000013500 data storage Methods 0.000 claims abstract description 14
- 238000012544 monitoring process Methods 0.000 claims abstract description 9
- 238000007621 cluster analysis Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims abstract description 4
- 238000007418 data mining Methods 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000011835 investigation Methods 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 230000004069 differentiation Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 5
- 238000001914 filtration Methods 0.000 abstract description 3
- 230000006872 improvement Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 4
- 238000009833 condensation Methods 0.000 description 3
- 230000005494 condensation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于用电情况大数据的数据聚类分析方法,包括以下步骤:大数据采集、无用数据筛除、有用数据存储、数据样本聚类、聚合类数据对比和分析结论输出;本发明通过对用户用电数据进行大数据采集,使数据采集来源更为丰富,有助于对用户进行差异化分析,同时提高了数据挖掘效率,通过将大数据集进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确,同时通过对存在异常用电行为的用户进行监测预警,从而使电力系统的安全性得到提高,通过对用电数据进行动态分配,提高了数据的读取和存储效率,并通过对用电数据进行聚类计算分析,使用户用电情况得到精确有效的分析和预测。
Description
技术领域
本发明涉及电力系统数据分析技术领域,尤其涉及一种基于用电情况大数据的数据聚类分析方法。
背景技术
随着传感技术、自动化控制技术、通信网络技术、分布式存储技术、大数据分析和人工智能技术的发展,以及社会经济和环境需求的巨大推动,电网也将真正实现与互联网的深度融合,发展“智能电网”是电力行业的必然发展趋势,电力系统规模日趋增大,电网结构日益复杂,系统故障引发后果越发严重国内外多次大停电事故造成了巨大的经济损失和恶劣的社会影响,新一轮的用电增长引发的问题和矛盾严重威胁到电力系统的安全运营,目前居民用户、商业用户和工业用户是主要的用电群体,而随着智能电网技术的快速发展,电网信息化程度不断提高,用户用电数据也飞速增长;
目前,由于用电用户分布范围广、用电数据量大,导致对电力系统的用电数据分析变得尤为重要,精准有效的用电数据分析可以给电力系统的管理带来质的飞跃,而传统的用电情况分析方法大都不够精准有效,主要原因使数据挖掘效率低,针对海量的用电数据无能为力,且不能对采集的数据中的无效数据进行筛除并对异常数据进行监测预警,从而使分析结果存在较大的误差,另外传统的分析方法对数据的存储和读取效率也较低,最后导致不能对用户的用电情况进行准确有效的分析和预测,一定程度上对电力系统的发展带来了阻碍,因此,本发明提出一种基于用电情况大数据的数据聚类分析方法以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出一种基于用电情况大数据的数据聚类分析方法,该方法通过对用户用电数据进行大数据采集,使数据采集来源更为丰富,有助于对用户进行差异化分析,同时提高了数据挖掘效率,通过将大数据集进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确。
为了实现本发明的目的,本发明通过以下技术方案实现:一种基于用电情况大数据的数据聚类分析方法,包括以下步骤:
步骤一:大数据采集
选择规定区域内所有用电用户作为采集对象,先对作为采集对象的用电用户的档案信息数据进行采集,再选定一个历史时间区间,并对该部分用电用户在该历史时间区间的用电数据进行信息采集,同时利用电流传感器和电压传感器对用户的实时用电数据进行实时监测,所述电流传感器和电压传感器预设在用电用户的电表内,然后将用电用户的档案信息数据和历史用电数据进行汇总,得到由所有用电用户的档案信息数据和历史用电数据组成的大数据集;
步骤二:无用数据筛除
根据步骤一,先对大数据集中的无用用电数据进行筛除,所述无用用电数据为无功率变化的用电数据,接着确定用电用户的理论上的标准用电数据值,再将大数据集中的用电用户历史用电数据与用电用户标准用电数据进行比较,其中与用电用户标准用电数据差距超过标准值的作为异常用电行为数据,与用电用户标准用电数据差距在标准值内的作为有用用电数据,并对得到的异常用电行为进行筛选标记,对得到的有用用电数据进行保留;
步骤三:有用数据存储
根据步骤二,先将保留下来的有用用电数据备份为两组以上的数据副本,接着利用负载均衡机制将与数据副本数量匹配的存储任务动态分发至不同的数据存储节点上,然后将利用不同的数据存储节点对对应的数据副本进行动态存储,得到用电用户的用电数据样本;
步骤四:数据样本聚类
根据步骤三,选定用于聚类的不同样本特征,利用聚类算法,根据样本特征相似性对用户用电数据样本进行计算分析,并根据分析出的结果将用户用电数据样本分为规定数量的数据聚合类;
步骤五:聚合类数据对比
根据步骤四,将样本特征不同的聚合类数据进行对比,分析出不同聚合类数据中用户的用电情况受不同因素影响的规律;
步骤六:分析结论输出
根据步骤五,先依据分析出的用户用电情况和规律预测不同用户的用电模式和用电水平,再根据不同用户的用电模式和用电水平为用户制定对应的供电和用电策略。
进一步改进在于:所述步骤一中,所述用户的档案信息数据包括用户用行业类别、用户用电类别和电气设备类别,所述用户的档案信息数据通过供电公司获取。
进一步改进在于:所述步骤一中,所述用户的历史用电数据包括用电功率、用电电压和用电电流,所述用户的历史用电数据通过智能电表采集。
进一步改进在于:所述步骤一中,所述采集对象的分布范围位于同一个城市内,所述规定时间区间大于30天。
进一步改进在于:所述步骤二中,所述用电用户的异常用电行为包括用户用电设备的漏电危险和用户的偷电行为,得到用户异常用电行为数据后对该用户的实时用电数据进行监测,实时判断该用户的用电行为是否存在危险和违规,并根据判断结果进行预警提示和追踪调查。
进一步改进在于:所述步骤二中,所述用户标准用电数据为用户无异常用电行为的用电数据,通过用户的档案信息数据计算和预估得到。
进一步改进在于:所述步骤四中,对存储的有用用电数据进行聚类前先对用电数据的负荷单位和时间单位进行统一,使用电数据得到规整并同一规格。
进一步改进在于:所述步骤四中,所述用户用电数据的样本特征包括用户用电功率、用户用电电压、用户用电种类和用户用电时间,所述聚类算法选自K-means聚类算法和凝聚型层次聚类算法中的一种。
进一步改进在于:所述步骤五中,所述不同因素包括昼夜时间因素、温度变化因素、用户行业类别因素和电气设备类别因素。
进一步改进在于:所述步骤六中,所述供电和用电策略包括将用户按用电量进行层次划分,并根据用户用的电高峰时间和低谷时间调整阶梯电价。
本发明的有益效果为:
1、通过对用户用电数据进行大数据采集,使数据采集来源更为丰富,有助于对用户进行差异化分析,相比传统数据采集使数据更具代表性,同时提高了数据挖掘效率,可以应用于海量的用户数据采集分析;
2、通过将大数据集中的无用用电数据进行筛除,异常用电行为进行筛选标记,并将有用用电数据进行保留,从而使采集的用户用电数据进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确,同时通过对存在异常用电行为的用户进行监测预警,从而使电力系统的安全性得到提高,杜绝了用户的违规用电行为;
3、通过对有用用电数据进行备份并利用负载均衡机制对有用用电数据进行动态任务分配和存储,不仅提高了数据的读取和存储效率,同时通过将数据多组副本存储到不同存储节点上还保证了数据的可靠性,并通过对用电数据进行聚类计算分析,使用户用电情况得到精确有效的分析和预测,具有广泛的工业应用需求和重要的社会应用价值,有助于电力系统的发展。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的分析方法流程图;
图2是本发明的步骤一流程图;
图3是本发明的步骤二流程图;
图4是本发明的步骤三流程图;
图5是本发明的步骤四流程图;
图6是本发明的步骤五流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”、“第四”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例一
参见图1、2、3、4、5、6,本实施例提供了一种基于用电情况大数据的数据聚类分析方法,包括以下步骤:
步骤一:大数据采集
选择规定区域内所有用电用户作为采集对象,先对作为采集对象的用电用户的档案信息数据进行采集,再选定一个历史时间区间,并对该部分用电用户在该历史时间区间的用电数据进行信息采集,同时利用电流传感器和电压传感器对用户的实时用电数据进行实时监测,所述电流传感器和电压传感器预设在用电用户的电表内,然后将用电用户的档案信息数据和历史用电数据进行汇总,得到由所有用电用户的档案信息数据和历史用电数据组成的大数据集,其中,所述用户的档案信息数据包括用户用行业类别、用户用电类别和电气设备类别,所述用户的档案信息数据通过供电公司获取,所述用户的历史用电数据包括用电功率、用电电压和用电电流,所述用户的历史用电数据通过智能电表采集,所述采集对象的分布范围位于同一个城市内,所述规定时间区间大于30天,通过对用户用电数据进行大数据采集,使数据采集来源更为丰富,有助于对用户进行差异化分析,相比传统数据采集使数据更具代表性,同时提高了数据挖掘效率,可以应用于海量的用户数据采集分析;
步骤二:无用数据筛除
通过用户的档案信息数据计算和预估得到用户无异常用电行为的用电数据作为用户标准用电数据,先对大数据集中的无用用电数据进行筛除,所述无用用电数据为无功率变化的用电数据,接着确定用电用户的理论上的标准用电数据值,再将大数据集中的用电用户历史用电数据与用电用户标准用电数据进行比较,其中与用电用户标准用电数据差距超过标准值的作为异常用电行为数据,与用电用户标准用电数据差距在标准值内的作为有用用电数据,并对得到的异常用电行为进行筛选标记,对得到的有用用电数据进行保留,其中,用电用户的异常用电行为包括用户用电设备的漏电危险和用户的偷电行为,得到用户异常用电行为数据后对该用户的实时用电数据进行监测,实时判断该用户的用电行为是否存在危险和违规,并根据判断结果进行预警提示和追踪调查,通过将大数据集中的无用用电数据进行筛除,异常用电行为进行筛选标记,并将有用用电数据进行保留,从而使采集的用户用电数据进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确,同时通过对存在异常用电行为的用户进行监测预警,从而使电力系统的安全性得到提高,杜绝了用户的违规用电行为;
步骤三:有用数据存储
根据步骤二,先将保留下来的有用用电数据备份为两组以上的数据副本,接着利用负载均衡机制将与数据副本数量匹配的存储任务动态分发至不同的数据存储节点上,然后将利用不同的数据存储节点对对应的数据副本进行动态存储,得到用电用户的用电数据样本,通过对有用用电数据进行备份并利用负载均衡机制对有用用电数据进行动态任务分配和存储,不仅提高了数据的读取和存储效率,同时通过将数据多组副本存储到不同存储节点上还保证了数据的可靠性;
步骤四:数据样本聚类
先对用电数据的负荷单位和时间单位进行统一,使用电数据得到规整并同一规格,选定用于聚类的不同样本特征,利用K-means聚类算法,根据样本特征相似性对用户用电数据样本进行计算分析,并根据分析出的结果将用户用电数据样本分为规定数量的数据聚合类,其中,用户用电数据的样本特征包括用户用电功率、用户用电电压、用户用电种类和用户用电时间,通过K-means聚类算法将数据按不同样本特征和样本特征相似性分为不同数据聚合类,从而便于在用电数据中寻找隐含的数据分布模式及关联规则,以便于有效地进行数据对比分析,以及对用电情况做出预测;
步骤五:聚合类数据对比
根据步骤四,将样本特征不同的聚合类数据进行对比,分析出不同聚合类数据中用户的用电情况受昼夜时间因素、温度变化因素、用户行业类别因素和电气设备类别因素影响的规律,通过对用电数据聚合类进行对比分析并得出用户的用电情况规律,从而便于根据用户的用电情况为不同用电用户提供差异化服务和相应的用电调整;
步骤六:分析结论输出
根据步骤五,先依据分析出的用户用电情况和规律预测不同用户的用电模式和用电水平,再根据不同用户的用电模式和用电水平为用户制定对应的供电和用电策略,包括将用户按用电量进行层次划分,并根据用户用的电高峰时间和低谷时间调整阶梯电价,通过对不同用电用户指定对应供电和用电策略,从而使电力系统的用电和供电管理便于调整和改善,并可以妥善规划电力系统的建设和发展,具有广泛的工业应用需求和重要的社会应用价值。
实施例二
参见图1、2、3、4、5、6,本实施例提供了一种基于用电情况大数据的数据聚类分析方法,包括以下步骤:
步骤一:大数据采集
选择规定区域内所有用电用户作为采集对象,先对作为采集对象的用电用户的档案信息数据进行采集,再选定一个历史时间区间,并对该部分用电用户在该历史时间区间的用电数据进行信息采集,同时利用电流传感器和电压传感器对用户的实时用电数据进行实时监测,所述电流传感器和电压传感器预设在用电用户的电表内,然后将用电用户的档案信息数据和历史用电数据进行汇总,得到由所有用电用户的档案信息数据和历史用电数据组成的大数据集,其中,所述用户的档案信息数据包括用户用行业类别、用户用电类别和电气设备类别,所述用户的档案信息数据通过供电公司获取,所述用户的历史用电数据包括用电功率、用电电压和用电电流,所述用户的历史用电数据通过智能电表采集,所述采集对象的分布范围位于同一个城市内,所述规定时间区间大于30天,通过对用户用电数据进行大数据采集,使数据采集来源更为丰富,有助于对用户进行差异化分析,相比传统数据采集使数据更具代表性,同时提高了数据挖掘效率,可以应用于海量的用户数据采集分析;
步骤二:无用数据筛除
通过用户的档案信息数据计算和预估得到用户无异常用电行为的用电数据作为用户标准用电数据,先对大数据集中的无用用电数据进行筛除,所述无用用电数据为无功率变化的用电数据,接着确定用电用户的理论上的标准用电数据值,再将大数据集中的用电用户历史用电数据与用电用户标准用电数据进行比较,其中与用电用户标准用电数据差距超过标准值的作为异常用电行为数据,与用电用户标准用电数据差距在标准值内的作为有用用电数据,并对得到的异常用电行为进行筛选标记,对得到的有用用电数据进行保留,其中,用电用户的异常用电行为包括用户用电设备的漏电危险和用户的偷电行为,得到用户异常用电行为数据后对该用户的实时用电数据进行监测,实时判断该用户的用电行为是否存在危险和违规,并根据判断结果进行预警提示和追踪调查,通过将大数据集中的无用用电数据进行筛除,异常用电行为进行筛选标记,并将有用用电数据进行保留,从而使采集的用户用电数据进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确,同时通过对存在异常用电行为的用户进行监测预警,从而使电力系统的安全性得到提高,杜绝了用户的违规用电行为;
步骤三:有用数据存储
根据步骤二,先将保留下来的有用用电数据备份为两组以上的数据副本,接着利用负载均衡机制将与数据副本数量匹配的存储任务动态分发至不同的数据存储节点上,然后将利用不同的数据存储节点对对应的数据副本进行动态存储,得到用电用户的用电数据样本,通过对有用用电数据进行备份并利用负载均衡机制对有用用电数据进行动态任务分配和存储,不仅提高了数据的读取和存储效率,同时通过将数据多组副本存储到不同存储节点上还保证了数据的可靠性;
步骤四:数据样本聚类
先对用电数据的负荷单位和时间单位进行统一,使用电数据得到规整并同一规格,选定用于聚类的不同样本特征,利用凝聚型层次聚类算法,根据样本特征相似性对用户用电数据样本进行有效分析,并根据分析出的结果将用户用电数据样本分为规定数量的数据聚合类,其中,用户用电数据的样本特征包括用户用电功率、用户用电电压、用户用电种类和用户用电时间,通过凝聚型层次聚类算法将数据按不同样本特征和样本特征相似性分为不同数据聚合类,从而便于在用电数据中寻找隐含的数据分布模式及关联规则,以便于有效地进行数据对比分析,以及对用电情况做出预测;
步骤五:聚合类数据对比
根据步骤四,将样本特征不同的聚合类数据进行对比,分析出不同聚合类数据中用户的用电情况受昼夜时间因素、温度变化因素、用户行业类别因素和电气设备类别因素影响的规律,通过对用电数据聚合类进行对比分析并得出用户的用电情况规律,从而便于根据用户的用电情况为不同用电用户提供差异化服务和相应的用电调整;
步骤六:分析结论输出
根据步骤五,先依据分析出的用户用电情况和规律预测不同用户的用电模式和用电水平,再根据不同用户的用电模式和用电水平为用户制定对应的供电和用电策略,包括将用户按用电量进行层次划分,并根据用户用的电高峰时间和低谷时间调整阶梯电价,通过对不同用电用户指定对应供电和用电策略,从而使电力系统的用电和供电管理便于调整和改善,并可以妥善规划电力系统的建设和发展,具有广泛的工业应用需求和重要的社会应用价值
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1. 一种基于用电情况大数据的数据聚类分析方法,其特征在于:包括以下步骤:
步骤一:大数据采集
选择规定区域内所有用电用户作为采集对象,先对作为采集对象的用电用户的档案信息数据进行采集,再选定一个历史时间区间,并对该部分用电用户在该历史时间区间的用电数据进行信息采集,同时利用电流传感器和电压传感器对用户的实时用电数据进行实时监测,所述电流传感器和电压传感器预设在用电用户的电表内,然后将用电用户的档案信息数据和历史用电数据进行汇总,得到由所有用电用户的档案信息数据和历史用电数据组成的大数据集;
所述用户的档案信息数据包括用户用行业类别、用户用电类别和电气设备类别,所述用户的档案信息数据通过供电公司获取,所述用户的历史用电数据包括用电功率、用电电压和用电电流,所述用户的历史用电数据通过智能电表采集,所述采集对象的分布范围位于同一个城市内,所述历史时间区间大于30天,通过对用户用电数据进行大数据采集,使数据采集来源丰富,有助于对用户进行差异化分析,相比传统数据采集使数据更具代表性,同时提高了数据挖掘效率;
步骤二:无用数据筛除
根据步骤一,先对大数据集中的无用用电数据进行筛除,所述无用用电数据为无功率变化的用电数据,接着确定用电用户的理论上的标准用电数据值,再将大数据集中的用电用户历史用电数据与用电用户标准用电数据进行比较,其中与用电用户标准用电数据差距超过标准值的作为异常用电行为数据,与用电用户标准用电数据差距在标准值内的作为有用用电数据,并对得到的异常用电行为进行筛选标记,对得到的有用用电数据进行保留;
用电用户的异常用电行为包括用户用电设备的漏电危险和用户的偷电行为,得到用户异常用电行为数据后对该用户的实时用电数据进行监测,实时判断该用户的用电行为是否存在危险和违规,并根据判断结果进行预警提示和追踪调查,通过将大数据集中的无用用电数据进行筛除,异常用电行为进行筛选标记,并将有用用电数据进行保留,从而使采集的用户用电数据进行合理有效的过滤,从而降低了数据误差,使用电情况的分析结果更为精确,同时通过对存在异常用电行为的用户进行监测预警,从而使电力系统的安全性得到提高,杜绝了用户的违规用电行为;
所述用户标准用电数据为用户无异常用电行为的用电数据,通过用户的档案信息数据计算和预估得到;
步骤三:有用数据存储
根据步骤二,先将保留下来的有用用电数据备份为两组以上的数据副本,接着利用负载均衡机制将与数据副本数量匹配的存储任务动态分发至不同的数据存储节点上,然后将利用不同的数据存储节点对对应的数据副本进行动态存储,得到用电用户的用电数据样本;
通过对有用用电数据进行备份并利用负载均衡机制对有用用电数据进行动态任务分配和存储,不仅提高了数据的读取和存储效率,同时通过将数据多组副本存储到不同存储节点上,保证了数据的可靠性;
步骤四:数据样本聚类
根据步骤三,选定用于聚类的不同样本特征,利用聚类算法,根据样本特征相似性对用户用电数据样本进行计算分析,并根据分析出的结果将用户用电数据样本分为规定数量的数据聚合类;
用户用电数据的样本特征包括用户用电功率、用户用电电压、用户用电种类和用户用电时间,通过K-means聚类算法将数据按不同样本特征和样本特征相似性分为不同数据聚合类,从而便于在用电数据中寻找隐含的数据分布模式及关联规则,以便于有效地进行数据对比分析,以及对用电情况做出预测;
对存储的有用用电数据进行聚类前先对用电数据的负荷单位和时间单位进行统一,使用电数据得到规整并同一规格;
步骤五:聚合类数据对比
根据步骤四,将样本特征不同的聚合类数据进行对比,分析出不同聚合类数据中用户的用电情况受不同因素影响的规律;
将样本特征不同的聚合类数据进行对比,分析出不同聚合类数据中用户的用电情况受昼夜时间因素、温度变化因素、用户行业类别因素和电气设备类别因素影响的规律,通过对用电数据聚合类进行对比分析并得出用户的用电情况规律,从而便于根据用户的用电情况为不同用电用户提供差异化服务和相应的用电调整;
步骤六:分析结论输出
根据步骤五,先依据分析出的用户用电情况和规律预测不同用户的用电模式和用电水平,再根据不同用户的用电模式和用电水平为用户制定对应的供电和用电策略;
将用户按用电量进行层次划分,并根据用户用的电高峰时间和低谷时间调整阶梯电价,通过对不同用电用户指定对应供电和用电策略,从而使电力系统的用电和供电管理便于调整和改善,并可以妥善规划电力系统的建设和发展,具有广泛的工业应用需求和重要的社会应用价值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934458.4A CN113723671B (zh) | 2021-08-16 | 2021-08-16 | 一种基于用电情况大数据的数据聚类分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110934458.4A CN113723671B (zh) | 2021-08-16 | 2021-08-16 | 一种基于用电情况大数据的数据聚类分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113723671A CN113723671A (zh) | 2021-11-30 |
CN113723671B true CN113723671B (zh) | 2024-03-19 |
Family
ID=78675929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110934458.4A Active CN113723671B (zh) | 2021-08-16 | 2021-08-16 | 一种基于用电情况大数据的数据聚类分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723671B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114118302A (zh) * | 2022-01-25 | 2022-03-01 | 全球能源互联网研究院有限公司 | 一种电能表串表识别方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108471457A (zh) * | 2018-06-16 | 2018-08-31 | 温州职业技术学院 | 基于分布式节点动态存储负载均衡方法 |
CN108765194A (zh) * | 2018-05-29 | 2018-11-06 | 深圳源广安智能科技有限公司 | 一种有效的居民用电行为分析系统 |
CN109753989A (zh) * | 2018-11-18 | 2019-05-14 | 韩霞 | 基于大数据与机器学习的电力用户窃电行为分析方法 |
CN111652313A (zh) * | 2020-06-04 | 2020-09-11 | 重庆东电通信技术有限公司 | 基于聚类分析的多源异构数据挖掘方法 |
CN111950620A (zh) * | 2020-08-07 | 2020-11-17 | 国网能源研究院有限公司 | 基于DBSCAN和K-means算法的用户筛选方法 |
-
2021
- 2021-08-16 CN CN202110934458.4A patent/CN113723671B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765194A (zh) * | 2018-05-29 | 2018-11-06 | 深圳源广安智能科技有限公司 | 一种有效的居民用电行为分析系统 |
CN108471457A (zh) * | 2018-06-16 | 2018-08-31 | 温州职业技术学院 | 基于分布式节点动态存储负载均衡方法 |
CN109753989A (zh) * | 2018-11-18 | 2019-05-14 | 韩霞 | 基于大数据与机器学习的电力用户窃电行为分析方法 |
CN111652313A (zh) * | 2020-06-04 | 2020-09-11 | 重庆东电通信技术有限公司 | 基于聚类分析的多源异构数据挖掘方法 |
CN111950620A (zh) * | 2020-08-07 | 2020-11-17 | 国网能源研究院有限公司 | 基于DBSCAN和K-means算法的用户筛选方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113723671A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN113267692B (zh) | 一种低压台区线损智能诊断分析方法和系统 | |
Lei et al. | A dynamic anomaly detection method of building energy consumption based on data mining technology | |
CN110264107B (zh) | 一种基于大数据技术的台区线损率异常诊断方法 | |
US20190369570A1 (en) | System and method for automatically detecting anomalies in a power-usage data set | |
CN110782153A (zh) | 一种企业园区综合能效评估体系建模方法及系统 | |
CN113673580A (zh) | 基于大数据建模的窃电嫌疑判断方法 | |
CN111310854A (zh) | 基于用电负荷指纹的低误报率窃电检测二次筛选方法 | |
CN108828375B (zh) | 基于双回路智能电能表的空调用电监控系统及监控方法 | |
CN113723671B (zh) | 一种基于用电情况大数据的数据聚类分析方法 | |
CN111552686A (zh) | 一种电力数据质量评估方法及其装置 | |
CN115792370A (zh) | 一种基于智能电表的用能诊断方法、装置和设备 | |
CN116301128A (zh) | 一种基于人工智能算法的楼宇智慧运维系统 | |
CN116522746A (zh) | 高耗能企业配电托管方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN114878934A (zh) | 一种电能耗数据异常预警方法 | |
CN115798155A (zh) | 一种天然气计量分析系统 | |
CN114723223A (zh) | 基于旭日图的电表健康度分析展示方法及装置 | |
CN111476397A (zh) | 应用于中长期电量安全校核的母线负荷预测方法及系统 | |
CN108108665B (zh) | 一种基于多变量的燃气调压器安全预警方法 | |
CN113642933A (zh) | 一种配电台区低电压诊断方法及装置 | |
CN117196120A (zh) | 一种用户用水行为分析算法 | |
CN112649696A (zh) | 电网异常状态识别方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN111144628A (zh) | 一种分布式供能的冷热电负荷预测模型系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |