CN112711616A - 一种基于聚类算法的用户用电特性分析方法 - Google Patents
一种基于聚类算法的用户用电特性分析方法 Download PDFInfo
- Publication number
- CN112711616A CN112711616A CN201911022557.4A CN201911022557A CN112711616A CN 112711616 A CN112711616 A CN 112711616A CN 201911022557 A CN201911022557 A CN 201911022557A CN 112711616 A CN112711616 A CN 112711616A
- Authority
- CN
- China
- Prior art keywords
- clustering
- load
- typical
- user
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 18
- 230000005611 electricity Effects 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000012512 characterization method Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000003064 k means clustering Methods 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 3
- 230000003042 antagnostic effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000005612 types of electricity Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005485 electric heating Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明一种基于聚类算法的用户用电特性分析方法,首先,通过对收集到的配网用户用电数据进行预筛和处理,得到聚类对象,然后将聚类对象按照用户地区进行分组形成从站,接着对对它们进行EDBDC聚类,采用分布式聚类来提高数据处理效率,主站和从站聚类都采用K‑means聚类算法,所有用户按照最终的聚类模型以欧式距离最小原则进行归类,形成用户画像,并绘制一年四季的典型日负荷曲线,一年四季的典型月的持续负荷曲线和年持续负荷曲线。本发明能够所建立的用户画像完整细致地展现了各类用户的用电特性并对用户用电类型进行归类,能够为配网运行和供电公司的营销策略提供指导。
Description
技术领域
本发明涉及一种用于智能配网领域的基于聚类算法的用户用电特性分析方法。
背景技术
近年来,随着电力负荷结构趋于多样化,广义负荷开始逐渐进入人们的视野。广义负荷指含有一定比例新能源电源或者分布式电源的电网,但仍然以电力负荷为主,其含量大于电源的含量。广义负荷与电网的互动关系通常是双向的,除了从电网吸收功率以外,能在特定时段向电网输送电能,广义负荷是对于传统负荷的一种拓展。在对于广义负荷特性的研究中,首先,由于广义负荷结构特殊,有着分布性和不确定性,并且广义负荷中的电源部分是传统负荷模型所无法描述的,所以传统的负荷研究方法已不再适用,其次,研究中所采集到的广义负荷用户数据量级高、实时性强,传统方法在处理这样的大数据时有效率低的问题。因此,必须找到新的能够高效处理广义负荷数据的方法来研究其变化特性。
另一方面,用户画像,这一目前主要针对互联网和移动社交领域的用户行为特性的研究方法,国内外都积累了颇为可观的研究成果。用户画像是对现实中的用户进行数学建模,这是将用户特征“可视化”的一个渠道,其核心是标签体系的建立,通过这一过程,抽象出一个用户的信息全貌,是互联网企业赖以分析掌握用户,及时调整营销策略的有力工具。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种基于聚类算法的用户用电特性分析方法,能偶在不同时间和空间尺度下将广义负荷电网中电力用户的用电特性清晰地呈现出来,为之后的建模打下基础,为企业电价制定和用户安排用电提供参考,有着重要的实用意义和广阔的应用价值。
实现上述目的一种技术方案是:一种基于聚类算法的用户用电特性分析方法,包括如下步骤:
步骤1,在特定配网范围内,通过配网用户用电数据收集系统,获取配网用户用电数据;
步骤2,对配网用户用电数据进行数据预筛和处理,形成对应每个配网用户的表征用电特性数组;
步骤3,对表征用电特性数组按照用户地区进行分组形成从站;
步骤4,对各个地区的从站进行聚类,将每个地区的聚类结果存在同一个名为center的数组中,形成二维矩阵center;
步骤5,进行主站聚类,对二维矩阵center的元素进行聚类,最终得到二维数组temp_center_final 2,以得到聚类中心;
步骤6,将步骤3中各个从站中的用户归入相应的聚类中心的组别内,任意一个组别即为一类用户特性,形成一类用户画像;
步骤7,针对每一类用户画像,绘制一年四季的典型日负荷曲线、典型月的持续负荷曲线和年持续负荷曲线。
进一步的,所述表征用电特性数组为50维用电数据,分别为下列数据:春季典型日负荷峰值、夏季典型日负荷峰值、秋季典型日负荷峰值、冬季典型日负荷峰值、春季典型日负荷峰谷差、夏季典型日负荷峰谷差、秋季典型日负荷峰谷差、冬季典型日负荷峰谷差、春季典型日白天负荷峰值、夏季典型日白天负荷峰值、秋季典型日白天负荷峰值、冬季典型日白天负荷峰值、春季典型日夜晚负荷峰值、夏季典型日夜晚负荷峰值、秋季典型日夜晚负荷峰值、冬季典型日夜晚负荷峰值、春季典型月负荷峰值、夏季典型月负荷峰值、秋季典型月负荷峰值、冬季典型月负荷峰值、春季典型月负荷峰谷差、夏季典型月负荷峰谷差、秋季典型月负荷峰谷差、冬季典型月负荷峰谷差、春季典型月负荷均值、夏季典型月负荷均值、秋季典型月负荷均值、冬季典型月负荷均值、春季典型月负荷最小值/均值、夏季典型月负荷最小值/均值、秋季典型月负荷最小值/均值、冬季典型月负荷最小值/均值、春季工作日白天负荷峰值、夏季工作日白天负荷峰值、秋季工作日白天负荷峰值、冬季工作日白天负荷峰值、春季工作日夜晚负荷峰值、夏季工作日夜晚负荷峰值、秋季工作日夜晚负荷峰值、冬季工作日夜晚负荷峰值、春季周末白天负荷峰值、夏季周末白天负荷峰值、秋季周末白天负荷峰值、冬季周末白天负荷峰值、春季周末夜晚负荷峰值、夏季周末夜晚负荷峰值、秋季周末夜晚负荷峰值、冬季周末夜晚负荷峰值、年负荷峰值和年负荷峰谷差。
进一步的,步骤2中,对配网用户用电数据进行数据预筛和处理的方法为:
步骤2.1,针对每一个用户通过判断用户ID得到该用户的数据起始点,之后把用户序号和数据起始点依次存在一个名为identifier的数组中;
步骤2.2,根据给出的用户数据依次进行季节判断,3、4、5月判断为春季,6、7、8月判断为夏季,9、10、11月判断为秋季,12、1、2月判断为冬季;
步骤2.3,根据给出的用户数据依次进行典型日判断,在四个季节中分别选取峰值负荷所在的一天作为典型日,在典型日中根据时间来判断白天或夜晚,以获取典型日白天和夜晚的负荷峰值以及峰谷差;
步骤2.4,根据给出的用户数据对应任意用户选取相同的月份区段判断为典型月,获取典型月负荷峰值、峰谷差和月负荷最小值/月负荷平均值;
步骤2.5,进行数据的归一化,其中,负荷最小值/负荷平均值数据不需要归一化。
进一步的,步骤4或步骤5中,进行聚类的方法为:
对于每个从站,设定初始聚类中心为5个,在用电负荷最大值的范围内使用随机数方法获得这5个点,然后计算该地区所有的用户用电特性点到这5个临时的聚类中心的欧式距离;
欧式距离的定义如下:
其中i=(xi1,xi2...xin),j=(xj1,xj2...xjn)是数据对象集中的两个n维数据对象,在本发明中n=50,将这些用户归入欧式距离最小的临时聚类中心所在的簇,接着通过取平均的方法重新计算这5个簇的聚类中心,如果前后两次聚类中心之间的距离足够小则停止聚类,否则重复进行归簇,计算中心的迭代过程一直进行直到满足前后两次聚类中心之间的欧氏距离足够小的要求;
将每个地区的聚类结果存在同一个名为center的数组中,由于初始设定每组5个聚类中心,所以center数组中的元素数量为5*地区数量,形成50*(5*地区数量)的二维矩阵center。
主站聚类的方位为,元素数量为5*地区数量的元素进行聚类,设定5个聚类中心,采用与前述相同的迭代方法达到前后两次聚类中心之间的距离足够小的要求时则跳出循环,最终聚类得到的50*5二维数组temp_center_final 2。
进一步的,步骤6中,将步骤3中各个从站中的用户归入相应的聚类中心的组别内的方法为:即按地区分类得到的组中,将每个组中的所有用户按照欧氏距离最小原则归入其中的组别,得到最终的聚类结果,即所有的用户都被聚到了相应的簇中。
本发明的一种基于聚类算法的用户用电特性分析方法,首先,通过对收集到的配网用户用电数据进行预筛和处理,得到聚类对象,然后将聚类对象按照用户地区进行分组形成从站,接着对对它们进行EDBDC聚类,采用分布式聚类来提高数据处理效率,主站和从站聚类都采用K-means聚类算法,所有用户按照最终的聚类模型以欧式距离最小原则进行归类,形成用户画像,并绘制一年四季的典型日负荷曲线,一年四季的典型月的持续负荷曲线和年持续负荷曲线。本发明能够所建立的用户画像完整细致地展现了各类用户的用电特性并对用户用电类型进行归类,能够为配网运行和供电公司的营销策略提供指导。
附图说明
图1为本发明的一种基于聚类算法的用户用电特性分析方法的流程示意图;
图2为本实施例中,采用本发明的一种基于聚类算法的用户用电特性分析方法进行分类的三类用户的四季典型日、典型月及年符合特性的用电特性对比图;
图3为本实施例汇总,采用本发明的一种基于聚类算法的用户用电特性分析方法进行分类的三类用户一年四季的用电特性对比图。
具体实施方式
为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例进行详细地说明:
请参阅图1,为本发明的一种基于聚类算法的用户用电特性分析方法的流程示意图。步骤1为特定配网范围内,通过配网用户用电数据收集系统,获取配网用户用电数据。在本实施例中,数据源以澳洲SGSC(Smart Grid,Smart City)项目所获得的电力数据中的前3500个用户的数据为例,进行用户用电特性分析。
SGSC(Smart Grid,Smart City)项目是澳大利亚首个商业层面的智能电网,通过对一个小型智能电网进行测试,采集到了电力用户数据。通过有针对性地分析用户在智能电网中的行为,并把它们和一些外在因素(如用户的家庭情况和生活背景)建立联系,可以在很大程度上为各方包括政府、电力供应商、技术开发人员和用户在内的决策提供参考。这项时间跨度2010年至2014年的项目提供了用电用户每隔半小时的用电数据,用户在澳大利亚的地域分布数据以及关于电器使用、气候、订购和零售产品套餐在内一些相关因素的数据。
然后进行步骤2,对配网用户用电数据进行数据预筛和处理,形成对应每个配网用户的表征用电特性数组,其具体步骤为:
步骤2.1,针对每一个用户通过判断用户ID得到该用户的数据起始点,之后把用户序号和数据起始点依次存在一个名为identifier的数组中;
步骤2.2,根据给出的用户数据依次进行季节判断,3、4、5月判断为春季,6、7、8月判断为夏季,9、10、11月判断为秋季,12、1、2月判断为冬季;
步骤2.3,根据给出的用户数据依次进行典型日判断,在四个季节中分别选取峰值负荷所在的一天作为典型日,在典型日中根据时间来判断白天或夜晚,以获取典型日白天和夜晚的负荷峰值以及峰谷差;
步骤2.4,根据给出的用户数据对应任意用户选取相同的月份区段判断为典型月,获取典型月负荷峰值、峰谷差和月负荷最小值/月负荷平均值。
通过上述步骤将得到表征用电特性数组为50维用电数据,分别为下列数据:春季典型日负荷峰值、夏季典型日负荷峰值、秋季典型日负荷峰值、冬季典型日负荷峰值、春季典型日负荷峰谷差、夏季典型日负荷峰谷差、秋季典型日负荷峰谷差、冬季典型日负荷峰谷差、春季典型日白天负荷峰值、夏季典型日白天负荷峰值、秋季典型日白天负荷峰值、冬季典型日白天负荷峰值、春季典型日夜晚负荷峰值、夏季典型日夜晚负荷峰值、秋季典型日夜晚负荷峰值、冬季典型日夜晚负荷峰值、春季典型月负荷峰值、夏季典型月负荷峰值、秋季典型月负荷峰值、冬季典型月负荷峰值、春季典型月负荷峰谷差、夏季典型月负荷峰谷差、秋季典型月负荷峰谷差、冬季典型月负荷峰谷差、春季典型月负荷均值、夏季典型月负荷均值、秋季典型月负荷均值、冬季典型月负荷均值、春季典型月负荷最小值/均值、夏季典型月负荷最小值/均值、秋季典型月负荷最小值/均值、冬季典型月负荷最小值/均值、春季工作日白天负荷峰值、夏季工作日白天负荷峰值、秋季工作日白天负荷峰值、冬季工作日白天负荷峰值、春季工作日夜晚负荷峰值、夏季工作日夜晚负荷峰值、秋季工作日夜晚负荷峰值、冬季工作日夜晚负荷峰值、春季周末白天负荷峰值、夏季周末白天负荷峰值、秋季周末白天负荷峰值、冬季周末白天负荷峰值、春季周末夜晚负荷峰值、夏季周末夜晚负荷峰值、秋季周末夜晚负荷峰值、冬季周末夜晚负荷峰值、年负荷峰值和年负荷峰谷差。
步骤2.5,对上述数据进行数据的归一化,其中,负荷最小值/负荷平均值数据不需要归一化。
进一步,根据给出的用户数据依次进行季节判断和典型日判断从而得到典型日白天和夜晚的负荷峰值以及峰谷差;判断典型月,获取典型月负荷峰值、峰谷差和月负荷最小值/月负荷平均值;提取工作日和周末特性,获取一年四季工作日和周末白天及夜晚的负荷峰值;根据一年额数据得到年负荷峰值和峰谷差。
最后进行数据的归一化,其中,负荷最小值/负荷平均值数据不需要归一化。
经过以上步骤得到的表征用户用电特性的50*3500二维数组中,每个用户的用电特性都由50个维度来刻画。
然后,为简化运算流程,对用户用电数据进行分组,分组方法是按照用户所处地区进行分类,这样可以恰当地模拟分布式聚类中各个从站处于不同地点的模式,为变空间尺度的用户画像的构建打下了基础。最终得到的按照地区因素分组的结果是分出了15个组,组名与对应的用户数量表如下:
表1用户地区分布表
然后进行基于分布式聚类的用户分类,包括步骤4,对各个地区的从站进行聚类,将每个地区的聚类结果存在同一个名为center的数组中,形成二维矩阵center,以及步骤5,进行主站聚类,对二维矩阵center的元素进行聚类,最终得到二维数组temp_center_final 2,以得到聚类中心,其具体方法为:
对于每个从站,设定初始聚类中心为5个,在用电负荷最大值的范围内使用随机数方法获得这5个点,然后计算该地区所有的用户用电特性点到这5个临时的聚类中心的欧式距离。
欧式距离的定义如下:
其中,i=(xi1,xi2...xin),j=(xj1,xj2...xjn)是数据对象集中的两个n维数据对象,在本发明中n=50。将这些用户归入欧式距离最小的临时聚类中心所在的簇,接着通过取平均的方法重新计算这5个簇的聚类中心,如果前后两次聚类中心之间的距离足够小则停止聚类,否则重复进行归簇,计算中心的迭代过程一直进行直到满足前后两次聚类中心之间的欧氏距离足够小的要求。
将每个地区的聚类结果存在同一个名为center的数组中,由于初始设定每组5个聚类中心,之前按照地区分组得到15个组,所以center数组中有5*15=75个元素,是一个50*75的二维矩阵center。
接着,进行主站聚类,即对这75个元素进行聚类。同样设定5个聚类中心,采用与之前相同的方法迭代,达到前后两次聚类中心之间的距离足够小的要求时则跳出循环。最终聚类得到的50*5二维数组temp_center_final 2。
在得到分布式主站聚类的结果,即这5个聚类中心以后,接下来的一步就是把它们传送到各个从站,即按地区分类得到的15个组,将每个组中的所有用户按照欧氏距离最小原则归入其中的组别,得到最终的聚类结果,即所有的用户都被聚到了相应的簇中。
聚类结果如下:
表2聚类结果
所以聚类最终得到3个组,聚到这3个类中的用户数量分别为7,67和3426。
最后,针对每一类用户画像,绘制一年四季的典型日负荷曲线、典型月的持续负荷曲线和年持续负荷曲线,以形成一类用户的用户画像。用户画像是沟通用户特性和需求与产品设计的有效工具。一方面,用户画像要能够做到“可视化”地、具体形象地反应研究对象的特质,把研究对象凝练的关键要素展现在产品设计者面前,另一方面,用户画像的核心是标签体系的建立,它如同“名片”一般通过一系列的文字或者图案符号凸显出一类用户的特性,对该类用户有特定的标识作用。所绘制一年四季的典型日负荷曲线、典型月的持续负荷曲线和年持续负荷曲线,能生动而细致地刻画了每一类用户的用电特性,可以把包括负荷峰值、负荷峰谷差、负荷变化趋势等等在内的特征直观地呈现出来。并且,将每个用户50维用电特性数组作为标识该类用电用户的标签体系,与直观形象的负荷曲线一起构成广义负荷电力系统的用户画像。
根据步骤6得到的聚类结果,可以建立3类用户用电特性的变时间尺度的标签体系为(表格中数据已经过归一化处理):
表3用户用电特性标签体系
续表3
然后计算这3个组中各个用户到各自聚类中心的欧式距离,取距离聚类中心欧式距离最小的用户代表该类,绘制从其一年四季的典型日负荷曲线、一年四季的典型月持续负荷曲线和年持续负荷曲线,从不同时间尺度上进一步具象化了用户画像,三类用户的四季典型日和典型月的用电特性对比具体如图2所示。
通过横向比较则可以发现,三类用户一年四季的典型日负荷中,第二类用户负荷量最大,第三类用户次之,第一类用户负荷量最小。
对比分析三类用户的一年四季典型月持续负荷曲线,可以得到类似的结论。第二类用户负荷量最大,第三类用户次之,第一类用户负荷量最小。无论春夏秋冬,第二类用户的典型月用电量持续负荷曲线都是最平缓的,可以看出整体来说这一类用户用电量普遍比较大,可能与他们的家庭经济情况比较好有关系。
而对比分析年持续负荷曲线,可以看出,第二类用户用电量最大,第三类用户次之,第一类用户用电量最少,且第一类用户的用电量年持续负荷曲线最陡,说明这一类用户只在极少数时间用电量比较大,这可能与他们家庭经济状况比较拮据有关系,第二类用户的用电量年持续负荷曲线最平缓。
三类用户一年四季的用电特性对比如图3所示。
第一类用电用户春季典型日负荷在下午达到峰值;夏季典型日负荷在凌晨及上午达到高峰,且整体用电量在一年四季的典型日中达到最大,这可能与夏季空调的使用有关系;秋季典型日负荷普遍比较低,高峰出现在下午,同时峰谷差也是一年四季中最小的;冬季典型日负荷相比春季和夏季典型日负荷次之,在中午附近达到最高,这可能与除空调外的家用电器使用量有关,中午气温往往是一天中最高的时刻,空调使用量有所下降,此时用电量却很高,说明空调这一大功率电器不是这一类用户的典型负荷,且冬季整体的用电量没有夏天大可能与这一类用户的家庭情况和澳大利亚的地理位置有关系。
第二类用户春季典型日的负荷在夜晚整体都比较高,白天反而比较低,这可能他们这一类用户的生活作息习惯有关;而夏季典型日负荷波动比较大,负荷量相比春季稍有增加;秋季的典型日负荷曲线与夏季典型日负荷曲线在趋势分布上相近,负荷量稍有减小;冬季的典型日负荷在夜晚达到高峰,幅值处于一年四季之首,峰谷差异明显。整体上第二类用户一年四季的用电量差异不大,说明这一类用户的用电特性受外在自然因素的影响比较小,这可能与这一类用户的家庭经济条件比较好有关系。
第三类用户春季典型日负荷除了在早上6点和晚上7点附近的负荷峰值外,用电都比较均匀且都相当少,这可能与这一类用户是典型的上班族,用电量与作息有紧密联系;夏季典型日负荷曲线在中午附近达到峰值,且幅值达到一年四季中的最大,这与一天的气温分布是相近的;秋季典型日负荷曲线分布趋势与春季典型日负荷曲线相近,也是在早上6点和晚上7点附近达到峰值,但负荷量少于春季;冬季典型日负荷曲线只在晚上达到峰值,这可能与空调、电暖等设备的使用情况有关。这一类用户的用电特性非常典型,负荷波动与气候变化相一致,用电特性受外在环境的影响比较大。
根据以上分析可以得出初步结论,这三类用电用户有着截然不同的用电特点。第一类用户整体用电量比较少,同时一年四季的用电特性没有大差别,这可能与他们所处的地理位置特殊,一年四季气候变化不大,以及家庭经济情况较为拮据有关;第二类用户可能是家庭经济情况比较好同时在用电策略上没有特别的安排,不是很注意节约用电的用户,用电量一直都比较大;第三类用户的用电特性则比较典型,夏季和冬季明显高于春季和秋季,且整体用电量居于两者之间。
由本实施例可见,通过本发明的一种基于聚类算法的用户用电特性分析方法,可以把原本复杂凌乱的大数据经过整理,在没有预先设定分类规则的情况下,把特性相似的用户聚到一簇,为电力供应商更好地掌握用户用电特性,调整配网供电结构和策略,制定有针对性的电价策略提供参考。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
Claims (5)
1.一种基于聚类算法的用户用电特性分析方法,其特征在于,包括如下步骤:
步骤1,在特定配网范围内,通过配网用户用电数据收集系统,获取配网用户用电数据;
步骤2,对配网用户用电数据进行数据预筛和处理,形成对应每个配网用户的表征用电特性数组;
步骤3,对表征用电特性数组按照用户地区进行分组形成从站;
步骤4,对各个地区的从站进行聚类,将每个地区的聚类结果存在同一个名为center的数组中,形成二维矩阵center;
步骤5,进行主站聚类,对二维矩阵center的元素进行聚类,最终得到二维数组temp_center_final2,以得到聚类中心;
步骤6,将步骤3中各个从站中的用户归入相应的聚类中心的组别内,任意一个组别即为一类用户特性,形成一类用户画像;
步骤7,针对每一类用户画像,绘制一年四季的典型日负荷曲线、典型月的持续负荷曲线和年持续负荷曲线。
2.根据权利要求1所述的一种基于聚类算法的用户用电特性分析方法,其特征在于,所述表征用电特性数组为50维用电数据,分别为下列数据:春季典型日负荷峰值、夏季典型日负荷峰值、秋季典型日负荷峰值、冬季典型日负荷峰值、春季典型日负荷峰谷差、夏季典型日负荷峰谷差、秋季典型日负荷峰谷差、冬季典型日负荷峰谷差、春季典型日白天负荷峰值、夏季典型日白天负荷峰值、秋季典型日白天负荷峰值、冬季典型日白天负荷峰值、春季典型日夜晚负荷峰值、夏季典型日夜晚负荷峰值、秋季典型日夜晚负荷峰值、冬季典型日夜晚负荷峰值、春季典型月负荷峰值、夏季典型月负荷峰值、秋季典型月负荷峰值、冬季典型月负荷峰值、春季典型月负荷峰谷差、夏季典型月负荷峰谷差、秋季典型月负荷峰谷差、冬季典型月负荷峰谷差、春季典型月负荷均值、夏季典型月负荷均值、秋季典型月负荷均值、冬季典型月负荷均值、春季典型月负荷最小值/均值、夏季典型月负荷最小值/均值、秋季典型月负荷最小值/均值、冬季典型月负荷最小值/均值、春季工作日白天负荷峰值、夏季工作日白天负荷峰值、秋季工作日白天负荷峰值、冬季工作日白天负荷峰值、春季工作日夜晚负荷峰值、夏季工作日夜晚负荷峰值、秋季工作日夜晚负荷峰值、冬季工作日夜晚负荷峰值、春季周末白天负荷峰值、夏季周末白天负荷峰值、秋季周末白天负荷峰值、冬季周末白天负荷峰值、春季周末夜晚负荷峰值、夏季周末夜晚负荷峰值、秋季周末夜晚负荷峰值、冬季周末夜晚负荷峰值、年负荷峰值和年负荷峰谷差。
3.根据权利要求1或2所述的一种基于聚类算法的用户用电特性分析方法,其特征在于,步骤2中,对配网用户用电数据进行数据预筛和处理的方法为:
步骤2.1,针对每一个用户通过判断用户ID得到该用户的数据起始点,之后把用户序号和数据起始点依次存在一个名为identifier的数组中;
步骤2.2,根据给出的用户数据依次进行季节判断,3、4、5月判断为春季,6、7、8月判断为夏季,9、10、11月判断为秋季,12、1、2月判断为冬季;
步骤2.3,根据给出的用户数据依次进行典型日判断,在四个季节中分别选取峰值负荷所在的一天作为典型日,在典型日中根据时间来判断白天或夜晚,以获取典型日白天和夜晚的负荷峰值以及峰谷差;
步骤2.4,根据给出的用户数据对应任意用户选取相同的月份区段判断为典型月,获取典型月负荷峰值、峰谷差和月负荷最小值/月负荷平均值;
步骤2.5,进行数据的归一化,其中,负荷最小值/负荷平均值数据不需要归一化。
4.根据权利要求1所述的一种基于聚类算法的用户用电特性分析方法,其特征在于,步骤4或步骤5中,进行聚类的方法为:
对于每个从站,设定初始聚类中心为5个,在用电负荷最大值的范围内使用随机数方法获得这5个点,然后计算该地区所有的用户用电特性点到这5个临时的聚类中心的欧式距离;
欧式距离的定义如下:
其中i=(xi1,xi2...xin),j=(xj1,xj2...xjn)是数据对象集中的两个n维数据对象,在本发明中n=50,将这些用户归入欧式距离最小的临时聚类中心所在的簇,接着通过取平均的方法重新计算这5个簇的聚类中心,如果前后两次聚类中心之间的距离足够小则停止聚类,否则重复进行归簇,计算中心的迭代过程一直进行直到满足前后两次聚类中心之间的欧氏距离足够小的要求;
将每个地区的聚类结果存在同一个名为center的数组中,由于初始设定每组5个聚类中心,所以center数组中的元素数量为5*地区数量,形成50*(5*地区数量)的二维矩阵center。
主站聚类的方位为,元素数量为5*地区数量的元素进行聚类,设定5个聚类中心,采用与前述相同的迭代方法达到前后两次聚类中心之间的距离足够小的要求时则跳出循环,最终聚类得到的50*5二维数组temp_center_final2。
5.根据权利要求1所述的一种基于聚类算法的用户用电特性分析方法,其特征在于,步骤6中,将步骤3中各个从站中的用户归入相应的聚类中心的组别内的方法为:即按地区分类得到的组中,将每个组中的所有用户按照欧氏距离最小原则归入其中的组别,得到最终的聚类结果,即所有的用户都被聚到了相应的簇中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911022557.4A CN112711616A (zh) | 2019-10-25 | 2019-10-25 | 一种基于聚类算法的用户用电特性分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911022557.4A CN112711616A (zh) | 2019-10-25 | 2019-10-25 | 一种基于聚类算法的用户用电特性分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112711616A true CN112711616A (zh) | 2021-04-27 |
Family
ID=75540641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911022557.4A Pending CN112711616A (zh) | 2019-10-25 | 2019-10-25 | 一种基于聚类算法的用户用电特性分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112711616A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113269360A (zh) * | 2021-05-20 | 2021-08-17 | 国网甘肃省电力有限公司酒泉供电公司 | 一种基于电力用户用电行为画像的数据采集方法 |
CN113297286A (zh) * | 2021-04-28 | 2021-08-24 | 国网山东省电力公司菏泽供电公司 | 一种考虑负荷特性的电力用户用电行为画像方法 |
CN113377881A (zh) * | 2021-06-04 | 2021-09-10 | 国网辽宁省电力有限公司 | 一种配电网负荷的纵横混合聚类多维度分析方法 |
CN113884734A (zh) * | 2021-10-27 | 2022-01-04 | 广东电网有限责任公司 | 一种非侵入式用电异常诊断方法及装置 |
CN113887809A (zh) * | 2021-10-11 | 2022-01-04 | 国网新疆电力有限公司巴州供电公司 | 双碳目标下配电网供需平衡方法、系统、介质及计算设备 |
CN116166940A (zh) * | 2023-04-24 | 2023-05-26 | 施维智能计量系统服务(长沙)有限公司 | 一种基于热力图的用户电力负荷时间特性分类识别方法 |
-
2019
- 2019-10-25 CN CN201911022557.4A patent/CN112711616A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297286A (zh) * | 2021-04-28 | 2021-08-24 | 国网山东省电力公司菏泽供电公司 | 一种考虑负荷特性的电力用户用电行为画像方法 |
CN113269360A (zh) * | 2021-05-20 | 2021-08-17 | 国网甘肃省电力有限公司酒泉供电公司 | 一种基于电力用户用电行为画像的数据采集方法 |
CN113377881A (zh) * | 2021-06-04 | 2021-09-10 | 国网辽宁省电力有限公司 | 一种配电网负荷的纵横混合聚类多维度分析方法 |
CN113377881B (zh) * | 2021-06-04 | 2024-06-07 | 国网辽宁省电力有限公司 | 一种配电网负荷的纵横混合聚类多维度分析方法 |
CN113887809A (zh) * | 2021-10-11 | 2022-01-04 | 国网新疆电力有限公司巴州供电公司 | 双碳目标下配电网供需平衡方法、系统、介质及计算设备 |
CN113884734A (zh) * | 2021-10-27 | 2022-01-04 | 广东电网有限责任公司 | 一种非侵入式用电异常诊断方法及装置 |
CN113884734B (zh) * | 2021-10-27 | 2024-04-19 | 广东电网有限责任公司 | 一种非侵入式用电异常诊断方法及装置 |
CN116166940A (zh) * | 2023-04-24 | 2023-05-26 | 施维智能计量系统服务(长沙)有限公司 | 一种基于热力图的用户电力负荷时间特性分类识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112711616A (zh) | 一种基于聚类算法的用户用电特性分析方法 | |
CN111144468B (zh) | 电力用户信息标签化方法和装置、电子设备以及存储介质 | |
CN103559655B (zh) | 基于数据挖掘的微网新型馈线负荷的预测方法 | |
Park et al. | Apples or oranges? Identification of fundamental load shape profiles for benchmarking buildings using a large and diverse dataset | |
Luo et al. | Social information filtering-based electricity retail plan recommender system for smart grid end users | |
Quilumba et al. | Using smart meter data to improve the accuracy of intraday load forecasting considering customer behavior similarities | |
CN111832861A (zh) | 基于大数据平台的居民负荷变尺度画像方法和系统 | |
Ozawa et al. | Determining the relationship between a household’s lifestyle and its electricity consumption in Japan by analyzing measured electric load profiles | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN111932069A (zh) | 家庭电力用户用电能效分析方法、计算机设备、存储介质 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN106296315A (zh) | 基于用户用电数据的情境感知系统 | |
US20240144004A1 (en) | Trained Models for Discovering Target Device Presence | |
CN113362103B (zh) | 一种通过用户用电行为特征定制电网峰谷分时电价的方法 | |
CN102426676A (zh) | 一种智能用电策略的特征提取方法 | |
Lu et al. | Research on creating multi-attribute power consumption behavior portraits for massive users | |
Toffanin | Generation of customer load profiles based on smart-metering time series, building-level data and aggregated measurements | |
CN104318316A (zh) | 一种用户用电实时测量方法 | |
Wang et al. | Application of clustering technique to electricity customer classification for load forecasting | |
CN111768066B (zh) | 基于融合特征的园区电热负荷耦合关系分析方法及装置 | |
CN111404146B (zh) | 基于用户负荷转移舒适度的配电方法、系统、终端和介质 | |
Mincu et al. | Load profiles in smart cities | |
Gerbec et al. | A methodology to classify distribution load profiles | |
Caquilpan et al. | Load estimation based on self-organizing maps and Bayesian networks for microgrids design in rural zones | |
Maniar et al. | Validity index based improvisation in reproducibility of load profiling outcome |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210427 |