CN111144468A - 电力用户信息标签化方法和装置、电子设备以及存储介质 - Google Patents
电力用户信息标签化方法和装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN111144468A CN111144468A CN201911314690.7A CN201911314690A CN111144468A CN 111144468 A CN111144468 A CN 111144468A CN 201911314690 A CN201911314690 A CN 201911314690A CN 111144468 A CN111144468 A CN 111144468A
- Authority
- CN
- China
- Prior art keywords
- daily
- load
- user
- clustering
- power consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 title claims abstract description 24
- 238000002372 labelling Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 61
- 230000005611 electricity Effects 0.000 claims abstract description 49
- 238000003064 k means clustering Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 50
- 230000006399 behavior Effects 0.000 claims description 45
- 238000012360 testing method Methods 0.000 claims description 42
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 230000007958 sleep Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 2
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005485 electric heating Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种电力用户信息标签化方法和装置、电子设备以及存储介质,该方法包括:获取一用户的三相电表数据;对该三相电表数据进行聚类得到典型负荷曲线图片;利用预训练的VGG模型对该典型负荷曲线图片进行分类得到该用户的用电特性特征标签,将K‑means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。
Description
技术领域
本发明涉及电力技术领域,尤其涉及一种电力用户信息标签化方法和装置。
背景技术
目前,能源市场竞争日益激烈,了解海量用户需求是电力公司提升服务水平、 增强竞争力的关键。电力物联网的发展及智能电表的普及,使用户数据得以高效 采集。
用户画像(即用户信息标签)是根据用户数据(如社会属性、生活习惯、消 费行为等)挖掘出的标签化用户模型。构建用户画像可以实现用户隐性特征显性 化,帮助企业了解用户,洞察用户需求、发掘目标用户、挖掘用户调控潜力,精 细化定位人群特征,为电力公司智能化管理提供理论依据,从而完善产品运营, 提升营销策略和综合能源服务水平,提升用户体验。
目前对电力用户行为分析的方法大多仅直接进行聚类,将相似用电模式的用 户归类,进一步分析用户用电行为及调控潜力,例如:基于年度/月度负荷曲线, 提取分段平均电量、波动率等特征,分析用户年度用电特点;以削峰填谷为目标, 分析提取表征用户用电高峰及季节性变化的特征量,研究各类用户适合参与的需 求响应项目;以年用电量预测为主要分析目标,基于经济、气候及电价等关联影 响因素研究了用户用电模式聚类分析;利用居民及中小商业的用电行为实验数据, 研究了分时电价等激励机制对用户行为的影响;但是,现有方法采用的行为习惯 数据一般是通过问卷调研及项目实验获得,实施难度大且样本量小,难以覆盖所 有典型用户,准确率低。
发明内容
针对现有技术中的问题,本发明提供一种电力用户信息标签化方法、装置、 电子设备以及计算机可读存储介质,能够至少部分地解决现有技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
第一方面,提供一种电力用户信息标签化方法,包括:
获取一用户的三相电表数据;
对该三相电表数据进行聚类得到典型负荷曲线图片;
利用预训练的VGG模型对该典型负荷曲线图片进行分类得到该用户的用电特 性特征标签。
进一步地,对该三相电表数据进行聚类得到典型负荷曲线图片时采用K-means 聚类算法,包括:
根据该三相电表数据获取该用户一段时间内每日的峰值耗电率、日负荷峰值 时刻、谷时耗电率、日负荷周期数以及日最小负荷率;
将该用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,该日负荷 曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负 荷率构成的向量;
对该行向量矩阵进行聚类;
根据各类的聚类中心生成该典型负荷曲线图片。
进一步地,该根据该三相电表数据获取该用户一段时间内每日的峰值耗电率、 日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率包括:
根据日高峰时段用电量以及日总用电量得到峰时耗电率;
根据日最大的运行负荷得到日负荷峰值时刻;
根据日低谷时段用电量以及日总用电量得到谷时耗电率;
根据日最大的运行负荷以及日最小运行负荷统计日负荷周期数;
根据日最小负荷以及日最大负荷得到日最小负荷率。
进一步地,该对该行向量矩阵进行聚类,包括:
根据预设初始类数对该行向量矩阵进行聚类;
重聚类步骤:计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个 向量重新分配给最近的聚类中心所在的类;
判断重聚类后各类的聚类中心是否移动;
若是,返回重聚类步骤;
若否,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或 者类数等于预设最大类数。
进一步地,电力用户信息标签化方法还包括:
构建VGG模型;
采用已知标签的典型负荷曲线图片样本集对该VGG模型进行训练得到预训 练的VGG模型。
进一步地,电力用户信息标签化方法还包括:
获取已知标签的测试用典型负荷曲线图片;
应用该已知标签的测试用典型负荷曲线图片对该预训练的VGG模型进行测 试,并将该模型的输出作为测试结果;
基于该测试结果及已知标签,判断预训练的VGG模型是否符合预设要求;
若是,则将当前模型作为用于用电特性特征标签分类的目标模型;
若否,则对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。
进一步地,电力用户信息标签化方法还包括:
获取该用户的物联网数据;
利用预建立的用户行为分析模型处理该物联网数据以及该三相电表数据得到 用户行为特征标签。
进一步地,电力用户信息标签化方法还包括:
获取该用户的电费数据;
对该用户的电费数据进行分类得到该用户的消费习惯特征标签。
第二方面,提供一种电力用户信息标签化装置,包括:
三相电表数据获取模块,获取一用户的三相电表数据;
聚类模块,对该三相电表数据进行聚类得到典型负荷曲线图片;
用电特性分类模块,利用预训练的VGG模型对该典型负荷曲线图片进行分类 得到该用户的用电特性特征标签。
进一步地,该聚类模块包括:
用户数据获取子模块,根据该三相电表数据获取该用户一段时间内每日的峰 值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;
矩阵构建子模块,将该用户一段时间内的日负荷曲线进行归一化后形成行向 量矩阵,该日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷 周期数、日最小负荷率构成的向量;
聚类子模块,对该行向量矩阵进行聚类;
图片生成子模块,根据各类的聚类中心生成该典型负荷曲线图片。
进一步地,该用户数据获取子模块包括:
峰时耗电率获取单元,根据日高峰时段用电量以及日总用电量得到峰时耗电 率;
日负荷峰值时刻获取单元,根据日最大的运行负荷得到日负荷峰值时刻;
谷时耗电率获取单元,根据日低谷时段用电量以及日总用电量得到谷时耗电 率;
日负荷周期数获取单元,根据日最大的运行负荷以及日最小运行负荷统计日 负荷周期数;
日最小负荷率获取单元,根据日最小负荷以及日最大负荷得到日最小负荷率。
进一步地,该聚类子模块包括:
初始聚类单元,根据预设初始类数对该行向量矩阵进行聚类;
重聚类单元,计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个 向量重新分配给最近的聚类中心所在的类;
中心移动判断单元,判断重聚类后各类的聚类中心是否移动;
约束单元,将不满足约束条件的类划分为两个类,直至所有类均满足约束条 件或者类数等于预设最大类数。
进一步地,电力用户信息标签化装置还包括:
模型构建模块,构建VGG模型;
模型训练模块,采用已知标签的典型负荷曲线图片样本集对该VGG模型进行 训练得到预训练的VGG模型。
进一步地,电力用户信息标签化装置还包括:
测试图片获取模块,获取已知标签的测试用典型负荷曲线图片;
模型测试模块,应用该已知标签的测试用典型负荷曲线图片对该预训练的 VGG模型进行测试,并将该模型的输出作为测试结果;
测试判断模块,基于该测试结果及已知标签,判断预训练的VGG模型是否符 合预设要求;
模型输出模块,将当前模型作为用于用电特性特征标签分类的目标模型;
模型调整模块,对当前模型进行优化和/或应用更新后的训练样本集重新进行 模型训练。
进一步地,电力用户信息标签化装置还包括:
物联网数据获取模块,获取该用户的物联网数据;
行为分类模块,利用预建立的用户行为分析模型处理该物联网数据以及该三 相电表数据得到用户行为特征标签。
进一步地,电力用户信息标签化装置还包括:
电费数据获取模块,获取该用户的电费数据;
消费习惯分类模块,对该用户的电费数据进行分类得到该用户的消费习惯特 征标签。
第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可 在处理器上运行的计算机程序,该处理器执行该程序时实现上述的电力用户信息 标签化方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算 机程序被处理器执行时实现上述的电力用户信息标签化方法的步骤。
本发明提供的电力用户信息标签化方法、装置、电子设备以及计算机可读存 储介质,该方法包括:获取一用户的三相电表数据;对该三相电表数据进行聚类 得到典型负荷曲线图片;利用预训练的VGG模型对该典型负荷曲线图片进行分类 得到该用户的用电特性特征标签,将K-means聚类与深度卷积神经网络结合用于 电力用户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆 盖所有典型用户,准确率高。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实 施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例 或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例中的电力用户信息标签化方法的流程示意图一;
图2示出了本发明实施例中几种用户用电特性;
图3示出了图1中步骤S200的具体步骤;
图4示出了图3中步骤S210的具体步骤;
图5示出了图3中步骤S240的具体步骤;
图6是本发明实施例中的电力用户信息标签化方法的流程示意图二;
图7示出了本发明实施例中6类典型用户行为;
图8是本发明实施例中的电力用户信息标签化装置的结构框图;
图9为本发明实施例电子设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例 中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述 的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的 实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实 施例,都应当属于本申请保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算 机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软 件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计 算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括” 和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一 系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步 骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固 有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可 以相互组合。下面将参考附图并结合实施例来详细说明本申请。
现有分析电力用户行为的方法所采用的行为习惯数据一般是通过问卷调研及 项目实验获得,实施难度大且样本量小,难以覆盖所有典型用户,准确率低。
为至少部分解决现有技术中存在的上述技术问题,本发明实施例提供了一种 电力用户信息标签化方法,将K-means聚类与深度卷积神经网络结合用于电力用 户信息标签化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有 典型用户,准确率高。
图1是本发明实施例中的电力用户信息标签化方法的流程示意图一;如图1 所示,该电力用户信息标签化方法至少可以包括以下内容:
步骤S100:获取一用户的三相电表数据。
其中,三相电表数据为电力系统侧在指定时间段进行采集统计得到,记录有 功电量、无功电量、有功功率、无功功率、功率因素、最大需量、电流、电压、 电费、用电量、日高峰时段用电量、日总用电量、日最大的运行负荷、日低谷时 段用电量、日最小运行负荷以及各参数所对应的时刻等。
步骤S200:对所述三相电表数据进行聚类得到典型负荷曲线图片;
其中,采用K-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲 线图片,k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分 析算法。
步骤S300:利用预训练的VGG模型对所述典型负荷曲线图片进行分类得到 所述用户的用电特性特征标签。
其中,VGG模型利用不同神经元对图片特征进行提取,并使用不同大小的卷积 核对图像进行卷积或者下采样。VGG模型的网络深度较大,且准确率较高,具体结 构参见表1:
表1:VGG模型
值得说明的是,用电特性特征标签包括:用户行为模式和居民用电负荷模式, 用户行为模式分为工作日上班族、工作日居家族、休闲日宅居族、休息日外出族、 老人居家族、上班与老人混居族等,居民用电负荷模式分为平稳型、午间负荷型、 晚间负荷型、单峰型、双峰型、三峰型和其它型等,参见图2。
综上所述,本发明实施例提供的电力用户信息标签化方法,将K-means聚类 与深度卷积神经网络VGG结合用于电力用户信息标签化,获取电力用户行为画像, 实施难度小且样本量大,能够覆盖所有典型用户,准确率高。
通过用户画像能够准确捕捉用户精细化特征及精确锁定目标客户群,细化了 用户行为分析粒度,有助于更好的了解用户特征,通过不同的标签对电力用户进 行综合画像有利与分析用户行为特征,掌握不同时段的用电需求,从而进行合理 的调配,为电力营销和调配进行决策支撑,为用电需求侧管理、优化客户服务管 理规范提供辅助决策,充分了解用户习惯和诉求,为差异化服务、针对性规划提 出指导建议。
在一个可选的实施例中,参见图3,该步骤S200可以包括以下内容:
步骤S210:根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电 率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率。
步骤S220:将所述用户一段时间内的日负荷曲线进行归一化后形成行向量矩 阵,所述日负荷曲线为由峰值耗电率βH、日负荷峰值时刻Tmax、谷时耗电率βL、 日负荷周期数nT、日最小负荷率构成的向量η;
具体地,根据选取的5个特征,将用户某日的日负荷曲线表示为 βH,Tmax,βL,nT,η)向量。为使不同特征上的数据具有可比性,也为了方便计算特 征权重,将向量归一化处理,例如某一用户n天对应的n条日负荷曲线可以表示 为一个5n的行向量矩阵X:
步骤S230:对所述行向量矩阵进行聚类;
步骤S240:根据各类的聚类中心生成所述典型负荷曲线图片。
具体地,提取各类的聚类中心的日负荷曲线,在Matlab中生成典型负荷曲线, 将各典型负荷曲线汇总后得到典型负荷曲线图片。
在一个可选的实施例中,参见图4,该步骤S210具体包括以下内容:
步骤S211:根据日高峰时段用电量WH以及日总用电量WN得到峰时耗电率βH;
具体地,βH=WH/WN。
步骤S212:根据日最大的运行负荷Pd.max得到日负荷峰值时刻;
具体地,日最大的运行负荷Pd.max所对应的时刻为日负荷峰值时刻。
步骤S213:根据日低估时段用电量WL以及日总用电量WN得到谷时耗电率;
具体地,βL=WL/WN。
步骤S214:根据日最大的运行负荷Pd.max以及日最小运行负荷Pd.min统计日负 荷周期数Nt;
具体地,
PH>Pd.max-0.3(Pd.max-Pd.min)
PL>Pd.max+0.3(Pd.max-Pd.min)
PH为高负荷,PL为低负荷,一日中负荷在PH和PL之间变换一次记为0.5周期, 一日总周期数为Nt,日负荷周期数表征了负荷波动性。
步骤S215:根据日最小负荷Pd.min以及日最大负荷Pd.max得到日最小负荷率η。
具体地,η=Pd.min/Pd.max。
在一个可选的实施例中,参见图5,该步骤S240可以包括以下内容:
步骤S241:根据预设初始类数Kmin对所述行向量矩阵进行聚类。
其中,将数据随机划分为数量为Kmin的类,并计算每个类的聚类中心(均值向 量)mu(u=1,2,…,Kmin)。
步骤S242:计算每个向量距离各类的聚类中心的欧氏距离;
具体地,此时的类数量为Kmin个,每个类中的向量个数分别 为:n1,n2,…,nr,…,nk,nr表示第r个聚类中向量的个数,第j列为第j维特征,J 的取值为1~5,代表上述的5个特征中的一个。
首先,计算第j(j=1,2,…,5)维特征的权重wj:
cj为特征j对聚类的贡献度,具体地:
cj=dm/dn
根据上式可以得知,若想要贡献度cj比较大,就需要类间距离dm较大,类内 距离dn较小。如果类间距离dm较小,类内距离dn较大,则说明此特征的贡献度比 较小,从而分配给此特征的权重就比较小。所以说cj可以度量出聚类的性能。
所有Kmin个聚类在第j维特征上的类间距离之和dm为:
mj为类中全部数据在第j维特征上的均值,mrj为第r个聚类在第j维特征上 的均值。
所有Kmin个聚类在第j维特征上的类内距离之和dn为:
xij为该类矩阵中第i行第j列,mrj为第r个聚类在第j维特征上的均值。
然后,根据上述计算得到的权重wj计算每个向量距离每个类的聚类中心的欧氏距离d,具体地:
mu为每个类的聚类中心,xi为该类矩阵中第i行第j列,muj为第u个聚类在 第j维特征上的均值。
步骤S243:将每个向量重新分配给最近的聚类中心所在的类;
具体地,将所有向量均重新分配后,完成重聚类过程,重新计算每个类的聚 类中心。
步骤S244:判断重聚类后各类的聚类中心是否移动;
若是,返回步骤S242;若否,执行步骤S245;
具体地,判断本次重聚类后每个类的聚类中心与本次重聚类前每个类的聚类 中心是否发生移动,若是,返回步骤S242,直至本次重聚类后每个类的聚类中心 与本次重聚类前每个类的聚类中心未发生移动。
步骤S245:将不满足约束条件的类划分为两个类,并执行上述步骤S242至S244,直至所有类均满足约束条件或者类数等于预设最大类数。
具体地,将当前的所有类均标记为未检验聚类,然后对各未检验聚类进行检验,具体为:判断未检验聚类是否满足聚类误差指标,即判断未检验聚类是否满足以 下条件的约束:
mrj为第r个聚类在第j维特征上的均值。C为可容忍误差阈值,即对聚类结 果能够接受的总体最大误差,举例来说,可为0.3~0.6,如0.4;Er为第r个聚类 的总代表误差;nk为属于第r个聚类的数量。
将满足约束条件的未检验聚类标记为已检验聚类;对于不满足约束条件的类, 再次划分为两个新的聚类,并执行上述步骤S242至S244,并将最终得到的两个新 的聚类标记为未检验聚类执行检验步骤,直至所有未检验聚类均已标记为已检验 聚类或者未检验聚类和已检验聚类的聚类总数量达到预设的最大聚类数量Kmax。
值得说明的是,通过采用上述聚类方案,能够有效对相似向量进行聚类,利 于提高后续分析的准确性。
在一个可选的实施例中,该电力用户信息标签化方法还可以包括:
步骤a:构建VGG模型;
步骤b:采用已知标签的典型负荷曲线图片样本集对所述VGG模型进行训练 得到预训练的VGG模型。
在一个进一步地实施例中,该电力用户信息标签化方法还可以包括:
步骤c:获取已知标签的测试用典型负荷曲线图片;
步骤d:应用所述已知标签的测试用典型负荷曲线图片对所述预训练的VGG 模型进行测试,并将该模型的输出作为测试结果;
步骤e:基于所述测试结果及已知标签,判断预训练的VGG模型是否符合预 设要求;
若是,执行步骤f;若否,执行步骤g。
步骤f:将当前模型作为用于用电特性特征标签分类的目标模型;
步骤g:对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训 练。
在一个可选的实施例中,参见图6,该电力用户信息标签化方法还可以包括以 下内容:
步骤S400:获取所述用户的物联网数据以及电费数据。
其中,物联网数据可通过电器节点传感器采集识别得到。
步骤S500:利用预建立的用户行为分析模型处理所述物联网数据以及所述三 相电表数据得到用户行为特征标签。
具体地,考虑日历因素影响下的用户作息行为习惯分析用户行为,寻找用户 用电在时间上的规律性。用户行为分析模型如下:
Lgwap={(Ts,Te)P(Ti)W(av)m(Ldif)C(Lreg)}
其中,(Ts,Te)为用户的起居时间,根据物联网数据,基于春夏天的多日的用 电负荷曲线,截取居民早晚电器启停时刻综合判断用户作息时间;P(Ti)为负荷 曲线特征,利用负荷量及出现的时段判断;W(av)为电量消耗水平,利用用户年 用电量的所处阶梯;m(Ldif)为电器类型数量(空调、电采暖(功率分档)、电动 汽车、电热水器、智能厨电、洗衣机、普通厨电、基本照明、冰箱等),通过一年 的辨识数据求合集(根据电器节点传感器采集识别数据);C(Lreg)为大功率可调 负荷总容量,通过一年的辨识数据综合推算(例如空调、电暖等大功率可调负荷 电器可根据一年中使用境况的不同进行综合推算)。
考虑用户行为的高差异性,所有判断因子均以区段进行表示,根据统计数据 估算出估算各个区段的上下限值。若并非所有标签均满足,则以该类用户的主要 判据为主,如:上班族受上班时间约束,工作日用电规律性极强;工作日居家族 全天用电,且电器类型多;老人居家族早睡早起,电量小;混居族则早起晚睡, 整日持续用电,参见图7以及表2。
表2:用户行为
类别 | (Ts,Te) | P(Ti) | W(av) | m(Ldif) | C(Lreg) |
1 | 晚睡早起 | 早峰晚峰 | 中 | 中 | 中 |
2 | 晚睡晚起 | 早峰晚峰 | 高 | 多 | 大 |
3 | 早睡早起 | 早中晚峰 | 低 | 多 | 小 |
4 | 早起晚睡 | 早中晚峰 | 高 | 多 | 大 |
其中,表中W(av)根据用户年用电量的所处阶梯分成低、中、高三类。低于 2880千瓦时为低,2880-4800为中,4800以上为高。
表中m(Ldif)低于5为少,5-20为中,20以上为多。
表中C(Lreg)低于500为少,500-1000为中,1000以上为多。
步骤S600:对所述用户的电费数据进行分类得到所述用户的消费习惯特征标 签。
在现行阶梯电价政策下,电费与电量已不是线性相关,因此电费成本与调控 的潜力及意愿都为正相关。
阶梯电费占比:
总电费:
式中:Cj1Cj2Cj3分别为用户第一、二、三阶梯的电费;Ci为第i个用户的总电 费。时间以1年计。
当用户的总电费低于1500元则为消费习惯特征标签为低,当用户的总电费低 于1500-3500元则为消费习惯特征标签为中,当用户的总电费在3500元以上则为 消费习惯特征标签为高。
最后,基于用户子标签特征值进行综合画像,并对用户定性标签进行直观展 示,参见表3。
表3:用户定性标签
在一个可选的实施例中,该电力用户信息标签化方法还可以包括:
数据清洗步骤。
具体地,通过各种方式收集来的数据通常是不完整的,存在数据缺失、数据 错误、离群值、数据不一致等问题,因此在使用数据进行电力用户信息标签化之 前,需要进行数据清洗,删除其中噪声,进行数据过滤,保证数据完整性和一致 性,生成干净正确的数据通过调用机器学习算法进行建模。
综上,通过在北京市电力用户中,随机挑选了3000户居民用户包括了20多 个社区,每30min采集一次,每个用户每天采集48个数据点,获取用户三相电表 数据、物联网数据以及电费数据(如整年的电量、电费及网络行为统计数据、总 负荷以及分项辨识负荷曲线数据等),得到总共100万多条负荷曲线,进行了电 力用户信息标签化,并在标签化后进行了抽样验证,证明本发明实施例提供的电 力用户信息标签化的精度达到90%以上。
综上所述,本发明实施例提供的电力用户信息标签化方法,能够根据用户历 史行为分析将电力用户分类,结合聚类和神经网络,抽象出一个用户的信息全貌, 精准、快速地分析用户行为习惯,帮助用户节约用电,同时还能降低能源的消耗, 提高能源的利用率,实现智能用电。
基于同一发明构思,本申请实施例还提供了一种电力用户信息标签化装置, 可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于电力用户信 息标签化装置解决问题的原理与上述方法相似,因此电力用户信息标签化装置的 实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的,术语“单元” 或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的 装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并 被构想的。
图8是本发明实施例中的电力用户信息标签化装置的结构框图。如图8所示, 该电力用户信息标签化装置具体包括:三相电表数据获取模块10、聚类模块20以 及用电特性分类模块30。
三相电表数据获取模块10获取一用户的三相电表数据。
其中,三相电表数据为电力系统侧在指定时间段进行采集统计得到,记录有 功电量、无功电量、有功功率、无功功率、功率因素、最大需量、电流、电压、 电费、用电量、日高峰时段用电量、日总用电量、日最大的运行负荷、日低谷时 段用电量、日最小运行负荷以及各参数所对应的时刻等。
聚类模块20对所述三相电表数据进行聚类得到典型负荷曲线图片。
其中,采用K-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲 线图片,k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分 析算法。
用电特性分类模块30利用预训练的VGG模型对所述典型负荷曲线图片进行 分类得到所述用户的用电特性特征标签。
其中,VGG模型利用不同神经元对图片特征进行提取,并使用不同大小的卷积 核对图像进行卷积或者下采样。VGG模型的网络深度较大,且准确率较高。
值得说明的是,用电特性特征标签包括:用户行为模式和居民用电负荷模式, 用户行为模式分为工作日上班族、工作日居家族、休闲日宅居族、休息日外出族、 老人居家族、上班与老人混居族等,居民用电负荷模式分为平稳型、午间负荷型、 晚间负荷型、单峰型、双峰型、三峰型和其它型等。
综上所述,本发明实施例提供的电力用户信息标签化装置,将K-means聚类 与深度卷积神经网络VGG结合用于电力用户信息标签化,获取电力用户行为画像, 实施难度小且样本量大,能够覆盖所有典型用户,准确率高。
通过用户画像能够准确捕捉用户精细化特征及精确锁定目标客户群,细化了 用户行为分析粒度,有助于更好的了解用户特征,通过不同的标签对电力用户进 行综合画像有利与分析用户行为特征,掌握不同时段的用电需求,从而进行合理 的调配,为电力营销和调配进行决策支撑,为用电需求侧管理、优化客户服务管 理规范提供辅助决策,充分了解用户习惯和诉求,为差异化服务、针对性规划提 出指导建议。
在一个可选的实施例中,该聚类模块包括:用户数据获取子模块、矩阵构建 子模块、聚类子模块以及图片生成子模块。
用户数据获取子模块,根据所述三相电表数据获取所述用户一段时间内每日 的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;
矩阵构建子模块,将所述用户一段时间内的日负荷曲线进行归一化后形成行 向量矩阵,所述日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日 负荷周期数、日最小负荷率构成的向量;
具体地,根据选取的5个特征,将用户某日的日负荷曲线表示为 βH,Tmax,βL,nT,η)向量。为使不同特征上的数据具有可比性,也为了方便计算特 征权重,将向量归一化处理,例如某一用户n天对应的n条日负荷曲线可以表示 为一个5n的行向量矩阵X:
聚类子模块,对所述行向量矩阵进行聚类;
图片生成子模块,根据各类的聚类中心生成所述典型负荷曲线图片。
具体地,提取各类的聚类中心的日负荷曲线,在Matlab中生成典型负荷曲线, 将各典型负荷曲线汇总后得到典型负荷曲线图片。
在一个可选的实施例中,所述用户数据获取子模块包括:峰时耗电率获取单 元、日负荷峰值时刻获取单元、谷时耗电率获取单元、日负荷周期数获取单元以 及日最小负荷率获取单元。
峰时耗电率获取单元,根据日高峰时段用电量WH以及日总用电量WN得到峰时 耗电率βH;
具体地,βH=WH/WN。
日负荷峰值时刻获取单元,根据日最大的运行负荷Pd.max得到日负荷峰值时 刻;
具体地,日最大的运行负荷Pd.max所对应的时刻为日负荷峰值时刻。
谷时耗电率获取单元,根据日低估时段用电量WL以及日总用电量WN得到谷时 耗电率;
具体地,βL=WL/WN。
日负荷周期数获取单元,根据日最大的运行负荷Pd.max以及日最小运行负荷 Pd.min统计日负荷周期数Nt;
具体地,
PH>Pd.max-0.3(Pd.max-Pd.min)
PL>Pd.max+0.3(Pd.max-Pd.min)
PH为高负荷,PL为低负荷,一日中负荷在PH和PL之间变换一次记为0.5周期, 一日总周期数为Nt,日负荷周期数表征了负荷波动性。
日最小负荷率获取单元,根据日最小负荷Pd.min以及日最大负荷Pd.max得到日 最小负荷率η。
具体地,η=Pd.min/Pd.max。
在一个可选的实施例中,所述聚类子模块包括:初始聚类单元、重聚类单元、 中心移动判断单元以及约束单元。
初始聚类单元,根据预设初始类数对所述行向量矩阵进行聚类;
重聚类单元,计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个 向量重新分配给最近的聚类中心所在的类;
中心移动判断单元,判断重聚类后各类的聚类中心是否移动;
约束单元,将不满足约束条件的类划分为两个类,直至所有类均满足约束条 件或者类数等于预设最大类数。
在一个可选的实施例中,该电力用户信息标签化装置还可以包括:模型构建 模块以及模型训练模块。
模型构建模块,构建VGG模型;
模型训练模块,采用已知标签的典型负荷曲线图片样本集对所述VGG模型进 行训练得到预训练的VGG模型。
在一个可选的实施例中,电力用户信息标签化装置还可以包括:测试图片获 取模块、模型测试模块、测试判断模块、模型输出模块以及模型调整模块。
测试图片获取模块,获取已知标签的测试用典型负荷曲线图片;
模型测试模块,应用所述已知标签的测试用典型负荷曲线图片对所述预训练 的VGG模型进行测试,并将该模型的输出作为测试结果;
测试判断模块,基于所述测试结果及已知标签,判断预训练的VGG模型是否 符合预设要求;
模型输出模块,将当前模型作为用于用电特性特征标签分类的目标模型;
模型调整模块,对当前模型进行优化和/或应用更新后的训练样本集重新进行 模型训练。
在一个可选的实施例中,电力用户信息标签化装置还可以包括:物联网数据 获取模块以及行为分类模块。
物联网数据获取模块,获取所述用户的物联网数据;
行为分类模块,利用预建立的用户行为分析模型处理所述物联网数据以及所 述三相电表数据得到用户行为特征标签。
在一个可选的实施例中,该电力用户信息标签化装置还可以包括:电费数据 获取模块以及消费习惯分类模块。
电费数据获取模块,获取所述用户的电费数据;
消费习惯分类模块,对所述用户的电费数据进行分类得到所述用户的消费习 惯特征标签。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现, 或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的, 电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电 话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板 计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上 并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现下述步骤:
获取一用户的三相电表数据;
采用K-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片;
利用预训练的VGG模型对所述典型负荷曲线图片进行分类得到所述用户的用 电特性特征标签。
从上述描述可知,本发明实施例提供的电子设备,可用于电力用户信息标签 化,将K-means聚类与深度卷积神经网络结合用于电力用户信息标签化,获取电 力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户,准确率高。
下面参考图9,其示出了适于用来实现本申请实施例的电子设备600的结构示 意图。
如图9所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储 在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器 (RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储 有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过 总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如 阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括 硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通 信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根 据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体 存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根 据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计 算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储 有计算机程序,该计算机程序被处理器执行时实现下述步骤:
获取一用户的三相电表数据;
采用K-means聚类算法对所述三相电表数据进行聚类得到典型负荷曲线图片;
利用预训练的VGG模型对所述典型负荷曲线图片进行分类得到所述用户的用 电特性特征标签。
从上述描述可知,本发明实施例提供的计算机可读存储介质,可用于电力用 户信息标签化,将K-means聚类与深度卷积神经网络结合用于电力用户信息标签 化,获取电力用户行为画像,实施难度小且样本量大,能够覆盖所有典型用户, 准确率高。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和 安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何 方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模 块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态 随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存 储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记 忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或 其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非 传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机 可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在 实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品 的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或 方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框 的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机 或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可 编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流 程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以 特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令 产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得 在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从 而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多 个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性 的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要 素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商 品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定 的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的 相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序 产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件 方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用 程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存 储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如 程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、 程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在 这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。 在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机 存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似 的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤 其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单, 相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术 人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的 任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (18)
1.一种电力用户信息标签化方法,其特征在于,包括:
获取一用户的三相电表数据;
所述三相电表数据进行聚类得到典型负荷曲线图片;
利用预训练的VGG模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。
2.根据权利要求1所述的电力用户信息标签化方法,其特征在于,对所述三相电表数据进行聚类得到典型负荷曲线图片时采用K-means聚类算法,包括:
根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;
将所述用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,所述日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负荷率构成的向量;
对所述行向量矩阵进行聚类;
根据各类的聚类中心生成所述典型负荷曲线图片。
3.根据权利要求2所述的电力用户信息标签化方法,其特征在于,所述根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率包括:
根据日高峰时段用电量以及日总用电量得到峰时耗电率;
根据日最大的运行负荷得到日负荷峰值时刻;
根据日低谷时段用电量以及日总用电量得到谷时耗电率;
根据日最大的运行负荷以及日最小运行负荷统计日负荷周期数;
根据日最小负荷以及日最大负荷得到日最小负荷率。
4.根据权利要求2所述的电力用户信息标签化方法,其特征在于,所述对所述行向量矩阵进行聚类,包括:
根据预设初始类数对所述行向量矩阵进行聚类;
重聚类步骤:计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个向量重新分配给最近的聚类中心所在的类;
判断重聚类后各类的聚类中心是否移动;
若是,返回重聚类步骤;
若否,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或者类数等于预设最大类数。
5.根据权利要求1所述的电力用户信息标签化方法,其特征在于,还包括:
构建VGG模型;
采用已知标签的典型负荷曲线图片样本集对所述VGG模型进行训练得到预训练的VGG模型。
6.根据权利要求5所述的电力用户信息标签化方法,其特征在于,还包括:
获取已知标签的测试用典型负荷曲线图片;
应用所述已知标签的测试用典型负荷曲线图片对所述预训练的VGG模型进行测试,并将该模型的输出作为测试结果;
基于所述测试结果及已知标签,判断预训练的VGG模型是否符合预设要求;
若是,则将当前模型作为用于用电特性特征标签分类的目标模型;
若否,则对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。
7.根据权利要求1所述的电力用户信息标签化方法,其特征在于,还包括:
获取所述用户的物联网数据;
利用预建立的用户行为分析模型处理所述物联网数据以及所述三相电表数据得到用户行为特征标签。
8.根据权利要求1或7所述的电力用户信息标签化方法,其特征在于,还包括:
获取所述用户的电费数据;
对所述用户的电费数据进行分类得到所述用户的消费习惯特征标签。
9.一种电力用户信息标签化装置,其特征在于,包括:
三相电表数据获取模块,获取一用户的三相电表数据;
聚类模块,对所述三相电表数据进行聚类得到典型负荷曲线图片;
用电特性分类模块,利用预训练的VGG模型对所述典型负荷曲线图片进行分类得到所述用户的用电特性特征标签。
10.根据权利要求9所述的电力用户信息标签化装置,其特征在于,所述聚类模块包括:
用户数据获取子模块,根据所述三相电表数据获取所述用户一段时间内每日的峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数以及日最小负荷率;
矩阵构建子模块,将所述用户一段时间内的日负荷曲线进行归一化后形成行向量矩阵,所述日负荷曲线为由峰值耗电率、日负荷峰值时刻、谷时耗电率、日负荷周期数、日最小负荷率构成的向量;
聚类子模块,对所述行向量矩阵进行聚类;
图片生成子模块,根据各类的聚类中心生成所述典型负荷曲线图片。
11.根据权利要求10所述的电力用户信息标签化装置,其特征在于,所述用户数据获取子模块包括:
峰时耗电率获取单元,根据日高峰时段用电量以及日总用电量得到峰时耗电率;
日负荷峰值时刻获取单元,根据日最大的运行负荷得到日负荷峰值时刻;
谷时耗电率获取单元,根据日低谷时段用电量以及日总用电量得到谷时耗电率;
日负荷周期数获取单元,根据日最大的运行负荷以及日最小运行负荷统计日负荷周期数;
日最小负荷率获取单元,根据日最小负荷以及日最大负荷得到日最小负荷率。
12.根据权利要求10所述的电力用户信息标签化装置,其特征在于,所述聚类子模块包括:
初始聚类单元,根据预设初始类数对所述行向量矩阵进行聚类;
重聚类单元,计算每个向量距离各类的聚类中心的欧氏距离,并且,将每个向量重新分配给最近的聚类中心所在的类;
中心移动判断单元,判断重聚类后各类的聚类中心是否移动;
约束单元,将不满足约束条件的类划分为两个类,直至所有类均满足约束条件或者类数等于预设最大类数。
13.根据权利要求9所述的电力用户信息标签化装置,其特征在于,还包括:
模型构建模块,构建VGG模型;
模型训练模块,采用已知标签的典型负荷曲线图片样本集对所述VGG模型进行训练得到预训练的VGG模型。
14.根据权利要求13所述的电力用户信息标签化装置,其特征在于,还包括:
测试图片获取模块,获取已知标签的测试用典型负荷曲线图片;
模型测试模块,应用所述已知标签的测试用典型负荷曲线图片对所述预训练的VGG模型进行测试,并将该模型的输出作为测试结果;
测试判断模块,基于所述测试结果及已知标签,判断预训练的VGG模型是否符合预设要求;
模型输出模块,将当前模型作为用于用电特性特征标签分类的目标模型;
模型调整模块,对当前模型进行优化和/或应用更新后的训练样本集重新进行模型训练。
15.根据权利要求9所述的电力用户信息标签化装置,其特征在于,还包括:
物联网数据获取模块,获取所述用户的物联网数据;
行为分类模块,利用预建立的用户行为分析模型处理所述物联网数据以及所述三相电表数据得到用户行为特征标签。
16.根据权利要求9或15所述的电力用户信息标签化装置,其特征在于,还包括:
电费数据获取模块,获取所述用户的电费数据;
消费习惯分类模块,对所述用户的电费数据进行分类得到所述用户的消费习惯特征标签。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述的电力用户信息标签化方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的电力用户信息标签化方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911314690.7A CN111144468B (zh) | 2019-12-19 | 2019-12-19 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911314690.7A CN111144468B (zh) | 2019-12-19 | 2019-12-19 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111144468A true CN111144468A (zh) | 2020-05-12 |
CN111144468B CN111144468B (zh) | 2023-07-18 |
Family
ID=70518892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911314690.7A Active CN111144468B (zh) | 2019-12-19 | 2019-12-19 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144468B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539657A (zh) * | 2020-05-30 | 2020-08-14 | 国网湖南省电力有限公司 | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 |
CN111798336A (zh) * | 2020-07-09 | 2020-10-20 | 山东大学 | 一种基于典型用户的居民电费套餐推荐方法及系统 |
CN112579721A (zh) * | 2020-12-22 | 2021-03-30 | 北京市腾河智慧能源科技有限公司 | 构建人群分布图的方法及系统、终端设备、存储介质 |
CN113256349A (zh) * | 2021-06-25 | 2021-08-13 | 国网江西省电力有限公司供电服务管理中心 | 一种提供电力产品套餐的标签库构建方法 |
CN113269360A (zh) * | 2021-05-20 | 2021-08-17 | 国网甘肃省电力有限公司酒泉供电公司 | 一种基于电力用户用电行为画像的数据采集方法 |
CN113297286A (zh) * | 2021-04-28 | 2021-08-24 | 国网山东省电力公司菏泽供电公司 | 一种考虑负荷特性的电力用户用电行为画像方法 |
CN113514717A (zh) * | 2021-04-22 | 2021-10-19 | 微企(天津)信息技术有限公司 | 一种非侵入式电力负荷监测系统 |
CN113837780A (zh) * | 2020-06-23 | 2021-12-24 | 上海莉莉丝科技股份有限公司 | 信息投放方法、系统、设备和介质 |
CN114336651A (zh) * | 2022-01-04 | 2022-04-12 | 国网四川省电力公司营销服务中心 | 一种基于削峰潜力的电力调度方法及装置 |
CN115168437A (zh) * | 2022-09-06 | 2022-10-11 | 国网冀北综合能源服务有限公司 | 一种基于数据分析实现用电用户画像的方法及系统 |
CN115809406A (zh) * | 2023-02-03 | 2023-03-17 | 佰聆数据股份有限公司 | 电力用户细粒度归类方法、装置、设备及存储介质 |
CN117521898A (zh) * | 2023-11-10 | 2024-02-06 | 国网山东省电力公司营销服务中心(计量中心) | 一种基于关联分析的电费结算优化方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169613A (ja) * | 2000-12-04 | 2002-06-14 | Hitachi Ltd | 電力ロードカーブの分析方法およびシステム |
CN103646349A (zh) * | 2013-09-27 | 2014-03-19 | 华北电力大学 | 一种电力负荷曲线分段识别方法 |
WO2014187147A1 (zh) * | 2013-05-20 | 2014-11-27 | 国家电网公司 | 电力系统中长期优化运行的中长期风电出力模型建模方法 |
CN105574606A (zh) * | 2015-12-10 | 2016-05-11 | 济南大学 | 一种基于负荷特性指标体系的用电避峰方法 |
CN108256575A (zh) * | 2018-01-17 | 2018-07-06 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 图像识别方法、装置、计算机设备和存储介质 |
CN110516849A (zh) * | 2019-08-02 | 2019-11-29 | 国网上海市电力公司 | 一种基于典型日负荷曲线的负荷分类结果评价方法 |
-
2019
- 2019-12-19 CN CN201911314690.7A patent/CN111144468B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169613A (ja) * | 2000-12-04 | 2002-06-14 | Hitachi Ltd | 電力ロードカーブの分析方法およびシステム |
WO2014187147A1 (zh) * | 2013-05-20 | 2014-11-27 | 国家电网公司 | 电力系统中长期优化运行的中长期风电出力模型建模方法 |
CN103646349A (zh) * | 2013-09-27 | 2014-03-19 | 华北电力大学 | 一种电力负荷曲线分段识别方法 |
CN105574606A (zh) * | 2015-12-10 | 2016-05-11 | 济南大学 | 一种基于负荷特性指标体系的用电避峰方法 |
CN108256575A (zh) * | 2018-01-17 | 2018-07-06 | 广东顺德工业设计研究院(广东顺德创新设计研究院) | 图像识别方法、装置、计算机设备和存储介质 |
CN110516849A (zh) * | 2019-08-02 | 2019-11-29 | 国网上海市电力公司 | 一种基于典型日负荷曲线的负荷分类结果评价方法 |
Non-Patent Citations (3)
Title |
---|
PRAHASTONO I 等: "A Review of Electricity Load Profile Classification Methods", 《UNIVERSITY POWER ENGINEERING CONFERENCCE》, pages 1187 - 1191 * |
任炳俐 等: "基于用电采集数据的需求响应削峰潜力评估方法", vol. 37, no. 11, pages 1 * |
蔡秋娜 等: "基于GMM聚类和SVM的用户负荷行业分类辨识方法", vol. 30, no. 12, pages 1 - 3 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539657A (zh) * | 2020-05-30 | 2020-08-14 | 国网湖南省电力有限公司 | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 |
CN111539657B (zh) * | 2020-05-30 | 2023-11-24 | 国网湖南省电力有限公司 | 结合用户日用电量曲线的典型用电行业负荷特性分类与综合方法 |
CN113837780A (zh) * | 2020-06-23 | 2021-12-24 | 上海莉莉丝科技股份有限公司 | 信息投放方法、系统、设备和介质 |
CN111798336A (zh) * | 2020-07-09 | 2020-10-20 | 山东大学 | 一种基于典型用户的居民电费套餐推荐方法及系统 |
CN111798336B (zh) * | 2020-07-09 | 2021-06-01 | 山东大学 | 一种基于典型用户的居民电费套餐推荐方法及系统 |
CN112579721B (zh) * | 2020-12-22 | 2023-10-27 | 北京市腾河智慧能源科技有限公司 | 构建人群分布图的方法及系统、终端设备、存储介质 |
CN112579721A (zh) * | 2020-12-22 | 2021-03-30 | 北京市腾河智慧能源科技有限公司 | 构建人群分布图的方法及系统、终端设备、存储介质 |
CN113514717A (zh) * | 2021-04-22 | 2021-10-19 | 微企(天津)信息技术有限公司 | 一种非侵入式电力负荷监测系统 |
CN113297286A (zh) * | 2021-04-28 | 2021-08-24 | 国网山东省电力公司菏泽供电公司 | 一种考虑负荷特性的电力用户用电行为画像方法 |
CN113269360A (zh) * | 2021-05-20 | 2021-08-17 | 国网甘肃省电力有限公司酒泉供电公司 | 一种基于电力用户用电行为画像的数据采集方法 |
CN113256349A (zh) * | 2021-06-25 | 2021-08-13 | 国网江西省电力有限公司供电服务管理中心 | 一种提供电力产品套餐的标签库构建方法 |
CN114336651B (zh) * | 2022-01-04 | 2023-08-01 | 国网四川省电力公司营销服务中心 | 一种基于削峰潜力的电力调度方法及装置 |
CN114336651A (zh) * | 2022-01-04 | 2022-04-12 | 国网四川省电力公司营销服务中心 | 一种基于削峰潜力的电力调度方法及装置 |
CN115168437A (zh) * | 2022-09-06 | 2022-10-11 | 国网冀北综合能源服务有限公司 | 一种基于数据分析实现用电用户画像的方法及系统 |
CN115809406A (zh) * | 2023-02-03 | 2023-03-17 | 佰聆数据股份有限公司 | 电力用户细粒度归类方法、装置、设备及存储介质 |
CN117521898A (zh) * | 2023-11-10 | 2024-02-06 | 国网山东省电力公司营销服务中心(计量中心) | 一种基于关联分析的电费结算优化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111144468B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144468B (zh) | 电力用户信息标签化方法和装置、电子设备以及存储介质 | |
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及系统 | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
US11043808B2 (en) | Method for identifying pattern of load cycle | |
Beckel et al. | Automatic socio-economic classification of households using electricity consumption data | |
Llanos et al. | Load estimation for microgrid planning based on a self-organizing map methodology | |
CN111461761A (zh) | 一种基于多维细粒度行为数据的居民用户画像方法 | |
CN111832861A (zh) | 基于大数据平台的居民负荷变尺度画像方法和系统 | |
CN112330077B (zh) | 电力负荷预测方法、装置、计算机设备和存储介质 | |
CN111815060A (zh) | 一种用电地区短期负荷预测方法及装置 | |
Justo et al. | Behavioral similarity of residential customers using a neural network based on adaptive resonance theory | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN115796559A (zh) | 一种考虑需求响应场景的可调负荷排序方法及系统 | |
CN108898273A (zh) | 一种基于形态分析的用户侧负荷特征聚类评价方法 | |
Wu et al. | Understanding multi-scale spatiotemporal energy consumption data: A visual analysis approach | |
Sodenkamp et al. | Supervised classification with interdependent variables to support targeted energy efficiency measures in the residential sector | |
CN116467631A (zh) | 电力指纹识别模型训练方法、电力指纹识别方法及装置 | |
CN116091157A (zh) | 资源推送方法及装置、存储介质、计算机设备 | |
CN113837486B (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 | |
Watanatada et al. | Forecasting urban travel demand for quick policy analysis with disaggregate choice models: A Monte Carlo simulation approach | |
Majidpour | Time series prediction for electric vehicle charging load and solar power generation in the context of smart grid | |
CN115358797A (zh) | 基于聚类分析法的综合能源用户用能行为分析方法、系统及存储介质 | |
Dong et al. | Image-based processing mechanism for peak load forecasting in smart grids | |
CN109816139B (zh) | 基于负荷细分的差异化用户基线负荷预测方法、装置及系统 | |
Popeangă | Data mining smart energy time series |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |