CN111783827B - 一种基于负荷数据的企业用户分类方法和装置 - Google Patents
一种基于负荷数据的企业用户分类方法和装置 Download PDFInfo
- Publication number
- CN111783827B CN111783827B CN202010463757.XA CN202010463757A CN111783827B CN 111783827 B CN111783827 B CN 111783827B CN 202010463757 A CN202010463757 A CN 202010463757A CN 111783827 B CN111783827 B CN 111783827B
- Authority
- CN
- China
- Prior art keywords
- load data
- enterprise
- classification
- electricity
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 230000005611 electricity Effects 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 35
- 238000000513 principal component analysis Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 26
- 238000013138 pruning Methods 0.000 claims description 25
- 238000004458 analytical method Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 20
- 238000003066 decision tree Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000006399 behavior Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种基于负荷数据的企业用户分类方法和装置,其中,所述方法包括:获取企业用户的用电负荷数据;对所述用电负荷数据进行主成分分析,获得目标负荷数据;将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果;基于所述分类结果进行企业分类,综合分析各个企业类别。采用本发明所述的基于负荷数据的企业用户分类方法,能够基于电力数据特性分析企业用电行为,合理防范企业不规范用电,实现对企业的精准分类,提高电网运行的安全可靠性,同时便于对企业用电进行管控。
Description
技术领域
本发明实施例涉及大数据处理技术领域,具体涉及一种基于负荷数据的企业用户分类方法和装置,另外还涉及一种电子设备和计算机可读存储介质。
背景技术
近年来,随着经济社会的快速发展,企业的用电需求量呈现指数增长趋势,同时也出现了不符合规定的企业用电行为,其不仅会损害电力企业的利益,也会造成安全事故的出现。因此,如何利用电力数据特性分析企业用电行为,合理防范企业不规范用电成为电力公司关注的重点。
目前,常见的基于负荷数据的企业分类方法有:基于统计方法的负荷企业分类、基于神经网络的负荷分类、基于专家经验的负荷分类。然而,基于统计方法的负荷分类主要是选用有监督分类算法或无监督聚类算法来分析负荷数据的规律,进而对负荷数据进行分类,缺乏一定的经验知识,过度依赖数据规律,适合用电数据较规律的企业分析;基于神经网络的负荷分类则是选用模拟人的大脑皮层的神经网络进行计算,但是神经网络属于黑盒计算,过程无法透明化,因此对先验知识要求较高。基于专家经验的负荷分类则过重依赖于专家经验,普及性和处理效率都存在于一定的局限性,满足不了当前的企业的需求量。
发明内容
为此,本发明实施例提供一种基于负荷数据的企业用户分类方法,以解决现有技术中存在的利用电力数据特性分析企业用电行为局限性较大,无法有效满足当前用户实际需求的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供一种基于负荷数据的企业用户分类方法,包括:获取企业用户的用电负荷数据;对所述用电负荷数据进行主成分分析,获得目标负荷数据;将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果;基于所述分类结果进行企业分类,综合分析各个企业类别。
进一步的,对所述用电负荷数据进行主成分分析,获得目标负荷数据,具体包括:将所述用电负荷数据以短期时间进行主成分分析,提取短期负荷数据的主成分,获得短期时间内负荷数据的规律和波动特征;根据短期时间内负荷数据的规律和波动特征以及周期性参考因素,分析企业的长期负荷数据,获得目标负荷数据。
进一步的,对所述用电负荷数据进行主成分分析,获得目标负荷数据,具体包括:对所述用电负荷数据进行标准化处理;计算日负荷数据对应的相关系数矩阵;计算主成分贡献率以及累计贡献率;选择累计贡献率达到或者超过预设百分比阈值的特征值作为主成分;选取主成分对应的特征向量组成矩阵,最终计算可得到降维之后的目标数据集,将所述数据集作为目标负荷数据。
进一步的,所述的基于负荷数据的企业用户分类方法,还包括:对所述目标负荷数据进行预处理;判断预处理之后的目标负荷数据是否合格,若是,则将所述目标负荷数据作为分析样本,输入到预设的基于LightGBM算法和负荷数据的负荷分类器模型中进行分析。
进一步的,所述负荷分类器模型包括:基学习器学习、基学习器集成以及集成模型优化三个阶段。
进一步的,在所述基学习器学习阶段,采用基于CART算法的决策树作为LightGBM集成算法的基学习器对目标负荷数据进行处理,所述基学习器的建树过程包括节点分裂和剪枝处理;其中,所述节点分裂通过Gini指数选取最优划分节点,所述剪枝处理则采用后剪枝和预剪枝两种方法;在所述基学习器集成阶段,采用Boosting机器学习算法的迭代法,在每一层在训练的时候,对前一层及基分类器分错的样本给予更高的权重,逐步聚焦于基分类器出错的样本,减少负荷分类器模型的偏差;在所述集成模型优化阶段,利用LightGBM算法对代价函数运用泰勒二阶展开式计算,并加入正则化在控制模型的泛化能力的基础上进行改进处理。
进一步的,在所述集成模型优化阶段,利用LightGBM算法,基于预设的梯度单边采样技术和独立特征合并技术进行优化处理。
第二方面,本发明实施例还提供一种基于负荷数据的企业用户分类装置,包括:企业负荷数据获取单元,用于获取企业用户的用电负荷数据;分析处理单元,用于对所述用电负荷数据进行主成分分析,获得目标负荷数据;分类器分类单元,用于将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果;企业分类单元,用于基于所述分类结果进行企业分类,综合分析各个企业类别。
进一步的,分析处理单元具体用于:将所述用电负荷数据以短期时间进行主成分分析,提取短期负荷数据的主成分,获得短期时间内负荷数据的规律和波动特征;根据短期时间内负荷数据的规律和波动特征以及周期性参考因素,分析企业的长期负荷数据,获得目标负荷数据。
进一步的,分析处理单元具体用于:对所述用电负荷数据进行标准化处理;计算日负荷数据对应的相关系数矩阵;计算主成分贡献率以及累计贡献率;选择累计贡献率达到或者超过预设百分比阈值的特征值作为主成分;选取主成分对应的特征向量组成矩阵,最终计算可得到降维之后的目标数据集,将所述数据集作为目标负荷数据。
进一步的,所述的基于负荷数据的企业用户分类装置,还包括:预处理单元,用于对所述目标负荷数据进行预处理;判断单元,用于判断预处理之后的目标负荷数据是否合格,若是,则将所述目标负荷数据作为分析样本,输入到预设的基于LightGBM算法和负荷数据的负荷分类器模型中进行分析。
进一步的,所述负荷分类器模型包括:基学习器学习、基学习器集成以及集成模型优化三个阶段。
进一步的,在所述基学习器学习阶段,采用基于CART算法的决策树作为LightGBM集成算法的基学习器对目标负荷数据进行处理,所述基学习器的建树过程包括节点分裂和剪枝处理;其中,所述节点分裂通过Gini指数选取最优划分节点,所述剪枝处理则采用后剪枝和预剪枝两种方法;在所述基学习器集成阶段,采用Boosting机器学习算法的迭代法,在每一层在训练的时候,对前一层及基分类器分错的样本给予更高的权重,逐步聚焦于基分类器出错的样本,减少负荷分类器模型的偏差;在所述集成模型优化阶段,利用LightGBM算法对代价函数运用泰勒二阶展开式计算,并在加入正则化控制模型的泛化能力的基础上进行改进处理。
进一步的,在所述集成模型优化阶段,利用LightGBM算法,基于预设的梯度单边采样技术和独立特征合并技术进行优化处理。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器;其中,所述存储器,用于存储基于负荷数据的企业用户分类方法的程序,该电子设备通电并通过所述处理器运行该基于负荷数据的企业用户分类方法的程序后,执行上述所述的任意一项所述的基于负荷数据的企业用户分类方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行上述基于负荷数据的企业用户分类方法中任一项所述的方法。
采用本发明所述的基于负荷数据的企业用户分类方法,能够基于电力数据特性分析企业用电行为,合理防范企业不规范用电,实现对企业的精准分类,提高电网运行的安全可靠性,同时便于对企业用电进行管控。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本发明实施例提供的一种基于负荷数据的企业用户分类方法的流程图;
图2为本发明实施例提供的一种基于负荷数据的企业用户分类装置的示意图;
图3为本发明实施例提供的一种电子设备的示意图;
图4为本发明实施例提供的一种基于负荷数据的企业用户分类方法的完整流程图;
图5为本发明实施例提供的一种基于负荷数据的企业用户分类方法中的基学习器决策树流程图;
图6为本发明实施例提供的一种基于负荷数据的企业用户分类方法中目标负荷数据的分布示意图;
图7为本发明实施例提供的一种基于负荷数据的企业用户分类方法中不同类别的企业用户分布示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面基于本发明所述的一种基于负荷数据的企业用户分类方法,对其实施例进行详细描述。如图1所示,其为本发明实施例提供的一种基于负荷数据的企业用户分类方法的流程图,具体实现过程包括以下步骤:
步骤S101:获取企业用户的用电负荷数据。
步骤S102:对所述用电负荷数据进行主成分分析,获得目标负荷数据。
在步骤S101中获取企业用户的用电负荷数据之后,在本步骤中可对所述用电负荷数据进行主成分分析获得目标负荷数据。
在本发明实施例中,对所述用电负荷数据进行主成分分析,获得目标负荷数据,具体实现过程可以包括:将所述用电负荷数据以短期时间进行主成分分析,提取短期负荷数据的主成分,获得短期时间内负荷数据的规律和波动特征;根据短期时间内负荷数据的规律和波动特征以及周期性参考因素,分析企业的长期负荷数据,获得目标负荷数据。具体的,可首先对所述用电负荷数据进行标准化处理;计算日负荷数据对应的相关系数矩阵;计算主成分贡献率以及累计贡献率;选择累计贡献率达到或者超过预设百分比阈值的特征值作为主成分;选取主成分对应的特征向量组成矩阵,最终计算可得到降维之后的目标数据集,将所述数据集作为目标负荷数据(如图6所示)。
比如获取某企业一年的负荷数据,先将负荷数据以短期时间进行分析,用主成分分析提取出负荷数据的规律和波动特征,再考虑订单周期性和交易量等周期性参考因素分析长期负荷数据,完成数据提取和处理。在具体实施过程中,考虑到日负荷数据的维数,需要先对数据进行降维操作,减少冗余数据,进行主成分分析,即首先对负荷数据进行标准化处理,以减少量纲的影响。日负荷数据原变量指标为x1,x2,...,xp,标准化处理之后,新变量指标为z1,z2,...,zp,其中p为日负荷点数。计算日负荷数据相关系数矩阵为:
其中,m为日负荷天数,p为日负荷点数。
解相关系数R的特征方程|λI-R|=0,求特征值λi(i=1,...,p)和特征向量ei(i=1,...,p)。计算主成分贡献率和累计贡献率,其中主成分贡献率为:
累计贡献率为:
选择累计贡献率达85%-95%的特征值λi(i=1,...,m)为m个主成分,选取主成分对应的特征向量组成矩阵Wm,最终计算可得到降维之后的数据集D,将所述数据集作为目标负荷数据。
D=Wpm×Znp
其中,m为主成分个数,n为样本数量,p为日负荷数据维数。
进一步的,在本发明实施例中,还可对所述目标负荷数据进行预处理;判断预处理之后的目标负荷数据是否合格,若是,则将所述目标负荷数据作为分析样本,输入到预设的基于LightGBM算法和负荷数据的负荷分类器模型中进行分析。
步骤S103:将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果。
在步骤S102中获得目标负荷数据之后,在本步骤中可基于负荷分类器模型负荷分类器模型对所述样本进行分析。
在本发明实施例中,所述负荷分类器模型包括:基学习器学习、基学习器集成以及集成模型优化三个阶段。
在所述基学习器学习阶段,采用基于CART算法的决策树作为LightGBM集成算法的基学习器对目标负荷数据进行处理,所述基学习器的建树过程包括节点分裂和剪枝处理;其中,所述节点分裂通过Gini指数选取最优划分节点,所述剪枝处理则采用后剪枝和预剪枝两种方法。
在具体实施过程中,选用CART决策树作为LightGBM集成算法的基学习器,该CART决策树是一种自上而下对样本数据进行树形分类的过程。由于负荷数据属于连续型变量,因此选用CART决策树来进行建树过程。CART决策树包含一个根节点,若干个内部结点或若干个叶节点,叶节点代表决策结果,其他节点代表一个特征或属性,决策树的建立一般分成节点分裂、剪枝处理两部分。具体如图5所示,其中,节点分裂是采用二元法对特征数据进行分割,考虑到负荷数据属于连续型数据,针对于某一特性来说,设置一个阈值,将数据集X分为X+和X-,计算数据的Gini指数,选择Gini指数最小的特征为当前分裂节点,模拟建树过程。剪枝处理分为预剪枝和后剪枝,预剪枝是在决策树中节点进行扩展之间,先计算当前的划分是否能提升模型的泛化能力,如果不能,则停止节点划分。后剪枝是先让节点正常分裂形成一棵完全生长的决策树,然后把该决策树划分成一系列子树,通过计算子树的代价复杂度剪枝来判断时候需要剪枝处理,若剪枝,则将子树替换成一个叶节点,该节点的决策结果通过多数投票实现。
在所述基学习器集成阶段,采用Boosting机器学习算法的迭代法,在每一层在训练的时候,对前一层及基分类器分错的样本给予更高的权重,逐步聚焦于基分类器出错的样本,减少负荷分类器模型的偏差,在此不再展开赘述。
在所述集成模型优化阶段,利用LightGBM算法对代价函数运用泰勒二阶展开式计算,并加入正则化控制模型的泛化能力的基础上进行改进处理,从而减少了模型训练的时间复杂度和空间复杂度。需要说明的是,在所述集成模型优化阶段,利用LightGBM算法,基于预设的梯度单边采样技术(Gradient-based One-Side Sampling,简称:GOSS)和独立特征合并技术进行优化处理(Exclusive Feature Bundling,简称:EFB)。在具体实施过程中,关于GOSS,梯度大的样本点在信息增益的计算中有着主要的作用,也就是说梯度值大的样本点会贡献更多的信息增益,因此为了保持信息增益评估的精度,当对样本进行下采样的时候选择这些梯度大的样本点,而对于梯度小的样本点按比例进行随机采样。关于EFB,将互斥的特征捆绑在少数密集特征上,以减少特征的数量和避免零特征值的计算。为了解决互斥特征的捆绑优化,引入直方图算法,将连续型的特征值离散化生成直方图,然后遍历放置过互斥特征的直方图区间寻找最优分割点。因此,可以在不破坏点分割准确性的前提下减少特征的数量。
步骤S104:基于所述分类结果进行企业分类,综合分析各个企业类别。
在步骤S103中获得基于企业用户用电负荷数据特性的分类结果之后,在本步骤中可进一步基于所述分类结果进行企业分类,获得各个企业用户类别的分布数据(如图7所示)。在具体实施过程中,可通过不同的颜色表示不同的企业用户类别及其分布位置。
在本发明实施例中,基于LightGBM算法和负荷数据的企业分类器模型在实际应用中能够综合分析各个企业类别,合理管理企业用电,在保障电力公司利益的同时,维护企业安全用电,减少安全事故的发生,更能为未来的电网规划工作提供有力支撑。因此,采用本发明所述的基于负荷数据的企业用户分类方法,能够基于电力数据特性分析企业用电行为,合理防范企业不规范用电,实现对企业的精准分类,提高电网运行的安全可靠性,同时便于对企业用电进行管控。
与上述提供的一种基于负荷数据的企业用户分类方法相对应,本发明还提供一种基于负荷数据的企业用户分类装置。由于该装置的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的基于负荷数据的企业用户分类装置的实施例仅是示意性的。请参考图2所示,其为本发明实施例提供的一种基于负荷数据的企业用户分类装置的示意图。
本发明所述的一种基于负荷数据的企业用户分类装置包括如下部分:
企业负荷数据获取单元201,用于获取企业用户的用电负荷数据。
分析处理单元202,用于对所述用电负荷数据进行主成分分析,获得目标负荷数据。
分类器分类单元203,用于将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果。
企业分类单元204,用于基于所述分类结果进行企业分类,综合分析各个企业类别。
采用本发明所述的基于负荷数据的企业用户分类装置,能够基于电力数据特性分析企业用电行为,合理防范企业不规范用电,实现对企业的精准分类,提高电网运行的安全可靠性,同时便于对企业用电进行管控。
与上述提供的一种基于负荷数据的企业用户分类方法相对应,本发明还提供一种电子设备。由于该电子设备的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的电子设备仅是示意性的。如图3所示,其为本发明实施例提供的一种电子设备的示意图。
该电子设备具体包括:处理器301和存储器302;其中,存储器302用于运行一个或多个程序指令,用于存储基于负荷数据的企业用户分类方法的程序,该服务器通电并通过所述处理器301运行该基于负荷数据的企业用户分类方法的程序后,执行上述任意一项所述的基于负荷数据的企业用户分类方法。
与上述提供的一种基于负荷数据的企业用户分类方法相对应,本发明还提供一种计算机存储介质。由于该计算机存储介质的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的计算机存储介质仅是示意性的。
所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行上述所述的基于负荷数据的企业用户分类方法。所述的服务器可以是指与上述电子设备对应的后台服务器。
在本发明实施例中,处理器或处理器模块可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器(Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,简称SLDRAM)和直接内存总线随机存取存储器(Direct Ram bus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (5)
1.一种基于负荷数据的企业用户分类方法,其特征在于,包括:
获取企业用户的用电负荷数据;
对所述用电负荷数据进行主成分分析,获得目标负荷数据;
将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果;
基于所述分类结果进行企业分类,综合分析各个企业类别;
对所述用电负荷数据进行主成分分析,获得目标负荷数据,具体包括:
将所述用电负荷数据以短期时间进行主成分分析,提取短期负荷数据的主成分,获得短期时间内负荷数据的规律和波动特征;
根据短期时间内负荷数据的规律和波动特征以及周期性参考因素,分析企业的长期负荷数据,获得目标负荷数据;
对所述用电负荷数据进行主成分分析,获得目标负荷数据,具体包括:
对所述用电负荷数据进行标准化处理;
计算日负荷数据对应的相关系数矩阵;
计算主成分贡献率以及累计贡献率;
选择累计贡献率达到或者超过预设百分比阈值的特征值作为主成分;
选取主成分对应的特征向量组成矩阵,最终计算可得到降维之后的目标数据集,将所述数据集作为目标负荷数据;
还包括:
对所述目标负荷数据进行预处理;
判断预处理之后的目标负荷数据是否合格,若是,则将所述目标负荷数据作为分析样本,输入到预设的基于LightGBM算法和负荷数据的负荷分类器模型中进行分析;
所述负荷分类器模型包括:基学习器学习、基学习器集成以及集成模型优化三个阶段;
在所述基学习器学习阶段,采用基于CART算法的决策树作为LightGBM集成算法的基学习器对目标负荷数据进行处理,所述基学习器的建树过程包括节点分裂和剪枝处理;其中,所述节点分裂通过Gini指数选取最优划分节点,所述剪枝处理则采用后剪枝和预剪枝两种方法;
在所述基学习器集成阶段,采用Boosting机器学习算法的迭代法,在每一层在训练的时候,对前一层及基分类器分错的样本给予更高的权重,逐步聚焦于基分类器出错的样本,减少负荷分类器模型的偏差;
在所述集成模型优化阶段,利用LightGBM算法对代价函数运用泰勒二阶展开式计算,并加入正则化在控制模型的泛化能力的基础上进行改进处理。
2.根据权利要求1所述的企业用户分类方法,其特征在于,包括:在所述集成模型优化阶段,利用LightGBM算法,基于预设的梯度单边采样技术和独立特征合并技术进行优化处理。
3.一种用于权利要求1所述方法的基于负荷数据的企业用电行为分类装置,其特征在于,包括:
企业负荷数据获取单元,用于获取企业用户的用电负荷数据;
分析处理单元,用于对所述用电负荷数据进行主成分分析,获得目标负荷数据;
分类器分类单元,用于将所述目标负荷数据作为样本,利用预设的基于LightGBM算法和负荷数据的负荷分类器模型对所述样本进行分析,获得基于企业用户用电负荷数据特性的分类结果;
企业分类单元,用于基于所述分类结果进行企业分类,综合分析各个企业类别。
4. 一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储企业用户分类方法的程序,该电子设备通电并通过所述处理器运行该企业用户分类方法的程序后,执行上述权利要求1-2任意一项所述的企业用户分类方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行如权利要求1-2任一项所述的企业用户分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010463757.XA CN111783827B (zh) | 2020-05-27 | 2020-05-27 | 一种基于负荷数据的企业用户分类方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010463757.XA CN111783827B (zh) | 2020-05-27 | 2020-05-27 | 一种基于负荷数据的企业用户分类方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783827A CN111783827A (zh) | 2020-10-16 |
CN111783827B true CN111783827B (zh) | 2024-07-19 |
Family
ID=72753434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010463757.XA Active CN111783827B (zh) | 2020-05-27 | 2020-05-27 | 一种基于负荷数据的企业用户分类方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783827B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298422B (zh) * | 2021-06-16 | 2023-01-31 | 福建亿力优能电力科技有限公司 | 一种基于用电数据的污染源企业违规生产监控方法 |
CN114155038B (zh) * | 2021-12-09 | 2024-05-31 | 国网河北省电力有限公司营销服务中心 | 受疫情影响用户识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN111178587A (zh) * | 2019-12-06 | 2020-05-19 | 广东工业大学 | 一种基于spark框架的短期电力负荷快速预测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100987168B1 (ko) * | 2008-10-31 | 2010-10-11 | 한국전력공사 | 원격계측 전력 부하패턴의 분류 및 예측 방법 |
CN106355515A (zh) * | 2016-09-08 | 2017-01-25 | 广东工业大学 | 一种电力负荷的分类方法及系统 |
KR101998559B1 (ko) * | 2017-12-07 | 2019-07-10 | 한국생산기술연구원 | 딥 러닝과 웨이블렛 변환을 이용한 회전체의 고장 진단 시스템 |
US11354601B2 (en) * | 2018-03-16 | 2022-06-07 | Ricoh Company, Ltd. | Learning classification device and learning classification method |
CN110825723B (zh) * | 2019-10-09 | 2023-04-25 | 上海电力大学 | 一种基于用电负荷分析的居民用户分类方法 |
CN110956269B (zh) * | 2019-10-12 | 2024-05-10 | 平安科技(深圳)有限公司 | 数据模型的生成方法、装置、设备以及计算机存储介质 |
CN111126498A (zh) * | 2019-12-25 | 2020-05-08 | 国网河北省电力有限公司 | 一种基于分类分析的客户用电行为特征分析方法 |
-
2020
- 2020-05-27 CN CN202010463757.XA patent/CN111783827B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN111178587A (zh) * | 2019-12-06 | 2020-05-19 | 广东工业大学 | 一种基于spark框架的短期电力负荷快速预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111783827A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wen et al. | Stock market trend prediction using high-order information of time series | |
Bianchi et al. | Short-term electric load forecasting using echo state networks and PCA decomposition | |
CN112330078B (zh) | 用电量预测方法、装置、计算机设备和存储介质 | |
CN111783827B (zh) | 一种基于负荷数据的企业用户分类方法和装置 | |
CN112052684A (zh) | 电力计量的命名实体识别方法、装置、设备和存储介质 | |
CN111581877A (zh) | 样本模型训练方法、样本生成方法、装置、设备及介质 | |
CN114048468A (zh) | 入侵检测的方法、入侵检测模型训练的方法、装置及介质 | |
Wang | A stock price prediction method based on BiLSTM and improved transformer | |
CN112215398A (zh) | 电力用户负荷预测模型建立方法、装置、设备及存储介质 | |
Zhang et al. | An effective transformation-encoding-attention framework for multivariate time series anomaly detection in iot environment | |
CN114021425A (zh) | 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质 | |
CN113222281A (zh) | 基于改进AlexNet-GRU模型的配电网短期负荷预测方法及装置 | |
CN116777646A (zh) | 基于人工智能的风险识别方法、装置、设备及存储介质 | |
CN114357160B (zh) | 基于生成传播结构特征的早期谣言检测方法及装置 | |
CN115358473A (zh) | 基于深度学习的电力负荷预测方法及预测系统 | |
CN115526420A (zh) | 一种基于外部影响因素关联性的电力负荷预测方法及系统 | |
Wang et al. | Short‐term load forecasting based on VMD and combined deep learning model | |
CN115423091A (zh) | 一种条件对抗神经网络训练方法、场景生成方法和系统 | |
CN110210518B (zh) | 提取降维特征的方法和装置 | |
CN112308299B (zh) | 用于电力系统负荷预测模型的样本数据提取方法和装置 | |
Luo et al. | A novel multi-task learning method for evaluating short-term voltage stability with incomplete PMU measurements | |
CN118070134B (zh) | 一种园区内用户用电能耗预测方法及系统 | |
Yang et al. | Online Robust Reduced-Rank Regression | |
CN116340765B (zh) | 一种窃电用户预测方法、装置、存储介质及电子设备 | |
CN116341759A (zh) | 一种预测短期电力负荷的方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |