CN112308462A - 电力用户分类方法及装置 - Google Patents
电力用户分类方法及装置 Download PDFInfo
- Publication number
- CN112308462A CN112308462A CN202011325786.6A CN202011325786A CN112308462A CN 112308462 A CN112308462 A CN 112308462A CN 202011325786 A CN202011325786 A CN 202011325786A CN 112308462 A CN112308462 A CN 112308462A
- Authority
- CN
- China
- Prior art keywords
- power
- determining
- data
- clustering
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000011156 evaluation Methods 0.000 claims description 38
- 230000005611 electricity Effects 0.000 claims description 30
- 238000011835 investigation Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 abstract description 8
- 238000010219 correlation analysis Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力用户分类方法及装置。其中,该方法包括:获取电力用户的多个用户数据;对所述多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;计算每个第一集合中各个用户数据之间的相关性指标;依据所述相关性指标,从所述每个第一集合中确定关键数据;依据所述关键数据确定所述电力用户的类型。本发明解决了现有技术缺乏对指标信息重叠的问题的考虑,造成的分析结果泛化性差,无法为电力公司提供合理建议的技术问题。
Description
技术领域
本发明涉及电力运营领域,具体而言,涉及一种电力用户分类方法及装置。
背景技术
伴随着电力市场的逐步开放,电力用户的市场力逐步提升,电力用户的需求也开始呈现多样化和个性化。为了满足不同层次用户需求的服务需求,电力企业推行“互联网+供电服务”的深化应用以及网上国网的线上推广,为不同类型用户设定对应的运营策略和优惠服务,快速精准定位用户需求和问题,满足客户服务需求,为企业的规划计划、市场营销和经营决策提供信息和依据。
现有的客户分类是对客户的用电特征和成本进行分类认知,利用k-means聚类算法对客户进行聚类,实现对客户等级划分的差异性,从而获取不同用户的用电需求。这种方法在给客户分类时准确度较高,伹是缺乏对指标信息重叠的问题的考虑,易造成分析结果泛化性差,不具备说服力和适用性,导致未来用户等级划分水平准确性和科学性均可能存在较大误差,无法为电力公司提供合理建议。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种电力用户分类方法及装置,以至少解决现有技术缺乏对指标信息重叠的问题的考虑,造成的分析结果泛化性差,无法为电力公司提供合理建议的技术问题。
根据本发明实施例的一个方面,提供了一种对电力用户进行分类的方法,包括:获取电力用户的多个用户数据;对这些用户数据采用第一聚类算法进行聚类,得到多个第一集合;计算每个第一集合中各个用户数据之间的相关性指标;依据相关性指标,从每个第一集合中确定关键数据;依据关键数据确定电力用户的类型。
可选地,依据关键数据确定电力用户的类型,包括确定关键数据的权重,以及依据权重和关键数据确定电力用户的评价指标,其中,评价指标用于确定电力用户的重要程度;对各个电力用户的评价指标采用第二聚类算法进行聚类,得到电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第一集合与电力用户的类型是一一对应的。
可选地,对各个电力用户的评价指标采用第二聚类算法进行聚类包括:从各个电力用户的评价指标中选择任意一个评价指标作为核心指标;确定核心指标的邻域距离小于预设邻域阈值的评价指标,得到与第二聚类算法对应的第二集合,并基于第二集合确定分类结果。
可选地,确定关键数据的权重包括:计算关键数据的信息熵,基于信息熵确定所述关键数据的权重,其中,信息熵越大,权重越大。
可选地,多个用户数据包括电力数据和信用数据;电力数据包括以下至少之一:用电量、缴费次数、欠费天数、违约用电类别;信用指标数据包括以下至少之一:法院文书判决信息,征信指标,其中,征信指标用于表示所述电力用户的信用状况。
可选地,计算每个第一集合中各个用户数据之间的相关性指标包括:通过以下公式确定所述相关性指标:ρ表示所述相关性指标,x和分别表示变量x和y的均值。ρ绝对值的大小表示x与y之间相关关系的紧密程度;ρ的绝对值小于预设值时,则确定用户数据之间存在相关性,ρ的绝对值大于所述预设值时,则确定用户数据之间无相关性。
可选地,依据关键数据确定电力用户的类型之后,本方法还包括:获取电力用户所在供电网的负载状态;在负载状态满足预设条件时,依据电力用户的类型对电力用户的供电状态进行调整。
根据本发明实施例的另一方面,还提供了一种对电力用户进行分类的装置,包括:
获取模块,用于获取电力用户的多个用户数据;
聚类模块,用于对多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;
计算模块,用于计算每个第一集合中各个用户数据之间的相关性指标;
确定模块,用于依据相关性指标,从每个第一集合中确定关键数据;以及依据关键数据确定电力用户的类型。
可选地,确定模块还用于确定关键数据的权重,以及依据权重和关键数据确定电力用户的评价指标,其中,评价指标用于确定电力用户的重要程度;以及对各个电力用户的评价指标采用第二聚类算法进行聚类,得到电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第二集合与电力用户的类型是一一对应的。
在本发明实施例中,采用基于多种聚类算法和相关性分析的方式,通过收集电力用户的多项数据并从这些数据中提取关键评价指标,从而实现了快速准确的对电力用户进行分类的技术效果,进而解决了现有技术缺乏对指标信息重叠的问题的考虑,造成的分析结果泛化性差,无法为电力公司提供合理建议技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的对电力用户进行分类的方法的示意图;
图2是根据本发明实施例的一种可选的对电力用户进行分类的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种对电力用户进行分类的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的对电力用户进行分类的方法,如图1所示,该方法包括如下步骤:
步骤S102,获取电力用户的多个用户数据;
需要说明的是,获取的多个用户数据包括用户的电力数据和信用数据;电力电力数据包括以下至少之一:用电量、缴费次数、欠费天数、违约用电类别;信用数据包括以下至少之一:法院文书判决信息,征信指标,其中,征信指标用于表示电力用户的信用状况。
在本申请的一些实施例中,用户的电力数据可以通过查询电力公司历史数据库来得到,信用数据可以利用爬虫软件,从相关的网站中获取用户的信用数据。
需要说明的是,目前大多数数据都或多或少存在数据问题,都存在着不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘质量,在本申请的一些实施例中对电力数据进行以下操作:
用电客户档案表、用户用电量表、缴费记录表等电力数据通过CONS_ID、ID、CONS_NAME等字段进行数据关联,最终得到含有用户编号、用电类别编码、所属供电公司编码、用户用电量、缴费方式、实收时间、发行时间等用户电力数据的用电表;
筛选出所需字段,并对用户的用电数据进行去重处理,针对电力公司重复记录的情况,保留第一条用电数据;
如果用户用电量等数值型变量为空,则用均值或者数据特征规律填补变量缺失值,如果用户用电数据条数低于预设值,则删除该用户;
根据处理后的月度用电数据,计算出用户年度用电数据。
在本申请的一些实施例中,征信指标是基于评分卡模型原理,结合WOE(weight ofevidence)值和IV(information value)值,利用逻辑回归建立电力征信模型,得到每个用户的征信得分,征信指标。基于逻辑回归的信用评分模型形式如下:
其中使用WOE值的目的是将连续变量转化为离散变量,使用IV值的目的是将参考价值不大的变量去除。
上述公式中各个参数的含义或计算方式如下:
首先需要明确比率的概念,即假设某个事件发生的概率为P,则其不发生的概率为1-P,则该事件的比率odds=P/1-P,基于逻辑回归模型,可得:
log(odds)=β0+β1X1+……+βmXm (1)
模型参数β0和βi是用建模参数拟合模型得到的,一般可以使用极大似然法;
假设自变量Xi可以分为ni类,基于WOE计算公式,可以将变量Xi的计算公式重新表述为如下形式:
WOE(Xi)=δi1WOE(Xi1)+δi2WOE(Xi2)+……+δijWOE(Xij),j=1,2,……ni (2)
其中,δij为二元虚拟变量,即对于所有的j=1,2,……ni,如果Xi的取值为第j类,即Xi=xij,则δij=1,否则δij=0;
采用经过WOE变化后的WOE(Xi)代替原有的变量Xi,带入到公式(1)中,则可得:
log(odds)=β0+β1WOE(X1)+……+βmWOE(Xm) (3)
通过上述步骤可以看出,信用卡评分模型也可以写成如下的形式:
Score=A+Blog(odds)
其中常数A通常被称为补偿,常数B通常被称为刻度,要获取A和B的值,可以通过将两个已知或假设的分值带入上式得到。通常求解时需要以下两个假设:
a、在某个特定的比率设定特定的预期分值P0;
b、设定比率翻倍的分数PD0。
即设定比率为θ0时的分数为P0,比率为2θ0时的分数为PD0,带入上式,可得:
B=PD0/ln2,A=P0-Bln(θ0)。
之后可以通过将两个已知
步骤S104,对多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;
在本申请的一些实施例中,对多个用户数据进行聚类时采用的聚类方法为层次聚类R型聚类。层次聚类R型聚类是层次聚类的一种,对象的观察变量进行分类,它使具有共同特征的变量聚在一起,以便可以从不同类中分别选出具有代表性的变量作为分析,从而减少分析变量的个数。其基本步骤如下:
定义每个用户数据为一类;
计算每类和其他各类的距离;
把距离最短的两类合并成一类,这样类的个数就减少一类;
重复计算每类与其他各类的距离和把距离最短的两类合并成一类,直到包含所有观测值的类合并成单个的类为止。
通过以上步骤,可以对用户数据进行降维,减少需要分析的用户数据种类,既初步得到关键评价指标。但这些指标之间有的仍然是有相关性的,所以需要进行进一步的处理。
步骤S106,计算每个第一集合中各个用户数据之间的相关性指标;
在本申请的一些实施例中,计算每个第一集合中各个用户数据之间的相关性指标包括:通过以下公式确定所述相关性指标:ρ表示所述相关性指标,和分别表示变量x和y的均值。ρ绝对值的大小表示x与y之间相关关系的紧密程度;ρ的绝对值小于预设值时,则确定用户数据之间存在相关性,ρ的绝对值大于所述预设值时,则确定用户数据之间无相关性。
步骤S108,依据相关性指标,从每个第一集合中确定关键数据;
需要说明的是,任意两个关键数据之间都是无相关性的。
步骤S110,依据关键数据确定电力用户的类型。
在本申请的一些实施例中,可以通过以下方式确定电力用户的类型:确定关键数据的权重,以及依据权重和关键数据确定电力用户的评价指标,其中,评价指标用于确定所述电力用户的重要程度;对各个电力用户的评价指标采用第二聚类算法进行聚类,得到电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第二集合与电力用户的类型是一一对应的。
第二聚类算法可以是DBSCAN聚类算法,DBSCAN自适应聚类算法是一种基于密度的聚类算法,假定类别可以通过样本分布的紧密程度决定,同一类别的样本之间紧密相连,即在该类任意样本周围不远处一定有同类别的样本存在。通过紧密项相连的样本被划为一类,就得到了一个聚类的类别,通过将各组紧密相连的样本划到不同的类别,即实现了最终聚类的效果。
DBSCAN的基本假设是一个集群的密度要显著高于噪声点的密度。因此,其基本思想是对于集群中的每一个点,在给定的半径范围内,相邻点的数量必须超过预先设定的某一个阈值。DBSCAN算法(基于密度带噪声的空间聚类应用)可以聚类任意形状的簇以及对于大型空间数据库也是有效的。该算法通过搜索每个对象的周围环境和检查其是否包含大于对象的最小数目来搜索簇。
使用DBSCAN聚类算法对各个电力用户的评价指标聚类时,包括:从各个电力用户的评价指标中选择任意一个评价指标作为核心指标;确定核心指标的邻域距离小于预设邻域阈值的评价指标,得到与DBSCAN聚类算法对应的集合,并基于集合确定分类结果。
在本申请的一些实施例中,确定关键数据的权重时,可以采用熵权法确定,具体地:计算关键数据的信息熵,基于信息熵确定所述关键数据的权重,其中,信息熵越大,权重越大。
通过上述步骤,可以实现基于多种聚类算法和相关性分析,结合电力用户的多项数据,快速准确地对电力用户进行会员分类。还可以获取电力用户所在供电网的负载状态;在负载状态满足预设条件时,依据电力用户的类型对电力用户的供电状态进行调整。例如,依据分类结果,对优先级较高的电力用户,在该客户的用电高峰期时,供电公司会多分配一些资源确保该客户用电状态的稳定。
与现有技术相比,本发明的优点是:
借助层次聚类R型聚类和相关性分析分析出评价指标体系和电力分层运营模型的指标,不再仅仅以用户用电数据进行特征分析和规律挖掘。
通过多指标综合评价方法对电力用户进行综合评价,然后利用DBSCAN自适应聚类对用户进行会员分层,不仅仅可以得出各层用户之间的差异性,而且可以借助分层后的模型对未来的用户进行分类,提高用户的管理性。
下面利用企业用电数据,结合实例对本发明进行进一步说明。
数据准备
选取某市某区数据为例进行相关性和关联度分析,以2020年7月31日为时间窗口,样本数据涵盖户2381户企业用户。进一步筛选出2017年到2020年的1030户的用电数据用于评价指标体系及会员分层模型构建,并获取用户2017年到2020年的企业基本信息、法院失信人信息、企业股东及出资信息、法院裁判文书网信息等数据。
数据预处理
目前大多数数据或多或少都存在着不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘质量,本发明实施例对原始数据进行了如下操作:
用电客户档案表、用户用电量表、缴费记录表、外部数据表等十个表通过CONS_ID、ID、CONS_NAME等字段进行数据关联,最终得到含有用户编号、用电类别编码、所属供电公司编码、用户用电量、缴费方式、实收时间、发行时间等字段的用电表;
筛选出所需字段,并对企业用户的用电数据进行去重处理,针对电力公司重复记录的情况,保留第一条用电数据;
如果企业用户用电量等数值型变量为空,则用均值或者数据特征规律填补变量缺失值。如果企业用户用电数据条数低于35,则删除该用户;
4)根据处理后的月度用电数据,计算出企业用户年度用电数据。
评价指标体系构建
根据层级聚类R型聚类的分类原理,对用电量、月均预付费、缴费方式和欠费天数等变量进行聚类降维,提取出电量、欠费天数、征信评分等18项关键指标,然后利用相关系数的公式计算每2项关键指标之间的相关性系数,得出电费年度同比和欠费金额年度同比呈正相关,欠费占比与征信评分呈正相关等,对18项关键指标进行更进一步的降维。
基于层级聚类R型聚类和相关性分析的结果,选择用电量、月均预付费、电费年度同比、增减容次数和法律裁判文书网评分FG等12项指标作为评价指标体系的关键指标。
通过熵权法计算出12项指标的权重值,利用多指标综合评价方法计算出每个用户的综合评分,然后利用DBSCAN自适应聚类对用户进行会员分层,并为不同层次会员需求建立会员个性化服务体系,制定精准化电力营销策略,提升公司客户优质服务水平。综合评分的公式如下:
其中,i=1,2,…,1030,sorcei表示电力客户i的评分,ωj表示指标j的权重,xij表示客户i的指标j的取值。
图2是一种对电力用户进行会员分类的装置,用于实现图1所述的方法,如图2所示,该装置包括:获取模块202,用于获取电力用户的多个用户数据;聚类模块204,用于对多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;计算模块206,用于计算每个第一集合中各个用户数据之间的相关性指标;确定模块208,用于依据相关性指标,从每个第一集合中确定关键数据;以及依据关键数据确定电力用户的类型。
在本申请的一些实施例中,图2中的确定模块208还用于确定关键数据的权重,以及依据权重和关键数据确定电力用户的评价指标,其中,评价指标用于确定电力用户的重要程度;以及对各个电力用户的评价指标采用第二聚类算法进行聚类,得到电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第二集合与电力用户的类型是一一对应的。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种对电力用户分类的方法,其特征在于,
获取电力用户的多个用户数据;
对所述多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;
计算每个第一集合中各个用户数据之间的相关性指标;
依据所述相关性指标,从所述每个第一集合中确定关键数据;
依据所述关键数据确定所述电力用户的类型。
2.依据权利要求1所述方法,其特征在于,依据所述关键数据确定所述电力用户的类型,包括:
确定所述关键数据的权重,以及依据所述权重和所述关键数据确定所述电力用户的评价指标,其中,所述评价指标用于确定所述电力用户的重要程度;
对各个电力用户的评价指标采用第二聚类算法进行聚类,得到所述电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第一集合与电力用户的类型是一一对应的。
3.依据权利要求2所述方法,其特征在于,对各个电力用户的评价指标采用第二聚类算法进行聚类,包括:
从所述各个电力用户的评价指标中选择任意一个评价指标作为核心指标;
并确定所述核心指标的邻域距离小于预设邻域阈值的评价指标,得到与所述第二聚类算法对应的第二集合,并基于所述第二集合确定所述分类结果。
4.依据权利要求2所述方法,其特征在于,确定所述关键数据的权重,包括:
计算所述关键数据的信息熵,基于所述信息熵确定所述关键数据的权重,其中,所述信息熵越大,权重越大。
5.依据权利要求1所述方法,其特征在于,
所述多个用户数据包括电力数据和信用数据;
所述电力数据包括以下至少之一:用电量、缴费次数、欠费天数、违约用电类别;
所述信用指标数据包括以下至少之一:法院文书判决信息,征信指标,其中,所述征信指标用于表示所述电力用户的信用状况。
7.依据权利要求5所述方法,其特征在于,ρ的绝对值小于预设值时,则确定用户数据之间存在相关性,ρ的绝对值大于所述预设值时,则确定所述用户数据之间无相关性。
8.依据权利要求5所述方法,其特征在于,依据所述关键数据确定所述电力用户的类型之后,所述方法还包括:
获取所述电力用户所在供电网的负载状态;
在所述负载状态满足预设条件时,依据所述电力用户的类型对所述电力用户的供电状态进行调整。
9.一种对电力用分类的装置,其特征在于:
获取模块,用于获取电力用户的多个用户数据;
聚类模块,用于对所述多个用户数据采用第一聚类算法进行聚类,得到多个第一集合;
计算模块,用于计算每个第一集合中各个用户数据之间的相关性指标;
确定模块,用于依据所述相关性指标,从所述每个第一集合中确定关键数据;以及依据所述关键数据确定所述电力用户的类型。
10.依据权利要求9所述的装置,其特征在于,所述确定模块,还用于确定所述关键数据的权重,以及依据所述权重和所述关键数据确定所述电力用户的评价指标,其中,所述评价指标用于确定所述电力用户的重要程度;以及对各个电力用户的评价指标采用第二聚类算法进行聚类,得到所述电力用户的分类结果,其中,采用第二聚类算法进行聚类得到的每个第二集合与电力用户的类型是一一对应的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011325786.6A CN112308462A (zh) | 2020-11-23 | 2020-11-23 | 电力用户分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011325786.6A CN112308462A (zh) | 2020-11-23 | 2020-11-23 | 电力用户分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112308462A true CN112308462A (zh) | 2021-02-02 |
Family
ID=74335444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011325786.6A Pending CN112308462A (zh) | 2020-11-23 | 2020-11-23 | 电力用户分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308462A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801543A (zh) * | 2021-03-10 | 2021-05-14 | 海南电网有限责任公司信息通信分公司 | 一种多元用电客户信用评估管理系统 |
CN112801542A (zh) * | 2021-03-09 | 2021-05-14 | 海南电网有限责任公司信息通信分公司 | 用电客户信用评估方法 |
CN112907100A (zh) * | 2021-03-09 | 2021-06-04 | 北京光速斑马数据科技有限公司 | 一种服务需求的测量方法、装置和电子设备 |
CN113034153A (zh) * | 2021-03-26 | 2021-06-25 | 支付宝(杭州)信息技术有限公司 | 一种基于共享学习的被欺诈风险识别方法、装置及设备 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
CN113780452A (zh) * | 2021-09-16 | 2021-12-10 | 国网北京市电力公司 | 独居群体的监控方法、监控装置以及电子设备 |
CN116188622A (zh) * | 2022-12-08 | 2023-05-30 | 北京国电通网络技术有限公司 | 电力指标信息展示方法、装置、电子设备和计算机介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103207944A (zh) * | 2013-02-04 | 2013-07-17 | 国家电网公司 | 一种电力统计指标关联性分析方法 |
CN103839197A (zh) * | 2014-03-19 | 2014-06-04 | 国家电网公司 | 一种基于eemd方法的用户用电行为异常的判定方法 |
CA2941604A1 (en) * | 2016-09-12 | 2018-03-12 | Ebrahim BAGHERI | System and method for temporal identification of latent communities using electronic content |
CN111738462A (zh) * | 2020-06-08 | 2020-10-02 | 国网江苏省电力有限公司常州供电分公司 | 电力计量装置故障抢修主动服务预警方法 |
-
2020
- 2020-11-23 CN CN202011325786.6A patent/CN112308462A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103207944A (zh) * | 2013-02-04 | 2013-07-17 | 国家电网公司 | 一种电力统计指标关联性分析方法 |
CN103839197A (zh) * | 2014-03-19 | 2014-06-04 | 国家电网公司 | 一种基于eemd方法的用户用电行为异常的判定方法 |
CA2941604A1 (en) * | 2016-09-12 | 2018-03-12 | Ebrahim BAGHERI | System and method for temporal identification of latent communities using electronic content |
CN111738462A (zh) * | 2020-06-08 | 2020-10-02 | 国网江苏省电力有限公司常州供电分公司 | 电力计量装置故障抢修主动服务预警方法 |
Non-Patent Citations (1)
Title |
---|
王莉芳等: "《基于客户细分及价值评价的电力资源缴费模式》", vol. 1, 西北工业大学出版社, pages: 94 - 88 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801542A (zh) * | 2021-03-09 | 2021-05-14 | 海南电网有限责任公司信息通信分公司 | 用电客户信用评估方法 |
CN112907100A (zh) * | 2021-03-09 | 2021-06-04 | 北京光速斑马数据科技有限公司 | 一种服务需求的测量方法、装置和电子设备 |
CN112907100B (zh) * | 2021-03-09 | 2024-05-14 | 北京光速斑马数据科技有限公司 | 一种服务需求的测量方法、装置和电子设备 |
CN112801543A (zh) * | 2021-03-10 | 2021-05-14 | 海南电网有限责任公司信息通信分公司 | 一种多元用电客户信用评估管理系统 |
CN113034153A (zh) * | 2021-03-26 | 2021-06-25 | 支付宝(杭州)信息技术有限公司 | 一种基于共享学习的被欺诈风险识别方法、装置及设备 |
CN113449793A (zh) * | 2021-06-28 | 2021-09-28 | 国网北京市电力公司 | 用电状态的确定方法及装置 |
CN113780452A (zh) * | 2021-09-16 | 2021-12-10 | 国网北京市电力公司 | 独居群体的监控方法、监控装置以及电子设备 |
CN116188622A (zh) * | 2022-12-08 | 2023-05-30 | 北京国电通网络技术有限公司 | 电力指标信息展示方法、装置、电子设备和计算机介质 |
CN116188622B (zh) * | 2022-12-08 | 2023-09-12 | 北京国电通网络技术有限公司 | 电力指标信息展示方法、装置、电子设备和计算机介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308462A (zh) | 电力用户分类方法及装置 | |
CN110704572B (zh) | 疑似非法集资风险的预警方法、装置、设备和存储介质 | |
CN108256691A (zh) | 还款概率预测模型构建方法及装置 | |
CN104321794B (zh) | 一种使用多维评级来确定一实体的未来商业可行性的系统和方法 | |
CN110069623A (zh) | 摘要文本生成方法、装置、存储介质和计算机设备 | |
CN111709613A (zh) | 基于数据统计的任务自动分配方法、装置及计算机设备 | |
CN112632405B (zh) | 一种推荐方法、装置、设备及存储介质 | |
CN108388955A (zh) | 基于随机森林和逻辑回归的客户服务策略制定方法、装置 | |
CN107248023B (zh) | 一种对标企业名单的筛选方法和装置 | |
CN111127105A (zh) | 用户分层模型构建方法及系统、运营分析方法及系统 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
CN108564423A (zh) | 票务订单的恶意占位识别方法、系统、设备和存储介质 | |
CN107622326A (zh) | 用户分类、可用资源预测方法、装置及设备 | |
CN115577152A (zh) | 基于数据分析的在线图书借阅管理系统 | |
CN112365339A (zh) | 一种中小企业商业价值信用贷款额度判定方法 | |
CN105786810B (zh) | 类目映射关系的建立方法与装置 | |
CN113450004A (zh) | 电力信用报告生成方法、装置、电子设备及可读存储介质 | |
CN113920366A (zh) | 一种基于机器学习的综合加权主数据识别方法 | |
CN109522934A (zh) | 一种基于聚类算法的电力用户聚类方法 | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN116523301A (zh) | 基于电商大数据进行风险评级预测的系统 | |
CN114265887A (zh) | 一种维度数据处理方法、装置、存储介质及电子设备 | |
CN114219611A (zh) | 贷款额度计算方法、装置、计算机设备和存储介质 | |
Xiahou et al. | Customer profitability analysis of automobile insurance market based on data mining | |
WO1992017853A2 (en) | Direct data base analysis, forecasting and diagnosis method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |