CN112990721A - 一种基于缴费行为的电力用户价值分析方法及系统 - Google Patents
一种基于缴费行为的电力用户价值分析方法及系统 Download PDFInfo
- Publication number
- CN112990721A CN112990721A CN202110311050.1A CN202110311050A CN112990721A CN 112990721 A CN112990721 A CN 112990721A CN 202110311050 A CN202110311050 A CN 202110311050A CN 112990721 A CN112990721 A CN 112990721A
- Authority
- CN
- China
- Prior art keywords
- power
- value
- user
- payment behavior
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 181
- 238000004458 analytical method Methods 0.000 title claims abstract description 29
- 239000013598 vector Substances 0.000 claims abstract description 154
- 238000012549 training Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 claims abstract description 6
- 230000005611 electricity Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 24
- 238000010276 construction Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 claims 1
- 238000009472 formulation Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011161 development Methods 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及智能电网技术领域,针对智能电网电力营销发展的新向标下不同价值水平客户群体的精准划分和识别问题,提出了一种基于缴费行为的电力用户价值分析方法及系统。该分析过程主要包括用户缴费行为历史数据采集和预处理、电力用户价值群体划分和待识别用户的价值类型匹配三个环节;本发明构建的特征向量,能有效表达电力用户价值特性的关键信息;构建的电力用户缴费行为训练数据网络,不但可以记录缴费行为状态,还有效表达了电力用户之间蕴含的复杂相关关系,有助于获得鲁棒性和可解释性更强的划分结果;利用变分图自编码器结构建立电力用户价值群体划分模型,使模型具有一定的生成能力,从而使电力用户的价值类型识别具有更强的泛化能力。
Description
技术领域
本发明涉及智能电网技术领域,特别涉及一种基于缴费行为的电力用户价值分析方法及系统。
背景技术
在智能电网电力营销发展的新向标下,电力企业必须要精确定位优质客户,转变原有的思维模式,科学配置服务资源,要以全新的视角看待市场营销。因此,研究和分析电力用户的行为数据,精确定位用户的需求、消费习惯、行为趋势和心理变化,对各电力企业放开售电市场,改善国内用户服务质量,提髙海内外市场核心竞争力具有重要意义。用户用电行为分析是运用数据挖掘等手段对用户用电数据进行统计、分析、处理等,开展电力用户行为辨识方法研究,从而发现用户用电行为的特点及规律,建立较为完善的基于智能电网海量数据的用户行为分析模型、方法和理论框架,有利于为智能电网价值提升和服务创新提供基础理论和技术支撑。
目前国内外相关电力企业对于电力数据的处理分析处于初级阶段,大都关注于理论研究或局限于某个区域,并未实现大规模应用,用户行为数据分析研究模型较为单一,电力缴费数据挖掘分析有限,缺少高效精准的聚类模型,价值模型帮助电力企业部门更加详细、清楚地了解用户,无法为电力部门及用户进一步开放售电侧,优化制定营销策略提供依据,限制了用户用电体验,不能适应以市场为导向、客户需求为中心的现代电力营销。因此,围绕电力缴费用户行为数据分析,设计科学合理的电力用户群聚类分群模型,总结分析用户群特征价值,对于帮助电力企业掌握电力用户群特征,了解用户价值,制定最合理的价值响应策略,优化售电侧等具有积极意义。
发明内容
针对上述问题本发明提供了一种基于缴费行为的电力用户价值分析方法及系统,实现不同价值水平客户群体的精准划分和识别,为企业进行用户价值细分和定位提供参考,进而促进电力企业的市场营销和用户服务管理水平的提高。
为了达到上述目的,本发明采用了下列技术方案:
本发明提供了一种基于缴费行为的电力用户价值分析方法,主要包括用户缴费行为历史数据采集和预处理、电力用户价值群体划分和待识别用户的价值类型匹配三个环节。
进一步,所述电力用户价值分析方法具体包括以下步骤:
S1、由电力企业的电费收缴及营销账务系统中抽取特定时间区间的电力用户历史用电行为原始数据,经预处理和特征构造后组成电力用户缴费行为特征向量,以此构建电力用户缴费行为训练数据集;
S2、由用户缴费行为训练数据集抽取不同用户间的全局结构关系,构建电力用户缴费行为训练数据网络;
S3、在变分图自编码器架构下建立电力用户价值群体划分模型;
S4、利用电力用户缴费行为训练数据网络以迭代计算方式对步骤S3构建的电力用户价值群体划分模型进行求解,确定模型的最优参数;
S5、利用步骤S4确定的电力用户价值群体划分模型对用户缴费行为训练数据网络中的电力用户进行价值群体划分;
S6、将待识别电力用户的缴费行为数据与S5产生的电力用户价值群体划分结果进行匹配,确定该用户所在的价值群体,并进行结果输出。
更进一步,所述步骤S1包含以下具体步骤:
S11、在选定的时间区间内,结合电力用户分析数据需求,由电力企业的电费收缴及营销账务业务系统中抽取电力用户历史用电行为原始数据,包括:用户基本信息、缴费信息、欠费信息、客服工单信息、投诉处理信息等关键用电信息;
S12、对电力用户历史用电行为原始数据进行预处理,包括缺失值填充、异常值剔除、冗余数据约简;
S13、由预处理后的用电行为数据中抽取对于电力用户价值分析最关键的5个信息项,包括:月均缴费额、年均缴费次数、年度投诉及欠费总次数、月均欠费金额、欠费金额所占比例,进行特征构造,构成电力用户缴费行为特征向量,用于记录每个电力用户的关键缴费行为,将第i个电力用户的缴费行为特征向量记录为xi;
S14、利用式(1)对电力用户缴费行为特征向量进行标准化处理,将其各特征的取值转换到[-1,1]区间,
其中,ui表示对xi进行标准化处理后的电力用户缴费行为特征向量,以下简称特征向量,μx表示电力用户缴费行为特征向量数据分布的期望,δx表示电力用户缴费行为特征向量数据分布的标准差;将标准化后的全部电力用户缴费行为特征向量构建为电力用户缴费行为训练数据集,记为N表示用于电力用户价值分析的电力用户数量。
所述步骤S2包括以下具体步骤:
S21、遍历电力用户缴费行为训练数据集,利用式(2)计算其中任意两个特征向量间的相似度:
其中,Simij表示ui和uj之间的相似度,ui和uj分别表示第i个和第j个电力用户对应的缴费行为特征向量,dis(ui,uj)表示ui和uj之间的欧几里得距离;
S22、以特征向量间的相似度作为元素,构建电力用户缴费行为相关性矩阵A=[Simij]N×N,表达不同用户间的全局相关性;
S23、利用电力用户缴费行为训练数据集U和相关性矩阵A构建电力用户缴费行为训练数据网络Net(U,A),用于同时记录不同电力用户的缴费行为数据以及它们之间的相关关系。
所述步骤S3中的电力用户价值群体划分模型包含编码器、解码器、分类器三个部分,其整体结构如附图1所示,步骤S3包含以下步骤:
S31、编码器用于将电力用户缴费行为训练数据网络Net(U,A)映射为低维特征空间中的嵌入向量构成的集合Z,这一映射过程可描述为如式(3)所示的形式化表示:
μz,i=GCNμ(ui,A) (5)
logσz,i=GCNσ(ui,A) (6)
其中,GCNμ()和GCNσ()分别表示计算嵌入向量分布的期望与方差的图卷积网络,它们具有相同的结构,由式(7)定义:
GCN(U,A)=Gconv(ReLU(Gconv(A,U;W0));W1) (7)
式中,Gconv()表示图卷积网络;W0和W1分别为第一层图卷积网络和第二层图卷积网络中的连接权重矩阵,是分类模型中的待定参数,在后续步骤中通过输入电力用户缴费行为训练数据网络进行确定;ReLU()为激活函数,由式(8)定义:
其中,σ()为狄拉克函数。
S33、分类器用于将电力用户缴费行为特征向量对应的嵌入向量划分到相应价值群体当中,将分类器的价值群体划分结果记为C*={C1,C2,…,CK},其中K为价值群体数量,该分类器由一个高斯混合模型构成,其形式化表示为πk为第k个价值群体Ck的先验分布概率,将各价值群体的先验分布概率构成的向量记作π=[π1,π2,…,πK];为高斯混合模型中价值群体Ck对应的高斯分布分量,μk和分别为Ck对应的高斯分布分量的期望与方差。
所述步骤S4包含以下具体步骤:
S41、基于S3建立的电力用户价值群体划分模型,构造关于电力用户缴费行为的对数似然函数如式(10)所示:
其中,logp(ui)为特征向量ui的对数似然函数;对于任意电力用户缴费行为特征向量u,利用Jensen不等式获得其对数似然函数logp(u)的证据下界(ELBO)如式(11):
p(a,z,Ck)=p(a|z)p(z|Ck)p(Ck) (12)
其中,p(a|z)由式(13)定义
p(z|Ck)由式(14)定义
p(Ck)由式(15)定义
p(Ck)=Cat(Ck|π) (15)
式中,Cat(Ck|π)为电力用户价值群体分布函数;式(11)中q(z,Ck|u,a)为真实后验分布p(z,Ck|u,a)的变分后验近似值;
S42、通过使用蒙特卡洛随机梯度下降变分贝叶斯(Monte Carlo SGVB)算子,将式(11)的证据下界变换为式(16)
式中,M为蒙特卡洛随机梯度下降变分贝叶斯算子的采样数量,D为电力用户缴费行为特征向量的维度,R为嵌入向量的维度,ud为特征向量u的第d个分量,为μA的第m个采样中第d个分量,为的第r个分量,为的第r个分量,μz|r为μz的第r个分量,μk|r为μk的第r个分量;
S43、使用高斯分布对步骤S3中的电力用户价值群体划分模型进行初始化;即给定迭代次数L,迭代执行步骤S44~S49,直到达到迭代次数,完成对电力用户价值群体划分模型的训练,获得模型的最优参数;
S44、利用式(5)和式(6)计算电力用户缴费行为训练数据网络Net(U,A)中每个特征向量及其邻接向量在低维特征空间中对应的嵌入向量的期望和方差;
S45、由电力用户全部价值群体中随机选取一个价值群体,记作Ck,利用式(17)计算该次迭代中模型输出值:
S46、按式(18)从关于价值群体Ck的后验高斯分布中采样一个嵌入向量zi;
S47、利用式(8)将低维特征空间中的嵌入向量重构为网络关系;
S49、利用梯度方法进行反向传播,对电力用户价值群体划分模型中的连接权重矩阵进行更新。
所述步骤S5包括以下具体步骤:
S51、式(16)可变换为式(19)的形式:
式中,为嵌入向量的高斯先验分布,KL[p(Ck|z)||q(Ck|u,a)]为p(Ck|z)和q(Ck|u,a)之间的KL散度;由KL散度定义可知式(19)第二项取值为非负数,因此,证据下界取最大值时满足式(20)
KL[p(Ck|z)|| q(Ck|u,a)]=0 (20)
则电力用户价值分类的后验分布可由式(21)计算
S52、通过迭代执行步骤S44~S49的训练过程获得电力用户价值群体划分模型的最优参数后,利用式(21)获得电力用户价值群体划分结果;该结果表示的是电力用户缴费行为训练数据集中每一特征向量被划分到各价值群体中的概率,该结果是一种具有较强鲁棒性和可解释性的软分类结果;在此基础上可根据实际需求通过设定阈值将软分类结果转化为硬分类结果;
S53、计算电力用户缴费行为训练数据集中各电力用户价值群体的中心特征向量,如式(22)所示:
S61、对于要进行价值群体识别的待识别电力用户,按照步骤S1所述的方法抽取该用户的原始用电行为数据并进行预处理和特征构造,形成该电力用户的缴费行为特征向量;
S62、遍历计算待识别电力用户的缴费行为特征向量与各电力用户价值群体的中心特征向量之间的欧式距离,选取欧式距离最小的中心特征向量,将待识别电力用户匹配到该中心特征向量所在的电力用户价值群体中;
S63、将电力用户价值群体识别结果输出至相关数据分析与决策系统,从而为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
本发明还提供一种基于缴费行为的电力用户价值分析系统,包括计算机处理器和内存、电力用户缴费行为训练数据采集单元、电力用户价值群体划分单元、待识别用户的价值类型匹配单元。
进一步,所述电力用户缴费行为训练数据采集单元执行步骤S10,由电力企业的电费收缴及营销账务业务系统中抽取特定时间区间的电力用户原始用电行为数据,经预处理和特征构造后组成电力用户缴费行为特征向量,进而构建电力用户缴费行为训练数据集,并加载到计算机内存中;电力用户价值群体划分单元根据电力用户缴费行为训练数据采集单元产生的电力用户缴费行为训练数据集执行步骤S20~步骤S50,将电力用户缴费行为训练数据集中的电力用户缴费行为特征向量划分为若干价值群体;待识别用户的价值类型匹配单元执行步骤S60,将待识别用户的缴费行为特征向量与电力用户价值群体划分单元获得的用户价值群体进行匹配,将电力用户缴费行为识别结果输出至相关数据分析与决策系统,可为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
与现有技术相比本发明具有以下优点:
1、本发明方法是基于电力用户的缴费行为数据构建价值分析的特征向量,能有效表达电力用户价值特性的关键信息。
2、本发明构建的电力用户缴费行为训练数据网络,不但可以记录不同电力用户的缴费行为状态,还有效表达了这些电力用户之间蕴含的复杂相关关系,有助于获得鲁棒性和可解释性更强的电力用户价值群体划分结果。
3、本发明利用变分图自编码器结构构建电力用户价值群体划分模型,使模型具有一定的生成能力,从而使电力用户的价值类型识别具有更强的泛化能力。
4、本发明的电力用户价值分析结果输出至相关数据分析与决策系统,可为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
附图说明
图1为本发明所述步骤S3中的电力用户价值群体划分模型结构图;
图2为本发明所述的一种基于缴费行为的电力用户价值分析系统的系统结构图;
图3为本发明所述的一种基于缴费行为的电力用户价值分析方法的流程图。
具体实施方式
为了进一步阐述本发明的技术方案,下面结合附图及实施例对本发明进行进一步说明。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干变型和改进,这些也应视为属于本发明的保护范围。
实施例1
本发明所述的一种基于缴费行为的电力用户价值分析方法通过计算机程序实施,下面将按照图3所示流程详述本发明提出的技术方案的具体实施方式,使用某市供电公司电费收缴及营销账务系统提供的电力用户用电数据,通过本发明的技术方案对2018年1月~2019年12月之间在网电力用户进行价值分析,对本发明技术方案的实施流程进行详细阐述。
实施方式主要包含以下关键内容:
S1、由某市供电公司的电费收缴及营销账务系统中抽取2018年1月~2019年12月之间的电力用户历史用电行为原始数据,经预处理和特征构造后组成电力用户缴费行为特征向量,以此构建电力用户缴费行为训练数据集,包含以下具体步骤:
S11、选定时间区间2018年1月~2019年12月之间,结合电力用户分析数据需求,由某市供电公司的电费收缴及营销账务业务系统中抽取电力用户历史用电行为原始数据,包括:用户基本信息、缴费信息、欠费信息、客服工单信息、投诉处理信息等关键用电信息,共计7大表单,65个信息项;
S12、对电力用户历史用电行为原始数据进行预处理,包括缺失值填充、异常值剔除、冗余数据约简,预处理后的数据包含48个信息项;
S13、由预处理后的用电行为数据中抽取对于电力用户价值分析最关键的5个信息项,包括:月均缴费额、年均缴费次数、年度投诉及欠费总次数、月均欠费金额、欠费金额所占比例,进行特征构造,构成电力用户缴费行为特征向量,用于记录每个电力用户的关键缴费行为,将第i个电力用户的缴费行为特征向量记录为xi;
S14、利用式(1)对电力用户缴费行为特征向量进行标准化处理,将其各特征的取值转换到[-1,1]区间,
其中,ui表示对xi进行标准化处理后的电力用户缴费行为特征向量,以下简称特征向量,μx表示电力用户缴费行为特征向量数据分布的期望,δx表示电力用户缴费行为特征向量数据分布的标准差;将标准化后的全部电力用户缴费行为特征向量构建为电力用户缴费行为训练数据集,记为N表示用于电力用户价值分析的电力用户数量。
S2、由用户缴费行为训练数据集抽取不同用户间的全局结构关系,构建电力用户缴费行为训练数据网络,包括以下具体步骤:
S21、遍历电力用户缴费行为训练数据集,利用式(2)计算其中任意两个特征向量间的相似度:
其中,Simij表示ui和uj之间的相似度,ui和uj分别表示第i个和第j个电力用户对应的缴费行为特征向量,dis(ui,uj)表示ui和uj之间的欧几里得距离;
S22、以特征向量间的相似度作为元素,构建电力用户缴费行为相关性矩阵A=[Simij]N×N,表达不同用户间的全局相关性;
S23、利用电力用户缴费行为训练数据集U和相关性矩阵A构建电力用户缴费行为训练数据网络Net(U,A),用于同时记录不同电力用户的缴费行为数据以及它们之间的相关关系。
S3、在变分图自编码器架构下建立电力用户价值群体划分模型,该模型包含编码器、解码器、分类器三个部分,其整体结构如附图1所示,步骤S3包含以下步骤:
S31、编码器用于将电力用户缴费行为训练数据网络Net(U,A)映射为低维特征空间中的嵌入向量构成的集合Z,这一映射过程可描述为如式(3)所示的形式化表示:
μz,i=GCNμ(ui,A) (5)
logσz,i=GCNσ(ui,A) (6)
其中,GCNμ()和GCNσ()分别表示计算嵌入向量分布的期望与方差的图卷积网络,它们具有相同的结构,由式(7)定义:
GCN(U,A)=Gconv(ReLU(Gconv(A,U;W0));W1) (7)
式中,Gconv()表示图卷积网络;W0和W1分别为第一层图卷积网络和第二层图卷积网络中的连接权重矩阵,是分类模型中的待定参数,在后续步骤中通过输入电力用户缴费行为训练数据网络进行确定;ReLU()为激活函数,由式(8)定义:
其中,σ()为狄拉克函数。
S33、分类器用于将电力用户缴费行为特征向量对应的嵌入向量划分到相应价值群体当中,将分类器的价值群体划分结果记为C*={C1,C2,…,CK},其中K为价值群体数量,该分类器由一个高斯混合模型构成,其形式化表示为πk为第k个价值群体Ck的先验分布概率,将各价值群体的先验分布概率构成的向量记作π=[π1,π2,…,πK];为高斯混合模型中价值群体Ck对应的高斯分布分量,μk和分别为Ck对应的高斯分布分量的期望与方差。
S4、利用电力用户缴费行为训练数据网络以迭代计算方式对步骤S3构建的电力用户价值群体划分模型进行求解,确定模型的最优参数,包含以下具体步骤:
S41、基于S3建立的电力用户价值群体划分模型,构造关于电力用户缴费行为的对数似然函数如式(10)所示:
其中,logp(ui)为特征向量ui的对数似然函数;对于任意电力用户缴费行为特征向量u,利用Jensen不等式获得其对数似然函数logp(u)的证据下界如式(11):
p(a,z,Ck)=p(a|z)p(z|Ck)p(Ck) (12)
其中p(a|z)由式(13)定义
p(z|Ck)由式(14)定义
p(Ck)由式(15)定义
p(Ck)=Cat(Ck|π)(15)
式中,Cat(Ck|π)为电力用户价值群体分布函数;式(11)中q(z,Ck|u,a)为真实后验分布p(z,Ck|u,a)的变分后验近似值;
S42、通过使用蒙特卡洛随机梯度下降变分贝叶斯(Monte Carlo SGVB)算子,将式(11)的证据下界变换为式(16)
式中,M为Monte Carlo SGVB算子的采样数量,D为电力用户缴费行为特征向量的维度,R为嵌入向量的维度,ud为特征向量u的第d个分量,为μA的第m个采样中第d个分量,为的第r个分量,为的第r个分量,μz|r为μz的第r个分量,μk|r为μk的第r个分量;
S43、使用高斯分布对步骤S30中的电力用户价值群体划分模型进行初始化;即给定迭代次数L,迭代执行步骤S44~S49,直到达到迭代次数,完成对电力用户价值群体划分模型的训练,获得模型的最优参数;
S44、利用式(5)和式(6)计算电力用户缴费行为训练数据网络Net(U,A)中每个特征向量及其邻接向量在低维特征空间中对应的嵌入向量的期望和方差;
S45、由电力用户全部价值群体中随机选取一个价值群体,记作Ck,利用式(17)计算该次迭代中模型输出值:
S46、按式(18)从关于价值群体Ck的后验高斯分布中采样一个嵌入向量zi;
S47、利用式(8)将低维特征空间中的嵌入向量重构为网络关系;
S49、利用梯度方法进行反向传播,对电力用户价值群体划分模型中的连接权重矩阵进行更新。
S5、利用步骤S4确定的电力用户价值群体划分模型对用户缴费行为训练数据网络中的电力用户进行价值群体划分,包括以下具体步骤:
S51、式(16)可变换为式(19)的形式:
KL[p(Ck|z)||q(Ck|u,a)]=0 (20)
则电力用户价值分类的后验分布可由式(21)计算
S52、通过迭代执行步骤S44~S49的训练过程获得电力用户价值群体划分模型的最优参数后,利用式(21)获得电力用户价值群体划分结果;该结果表示的是电力用户缴费行为训练数据集中每一特征向量被划分到各价值群体中的概率,该结果是一种具有较强鲁棒性和可解释性的软分类结果;在此基础上可根据实际需求通过设定阈值将软分类结果转化为硬分类结果;
S53、计算电力用户缴费行为训练数据集中各电力用户价值群体的中心特征向量,如式(22)所示:
S6、将待识别电力用户的缴费行为数据与S5产生的电力用户价值群体划分结果进行匹配,确定该用户所在的价值群体,并进行结果输出,具体方法包括以下步骤:
S61、对于要进行价值群体识别的待识别电力用户,按照步骤S10所述的方法抽取该用户的原始用电行为数据并进行预处理和特征构造,形成该电力用户的缴费行为特征向量;
S62、遍历计算待识别电力用户的缴费行为特征向量与各电力用户价值群体的中心特征向量之间的欧式距离,选取欧式距离最小的中心特征向量,将待识别电力用户匹配到该中心特征向量所在的电力用户价值群体中;
S63、将电力用户价值群体识别结果输出至相关数据分析与决策系统,可为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
技术效果评价:
为验证本发明提出技术方案的有效性和先进性,将本发明与K均值(K-means)、核K均值(Kernel K-means)、密度峰值聚类(DPC)、K近邻(KNN),以及基于密度的聚类方法(DBSCAN)用于电力用户价值分析,以20次实验的平均价值群体识别精度和召回率为评价指标,将上述匹配结果进行对比分析,比较结果如下表所示:
由表中结果可以看出,本发明技术方案在进行电力用户价值群体识别时,能获得更优的价值群体识别结果。
实施例2
如图2所示,一种基于缴费行为的电力用户价值分析系统,包括计算机处理器和内存、电力用户缴费行为训练数据采集单元、电力用户价值群体划分单元、待识别用户的价值类型匹配单元。所述电力用户缴费行为训练数据采集单元执行步骤S10,由电力企业的电费收缴及营销账务业务系统中抽取特定时间区间的电力用户原始用电行为数据,经预处理和特征构造后组成电力用户缴费行为特征向量,进而构建电力用户缴费行为训练数据集,并加载到计算机内存中;电力用户价值群体划分单元根据电力用户缴费行为训练数据采集单元产生的电力用户缴费行为训练数据集执行步骤S20~步骤S50,将电力用户缴费行为训练数据集中的电力用户缴费行为特征向量划分为若干价值群体;待识别用户的价值类型匹配单元执行步骤S60,将待识别用户的缴费行为特征向量与电力用户价值群体划分单元获得的用户价值群体进行匹配,将电力用户缴费行为识别结果输出至相关数据分析与决策系统,可为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
Claims (10)
1.一种基于缴费行为的电力用户价值分析方法,其特征在于:包括用户缴费行为历史数据采集和预处理、电力用户价值群体划分和待识别用户的价值类型匹配三个环节。
2.根据权利要求1所述的一种基于缴费行为的电力用户价值分析方法,其特征在于:所述电力用户价值分析方法具体包括以下步骤:
S1、构建电力用户缴费行为训练数据集;
S2、由用户缴费行为训练数据集抽取不同用户间的全局结构关系,构建电力用户缴费行为训练数据网络;
S3、在变分图自编码器架构下建立电力用户价值群体划分模型;
S4、利用电力用户缴费行为训练数据网络以迭代计算方式对步骤S3构建的电力用户价值群体划分模型进行求解,确定模型的最优参数;
S5、利用步骤S4确定的电力用户价值群体划分模型对用户缴费行为训练数据网络中的电力用户进行价值群体划分;
S6、将待识别电力用户的缴费行为数据与S5产生的电力用户价值群体划分结果进行匹配,确定该用户所在的价值群体,并进行结果输出。
3.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,所述步骤S1包含以下具体步骤:
S11、在选定的时间区间内,结合电力用户分析数据需求,由电力企业的电费收缴及营销账务业务系统中抽取电力用户历史用电行为原始数据,包括:用户基本信息、缴费信息、欠费信息、客服工单信息、投诉处理信息;
S12、对电力用户历史用电行为原始数据进行预处理,包括缺失值填充、异常值剔除、冗余数据约简;
S13、由预处理后的用电行为数据中抽取对于电力用户价值分析最关键的5个信息项,包括:月均缴费额、年均缴费次数、年度投诉及欠费总次数、月均欠费金额、欠费金额所占比例,进行特征构造,构成电力用户缴费行为特征向量,用于记录每个电力用户的关键缴费行为,将第i个电力用户的缴费行为特征向量记录为xi;
S14、利用式(1)对电力用户缴费行为特征向量进行标准化处理,将其各特征的取值转换到[-1,1]区间,
4.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,所述步骤S2包括以下具体步骤:
S21、遍历电力用户缴费行为训练数据集,利用式(2)计算其中任意两个特征向量间的相似度:
其中,Simij表示ui和uj之间的相似度,ui和uj分别表示第i个和第j个电力用户对应的缴费行为特征向量,dis(ui,uj)表示ui和uj之间的欧几里得距离;
S22、以特征向量间的相似度作为元素,构建电力用户缴费行为相关性矩阵A=[Simij]N×N,表达不同用户间的全局相关性;
S23、利用电力用户缴费行为训练数据集U和相关性矩阵A构建电力用户缴费行为训练数据网络Net(U,A),用于同时记录不同电力用户的缴费行为数据以及它们之间的相关关系。
5.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,所述步骤S3中的电力用户价值群体划分模型包含编码器、解码器、分类器三个部分,所述步骤S3包含以下步骤:
S31、编码器用于将电力用户缴费行为训练数据网络Net(U,A)映射为低维特征空间中的嵌入向量构成的集合Z,这一映射过程可描述为如式(3)所示的形式化表示:
μz,i=GCNμ(ui,A) (5)
logσz,i=GCNσ(ui,A) (6)
其中,GCNμ()和GCNσ()分别表示计算嵌入向量分布的期望与方差的图卷积网络,它们具有相同的结构,由式(7)定义:
GCN(U,A)=Gconv(ReLU(Gconv(A,U;W0));W1) (7)
式中,Gconv()表示图卷积网络;W0和W1分别为第一层图卷积网络和第二层图卷积网络中的连接权重矩阵;ReLU()为激活函数,由式(8)定义:
其中,σ()为狄拉克函数。
6.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,所述步骤S4包含以下具体步骤:
S41、基于S3建立的电力用户价值群体划分模型,构造关于电力用户缴费行为的对数似然函数如式(10)所示:
其中,logp(ui)为特征向量ui的对数似然函数;对于任意电力用户缴费行为特征向量u,利用Jensen不等式获得其对数似然函数logp(u)的证据下界如式(11):
p(a,z,Ck)=p(a|z)p(z|Ck)p(Ck) (12)
其中,p(a|z)由式(13)定义
p(z|Ck)由式(14)定义
p(Ck)由式(15)定义
p(Ck)=Cat(Ck|π) (15)
式中,Cat(Ck|π)为电力用户价值群体分布函数;式(11)中q(z,Ck|u,a)为真实后验分布p(z,Ck|u,a)的变分后验近似值;
S42、通过使用蒙特卡洛随机梯度下降变分贝叶斯算子,将式(11)的证据下界变换为式(16)
式中,M为蒙特卡洛随机梯度下降变分贝叶斯算子的采样数量,D为电力用户缴费行为特征向量的维度,R为嵌入向量的维度,ud为特征向量u的第d个分量,为μA的第m个采样中第d个分量,为的第r个分量,为的第r个分量,μz|r为μz的第r个分量,μk|r为μk的第r个分量;
S43、使用高斯分布对步骤S3中的电力用户价值群体划分模型进行初始化;即给定迭代次数L,迭代执行步骤S44~S49,直到达到迭代次数,完成对电力用户价值群体划分模型的训练,获得模型的最优参数:
S44、利用式(5)和式(6)计算电力用户缴费行为训练数据网络Net(U,A)中每个特征向量及其邻接向量在低维特征空间中对应的嵌入向量的期望和方差;
S45、由电力用户全部价值群体中随机选取一个价值群体,记作Ck,利用式(17)计算该次迭代中模型输出值:
S46、按式(18)从关于价值群体Ck的后验高斯分布中采样一个嵌入向量zi;
S47、利用式(8)将低维特征空间中的嵌入向量重构为网络关系;
S49、利用梯度方法进行反向传播,对电力用户价值群体划分模型中的连接权重矩阵进行更新。
7.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,所述步骤S5包含以下具体步骤:
S51、式(16)可变换为式(19)的形式:
式中,为嵌入向量的高斯先验分布,KL[p(Ck|z)||q(Ck|u,a)]为p(Ck|z)和q(Ck|u,a)之间的KL散度;由KL散度定义可知式(19)第二项取值为非负数,因此,证据下界取最大值时满足式(20)
KL[p(Ck|z)||q(Ck|u,a)]=0 (20)
则电力用户价值分类的后验分布可由式(21)计算
S52、通过迭代执行步骤S44~S49的训练过程获得电力用户价值群体划分模型的最优参数后,利用式(21)获得电力用户价值群体划分结果,即电力用户缴费行为训练数据集中每一特征向量被划分到各价值群体中的概率,在此基础上可通过设定阈值将软分类结果转化为硬分类结果;
S53、计算电力用户缴费行为训练数据集中各电力用户价值群体的中心特征向量,如式(22)所示:
8.根据权利要求2所述的一种基于缴费行为的电力用户价值分析方法,其特征在于,该方法所述步骤S6包含以下具体步骤:
S61、对于要进行价值群体识别的待识别电力用户,按照步骤S1所述的方法抽取该用户的原始用电行为数据并进行预处理和特征构造,形成该电力用户的缴费行为特征向量;
S62、遍历计算待识别电力用户的缴费行为特征向量与各电力用户价值群体的中心特征向量之间的欧式距离,选取欧式距离最小的中心特征向量,将待识别电力用户匹配到该中心特征向量所在的电力用户价值群体中;
S63、将电力用户价值群体识别结果输出至相关数据分析与决策系统,从而为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定的解决提供有效支持和依据。
9.一种基于缴费行为的电力用户价值分析系统,其特征在于:包括计算机处理器和内存、电力用户缴费行为训练数据采集单元、电力用户价值群体划分单元、待识别用户的价值类型匹配单元。
10.根据权利要求9所述的一种基于缴费行为的电力用户价值分析系统,其特征在于:所述电力用户缴费行为训练数据采集单元是由电力企业的电费收缴及营销账务业务系统中抽取特定时间区间的电力用户原始用电行为数据,经预处理和特征构造后组成电力用户缴费行为特征向量,进而构建电力用户缴费行为训练数据集,并加载到计算机内存中;所述电力用户价值群体划分单元是将电力用户缴费行为训练数据集中的电力用户缴费行为特征向量划分为若干价值群体;所述待识别用户的价值类型匹配单元是将待识别用户的缴费行为特征向量与电力用户价值群体划分单元获得的用户价值群体进行匹配,将电力用户缴费行为识别结果输出至相关数据分析与决策系统,为用户市场细分、服务渠道建设、企业品牌推广以及精细化营销策略制定等问题的解决提供有效支持和依据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311050.1A CN112990721B (zh) | 2021-03-24 | 2021-03-24 | 一种基于缴费行为的电力用户价值分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311050.1A CN112990721B (zh) | 2021-03-24 | 2021-03-24 | 一种基于缴费行为的电力用户价值分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112990721A true CN112990721A (zh) | 2021-06-18 |
CN112990721B CN112990721B (zh) | 2023-04-21 |
Family
ID=76333235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110311050.1A Active CN112990721B (zh) | 2021-03-24 | 2021-03-24 | 一种基于缴费行为的电力用户价值分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990721B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077058A (zh) * | 2023-08-29 | 2023-11-17 | 广东青藤环境科技有限公司 | 基于用水数据分析的智慧营业收费管理系统 |
CN117556369A (zh) * | 2024-01-12 | 2024-02-13 | 南京信息工程大学 | 一种动态生成的残差图卷积神经网络的窃电检测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650763A (zh) * | 2016-07-05 | 2017-05-10 | 国网内蒙古东部电力有限公司电力科学研究院 | 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法 |
WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
US20190272468A1 (en) * | 2018-03-05 | 2019-09-05 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation |
CN111221868A (zh) * | 2018-11-26 | 2020-06-02 | 国网上海市电力公司 | 一种应用于电力客户渠道偏好的数据挖掘与分析方法 |
CN111681718A (zh) * | 2020-06-11 | 2020-09-18 | 湖南大学 | 一种基于深度学习多源异构网络的药物重定位方法 |
CN112084328A (zh) * | 2020-07-29 | 2020-12-15 | 浙江工业大学 | 一种基于变分图自编码器与K-Means的科技论文聚类分析方法 |
CN112132188A (zh) * | 2020-08-31 | 2020-12-25 | 浙江工业大学 | 一种基于网络属性的电商用户分类方法 |
CN112966773A (zh) * | 2021-03-24 | 2021-06-15 | 山西大学 | 一种无人机飞行工况模式识别方法及系统 |
-
2021
- 2021-03-24 CN CN202110311050.1A patent/CN112990721B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650763A (zh) * | 2016-07-05 | 2017-05-10 | 国网内蒙古东部电力有限公司电力科学研究院 | 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法 |
WO2018220368A1 (en) * | 2017-05-30 | 2018-12-06 | Gtn Ltd | Tensor network machine learning system |
US20190272468A1 (en) * | 2018-03-05 | 2019-09-05 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation |
CN111221868A (zh) * | 2018-11-26 | 2020-06-02 | 国网上海市电力公司 | 一种应用于电力客户渠道偏好的数据挖掘与分析方法 |
CN111681718A (zh) * | 2020-06-11 | 2020-09-18 | 湖南大学 | 一种基于深度学习多源异构网络的药物重定位方法 |
CN112084328A (zh) * | 2020-07-29 | 2020-12-15 | 浙江工业大学 | 一种基于变分图自编码器与K-Means的科技论文聚类分析方法 |
CN112132188A (zh) * | 2020-08-31 | 2020-12-25 | 浙江工业大学 | 一种基于网络属性的电商用户分类方法 |
CN112966773A (zh) * | 2021-03-24 | 2021-06-15 | 山西大学 | 一种无人机飞行工况模式识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
关时雨: "基于K-means的电力缴费行为数据研究与应用", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077058A (zh) * | 2023-08-29 | 2023-11-17 | 广东青藤环境科技有限公司 | 基于用水数据分析的智慧营业收费管理系统 |
CN117077058B (zh) * | 2023-08-29 | 2024-01-30 | 广东青藤环境科技有限公司 | 基于用水数据分析的智慧营业收费管理系统 |
CN117556369A (zh) * | 2024-01-12 | 2024-02-13 | 南京信息工程大学 | 一种动态生成的残差图卷积神经网络的窃电检测方法及系统 |
CN117556369B (zh) * | 2024-01-12 | 2024-04-19 | 南京信息工程大学 | 一种动态生成的残差图卷积神经网络的窃电检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112990721B (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019165673A1 (zh) | 一种报销单风险预测方法、装置、终端设备及存储介质 | |
Srdjevic et al. | Synthesis of individual best local priority vectors in AHP-group decision making | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN112990721A (zh) | 一种基于缴费行为的电力用户价值分析方法及系统 | |
Utkin et al. | The DS/AHP method under partial information about criteria and alternatives by several levels of criteria | |
CN115795131A (zh) | 基于人工智能的电子档案分类方法、装置及电子设备 | |
CN111275485A (zh) | 基于大数据分析的电网客户等级划分方法、系统、计算机设备及存储介质 | |
CN110765351A (zh) | 目标用户识别方法、装置、计算机设备和存储介质 | |
Grigoras et al. | Processing of smart meters data for peak load estimation of consumers | |
Bard | Using multicriteria methods in the early stages of new product development | |
Majidpour | Time series prediction for electric vehicle charging load and solar power generation in the context of smart grid | |
Ulkhaq et al. | Predicting customer churn: A comparison of eight machine learning techniques: A case study in an indonesian telecommunication company | |
CN116188174A (zh) | 基于模块度和互信息的保险欺诈检测方法及系统 | |
Shahrokhabadi et al. | Learning with subsampled kernel-based methods: Environmental and financial applications | |
KR102251139B1 (ko) | 데이터 증강 기반 기계학습 방식의 결측치 보정 시스템 | |
Huang et al. | Iterative estimation maximization for stochastic linear programs with conditional value-at-risk constraints | |
Legault et al. | A model-free approach for solving choice-based competitive facility location problems using simulation and submodularity | |
US20130152091A1 (en) | Optimized Judge Assignment under Constraints | |
CN115222177A (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
Sen et al. | Optimum risk portfolio and eigen portfolio: a comparative analysis using selected stocks from the Indian stock market | |
Sangadiev et al. | A review on recent advances in scenario aggregation methods for power system analysis | |
CN104778636A (zh) | 船舶装备维修保障信息服务推荐方法 | |
CN117670066B (zh) | 基于智能决策的司库管理方法、系统、设备及存储介质 | |
Mazur | Density forecasts based on disaggregate data: Nowcasting polish inflation | |
Birbil et al. | An integrated approach to single-leg airline revenue management: The role of robust optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |