CN113554241A - 一种基于用户用电投诉行为的用户分层方法及预测方法 - Google Patents

一种基于用户用电投诉行为的用户分层方法及预测方法 Download PDF

Info

Publication number
CN113554241A
CN113554241A CN202111027979.8A CN202111027979A CN113554241A CN 113554241 A CN113554241 A CN 113554241A CN 202111027979 A CN202111027979 A CN 202111027979A CN 113554241 A CN113554241 A CN 113554241A
Authority
CN
China
Prior art keywords
user
complaint
convolution
layering
behaviors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111027979.8A
Other languages
English (en)
Other versions
CN113554241B (zh
Inventor
高慧
宫德锋
张林峰
亓鹏
张立柱
李雅文
刘爱新
郑悦
张同庆
赵长耀
李婷
崔志国
鲁国正
孙华杰
张卓
于珏
韩璐
张忠臣
胡光磊
高凡
胡兰青
李�浩
金大未
李红新
陈希强
王舒平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202111027979.8A priority Critical patent/CN113554241B/zh
Publication of CN113554241A publication Critical patent/CN113554241A/zh
Application granted granted Critical
Publication of CN113554241B publication Critical patent/CN113554241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开一种基于用户用电投诉行为的用户分层方法及预测方法,通过层次化标签生成方法对用电用户的各种行为进行提取和分类,完成用电用户投诉行为标签的划分,通过建立用户标签体系形成电力营销业务画像;并且基于用户的用电投诉行为提出联合图卷积网络来完成对用户下一投诉内容的预测,实现对用户诉求的主动响应,从而提升客户满意度。本发明具有较低的时间成本;划分的类别具有高的离散度,完成对用户各种行为的分类、获得更有鲁棒性的高质量的结果,实现用户画像的构建。本发明依据用户分层画像进行未来投诉内容的预测,通过联合卷积块集成时间卷积及非时间卷积,拥有更好的性能,更训练快、容易收敛。

Description

一种基于用户用电投诉行为的用户分层方法及预测方法
技术领域
本发明涉及电力用户行为分层领域,具体涉及一种基于用户用电投诉行为的用户分层方法及预测方法。
背景技术
在电力行业用电需求侧企业与客户的关系是“管理”与“被管理”,存在企业“被动响应”用户需求,员工欠缺服务意识,考核监管机构不完善等问题。不仅如此,在实际工作中,公司采用传统的数据处理方式,从客户服务数据中提取得到一些统计表格,例如人工服务率、满意率等指标,这样做难以发现隐藏于数据中的业务规律,更难抽象出描述业务特点的数学模型。
发明内容
为解决上述问题,本发明提供一种基于用户用电投诉行为的用户分层方法及预测方法,实现用电用户的行为分层以及用户投诉内容的预测,实现客户诉求的主动响应,以进一步提升客户满意度,具有简单直观、实用性强的特点,应用成效显著。
本发明的技术方案是:一种基于用户用电投诉行为的用户分层方法,包括以下步骤:
S1,获取用户行为的数据集D,进行初次层次分层,并获得指标矩阵A;用户行为包括用电行为和投诉行为;
S2,用边约束构造并求解目标函数,通过目标函数对初次层次分层结果进行再次层次分层获得再次层次分层的结果P;
S3,对再次层次分层的结果P进行迭代优化产生新的局部最小解P′;
S4,判断新的局部最小解P′是否满足收敛条件,若满足则获得最终分层结果;否则进入下一步;
S5,调用集群扩展对再次层次分层的结果P和新的局部最小解P′进行扩展获得新的集群P″,并将并集P∪P′∪P″添加到指标矩阵A;
S6,继续基于新的集群P″重复步骤S2-S5,直到最终分层结果满足收敛标准。
进一步地,步骤S1中进行初次层次分层,具体为:
S101,设置初始聚类数H,从数据集D中随机选择一个点作为第一中心点p1
S102,对于每个点,从已经选择的中心点找到该点最近的邻居,并记录它们之间的距离,用T(x)表示;
S103,选择中心点pi,pi=arg maxx∈DT(x);
S104,重复步骤S102和S103,直到中心数为所设置的初始聚类数H,获得中心点集合{p1,p2,...,pH}。
进一步地,指标矩阵A是值为0或1的指标矩阵,其列表示对应用户的数据子集,值为1表示该点属于相应类别,为0表示不属于。
进一步地,步骤S2中的目标函数为:
Figure BDA0003244047020000021
Figure BDA0003244047020000022
其中,c([A]i)是矩阵A中第i列的成本,α是平衡两项影响的权重因子,L为一个利用初始聚类中心之间的相似性构造的拉普拉斯矩阵;e是1的n维向量,二进制集合x是解向量,m是最终分类的类别数,q=2n-1表示除空集合之外的数据子集的数量,di表示初始聚类结果中矩阵A的第i个类别与其他类别的最小距离,聚类结果ε是限制解中类别的最小距离之和的截止因子。
进一步地,步骤S5所获得新的集群P″为:
Figure BDA0003244047020000031
其中,
Figure BDA0003244047020000032
包含P和P′中所有元素加上离对应类中心最近的第j个非成员邻居,
Figure BDA0003244047020000033
包含分类中的所有数据,但不包括离类中心最远的第j个点。
本发明的技术方案还包括一种基于用户用电投诉行为的预测方法,包括以下步骤:
SS1,采用图卷积对用户投诉行为数据进行图结构化,以从权利要求1-5任一项所获得的用户分层结果中提取到用户行为特征;
SS2,采用时间轴上的整个卷积结构来捕捉用户在不同时间段的投诉行为以及投诉持续时间情形;
SS3,构造联合卷积块处理结构时间序列获得联合图卷积网络,利用联合图卷积网络对用户投诉行为进行预测。
进一步地,步骤SS1中采用图卷积对用户投诉行为数据进行图结构化,具体为:
SS101,基于频谱图卷积的概念引入图卷积算子
Figure BDA0003244047020000034
的概念,即信号
Figure BDA0003244047020000035
与核Θ的乘积,
Figure BDA0003244047020000036
其中,图傅里叶基
Figure BDA0003244047020000037
是规范化图拉普拉斯
Figure BDA0003244047020000038
Figure BDA0003244047020000039
的特征向量矩阵;
SS102,通过Chebyshev多项式,将图卷积写成
Figure BDA00032440470200000310
Figure BDA00032440470200000311
其中
Figure BDA00032440470200000312
是在缩放的拉普拉斯
Figure BDA00032440470200000313
时评估的i级Chebyshev多项式;
SS103,令α=α0=-α1,将式子变为
Figure BDA0003244047020000041
从而完成使用图卷积来图结构化用户投诉行为数据。
进一步地,步骤SS2具体为将每个节点的时间卷积的输入看作是一个长度为M的序列,卷积核
Figure BDA0003244047020000042
被用来将输入Y映射到单个输出元素
Figure BDA0003244047020000043
因此gated卷积可以被定义为
Figure BDA0003244047020000044
Figure BDA0003244047020000045
其中Q是模型中gates的输入,⊙指的是元素的Hadamard乘积。
进一步地,步骤SS3中构造联合卷积块处理结构时间序列,具体为:输入
Figure BDA0003244047020000046
则输出kl+1可以由
Figure BDA0003244047020000047
来计算;
其中C为信道,
Figure BDA0003244047020000048
分别是块l内的上下时间核;Θl是图卷积的谱核;ReLU()表示线性修正单元激活函数。
进一步地,步骤SS3中在堆叠了两个联合卷积块之后,增加一个额外的时间卷积层和一个完成连接的层作为最后的输出层,时间卷积层将最后一个联合卷积块的输出映射到单步预测,进而联合图卷积网络的最终输出为
Figure BDA0003244047020000049
并通过在C信号上应用线性变换
Figure BDA00032440470200000410
其中
Figure BDA00032440470200000411
是权重向量,b是偏差;
步骤SS3中利用联合图卷积网络对用户投诉行为进行预测的损失函数为
Figure BDA00032440470200000412
其中Wα都是联合图卷积网络中可训练的参数,kj+1是预测结果与实际真实结果的差异,
Figure BDA00032440470200000413
则表示联合图卷积网络的预测。
本发明提供的一种基于用户用电投诉行为的用户分层方法及预测方法,通过层次化标签生成方法对用电用户的各种行为进行提取和分类,完成用电用户投诉行为标签的划分,通过建立用户标签体系形成电力营销业务画像;并且基于用户的用电投诉行为还提出一个联合图卷积网络来完成对用户下一投诉内容的预测,实现对用户诉求的主动响应,从而提升客户满意度。本发明采用层次化标签生成方法,在对数据集进行初次划分的时候具有较低的时间成本;构造的目标函数中加入了区别性信息,不仅可以用来获取各种类别之间的信息,还可以保证我们划分的类别具有高的离散度,最终可以完成对用户各种行为的分类、获得更有鲁棒性的高质量的结果,实现用户画像的构建。另外,本发明依据用户分层画像进行未来投诉内容的预测,通过联合卷积块集成了时间卷积以及非时间卷积,不仅拥有更好的性能,还可以更快训练、更容易收敛,实现客户诉求的主动响应,提升客户满意度。
附图说明
图1是本发明具体实施例一方法流程示意图;
图2是本发明具体实施例一基于层次化标签生成的用户画像构建过程示意图;
图3是本发明具体实施例二方法原理示意图。
图4是本发明具体实施例二联合图卷积网络的体系结构示意图;
图5是本发明具体实施例二基于联合图卷积网络的用户投诉内容预测流程示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例一
如图1所示,本实施例提供一种基于用户用电投诉行为的用户分层方法,包括以下步骤:
S1,获取用户行为的数据集D,进行初次层次分层,并获得指标矩阵A;用户行为包括用电行为和投诉行为;
本实施例采用Max-Min Distance(最长最短距离)这种时间复杂度低的算法来生成用户的用电行为、投诉行为等各个分区,这样可以在生成初始标签结果时节省大量时间。
进行初次层次分层,具体为:
S101,设置初始聚类数H,从数据集D中随机选择一个点作为第一中心点p1
S102,对于每个点,从已经选择的中心点找到该点最近的邻居,并记录它们之间的距离,用T(x)表示;
S103,选择中心点pi,pi=arg maxx∈DT(x);
S104,重复步骤S102和S103,直到中心数为所设置的初始聚类数H,获得中心点集合{p1,p2,...,pH}。
例如设置初始类别数为2,从数据集D中随机选择一个点作为第一个中心点p1;对于每个点,从已经选择的中心找到该点最近的邻居,并记录它们之间的距离,用T(x)表示;接着选择中心pi=arg maxx∈DT(x)。重复上述步骤,直到中心数为2。具体实施时,初始的分层结果可以用户的用电行为、投诉行为为初始聚类的中心。
本实施例的指标矩阵A是值为0或1的指标矩阵,其列表示对应用户的数据子集,值为1表示该点属于相应类别,为0表示不属于。该步骤的指标矩阵A包含通过初次层次分类获得的类别。
S2,用边约束构造并求解目标函数,通过目标函数对初次层次分层结果进行再次层次分层获得再次层次分层的结果P;
首先构造出目标函数:
Figure BDA0003244047020000071
Figure BDA0003244047020000072
其中c([A]i)是矩阵A中第i列的成本,α是平衡两项影响的权重因子,L是一个利用初始聚类中心之间的相似性构造的拉普拉斯矩阵;e是1的n维向量;二进制集合x是解向量,如果在最佳聚类结果处选择了对应于指标矩阵A的第i列的子集,则x中的第i元素的值等于1,否则为0;q=2n-1表示除空集合之外的数据子集的数量;di表示初始聚类结果中矩阵A中第i个聚类与其他聚类的最小距离,ε是限制解中类别的最小距离之和的截止因子。
目标函数的第二项是拉普拉斯正则项,其被设计用于捕获结构信息。该函数中第一个约束可能会导致最终结果出现重叠类别。为了处理这种情况,可以使用任何重叠消除技术来确保每个行为点只属于一个类别;第二个约束是指最终分类的类别数为m;在第三个约束中,保证最终各个类别的分散度不要太小。之后从中心点集合{p1,p2}(所设置初始类别数为2)对每个x∈D更新各个分类的中心,一个再次分层结果P={P1,P2}获得。
S3,对再次层次分层的结果P进行迭代优化产生新的局部最小解P′;
本实施例通过初始的分层结果,如用户的用电行为、投诉行为为初始聚类的中心,对所有的数据进行进一步分类,然后对产生的结果应用迭代优化方法,得到进一步的分层标签,也就是得到新的局部最小解P′。例如P′中包含的用户的投诉行为会分为投诉内容、投诉频率、投诉持续时间、投诉发生的时间段等。
S4,判断新的局部最小解P′是否满足收敛条件,若满足则获得最终分层结果;否则进入下一步;
S5,调用集群扩展对再次层次分层的结果P和新的局部最小解P′进行扩展获得新的集群P″,并将并集P∪P′∪P″添加到指标矩阵A;
集群扩展是指对每个大的分类Pi,通过添加一个不在这两个类中且距类中心的距离最小的点,并删除一个属于类中成员且距类中心的距离最大的点,对Pi产生较小的干扰,然后创建一个新的集合P″包含数据的部分子集。
为了提高分类性能,要对已经获得的两个解进行扩展,但同时还要避免对Pi产生较大的干扰,因此本发明创建一个新的集合P″包含数据的部分子集:
Figure BDA0003244047020000081
t的值设为10,其中
Figure BDA0003244047020000082
包含Pi中的所有元素加上离类中心最近的第j个非成员邻居,
Figure BDA0003244047020000083
包含分类中的所有数据,但不包括离类中心最远的第j个点,从而完成对分类的详细划分。例如P″最终包含的是投诉具体内容、投诉频率正常或偏多或从未、投诉持续时间偏长或正常、投诉发生时间段为何时等等。
S6,继续基于新的集群P″重复步骤S2-S5,直到最终分层结果满足收敛标准。
经过以上步骤的循环,最终可以获得详细的用户标签分类,也在保证鲁棒性、计算复杂度低的情况下完成给用户画像的构建。如图2所示为基于上述层次化标签生成的用户画像构建过程示意图。
实施例二
在实施例一基础上,本实施例提供一种基于用户用电投诉行为的预测方法。实施例一通过层次化标签生成方法对用电用户的各种行为进行提取和分类,完成用电用户投诉行为标签的划分,所建立用户标签体系可形成电力营销业务画像。如图3所示,本实施例原理是在实施例一用电用户分类,根据分类可构建用户画像基础上,基于用户的用电投诉行为提出一个联合图卷积网络来完成对用户下一投诉内容的预测,实现对用户诉求的主动响应,从而提升客户满意度。如图4所示为本实施例联合图卷积网络的体系结构示意图。
具体地,如图5所示,本实施例基于联合图卷积网络的用户投诉内容预测流程包括以下步骤:
SS1,采用图卷积对用户投诉行为数据进行图结构化,以从实施例一所获得的用户分层结果中提取到用户行为特征;
本实施例通过引入谱框架、在谱域中应用卷积来完成图卷积来图结构化行为特征数据,使用图傅立叶基础进行
Figure BDA0003244047020000091
乘法,其过程如下:
a)基于频谱图卷积的概念引入了图卷积算子
Figure BDA0003244047020000092
的概念,即信号
Figure BDA0003244047020000093
与核Θ的乘积:
Figure BDA0003244047020000094
这里图傅里叶基
Figure BDA0003244047020000095
是Normalized图拉普拉斯
Figure BDA0003244047020000096
Figure BDA0003244047020000097
(In是一个单位矩阵,
Figure BDA0003244047020000098
是对角度矩阵且Dii=∑jWij)的特征向量矩阵;
Figure BDA0003244047020000099
是L的特征值的对角矩阵,Θ(Λ)也是一个对角矩阵,根据该定义,图信号x被内核Θ滤波,在Θ和图傅立叶变换UTx之间相乘。
b)由于使用步骤a)中的等式在图卷积中计算内核Θ可能会代价较大,因此本发明首先采用Chebyshev多项式逼近策略来克服此问题。由于内核Θ限制Λ的多项式为
Figure BDA00032440470200000910
其中
Figure BDA00032440470200000911
是多项式系数的向量,m是图卷积的内核大小,而缩放后
Figure BDA00032440470200000912
因此通过Chebyshev多项式,可以将图卷积写成:
Figure BDA0003244047020000101
这里的
Figure BDA0003244047020000102
是在缩放的拉普拉斯
Figure BDA0003244047020000103
时评估的i级Chebyshev多项式。
c)由于神经网络具有尺度化和归一化的特征,因此本发明进一步假设μmax≈2,这样图卷积的式子可以简化为:
Figure BDA0003244047020000104
接着为了稳定数值性能,让α=α0=-α1,就可以将式子变为:
Figure BDA0003244047020000105
从而完成使用图卷积来图结构化用户投诉行为等数据。
SS2,采用时间轴上的整个卷积结构来捕捉用户在不同时间段的投诉行为以及投诉持续时间情形;
由于对用户画像图中的每个节点,时间卷积在没有填充的情况下探索输入元素的mj个邻居,这导致序列长度每次缩短mj-1,因此,本发明将每个节点的时间卷积的输入看作是一个长度为M的序列。卷积核
Figure BDA0003244047020000106
被用来将输入Y映射到单个输出元素
Figure BDA0003244047020000107
这里的Q、R被分为两半,信道大小相同,因此gated CNN可以被定义为
Figure BDA0003244047020000108
其中Q是模型中gates的输入,⊙指的是元素的Hadamard乘积,σ(R)是sigmoid gate控制当前状态的输入Q哪个会与时间序列的动态变化有关。
SS3,构造联合卷积块处理结构时间序列获得联合图卷积网络,利用联合图卷积网络对用户投诉行为进行预测;
为了融合非时间域和时间域的特征,构造联合卷积块来处理结构时间序列。块本身可以根据特定情况的规模和复杂性进行堆叠或扩展。首先输入
Figure BDA0003244047020000111
其中C为信道,则输出kl+1可以由
Figure BDA0003244047020000112
Figure BDA0003244047020000113
来计算,其中
Figure BDA0003244047020000114
分别是块l内的上下时间核;Θl是图卷积的谱核;ReLU()表示线性修正单元激活函数。在堆叠了两个联合卷积块之后,本发明附加了一个额外的时间卷积层和一个完全连接的层作为最后的输出层。时间卷积层将最后一个联合卷积块的输出映射到单步预测。然后,可以从模型中获得最终输出
Figure BDA0003244047020000115
并通过在c-channel上应用线性变换
Figure BDA0003244047020000116
其中
Figure BDA0003244047020000117
是权重向量,b是偏差。最后我们把用于用电用户投诉内容预测的损失函数写成
Figure BDA0003244047020000118
这里Wα都是模型中可训练的参数,kj+1是ground truth(预测结果与实际真实结果的差异),
Figure BDA0003244047020000119
则表示模型的预测。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (10)

1.一种基于用户用电投诉行为的用户分层方法,其特征在于,包括以下步骤:
S1,获取用户行为的数据集D,进行初次层次分层,并获得指标矩阵A;用户行为包括用电行为和投诉行为;
S2,用边约束构造并求解目标函数,通过目标函数对初次层次分层结果进行再次层次分层获得再次层次分层的结果P;
S3,对再次层次分层的结果P进行迭代优化产生新的局部最小解P′;
S4,判断新的局部最小解P′是否满足收敛条件,若满足则获得最终分层结果;否则进入下一步;
S5,调用集群扩展对再次层次分层的结果P和新的局部最小解P′进行扩展获得新的集群P″,并将并集P∪P′∪P″添加到指标矩阵A;
S6,继续基于新的集群P″重复步骤S2-S5,直到最终分层结果满足收敛标准。
2.根据权利要求1所述的基于用户用电投诉行为的用户分层方法,其特征在于,步骤S1中进行初次层次分层,具体为:
S101,设置初始聚类数H,从数据集D中随机选择一个点作为第一中心点p1
S102,对于每个点,从已经选择的中心点找到该点最近的邻居,并记录它们之间的距离,用T(x)表示;
S103,选择中心点pi,pi=argmaxx∈DT(x);
S104,重复步骤S102和S103,直到中心数为所设置的初始聚类数H,获得中心点集合{p1,p2,...,pH}。
3.根据权利要求2所述的基于用户用电投诉行为的用户分层方法,其特征在于,指标矩阵A是值为0或1的指标矩阵,其列表示对应用户的数据子集,值为1表示该点属于相应类别,为0表示不属于。
4.根据权利要求3所述的基于用户用电投诉行为的用户分层方法,其特征在于,步骤S2中的目标函数为:
Figure FDA0003244047010000021
Figure FDA0003244047010000022
其中,c([A]i)是矩阵A中第i列的成本,α是平衡两项影响的权重因子,L为一个利用初始聚类中心之间的相似性构造的拉普拉斯矩阵;e是1的n维向量,二进制集合x是解向量,m是最终分类的类别数,q=2n-1表示除空集合之外的数据子集的数量,di表示初始聚类结果中矩阵A的第i个类别与其他类别的最小距离,ε是限制解中类别的最小距离之和的截止因子。
5.根据权利要求4所述的基于用户用电投诉行为的用户分层方法,其特征在于,步骤S5所获得新的集群P″为:
Figure FDA0003244047010000023
其中,
Figure FDA0003244047010000024
包含P和P′中所有元素加上离对应类中心最近的第j个非成员邻居,
Figure FDA0003244047010000025
包含分类中的所有数据,但不包括离类中心最远的第j个点。
6.一种基于用户用电投诉行为的预测方法,其特征在于,包括以下步骤:
SS1,采用图卷积对用户投诉行为数据进行图结构化,以从权利要求1-5任一项所获得的用户分层结果中提取到用户行为特征;
SS2,采用时间轴上的整个卷积结构来捕捉用户在不同时间段的投诉行为以及投诉持续时间情形;
SS3,构造联合卷积块处理结构时间序列获得联合图卷积网络,利用联合图卷积网络对用户投诉行为进行预测。
7.根据权利要求6所述的基于用户用电投诉行为的预测方法,其特征在于,步骤SS1中采用图卷积对用户投诉行为数据进行图结构化,具体为:
SS101,基于频谱图卷积的概念引入图卷积算子
Figure FDA0003244047010000031
的概念,即信号
Figure FDA0003244047010000032
与核Θ的乘积,
Figure FDA0003244047010000033
其中,图傅里叶基
Figure FDA0003244047010000034
是规范化图拉普拉斯
Figure FDA0003244047010000035
Figure FDA0003244047010000036
的特征向量矩阵;
SS102,通过Chebyshev多项式,将图卷积写成
Figure FDA0003244047010000037
Figure FDA0003244047010000038
其中
Figure FDA00032440470100000319
是在缩放的拉普拉斯
Figure FDA0003244047010000039
时评估的i级Chebyshev多项式;
SS103,令α=α0=-α1,将式子变为
Figure FDA00032440470100000310
从而完成使用图卷积来图结构化用户投诉行为数据。
8.根据权利要求7所述的基于用户用电投诉行为的预测方法,其特征在于,步骤SS2具体为将每个节点的时间卷积的输入看作是一个长度为M的序列,卷积核
Figure FDA00032440470100000311
被用来将输入Y映射到单个输出元素
Figure FDA00032440470100000312
Figure FDA00032440470100000313
因此gated卷积可以被定义为
Figure FDA00032440470100000314
Figure FDA00032440470100000315
其中Q是模型中gates的输入,⊙指的是元素的Hadamard乘积。
9.根据权利要求8所述的基于用户用电投诉行为的预测方法,其特征在于,步骤SS3中构造联合卷积块处理结构时间序列,具体为:输入
Figure FDA00032440470100000316
则输出kl+1可以由
Figure FDA00032440470100000317
来计算;
其中C为信道,
Figure FDA00032440470100000318
分别是块l内的上下时间核;Θl是图卷积的谱核;
ReLU()表示线性修正单元激活函数。
10.根据权利要求9所述的基于用户用电投诉行为的预测方法,其特征在于,步骤SS3中在堆叠了两个联合卷积块之后,增加一个额外的时间卷积层和一个完成连接的层作为最后的输出层,时间卷积层将最后一个联合卷积块的输出映射到单步预测,进而联合图卷积网络的最终输出为
Figure FDA0003244047010000041
并通过在C信号上应用线性变换
Figure FDA0003244047010000042
其中
Figure FDA0003244047010000043
是权重向量,b是偏差;
步骤SS3中利用联合图卷积网络对用户投诉行为进行预测的损失函数为
Figure FDA0003244047010000044
其中Wα都是联合图卷积网络中可训练的参数,kj+1是预测结果与实际真实结果的差异,
Figure FDA0003244047010000045
则表示联合图卷积网络的预测。
CN202111027979.8A 2021-09-02 2021-09-02 一种基于用户用电投诉行为的用户分层方法及预测方法 Active CN113554241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111027979.8A CN113554241B (zh) 2021-09-02 2021-09-02 一种基于用户用电投诉行为的用户分层方法及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111027979.8A CN113554241B (zh) 2021-09-02 2021-09-02 一种基于用户用电投诉行为的用户分层方法及预测方法

Publications (2)

Publication Number Publication Date
CN113554241A true CN113554241A (zh) 2021-10-26
CN113554241B CN113554241B (zh) 2024-04-26

Family

ID=78106201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111027979.8A Active CN113554241B (zh) 2021-09-02 2021-09-02 一种基于用户用电投诉行为的用户分层方法及预测方法

Country Status (1)

Country Link
CN (1) CN113554241B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511058A (zh) * 2022-01-27 2022-05-17 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置
CN117235326A (zh) * 2023-11-16 2023-12-15 国网山东省电力公司泰安供电公司 一种基于台区画像的台区设备可视化展示系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279583A1 (en) * 2013-03-14 2014-09-18 Lex Machina, Inc. Systems and Methods for Classifying Entities
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
CN108540320A (zh) * 2018-04-03 2018-09-14 南京华苏科技有限公司 基于信令挖掘用户满意度的评估方法
CN108710651A (zh) * 2018-05-08 2018-10-26 华南理工大学 一种大规模客户投诉数据自动分类方法
KR20180120488A (ko) * 2017-04-27 2018-11-06 한양대학교 산학협력단 텍스트 마이닝 기법을 활용한 고객 불만에 대한 분류 및 예측 방법
CN109447364A (zh) * 2018-11-08 2019-03-08 国网湖南省电力有限公司 基于标签的电力客户投诉预测方法
CN109982367A (zh) * 2017-12-28 2019-07-05 中国移动通信集团四川有限公司 移动终端上网用户投诉预测方法、装置、设备及存储介质
CN110930182A (zh) * 2019-11-08 2020-03-27 中国农业大学 基于改进粒子群优化算法的客户分类方法及装置
CN111639121A (zh) * 2020-04-07 2020-09-08 国网新疆电力有限公司 一种构建客户画像的大数据平台及构建方法
CN112529630A (zh) * 2020-12-17 2021-03-19 国网河北省电力有限公司营销服务中心 一种电力用户多维度信息化标签系统的构建方法
WO2021143396A1 (zh) * 2020-01-16 2021-07-22 支付宝(杭州)信息技术有限公司 利用文本分类模型进行分类预测的方法及装置
CN113837778A (zh) * 2021-10-28 2021-12-24 国网辽宁省电力有限公司阜新供电公司 基于改进狼群优化K-means的用户投诉聚类分析方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279583A1 (en) * 2013-03-14 2014-09-18 Lex Machina, Inc. Systems and Methods for Classifying Entities
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
KR20180120488A (ko) * 2017-04-27 2018-11-06 한양대학교 산학협력단 텍스트 마이닝 기법을 활용한 고객 불만에 대한 분류 및 예측 방법
CN109982367A (zh) * 2017-12-28 2019-07-05 中国移动通信集团四川有限公司 移动终端上网用户投诉预测方法、装置、设备及存储介质
CN108540320A (zh) * 2018-04-03 2018-09-14 南京华苏科技有限公司 基于信令挖掘用户满意度的评估方法
CN108710651A (zh) * 2018-05-08 2018-10-26 华南理工大学 一种大规模客户投诉数据自动分类方法
WO2019214133A1 (zh) * 2018-05-08 2019-11-14 华南理工大学 一种大规模客户投诉数据自动分类方法
CN109447364A (zh) * 2018-11-08 2019-03-08 国网湖南省电力有限公司 基于标签的电力客户投诉预测方法
CN110930182A (zh) * 2019-11-08 2020-03-27 中国农业大学 基于改进粒子群优化算法的客户分类方法及装置
WO2021143396A1 (zh) * 2020-01-16 2021-07-22 支付宝(杭州)信息技术有限公司 利用文本分类模型进行分类预测的方法及装置
CN111639121A (zh) * 2020-04-07 2020-09-08 国网新疆电力有限公司 一种构建客户画像的大数据平台及构建方法
CN112529630A (zh) * 2020-12-17 2021-03-19 国网河北省电力有限公司营销服务中心 一种电力用户多维度信息化标签系统的构建方法
CN113837778A (zh) * 2021-10-28 2021-12-24 国网辽宁省电力有限公司阜新供电公司 基于改进狼群优化K-means的用户投诉聚类分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范毅刚: "数据挖掘中聚类算法的并行优化研究", 中国优秀硕士论文电子期刊信息科技辑 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511058A (zh) * 2022-01-27 2022-05-17 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置
CN114511058B (zh) * 2022-01-27 2023-06-02 国网江苏省电力有限公司泰州供电分公司 一种用于电力用户画像的负荷元件构建方法及装置
CN117235326A (zh) * 2023-11-16 2023-12-15 国网山东省电力公司泰安供电公司 一种基于台区画像的台区设备可视化展示系统

Also Published As

Publication number Publication date
CN113554241B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Chan et al. Market segmentation and ideal point identification for new product design using fuzzy data compression and fuzzy clustering methods
Wan et al. Deep matrix factorization for trust-aware recommendation in social networks
CN113554241A (zh) 一种基于用户用电投诉行为的用户分层方法及预测方法
US20180101765A1 (en) System and method for hierarchically building predictive analytic models on a dataset
Marović et al. Automatic movie ratings prediction using machine learning
Ghodousi et al. Analyzing public participant data to evaluate citizen satisfaction and to prioritize their needs via K-means, FCM and ICA
CN113361801A (zh) 基于gan网络和半监督回归的混合滚动短期负荷预测方法
Bari et al. AestheticNet: deep convolutional neural network for person identification from visual aesthetic
CN113051440A (zh) 一种基于超图结构的链路预测方法及系统
Devi et al. Smoothing approach to alleviate the meager rating problem in collaborative recommender systems
Li et al. Time-varying multi-objective optimisation over switching graphs via fixed-time consensus algorithms
Kavitha Devi et al. Kernel based collaborative recommender system for e-purchasing
CN112446739B (zh) 一种基于分解机和图神经网络的点击率预测方法及系统
CN114417172A (zh) 一种深度兴趣进化推荐方法、装置、设备和存储介质
Peters et al. Dynamic clustering with soft computing
CN112200665A (zh) 一种授信额度的确定方法及装置
CN115994632A (zh) 一种点击率预测方法、装置、设备及可读存储介质
Gao et al. Deep learning with consumer preferences for recommender system
CN112507224B (zh) 基于异质网络表示学习的人机物融合系统服务推荐方法
Honda et al. Collaborative filtering by sequential extraction of user-item clusters based on structural balancing approach
CN116523001A (zh) 电网薄弱线路识别模型构建方法、装置和计算机设备
CN115689639A (zh) 一种基于深度学习的商业广告点击率预测方法
CN113642674A (zh) 一种基于图卷积神经网络的多轮对话分类方法
Guo et al. Explainable recommendation systems by generalized additive models with manifest and latent interactions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant