CN111062757A - 基于多路径寻优匹配的信息推荐方法及系统 - Google Patents

基于多路径寻优匹配的信息推荐方法及系统 Download PDF

Info

Publication number
CN111062757A
CN111062757A CN201911303785.9A CN201911303785A CN111062757A CN 111062757 A CN111062757 A CN 111062757A CN 201911303785 A CN201911303785 A CN 201911303785A CN 111062757 A CN111062757 A CN 111062757A
Authority
CN
China
Prior art keywords
service
client
customer
matching
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911303785.9A
Other languages
English (en)
Other versions
CN111062757B (zh
Inventor
史玉良
管永明
张晖
胥鹏飞
吕梁
王永良
李双双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dareway Software Co ltd
Original Assignee
Dareway Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dareway Software Co ltd filed Critical Dareway Software Co ltd
Priority to CN201911303785.9A priority Critical patent/CN111062757B/zh
Publication of CN111062757A publication Critical patent/CN111062757A/zh
Application granted granted Critical
Publication of CN111062757B publication Critical patent/CN111062757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于多路径寻优匹配的信息推荐方法及系统,获取各客户历史缴费信息、用电信息、推荐业务信息和业务推荐信息;基于缴费行为数据、用电行为数据,利用模糊C均值聚类算法对数据进行聚类,从中选择出适合于分析客户行为的聚类特征,构建客户行为主题标签,实现不同类型电力客户行为模式画像;将客户的用电行为数据、缴费行为数据进行聚类,分析行为特征,设置行为标签特征,对业务特征属性进行刻画,制定业务标签集合,完成业务画像构建;通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft‑Karp算法应用在客户和业务的匹配中,找到相适配的客户,完成业务信息推荐。

Description

基于多路径寻优匹配的信息推荐方法及系统
技术领域
本发明属于电力行业业务推荐技术领域,涉及一种基于多路径寻优匹配的信息推荐方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在电力改革不断深入的形势下,供电企业间对客户资源的争夺日趋激烈,为在激烈的市场竞争环境中占据有利的位置,以客户服务为核心推进企业健康稳步发展,向客户精准地推荐满足其需求的电力业务,成为供电企业关注的热点问题。
目前电力客户的需求趋于多样化,客户群体正在出现分化,导致供电企业难以全面准确把握客户的需求,无法为客户进行精准推荐。因此,经常会出现客户对推荐的业务不感兴趣等情况,业务推广效率事倍功半,且电力业务种类日益繁多,市场上很少有一种电力业务可以满足所有客户的需求。以往供电企业为对客户进行业务推荐,采取定期向客户推送业务信息、在各大平台发布业务信息、电子邮件营销、依据客户特征为客户推荐业务等措施,这些措施虽然能有效地减轻其他推荐服务渠道的压力,但客户的满意度并没有提升,并且业务推荐过程存在盲目性和对客户过多打扰,供电企业与客户之间的关系也没有得到有效促进。同时也造成推荐信息平台的信息发送压力,占用信息发送流量和时间。
发明内容
本发明为了解决上述问题,提出了一种基于多路径寻优匹配的信息推荐方法及系统,本发明利用模糊C均值聚类算法进行客户行为模式分析,实现电力客户画像和业务画像构建,再构建客户和业务二分图,将二分图最大匹配的Hopcroft-Karp算法应用在客户和业务的匹配中,精确定位业务适配的客户群,保证信息推荐的正确性。
根据一些实施例,本发明采用如下技术方案:
一种基于多路径寻优匹配的信息推荐方法,包括以下步骤:
获取各客户历史缴费信息、用电信息、推荐业务信息和业务推荐信息;
基于缴费行为数据、用电行为数据,利用模糊C均值聚类算法对数据进行聚类,从中选择出适合于分析客户行为的聚类特征,构建客户行为主题标签,实现不同类型电力客户行为模式画像;
将客户的用电行为数据、缴费行为数据进行聚类,分析行为特征,设置行为标签特征,对业务特征属性进行刻画,制定业务标签集合,完成业务画像构建;
通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft-Karp算法应用在客户和业务的匹配中,找到相适配的客户,完成业务信息推荐。
作为可选择的实施方式,构建电力客户行为模式画像的具体过程包括:
(1)基于获取的电力客户历史数据,抽取电力客户缴费行为数据、用电行为数据;
(2)对获取客户数据进行预处理;
(3)利用模糊C均值聚类算法对经过预处理的数据进行聚类,构建客户分类簇,划分为不同客户群;
(4)根据输出聚类结果,对不同客户簇中的数据对象的不同属性进行统计,并得出相关的结论,为不同客户簇建立标签化的客户画像。
作为可选择的实施方式,所述步骤(3)中,具体过程包括:
设定客户类别数目、加权指数、误差阈值和待分类客户的数据集;
计算客户数据的聚类中心;
计算所有客户数据与聚类中心的隶属度矩阵;
如果满足迭代条件,则停止迭代,输出聚类结果,如果否,继续进行聚类。
作为可选择的实施方式,构建业务画像的实现过程具体包括:
基于业务推荐记录信息、客户办理业务的记录信息、推荐业务使用状况,收集使用业务的客户信息,获取这些电力客户的缴费行为数据、用电行为数据;
对获取客户数据进行预处理;
利用模糊C均值聚类算法对经过预处理的数据进行聚类,并统计各客户簇客户样本数,为选择最优客户簇,对聚类结果进行分析判断,当不同客户簇的客户样本数不相等,选取客户样本数最多的客户簇,构建客户画像;
通过对客户标签的统计分析,再结合业务本身特点,总结业务的标签特征,进而对业务特征属性进行刻画,完成业务画像构建。
作为可选择的实施方式,当不同客户簇的客户样本数相等,人工选择一客户簇进行画像,或随机指定一客户簇进行画像。
作为可选择的实施方式,客户和业务之间匹配的实现过程具体包括:
基于不同的标签对客户的影响程度,对标签赋予不同的权重,并对待匹配的客户和业务的标签做数值化处理;
构建业务与客户二分类的二分图,将业务标签集映射为节点集,将客户标签集映射为节点集看作客户集和业务集的匹配边;
计算业务集X与客户集Y中任意标签对的空间距离相似度,若相似度在设定的范围内,则在相应的节点间添加一条边;
根据相似度值构造客户集和业务集二分图的标签相似度矩阵,进行虚拟匹配;
从业务集到客户集进行匹配,利用二分图最大匹配的Hopcroft-Karp算法计算出客户与业务的匹配边对数;
计算匹配边对数与业务集节点数的比值选取比值最大的客户类别作为最优匹配,进而把业务推荐给客户。
作为可选择的实施方式,利用二分图最大匹配的Hopcroft-Karp算法求匹配边对数的具体过程包括:
i从二分图G的邻接矩阵L中取一个初始匹配M,用集合L(X)表示顶点集X中的不饱和点,集合T←φ,dis表示当前节点深度;
ii读取业务集X与客户集Y的节点进行匹配,若X中的所有节点都被M匹配,则停止搜索,返回;否则,以所有未匹配顶点为源点进行一次广度优先搜索,标记各个点到源点的dis;
iii在满足dis[X]=dis[Y]+1的边集E中,从X中找到一个未被M匹配的节点x0,从x0出发,反复执行步骤iv、v,获得更大的匹配M‘,记x0∈L(X);
iv若L(X)邻接的点集N(L(X))=T,则表明当前已经无法得到更大匹配,返回,否则取一节点y0∈N(L(X))-T;
v若y0已经被M匹配,则转步骤vi,否则做一条x0→y0的M增广路径P(x0,y0),取M←M⊕E(P);
vi由于y0已经被M匹配,M中有一条边(y0,z0),作L=L∪{z0},T=T∪{y0},转步骤ii。
一种基于Hopcroft-Karp多路径寻优匹配的信息推荐系统,包括:
构建电力客户画像模块,被配置为基于海量的电力客户数据,采用模糊C均值聚类算法对客户行为数据进行聚类,划分客户,再对客户行为特征进行描述,进一步形成客户画像;
构建业务画像模块,被配置为基于业务推荐记录信息、客户办理业务的记录信息,收集客户使用业务的信息,分析这些客户的行为特征,再结合业务本身特点,总结业务的标签特征,完成业务画像构建;
客户业务匹配模块,被配置为通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft-Karp算法应用到客户与业务的匹配中,找到匹配的客户,完成业务推荐。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种基于多路径寻优匹配的信息推荐方法。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种基于多路径寻优匹配的信息推荐方法。
与现有技术相比,本发明的有益效果为:
1.为构建电力客户画像,实现对客户全面准确的描述,本发明基于海量的电力客户数据,从客户行为建立客户标签库,利用模糊C均值聚类算法进行聚类,构建不同客户类别,准确把握客户需求,避免将客户信息混淆。
2.为构建业务画像,实现电力业务的细化,为不同客户提供不同业务,本发明基于收集使用业务的客户数据,利用模糊C均值聚类算法对客户行为数据进行聚类分析,根据聚类结果选择合适的客户类别进行画像,再结合从业务特性分析得出的初始标签,完成业务画像构建,这一方法将业务具体化、形象化,辅助工作人员发挥主观能动性,避免盲目推荐。
3.为实现业务精准推荐,本发明通过构建业务与客户二分图,利用二分图最大匹配的Hopcroft-Karp算法寻找客户和业务的最大匹配,获取匹配对个数,计算出匹配对个数与业务标签总个数比值,选择比值最大的作为最优匹配,从而将业务分配给合适的客户群,从而实现业务推荐,避免了对客户过多打扰。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是基于Hopcroft-Karp多路径寻优匹配的电力业务推荐结构图。
图2是构建电力客户画像的流程图;
图3是构建业务画像的流程图;
图4是客户业务匹配的流程图;
图5是本实施例的五类客户数量示意图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例公开了一种基于多路径寻优匹配的电力业务推荐方法,利用模糊C均值聚类算法构建客户和业务的画像,再以二分图最大匹配的Hopcroft-Karp算法完成客户业务匹配,为业务寻找合适它的客户群,提升客户满意度。
具体的,如图1中所示,一种基于多路径寻优匹配的电力业务推荐方法主要包括三个模块:构建电力客户画像模块、构建业务画像模块和客户业务匹配模块。上述构建电力客户画像模块,基于海量的电力客户数据,采用模糊C均值聚类算法对客户行为数据进行聚类,划分为不同客户群,进一步形成客户画像,上述构建业务画像模块是将使用业务客户的用电行为数据、缴费行为数据进行聚类,根据聚类结果选择最合适客户类别进行画像,再结合从业务本身分析得出的特征,完成业务画像构建;上述客户业务匹配模块通过构建客户标签集与业务标签集二分图,利用二分图最大匹配的Hopcroft-Karp算法获取客户和业务的匹配边对数,再计算出匹配边对数与业务标签总个数比值,选择比值最大的作为最优匹配,进而把业务推荐给客户,完成业务推荐。
基于多路径寻优匹配的电力业务推荐方法的步骤流程如下:
A数据采集。基于电力系统数据库提取客户历史数据,数据采集包含客户缴费信息、用电信息、推荐业务信息、业务推荐信息,数据来源主要为:掌上电力APP、营销系统、供电营业厅、95598互动网站。
B构建电力客户画像。基于客户缴费行为数据、用电行为数据,利用模糊C均值聚类算法对数据进行聚类,从中选择出适合于分析客户行为的聚类特征,构建客户行为主题标签,实现不同类型电力客户行为模式画像。
C构建业务画像。收集客户使用业务的日志信息,将客户的用电行为数据、缴费行为数据进行聚类,分析这些客户的行为特征,结合业务本身特点,总结业务的标签特征,对业务特征属性进行刻画,制定业务标签集合。
D客户业务匹配。通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft-Karp算法应用在客户和业务的匹配中,找到合适的客户,完成业务推荐。
具体的,图2是构建电力客户画像的流程图,实现的过程如下:
B1数据准备。基于海量的电力客户数据,抽取电力客户缴费行为数据、用电行为数据;
B2数据预处理。为了得到有用的客户信息和便于算法处理,使用R语言对获取客户数据进行预处理(清洗、整理、加工);
B3构建客户分类簇。利用模糊C均值聚类算法对经过预处理的数据进行聚类,划分不同客户群;
B4标签化操作。根据输出聚类结果,对不同客户簇中的数据对象的不同属性进行统计,并得出相关的结论,为不同客户簇建立标签化的客户画像。
利用模糊C均值聚类算法对客户聚类的实现过程如下:
B31.首先设定客户类别数目k、加权指数b、误差阈值l和待分类客户的数据集X={x1,x2,x3,.....,xn},n为客户样本条数目;
B32.计算客户数据的聚类中心mj(j=1,2,3,.....,k),每个样本聚类中心按公式(2)计算:
Figure BDA0002322531400000101
Figure BDA0002322531400000102
Figure BDA0002322531400000103
令Jf为mj和uj(xi)的偏导为0,求得聚类中心迭代公式(2)和隶属度的迭代公式(3)。这里Jf为模糊C均值聚类算法的目标函数,||xi-mj||2为第i个聚类中心与第j个数据点间的欧几里德距离,U=(uj(xi))用来描述数据集X的模糊聚类的模糊矩阵,元素uj(xi)是矩阵U的第i行第j列元素,代表第i个样本点隶属第j类的隶属度;
B33.用(3)式计算所有客户数据与聚类中心的隶属度矩阵U;
B34.如果||Uk-Uk+1||<l,则停止迭代,输出聚类结果,如果否,令k=k+1,转步骤B32;
B35.保存并展示聚类结果。
图3为本发明所述的构建业务画像的流程图,实现的过程如下:
C1数据准备。基于业务推荐记录信息、客户办理业务的记录信息,收集客户使用业务的信息,获取这些电力客户的缴费行为数据、用电行为数据;
C2数据预处理。为了得到有用的客户信息和便于算法处理,使用R语言对获取客户数据进行预处理(清洗、整理、加工);
C3选择最合适客户簇。为找到适配的业务客户簇,利用模糊C均值聚类算法对经过预处理的数据进行聚类,并统计各客户簇客户样本数,为选择最合适客户簇,对聚类结果进行分析判断,当不同客户簇的客户样本数不相等,选取客户样本数最多的客户簇,构建客户画像,当不同客户簇的客户样本数相等,人工选择哪个客户簇进行画像。
C4标签化操作。通过对客户标签的统计分析,再结合业务本身特点,总结业务的标签特征,进而对业务特征属性进行刻画,完成业务画像构建。
图4为本发明所述的客户业务匹配流程图,实现过程如下:
D1首先基于不同的标签对客户的影响程度,对标签赋予不同的权重,并对待匹配的客户和业务的标签做数值化处理;
D2构建业务与客户二分类(Xm,Yn)的二分图Gm,n=(Xm,Yn;E),将业务标签集映射为节点集Xm=(x1,x2,x3,....,xm),将客户标签集映射为节点集Yn=(y1,y2,y3,....,yn),E=(e11,e12,e13,....,emn)看作客户集和业务集的匹配边,m表示被业务标注的标签个数,n表示被客户标注的标签个数,G的节点数为max(n,m);
D3计算业务集X与客户集Y中任意标签对的空间距离相似度R,若R在设定
Figure BDA0002322531400000122
范围内,则在相应的节点间添加一条边e;
D4根据R值构造客户集和业务集二分图G的标签相似度矩阵L,进行虚拟匹配;
D5从业务集到客户集进行匹配,利用二分图最大匹配的Hopcroft-Karp算法计算出客户与业务的匹配边对数ML;
D6计算ML与业务集节点数n的比值,比值用式(4)ΔSM来表示,num为不同客户类别数:
Figure BDA0002322531400000121
D7选取比值最大的客户类别作为最优匹配,进而把业务推荐给客户。
利用二分图最大匹配的Hopcroft-Karp算法求匹配边对数ML的实现过程如下:
D51.从二分图G的邻接矩阵L中取一个初始匹配M,用集合L(X)表示顶点集X中的不饱和点,集合T←φ,dis表示当前节点深度;
D52.读取业务集X与客户集Y的节点进行匹配,若X中的所有节点都被M匹配,则停止搜索,返回;否则,以所有未匹配顶点为源点进行一次广度优先搜索(BFS),标记各个点到源点的dis;
D53.在满足dis[X]=dis[Y]+1的边集E中,从X中找到一个未被M匹配的节点x0,从x0出发,反复执行步骤D54、D55,获得更大的匹配M‘,记x0∈L(X);
D54.若L(X)邻接的点集N(L(X))=T,则表明当前已经无法得到更大匹配,返回,否则取一节点y0∈N(L(X))-T;
D55.若y0已经被M匹配,则转步骤D56,否则做一条x0→y0的M增广路径P(x0,y0),取M←M⊕E(P);
D56.由于y0已经被M匹配,M中有一条边(y0,z0),作L=L∪{z0},T=T∪{y0},转步骤D52。
实验与分析
(1)数据准备
电力业务方面,本申请选择以电能替代业务为研究对象,为验证本申请方法的有效性,以某地区20126户(不包括新立户和销户的用电客户)客户为数据样本,从电力系统数据库中提取出客户用电数据、缴费信息,进行画像分析。在数据样本的获取中,提取出电力客户的缴费记录,其中包括客户编号、预存电费金额、月用电量、缴费方式以及欠费记录等。具体数据见表1。
表1客户8876的缴费记录
Figure BDA0002322531400000141
(2)数据聚类结果分析
模糊C均值聚类算法聚类分析最终得到三类A、B、C不同簇的客户群,每类客户群的客户数量如图5所示,其中,B类客户的数量较多,接近9000户,C类客户相对少,由图5可以直观看出,聚类的三个客户群,在数量上存在一定的差异;对使用电能替代业务的客户数据进行聚类,最终得到不同客户类别D,E,每类客户群的客户数量如图5所示,其中,D类客户数量相对少,只有412户。
五类客户户数如图5所示。
(3)电力客户画像及可视化呈现
对A,B,C各客户类别中的数据对象的不同属性进行统计,分析三类客户群体的不同特征,并得出相关的结论,实现标签化操作。为分析每个客户群的特点,在标签的选择上,需要考虑最能反映客户行为特征的,经过多次梳理和分析,用用电类型、电费回收风险率、电价敏感、违约用电程度、月用电增长量五项标签。表2是对客户标签进行直观展示。
客户标签描述如下:
(1)用电客户类型主要分为传统型客户、前卫型客户和低值型客户。传统型客户,缴费积极性高,各种新缴费方式使用率低,但传统缴费方式使用率非常高,前卫型客户,对各种新缴费方式使用积极,消费水平高,低值型客户,各种新缴费方式使用不积极,客户缴费次数和预存电费次数少。
(2)电费回收风险主要分为低、中和高。预存电费金额充足,电费回收风险较低,存在预存但是不多,电费回收风险中等,偶尔预存,月结有时欠费,电费回收风险较高。
(3)电价敏感主要分为弱、中、强。峰谷电价变化前后的用电量变化不大,电价敏感弱,峰谷电价变化前后的用电量有下降,电价敏感中,峰谷电价变化前后的用电量大幅下降,电价敏感强。
(4)月电量增长率主要分为持平、略有上升和上升三个档位,并未出现电量猛增或骤降。
(5)违约用电程度主要分为低、较低和中。
表2三类客户标签特征
Figure BDA0002322531400000161
表2可知,A、B、C类客户特性鲜明,说明制定的客户行为标签合理,聚类算法有效。
(4)业务画像及可视化呈现
基于使用电能替代业务的客户行为特征,这里选择样本数量多的E客户类别,再结合从电能替代业务特性分析得出的特性,建立电能替代业务标签画像。
业务标签特性:业务适用人群为开放型客户,接受新事物能力强,用电量大,信用度高。
电能替代业务标签特征见表3。
表3业务标签特征
Figure BDA0002322531400000162
Figure BDA0002322531400000171
(5)客户业务相关匹配结果
为找到合适的客户群,本申请将二分图最大匹配的Hopcroft-Karp算法应用到客户与业务的匹配中,计算出客户与业务之间最大匹配对数ML,计算比值ΔSM,具体结果见表4。
表4统计结果
Figure BDA0002322531400000172
由表4可知,将二分图最大匹配的Hopcroft-Karp算法应用在业务与客户的匹配中,可以获得最大配对数,在这次匹配分析中,选择比值值最大的A类客户,作为最优匹配,进而把电能替代业务推荐给A类客户群。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于多路径寻优匹配的信息推荐方法,其特征是:包括以下步骤:
获取各客户历史缴费信息、用电信息、推荐业务信息和业务推荐信息;
基于缴费行为数据、用电行为数据,利用模糊C均值聚类算法对数据进行聚类,从中选择出适合于分析客户行为的聚类特征,构建客户行为主题标签,实现不同类型电力客户行为模式画像;
将客户的用电行为数据、缴费行为数据进行聚类,分析行为特征,设置行为标签特征,对业务特征属性进行刻画,制定业务标签集合,完成业务画像构建;
通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft-Karp算法应用在客户和业务的匹配中,找到相适配的客户,完成业务信息推荐。
2.如权利要求1所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:构建电力客户行为模式画像的具体过程包括:
(1)基于获取的电力客户历史数据,抽取电力客户缴费行为数据、用电行为数据;
(2)对获取客户数据进行预处理;
(3)利用模糊C均值聚类算法对经过预处理的数据进行聚类,构建客户分类簇,划分为不同客户群;
(4)根据输出聚类结果,对不同客户簇中的数据对象的不同属性进行统计,并得出相关的结论,为不同客户簇建立标签化的客户画像。
3.如权利要求2所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:所述步骤(3)中,具体过程包括:
设定客户类别数目、加权指数、误差阈值和待分类客户的数据集;
计算客户数据的聚类中心;
计算所有客户数据与聚类中心的隶属度矩阵;
如果满足迭代条件,则停止迭代,输出聚类结果,如果否,继续进行聚类。
4.如权利要求1所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:构建业务画像的实现过程具体包括:
基于业务推荐记录信息、客户办理业务的记录信息、推荐业务使用状况,收集使用业务的客户信息,获取这些电力客户的缴费行为数据、用电行为数据;
对获取客户数据进行预处理;
利用模糊C均值聚类算法对经过预处理的数据进行聚类,并统计各客户簇客户样本数,为选择最优客户簇,对聚类结果进行分析判断,当不同客户簇的客户样本数不相等,选取客户样本数最多的客户簇,构建客户画像;
通过对客户标签的统计分析,再结合业务本身特点,总结业务的标签特征,进而对业务特征属性进行刻画,完成业务画像构建。
5.如权利要求4所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:当不同客户簇的客户样本数相等,人工选择一客户簇进行画像,或随机指定一客户簇进行画像。
6.如权利要求1所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:客户和业务之间匹配的实现过程具体包括:
基于不同的标签对客户的影响程度,对标签赋予不同的权重,并对待匹配的客户和业务的标签做数值化处理;
构建业务与客户二分类的二分图,将业务标签集映射为节点集,将客户标签集映射为节点集看作客户集和业务集的匹配边;
计算业务集X与客户集Y中任意标签对的空间距离相似度,若相似度在设定的范围内,则在相应的节点间添加一条边;
根据相似度值构造客户集和业务集二分图的标签相似度矩阵,进行虚拟匹配;
从业务集到客户集进行匹配,利用二分图最大匹配的Hopcroft-Karp算法计算出客户与业务的匹配边对数;
计算匹配边对数与业务集节点数的比值选取比值最大的客户类别作为最优匹配,进而把业务推荐给客户。
7.如权利要求1所述的一种基于多路径寻优匹配的信息推荐方法,其特征是:利用二分图最大匹配的Hopcroft-Karp算法求匹配边对数的具体过程包括:
i从二分图G的邻接矩阵L中取一个初始匹配M,用集合L(X)表示顶点集X中的不饱和点,集合T←φ,dis表示当前节点深度;
ii读取业务集X与客户集Y的节点进行匹配,若X中的所有节点都被M匹配,则停止搜索,返回;否则,以所有未匹配顶点为源点进行一次广度优先搜索,标记各个点到源点的dis;
iii在满足dis[X]=dis[Y]+1的边集E中,从X中找到一个未被M匹配的节点x0,从x0出发,反复执行步骤iv、v,获得更大的匹配M‘,记x0∈L(X);
iv若L(X)邻接的点集N(L(X))=T,则表明当前已经无法得到更大匹配,返回,否则取一节点y0∈N(L(X))-T;
v若y0已经被M匹配,则转步骤vi,否则做一条x0→y0的M增广路径P(x0,y0),取M←M⊕E(P);
vi由于y0已经被M匹配,M中有一条边(y0,z0),作L=L∪{z0},T=T∪{y0},转步骤ii。
8.一种基于Hopcroft-Karp多路径寻优匹配的信息推荐系统,其特征是:包括:
构建电力客户画像模块,被配置为基于海量的电力客户数据,采用模糊C均值聚类算法对客户行为数据进行聚类,划分客户,再对客户行为特征进行描述,进一步形成客户画像;
构建业务画像模块,被配置为基于业务推荐记录信息、客户办理业务的记录信息,收集客户使用业务的信息,分析这些客户的行为特征,再结合业务本身特点,总结业务的标签特征,完成业务画像构建;
客户业务匹配模块,被配置为通过构建客户标签集与业务标签集的二分图,将二分图最大匹配的Hopcroft-Karp算法应用到客户与业务的匹配中,找到匹配的客户,完成业务推荐。
9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-7中任一项所述的一种基于多路径寻优匹配的信息推荐方法。
10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-7中任一项所述的一种基于多路径寻优匹配的信息推荐方法。
CN201911303785.9A 2019-12-17 2019-12-17 基于多路径寻优匹配的信息推荐方法及系统 Active CN111062757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911303785.9A CN111062757B (zh) 2019-12-17 2019-12-17 基于多路径寻优匹配的信息推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911303785.9A CN111062757B (zh) 2019-12-17 2019-12-17 基于多路径寻优匹配的信息推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111062757A true CN111062757A (zh) 2020-04-24
CN111062757B CN111062757B (zh) 2023-09-01

Family

ID=70302051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911303785.9A Active CN111062757B (zh) 2019-12-17 2019-12-17 基于多路径寻优匹配的信息推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111062757B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612015A (zh) * 2020-05-26 2020-09-01 创新奇智(西安)科技有限公司 车辆识别方法、装置及电子设备
CN111899057A (zh) * 2020-08-05 2020-11-06 厦门力含信息技术服务有限公司 基于边缘云节点数据收集的客户画像数据聚类分析系统
CN112116253A (zh) * 2020-09-21 2020-12-22 中国建设银行股份有限公司 一种中心网点选择的方法、装置和系统
CN112163868A (zh) * 2020-09-30 2021-01-01 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及存储介质
CN112202867A (zh) * 2020-09-27 2021-01-08 中孚安全技术有限公司 一种应用于网络安全环境的工作流节点处置方法与系统
CN112365281A (zh) * 2020-10-28 2021-02-12 国网冀北电力有限公司计量中心 电力客户服务需求分析方法及装置
CN112381626A (zh) * 2020-12-10 2021-02-19 深圳供电局有限公司 一种电力增值服务潜在客户匹配方法及系统
CN113064938A (zh) * 2021-03-31 2021-07-02 深圳供电局有限公司 一种电力用户用电业务行为分析方法及系统
CN113222697A (zh) * 2021-05-11 2021-08-06 湖北三赫智能科技有限公司 商品信息推送方法、装置计算机设备及可读存储介质
CN113570349A (zh) * 2021-09-28 2021-10-29 广东电网有限责任公司中山供电局 基于em-fcm算法的电力员工画像侧写方法及系统
CN114119111A (zh) * 2022-01-27 2022-03-01 深圳江行联加智能科技有限公司 基于大数据的电力交易用户管理方法、装置、设备及介质
CN114219241A (zh) * 2021-12-01 2022-03-22 深圳供电局有限公司 一种客户用电行为分析方法及系统
CN115099478A (zh) * 2022-06-17 2022-09-23 国网数字科技控股有限公司 用户用电行为预测方法、装置、电子设备及存储介质
CN117056591A (zh) * 2023-07-24 2023-11-14 深圳义云科技有限公司 基于动态预测的电力缴费渠道智能推荐方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180088A (zh) * 2017-05-10 2017-09-19 广西师范学院 基于模糊c均值聚类算法的新闻推荐方法
WO2019062011A1 (zh) * 2017-09-28 2019-04-04 平安科技(深圳)有限公司 目标客户群的构建方法、电子装置及存储介质
CN109784092A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于标签和差分隐私保护的推荐方法
CN109902915A (zh) * 2019-01-11 2019-06-18 国网浙江省电力有限公司 一种基于模糊c均值模型的电水气用能行为分析方法
CN110175286A (zh) * 2019-05-17 2019-08-27 山东师范大学 结合成对优化和矩阵分解的产品推荐方法及系统
CN110275952A (zh) * 2019-05-08 2019-09-24 平安科技(深圳)有限公司 基于用户短期兴趣的新闻推荐方法、装置及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180088A (zh) * 2017-05-10 2017-09-19 广西师范学院 基于模糊c均值聚类算法的新闻推荐方法
WO2019062011A1 (zh) * 2017-09-28 2019-04-04 平安科技(深圳)有限公司 目标客户群的构建方法、电子装置及存储介质
CN109902915A (zh) * 2019-01-11 2019-06-18 国网浙江省电力有限公司 一种基于模糊c均值模型的电水气用能行为分析方法
CN109784092A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于标签和差分隐私保护的推荐方法
CN110275952A (zh) * 2019-05-08 2019-09-24 平安科技(深圳)有限公司 基于用户短期兴趣的新闻推荐方法、装置及介质
CN110175286A (zh) * 2019-05-17 2019-08-27 山东师范大学 结合成对优化和矩阵分解的产品推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王星月: "三维耳廓随机局部特征二分优化匹配" *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612015B (zh) * 2020-05-26 2023-10-31 创新奇智(西安)科技有限公司 车辆识别方法、装置及电子设备
CN111612015A (zh) * 2020-05-26 2020-09-01 创新奇智(西安)科技有限公司 车辆识别方法、装置及电子设备
CN111899057A (zh) * 2020-08-05 2020-11-06 厦门力含信息技术服务有限公司 基于边缘云节点数据收集的客户画像数据聚类分析系统
CN111899057B (zh) * 2020-08-05 2024-05-10 厦门慧企互联科技有限公司 基于边缘云节点数据收集的客户画像数据聚类分析系统
CN112116253A (zh) * 2020-09-21 2020-12-22 中国建设银行股份有限公司 一种中心网点选择的方法、装置和系统
CN112202867A (zh) * 2020-09-27 2021-01-08 中孚安全技术有限公司 一种应用于网络安全环境的工作流节点处置方法与系统
CN112163868A (zh) * 2020-09-30 2021-01-01 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及存储介质
CN112365281A (zh) * 2020-10-28 2021-02-12 国网冀北电力有限公司计量中心 电力客户服务需求分析方法及装置
CN112365281B (zh) * 2020-10-28 2024-05-14 国网冀北电力有限公司计量中心 电力客户服务需求分析方法及装置
CN112381626A (zh) * 2020-12-10 2021-02-19 深圳供电局有限公司 一种电力增值服务潜在客户匹配方法及系统
CN113064938A (zh) * 2021-03-31 2021-07-02 深圳供电局有限公司 一种电力用户用电业务行为分析方法及系统
CN113222697A (zh) * 2021-05-11 2021-08-06 湖北三赫智能科技有限公司 商品信息推送方法、装置计算机设备及可读存储介质
CN113570349A (zh) * 2021-09-28 2021-10-29 广东电网有限责任公司中山供电局 基于em-fcm算法的电力员工画像侧写方法及系统
CN114219241A (zh) * 2021-12-01 2022-03-22 深圳供电局有限公司 一种客户用电行为分析方法及系统
CN114119111A (zh) * 2022-01-27 2022-03-01 深圳江行联加智能科技有限公司 基于大数据的电力交易用户管理方法、装置、设备及介质
CN115099478A (zh) * 2022-06-17 2022-09-23 国网数字科技控股有限公司 用户用电行为预测方法、装置、电子设备及存储介质
CN117056591A (zh) * 2023-07-24 2023-11-14 深圳义云科技有限公司 基于动态预测的电力缴费渠道智能推荐方法及系统

Also Published As

Publication number Publication date
CN111062757B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
CN111062757B (zh) 基于多路径寻优匹配的信息推荐方法及系统
CN109063945B (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN104834641B (zh) 网络媒介信息的处理方法和相关系统
CN101454771A (zh) 基于使用多媒体调查特征匹配以划分和标记个体的系统和方法
CN108921602B (zh) 一种基于集成神经网络的用户购买行为预测方法
CN103164804A (zh) 一种个性化的信息推送方法及装置
CN110009502B (zh) 理财数据分析方法、装置、计算机设备和存储介质
CN111489201A (zh) 一种客户价值分析的方法、设备、存储介质
CN105335518A (zh) 生成用户偏好信息的方法及装置
Zhang et al. Analysis of purchase history data based on a new latent class model for RFM analysis
CN105389714B (zh) 一种从行为数据识别用户特性的方法
Sun et al. Using improved RFM model to classify consumer in big data environment
Rashi et al. An AI-Based Customer Relationship Management Framework for Business Applications
CN115130811A (zh) 电力用户画像的建立方法、装置及电子设备
Khajvand et al. Analyzing customer segmentation based on customer value components (case study: a private bank)
CN108460630B (zh) 基于用户数据进行分类分析的方法和装置
EP3493082A1 (en) A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends
Takahashi Consumer behavior DNA for realizing flexible digital marketing
CN109447682A (zh) 确定店铺的营业状态的方法、系统、电子设备及存储介质
CN114092123A (zh) 一种满意度智能分析系统
CN113822691A (zh) 用户账号的识别方法、装置、系统和介质
Ramanathan An ensemble model for click through rate prediction
CN110738538A (zh) 识别相似物品的方法和装置
CN113902533B (zh) 一种适用于财税领域指标自定义和自动化运行的应用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant