CN114022205A - 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 - Google Patents
基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 Download PDFInfo
- Publication number
- CN114022205A CN114022205A CN202111306262.7A CN202111306262A CN114022205A CN 114022205 A CN114022205 A CN 114022205A CN 202111306262 A CN202111306262 A CN 202111306262A CN 114022205 A CN114022205 A CN 114022205A
- Authority
- CN
- China
- Prior art keywords
- payment
- user
- clustering
- channel
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000003064 k means clustering Methods 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000007619 statistical method Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000001174 ascending effect Effects 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 6
- 239000000463 material Substances 0.000 abstract description 3
- 230000006399 behavior Effects 0.000 description 46
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 8
- 230000005611 electricity Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/10—Payment architectures specially adapted for electronic funds transfer [EFT] systems; specially adapted for home banking systems
- G06Q20/102—Bill distribution or payments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统,方法包括:采集用户的缴费基础数据,并对缴费基础数据进行预处理;利用缴费基础数据,构造用户的缴费行为价值指标;对k‑means聚类法进行改进,对缴费行为价值指标进行聚类,以获得k个用户簇;基于统计法提取各用户簇的渠道偏好特征;根据渠道偏好特征为各用户簇匹配缴费渠道。本发明显著提高了企业对客户渠道偏好的了解程度,便于制定更加精准高效的营销策略,提高渠道运营效率,降低人力、物力等的无谓投入,精准营销,从而为企业节省更多的渠道运营成本,也为企业带来显著的经济效益。
Description
技术领域
本发明涉及电力营销技术领域,更具体地,涉及基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统。
背景技术
国外电力营销领域的研究主要集中在价格策略和对市场细分客户的服务方面,专门研究电力营销渠道的较少。国内电力营销渠道的研究主要集中在售电渠道方面,尤其是针对缴费等单一场景的研究较多,而对其他新兴服务渠道几乎未涉及。
电力行业渠道存在以下特点:
1、渠道多,管理幅度大、难度大;对市场变化无法做出最快速准确的反应,并且对保障客户服务的满意度有一定程度的影响。
2、渠道功能交叉重叠,部分渠道利用效率不高,导致资源浪费;并且不同业务的最佳渠道可能不同,会增加客户选择成本,造成部分客户流失,线上线下渠道相辅相成的作用没有得到最大程度的发挥。
3、渠道业务类型负载不均衡,线下服务成本过高,压力过大;线下实体营业厅常规居民业务负载较大,对人员数量和营业厅数量需求较高,线上线下渠道相辅相成的作用也没有得到最大程度的发挥,并且导致对于电力大客户服务的资源无法更加专注集中。
现有技术中,国内对售电渠道的研究包括:
现有技术1(CN107103386A)公开了“基于RFM模型的电力客户缴费渠道片偏好分析预测方法”,从营销业务系统提取客户缴费数据,并从中提取缴费时间间隔、缴费频率和缴费金额,对这些数据进行标准化处理后,再依据熵值法计算对应的权重系数,最终计算得到每个用户的每一种渠道的偏好评分。
但是,现有技术1仅针对于客户缴费渠道进行分析,借用并改进了客户关系管理领域中的RFM定量分析模型,需要输入指定的数据,在此基础上进行数据分析及渠道评分,判定渠道价值,然而现有技术1无法进行用户业扩报装、增容等业务的渠道偏好的分析,其适用场景受限。
现有技术2(CN105260815A)公开了“基于大数据的电力系统缴费渠道评价方法”,基于调查问卷数据,采用K-means聚类算法对用户缴费行为进行画像分析,识别出各类用户属性与各类用户缴费行为的对应关系,利用K最近邻分类算法对电力系统缴费渠道评价因素进行最邻近聚类,聚合结果作为缴费渠道评价指标,建立缴费渠道评价体系,利用模拟遗传退火算法确定缴费渠道评价指标的权重,从而形成缴费渠道评价模型。
然而,现有技术2的数据来源于调查问卷数据,调查问卷数据通常与真实数据分布存在一定偏差,对结果的客观性造成影响,因此无法直接反映某地区某一种缴费渠道的实际业务的真实需求。
现有技术3(CN111221868A)公开了“一种应用于电力客户渠道偏好的数据挖掘与分析方法”,使用聚类法找到最优聚类数,基于匹配用户数据分析用户渠道偏好的影响因素,并建立渠道偏好的预测模型。
但是,现有技术3通过建立渠道偏好的预测模型来预判客户下一次业务的渠道选择,在下一次接触用户时,通过地址信息判断用户渠道选择,从而提供相应的渠道服务,无法基于对历史数据的分析,明确典型业务场景的重点客户的渠道偏好,从而为各营销服务渠道的管理、日常营销活动的设计等提供参考。
现有技术4(CN113064938A)公开了“一种电力用户用电业务行为分析方法及系统”,生成并根据第一关联表和第二关联表获取电力用户的用电业务信息,并根据用电业务信息进行用户用电行为聚类获得聚类结果;根据聚类结果生成用户标签,根据用户标签进行画像。
但是,现有技术4虽然也使用了聚类方法,但是它仅仅根据聚类结果生成用户标签,并进一步生成用户画像,以此来进行用户用电业务行为分析,并未涉及用户缴费渠道偏好分析。
因此,需要应用大数据和聚类算法从思路构建、数据获取、数据处理、用户画像指标体系构建、模型构建等方面对电力行业客户属性、渠道偏好、业务倾向等进行分析,生成客户的业务办理渠道偏好结果;基于聚类算法的分析结果设计精准营销策略,提高渠道运营效率,降低渠道运营成本,提升经济效益。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统,以用户缴费数据的原始数据,以用户缴费渠道偏好匹配研究目标,针对研究目标构造用户缴费特征数据。以用户缴费特征数据为输入数据,进行聚类分析实现用户分群。针对不同群体开展不同特征客户渠道偏好的匹配研究。本发明有利于更好地针对不同渠道偏好的客户群体制定相应的精准营销策略,提升客户服务和渠道运营效率,为营销渠道运营及其推广性价比的提高奠定基础。
本发明采用如下的技术方案。
基于改进聚类法的电力用户缴费渠道偏好匹配方法,包括:
步骤1,采集用户的缴费基础数据,并对缴费基础数据进行预处理;
步骤2,利用缴费基础数据,构造用户的缴费行为价值指标;
步骤3,对k-means聚类法进行改进,对缴费行为价值指标进行聚类,以获得k个用户簇;
步骤4,基于统计法提取各用户簇的渠道偏好特征;根据渠道偏好特征为各用户簇匹配缴费渠道。
优选地,步骤1中,缴费基础数据包括:用户基本信息,用电类别,营业站,电子账单,逾期付费次数,总电费,缴费次数,缴费渠道和缴费方式。
优选地,用户缴费基础数据的预处理包括:剔除噪声数据;其中,噪声数据包括:无关数据、重复数据、平滑噪声数据。
优选地,步骤2中,缴费行为价值指标包括:缴费次数,缴费总额,欠费额度在总电费中的占比,缴费周期,欠费次数在缴费次数中的占比。
优选地,缴费行为价值指标,用于表征用户缴费行为特征。
优选地,步骤2包括:
步骤2.1,从用户缴费基础数据中获取用户一年内缴费次数的总和,以如下关系式构造缴费次数:
timesi=count(N)
式中,timesi为缴费次数,count(N)为对户号为N的用户一年内缴费次数进行统计;
步骤2.2,从电子账单中提取用户一年内的总电费缴费总额,构造缴费总额;
步骤2.3,从电子账单中提取用户的欠费额度,并构造欠费额度在总电费中的占比,用于表征用户一年内的欠费状况;
步骤2.4,从电子账单中提取用户最近一次缴费所用天数,构造缴费周期;
步骤2.5,构造逾期付费次数在缴费次数中的占比,用于表征用户一年内的欠费频率。
优选地,步骤3中,每个用户簇,具有不同的渠道偏好特征;每个用户簇包含多个样本点,每个样本点表征一个用户。
优选地,步骤3包括:
步骤3.1,以缴费行为价值指标构建输入样本集;
步骤3.2,利用密度函数计算输入样本集中的各样本点的分布密度,其中密度函数满足如下关系式:
式中,
ρ(xi)为第i个样本点的分布密度,
dis(xi,yi)为不同样本点xi和yi之间的欧式距离,
n为样本点的数量;
步骤3.4,利用手肘法确定聚类簇数量k;
步骤3.6,计算步骤3.5中形成的任意两个聚类簇之间的距离,并将距离按照升序排列;
优选地,步骤3.7中,新聚类簇的聚类中心满足如下关系式:
式中,S为形成的新聚类簇的聚类中心,xi为新聚类簇c内任意一个样本点,m为形成的新聚类簇c中样本点的数量。
优选地,步骤4包括:
步骤4.1,任一用户簇中,利用统计法统计各用户的缴费行为价值指标,以统计值最高的缴费行为价值指标作为该用户簇的渠道偏好特征;
步骤4.2,根据各用户簇的渠道偏好特征,为各用户簇匹配不同的缴费渠道;
步骤4.3,同一用户簇内的各用户,匹配相同的缴费渠道。
优选地,缴费渠道包括:自建渠道、半自建渠道、通道渠道。
基于改进聚类法的电力用户缴费渠道偏好匹配系统,包括:缴费基础数据模块,缴费行为价值指标模块,改进聚类模块和缴费渠道匹配模块;
缴费基础数据模块,用于采集用户的缴费基础数据,并对缴费基础数据进行预处理;缴费基础数据模块将预处理后的缴费基础数据输入至缴费行为价值指标模块中;
缴费行为价值指标模块,用于利用缴费基础数据,构造用户的缴费行为价值指标;缴费行为价值指标模块将缴费行为价值指标输入至改进聚类模块中;
改进聚类模块,用于基于改进的k-means聚类法,对缴费行为价值指标进行聚类,以获得k个用户簇;改进聚类模块将k个用户簇输入至缴费渠道匹配模块中;
缴费渠道匹配模块,用于基于统计法提取各用户簇的渠道偏好特征,并根据渠道偏好特征为各用户簇匹配缴费渠道;缴费渠道匹配模块输出各用户偏好的缴费渠道。
优选地,改进聚类模块包括:样本密度计算单元,k-means聚类单元和聚类簇合并单元;
聚类簇合并单元,用于计算任意两个聚类簇之间的距离,并将距离按照升序排列;若则将距离最近的两个聚类簇进行合并,形成新聚类簇;以均值法计算新聚类簇的聚类中心,再次调用k-means聚类单元进行聚类;若则结束聚类,以当前的聚类簇为用户簇。
本发明的有益效果在于,与现有技术相比:
1、以用户缴费的原始数据为基础,构造了表征用户缴费行为的相关指标,用以体现用户的缴费行为特征;
2、原始数据中存在噪声,不能直接用于聚类,对用户缴费的基础数据进行预处理,剔除原始数据中的无关数据、重复数据、平滑噪声数据,提升了数据质量;
3、缴费行为价值指标包括:缴费次数、缴费总额、欠费额度在总电费中的占比、缴费周期、欠费次数在缴费次数中的占比;这些字段数据表征了用户的缴费行为,也是本发明进行聚类分群的输入数据;
4、传统的k-means聚类算法的聚类效果受初始聚类中心和离群点的影响,为了避免这些影响,提出了k-means聚类算法的改进模式,包括:
(1)在k-means聚类算法中引入密度的概念,以欧式距离为基础,构造样本点的密度计算方式,衡量样本点周围分布的聚集度;初始聚类中心取在密度较大的区域;
(2)计算每个样本点的密度,并对这些密度进行排序,选取排序前的样本点作为初始聚类中心,进行聚类,然后再对形成的个聚类簇进行合并,直到得到k个聚类簇,聚类结束,用户分群完成;通过多次进行聚类簇的合并,减少计算时间;
5、显著提高企业对客户渠道偏好的了解程度,便于制定更加精准高效的营销策略,提高渠道运营效率,降低人力、物力等的无谓投入,精准营销,从而为企业节省更多的渠道运营成本,也为企业带来显著的经济效益。
附图说明
图1是本发明基于改进聚类法的电力用户缴费渠道偏好匹配方法的步骤框图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
国外电力营销领域的研究主要集中在价格策略和对市场细分客户的服务方面,专门研究电力营销渠道的较少。本发明针对缴费渠道匹配的目标,设计了相关识别用户缴费特征的指标,并且针对k-means聚类算法的缺点,提出了改进措施。引入了密度的概念,一方面将初始聚类中心选在密度较较高的地方,避免随机选取,另一方面,引入层次聚类算法的思想,对形成的小簇进行合并,知道形成K个大簇,试验表明,模型改进后聚类效果更加稳定。最后,对经聚类分析形成的不同类簇进行统计分析,然后针对形成不同群体,进行渠道匹配。
实施例1。
本发明提出的基于改进聚类法的电力用户缴费渠道偏好匹配方法,如图1,包括步骤1至4,具体如下:
步骤1,采集用户的缴费基础数据,并对缴费基础数据进行预处理。
具体地,步骤1中,缴费基础数据包括但不限于:用户基本信息,用电类别,营业站,电子账单,逾期付费次数,总电费,缴费次数,缴费渠道和缴费方式。
值得注意的是,所属领域技术人员可以根据实际业务需求采集其他类型的缴费基础数据,本发明优选实施例中的缴费基础数据的各项数据是一种非限制性的较优选择。
具体地,用户缴费基础数据的预处理包括但不限于:剔除噪声数据;其中,噪声数据包括:无关数据、重复数据、平滑噪声数据。
用户的缴费基础数据是一种原始数据,原始数据中往往存在噪声,不能直接用于聚类,因此需要对用户缴费的基础数据进行预处理,剔除原始数据中的无关数据、重复数据、平滑噪声数据。通过数据预处理,能够显著提升基础数据的质量,从而提升聚类结果的可靠性。
值得注意的是,所属领域技术人员可以根据实际业务需求采取多种数据预处理措施,本发明优选实施例中提出的数据预处理措施是一种非限制性的较优选择。
步骤2,利用缴费基础数据,构造用户的缴费行为价值指标。
本发明优选实施例中,用户分群最终要利用缴费行为指标数据进行聚类分析而得到。
具体地,步骤2中,缴费行为价值指标包括但不限于:缴费次数,缴费总额,欠费额度在总电费中的占比,缴费周期,欠费次数在缴费次数中的占比。
具体地,缴费行为价值指标,用于表征用户缴费行为特征。
具体地,步骤2包括:
步骤2.1,从用户缴费基础数据中获取用户一年内缴费次数的总和,以如下关系式构造缴费次数:
timesi=count(N)
式中,timesi为缴费次数,count(N)为对户号为N的用户一年内缴费次数进行统计;
步骤2.2,从电子账单中提取用户一年内的总电费缴费总额,构造缴费总额;
步骤2.3,从电子账单中提取用户的欠费额度,并构造欠费额度在总电费中的占比,用于表征用户一年内的欠费状况;
步骤2.4,从电子账单中提取用户最近一次缴费所用天数,构造缴费周期;
步骤2.5,构造逾期付费次数在缴费次数中的占比,用于表征用户一年内的欠费频率。
值得注意的是,所属领域技术人员可以根据实际业务需求构造多种类型的缴费行为价值指标,本发明优选实施例中的缴费行为价值指标的各项数据是一种非限制性的较优选择。
步骤3,对k-means聚类法进行改进,对缴费行为价值指标进行聚类,以获得k个用户簇。
k-means聚类算法由于受初始聚类中心的影响,聚类结果不稳定,本发明优选实施例中提出了改进措施,第一,引入密度的概念,将初始聚类中心取在密度较大的区域,第二,引入了层次聚类算法的相关思想,对第一次聚类形成的小簇进行合并,减少计算时间。实测数据证明,改进后的算法聚类效果更稳定。
具体地,步骤3中,每个用户簇,具有不同的渠道偏好特征;每个用户簇包含多个样本点,每个样本点表征一个用户。
具体地,步骤3包括:
步骤3.1,以缴费行为价值指标构建输入样本集;
步骤3.2,利用密度函数计算输入样本集中的各样本点的分布密度,其中密度函数满足如下关系式:
式中,
ρ(xi)为第i个样本点的分布密度,
dis(xi,yi)为不同样本点xi和yi之间的欧式距离,
n为样本点的数量;
步骤3.4,利用手肘法确定聚类簇数量k;
步骤3.6,计算步骤3.5中形成的任意两个聚类簇之间的距离,并将距离按照升序排列;
具体地,步骤3.7中,新聚类簇的聚类中心满足如下关系式:
式中,S为形成的新聚类簇的聚类中心,xi为新聚类簇c内任意一个样本点,m为形成的新聚类簇c中样本点的数量。
步骤4,基于统计法提取各用户簇的渠道偏好特征;根据渠道偏好特征为各用户簇匹配缴费渠道。
具体地,步骤4包括:
步骤4.1,任一用户簇中,利用统计法统计各用户的缴费行为价值指标,以统计值最高的缴费行为价值指标作为该用户簇的渠道偏好特征;
步骤4.2,根据各用户簇的渠道偏好特征,为各用户簇匹配不同的缴费渠道;
步骤4.3,同一用户簇内的各用户,匹配相同的缴费渠道。
更进一步,缴费渠道包括:自建渠道、半自建渠道、通道渠道。
本发明另一方面还提出基于改进聚类法的电力用户缴费渠道偏好匹配系统,包括:缴费基础数据模块,缴费行为价值指标模块,改进聚类模块和缴费渠道匹配模块。
缴费基础数据模块,用于采集用户的缴费基础数据,并对缴费基础数据进行预处理;缴费基础数据模块将预处理后的缴费基础数据输入至缴费行为价值指标模块中。
缴费行为价值指标模块,用于利用缴费基础数据,构造用户的缴费行为价值指标;缴费行为价值指标模块将缴费行为价值指标输入至改进聚类模块中;
改进聚类模块,用于基于改进的k-means聚类法,对缴费行为价值指标进行聚类,以获得k个用户簇;改进聚类模块将k个用户簇输入至缴费渠道匹配模块中。
具体地,改进聚类模块包括:样本密度计算单元,k-means聚类单元和聚类簇合并单元;
聚类簇合并单元,用于计算任意两个聚类簇之间的距离,并将距离按照升序排列;若则将距离最近的两个聚类簇进行合并,形成新聚类簇;以均值法计算新聚类簇的聚类中心,再次调用k-means聚类单元进行聚类;若则结束聚类,以当前的聚类簇为用户簇。
缴费渠道匹配模块,用于基于统计法提取各用户簇的渠道偏好特征,并根据渠道偏好特征为各用户簇匹配缴费渠道;缴费渠道匹配模块输出各用户偏好的缴费渠道。
本发明的有益效果在于,与现有技术相比:
1、以用户缴费的原始数据为基础,构造了表征用户缴费行为的相关指标,用以体现用户的缴费行为特征;
2、原始数据中存在噪声,不能直接用于聚类,对用户缴费的基础数据进行预处理,剔除原始数据中的无关数据、重复数据、平滑噪声数据,提升了数据质量;
3、缴费行为价值指标包括:缴费次数、缴费总额、欠费额度在总电费中的占比、缴费周期、欠费次数在缴费次数中的占比;这些字段数据表征了用户的缴费行为,也是本发明进行聚类分群的输入数据;
4、传统的k-means聚类算法的聚类效果受初始聚类中心和离群点的影响,为了避免这些影响,提出了k-means聚类算法的改进模式,包括:
(1)在k-means聚类算法中引入密度的概念,以欧式距离为基础,构造样本点的密度计算方式,衡量样本点周围分布的聚集度;初始聚类中心取在密度较大的区域;
(2)计算每个样本点的密度,并对这些密度进行排序,选取排序前的样本点作为初始聚类中心,进行聚类,然后再对形成的个聚类簇进行合并,直到得到k个聚类簇,聚类结束,用户分群完成;通过多次进行聚类簇的合并,减少计算时间;
5、显著提高企业对客户渠道偏好的了解程度,便于制定更加精准高效的营销策略,提高渠道运营效率,降低人力、物力等的无谓投入,精准营销,从而为企业节省更多的渠道运营成本,也为企业带来显著的经济效益。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (13)
1.基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
所述方法包括:
步骤1,采集用户的缴费基础数据,并对缴费基础数据进行预处理;
步骤2,利用缴费基础数据,构造用户的缴费行为价值指标;
步骤3,对k-means聚类法进行改进,对缴费行为价值指标进行聚类,以获得k个用户簇;
步骤4,基于统计法提取各用户簇的渠道偏好特征;根据渠道偏好特征为各用户簇匹配缴费渠道。
2.根据权利要求1所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤1中,缴费基础数据包括:用户基本信息,用电类别,营业站,电子账单,逾期付费次数,总电费,缴费次数,缴费渠道和缴费方式。
3.根据权利要求2所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
用户缴费基础数据的预处理包括:剔除噪声数据;其中,噪声数据包括:无关数据、重复数据、平滑噪声数据。
4.根据权利要求1所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤2中,缴费行为价值指标包括:缴费次数,缴费总额,欠费额度在总电费中的占比,缴费周期,欠费次数在缴费次数中的占比。
5.根据权利要求4所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
缴费行为价值指标,用于表征用户缴费行为特征。
6.根据权利要求2所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤2包括:
步骤2.1,从用户缴费基础数据中获取用户一年内缴费次数的总和,以如下关系式构造缴费次数:
timesi=count(N)
式中,timesi为缴费次数,count(N)为对户号为N的用户一年内缴费次数进行统计;
步骤2.2,从电子账单中提取用户一年内的总电费缴费总额,构造缴费总额;
步骤2.3,从电子账单中提取用户的欠费额度,并构造欠费额度在总电费中的占比,用于表征用户一年内的欠费状况;
步骤2.4,从电子账单中提取用户最近一次缴费所用天数,构造缴费周期;
步骤2.5,构造逾期付费次数在缴费次数中的占比,用于表征用户一年内的欠费频率。
7.根据权利要求1所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤3中,每个用户簇,具有不同的渠道偏好特征;每个用户簇包含多个样本点,每个样本点表征一个用户。
8.根据权利要求7所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤3包括:
步骤3.1,以缴费行为价值指标构建输入样本集;
步骤3.2,利用密度函数计算输入样本集中的各样本点的分布密度,其中密度函数满足如下关系式:
式中,
ρ(xi)为第i个样本点的分布密度,
dis(xi,yi)为不同样本点xi和yi之间的欧式距离,
n为样本点的数量;
步骤3.4,利用手肘法确定聚类簇数量k;
步骤3.6,计算任意两个聚类簇之间的距离,并将距离按照升序排列;
10.根据权利要求7所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
步骤4包括:
步骤4.1,任一用户簇中,利用统计法统计各用户的缴费行为价值指标,以统计值最高的缴费行为价值指标作为该用户簇的渠道偏好特征;
步骤4.2,根据各用户簇的渠道偏好特征,为各用户簇匹配不同的缴费渠道;
步骤4.3,同一用户簇内的各用户,匹配相同的缴费渠道。
11.根据权利要求10所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法,其特征在于,
缴费渠道包括:自建渠道、半自建渠道、通道渠道。
12.利用权利要求1至11任一项所述的基于改进聚类法的电力用户缴费渠道偏好匹配方法而实现的基于改进聚类法的电力用户缴费渠道偏好匹配系统,其特征在于,
所述系统包括:缴费基础数据模块,缴费行为价值指标模块,改进聚类模块和缴费渠道匹配模块;
缴费基础数据模块,用于采集用户的缴费基础数据,并对缴费基础数据进行预处理;缴费基础数据模块将预处理后的缴费基础数据输入至缴费行为价值指标模块中;
缴费行为价值指标模块,用于利用缴费基础数据,构造用户的缴费行为价值指标;缴费行为价值指标模块将缴费行为价值指标输入至改进聚类模块中;
改进聚类模块,用于基于改进的k-means聚类法,对缴费行为价值指标进行聚类,以获得k个用户簇;改进聚类模块将k个用户簇输入至缴费渠道匹配模块中;
缴费渠道匹配模块,用于基于统计法提取各用户簇的渠道偏好特征,并根据渠道偏好特征为各用户簇匹配缴费渠道;缴费渠道匹配模块输出各用户偏好的缴费渠道。
13.根据权利要求12所述的基于改进聚类法的电力用户缴费渠道偏好匹配系统,其特征在于,
改进聚类模块包括:样本密度计算单元,k-means聚类单元和聚类簇合并单元;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111306262.7A CN114022205A (zh) | 2021-11-05 | 2021-11-05 | 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111306262.7A CN114022205A (zh) | 2021-11-05 | 2021-11-05 | 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114022205A true CN114022205A (zh) | 2022-02-08 |
Family
ID=80061549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111306262.7A Pending CN114022205A (zh) | 2021-11-05 | 2021-11-05 | 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022205A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117056591A (zh) * | 2023-07-24 | 2023-11-14 | 深圳义云科技有限公司 | 基于动态预测的电力缴费渠道智能推荐方法及系统 |
CN117853152A (zh) * | 2024-03-07 | 2024-04-09 | 云南疆恒科技有限公司 | 一种基于多渠道的业务营销数据处理系统 |
-
2021
- 2021-11-05 CN CN202111306262.7A patent/CN114022205A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117056591A (zh) * | 2023-07-24 | 2023-11-14 | 深圳义云科技有限公司 | 基于动态预测的电力缴费渠道智能推荐方法及系统 |
CN117853152A (zh) * | 2024-03-07 | 2024-04-09 | 云南疆恒科技有限公司 | 一种基于多渠道的业务营销数据处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110881B (zh) | 电力客户需求预测分析方法及系统 | |
CN109063945B (zh) | 一种基于价值评估体系的售电公司360度客户画像构建方法 | |
CN114022205A (zh) | 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统 | |
CN112232909A (zh) | 一种基于企业画像的商机挖掘方法 | |
CN110046792B (zh) | 基于雷达图综合评价法的零电量用户排查方法 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
CN111626614A (zh) | 一种基于电费回收的用户分类方法 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN112184489A (zh) | 一种电力用户分群管理系统及方法 | |
CN114611738A (zh) | 一种基于用户用电行为分析的负荷预测方法 | |
CN112101807A (zh) | 一种电信行业集团客户价值综合评估的方法及相关装置 | |
CN113033909A (zh) | 携转用户分析方法、装置、设备及计算机存储介质 | |
CN114118793A (zh) | 一种地方交易所风险预警方法、装置及设备 | |
Wang et al. | Electricity market customer segmentation based on DBSCAN and k-Means:—A case on yunnan electricity market | |
CN112163781A (zh) | 基于多维度指标聚类的园区用电群体生命周期评价方法 | |
CN114841832B (zh) | 一种基于用电负荷二次聚类的电力用户画像标签建立方法 | |
CN112258067A (zh) | 基于高斯混合模型聚类算法的低压用户缴费行为分类方法 | |
CN111709791A (zh) | 一种基于改进特征词权重算法的供电营销服务方法 | |
CN116307761A (zh) | 基于云平台的招商数据管理系统 | |
CN115130811A (zh) | 电力用户画像的建立方法、装置及电子设备 | |
CN114897097A (zh) | 一种电力用户画像方法、装置、设备及介质 | |
CN114078063A (zh) | 一种利用电力客户用电负荷信息实现行业分类的方法 | |
CN113627821A (zh) | 一种基于用电行为特征进行异常用电识别的方法及系统 | |
CN114219245A (zh) | 基于大数据的乡村电力指数评价方法、装置及存储介质 | |
Soldan et al. | Characterization of electric consumers through an automated clustering pipeline |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |