CN115115265A - 一种基于rfm模型的消费者评估方法、装置及介质 - Google Patents

一种基于rfm模型的消费者评估方法、装置及介质 Download PDF

Info

Publication number
CN115115265A
CN115115265A CN202210864308.5A CN202210864308A CN115115265A CN 115115265 A CN115115265 A CN 115115265A CN 202210864308 A CN202210864308 A CN 202210864308A CN 115115265 A CN115115265 A CN 115115265A
Authority
CN
China
Prior art keywords
client
index
customer
point
consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210864308.5A
Other languages
English (en)
Inventor
杨蕾
张涛
何雪峰
杨乾栩
冯洪涛
夏体渊
李超
吴家灿
陶鹰
王海娟
李永煜
邹娟
冷思漩
苗崧
蒋梦菲
王希璇
郭珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Yunnan Industrial Co Ltd
Original Assignee
China Tobacco Yunnan Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Yunnan Industrial Co Ltd filed Critical China Tobacco Yunnan Industrial Co Ltd
Priority to CN202210864308.5A priority Critical patent/CN115115265A/zh
Publication of CN115115265A publication Critical patent/CN115115265A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于RFM模型的消费者评估方法、装置及介质,该方法包括:从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数;根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;采用层次分析法计算R、F和M各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式,根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。本发明可以精确地对进行消费者价值评估。

Description

一种基于RFM模型的消费者评估方法、装置及介质
技术领域
本发明涉及数据挖掘与数据分析领域,具体是一种基于RFM模型的消费者评估方法、装置及介质。
背景技术
随着我国烟草行业的飞速发展,各个烟草企业间的竞争也愈发激烈,现代企业的营销理念已经从“以产品为中心”演变为“以客户为中心”,对于企业而言客户成为极具价值的资源。面对庞大的不同行为模式的客户群体,科学评价客户价值并进行精准客户细分,从而制定相应客户服务策略,提供差异化营销策略,是企业将有限资源利益最大化、高效提升客户忠诚度的重要途径,有助于企业在激烈的市场竞争中占据优势地位。
目前RFM模型在客户细分领域被广泛应用,但是传统RFM模型的客户细分主要是根据R、F、M三个指标的均值直接将客户划分为8类,导致客户分类常常存在分类模糊问题。Kmeans聚类分析算法作为一种经典的迭代求解的划分聚类算法,常与RFM模型结合使用以提高客户分类精度,然而传统K-means聚类分析算法存在一定局限性,k值需要预先人工经验设定,且k值的估计非常困难;初始聚类中心随机选取而成,易造成聚类结果不准确;孤立点的存在容易造成聚类迭代次数增加,且聚类陷入局部最优;当数据属性值种类多且重要性不一致时,所使用的欧氏距离对待每个属性的重要性权重相同,导致聚类精度产生偏差。其次,在RFM模型中,各指标权重的选取是客户价值评估模型的关键,但是在大多数RFM模型应用中,识别客户价值时使用的各指标权重相同,对客户价值评价的准确性产生了负面影响。
发明内容
本发明提供一种基于RFM模型的消费者评估方法、装置及介质,解决现有RFM模型对消费者分类不精确,易造成评估结果不准确的问题,能更加科学评价客户和精准客户分类,提高企业的管理水平。
为实现以上目的,本发明提供以下技术方案:
一种基于RFM模型的消费者评估方法,包括:
从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,以获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数,其中,所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额;
根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;
采用层次分析法计算所述R指标、所述F指标和所述M指标所对应的权重系数μr、μf和μm,确定每个客户的综合价值的加权计算公式;
根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
优选的,还包括:
对所述R指标、所述F指标和所述M指标分别进行Z分数标准化变换得到xir、xif和xim,记为客户xi的三个属性值;
将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n;
对得到的客户集X'进行粗聚类得到中心点集合,利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群;
计算聚类后每类客户群的R指标、F指示和M指标的平均值,将每类客户群的R指标、F指标和M指标的平均值与全体客户的R指标、F指标和M指标的平均值进行比较,得到每类客户群的RFM类型。
优选的,采用层次分析法计算所述R指标、所述F指标和所述M指标所对应的权重系数,包括:
根据不同指标及其关联关系建立一个层次分析结构模型;
基于层次分析法将各指标进行两两比较,通过比较,以确定所述R指标、所述F指标和所述M指标的重要性程度,并按照重要性程度进行赋值,在各指标两两比较完后,将赋值后的比较结果构建判断矩阵A;
每个元素的元素值用于表征元素的重要程度,获取判断矩阵A对应的特征向量,计算得到所述R指标、所述F指标和所述M指标所对应的权重系数。
优选的,所述对得到的客户集X'进行粗聚类得到中心点集合,包括:
a)通过交叉验证法调参,设定初始距离第一阈值T1和初始距离第二阈值T2,且T1>T2;
b)初始化q=1;从客户集X'中随机选取一个客户点,作为第一个中心点c1,并将该客户点从客户集X'中删除;
c)从客户集X'中再次随机抽取一个客户点xi,利用加权欧氏距离公式计算客户点xi分别到所有中心点的加权欧式距离,记为Di={d1,d2,…,dq},找出相距最近中心点所在的集合,并记最近加权欧式距离为dmin;
d)如果T2<dmin≤T1,则将客户点xi加入该集合;如果dmin≤T2,则将客户点xi加入该集合;给客户点xi一个强标记,计算该集合中所有强标记客户点的均值,将与该均值点加权欧式距离最近的客户点设为该集合的新中心点;将客户点xi从客户集X'中删除;如果dmin>T1,则将q+1赋值给q,客户点xi作为第q+1个中心点cq+1,并将客户点xi从客户集X'中删除;
e)判断客户集X'是否为空,若为空,则表示获得中心点集合C={c1,c2,…,cq,…,ck},k表示中心点的个数;否则,返回步骤C执行。
优选的,所述利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群,包括:
将所得k个中心点作为初始聚类中心;
计算每个客户点xi分别到k个聚类中心的加权欧式距离,并将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;使k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk};
计算每一个簇中所有客户点的均值,将与该均值点的加权欧式距离最近的客户点设为新的聚类中心;
迭代直至聚类中心不再变化,得到的k个簇,即为k类客户群。
优选的,所述加权计算公式为:xirfm=μr×xirf×xifm×xim
本发明还提供一种基于RFM模型的消费者评估装置,包括:
提取单元,用于从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数,其中,所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额;
第一计算单元,用于根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;
第二计算单元,用于采用层次分析法计算R、F和M各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式,根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
优选的,还包括:
第三计算单元,用于将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n;
聚类单元,用于对得到的客户集X'进行粗聚类得到中心点集合;利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群;
比较单元,用于计算聚类后每类客户群的R、F和M指标的平均值,将每类客户群的R、F和M指标的平均值与全体客户的R、F和M指标的平均值进行比较,得到每类客户群的RFM类型。
优选的,所述第二计算单元还用于:
根据不同指标及其关联关系建立一个层次分析结构模型;
基于层次分析法将各指标进行两两比较,通过比较,以确定所述R指标、所述F指标和所述M指标的重要性程度,并按照重要性程度进行赋值,在各指标两两比较完后,将赋值后的比较结果构建判断矩阵A;
每个元素的元素值用于表征元素的重要程度,获取判断矩阵A对应的特征向量,计算得到所述R指标、所述F指标和所述M指标所对应的权重系数。
优选的,所述聚类单元还用于:
将所得k个中心点作为初始聚类中心;
计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;则k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk};
计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;
迭代直至聚类中心不再变化,得到的k个簇,即为k类客户群。
优选的,一种基于RFM模型的消费者评估装置,包括:处理器和存储器;
所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使用上述的方法。
优选的,一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行上述的方法。
本发明提供一种基于RFM模型的消费者评估方法、装置及介质,利用层次分析法确定R、F和M指标权重,加权计算出每个客户的综合价值,相比于传统RFM模型能够更客观准确地测算出客户综合价值;将k类客户群按照综合价值的平均值由高到低进行排序,可以为提供进一步地决策支持,面对综合价值更高的客户群投入更多资源,将有限资源利益最大化。
附图说明
为了更清楚地说明本发明的具体实施例,下面将对实施例中所需要使用的附图作简单地介绍。
图1为本发明一种基于RFM模型的消费者评估方法的流程图。
图2为本发明一种基于RFM模型的消费者评估装置的示意框图。
图3为本发明一种基于RFM模型的消费者评估装置的示意框图。
图4为本发明另一种基于RFM模型的消费者评估装置的示意框图。
图5为本发明一种基于RFM模型的消费者评估处理器的示意框图。
图6为本发明一种基于RFM模型的消费者评估方法的存储介质的示意框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
针对当前对农产品的体积测量存在检测效率低和准确性不高的问题。本发明提供一种基于RFM模型的消费者评估方法、装置及介质,解决现有RFM模型对消费者分类不精确,易造成评估结果不准确的问题,能更加科学评价客户和精准客户分类,提高企业的管理水平。
如图1所示,本发明提供的一种基于RFM模型的消费者评估方法,具体包括以下步骤:
S101:从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数;所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额。
S102:根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;对R、F和M指标分别进行Z分数标准化变换得到xir、xif和xim,记为客户xi的三个属性值。
S103:采用层次分析法计算R、F和M各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式:xirfm=μr×xirf×xifm×xim
S104:根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
在一实施例中,前述步骤S102之后还可以进一步包括步骤,如图2所示:
S1021:将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n。
在其他实施例中,前述步骤S1021之后还可以进一步包括步骤:
S1022:对得到的客户集X'进行粗聚类得到中心点集合。
S1023:利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群。
S1024:计算聚类后每类客户群的R、F和M指标的平均值,将每类客户群的R、F和M指标的平均值与全体客户的R、F和M指标的平均值进行比较,得到每类客户群的RFM类型。
一具体实施方式中,步骤S1021中将S1022得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离计算公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n;即以客户集X中任一客户点xi为圆心,平均加权欧式距离MeanDist(X)为半径,圆内客户点的个数即为xi的密度参数。其中,当z>0时,u(z)=1;当z≤0,u(z)=0。
进一步的,步骤S1022中对得到的客户集X'进行粗聚类得到中心点集合具体步骤如下:
a)通过交叉验证法调参,设定初始距离第一阈值T1和初始距离第二阈值T2,且T1>T2。
b)初始化q=1;从客户集X'中随机选取一个客户点,作为第一个中心点c1,并将该客户点从客户集X'中删除。
c)从客户集X'中再次随机抽取一个客户点xi,利用公式(1)计算客户点xi分别到所有中心点的加权欧式距离,记为Di={d1,d2,…,dq},找出相距最近中心点所在的集合,并记最近加权欧式距离为dmin。
d)如果T2<dmin≤T1,则将客户点xi加入该集合;如果dmin≤T2,则将客户点xi加入该集合;给客户点xi一个强标记,计算该集合中所有强标记客户点的均值,将与该均值点加权欧式距离最近的客户点设为该集合的新中心点;将客户点xi从客户集X'中删除;如果dmin>T1,则将q+1赋值给q,客户点xi作为第q+1个中心点cq+1,并将客户点xi从客户集X'中删除。
e)判断客户集X'是否为空,若为空,则表示获得中心点集合C={c1,c2,…,cq,…,ck},k表示中心点的个数;否则,返回步骤C执行。
在一实施例中,步骤S1023具体包括以下步骤:
将步骤S1022所得k个中心点作为初始聚类中心;计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;则k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk}。
计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;迭代直至聚类中心不再变化,得到的k个簇即为k类客户群。
比如,计算结果储存于result.csv文件中,如下表1所示,表中USERID代表不同客户,示例中1-12代表本次调查的12个区域,r_score,f_score,m_score分别代表RFM模型中的回购,频率和购买量评估值,分值大小从1到5。rfm_wscore代表综合评分,rfm_comb代表根据得到代分的类型。三位数字每一位分别代表回购,频率和购买量得分,分值大小从1到5。
表1
Figure BDA0003756550350000081
需要说明的是,在步骤S102中,客户的R、F和M指标选取基于RFM模型;在众多客户关系管理的分析模式中,RFM模型是一种较为流行的客户价值模型,模型包括三种指标:R、F和M;R指标表示最近一次购买时间,最近一次购买时间越近的客户越有可能再次购买,因此R值越小越好;F指标表示消费者在某个规定时间中的购买次数,经常购买的客户越有意向再次购买,客户忠诚度高,因此F值越大越好;M指标表示消费者在某个时间段中客户购买的总金额,购买金额越大,带给企业的价值越大,因此M值越大越好。
在步骤S103中,具体计算R指标、F指标和M指标的方法为,按照用户编号对各属性分组,分别计算每位客户最近一次消费时间点距离分析时间点的间隔天数,记为R指标;规定时间段中的订单编号个数,记为F指标;规定时间段中的全部订单金额总和,记为M指标。
在步骤S1024中,所述利用RFM模型对每类客户群进行RFM类型划分的具体方法为,计算聚类后每类客户群的各个指标的平均值,与全体客户的各个指标的平均值进行比较,每类客户群的RFM各指标平均值分别存在大于(等于)、小于全体客户的RFM各指标平均值两种情况,则三个指标一共有2×2×2=8种情况,因此每类客户群的RFM类型有8种可能,即重要保持客户(R↓F↑M↑)、重要发展客户(R↓F↓M↑)、重要挽留客户(R↑F↑M↑)、一般价值客户(R↑F↓M↑)、一般保持客户(R↓F↑M↓)、一般发展客户(R↓F↓M↓)、一般挽留客户(R↑F↑M↓)、无价值客户(R↑F↓M↓)。
在步骤S103中,采用层次分析法确定R、F和M指标权重的具体做法为,邀请多名专家依据Santy的1-9标度法将R、F及M这三项指标的重要程度两两进行比较,构建多个判断矩阵,对每个判断矩阵计算最大特征值及其对应的特征向量,并对特征向量归一化处理;若判断矩阵通过一致性检验,则归一化后的特征向量作为各指标权重;赋予各专家相同权重,计算各专家三项指标权重的算术平均数,作为最终三项指标的权重。
本发明采用加权欧氏距离代替传统欧氏距离,去除数据孤立点,使用算法结合传统K-means算法优化客户聚类结果,提升了客户细分的精准度和效率;运用层次分析法对RFM模型加权,得到客户价值并进行排序,可以为提供进一步地决策支持,面对综合价值更高的客户群投入更多资源,将有限资源利益最大化。
本发明将聚类后每类客户群的各个指标的平均值,与全体客户的各个指标的平均值进行比较,得到每类客户群的RFM类型,使得客户分类更加细致,有利于针对不同行为模式的客户群体,制定相应客户服务策略,提供差异化营销策略,高效提升客户忠诚度。同时,利用层次分析法确定R、F和M指标权重,加权计算出每个客户的综合价值,相比于传统RFM模型能够更客观准确地测算出客户综合价值;将k类客户群按照综合价值的平均值由高到低进行排序,可以为提供进一步地决策支持,面对综合价值更高的客户群投入更多资源,将有限资源利益最大化。
如图3所示,本发明还公开了一种基于RFM模型的消费者评估装置,包括:
提取单元301,用于从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数;所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额;
第一计算单元302,用于根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;
第二计算单元303,用于采用层次分析法计算R、F和M各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式,根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
在其他一实施例中,该评估装置还进一步包括:
第三计算单元304,用于将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n。
聚类单元305,用于对得到的客户集X'进行粗聚类得到中心点集合;利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群。
比较单元306,用于计算聚类后每类客户群的R、F和M指标的平均值,将每类客户群的R、F和M指标的平均值与全体客户的R、F和M指标的平均值进行比较,得到每类客户群的RFM类型。
具体地,第二计算单元303确定每个客户的综合价值的加权计算公式具体为:根据不同指标及其关联关系建立一个层次分析结构模型;基于层次分析法将各指标进行两两比较,通过比较哪个指标更为重要,并按照重要性程度进行赋值,在各指标两两比较完后,将赋值后的比较结果构建判断矩阵A;每个元素的元素值用于表征元素的重要程度,获取判断矩阵对应的特征向量,得到所述指标体系中各指标的权重系数。
具体地,聚类单元305用于:将所述k个中心点作为初始聚类中心;计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;则k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk};计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;迭代直至聚类中心不再变化,得到的k个簇即为k类消费者客户群。
如图5所示,本发明还提供一种电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)521和/或高速缓存存储单元522,还可以进一步包括只读存储单元(ROM)523。
存储单元520还可以包括具有一组(至少一个)程序模块525的程序/实用工具524,这样的程序模块525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的描述,本领域的技术人员易于理解,该示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
本发明还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
以上依据图示所示的实施例详细说明了本发明的构造、特征及作用效果,以上所述仅为本发明的较佳实施例,但本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。

Claims (12)

1.一种基于RFM模型的消费者评估方法,其特征在于,包括:
从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,以获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数,其中,所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额;
根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;
采用层次分析法计算所述R指标、所述F指标和所述M指标所对应的权重系数μr、μf和μm,确定每个客户的综合价值的加权计算公式;
根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
2.根据权利要求1所述的基于RFM模型的消费者评估方法,其特征在于,还包括:
对所述R指标、所述F指标和所述M指标分别进行Z分数标准化变换得到xir、xif和xim,记为客户xi的三个属性值;
将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n;
对得到的客户集X'进行粗聚类得到中心点集合,利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群;
计算聚类后每类客户群的R指标、F指示和M指标的平均值,将每类客户群的R指标、F指标和M指标的平均值与全体客户的R指标、F指标和M指标的平均值进行比较,得到每类客户群的RFM类型。
3.根据权利要求2所述的基于RFM模型的消费者评估方法,其特征在于,采用层次分析法计算所述R指标、所述F指标和所述M指标所对应的权重系数,包括:
根据不同指标及其关联关系建立一个层次分析结构模型;
基于层次分析法将各指标进行两两比较,通过比较,以确定所述R指标、所述F指标和所述M指标的重要性程度,并按照重要性程度进行赋值,在各指标两两比较完后,将赋值后的比较结果构建判断矩阵A;
每个元素的元素值用于表征元素的重要程度,获取判断矩阵A对应的特征向量,计算得到所述R指标、所述F指标和所述M指标所对应的权重系数。
4.根据权利要求2所述的基于RFM模型的消费者评估方法,其特征在于,所述对得到的客户集X'进行粗聚类得到中心点集合,包括:
a)通过交叉验证法调参,设定初始距离第一阈值T1和初始距离第二阈值T2,且T1>T2;
b)初始化q=1;从客户集X'中随机选取一个客户点,作为第一个中心点c1,并将该客户点从客户集X'中删除;
c)从客户集X'中再次随机抽取一个客户点xi,利用加权欧氏距离公式计算客户点xi分别到所有中心点的加权欧式距离,记为Di={d1,d2,…,dq},找出相距最近中心点所在的集合,并记最近加权欧式距离为dmin;
d)如果T2<dmin≤T1,则将客户点xi加入该集合;如果dmin≤T2,则将客户点xi加入该集合;给客户点xi一个强标记,计算该集合中所有强标记客户点的均值,将与该均值点加权欧式距离最近的客户点设为该集合的新中心点;将客户点xi从客户集X'中删除;如果dmin>T1,则将q+1赋值给q,客户点xi作为第q+1个中心点cq+1,并将客户点xi从客户集X'中删除;
e)判断客户集X'是否为空,若为空,则表示获得中心点集合C={c1,c2,…,cq,…,ck},k表示中心点的个数;否则,返回步骤C执行。
5.根据权利要求2所述的基于RFM模型的消费者评估方法,其特征在于,所述利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群,包括:
将所得k个中心点作为初始聚类中心;
计算每个客户点xi分别到k个聚类中心的加权欧式距离,并将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;使k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk};
计算每一个簇中所有客户点的均值,将与该均值点的加权欧式距离最近的客户点设为新的聚类中心;
迭代直至聚类中心不再变化,得到的k个簇,即为k类客户群。
6.根据权利要求2所述的基于RFM模型的消费者评估方法,其特征在于,所述加权计算公式为:xirfm=μr×xirf×xifm×xim
7.一种基于RFM模型的消费者评估装置,其特征在于,包括:
提取单元,用于从客户数据库中提取客户消费数据,并对客户消费数据按照不同地理区域进行数据分类,对数据分类后的客户消费数据集进行向量化处理,获得客户集X={x1,x2,…xi,…xn},1≤i≤n,n为客户个数,其中,所述客户消费数据包括卷烟类型、卷烟口味、包装设计、消费意愿、消费氛围、消费频率和消费金额;
第一计算单元,用于根据数据分类后的客户消费数据,计算每位客户最近一次消费的时间间隔R指标、规定时间段的消费频率F指标和规定时间段的消费总金额M指标;
第二计算单元,用于采用层次分析法计算R、F和M各指标权重系数分别为μr、μf和μm,确定每个客户的综合价值的加权计算公式,根据每个客户的综合价值的加权计算公式计算得到每个客户的综合价值。
8.根据权利要求7所述的基于RFM模型的消费者评估装置,其特征在于,还包括:
第三计算单元,用于将得到的客户xi的三个属性值作为输入数据,确定加权欧氏距离公式,去除客户集X中所有孤立点,得到客户集X'={x1',x2',…xi',…xm'},1≤i≤m≤n;
聚类单元,用于对得到的客户集X'进行粗聚类得到中心点集合;利用得到的中心点集合作为K-means算法的初始聚类中心进行聚类,得到k类客户群;
比较单元,用于计算聚类后每类客户群的R、F和M指标的平均值,将每类客户群的R、F和M指标的平均值与全体客户的R、F和M指标的平均值进行比较,得到每类客户群的RFM类型。
9.根据权利要求8所述的基于RFM模型的消费者评估装置,其特征在于,所述第二计算单元还用于:
根据不同指标及其关联关系建立一个层次分析结构模型;
基于层次分析法将各指标进行两两比较,通过比较,以确定所述R指标、所述F指标和所述M指标的重要性程度,并按照重要性程度进行赋值,在各指标两两比较完后,将赋值后的比较结果构建判断矩阵A;
每个元素的元素值用于表征元素的重要程度,获取判断矩阵A对应的特征向量,计算得到所述R指标、所述F指标和所述M指标所对应的权重系数。
10.根据权利要求9所述的基于RFM模型的消费者评估装置,其特征在于,所述聚类单元还用于:
将所得k个中心点作为初始聚类中心;
计算每个客户点xi分别到k个聚类中心的加权欧式距离,将每个客户点xi分配到与其加权欧式距离最近的聚类中心所在的簇中;则k个聚类中心形成k个簇S,S={S1,S2,…Sj,…Sk};
计算每一个簇中所有客户点的均值,将与该均值点加权欧式距离最近的客户点设为新的聚类中心;
迭代直至聚类中心不再变化,得到的k个簇,即为k类客户群。
11.一种基于RFM模型的消费者评估装置,其特征在于,包括:处理器和存储器;
所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使用权利要求1至6任一项所述的方法。
12.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行权利要求1至6中任一项所述的方法。
CN202210864308.5A 2022-07-21 2022-07-21 一种基于rfm模型的消费者评估方法、装置及介质 Pending CN115115265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210864308.5A CN115115265A (zh) 2022-07-21 2022-07-21 一种基于rfm模型的消费者评估方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210864308.5A CN115115265A (zh) 2022-07-21 2022-07-21 一种基于rfm模型的消费者评估方法、装置及介质

Publications (1)

Publication Number Publication Date
CN115115265A true CN115115265A (zh) 2022-09-27

Family

ID=83334946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210864308.5A Pending CN115115265A (zh) 2022-07-21 2022-07-21 一种基于rfm模型的消费者评估方法、装置及介质

Country Status (1)

Country Link
CN (1) CN115115265A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115563555A (zh) * 2022-11-30 2023-01-03 中南大学 一种数据驱动的互联网卡用户价值分类方法、设备及介质
CN116797253A (zh) * 2022-12-13 2023-09-22 乖乖数字科技(苏州)有限公司 一种基于客户资源的分类管理方法
CN117272398A (zh) * 2023-11-23 2023-12-22 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统
CN117593034A (zh) * 2024-01-17 2024-02-23 湖南三湘银行股份有限公司 基于计算机的用户分类方法
CN117745129A (zh) * 2023-12-05 2024-03-22 武汉国信映盛互动技术有限公司 一种新型用户等级评价管理方法、装置、电子设备及介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115563555A (zh) * 2022-11-30 2023-01-03 中南大学 一种数据驱动的互联网卡用户价值分类方法、设备及介质
CN115563555B (zh) * 2022-11-30 2023-03-14 中南大学 一种数据驱动的互联网卡用户价值分类方法、设备及介质
CN116797253A (zh) * 2022-12-13 2023-09-22 乖乖数字科技(苏州)有限公司 一种基于客户资源的分类管理方法
CN116797253B (zh) * 2022-12-13 2024-03-01 乖乖数字科技(苏州)有限公司 一种基于客户资源的分类管理方法
CN117272398A (zh) * 2023-11-23 2023-12-22 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统
CN117272398B (zh) * 2023-11-23 2024-01-26 聊城金恒智慧城市运营有限公司 基于人工智能的数据挖掘安全保护方法及系统
CN117745129A (zh) * 2023-12-05 2024-03-22 武汉国信映盛互动技术有限公司 一种新型用户等级评价管理方法、装置、电子设备及介质
CN117593034A (zh) * 2024-01-17 2024-02-23 湖南三湘银行股份有限公司 基于计算机的用户分类方法
CN117593034B (zh) * 2024-01-17 2024-06-07 湖南三湘银行股份有限公司 基于计算机的用户分类方法

Similar Documents

Publication Publication Date Title
CN115115265A (zh) 一种基于rfm模型的消费者评估方法、装置及介质
WO2021012783A1 (zh) 基于大数据的保单核保模型训练方法和核保风险评估方法
JP6344395B2 (ja) 払出量予測装置、払出量予測方法、プログラム、及び、払出量予測システム
CN112232930A (zh) 一种基于加权rfm模型的电商平台客户细分方法
CN112070125A (zh) 一种基于孤立森林学习的不平衡数据集的预测方法
JP2002543538A (ja) 実験データの分布状階層的発展型モデリングと可視化の方法
WO2015040789A1 (ja) 商品推薦装置、商品推薦方法、及び、記録媒体
JP6344396B2 (ja) 発注量決定装置、発注量決定方法、プログラム、及び、発注量決定システム
CN107886241B (zh) 资源分析方法、装置、介质和电子设备
CN112990386B (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN115170294A (zh) 一种客户分类方法、装置及服务器
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
US11556595B2 (en) Attribute diversity for frequent pattern analysis
US20060005121A1 (en) Discretization of dimension attributes using data mining techniques
CN113554307B (zh) 一种基于rfm模型的用户分组方法、装置及可读介质
CN115577259A (zh) 高压直流输电系统故障选极方法、装置和计算机设备
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN113221966A (zh) 基于F_Max属性度量的差分隐私决策树构建方法
CN116501770B (zh) 一种基于模糊算法的用户数据采集方法及系统
CN112559859B (zh) 资源推荐方法、装置、电子设备及机器可读存储介质
JP2002358411A (ja) プリペイメント分析システム、マイニング装置、統計分析装置、プリペイメント分析方法、およびプログラム
Sukhanov et al. Collaborative Filtering Algorithm for Recommender Systems
CN114611976A (zh) 一种电力用户行为画像方法、系统及装置
CN117971913A (zh) 一种应用数据库信息收集反馈指令的系统
CN115169460A (zh) 一种用户分类的方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination