CN115860787A - 一种增量式消费者画像方法 - Google Patents
一种增量式消费者画像方法 Download PDFInfo
- Publication number
- CN115860787A CN115860787A CN202211720987.5A CN202211720987A CN115860787A CN 115860787 A CN115860787 A CN 115860787A CN 202211720987 A CN202211720987 A CN 202211720987A CN 115860787 A CN115860787 A CN 115860787A
- Authority
- CN
- China
- Prior art keywords
- rfm
- incremental
- model
- user
- consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 9
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000003384 imaging method Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012821 model calculation Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 abstract 1
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种增量式消费者画像方法,包含对客户的粗粒度价值分类和偏好分析。基于智能消费终端收集到的用户购买行为记录,首先采用RFM模型对客户进行价值评估,根据用户最近一次消费、消费频率以及消费金额三个指标判断客户对公司的价值。然后,对RFM模型进行了增量式优化,随着新的用户购买行为数据不断产生,设计了高效的更新策略,避免重复读取历史数据,造成不必要的冗余计算,从而加快了RFM模型更新效率。同时引入TGI(Target Group Index)模型,根据用户的消费记录分析用户的消费习惯,对用户根据其所属类型进行一定程度的偏好刻画,有利于按人群推荐其偏好的产品。
Description
技术领域
本发明属于用户画像领域,尤其涉及一种增量式消费者画像方法。
背景技术
随着互联网的普及,许多零售店受到前所未有的冲击。但是随着近几年零售店转型升级,智能销售终端开始普及,使得零售店能够收集到消费者的历史购买记录。通过合理利用这些消费者数据,可以有效帮助零售店合理配置资源,提高消费者黏性,
但是如何通过对消费者的购买行为记录进行分析,形成对消费者的消费动机、消费能力、消费偏好、消费习惯和消费趋势的精准认识是目前的主要难点。为此,我们提出一种增量式消费者画像方法,对客户的粗粒度价值分类和偏好分析。
在之前工作中,传统RFM模型是一种常用的用于评价客户流失倾向、忠诚度和客户价值的计算方法,这一模型通过客户的最近的购买时间、购买的频率以及消费的价格三项指标来动态地刻画客户。
但是,传统RFM模型的三个指标都具有实时性,即消费的近度、频度、额度都会随着时间的流逝、订单的产生进行改变。同时用户的消费习惯、消费需求也并非一成不变,它随时可能因为用户新的尝试、销售商品的淡旺季、年龄的成长等因素进行改变,对用户消费习惯的攫取和预测更应该以“近况”为准。因此,为了获得最新的RFM模型,需要在历史消费数据的基础上,考虑新产生的消费数据。但是如果使用传统计算方法对历史数据以及新产生的数据重新计算RFM模型,将非常耗时,尤其是当历史数据规模非常庞大时。
本发明克服了传统RFM模型的缺点,提出一种增量式RFM计算方法,在历史RFM模型基础上,对新产生的消费数据统计相关指标,快速更新RFM模型。然后,增量RFM模型对客户进行分类,通过历史数据对商品进行分析,统计8类用户对它们的TGI指数。通过TGI指数,可以分析不同类型客户购物偏好,为之后零售终端补货提供借鉴。
发明内容
本发明的目的在于针对现有技术的不足,提供一种增量式消费者画像方法,通过增量RFM模型,然后通过TGI分析,从而快速的分析不同类型客户偏好,为之后商品补货提供借鉴。
本发明的目的是通过以下技术方案来实现,一种增量式消费者画像方法,包括以下步骤:
1)对商品数据进行预处理。
2)将步骤1)预处理后的商品信息进行RFM模型计算。
3)基于步骤2)得到的RFM模型指标,快速更新RFM模型,得到增量RFM模型。
4)基于步骤3)通过增量RFM模型分类结果,利用TGI模型分析不同类别的客户对各种商品的偏好程度。
步骤1)中,数据预处理方法:
1.1)对于获取用户购买商品消费记录进行预处理操作。
1.2)对消费者购买商品与价格进行分类。
1.3)统计用户的历史消费记录。
步骤2)中,RFM模型计算:
2.1)统计用户历史消费记录。
2.2)基于历史数据统计的得到用户RFM表。
2.3)根据公式计算,得到基于历史数据统计的用户RFM打分表。
2.4)根据RFM打分表,得到基于历史数据统计的用户RFM用户划分表。
步骤3)中,增量RFM模型计算:
3.1)假设增加了一个月的数据量,统计最新一个月的用户RFM表。
3.2)根据2.2)步骤的历史数据统计的用户RFM表与最新一个月的用户RFM表,通过公式计算,得到最新的RFM打分表。
步骤4)中,TGI模型分析:
4.1)利用增量RFM模型对客户进行分类
4.2)从历史数据中挑选销量最高商品进行分析,统计8类用户对它们的TGI指数
4.3)通过TGI指数,可以分析不同类型客户的购买商品偏好,为之后零售商品补货提供借鉴。
与现有技术相比,本发明具有如下优点:
本发明增量式消费者画像方法,在历史RFM模型基础上,对新产生的消费数据统计相关指标,快速更新RFM模型,避免重复读取历史数据,造成不必要的冗余计算,从而加快了RFM模型更新效率。
然后本发明基于增量RFM模型的分类结果,将利用TGI模型分析不同类别的客户对各种商品的偏好程度。具体步骤如下,首先会利用RFM模型对客户进行分类,然后从历史数据中挑选销量最高的4种商品进行分析,统计8类用户对它们的TGI指数。通过TGI指数,可以分析不同类型客户购买商品偏好。
附图说明
图1为TGI分析流程。
图2为本发明增量式消费者画像方法的流程示意图。
具体实施方式
下面结合附图以及具体实例对本发明提出的方法进行进一步的详细说明。
如图1和图2所示,一种增量式消费者画像方法,包含以下步骤:
1)对商品数据进行预处理。
2)将步骤1)预处理后的商品信息进行RFM模型计算。
3)基于步骤2)得到的RFM模型指标,快速更新RFM模型,得到增量RFM模型。
4)基于步骤3)通过增量RFM模型分类结果,利用TGI模型分析不同类别的客户对各种商品的偏好程度。
增量RFM模型
RFM模型是一种常用的用于评价客户流失倾向、忠诚度和客户价值的计算方法,这一模型通过客户的最近的购买时间、购买的频率以及消费的价格三项指标来动态地刻画客户,即距离上一次交易的时间R(简称“近度”,Recency)、最近N个月的交易次数F(简称“频度”,Frequency)和最近N个月的交易金额M(简称“额度”,Monetary)的综合分析。
RFM模型会计算三个指标的整体平均值,记作ravg、favg和mavgravg,然后根据每个客户自身的RFM指标与平均值的大小关系,将对应指标标记为0或1,即:
基于上述公式,每个客户都可以被3个0/1标记,最终可以分类成如表1所示的8类用户。
表1RFM模型用户分类
RFM模型的三个指标都具有实时性,即消费的近度、频度、额度都会随着时间的流逝、订单的产生进行改变。同时用户的消费习惯、消费需求也并非一成不变,它随时可能因为用户新的尝试、商品销售的淡旺季、年龄的成长等因素进行改变,对用户消费习惯的攫取和预测更应该以“近况”为准。因此,为了获得最新的RFM模型,需要在历史消费数据的基础上,考虑新产生的消费数据。但是如果使用传统计算方法对历史数据以及新产生的数据重新计算RFM模型,将非常耗时,尤其是当历史数据规模非常庞大时。
因此,本发明提出一种增量式消费者画像方法,在历史RFM模型基础上,对新产生的消费数据统计相关指标,快速更新RFM模型。
情况1:用户u在历史数据和新增数据中都存在购买记录:
情况2:用户u只在历史数据中存在购买记录,没有在新增数据中存在购买记录:
其中I表示新增数据的时间间隔。假设我们每个月对RFM模型进行更新,则I=30。
情况3:用户u只在新增数据存在购买记录,没有在历史数据中存在购买记录:
每个用户的RFM指标更新完成后,还需要计算各个指标的平均值,才能为用户分类。假设历史数据中的用户集合记作Uold,共包含Nold个用户,且历史数据的RFM平均值分别为假设新增数据中的用户结合记作Unew,共包含Nnew个用户,其中个用户在历史数据中存在购买行为,其中个用户没有在历史数据中存在购买行为,则它们满足更新后的RFM模型各个指标平均值可通过如下公式计算:
其中U′=Uold-(Uold∩Unew)表示只在历史数据中存在购买记录的用户集合。
TGI
TGI(Target Group Index)又称目标群体指数,可反映目标群体在特定研究范围内的强势或弱势。简言之,就是比之全体成员,目标群体对某一物体或特征的偏好。TGI指数可由如下公式计算得到:
TGI指数表征不同群体对相同问题的差异情况,其中TGI指数等于100表示平均水平,高于100,代表该类用户对某类问题的关注程度高于整体水平。
假设基于历史数据统计的RFM数据如下:
表2基于历史数据统计的用户RFM表
可以计算每个指标的平均值:
然后根据各用户RFM数据与平均值的大小关系计算每个用户在三个指标的打分情况,以u1为例:
类似地,可以得到全部用户的评分矩阵,如表3所示:
表3基于历史数据统计的用户RFM打分表
根据表1可以得知四名用户的用户分类结果如表4所示:
表4基于历史数据统计的用户RFM用户划分表
假设在表2的基础上,又过了一个月,增加了一个月的数据量,并且这一个月的RFM统计情况如下:
表5最新一个月的用户RFM表
其中增加了一个新的用户u5,在之前表1中没有出现过。另外u2和u4由于没有在这一个月内买过商品,所以在表中没有记录。
可以看到利用增量式的方式不需要遍历历史数据去获得历史RFM值,节约了大量计算,避免重复计算。
基于增量RFM模型的分类结果,利用TGI模型分析不同类别的客户对各种品牌的偏好程度,分析的大致流程如图1所示。
我们首先会利用RFM模型对客户进行分类(红色箭头部分),然后从历史数据中挑选销量最高的4种商品进行分析,统计8类用户对它们的TGI指数(蓝色箭头部分)。通过TGI指数,可以分析不同类型客户的商品购买偏好,为之后零售终端补货提供借鉴。
对于本领域的技术人员来说,可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。
Claims (5)
1.一种增量式消费者画像方法,其特征在于,包括以下步骤:
1)对商品数据进行预处理;
2)将步骤1)预处理后的商品信息进行RFM模型计算,得到RFM模型指标;
3)基于步骤2)得到的RFM模型指标,更新RFM模型,得到增量RFM模型;
4)通过步骤3)的增量RFM模型获取分类结果,利用TGI模型分析不同类别的客户对各种商品的偏好程度。
2.如权利要求1所述增量式消费者画像方法,其特征在于,步骤1)中,对商品数据进行预处理,具体包括:
1.1)对于获取用户购买商品消费记录进行预处理操作;
1.2)对消费者购买商品与价格进行分类;
1.3)统计用户的历史消费记录。
3.如权利要求1所述增量式消费者画像方法,其特征在于,步骤2)中,RFM模型计算:
2.1)统计用户历史消费记录;
2.2)基于历史数据统计的得到用户RFM表;
2.3)根据公式计算,得到基于历史数据统计的用户RFM打分表;
2.4)根据RFM打分表,得到基于历史数据统计的用户RFM用户划分表。
4.如权利要求1所述增量式消费者画像方法,其特征在于,步骤3)中,更新RFM模型计算:
3.1)假设增加了一个月的数据量,统计最新一个月的用户RFM表;
3.2)根据2.2)步骤的历史数据统计的用户RFM表与最新一个月的用户RFM表,通过公式计算,得到最新的RFM打分表。
5.如权利要求1所述增量式消费者画像方法,其特征在于,步骤4)中,通过步骤3)的增量RFM模型获取分类结果,利用TGI模型分析不同类别的客户对各种商品的偏好程度,具体包括:
4.1)利用增量RFM模型对客户进行分类,获取分类结果;
4.2)从历史数据中挑选销量最高商品进行分析,统计8类用户对它们的TGI指数;
4.3)通过TGI指数,分析不同类型客户的购买商品偏好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720987.5A CN115860787A (zh) | 2022-12-30 | 2022-12-30 | 一种增量式消费者画像方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720987.5A CN115860787A (zh) | 2022-12-30 | 2022-12-30 | 一种增量式消费者画像方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115860787A true CN115860787A (zh) | 2023-03-28 |
Family
ID=85656303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211720987.5A Withdrawn CN115860787A (zh) | 2022-12-30 | 2022-12-30 | 一种增量式消费者画像方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115860787A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116431931A (zh) * | 2023-06-14 | 2023-07-14 | 陕西思极科技有限公司 | 实时增量数据统计分析方法 |
CN116777504A (zh) * | 2023-08-24 | 2023-09-19 | 北京信索咨询股份有限公司 | 基于消费研究分析的产品购入评估系统 |
-
2022
- 2022-12-30 CN CN202211720987.5A patent/CN115860787A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116431931A (zh) * | 2023-06-14 | 2023-07-14 | 陕西思极科技有限公司 | 实时增量数据统计分析方法 |
CN116431931B (zh) * | 2023-06-14 | 2023-08-25 | 陕西思极科技有限公司 | 实时增量数据统计分析方法 |
CN116777504A (zh) * | 2023-08-24 | 2023-09-19 | 北京信索咨询股份有限公司 | 基于消费研究分析的产品购入评估系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115860787A (zh) | 一种增量式消费者画像方法 | |
US7010495B1 (en) | Methods and systems for analyzing historical trends in marketing campaigns | |
US20040138958A1 (en) | Sales prediction using client value represented by three index axes as criteron | |
JP2015097094A (ja) | リアルタイム広告入札に対して競争評価モデルを使用するための学習システム | |
CN107665448A (zh) | 用于确定消费贡献价值的方法、装置以及存储介质 | |
US11321724B1 (en) | Product evaluation system and method of use | |
CN113469722A (zh) | 消费预测系统及消费预测方法 | |
CN109685540A (zh) | 电商平台及其商品促销控制方法、设备、可读存储介质 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
EP3400571A1 (en) | Consumer decision tree generation system | |
US20020161561A1 (en) | System and method for association of object sets | |
CN117455632A (zh) | 一种基于大数据的电商选品分析管理平台 | |
CN116187808A (zh) | 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法 | |
CN116579804A (zh) | 一种节假日商品销量预测方法、装置及计算机存储介质 | |
CN111507782A (zh) | 一种用户流失归因聚焦方法、装置、存储介质及电子设备 | |
US20150142782A1 (en) | Method for associating metadata with images | |
US7783547B1 (en) | System and method for determining hedge strategy stock market forecasts | |
Arivazhagan et al. | Pattern discovery and analysis of customer buying behavior using association rules mining algorithm in e-commerce | |
CN114971805A (zh) | 一种基于深度学习的电子商务平台商品智能分析推荐系统 | |
CN110490682A (zh) | 分析商品属性的方法和装置 | |
CN114418318A (zh) | 一种采购任务优先级队列的生成方法 | |
CN114741617A (zh) | 一种企业财务数据采集分析方法、系统及计算机存储介质 | |
CN109360051A (zh) | 确定用户购物需求的方法、装置、设备及可读存储介质 | |
CN111311331A (zh) | 一种rfm分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230328 |