CN111311331A - 一种rfm分析方法 - Google Patents
一种rfm分析方法 Download PDFInfo
- Publication number
- CN111311331A CN111311331A CN202010118211.0A CN202010118211A CN111311331A CN 111311331 A CN111311331 A CN 111311331A CN 202010118211 A CN202010118211 A CN 202010118211A CN 111311331 A CN111311331 A CN 111311331A
- Authority
- CN
- China
- Prior art keywords
- data
- analysis
- value
- interval
- basic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种RFM分析方法,包括以下步骤:对应获取基础数据,R分析,F分析,M分析,L分析,基于R分析基础数据、F分析基础数据、M分析基础数据,全方面,多维度的去分析、开发数据,深层次的展现会员消费情况。本发明帮助商家有的放矢的维护店铺会员;更灵活的针对不同店铺的会员进行分析;多维度,多条件的进行数据筛选,比市面上其他分析更全面的展示店铺会员的综合数据及消费习惯。增加了会员等级分析维度,能更好的去分析优质用户数据。
Description
技术领域
本发明属于数据分析技术领域,具体涉及一种RFM分析方法。
背景技术
电商行业飞速发展的今天,如何分析用户行为,已经成为客户管理体系中的重要一环。利用电商平台的下单数据,从哪个维度管理和分析用户,成为决定数据分析模型是否够能够给商家赋能的关键。
分析会员可以从多个维度去分析,例如:复购次数,回购周期,老客对GMV贡献值等。
有些人会单纯的用客户绝对贡献金额来分析客户是否流失,但是绝对金额有时会曲解客户行为。因为每个商品价格可能不同,对不同产品的促销有不同的折扣。
根据美国数据库营销研究所ARthuR Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(FRequency)、消费金额(MonetaRy)。
R(Recency)表示客户购买的时间有多远,F(FRequency)表示客户在时间内购买的次数,M(MonetaRy)表示客户在时间内购买的金额。
电商行业的会员管理中,除了R,F,M 3个指标外,还有一个重要的指标,会员等级(LeveL),也是衡量客户消费能力不可或缺的指标之一。
现有技术RFM分析模型,是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的最近一次消费(Recency)、消费频率(FRequency)、消费金额(MonetaRy)3项指标来描述该客户的价值状况。
在RFM模式中,一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。
该方法从R,F,M三个维度分析用户行为及习惯。企业用R、F的变化,可以推测客户消费的异动状况,根据客户流失的可能性,列出客户,再从M(消费金额)的角度来分析,就可以把重点放在贡献度高且流失机会也高的客户上,重点拜访或联系,以最有效的方式挽回更多的商机。
但是对于电商行业,RFM分析模型显得有些笼统,商家很难根据此模型分析的数据对会员进行有效管理。根据电商行业的发展现状,L(会员等级)在会员管理中的作用越来越明显,L能够反映出客户的忠诚度以及客户与店铺之间的粘合度。缺少L的RFM模型,对于电商行业的会员管理很难做到精细化。
发明内容
本发明针对现有技术问题,提供了一种RFM分析方法,打破现有的RFM分析模型的桎梏,改进现有RMF分析体系的缺点于不足,增加L(会员等级)的分析维度。从更多的纬度去分析,合理且智能的对电商用户进行不同条件的分析,更贴合实际的去进行数据处理,利用用户在电商平台上的下单数据,从购物轨迹和用户等级属性角度,分析用户行为。
为了实现以上发明目的,本发明采取的技术方案如下:
一种RFM分析方法,包括以下步骤:
步骤一,对应获取基础数据
通过订单数据获取到基础数据,按照设置店铺的不同条件,分出哪些是特定店铺哪些是选择时间段的店铺哪些是全量数据分析的店铺,对基础数据做区分,对不同店铺选择对应的数据进行分析数据的整理计算出RFML模型分析计算的数据依赖,再将所有得到的数据进行合并到一块儿传到下一步进行统一处理;
步骤二:R分析
包括包含R分析基础数据、R分析明细数据、R分析总计数据、导出;
将上步骤一得到的数据进行处理得到R分析基础数据,此步为RFM模型后续分析的基础数据处理节点,后续F分析M分析的基础数据完全依赖于此节点的结果数据;
对R分析基础数据进行计算汇总,得出总的数据结果,再将结果与R分析基础数据合并计算得出R分析相关明细数据;
导出R分析相关明细数据;
步骤三:F分析
包含F分析基础数据、F分析总计数据、F分析明细数据、导出;
依赖R分析基础数据节点,当R分析基础节点计算完毕之后出发F分析,通过R分析基础数据计算出F分析的基础数据;
对F分析基础数据进行计算汇总,得出总的数据结果,再将结果与F分析基础数据合并计算得出F分析相关明细数据;
导出F分析相关明细数据;
步骤四:M分析
包含M分析基础数据、M分析总计数据、F相关、R相关、M明细数据;
依赖R分析基础数据节点,当R分析基础节点计算完毕之后触发M分析,通过R分析基础数据计算出M分析的基础数据;
对M分析基础数据进行计算得出不同维度的F值相关,所有F值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算得出不同维度的R值相关,所有R值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算汇总,得出总的数据结果;
链接查询M-F相关和M-R相关,再将结果与M分析总计数据合并得出M分析相关明细数据;
导出M分析相关明细数据;
步骤五:L分析
为会员等级信息分析;
包含L分析、导出;
基于R分析基础数据、F分析基础数据、M分析基础数据,全方面,多维度的去分析、开发数据,深层次的展现会员消费情况。
进一步的,所述的步骤一,对应获取基础数据,具体包括以下步骤:
将店铺分为三大类:基础店铺、新增店铺或者修改参数店铺、特殊指定店铺;(1.1)订单基础数据为:取订单表与会员表进行关联,以订单表为主,关联条件为:seLLeRnick即店铺名称,buyeRnick即会员昵称相同则关联为一条数据,取昨天之前的全部数据,通过seLLeRnick即店铺昵称、buyeRnick即会员昵称、即gRade会员等级、paydate即购买时间进行分组计算出payMent即购买金额的值的和,得出计算基础数据,包含字段:seLLeRnick、buyeRnick、gRade、paydate、payMent;记为订单基础数据表;
(1.2)计算RFML模型基础数据:取第(1.1)步的结果订单基础数据,根据条件值日期选择不同的时间对应店铺类型的条件时间段截取数据,按照seLLeRnick即店铺昵称、buyeRnick即会员昵称、gRade即会员等级三个字段进行分组,对分组后的数据进行聚合计算:获取昨天的日期记为aboRtdate即截止日期、对获取时间段进行标记1为一年段时间、2为两年段时间、3为全部时间,记为Ranktype即时间类型、计算昨天时间所在月的最后一天和最近购买时间即Max(paydate)之差所得数字记为Rang_day最近购买时间间隔时间、最近购买时间记为LastpaytiMe即最近购买时间、综合分组中的订单号记为tRadenuM即订单数、合计付款金额记为payMent即个人付款总金额、付款总额除以订单数记为peRconsuMe即客单价、seLLeRnick、buyeRnick、gRade,共十个字段作为RMFL分析基础数据,并将各部分数据合并至一张表中作为RFML模型分析的最终基础数据传递至后续步骤。
进一步的,所述的步骤二:R分析,具体包括以下步骤:
(2.1)首先对步骤一最终的到的RMFL模型分析基础数据进行进一步清洗:计算及区分R值间隔对数据打标,分为固定间隔和自定义间隔按R=30天或者按店铺自定义间隔天数,将数据划分到R值间隔对应的区间内,对于自定义店铺有专门一个表存储着他们对应设置的值,只要用seLLeRnick进行关联即可得到对应的店铺,及自定义数据;最终得到数据字段:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、RinteRvaL即R值间隔、inteRvaLnuM即区间值标记、buyeRnick即会员昵称、gRade即会员等级、tRadeaMount即付款金额、tRadenuM即订单数、peRconsuMe即平均客单价,记为R分析基础数据;此步骤得出的基础数据同样是F、M、L、分析的基础数据依据
(2.2)对R分析基础数据汇总处理,计算出各店铺下、不同时间段内、各R间隔值间、各区间内的会员数记为MeMbeRcount,合计金额记为tRadeaMount,合计订单个数记为tRadenuM,最终得到R分析汇总计数据;
(2.3)对R分析基础数据进行细分,将tRadenuM即订单数及RFML分析中的F值进行细分,分别计算出以F=1、=2、=3、=4、>=5区分的数据进行分组计算,分组字段为:seLLeRnick、aboRtDate、RankType、RInteRvaL、InteRvaLNuM;分别计算F值对应的会员数、合计金额、合计订单个数即F值,合并数据后和R分析汇总数据进行合并,得到R分析明细数据,数据中详细列出了:店铺名称、截止日期、时间类型、R值间隔、第几个区间值、总客户数、总成交额、总成交订单数、F=1客户数、F=1成交额、F=1成交订单数、依次F=2、F=3、F=4、F>=5的客户数、成交额、成交订单数。
进一步的,所述的步骤三:为F分析,具体包括以下步骤:
(3.1)对基础数据进行处理,清洗成F分析所需数据样式;数据来源为:R分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对于成交数大约20的F值一律记为21否则按实际值记;得到的列为:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、FinteRvaL即F值、tRadenuM即会员在对应区域成交订单数、buyeRnick即会员昵称、gRade即会员等级、tRadeaMount即会员在该区域的成交额、RinteRvaLnuM即R区间值序号,记录为:F分析基础数据;
(3.2)对F分析基础数据做汇总处理:根据seLLeRnick即店铺昵称、aboRtDate即截止日期、RankType即时间类型、FinteRvaL即F值四个字段去做分组处理,对分组后的数据做聚合计算得出会员数记为MeMbeRcount即会员数、合计金额记为tRadeaMount即金额、合计订单个数记为tRadenuM即订单数,最终得到F分析合计数据;包含列:eLLeRnick、aboRtDate、RankType、FinteRvaL、MeMbeRcount、ReadeMount、ReadenuM;
(3.3)对F分析基础数据进行细分处理:逻辑与R分析细分处理逻辑基本一致,不过F分析是对R值进行区,依次将R值区间分为R<=30、R>30&R<=90、R>90&R<=180、R<=360四个数据块儿分别对数据进行分组,分组依据:seLLeRnick即店铺昵称、即截止日期、RankType即时间类型、FinteRvaL即F值四个字段相同为一组,计算对应的会员数、成交额、成交订单数,得出的结果进行合并,汇总至一张表中,在于F分析合计数据进行合并,得到F分析明细数据,数据中详细列出了:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、FinteRvaL即F值、MeMbeRcount即该区间的总会员数、tRadecount即该区间总成交订单数、tRadeaMount即该区间总的成交额、以及对应R<=30、R>30&R<=90、R>90&R<=180、R<=360四个区间的会员数、成交额、成交订单数。
进一步的,所述的步骤四:M分析,具体包括以下步骤:
(4.1)基础数据进行处理,清洗成M分析所需数据样式;数据来源为:M分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对数据进行一个区域划分打标的过程,统计累计支付金额在固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值的编号、M值自定义区间标记,以及支付金额种类、间隔类型;对于自定义间隔的数据间隔类型为表中记录字段即inteRvaL的值,固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值统一记为0,M值自定义区间标记划分为21个区域;对于tRadenuM值大于等于5的一律记为5反之则按实际数据记录记为FinteRvaL即F间隔;得出M分析基础数据;
分开统计各维度数据,之后进行合并;
(4.2)计算F值相关:
基于M分析基础数据根据不同的区间值,及F间隔进行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick即店铺昵称、aboRtdate即截止时间、Ranktype即时间类型、MinteRvaLtype即金额种类、InteRvaLNuM_*即区间值字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将各区间数据进行汇总;
(4.3)计算R值相关:
基于M分析基础数据根据不同的区间值,及R间隔即InteRvaLNuM值行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick即店铺昵称、aboRtdate即截止时间、Ranktype即时间类型、MinteRvaLtype即总计金额种类、InteRvaLNuM_*即区间值·字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将各区间数据进行汇总;
(4.4)总计数据:
基于M分析基础数据,对数据进行分组之后聚合操作,分组依据为:seLLeRnick即店铺昵称、aboRtDate即截止日期、RankType即时间类型、MInteRvaLType即金额类型、InteRvaLNuM_*即金额所在区间值汇总计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将个区间数据进行汇总合并;
以上为数据计算量太大,各类型和区间值分别单独跑,然后合并;
(4.5)M分析明细数据:
基于以上:F值相关、R值相关、总计数据三个数据结果的集合进行关联计算,先F相关于R相关关联,的到一份数据之后再与总计数据关联,最终得到明细结果数据。
进一步的,所述的步骤五:L分析,具体包括以下步骤:
(5.1)R分析基础数据处理:对应于R分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、RInteRvaL即R间隔、InteRvaLNuM即成交订单数、gRade即会员等级)字段进行数据分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做R标识:R记为RFMType即表示为R值对应分,间隔类型标记记为:InteRvaLType;
(5.2)F值分析基础数据处理:对应于F分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、tRadenuM即成交订单数、gRade即会员等级字段进行分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做F标识:F记为RFMType,间隔类型标记记为:InteRvaLType;
(5.3)M值分析基础数据处理:对应于M分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、MInteRvaLType即M值间隔类型、InteRvaLNuM_*,间隔类型标记记为:InteRvaLType,M值间隔InteRvaL为分组字段InteRvaLNuM_*中*所匹配的字符值;
(5.4)汇总:
将RFM三个相关数据分析到的结果进行合并统计,得到最终会员等级信息RFML模型结果;包含字段:seLLeRnick即店铺昵称、aboRtdate即截至日期、Ranktype即时间类型、RFMtype即RFM对应值类型、InteRvaLType即间隔类型、InteRvaL即间隔值、InteRvaLNuM即对应间隔值所在区域、gRade即会员等级、MeMbeRcount即会员等级、tRadenuM即成交订单数、tRadeaMount即成交金额。
本发明具有以下技术效果:
(1)帮助商家有的放矢的维护店铺会员。
(2)更灵活的针对不同店铺的会员进行分析。
(3)多维度,多条件的进行数据筛选,比市面上其他分析更全面的展示店铺会员的综合数据及消费习惯。增加了会员等级分析维度,能更好的去分析优质用户数据。
(4)定时更新数据,保证数据的准确性。
(5)对海量的数据进行了筛选,减少了数据的杂乱程度,降低了数据量反而增加了数据的准确性,减少了集群压力及数据存储的消耗。
附图说明
图1是本发明流程示意图;
图2为实施例RFML分析模型。
具体实施方式
结合实施例说明本发明的具体技术方案。
本发明目的是对海量的店铺订单信息按照最后付款时间、交易次数、交易金额、会员等级,4个维度分析客户的行为。可以展示出客户的每个等级的会员情况,帮助商家维护高质量活跃用户,唤醒沉睡客户。
基础技术语言:sqL(数据库查询语言);
平台支持:MaxCoMpute(是阿里巴巴通用计算平台提供的一种快速、完全托管的GB/TB/PB级数据仓库解决方案);
数据支持:淘宝、京东、拼多多、网易考拉、苏宁易购、有赞、等各大网购平台订单数据,及一些线下数据;
数据级别:50TB。
技术方案如图1所示,一种RFM分析方法,包括以下步骤:
步骤一,对应获取基础数据
通过订单数据获取到基础数据,按照设置店铺的不同条件,分出哪些是特定店铺哪些是选择时间段的店铺哪些是全量数据分析的店铺,对基础数据做区分,对不同店铺选择对应的数据进行分析数据的整理计算出RFML模型分析计算的数据依赖,再将所有得到的数据进行合并到一块儿传到下一步进行统一处理。
详解步骤为:
此步为基础数据处理步骤,大体上将店铺分为三大类,基础店铺(这类店铺为产品用户中基本的无特殊需求的用户,对其只统计昨天之前的360天,每月2号出一个上月月底前的360天数据);新增店铺或者修改参数店铺(这类店铺类比1类店铺统计数据改为:昨天之前的360天,上月月底前的360天数据,两月月底前的360天数据,三月月底前的360天数据);特殊指定店铺(这类店铺为重要店铺,可设置昨天之前的前720天、昨天之前全部、每月2号执行上月之前720天、每月2号执行上月之前全部、两月前720天、三月前720天、上月前全部、两月前全部、三月前全部、上年年底前360天、上年年底的720天、上年之前全部)。
订单基础数据获取步骤为:取订单表与会员表进行关联,以订单表为主,关联条件为:seLLeRnick(店铺名称)、buyeRnick(会员昵称)相同则关联为一条数据,取昨天之前的全部数据,通过seLLeRnick(店铺昵称)、buyeRnick(会员昵称)、gRade(会员等级)、paydate(购买时间·精确到天)进行分组计算出payMent(购买金额)值的和,得出计算基础数据,包含字段:seLLeRnick、buyeRnick、gRade、paydate、payMent;记为订单基础数据表。
三类店铺基础数据最终结果一样,不同的是在筛选数据时会有专门的表去控制定铺昵称(seLLeRnick),如果存在则判断为该类店铺。
计算RFML模型基础数据:取第一步的结果订单基础数据,根据条件值日期选择不同的时间如昨天到之前的360天,上月底到之前的360天等对应店铺类型的条件时间段截取数据,按照seLLeRnick(店铺昵称)、buyeRnick(会员昵称)、gRade(会员等级)三个字段进行分组,对分组后的数据进行聚合计算:获取昨天的日期记为aboRtdate(截止日期)、对获取时间段进行标记1为一年段时间、2为两年段时间、3为全部时间,记为Ranktype(时间类型)、计算昨天时间所在月的最后一天和最近购买时间(Max(paydate))之差所得数字记为Rang_day最近购买时间间隔时间、最近购买时间记为LastpaytiMe(最近购买时间)、综合分组中的订单号记为tRadenuM(订单数)、合计付款金额记为payMent(个人付款总金额)、付款总额除以订单数记为peRconsuMe(客单价)、seLLeRnick、buyeRnick、gRade(会员等级),共十个字段作为RMFL分析基础数据,并将各部分数据合并至一张表中作为RFML模型分析的最终基础数据传递至后续步骤;
步骤二:为R分析(包含R分析基础数据、R分析明细数据、R分析总计数据、导出)
将上一步得到的数据进行处理得到R分析基础数据,此步为RFM模型后续分析的基础数据处理节点,后续F分析M分析的基础数据完全依赖于此节点的结果数据;
对R分析基础数据进行计算汇总,得出总的数据结果,再将结果与R分析基础数据合并计算得出R分析相关明细数据。
导出R分析相关明细数据。
详解步骤为:
此步骤为R分析,首先对模块一最终的到的RMFL模型分析基础数据进行进一步清洗:计算及区分R值间隔对数据打标,分为固定间隔和自定义间隔按R=30天或者按店铺自定义间隔天数,将数据划分到R值间隔对应的区间内(0<=R<=720天的按30或者自定义天数划分区间,R>720天以后的将按720<R<=900、900<R<=1080、R>1080进行划分),对于自定义店铺有专门一个表存储着他们对应设置的值,只要用seLLeRnick进行关联即可得到对应的店铺,及自定义数据;最终得到数据字段:seLLeRnick(店铺昵称)、aboRtdate(截止日期)、Ranktype(时间类型)、RinteRvaL(R值间隔)、inteRvaLnuM(区间值标记)、buyeRnick(会员昵称)、gRade(会员等级)、tRadeaMount(付款金额)、tRadenuM(订单数)、peRconsuMe(平均客单价)记为R分析基础数据。此步骤得出的基础数据同样是F、M、L、分析的基础数据依据。
对R分析基础数据汇总处理,计算出各店铺下、不同时间段内、各R间隔值间、各区间内(即:对seLLeRnick、aboRtDate、RankType、RInteRvaL,InteRvaLNuM字段分组)的会员数(去重后)记为MeMbeRcount(会员数),合计金额记为tRadeaMount(金额),合计订单个数记为tRadenuM(订单数),最终得到R分析汇总计数据;
对R分析基础数据进行细分,将tRadenuM(订单数)及RFML分析中的F值进行细分,分别计算出以F=1、=2、=3、=4、>=5区分的数据进行分组计算,分组字段为:seLLeRnick、aboRtDate、RankType、RInteRvaL、InteRvaLNuM;分别计算F值对应的会员数(去重后会员数),成交金额(合计金额),合计订单个数(也是F值),合并数据后和R分析汇总数据进行合并,得到R分析明细数据,数据中详细列出了:店铺名称、截止日期、时间类型、R值间隔、第几个区间值、总客户数、总成交额、总成交订单数、F=1客户数、F=1成交额、F=1成交订单数、依次F=2、F=3、F=4、F>=5的客户数、成交额、成交订单数;
步骤三:为F分析,包含(F分析基础数据、F分析总计数据、F分析明细数据、导出)
依赖R分析基础数据节点,当R分析基础节点计算完毕之后出发F分析,通过R分析基础数据计算出F分析的基础数据;
对F分析基础数据进行计算汇总,得出总的数据结果,再将结果与F分析基础数据合并计算得出F分析相关明细数据;
导出F分析相关明细数据。
详解步骤为:
首先对基础数据进行处理,清洗成F分析所需数据样式;他的数据来源为:R分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对于成交数大约20的F值一律记为21否则按实际值记;得到的列为:seLLeRnick(店铺昵称)、aboRtdate(截止日期)、Ranktype(时间类型)、FinteRvaL(F值)、tRadenuM(会员在对应区域成交订单数)、buyeRnick(会员昵称)、gRade(会员等级)、tRadeaMount(会员在该区域的成交额)、RinteRvaLnuM(R区间值序号),记录为:F分析基础数据;
对F分析基础数据做汇总处理:根据seLLeRnick(店铺昵称),aboRtDate(截止日期),RankType(时间类型),FinteRvaL(F值)四个字段去做分组处理,对分组后的数据做聚合计算得出会员数(去重后)记为MeMbeRcount(会员数),合计金额记为tRadeaMount(金额),合计订单个数记为tRadenuM(订单数)最终得到F分析合计数据;包含列:eLLeRnick(店铺昵称)、aboRtDate(截止日期)、RankType(时间类型)、FinteRvaL(F值)、MeMbeRcount(会员数)、ReadeMount(成交金额)、ReadenuM(订单数);
对F分析基础数据进行细分处理:逻辑与R分析细分处理逻辑基本一致,不过F分析是对R值进行区,依次将R值区间分为R<=30、R>30&R<=90、R>90&R<=180、R<=360四个数据块儿分别对数据进行分组,分组依据:seLLeRnick(店铺昵称),aboRtDate(截止日期),RankType(时间类型),FinteRvaL(F值)四个字段相同为一组,计算对应的会员数、成交额、成交订单数,得出的结果进行合并,汇总至一张表中,在于F分析合计数据进行合并,得到F分析明细数据,数据中详细列出了:seLLeRnick(店铺昵称)、aboRtdate(截止日期)、Ranktype(时间类型)、FinteRvaL(F值)、MeMbeRcount(该区间的总会员数)、tRadecount(该区间总成交订单数)、tRadeaMount(该区间总的成交额)、以及对应R<=30、R>30&R<=90、R>90&R<=180、R<=360四个区间的会员数、成交额、成交订单数。
步骤四:为M分析部分包含:(M分析基础数据、M分析总计数据、F相关、R相关、M明细数据)
依赖R分析基础数据节点,当R分析基础节点计算完毕之后触发M分析,通过R分析基础数据计算出M分析的基础数据;
对M分析基础数据进行计算得出不同维度的F值相关,所有F值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算得出不同维度的R值相关,所有R值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算汇总,得出总的数据结果;
链接查询M-F相关和M-R相关,再将结果与M分析总计数据合并得出M分析相关明细数据;
导出M分析相关明细数据。
详解步骤为:
首先还是基础数据进行处理,清洗成M分析所需数据样式;他的数据来源为:M分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对数据进行一个区域划分打标的过程,统计累计支付金额在固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值的编号、M值自定义区间标记(固定值标记为0),以及支付金额种类、间隔类型;对于自定义间隔的数据间隔类型为表中记录字段(inteRvaL)的值,固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值统一记为0,M值自定义区间标记划分为21个区域;对于tRadenuM值大于等于5的一律记为5反之则按实际数据记录记为FinteRvaL(F间隔);得出M分析基础数据。
由于逻辑复杂,数据量大故此分开统计各维度数据,之后进行合并。
计算F值相关:
基于M分析基础数据根据不同的区间值,及F间隔进行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick(店铺昵称)、aboRtdate(截止时间)、Ranktype(时间类型)、MinteRvaLtype(金额种类)、InteRvaLNuM_*(区间值·*代表任意匹配·)字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值(M值间隔),最终将各区间数据进行汇总。
计算R值相关:
基于M分析基础数据根据不同的区间值,及R间隔(InteRvaLNuM值)行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick(店铺昵称)、aboRtdate(截止时间)、Ranktype(时间类型)、MinteRvaLtype(总计金额种类)、InteRvaLNuM_*(区间值·*代表任意匹配·)字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值(M值间隔),最终将各区间数据进行汇总。
总计数据:
基于M分析基础数据,对数据进行分组之后聚合操作,分组依据为:seLLeRnick(店铺昵称)、aboRtDate(截止日期)、RankType(时间类型)、MInteRvaLType(金额类型)、InteRvaLNuM_*(金额所在区间值·*代表任意匹配·)汇总计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值(M值间隔),最终将个区间数据进行汇总合并。
以上为数据计算量太大,各类型和区间值分别单独跑,然后合并。
M分析明细数据:
基于以上:F值相关、R值相关、总计数据三个数据结果的集合进行关联计算,先F相关于R相关关联,的到一份数据之后再与总计数据关联,最终得到明细结果数据,数据包含了:seLLeRnick(店铺昵称)、oRtde(截止到日期)、Rktype(时间类型(1年2年全部))、MinteRvtype(M计支付金额/MP客单价)、MinteRv(M值间隔)、inteRvnuM(M值间隔,落在第几个区间)、F.MeMbeRCount(对应的会员数)、F.TReNuM(对应的成交次数)、F.TReount(对应的成交额)、MR1MeMbeRCount(最近成交时间落在R<=30的会员数)、MR1TReNuM(最近成交时间落在R<=30的成交次数)、MR1TReount(最近成交时间落在R<=30的成交额)、MR2MeMbeRCount(最近成交时间落在30<R<=90的会员数)、MR2TReNuM(最近成交时间落在30<R<=90的成交次数)、MR2TReount(最近成交时间落在30<R<=90的成交额)、MR3MeMbeRCount(最近成交时间落在90<R<=180的会员数)、MR3TReNuM(最近成交时间落在90<R<=180的成交次数)、MR3TReount(最近成交时间落在90<R<=180的成交额)、MR4MeMbeRCount(最近成交时间落在180<R<=360的会员数)、MR4TReNuM(最近成交时间落在180<R<=360的成交次数)、MR4TReount(最近成交时间落在180<R<=360的成交额)、MR5MeMbeRCount(最近成交时间落在R>=360的会员数)、MR5TReNuM(最近成交时间落在R>=360的成交次数)、MR5TReount(最近成交时间落在R>=360的成交额)、MF1MeMbeRCount(购买次数=1的会员数)、MF1TReNuM(购买次数=1的成交次数)、MF1TReount(购买次数=1的成交额)、MF2MeMbeRCount(购买次数=2的会员数)、MF2TReNuM(购买次数=2的成交次数)、MF2TReount(购买次数=2的成交额)、MF3MeMbeRCount(购买次数=3的会员数)、MF3TReNuM(购买次数=3的成交次数)、MF3TReount(购买次数=3的成交额)、MF4MeMbeRCount(购买次数=4的会员数)、MF4TReNuM(购买次数=4的成交次数)、MF4TReount(购买次数=4的成交额)、MF5MeMbeRCount(购买次数>=5的会员数)、MF5TReNuM(购买次数>=5的成交次数)、MF5TReount(购买次数>=5的成交额)。
步骤五:为L分析步骤包含(L分析、导出)
为给予RFM模型新增加的一个会员等级信息分析。基于此将新版RMF模型分析赋予一个全新的名词RFML分析模型;
基于R分析基础数据,F分析基础数据,M分析基础数据,全方面,多维度的去分析、开发数据,深层次的展现会员消费情况
R分析基础数据处理:对应于R分析基础数据根据seLLeRnick(店铺昵称)、aboRtDate(截至时间)、RankType(时间类型)、RInteRvaL(R间隔)、InteRvaLNuM(成交订单数)、gRade(会员等级)字段进行数据分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做R标识:R记为RFMType(表示为R值对应分析),间隔类型标记记为:InteRvaLType(Fix为固定间隔,其他为MA累计支付金额/MP客单价值为自定义间隔);
F值分析基础数据处理:对应于F分析基础数据根据seLLeRnick(店铺昵称)、aboRtDate(截至时间)、RankType(时间类型)、tRadenuM(成交订单数)、gRade(会员等级)字段进行分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做F标识:F记为RFMType(表示为F值对应分析),间隔类型标记记为:InteRvaLType(Fix为固定间隔,其他为MA累计支付金额/MP客单价值为自定义间隔);
M值分析基础数据处理:对应于M分析基础数据根据seLLeRnick(店铺昵称)、aboRtDate(截至时间)、RankType(时间类型)、MInteRvaLType(M值间隔类型)、InteRvaLNuM_*(M值间隔对应区间值)、gRade(会员等级)字段进行分组汇总数据,计算出会员数、成交额、成交订单数,并对数据做M值标记M记为RFMType(表示为M值对应分析),间隔类型标记记为:InteRvaLType(为MInteRvaLType字段:MA累计支付金额/MP客单价值为自定义间隔),M值间隔InteRvaL为分组字段InteRvaLNuM_*中*所匹配的字符值(例:100、50、200,或自定义间隔值);
汇总:
将RFML四个相关数据分析到的结果进行合并统计,得到最终会员等级信息RFML模型结果;包含字段:seLLeRnick(店铺昵称)、aboRtdate(截至日期)、Ranktype(时间类型)、RFMtype(RFM对应值类型)、InteRvaLType(间隔类型)、InteRvaL(间隔值)、InteRvaLNuM(对应间隔值所在区域)、gRade(会员等级)、MeMbeRcount(会员等级)、tRadenuM(成交订单数)、tRadeaMount(成交金额)。
以上R、F、M、L四块数据组成了最终的RFML模型。模型图如图2所示为RFML模型示意图:
R:最近一次消费时间
F:消费频率
M:消费金额
L:会员等级
在图2中可以看出RFML模型中根据R、F、M、L四个维度的值划分分析人群,将人群划分为不同的区块,并根据维度值的不同定义将不同区域定义特定的属性、级别;如:R值为正、F值为正、M值为正的区块定义为:重要价值客户,对应此块儿人群会员等级L越高则价值也越大;
L值不参与会员区域划分,只负责划分同区域内会员的价值度,如在重要价值客户中的低等级会员与一般价值客户中的高等级会员,会员等级没有可比性。
本实施例涉及到的名词字典:
单价:购买金额/购买次数(一天之内交易多次算一次);
指定客户数据分析:统计时间段内的指定的目标客户数据分析;
目标客户:对应统计时间段内的客户;
活跃客户:最近交易时间在0-90天的客户;
沉睡客户:最近交易时间在91-360天的客户;
流失客户:最近交易时间大于360天的客户;
选中人数:目标客户对应的客户数;
占比:选中人数/统计时间段下全部的客户数;
交易次数:目标客户对应的客户购买次数之和(一天之内交易多次算一次);
平均交易次数:交易次数/选中人数;
交易总额:目标客户对应的交易金额之和;
单次平均交易额:交易总额/交易次数;
客单价:交易总额/选中人数;
最近交易时间:根据目标客户类型确定,【全部】则是统计时间段内的全部交易时间,活跃客户为0<=R<=90,沉睡客户为90<R<=360,流失客户为R>360;
R值分析:
R值间隔:统计时间段内R值根据系统默认的间隔天数(30)或者自定义的天数(自定义间隔天数只能为10的倍数,最大设置180),将统计时间段分成不同的区间,如果统计时间段包含的时间比较长,0<=R<=720天的按30或者自定义天数划分区间,R>720天以后的将按720<R<=900、900<R<=1080、R>1080进行划分;
客户数:对应R值间隔内的客户人数(按buyeRnick去重统计);
客户占比:(客户数/所有R值间隔对应的客户数之和)*100;
客户累计占比:(R值小于该划分区间最大值的客户数/所有R值间隔对应的客户数之和)*100;
成交额:对应R值间隔内的客户其在统计时间段内的所有付款的订单金额之和;
成交金额占比:(成交额/所有R值间隔对应的成交额之和)*100;
成交额累计占比:(R值小于该划分区间最大值的成交额/所有R值间隔对应的成交额之和)*100;
F值-客户数(百分比):(R值间隔内对应购买次数(F为1、2、3、4、>=5)下的客户数/R值间隔内的客户数);
F值-成交额(百分比):(R值间隔内对应购买次数(F为1、2、3、4、>=5)下的成交额/R值间隔内的成交额);
M值-笔单价:成交额/R值间隔内的客户在统计时间段内的所有购买次数之和(一天之内交易多次算一次);
M值-人均购买次数:R值间隔内的客户在统计时间段内的所有购买次数之和(一天之内交易多次算一次)/客户数;
人均累积消费金额:成交额/客户数;
会员等级-客户数(百分比):(R值间隔内对应会员等级(店铺、普通、高级、VIP、至尊、其他)下的客户数/R值间隔内的客户数);
会员等级-成交额(百分比):(R值间隔内对应会员等级(店铺、普通、高级、VIP、至尊、其他)下的成交额/R值间隔内的成交额);
F值分析:
F值:统计时间段内,客户的购买次数(一天之内交易多次算一次);购买次数小于等于20次的按统计的次数算,大于20次的统一分到大于20的分组下;
客户数:购买次数为F值的客户人数(按buyeRnick去重统计);
客户占比:(客户数/所有F值对应的客户数之和)*100;
客户累计占比:(小于等于当前F值的客户数之和/所有F值对应的客户数之和)*100;
成交额:购买次数为F值的客户其在统计时间段内的所有付款的订单金额之和;
成交金额占比:(成交额/所有F值对应的成交额之和)*100;
成交额累计占比:(小于等于当前F值的成交额之和/所有F值对应的成交额之和)*100;
R值-客户数(百分比):(当前F值对应的R值间隔(R≤30、30<R≤90、90<R≤180、180<R≤360、360<R)下的客户数/F值对应的客户数);
R值-成交额(百分比):(当前F值对应的R值间隔(R≤30、30<R≤90、90<R≤180、180<R≤360、360<R)下的成交额/F值对应的成交额);
M值-笔单价:成交额/F值对应的客户在统计时间段内的所有购买次数之和(一天之内交易多次算一次);
M值-人均购买次数:F值对应的客户在统计时间段内的所有购买次数之和(一天之内交易多次算一次)/客户数;
M值-人均累计消费金额:成交额/客户数;
会员等级-客户数(百分比):(F值对应的会员等级(店铺、普通、高级、VIP、至尊、其他)下的客户数/F值对应的客户数);
会员等级-成交额(百分比):(F值对应的会员等级(店铺、普通、高级、VIP、至尊、其他)下的成交额/F值对应的成交额);
M值分析:
M值类型:累计支付金额、客单价;
累计支付金额:统计时间段内客户交易总额;
客单价:统计时间段内客户交易总额/统计时间段内客户交易次数(一天之内交易多次算一次);
M值间隔选择:20、50、100、200、500、1000、2000、自定义;
M值间隔:根据不同的M值间隔选择,系统默认分为21个区间(0<=M<=1*M值间隔选择、1*M值间隔选择<M<=2*M值间隔选择...19*M值间隔选择<M<=20*M值间隔选择、M>20*M值间隔选择)。
客户数:对应M值间隔内的客户人数(按buyeRnick去重统计);
客户占比:(客户数/所有M值间隔对应的客户数之和)*100;
客户累计占比:(M值小于该划分区间最大值的客户数/所有M值间隔对应的客户数之和)*100;
成交额:对应M值间隔内的客户其在统计时间段内的所有付款的订单金额之和;
成交金额占比:(成交额/所有M值间隔对应的成交额之和)*100;
成交额累计占比:(M值小于该划分区间最大值的成交额/所有R值间隔对应的成交额之和)*100;
R值-客户数(百分比):(当前M值间隔对应的R值间隔(R≤30、30<R≤90、90<R≤180、180<R≤360、360<R)下的客户数/M值间隔对应的客户数);
R值-成交额(百分比):(当前M值间隔对应的R值间隔(R≤30、30<R≤90、90<R≤180、180<R≤360、360<R)下的成交额/M值间隔对应的成交额);
F值-客户数(百分比):(M值间隔内对应购买次数(F为1、2、3、4、>=5)下的客户数/M值间隔内的客户数);
F值-成交额(百分比):(M值间隔内对应购买次数(F为1、2、3、4、>=5)下的成交额/M值间隔内的成交额);
会员等级-客户数(百分比):(M值间隔内对应会员等级(店铺、普通、高级、VIP、至尊、其他)下的客户数/M值间隔内的客户数);
会员等级-成交额(百分比):(M值间隔内对应会员等级(店铺、普通、高级、VIP、至尊、其他)下的成交额/M值间隔内的成交额);
说明:
R值分析的R值间隔选择自定义间隔天数和M值分析的M值间隔选择自定义金额,都是设置完成以后,次日生效;
本发明绑定在集客cRM系统下的数据洞察模块下;
当用户订购集客cRM相关产品时开通此项分析权限,店铺设置分析属性提交之后后台调图1逻辑功能进行定时数据统计更新
数据展示页面后也有用户可以从多个角度看到RFML模型数据结果、R值分析、F值分析、M值分析,以及多维度的观察数据结果:客户数/占比、笔单价、累计购买金额、R值间隔时间、F值指标、M值指标等。
本发明的适用场景,RFML非常适用于生产多种商品的企业,而且这些商品单价相对不高,如消费品、化妆品、小家电、录像带店、超市等;它也适合在一个企业内只有少数耐久商品,但是该商品中有一部分属于消耗品,如复印机、打印机、汽车维修等消耗品;RFML对于加油站、旅行保险、运输、快递、快餐店、KTV、行动电话信用卡、证券公司等也很适合。
Claims (6)
1.一种RFM分析方法,其特征在于,包括以下步骤:
步骤一,对应获取基础数据
通过订单数据获取到基础数据,按照设置店铺的不同条件,分出哪些是特定店铺哪些是选择时间段的店铺哪些是全量数据分析的店铺,对基础数据做区分,对不同店铺选择对应的数据进行分析数据的整理计算出RFML模型分析计算的数据依赖,再将所有得到的数据进行合并到一块儿传到下一步进行统一处理;
步骤二:R分析
包括包含R分析基础数据、R分析明细数据、R分析总计数据、导出;
将上步骤一得到的数据进行处理得到R分析基础数据,此步为RFM模型后续分析的基础数据处理节点,后续F分析M分析的基础数据完全依赖于此节点的结果数据;
对R分析基础数据进行计算汇总,得出总的数据结果,再将结果与R分析基础数据合并计算得出R分析相关明细数据;
导出R分析相关明细数据;
步骤三:F分析
包含F分析基础数据、F分析总计数据、F分析明细数据、导出;
依赖R分析基础数据节点,当R分析基础节点计算完毕之后出发F分析,通过R分析基础数据计算出F分析的基础数据;
对F分析基础数据进行计算汇总,得出总的数据结果,再将结果与F分析基础数据合并计算得出F分析相关明细数据;
导出F分析相关明细数据;
步骤四:M分析
包含M分析基础数据、M分析总计数据、F相关、R相关、M明细数据;
依赖R分析基础数据节点,当R分析基础节点计算完毕之后触发M分析,通过R分析基础数据计算出M分析的基础数据;
对M分析基础数据进行计算得出不同维度的F值相关,所有F值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算得出不同维度的R值相关,所有R值相关数据计算完成后对得到的多个结果集合并成一个结果集;
对M分析基础数据进行计算汇总,得出总的数据结果;
链接查询M-F相关和M-R相关,再将结果与M分析总计数据合并得出M分析相关明细数据;
导出M分析相关明细数据;
步骤五:L分析
为会员等级信息分析;
包含L分析、导出;
基于R分析基础数据、F分析基础数据、M分析基础数据,全方面,多维度的去分析、开发数据,深层次的展现会员消费情况。
2.根据权利要求1所述的一种RFM分析方法,其特征在于,所述的步骤一,对应获取基础数据,具体包括以下步骤:
将店铺分为三大类:基础店铺、新增店铺或者修改参数店铺、特殊指定店铺;(1.1)订单基础数据为:取订单表与会员表进行关联,以订单表为主,关联条件为:seLLeRnick即店铺名称,buyeRnick即会员昵称相同则关联为一条数据,取昨天之前的全部数据,通过seLLeRnick即店铺昵称、buyeRnick即会员昵称、即gRade会员等级、paydate即购买时间进行分组计算出payMent即购买金额的值的和,得出计算基础数据,包含字段:seLLeRnick、buyeRnick、gRade、paydate、payMent;记为订单基础数据表;
(1.2)计算RFML模型基础数据:取第(1.1)步的结果订单基础数据,根据条件值日期选择不同的时间对应店铺类型的条件时间段截取数据,按照seLLeRnick即店铺昵称、buyeRnick即会员昵称、gRade即会员等级三个字段进行分组,对分组后的数据进行聚合计算:获取昨天的日期记为aboRtdate即截止日期、对获取时间段进行标记1为一年段时间、2为两年段时间、3为全部时间,记为Ranktype即时间类型、计算昨天时间所在月的最后一天和最近购买时间即Max(paydate)之差所得数字记为Rang_day最近购买时间间隔时间、最近购买时间记为LastpaytiMe即最近购买时间、综合分组中的订单号记为tRadenuM即订单数、合计付款金额记为payMent即个人付款总金额、付款总额除以订单数记为peRconsuMe即客单价、seLLeRnick、buyeRnick、gRade,共十个字段作为RMFL分析基础数据,并将各部分数据合并至一张表中作为RFML模型分析的最终基础数据传递至后续步骤。
3.根据权利要求1所述的一种RFM分析方法,其特征在于,所述的步骤二:R分析,具体包括以下步骤:
(2.1)首先对步骤一最终的到的RMFL模型分析基础数据进行进一步清洗:计算及区分R值间隔对数据打标,分为固定间隔和自定义间隔按R=30天或者按店铺自定义间隔天数,将数据划分到R值间隔对应的区间内,对于自定义店铺有专门一个表存储着他们对应设置的值,只要用seLLeRnick进行关联即可得到对应的店铺,及自定义数据;最终得到数据字段:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、RinteRvaL即R值间隔、inteRvaLnuM即区间值标记、buyeRnick即会员昵称、gRade即会员等级、tRadeaMount即付款金额、tRadenuM即订单数、peRconsuMe即平均客单价,记为R分析基础数据;此步骤得出的基础数据同样是F、M、L、分析的基础数据依据
(2.2)对R分析基础数据汇总处理,计算出各店铺下、不同时间段内、各R间隔值间、各区间内的会员数记为MeMbeRcount,合计金额记为tRadeaMount,合计订单个数记为tRadenuM,最终得到R分析汇总计数据;
(2.3)对R分析基础数据进行细分,将tRadenuM即订单数及RFML分析中的F值进行细分,分别计算出以F=1、=2、=3、=4、>=5区分的数据进行分组计算,分组字段为:seLLeRnick、aboRtDate、RankType、RInteRvaL、InteRvaLNuM;分别计算F值对应的会员数、合计金额、合计订单个数即F值,合并数据后和R分析汇总数据进行合并,得到R分析明细数据,数据中详细列出了:店铺名称、截止日期、时间类型、R值间隔、第几个区间值、总客户数、总成交额、总成交订单数、F=1客户数、F=1成交额、F=1成交订单数、依次F=2、F=3、F=4、F>=5的客户数、成交额、成交订单数。
4.根据权利要求1所述的一种RFM分析方法,其特征在于,所述的步骤三:为F分析,具体包括以下步骤:
(3.1)对基础数据进行处理,清洗成F分析所需数据样式;数据来源为:R分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对于成交数大约20的F值一律记为21否则按实际值记;得到的列为:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、FinteRvaL即F值、tRadenuM即会员在对应区域成交订单数、buyeRnick即会员昵称、gRade即会员等级、tRadeaMount即会员在该区域的成交额、RinteRvaLnuM即R区间值序号,记录为:F分析基础数据;
(3.2)对F分析基础数据做汇总处理:根据seLLeRnick即店铺昵称、aboRtDate即截止日期、RankType即时间类型、FinteRvaL即F值四个字段去做分组处理,对分组后的数据做聚合计算得出会员数记为MeMbeRcount即会员数、合计金额记为tRadeaMount即金额、合计订单个数记为tRadenuM即订单数,最终得到F分析合计数据;包含列:eLLeRnick、aboRtDate、RankType、FinteRvaL、MeMbeRcount、ReadeMount、ReadenuM;
(3.3)对F分析基础数据进行细分处理:逻辑与R分析细分处理逻辑基本一致,不过F分析是对R值进行区,依次将R值区间分为R<=30、R>30&R<=90、R>90&R<=180、R<=360四个数据块儿分别对数据进行分组,分组依据:seLLeRnick即店铺昵称、即截止日期、RankType即时间类型、FinteRvaL即F值四个字段相同为一组,计算对应的会员数、成交额、成交订单数,得出的结果进行合并,汇总至一张表中,在于F分析合计数据进行合并,得到F分析明细数据,数据中详细列出了:seLLeRnick即店铺昵称、aboRtdate即截止日期、Ranktype即时间类型、FinteRvaL即F值、MeMbeRcount即该区间的总会员数、tRadecount即该区间总成交订单数、tRadeaMount即该区间总的成交额、以及对应R<=30、R>30&R<=90、R>90&R<=180、R<=360四个区间的会员数、成交额、成交订单数。
5.根据权利要求1所述的一种RFM分析方法,其特征在于,所述的步骤四:M分析,具体包括以下步骤:
(4.1)基础数据进行处理,清洗成M分析所需数据样式;数据来源为:M分析基础数据;默认取R分析基础数据的R值间隔为30得到的数据,对数据进行一个区域划分打标的过程,统计累计支付金额在固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值的编号、M值自定义区间标记,以及支付金额种类、间隔类型;对于自定义间隔的数据间隔类型为表中记录字段即inteRvaL的值,固定间隔20的区域、固定间隔50的区域、固定间隔为100的区域、固定间隔为200的区域、固定间隔为500的区域、固定间隔为1000的区域、固定间隔为2000的区域,这些区域中的值统一记为0,M值自定义区间标记划分为21个区域;对于tRadenuM值大于等于5的一律记为5反之则按实际数据记录记为FinteRvaL即F间隔;得出M分析基础数据;
分开统计各维度数据,之后进行合并;
(4.2)计算F值相关:
基于M分析基础数据根据不同的区间值,及F间隔进行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick即店铺昵称、aboRtdate即截止时间、Ranktype即时间类型、MinteRvaLtype即金额种类、InteRvaLNuM_*即区间值字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将各区间数据进行汇总;
(4.3)计算R值相关:
基于M分析基础数据根据不同的区间值,及R间隔即InteRvaLNuM值行数据切分,对筛选后的数据进行分组,分组依据为:seLLeRnick即店铺昵称、aboRtdate即截止时间、Ranktype即时间类型、MinteRvaLtype即总计金额种类、InteRvaLNuM_*即区间值·字段;之后进行聚合计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将各区间数据进行汇总;
(4.4)总计数据:
基于M分析基础数据,对数据进行分组之后聚合操作,分组依据为:seLLeRnick即店铺昵称、aboRtDate即截止日期、RankType即时间类型、MInteRvaLType即金额类型、InteRvaLNuM_*即金额所在区间值汇总计算出会员数、成交额、成交订单数,InteRvaLNuM_*统一记录为字段MInteRvaL值即M值间隔,最终将个区间数据进行汇总合并;
以上为数据计算量太大,各类型和区间值分别单独跑,然后合并;
(4.5)M分析明细数据:
基于以上:F值相关、R值相关、总计数据三个数据结果的集合进行关联计算,先F相关于R相关关联,的到一份数据之后再与总计数据关联,最终得到明细结果数据。
6.根据权利要求1所述的一种RFM分析方法,其特征在于,所述的步骤五:L分析,具体包括以下步骤:
(5.1)R分析基础数据处理:对应于R分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、RInteRvaL即R间隔、InteRvaLNuM即成交订单数、gRade即会员等级)字段进行数据分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做R标识:R记为RFMType即表示为R值对应分,间隔类型标记记为:InteRvaLType;
(5.2)F值分析基础数据处理:对应于F分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、tRadenuM即成交订单数、gRade即会员等级字段进行分组归类数据,计算会员数、成交金额、成交订单数,以及对数据做F标识:F记为RFMType,间隔类型标记记为:InteRvaLType;
(5.3)M值分析基础数据处理:对应于M分析基础数据根据seLLeRnick即店铺昵称、aboRtDate即截至时间、RankType即时间类型、MInteRvaLType即M值间隔类型、InteRvaLNuM_*,间隔类型标记记为:InteRvaLType,M值间隔InteRvaL为分组字段InteRvaLNuM_*中*所匹配的字符值;
(5.4)汇总:
将RFM三个相关数据分析到的结果进行合并统计,得到最终会员等级信息RFML模型结果;包含字段:seLLeRnick即店铺昵称、aboRtdate即截至日期、Ranktype即时间类型、RFMtype即RFM对应值类型、InteRvaLType即间隔类型、InteRvaL即间隔值、InteRvaLNuM即对应间隔值所在区域、gRade即会员等级、MeMbeRcount即会员等级、tRadenuM即成交订单数、tRadeaMount即成交金额。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118211.0A CN111311331A (zh) | 2020-02-26 | 2020-02-26 | 一种rfm分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010118211.0A CN111311331A (zh) | 2020-02-26 | 2020-02-26 | 一种rfm分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111311331A true CN111311331A (zh) | 2020-06-19 |
Family
ID=71147781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010118211.0A Pending CN111311331A (zh) | 2020-02-26 | 2020-02-26 | 一种rfm分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111311331A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766651A (zh) * | 2020-12-31 | 2021-05-07 | 上海倍通医药科技咨询有限公司 | 用于数据分析的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022800A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种用户特征数据的处理方法和装置 |
CN110689355A (zh) * | 2019-09-03 | 2020-01-14 | 浙江数链科技有限公司 | 客户分类方法、装置、计算机设备和存储介质 |
-
2020
- 2020-02-26 CN CN202010118211.0A patent/CN111311331A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022800A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种用户特征数据的处理方法和装置 |
CN110689355A (zh) * | 2019-09-03 | 2020-01-14 | 浙江数链科技有限公司 | 客户分类方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
李仲游: "电商客户数据分析系统的研究与开发", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766651A (zh) * | 2020-12-31 | 2021-05-07 | 上海倍通医药科技咨询有限公司 | 用于数据分析的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7853469B2 (en) | Methods and systems for predicting business behavior from profiling consumer card transactions | |
Ahlemeyer-Stubbe et al. | A practical guide to data mining for business and industry | |
Silva et al. | Association rules extraction for customer segmentation in the SMEs sector using the apriori algorithm | |
CN104813315B (zh) | 顾客数据分析/验证系统 | |
CN107562818A (zh) | 信息推荐系统及方法 | |
Wu et al. | User Value Identification Based on Improved RFM Model and K‐Means++ Algorithm for Complex Data Analysis | |
CN109118283A (zh) | 基于大数据的精准营销服务系统 | |
US20180108000A1 (en) | Systems and methods for generating aggregated merchant analytics for a geographic sector using tip data | |
Surma | Business intelligence: making decisions through data analytics | |
CN114611959A (zh) | 一种基于o2o大数据技术的选品策略系统 | |
CN108021627A (zh) | 关联数据的存储方法及装置 | |
US20170200172A1 (en) | Consumer decision tree generation system | |
Hemalatha | Market basket analysis–a data mining application in Indian retailing | |
Sheshasaayee et al. | An efficiency analysis on the TPA clustering methods for intelligent customer segmentation | |
CN111311331A (zh) | 一种rfm分析方法 | |
CA2514075A1 (en) | System and method for distributed data warehousing | |
Vasilev et al. | Sales analysis by the rectangle method | |
Dai et al. | A Clustering-based Sales Forecast Method for Big Promotion Days in O2O On-Demand Retailing | |
Granov | Customer loyalty, return and churn prediction through machine learning methods: for a Swedish fashion and e-commerce company | |
Lin et al. | Data mining techniques to enhance customer lifetime value | |
Yan et al. | Customer segmentation using real transactional data in e-commerce platform: A case of online fashion bags shop | |
Jing et al. | The Digitally Associated Display Model For Convenience Stores: A Case Study | |
Chen et al. | Big Data Applications in Business Analysis | |
Ekowati et al. | Development of Warehouse Data Models to Support JNE Delivery Services | |
Higgins | Management science in retailing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |