CN109858947A - 零售用户价值分析系统及方法 - Google Patents

零售用户价值分析系统及方法 Download PDF

Info

Publication number
CN109858947A
CN109858947A CN201811592819.6A CN201811592819A CN109858947A CN 109858947 A CN109858947 A CN 109858947A CN 201811592819 A CN201811592819 A CN 201811592819A CN 109858947 A CN109858947 A CN 109858947A
Authority
CN
China
Prior art keywords
user
model
transaction
value
following
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811592819.6A
Other languages
English (en)
Other versions
CN109858947B (zh
Inventor
陈煜波
胡豫陇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201811592819.6A priority Critical patent/CN109858947B/zh
Publication of CN109858947A publication Critical patent/CN109858947A/zh
Application granted granted Critical
Publication of CN109858947B publication Critical patent/CN109858947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种零售用户价值分析系统及方法,包括:采集用户交易数据和用户轮廓特征;设定基本时间单位;将老用户交易数据按基本时间单位划分;构建未来交易次数模型、未来交易金额模型和未来价值模型;将老用户在每个基本时间单位交易数据作为训练集,将训练集分别代入上述模型获得每个老用户未来交易次数、未来交易金额和未来价值;将每个老用户交易总金额作为每个老用户当前价值;根据未来价值和当前价值对老用户进行分类;对每类老用户用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。上述系统及方法根据用户交易数据对用户进行价值分析和分类。

Description

零售用户价值分析系统及方法
技术领域
本发明涉及网络技术领域,更为具体地,涉及一种零售用户价值分析系统及方法。
背景技术
随着互联网和金融科技的快速发展,银行业正不断面临来自新型互联网金融产品的竞争(例如“腾讯理财”、“陆金所”、“余额宝”等),互联网金融等新型金融业态对传统银行业务的影响日益明显。同时,受到利率市场化和“金融脱媒”的影响,国内银行业也正在面临垄断地位弱化,利润下滑的现状。传统银行业亟待寻求新的业务增长点和核心竞争力,实现新的业态转型。在转型过程中,若能充分发挥大数据背景下的信息经济优势和银行完善的金融业务体系优势,将能达成传统银行业务与互联网金融互利共赢的模式。基于大数据的用户行为和价值分析,可以帮助银行业深入了解大数据背景下互联网金融对传统银行业务和用户行为的影响方式,从而帮助银行业改进用户管理策略,打造新的企业核心竞争力,形成新型数字化的银行业务生态,实现更加有效获取和留存用户,扩大市场份额。
传统零售银行业为用户提供的产品与服务,已经在长期银行业垄断历程中形成了固定的产品模式和用户习惯,在产品形式上难以提出更多创新。因此零售银行业务的开展,需要从“以产品为核心”的方向,改变为“以用户为核心”的方向上来。以用户为核心分的业务开展可分为两方面。其一是通过提供更加优质的产品和服务,提高用户体验,提高用户得获取和留存。其二则是根据行业经验和商业数据分析,进行定量分析和精细化营销,为用户提供更具有针对性的服务。
发明内容
鉴于上述问题,本发明的目的是提供一种根据用户交易数据对用户进行价值分析和分类,进行不同价值用户类用户画像分析的零售用户价值分析系统及方法。
根据本发明的一个方面,提供一种零售用户价值分析系统,包括:
采集模块,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
设定模块,设定基本时间单位;
数据处理模块,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将采集模块采集的老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
未来交易次数模型构建模块,采用NBD模型的似然函数构建未来交易次数模型;
未来交易金额模型构建模块,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
未来价值模型构建模块,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
训练模块,将经过数据处理模块处理后老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
当前价值获得模块,将每个老用户的交易总金额作为每个老用户的当前价值;
分类模块,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
类轮廓特征获得模块,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
新用户价值获得模块,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
根据本发明的另一个方面,提供一种零售用户价值分析方法,包括:
步骤S1,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
步骤S2,设定基本时间单位;
步骤S3,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
步骤S4,采用NBD模型的似然函数构建未来交易次数模型;
步骤S5,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
步骤S6,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
步骤S7,将经过步骤S3处理的老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
步骤S8,将每个老用户的交易总金额作为每个老用户的当前价值;
步骤S9,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
步骤S10,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
步骤S11,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
本发明所述零售用户价值分析系统及方法,深入洞察不同的用户特征,从不同角度对对用户进行分层,充分挖掘不同类用户能够带来的市场推动作用,最大化的增加用户的生命周期价值,对于用户生命周期价值的提升和管理,能够帮助企业实现有效地市场分层,明确用户之间的价值差别。同时还能帮助企业制定营销战略,合理分配营销资源,更加有效地实现用户的获取、留存以及交叉销售。
上述零售用户价值分析系统及方法从交易价值的角度出发,通过分析用户在交易过程中产生的价值大小来对用户进行分层。同时,在此分层基础上,又可进一步根据分层结果,通过描述性统计的方式,刻画出不同类别用户的具体轮廓。相比于基于业务信息的分层方式,由此获得的用户轮廓可直接与用户的交易价值进行对应,而这些轮廓信息又不依赖于用户实际发生的业务数据,因而可以有效的对新获取的用户进行价值预测。
附图说明
通过参考以下结合附图的说明,随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1是本发明所述零售用户价值分析系统构成框图;
图2是本发明所述零售用户价值分析方法的流程图的示意图;
图3是本发明所述零售用户价值分析方法一个优选实施例的流程图的示意图;
图4是本发明所述根据未来价值和当前价值对老用户进行分类并对用户轮廓特征进行描述性统计的示意图;
图5是本发明对银行ATM取款交易的用户的未来交易次数的一个具体实施例的对比图;
图6是本发明所述对银行ATM取款交易的用户的未来交易金额的一个具体实施例的对比图;
图7是本发明所述对银行ATM取款交易的用户的未来价值的一个具体实施例的对比图;
图8是ATM取款交易中通过拟合期交易数据预测的未来价值和预测期交易数据的对比图;
图9是本发明所述对银行ATM取款交易的用户的HH类用户典型变量频率分布统计图;
图10是本发明所述对银行ATM取款交易的用户的LH类用户典型变量频率分布统计图。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本发明的具体实施例进行详细描述。
以下将结合附图对本发明的具体实施例进行详细描述。
图1是本发明所述零售用户价值分析系统构成框图,如图1所示,本发明所述零售用户价值分析系统包括:
采集模块10,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
设定模块20,设定基本时间单位;
数据处理模块30,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将采集模块采集的老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
未来交易次数模型构建模块40,采用NBD模型的似然函数构建未来交易次数模型;
未来交易金额模型构建模块50,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
未来价值模型构建模块60,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
训练模块70,将经过数据处理模块处理后老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
当前价值获得模块80,将每个老用户的交易总金额作为每个老用户的当前价值;
分类模块100,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
类轮廓特征获得模块110,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
新用户价值获得模块120,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
优选地,还包括推荐模块130,根据新用户归属的用户类的业务特征偏好,向新用户推荐交易项目,其中,采集模块10采集用户的业务特征。
在本发明的一个实施例中,零售用户价值分析系统还包括:
模型检测模块90,检测未来交易次数模型、未来交易金额模型和/或未来价值模型的模型误差,包括:
划分单元91,将采集模块的采集时间划分为拟合期和预测期,将数据处理模块处理后的老用户在采集时间内的交易数据划分为拟合期交易数据和预测期交易数据,将拟合期的交易数据发送给训练模块,获得每个老用户在预测期的未来交易次数、未来交易金额和/或未来价值;
实际未来价值获得单元92,将每个老用户在预测期的交易总金额作为每个老用户的实际未来价值;
模型误差获得单元93,根据每个老用户在预测期的实际交易次数和通过训练模块预测的未来交易次数获得未来交易次数模型的模型误差;根据每个老用户在预测期的实际交易金额和通过训练模块预测的未来交易金额获得未来交易金额模型的模型误差;和/或,根据每个老用户在预测期的实际未来价值和通过训练模块预测的未来价值获得未来价值模型的模型误差。
优选地,设定模块20还设定模型误差范围,所述模型检测模块90还包括筛选单元94或/和模型修正单元95,所述筛选单元94,模型误差在设定范围内的老用户在拟合期的交易数据发送给训练模型70和当前价值获得模块80,将筛选出的老用户的用户轮廓特征发送给分类模块100;所述模型修正单元95,对模型误差不在设定范围内的未来交易次数模型、未来交易金额模型和/或未来价值模型进行参数修正。
在本发明的一个实施例中,未来交易次数模型构建模块40包括:
观察周期获得单元41,将用户进行第一次交易的时间点到当前观察点之间的时间间隔作为观察周期;
交易次数获得单元42,获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数发送给数据处理模块,获得各用户的交易次数;
新鲜度获得单元43,将用户最后一次交易的时间点距离观察点的时间间隔作为用户的新鲜度;
用户交易行为描述单元44,根据下式(1)分别描述各用户交易行为,
Xi=(xi,ti,Ti) (1)
其中,i为用户索引,Xi为第i个用户的交易行为,xi为第i个用户的交易系数,ti为第i个用户的新鲜度,Ti为第i个用户的观察周期;
第一似然模型构建单元45,通过各用户的交易行为根据下式(2)构建各用户的交易次数的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的交易次数的似然模型作为各用户的交易次数的似然模型
其中,LCi为第i个用户的交易次数的似然函数,γ,α,s,β为待确定的模型参数,当α≠β时,当α=β时,ai=γ+s+xi,b=s+1,ci=γ+s+xi+1,F代表高斯超几何函数;通过对整体似然函数求最大值,确定模型中四个待确定参数γ,α,s,β;
第一模型构建单元46,通过上述似然模型,根据下式(3)构建各用户的未来交易次数模型,
其中,CE(xi,ti,Ti;r,α,s,β)为第i个用户的未来交易次数。
上述未来交易次数模型构建模块40在似然函数中提取出了部分,进而对似然函数做对数处理。可以避免由于Ti和xi同时取较大的数值时,而导致的过大,超出机器计算精度的问题。
在本发明的一个实施例中,未来交易金额模型构建模块50包括:
交易次数获得单元51,获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数发送给数据处理模块,获得各用户的交易次数;
平均每次交易金额获得单元52,将用户不包括第一次交易的交易金额的总交易金额除以交易次数获得单元获得的交易次数,得到用户平均每次交易金额;
第二似然模型构建单元53,根据下式(4)构建各用户平均每次交易金额的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的平均每次交易金额的似然模型作为各用户的平均每次交易金额的似然模型
其中,LJi为第i个用户的平均每次交易金额的似然值,p、q和r为待确定的模型参数,为第i个用户的平均每次交易金额,xi为第i个用户的交易系数;
第二模型构建单元54,通过上述似然模型根据下式(5)构建各用户的未来交易金额模型
其中,为第i个用户的未来的平均每次交易金额。
在本发明的一个实施例中,未来价值模型构建模块60采用用户未来生命周期价值根据下式(6)构建未来价值模型
其中,CLVi为第i个用户的未来价值,k为基本时间单元个数索引,n为第i个用户的基本时间单元总个数,CEi为第i个用户的未来交易次数,第i个用户的未来交易金额,0≤margin≤1,代表交易利润,d代表折现率。
图2是本发明零售用户价值分析方法的流程图的示意图,如图2所示,所述零售用户价值分析方法包括:
步骤S1,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
步骤S2,设定基本时间单位,所述基本时间单位可以是天,也可以是12小时,当然也可以是分钟等;
步骤S3,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
步骤S4,采用NBD模型的似然函数构建未来交易次数模型;
步骤S5,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
步骤S6,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
步骤S7,将经过步骤S3处理的老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
步骤S8,将每个老用户的交易总金额作为每个老用户的当前价值;
步骤S9,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
步骤S10,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
步骤S11,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
在本发明的一个实施例中,所述步骤S4包括:
将用户进行第一次交易的时间点到当前观察点之间的时间间隔作为观察周期;
获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数进行步骤S3的数据处理,获得各用户的交易次数;
将用户最后一次交易的时间点距离观察点的时间间隔作为用户的新鲜度;
根据公式(1)分别描述各用户交易行为;
通过各用户的交易行为根据公式(2)构建各用户的交易次数的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的交易次数的似然模型作为各用户的交易次数的似然模型;
通过上述似然模型,根据公式(3)构建各用户的未来交易次数模型。
在本发明的一个实施例中,步骤S5包括:
获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数进行步骤S3的数据处理,获得各用户的交易次数;
将用户不包括第一次交易的交易金额的总交易金额除以交易次数,得到用户平均每次交易金额;
根据公式(4)构建各用户平均每次交易金额的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的平均每次交易金额的似然模型作为各用户的平均每次交易金额的似然模型;
通过上述似然模型根据公式(5)构建各用户的未来交易金额模型。
图3是本发明零售用户价值分析方法的一个优选实施例的流程图的示意图,如图3所示,所述零售用户价值分析方法包括:
步骤S1',采集用户交易数据、用户轮廓特征和业务特征;
步骤S2',设定基本时间单位和模型误差范围,其中所述基本时间单位设为天;
步骤S3',将交易数据为0的用户作为新用户,交易数据不为0的作为老用户;
步骤S4',采集时间划分为拟合期和预测期,将老用户在采集时间内的交易数据划分为拟合期交易数据和预测期交易数据,优选地,拟合期和预测期时间长度也可根据需要(一般情况下,可将交易数据平分为两段,前半段为拟合期,后半段为预测期。如果预测效果不够理想,可延长拟合期长度,但不缩短拟合期长度)做出调整;
步骤S5',将老用户的拟合期交易数据和预测期交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;以基本时间单位(例如,天)为准,取得用户每个基本时间单位的交易金额总和;
步骤S6',采用NBD模型的似然函数构建未来交易次数模型;
步骤S7',采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
步骤S8',根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值根据公式(6)构建未来价值模型;
步骤S9',老用户在拟合期逐天交易情况作为模型输入数据,具体地:将老用户的拟合期交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
步骤S10',根据老用户在预测期的逐天交易情况获得其实际未来价值,也就是说,将每个老用户在预测期的交易总金额作为每个老用户的实际未来价值;
步骤S11',根据每个老用户在预测期的实际交易次数和通过未来交易次数模型预测的未来交易次数获得未来交易次数模型的模型误差;根据每个老用户在预测期的实际交易金额和通过未来交易金额模型预测的未来交易金额获得未来交易金额模型的模型误差;根据每个老用户在预测期的实际未来价值和通过未来价值模型预测的未来价值获得未来价值模型的模型误差;
步骤S12',将模型误差在设定范围内的老用户在拟合期的交易数据返回步骤S9',重新得到各模型的模型参数和未来价值;
步骤S13',根据模型误差在设定范围内的老用户的未来价值和当前价值对其进行分类;
步骤S14',对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
步骤S15',根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值;
步骤S16',根据新用户归属的用户类的业务特征偏好,向新用户推荐交易项目,例如,对于通过用户轮廓映射得到的未来价值偏低的用户,通过精准营销,引导其业务特征向高价值用户转变,从而实现用户未来价值提升。
如图4所示,上述各实施例的零售用户价值分析系统及方法综合考虑用户当前价值与未来价值,从而实现对用户价值更加全面的分析。基于前述对于用户未来价值的计算,我们将其作为横向分析维度,而纵向分析维度则选择过去用户价值维度,利用价值分析模型对用户进行分类,其中对于用户价值高低的划分,可根据实际业务不同,选择不同的划分额度。
上述分类模型中可以将用户基明确的划分为四个部分,根据每一部分用户的价值特点,可以有针对性的采取不同营销和关系管理方法,更进一步,在对用户基实现划分后,可将不同部分用户相关的非交易类变量(人口统计学变量、业务变量)进行对应的描述性统计,从而获取详细的用户轮廓。
在本发明的一个具体实施例中,采用本发明零售用户价值分析方法对银行的用户的ATM取款交易进行了预测,具体地:
图5示出了未来交易次数的预测结果,图中横轴表示拟合期用户的累计交易次数,纵轴表示预测期用户的实际未来交易次数与预测未来交易次数,从图中可以看出,对于累计交易次数大于8次的用户,预测未来交易次数偏高,对比预测未来交易次数与实际未来交易次数,预测未来交易次数高出8.2%。
图6示出了未来交易金额的预测结果,其中横轴表示未来交易金额,纵轴实线表示实际交易中的不同金额处交易的概率密度,虚线表示在不同金额处的交易比重与Gamma-Gamma模型预测的极大似然函数值乘积。由于Gamma-Gamma模型所计算的极大似然函数值对每个用户单独估计,并未考虑整体用户群分布,因此,需要通过交易金额比重部分来加权单个用户的极大似然函数值,实际概率密度的分布与加权后的预测概率密度出现了一定的偏差,可以通过改变加权方式来使得两条曲线拟合的更为接近。
图7给出了ATM取款交易中通过拟合期交易数据预测的未来价值和预测期交易数据的对比图,由图中可见,实际交易中低价值用户的价值累积速度远低于预测速度。对比预测与实际的整体用户价值,预测值降低11.8%。ATM取款交易中接近30%的用户CLV为0,这些用户对NBD和Gamma-Gamma模型中的极大似然函数贡献为0,会带来估计偏差。但同时由于大部分交易记录集中在后20%的用户群中,因此实际用户拟合模型的数据能够更为准确进行参数估计。
交易利润margin取值为0.002,即每发生1000元取款交易,银行收取2元的交易利润。针对其他不同类交易,可设定不同的margin。图8给出了在当前和未来CLV价值中用户的散点分布情况,图中对于价值高低中点的设定为200,对应取款金额为10,0000元,由于未来价值预测结果中大量的低价值用户并未得到较好的参数拟合效果,因此我们选定未来高价值用户进行分析。这类用户包含两种,一种是当前价值与未来价值都高的HH类用户,一种是当前价值低而未来价值高的用户LH类用户。通过对HH类用户和LH类用户的人口统计学变量和业务类变量进行描述性统计便可得到这两类用户的轮廓特征。ATM取款交易用户数共计10411个,通过对两个价值维度的筛选,最终得到HH类用户148个,LH类用户56个。
图9给出了HH类用户的典型变量频率分布统计结果,其中人口统计学变量具有明显特征,此类用户以男性群体为主,用户籍贯大多在三线城市,而当前城市分布以二线城市为主。同时职业分布中以专业技术人员和不便分类的一些职业。在业务变量分布中,此类用户账户类型多以白金卡为主,账户年限与活期储蓄年限分布较为平均,而其他各类业务开通时长与图中示例的手机银行(Mbank)业务类似,均集中在0附近,此外该类用户中有18%的用户开通第三方支付20个月。
图10给出了的LH类用户的典型变量频率分布统计结果。其中人口统计学变量分布中,性别以女性为主,相较于HH类用户,LH类用户籍贯在三线城市的百分比更高,当前城市在二线城市的百分比也更高,职业分布中以不便分类的职业为主。在业务变量分布中,此类用户账户类型同样多以白金卡为主,账户年限与活期储蓄年限分布较为平均,对其他类业务开通时长以0为主。此外该类用户中仅有7%的用户开通第三方支付达到20个月。
从上述对ATM交易中的LH和HH类用户轮廓刻画结果可以看出,该类业务中未来价值偏高的用户,对其他类业务依赖度低,且具有明显的城市和职业分布特征。在实际业务中通过对这些特征的匹配就可以快速定位相应的高价值用户。
通过数据挖掘实现的精细化营销,可以有效降低营销成本、提高营销成功率。同时,也能为客户提供个性化服务,提升客户体验。基于上述对零售客户价值的计算和分层,结合分层后得到的用户业务与人口统计学变量特征。本研究据此提出如下精准营销建议。
整体而言,在上述价值四分类的结果中,应当对不同价值类别的用户采取不同的营销策略。对于当前价值和未来价值都很高的HH类用户,一方面需要重点关注已有客户基中此类用户的留存,另一方面还需要对具有类似特征的新用户展开营销。对于HL类用户,考虑到其未来价值有下降趋势,可通过其他类业务推广等方式来增加其整体价值。对于LH类用户,具有优秀的价值增长潜力,则应加强激励,提高其业务粘性。同时也可积极培养类似的新用户或促进已有用户向相关方向转化。对于LL类用户,由于其长期价值偏低,则可以考虑减小在对应业务上的营销投入,尝试其他类别的业务推广。
在新用户获取层面,传统营销领域常通过邮件和电话营销等方式,对大量用户展开营销推广,但对客户特征了解不够。基于价值分类后的用户,各类别用户具有不同的典型人口统计学特征。基于对这些特征的把握,可以精准定位高价值用户群体,对其展开营销工作,提高获客效率,降低获客成本。例如上实施例中对ATM用户群体的价值划分中,HH和LH类用户都具有未来高价值潜力,这两类用户的人口统计学特征较为明显,因此可根据对新用户的人口统计学特征区分,向那些具有未来高价值的用户展开精准营销。
在用户转化方面,可通过对比未来价值高和低两类用户间的业务差异,通过相应的业务推广,促进低价值用户向高价值用户转化。例如业务一中的低价值类用户与业务二中的高价值用户出现特征重叠时,可对业务一中的低价值用户展开业务二相关的营销推广,也将有助于提高用户整体价值。
最后,用户全业务价值方面,可通过对用户基中全体用户的价值计算,及时预测企业未来收入,根据企业战略,调整相关业务布局。提升高价值用户占比偏高的业务推广,同时控制低价值用户占比偏高的业务投入。
随着互联网产业和数据技术的快速进步,目前国内众多商业银行都已经积累了一定的零售客户数据基础,通过对这些数据的挖掘,能够深入洞察用户特征,深化对用户的认知和细分,帮助企业制订精细化的客户细分管理和经营策略,进而增强数据库营销体系。
综上所述,参照附图以示例的方式描述了根据本发明提出的零售用户价值分析系统及方法。但是,本领域技术人员应当理解,对于上述本发明所提出的系统及方法,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (14)

1.一种零售用户价值分析系统,其特征在于,包括:
采集模块,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
设定模块,设定基本时间单位;
数据处理模块,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将采集模块采集的老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
未来交易次数模型构建模块,采用NBD模型的似然函数构建未来交易次数模型;
未来交易金额模型构建模块,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
未来价值模型构建模块,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
训练模块,将经过数据处理模块处理后老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
当前价值获得模块,将每个老用户的交易总金额作为每个老用户的当前价值;
分类模块,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
类轮廓特征获得模块,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
新用户价值获得模块,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
2.根据权利要求1所述的零售用户价值分析系统,其特征在于,还包括:
模型检测模块,检测未来交易次数模型、未来交易金额模型和/或未来价值模型的模型误差,包括:
划分单元,将采集模块的采集时间划分为拟合期和预测期,将数据处理模块处理后的老用户在采集时间内的交易数据划分为拟合期交易数据和预测期交易数据,将拟合期的交易数据发送给训练模块,获得每个老用户在预测期的未来交易次数、未来交易金额和/或未来价值;
实际未来价值获得单元,将每个老用户在预测期的交易总金额作为每个老用户的实际未来价值;
模型误差获得单元,根据每个老用户在预测期的实际交易次数和通过训练模块预测的未来交易次数获得未来交易次数模型的模型误差;根据每个老用户在预测期的实际交易金额和通过训练模块预测的未来交易金额获得未来交易金额模型的模型误差;和/或,根据每个老用户在预测期的实际未来价值和通过训练模块预测的未来价值获得未来价值模型的模型误差。
3.根据权利要求2所述的零售用户价值分析系统,其特征在于,所述设定模块还设定模型误差范围,所述模型检测模块还包括筛选单元或/和模型修正单元,所述筛选单元,模型误差在设定范围内的老用户在拟合期的交易数据发送给训练模型和当前价值获得模块,将筛选出的老用户的用户轮廓特征发送给分类模块;所述模型修正单元,对模型误差不在设定范围内的未来交易次数模型、未来交易金额模型和/或未来价值模型进行参数修正。
4.根据权利要求1所述的零售用户价值分析系统,其特征在于,
所述未来交易次数模型构建模块包括:
观察周期获得单元,将用户进行第一次交易的时间点到当前观察点之间的时间间隔作为观察周期;
交易次数获得单元,获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数发送给数据处理模块,获得各用户的交易次数;
新鲜度获得单元,将用户最后一次交易的时间点距离观察点的时间间隔作为用户的新鲜度;
用户交易行为描述单元,根据下式(1)分别描述各用户交易行为,
Xi=(xi,ti,Ti) (1)
其中,i为用户索引,Xi为第i个用户的交易行为,xi为第i个用户的交易次数,ti为第i个用户的新鲜度,Ti为第i个用户的观察周期;
第一似然模型构建单元,通过各用户的交易行为根据下式(2)构建各用户的交易次数的似然模型,将所有用户的似然模型相乘,得到整体似然函数,
其中,LCi为第i个用户的交易次数的似然函数,γ,α,s,β为待确定的模型参数,当α≠β时,当α=β时,ai=γ+s+xi,b=s+1,ci=γ+s+xi+1,F代表高斯超几何函数;通过对整体似然函数求最大值,确定模型中四个待确定参数γ,α,s,β;
第一模型构建单元,通过上述似然模型的四个参数以及用户交易行为,根据下式(3)构建各用户的未来交易次数模型,
其中,CE(xi,ti,Ti;r,α,s,β)为第i个用户的未来交易次数。
5.根据权利要求1所述的零售用户价值分析系统,其特征在于,所述未来交易金额模型构建模块包括:
交易次数获得单元,获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数发送给数据处理模块,获得各用户的交易次数;
平均每次交易金额获得单元,将用户不包括第一次交易的交易金额的总交易金额除以交易次数获得单元获得的交易次数,得到用户平均每次交易金额;
第二似然模型构建单元,根据下式(4)构建各用户平均每次交易金额的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的平均每次交易金额的似然模型作为各用户的平均每次交易金额的似然模型
其中,LJi为第i个用户的平均每次交易金额的似然值,p、q和r为待确定的模型参数,为第i个用户的平均每次交易金额,xi为第i个用户的交易系数;
第二模型构建单元,通过上述似然模型根据下式(5)构建各用户的未来交易金额模型
其中,为第i个用户的未来的平均每次交易金额。
6.根据权利要求1所述的零售用户价值分析系统,其特征在于,
所述未来价值模型构建模块采用用户未来生命周期价值根据下式(6)构建未来价值模型
其中,CLVi为第i个用户的未来价值,k为基本时间单元个数索引,n为第i个用户的基本时间单元总个数,CEi为第i个用户的未来交易次数,第i个用户的未来交易金额,0≤margin≤1,代表交易利润,d代表折现率。
7.根据权利要求1所述的零售用户价值分析系统,其特征在于,还包括:
推荐模块,根据新用户归属的用户类的业务特征偏好,向新用户推荐交易项目,其中,采集模块采集用户的业务特征。
8.一种零售用户价值分析方法,其特征在于,包括:
步骤S1,采集用户交易数据和用户轮廓特征,所述交易数据包括交易次数和交易金额,所述用户轮廓特征包括年龄、职业、城市、性别、籍贯和工资水平的一个或多个;
步骤S2,设定基本时间单位;
步骤S3,将交易数据为0的用户作为新用户,交易数据不为0的作为老用户,将老用户的交易数据按照基本时间单位划分,在基本时间单位内,存在交易的交易次数设为1,不存在交易的,交易次数设为0;
步骤S4,采用NBD模型的似然函数构建未来交易次数模型;
步骤S5,采用Gamma-Gamma模型的似然函数构建未来交易金额模型;
步骤S6,根据未来交易次数模型和未来交易金额模型,采用用户未来生命周期价值构建未来价值模型;
步骤S7,将经过步骤S3处理的老用户在每个基本时间单位的交易数据作为训练集,将训练集分别代入未来交易次数模型和未来交易金额模型进行训练得到各模型的模型参数,并获得每个老用户未来交易次数和未来交易金额,输入未来价值模型,得到每个老用户的未来价值;
步骤S8,将每个老用户的交易总金额作为每个老用户的当前价值;
步骤S9,根据未来价值和当前价值对老用户进行分类,所述分类包括LL类,当前价值和未来价值均低的用户类;HL类,当前价值高,未来价值低的用户类;LH类,当前价值低,未来价值高的用户类;HH类,当前价值和未来价值均高的用户类;
步骤S10,对每一类中的老用户的用户轮廓特征进行描述性统计,获得每类用户的类轮廓特征;
步骤S11,根据新用户的用户轮廓特征进行类匹配,得到新用户归属的用户类,对应预测用户未来价值。
9.根据权利要求8所述的零售用户价值分析方法,其特征在于,在步骤S8和S9之间还包括:
模型检测步骤,检测未来交易次数模型、未来交易金额模型和/或未来价值模型的模型误差,包括:
采集时间划分为拟合期和预测期,将老用户在采集时间内的交易数据划分为拟合期交易数据和预测期交易数据;
将拟合期交易数据代入未来交易次数模型、未来交易金额模型和/或未来价值模型的模型,获得每个老用户在预测期的未来交易次数、未来交易金额和/或未来价值;
将每个老用户在预测期的交易总金额作为每个老用户的实际未来价值;
根据每个老用户在预测期的实际交易次数和通过未来交易次数模型预测的未来交易次数获得未来交易次数模型的模型误差;根据每个老用户在预测期的实际交易金额和通过未来交易金额模型预测的未来交易金额获得未来交易金额模型的模型误差;和/或,根据每个老用户在预测期的实际未来价值和通过未来价值模型预测的未来价值获得未来价值模型的模型误差。
10.根据权利要求8所述的零售用户价值分析方法,其特征在于,在步骤S2中,还设定模型误差范围;在模型检测步骤中,还包括将模型误差在设定范围内的老用户在拟合期的交易数据返回步骤S7。
11.根据权利要求8所述的零售用户价值分析方法,其特征在于,所述步骤S4包括:
将用户进行第一次交易的时间点到当前观察点之间的时间间隔作为观察周期;
获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数进行步骤S3的数据处理,获得各用户的交易次数;
将用户最后一次交易的时间点距离观察点的时间间隔作为用户的新鲜度;
根据下式(1)分别描述各用户交易行为,
Xi=(xi,ti,Ti) (1)
其中,i为用户索引,Xi为第i个用户的交易行为,xi为第i个用户的交易系数,ti为第i个用户的新鲜度,Ti为第i个用户的观察周期;
通过各用户的交易行为根据下式(2)构建各用户的交易次数的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的交易次数的似然模型作为各用户的交易次数的似然模型
其中,LCi为第i个用户的交易次数的似然函数,γ,α,s,β为待确定的模型参数,当α≠β时,当α=β时,ai=γ+s+xi,b=s+1,ci=γ+s+xi+1,F代表高斯超几何函数;通过对整体似然函数求最大值,确定模型中四个待确定参数γ,α,s,β;
通过上述似然模型,根据下式(3)构建各用户的未来交易次数模型,
其中,CE(xi,ti,Ti;r,α,s,β)为第i个用户的未来交易次数。
12.根据权利要求8所述的零售用户价值分析方法,其特征在于,所述步骤S5包括:
获得用户从第一次交易后,直到当前观察点位置,不包括第一次交易进行过的重复交易次数,将各用户的重复交易次数进行步骤S3的数据处理,获得各用户的交易次数;
将用户不包括第一次交易的交易金额的总交易金额除以交易次数,得到用户平均每次交易金额;
根据下式(4)构建各用户平均每次交易金额的似然模型,将所有用户的似然模型相乘,得到整体似然函数,整体似然函数求最大值对应的各用户的平均每次交易金额的似然模型作为各用户的平均每次交易金额的似然模型
其中,LJi为第i个用户的平均每次交易金额的似然值,p、q和r为待确定的模型参数,为第i个用户的平均每次交易金额,xi为第i个用户的交易系数;
通过上述似然模型根据下式(5)构建各用户的未来交易金额模型
其中,为第i个用户的未来的平均每次交易金额。
13.根据权利要求8所述的零售用户价值分析方法,其特征在于,在所述步骤S6中,
采用用户未来生命周期价值根据下式(6)构建未来价值模型
其中,CLVi为第i个用户的未来价值,k为基本时间单元个数索引,n为第i个用户的基本时间单元总个数,CEi为第i个用户的未来交易次数,第i个用户的未来交易金额,0≤margin≤1,代表交易利润,d代表折现率。
14.根据权利要求8所述的零售用户价值分析方法,其特征在于,还包括:
根据新用户归属的用户类的业务特征偏好,向新用户推荐交易项目,其中,在步骤S1中,还采集用户的业务特征。
CN201811592819.6A 2018-12-25 2018-12-25 零售用户价值分析系统及方法 Active CN109858947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811592819.6A CN109858947B (zh) 2018-12-25 2018-12-25 零售用户价值分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811592819.6A CN109858947B (zh) 2018-12-25 2018-12-25 零售用户价值分析系统及方法

Publications (2)

Publication Number Publication Date
CN109858947A true CN109858947A (zh) 2019-06-07
CN109858947B CN109858947B (zh) 2021-04-06

Family

ID=66892211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811592819.6A Active CN109858947B (zh) 2018-12-25 2018-12-25 零售用户价值分析系统及方法

Country Status (1)

Country Link
CN (1) CN109858947B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110881035A (zh) * 2019-11-13 2020-03-13 广西大学行健文理学院 一种基于云计算和人工智能的网络安全系统
CN112990386A (zh) * 2021-05-17 2021-06-18 太平金融科技服务(上海)有限公司深圳分公司 用户价值聚类方法、装置、计算机设备和存储介质
CN113052383A (zh) * 2021-03-29 2021-06-29 上海酷量信息技术有限公司 一种基于机器学习的收入预测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590231A (zh) * 2014-10-24 2016-05-18 阿里巴巴集团控股有限公司 用户数据处理方法和装置
CN106980988A (zh) * 2016-12-29 2017-07-25 中国银联股份有限公司 商户价值评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590231A (zh) * 2014-10-24 2016-05-18 阿里巴巴集团控股有限公司 用户数据处理方法和装置
CN106980988A (zh) * 2016-12-29 2017-07-25 中国银联股份有限公司 商户价值评价方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
王灿等: "基于商品品类的零售业客户经济价值预测分析", 《商业经济研究》 *
范琳琳: "基于CLV和活跃度的客户细分模型及其应用研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
贾真: "服装企业VIP顾客流失行为研究——基于忠诚度、活跃度、顾客经济价值", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
赵萌: "基于评论行为的客户终身价值模型改进", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
马宝龙等: "随机RFM模型及其在零售顾客价值识别中的应用", 《管理工程学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110881035A (zh) * 2019-11-13 2020-03-13 广西大学行健文理学院 一种基于云计算和人工智能的网络安全系统
CN113052383A (zh) * 2021-03-29 2021-06-29 上海酷量信息技术有限公司 一种基于机器学习的收入预测方法及装置
CN112990386A (zh) * 2021-05-17 2021-06-18 太平金融科技服务(上海)有限公司深圳分公司 用户价值聚类方法、装置、计算机设备和存储介质
CN112990386B (zh) * 2021-05-17 2021-08-03 太平金融科技服务(上海)有限公司深圳分公司 用户价值聚类方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109858947B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
Han et al. Segmentation of telecom customers based on customer value by decision tree model
US7072863B1 (en) Forecasting using interpolation modeling
US6792399B1 (en) Combination forecasting using clusterization
US6473084B1 (en) Prediction input
US8635147B2 (en) System, method and program for agency cost estimation
CN108256691A (zh) 还款概率预测模型构建方法及装置
US20030220773A1 (en) Market response modeling
EP2506207A1 (en) Computer system, computer-implemented method and computer program product for managing operations of a system
CN109300039A (zh) 基于人工智能和大数据进行智能产品推荐的方法及系统
CN102136123A (zh) 一种银行目标客户识别系统
CN108388974A (zh) 基于随机森林和决策树的优质客户优化识别方法及装置
MXPA01008622A (es) Evaluacion rapida de portafolios de activos tales como instrumentos financieros.
CN105761112B (zh) 一种证券融资融券和资管目标客户的挖掘方法
JP2003526146A (ja) 評価値を求めてリスクを低減する方法とシステム
CN107093120A (zh) 服务策略推送方法和装置
CN109858947A (zh) 零售用户价值分析系统及方法
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
Bessler et al. Capacity effects and winner fund performance: the relevance and interactions of fund size and family characteristics
Piersma et al. Determining the optimal direct mailing frequency
CN101877113A (zh) 经济情报
CN110322347A (zh) 一种长短期策略多因子量化投资方法及装置
CN114943582A (zh) 一种信息推荐方法、系统及推荐服务器
Finlay Towards profitability: A utility approach to the credit scoring problem
Even et al. Inequality in the utility of customer data: Implications for data management and usage
KR101911922B1 (ko) 빅데이터 기반 무형저축상품 전자결제를 이용한 결제통합 저축 서비스 제공 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant