CN111640001A - 基于标签关联的客户群行为预测的方法 - Google Patents

基于标签关联的客户群行为预测的方法 Download PDF

Info

Publication number
CN111640001A
CN111640001A CN202010339262.6A CN202010339262A CN111640001A CN 111640001 A CN111640001 A CN 111640001A CN 202010339262 A CN202010339262 A CN 202010339262A CN 111640001 A CN111640001 A CN 111640001A
Authority
CN
China
Prior art keywords
label
expansion
storage structure
labels
extension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010339262.6A
Other languages
English (en)
Inventor
陈思成
唐玏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202010339262.6A priority Critical patent/CN111640001A/zh
Publication of CN111640001A publication Critical patent/CN111640001A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于标签关联的客户群行为预测的方法,包括:A.提取出每个客户的历史数据,对每类历史数据设置标签;B.根据历史数据按照各标签建立矩阵存储结构C1,其中行为各标签,列为客户;C.将C1中数值类型的标签拆分为多个扩展标签,并建立扩展矩阵存储结构C2,其中行为扩展标签和是否参加金融贷款产品营销活动的标签,列为客户,C2中的所有值都为布尔值;D.计算出每个扩展标签的权重;E.根据扩展标签的权重计算出新的客户标签参加金融贷款产品营销活动的概率值。本发明能够计算出扩展标签两两之间的关系,并且实时预测出选定的客户群参与活动的概率和提供出相关性最大的扩展标签组合,极大的辅助了人工对客户群的筛选。

Description

基于标签关联的客户群行为预测的方法
技术领域
本发明涉及数据处理的方法,具体讲是基于标签关联的客户群行为预测的方法。
背景技术
在金融贷款产品的营销场景中,为了提升营销的转化率、降低营销成本,通常会采用大数据技术来描述客户群体,营销人员通过大数据筛选出不同的客户群体来制定不同的营销策略。
通常的大数据分析方法为:首先根据数据平台采集的客户静态属性数据和客户行为数据,采用大数据统计的方式,对每一个客户打上标签,标签类别包括客户的性别、年龄、历史贷款金额、页面访问时长等,然后通过营销人员设置标签集合来筛选出客户群,例如将(男性、35岁以上、历史最大贷款金额10万元以上)三个标签组成一个客户群,对这个客户群来进行某中金融贷款产品的营销推广,在营销推广实施完成后,根据实际客户参与情况再来统计该客户群的营销效果。
这种方案的缺点有两个,其一是系统无法实时反馈营销人员筛选出的标签集合的营销推广效果,其二是营销人员在挑选标签时具有盲目性,系统不能智能提供标签选择的建议。
发明内容
本发明提供了一种基于标签关联的客户群行为预测的方法,可以根据历史数据实时预测出该选定的客户群参与相应活动的概率,辅助人工对客户群的筛选。
本发明基于标签关联的客户群行为预测的方法,包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,对所述历史数据分类,并对每类设置标签,至少包括每个客户的性别、年龄、历史贷款金额和是否参加金融贷款产品营销活动的标签;
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户;
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值(如0和1);
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重;
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。
本发明是通过分箱的操作,将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算,将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下,客户是否参与活动的概率。因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。
进一步的,步骤D中,通过公式:
Figure BDA0002467794030000021
计算出每个扩展标签的权重,其中,y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1),ω0为偏置量,表示截距,n为扩展标签的数量,xi为第i个扩展标签的取值,ωi为第i个扩展标签的权重,j为与扩展标签i不同的扩展标签,ωij为当ωi和ωj共同出现时的权重,表示了扩展标签xi和xj的关联关系。
进一步的,将所述公式中的ωij对应的第i个扩展标签的权重ωi和第j个扩展标签的权重ωj,分别通过各自对应的辅助向量Vi=(vi1,vi2,……,vik)和Vj=(vj1,vj2,……,vjk)将扩展标签表示为一个表征扩展标签特征的向量,使得ωij等于Vi和Vj的点乘(向量的内积),由此将所述公式转换为:
Figure BDA0002467794030000022
步骤D中,根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量Vi和Vj
进一步的,计算出每个辅助向量后,计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签,用于辅助人工筛选客户群。
本发明基于标签关联的客户群行为预测的方法,能够根据历史数据计算出扩展标签两两之间的关系,并且实时预测出该选定的客户群参与相应活动的概率和提供出相关性最大的扩展标签组合,极大的辅助了人工对客户群的筛选。并且,因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
附图说明
图1为本发明基于标签关联的客户群行为预测的方法的流程图。
具体实施方式
如图1所示本发明基于标签关联的客户群行为预测的方法,本实施例以预测指定的客户群参加金融产品的营销活动的概率为例,包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,包括每个客户的性别、年龄、页面访问时长、历史贷款金额等,以及每个客户最终是否参与营销活动(用0和1表示)。对所述的各种历史数据分类,并对每类设置标签,例如性别、年龄、页面访问时长、历史贷款金额分别为一个标签。
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户,如表1所示:
表1:
Figure BDA0002467794030000031
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,例如将“年龄标签”拆分为“年龄<30”、“30≤年龄<40”、“40≤年龄<50”等多个,将原N个标签扩展为P(P>N)个,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值(如0和1),如表2所示:
表2:
Figure BDA0002467794030000041
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重:
Figure BDA0002467794030000042
其中,y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1),ω0为偏置量,表示截距,n为扩展标签的数量,xi为第i个扩展标签的取值,ωi为第i个扩展标签的权重,j为与扩展标签i不同的扩展标签,ωij为当ωi和ωj共同出现时的权重,表示了扩展标签xi和xj的关联关系。
然后,将上述公式中的ωij对应的第i个扩展标签的权重ωi和第j个扩展标签的权重ωj,分别通过各自对应的辅助向量Vi=(vi1,vi2,……,vik)和Vj=(vj1,vj2,……,vjk)将扩展标签表示为一个表征扩展标签特征的向量,使得ωij等于Vi和Vj的点乘(向量的内积),由此将上述公式转换为:
Figure BDA0002467794030000043
再根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量Vi和Vj
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重和辅助向量,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。
在计算出每个辅助向量后,还可以通过计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签(如K=3),例如人工选择了“客户=男”的扩展标签,系统自动选取出关联度最大的“年龄<30”、“历史贷款<50”等扩展标签,用于辅助人工筛选客户群。
本发明是通过分箱的操作,将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算,将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下,客户是否参与活动的概率。
因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。

Claims (4)

1.基于标签关联的客户群行为预测的方法,其特征包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,对所述历史数据分类,并对每类设置标签,至少包括每个客户的性别、年龄、历史贷款金额和是否参加金融贷款产品营销活动的标签;
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户;
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值;
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重;
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值。
2.如权利要求1所述的基于标签关联的客户群行为预测的方法,其特征为:步骤D中,通过公式:
Figure FDA0002467794020000011
计算出每个扩展标签的权重,其中,y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值,ω0为偏置量,表示截距,n为扩展标签的数量,xi为第i个扩展标签的取值,ωi为第i个扩展标签的权重,j为与扩展标签i不同的扩展标签,ωij为当ωi和ωj共同出现时的权重,表示了扩展标签xi和xj的关联关系。
3.如权利要求2所述的基于标签关联的客户群行为预测的方法,其特征为:将所述公式中的ωij对应的第i个扩展标签的权重ωi和第j个扩展标签的权重ωj,分别通过各自对应的辅助向量Vi=(vi1,vi2,……,vik)和Vj=(vj1,vj2,……,vjk)将扩展标签表示为一个表征扩展标签特征的向量,使得ωij等于Vi和Vj的点乘,由此将所述公式转换为:
Figure FDA0002467794020000012
步骤D中,根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量Vi和Vj
4.如权利要求3所述的基于标签关联的客户群行为预测的方法,其特征为:计算出每个辅助向量后,计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签,用于辅助人工筛选客户群。
CN202010339262.6A 2020-04-26 2020-04-26 基于标签关联的客户群行为预测的方法 Pending CN111640001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010339262.6A CN111640001A (zh) 2020-04-26 2020-04-26 基于标签关联的客户群行为预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010339262.6A CN111640001A (zh) 2020-04-26 2020-04-26 基于标签关联的客户群行为预测的方法

Publications (1)

Publication Number Publication Date
CN111640001A true CN111640001A (zh) 2020-09-08

Family

ID=72331850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010339262.6A Pending CN111640001A (zh) 2020-04-26 2020-04-26 基于标签关联的客户群行为预测的方法

Country Status (1)

Country Link
CN (1) CN111640001A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070593A (zh) * 2020-09-29 2020-12-11 中国银行股份有限公司 数据处理方法、装置、设备以及存储介质
CN112308419A (zh) * 2020-10-30 2021-02-02 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机存储介质
CN116823382A (zh) * 2023-05-17 2023-09-29 南京邮电大学 一种基于大数据的产品推广方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070593A (zh) * 2020-09-29 2020-12-11 中国银行股份有限公司 数据处理方法、装置、设备以及存储介质
CN112070593B (zh) * 2020-09-29 2023-09-05 中国银行股份有限公司 数据处理方法、装置、设备以及存储介质
CN112308419A (zh) * 2020-10-30 2021-02-02 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及计算机存储介质
CN116823382A (zh) * 2023-05-17 2023-09-29 南京邮电大学 一种基于大数据的产品推广方法
CN116823382B (zh) * 2023-05-17 2024-01-05 南京邮电大学 一种基于大数据的产品推广方法

Similar Documents

Publication Publication Date Title
CN110046952B (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN111640001A (zh) 基于标签关联的客户群行为预测的方法
US10521748B2 (en) Retention risk determiner
CN108427708A (zh) 数据处理方法、装置、存储介质和电子装置
WO2015165372A1 (en) Method and apparatus for classifying object based on social networking service, and storage medium
CN110033342A (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
JP2019079302A (ja) 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
KR101970978B1 (ko) 상품 카테고리별 추천 키워드 추출 방법
CN107590232A (zh) 一种基于网络学习环境的资源推荐系统及方法
CN114612251A (zh) 风险评估方法、装置、设备及存储介质
Neyt et al. Never mind I'll find someone like me–Assortative mating preferences on Tinder
Conley et al. Estimating dynamic local interactions models
CN114595850A (zh) 基于机器学习的政务预约服务推荐方法
CN110443290A (zh) 一种基于大数据的产品竞争关系量化生成方法及装置
CN114022202B (zh) 基于深度学习的用户流失预测方法及系统
CN116308109A (zh) 一种基于大数据的企业政策智能推荐及政策制定系统
CN113743796B (zh) 基于权重的多约束条件双随机抽查方法
CN113407849B (zh) 一种粗排序的方法及装置
CN107832319A (zh) 一种基于语义关联网络的启发式查询扩展方法
KR101729283B1 (ko) 목표 달성 진단 장치 및 진단 방법
US8000995B2 (en) System and method for assessing customer segmentation strategies
US20100169106A1 (en) System and method for profiling jurors
Wang et al. A variational EM method for mixed membership models with multivariate rank data: An analysis of public policy preferences
CN115222461B (zh) 一种智能营销精准推荐方法
CN112417288B (zh) 一种用于众包软件测试的任务跨域推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200908

RJ01 Rejection of invention patent application after publication