CN111640001A - 基于标签关联的客户群行为预测的方法 - Google Patents
基于标签关联的客户群行为预测的方法 Download PDFInfo
- Publication number
- CN111640001A CN111640001A CN202010339262.6A CN202010339262A CN111640001A CN 111640001 A CN111640001 A CN 111640001A CN 202010339262 A CN202010339262 A CN 202010339262A CN 111640001 A CN111640001 A CN 111640001A
- Authority
- CN
- China
- Prior art keywords
- label
- expansion
- storage structure
- labels
- extension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及基于标签关联的客户群行为预测的方法,包括:A.提取出每个客户的历史数据,对每类历史数据设置标签;B.根据历史数据按照各标签建立矩阵存储结构C1,其中行为各标签,列为客户;C.将C1中数值类型的标签拆分为多个扩展标签,并建立扩展矩阵存储结构C2,其中行为扩展标签和是否参加金融贷款产品营销活动的标签,列为客户,C2中的所有值都为布尔值;D.计算出每个扩展标签的权重;E.根据扩展标签的权重计算出新的客户标签参加金融贷款产品营销活动的概率值。本发明能够计算出扩展标签两两之间的关系,并且实时预测出选定的客户群参与活动的概率和提供出相关性最大的扩展标签组合,极大的辅助了人工对客户群的筛选。
Description
技术领域
本发明涉及数据处理的方法,具体讲是基于标签关联的客户群行为预测的方法。
背景技术
在金融贷款产品的营销场景中,为了提升营销的转化率、降低营销成本,通常会采用大数据技术来描述客户群体,营销人员通过大数据筛选出不同的客户群体来制定不同的营销策略。
通常的大数据分析方法为:首先根据数据平台采集的客户静态属性数据和客户行为数据,采用大数据统计的方式,对每一个客户打上标签,标签类别包括客户的性别、年龄、历史贷款金额、页面访问时长等,然后通过营销人员设置标签集合来筛选出客户群,例如将(男性、35岁以上、历史最大贷款金额10万元以上)三个标签组成一个客户群,对这个客户群来进行某中金融贷款产品的营销推广,在营销推广实施完成后,根据实际客户参与情况再来统计该客户群的营销效果。
这种方案的缺点有两个,其一是系统无法实时反馈营销人员筛选出的标签集合的营销推广效果,其二是营销人员在挑选标签时具有盲目性,系统不能智能提供标签选择的建议。
发明内容
本发明提供了一种基于标签关联的客户群行为预测的方法,可以根据历史数据实时预测出该选定的客户群参与相应活动的概率,辅助人工对客户群的筛选。
本发明基于标签关联的客户群行为预测的方法,包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,对所述历史数据分类,并对每类设置标签,至少包括每个客户的性别、年龄、历史贷款金额和是否参加金融贷款产品营销活动的标签;
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户;
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值(如0和1);
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重;
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。
本发明是通过分箱的操作,将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算,将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下,客户是否参与活动的概率。因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。
进一步的,步骤D中,通过公式:
计算出每个扩展标签的权重,其中,y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1),ω0为偏置量,表示截距,n为扩展标签的数量,xi为第i个扩展标签的取值,ωi为第i个扩展标签的权重,j为与扩展标签i不同的扩展标签,ωij为当ωi和ωj共同出现时的权重,表示了扩展标签xi和xj的关联关系。
进一步的,将所述公式中的ωij对应的第i个扩展标签的权重ωi和第j个扩展标签的权重ωj,分别通过各自对应的辅助向量Vi=(vi1,vi2,……,vik)和Vj=(vj1,vj2,……,vjk)将扩展标签表示为一个表征扩展标签特征的向量,使得ωij等于Vi和Vj的点乘(向量的内积),由此将所述公式转换为:
步骤D中,根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量Vi和Vj。
进一步的,计算出每个辅助向量后,计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签,用于辅助人工筛选客户群。
本发明基于标签关联的客户群行为预测的方法,能够根据历史数据计算出扩展标签两两之间的关系,并且实时预测出该选定的客户群参与相应活动的概率和提供出相关性最大的扩展标签组合,极大的辅助了人工对客户群的筛选。并且,因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
附图说明
图1为本发明基于标签关联的客户群行为预测的方法的流程图。
具体实施方式
如图1所示本发明基于标签关联的客户群行为预测的方法,本实施例以预测指定的客户群参加金融产品的营销活动的概率为例,包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,包括每个客户的性别、年龄、页面访问时长、历史贷款金额等,以及每个客户最终是否参与营销活动(用0和1表示)。对所述的各种历史数据分类,并对每类设置标签,例如性别、年龄、页面访问时长、历史贷款金额分别为一个标签。
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户,如表1所示:
表1:
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,例如将“年龄标签”拆分为“年龄<30”、“30≤年龄<40”、“40≤年龄<50”等多个,将原N个标签扩展为P(P>N)个,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值(如0和1),如表2所示:
表2:
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重:
其中,y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1),ω0为偏置量,表示截距,n为扩展标签的数量,xi为第i个扩展标签的取值,ωi为第i个扩展标签的权重,j为与扩展标签i不同的扩展标签,ωij为当ωi和ωj共同出现时的权重,表示了扩展标签xi和xj的关联关系。
然后,将上述公式中的ωij对应的第i个扩展标签的权重ωi和第j个扩展标签的权重ωj,分别通过各自对应的辅助向量Vi=(vi1,vi2,……,vik)和Vj=(vj1,vj2,……,vjk)将扩展标签表示为一个表征扩展标签特征的向量,使得ωij等于Vi和Vj的点乘(向量的内积),由此将上述公式转换为:
再根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量Vi和Vj。
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重和辅助向量,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。
在计算出每个辅助向量后,还可以通过计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签(如K=3),例如人工选择了“客户=男”的扩展标签,系统自动选取出关联度最大的“年龄<30”、“历史贷款<50”等扩展标签,用于辅助人工筛选客户群。
本发明是通过分箱的操作,将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算,将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下,客户是否参与活动的概率。
因为扩展标签值、权重等数据都是基于历史数据的拟合,因此预测的结果是具有客观依据的,而不是依靠人为规则和主观判断来计算得到的。
Claims (4)
1.基于标签关联的客户群行为预测的方法,其特征包括:
A.通过处理器从系统数据库中提取出每个客户的历史数据,对所述历史数据分类,并对每类设置标签,至少包括每个客户的性别、年龄、历史贷款金额和是否参加金融贷款产品营销活动的标签;
B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1,其中矩阵存储结构C1的行结构为所述的各标签,列结构为各客户;
C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签,并在存储结构中建立扩展矩阵存储结构C2,其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签,列结构为各客户,扩展矩阵存储结构C2中的所有值都为布尔值;
D.根据扩展矩阵存储结构C2中各扩展标签的值,通过随机梯度下降的方法计算出每个扩展标签的权重;
E.将新的客户标签的值带入所述的随机梯度下降的方法,根据计算出的扩展标签的权重,计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值。
4.如权利要求3所述的基于标签关联的客户群行为预测的方法,其特征为:计算出每个辅助向量后,计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度,当人工选择一个扩展标签后,系统选取出与该扩展标签的相似度最大的K个扩展标签,用于辅助人工筛选客户群。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339262.6A CN111640001A (zh) | 2020-04-26 | 2020-04-26 | 基于标签关联的客户群行为预测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339262.6A CN111640001A (zh) | 2020-04-26 | 2020-04-26 | 基于标签关联的客户群行为预测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111640001A true CN111640001A (zh) | 2020-09-08 |
Family
ID=72331850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010339262.6A Pending CN111640001A (zh) | 2020-04-26 | 2020-04-26 | 基于标签关联的客户群行为预测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111640001A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112070593A (zh) * | 2020-09-29 | 2020-12-11 | 中国银行股份有限公司 | 数据处理方法、装置、设备以及存储介质 |
CN112308419A (zh) * | 2020-10-30 | 2021-02-02 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及计算机存储介质 |
CN116823382A (zh) * | 2023-05-17 | 2023-09-29 | 南京邮电大学 | 一种基于大数据的产品推广方法 |
-
2020
- 2020-04-26 CN CN202010339262.6A patent/CN111640001A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112070593A (zh) * | 2020-09-29 | 2020-12-11 | 中国银行股份有限公司 | 数据处理方法、装置、设备以及存储介质 |
CN112070593B (zh) * | 2020-09-29 | 2023-09-05 | 中国银行股份有限公司 | 数据处理方法、装置、设备以及存储介质 |
CN112308419A (zh) * | 2020-10-30 | 2021-02-02 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及计算机存储介质 |
CN116823382A (zh) * | 2023-05-17 | 2023-09-29 | 南京邮电大学 | 一种基于大数据的产品推广方法 |
CN116823382B (zh) * | 2023-05-17 | 2024-01-05 | 南京邮电大学 | 一种基于大数据的产品推广方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110046952B (zh) | 一种推荐模型的训练方法及装置、一种推荐方法及装置 | |
CN111640001A (zh) | 基于标签关联的客户群行为预测的方法 | |
US10521748B2 (en) | Retention risk determiner | |
CN108427708A (zh) | 数据处理方法、装置、存储介质和电子装置 | |
WO2015165372A1 (en) | Method and apparatus for classifying object based on social networking service, and storage medium | |
CN110033342A (zh) | 一种推荐模型的训练方法及装置、一种推荐方法及装置 | |
JP2019079302A (ja) | 営業活動支援システム、営業活動支援方法および営業活動支援プログラム | |
KR101970978B1 (ko) | 상품 카테고리별 추천 키워드 추출 방법 | |
CN107590232A (zh) | 一种基于网络学习环境的资源推荐系统及方法 | |
CN114612251A (zh) | 风险评估方法、装置、设备及存储介质 | |
Neyt et al. | Never mind I'll find someone like me–Assortative mating preferences on Tinder | |
Conley et al. | Estimating dynamic local interactions models | |
CN114595850A (zh) | 基于机器学习的政务预约服务推荐方法 | |
CN110443290A (zh) | 一种基于大数据的产品竞争关系量化生成方法及装置 | |
CN114022202B (zh) | 基于深度学习的用户流失预测方法及系统 | |
CN116308109A (zh) | 一种基于大数据的企业政策智能推荐及政策制定系统 | |
CN113743796B (zh) | 基于权重的多约束条件双随机抽查方法 | |
CN113407849B (zh) | 一种粗排序的方法及装置 | |
CN107832319A (zh) | 一种基于语义关联网络的启发式查询扩展方法 | |
KR101729283B1 (ko) | 목표 달성 진단 장치 및 진단 방법 | |
US8000995B2 (en) | System and method for assessing customer segmentation strategies | |
US20100169106A1 (en) | System and method for profiling jurors | |
Wang et al. | A variational EM method for mixed membership models with multivariate rank data: An analysis of public policy preferences | |
CN115222461B (zh) | 一种智能营销精准推荐方法 | |
CN112417288B (zh) | 一种用于众包软件测试的任务跨域推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200908 |
|
RJ01 | Rejection of invention patent application after publication |