CN110796484B - 客户活跃程度预测模型的构建方法、装置及其应用方法 - Google Patents

客户活跃程度预测模型的构建方法、装置及其应用方法 Download PDF

Info

Publication number
CN110796484B
CN110796484B CN201910963717.9A CN201910963717A CN110796484B CN 110796484 B CN110796484 B CN 110796484B CN 201910963717 A CN201910963717 A CN 201910963717A CN 110796484 B CN110796484 B CN 110796484B
Authority
CN
China
Prior art keywords
sample
model
client
time sequence
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910963717.9A
Other languages
English (en)
Other versions
CN110796484A (zh
Inventor
温舒
张俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shanghu Information Technology Co ltd
Original Assignee
Shanghai Shanghu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shanghu Information Technology Co ltd filed Critical Shanghai Shanghu Information Technology Co ltd
Priority to CN201910963717.9A priority Critical patent/CN110796484B/zh
Publication of CN110796484A publication Critical patent/CN110796484A/zh
Application granted granted Critical
Publication of CN110796484B publication Critical patent/CN110796484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Abstract

本发明公开一种客户活跃程度预测模型的构建方法、装置及其应用方法,模型的构建方法包括:获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;根据时序训练样本特征向量以及与时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型。本发明根据样本客户在不同历史时刻的多维度特征信息来训练得到一预测模型,该模型将客户不同时刻的活跃状态都纳入考虑范围,并且充分考虑时刻前后状态变化的特点,因此,使用该模型能够根据当前时刻的信息来有效地预测客户未来的活跃状态。

Description

客户活跃程度预测模型的构建方法、装置及其应用方法
技术领域
本发明属于计算机技术领域,尤其涉及一种客户活跃程度预测模型的构建方法、装置及其应用方法。
背景技术
在运营业务场景中,客户的活跃程度往往根据实际业务需求被定义为高度活跃(高活),中度活跃(中活),低度活跃(低活),睡眠客户等。客户的活跃程度基本可以反映企业运营状态。因此,预测客户未来一段时间活跃度的方法对客户运营有很大的帮助,可以提前识别客户的潜在活跃状态变化,采取一些手段,促使低活客户转化为高活客户,提高整个客户群的活跃度。
发明内容
本发明提出了一种客户活跃程度预测模型的构建方法、装置及其应用方法,可以有效预测客户未来的活跃状态。本发明实施例提供的具体技术方案如下:
第一方面,本发明提供一种客户活跃程度预测模型的构建方法,所述方法包括:
获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;
根据所述时序训练样本特征向量以及与所述时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在一些实施例中,根据所述时序训练样本特征向量以及与所述时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型具体包括:
将所述时序训练样本特征向量输入至BiLSTM模型中,得到样本客户在不同历史时刻的活跃程度的初步预测结果;
将所述初步预测结果输入至所述CRF模型中以对所述初步预测结果进行约束,得到样本客户在不同历史时刻的活跃程度的最终预测结果;
根据所述最终预测结果以及所述分类标签,对所述BiLSTM模型和CRF模型分别进行更新,将更新后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在一些实施例中,所述样本客户的活跃程度的分类标签的获取过程具体包括:
根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在所述历史时刻的活跃度得分;
根据所述活跃度得分与样本客户在所述历史时刻的活跃程度的预绑定关系,得到所述样本客户在所述历史时刻的活跃程度的分类标签。
在一些实施例中,所述多维度特征信息至少包括个性特征、行为特征。第二方面,本发明提供一种客户活跃程度预测模型的构建装置,所述装置包括:
样本采集模块,用于获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;
模型训练模块,用于根据所述时序训练样本特征向量以及与所述时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在一些实施例中,所述模型训练模块具体包括:
第一预测模块,用于将所述时序训练样本特征向量输入至BiLSTM模型中,得到样本客户在不同历史时刻的活跃程度的初步预测结果;
第二预测模块,用于将所述初步预测结果输入至所述CRF模型中以对所述初步预测结果进行约束,得到样本客户在不同历史时刻的活跃程度的最终预测结果;
更新模块,用于根据所述最终预测结果以及所述分类标签,对所述BiLSTM模型和CRF模型分别进行更新,将更新后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在一些实施例中,所述装置还包括:
样本标签构建模块,用于根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在所述历史时刻的活跃度得分;根据所述活跃度得分与样本客户在所述历史时刻的活跃程度的预绑定关系,得到所述样本客户在所述历史时刻的活跃程度的分类标签。
在一些实施例中,所述多维度特征信息至少包括个性特征、行为特征。
在一些实施例中,第三方面,本发明提供一种客户活跃程度预测方法,所述方法包括:
获取待预测客户在当前时刻的多维度特征信息以构建当前时刻的特征向量;
将所述当前时刻的特征向量输入至所述BiLSTM+CRF模型中,得到待预测客户在未来时刻的活跃程度的预测结果。
本发明实施例具有如下有益效果:
本发明根据样本客户在不同历史时刻的多维度特征信息来训练得到一预测模型,该模型将客户不同时刻的活跃状态都纳入考虑范围,并且充分考虑时刻前后状态变化的特点,因此,使用该模型能够根据当前时刻的信息来有效地预测客户未来的活跃状态。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一个实施例中一种客户活跃程度预测模型的构建方法的应用环境图;
图2是一个实施例中一种客户活跃程度预测模型的构建方法的流程示意图;
图3是一个实施例中根据时序训练样本特征向量以及与时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型步骤的流程示意图;
图4是一个实施例中样本客户的活跃程度的分类标签的获取过程步骤的流程示意图;
图5是一个实施例中一种客户活跃程度预测模型的构建装置的结构框图;
图6是一个实施例中一种客户活跃程度预测方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的客户活跃程度预测模型的构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现,服务器104为静态资源服务器。本申请实施例方案根据客户在不同历史时刻的多维度特征信息来训练得到一预测模型,该模型将客户不同时刻的活跃状态都纳入考虑范围,并且充分考虑时刻前后状态变化的特点,因此,使用该模型能够根据当前时刻的信息来有效地预测客户未来的活跃状态。
在一个实施例中,如图2所示,提供了一种客户活跃程度预测模型的构建方法,以该方法应用于图1中的服务器且服务器被配置用于金融理财类投资平台进行说明,方法包括以下步骤:
S202、获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量。
其中,不同的历史时刻表示为:i=[t-n、…、t-2、t-1、t],其中,t为历史某时刻,t-1为t时刻的上一时刻,t-2为t-1时刻的上一时刻;在进行时刻划分时,可以按照天/周来进行划分,本实施例对时刻的划分不加以限定;如:当选择按照天来进行时刻划分时,此时,t-1为t的前一天,t-2为t-1的前一天。
多维度特征信息至少包括:个性特征、行为特征;个性特征包括性别、年龄、职业、所在地、教育背景中的至少一种;行为特征包括:登录状况、交易状况中的至少一种。由于本实施例中,方法应用于金融理财类投资平台上,因此,行为特征包括:在该平台的登录情况、在该平台的交易状况中的至少一种。
构建得到的时序训练样本特征向量表示为:Xi=[Xt-n,…,Xt-2,Xt-1,Xt],其中,Xt是指t时刻某样本客户的一系列的特征向量,用来表征该样本客户不同维度的特征,即:Xt=[X1,X2,X3,…,Xm],m是实际生成的特征向量个数。Xt-1是t-1时刻(t的上一时刻)的样本客户的一系列的特征向量。
S204、根据时序训练样本特征向量以及与时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
其中,样本客户的活跃程度的分类标签表示为:Yi=[Yt-n,…,Yt-2,Yt-1,Yt],其中,Yt是指t时刻的客户活跃状态,Yt-1是t-1时刻的客户活跃状态。客户活跃状态包括:高度活跃、中度活跃、低度活跃和沉睡等。
BiLSTM+CRF模型为BiLSTM模型和CRF模型的组合,BiLSTM模型的输出为CRF模型的输入。
本步骤具体为:将时序训练样本特征向量输入至BiLSTM+CRF模型中得到预测结果,将预测结果与样本客户的活跃程度的分类标签进行比较,根据误差结果对BiLSTM+CRF模型的参数进行更新,将更新后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
上述方法中,BiLSTM模型可预测得到时序训练样本特征向量中每一个特征向量的分类情况的预测概率,CRF模型预测得到时序训练样本特征向量的前后关系,因此,利用BiLSTM和CRF相结合的方式可以将一个客户不同时刻的活跃状态都纳入考虑范围,且充分考虑其前后状态变化的特点。
在其中一个实施例中,如图3所示,上述根据时序训练样本特征向量以及与时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型可以包括如下步骤:
S302、将时序训练样本特征向量输入至BiLSTM模型中,得到样本客户在不同历史时刻的活跃程度的初步预测结果。
其中,BiLSTM模型由前向LSTM模型和后向LSTM模型组合而成。
该步骤具体为:将时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]输入至BiLSTM模型,BiLSTM模型中的前向LSTM模型和后向LSTM模型接受输入信息进行计算,分别得到输出结果并将输出结果结合从而得到时序训练样本特征向量中每一个特征向量的预测概率,即,初步预测结果。
初步预测结果表示为:
Figure GDA0003469890820000061
其中,n为时序训练样本特征向量的数量,k为分类标签的标签数量,本实施例中,k=n。Pi∈Rk的每一维都视为将时序训练样本特征向量Xi分类到标签Yi的打分值;其中,i=[t-n、…、t-2、t-1、t]。
S304、将初步预测结果输入至CRF模型中以对初步预测结果进行约束,得到样本客户在不同历史时刻的活跃程度的最终预测结果。
其中,CRF模型的参数为转移矩阵A,Aij表示的是从第i个标签到第j个标签的转移得分,进而在为某个时刻进行标注的时候可以利用此前已经标注过的标签。由于样本客户的活跃程度的分类标签为Yi=[Yt-n,…,Yt-2,Yt-1,Yt],因此,CRF模型对于时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]的标签等于Yi=[Yt-n,…,Yt-2,Yt-1,Yt]的打分为:
Figure GDA0003469890820000071
如此可以看出,时序训练样本特征向量的打分由两部分得到,一部分是BiLSTM模型输出的Pi决定,另一部分则由CRF模型的转移矩阵A决定。
在得到打分之后,利用Softmax进行归一化计算,得到最终预测结果:
Figure GDA0003469890820000072
S306、根据最终预测结果以及分类标签,对BiLSTM模型和CRF模型分别进行更新,将更新后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
具体的,根据时序训练样本特征向量中的每一个特征向量的最终预测结果PYi|Xi以及训练样本特征向量中的每一个特征向量的真实的分类标签Yi,对BiLSTM模型和CRF模型进行修正、更新,从而得到客户活跃程度预测模型。
在其中一个实施例中,如图4所示,上述样本客户的活跃程度的分类标签的获取过程可以包括如下步骤:
S402、根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在该历史时刻的活跃度得分。
具体的,该步骤包括:
1、为各维度特征信息配置权重;
2、将样本客户在一历史时刻的多维度特征信息和与多维度特征信息对应的权重进行乘积,得到乘积值;
3、将样本客户在一历史时刻的乘积值进行累加,得到样本客户在该历史时刻的活跃度得分。
S404、根据活跃度得分与样本客户在该历史时刻的活跃程度的预绑定关系,得到样本客户在该历史时刻的活跃程度的分类标签。
示例性的,若某个样本客户在t时刻的活跃度得分为0.5,该得分对应的客户的活跃程度为中度活跃,中度活跃对应的分类标签为Yt-2,从而得到样本客户在t时刻的活跃程度的分类标签为Yt-2
在一个实施例中,如图5所示,提供了一种客户活跃程度预测模型的构建装置,包括:样本采集模块502、模型训练模块504,其中:
样本采集模块502,用于获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;
模型训练模块504,用于根据时序训练样本特征向量以及与时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在其中一个实施例中,上述模型训练模块504具体包括:
第一预测模块5042,用于将时序训练样本特征向量输入至BiLSTM模型中,得到样本客户在不同历史时刻的活跃程度的初步预测结果;
第二预测模块5044,用于将初步预测结果输入至所述CRF模型中以对初步预测结果进行约束,得到样本客户在不同历史时刻的活跃程度的最终预测结果;
更新模块5046,用于根据最终预测结果以及分类标签,对BiLSTM模型和CRF模型分别进行更新,将更新后的BiLSTM+CRF模型确定为客户活跃程度预测模型。
在其中一个实施例中,上述装置还包括:
样本标签构建模块506,用于根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在历史时刻的活跃度得分;根据活跃度得分与样本客户在历史时刻的活跃程度的预绑定关系,得到样本客户在历史时刻的活跃程度的分类标签。
在其中一个实施例中,上述多维度特征信息至少包括个性特征、行为特征。
其中,个性特征包括性别、年龄、职业、所在地、教育背景中的至少一种;行为特征包括:登录状况、交易状况中的至少一种。由于本实施例中,装置应用于金融理财类投资平台上,因此,行为特征包括:在该平台的登录情况、在该平台的交易状况中的至少一种。
在一个实施例中,如图6所示,提供一种客户活跃程度预测方法,方法包括如下步骤:
S602、获取待预测客户在当前时刻的多维度特征信息以构建当前时刻的特征向量。
其中,当前时刻的特征向量为X=[X1,X2,X3,…,Xm],X1,X2,X3,…,Xm表示待预测客户在当前时刻的多维度特征信息,m是实际生成的特征向量个数;
多维度特征信息至少包括:个性特征、行为特征;个性特征包括性别、年龄、职业、所在地、教育背景中的至少一种;行为特征包括:登录状况、交易状况中的至少一种。
S604、将当前时刻的特征向量输入至BiLSTM+CRF模型中,得到待预测客户在未来时刻的活跃程度的预测结果。
具体的,该步骤为:
将当前时刻的特征向量X=[X1,X2,X3,…,Xm]输入至BiLSTM模型,得到关于待预测客户在当前时刻的活跃程度的初步预测结果,将当前时刻的活跃程度的初步预测结果输入至CRF模型,得到待预测客户在未来时刻的活跃程度的预测结果。
应该理解的是,虽然图2-4,图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4,图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
尽管已描述了本发明实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。另外,上述实施例提供的客户活跃程度预测模型的构建装置、客户活跃程度预测方法与客户活跃程度预测模型的构建方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种客户活跃程度预测模型的构建方法,其特征在于,所述方法包括:
获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;
根据所述时序训练样本特征向量以及与所述时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型,包括;
将时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]输入至BiLSTM模型,BiLSTM模型中的前向LSTM模型和后向LSTM模型接受输入信息进行计算,分别得到输出结果,并将输出结果结合得到时序训练样本特征向量中每一个特征向量的预测概率,得到样本客户在不同历史时刻的活跃程度的初步预测结果,
所述初步预测结果表示为:
Figure FDA0003469890810000011
其中,Xt是指t时刻某样本客户的一系列的特征向量,n为时序训练样本特征向量的数量,k为分类标签的标签数量,Pi∈Rk的每一维都视为将时序训练样本特征向量Xi分类到标签Yi的打分值,i=[t-n、…、t-2、t-1、t];
将所述初步预测结果输入至所述CRF模型中以对所述初步预测结果进行约束,CRF模型对于时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]的标签等于Yi=[Yt-n,…,Yt-2,Yt-1,Yt]的打分为:
Figure FDA0003469890810000012
在得到打分之后进行归一化计算,得到样本客户在不同历史时刻的活跃程度的最终预测结果:
Figure FDA0003469890810000013
其中,Yi是指样本客户的活跃程度的分类标签,Yt是指t时刻的客户活跃状态,CRF模型的参数为转移矩阵A,
Figure FDA0003469890810000021
表示的是从第Yi个标签到第Yi+1个标签的转移得分;
根据时序训练样本特征向量中的每一个特征向量的最终预测结果P(Yi|Xi)以及训练样本特征向量中的每一个特征向量的分类标签Yi,对BiLSTM模型和CRF模型进行修正或更新,得到客户活跃程度预测模型。
2.根据权利要求1所述的方法,其特征在于,所述样本客户的活跃程度的分类标签的获取过程具体包括:
根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在所述历史时刻的活跃度得分;
根据所述活跃度得分与样本客户在所述历史时刻的活跃程度的预绑定关系,得到所述样本客户在所述历史时刻的活跃程度的分类标签。
3.根据权利要求1所述的方法,其特征在于,所述多维度特征信息至少包括个性特征、行为特征。
4.一种客户活跃程度预测模型的构建装置,其特征在于,所述装置包括:
样本采集模块,用于获取样本客户在不同历史时刻的多维度特征信息以构建时序训练样本特征向量;
模型训练模块,用于根据所述时序训练样本特征向量以及与所述时序训练样本特征向量相对应的样本客户的活跃程度的分类标签,对BiLSTM+CRF模型进行训练,将训练后的BiLSTM+CRF模型确定为客户活跃程度预测模型,
所述模型训练模块包括;
第一预测模块,用于将时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]输入至BiLSTM模型,BiLSTM模型中的前向LSTM模型和后向LSTM模型接受输入信息进行计算,分别得到输出结果,并将输出结果结合得到时序训练样本特征向量中每一个特征向量的预测概率,得到样本客户在不同历史时刻的活跃程度的初步预测结果,
所述初步预测结果表示为:
Figure FDA0003469890810000031
其中,n为时序训练样本特征向量的数量,k为分类标签的标签数量,Pi∈Rk的每一维都视为将时序训练样本特征向量Xi分类到标签Yi的打分值,i=[t-n、…、t-2、t-1、t];
第二预测模块,用于将所述初步预测结果输入至所述CRF模型中以对所述初步预测结果进行约束,CRF模型对于时序训练样本特征向量Xi=[Xt-n,…,Xt-2,Xt-1,Xt]的标签等于Yi=[Yt-n,…,Yt-2,Yt-1,Yt]的打分为:
Figure FDA0003469890810000032
在得到打分之后进行归一化计算,得到样本客户在不同历史时刻的活跃程度的最终预测结果:
Figure FDA0003469890810000033
其中,CRF模型的参数为转移矩阵A,
Figure FDA0003469890810000034
表示的是从第Yi个标签到第Yi+1个标签的转移得分;
更新模块,用于根据时序训练样本特征向量中的每一个特征向量的最终预测结果P(Yi|Xi)以及训练样本特征向量中的每一个特征向量的分类标签Yi,对BiLSTM模型和CRF模型进行修正、更新,得到客户活跃程度预测模型。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
样本标签构建模块,用于根据样本客户在一历史时刻的多维度特征信息计算得到样本客户在所述历史时刻的活跃度得分;根据所述活跃度得分与样本客户在所述历史时刻的活跃程度的预绑定关系,得到所述样本客户在所述历史时刻的活跃程度的分类标签。
6.根据权利要求4所述的装置,其特征在于,所述多维度特征信息至少包括个性特征、行为特征。
7.一种基于权利要求1~3任意一项所述的客户活跃程度预测模型的构建方法的客户活跃程度预测方法,其特征在于,所述方法包括:
获取待预测客户在当前时刻的多维度特征信息以构建当前时刻的特征向量;
将所述当前时刻的特征向量输入至所述BiLSTM+CRF模型中,得到待预测客户在未来时刻的活跃程度的预测结果。
CN201910963717.9A 2019-10-11 2019-10-11 客户活跃程度预测模型的构建方法、装置及其应用方法 Active CN110796484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910963717.9A CN110796484B (zh) 2019-10-11 2019-10-11 客户活跃程度预测模型的构建方法、装置及其应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910963717.9A CN110796484B (zh) 2019-10-11 2019-10-11 客户活跃程度预测模型的构建方法、装置及其应用方法

Publications (2)

Publication Number Publication Date
CN110796484A CN110796484A (zh) 2020-02-14
CN110796484B true CN110796484B (zh) 2022-02-25

Family

ID=69439143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910963717.9A Active CN110796484B (zh) 2019-10-11 2019-10-11 客户活跃程度预测模型的构建方法、装置及其应用方法

Country Status (1)

Country Link
CN (1) CN110796484B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401433B (zh) * 2020-03-12 2023-10-17 腾讯科技(深圳)有限公司 用户信息获取方法、装置、电子设备及存储介质
CN111680873A (zh) * 2020-04-30 2020-09-18 百度在线网络技术(北京)有限公司 监测经济状态、建立经济状态监测模型的方法及对应装置
CN112116381B (zh) * 2020-08-31 2021-05-07 北京基调网络股份有限公司 基于lstm神经网络的月活预测方法、存储介质和计算机设备
CN112445690B (zh) * 2020-11-27 2023-07-25 广州三七互娱科技有限公司 信息获取方法、装置及电子设备
CN112612826B (zh) * 2020-12-21 2024-02-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112767028B (zh) * 2021-01-20 2022-08-26 每日互动股份有限公司 一种活跃用户数量的预测方法、计算机设备及存储介质
CN113656275B (zh) * 2021-08-24 2024-03-26 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133214A (zh) * 2017-05-05 2017-09-05 中国计量大学 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法
CN107784372A (zh) * 2016-08-24 2018-03-09 阿里巴巴集团控股有限公司 目标对象属性的预测方法、装置和系统
CN109034861A (zh) * 2018-06-04 2018-12-18 挖财网络技术有限公司 基于移动端日志行为数据的用户流失预测方法及装置
CN109684543A (zh) * 2018-12-14 2019-04-26 北京百度网讯科技有限公司 用户行为预测和信息投放方法、装置、服务器和存储介质
CN109784997A (zh) * 2019-01-11 2019-05-21 重庆邮电大学 一种基于大数据的短视频活跃用户预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10402658B2 (en) * 2016-11-03 2019-09-03 Nec Corporation Video retrieval system using adaptive spatiotemporal convolution feature representation with dynamic abstraction for video to language translation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784372A (zh) * 2016-08-24 2018-03-09 阿里巴巴集团控股有限公司 目标对象属性的预测方法、装置和系统
CN107133214A (zh) * 2017-05-05 2017-09-05 中国计量大学 一种基于评论信息的产品需求偏好特征挖掘及其质量评估方法
CN109034861A (zh) * 2018-06-04 2018-12-18 挖财网络技术有限公司 基于移动端日志行为数据的用户流失预测方法及装置
CN109684543A (zh) * 2018-12-14 2019-04-26 北京百度网讯科技有限公司 用户行为预测和信息投放方法、装置、服务器和存储介质
CN109784997A (zh) * 2019-01-11 2019-05-21 重庆邮电大学 一种基于大数据的短视频活跃用户预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
User opinion extraction model concerning consumer properties of products based on a recurrent neural network;Yuri P. Yekhlakov等;《DATA ANALYSIS AND INTELLIGENCE SYSTEMS》;20181231;第46卷(第4期);第7-16页 *
开源软件社区中开发者活跃度特性分析;刘雅新等;《软件导刊》;20170930;第16卷(第9期);164-169页 *

Also Published As

Publication number Publication date
CN110796484A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110796484B (zh) 客户活跃程度预测模型的构建方法、装置及其应用方法
US11770571B2 (en) Matrix completion and recommendation provision with deep learning
US11423325B2 (en) Regression for metric dataset
WO2021120677A1 (zh) 一种仓储模型训练方法、装置、计算机设备及存储介质
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN108399564B (zh) 信用评分方法及装置
CN109961080B (zh) 终端识别方法及装置
US11106997B2 (en) Content delivery based on corrective modeling techniques
CN112861662B (zh) 基于人脸和交互文本的目标对象行为预测方法及相关设备
CN115994226B (zh) 基于联邦学习的聚类模型训练系统及方法
CN116010684A (zh) 物品推荐方法、装置及存储介质
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
Zhao et al. Short‐term load demand forecasting through rich features based on recurrent neural networks
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
CN108876422B (zh) 用于信息推广的方法、装置、电子设备及计算机可读介质
CN112995414A (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
CN116777646A (zh) 基于人工智能的风险识别方法、装置、设备及存储介质
CN114418609A (zh) 成交概率预估方法、存储介质及程序产品
CN112231546A (zh) 异构文档的排序方法、异构文档排序模型训练方法及装置
KR102567137B1 (ko) 과거 일별 판매량 추정 및 미래 판매량 예측 모델 생성 방법
US20240031631A1 (en) Systems and methods for content customization
CN117235257A (zh) 基于人工智能的情感预测方法、装置、设备及存储介质
CN117709801A (zh) 客户数据处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant