CN109190808A - 用户行为预测方法、装置、设备及介质 - Google Patents
用户行为预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN109190808A CN109190808A CN201810931187.5A CN201810931187A CN109190808A CN 109190808 A CN109190808 A CN 109190808A CN 201810931187 A CN201810931187 A CN 201810931187A CN 109190808 A CN109190808 A CN 109190808A
- Authority
- CN
- China
- Prior art keywords
- matrix
- sample
- user
- advance
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Abstract
本发明实施例提供一种用户行为预测方法、装置、设备及介质,该方法包括:将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数;通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数;根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。根据本发明实施例的用户行为预测方法,能够自动得到用户的特征,不需要过于依赖于专家经验生成特征,节省人力成本。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户行为预测方法、装置、设备及介质。
背景技术
常用的预测模型是逻辑回归和迭代提升模型,这两种预测模型都无法处理时间序列数据(Time-Series Data)。时间序列数据是指在不同时间点上收集到的数据,这些数据反映了某一事物、现象等随时间的变化状态或程度。针对时间序列数据,一般依据业务逻辑和工作人员的经验人工统计生成的人工经验特征,然后将人工经验特征放入预测模型中进行机器学习训练。
上述方案的缺点是:特征生成的过程需要充足的专家经验,对专家经验的依赖性极大。
发明内容
本发明实施例提供了一种用户行为预测方法、装置、设备及介质,能够通过LSTM模型输出特征,不需要过于依赖于专家经验生成特征,节省人力成本。
第一方面,本发明实施例提供了一种用户行为预测方法,包括:
将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数;
通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数;
根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。
第二方面,本发明实施例提供了一种用户行为预测装置,包括:
第一转换模块,用于将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数;
第二转换模块,用于通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数;
预测模块,用于根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。
本发明实施例提供了一种计算设备,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的用户行为预测方法、装置、设备及介质,首先,通过将时间序列数据转换成M×N的矩阵,LSTM模型可以根据M×N的矩阵输出K个特征,不需要过度依赖于专家经验生成特征,节省了人力成本。其次,在依赖专家经验生成特征的情况下,如果原始数据增加了新类型的数据,则需要基于新类型的数据设计添加人工经验特征对应的代码,设计代码需要花大量时间,而通过本发明实施例在原有的代码里添加新类型的数据字段名称即可,节省了大量时间。最后,同样的用户时间序列数据,根据LSTM模型输出的特征进行预测的效果比根据人工经验特征进行预测的效果好。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的一种用户行为预测方法的流程示意图;
图2示出了本发明实施例的一种LSTM模型的结构示意图;
图3示出了本发明实施例的另一种用户行为预测方法的原理示意图;
图4示出了本发明实施例的又一种用户行为预测方法的流程示意图;
图5示出了本发明实施例的一种用户行为预测装置的结构示意图;
图6示出了本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
长短期记忆(Long Short-Term Memory,LSTM)网络是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,LSTM模型以时间序列数据作为输入进行训练。
长短期记忆网络应用范围相对广泛,包括翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病等领域,但是在互联网金融的风控领域,目前还没有相关的应用案例。
图1示出了本发明实施例的一种用户行为预测方法的流程示意图。该方法包括:S101至S103。
S101,将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数。
需要说明的是,目标用户可以是贷款的用户或者申请办理信用卡的用户。时间窗指的是一段时间,限制了纵轴中特征相对应的时间范围,该时间窗的范围可以人工设定,例如一个小时为一个时间窗,或者一天为一个时间窗,或者一周为一个时间窗。N可以表示N列连续但不重叠的时间窗,比如第一天、第二天、第三天…第N天。每一列时间窗对应M个特征。
作为一个示例,一个贷款申请者的原始的通话记录数据是逐条保存的,每一条通话记录数据都有一个开始时间,多条通话记录数据合在一起构成该申请者的时间序列数据,时间序列数据是该申请者的原始数据。由于该申请者通话发生的开始时间并不一致,所以不可能直接将时间序列数据放入到LSTM模型中。而本发明实施例将时间序列数据转换成LSTM模型能够处理的M×N的矩阵。M×N的矩阵可以包括申请者原始数据中的所有信息,不会丢弃原始数据;当然,M×N的矩阵可以包括申请者原始数据中的部分信息。
S102,通过预先训练的长短期记忆LSTM模型,将目标用户的M×N的矩阵转换成K×1的矩阵,K×1的矩阵表示目标用户的K个特征,K为正整数。
需要说明的是,目标用户的时间序列数据可以是目标用户的所有数据,LSTM模型是从目标用户的所有数据中筛选出目标用户的K个特征,实现用户特征的自动获取。目标用户的所有数据包括但不限于以下之一或多种的组合:目标用户的通话记录、银行卡交易记录、电商浏览记录、电商浏览记录。
M×N的矩阵中包括目标用户的M×N个特征,LSTM模型转换成的K个特征可以是从M×N个特征中筛选出的K个特征,LSTM模型转换成的K个特征还可以是对M×N个特征分析得出的与M×N个特征不同的K个特征。
作为一个示例,LSTM模型包括:首尾依次相连的输入层、LSTM单元层、全连接层和输出层,LSTM单元层用于将来自输入层的M×N的矩阵转换成P×1的矩阵;全连接层用于将来自LSTM单元层的P×1的矩阵转换成K×1的矩阵,LSTM单元层可以是一层或多层,全连接层的层数可以一层或多层,P为大于1的整数。比如LSTM单元层的层数是两层或三层,全连接层的层数可以是两层或三层。可以根据LSTM模型训练和迭代挑选出最合适的层数和LSTM模型中的系数。输入层被设置为接收M×N的矩阵。最后一层的全连接层被设置为输出K×1的矩阵,输出层被设置为输出1×1的矩阵,即输出层输出一个值,这个值可以表示预测的用户是否会逾期还款。
图2示出了本发明实施例的一种LSTM模型的结构示意图。该LSTM模型中LSTM单元层的层数是两层,分别是LSTM单元层1和LSTM单元层2;该LSTM模型中全连接层的层数是两层,分别是全连接层1和全连接层2。
作为一个示例,K=1,LSTM模型的输出层输出1×1的矩阵;或者,K>1,LSTM模型的最后一层全连接层输出K×1的矩阵。
S103,根据预先训练的预测模型和目标用户的K个特征,得到目标用户是否会逾期还款的预测结果。
作为一个示例,可以仅将目标用户的K个特征输入到预先训练的预测模型中,预先训练的预测模型输出目标用户是否会逾期还款的预测结果。该示例中,不需要依赖于人工经验特征。
作为一个示例,可以将目标用户的K个特征和目标用户的人工经验特征输入到预先训练的预测模型中,预先训练的预测模型输出目标用户是否会逾期还款的预测结果。该示例中,将LSTM模型输出的K个特征和人工经验特征结合,得到目标用户是否会逾期还款的预测结果,目标用户的人工经验特征可以是少量的特征,对人工经验特征的依赖程度较小。
需要说明的是,在现有技术中,预测模型往往不能输入过多的特征,在得到人工经验特征后,如果人工经验特征的数量过多,只能使用部分的人工经验特征,将另一部分的人工经验特征舍弃,这样就会造成数据丢失,进而影响预测模型预测结果的准确性。在本发明实施例中,LSTM模型转换成K×1的矩阵中的K是可调的,即LSTM模型生成目标用户的特征个数是可调的。如果预测模型最多能输入的特征个数有限制,可以将K调节到合适的值,这样可以避免将一部分数据舍弃,进一步地保证了预测模型预测结果的准确性。
比如,K=25,LSTM模型为目标用户生成了25个特征,但是,最多能向预测模型输入20个特征。可以将K调节至20,LSTM模型将M×N的矩阵转换成20×1的矩阵,即为目标用户生成了20个特征,可以将这20个特征全部输入到预测模型中进行预测。
图3示出了本发明实施例的另一种用户行为预测方法的原理示意图。该方法包括:将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,时间序列数据中的每条数据包括:事件类型、事件持续的时间和事件对应的编号;将目标用户的M×N的矩阵输入到预先训练的长短期记忆LSTM模型中,LSTM模型的最后一层全连接层输出K×1的矩阵,作为目标用户的K个特征;将LSTM模型得到的K个特征和人工经验特征输入到预测模型中,预测模型输出目标用户是否会逾期还款的预测结果。LSTM模型包括:输入层、LSTM单元层、全连接层和输出层,LSTM单元层和全连接层分别包括至少一个网络节点,网络节点会存储学习到的信息并影响后续的网络节点。
根据本发明实施例的用户行为预测方法,1、通过将时间序列数据转换成M×N的矩阵,LSTM模型可以根据M×N的矩阵输出K个特征,不需要过度依赖于专家经验生成特征,节省了人力成本。2、在依赖工作人员的经验生成特征的情况下,如果原始数据增加了新类型的数据,则需要基于新类型的数据设计添加人工经验特征对应的代码,设计代码需要花大量时间,而通过本发明实施例在原有的代码里添加新类型的数据字段名称即可,节省了大量时间。3、柯尔莫可洛夫-斯米洛夫(Kolmogorov-Smirnov,KS)值可以对预测模型的风险区分能力进行评估,KS值越大,预测模型的风险区分能力越强。或者,KS值可以衡量预测模型的准确性,KS值越大,说明预测模型预测的结果越准确。同样的用户时间序列数据,在利用人工经验特征进行建模后得到的预测模型的KS值为0.28,利用LSTM模型得到的特征进行建模后得到的预测模型的KS值为0.33。因此,利用LSTM模型得到的特征进行预测的结果更加准确。
在本发明的一个实施例中,S101包括:
获取目标用户在N列时间窗中的每列时间窗内开始产生的时间序列数据;根据获取的时间序列数据对应的事件信息,计算目标用户在每列时间窗内的特征;根据目标用户在每列时间窗内的特征,确定目标用户的M×N的矩阵。
作为一个示例,根据获取的时间序列数据对应的事件信息,计算目标用户在每列时间窗内的特征包括:根据预设的事件信息与权重之间的对应关系,获取时间序列数据对应的事件信息对应的权重,将该权重输入到预定公式中,得到时间窗内的特征。
比如,预设如下的对应关系:不同通话类型对应的权重和不同通话记录的时长对应的权重,通话类型包括本地通话和长途通话。若一个时间窗为一天,2018年7月20日产生的时间序列数据包括10条通话记录,根据预设的对应关系,得到每条通话记录的权重,将10条通话记录的权重共同输入到预定公式中,得到时间窗内的3个特征。
在本发明的一个实施例中,S101之前,用户行为预测方法还包括:
将样本用户的时间序列数据转换成M×N的矩阵,样本用户包括用于模型训练的第一样本用户;通过预建的LSTM模型,将第一样本用户的M×N的矩阵转换成K×1的矩阵,根据第一样本用户的K×1的矩阵得到1×1的矩阵;根据第一样本用户的1×1的矩阵和第一样本用户是否发生逾期还款的行为,训练预建的LSTM模型,作为预先训练的LSTM模型。
作为一个示例,将样本用户的时间序列数据转换成M×N的矩阵的具体实现方式,与图1中S101的具体实现方式类似,已经在S101部分做出了详细说明,在此不再重复赘述。
将第一样本用户的M×N的矩阵输入到预建的LSTM模型中,预建的LSTM模型的最后一层全连接层输出K×1的矩阵;如果K=1,K×1的矩阵即为1×1的矩阵,预建的LSTM模型的输出层输出1×1的矩阵;如果K>1,预建的LSTM模型的输出层将K×1的矩阵转化成1×1的矩阵,并输出该1×1的矩阵。
第一样本用户的1×1的矩阵就是一个数值,该数值表示预建的LSTM模型对第一样本用户的预测结果,可以表示预建的LSTM模型预测的第一样本用户是否会发生逾期还款,将第一样本用户的1×1的矩阵与第一样本用户实际上是否发生逾期还款的行为进行比较来判断预建的LSTM模型是否可用,若预建的LSTM模型不可用,则调整预建的LSTM模型的系数,重新训练预建的LSTM模型,直到预建的LSTM模型可用时为止,将可用的LSTM模型作为上述中的预先训练的LSTM模型。
比如,1×1的矩阵中的一个数值表示预测的第一样本用户会逾期还款的概率,第一样本用户是否发生逾期还款的行为是1表示第一样本用户实际上未发生逾期还款,第一样本用户是否发生逾期还款的行为是0表示第一样本用户实际上发生逾期还款。计算第一样本用户的1×1的矩阵中的数值和第一样本用户是否发生逾期还款的行为对应的数值之间的差值,若该差值小于或等于0.3,说明LSTM模型对第一样本用户的预测结果是准确的,若该差值大于0.3,说明LSTM模型对第一样本用户的预测结果是不准确的。由于第一样本用户的数量是多个,比如,第一样本用户的数量是7万个,可以统计LSTM模型对第一样本用户预测的准确率,若该准确率低于70%,说明LSTM模型不可用,重新训练LSTM模型,直到LSTM模型大于70%时,说明LSTM模型是可用的。
需要说明的是,第一样本用户的数量是多个,逐个将第一样本用户的数据输入到LSTM模型中对预建的LSTM模型进行训练。
在本发明的一个实施例中,训练预建的LSTM模型,作为预先训练的LSTM模型之后,用户行为预测方法还包括:
根据第一样本用户的K×1的矩阵和第一样本用户是否发生逾期还款的行为,训练预建的预测模型,得到预先训练的预测模型。
作为一个示例,将第一样本用户的K×1的矩阵输入到预建的预测模型中,预建的预测模型输出第一样本用户的预测结果;第一样本用户是否发生逾期还款的行为指的是第一样本用户实际发生的行为,将第一样本用户的预测结果和第一样本用户是否发生逾期还款的行为进行比较,来判断预建的预测模型是否可用。如果预建的预测模型不可用,调整预建的预测模型的系数,重新训练预建的预测模型,直到预建的预测模型可用时停止训练,将可用的预测模型作为上述中的预先训练的预测模型。
在本发明的一个实施例中,样本用户还包括用于模型验证的第二样本用户;用户行为预测方法还包括:
通过预先训练的LSTM模型,将第二样本用户的M×N的矩阵转换成K×1的矩阵;基于第二样本用户的K×1的矩阵和第二样本用户是否发生逾期还款的行为,判断预先训练的LSTM模型和预先训练的预测模型是否需要重新训练。
作为一个示例,在得到预先训练的LSTM模型和预先训练的LSTM模型之后,预先训练的LSTM模型转换出第二样本用户的K×1的矩阵,将K×1的矩阵输入到预先训练的预测模型中,预先训练的预测模型输出第二样本用户的预测结果,将第二样本用户的预测结果和第二样本用户是否发生逾期还款的行为进行比较,来判断预先训练的LSTM模型和预先训练的预测模型是否需要重新训练。第二样本用户是否发生逾期还款的行为指的是第二样本用户实际发生的行为。
第二样本用户的数量是多个,逐个将第二样本用户的数据输入到预先训练的预测模型中,以判断预先训练的LSTM模型和预先训练的预测模型是否需要重新训练。
需要说明的是,如果根据第一样本用户的人工经验特征和第一样本用户的K个特征,训练预测模型,那么根据第二样本用户的人工经验特征和第二样本用户的K个特征,判断预先训练的LSTM模型和预先训练的预测模型是否需要重新训练。而且将目标用户的人工经验特征和目标用户的K个特征输入到预测模型中进行预测。
如果根据第一样本用户的K个特征,训练预测模型,那么根据第二样本用户的K个特征,判断预先训练的LSTM模型和预先训练的预测模型是否需要重新训练。而且将目标用户的K个特征输入到预测模型中进行预测。
图4示出了本发明实施例的又一种用户行为预测方法的流程示意图。该方法包括:S201至S206。
S201,通过自动特征引擎,将10万个样本用户中的每个样本用户的时间序列数据分别转换成M×N的矩阵。
S202,从10万个样本用户中随机抽出7万个样本用户,将7万个样本用户用于模型训练,剩下的3万个样本用户用于模型验证。对于7万个样本用户中的每个样本用户,预建的LSTM模型将每个样本用户的M×N的矩阵转换成K×1的矩阵,将K×1的矩阵转换成1×1的矩阵。
S203,根据7万个样本用户的1×1的矩阵和7万个样本用户实际上是否发生逾期还款,训练预建的LSTM模型,在训练完LSTM模型,保存LSTM模型的文件。
S204,根据7万个样本用户的K×1的矩阵和7万个样本用户实际上是否发生逾期还款,训练预建的预测模型,在训练完预测模型,保存预测模型的文件。
或者,根据7万个样本用户的K×1的矩阵、7万个样本用户的人工经验特征和7万个样本用户实际上是否发生逾期,训练预建的预测模型。
S205,根据保存的LSTM模型的文件,将3万个样本用户的M×N的矩阵输入到LSTM模型中,以使LSTM模型输出3万个样本用户的K×1的矩阵。
S206,基于3万个样本用户的K×1的矩阵和3万个样本用户实际上是否发生逾期还款,判断LSTM模型和预测模型是否需要重新训练。如果不需要重新训练,则可以使用预测模型进行预测。
需要说明的是,如果S204中根据人工经验特征训练预测模型,那么需要将人工经验特征输入到预测模型中进行预测。
图5示出了本发明实施例的一种用户行为预测装置的结构示意图。该用户行为预测装置300包括:第一转换模块301、第二转换模块302和预测模块303。
第一转换模块301,用于将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数。
第二转换模块302,用于通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数。
预测模块303,用于根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。
在本发明的一个实施例中,所述第一转换模块301包括:获取单元、计算单元和确定单元。
获取单元,用于获取所述目标用户在N列时间窗中的每列时间窗内开始产生的时间序列数据。
计算单元,用于根据获取的时间序列数据对应的事件信息,计算所述目标用户在所述每个时间窗内的特征。
确定单元,用于根据所述目标用户在所述每列时间窗内的特征,确定所述目标用户的M×N的矩阵。
在本发明的一个实施例中,用户行为预测装置300还包括:第三转换模块、第四转换模块和第一训练模块。
第三转换模块,用于将样本用户的时间序列数据转换成M×N的矩阵,所述样本用户包括用于模型训练的第一样本用户。
第四转换模块,用于通过预建的LSTM模型,将所述第一样本用户的M×N的矩阵转换成K×1的矩阵,根据所述第一样本用户的K×1的矩阵得到1×1的矩阵。
第一训练模块,用于根据所述第一样本用户的1×1的矩阵和所述第一样本用户是否发生逾期还款的行为,训练所述预建的LSTM模型,作为所述预先训练的LSTM模型。
在本发明的一个实施例中,用户行为预测装置300还包括:
第二训练模块,用于根据所述第一样本用户的K×1的矩阵和所述第一样本用户是否发生逾期还款的行为,训练预建的预测模型,得到所述预先训练的预测模型。
在本发明的一个实施例中,所述样本用户包括用于模型验证的第二样本用户;用户行为预测装置300还包括:第五转换模块和判断模块。
第五转换模块,用于通过所述预先训练的LSTM模型,将所述第二样本用户的M×N的矩阵转换成K×1的矩阵。
判断模块,用于基于所述第二样本用户的K×1的矩阵和所述第二样本用户是否发生逾期还款的行为,判断所述预先训练的LSTM模型和所述预先训练的预测模型是否需要重新训练。
图6示出了本发明实施例的一种计算设备的结构示意图。计算设备400包括输入设备401、输入接口402、处理器403、存储器404、输出接口405、以及输出设备406。
其中,输入接口402、处理器403、存储器404、以及输出接口405通过总线410相互连接,输入设备401和输出设备406分别通过输入接口402和输出接口405与总线410连接,进而与计算设备400的其他组件连接。
具体地,输入设备401接收来自外部的输入信息,并通过输入接口402将输入信息传送到处理器403;处理器403基于存储器404中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器404中,然后通过输出接口405将输出信息传送到输出设备406;输出设备406将输出信息输出到计算设备400的外部供用户使用。
计算设备400可以执行本申请上述的方法中的各步骤。
处理器403可以是一个或多个中央处理器(英文:Central Processing Unit,CPU)。在处理器403是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器404可以是但不限于随机存储存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM),可擦除可编程只读存储器(Erasable ProgrammableRead Only Memory,EPROM)、光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、硬盘等中的一种或多种。存储器404用于存储程序代码。
可以理解的是,在本申请实施例中,图5提供的任一模块或全部模块的功能可以用图6所示的处理器403实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机程序指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于装置和系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。
Claims (10)
1.一种用户行为预测方法,其特征在于,包括:
将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数;
通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数;
根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述将目标用户的时间序列数据转换成M×N的矩阵,包括:
获取所述目标用户在所述N列时间窗中的每列时间窗内开始产生的时间序列数据;
根据获取的时间序列数据对应的事件信息,计算所述目标用户在所述每列时间窗内的特征;
根据所述目标用户在所述每列时间窗内的特征,确定所述目标用户的M×N的矩阵。
3.根据权利要求1所述的方法,其特征在于,所述将目标用户的时间序列数据转换成M×N的矩阵之前,还包括:
将样本用户的时间序列数据转换成M×N的矩阵,所述样本用户包括用于模型训练的第一样本用户;
通过预建的LSTM模型,将所述第一样本用户的M×N的矩阵转换成K×1的矩阵,根据所述第一样本用户的K×1的矩阵得到1×1的矩阵;
根据所述第一样本用户的1×1的矩阵和所述第一样本用户是否发生逾期还款的行为,训练所述预建的LSTM模型,作为所述预先训练的LSTM模型。
4.根据权利要求3所述的方法,其特征在于,所述训练所述预建的LSTM模型,作为所述预先训练的LSTM模型之后,还包括:
根据所述第一样本用户的K×1的矩阵和所述第一样本用户是否发生逾期还款的行为,训练预建的预测模型,得到所述预先训练的预测模型。
5.根据权利要求3所述的方法,其特征在于,所述样本用户还包括用于模型验证的第二样本用户;还包括:
通过所述预先训练的LSTM模型,将所述第二样本用户的M×N的矩阵转换成K×1的矩阵;
基于所述第二样本用户的K×1的矩阵和所述第二样本用户是否发生逾期还款的行为,判断所述预先训练的LSTM模型和所述预先训练的预测模型是否需要重新训练。
6.一种用户行为预测装置,其特征在于,包括:
第一转换模块,用于将目标用户的时间序列数据转换成M×N的矩阵,M表示M行特征,N表示N列时间窗,M和N分别为大于1的整数;
第二转换模块,用于通过预先训练的长短期记忆LSTM模型,将所述目标用户的M×N的矩阵转换成K×1的矩阵,所述K×1的矩阵表示所述目标用户的K个特征,K为正整数;
预测模块,用于根据预先训练的预测模型和所述目标用户的K个特征,得到所述目标用户是否会逾期还款的预测结果。
7.根据权利要求6所述的装置,其特征在于,所述第一转换模块包括:
获取单元,用于获取所述目标用户在所述N列时间窗中的每列时间窗内开始产生的时间序列数据;
计算单元,用于根据获取的时间序列数据对应的事件信息,计算所述目标用户在所述每列时间窗内的特征;
确定单元,用于根据所述目标用户在所述每列时间窗内的特征,确定所述目标用户的M×N的矩阵。
8.根据权利要求6所述的装置,其特征在于,还包括:
第三转换模块,用于将样本用户的时间序列数据转换成M×N的矩阵,所述样本用户包括用于模型训练的第一样本用户;
第四转换模块,用于通过预建的LSTM模型,将所述第一样本用户的M×N的矩阵转换成K×1的矩阵,根据所述第一样本用户的K×1的矩阵得到1×1的矩阵;
第一训练模块,用于根据所述第一样本用户的1×1的矩阵和所述第一样本用户是否发生逾期还款的行为,训练所述预建的LSTM模型,作为所述预先训练的LSTM模型。
9.一种计算设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-5中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810931187.5A CN109190808B (zh) | 2018-08-15 | 2018-08-15 | 用户行为预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810931187.5A CN109190808B (zh) | 2018-08-15 | 2018-08-15 | 用户行为预测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109190808A true CN109190808A (zh) | 2019-01-11 |
CN109190808B CN109190808B (zh) | 2020-11-24 |
Family
ID=64918038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810931187.5A Active CN109190808B (zh) | 2018-08-15 | 2018-08-15 | 用户行为预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109190808B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800309A (zh) * | 2019-01-24 | 2019-05-24 | 华中师范大学 | 课堂话语类型分类方法及装置 |
CN110060094A (zh) * | 2019-03-26 | 2019-07-26 | 上海拍拍贷金融信息服务有限公司 | 客群优劣预估方法及装置、计算机可读存储介质 |
CN110264270A (zh) * | 2019-06-20 | 2019-09-20 | 京东数字科技控股有限公司 | 一种行为预测方法、装置、设备和存储介质 |
CN110738564A (zh) * | 2019-10-16 | 2020-01-31 | 信雅达系统工程股份有限公司 | 贷后风险评估方法及装置、存储介质 |
CN111125519A (zh) * | 2019-12-11 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 用户行为预测方法、装置、电子设备以及存储介质 |
WO2020211616A1 (zh) * | 2019-04-15 | 2020-10-22 | 北京沃东天骏信息技术有限公司 | 用于处理用户交互信息的方法和装置 |
CN111950016A (zh) * | 2019-05-14 | 2020-11-17 | 北京腾云天下科技有限公司 | 一种数据开放输出模型的生成方法、装置和计算设备 |
CN114565196A (zh) * | 2022-04-28 | 2022-05-31 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3239905A1 (en) * | 2016-04-29 | 2017-11-01 | Fujitsu Limited | Methods and apparatus for use in predicting non-stationary time-series data |
CN107730087A (zh) * | 2017-09-20 | 2018-02-23 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
CN107992957A (zh) * | 2016-10-25 | 2018-05-04 | 航天信息股份有限公司 | 一种基于税务数据进行经营预测的方法及装置 |
-
2018
- 2018-08-15 CN CN201810931187.5A patent/CN109190808B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3239905A1 (en) * | 2016-04-29 | 2017-11-01 | Fujitsu Limited | Methods and apparatus for use in predicting non-stationary time-series data |
CN107992957A (zh) * | 2016-10-25 | 2018-05-04 | 航天信息股份有限公司 | 一种基于税务数据进行经营预测的方法及装置 |
CN107730087A (zh) * | 2017-09-20 | 2018-02-23 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800309A (zh) * | 2019-01-24 | 2019-05-24 | 华中师范大学 | 课堂话语类型分类方法及装置 |
CN110060094A (zh) * | 2019-03-26 | 2019-07-26 | 上海拍拍贷金融信息服务有限公司 | 客群优劣预估方法及装置、计算机可读存储介质 |
WO2020211616A1 (zh) * | 2019-04-15 | 2020-10-22 | 北京沃东天骏信息技术有限公司 | 用于处理用户交互信息的方法和装置 |
CN111950016A (zh) * | 2019-05-14 | 2020-11-17 | 北京腾云天下科技有限公司 | 一种数据开放输出模型的生成方法、装置和计算设备 |
CN111950016B (zh) * | 2019-05-14 | 2023-11-21 | 北京腾云天下科技有限公司 | 一种数据开放输出模型的生成方法、装置和计算设备 |
CN110264270A (zh) * | 2019-06-20 | 2019-09-20 | 京东数字科技控股有限公司 | 一种行为预测方法、装置、设备和存储介质 |
CN110738564A (zh) * | 2019-10-16 | 2020-01-31 | 信雅达系统工程股份有限公司 | 贷后风险评估方法及装置、存储介质 |
CN111125519A (zh) * | 2019-12-11 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 用户行为预测方法、装置、电子设备以及存储介质 |
CN111125519B (zh) * | 2019-12-11 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 用户行为预测方法、装置、电子设备以及存储介质 |
CN114565196A (zh) * | 2022-04-28 | 2022-05-31 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
CN114565196B (zh) * | 2022-04-28 | 2022-07-29 | 北京零点远景网络科技有限公司 | 基于政务热线的多事件趋势预判方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109190808B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190808A (zh) | 用户行为预测方法、装置、设备及介质 | |
CN109902222B (zh) | 一种推荐方法及装置 | |
CN108805185B (zh) | 人脸识别方法、装置、存储介质及计算机设备 | |
CN108037993B (zh) | 基于大数据和深度学习神经网络的云计算调度方法及系统 | |
CN113407694B (zh) | 客服机器人知识库歧义检测方法、装置及相关设备 | |
CN109389494B (zh) | 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置 | |
JP5965557B1 (ja) | 類似度学習システム及び類似度学習方法 | |
WO2019041439A1 (zh) | 核保难度预测的方法、装置、计算机设备及存储介质 | |
CN107909392A (zh) | 刺激行为敏感度预测方法、装置、设备及可读存储介质 | |
CN110705821A (zh) | 基于多评价维度的热点学科预测方法、装置、终端、及介质 | |
CN110264270A (zh) | 一种行为预测方法、装置、设备和存储介质 | |
CN112116245A (zh) | 信贷风险评估方法、装置、计算机设备及存储介质 | |
CN114663198A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
Mohammad Nezhad et al. | An artificial neural network meta-model for constrained simulation optimization | |
CN110263136B (zh) | 基于强化学习模型向用户推送对象的方法和装置 | |
CN112256886A (zh) | 图谱中的概率计算方法、装置、计算机设备及存储介质 | |
CN112733724B (zh) | 基于判别样本元挖掘器的亲属关系验证方法和装置 | |
CN107194489A (zh) | 数据预测方法及装置 | |
CN114661705A (zh) | 一种基于云计算的大数据分析系统 | |
CN109993588A (zh) | 一种用户年龄预测的方法及装置 | |
CN107832578B (zh) | 基于态势变化模型的数据处理方法及装置 | |
CN110533459A (zh) | 一种基于梯度提升算法的终端更换概率预测方法及装置 | |
CN114519508A (zh) | 基于时序深度学习和法律文书信息的信用风险评估方法 | |
CN108564237A (zh) | 一种容量评估模型建立方法、容量评估方法及装置 | |
CN110969549B (zh) | 一种司法数据处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |