CN114463036A

CN114463036A - 一种信息处理方法及装置、存储介质

Info

Publication number: CN114463036A
Application number: CN202111596746.XA
Authority: CN
Inventors: 袁强; 汪亚男; 赖晓彬
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2021-12-24
Filing date: 2021-12-24
Publication date: 2022-05-10
Also published as: WO2023115876A1

Abstract

本申请实施例公开了一种信息处理方法及装置、存储介质，包括：根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；多个流失预警模型在预测流失预警概率时所侧重的特征维度不同；利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率，多个融合系数与多个流失预警模型一一对应。

Description

一种信息处理方法及装置、存储介质

技术领域

本申请涉及机器学习技术领域，尤其涉及一种信息处理方法及装置、存储介质。

背景技术

随着互联网技术的高速发展，互联网公司、金融机构相继推出各类的业务产品，业务产品市场份额逐渐饱和，老客户通过对各类业务产品进行横向对比选择，造成了部分老客户的流失。为了防止因客户大量流失而造成业务产品经营危机，就需要提前预测出潜在的即将流失的客户，以进行提前干预挽留。

现有技术中，是获取待预测对象的预设时间段内的行为特征信息，将该预设时间段内的行为特征信息输入模型中，从而得到待预测对象对应的流失预警概率，由于现有的模型的学习能力具有局限性、模型的泛化能力不足，导致利用预警模型确定的流失预警概率值的准确性低。

发明内容

为解决上述技术问题，本申请实施例期望提供一种信息处理方法及装置、存储介质，能够提高确定目标流失预警概率时的准确性。

本申请的技术方案是这样实现的：

本申请实施例提供一种信息处理方法，所述信息处理方法包括：

根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；

将所述历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；所述多个流失预警模型在预测流失预警概率时所侧重的特征维度不同；

利用流失预警融合模型中的多个融合系数对所述多个流失预警概率进行融合处理，得到所述待预测对象对应的目标流失预警概率，所述多个融合系数与所述多个流失预警模型一一对应。

本申请实施例提供了一种信息处理装置，所述装置包括：

生成单元，用于根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；

输入单元，用于将所述历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；所述多个流失预警模型在预测流失预警概率时所侧重的特征维度不同；

融合单元，用于利用流失预警融合模型中的多个融合系数对所述多个流失预警概率进行融合处理，得到所述待预测对象对应的目标流失预警概率，所述多个融合系数与所述多个流失预警模型一一对应。

本申请实施例提供了一种信息处理装置，所述装置包括：

存储器、处理器和通信总线，所述存储器通过所述通信总线与所述处理器进行通信，所述存储器存储所述处理器可执行的信息处理的程序，当所述信息处理的程序被执行时，通过所述处理器执行上述所述的信息处理方法。

本申请实施例提供了一种存储介质，其上存储有计算机程序，应用于信息处理装置，其特征在于，该计算机程序被处理器执行时实现上述所述的信息处理方法。

本申请实施例提供了一种信息处理方法及装置、存储介质，信息处理方法包括：根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；多个流失预警模型在预测流失预警概率时所侧重的特征维度不同；利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率，多个融合系数与多个流失预警模型一一对应。采用上述方法实现方案，信息处理装置利用多个流失预警模型对待预测对象对应的历史行为信息进行预测，以在不同特征维度的侧重点上预测出待预测对象对应的流失预警概率，再利用流失预警融合模型针对多个流失预警概率分配不同的注意力，并基于注意力将不同侧重点的多个流失预警概率进行融合，从而实现在多个侧重点上同时判断待预测对象是否会流失，提高了流失预警的准确性。

附图说明

图1为本申请实施例提供的一种信息处理方法流程图；

图2为本申请实施例提供的一种示例性的信息处理过程中的模型架构示意图；

图3为本申请实施例提供的一种示例性的信息处理结构示意图一；

图4为本申请实施例提供的一种示例性的信息处理结构示意图二；

图5为本申请实施例提供的一种信息处理装置的组成结构示意图一；

图6为本申请实施例提供的一种信息处理装置的组成结构示意图二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

实施例一

本申请实施例提供了一种信息处理方法，一种信息处理方法应用于信息处理装置，图1为本申请实施例提供的一种信息处理方法流程图，如图1所示，信息处理方法可以包括：

S101、根据获取到的待预测对象的原始历史行为信息，生成历史行为信息。

本申请实施例提供的一种信息处理方法适用于确定待预测对象的目标流失预警概率的场景下。

在本申请实施例中，信息处理装置可以以各种形式来实施。例如，本申请中描述的信息处理装置可以包括诸如手机、照相机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)、便捷式媒体播放器(Portable Media Player，PMP)、导航装置、可穿戴设备、智能手环、计步器等装置，以及诸如数字TV、台式计算机、服务器等装置。

在本申请实施例中，待预测对象可以为物联网公司的客户，待预测对象也可以为金融机构中的客户；待预测对象还可以为其他的客户，具体的可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，待预测对象的数量可以为一个，待预测对象的数量也可以为两个，待预测对象的数量还可以为多个；具体的待预测对象的数量可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置可以在接收对待预测对象的流失预测指令的情况下，信息处理装置就根据获取待预测对象的原始历史行为信息，并根据原始历史行为信息生成历史行为信息。

在本申请实施例中，信息处理装置中设置有显示屏，信息处理装置可以从显示屏上接收对待预测对象的流失预测指令；信息处理装置也可以接收其他设备传输的对待预测对象的流失预测指令；具体的信息处理装置接收到对待预测对象的流失预测指令的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置获取待预测对象的原始历史行为信息的方式，可以为信息处理装置从数据库中待预测对象的原始历史行为信息；信息处理装置也可以从其他设备处待预测对象的原始历史行为信息；具体的信息处理装置待预测对象的原始历史行为信息的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，历史行为信息可以为从接收到对待预测对象的流失预测指令这一时间节点之前的与待预测对象关联的所有业务产品信息，以及待预测对象处理该业务产品信息的时间。

在本申请实施例中，信息处理装置根据获取到的待预测对象的原始历史行为信息，生成历史行为信息的过程，包括：信息处理装置从原始历史行为信息中剔除行为特征缺失率大于或者等于预设缺失率阈值的行为信息，得到剔除后的行为信息；信息处理装置对剔除后的行为信息进行特征筛选处理，得到历史行为信息。

在本申请实施例中，预设缺失率阈值可以为信息处理装置中配置的阈值信息；预设缺失率阈值也可以为信息处理装置从其他设备处接收到的阈值信息；预设缺失率阈值还可以为客户输入的阈值信息；具体的信息处理装置获取到预设缺失率阈值的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，预设缺失率阈值的取值可以为95％；预设缺失率阈值的取值也可以为80％；预设缺失率阈值的取值还可以为其他的数值；具体的预设缺失率阈值的数值可以根据实际情况进行确定，本申请实施例对此不作限定。

需要说明的是，原始历史行为信息可以为信息处理装置从数据库中获取到的还未处理的原始信息。

可以理解的是，信息处理装置通过从原始历史行为信息中剔除行为特征缺失率大于或者等于预设缺失率阈值的行为信息，得到剔除后的行为信息，对剔除后的行为信息进行特征筛选处理，得到历史行为信息，降低了剔除后的行为信息的特征维度，提高了信息处理装置对剔除后的行为信息进行特征筛选处理的速度，从而提高了信息处理装置获取到待预测对象的历史行为信息的速度。

在本申请实施例中，信息处理装置对剔除后的行为信息进行特征筛选处理，得到历史行为信息的过程，包括：信息处理装置对剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息；信息处理装置从衍生后的行为信息中筛选出特征稳定性大于或者等于预设稳定性阈值的稳定行为信息；信息处理装置从稳定行为信息中剔除相关系数大于或者等于预设相关阈值的行为信息，得到历史行为信息。

在本申请实施例中，相关系数可以为皮尔逊系数，即皮尔逊积矩相关系数(Pearson product-moment correlation coefficient，PPMCC)；相关系数也可以为其他的用于描述至少两个稳定行为信息之间的相似度的系数；具体的相关系数可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，预设稳定性阈值可以为信息处理装置中配置的阈值信息；预设稳定性阈值也可以为信息处理装置从其他设备处接收到的阈值信息；预设稳定性阈值还可以为客户输入的阈值信息；具体的信息处理装置获取到预设稳定性阈值的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置可以确定衍生后的行为信息对应的特征稳定性值(Population Stability Index，PSI)，并在特征稳定性值中筛选出特征稳定性大于或者等于预设稳定性阈值的稳定行为信息。

示例性的，预设稳定性阈值可以为25％；预设稳定性阈值也可以为30％；预设稳定性阈值还可以为其他的数值；具体的预设稳定性阈值可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置对剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息的方式，可以为信息处理装置按照预设的时间转化方式对剔除后的行为信息进行转化，得到衍生时序信息；也可以为信息处理装置按照剔除后的行为信息所处的时间节点确定剔除后的行为信息的衍生时序信息；还可以为信息处理装置统计预设时间段内剔除后的行为信息的数量，得到衍生时序信息；还可以为信息处理装置在剔除后的行为信息的数量为至少两个的情况下，确定至少两个剔除后的行为信息中相邻两个剔除后的行为信息之间的时间间隔，得到衍生时序信息；具体的信息处理装置对剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，若剔除后的行为信息为时间、数组等类型的信息，如“2021-10-01”，预设的时间转化方式可以为转化为年、月、日的转化方式，则按照预设的时间转化方式对剔除后的行为信息进行转化后，得到衍生后的行为信息为“2021”、“10”、“1”。

在本申请实施例中，预设相关阈值可以为信息处理装置中配置的阈值信息；预设相关阈值也可以为信息处理装置从其他设备处接收到的阈值信息；预设相关阈值还可以为客户输入的阈值信息；具体的信息处理装置获取到预设相关阈值的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，预设相关阈值可以为75％；预设相关阈值也可以为85％；预设相关阈值还可以为其他的数值；具体的预设相关阈值可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，稳定行为信息的数量为多个，信息处理装置从稳定行为信息中剔除相关系数大于或者等于预设相关阈值的行为信息得到历史行为信息的方式，可以为信息处理装置确定多个稳定行为信息中任意两个稳定行为信息之间的相关系数，在该相关系数大于或者等于预设相关阈值的情况下，信息处理装置则确定该任意两个稳定行为信息为相关信息，信息处理装置就删除该任意两个稳定行为信息中的任一个稳定行为信息，信息处理装置通过剔除多个稳定行为信息中的所有相关系数大于或者等于预设相关阈值的行为信息，从而就得到了得到历史行为信息。

可以理解的是，信息处理装置通过从衍生后的行为信息中筛选出特征稳定性较高的、且不具有相关性的历史行为特征，减少了剔除后的行为信息中的信息的量，得到了稳定性高的历史行为信息，利用该信息量少且稳定性高的历史行为信息可以快速、准确的确定出待预测对象对应的目标流失预警概率，提高了确定出准确性高的目标流失预警概率时的速度。

在本申请实施例中，信息处理装置对剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息的过程，包括：信息处理装置在剔除后的行为信息中不存在缺失特征的情况下，对剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息；信息处理装置在剔除后的行为信息中存在缺失特征的情况下，利用预设特征对剔除后的行为信息中的缺失特征进行填充处理，得到填充后的行为信息；信息处理装置对填充后的行为信息进行时序衍生处理，得到衍生后的行为信息。

在本申请实施例中，预设特征可以为信息处理装置中配置的特征；预设特征也可以为信息处理装置接收到的其他设备传输的特征；预设特征还可以为客户端输入的特征；具体的信息处理装置获取到预设特征的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

需要说明的是，预设特征可以为特征值为0的特征；预设特征也可以为特征值为最大值的特征；预设特征的特征值还可以为其他的值；具体的预设特征的特征值可以根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，客户在过去30天未进行交易，数据库中的存储的信息为NULL，可以利用预设特征0进行特征填充，得到填充后的行为信息；或者需要确定客户最近一次交易时间距离今多少天的信息时，数据库中该用户从来没有交易过，即没有交易时间，此时可以利用预设特征(最大值，如9999)进行特征填充，得到填充后的行为信息。

可以理解的是，信息处理装置在确定出剔除后的行为信息中存在缺失特征的情况下，通过利用预设特征对剔除后的行为信息中的缺失特征进行填充处理，得到填充后的行为信息，使得填充后的行为信息为完整的、不存在异常的行为信息，对该行为信息进行稳定性筛选以及相关性筛选时不会影响处理时的准确性，从而提高了根据填充后的行为信息确定出待预测对象对应的目标流失预警概率时的准确性。

S102、将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；多个流失预警模型在预测流失预警概率时所侧重的特征维度不同。

在本申请实施例中，信息处理装置根据获取到的待预测对象的原始历史行为信息，生成历史行为信息之后，信息处理装置就可以将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率。

需要说明的是，多个流失预警模型在预测流失预警概率时所侧重的特征维度不同。

在本申请实施例中，多个流失预警模型的数量可以为3个；多个流失预警模型的数量也可以为4个；多个流失预警模型的数量还可以为5个；多个流失预警模型的数量也可以为其他的数量；具体的多个流失预警模型的数量可以根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，若多个流失预警模型的数量可以为3个，则多个流失预警模型可以包括极端梯度提升(Extreme Gradient Boosting，XGBoost)二分类模型、梯度提升和类别型特征(Gradient Boosting、Categorical Features，CatBoost)二分类模型和LightGBM(LightGradient Boosting Machine)二分类模型。

需要说明的是，多个流失预警模型也可以为随机森林、支持向量机(SupportVector Machine，SVM)等模型；具体的可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率的过程，包括：信息处理装置从历史行为信息中获取待预测对象在预设时间段内的第一行为信息和第二行为信息；信息处理装置将第二行为信息输入时序特征提取模型中，得到时序信息；信息处理装置将第一行为信息和时序信息进行拼接，得到拼接行为信息；信息处理装置将拼接行为信息分别输入多个流失预警模型中，得到多个流失预警概率。

需要说明的是，第二行为信息为历史行为信息中除第一行为信息外的、且在第一行为信息之前生成的行为信息。第一行为信息为预设时间段内的行为信息；第二行为信息为非预设时间段内的行为信息。

在本申请实施例中，预设时间段内可以为从当前时间段之前一个月内的时间段；预设时间段内也可以为从当前时间段之前15天内的时间段；预设时间段内还可以为其他的时间段间隔；具体的预设时间段可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，时序特征提取模型可以为长短期记忆人工神经网络(LongShort-Term Memory，LSTM)模型；时序特征提取模型也可以为门控循环单元(GateRecurrent Unit，GRU)；时序特征提取模型还可以为其他的用于提取时序特征的模型；具体的可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置在得到第二行为信息的情况下，信息处理装置可以先对第二行为信息进行归一化处理，得到归一化处理后的行为信息；然后信息处理装置将归一化处理后的行为信息输入时序特征提取模型中，得到时序信息。

在本申请实施例中，信息处理装置将第一行为信息和时序信息进行拼接，得到拼接行为信息的方式，可以为信息处理装置将第一行为信息和时序信息进行首尾拼接，得到拼接行为信息；信息处理装置也可以将第一行为信息和时序信息进行间隔拼接，得到拼接行为信息；信息处理装置还可以将第一行为信息和时序信息进行其他方式的拼接，得到拼接行为信息；具体的信息处理装置将第一行为信息和时序信息进行拼接，得到拼接行为信息的方式，可以根据实际情况进行确定，本申请实施例对此不作限定。

可以理解的是，信息处理装置通过获取待预测对象在非预设时间段内的第二行为信息，并利用时序特征提取模型从第二行为信息中提取时序信息，根据第二行为信息中的时序信息来补充第一行为信息中的信息量，即根据增加了信息量的第一行为信息来确定待预测对象对应的目标流失预警概率，提高了目标流失预警概率的准确性。

在本申请实施例中，多个流失预警模型包括第一流失预警模型、第二流失预警模型和第三流失预警模型；信息处理装置将拼接行为信息分别输入多个流失预警模型中，得到流失预警概率的过程，包括：信息处理装置将拼接行为信息输入第一流失预警模型，得到第一预警概率；信息处理装置将拼接行为信息输入第二流失预警模型，得到第二预警概率；信息处理装置将拼接行为信息输入第三流失预警模型，得到第三预警概率；信息处理装置将第一预警概率、第二预警概率和第三预警概率进行拼接，得到多个流失预警概率。

在本申请实施例中，信息处理装置将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率之前，信息处理装置还会获取样本对象对应的样本行为信息以及样本对象对应的样本流失预警标签；信息处理装置利用样本行为信息和样本流失预警标签训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、多个流失预警模型和流失预警融合模型。

在本申请实施例中，初始时序特征提取模型可以为LSTM模型；多个初始流失预警模型可以为XGBoost二分类模型、CatBoost二分类模型和LightGBM二分类模型；流失预警融合模型可以为逻辑回归(Logistic Regression，LR)模型；流失预警融合模型也可以为其他的用于确定多个流失预警模型对应的融合系数的模型；具体的流失预警融合模型可以根据实际情况进行确定，本申请实施例对此不作限定。

可以理解的是，信息处理装置通过获取样本行为信息和样本流失预警标签，利用样本行为信息和样本流失预警标签来训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、多个流失预警模型和流失预警融合模型，以供利用多个流失预警模型和流失预警融合模型构建的堆叠模型(stacking模型)和时序特征提取模型对待预测对象的历史行为信息进行准确预测，提高了确定出待预测对象对应的目标流失预警概率时的准确性。

在本申请实施例中，信息处理装置利用样本行为信息和样本流失预警标签训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、多个流失预警模型和流失预警融合模型的过程，包括：信息处理装置从样本行为信息中获取得到样本对象在预设时间段内的第一样本行为信息和第二样本行为信息；信息处理装置利用初始时序特征提取模型从第二样本行为信息中筛选时序训练信息；并将第一样本行为信息和时序训练信息进行拼接，得到样本拼接信息；信息处理装置将样本拼接信息分别输入多个初始流失预警模型，得到多个训练流失预警标签；信息处理装置将样本流失预警标签和多个训练流失预警标签输入初始流失预警融合模型，得到训练预测结果；并根据训练预测结果和样本流失预警标签确定初始流失预警融合模型的模型损失；信息处理装置在模型损失大于或者等于预设模型损失阈值的情况下，调整初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的模型参数；并利用样本行为信息和样本流失预警标签继续训练调整模型参数后的初始时序特征提取模型、调整模型参数后的多个初始流失预警模型和调整模型参数后的初始流失预警融合模型，直至得到时序特征提取模型、多个流失预警模型和流失预警融合模型。

在本申请实施例中，在样本对象中的流失对象数量较少的情况下，信息处理装置在获取到样本行为信息后，信息处理装置先对样本行为信息中的流失对象对应的负样本行为信息进行下采样处理，使得样本行为信息中的正样本行为信息与负样本行为信息之间的比值为预设比值。

示例性的，预设比值可以为1:20，预设比值也可以为1:10，预设比值还可以为1:10-1:20，具体的预设比值可以根据实际情况进行确定，本申请实施例对此不作限定。

需要说明的是，信息处理装置调整样本行为信息中的正样本行为信息与负样本行为信息之间的比值为预设比值之后，信息处理装置就可以利用调整后的样本行为信息和样本流失预警标签来训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，从而得到时序特征提取模型、多个流失预警模型和流失预警融合模型。

在本申请实施例中，预设模型损失阈值可以为信息处理装置中配置的损失阈值；预设模型损失阈值也可以为信息处理装置接收到的其他设备传输的损失阈值；预设模型损失阈值还可以为用户输入信息处理装置中的损失阈值；预设模型损失阈值还可以为信息处理装置以其他的方式获取到的损失阈值；具体的信息处理装置获取到预设模型损失阈值的方式可以根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，信息处理装置根据训练预测结果

和样本流失预警标签(y)确定初始流失预警融合模型的模型损失(Loss Function)的方式，如公式(1)所示：

需要说明的是，模型参数包括：初始时序特征提取模型的第一模型参数、多个初始流失预警模型对应的多个第二模型参数、初始流失预警融合模型对应的第三模型参数。

还需要说明的是，第一模型参数包括：LSTM模型的输出神经元数量、隐藏层的隐藏系数以及隐藏层的神经元数量。多个第二模型参数包括：树的深度、学习率、迭代次数等。第三模型参数包括迭代次数、L1正则、L2正则等参数等。

需要说明的是，隐藏层的神经元数量(N_h)、隐藏层的隐藏系数(α)和输出神经元数量(N_o)之间的关系如公式(2)所示：

其中，N_i为LSTM模型的输入层神经元数量(数量值为第一行为信息中的特征数量)，N_s为LSTM模型的样本对象的数量。隐藏层的隐藏系数的取值范围为(2-10)；输出神经元数量的最大值为第二行为信息中的特征数量。

需要说明的是，LSTM模型的隐藏层的数量为2层。

在本申请实施例中，信息处理装置在确定出模型训练过程中的模型损失小于预设模型损失阈值的情况下，信息处理装置就将训练过程中该模型损失对应的训练时序特征提取模型、多个训练流失预警模型和训练流失预警融合模型作为时序特征提取模型、多个流失预警模型和流失预警融合模型。

可以理解的是，信息处理装置通过获取样本对象在非预设时间段内的第二样本行为信息，并利用第二样本行为信息训练初始时序特征提取模型，利用时序特征提取模型输出的时序训练信息、第一样本行为信息训练多个初始流失预警模型；利用多个初始流失预警模型输出的多个训练流失预警标签和样本流失预警标签训练初始流失预警融合模型，以得到可以对待预测对象的第二行为信息进行处理的时序特征提取模型，以及可以搭建堆叠模型的多个流失预警模型和流失预警融合模型，以供利用多个流失预警模型和流失预警融合模型构建的堆叠模型和时序特征提取模型对待预测对象的历史行为信息进行准确预测，提高了确定出待预测对象对应的目标流失预警概率时的准确性。

在本申请实施例中，初始流失预警模型包括第一初始流失预警模型、第二初始流失预警模型和第三初始流失预警模型，信息处理装置将样本拼接信息输入初始流失预警模型，得到训练流失预警标签的过程，包括：信息处理装置将样本拼接信息输入第一初始流失预警模型，得到第一训练标签；信息处理装置将样本拼接信息输入第二初始流失预警模型，得到第二训练标签；信息处理装置将样本拼接信息输入第三初始流失预警模型，得到第三训练标签；信息处理装置将第一训练标签、第二训练标签和第三训练标签进行拼接，得到训练流失预警标签。

示例性的，信息处理装置获取到了n个样本对象对应的样本行为信息，该样本行为信息可以为D1＝{(x₁,y₁),(x₂,y₂),…,(x_n,y_n)}(n>0)，其中x₁为第一个样对象对应的样本行为信息，y₁为第一个样对象对应的样本流失预警标签；x₂为第二个样对象对应的样本行为信息，y₂为第一个样对象对应的样本流失预警标签；x_n为最后一个样对象对应的样本行为信息，y_n为最后一个样对象对应的样本流失预警标签，每个样本行为信息中有m个特征

每个样本流失预警标签y_i∈{0,1},i＝1,2,…,n。信息处理装置将集合D1按照时间维度进行特征拆分，得到预设时间段(30天)内的第一样本行为信息D2＝{(r₁,y₁),(r₂,y₂),…,(r_n,y_n)}与第二样本行为信息D3＝{t₁,t₂,…,t_n}。其中，集合D2中每一个样本对象对应的样本行为信息中包括p个特征

集合D3中每一个样本对象对应的样本行为信息中包括m-p个特征

信息处理装置先将集合D3的样本行为信息进行归一化处理，然后将归一化样本行为信息输入至初始LSTM模型的输入层(输入层的神经元个数等于输入特征的数量m-p)、隐藏层和输出层。

需要说明的是，在LSTM模型中，隐藏层的神经元数量越多，提取得到的特征越多，从而会导致LSTM过拟合。隐藏层中的神经元数量越少，提取得到的特征越少，会导致LSTM欠拟合。为了提升LSTM模型的训练效果，通过反向传播网络更新隐藏层的神经元数量，得到最优的隐藏层的神经元数量。

在本申请实施例中，初始LSTM模型的输出层输出时序训练信息为D4＝{t′₁,t′₂,…,t′_n}，在初始LSTM模型的输出层有k个神经元的情况下，则集合D4中的每个样本对象有k个特征，每个样本对象对应的k个特征的集合为

在本申请实施例中，信息处理装置将第一样本行为信息(集合D2)与时序训练信息(集合D4)按列进行拼接，得到样本拼接信息，即集合D5＝{(x′₁,y₁),(x′₂,y₂),…,(x′_n,y_n)}，在样本拼接信息中的每个样本对象有p+k个特征，每个样本对象对应的p+k个特征的集合为

需要说明的是，信息处理装置中的第二层网络由多个初始流失预警模型(三个二分类子模型)构成，其中，多个初始流失预警模型包括：第一初始流失预警模型(XGBoost二分类模型)、第二初始流失预警模型(CatBoost二分类模型)以及第三初始流失预警模型(LightGBM二分类模型)。信息处理装置先初始化各子模型(多个初始流失预警模型)的模型参数，例如树的深度、学习率、迭代次数等，设置各子模型的参数候选集，然后将样本拼接信息(集合D5)分别输入多个初始流失预警模型中，采用K折交叉验证训练多个初始流失预警模型(K的值可以为5)。若样本拼接信息(集合D5)在第一初始流失预警模型中经过5折交叉验证训练得到预测结果(第一训练标签)为xgb_proba＝{xgb_y₁,xgb_y₂,…,xgb_y_n}^T，样本拼接信息在第二初始流失预警模型中经过5折交叉验证训练得到预测结果(第二训练标签)为catb_proba＝{catb_y₁,catb_y₂,…,catb_y_n}^T，样本拼接信息在第三初始流失预警模型中经过5折交叉验证训练得到预测结果(第三训练标签)为lgb_proba＝{lgb_y₁,lgb_y₂,…,lgb_y_n}^T。

在本申请实施例中，信息处理装置将第一训练标签、第二训练标签和第三训练标签进行合并(拼接)，合并(拼接)过程如公式(3)所示：

combine_proba＝concat([xgb_proba,catb_proba,lgb_proba],axis＝1) (3)

需要说明的是，concat函数表示对第一训练标签、第二训练标签和第三训练标签进行拼接，参数aixs为1表示按列进行拼接。则，公式(3)的拼接结果如公式(4)所示：

在本申请实施例中，信息处理装置中的第三层网络为流失预警融合模型(LR模型)，用于次层元学习器，属于有监督学习模型。信息处理装置利用concat函数将combine_proba与样本流失预警标签进行按列拼接，得到LR模型的输入信息，即集合D6＝{(combine_proba₁,y₁),(combine_proba₂,y₂)…,(combine_proba_n,y_n)}，其中，LR模型的输入信息集合中的每个样本包括3个特征，即combine_proba_i＝{xgb_y_i,catb_y_i,lgb_y_i},i＝1,2,…,n。

在本申请实施例中，信息处理装置初始化初始流失预警融合模型(初始LR模型)的模型参数，包括初始LR模型的迭代次数、L1正则、L2正则等参数，将集合D6输入到LR模型中进行训练，可以得到训练模型lr_model。信息处理装置剔除集合D6中的样本流失预警标签可以得到集合D7＝{combine_proba₁,combine_proba₂,…,combine_proba_n}。信息处理装置将集合D7再次输入至lr_model中，利用训练模型lr_mode输出预测结果lr_proba＝{lr_y₁,lr_y₂,…,lr_y_n}^T。

在本申请实施例中，信息处理装置选取交叉熵损失函数作为流失预警融合模型的损失函数，损失函数如公式(5)所示：

需要说明的是，公式(5)中的

是训练模型lr_mode输出预测结果(输出的流失预警概率)，y是样本流失预警标签。通过公式(5)来计算预测结果lr_proba的损失值。

在本申请实施例中，信息处理装置通过反向传播网络对初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的模型参数进行更新，提升初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的最终预测结果的准确性。反向传播网络中更新模型参数的方式如公式(6)所示：

需要说明的是，updated函数为对初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的模型参数进行更新操作，调整模型参数的取值。

在本申请实施例中，信息处理装置通过确定流失预警融合模型的损失函数，可以得到初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的训练效果，初始化损失值为inf。信息处理装置通过设计的反向传播网络，更新初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型对应的模型参数，直至损失函数的损失值小于或者等于预设模型损失阈值，初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的模型参数更新的过程如公式(7)所示：

需要说明的是，model_params为模型参数的集合，loss_value为模型损失函数的损失值，threshold为模型参数需要更新的阈值，可以初始化为inf。

可以理解的是，通过设置多个初始流失预警模型，将样本拼接信息分别输入第一初始流失预警模型、第二初始流失预警模型和第三初始流失预警模型，以对第一初始流失预警模型、第二初始流失预警模型和第三初始流失预警模型分别进行训练，以在不同特征维度的侧重点上训练流失预警模型，得到第一流失预警模型、第二失预警模型和第三流失预警模型，使得信息处理装置可以利用第一流失预警模型、第二失预警模型和第三流失预警模型获预测出待预测对象在不同特征维度上对应的流失预警概率，从而实现在多个侧重点上同时判断待预测对象是否会流失，提高了流失预警时的准确性。

S103、利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率，多个融合系数与多个流失预警模型一一对应。

在本申请实施例中，信息处理装置将历史行为信息分别输入多个流失预警模型，得到多个流失预警概率之后，信息处理装置就可以利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率。

需要说明的是，多个融合系数与多个流失预警模型一一对应，即一个融合系数对应一个流失预警模型。

在本申请实施例中，信息处理装置利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率的过程，可以为信息处理装置分别确定多个融合系数与多个流失预警概率之间的乘积，得到多个乘积；信息处理装置确定多个乘积之间的和，从而得到目标流失预警概率。

需要说明的是，多个融合系数、多个流失预警概率和多个乘积一一对应，即一个融合系数对应一个流失预警概率，对应一个乘积。

示例性的，多个融合系数中的第一个融合系数可以为0.2；第二个融合系数可以为0.3；第三个融合系数可以为0.5；多个流失预警概率可以中的第一个流失预警概率为0.8；第二个流失预警概率为0.9；第三个流失预警概率为0.7；则信息处理装置确定第一个融合系数0.2与第一个流失预警概率0.8之间的第一乘积为0.16；信息处理装置确定第二个融合系数0.3与第二个流失预警概率0.9之间的第二乘积为0.27；信息处理装置确定第三个融合系数0.5与第三个流失预警概率0.7之间的第三乘积为0.35；信息处理装置确定第一乘积0.16、第二乘积0.27和第三乘积为0.35之间的和，从而得到目标流失预警概率为0.78。

示例性的，如图2所示：信息处理装置从样本行为信息(x₁,x₂,…,x_n)中获取得到样本对象在预设时间段内的第一样本行为信息(r₁,r₂,…,r_n)和第二样本行为信息(t₁,t₂,…,t_n)；信息处理装置利用初始时序特征提取模型(初始LSTM神经网络)从第二样本行为信息中筛选时序训练信息(t′₁,t′₂,…,t′_n)；并将第一样本行为信息和时序训练信息进行拼接，得到样本拼接信息(x′₁,x′₂,…,x′_n)；信息处理装置将样本拼接信息分别输入多个初始流失预警模型(XGBoost Classifier、CatBoost Classifier以及LightGBM Classifier)，经过K折交叉验证训练得到多个训练流失预警标签(第一训练标签xgb_proba＝{xgb_y₁,xgb_y₂,…,xgb_y_n}^T，第二训练标签catb_proba＝{catb_y₁,catb_y₂,…,catb_y_n}^T，第三训练标签lgb_proba＝{lgb_y₁,lgb_y₂,…,lgb_y_n}^T，信息处理装置将第一训练标签、第二训练标签和第三训练标签合并(合并预测结果)，得到多个训练流失预警标签)；信息处理装置将样本流失预警标签和多个训练流失预警标签输入初始流失预警融合模型(LogisticRegression)，得到训练预测结果(lr_proba)；并根据训练预测结果和样本流失预警标签确定初始流失预警融合模型的模型损失(Loss Function)；信息处理装置在模型损失大于或者等于预设模型损失阈值的情况下，调整初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型的模型参数；并利用样本行为信息和样本流失预警标签继续训练调整模型参数后的初始时序特征提取模型、调整模型参数后的多个初始流失预警模型和调整模型参数后的初始流失预警融合模型，直至得到时序特征提取模型、多个流失预警模型和流失预警融合模型。

示例性的，如图3所示：信息处理装置先从数据库中采集样本对象对应的原始样本行为信息(数据集)，信息处理装置再对原始样本行为信息进行数据清洗(将原始样本行为信息中的特征缺失率大于或者等于预设缺失率阈值行为信息剔除)；信息处理装置对剔除后的原始样本行为信息进行特征筛选处理(特征工程)，得到样本行为信息；信息处理装置利用样本行为信息和样本流失预警标签训练初始模型(初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型)，得到模型(时序特征提取模型、多个流失预警模型和流失预警融合模型)。之后，信息处理装置就可以根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；将历史行为信息输入时序特征提取模型、多个流失预警模型和流失预警融合模型，利用时序特征提取模型、多个流失预警模型和流失预警融合模型预测待预测对象对应的目标流失预警概率(模型结果)。

示例性的，如图4所示：信息处理装置从数据库中采集待预测对象的原始历史行为信息(数据采集)；信息处理装置从原始历史行为信息中剔除行为特征缺失率大于或者等于预设缺失率阈值的行为信息(数据清洗)，得到剔除后的行为信息；信息处理装置在确定出剔除后的行为信息中存在缺失特征的情况下，利用预设特征对剔除后的行为信息中的缺失特征进行填充处理(缺失值填充)，得到填充后的行为信息；信息处理装置对填充后的行为信息进行时序衍生处理(特征衍生)，得到衍生后的行为信息；信息处理装置从衍生后的行为信息中筛选出特征稳定性大于或者等于预设稳定性阈值的稳定行为信息；信息处理装置从稳定行为信息中剔除相关系数大于或者等于预设相关阈值的行为信息，得到历史行为信息(特征筛选后得到历史行为信息)；信息处理装置利用时序特征提取模型对历史行为信息中的第二行为信息进行时序特征提取，得到时序信息；信息处理装置将第一行为信息和时序信息进行拼接，得到拼接行为信息；信息处理装置将拼接行为信息分别输入多个流失预警模型(第一流失预警模型、第二流失预警模型和第三流失预警模型)中，得到多个流失预警概率，信息处理装置利用流失预警融合模型中的多个融合系数对多个流失预警概率进行融合处理，得到待预测对象对应的目标流失预警概率。

可以理解的是，信息处理装置利用多个流失预警模型对待预测对象对应的历史行为信息进行预测，以在不同特征维度的侧重点上预测出待预测对象对应的流失预警概率，再利用流失预警融合模型针对多个流失预警概率分配不同的注意力，并基于注意力将不同侧重点的多个流失预警概率进行融合，从而实现在多个侧重点上同时判断待预测对象是否会流失，提高了流失预警的准确性。

实施例二

基于实施例一同一发明构思，本申请实施例提供了一种信息处理装置1，对应于一种信息处理方法；图5为本申请实施例提供的一种信息处理装置的组成结构示意图一，该信息处理装置1可以包括：

生成单元11，用于根据获取到的待预测对象的原始历史行为信息，生成历史行为信息；

输入单元12，用于将所述历史行为信息分别输入多个流失预警模型，得到多个流失预警概率；所述多个流失预警模型在预测流失预警概率时所侧重的特征维度不同；

融合单元13，用于利用流失预警融合模型中的多个融合系数对所述多个流失预警概率进行融合处理，得到所述待预测对象对应的目标流失预警概率，所述多个融合系数与所述多个流失预警模型一一对应。

在本申请的一些实施例中，所述装置还包括获取单元和拼接单元；

所述获取单元，用于从所述历史行为信息中获取待预测对象在预设时间段内的第一行为信息和第二行为信息；所述第二行为信息为所述历史行为信息中除所述第一行为信息外的、且在所述第一行为信息之前生成的行为信息；

所述输入单元12，用于将所述第二行为信息输入时序特征提取模型中，得到时序信息；将所述拼接行为信息分别输入所述多个流失预警模型中，得到所述多个流失预警概率；

所述拼接单元，用于将所述第一行为信息和所述时序信息进行拼接，得到拼接行为信息。

在本申请的一些实施例中，所述装置还包括训练单元；

所述获取单元，用于获取样本对象对应的样本行为信息以及所述样本对象对应的样本流失预警标签；

所述训练单元，用于利用所述样本行为信息和所述样本流失预警标签训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、所述多个流失预警模型和所述流失预警融合模型。

在本申请的一些实施例中，所述装置还包括筛选单元、确定单元和调整单元；

所述获取单元，用于从所述样本行为信息中获取得到样本对象在预设时间段内的第一样本行为信息和第二样本行为信息；

所述筛选单元，用于利用所述初始时序特征提取模型从所述第二样本行为信息中筛选时序训练信息；

所述拼接单元，用于将所述第一样本行为信息和所述时序训练信息进行拼接，得到样本拼接信息；

所述输入单元12，用于将所述样本拼接信息分别输入所述多个初始流失预警模型，得到多个训练流失预警标签；将所述样本流失预警标签和所述多个训练流失预警标签输入所述初始流失预警融合模型，得到训练预测结果；

所述确定单元，用于根据所述训练预测结果和所述样本流失预警标签确定所述初始流失预警融合模型的模型损失；

所述调整单元，用于在所述模型损失大于或者等于预设模型损失阈值的情况下，调整所述初始时序特征提取模型、所述多个初始流失预警模型和初始流失预警融合模型的模型参数；

所述训练单元，用于利用所述样本行为信息和所述样本流失预警标签继续训练调整模型参数后的初始时序特征提取模型、调整模型参数后的多个初始流失预警模型和调整模型参数后的初始流失预警融合模型，直至得到所述时序特征提取模型、所述多个流失预警模型和所述流失预警融合模型。

在本申请的一些实施例中，所述初始流失预警模型包括第一初始流失预警模型、第二初始流失预警模型和第三初始流失预警模型；

所述输入单元12，用于将所述样本拼接信息输入所述第一初始流失预警模型，得到第一训练标签；将所述样本拼接信息输入所述第二初始流失预警模型，得到第二训练标签；将所述样本拼接信息输入所述第三初始流失预警模型，得到第三训练标签；

所述拼接单元，用于将所述第一训练标签、所述第二训练标签和所述第三训练标签进行拼接，得到所述多个训练流失预警标签。

在本申请的一些实施例中，所述装置还包括剔除单元；

所述剔除单元，用于从所述原始历史行为信息中剔除行为特征缺失率大于或者等于预设缺失率阈值的行为信息，得到剔除后的行为信息；

所述筛选单元，用于对所述剔除后的行为信息进行特征筛选处理，得到所述历史行为信息。

在本申请的一些实施例中，所述装置还包括处理单元；

所述处理单元，用于对所述剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息；

所述筛选单元，用于从所述衍生后的行为信息中筛选出特征稳定性大于或者等于预设稳定性阈值的稳定行为信息；

所述剔除单元，用于从所述稳定行为信息中剔除相关系数大于或者等于预设相关阈值的行为信息，得到所述历史行为信息。

在本申请的一些实施例中，所述装置还包括填充单元；

所述填充单元，用于在所述剔除后的行为信息中存在缺失特征的情况下，利用预设特征对所述剔除后的行为信息中的缺失特征进行填充处理，得到填充后的行为信息；

所述处理单元，用于在所述剔除后的行为信息中不存在缺失特征的情况下，对所述剔除后的行为信息进行时序衍生处理，得到所述衍生后的行为信息；对所述填充后的行为信息进行时序衍生处理，得到所述衍生后的行为信息。

需要说明的是，在实际应用中，上述生成单元11、输入单元12和融合单元13可由信息处理装置1上的处理器14实现，具体为CPU(Central Processing Unit，中央处理器)、MPU(Microprocessor Unit，微处理器)、DSP(Digital Signal Processing，数字信号处理器)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等实现；上述数据存储可由信息处理装置1上的存储器15实现。

本申请实施例还提供了一种信息处理装置1，如图6所示，所述信息处理装置1包括：处理器14、存储器15和通信总线16，所述存储器15通过所述通信总线16与所述处理器14进行通信，所述存储器15存储所述处理器14可执行的程序，当所述程序被执行时，通过所述处理器14执行如上述所述的信息处理方法。

在实际应用中，上述存储器15可以是易失性存储器(volatile memory)，例如随机存取存储器(Random-Access Memory，RAM)；或者非易失性存储器(non-volatile memory)，例如只读存储器(Read-Only Memory，ROM)，快闪存储器(flash memory)，硬盘(Hard DiskDrive，HDD)或固态硬盘(Solid-State Drive，SSD)；或者上述种类的存储器的组合，并向处理器14提供指令和数据。

本申请实施例提供了一种计算机可读存储介质，其上有计算机程序，所述程序被处理器14执行时实现如上述所述的信息处理方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述历史行为信息分别输入多个流失预警模型，得到多个流失预警概率，包括：

从所述历史行为信息中获取待预测对象在预设时间段内的第一行为信息和第二行为信息；所述第二行为信息为所述历史行为信息中除所述第一行为信息外的、且在所述第一行为信息之前生成的行为信息；

将所述第二行为信息输入时序特征提取模型中，得到时序信息；

将所述第一行为信息和所述时序信息进行拼接，得到拼接行为信息；

将所述拼接行为信息分别输入所述多个流失预警模型中，得到所述多个流失预警概率。

3.根据权利要求1所述的方法，其特征在于，所述将所述历史行为信息分别输入多个流失预警模型，得到多个流失预警概率之前，所述方法还包括：

获取样本对象对应的样本行为信息以及所述样本对象对应的样本流失预警标签；

利用所述样本行为信息和所述样本流失预警标签训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、所述多个流失预警模型和所述流失预警融合模型。

4.根据权利要求3所述的方法，其特征在于，所述利用所述样本行为信息和所述样本流失预警标签训练初始时序特征提取模型、多个初始流失预警模型和初始流失预警融合模型，得到时序特征提取模型、所述多个流失预警模型和所述流失预警融合模型，包括：

从所述样本行为信息中获取得到样本对象在预设时间段内的第一样本行为信息和第二样本行为信息；

利用所述初始时序特征提取模型从所述第二样本行为信息中筛选时序训练信息；并将所述第一样本行为信息和所述时序训练信息进行拼接，得到样本拼接信息；

将所述样本拼接信息分别输入所述多个初始流失预警模型，得到多个训练流失预警标签；

将所述样本流失预警标签和所述多个训练流失预警标签输入所述初始流失预警融合模型，得到训练预测结果；并根据所述训练预测结果和所述样本流失预警标签确定所述初始流失预警融合模型的模型损失；

在所述模型损失大于或者等于预设模型损失阈值的情况下，调整所述初始时序特征提取模型、所述多个初始流失预警模型和初始流失预警融合模型的模型参数；并利用所述样本行为信息和所述样本流失预警标签继续训练调整模型参数后的初始时序特征提取模型、调整模型参数后的多个初始流失预警模型和调整模型参数后的初始流失预警融合模型，直至得到所述时序特征提取模型、所述多个流失预警模型和所述流失预警融合模型。

5.根据权利要求4所述的方法，其特征在于，所述多个初始流失预警模型包括第一初始流失预警模型、第二初始流失预警模型和第三初始流失预警模型，所述将所述样本拼接信息分别输入所述多个初始流失预警模型，得到多个训练流失预警标签，包括：

将所述样本拼接信息输入所述第一初始流失预警模型，得到第一训练标签；

将所述样本拼接信息输入所述第二初始流失预警模型，得到第二训练标签；

将所述样本拼接信息输入所述第三初始流失预警模型，得到第三训练标签；

将所述第一训练标签、所述第二训练标签和所述第三训练标签进行拼接，得到所述多个训练流失预警标签。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述根据获取到的待预测对象的原始历史行为信息，生成历史行为信息，包括：

从所述原始历史行为信息中剔除行为特征缺失率大于或者等于预设缺失率阈值的行为信息，得到剔除后的行为信息；

对所述剔除后的行为信息进行特征筛选处理，得到所述历史行为信息。

7.根据权利要求6所述的方法，其特征在于，所述对所述剔除后的行为信息进行特征筛选处理，得到所述历史行为信息，包括：

对所述剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息；

从所述衍生后的行为信息中筛选出特征稳定性大于或者等于预设稳定性阈值的稳定行为信息；

从所述稳定行为信息中剔除相关系数大于或者等于预设相关阈值的行为信息，得到所述历史行为信息。

8.根据权利要求7所述的方法，其特征在于，所述对所述剔除后的行为信息进行时序衍生处理，得到衍生后的行为信息，包括：

在所述剔除后的行为信息中不存在缺失特征的情况下，对所述剔除后的行为信息进行时序衍生处理，得到所述衍生后的行为信息；

在所述剔除后的行为信息中存在缺失特征的情况下，利用预设特征对所述剔除后的行为信息中的缺失特征进行填充处理，得到填充后的行为信息；

对所述填充后的行为信息进行时序衍生处理，得到所述衍生后的行为信息。

9.一种信息处理装置，其特征在于，所述装置包括：

10.一种信息处理装置，其特征在于，所述装置包括：

存储器、处理器和通信总线，所述存储器通过所述通信总线与所述处理器进行通信，所述存储器存储所述处理器可执行的信息处理的程序，当所述信息处理的程序被执行时，通过所述处理器执行如权利要求1至8任一项所述的方法。

11.一种存储介质，其上存储有计算机程序，应用于信息处理装置，其特征在于，该计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。