CN113537616A

CN113537616A - 账户预测模型的训练方法、装置、电子设备及存储介质

Info

Publication number: CN113537616A
Application number: CN202110858237.3A
Authority: CN
Inventors: 林静虹; 赖相宇; 季鸫; 叶智字
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-28
Filing date: 2021-07-28
Publication date: 2021-10-22

Abstract

本公开涉及计算机技术领域，特别涉及账户预测模型的训练方法、装置、电子设备及存储介质，用于解决已有技术下对交易账户进行预测获得的预测结果的准确率低下的问题。该方法为：获取待预测账户相关联的账户数据对应的特征信息，其中，特征信息表征待预测账户的指定属性在预设时间范围内的变化状态；预设时间范围是基于待预测账户执行变更绑定操作对应的基准时间点确定的，并将特征信息输入目标账户预测模型中，得到待预测账户对应的目标账户预测结果；这样，通过已训练好的目标账户预测模型，对针对待预测账户相关联的账户数据对应的特征信息进行预测，提高了目标账户预测结果的准确率。

Description

账户预测模型的训练方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，特别涉及账户预测模型的训练方法、装置、电子设备及存储介质。

背景技术

随着计算机技术产业的发展，网络安全越来越受到大众的重视。各大应用程序平台为了确保注册在本平台中的各个账户是安全的，通常需要识别粉丝量达到一定数量的账户的合法性，以避免通过本平台上的账户发布虚假内容，从而利用该账户的账户资源达到违法违规的目的，其中，涉及发布虚假内容的账户通常被称为交易账户。

已有技术下，通常通过制定一系列的规则实现对上述交易账户进行策略召回，具体的，策略召回通常需要依据历史经验制定上述规则的阈值，再采用制定有阈值的规则从众多粉丝量达到一定数量的账户进行分析，从而获得相应的预测结果，然后对预测出的交易账户实施相应的策略召回，以保证了平台的安全和清洁。

然而，已有技术下，由于依据历史经验制定的规则阈值存在不确定性，基于上述规则的阈值，存在预测出的交易账户的预测结果准确率低下的问题。

因此，需要设计一种新的方法，以解决上述问题。

发明内容

本公开实施例提供账户预测模型的训练方法、装置、电子设备及存储介质，用于解决已有技术下对交易账户进行预测获得的预测结果的准确率低下的问题。

本公开实施例提供的具体技术方案如下：

第一方面，一种账户预测的方法，包括：

获取待预测账户相关联的账户数据对应的特征信息，其中，所述特征信息表征所述待预测账户的指定属性在预设时间范围内的变化状态；所述预设时间范围是基于所述待预测账户执行变更绑定操作对应的基准时间点确定的；

将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果。

可选的，所述特征信息包括第一特征信息和第二特征信息中的任意一种或组合；

当所述特征信息包括第一特征信息时，所述获取待预测账户相关联的账户数据对应的特征信息，包括：

获取所述待预测账户相关联的账户数据对应的第一特征信息，其中，所述第一特征信息表征所述待预测账户在所述预设时间范围内的行为特征信息；

当所述特征信息包括第二特征信息时，所述获取待预测账户相关联的账户数据对应的特征信息，包括：

获取所述待预测账户相关联的账户数据对应的第二特征信息，其中，所述第二特征信息表征所述待预测账户在所述预设时间范围内的社交特征信息。

可选的，所述获取所述待预测账户相关联的账户数据对应的第一特征信息，包括：

获取所述待预测账户相关联的账户数据对应的多媒体文件删除量占比特征信息，其中，所述多媒体文件删除量占比特征信息表征所述基准时间点后的多媒体文件数量的减少量，与所述基准时间点前的多媒体文件数量的比值；

获取所述待预测账户相关联的账户数据对应的多媒体文件关联内容变更特征信息，其中，所述多媒体文件关联内容变更特征信息表征所述基准时间点后的多媒体文件的关联内容，与所述基准时间点后的多媒体文件的关联内容之间的第一变化量；

获取所述待预测账户相关联的账户数据对应的登录信息变更特征信息，其中，所述登录信息变更特征信息表征所述基准时间点后的登录信息，与所述基准时间点前的登录信息之间的第二变化量；

获取所述待预测账户相关联的账户数据对应的用户信息变更特征信息；其中，所述用户信息变更特征信息表征所述基准时间点后的用户信息，与所述基准时间点后的用户信息之间的第三变化量；

将多媒体文件删除量占比特征信息、多媒体文件关联内容变更特征信息、登录信息变更特征信息，以及用户信息变更特征信息中的任意一种或组合，作为所述第一特征信息。

可选的，所述获取所述待预测账户相关联的账户数据对应的第二特征信息，包括：

获取所述待预测账户相关联的账户数据对应的被关注量降低特征信息，其中，所述被关注量降低特征信息表征在所述基准时间点后的被关注量的降低程度；

将所述被关注量降低特征信息，作为所述待预测账户的第二特征信息。

可选的，所述目标账户预测模型是采用以下方式训练的：

基于训练样本集合对待训练的账户预测模型进行多轮迭代训练，直至满足预设的收敛条件为止，并将最后一轮输出的账户预测模型作为目标账户预测模型，其中，在一轮迭代训练过程中，执行以下操作：

将从所述训练样本集合中获取的各个训练样本各自对应的特征信息，分别输入所述账户预测模型，得到对应所述各个训练样本输出的账户预测结果；

基于所述对应所述各个训练样本输出的账户预测结果，与各自对应的样本标签的比对结果，确定损失值；

基于所述损失值，对所述账户预测模型的模型参数进行调整。

可选的，当采用多个训练样本集合时，则基于所述多个训练样本集合，分别对多个待训练的账户预测模型进行训练，得到多个目标账户预测模型。

可选的，所述将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果，包括：

分别将所述特征信息输入所述多个目标账户预测模型中，得到各自对应的账户预测结果；

将得到的所述各自对应的账户预测结果进行相应整合，确定所述待预测账户的目标账户预测结果。

第二方面，一种账户预测的装置，包括：

获取单元，用于获取待预测账户相关联的账户数据对应的特征信息，其中，所述特征信息表征所述待预测账户的指定属性在预设时间范围内的变化状态；所述预设时间范围是基于所述待预测账户执行变更绑定操作对应的基准时间点确定的；

得到单元，用于将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果。

可选的，所述获取所述待预测账户相关联的账户数据对应的第一特征信息，所述获取单元用于：

可选的，所述获取所述待预测账户相关联的账户数据对应的第二特征信息，所述获取单元用于：

可选的，所述目标账户预测模型是采用以下方式训练的：

可选的，所述将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果，所述得到单元用于：

第三方面，一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行所述存储器中存储的可执行指令，以实现上述第一方面中任一项所述的方法。

第四方面，一种计算机可读存储介质，当所述计算机可读存储介质中的指令由处理器执行时，使得所述处理器能够执行上述第一方面中任一项所述的方法。

第五方面，一种计算机程序产品，包含可执行指令，当所述计算机程序产品的可执行指令由处理器执行时，能够实现上述第一方面中任一项所述的方法。

本公开实施例中，获取待预测账户相关联的账户数据对应的特征信息，其中，特征信息表征待预测账户的指定属性在预设时间范围内的变化状态；预设时间范围是基于待预测账户执行变更绑定操作对应的基准时间点确定的，并将特征信息输入目标账户预测模型中，得到待预测账户对应的目标账户预测结果；这样，由于目标账户预测模型是基于从各个训练样本中获取各自对应的特征信息，以及各自对应的样本标签训练得到的，因此，目标账户预测模型中已确定了特征信息的最佳规则阈值，那么，通过已训练好的目标账户预测模型，对针对待预测账户相关联的账户数据对应的特征信息进行预测，提高了目标账户预测结果的准确率，也解决了已有技术下基于历史经验制定规定阈值存在的不确定性和准确率低下的问题。

附图说明

图1、图2、图3、图4、图5为本公开实施例中一种构建训练样本集合的一种应用场景的示意图；

图6本公开实施例中账户预测模型的训练过程的示意图；

图7为本公开实施例中对待预测账户进行账户预测的流程示意图；

图8为本公开实施例中基于目标账户预测模型进行账户预测应用场景的示意图；

图9为本公开实施例中账户预测装置的逻辑架构示意图；

图10为本公开实施例中账户预测装置的实体架构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开技术方案的一部分实施例，而不是全部的实施例。基于本公开文件中记载的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开技术方案保护的范围。

本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够在除了这里图示或描述的那些以外的顺序实施。

为了解决已有技术下对交易账户进行预测获得的预测结果的准确率低下的问题，本公开实施例中，获取待预测账户相关联的账户数据对应的特征信息，其中，特征信息表征待预测账户的指定属性在预设时间范围内的变化状态；预设时间范围是基于待预测账户执行变更绑定操作对应的基准时间点确定的，并将特征信息输入目标账户预测模型中，从而准确得到待预测账户对应的目标账户预测结果。

下面结合附图对本公开优选的实施方式做出进一步详细说明，应当理解，此处所描述的优选实施例仅用于说明和解释本申请，并不用于限定本公开，并且在不冲突的情况下，本公开实施例及实施例中的特征可以相互组合。

本公开实施例中，可以选择性地基于梯度提升决策树(Gradient Boost DecisionTree，GBDT)搭建待训练的账户预测模型，在对账户预测模型进行迭代训练后，获得训练完毕的目标账户预测模型。

下面对本公开实施例中，对账户预测模型进行训练的流程进行说明。

本公开实施例中，首先，需要预先建立一个训练样本集合，训练样本集合中海量的各个账户数据，记为各个训练样本，其中，每个训练样本均携带有用于区分各自训练样本是否为待召回交易账户的样本标签。

可选的，携带的样本标签表征为待召回交易账户的，记为正训练样本，如，样本标签为“1”，该正训练样本是经周期性人工标注方式收集的；携带的样本标签表征为非待召回交易账户的，记为正训练样本，如，样本标签为“0”，该负训练样本是经认证的各个账户数据。

然后，对训练样本集合中的各个训练样本进行预处理，具体的，针对训练样本集合中的各个训练样本，分别执行以下操作：

操作一，基于训练样本集合中的各个训练样本中的一个训练样本，获取一个训练样本相关联的账户数据对应的特征信息，其中，特征信息表征一个训练样本的指定属性在预设时间范围内的变化状态；预设时间范围时基于一个训练样本执行变更绑定操作对应的基准时间点确定的。

本公开实施例中，特征信息包括第一特征信息和第二特征信息中的任意一种或组合，则本公开实施例中，针对一个训练样本，获取一个训练样本相关联的账户数据对应的特征信息可以包含如下两种情况：

情况一，当上述特征信息包括第一特征信息时，获取一个训练样本相关联的账户数据对应的第一特征信息，其中，第一特征信息表征一个训练样本在预设时间范围内的行为特征信息。

本公开实施例中，通常待召回交易账户在执行变更绑定操作前后，该待召回交易账户对应的账户的行为特征信息会出现巨大反差，那么，通过获取该待预测账户相关联的账户数据对应的第一特征信息，可以准确地对待预测账户进行预测，因此，获取各个训练样本的第一特征信息，并通过获取到的各个第一特征信息，对待训练的账户预测模型进行训练，可以使的获得目标账户预测模型的预测结果更为准确。

具体实施中，一个训练样本的第一特征可以是如下信息中的任意一种或组合：

1、基于针对一个训练样本相关联的账户数据，获取一个训练样本对应的多媒体文件删除量占比特征信息，其中，多媒体文件删除量占比特征信息表征基准时间点后的多媒体文件数量的减少量，与基准时间点前的多媒体文件数量的比值。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，会大量删除原来发布在该待召回交易账户上的多媒体文件，以便抹去原来账户的信息，从而使该待召回交易账户更好地为后续发布虚假内容所使用。

本公开实施例中，获取正训练样本(携带样本标签“1”)相关联的账户数据在变更绑定操作(即，基准时间点)后的多媒体文件数量的减少量，与在变更绑定操作前的多媒体文件数量的比值，从而获取到正训练样本对应的多媒体文件删除量占比特征；相应的，获取负训练样本(携带样本标签“0”)相关联的账户数据在变更绑定操作(即，基准时间点)后的多媒体文件数量的减少量，与在变更绑定操作前的多媒体文件数量的比值，从而获取到负训练样本对应的多媒体文件删除量占比特征。

然后，将获取到的正训练样本(携带样本标签“1”)相关联的账户数据对应的多媒体文件删除量占比特征信息，与获取到的负训练样本(携带样本标签“0”)相关联的账户数据对应的多媒体文件删除量占比特征信息进行比对，可以发现，正训练样本对应的多媒体文件删除量占比特征信息，与负训练样本对应的多媒体文件删除量占比特征信息存在着明显的差异，正训练样本对应的多媒体文件删除量占比要远大于负训练样本对应的多媒体文件删除量占比，正训练样本对应的多媒体文件删除量占比特征信息更具有代表性；因此，可以通过多媒体文件删除量占比特征信息，准确地区分开正训练样本和负训练样本。

例如，参阅图1所示，以正训练样本A_正为例。

假设基于获取的正训练样本A_正的账户数据，获取到在2020年10月8日，正训练样本A_正执行了变更绑定操作。

则以2020年10月8日为基准时间点，获取正训练样本A_正在2020年10月8日一段时间后的多媒体文件数量的减少量，以及在2020年10月8日前的多媒体文件数量。

又假设正训练样本A_正的账户数据，在2020年10月8日后的一周，即2020年10月15日时的多媒体文件数量的减少量达到最大值，如490个，即在2020年10月15日时，正训练样本A_正存储的多媒体文件数量为10个；以及在2020年10月8日前的多媒体文件数量为500个。

则基于基准时间点前的多媒体文件数量的减少量(即，490)，以及基准时间点后的多媒体文件数量(即，500)，获取正训练样本A_正相关联的账户数据对应的多媒体文件删除量占比特征信息，即490/500＝98％。

又例如，参阅图2所示，以负训练样本B_负为例。

假设基于获取的负训练样本B_负的账户数据，未获取到针对负训练样本B_负执行的变更绑定操作。

因此，本公开实施例中，获取到该负训练样本B_负相关联的账户数据对应的多媒体文件删除量占比特征信息，即“0”。

又例如，参阅图3所示，以负训练样本C_负为例。

假设基于获取的负训练样本C_负的账户数据，获取到在2020年8月3日，负训练样本C_负执行了变更绑定操作。

则以2020年8月3日为基准时间点，获取正训练样本C_负在2020年8月3日后一段时间后的多媒体文件数量的减少量，以及在2020年8月3日前的多媒体文件数量。

又假设负训练样本C_负的账户数据，在2020年8月3日后的一周，即2020年8月10日的多媒体文件数量的减少量达到最大值，如18个，即在2020年8月10日时，正训练样本C_负存储的多媒体文件数量为582个；以及在2020年8月10日前的多媒体文件数量为600个。

则基于基准时间点前的多媒体文件数量的减少量(即，18)，以及基准时间点后的多媒体文件数量(即，600)，获取负训练样本C_负相关联的账户数据对应的多媒体文件删除量占比特征信息，即(600-582)/600＝3％。

2、基于针对一个训练样本相关联的账户数据，获取一个训练样本对应的多媒体文件关联内容变更特征信息，其中，多媒体文件关联内容变更特征信息表征基准时间点后的多媒体文件的关联内容，与基准时间点后的多媒体文件的关联内容之间的第一变化量。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，在该待召回交易账户上发布的多媒体文件的关联内容，与执行变更绑定操作前发布的多媒体文件关联内容会大相径庭，因此，基于获取到的多媒体文件关联内容变更特征信息，可以准确确定一个训练样本是否为待召回交易账户。

例如，仍以正训练样本A_正为例。

假设针对正训练样本A_正相关联的账户数据，获取到在2020年10月8日，负训练样本A_正执行了变更绑定操作。

则以2020年10月8日为基准时间点，获取基准时间点后的多媒体文件的关联内容与基准时间点后的多媒体文件的关联内容之间的第一变化量。

又假设基准时间点后的多媒体文件的关联内容为“X品牌大甩卖”，以及基准时间点后的多媒体文件的关联内容为“旅游风景”。

则基于“X品牌大甩卖”与“旅游风景小视频”之间的第一变化量，获取到负训练样本A_正相关联的账户数据对应的多媒体文件关联内容变更特征信息。

可选的，本公开实施例中，可以基于正训练样本A_正在基准时间点前后，发布的多媒体文件的关联内容各自归属的类别的相似度，确定针对正训练样本A_正相关联的账户数据对应的多媒体文件关联内容变更特征信息。

由于“旅游风景”归属于“旅游、休闲”，而“X品牌大甩卖”归属于“商业、促销”，假设上述两个类别的相似度为2％，因此，基于获得的“旅游风景”和“X品牌大甩卖”各自归属的类别的相似度，获取针对正训练样本A_正相关联的账户数据对应的多媒体文件关联内容变更特征信息为2％。

3、基于针对一个训练样本相关联的账户数据，获取一个训练样本对应的登录信息变更特征信息，其中，登录信息变更特征信息表征基准时间点后的登录信息，与基准时间点前的登录信息之间的第二变化量。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，登录信息会出现极大差异，如登录信息从历史存在交易账户概率小的地区，转变为历史存在交易账户概率大的地区，因此，基于获取到的登录信息变更特征信息，可以准确确定一个训练样本是否为待召回交易账户。

例如，参阅图4所示，仍以正训练样本A_正为例。

仍假设基于正训练样本A_正的账户数据，获取到在2020年10月8日，正训练样本A_正执行了变更绑定操作。

则以2020年10月8日为基准时间点，获取到正训练样本A_正在2020年10月8日前的常用登录地址为“北京”，ID 119.22.8.64；以及在2020年10月8日后的常用登录地址为“深圳”，ID 1X.2X.XX.XX”。

由于两个登录地址之间历史存在交易账号的概率较大，则获取正训练样本A_正相关联账户数据的基准时间点后的登录信息，与基准时间点前的登录信息之间的第二变化量，即正训练样本A_正对应的登录信息变更特征信息为1。

4、基于针对一个训练样本相关联的账户数据，获取一个训练样本对应的用户信息变更特征信息；其中，用户信息变更特征信息表征基准时间点后的用户信息，与基准时间点后的用户信息之间的第三变化量。

可选的，可以通过如下用户信息中的任意一种或组合中，获取到一个训练样本在变更绑定操作前后的用户信息的变更情况：

一个训练样本关联的账户的头像；

一个训练样本关联的账户的昵称；

一个训练样本关联的账户的简介；

一个训练样本关联的账户的背景等。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，会变更用户信息，因此，基于提取的用户信息变更特征信息，可以准确确定一个训练样本是否为待召回交易账户。

可选的，本公开实施例中，基于一个训练样本相关联的账户数据，可以采用多种方式获得针对一个训练样本的用户信息变更特征信息，例如，执行变更绑定操作前后，可以基于获得的用户信息之间的相似度，获取针对一个训练样本的用户信息变更特征信息；也可以基于用户信息的关联关系，获取针对一个训练样本的用户信息变更特征信息。

情况二，当上述特征信息包括第二特征信息时，获取一个训练样本相关联的账户数据对应的第二特征信息，其中，第二特征信息表征一个训练样本在预设时间范围内的社交特征信息。

本公开实施例中，通常待召回交易账户在执行变更绑定操作后，该待召回交易账户对应的账户的社交特征信息也会出现巨大反差，那么，通过获取该待预测账户相关联的账户数据对应的第二特征信息，可以准确地对待预测账户进行预测，因此，获取各个训练样本的第二特征信息，并通过获取到的各个第二特征信息，对待训练的账户预测模型进行训练，可以使的获得目标账户预测模型的预测结果也更为准确。

具体实施中，基于一个训练样本相关联的账户数据，获取一个训练样本对应的被关注量降低特征信息，其中，被关注量降低特征信息表征在基准时间点后的被关注量的降低程度。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，被关注量会因发布内容的变更等因素，造成被关注量的大幅下降，因此，基于获取到的被关注量降低特征信息，可以准确确定一个训练样本是否为待召回交易账户。

例如，参阅图5所示，仍以正训练样本A_正为例。

则以2020年10月8日为基准时间点，获取正训练样本A_正在2020年10月8日前的被关注量为2520，以及在2020年10月8日后的被关注量降低为20。

假设在基准时间点后的被关注量的降低程度可以用如下公式计算得到：

(基准时间点前的关注量-基准时间点后的关注量)/基准时间点前的关注量

那么，基于上述公式，获取的正训练样本A_正的被关注量降低特征信息为(2520-20)/2520＝99.2％。

操作二，基于一个训练样本获取的特征信息，为该一个训练样本设置特征向量。

可选的，本公开实施例中，针对训练样本集合中的各个训练样本分别进行上述预处理后，分别获得各个训练样本各自对应的特征信息，以及各个训练样本各自对应的特征向量。

需要说明的是，随着数据处理技术的飞速发展，可以采用已有技术获取到账户数据对应的特征信息，也可以采用新技术获取到账户数据对应的特征信息，本公开实施例中，对基于账户数据，如何获取相应的特征信息不作具体限定。基于本公开文件中记载的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开技术方案保护的范围。

最后，基于各个特征向量，获得用于训练待训练的账户预测模型的训练样本集合。

本公开实施例中，训练样本集合中每个训练样本以一个唯一的特征向量来表征相应的训练样本，即，训练样本集合中包含有海量的特征向量，对应的，每个特征向量表征着一个训练样本。

在获取训练样本集合之后，开始对待训练的账户预测模型进行迭代训练，参阅图6所示，具体的模型训练过程如下：

步骤600：获取训练样本集合。

本公开实施例中，针对上述训练样本集合中的各个训练样本进行预处理后，可以获得用于训练账户预测模型的训练样本集合，在执行步骤600时，获取上述预处理后的训练样本集合。

步骤610：基于训练样本集合对待训练的账户预测模型进行多轮迭代训练，直至满足预设的收敛条件为止，并将最后一轮输出的账户预测模型作为目标账户预测模型，其中，在一轮迭代训练过程中，执行以下操作：

需要说明的是，本公开实施例中，在对待训练的账户预测模型进行训练时，采用训练样本集合中的全部训练样本对待训练的账户预测模型进行训练，称为一轮迭代训练。

在执行步骤610时，通过执行步骤6101-步骤6103实现相关功能。

步骤6101：将从训练样本集合中获取各个训练样本各自对应的特征信息，输入账户预测模型，得到对应各个训练样本输出的账户预测结果。

具体实施中，将训练样本集合中的全部训练样本各自对应的特征向量(每个特征向量表征一个训练样本)，输入待训练的账户预测模型，经过GBDT，建立相应数量的弱模型，其中，每个弱模型的建立都是为了学习前面已建立的弱模型的残差，从而得到对应各个训练样本输出的账户预测结果，即账户预测结果为各个弱模型各自对应的残差的线性组合。

步骤6102：基于对应所述各个训练样本输出的账户预测结果，与各自对应的样本标签的比对结果，确定损失值。

本公开实施例中，由于输入待训练的账户预测模型中的各个训练样本携带有各自的样本标签，因此，通过将各个账户预测结果和各自对应的样本标签做比对，可以确定相应的损失值。

步骤6103：基于损失值，对账户预测模型的模型参数进行调整。

本公开实施例中，执行步骤6102后确定了相应的损失值，那么，基于该损失值，对待训练的账户预测模型的模型参数进行调整，以使待训练的账户预测模型为下一轮迭代训练做准备。具体的，基于损失值，对当前模型中的建立的分类回归树的颗树、阈值分割点等进行相应调整。

步骤620：确定满足预设的收敛条件时，获得目标账户预测模型。

本公开实施例中，按照步骤610描述的迭代训练方式，进行多轮迭代训练，直至满足预设的收敛条件，将最后一轮迭代训练输出的账户预测模型作为目标账户预测模型，其中，预设的收敛条件可以为确定损失值连续低于设定值的次数达到预设门限值。

可选的，预设的收敛条件还可以为输出的账户预测结果的准确率达到预设阈值。

这样，通过对待训练的账户预测模型进行迭代训练，当确定训练中的账户预测模型达到上述预设的收敛条件时，则获得目标账户预测模型，由于目标账户预测模型包含针对特征信息的最佳分割点，因此，再通过目标账户预测模型对待预测账户进行预测，可以得到更为准确的目标预测结果。

本公开实施例中，当采用多个训练样本集合时，基于多个训练样本集合，分别对多个待训练的账户预测模型进行训练，得到多个目标账户预测模型。

为了得到更为准确的目标账户预测结果，可以采用上述迭代训练的方式，通过多个训练样本集合，分别对待训练的多个账户预测模型进行并行训练，从而得到多个目标账户预测模型，然后，将待预测账户相关联的账户数据对应的特征信息，分别输入上述多个目标账户预测模型中，获得多个目标预设结果，并将获得多个目标预测结果进行相应整合，如线性组合等，可以得到更具鲁棒性的账户预测结果。

本公开实施例中，参阅图7所示，对待预测账户进行账户预测的具体流程如下：

步骤700：获取待预测账户相关联的账户数据对应的特征信息，其中，特征信息表征待预测账户的指定属性在预设时间范围内的变化状态；预设时间范围是基于待预测账户执行变更绑定操作对应的基准时间点确定的。

本公开实施例中，在执行步骤700时，需要先确定待预测账户执行了变更绑定操作，然后，以执行变更绑定操作对应的时间为基准时间点，确定预设时间范围，再获取待预测账户的指定属性在预设时间范围内的变化状态，从而获取到待预测账户相关联的账户数据对应的特征信息。

可选的，本公开实施例中，上述特征信息包括第一特征信息和第二特征信息中的任意一种或组合。

具体实施中，执行步骤700时，获取待预测账户的特征信息包含但不限于以下两种方式：

方式一，当特征信息包括第一特征信息时，获取待预测账户相关联的账户数据对应的第一特征信息，其中，第一特征信息表征待预测账户在所述预设时间范围内的行为特征信息。

具体的，本公开实施例中，待预测账户相关联的账户数据对应的第一特征信息，可以通过执行如下操作获取：

操作1，获取待预测账户相关联的账户数据对应的多媒体文件删除量占比特征信息，其中，多媒体文件删除量占比特征信息表征基准时间点后的多媒体文件数量的减少量，与基准时间点前的多媒体文件数量的比值。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，会大量删除原来发布在该待召回交易账户上的多媒体文件，以便抹去原来账户的信息，以使该待召回交易账户更好地为后续发布虚假内容所使用。因此，获取待预测账户相关联的账户数据对应的多媒体文件删除量占比特征信息，可以准确地预测出该待预测账户是否为待召回交易账户。

操作2，获取待预测账户相关联的账户数据对应的多媒体文件关联内容变更特征信息，其中，多媒体文件关联内容变更特征信息表征基准时间点后的多媒体文件的关联内容，与基准时间点后的多媒体文件的关联内容之间的第一变化量。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，在该待召回交易账户上发布的多媒体文件的关联内容，与执行变更绑定操作前发布的多媒体文件关联内容会大相径庭，因此，获取待预测账户在预设时间范围内的多媒体文件关联内容变更特征信息，并基于该多媒体文件关联内容变更特征信息，可以准确地预测出该待预测账户是否为待召回交易账户。

操作3，获取待预测账户相关联的账户数据对应的登录信息变更特征信息，其中，登录信息变更特征信息表征基准时间点后的登录信息，与基准时间点前的登录信息之间的第二变化量。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，登录信息会出现极大差异，例如，在执行变更绑定操作之前，登录地址为“北京”，而在执行变更绑定操作之后，登录地址转变历史存在交易账号概率较大的“深圳”；因此，获取待预测账户相关联的账户数据在预设时间范围内对应的登录信息变更特征信息，并基于该登录信息变更特征信息，可以准确地预测出该待预测账户是否为待召回交易账户。

操作4，获取待预测账户相关联的账户数据对应的用户信息变更特征信息，其中，用户信息变更特征信息表征基准时间点后的用户信息，与基准时间点后的用户信息之间的第三变化量。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，会变更用户信息，例如，在执行变更绑定操作之前，用户信息中头像为“小兔子”，而在执行变更绑定操作之后，用户信息中头像转变为“大促销”等带有夸张、引诱性的图片或/和语句；因此，获取待预测账户相关联的账户数据在预设时间范围内的用户信息变更特征信息，并基于该用户信息变更特征信息，可以准确地预测出该待预测账户是否为待召回交易账户。

操作5，将多媒体文件删除量占比特征信息、多媒体文件关联内容变更特征信息、登录信息变更特征信息，以及用户信息变更特征信息中的任意一个或组合，作为待预测账户的第一特征。

本公开实施例中，将从待预测账户相关联的账户数据中，获取出的多媒体文件删除量占比特征信息、多媒体文件关联内容变更特征信息、登录信息变更特征，以及用户信息变更特征中的任意一种或组合，作为第一特征信息。由于上述第一特征信息，可以反映该待预测账户的指定属性在预设时间范围内的变化状态，并且上述变化状态可以准确反映该待预测账户是否为待召回交易账户，因此，获取第一特征信息，并基于第一特征信息进行预测，可以得到针对该待预测账户的目标预测结果，从而准确地预测出该待预测账户是否为待召回交易账户。

方式二，当特征信息包括第二特征信息时，获取待预测账户相关联的账户数据对应的第二特征信息，其中，第二特征信息表征待预测账户在所述预设时间范围内的社交特征信息。

本公开实施例中，通过执行如下操作，获取待预测账户对应的第二特征：

操作1，获取待预测账户相关联的账户数据对应的被关注量降低特征信息，其中，被关注量降低特征信息表征在基准时间点后的被关注量的降低程度。

需要说明的是，本公开实施例中，通常待召回交易账户在执行变更绑定操作后，被关注量会因发布内容的变更等因素，造成被关注量的大幅下降，例如，在执行变更绑定操作之前，该待预测账户的被关注量为2000，而在执行变更绑定操作之后，待预测账户的被关注量会在短时间内降为20；因此，获取待预测账户在预设时间范围内的被关注量降低特征信息，并基于该被关注量降低特征信息，可以准确地预测出该待预测账户是否为待召回交易账户。

操作2，将被关注量降低特征信息，作为待预测账户的第二特征信息。

本公开实施例中，将从待预测账户相关联的账户数据中，获取出的被关注量降低特征信息作为第二特征信息。由于上述第二特征信息，可以反映该待预测账户的指定属性在预设时间范围内的变化状态，并且上述变化状态可以准确反映该待预测账户是否为待召回交易账户，因此，获取第二特征信息，并基于第二特征信息进行预测，可以得到针对该待预测账户的目标预测结果，从而准确地预测出该待预测账户是否为待召回交易账户。

步骤710：将特征信息输入目标账户预测模型中，得到待预测账户对应的目标账户预测结果。

本公开实施例中，在执行步骤700时，可以获取到待预测账户的特征信息，然后，经上述特征信息输入到已训练完毕的目标账户预测模型中，基于目标账户预测模型的输出结果，可以准确获得针对待预测账户的目标账户预测结果，从而基于目标账户预测结果，确定该待预测账户是否为待召回交易账户，进而确定是否实施相应的策略召回，以保障平台的安全和清洁。

例如，参阅图8所示，以待预测账户为账户A为例。

假设账户A在2021年2月10日执行了变更绑定操作，以及预设时间范围为以2021年2月10日为基准时间点的前后一个月时间内。

那么，获取账户A在预设时间范围内的账户数据对应的特征信息，即获取账户A在以2021年2月10日为基准的前后一个月时间内产生的账户数据对应的特征信息。

又假设获取到的账户A在预设时间范围内的特征信息：{多媒体文件删除量占比特征信息(72％)，登录信息变更特征信息(1)，被关注量降低特征信息(99％)}。

则账户A对应的特征向量，记为[72％，1，99％]。

再将上述账户A的特征向量，输入到目标账户预测模型中，得到针对账户A的目标账户预测结果，如账户A得到的目标账户预测结果为：账户A为待召回交易账户的概率为80％。

可选的，在进行模型训练时，可以基于多个训练样本集合，获得多个目标账户预测模型，然后，将上述待预测账户相关联的账户数据对应的特征信息，分别输入多个目标账户预测模型中，从而得到各自对应的账户预测结果；并将得到的各自对应的账户预测结果进行相应整合，确定待预测账户的目标账户预测结果。

这样，通过将待预测账户相关联的特征信息，输入多个目标账户预测模型，并将获得多个目标预设结果进行相应整合，如线性组合等，可以使得到账户预测结果更具鲁棒性。

基于同一发明构思，参阅图9所示，本公开实施例中提供一种电子设备(如，账户预测的装置)，包括：

获取单元910，用于获取待预测账户相关联的账户数据对应的特征信息，其中，所述特征信息表征所述待预测账户的指定属性在预设时间范围内的变化状态；所述预设时间范围是基于所述待预测账户执行变更绑定操作对应的基准时间点确定的；

得到单元920，用于将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果。

可选的，所述获取所述待预测账户相关联的账户数据对应的第一特征信息，所述获取单元910用于：

可选的，所述获取所述待预测账户相关联的账户数据对应的第二特征信息，所述获取单元910用于：

可选的，所述目标账户预测模型是采用以下方式训练的：

可选的，当采用多个训练样本集合时，基于所述多个训练样本集合，分别对多个待训练的账户预测模型进行训练，得到多个目标账户预测模型。

可选的，所述将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果，所述得到单元920用于：

基于同一发明构思，参阅图10所示，本公开实施例提供一种电子设备，例如，电子设备1000可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图10，电子设备1000可以包括以下一个或多个组件：处理组件1002，存储器1004，电源组件1006，多媒体组件1008，音频组件1010，输入/输出(I/O)的接口1012，传感器组件1014，以及通信组件1016。

处理组件1002通常控制电子设备1000的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件1002可以包括一个或多个处理器1020来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1002可以包括一个或多个模块，便于处理组件1002和其他组件之间的交互。例如，处理组件1002可以包括多媒体模块，以方便多媒体组件1008和处理组件1002之间的交互。

存储器1004被配置为存储各种类型的数据以支持在电子设备1000的操作。这些数据的示例包括用于在电子设备1000上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1006为电子设备1000的各种组件提供电力。电源组件1006可以包括电源管理系统，一个或多个电源，及其他与为电子设备1000生成、管理和分配电力相关联的组件。

多媒体组件1008包括在电子设备1000和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1008包括一个前置摄像头和/或后置摄像头。当电子设备1000处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1010被配置为输出和/或输入音频信号。例如，音频组件1010包括一个麦克风(MIC)，当电子设备1000处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1004或经由通信组件1016发送。在一些实施例中，音频组件1010还包括一个扬声器，用于输出音频信号。

I/O接口1012为处理组件1002和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1014包括一个或多个传感器，用于为电子设备1000提供各个方面的状态评估。例如，传感器组件1014可以检测到电子设备1000的打开/关闭状态，组件的相对定位，例如所述组件为电子设备1000的显示器和小键盘，传感器组件1014还可以检测电子设备1000或电子设备1000一个组件的位置改变，用户与电子设备1000接触的存在或不存在，电子设备1000方位或加速/减速和电子设备1000的温度变化。传感器组件1014可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1014还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1014还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1016被配置为便于电子设备1000和其他设备之间有线或无线方式的通信。电子设备1000可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件1016经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件1016还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备1000可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例中账户预测的装置执行的任意一种方法。

基于同一发明构思，本公开实施例提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由处理器执行时，能够执行上述实施例中电子设备执行的任意一种方法。

基于同一发明构思，本公开实施例提供一种计算机程序产品，包含可执行指令，当所述计算机程序产品的可执行指令由处理器执行时，能够实现如上述实施例中电子设备执行的任意一种方法。

综上所述，本公开实施例中，获取待预测账户相关联的账户数据对应的特征信息，其中，特征信息表征待预测账户的指定属性在预设时间范围内的变化状态；预设时间范围是基于待预测账户执行变更绑定操作对应的基准时间点确定的；并将特征信息输入目标账户预测模型中，得到待预测账户对应的目标账户预测结果；这样，由于目标账户预测模型是基于从各个训练样本中获取各自对应的特征信息，以及各自对应的样本标签训练得到的，因此，目标账户预测模型中已确定了特征信息的最佳规则阈值，那么，通过已训练好的目标账户预测模型，对针对待预测账户相关联的账户数据对应的特征信息进行预测，提高了目标账户预测结果的准确率，也解决了已有技术下基于历史经验制定规定阈值存在的不确定性和准确率低下的问题。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域的技术人员可以对本公开实施例进行各种改动和变型而不脱离本公开实施例的精神和范围。这样，倘若本公开实施例的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

1.一种账户预测的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述特征信息包括第一特征信息和第二特征信息中的任意一种或组合；

3.如权利要求2所述的方法，其特征在于，所述获取所述待预测账户相关联的账户数据对应的第一特征信息，包括：

4.如权利要求2所述的方法，其特征在于，所述获取所述待预测账户相关联的账户数据对应的第二特征信息，包括：

5.如权利要求1-4任一项所述的方法，其特征在于，所述目标账户预测模型是采用以下方式训练的：

6.如权利要求5所述的方法，其特征在于，当采用多个训练样本集合时，基于所述多个训练样本集合，分别对多个待训练的账户预测模型进行训练，得到多个目标账户预测模型。

7.如权利要求6所述的方法，其特征在于，所述将所述特征信息输入目标账户预测模型中，得到所述待预测账户对应的目标账户预测结果，包括：

8.一种账户预测的装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行所述存储器中存储的可执行指令，以实现如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由处理器执行时，使得所述处理器能够执行如权利要求1-7任一项所述的方法。