CN114462502A

CN114462502A - 一种核身推荐模型训练方法及装置

Info

Publication number: CN114462502A
Application number: CN202210011293.8A
Authority: CN
Inventors: 王宁涛; 吕乐; 周璟; 傅幸; 范东云; 杨阳
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2022-01-06
Filing date: 2022-01-06
Publication date: 2022-05-10

Abstract

本说明书公开了一种核身推荐模型训练方法及装置。所述方法包括：获取训练样本集合；所述训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本；根据所述训练样本集合，预训练所述表征模型；预训练后的表征模型用于将输入的样本特征映射到第一向量空间中，针对相同推荐标签的样本减小第一向量空间映射结果之间的距离；获取任一业务场景中的若干训练样本，将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果，根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签，训练该业务场景对应的预测模型。

Description

一种核身推荐模型训练方法及装置

技术领域

本说明书实施例涉及推荐领域，尤其涉及一种核身推荐模型训练方法及装置。

背景技术

目前，移动终端上存在较多的业务场景需要核验用户身份，例如支付、登录、查询用户信息等。

针对这些业务场景，通常可以为用户推荐合适的核身产品用于核验用户身份。而如何确定推荐的核身产品，由于不同业务场景的需求不同，通常可以针对不同的业务场景，从头开始训练不同的核身产品推荐模型进行推荐。

但是这种方式耗费资源较多，模型训练效率低下。

发明内容

为了解决上述技术问题，本说明书实施例提供了一种核身推荐模型训练方法及装置。技术方案如下所示。

一种核身推荐模型训练方法，所述核身推荐模型包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景；所述预测模型用于在对应业务场景中预测待推荐核身产品；所述方法包括：

获取训练样本集合；所述训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本；

根据所述训练样本集合，预训练所述表征模型；预训练后的表征模型用于将输入的样本特征映射到第一向量空间中，针对相同推荐标签的样本减小第一向量空间映射结果之间的距离；

获取任一业务场景中的若干训练样本，将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果，根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签，训练该业务场景对应的预测模型。

可选地，所述训练样本集合中的训练样本特征包括移动终端运动数据；所述表征模型包括运动数据表征子模型；

所述预训练所述表征模型，包括：

将所述训练样本集合中任一训练样本的原始运动数据输入所述运动数据表征子模型中；

所述运动数据表征子模型用于：根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，并将所得到的两个不同运动数据分别映射到第二向量空间，再确定第二向量空间映射结果之间的距离；

针对所述运动数据表征子模型进行迭代训练，以减小第二向量空间映射结果之间的距离；

所述第一向量空间映射结果包括训练后的运动数据表征子模型的第二向量空间映射结果。

可选地，所述两个不同运动数据包括：与原始运动数据在时域上相似的一个运动数据，以及与原始运动数据在频域上相似的一个运动数据。

可选地，所述根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，包括：

根据输入的原始运动数据，得到与原始运动数据相似且形式相同的两个不同运动数据；所得到的不同运动数据是时域数据；

将所得到的其中一个运动数据变换为频域数据，得到与原始运动数据相似且形式不同的两个不同运动数据。

可选地，所述训练样本集合中的训练样本特征包括历史核身序列；所述表征模型包括历史表征子模型；

所述预训练所述表征模型，包括：

根据所述训练样本集合中任一训练样本的历史核身序列，构建自监督样本；所构建的自监督样本中特征和标签是根据该历史核身序列确定的；所述历史核身序列包括一个或多个业务场景下的核身历史记录；

利用所构建的自监督样本训练所述历史表征子模型；

所述第一向量空间映射结果包括训练后的历史表征子模型的隐藏层输出结果。

可选地，所述将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果，包括：

将所获取的训练样本输入训练后的运动数据表征子模型，得到第二向量空间映射结果；

将所获取的训练样本输入训练后的历史表征子模型，得到隐藏层输出结果；

将所得到的第二向量空间映射结果和所得到的隐藏层输出结果拼接，确定为第一向量空间映射结果。

可选地，所述方法还包括：

将所述预训练后的表征模型部署到移动终端本地；

任一预测模型用于，从任一移动终端获取待预测数据的第一向量空间映射结果进行预测。

可选地，所述方法还包括：

将训练后的运动数据表征子模型部署到移动终端本地；

任一预测模型用于，从任一移动终端获取待预测数据中运动数据的第二向量空间映射结果进行预测。

一种核身推荐模型训练装置，所述核身推荐模型包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景；所述预测模型用于在对应业务场景中预测待推荐核身产品；所述装置包括：

获取单元，用于获取训练样本集合；所述训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本；

预训练单元，用于根据所述训练样本集合，预训练所述表征模型；预训练后的表征模型用于将输入的样本特征映射到第一向量空间中，针对相同推荐标签的样本减小第一向量空间映射结果之间的距离；

训练单元，用于获取任一业务场景中的若干训练样本，将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果，根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签，训练该业务场景对应的预测模型。

所述预训练单元，包括：

运动数据表征子单元，用于将所述训练样本集合中任一训练样本的原始运动数据输入所述运动数据表征子模型中；所述运动数据表征子模型用于：根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，并将所得到的两个不同运动数据分别映射到第二向量空间，再确定第二向量空间映射结果之间的距离；针对所述运动数据表征子模型进行迭代训练，以减小第二向量空间映射结果之间的距离；

可选地，所述运动数据表征子单元，用于：

所述预训练单元，包括：

历史表征子单元，用于根据所述训练样本集合中任一训练样本的历史核身序列，构建自监督样本；所构建的自监督样本中特征和标签是根据该历史核身序列确定的；所述历史核身序列包括一个或多个业务场景下的核身历史记录；

利用所构建的自监督样本训练所述历史表征子模型；

可选地，所述训练单元，包括：

映射子单元，用于将所获取的训练样本输入训练后的运动数据表征子模型，得到第二向量空间映射结果；将所获取的训练样本输入训练后的历史表征子模型，得到隐藏层输出结果；将所得到的第二向量空间映射结果和所得到的隐藏层输出结果拼接，确定为第一向量空间映射结果。

可选地，所述装置还包括：

第一部署单元，用于将所述预训练后的表征模型部署到移动终端本地；

可选地，所述装置还包括：

第二部署单元，用于将训练后的运动数据表征子模型部署到移动终端本地；

上述技术方案通过针对不同业务场景共同训练表征模型，再分别针对不同业务场景，利用该业务场景中的训练样本，得到表征模型的映射结果用于训练该业务场景对应的预测模型，从而可以针对不同业务场景复用所训练的表征模型，提高模型训练效率。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本说明书实施例提供的一种核身推荐模型训练方法的流程示意图；

图2是本说明书实施例提供的一种核身推荐模型的结构示意图；

图3是本说明书实施例提供的一种核身推荐模型训练装置的结构示意图；

图4是用于配置本说明书实施例方法的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行详细地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于公开的范围。

针对这些业务场景，通常可以为用户推荐合适的核身产品用于核验用户身份，提高核验成功率或者提高用户操作的便利或者提高安全性。

核身产品可以包括：人脸验证，指纹验证，密码验证，短信验证码验证，邮件链接验证，以及各种核身方式的不同组合等。

具体推荐核身产品，例如，针对经常使用密码核验进行支付的用户，可以推荐安全性更高且操作更便利的指纹验证，提高操作的便利性和支付安全性。

而如何确定推荐的核身产品，由于不同业务场景的需求不同，通常可以针对不同的业务场景，从头开始训练不同的核身产品推荐模型进行推荐。

具体地，不同业务场景对于安全性的要求不同，对于操作便捷性的要求也不同，往往难以使用相同的核身产品推荐模型进行推荐。

例如，针对登录业务场景，安全性要求较高，至少需要两种以上的核身方式进行组合，因此可以使用密码验证和短信验证码验证相结合的核身产品；而针对机票查询，安全性要求较低，便捷性要求较高，因此通常可以仅仅使用短信验证码验证。

但是这种方式耗费资源较多，模型训练效率低下。

并且，移动终端上存在多种多样的业务场景，其中需要注意的是长尾场景。长尾场景指的是调用较少，但是数量较多的若干场景。例如，查询各类交通票据(机票车票船票)的业务场景，查询各类居民信息(如水电费)的业务场景，查询公积金社保的业务场景等等。

与长尾场景相对的是支付场景和登录场景，这些业务场景数量较少，但是调用较多。

因此，如果针对每个业务场景单独从头开始构建并训练核身产品推荐模型，那么对于长尾场景而言，不仅耗费较多资源，包括存储资源和计算资源，模型使用情况较少，并且由于长尾场景调用较少，训练样本的获取也相应地十分困难，训练样本的数量不足，模型训练效果较差。

为了解决上述问题，本说明书实施例提供了一种核身推荐模型训练方法。

考虑到核身推荐模型中通常可以包括表征层和分类层，针对输入训练样本可以通过表征层得到特征向量，再进一步针对特征向量利用分类层进行分类预测，确定所推荐的核身产品。

而不同业务场景的不同需求，通常体现在分类层。而表征层用于提取输入训练样本特征中的深层特征，与业务场景的关联较小。

因此，本说明书实施例提供的方法中，核身推荐模型可以包括表征模型和对应于不同业务场景的不同预测模型。

具体可以针对不同的业务场景，统一构建并训练一个共同的表征模型，表征模型可以用于针对训练样本的特征进行处理，得到训练样本特征的表征结果，具体可以是特征向量。

表征模型具体可以对接不同的业务场景，利用不同业务场景的训练样本进行训练，并针对不同业务场景的训练样本特征得到表征结果。

此外，该方法中还可以针对不同的业务场景分别构建对应的预测模型。

表征模型的表征结果可以用于提供给不同业务场景对应的预测模型，方便后续预测模型针对表征结果进行分类预测，得到最终的核身产品推荐结果。

并且，为了方便预测模型的分类预测，表征模型可以用于针对相同推荐标签的样本缩小对应表征结果之间的距离，方便预测模型针对相同推荐标签的样本对应的表征结果得到相同或相近的预测结果，从而提高预测模型的准确率。

在本说明书实施例提供的上述方法中，可以通过针对不同业务场景共同训练表征模型，节约资源，具体可以节约计算资源和存储资源。

由于模型训练的过程中，大多数计算资源耗费在表征部分，因此，本方法可以节约大量计算资源。

并且，上述方法中的表征模型可以综合不同业务场景的训练样本进行训练，并且在不同业务场景中使用训练后的表征模型，提高表征效果，对于长尾场景而言，可以解决训练样本不足的问题，提高长尾场景下核身推荐模型的效果。

此外，上述方法中的表征模型可以通过针对相同类别的样本缩小表征结果之间的距离，方便后续进行分类预测，提高分类预测的准确率。

并且，对于新增的业务场景，上述方法中的核身推荐模型也可以复用现有的表征模型，只训练新的预测模型用于对应新增业务场景，提高了训练效率，可扩展性强。

为了便于理解，下面结合附图对本说明书实施例提供的一种核身推荐模型训练方法进行详细的解释。

如图1所示，为本说明书实施例提供的一种核身推荐模型训练方法的流程示意图。

其中，可选地，核身推荐模型可以包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景。

可选地，预测模型可以用于在对应业务场景中预测待推荐核身产品。具体可以是预测模型用于在对应业务场景推荐核身产品。

该方法可以包括以下步骤。

S101：获取训练样本集合。

可选地，所获取的训练样本集合可以包括不同业务场景中标注有核身产品推荐标签的训练样本。

S102：根据所获取的训练样本集合，预训练核身推荐模型中的表征模型。

可选地，预训练后的表征模型可以用于将输入的样本特征映射到第一向量空间中，针对相同推荐标签的样本减小第一向量空间映射结果之间的距离。

S103：获取任一业务场景中的若干训练样本，将所获取的训练样本输入预训练后的表征模型得到第一向量空间映射结果，根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签，训练该业务场景对应的预测模型。

上述方法流程通过针对不同业务场景共同训练表征模型，再分别针对不同业务场景，利用该业务场景中的训练样本，得到表征模型的映射结果用于训练该业务场景对应的预测模型，既能够贴合不同业务场景的需求进行核身产品推荐，又能够节约资源，避免资源浪费，还可以具有较高的可扩展性，针对新的业务场景，可以复用现有的预训练后表征模型，无需从头开始训练，只需要训练对应的预测模型即可，提高了训练效率。

并且，上述方法流程中的表征模型可以综合不同业务场景的训练样本进行训练，并且在不同业务场景中使用训练后的表征模型，提高表征效果，对于长尾场景而言，可以解决训练样本不足的问题，提高长尾场景下核身推荐模型的效果。

下面针对各个步骤进行详细的解释。

一、针对S101进行解释。

S101：获取训练样本集合。

本方法流程并不具体限定获取训练样本集合的方法。

在一种可选的实施例中，本方法流程所针对的核身推荐模型可以是针对移动终端上的业务场景进行核身推荐。因此，具体的训练样本也可以是从移动终端获取的。

在一种可选的实施例中，可以收集不同业务场景中的核身产品使用记录，从中获取训练样本。

可选地，训练样本包含的样本特征具体可以包括：移动终端的运动状态(例如，长时间静止不动，竖直，屏幕向下等等)，用户信息，用户习惯，业务场景，历史核身记录等等。

可选地，训练样本的样本特征可以从核身产品使用记录中获取。

具体训练样本包含的样本特征相关解释在后文叙述。

可选地，训练样本包含的推荐标签可以表征本次业务所真实使用的核身产品，也可以表征针对一次业务由人工或预设规则确定的核身产品，也可以表征对于某种业务场景中广受用户好评的核身产品。

例如，针对一条核身产品使用记录可以构建训练样本。其中针对公积金查询，用户实际使用了验证码验证，则可以将验证码验证作为该样本的推荐标签。

针对一条核身产品使用记录可以构建训练样本。其中针对公积金查询，用户实际使用了验证码验证，但是通过人工或预设规则，确定出给用户推荐密码验证，则可以将密码验证作为该样本的推荐标签。

针对一条核身产品使用记录可以构建训练样本。其中针对公积金查询，用户实际使用了验证码验证，通过人工或预设规则，确定出给用户推荐密码验证，但是对于用户整体针对公积金查询的反馈意见，对于指纹验证的好评较多，则可以将指纹验证作为该样本的推荐标签。

可选地，针对训练样本，所获取的不同业务场景中的训练样本的样本特征形式和标签形式可以相同，从而方便后续的模型训练。

当然，本方法流程并不限定训练样本中样本特征和推荐标签的来源、内容或者形式，以上实施例仅仅用于示例性说明。

二、针对S102进行解释。

在本方法流程中训练核身推荐模型，可以分别两个步骤，具体可以包括对表征模型的预训练步骤，以及对预测模型的训练步骤。

其中，表征模型的预训练可以采用所获取的训练样本集合整体进行训练，也就是利用若干不同业务场景的训练样本进行训练，从而可以提高表征模型的表征能力，并且节约模型训练的资源，也方便后续复用表征模型的表征能力，提高训练效率。

而为了方便后续分类预测，提高分类预测的准确率，可选地，预训练时可以针对表征模型的表征能力进行改进，使得针对相同推荐标签的样本可以得到相近或相似的表征结果，从而可以方便后续预测模型的训练，提高训练效率，也可以提高预测模型的准确率。

其中的第一向量空间映射结果就是表征模型的表征结果。

可选地，在第一向量空间中，针对相同推荐标签的样本可以减少映射结果之间的距离，相对而言，针对不同推荐标签的样本可以增大映射结果之间的距离，从而可以通过第一向量空间的映射实现初步的聚类，方便后续的分类预测，也方便提高预测模型的准确率。

可选地，为了提高表征模型的表征能力，具体预训练表征模型，可以采用自监督的训练方法。

可选地，可以针对任一训练样本，通过数据增强的方式得到若干组相似的两个样本特征，由于每组中两个样本特征是相似的，标签也相同，因此通过表征模型分别得到的两个输出也应当相近。之后可以通过训练表征模型，不断缩小输出之间的距离，从而实现相同标签的样本可以映射到相似的输出。具体地，可以基于交叉熵损失函数衡量表征模型得到的两个输出之间的相似度，并基于交叉熵损失函数训练表征模型，以提高表征模型的两个输出之间的相似度。

其中，可选地，表征模型中的隐藏层输出可以是第一向量空间中的映射结果。显然，针对表征模型，对于两个不同样本特征，隐藏层输出越相似，表征模型整体的输出越相似。

因此，可以通过表征模型对样本进行表征，得到样本特征在第一向量空间中的映射结果，用于后续的预测。

可选地，可以提取表征模型隐藏层的输出作为第一向量空间中的映射结果，也可以直接将训练完成的表征模型中的输出层删除，将隐藏层的输出直接用于后续的预测。

在一种可选的实施例中，预训练表征模型，可以包括以下步骤。

将任一训练样本的原始特征输入表征模型中；表征模型可以根据输入的原始特征，得到分别与原始特征相似的两个不同新特征，并将所得到的两个不同新特征分别映射到第一向量空间，再确定第一向量空间中两个映射结果之间的距离；针对表征模型进行迭代训练，以减小第一向量空间中两个映射结果之间的距离。

其中，可选地，可以针对原始特征进行数据增强，得到分别与原始特征相似的两个不同新特征。

当然，针对同一原始特征，可以得到若干组分别与原始特征相似的两个不同新特征用于训练表征模型。上述实施例只描述根据一组两个不同新特征训练表征模型的过程，可以通过简单推理得到根据若干组两个不同新特征训练表征模型的过程，此处不再赘述。

在一种可选的实施例中，可以针对训练样本的样本特征引入移动终端运动数据。

可选地，移动终端运动数据可以是移动终端本身的运动数据，具体可以是移动终端的位姿变化数据。

可选地，移动终端运动数据可以是通过移动终端的高频传感器收集得到的，高频传感器例如，加速度传感器，陀螺仪，重力传感器等等。高频传感器可以记录移动终端的位姿变化情况，从而可以帮助确定移动终端的运动状态。具体可以是静止或竖置或屏幕朝下等等。

可选地，可以将移动终端运动数据作为训练样本的一个样本特征。由于核身产品中，包括若干核身产品需要用户通过变化移动终端的位姿才能方便使用，例如，人脸验证时，通常需要人脸与移动终端屏幕平行；密码验证时，通常需要用户查看屏幕并输入密码。

因此，可以结合移动终端运动数据，帮助进行核身产品推荐，从而可以贴合用户当前移动终端的使用情况，进一步提高核身产品的推荐准确率。

例如，在移动终端当前处于平躺静止的运动状态，如果为用户推荐密码验证或者人脸验证，则通常需要用户查看屏幕并输入密码，或者竖置移动终端进行人脸验证，导致用户操作麻烦。而如果为用户推荐指纹验证，则无需用户查看屏幕，也无需竖置移动终端，只需要将手指放在指纹感应区即可完成核身，提高核身产品的推荐准确率。

或者，当移动终端当前处于竖置的运动状态，例如，用户正在自拍，或者正在拍照，如果想用户推荐人脸验证，则可以很容易地进行操作，提高核身产品的推荐准确率。

因此，移动终端运动数据的引入可以帮助提高核身产品的推荐准确率，根据移动终端运动数据进行核身产品推荐能够更贴合用户的核身需求。

可选地，作为样本特征，移动终端运动数据具体可以是高频传感器记录的数据，具体可以是高频传感器在预设时间段内记录的数据，预设时间段具体可以是使用核身产品前的固定时长。

在一种可选的实施例中，可以针对移动终端运动数据这一特征进行映射，减小相同标签样本的移动终端运动数据映射结果之间的距离。

因此，可选地，训练样本集合中的训练样本特征包括移动终端运动数据；表征模型可以包括运动数据表征子模型。

相对应地，具体预训练表征模型，可以包括：将训练样本集合中任一训练样本的原始运动数据输入运动数据表征子模型中。运动数据表征子模型可以用于：根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，并将所得到的两个不同运动数据分别映射到第二向量空间，再确定第二向量空间中两个映射结果之间的距离。针对运动数据表征子模型进行迭代训练，以减小第二向量空间中两个映射结果之间的距离。

其中，第一向量空间映射结果可以包括训练后的运动数据表征子模型的第二向量空间映射结果。

可选地，第一向量空间映射结果可以是训练后的运动数据表征子模型的第二向量空间映射结果。

显然，通过上述训练运动数据表征子模型的方式，可以针对相同推荐标签的样本，减小移动终端运动数据的第二向量空间映射结果之间的距离，从而方便针对移动终端运动数据这一特征进行初步聚类，方便后续的分类预测。

在一种可选的实施例中，针对所得到的两个不同运动数据，具体可以是所得到的两个不同运动数据可以包括：与原始运动数据在时域上相似的一个运动数据，以及与原始运动数据在频域上相似的一个运动数据。

通过两个形式不同的不同运动数据训练运动数据表征子模型，可以有效避免平凡解。

可选地，移动终端运动数据具体可以是时域数据的形式，具体可以是高频传感器按照一定时间间隔周期性采集的位姿变化数据。

因此，根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，可以包括：根据输入的原始运动数据，得到与原始运动数据相似且形式相同的两个不同运动数据；所得到的不同运动数据是时域数据；将所得到的其中一个运动数据变换为频域数据，得到与原始运动数据相似且形式不同的两个不同运动数据。具体可以是通过傅里叶变换，将时域数据变换为频域数据。

可选地，根据输入的原始运动数据，得到与原始运动数据相似且形式相同的两个不同运动数据，可以包括：针对原始运动数据进行任一预设数据增强处理，得到与原始运动数据相似且形式相同的两个不同运动数据。

可选地，预设数据增强处理可以包括：添加噪声，去除一个片段的数据，去除频率片段，频率平移等等。

在一种可选的实施例中，可以针对训练样本的样本特征引入历史核身序列。

可选地，历史核身序列可以是移动终端上的核身产品使用记录，按照时间顺序进行排列得到的。

具体可以是采集移动终端上固定时长内的核身产品使用记录，并按照时间顺序排列后得到历史核身序列。需要注意的是，移动终端上可以存在多种业务场景，因此，历史核身序列中可以包括一个或多个业务场景中的核身产品使用记录。

当然，对于历史核身序列中的每次核身记录，都可以详细记录数据作为特征数据的一部分，例如，核身产品，核身结果，时间，机型，环境，业务场景等。

例如，可以针对移动终端在历史7天内的核身记录，生成历史核身序列，历史核身序列中可以包括若干按时间排序的核身事件(对应于核身记录)。核身序列里的每一个核身事件都可以包含以下特征：核身产品，核身结果，时间，机型，环境，业务场景等。

引入历史核身序列进行核身产品的推荐，可以帮助提高核身产品的推荐准确率。

具体可以通过历史核身序列提取出用户所偏好的核身产品，或者用户常用的核身产品，或者用户通过率高的核身产品等等特征，从而方便后续针对任一业务场景推荐核身产品时，综合考虑历史因素，提高推荐准确率。

并且，由于历史核身序列可以包括不同业务场景，从而可以综合考虑用户在不同业务场景下的特征，方便提取出用户在核身时的深层特征，提高推荐准确率。

因此，可选地，训练样本集合中的训练样本特征可以包括历史核身序列；表征模型包括历史表征子模型。

预训练表征模型，可以包括：根据训练样本集合中任一训练样本的历史核身序列，构建自监督样本；所构建的自监督样本中特征和标签是根据该历史核身序列确定的；历史核身序列包括一个或多个业务场景下的核身历史记录；利用所构建的自监督样本训练历史表征子模型。

第一向量空间映射结果包括训练后的历史表征子模型的隐藏层输出结果。

在一种可选的实施例中，对于历史表征子模型训练的实施例可以是在对运动数据表征子模型训练的实施例基础上实现的。

本方法流程并不限定具体根据历史核身序列构建自监督样本的方法。

可选地，具体可以是采用上述数据增强处理得到相似样本特征，再缩小相同标签样本的映射结果之间的距离。

可选地，可以针对任一训练样本，通过数据增强的方式得到若干组相似的两个样本特征，由于每组中两个样本特征是相似的，标签也相同，因此通过分类器分别得到的两个向量也应当相近。之后可以通过训练分类器，不断缩小向量之间的距离，从而实现相同标签的样本可以映射到相近向量。

具体预训练表征模型，可以包括：将训练样本集合中任一训练样本的原始历史核身序列输入历史表征子模型中。历史表征子模型可以用于：根据输入的原始历史核身序列，得到与原始历史核身序列相似的两个不同核身序列，并将所得到的两个不同核身序列分别映射到第三向量空间，再确定第三向量空间中两个映射结果之间的距离。针对历史表征子模型进行迭代训练，以减小第三向量空间中两个映射结果之间的距离。

可选地，也可以采用bert模型的训练方法进行训练，实现历史核身序列的表征。

由于历史表征子模型可以采用自监督的方法进行训练，因此，可以提取出历史表征子模型中隐藏层的输出，作为历史表征子模型的表征结果或映射结果。

当然，可选地，表征模型中可以包括若干样本特征的表征子模型，可以并不限定于上述的运动数据表征子模型和历史表征子模型，例如，用户信息表征子模型，移动终端类型表征子模型等等。具体的子模型训练方法可以参见上述方法实施例。

三、针对S103进行解释。

在预训练表征模型后，预训练后的表征模型可以用于针对不同业务场景进行表征，提取数据中的深层特征，并且可以进行初步聚类，方便后续分类预测。

相对应地，针对任一业务场景，可以获取该业务场景中的若干训练样本，通过预训练后的表征模型将样本特征映射到第一向量空间，得到第一向量空间映射结果，从而可以方便该业务场景对应预测模型在第一向量空间中进行分类预测的训练。

可以理解的是，针对每个业务场景都可以通过S103训练对应的预测模型，得到针对每个业务场景用于推荐核身产品的预测模型。

在一种可选的实施例中，上述方法流程可以通过分别训练表征模型和若干预测模型，实现核身推荐模型的训练。

核身推荐模型可以包括表征模型和若干预测模型，从而方便针对不同业务场景的待预测数据进行核身产品的推荐。

具体可以是，针对任一业务场景中的待预测数据，先通过核身推荐模型中的表征模型，得到第一向量空间映射结果，再将所得到的第一向量空间映射结果输入到该业务场景对应的预测模型中，得到预测结果，用于表征所推荐的核身产品。

为了便于理解，如图2所示，为本说明书实施例提供的一种核身推荐模型的结构示意图。

其中，核身推荐模型包括表征模型、第一预测模型、第二预测模型和第三预测模型。第一预测模型可以对应于登录场景，第二预测模型可以对应于支付场景，第三预测模型可以对应于查询车牌场景。

其中，表征模型可以输出第一向量空间映射结果到第一预测模型、第二预测模型和第三预测模型，以便于每个预测模型针对对应业务场景中的待预测数据进行预测。

在一种可选的实施例中，核身推荐模型也可以进行预测模型的扩展，具体可以是针对新增的业务场景，重新构建一个新的预测模型进行训练。

由于表征步骤可以复用核身推荐模型中现有的表征模型，预测模型的结构可以相对轻量简单，无需太过复杂就可以具有较好的预测推荐效果。

因此，对于新增业务场景，本方法流程的核身推荐模型的可扩展性高，可以方便新增预测模型，提高训练效率。

在一种可选的实施例中，在表征模型包括运动数据表征子模型的情况下，具体将所获取的训练样本输入预训练后的表征模型得到第一向量空间映射结果，可以包括：将所获取的训练样本输入训练后的运动数据表征子模型，得到第二向量空间映射结果，作为第一向量空间映射结果的一部分。

在一种可选的实施例中，在表征模型包括历史表征子模型的情况下，具体将所获取的训练样本输入预训练后的表征模型得到第一向量空间映射结果，可以包括：将所获取的训练样本输入训练后的历史表征子模型，得到隐藏层输出结果，作为第一向量空间映射结果的一部分。

在一种可选的实施例中，在表征模型包括运动数据表征子模型和历史表征子模型的情况下，具体将所获取的训练样本输入预训练后的表征模型得到第一向量空间映射结果，可以包括：将所获取的训练样本输入训练后的运动数据表征子模型，得到第二向量空间映射结果；将所获取的训练样本输入训练后的历史表征子模型，得到隐藏层输出结果。

所得到的第二向量空间映射结果和隐藏层输出结果都可以是第一向量空间映射结果的一部分。

可选地，可以将所得到的第二向量空间映射结果和所得到的隐藏层输出结果拼接，确定为第一向量空间映射结果。

此外，在一种可选的实施例中，关于训练后的核身推荐模型的部署位置可以不限定。

可选地，可以直接将训练后的核身推荐模型部署在云端或者服务端，为若干移动终端提供核身推荐服务。

可选地，考虑到核身推荐模型中的表征模型通常需要获取移动终端的数据，而这些数据可能涉及用户隐私，例如，移动终端运动数据。

因此，可以考虑将表征模型部署到移动终端，使得表征模型在移动终端本地完成表征，而隐私数据可以保留在移动终端本地，无需发送给云端或服务端，从而更好地保护数据隐私和安全。

移动终端可以只发送表征模型结果，也就是第一向量空间映射结果到云端或服务端，进行后续的分类预测。

同时，云端和本地协同进行核身产品推荐，还可以提高推荐效率，利用本地的计算资源帮助进行核身产品推荐，节约云端的计算资源，提高计算效率。

因此，可选地，上述方法流程还可以包括：将预训练后的表征模型部署到移动终端本地。任一预测模型用于，从任一移动终端获取待预测数据的第一向量空间映射结果进行预测。

当然，可选地，由于表征模型中可以包括若干特征的表征子模型，其中可以包括涉及隐私数据的表征子模型，也可以包括并不涉及隐私数据的表征子模型，因此，为了减轻移动终端的运算压力，也可以只将涉及隐私数据的表征子模型部署到移动终端，而其他表征子模型仍然可以部署到云端或服务端，在保证数据隐私安全的前提下，可以进一步减轻移动终端的运算压力，更好地平衡移动终端和云端之间的算力，提高计算效率。

因此，可选地，上述方法流程还可以包括：将训练后的运动数据表征子模型部署到移动终端本地。任一预测模型可以用于，从任一移动终端获取待预测数据中运动数据的第二向量空间映射结果进行预测。

可选地，训练后的运动数据表征子模型可以部署到移动终端本地，训练后的历史表征子模型可以部署到云端，从任一移动终端获取待预测数据中运动数据的第二向量空间映射结果，并从云端获取将待预测数据中历史核身序列输入历史表征子模型得到的隐藏层输出，综合所获取的第二向量空间映射结果和隐藏层输出进行预测。

此外，还可以通过将核身推荐模型中涉及隐私数据的模型部署到移动终端本地保护数据隐私，并利用云端和移动终端协同计算提高推荐效率和计算效率。

上述方法流程还可以通过引入移动终端运动数据和历史核身序列等特征，提高表征模型的表征能力和预测模型的预测准确率，从而提高核身推荐模型的推荐准确率。

对应于上述方法实施例，本说明书实施例提供了一种装置实施例。

如图3所示，为本说明书实施例提供的一种核身推荐模型训练装置的结构示意图。

核身推荐模型中包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景；预测模型用于在对应业务场景中预测待推荐核身产品；该装置可以包括以下单元。

获取单元301，用于获取训练样本集合；训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本。

预训练单元302，用于根据所获取的训练样本集合，预训练表征模型；预训练后的表征模型用于将输入的样本特征映射到第一向量空间中，针对相同推荐标签的样本减小第一向量空间映射结果之间的距离。

训练单元303，用于获取任一业务场景中的若干训练样本，将所获取的训练样本输入预训练后的表征模型得到第一向量空间映射结果，根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签，训练该业务场景对应的预测模型。

可选地，训练样本集合中的训练样本特征包括移动终端运动数据；表征模型包括运动数据表征子模型。

预训练单元302可以包括：运动数据表征子单元302a，用于将训练样本集合中任一训练样本的原始运动数据输入运动数据表征子模型中；运动数据表征子模型用于：根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，并将所得到的两个不同运动数据分别映射到第二向量空间，再确定第二向量空间映射结果之间的距离；针对运动数据表征子模型进行迭代训练，以减小第二向量空间映射结果之间的距离。

第一向量空间映射结果包括训练后的运动数据表征子模型的第二向量空间映射结果。

可选地，两个不同运动数据包括：与原始运动数据在时域上相似的一个运动数据，以及与原始运动数据在频域上相似的一个运动数据。

可选地，运动数据表征子单元302a，用于：根据输入的原始运动数据，得到与原始运动数据相似且形式相同的两个不同运动数据；所得到的不同运动数据是时域数据；将所得到的其中一个运动数据变换为频域数据，得到与原始运动数据相似且形式不同的两个不同运动数据。

可选地，训练样本集合中的训练样本特征包括历史核身序列；表征模型包括历史表征子模型。

预训练单元302可以包括：历史表征子单元302b，用于根据训练样本集合中任一训练样本的历史核身序列，构建自监督样本；所构建的自监督样本中特征和标签是根据该历史核身序列确定的；历史核身序列包括一个或多个业务场景下的核身历史记录。利用所构建的自监督样本训练历史表征子模型。

可选地，训练单元303可以包括：映射子单元303a，用于将所获取的训练样本输入训练后的运动数据表征子模型，得到第二向量空间映射结果；将所获取的训练样本输入训练后的历史表征子模型，得到隐藏层输出结果；将所得到的第二向量空间映射结果和所得到的隐藏层输出结果拼接，确定为第一向量空间映射结果。

可选地，该装置还可以包括：第一部署单元304，用于将预训练后的表征模型部署到移动终端本地。任一预测模型用于，从任一移动终端获取待预测数据的第一向量空间映射结果进行预测。

可选地，该装置还可以包括：第二部署单元305，用于将训练后的运动数据表征子模型部署到移动终端本地。任一预测模型用于，从任一移动终端获取待预测数据中运动数据的第二向量空间映射结果进行预测。

上述装置实施例的解释可以参见上述方法实施例。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现一种核身推荐模型训练方法。

图4示出了本说明书实施例所提供的一种更为具体的计算机设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现一种核身推荐模型训练方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护。

Claims

1.一种核身推荐模型训练方法，所述核身推荐模型包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景；所述预测模型用于在对应业务场景中预测待推荐核身产品；所述方法包括：

2.根据权利要求1所述的方法，所述训练样本集合中的训练样本特征包括移动终端运动数据；所述表征模型包括运动数据表征子模型；

所述预训练所述表征模型，包括：

3.根据权利要求2所述的方法，所述两个不同运动数据包括：与原始运动数据在时域上相似的一个运动数据，以及与原始运动数据在频域上相似的一个运动数据。

4.根据权利要求2所述的方法，所述根据输入的原始运动数据，得到与原始运动数据相似的两个不同运动数据，包括：

5.根据权利要求2所述的方法，所述训练样本集合中的训练样本特征包括历史核身序列；所述表征模型包括历史表征子模型；

所述预训练所述表征模型，包括：

利用所构建的自监督样本训练所述历史表征子模型；

6.根据权利要求5所述的方法，所述将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果，包括：

7.根据权利要求1所述的方法，还包括：

将所述预训练后的表征模型部署到移动终端本地；

8.根据权利要求2所述的方法，还包括：

将训练后的运动数据表征子模型部署到移动终端本地；

9.一种核身推荐模型训练装置，所述核身推荐模型包括表征模型和至少两个预测模型，不同预测模型分别对应于不同的业务场景；所述预测模型用于在对应业务场景中预测待推荐核身产品；所述装置包括：

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至8任一项所述的方法。

11.一种机器可读存储介质，其上存储有程序，该程序被处理器执行时，实现如权利要求1至8中任一项所述的方法。