CN113051486A

CN113051486A - 基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质

Info

Publication number: CN113051486A
Application number: CN202110409062.8A
Authority: CN
Inventors: 蔡成加
Original assignee: Shenzhen Zhenai Jieyun Information Technology Co ltd
Current assignee: Shenzhen Zhenai Jieyun Information Technology Co ltd
Priority date: 2021-04-16
Filing date: 2021-04-16
Publication date: 2021-06-29

Abstract

本申请涉及一种基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质。所述方法包括：获取预设时间内目标应用程序的交友推荐页的用户行为数据集；从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数；基于所述点击概率参数对待训练的推荐模型执行初始化，得到初始化推荐模型；基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。实施本申请实施例具有提高推荐模型的准确度的优点。

Description

基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质

技术领域

本申请涉及机器学习技术领域，特别是涉及一种基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质。

背景技术

随着计算机技术的深入研究，人工智能技术也随之飞速发展，机器学习是人工智能技术中重要的组成部分，其中，推荐模型即为机器学习模型中应用最广泛的模型之一。推荐模型的主要应用场景之一即为社交交友平台。

目前，社交交友平台中的推荐模型通常为通过支撑向量机SVM构建的SVMRank模型，其主要降排序问题转化为pairwise分类问题然后使用SVM分类模型进行学习和求解，即在SVMRank模型的训练过程中，主要通过pairwise算法对推荐模型进行训练。但是，在通过pairwise算法对推荐模型训练的过程中，对样本质量要求极高，在构建训练对的过程中容易产生错误标注，从而导致训练出来的推荐模型效果不佳，并且，通过pairwise算法训练的推荐模型仅学习局部排序，不能学习到样本全局，通用性差，因此导致推荐模型的训练效果低下，准确率不高。

发明内容

本申请实施例提供一种基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质，用于提高推荐模型全局性以及推荐模型准确度。

第一方面，本申请实施例提供一种基于交友场景的推荐模型的训练方法，包括：

获取预设时间内目标应用程序的交友推荐页的用户行为数据集；

从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数；

基于所述点击概率参数对待训练的推荐模型执行初始化，得到初始化推荐模型；

基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。

在其中一个实施例中，所述点击率预估模型采用逻辑回归LR模型结构。

在其中一个实施例中，所述推荐模型采用SVMRank模型结构。

在其中一个实施例中，所述基于用户行为数据集构建第二样本集，包括：从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；基于所述随机用户对所述第一等级构建多个随机样本对；所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

在其中一个实施例中，所述确定所述多个用户对的样本目标等级，包括：针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

在其中一个实施例中，所述将所述第二样本集代入所述初始化推荐模型进行训练，包括：提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

在其中一个实施例中，所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，包括：基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

第二方面，本申请实施例提供一种基于交友场景的推荐模型的训练装置，包括：

获取单元，用于获取预设时间内目标应用程序的交友推荐页的用户行为数据集；

第一训练单元，用于从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数；

初始化单元，用于基于所述点击概率参数对待训练的推荐模型执行初始化，得到初始化推荐模型；

第二训练单元，用于基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。

在其中一个实施例中，所述第一训练单元中所述点击率预估模型采用逻辑回归LR模型结构。

在其中一个实施例中，所述初始化单元中所述推荐模型采用SVMRank模型结构。

在其中一个实施例中，在所述基于用户行为数据集构建第二样本集方面，所述第二训练单元具体用于：从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；基于所述随机用户对所述第一等级构建多个随机样本对；所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

在其中一个实施例中，在所述确定所述多个用户对的样本目标等级方面，所述第二训练单元具体用于：针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

在其中一个实施例中，在所述将所述第二样本集代入所述初始化推荐模型进行训练方面，所述第二训练单元具体用于：提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

在其中一个实施例中，在所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型方面，所述第一训练单元具体用于：基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

第三方面，本申请实施例提供一种电子设备，该电子设备包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤的指令。

第四方面，本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质用于存储计算机程序，其中，上述计算机程序被处理器执行，以实现如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

可以看出，在本申请实施例中，电子设备通过获取预设时间内目标应用程序的交友推荐页的用户行为数据集；从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的模型参数；基于所述模型参数对待训练的推荐模型执行初始化，得到初始化推荐模型；基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。如此，可以通过用户行为数据首先训练点击率预估模型得到模型参数，通过模型参数初始化待训练的推荐模型，从而实现推荐模型的全局性学习，提高全局性，通过用户行为数据集构建第二样本集对初始化推荐模型进行训练，实现微调学习样本局部，从而实现模型精度的提高，有利于提高推荐模型的推荐准确度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种基于交友场景的推荐模型的训练方法的流程示意图；

图2是本申请实施例提供的一种基于交友场景的推荐模型的训练方法的交互示意图；

图3是本申请实施例提供的一种电子设备300的结构示意图；

图4是本申请实施例提供的一种基于交友场景的推荐模型的训练装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

以下，对本申请中的部分用语进行解释说明，以便于本领域技术人员理解。

电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备（例如智能手表、智能手环、计步器等）、计算设备或通信连接到无线调制解调器的其他处理设备，以及各种形式的用户设备（User Equipment，UE），移动台（Mobile Station，MS），终端设备（terminal device）等等。为方便描述，上面提到的设备统称为电子设备。

请参阅图1，图1是本申请实施例提供的一种基于交友场景的推荐模型的训练方法的流程示意图，以该方法应用于电子设备，包括以下步骤：

步骤101、获取预设时间内目标应用程序的交友推荐页的用户行为数据集；

可选的，在获取所述用户行为数据集之前，设置定时器，所述定时器的时间设置为所述预设时间，所述定时器用于采集所述用户行为数据集。

可选的，所述用户在打开所述目标应用程序或者启动所述目标应用应用程序中包含的推荐功能时（例如：点击启动推荐功能、手势动作启动推荐功能等等），以弹窗或页面跳转方式展示交友推荐页，实现交友推荐页曝光，采集用户针对交友推荐页的用户行为数据。

可选的，采集在所述预设时间内所有用户使用所述目标应用程序时针对所述交友推荐页执行的操作，得到包含所有用户的用户行为数据的用户行为数据集。

步骤102、从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的模型参数；

可选的，所述点击率预估模型采用逻辑回归LR模型结构。

可选的，所述点击率预估模型还可以采用SVM等二分类模型结构。

可选的，所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，包括：基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

其中，所述正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据，即，针对所述用户行为数据集中任意一个用户行为数据，判断所述用户行为数据对应的用户是否包含针对所述交友推荐页展示的推荐交友用户的点击操作，若包含，则确定所述用户行为数据为正样本，若不包含，则确定所述用户行为数据为负样本。

可选的，在从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，包括：所述第一样本集包括正样本集和负样本集，针对所述正样本集和所述负样本集执行特征提取操作，得到所述正样本集和所述负样本集对应的正样本特征集和负样本特征集，所述正样本特征集和所述负样本特征集中的任一正样本特征或任一负样本特征的表现形式可以是一组特征值也可以是一个特征向量，其中，所述特征提取操作提取的特征可以包括：用户年龄、用户收入、用户学历、用户身高、用户婚况、用户注册时间、用户最后登录时间、7天内被点击次数、7天内登录次数等等；对所述正样本特征集和所述负样本特征集进行归一化处理，得到归一化后的正样本特征集和归一化后的负样本特征集，将所述归一化后的正样本特征集和所述归一化后的负样本特征集作为训练样本输入所述预设的点击率预估模型进行训练，得到训练好的点击率预估模型和所述模型参数。

步骤103、基于所述模型参数对待训练的推荐模型执行初始化，得到初始化推荐模型；

可选的，基于所述模型参数对待训练的推荐模型执行初始化包括将所述模型参数对所述待训练的推荐模型的参数调整起始点，得到初始化推荐模型。

可选的，所述推荐模型采用SVMRank模型结构。

步骤104、基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。

可选的，所述基于用户行为数据集构建第二样本集，包括：从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；基于所述随机用户对所述第一等级构建多个随机样本对；所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

其中，确定所述用户行为数据对应的主动用户和被动用户包括：确定采集所述用户行为数据的设备id，确定所述设备id对应的登录用户id，提取所述用户行为数据包含的至少一个用户，确定所述至少一个用户中与所述登录用户id匹配的用户为主动用户，所述至少一个用户中与所述登录用户id不匹配的用户为被动用户。

具体实施过程中，从用户行为数据集中提取的用户对的表现形式可以包括但不限于：<#主动用户 #被动用户>。

具体实施过程中，训练样本对的表现形式可以包括但不限于：<#主动用户 #被动用户 #样本目标等级>。

具体实施过程中，假设从用户行为数据中提取m个用户对，则m个用户对中包含n个主动用户，其中，n<m，n、m均为大于0的整数，针对n个主动用户中任意一个主动用户，获取推荐用户列表，基于推荐用户列表选取多个随机用户，其中，多个随机用户的数量可以包括但不限于：10、20等；基于任意一个主动用户与其对应的多个随机用户构建多个随机用户对，其中，多个随机用户对的每一随机用户对的样本目标等级均为第一等级，基于多个随机用户对和第一等级构建得到多个随机样本对。

可选的，所述确定所述多个用户对的样本目标等级，包括：针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

其中，主动行为数包括主动用户针对被动用户执行的主动行为的数量，主动行为可以包括但不限于：点击、打招呼、发消息、浏览信息等等；被动行为数包括被动用户针对主动用户返回的互动行为的数量，互动行为可以包括但不限于：点击、打招呼、回复消息、浏览信息等等。

可选的，针对所述多个用户对，从所述用户行为数据集中提取所述多个用户对的多个主动行为数和多个被动行为数；确定所述多个用户对中主动行为数大于0且小于预设阈值的用户对属于第二类用户对，所述第二类样本对应的样本目标等级为第二等级；确定所述多个用户对中主动行为数大于预设阈值且被动行为数为0的用户对为第三类用户对，所述第三类用户对对应的样本目标等级为第三等级；确定所述多个用户对中被动行为数不为0的用户对为第四类用户对，所述第四类用户对对应的样本目标等级为第四等级；其中，样本目标等级的顺序为：第四等级>第三等级>第二等级>第一等级，针对所述多个用户对中任意一个用户对，若所述任意一个用户对同时满足两个或两个以上类别，选取等级最高的类别作为所述任意一个用户对的类别，例如，若用户对满足第二类用户对条件且满足第三类用户对条件，确定所述用户对为第三类用户对，所述用户对的样本目标等级为第三等级。

步骤105、基于所述第二样本集对所述初始化推荐模型进行训练，得到所述推荐模型。

可选的，所述将所述第二样本集代入所述初始化推荐模型进行训练，包括：提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

其中，针对所述训练样本集执行特征提取操作，包括：针对所述训练样本集中任意一个训练样本，所述任意一个训练样本的用户对的特征作为一个特征进行提取计算，即在具体实施过程中，假设用户对（A，B）的年龄段分别是20-25和25-28，那么将（20-25，25-28）作为用户对（A，B）的年龄特征进行提取，其中，（20-25，25-28）为一个特征。

其中，所述提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，包括：提取预设的样本权重为“1：1：10：20”，其中，该样本权重对应的样本目标的等级为“第一等级：第二等级：第三等级：第四等级”，具体实施过程中，加权即把训练样本依据样本权重进行复制，以保证样本目标等级为第三等级和第四等级的训练样本的排序满足f(x4)>f(x3)>f(x2)>f(x1)，其中f(x)为推荐模型的排序函数，x1、x2、x3、x4分别是样本目标等级为第一等级、第二等级、第三等级、第四等级的训练样本d1、d2、d3、d4的特征向量。

具体实施过程中，将归一化后的训练样本特征集按照libsvm数据格式写入到训练文件中，其中，libsvm数据格式，是SVMrank模型训练文件的格式，即把所有数据写入到train.dat文件中的格式。具体格式如下：<目标值> <qid：用户id> <特征编号：特征值> <特征编号：特征值> <特征编号：特征值> … # <备注信息>；再将训练文件输入到SVMRank模型中进行模型训练，推荐模型中设置惩罚系数c为1，其中，惩罚系数c用于平衡训练错误与最大分类间隔，即对于错误分类的样本加入一定的惩罚；通过归一化折损累计增益（Normalized Discounted Cumulative Gain，NDCG）指标实现排序性能评估，其中，NDCG是用来衡量排序质量的指标，NDCG公式为：

；

其中，DCG的计算公式为：

，

其中，p表示只考虑前p个结果，

表示i在这个位置上的相关度；IDCG为立项情况下最大的DCG值，计算公式为：

，

其中，|REL|表示结果按照相关性从大到小的顺序排序后取前p个结果组成的集合；本方案在具体实施的过程中取p=10，样本目标等级为第一等级、第二等级、第三等级、第四等级的相关性分别为0、1、2、4，最终对所有排序NDCG值取均值作为最后排序指标。

可选的，所述得到所述推荐模型之后，还包括：接收预设周期内所述推荐模型的输出结果和推荐反馈，基于所述输出结果构建增量训练样本集；基于所述增量训练样本集对所述推荐模型进行更新。

可以看出，在本申请实施例中，电子设备通过获取预设时间内目标应用程序的交友推荐页的用户行为数据集；从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的模型参数；基于所述模型参数对待训练的推荐模型执行初始化，得到初始化推荐模型；基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。如此，可以通过用户行为数据首先训练点击率预估模型得到模型参数，通过模型参数初始化待训练的推荐模型，从而实现推荐模型的全局性学习，提高全局性，通过用户行为数据集构建第二样本集对初始化推荐模型进行训练，实现微调学习样本局部，从而实现模型精度的提高，有利于提高推荐模型的推荐准确度；通过推荐模型的输出结果和推荐反馈构建增量训练样本实现推荐模型的更新学习，有利于提高推荐模型效率和准确度。

请参阅图2，图2是本申请实施例提供的一种基于交友场景的推荐模型的训练方法的交互示意图，如图所示，所述方法主要应用于电子设备，其中，电子设备与用户设备进行通讯连接，用户设备需要安装目标应用程序，目标应用程序在用户设备上展示交友推荐页，用户设备向电子设备返回针对交友推荐页的用户行为数据，电子设备执行以下步骤：

步骤201、获取预设时间内目标应用程序的交友推荐页的用户行为数据集，其中，用户行为数据集包括至少一条用户行为数据；

步骤202、从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数；

步骤203、基于所述点击概率参数对待训练的推荐模型执行初始化，得到初始化推荐模型；

步，204、基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型；

电子设备从数据库中提取推荐用户列表，执行步骤205、基于推荐用户列表筛选至少一个交友推荐用户，通过所述交友推荐页推送所述至少一个交友推荐用户；

用户设备返回交友推荐页推荐反馈，电子设备执行步骤206、接收预设周期内所述推荐模型的输出结果和推荐反馈，基于所述输出结果构建增量训练样本集；基于所述增量训练样本集对所述推荐模型进行更新。

如此可以看出在本申请实施例中所描述的推荐模型训练方法提高了推荐模型的全局性，实现推荐模型全局性和局部并存，有利于提高推荐模型的准确度，同时提高推荐模型的训练速度。

应该理解的是，虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

请参阅图3，图3是本申请实施例提供的一种电子设备300的结构示意图，如图所示，所述电子设备300包括：应用处理器310、存储器320、通信接口330、以及一个或多个程序321，其中，所述一个或多个程序321被存储在上述存储器320中，并且被配置由上述应用处理器310执行，所述一个或多个程序321包括用于执行以下步骤的指令：

在其中一个实施例中，所述推荐模型采用SVMRank模型结构。

在其中一个实施例中，所述基于用户行为数据集构建第二样本集，所述一个或多个程序用于执行以下步骤的指令：从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；基于所述随机用户对所述第一等级构建多个随机样本对；所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

在其中一个实施例中，所述确定所述多个用户对的样本目标等级，所述一个或多个程序用于执行以下步骤的指令：针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

在其中一个实施例中，所述将所述第二样本集代入所述初始化推荐模型进行训练，所述一个或多个程序用于执行以下步骤的指令：提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

在其中一个实施例中，所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，所述一个或多个程序用于执行以下步骤的指令：基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个控制单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

请参阅图4，图4是本申请实施例提供的一种基于交友场景的推荐模型的训练装置的结构示意图。

获取单元401，用于获取预设时间内目标应用程序的交友推荐页的用户行为数据集；

第一训练单元402，用于从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，得到所述点击率预估模型，其中，所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数；

初始化单元403，用于基于所述点击概率参数对待训练的推荐模型执行初始化，得到初始化推荐模型；

第二训练单元404，用于基于用户行为数据集构建第二样本集，将所述第二样本集代入所述初始化推荐模型进行训练，得到所述推荐模型。

在其中一个实施例中，所述第一训练单元402中所述点击率预估模型采用逻辑回归LR模型结构。

在其中一个实施例中，所述初始化单元403中所述推荐模型采用SVMRank模型结构。

在其中一个实施例中，在所述基于用户行为数据集构建第二样本集方面，所述第二训练单元具体404，具体用于：从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；基于所述随机用户对所述第一等级构建多个随机样本对；所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

在其中一个实施例中，在所述确定所述多个用户对的样本目标等级方面，所述第二训练单元404，具体用于：针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

在其中一个实施例中，在所述将所述第二样本集代入所述初始化推荐模型进行训练方面，所述第二训练单，404，具体用于：提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

在其中一个实施例中，在所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型方面，所述第一训练单，402，具体用于：基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤，上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包，上述计算机包括电子设备。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器（英文：Read-Only Memory ，简称：ROM）、随机存取器（英文：Random Access Memory，简称：RAM）、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种基于交友场景的推荐模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述点击率预估模型采用逻辑回归LR模型结构。

3.根据权利要求1所述的方法，其特征在于，所述推荐模型采用SVMRank模型结构。

4.根据权利要求1所述的方法，其特征在于，所述基于用户行为数据集构建第二样本集，包括：

从所述用户行为数据集中提取多个用户对，所述多个用户对中每一所述用户对包括：主动用户和被动用户；

确定所述多个用户对的多个样本目标等级，基于所述多个用户对和所述多个样本目标等级构建多个训练样本对；

针对所述多个用户对中任意一个主动用户，从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对，所述多个随机用户对的样本目标等级为第一等级；

基于所述随机用户对所述第一等级构建多个随机样本对；

所述多个训练样本对和所述多个随机样本对构成所述第二样本集。

5.根据权利要求4所述的方法，其特征在于，所述确定所述多个用户对的样本目标等级，包括：

针对所述多个用户对中每一所述用户对，获取所述用户对的用户行为数据；

从所述用户行为数据中提取所述用户对的主动行为数和被动行为数；

判断所述被动行为数是否为零，若不为零，则确定所述样本目标等级为第四等级；

若所述被动行为数为零，则判断所述主动行为数是否大于预设阈值，若大于，则确定所述样本目标等级为第三等级；

若所述主动行为数不大于所述预设阈值，则确定所述样本目标等级为第二等级。

6.根据权利1-5任一项所述的方法，其特征在于，所述将所述第二样本集代入所述初始化推荐模型进行训练，包括：

提取所述样本目标等级对应的样本权重对所述第二样本集进行加权，得到训练样本集；

针对所述训练样本集执行特征提取操作，得到所述训练样本集对应的训练样本特征集；

对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集；

将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。

7.根据权利要求1所述的方法，其特征在于，所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型，包括：

基于所述用户行为数据集筛选正样本子集和负样本子集，所述正样本子集和所述负样本子集构成所述第一样本集，其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据，所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据；

对所述正样本子集和所述负样本子集执行特征提取操作，得到正样本特征集和负样本特征集；

通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。

8.一种基于交友场景的推荐模型的训练装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1至7任意一项所述的方法。