WO2022198752A1

WO2022198752A1 - 推送模型训练方法、数据推送方法、装置及存储介质

Info

Publication number: WO2022198752A1
Application number: PCT/CN2021/091176
Authority: WO
Inventors: 程磊
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-03-24
Filing date: 2021-04-29
Publication date: 2022-09-29
Also published as: CN113033090B; CN113033090A

Abstract

本申请实施例提供一种推送模型训练方法，包括获取多个样本用户的多个用户数据，预处理多个用户数据，得到多个样本用户簇；将每个样本用户的多个用户数据输入待训练模型中，输出每个样本用户对应每个项目类型数据的第一样本喜好度；编码每个项目类型数据对应的第一样本喜好度，得到对应的第一样本喜好度编码数据，并从中确定样本喜好度输出编码数据；获取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；根据代价函数，比对每个样本用户的样本喜好度输出编码数据与样本喜好度标签编码数据，以调整待训练模型的模型参数，以得到项目数据推荐模型。本申请有效地提高了优化后的模型进行项目类型数据推送的效率和准确率。

Description

推送模型训练方法、数据推送方法、装置及存储介质

本申请要求于2021年3月24日提交中国专利局、申请号为202110311438.1、发明名称为“推送模型训练方法、数据推送方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及大数据技术领域，尤其涉及一种推送模型训练方法、数据推送方法、装置及存储介质。

背景技术

数据推送系统一直是信息领域的研究热点，在数据挖掘和机器学习的各大会议中，它一直作为讨论的热点。正因为如此，汇集了世界各地的学者对推荐系统展开了研究与探讨。如今，数据推送系统被应用于各个领域，例如：电子商务(Amazon、淘宝、京东)利用数据推送系统为用户提供喜爱的商品，信息检索(Google、百度、搜狗)利用数据推送系统为用户推荐有效的信息等。

不管是学术研究，还是商业应用，数据推送系统已经成为人们生活中不可或缺的重要技术。推荐系统的应用给人们的生活带来了极大的方便，它不仅帮助用户获取有价值的信息，而且可以减少用户获取有效信息所花费的时间，因此推荐系统的研究是一项具有重大意义的事情。

发明人意识到目前主流的数据推送系统都是基于混合的推荐，他们的实现方式虽然千奇百怪，但是都需要依赖于近邻用户才能给出推荐，且都需要海量的目标用户数据和近邻用户数据。采取上述数据推送的方式，要获取目标样本用户和近邻用户的用户数据，当样本用户不存在近邻用户的时候，通过依靠近邻用户得到项目类型数据的准确率较低。

发明内容

有鉴于此，本申请实施例提供了一种推送模型训练方法、装置、计算机设备及计算机可读存储介质，用于解决采用现有的项目数据类型推送方式，导致项目类型数据输出模型的结果的准确率较低的问题。

本申请实施例是通过下述技术方案来解决上述技术问题：

一种推送模型训练方法，包括：

获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。

为了实现上述目的，本申请实施例还提供一种推送模型训练装置，包括：

预处理模块，用于获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

模型处理模块，用于将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

编码模块，用于分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

确定模块，用于从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

提取模块，用于从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

生成模块，用于根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

调整模块，用于根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。

为了实现上述目的，本申请实施例还提供一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时还执行以下步骤：

为了实现上述目的，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行以下步骤：

为了实现上述目的，本申请实施例还提供一种数据推送方法，包括：

获取目标用户的多个用户数据、历史项目类型评分数据和多个项目类型数据；

将所述多个用户数据、历史项目类型评分数据和多个项目类型数据，输入至上述任一实施例所述的项目数据推荐模型中；

根据所述项目数据推荐模型，输出所述目标用户对应每个项目类型数据的第一喜好度；

从所述每个项目类型数据的第一喜好度中确定目标喜好度，并确定所述目标喜好度对应的项目类型数据为目标项目类型数据；及

将所述目标项目类型数据推送至客户端。

本申请实施例提供的推送模型训练方法、装置、计算机设备及计算机可读存储介质，获取多个样本用户的多个用户数据和对应的多个项目类型标签数据，对所述多个样本用户进行预处理，得到多个样本用户簇；将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，并根据所述模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；根据多个第一样本喜好度获取样本喜好度输出编码数据，并通过代价函数对模型进行迭代，以调整参数；进而有效地提高了优化后的模型进行项目类型数据推送的效率和准确率。

以下结合附图和具体实施例对本申请进行详细描述，但不作为对本申请的限定。

附图说明

图1为本申请实施例一之推送模型训练方法的步骤流程图；

图2为本申请实施例一之推送模型训练方法的步骤流程图；

图3为本申请实施例一之推送模型训练方法的步骤流程图；

图4为本申请实施例一之推送模型训练方法的步骤流程图；

图5为本申请实施例一之推送模型训练方法的步骤流程图；

图6为本申请实施例二之推送模型训练装置的程序模块示意图；

图7为本申请实施例三之计算机设备的硬件结构示意图；

图8为本申请实施例五之数据推送方法的步骤流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

在本申请的描述中，需要理解的是，步骤前的数字标号并不标识执行步骤的前后顺序，仅用于方便描述本申请及区别每一步骤，因此不能理解为对本申请的限制。

实施例一

请参阅图1，示出了本申请实施例之推送模型训练方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，具体如下：

如图1所示，所述推送模型训练方法可以包括步骤S100～S600，其中：

步骤S100，获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇。

在当前网络环境下，可以准确获取多个样本用户的多个用户数据，例如样本用户姓名、样本用户性别、样本用户年龄、样本用户职业等。定义样本用户集合为Q＝{Q ₁,Q ₂,…,Q _u…,Q _c}，其中，Q ₁、Q ₂、…、Q _u、…、Q _c均为样本用户，u和c均为正整数。其中，样本用户的属性信息集合为Q _u＝(q ₁,q ₂,…,q _e)，其中，Q _u表示第u个样本用户，u∈[1,c]，q _e表示第u个样本用户的第e个用户数据，例如，当Q _u＝(男，23，teacher)时，表示样本用户Q _u的性别为男，年龄为23，职业为teacher(老师)。

为了更好地构建训练数据，在示例性的实施例中，请参阅图2，多个样本用户簇还可以通过以下操作得到：步骤S200，从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；步骤S202，从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；步骤S204，从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；步骤S206，根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；步骤S208，根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；及步骤S210，根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。

在构建模型的训练数据集之前，还需要通过K-means聚类法(k均值聚类法)对样本用户的用户数据中的属性信息进行预处理。采用数字编码[1-9]的方式对样本用户的基本数据进行预处理。针对性别数据，预设的第一分类编码规则表示为将性别男编码为1和性别女编码为2；针对年龄数据，预设的第二分类编码规则表示为根据年龄段范围将样本用户年龄划分为少儿组(0～19岁)，青年组(20～39岁)，壮年组(40～59岁)，实年组(60～79岁)和老年组(80岁及以上)，并依次对应编码为1、2、3、4、5；针对职业数据，统计所有样本用户的职业类别及每种职业的样本用户数量，预设的第三分类编码规则表示为根据每种职业的样本用户数量进行降序排名，对排在前20％的职业给予单独编码，剩余的职业归为一类，并对该类进行编码。例如，21个职业中，取样本用户数量排名前4的职业进行单独编码，剩余的职业归为一类，所以样本用户的排名前4和剩余的职业编码依次为1、2、3、4、5。经过数字编码后，样本用户的属性信息可以表示为数字编码，接上例，当Q _u＝(男，23，teacher)时，Qu＝(1,1,5)。

为了更好地将样本用户进行归类分析，请参阅图3，在示例性的实施例中，所述根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，生成多个样本用户簇的步骤还可以通过执行如下操作得到，其中：步骤S300，根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；步骤S302，计算每个样本用户与每个聚类中心的距离；步骤S304，确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；及步骤S306，根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。

示例性的，聚类分析算法可以是k-means聚类算法。

步骤S102，将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度。

在示例性的实施例中，如图4所示，所述步骤S102还可以进一步包括步骤S400～S406，其中：步骤S400，根据每个样本用户簇中的每个样本用户的多个用户数据和每个项目数据之间的第一关联关系，得到每个样本用户对应的用户项目矩阵，并根据每个项目数据和项目类型数据之间的第二关联关系，得到每个样本用户对应的项目类型矩阵；步骤S402，根据所述用户项目矩阵和项目类型矩阵的乘积，生成所述每个样本用户对每个项目类型数据的评论次数；步骤S404，对每个样本用户与每个项目类型数据的评论次数进行求和，以得到每个样本用户的总评论次数；及步骤S406，分别根据每个样本用户的每个项目类型数据的评论次数与每个样本用户的总评论次数的比值，生成每个样本用户对应每个项目类型数据的第一样本喜好度。

计算样本用户u对项目的类型l的评论次数，可以用S _ul表示，l∈[1,m]，它是通过样本用户-项目矩阵

和项目-类型矩阵

的对应项相乘得到。在

中，当样本用户u存在对项目I _i的评分时，

否则，

同理，在

中，当项目I _i中属于类型l时，

否则

如具体见公式1：

计算样本用户u对所有项目类型数据的总评论次数，用S _u表示。具体见公式2：

最后，计算每个样本用户u对于每个项目类型数据l的第一喜好度，用P _ul表示，具体见公式3：

通过计算样本用户对于项目类型数据反馈的评分数据以及评论数据，分析得到每个样本用户对于每个项目类型数据的第一样本喜好度。其中，喜好度表示样本用户对于项目类型数据的喜好程度。

在示例性的实施例中，所述待训练模型包括输入层、第一隐含层、第二隐含层和输出层。

项目类型推荐模型训练前，需要搭建模型并确定方法。项目类型推荐模型具体包括一个输入层、两个隐含层和一个输出层。输入神经元的个数为N _in，隐藏层第l层神经元的个数为

输出层神经元的个数为N _out。隐含层采用Dropout(丢弃)策略，激活函数为ReLu，输出层的激活函数为Softmax。

项目类型推荐模型中隐含层神经元的个数采用Kolmogorov(柯尔莫戈洛夫)定理来确定，输入层神经元数目与隐含层神经元的数目存在等量关系，见公式4：

步骤S104，分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据。

在示例性的实施例中，样本用户对项目的评分表示了样本用户对项目的喜好程度，将喜好程度进行编码,得到第一喜好度编码数据，见下表1。

表1样本用户项目类型数据的第一样本喜好度编码表

进一步地，将多个样本用户对应多个项目类型数据的第一样本喜好度以及第一喜好度编码数据进行汇总，建立对应关系。以U ₁为例，其中，I _i表示第i个项目，L _i表示第i个类型。其训练数据集如下表2所示。

表2用户-项目类型-喜好度关系对应表

步骤S106，从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据。

解码每个样本用户对应的多个样本喜好度编码数据，得到多个第一样本喜好度编码数据对应的第一样本喜好度，从多个第一样本喜好度中获取分值最大的第一样本喜好度，并将该第一样本喜好度对应的第一样本喜好度编码数据，确定为样本喜好度输出编码数据。

对所述多个训练数据进行前向传播训练时，隐含层和输出层中每一个神经元的输入都来自前一层所有神经元输出值的线性加权和，为了防止过度拟合，对输入值的训练数据采取Dropout策略，见公式5：

其中，

表示项目类型推荐模型中第l层第n个神经元的输入值，

表示第l-1层第i个神经元与当前神经元连接的权值，

表示经过Dropout后第l-1层第i个神经元的输出值，

表示第l层第n个神经元的偏置值，k _l-1表示第l-1层神经元的总个数。

表示第l-1层第i个神经元的输出值，r ^l-1表示第l-1层神经元选择的概率，它是一个Bernoulli(伯努利)函数，以概率p随机生成一个0、1的向量。构建好输入层、隐含层以及输出层的神经元个数以及输出值之间的关联关系，有助于对训练数据进行有效筛选，有助于提升模型训练的效率。

在示例性的实施例中，经由每个隐含层、输出层的激活函数对于上一层的输出值(即该隐含层的输入值)进行非线性映射，使得神经网络具备了分层学习的能力。隐含层中的激活函数采用ReLU，输出层的激活函数采用Softmax，分别见公式6：

和公式7：

其中，

表示项目类型推荐模型中第l层第n个神经元的输出值，

表示项目类型推荐模型中第l层第n个神经元的输入值，k _l表示第l层神经元的总个数。

通过确定好每一层的神经元个数以及激活函数来搭建好项目类型推荐模型，有助于训练数据的有效训练以及模型的参数优化。

步骤S108，从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据。

步骤S110，根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值。

在示例性的实施例中，当通过项目类型推荐模型得到输出值后需要基于代价函数与样本喜好度标签编码数据进行比对。根据项目的类型的不同，常分为交叉熵准则和最小均方差法。示例性的，本申请实施例采用交叉熵准则。交叉熵准则具体见公式8：

其中，L _i表示第i个输出值与目标值的差值，即L _i表示第i个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据的差值；t _ij表示第i个输入信号对应的第j个实际类，p _ij表示第i个输入信号对应的第j个预测类。

步骤S112，根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。

如图5所示，在示例性的实施例中，所述根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型的步骤，包括：

步骤S500，通过自适应矩估计算法和所述损失值，计算所述待训练模型中每个模型参数的学习率；及步骤S502，根据所述每个模型参数的学习率，调整所述每个模型参数，以得到所述项目数据推荐模型。

项目数据推荐模型可以为优化后的深度神经网络模型。

在示例性的实施例中，代价函数的求解采用Adam算法，即自适应时刻估计方法(Adaptive Moment Estimation)。

通过代价函数计算得到的损失值，通过梯度的一阶矩阵和二阶矩阵更新每个模型参数的学习率，进而得到更新后的模型参数；使得模型的训练和收敛效果更好。

本申请实施例先根据用户属性对样本用户进行K-means聚类,划分为不同的用户簇，然后在不同的用户簇中对用户数据进行数据处理，包括输入层数据处理和输出层数据处理，根据处理的数据建立项目类型与用户项目评分的对应关系用于模型训练，随后对模型进行训练得到最佳的模型，模型的训练包括线性求和、激活函数、代价函数和代价函数求解，最后通过训练好的模型和反编码得到目标项目的预测评分。且在模型的搭建时，着重于每一层神经元的确定，以构建出合适的项目类型数据推送模型，再将训练数据输入到确定好神经元排布的模型中进行训练，有助于模型参数的优化，有助于模型训练效率的提升。在用户存在一定的评分项目数时，利用模型进行预测可以产生令人满意的推荐效果。

实施例二

请继续参阅图6，示出了本申请推送模型训练装置的程序模块示意图。在本实施例中，推送模型训练装置20可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本申请，并可实现上述推送模型训练方法。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合于描述推送模型训练装置20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能：

预处理模块600，用于获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇。

模型处理模块610，用于将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度。

编码模块620，用于分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据。

确定模块630，用于从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据。

提取模块640，用于从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据。

生成模块650，用于根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值。

调整模块660，用于根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。

在示例性的实施例中，所述预处理模块600，还用于：从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。

在示例性的实施例中，所述预处理模块600，还用于：根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；计算每个样本用户与每个聚类中心的距离；确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。

在示例性的实施例中，所述模型处理模块610，还用于：根据每个样本用户簇中的每个样本用户的多个用户数据和每个项目数据之间的第一关联关系，得到每个样本用户对应的用户项目矩阵，并根据每个项目数据和项目类型数据之间的第二关联关系，得到每个样本用户对应的项目类型矩阵；根据所述用户项目矩阵和项目类型矩阵的乘积，生成所述每个样本用户对每个项目类型数据的评论次数；对每个样本用户与每个项目类型数据的评论次数进行求和，以得到每个样本用户的总评论次数；分别根据每个样本用户的每个项目类型数据的评论次数与每个样本用户的总评论次数的比值，生成每个样本用户对应每个项目类型数据的第一样本喜好度。

在示例性的实施例中，所述调整模块660，还用于：通过自适应矩估计算法和所述损失值，计算所述待训练模型中每个模型参数的学习率；根据所述每个模型参数的学习率，调整所述每个模型参数，以得到所述项目数据推荐模型。

实施例三

参阅图7，是本申请实施例三之计算机设备的硬件架构示意图。本实施例中，所述计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图7所示，所述计算机设备2至少包括，但不限于，可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及推送模型训练装置20。其中：

本实施例中，存储器21至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如上述实施例的推送模型训练装置20的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行推送模型训练装置20，以实现上述实施例的推送模型训练方法。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如，所述网络接口23用于通过网络将所述计算机设备2与外部终端相连，在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图7仅示出了具有部件20-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器21中的所述推送模型训练装置20还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器22)所执行，以完成本申请。

例如，图6示出了所述实现推送模型训练装置20实施例二的程序模块示意图，该实施例中，所述基于推送模型训练装置20可以被划分为预处理模块600、处理模块610、编码模块620、确定模块630、提取模块640、生成模块650及调整模块660。其中，本申请所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述所述推送模型训练装置20在所述计算机设备2中的执行过程。所述程序模块600-660的具体功能在实施例二中已有详细描述，在此不再赘述。

实施例四

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。所述计算机可读存储介质可以是非易失性，也可以是易失性。本实施例的计算机可读存储介质用于存储推送模型训练装置20，被处理器执行时实现上述实施例的推送模型训练方法。

实施例五

请参阅图8，示出了本申请实施例之数据推送方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，具体如下：

如图8所示，所述数据推送方法可以包括步骤S800～S808，其中：

步骤S800，获取目标用户的多个用户数据、历史项目类型评分数据和多个项目类型数据；步骤S802，将所述多个用户数据输入至上述任一实施例所述的项目数据推荐模型中；步骤S804，根据所述项目数据推荐模型，输出所述目标用户对应每个项目类型数据的第一喜好度；步骤S806，从所述每个项目类型数据的第一喜好度中确定目标喜好度，并确定所述目标喜好度对应的项目类型数据为目标项目类型数据；及步骤S808，将所述目标项目类型数据推送至客户端。

当加入新项目时，将目标项目先进行数据处理，然后经过模型训练，便得到预测结果。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种推送模型训练方法，其中，包括：

获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。
根据权利要求1所述的推送模型训练方法，其中，所述对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇的步骤，包括：

从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；

从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；

从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；

根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；

根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；

根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。
根据权利要求2所述的推送模型训练方法，其中，所述根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇的步骤，包括：

根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；

计算每个样本用户与每个聚类中心的距离；

确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；

根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。
根据权利要求3所述的推送模型训练方法，其中，所述将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度的步骤，包括：

根据每个样本用户簇中的每个样本用户的多个用户数据和每个项目数据之间的第一关联关系，得到每个样本用户对应的用户项目矩阵，并根据每个项目数据和项目类型数据之间的第二关联关系，得到每个样本用户对应的项目类型矩阵；

根据所述用户项目矩阵和项目类型矩阵的乘积，生成所述每个样本用户对每个项目类型数据的评论次数；

对每个样本用户与每个项目类型数据的评论次数进行求和，以得到每个样本用户的总评论次数；

分别根据每个样本用户的每个项目类型数据的评论次数与每个样本用户的总评论次数的比值，生成每个样本用户对应每个项目类型数据的第一样本喜好度。
根据权利要求1所述的推送模型训练方法，其中，所述待训练模型包括输入层、第一隐含层、第二隐含层和输出层。
根据权利要求1所述的推送模型训练方法，其中，所述根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型的步骤，包括：

通过自适应矩估计算法和所述损失值，计算所述待训练模型中每个模型参数的学习率；

根据所述每个模型参数的学习率，调整所述每个模型参数，以得到所述项目数据推荐模型。
一种数据推送方法，其中，包括：

获取目标用户的多个用户数据、历史项目类型评分数据和多个项目类型数据；

将所述多个用户数据、历史项目类型评分数据和多个项目类型数据输入至如权利要求1～6任一项所述的项目数据推荐模型中；

根据所述项目数据推荐模型，输出所述目标用户对应每个项目类型数据的第一喜好度；

从所述每个项目类型数据的第一喜好度中确定目标喜好度，并确定所述目标喜好度对应的项目类型数据为目标项目类型数据；及

将所述目标项目类型数据推送至客户端。
一种推送模型训练装置，其中，包括：

预处理模块，用于获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

模型处理模块，用于将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

编码模块，用于分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

确定模块，用于从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

提取模块，用于从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

生成模块，用于根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

调整模块，用于根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。
根据权利要求8所述的推送模型训练装置，其中，所述预处理模块还用于：

从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；

从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；

从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；

根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；

根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；

根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。
根据权利要求9所述的推送模型训练装置，其中，所述预处理模块还用于：

根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；

计算每个样本用户与每个聚类中心的距离；

确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；

根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。
根据权利要求10所述的推送模型训练装置，其中，所述模型处理模块还用于：

根据每个样本用户簇中的每个样本用户的多个用户数据和每个项目数据之间的第一关联关系，得到每个样本用户对应的用户项目矩阵，并根据每个项目数据和项目类型数据之间的第二关联关系，得到每个样本用户对应的项目类型矩阵；

根据所述用户项目矩阵和项目类型矩阵的乘积，生成所述每个样本用户对每个项目类型数据的评论次数；

对每个样本用户与每个项目类型数据的评论次数进行求和，以得到每个样本用户的总评论次数；

分别根据每个样本用户的每个项目类型数据的评论次数与每个样本用户的总评论次数的比值，生成每个样本用户对应每个项目类型数据的第一样本喜好度。
根据权利要求8所述的推送模型训练装置，其中，所述待训练模型包括输入层、第一隐含层、第二隐含层和输出层。
根据权利要求8所述的推送模型训练装置，其中，所述调整模块还用于：

通过自适应矩估计算法和所述损失值，计算所述待训练模型中每个模型参数的学习率；

根据所述每个模型参数的学习率，调整所述每个模型参数，以得到所述项目数据推荐模型。
一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时执行以下步骤：

获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。
如权利要求14所述的计算机设备，其中，所述处理器执行所述计算机程序时还执行以下步骤：

从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；

从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；

从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；

根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；

根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；

根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。
如权利要求15所述的计算机设备，其中，所述处理器执行所述计算机程序时还执行以下步骤：

根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；

计算每个样本用户与每个聚类中心的距离；

确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；

根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。
如权利要求16所述的计算机设备，其中，所述处理器执行所述计算机程序时还执行以下步骤：

根据每个样本用户簇中的每个样本用户的多个用户数据和每个项目数据之间的第一关联关系，得到每个样本用户对应的用户项目矩阵，并根据每个项目数据和项目类型数据之间的第二关联关系，得到每个样本用户对应的项目类型矩阵；

根据所述用户项目矩阵和项目类型矩阵的乘积，生成所述每个样本用户对每个项目类型数据的评论次数；

对每个样本用户与每个项目类型数据的评论次数进行求和，以得到每个样本用户的总评论次数；

分别根据每个样本用户的每个项目类型数据的评论次数与每个样本用户的总评论次数的比值，生成每个样本用户对应每个项目类型数据的第一样本喜好度。
一种计算机可读存储介质，其中，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行以下步骤：

获取多个样本用户的多个用户数据和所述多个样本用户对应的多个项目类型标签数据，对所述多个样本用户的多个用户数据的属性信息进行预处理，得到多个样本用户簇；

将每个样本用户簇中的每个样本用户的多个用户数据输入待训练模型中，根据所述待训练模型输出每个样本用户对应每个项目类型数据的第一样本喜好度；

分别编码所述每个样本用户对应的所述每个项目类型数据的第一样本喜好度，生成所述每个项目类型数据对应的第一样本喜好度编码数据；

从所述每个样本用户对应每个项目类型数据对应的第一样本喜好度编码数据中，确定样本喜好度输出编码数据；

从每个样本用户对应的多个项目类型标签数据中提取每个样本用户的偏好样本项目类型数据对应的样本喜好度标签编码数据；

根据代价函数，比对所述每个样本用户的样本喜好度输出编码数据与所述样本喜好度标签编码数据，以生成损失值；及

根据所述损失值调整所述待训练模型的一个或多个模型参数，以得到项目数据推荐模型。
如权利要求18所述的计算机可读存储介质，其中，所述处理器执行所述计算机程序时还执行以下步骤：

从所述多个样本用户的多个用户数据中提取多个性别数据，根据预设的第一分类编码规则，分别编码每个样本用户的性别数据，以得到第一编码数据；

从所述多个样本用户的多个用户数据中提取多个年龄数据，根据预设的第二分类编码规则，编码所述每个样本用户的年龄数据，以得到第二编码数据；

从所述多个样本用户的多个用户数据中提取多个职业数据，根据所述多个职业数据对应的样本用户数量，确定多个职业类别；

根据预设的第三分类编码规则，编码所述多个职业类别，以得到每个样本用户对应的第三编码数据；

根据每个样本用户的所述第一编码数据、所述第二编码数据以及所述第三编码数据，生成每个样本用户的用户属性编码数据；

根据所述每个样本用户的用户属性编码数据和预设的聚类分析算法，计算得到多个样本用户簇。
如权利要求19所述的计算机设备，其中，所述处理器执行所述计算机程序时还执行以下步骤：

根据所述预设的聚类分析算法，从所述多个样本用户的用户属性编码数据中选取多个聚类中心；

计算每个样本用户与每个聚类中心的距离；

确定每个样本用户的样本属性类别，所述每个样本用户的样本属性类别为所述每个样本用户与每个聚类中心的距离中最短距离的聚类中心对应的样本属性类别；

根据所述每个样本用户的样本属性类别，分类所述多个样本用户，以得到多个样本用户簇。