CN114764469A

CN114764469A - 一种内容推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN114764469A
Application number: CN202110034688.5A
Authority: CN
Inventors: 冯志祥
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2022-07-19

Abstract

本申请实施例公开了一种内容推荐方法、装置、计算机设备和存储介质；本申请实施例通过获取训练样本集合的历史内容，提取历史内容的携带标识信息的特征向量；基于标识信息确定特征向量的权重调节参数；根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过该模型向终端推荐内容。该方案根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

Description

一种内容推荐方法、装置、计算机设备和存储介质

技术领域

本发明涉及通信技术领域，具体涉及一种内容推荐方法、装置、计算机设备和存储介质。

背景技术

目前，许多应用程序利用个性化推荐技术为用户推荐符合用户喜好的内容，比如，可以将向用户推荐音乐、视频和新闻等内容，而历史推荐内容可以作为机器学习模型(也称为模型)的训练数据，基于训练好的模型向用户推送其感兴趣的内容。

在个性化推荐的过程中经常会遇到小样本问题，即目标样本数量不足以进行模型训练，比如，模型的训练数据中的正样本不够多，这会导致训练的难度增加，且训练好的模型不能较准确地向用户推荐内容。通常采用复制目标样本的方式解决小样本问题，对目标样本进行复制，复制后训练数据中存在多个相同的目标样本，从而增加目标样本的数量，提高目标样本在训练数据中的占比。

在对现有技术的研究和实践过程中，本申请的发明人发现，复制目标样本，训练数据中会存在多个相同的样本，使得模型对相同样本的训练次数增加，而使用相同样本对模型进行训练并未能够提升模型的训练效果，导致训练好的模型对内容推荐的准确性和可靠性降低。

发明内容

本申请实施例提供一种内容推荐方法、装置、计算机设备和存储介质，本申请实施例可以提高对推荐模型训练的精准性，以提高训练后推荐模型对内容推荐的准确性。

本申请实施例提供的一种内容推荐方法，包括：

获取训练样本集合，所述训练样本集合包括至少一条向终端推荐的历史内容，所述历史内容携带有目标推荐结果；

提取所述历史内容的特征向量，所述特征向量携带标识信息；

基于所述标识信息确定所述特征向量的权重调节参数；

根据所述权重调节参数对所述特征向量的权重值进行调节，得到目标权重值；

通过初始推荐模型基于所述特征向量和目标权重值，对所述历史内容进行预测，得到预测推荐结果；

将所述预测推荐结果与所述目标推荐结果进行收敛，以对所述初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向所述终端推荐内容。

相应的，本申请实施例还提供的一种内容推荐装置，包括：

获取单元，用于获取训练样本集合，所述训练样本集合包括至少一条向终端推荐的历史内容，所述历史内容携带有目标推荐结果；

向量单元，用于提取所述历史内容的特征向量，所述特征向量携带标识信息；

参数单元，用于基于所述标识信息确定所述特征向量的权重调节参数；

权重单元，用于根据所述权重调节参数对所述特征向量的权重值进行调节，得到目标权重值；

预测单元，用于通过初始推荐模型基于所述特征向量和目标权重值，对所述历史内容进行预测，得到预测推荐结果；

收敛单元，用于将所述预测推荐结果与所述目标推荐结果进行收敛，以对所述初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向所述终端推荐内容。

相应的，本申请实施例还提供的一种计算机设备，包括存储器和处理器；所述存储器存储有应用程序，所述处理器用于运行所述存储器内的计算机程序，以执行本申请实施例提供的任一种内容推荐方法。

相应的，本申请实施例还提供一种存储介质，所述存储介质用于存储计算机程序，所述计算机程序被处理器加载以执行本申请实施例提供的任一种内容推荐方法。

本申请实施例可以通过获取训练样本集合的历史内容，提取历史内容的携带标识信息的特征向量；基于标识信息确定特征向量的权重调节参数；根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；然后，通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；最后，将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。本申请实施例通过根据标识信息确定权重调节参数对权重值进行调节，从而可以利用调节得到目标权重值的差异性使对初始推荐模型进行训练，提高了对推荐模型训练的精准性，使得训练后推荐模型可以向终端准确推荐相关内容。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的内容推荐方法的场景示意图；

图2是本申请实施例提供的内容推荐方法的流程图；

图3是本申请实施例提供的内容推荐方法的另一流程图；

图4是本申请实施例提供的初始推荐模型迭代训练的示意图；

图5是本申请实施例提供的内容推荐装置的示意图；

图6是本申请实施例提供的服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种内容推荐方法、装置、计算机设备和存储介质。该内容推荐装置可以集成在计算机设备中，该计算机设备可以是服务器等设备。

例如，如图1所述，服务器可以获取训练样本集合的历史内容；提取历史内容的携带标识信息的特征向量；基于标识信息确定特征向量的权重调节参数；根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；然后，通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；最后，将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。本申请实施例通过根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从内容推荐装置的角度进行描述，该内容推荐装置具体可以集成在计算机设备中，该计算机设备可以是服务器等设备。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

如图2所示，提供了一种内容推荐方法，该内容推荐方法可以由服务器执行，具体流程可以如下：

101、获取训练样本集合，训练样本集合包括至少一条向终端推荐的历史内容，历史内容携带有目标推荐结果。

其中，训练样本集合可以服务器包括向终端推荐的历史内容，比如该历史内容可以包括广告、音乐、文章、或者商品等，还可以包括终端对应的用户的用户信息，比如用户信息可以包括用户的昵称、年龄、以及性别等。

其中，历史内容可以携带有目标推荐结果(可以简称为推荐结果)，比如，若服务器向终端推荐了广告，推荐结果可以是用户通过终端对广告进行点击操作，或者是用户没有通过终端对该推荐信息进行点击操作，即忽略该推荐信息；如果服务器向终端推荐了文章，则推荐结果可以是用户阅读了文章，或者用户没有阅读文章。

其中，推荐结果可以通过被推荐内容的终端对用户的操作行为进行监测，得到推荐的内容的推荐结果。

比如，具体可以是定时获取训练样本集合中的历史内容，或者在预设训练时间获取训练样本集合中的历史内容，以进行初始训练模型的训练。

当向终端推荐的内容是广告时，将推荐结果为用户通过终端进行点击操作的广告定义为正样本，推荐结果为用户没有进行点击操作的广告定义为负样本，实际应用场景中，存在广告的数量很大，但用户点击的广告数量很小的情况，此时，获取的训练样本集合中的正、负样本的在训练样本集合的占比差距很大，根据该训练样本集合进行训练得到的训练结果欠拟合，训练后推荐模型的预测结果的正确率不高。

在其他的实际应用场景也存在正、负样本占比差距很大的情况，可能是正样本数量过少，或者是负样本数量过少，可以通过对数量过少的样本进行复制，增加样本的数量，以降低训练样本集合中正样本和负样本的占比差距，使正、负样本的数量满足推荐模型训练对数量的要求。

或者是增加采集样本的时间，比如，从收集向用户推荐内容后24小时内的候选历史内容，增加至收集向用户推荐内容后48小时内的候选历史内容，增加样本的采集时间可以积累更多的目标样本，但影响了初始推荐模型训练的时效性。

需要说明的是，目标样本可以根据应用场景设定为正样本或者负样本，或者其他样本。对正样本和负样本的区分并不限于用户是否点击，可以根据实际应用场景定义正样本和负样本。

在一实施例中，可以根据样本的标识信息，判断是否为目标样本(即标识信息为目标标识信息的候选历史内容)，若是目标样本，即对目标样本进行采样，得到训练样本集合。具体地，步骤“获取训练样本集合”之前，可以包括：

获取候选历史内容，候选历史内容携带标识信息，标识信息包括采样率；

若标识信息为目标标识信息，则根据采样率对候选历史内容进行采样，得到历史内容，基于历史内容生成训练样本集合。

其中，候选历史内容可以是向终端推荐的内容，以及内容对应的推荐结果。

其中，标识信息可以用于标识是否对该候选历史内容进行采样，以及该候选历史内容的采样率。标识信息可以包括目标推荐结果的标签，比如可以是有用户点击操作标签为1，没有用户点击操作标签为0，也可以是其他形式进行对样本的区分，在此不做限定。

其中，采样率可以表示对该候选历史内容进行复制的次数。

比如，具体可以是获取候选历史内容，根据候选历史内容的标识信息，判断该候选历史内容是否为目标样本，若标识信息为目标标识信息，则该候选历史内容为目标样本，基于采样率，对该候选历史内容进行复制，得到历史内容。基于历史内容生成训练样本集合，即训练样本集合包括候选历史内容，以及复制得到的相同的候选历史内容。

在一实施例中，可以根据向终端推荐的内容，以及内容对应的推荐结果，得到候选历史内容，获取第一预设时间内的候选历史内容，根据候选历史内容的标识信息，对该候选历史内容进行采样，得到训练样本集合。

其中，第一预设时间可以根据实际需要进行灵活设置，比如可以是在更新向终端推荐的内容的前1小时、2小时、5小时、或者是1天等。

可选的，可以在第二预设时间内通过被推荐内容的终端对用户的操作行为进行监测，得到推荐的内容的推荐结果，根据向终端推荐的内容，以及内容对应的推荐结果，得到候选历史内容，根据候选历史内容的标识信息，对该候选历史内容进行采样，得到训练样本集合。

其中，第二预设时间可以根据实际需要进行灵活设置，比如可以是向终端推荐内容后的1小时、2小时、或者是1天等。

102、提取历史内容的特征向量，特征向量携带标识信息。

其中，特征向量可以通过将历史内容转化为向量形式得到，是历史内容的另一种表示形式。

其中，标识信息可以用于识别该特征向量对应的历史内容是否是进行采样的，或者采样得到的历史内容。

比如，具体可以是提取历史内容的关键词，若历史内容包括图片，可以通过图片识别得到特征信息，比如历史内容是商品，则得到的特征信息可以包括商品的种类、颜色、价格、品牌、和/或类型等，将特征信息转化为向量形式，可以得到历史内容的特征向量，还可以是通过Item2Vec得到历史内容的特征向量。

可选的，可以基于独热编码将特征信息转化为特征向量。

如果特征信息包括的特征数量很多，根据独热编码得到的特征向量将会十分稀疏，增加了初始推荐模型计算处理的难度，可以将稀疏的向量转化为密集向量，比如，可以根据一个转化矩阵进行转化，具体地，步骤“提取历史内容的特征向量”可以包括：

提取历史内容的特征信息；

将所述特征信息映射至对应的预设维度，得到所述特征信息的稀疏向量；

基于转换矩阵将稀疏向量转化为特征向量。

其中，特征信息可以从历史内容中提取，比如可以利用神经网络对历史内容进行处理，从而提取历史内容的特征信息。

其中，预设维度可以包括类别、颜色、和/或价格等，可以根据实际分析需要进行灵活设置，预设维度还可以是性别和年龄等。

其中，稀疏向量可以是根据独热编码对映射到预设维度的特征信息中的每个特征进行处理得到。

其中，转换矩阵可以将稀疏向量转化为密集向量，比如稀疏向量为a维向量，通过转化矩阵，可以将a维向量转化为b维向量，即特征向量，其中，a远小于b。转换矩阵可以通过嵌入层(Embedding)实现，Embedding是一个将离散变量转为连续向量表示的一个方式。在神经网络中，Embedding可以减少离散变量的空间维数，同时还可以反映向量之间的关系。

比如，具体可以是将特征信息映射至对应的预设维度，若预设维度有类别、颜色、价格，其中类别有5种，颜色有8种，则得到的稀疏向量维度为14。通过转化矩阵可以将稀疏向量进行降维，得到低维度的特征向量。

在一实施例中，通过Embedding得到特征向量后，在Embedding空间查找到最相邻的特征向量，对特征向量和该特征向量最相邻的特征向量进行合适的加权处理，得到融合特征向量，将该融合特征向量输入初始推荐模型进行训练。

103、基于标识信息确定特征向量的权重调节参数。

其中，权重调节参数可以包括随机参数、均值参数和标准差参数，可以用于对权重值进行调节，得到目标权重值。

比如，具体可以是判断标识信息是否为目标标识信息，若标识信息为目标标识信息，则生成随机参数；根据随机参数、均值参数和标准差参数确定权重调整参数，比如，在一实施例中，权重调整参数可以是随机参数、均值参数和标准差参数。

若标识信息不为目标标识信息，则根据均值参数确定权重调整参数，比如，在一实施例中，权重调整参数可以是均值参数。

104、根据权重调节参数对特征向量的权重值进行调节，得到目标权重值。

其中，权重值可以是初始推荐模型的参数，在不对权重值进行调节的情况下，权重值可以是对输入的特征向量进行计算处理时，赋予特征向量的权重的值。

其中，目标权重值可以通过权重调节参数对权重值进行调节得到，用于对特征向量进行计算时，赋予特征向量的权重的值。

在步骤101中，对携带目标标识信息的候选历史内容进行复制，所以，在训练样本集合中存在多个相同的历史内容，初始推荐模型对同个历史内容进行多次训练会导致训练结果过拟合，得到的训练后推荐模型预测结果准确率低。

其中，过拟合可以理解为一个假设(比如，训练后推荐模型)在训练数据，比如训练样本集合的历史内容上，能够很好的拟合，但是在训练样本集合外的数据集上，比如待预测内容，却不能很好地拟合数据，此时认为这个假设出现了过拟合的现象。

可以通过基于均值参数和标准差参数对权重值进行探索，为得到与当前初始推荐模型的权重值存在差异但差异相对稳定的目标特征权重，避免出现过拟合的情况。步骤“根据权重调节参数对特征向量的权重值进行调节，得到目标权重值”，具体可以是：

若标识信息为目标标识信息，则根据随机参数、均值参数和标准差参数对权重值进行调节，得到目标权重值；

若标识信息不为目标标识信息，则根据均值参数对权重值进行调节，得到目标权重值。

比如，具体可以是，如图3所示，若标识信息为目标标识信息，则根据目标权重值和随机参数、均值参数，以及标准差参数的关系式：ω＝m+s·r，得到目标权重值。

若标识信息不为目标标识信息，则根据目标权重值和均值参数的关系式：ω＝m，得到目标权重值。

将得到的目标权重值作为初始推荐模型对特征向量进行计算处理时，赋予特征向量的权重值。

其中，ω为目标权重值，m为均值参数，s为标准差参数，r为随机参数。

在一实施例中，若标识信息为目标标识信息，则根据目标权重值和权重值与标准差参数的关系式：ω＝ω₀+s·r，对权重值进行调节，得到目标权重值；若标识信息不为目标标识信息，则权重值为目标权重值，即ω＝ω₀；将得到的目标权重值作为初始推荐模型对特征向量进行计算处理时，赋予特征向量的权重。

其中，ω为目标权重值，ω₀为权重值。

在一实施例中，随机参数满足标准正态分布r～(0，1)。

在一实施例中，随机参数r取值范围为满足区间[-1，1]的随机参数。

可选的，在初始推荐模型初始化时，m＝0，s＝1。

可选的，初始推荐模型可以包括至少一个深度神经网络隐层，可以在第一深度神经网络，即深度神经网络1中，根据权重调节参数对权重值进行调节，也可以在多个或者所有神经网络隐层中根据权重调节参数对权重值进行调节。

步骤106通过反向传播对权重调节参数进行调整可以在一层或者多层深度神经网络中应用，在此不做赘述。

在一实施例中，可以不对初始推荐模型的权重值进行调节，通过对标识信息为目标标识信息的特征向量进行加噪处理，得到处理后特征向量，加噪处理的目的在于使处理后特征向量与初始的特征向量之间存在差异，初始推荐模型对训练样本集合中重复的历史内容进行训练时不会出现过拟合的情况。

105、通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果。

其中，初始推荐模型可以是还没有完成训练的用于向终端推荐内容的机器学习模型。

其中，预测推荐结果可以是对训练样本集合中的历史内容进行预测得到的结果，比如，如果历史内容是广告，预测结果可以是0至1之间的任意数值，表示用户点击该广告的概率；如果历史内容是商品，预测结果可以是商品与用户的匹配度等等。

比如，具体可以是对目标权重值和特征向量进行加权求和，根据加权求和得到的结果进行预测，得到对历史内容的推荐结果，具体地，步骤“通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果”，包括：

通过初始推荐模型，根据目标权重值对特征向量进行加权求和处理，得到加权特征向量；

根据加权特征向量对历史内容进行预测，得到对历史内容的预测推荐结果。

比如，具体可以是根据特征向量中每个特征对应的目标权重值进行加权求和处理，得到特征向量的加权特征向量，通过激活函数，比如sigmoid函数将加权向量映射至(0，1)之间，得到预测推荐结果。

在一实施例中，若历史内容是商品和用户信息，对商品和用户信息对应的特征向量，以及对应的目标权重值进行加权求和，得到商品的加权特征向量，和用户信息的加权特征向量，计算两个向量之间的距离，根据距离得到预测推荐结果。

106、将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。

其中，预测推荐结果与目标推荐结果之间存在误差，将预测推荐结果与目标推荐结果进行收敛，即通过反向传播对初始推荐模型进行收敛，以得到训练后推荐模型。

基于标识信息确定权重调节参数，标识信息不同的历史内容所对应的权重调整参数不同，反向传播调整的权重调整参数不同。具体地，步骤“将预测推荐结果与目标推荐结果进行收敛”，包括：

若标识信息为目标标识，则通过损失函数基于所述预测推荐结果与所述目标推荐结果，计算所述均值参数的均值梯度和所述标准差参数的标准差梯度；

根据均值梯度调整均值参数，得到调整后均值参数；

根据标准差梯度调整标准差参数，得到调整后标准差参数；

根据调整后均值参数和调整后标准差参数，对预测推荐结果与目标推荐结果进行收敛。

其中，损失函数可以用于计算预测推荐结果与目标推荐结果的差距，损失函数可以是均方误差函数、均方根误差函数、平均绝对误差函数、或者是交叉熵损失函数，也可以是其他在此没有列举的损失函数。

可以理解的是，可以根据需要选择损失函数，在此不做限制。

其中，均值梯度可以通过将损失函数对均值参数进行求导得到，可以用于对均值参数进行调节，得到调整后均值参数。

其中，标准差梯度可以通过将损失函数对标准差参数进行求导得到，可以用于对标准差参数进行调节，得到调整后标准差参数。

比如，如图3所示，具体可以是若标识信息为目标标识信息，损失函数为关于均值参数m，标准差参数s的函数，可以表示为：

也可以称为函数F，通过分别求解函数F对m的导数，函数F对s的导数，得到均值参数的均值梯度Δm和标准差参数的标准差梯度Δs。

根据m′＝m+Δm·θ_m，得到调整后均值参数；根据s′＝s+Δs·θ_s，得到调整后标准差参数。

其中，x_i为输入特征向量，

为目标推荐结果，m′为调整后均值参数，s′调整后标准差参数，Δm为均值梯度，Δs为标准差梯度，θ_m为均值参数的均值学习率，θ_s为标准差参数的标准差学习率。

其中均值学习率和标准差学习率可以根据实际情况进行调整。

如果标识信息不为目标标识信息，则反向传播调节的权重调整参数为均值参数。具体地，本申请实施例提供的方法还包括：

若标识信息不为目标标识信息，则通过损失函数基于所述预测推荐结果与所述目标推荐结果，计算所述均值梯度；

根据均值梯度调整均值参数，得到调整后均值参数。

根据调整后均值参数，对预测推荐结果与目标推荐结果进行收敛。

比如，具体可以是，若标识信息不为目标标识信息，则特征向量对应的目标权重值为均值参数，即损失函数为

也称为函数F′，通过求解函数F′对m的导数，得到均值参数的均值梯度Δm，根据m′＝m+Δm·θ_m，得到调整后均值参数。

初始推荐模型对之后输入的特征向量，根据得到的调整后均值参数和调整后标准差，得到其对应的目标特征权重，通过对特征向量进行预测，得到预测结果，然后，通过反向传播再次调节权重参数，不断对初始模型进行迭代训练，直到初始推荐模型完成训练。

可选的，初始模型训练完成的条件可以是输出的预测推荐结果与目标推荐结果之间的误差满足预设阈值。

可选的，初始模型训练完成的条件可以是对训练样本集合进行了预设次数的训练，即训练样本集合中的每条历史内容输入初始推荐模型进行训练的次数为预设次数。

在一实施例中，若目标特征权重根据ω＝ω₀+s·r得到，则损失函数为关于权重值和标准差参数的函数，通过分别求解该函数对权重值和标准差参数的导数，的到权重值的梯度和标准差参数的梯度，根据权重值的梯度和标准差参数的梯度调节权重值和标准差参数，得到调整后权重值和调整后标准差参数。

若目标权重值即为权重值，则损失函数为关于权重值的函数，通过求解该函数对权重值的导数，得到权重值的梯度，根据权重值的梯度调节权重值，得到调整后权重值。

初始推荐模型对之后输入的特征向量，根据得到的调整后标准差和调整后权重值，得到其对应的目标特征权重，通过对特征向量进行预测，得到预测结果，然后，通过反向传播再次调节权重参数，不断对初始模型进行迭代训练，直到初始推荐模型完成训练。

初始推荐模型训练完成之后，可以得到训练后模型，在一实施例中，可以采用训练与应用权重差异化的方式，即对初始推荐模型训练时，基于均值参数和标准差参数对权重值进行探索，训练后推荐模型可以根据训练后得到的均值参数对待推荐内容进行预测。

可选的，对初始推荐模型训练时，基于均值参数对权重值进行探索，训练后推荐模型可以根据训练后得到的权重值对待推荐内容进行预测。

根据对待推荐内容的预测结果，向终端推荐待推荐内容。具体地，本实施例提供的方法还包括：

获取待推荐内容，并对所述待推荐内容进行特征提取，得到内容特征向量；

通过所述训练后推荐模型基于所述内容特征向量进行推荐预测，得到预测结果；

基于所述推荐预测结果从所述待推荐内容筛选出目标推荐内容，向所述终端推荐所述目标推荐内容。

其中，待推荐内容可以是与历史内容相同类型的内容，比如可以是广告、音乐、文章、或者商品等。

其中，特征提取可以是提取待推荐内容的关键词，将提取的关键词作为该待推荐内容的特征。

比如，具体可以是获取待推荐内容，提取待推荐内容的特征，根据Embedding将特征转化为内容特征向量，通过训练后推荐模型对基于训练后的权重值对内容特征向量进行加权求和，以得到预测结果，比如，预测结果可以是推荐内容与用户的匹配度，根据匹配度从待推荐内容筛选出目标推荐内容，向所述终端推荐目标推荐内容。

本申请实施例采用获取训练样本集合的历史内容；提取历史内容的携带标识信息的特征向量；基于标识信息确定特征向量的权重调节参数；根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；然后，通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；最后，将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。通过根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

在上述实施例的基础上，下面将举例做进一步详细说明。

本实施例将从内容推荐装置的角度，该内容推荐装置具体可以集成在计算机设备中，该计算机设备可以是服务器等设备。

本申请实施例提供的一种内容推荐方法，该方法可以由服务器执行，如图3所示，该逻辑代码运行方法的具体流程可以如下：

201、获取候选历史内容，根据采样率对候选历史内容进行采样，得到训练样本集合。

比如，服务器可以从数据库中获取预先存储的候选历史内容，根据候选历史内容的标识信息，判断该候选历史内容是否为目标样本，若标识信息为目标标识信息，则该候选历史内容为目标样本，根据采样率，对该候选历史内容进行复制，得到历史内容。基于历史内容生成训练样本集合，即训练样本集合包括候选历史内容，以及复制得到的相同的候选历史内容。

在一实施例中，候选历史内容可以包括广告和用户信息，广告的目标推荐结果为用户点击，或者用户不点击。将用户点击的候选历史内容定义为正样本，用户不点击的候选历史内容定义为负样本，且在实际应用场景中，用户点击的候选历史内容的数量在向用户所在终端推荐的广告的数量中占比很小，因此，将正样本设定为目标样本，可以以目标推荐结果作为标识信息，即若为正样本，则进行根据采样率进行复制。根据初始推荐模型训练所需要的数据，可以选择复制广告，或者复制广告以及用户信息。

其中，第一预设时间可以根据实际需要进行灵活设置，比如可以是在更新向终端推荐的内容的前1小时、2小时、5小时、或者是1天。

其中，第二预设时间可以根据实际需要进行灵活设置，比如可以是向终端推荐内容后的1小时、2小时，或者是1天。

202、提取训练样本集合中的历史内容的特征向量。

比如，具体可以是服务器提取历史内容的关键词，若历史内容包括图片，可以通过图片识别得到特征信息，比如历史内容是商品，则得到的特征信息可以包括商品的种类、颜色、价格、品牌、合/或类型等，将特征信息转化为向量形式，可以得到历史内容的特征向量。

可选的，服务器可以基于独热编码将特征信息转化为特征向量。

如果特征信息包括的特征数量很多，根据独热编码得到的特征向量将会十分稀疏，增加了初始推荐模型计算处理的难度，可以将稀疏的向量转化为密集向量。

比如，具体可以是服务器将特征信息映射至对应的预设维度，若预设维度有类别、颜色、价格，其中类别有5种，颜色有8种，则得到的稀疏向量维度为14。通过转化矩阵可以将稀疏向量进行降维，得到低维度的特征向量。

203、若标识信息为目标标识信息，则基于随机参数、均值参数，以及标准差参数得到目标权重值。

比如，具体可以是判断标识信息是否为目标标识信息，若标识信息为目标标识信息，则生成随机参数；根据随机参数、均值参数和标准差参数确定权重调整参数，根据权重调节参数对权重值进行调节，得到目标权重值。

比如，在一实施例中，如图4所示，权重调整参数可以是随机参数、均值参数和标准差参数，服务器根据目标权重值和随机参数、均值参数，以及标准差参数的关系式：ω＝m+s·r，得到目标权重值。

服务器将得到的目标权重值作为初始推荐模型对特征向量进行计算处理时，赋予特征向量的权重值。

可选的，随机参数满足标准正态分布r～(0，1)。

可选的，随机参数r取值范围为满足区间[-1，1]的随机参数。

204、通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果。

比如，具体可以是对目标权重值和特征向量进行加权求和，根据加权求和得到的结果进行预测，得到对历史内容的推荐结果。

205、通过损失函数基于预测推荐结果和目标推荐结果，计算均值参数的均值梯度和标准差参数的标准差梯度。

比如，具体可以是损失函数为关于均值参数m，标准差参数s的函数，可以表示为：

其中，x_i为输入特征向量，

为目标推荐结果，m为均值参数，s为标准差参数。

206、根据均值梯度和标准差梯度对预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。

比如，具体可以是服务器根据均值梯度和标准差梯度得到调整后均值参数和调整后标准差参数，再基于调整后均值参数和调整后标准差参数对预测推荐结果与目标推荐结果进行收敛。

在一实施例中，如图4所示，根据m′＝m+Δm·θ_m，得到调整后均值参数；根据s′＝s+Δs·θ_s，得到调整后标准差参数。

其中，m′为调整后均值参数，s′调整后标准差参数，Δm为均值梯度，Δs为标准差梯度，θ_m为均值参数的均值学习率，θ_s为标准差参数的标准差学习率。

其中，均值学习率和标准差学习率可以根据实际情况进行调整。

初始推荐模型对之后输入的特征向量，根据标识信息，选择得到的调整后均值参数和调整后标准差，或者调整后均值参数，以得到其对应的目标特征权重，通过对特征向量进行预测，得到预测结果，然后，通过反向传播再次调节权重参数，不断对初始模型进行迭代训练，直到初始推荐模型完成训练。

207、若标识信息不为目标标识信息，则基于均值参数得到目标权重值。

比如，具体可以是若标识信息不为目标标识信息，则服务器根据均值参数确定权重调整参数，根据权重调节参数对权重值进行调节，得到目标权重值。

比如，在一实施例中，如图4权重调整参数可以是均值参数，服务器根据目标权重值和均值参数的关系式：ω＝m，得到目标权重值。

其中，ω为目标权重值，m为均值参数。

208、通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果。

比如，具体可以是服务器对目标权重值和特征向量进行加权求和，根据加权求和得到的结果进行预测，得到对历史内容的推荐结果。

在一实施例中，若历史内容是商品和用户信息，对商品和用户信息对应的特征向量，以及对应的目标权重值进行加权求和，得到商品的加权特征向量，和用户信息的加权特征向量，服务器计算两个向量之间的距离，根据距离得到预测推荐结果。

209、通过损失函数基于预测推荐结果和目标推荐结果，计算均值参数的均值梯度。

也称为函数F′，服务器通过求解函数F′对m的导数，得到均值参数的均值梯度Δm，根据m′＝m+Δm·θ_m，得到调整后均值参数。

其中，x_i为输入特征向量，

为目标推荐结果，m为均值参数。

210、根据均值梯度对预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。

比如，具体可以是服务器根据均值梯度和标准差梯度得到调整后均值参数和调整后标准差参数，再基于调整后均值参数对预测推荐结果与目标推荐结果进行收敛。

在一实施例中，如图4所示，服务器根据m′＝m+Δm·θ_m，得到调整后均值参数，并进行反向传播对均值参数进行调整。

其中，m′为调整后均值参数，Δm为均值梯度，θ_m为均值参数的均值学习率。

其中，均值学习率可以根据实际情况进行调整。

在一实施例中，根据标识信息通过权重调节参数确定目标权重值，根据目标权重值对历史内容进行预测，以及通过反向传播对权重值进行调节可以应用于单个深度神经网络隐层，比如深度神经网络隐层1，也可以应用于多个深度神经网络隐层。

服务器对之后输入初始推荐模型的特征向量，根据标识信息，选择得到的调整后均值参数和调整后标准差，或者调整后均值参数，以得到其对应的目标特征权重，通过对特征向量进行预测，得到预测结果，然后，通过反向传播再次调节权重参数，不断对初始模型进行迭代训练，直到初始推荐模型完成训练。

初始推荐模型训练完成之后，可以得到训练后模型，服务器通过训练后模型可以与待推荐内容进行推荐预测，根据预测结果，向终端推荐待推荐内容。具体地，本实施例提供的方法还包括：

获取待推荐内容，并对待推荐内容进行特征提取，得到内容特征向量；

通过训练后推荐模型基于所述内容特征向量进行推荐预测，得到预测结果；

基于推荐预测结果从待推荐内容筛选出目标推荐内容，向终端推荐目标推荐内容。

本申请实施例采用获取候选历史内容，根据采样率对候选历史内容进行采样，得到训练样本集合；获取训练样本集合，提取训练样本集合中的历史内容的特征向量，若标识信息为目标标识信息，则基于随机参数、均值参数，以及标准差参数得到目标权重值，通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果，通过损失函数基于预测推荐结果和目标推荐结果，计算均值参数的均值梯度和标准差参数的标准差梯度，根据均值梯度和标准差梯度对预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容；若标识信息不为目标标识信息，则基于均值参数得到目标权重值，通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果，通过损失函数基于预测推荐结果和目标推荐结果，计算均值参数的均值梯度，根据均值梯度对预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。通过根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

为了更好地实施以上方法，本申请实施例还提供一种内容推荐装置，其中名词的含义与上述内容推广方法中相同，具体实现细节可以参考方法实施例中的说明。如图5所示，该内容推荐装置可以包括获取单元301、向量单元302、参数单元303、权重单元304、预测单元305、以及收敛单元306，具体如下：

(1)获取单元301：

获取单元301，用于获取训练样本集合，所述训练样本集合包括至少一条向终端推荐的历史内容，所述历史内容携带有目标推荐结果。

在一实施例中，获取单元301可以还包括采样子单元，采样子单元可以用于根据样本的标识信息，判断是否为目标样本，若是目标样本，即对目标样本进行采样，得到训练样本集合。具体地，采样子单元用于：

(2)向量单元302：

向量单元302，用于提取所述历史内容的特征向量，所述特征向量携带标识信息。

比如，具体可以是提取历史内容的关键词，若历史内容包括图片，可以通过图片识别得到特征信息，比如历史内容是商品，则得到的特征信息可以包括商品的种类、颜色、价格、品牌和/或类型等，将特征信息转化为向量形式，可以得到历史内容的特征向量。

如果特征信息包括的特征数量很多，根据独热编码得到的特征向量将会十分稀疏，增加了初始推荐模型计算处理的难度，可以将稀疏的向量转化为密集向量，比如，可以根据一个转化矩阵进行转化，具体地，向量单元302包括向量转换子单元，向量转换子单元可以用于：

提取历史内容的特征信息；

基于转换矩阵将稀疏向量转化为特征向量。

(3)参数单元303：

参数单元303，用于基于所述标识信息确定所述特征向量的权重调节参数。

(4)权重单元304：

权重单元304，用于根据所述权重调节参数对所述特征向量的权重值进行调节，得到目标权重值。

比如，具体可以根据随机参数、均值参数和标准差参数对权重值进行调节，得到目标权重值，或者根据均值参数对权重值进行调节，得到目标权重值。

可选的，权重单元304可以包括调节子单元和第二调节子单元，其中，调节子单元用于：

比如，具体可以是，若标识信息为目标标识信息，则根据目标权重值和随机参数、均值参数，以及标准差参数的关系式：ω＝m+s·r，得到目标权重值。

(5)预测单元305：

预测单元305，用于通过初始推荐模型基于所述特征向量和目标权重值，对所述历史内容进行预测，得到预测推荐结果。

比如，具体可以是对目标权重值和特征向量进行加权求和，根据加权求和得到的结果进行预测，得到对历史内容的推荐结果，具体地，预测单元305可以包括加权子单元，加权子单元可以用于：

通过初始推荐模型，根据目标权重值对特征向量进行加权求和处理，得到加权特征向量。

比如，具体可以是，若历史内容是商品和用户信息，对商品和用户信息对应的特征向量，以及对应的目标权重值进行加权求和，得到商品的加权特征向量，和用户信息的加权特征向量，计算两个向量之间的距离，根据距离得到预测推荐结果。

(6)收敛单元306：

收敛单元306，用于将所述预测推荐结果与所述目标推荐结果进行收敛，以对所述初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向所述终端推荐内容。

比如，具体可以是基于标识信息确定权重调节参数，标识信息不同的历史内容所对应的权重调整参数不同，反向传播调整的权重调整参数不同。

可选的，收敛单元306可以包括梯度子单元，梯度子单元用于：

若标识信息为目标标识，则通过损失函数基于预测推荐结果与目标推荐结果，计算均值参数的均值梯度和标准差参数的标准差梯度。

根据均值梯度调整均值参数，得到调整后均值参数。

根据标准差梯度调整标准差参数，得到调整后标准差参数。

比如，具体可以是若标识信息为目标标识信息，损失函数为关于均值参数m，标准差参数s的函数，可以表示为：

根据m′＝m+Δm·θ_m，得到调整后均值参数。

根据s′＝s+Δs·θ_s，得到调整后标准差参数。

其中，x_i为输入特征向量，

若标识信息不为目标标识信息，则通过损失函数基于所述预测推荐结果与所述目标推荐结果，计算均值梯度；

根据均值梯度调整均值参数，得到调整后均值参数；

可选的，收敛单元306还可以包括推荐子单元，推荐子单元用于：

通过训练后推荐模型基于内容特征向量进行推荐预测，得到预测结果；

比如，具体可以是获取待推荐内容，提取待推荐内容的特征，铜火锅Embedding将特征转化为内容特征向量，通过训练后推荐模型对基于训练后的权重值对内容特征向量进行加权求和，以得到预测结果，根据预测结果向终端推荐待推荐内容。

本申请实施例通过获取单元301获取训练样本集合的历史内容；由向量单元302提取历史内容的携带标识信息的特征向量；通过参数单元303基于标识信息确定特征向量的权重调节参数；再由权重单元304根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；然后，经预测单元305通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；最后，通过收敛单元306将预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。通过根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

本申请实施例还提供一种计算机设备，本申请实施例还提供一种计算机设备，该计算机设备可以是服务器，如图6所示，其示出了本申请实施例所涉及的服务器的结构示意图，具体来讲：

该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图6中示出的服务器结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

服务器还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该服务器还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，服务器还可以包括显示单元等，在此不再赘述。具体在本实施例中，服务器中的处理器401会按照如下的指令，将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的计算机程序，从而实现各种功能，如下：

获取训练样本集合；提取历史内容的特征向量；基于标识信息确定特征向量的权重调节参数；根据权重调节参数对特征向量的权重值进行调节，得到目标权重值；通过初始推荐模型基于特征向量和目标权重值，对历史内容进行预测，得到预测推荐结果；预测推荐结果与目标推荐结果进行收敛，以对初始推荐模型进行训练，得到训练后推荐模型，以通过训练后推荐模型向终端推荐内容。

以上各个操作的具体实施可参见前面的实施例，在此不作赘述。

由上可知，本实施例的服务器根据标识信息确定权重调节参数，并对权重进行调整，初始推荐模型进行训练时，权重之间存在差异性，使训练后推荐模型输出的预测结果准确率高，实现准确推荐相关内容。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成，或通过计算机程序控制相关的硬件来完成，该计算机程序可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中各种可选实现方式中提供的方法。

为此，本申请实施例提供一种存储介质，其中存储有计算机程序，该计算机程序被处理器进行加载，以执行本申请实施例所提供的任一种内容推荐方法。

以上内容推荐方法的各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的计算机程序，可以执行本申请实施例所提供的任一种内容推荐方法中的步骤，因此，可以实现本申请实施例所提供的任一种内容推荐方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种内容推荐方法、装置、计算机设备和存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上该，本说明书内容不应理解为对本申请的限制。

Claims

1.一种内容推荐方法，其特征在于，包括：

基于所述标识信息确定所述特征向量的权重调节参数；

2.根据权利要求1所述的方法，其特征在于，所述权重调节参数包括随机参数、均值参数和标准差参数，所述根据所述权重调节参数对所述特征向量的权重值进行调节，得到目标权重值，包括：

若所述标识信息为目标标识信息，则根据所述随机参数、所述均值参数和所述标准差参数对所述权重值进行调节，得到目标权重值；

若所述标识信息不为目标标识信息，则根据所述均值参数对所述权重值进行调节，得到所述目标权重值。

3.根据权利要求2所述的方法，其特征在于，所述将所述预测推荐结果与所述目标推荐结果进行收敛，包括：

若所述标识信息为目标标识信息，则通过损失函数基于所述预测推荐结果与所述目标推荐结果，计算所述均值参数的均值梯度和所述标准差参数的标准差梯度；

根据所述均值梯度调整所述均值参数，得到调整后均值参数；

根据所述标准差梯度调整所述标准差参数，得到调整后标准差参数；

根据所述调整后均值参数和所述调整后标准差参数，对所述预测推荐结果与所述目标推荐结果进行收敛。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

若所述标识信息不为目标标识信息，则通过损失函数基于所述预测推荐结果与所述目标推荐结果，计算所述均值梯度；

根据所述调整后均值参数，对所述预测推荐结果与所述目标推荐结果进行收敛。

5.根据权利要求1所述的方法，其特征在于，所述通过初始推荐模型基于所述特征向量和目标权重值，对所述历史内容进行预测，得到预测推荐结果，包括：

通过所述初始推荐模型，根据所述目标权重值对所述特征向量进行加权求和处理，得到加权特征向量；

根据所述加权特征向量对历史内容进行预测，得到对所述历史内容的预测推荐结果。

6.根据权利要求1至5所述的任一方法，其特征在于，所述训练样本集合包括样本集合，所述获取训练样本集合之前，所述方法还包括：

获取样本集合中的候选历史内容，所述候选历史内容携带所述标识信息，所述标识信息包括采样率；

若所述标识信息为目标标识信息，则根据所述采样率对所述候选历史内容进行采样，得到所述历史内容，基于所述历史内容生成训练样本集合。

7.根据权利要求1所述的方法，其特征在于，所述提取所述历史内容的特征向量，所述特征向量携带标识信息，包括：

提取所述历史内容的特征信息；

基于转换矩阵将所述稀疏向量转化为特征向量。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

9.一种内容推荐装置，其特征在于，包括：

10.一种存储介质，其特征在于，所述存储介质用于存储计算机程序，所述计算机程序被处理器加载以执行权利要求1至8任一项所述的内容推荐方法。