CN116932862A

CN116932862A - 冷启动对象推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN116932862A
Application number: CN202210326097.XA
Authority: CN
Inventors: 陈昊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-10-24
Also published as: US20240037133A1; WO2023185320A1

Abstract

本申请涉及一种冷启动对象推荐方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取冷启动状态下目标对象的内容特征和初始偏好特征；基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系；所述元映射网络，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的；按照所述特征映射关系对所述初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；所述目标偏好特征空间分布，用于表征所述推荐对象所对应偏好特征的空间分布；基于所述更新偏好特征对所述目标对象进行推荐分析，得到针对所述目标对象的推荐结果。采用本方法能够提高冷启动阶段下目标对象的推荐准确性。

Description

冷启动对象推荐方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种冷启动对象推荐方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着计算机技术的发展，出现了越来越多的人机交互场景。例如，用户日常交互的对象如短视频、图像、文章等，一般都是需要用户主动搜索才能找到其偏好的对象。对于系统所提供海量的交互对象，主动搜索的操作过程复杂，且需要消耗大量的数据处理资源。为解决这一问题，通过主动为用户提供其偏好的对象进行推荐，能够极大程度上提高交互有效性，为用户的日常生活和娱乐极大地提供方便。

然而，传统的对象推荐方式，一般向用户推荐的是基于用户与对象的交互数据，确定对象的偏好用户，从而向该偏好用户推荐该对象，但这种对象推荐方式依赖于用户与对象的交互数据，对于冷启动状态下，由于没有交互数据或是交互数据较少的对象，无法实现对象的准确推荐。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高推荐准确性的冷启动对象推荐方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种冷启动对象推荐方法。所述方法包括：

获取冷启动状态下目标对象的内容特征和初始偏好特征；

基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系；所述元映射网络，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的；

按照所述特征映射关系对所述初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；所述目标偏好特征空间分布，用于表征所述推荐对象所对应偏好特征的空间分布；

基于所述更新偏好特征对所述目标对象进行推荐分析，得到针对所述目标对象的推荐结果。

第二方面，本申请还提供了一种冷启动对象推荐装置。所述装置包括：

特征获取模块，用于获取冷启动状态下目标对象的内容特征和初始偏好特征；

特征处理模块，用于基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系；所述元映射网络，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的；

映射变换模块，用于按照所述特征映射关系对所述初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；所述目标偏好特征空间分布，用于表征所述推荐对象所对应偏好特征的空间分布；

推荐分析模块，用于基于所述更新偏好特征对所述目标对象进行推荐分析，得到针对所述目标对象的推荐结果。

在一个实施例中，所述特征获取模块包括内容特征获取模块和初始偏好特征获取模块；

所述内容特征获取模块，用于获取目标对象的内容描述数据，对所述内容描述数据进行向量转换，得到所述目标对象的内容特征；

所述初始偏好特征获取模块，用于获取满足目标偏好特征空间分布的推荐对象各自所对应的偏好特征；对各所述偏好特征进行全局平均池化处理，将得到的全局平均偏好特征，作为所述冷启动的目标对象的初始偏好特征。

在一个实施例中，所述目标对象包括目标视频；所述内容特征获取模块，还用于获取针对目标视频的补充描述信息，并提取所述目标视频中的关键视频帧；对所述关键视频帧进行图像识别处理，得到所述关键视频帧中的视频内容信息；将所述补充描述信息和所述视频内容信息，确定为所述目标对象的内容描述数据。

在一个实施例中，所述特征映射关系包括拉伸函数；所述映射变换模块包括拉伸模块，用于按照所述拉伸函数对所述初始偏好特征的特征分布进行拉伸处理，将所述内容特征融入所述初始偏好特征的拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征。

在一个实施例中，所述特征处理模块包括拉伸函数确定模块，用于基于所述元映射网络中的元拉伸网络参数，对所述内容特征进行多层感知处理，得到使所述初始偏好特征趋近于所述目标偏好特征空间分布进行拉伸的拉伸函数。

在一个实施例中，所述特征映射关系还包括偏移函数；所述拉伸模块，用于基于所述拉伸函数，对所述初始偏好特征的特征分布进行拉伸处理，将所述内容特征融入所述初始偏好特征的拉伸空间，得到中间偏好特征；

所述映射变换模块还包括偏移模块，用于基于所述偏移函数，对所述中间偏好特征的特征分布进行偏移调整，以去除所述中间偏好特征中的噪声数据，得到更新偏好特征。

在一个实施例中，所述特征处理模块包括偏移函数确定模块，用于获取针对所述目标对象的交互数据；基于所述元映射网络中的元偏移网络参数，对所述交互数据进行多层感知处理，得到使所述中间偏好特征趋近于所述目标偏好特征空间分布进行偏移的偏移函数。

在一个实施例中，所述冷启动对象推荐装置还包括特征聚合模块，用于对所述交互数据中的交互偏好特征进行聚合处理，得到聚合交互特征；

所述偏移函数确定模块，还用于基于所述元映射网络中的元偏移网络参数，对所述聚合交互特征进行多层感知处理，得到使所述中间偏好特征趋近于所述目标偏好特征空间分布进行偏移的偏移函数。

在一个实施例中，所述冷启动对象推荐装置还包括元映射网络训练模块，用于从推荐对象的冷启动模拟数据中获取推荐反馈标签，并确定针对所述推荐对象的推荐结果；计算所述推荐结果与所述推荐反馈标签的损失数据；通过梯度下降优化算法，基于所述损失数据对初始元映射网络的参数进行迭代训练，直至满足训练停止条件，得到所述元映射网络。

在一个实施例中，所述元映射网络训练模块，还用于基于所述初始元映射网络，将所述推荐对象的初始偏好特征转换为符合目标偏好特征空间分布的更新偏好特征；分别计算所述初始偏好特征所对应推荐结果与所述推荐反馈标签的第一损失数据、以及所述更新偏好特征所对应推荐结果与所述推荐反馈标签的第二损失数据；所述第一损失数据，用于对所述初始元映射网络的参数进行更新；所述第二损失数据，用于对所述初始偏好特征进行更新。

在一个实施例中，所述冷启动对象推荐装置还包括训练数据获取模块，用于从样本对象中筛选出交互数据符合交互条件、且推荐效果达到预期效果的样本对象；基于所述样本对象的交互数据中的被推荐对象数据、接收对象数据以及推荐反馈标签，构建三元组；将所述三元组作为用于对所述初始元映射网络进行参数训练的交互数据。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取冷启动状态下目标对象的内容特征和初始偏好特征；

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取冷启动状态下目标对象的内容特征和初始偏好特征；

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

获取冷启动状态下目标对象的内容特征和初始偏好特征；

上述冷启动对象推荐方法、装置、计算机设备、存储介质和计算机程序产品，通过获取冷启动状态下目标对象的内容特征和初始偏好特征，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，由于更新偏好特征的空间分布趋近于推荐对象所对应偏好特征的空间分布，能够确定冷启动状态下的目标对象能够学习到准确的偏好特征，进而基于更新偏好特征对目标对象进行推荐分析，得到更为准确的推荐结果。

附图说明

图1为一个实施例中冷启动对象推荐方法的应用环境图；

图2为一个实施例中冷启动对象推荐方法的流程示意图；

图3为一个实施例中处于冷启动状态下的目标对象的示意图；

图4为一个实施例中多层感知处理机的结构示意图；

图5为一个实施例中推荐显示冷启动对象的界面示意图；

图6为另一个实施例中冷启动对象推荐方法的流程示意图；

图7为一个实施例中确定短视频的内容特征的流程示意图；

图8为一个实施例中冷启动对象推荐装置的结构框图；

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的方案可以涉及人工智能(Artificial Intelligence，简称为AI)、机器学习(Machine Learning，简称为ML)等技术。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。基于人工智能和机器学习等技术，能够获取冷启动状态下目标对象的内容特征和初始偏好特征，基于通过推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系；按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；使得更新偏好特征的空间分布趋近于推荐对象所对应偏好特征的空间分布，基于更新偏好特征对目标对象进行推荐分析，得到准确的推荐结果。

本申请实施例提供的冷启动对象推荐方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他服务器上。服务器104获取冷启动状态下目标对象的内容特征和初始偏好特征，基于通过是基于推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，服务器104基于更新偏好特征对目标对象进行推荐分析，得到针对目标对象的推荐结果，并在推荐结果符合推荐条件时，将目标对象推荐至推荐结果所指示用户所在的终端102进行显示，其中，终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种冷启动对象推荐方法，本申请实施例可以应用于信息推荐展示的应用，预估用户可能感兴趣的信息进行精准推荐，该推荐场景可以为文本的推荐场景、视频的推荐场景或者音乐的推荐场景等，本申请实施例将以短视频的推荐场景为例详细介绍本申请提供的冷启动对象推荐方法，该场景仅为示例，并不对本申请技术方案的保护范围造成限制。以该方法应用于图1中的计算机设备为例进行说明，包括以下步骤：

步骤202，获取冷启动状态下目标对象的内容特征和初始偏好特征。

其中，目标对象是指在终端设备上呈现的可与接收对象实现交互的被推荐对象，包括但不限于展示的商品对象、音视频对象、电子读物对象等等。接收对象是实际存在的对象，包括但不限用户和/或用户所使用的设备如客户端等，接收对象与被推荐对象交互产生的交互具体形式可因场景不同而不同，包括但不限于：点赞、转发、浏览、订购、收藏、分享、评论等等。具体地，在不同的场景下，接收对象进行交互的目标对象也可能不同。例如，在多媒体场景下，目标对象可以为点赞、收藏或转发的多媒体文件，如音乐、短视频、文章等；在电商场景下，目标对象可以为加入购物车的物品或者已经购买过的物品；在广告场景下，目标对象可以为已经观点击或收藏过的广告等等。

在被推荐对象的推荐系统中，被推荐对象是不断增加的，对于新增的被推荐对象，其缺乏与接收对象的交互数据，其进入推荐系统进行推荐的过程缺乏可参考的交互数据为冷启动过程，新增的被推荐对象在冷启动过程中所处的状态即为冷启动状态。具体来说，以短视频推荐系统为例，创作者新上传的短视频即为处于冷启动状态下的目标对象，由于暂时没有其他用户对该短视频的完播、点赞、分享等交互记录，推荐系统难以识别该短视频所属的用户偏好，容易造成目标推荐人群不准确，影响推荐转化率，即为短视频的冷启动问题。

内容特征是从与目标对象匹配的内容数据中所提取的特征，内容数据包括对目标对象的详细描述。如图3所示，内容数据可以包括用户在上传目标对象时所填写的标题、类别、描述等跟内容相关的可用信息，以及通过对目标对象进行内容提取所得到的信息。

偏好特征用于表征目标对象对于与其发生交互的接收对象的偏好，初始偏好特征是目标对象在冷启动状态下赋予的偏好特征，具体地，初始偏好特征可以是推荐系统随机生成的偏好特征，也可以基于现有的所有具备足够交互数据且得到充分学习的推荐对象的特征分布特点，生成的偏好特征。

具体地，计算机设备响应于目标对象新增事件，查找目标对象所对应的交互数据，基于交互数据的数据量确定目标对象的当前状态，当交互数据的数据量为零或是小于设定的数据量阈值时，判定新增的目标对象所处的状态为冷启动状态。计算机设备基于目标对象所包含的内容数据，提取出目标对象的内容特征，并基于目标对象的对象标识信息，确定目标对象的初始偏好特征。

步骤204，基于元映射网络对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系；元映射网络，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的。

其中，元映射网络是基于推荐对象在模拟冷启动状态下的交互数据训练得到的网络模型，推荐对象可以是推荐系统中，现有的交互数据的数据量达到数量阈值且推荐成功率达到概率阈值的推荐对象，其中，数据量达到数量阈值表征推荐对象具备足够的交互数据，推荐成功率达到概率阈值表征推荐对象的偏好数据在推荐系统中得到充分学习，能够实现精准的推荐。

模拟冷启动状态是指处于非冷启动状态下的推荐对象通过交互数据筛选，模拟出的冷启动状态，通过模拟推荐对象的冷启动状态，能够充分学习冷启动状态下的偏好特征分布与处于非冷启动状态下的推荐对象之间的偏好特征的空间分布特点，训练初始元映射网络中的网络参数，以使训练得到的元映射网络能够针对目标对象生成一一对应的特征映射关系，进而通过特征映射关系，将目标对象的初始偏好特征，转换为趋近于推荐对象所对应偏好特征的空间分布的更新偏好特征。

多层感知处理是指基于多个维度的数据映射到单一数据上的过程。具体地，多层感知的映射处理可以通过多层感知机(又称人工神经网络模型)来实现。如图4所示，多层感知机包括除了输入输出层，中间可以有多个隐藏层，多层感知机层与层之间是全连接的。具体来说，多层感知机的最底层是输入层，中间是隐藏层，最后是输出层。隐藏层的神经元与输入层是全连接的，假设输入层用向量X表示，则隐藏层的输出为f(W₁X+b₁)，W₁是输入层与隐藏层之间的连接系数，b₁是输入层到隐藏层的偏置，函数f可以是常用的sigmoid函数或者tanh函数。隐藏层到输出层是一个多类别的逻辑回归，也即softmax回归，输出层的输出为：softmax(W₂X₁+b₂)，X₁表示隐藏层的输出f(W₁X+b₁)，W₂是隐藏层与输出层之间的连接系数，b₂是隐藏层到输出层的偏置。

通过多层感知处理实质上是将内容特征作为多层感知机的输入数据，基于多层感知机中各层中所包含的训练完成的参数进行逻辑分析，得到的输出结果即为与目标对象相匹配的特征映射关系。其中，多层感知机中各层的参数包括各个层之间的连接权重以及偏置，包括W1、b1、W2、b2等。多层感知机中各层的参数的确定可以通过模型训练得到，具体训练过程包括：首先随机初始化多层感知机的所有参数，然后迭代地训练，不断地计算梯度和更新参数，直到满足训练结束条件为止，训练结束条件可以是准确度满足准确度要求、误差满足误差要求或是迭代次数满足次数要求等条件中的至少一个。

特征映射关系是用于对初始偏好特征进行映射变换所需要遵循的数据处理规则，特征映射关系具体可以包括特征空间的拉伸、特征空间的偏移等处理逻辑中的至少一种。具体地，特征映射关系可以是对初始偏好特征进行特征空间拉伸以融入内容特征，也可以是对初始偏好特征进行特征空间偏移已过滤噪声特征，还可以是先对初始偏好特征进行特征空间拉伸以融入内容特征，再进行特征空间偏移已过滤噪声特征，具体可以根据实际场景需要进行设定。

具体地，计算机设备在目标对象的内容特征之后，基于通过推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对目标对象的内容特征进行多层感知处理，得到与目标对象相匹配的特征映射关系。当目标对象的数量为多个时，计算机设备可以基于训练得到的元映射网络，采用多进程同时对各目标对象进行多层感知处理，得到与每一目标对象各自匹配的特征映射关系。

步骤206，按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；目标偏好特征空间分布，用于表征推荐对象所对应偏好特征的空间分布。

其中，映射变换是按照特征映射关系对初始偏好特征的特征空间分布进行变换处理的过程，例如按照特征映射关系对初始偏好特征进行特征空间拉伸、特征空间偏移等。

目标偏好特征空间分布用于表征推荐对象所对应偏好特征的空间分布，具体来说，在大量的推荐目标的交互数据上训练的推荐系统，为推荐目标的偏好特征分配了特定的特征空间，表现为推荐对象的偏好特征满足某种特定分布，即目标偏好特征空间分布。而冷启动状态下的目标对象在记录足够的交互数据之前，其偏好特征的空间分布与目标偏好特征空间分布存在差距，冷启动状态下的目标对象从足够的交互数据中学到偏好信息后，其偏好特征分布会逐渐向目标偏好特征空间分布收敛。

更新特征偏好是初始偏好特征进行映射变换所得到的结果，更新偏好特征的特征空间相较于初始偏好特征，更趋近于目标偏好特征空间分布，基于更新偏好特征进行推荐分析，能够规避冷启动状态下由于缺乏足够的交互数据而导致目标对象的初始偏好特征与目标偏好特征空间分布存在较大差异的弊端，基于趋近于目标偏好特征空间分布的更新偏好特征进行推荐分析，得到更为准确的推荐结果。

具体地，计算机设备在获取到这对目标对象的特征映射关系之后，按照特征映射关系，对目标对象所对应的初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，进而基于更新偏好特征进行推荐分析。

步骤208，基于更新偏好特征对目标对象进行推荐分析，得到针对目标对象的推荐结果。

其中，推荐分析可以是针对目标对象所偏好的接收对象群体的分析，也可以是针对指定接收对象确判定是否需要进行推荐的分析。相应的，当推荐分析为针对目标对象所偏好的接收对象群体时，推荐结果为根据更新偏好特征，将目标对象推荐至符合推荐条件的目标接收对象。当推荐分析为针对指定接收对象确判定是否需要进行推荐时，推荐结果包括向指定接收对象进行目标对象推荐或不向指定接收对象进行目标对象推荐。如图5所示，当用户A在第一终端上传新的短视频1时，短视频1在推荐系统中处于冷启动状态，通过上述冷启动对象推荐方法，确定第二终端为短视频1的偏好接收对象，从而将短视频1在第二终端进行推荐显示。

上述冷启动对象推荐方法，通过获取冷启动状态下目标对象的内容特征和初始偏好特征，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，由于更新偏好特征的空间分布趋近于推荐对象所对应偏好特征的空间分布，能够确定冷启动状态下的目标对象能够学习到准确的偏好特征，进而基于更新偏好特征对目标对象进行推荐分析，得到更为准确的推荐结果。

在一个实施例中，如图6所示，获取冷启动的目标对象的内容特征和初始偏好特征，包括：

步骤602，获取目标对象的内容描述数据，对内容描述数据进行向量转换，得到目标对象的内容特征。

步骤604，获取满足目标偏好特征空间分布的推荐对象各自所对应的偏好特征。

步骤606，对各偏好特征进行全局平均池化处理，将得到的全局平均偏好特征，作为冷启动的目标对象的初始偏好特征。

其中，内容描述数据是用于表征目标对象的详细信息的原始数据，具体可以包括标题、类别、简要描述以及详细内容等。向量转换是指将内容描述数据转换为连续向量的过程。向量转换具体可以通过嵌入技术来实现，嵌入技术是一种能够将原始数据转化为连续向量的技术，所得到的连续向量可以被称为嵌入特征，计算机识别将内容描述数据的原始数据输入嵌入层进行嵌入处理之后，得到内容描述数据所对应的嵌入特征。满足目标偏好特征空间分布的推荐对象，是推荐系统中具备足够交互数据且得到充分学习的对象，全局平均池化处理是指将全局特征进行平均处理并输出平均特征值的处理过程。

在一个具体的应用中，以目标对象为短视频为例，在冷启动短视频进入推荐系统时，推荐模型为目标对象随机初始化一个初始偏好特征，但随机初始化的初始偏好特征中几乎不会包含与冷启动短视频相关的信息，无法达到准确的推荐效果。通过对现有的具备足够交互数据且得到充分学习的已有短视频的偏好特征执行全局平均池化操作，得到全局平局偏好特征，作为一般化的偏好特征。在冷启动短视频进入推荐系统时，即对于零样本阶段的冷启动视频，使用一般化的偏好特征作为冷启动短视频的初始偏好特征，这种偏好特征初始化方法，为冷启动短视频提供了距离目标偏好特征空间分布差距尽可能小的初始偏好特征。

在本实施例中，通过对推荐对象的偏好特征执行全局平均池化操作，得到全局平局偏好特征作为目标对象的初始偏好特征，能够使得初始偏好特征在初始阶段距离目标偏好特征空间分布差距尽可能小，从而加速目标对象适配推荐系统进行准确推荐的进度。

在一个实施例中，目标对象包括目标视频；获取目标对象的内容描述数据，包括：获取针对目标视频的补充描述信息，并提取目标视频中的关键视频帧；对关键视频帧进行图像识别处理，得到关键视频帧中的视频内容信息；将补充描述信息和视频内容信息，确定为目标对象的内容描述数据。

其中，如图7所示，补充描述信息可以是标题、类别、简要描述等跟视频内容相关的用户直接针对目标视频进行编辑输入的可用信息。目标视频中的关键视频帧可以是按照指定节点从目标视频中所抽取的视频帧，例如按照指定的时间间隔进行抽取或是按照指定的帧间间隔进行抽取等。图像识别处理具体可以是获取关键视频帧中的内容信息的处理过程，例如识别视频中的文字、图像中的物品类别等。

具体地，计算机设备针对目标视频进行关联信息获取，得到针对目标视频的补充描述信息，并按照视频帧提取参数，提取目标视频中的关键视频帧，通过对关键视频帧进行图像识别处理，得到关键视频帧中的视频内容信息，计算机设备将补充描述信息和视频内容信息，确定为目标对象的内容描述数据进行特征嵌入处理，得到目标对象的内容特征。

在本实施例中，对于目标视频，通过对目标视频中抽取关键视频帧进行图像识别处理，能够充分利用视频的标题、类别、描述等补充描述内容以及视频帧中的内容来得到内容特征，从而能够尽可能地从目标视频中提取出目标视频的偏好信息，进而为后续实现准确推荐提供基础。

在一个实施例中，特征映射关系包括拉伸函数；按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，包括：按照拉伸函数对初始偏好特征的特征分布进行拉伸处理，将内容特征融入初始偏好特征的拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征。

其中，拉伸函数是用于实现初始偏好特征D_c到目标偏好特征空间分布D_t的映射的拉伸操作的函数，通过拉伸操作可以得到拉伸空间，进而将目标对象的内容特征融入拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征。

具体地，针对特征分布空间进行拉伸处理具体可以是基于指定拉伸方向和拉伸距离实现，例如按特征向量行方向进行拉伸或是按照特征向量列方向进行拉伸，再或者同时基于行方向或是列方向进行拉伸等，拉伸方向和拉伸距离可以基于拉伸函数来确定。

在本实施例中，通过将目标对象的偏好特征朝着适配目标偏好特征空间分的方向执行拉伸变换，加速目标对象适配推荐系统的进度，快速准确地得到针对目标对象的推荐结果。

在其中一个实施例中，基于元映射网络对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，包括：基于元映射网络中的元拉伸网络参数，对内容特征进行多层感知处理，得到使初始偏好特征趋近于目标偏好特征空间分布进行拉伸的拉伸函数。

其中，元拉伸网络用于实现初始偏好特征的空间分布D_c到目标偏好特征空间分布D_t的映射的拉伸操作，该拉伸操作由元拉伸网络针对每个目标对象生成的拉伸函数完成。元拉伸网络参数是元映射网络中通过训练得到的、用于生成对偏好特征进行拉伸操作的偏移参数所需的参数。

具体地，目标对象的内容特征往往包含了部分偏好信息，表现为偏好特征相似的对象，其内容特征也相对相似。将内容特征作为元拉伸网络的输入，元拉伸网络可以提取内容特征中与偏好相关的信息，得到的拉伸函数通过将目标对象的偏好特征朝着D_t的方向进行拉伸，将内容特征中与偏好相关的信息融入偏好特征中。元拉伸网络的表达式如下：

其中w_scale是元拉伸网络中的参数，可通过网络训练进行迭代更新，h为多层感知机模型，具体可以为两层的多层感知机模型，为拉伸函数。由D_c到D_t的映射的拉伸操作可表示为/>⊙表示按元素相乘。

在本实施例中，通过元映射网络中的元拉伸网络参数，对内容特征进行多层感知处理，得到拉伸函数，使得基于拉伸函数得到的更新偏好特征的空间分布趋近于推荐对象所对应偏好特征的空间分布，能够确定冷启动状态下的目标对象能够学习到准确的偏好特征，进而针对目标对象得到更为准确的推荐结果。

在一个实施例中，特征映射关系还包括偏移函数；按照拉伸函数对初始偏好特征的特征分布进行拉伸处理，将内容特征融入初始偏好特征的拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征，包括：基于拉伸函数，对初始偏好特征的特征分布进行拉伸处理，将内容特征融入初始偏好特征的拉伸空间，得到中间偏好特征；基于偏移函数，对中间偏好特征的特征分布进行偏移调整，以去除中间偏好特征中的噪声数据，得到更新偏好特征。

其中，偏移函数是用于实现初始偏好特征D_c到目标偏好特征空间分布D_t的映射的偏移操作的函数，通过偏移操作将拉伸处理后的中间偏好特征的噪声数据进行过滤，得到趋近于目标偏好特征空间分布的更新偏好特征。针对特征分布空间进行偏移处理具体可以是基于指定偏移方向和偏移距离实现，例如按特征向量行方向进行偏移或是按照特征向量列方向进行偏移，再或者依次基于行方向或是列方向分别进行偏移等，偏移方向和偏移距离可以基于偏移函数来确定。

具体地，计算机设备基于拉伸函数，先对目标对象所对应的初始偏好特征的特征分布进行拉伸处理，确定初始偏好特征的拉伸空间，然后将目标对象所对应的内容特征融入初始偏好特征的拉伸空间，得到拉伸后的中间偏好特征，再基于偏移函数，对中间偏好特征的特征分布进行偏移调整，以去除中间偏好特征中的噪声数据，得到目标对象所对应的更新偏好特征。

在本实施例中，通过将目标对象的偏好特征朝着适配目标偏好特征空间分的方向，依次执行拉伸变换和偏移调整，能够使得更新偏好特征更趋近于目标偏好特征空间分布，从而能够加速目标对象适配推荐系统的进度，快速准确地得到针对目标对象的推荐结果。

在一个实施例中，基于元映射网络对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，包括：获取针对目标对象的交互数据；基于元映射网络中的元偏移网络参数，对交互数据进行多层感知处理，得到使中间偏好特征趋近于目标偏好特征空间分布进行偏移的偏移函数。

其中，针对目标对象的交互数据可以是冷启动阶段所获取的少量交互数据，也可以是随机生成的服从随机分布的交互数据。元偏移网络参数是元映射网络中通过训练得到的、用于生成对偏好特征进行偏移操作的偏移参数所需的参数。

在一个具体的应用中，元偏移网络主要负责对拉伸后的中间偏好特征进行偏移调整，一方面是过滤中间偏好特征中的噪声数据，另一方面是让更新得到的更新偏好特征D_c更接近目标偏好特征空间分布D_t。以目标对象为短视频为例，从交互数据中学习偏好信息，是冷启动短视频的偏好特征从D_c靠近D_t最直接的方法。然而，交互数据中不可避免地会存在部分噪音，例如误触双击了短视频。噪音会对偏好特征的学习造成较大的消极影响。元偏移网络通过识别冷启动短视频的交互数据中的噪音，为每个冷启动短视频生成具有过滤作用进行偏移的偏移参数。

在本实施例中，通过获取针对目标对象的交互数据，基于元映射网络中的元偏移网络参数，对交互数据进行多层感知处理，得到使中间偏好特征趋近于目标偏好特征空间分布进行偏移的偏移函数，能够基于交互数据对中间偏好特征进行偏移调整，保留中间偏好特征从交互数据中学到的有用信息，过滤噪音产生的错误信息，提高更新偏好特征与目标偏好特征空间分布的适配度。

在一个实施例中，方法还包括：对交互数据中的交互偏好特征进行聚合处理，得到聚合交互特征；基于元映射网络中的元偏移网络参数，对交互数据进行多层感知处理，得到使中间偏好特征趋近于目标偏好特征空间分布进行偏移的偏移函数，包括：基于元映射网络中的元偏移网络参数，对聚合交互特征进行多层感知处理，得到使中间偏好特征趋近于目标偏好特征空间分布进行偏移的偏移函数。

其中，交互偏好特征是指与目标对象进行交互的各接收对象的偏好特征。对交互偏好特征进行聚合处理是指将交互偏好特征进行特征聚合，例如基于均值函数对各交互偏好特征进行均值化处理。在具体的应用中，以目标对象为短视频为例，聚合交互特征可以是点赞过短视频i的各用户的平均偏好特征。

在一个具体的应用中，以目标对象为短视频i为例，短视频i的全局正反馈集，即点赞过短视频i的各用户的偏好特征的集合表示为U(i)＝{u_j|y(i，u)＝1}。在冷启动问题的少样本阶段，|U(i)|＞0。元偏移网络在冷启动问题的少样本阶段发挥作用。元偏移网络的表示如下：

其中w_shift是元偏移网络中的可学习参数，g通常为两层的多层感知机模型，为聚合函数，/>为偏移函数。基于拉伸函数/>和偏移函数/>由初始偏好特征D_c到目标偏好特征空间分布D_t的映射可以表示为：

其中表示按元素相加。

在本实施例中，通过获取针对目标对象的交互数据，对交互数据中的交互偏好特征进行聚合处理，能够使得用于进行多层感知处理的聚合交互特征能够表征交互数据的平均水平，进而使得得到的偏移参数能够生成偏移函数更有效实现过滤噪音产生的错误信息，提高更新偏好特征与目标偏好特征空间分布的适配度。

在一个实施例中，元映射网络的参数训练过程包括：从推荐对象的交互数据中获取推荐反馈标签，并确定针对推荐对象的推荐结果；计算推荐结果与推荐反馈标签的第一损失数据；通过梯度下降优化算法，基于第一损失数据对初始元映射网络的参数进行迭代训练，直至满足训练停止条件，得到元映射网络。

其中，推荐反馈标签用于表征接收对象针对推荐的对象是否能够交互的反馈结果，其中推荐反馈标签可以是二分类标签，包括正反馈标签和负反馈标签，在一个具体的应用中，推荐反馈标签包括0和1，0表示负反馈，如用户直接划过推荐的短视频；1表示正反馈，如用户点赞推荐的短视频。针对交互数据的推荐结果是指基于推荐对象的初始偏好特征和交互数据进行推荐分析处理所得到的结果。初始元映射网络是指初始状态下的元映射网络，通过迭代训练可以对初始元映射网络的参数进行迭代更新，得到元映射网络。

具体地，对于推荐对象的推荐结果预测，可以表示为：

其中，θ表示推荐模型的参数。

对数损失数据通常被用作二分类任务的损失数据函数，即优化目标，计算和y之间损失数据如下：

其中φ表示嵌入层参数，即接收对象和目标对象的嵌入。计算出推荐结果和推荐反馈标签y之间的损失数据后，即可通过基于梯度下降的优化方法，优化模型中的可学习参数θ和φ，让推荐模型学习接收对象和目标对象之间的关系。

在本实施例中，通过从推荐对象的冷启动模拟数据中获取推荐反馈标签，并确定针对推荐对象的推荐结果，以计算推荐结果与推荐反馈标签的损失数据，进而通过梯度下降优化算法，基于损失数据对初始元映射网络的参数进行迭代训练，直至满足训练停止条件，以使得到的元映射网络能够在应用过程中针对目标对象生成更为准确的特征映射关系，进而提高映射转换就的更新偏好特征更趋近于目标偏好特征空间分布，得到准确的推荐结果。

在一个实施例中，方法还包括：从样本对象中筛选出交互数据符合交互条件、且推荐效果达到预期效果的样本对象；基于样本对象的交互数据中的被推荐对象数据、接收对象数据以及推荐反馈标签，构建三元组；将三元组作为用于对初始元映射网络进行参数训练的交互数据。

具体来说，用于对初始元映射网络进行参数训练的交互数据包括短视频、用户、标签三个实体(i，J，y)，其中i，j分别为短视频和用户的索引，y为标签。用户和短视频都有所属的特征，其中用户的特征包括用户ID、性别、年龄等；短视频特征包括短视频ID、标题、类别、描述等。ID特征的嵌入称为偏好特征，将其他特征的嵌入称为内容特征。以短视频为例，短视频的ID经过嵌入层得到的嵌入称为偏好特征，短视频标题、类别、描述经过嵌入层得到的嵌入统称为内容特征；用户同理。

在一个实施例中，方法还包括：基于初始元映射网络，将推荐对象的初始偏好特征转换为符合目标偏好特征空间分布的更新偏好特征。进一步地，计算推荐结果与推荐反馈标签的损失数据，包括：分别计算初始偏好特征所对应推荐结果与推荐反馈标签的第一损失数据、以及更新偏好特征所对应推荐结果与推荐反馈标签的第二损失数据；其中，第一损失数据，用于对初始元映射网络的参数进行更新；第二损失数据，用于对初始偏好特征进行更新。

具体来说，初始元映射网络包括初始的元拉伸网络和元偏移网络，对初始的元拉伸网络和元偏移网络的训练过程如下：

获取预训练的推荐模型f_θ，φ(·)，随机初始化元拉伸网络h的可学习参数w_scale，元偏移网络g的可学习参数w_shift；

循环执行下列过程直到推荐模型收敛：

(1)从关于短视频i的交互数据中取出少量交互数据。

(2)基于短视频i的初始偏好特征v_i，确定第一推荐结果，基于第一推荐结果和交互数据中的推荐反馈标签，计算第一损失数据

(3)通过计算公式得到短视频i的更新偏好特征/>其中：

w_scale是元拉伸网络中的参数，w_shift是元偏移网络中的参数，h、g为多层感知机模型，为拉伸函数，/>为偏移函数，⊙表示按元素相乘/>表示按元素相加。

(4)基于短视频i的更新偏好特征确定第二推荐结果，基于第二推荐结果和交互数据中的推荐反馈标签，计算第二损失数据/>

(5)通过梯度下降优化算法，基于第一损失数据更新参数w_scale，w_shift；基于第二损失数据/>对偏好特征v_i进行更新。

(6)推荐模型收敛结束循环。

具体来说，短视频i的偏好特征v_i和内容特征集其中n表示短视频的内容特征的类别总数，用户u的偏好特征u_j和内容特征集/>其中m表示用户的内容特征的类别总数，u，v，/>即各特征的向量维度都是k维，将短视频和用户具体化为特征的组合后，三元组样本可以表示为([v_i，X_i，u_j，S_j]，y)。对于交互行为的预测，推荐结果可以表示为：

其中θ表示推荐模型的参数。对数损失数据通常被用作二分类任务的损失数据函数，即优化目标，计算和y之间损失数据如下：

其中φ表示嵌入层参数，即所有的用户和短视频的嵌入。计算出预测和标签y之间的损失数据后，即可通过基于梯度下降的优化方法，优化模型中的可学习参数θ和φ，让推荐模型学习短视频和用户之间的关系。

基于v_i计算的过程如下：

同理可基于计算/>

由于只与w_scale，w_shift相关，/>只与v_i相关，因此w_scale，w_shift和v_i的学习互不影响，从而元映射网络的引入不会影响原推荐模型对已有短视频的推荐效果。

在本实施例中，通过分别计算初始偏好特征所对应推荐结果与推荐反馈标签的第一损失数据以及更新偏好特征所对应推荐结果与推荐反馈标签的第二损失数据，分别用于对初始元映射网络的参数和初始偏好特征进行更新，能够使得初始元映射网络的参数的学习和初始偏好特征的学习互不影响，使得元映射网络的引入不会影响原推荐模型对已有推荐对象的推荐效果，同时实现对冷启动目标对象的准确推荐。

本申请还提供一种短视频推荐的应用场景，该应用场景应用上述的冷启动对象推荐方法。具体地，该冷启动对象推荐方法在该应用场景的应用如下：

近来，短视频逐渐成为用户停留时间最长，流量消耗最大的互联网内容类型。各大短视频平台依靠海量的用户和短视频数据，借助强大的推荐系统技术，向用户推荐热门的、多样化的、个性化的内容，增加用户停留时间，强化用户粘性。然而，无论是传统的推荐技术，例如协同过滤技术，包括SVD++、矩阵分解等，还是基于深度学习的神经推荐系统，例如点击率预测模型，如深度兴趣网络、深度兴趣进化网络等，都需要大量的用户-短视频交互数据，让模型能够从交互数据中学到用户对短视频的偏好。

对于缺少交互数据的短视频，即创作者新上传的短视频，由于暂时没有其他用户对该短视频的完播、点赞、分享等交互记录，推荐系统难以识别该短视频所属的用户偏好，造成目标推荐人群不准确，影响推荐转化率，这就是短视频的冷启动问题。按照目前单日十亿级别的数据量来估算，与当日新发布的短视频相关的记录通常占比为1～5％，数量级可达千万级别。为解决上述问题，提出基于元网络映射的冷启动短视频推荐方法，用于具有冷启动推荐需求的短视频平台。搭载于各种现存的基于深度学习的推荐模型上，弥补现有推荐模型在冷启动问题的零样本阶段和少样本阶段中存在的短板。

冷启动短视频推荐方法具体包括针对短视频的偏好特征初始化处理和两种元网络，即元拉伸网络和元偏移网络，其中：

针对短视频的偏好特征初始化处理过程包括：对于零样本阶段的冷启动短视频，通过对现有的所有具备足够交互数据且得到充分学习的短视频(以下称为一般短视频)的偏好特征执行全局平均池化操作，得到一般化的偏好特征作为冷启动短视频的初始偏好特征；

元拉伸网络以冷启动短视频的内容特征作为输入，生成特定于当前冷启动短视频的拉伸函数，将冷启动短视频的偏好特征朝着适配当前推荐系统的方向，即理想的一般短视频的偏好特征空间，执行拉伸变换，加速冷启动短视频适配推荐系统的进度；元偏移网络分析冷启动短视频当前所有交互用户的偏好特征，生成能够指导过滤交互数据中的噪音的偏移函数。

具体来说，在大量的一般短视频交互数据上训练的推荐系统，为一般短视频的偏好特征分配了特定的特征空间，表现为一般短视频的偏好特征满足目标偏好特征空间分布D_t。而冷启动短视频在记录足够的交互数据之前，其偏好特征分布D_c与D_t存在差距；冷启动短视频从足够的交互数据中学到偏好信息后，其偏好特征分布会逐渐向D_t收敛，偏好特征初始化过程为冷启动短视频提供了距离D_t尽可能小的初始偏好特征，降低其接近D_t的难度。进一步地，两个元网络为冷启动短视频提供了D_c到D_t的映射，对于冷启动问题的零样本阶段和少样本阶段，都有明显的效果。

上述技术方案的实现过程基于如下部分来实现，分别为：冷启动推荐场景定义，偏好特征初始化，元拉伸网络和元偏移网络训练，模型应用。

第一部分，冷启动推荐场景定义。

具体地，推荐模型聚焦于二分类(0-1)推荐任务，预测用户点赞短视频的概率(0～1)；0表示负反馈，即用户直接划过短视频；1表示正反馈，即用户点赞短视频。每条样本为一个三元组，包括短视频、用户、标签三个实体，即(i，j，y)，其中i，j分别为短视频和用户的索引，y为标签。用户和短视频都有所属的特征，其中用户信息所对应的特征包括用户ID、性别、年龄等；短视频信息所对应的特征包括短视频ID、标题、类别、描述等。通过推荐系统的嵌入技术，即一种能够将上述用户和短视频的原始特征转化为连续向量的技术，这种连续向量被称为嵌入。原始特征经过推荐系统中的嵌入层后，可以得到用户和短视频各个特征的嵌入。通常，将ID特征的嵌入称为偏好特征，将其他特征的嵌入称为内容特征。以短视频为例，短视频的ID经过嵌入层得到的嵌入称为偏好特征，短视频标题、类别、描述经过嵌入层得到的嵌入统称为内容特征；用户同理。由于ID对于短视频是唯一的，所以ID特征的学习仅仅依赖于ID对应的短视频的交互数据——这是接导致短视频的冷启动问题的根本原因。而内容特征通常在多个短视频中重复出现，交互数据充足，几乎所有内容特征都能得到充分学习。

用户和短视频的特征经过嵌入层后，可以得到短视频i的偏好特征v_i和内容特征集其中n表示短视频的内容特征的类别总数。同理可得用户u的偏好特征u_j和内容特征集/>其中m表示用户的内容特征的类别总数，u，v，/>即各特征的向量维度都是k维，k的大小根据实际业务效果设定。将短视频和用户具体化为特征的组合后，原来的三元组样本可以表示为([v_i，X_i，u_j，S_j]，y)。对于交互行为的推荐结果，可以表示为

其中θ表示一般推荐模型的参数。对数损失数据通常被用作二分类任务的损失数据函数，即优化目标，计算和y之间损失数据如下：

第二部分：偏好特征初始化。

通常，在冷启动短视频进入推荐系统时，推荐系统会为它随机初始化一个偏好特征。然而随机初始化的偏好特征中几乎不会蕴含于冷启动短视频相关的信息，也难以取得令人满意的推荐效果。通过对现存的所有一般短视频的偏好特征执行全局平均池化操作，得到全局平局偏好特征作为一般化的偏好特征。在冷启动短视频进入推荐系统时，即对于零样本阶段的冷启动视频，使用一般化的偏好特征作为冷启动短视频的初始偏好特征。这种偏好特征初始化方法，为冷启动短视频提供了距离一般偏好特征的分布D_t尽可能小的初始偏好特征，大大增强了两个元网络带来的效果，相比于随机初始化方法要好得多。

第三部分：元拉伸网络和元偏移网络训练。

得到一般化的初始偏好特征后，元拉伸网络和元偏移网络将生成特定于每个冷启动视频的拉伸函数和偏移函数，两个函数共同构成由冷启动偏好特征分布D_c到一般偏好特征的分布D_t的映射，改善冷启动短视频的推荐效果。

元拉伸网络负责D_c到D_t的映射的拉伸操作，该拉伸操作由元拉伸网络为每个冷启动视频生成的拉伸函数完成。通常，短视频的内容特征往往包含了部分偏好信息，表现为偏好特征相似的短视频，其内容特征也相对相似。因此，将内容特征作为元拉伸网络的输入，元拉伸网络可以提取内容特征中与偏好相关的信息，得到的拉伸函数通过将冷启动短视频的偏好特征朝着D_t的方向进行拉伸，将内容特征中与偏好相关的信息融入偏好特征中。元拉伸网络的表达式如下：

其中w_scale是元拉伸网络中的可学习参数，h通常为两层的多层感知机模型，就是得到的拉伸函数。由D_c到D_t的映射的拉伸操作可表示为⊙表示按元素相乘。

元偏移网络主要负责对拉伸后的偏好特征进行平移调整，一方面是过滤偏好特征中的噪音，另一方面是让D_c更接近D_t。通常，从交互数据中学习偏好信息，是冷启动短视频的偏好特征从D_c靠近D_t最直接的方法。然而，交互数据中不可避免地会存在部分噪音，例如误触双击了短视频。尤其在少样本阶段，噪音会对偏好特征的学习造成较大的消极影响。元偏移网络识别冷启动短视频的交互数据中的噪音，为每个冷启动短视频生成具有过滤作用的偏移函数。偏移函数对冷启动短视频的偏好特征进行平移调整，保留偏好特征从交互数据中学到的有用信息，过滤噪音产生的错误信息。

为了表示元偏移网络，引入短视频i的全局正反馈集，即点赞过短视频i的所有用户的偏好特征的集合，表示为U(i)＝{u_j|y(i，u)＝1}。在冷启动问题的零样本阶段，|U(i)|＝0；在冷启动问题的少样本阶段，|U(i)|＞0。显然，元偏移网络在冷启动问题的少样本阶段发挥作用。元偏移网络的表示如下：

其中w_shift是元偏移网络中的可学习参数，g通常为两层的多层感知机模型，为聚合函数(例如简单的平均函数，即求点赞过短视频i的所有用户的平均偏好特征)，/>就是得到的偏移函数。最后，有了/>和/>由D_c到D_t的映射可以表示为：

其中表示按元素相加。

给定一个训练好的推荐模型f_θ，φ(·)，该推荐模型能够对一般的短视频进行良好的推荐，但对于冷启动短视频，由于偏好特征没有充分训练，推荐模型对其推荐效果不佳。现对模块三、四中模型的训练过程进行说明，如下列算法所示：

循环执行下列过程直到推荐模型收敛：

(1)从关于短视频i的交互数据中取出少量交互数据。

(3)通过计算公式得到更新偏好特征

(6)推荐模型收敛时结束循环。

其中，基于v_i计算的过程如下：

同理可基于计算/>上述训练过程以单个短视频i为例，实际训练时将批量进行。由于/>只与w_scale，w_shift相关，/>只与v_i相关，因此w_scale，w_shift和v_i的学习互不影响，从而元网络的引入不会影响原推荐模型对一般短视频的推荐效果。

第四部分：模型应用。

在元网络训练完成后，冷启动短视频进入推荐系统时，其偏好特征将被转化为v^warm进行预测，直至v从足够的交互数据中学习到偏好信息为止，直接使用v进行预测。

应该理解的是，虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的冷启动对象推荐方法的冷启动对象推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个冷启动对象推荐装置实施例中的具体限定可以参见上文中对于冷启动对象推荐方法的限定，在此不再赘述。

在一个实施例中，如图8所示，提供了一种冷启动对象推荐装置800，包括特征获取模块802、特征处理模块804、映射变换模块806和推荐分析模块808，其中：

特征获取模块802，用于获取冷启动状态下目标对象的内容特征和初始偏好特征；

特征处理模块804，用于基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系；所述元映射网络，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的；

映射变换模块806，用于按照所述特征映射关系对所述初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征；所述目标偏好特征空间分布，用于表征所述推荐对象所对应偏好特征的空间分布；

推荐分析模块808，用于基于所述更新偏好特征对所述目标对象进行推荐分析，得到针对所述目标对象的推荐结果。

上述冷启动对象推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

上述冷启动对象推荐装置，通过获取冷启动状态下目标对象的内容特征和初始偏好特征，是基于推荐对象在模拟冷启动状态下的交互数据训练得到的元映射网络，对内容特征进行多层感知处理，确定与目标对象相匹配的特征映射关系，按照特征映射关系对初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，由于更新偏好特征的空间分布趋近于推荐对象所对应偏好特征的空间分布，能够确定冷启动状态下的目标对象能够学习到准确的偏好特征，进而基于更新偏好特征对目标对象进行推荐分析，得到更为准确的推荐结果。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O)和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储交互数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种冷启动对象推荐方法。

本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种冷启动对象推荐方法，其特征在于，所述方法包括：

获取冷启动状态下目标对象的内容特征和初始偏好特征；

2.根据权利要求1所述的方法，其特征在于，所述获取冷启动的目标对象的内容特征和初始偏好特征，包括：

获取目标对象的内容描述数据，对所述内容描述数据进行向量转换，得到所述目标对象的内容特征；

获取满足目标偏好特征空间分布的推荐对象各自所对应的偏好特征；

对各所述偏好特征进行全局平均池化处理，将得到的全局平均偏好特征，作为所述冷启动状态下目标对象的初始偏好特征。

3.根据权利要求2所述的方法，其特征在于，所述目标对象包括目标视频；

所述获取目标对象的内容描述数据，包括：

获取针对目标视频的补充描述信息，并提取所述目标视频中的关键视频帧；

对所述关键视频帧进行图像识别处理，得到所述关键视频帧中的视频内容信息；

将所述补充描述信息和所述视频内容信息，确定为所述目标对象的内容描述数据。

4.根据权利要求1所述的方法，其特征在于，所述特征映射关系包括拉伸函数；

所述按照所述特征映射关系对所述初始偏好特征进行映射变换，得到趋近于目标偏好特征空间分布的更新偏好特征，包括：

按照所述拉伸函数对所述初始偏好特征的特征分布进行拉伸处理，将所述内容特征融入所述初始偏好特征的拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征。

5.根据权利要求4所述的方法，其特征在于，所述基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系，包括：

基于所述元映射网络中的元拉伸网络参数，对所述内容特征进行多层感知处理，得到使所述初始偏好特征趋近于所述目标偏好特征空间分布进行拉伸的拉伸函数。

6.根据权利要求4所述的方法，其特征在于，所述特征映射关系还包括偏移函数；

所述按照所述拉伸函数对所述初始偏好特征的特征分布进行拉伸处理，将所述内容特征融入所述初始偏好特征的拉伸空间，得到趋近于目标偏好特征空间分布的更新偏好特征，包括：

基于所述拉伸函数，对所述初始偏好特征的特征分布进行拉伸处理，将所述内容特征融入所述初始偏好特征的拉伸空间，得到中间偏好特征；

基于所述偏移函数，对所述中间偏好特征的特征分布进行偏移调整，以去除所述中间偏好特征中的噪声数据，得到更新偏好特征。

7.根据权利要求6所述的方法，其特征在于，所述基于元映射网络对所述内容特征进行多层感知处理，确定与所述目标对象相匹配的特征映射关系，包括:

获取针对所述目标对象的交互数据；

基于所述元映射网络中的元偏移网络参数，对所述交互数据进行多层感知处理，得到使所述中间偏好特征趋近于所述目标偏好特征空间分布进行偏移的偏移函数。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

对所述交互数据中的交互偏好特征进行聚合处理，得到聚合交互特征；

所述基于所述元映射网络中的元偏移网络参数，对所述交互数据进行多层感知处理，得到使所述中间偏好特征趋近于所述目标偏好特征空间分布进行偏移的偏移函数，包括：

基于所述元映射网络中的元偏移网络参数，对所述聚合交互特征进行多层感知处理，得到使所述中间偏好特征趋近于所述目标偏好特征空间分布进行偏移的偏移函数。

9.根据权利要求1至8中任一项所述的方法，其特征在于，所述元映射网络的参数训练过程包括：

从推荐对象的冷启动模拟数据中获取推荐反馈标签，并确定针对所述推荐对象的推荐结果；

计算所述推荐结果与所述推荐反馈标签的损失数据；

通过梯度下降优化算法，基于所述损失数据对初始元映射网络的参数进行迭代训练，直至满足训练停止条件，得到所述元映射网络。

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

基于所述初始元映射网络，将所述推荐对象的初始偏好特征转换为符合目标偏好特征空间分布的更新偏好特征；

所述计算所述推荐结果与所述推荐反馈标签的损失数据，包括：

分别计算所述初始偏好特征所对应推荐结果与所述推荐反馈标签的第一损失数据、以及所述更新偏好特征所对应推荐结果与所述推荐反馈标签的第二损失数据；

所述第一损失数据，用于对所述初始元映射网络的参数进行更新；所述第二损失数据，用于对所述初始偏好特征进行更新。

11.根据权利要求9所述的方法，其特征在于，所述方法还包括：

从样本对象中筛选出交互数据符合交互条件、且推荐效果达到预期效果的样本对象；

基于所述样本对象的交互数据中的被推荐对象数据、接收对象数据以及推荐反馈标签，构建三元组；

将所述三元组作为用于对所述初始元映射网络进行参数训练的交互数据。

12.一种冷启动对象推荐装置，其特征在于，所述装置包括：

13.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。

15.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。