CN111798280A

CN111798280A - 多媒体信息推荐方法、装置和设备及存储介质

Info

Publication number: CN111798280A
Application number: CN202010931706.5A
Authority: CN
Inventors: 严超
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-09-08
Filing date: 2020-09-08
Publication date: 2020-10-20
Anticipated expiration: 2040-09-08
Also published as: CN111798280B

Abstract

本申请公开了一种多媒体信息推荐方法、装置和设备及存储介质，涉及计算机技术领域，用于提升多媒体信息推荐的精准性。该方法包括：获取多个多媒体信息的资源属性信息以及当前时间段之前的N个连续时间段对应的N个互动数据集合；分别获取各多媒体信息每一互动数据集合对应的互动率偏差值集合；利用已训练的互动率校正模型，根据资源属性信息与N个互动率偏差值集合，获取各多媒体信息在当前时间段的互动率偏差值；通过互动率偏差值分别对预估互动率进行校正；根据各多媒体信息校正后的预估互动率，从多个多媒体信息中确定目标多媒体信息，并将目标多媒体信息推荐给目标用户，从而实现多媒体信息的精准推荐。

Description

多媒体信息推荐方法、装置和设备及存储介质

技术领域

本申请涉及计算机技术领域，提供一种多媒体信息推荐方法、装置和设备及存储介质。

背景技术

智能出价广告是一种新的出价方式，广告主可以选择期望优化的优化目标，并提供对该优化目标期望的平均转化成本（target_cpa），广告平台通过预估每一次展示的转化价值，自动进行出价。目前常见的自动出价方案包括优化行为出价（optimized cost peraction，ocpa）方案、优化点击付费（optimized cost per click，ocpc）方案和优化千次展现出价（optimized cost per mille，ocpm）方案。以ocpa方案为例，当广告主在广告投放流程中选定优化目标，例如移动应用的激活或者购物网站的下单等，并填写愿意为此投放目标而支付的平均价格，并及时准确的回传效果数据，广告平台则可以借助转化预估模型，实时预估每一次广告展示对广告主的转化价值，自动进行广告出价，最终按照点击扣费，使得每个优化目标平摊成本在广告主期望的成本价附近区间内。

其中，在广告出价环节中根据广告在用户上的转化价值来决定广告的排序，从而决定广告是否能够获取此次曝光以及获得此次曝光之后广告主的成本是否符合预期，例如对于ocpa方案而言，将每千次曝光的总扣费（effective cost per mille，ecpm）作为广告竞价排序的指标，通过计算获得各个广告的ecpm，ecpm高的广告优先进行曝光。但是，由于广告出价环节中是根据预估的互动率进行的，如预估转化率（conversion rate，CVR），由于CVR预估存在数据稀疏等问题，难以做到完全准确预估，从而导致CVR预估存在很大偏差，从而影响广告出价环节的转化成本，从而使得广告的实际成本难以达成广告主的预期。

可见，预估互动率的准确性直接影响到当前曝光机会所要曝光的广告，因而预估互动率准确性较低时，也无法精准的实现广告推荐。其他多媒体信息推荐系统，也存在同样问题。

发明内容

本申请实施例提供一种多媒体信息推荐方法、装置和设备及存储介质，用于提升多媒体信息推荐的精准性。

一方面，提供一种多媒体信息推荐方法，所述方法包括：

获取多个多媒体信息的资源属性信息，以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合，其中，每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据；

分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合；其中，每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值，每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差；所述预估互动率为预估的用户与多媒体信息进行互动的次数与述多媒体信息的展示次数之间的比值；

利用已训练的互动率校正模型，根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合，获取各多媒体信息在当前时间段的互动率偏差值；其中，所述互动率校正模型是利用多个训练样本训练得到的，每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合；所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差；

通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正；

根据各多媒体信息校正后的预估互动率，从所述多个多媒体信息中确定目标多媒体信息，并将所述目标多媒体信息推荐给目标用户。

一方面，提供一种多媒体信息推荐装置，所述装置包括：

获取单元，用于获取多个多媒体信息的资源属性信息，以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合，其中，每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据；

所述获取单元，还用于分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合；其中，每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值，每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差；所述预估互动率为预估的用户与多媒体信息进行互动的次数与述多媒体信息的展示次数之间的比值；

确定单元，用于利用已训练的互动率校正模型，根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合，获取各多媒体信息在当前时间段的互动率偏差值；其中，所述互动率校正模型是利用多个训练样本训练得到的，每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合；所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差；

校正单元，用于通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正；

推荐单元，用于根据各多媒体信息校正后的预估互动率，从所述多个多媒体信息中确定目标多媒体信息，并将所述目标多媒体信息推荐给目标用户。

可选的，所述装置还包括模型训练单元，用于：

从训练样本库中获取设定数量的训练样本；

通过获取的训练样本，按照设定的训练参数对所述互动率校正模型进行多次训练，每一次训练过程包括如下步骤：

根据所述资源属性信息以及N+1个连续时间段中前N个时间段的互动率偏差值集合，通过所述互动率校正模型，获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值；

根据所述训练样本的多媒体信息在第N+1个时间段的互动率偏差值，与所述训练样本中第N+1个时间段的互动率偏差值集合，获取所述互动率校正模型的损失值；

根据所述损失值确定是否继续对所述互动率校正模型进行训练；

若确定继续对所述互动率校正模型进行训练，则对所述互动率校正模型的模型参数进行调整，并通过调整后的所述互动率校正模型继续下一次训练过程。

可选的，所述确定单元，用于：

将所述每一特征维度在每一时间段内的互动次数所属的数值区间对应位置赋值为所述每一特征维度在每一时间段的互动率偏差值，除所述每一特征维度在每一时间段内的互动次数所属的数值区间之外的其余数值区间对应位置赋值为空值，以得到所述每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量。

可选的，所述多个特征维度包括多个单一特征维度和由所述多个单一特征维度进行交叉得到的交叉特征维度。

可选的，所述深度子模型包括特征向量化层和至少两个全连接层，则所述确定单元，用于：

通过所述特征向量化层，将所述资源属性信息中各特征字段和各特征字段对应的特征值进行拼接，并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量；

通过所述至少两个全连接层，对各特征字段对应的词向量进行特征映射，以得到所述资源表示向量。

可选的，所述确定单元，用于：

分别对各特征字段和各特征字段对应的特征值进行编码，并将编码后的各特征字段和各特征字段对应的特征值进行拼接，得到各特征字段和各特征字段对应的特征值对应的索引号；

根据各特征字段和各特征字段对应的特征值对应的索引号，从词向量库中获取所述索引号对应的词向量，其中，所述词向量库为在所述互动率校正模型的训练过程中训练得到的，所述词向量库包括所有拼接的特征字段和特征值对应的词向量。

可选的，若特征字段的类型为数值连续型字段，则所述确定单元，用于：

确定所述特征字段的特征值所属的特征值区间，对特征值所属的特征值区间的索引号进行编码，并对所述特征字段进行编码；

将编码后的特征值区间的索引号与编码后的特征字段进行拼接，得到所述特征字段和所述特征字段对应的特征值对应的索引号。

可选的，所述推荐单元，用于：

分别根据各多媒体信息校正后的预估互动率，确定各多媒体信息在信息展示位上进行展示所需提供的电子资源；

根据各多媒体信息对应的电子资源，对所述多个多媒体信息进行排序；

根据排序结果从所述多个多媒体信息确定所述目标多媒体信息，并将所述目标多媒体信息推荐给目标用户。

一方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一种方法的步骤。

一方面，提供一种计算机存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现上述任一种方法的步骤。

一方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述任一种方法的步骤。

本申请实施例中，根据多媒体信息的资源属性信息，以及该多媒体信息在当前时间段之前的N个连续时间段的历史互动数据，并根据历史互动数据确定历史互动率偏差值，从而进而根据资源属性信息与历史互动率偏差值，确定该多媒体信息在当前时间段的互动率偏差值，进而通过当前时间段的互动率偏差值对预估互动率进行校正，最终根据校正后的预估互动率进行多媒体信息的推荐，从而预估互动率更为准确，相应的提升了多媒体信息推荐的精准性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种场景示意图；

图2为本申请实施例提供的多媒体信息的互动率校正方法的流程示意图；

图3为本申请实施例提供的一种系统框架示意图；

图4为本申请实施例提供的互动率校正模型的训练过程的流程示意图；

图5为本申请实施例提供的多媒体信息的互动率校正方法的另一流程示意图；

图6为本申请实施例提供的互动率校正模型的一种模型架构示意图；

图7为本申请实施例提供的词向量库的示意框图；

图8为本申请实施例提供的多媒体信息推荐方法的流程示意图；

图9为本申请实施例提供的广告平台进行广告推荐的流程示意图；

图10为本申请实施例提供的创建广告的流程示意图；

图11为本申请实施例提供的广告平台为用户推荐广告的过程示意图；

图12为本申请实施例提供的多媒体信息推荐装置的一种结构示意图；

图13为本申请实施例提供的计算机设备的一种结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

为便于理解本申请实施例提供的技术方案，这里先对本申请实施例使用的一些关键名词进行解释：

多媒体信息：用户可与之进行互动的信息，例如可以为广告、网页页面等。以广告为例，广告可通过网页页面或者应用界面内的广告展示位进行展示，用户可点击广告进入相应页面，并进行相应的操作，如下载应用或者购买下单等。

资源属性信息：与多媒体信息相关的属性信息，例如当多媒体信息为广告时，资源属性信息可以包括广告名称、广告所属的广告主、广告的优化目标、广告涉及的商品等信息。

广告主：广告主是广告活动的发起者，是在网上销售或宣传自己产品和服务的商家，任何推广、销售其产品或服务的商家都可以作为广告主。广告主发布广告活动，并按照广告平台完成的广告活动中规定的营销效果的总数量及单位效果价格向网站主支付费用。

互动数据：用户与多媒体信息进行互动的数据，例如当多媒体信息为广告时，互动可以为用户点击广告，用户下载广告中的应用，用户购买广告中的商品，用户激活广告中的产品等等。

达成率：在一个广告集合中，广告达成的比例称为达成率。达成是指针对一个广告而言，该广告的转化成本接近广告主的预期成本，例如为广告主的预期成本的0.8~1.2倍，则认为该广告达成。若最终广告成本与广告主的预期成本差距较大，则认为成本跑飞。

转化成本：转化是指针对广告主设定的优化目标，用户完成一次优化目标则认为实现一次转化，例如设定的优化目标为购买广告中的商品，那么用户点击广告进入购买页面并完成购买则认为实现了一次转化，广告主在平均每个转化的付费即为转化成本。

智能出价广告是一种新的出价方式，广告主设置优化目标，如移动应用的下载、激活或者付费等，以及愿意为优化目标付出的转化成本，广告平台在存在曝光机会时自动进行出价，使得广告的实际转化成本接近广告主预期的转化成本。

其中，在存在一个曝光机会时，广告平台为多个广告自动出价，并根据各个广告的出价来决定广告的排序，从而决定广告是否能够获取此次曝光。该过程也会影响到广告获得曝光之后实际转化成本是否符合广告主预期的转化成本。例如对于ocpa方案而言，将每千次曝光的总扣费（effective cost per mille，ecpm）作为广告竞价排序的指标，通过计算获得各个广告的ecpm，ecpm高的广告优先进行曝光，ecpm的计算公式如下：

ecpm = bid × pCTR × pCVR × lambda

其中，bid为广告主设置的预期转化成本，pCTR为通过点击率精准预估模型得到的预估点击率，pCVR为通过转化率精准预估模型得到的预估转化率，lambda为实时调节因子，用于调节广告的平均转化成本。

可见，由于广告出价环节中是根据预估的互动率进行出价的，如上述的预估转化率，难以做到完全准确预估，从而影响广告出价环节的转化成本，使得广告的实际成本难以达成广告主的预期。而实时调节因子虽然存在一定的调节作用，但是实时调节因子考虑因素很多，需要考虑了各种模型的预估偏差，还需要考虑历史成本偏差，以及考虑线上出价的安全性，且实时调节因子有上下界的限制，无法充分考虑模型预估的巨大偏离程度，在极端情况下对于模型预估偏差的调节作用不明显。

因此，考虑到预估互动率的准确性直接影响广告出价的准确性，亟待一种方法来提升预估互动率的准确性。基于此，本申请实施例提供一种多媒体信息的互动率校正方法，在该方法中，可以根据多媒体信息的资源属性信息，以及该多媒体信息在当前时间段之前的N个连续时间段的历史互动数据，并根据历史互动数据确定历史互动率偏差值，从而进而根据资源属性信息与历史互动率偏差值，确定该多媒体信息在当前时间段的互动率偏差值，以通过当前时间段的互动率偏差值对预估互动率进行校正，从而提升预估互动率的准确性。其中，本申请实施例引入了用于校正预估互动率的互动率偏差，即单独通过互动率偏差来对预估互动率进行校正，使得互动率偏差能够更精准的被估计，从而使得预估互动率能够更好的向真实互动率靠近，从而使得多媒体信息展示所需的电子资源的计算更为准确，从而从长远角度来看，能够使得多媒体信息的转化成本更加接近预设的出价，从而提高达成率。相较上述的实时调节因子而言，将对预估互动率进行校正的功能从实时调节因子中剥离出来，那么实时调价因子的功能则可以更加单一可靠，只需要拟合历史成本偏差即可，而不需要同时兼顾各种模型预估偏差，从而使得实时调价因子的预估以及调控更为合理。

此外，本申请实施例通过基于Wide和Deep结合的互动率校正模型来确定互动率偏差，即互动率校正模型包括宽度子模型和深度子模型宽度子模型基于历史互动率偏差对当前的互动率偏差进行预测，深度子模型通过深度学习模型参数，根据多媒体信息的资源属性信息来预测互动率偏差，提升互动率偏差的准确性，使得校正后的预估互动率能够更接近真实互动率。

本申请实施例还提供一种多媒体信息推荐方法，在该方法中，通过上述的互动率校正方法对预估互动率进行校正后，基于校正后的预估互动率确定各个多媒体信息在信息展示位上进行展示所需提供的电子资源，从而确定待展示的目标多媒体信息，并推送给目标用户，使得在目标用户的信息展示位上展示目标多媒体信息。其中，通过互动率偏差来对预估互动率进行校正，使得互动率偏差能够更精准的被估计，从而使得预估互动率能够更好的向真实互动率靠近，从而使得多媒体信息展示所需的电子资源的计算更为准确，从而从长远角度来看，能够使得多媒体信息的转化成本更加接近预设的出价，从而提高达成率。

在介绍完本申请实施例的设计思想之后，下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍，需要说明的是，以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中，可以根据实际需要灵活地应用本申请实施例提供的技术方案。

本申请实施例提供的方案可以适用于多媒体信息推荐场景中，尤其适用于智能出价广告场景中，如图1所示，为本申请实施例提供的一种场景示意图，在该场景中可以包括多媒体信息提供方终端、服务器102和用户终端103。当多媒体信息为广告时，则多媒体信息提供方终端即为广告主终端，图1中具体以此为例进行示出。

其中，广告主终端101和用户终端103均可以为手机、个人计算机（personalcomputer，PC）、笔记本电脑或者平板电脑（PAD）等设备，服务器102可以

为多媒体信息展示位提供方的后台服务器，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器，但并不局限于此。当多媒体信息为广告时，则服务器102可以为包括广告展示位的应用软件的后台服务器，也可以为广告平台的后台服务器，该广告平台的广告展示位位于一个或者多个应用软件的页面中。

服务器102可以包括一个或多个处理器、存储器以及与其他设备交互的I/O接口等。此外，服务器102还可以配置数据库，数据库可以用于存储本申请实施例提供的方案中涉及到的数据，如模型数据等。其中，服务器102的存储器中可以存储本申请实施例提供的多媒体信息的互动率校正和多媒体信息推荐方法的程序指令，这些程序指令被处理器执行时能够用以实现本申请实施例提供的多媒体信息的互动率校正和多媒体信息推荐方法的步骤。

以多媒体信息为广告为例，对图1所示的应用场景进行介绍。

广告主可以在广告主终端101中打开广告平台提供的广告创建页面，并填写相应信息，从而完成新广告的创建，新增加的广告会增加到广告平台的广告库中。当用户浏览到一个广告展示位时，例如用户打开一个网页时，该网页中包括广告展示位，那么在打开这个网页时，则会同时向服务器102发送广告请求，服务器102从广告库中进行广告筛选，确定在该展示位展示的广告，并将该广告推送给终端101，以进行广告展示。其中，服务器102在进行广告筛选时，则涉及到为候选广告进行出价，并根据各广告的出价进行排序，以选择出价较高的广告进行展示。

多媒体信息提供方终端、服务器102和用户终端103之间可以通过一个或者多个网络104进行直接或间接的通信连接。该网络104可以是有线网络，也可以是无线网络，例如无线网络可以是移动蜂窝网络，或者可以是无线保真（Wireless-Fidelity，WIFI）网络，当然还可以是其他可能的网络，本申请实施例对此不做限制。

当然，本申请实施例提供的方法并不限用于图1所示的应用场景中，还可以用于其他可能的应用场景，本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述，在此先不过多赘述。下面，将先对本申请实施例涉及的技术进行简单介绍。

在一种可选的实施方式中，本申请实施例可以采用实体设备结合人工智能（Artificial Intellegence，AI）技术来实现本申请实施例的方法过程，在另一种可选的实施方式中，还可以通过云技术（Cloud technology）结合AI技术来实现本申请实施例的方法过程。

云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。具体而言，本申请实施例除了可以通过实体计算资源执行程序流程，以及实体存储资源来实现数据存储之外，也可以通过云端提供的计算资源来进行方法步骤的执行，并且所涉及到的数据均可通过云端提供的存储资源来进行存储。

AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理(NatureLanguage Processing，NLP)技术以及机器学习/深度学习等几大方向。本申请实施例提供的技术方案主要涉及人工智能的机器学习/深度学习等技术。

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。具体而言，本申请实施例中对于互动率校正过程中的互动率偏差获取可以通过机器学习得到的模型得到。

请参见图2，为本申请实施例提供的多媒体信息推荐方法的流程示意图，该方法可以通过图1中的服务器102来执行，该方法的流程介绍如下。

步骤201：获取多个多媒体信息的资源属性信息，以及多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合。

其中，上述的多个多媒体信息为候选的多媒体信息，需从这些多媒体信息中选择为目标用户推荐的多媒体信息。

其中，每一时间段的互动数据集合包括多媒体信息在多个特征维度上的互动数据。多个特征维度可以包括多个单一特征维度和由多个单一特征维度进行交叉得到的交叉特征维度，例如多个特征维度的互动数据例如可以包括多媒体信息的互动数据、多媒体信息所属多媒体信息提供方的互动数据、多媒体信息中包括的商品的互动数据以及为该多媒体信息设置的优化目标的互动数据，以及还可以包括由上述多个单一维度进行交叉得到交叉维度的互动数据。

本申请实施例中，当多媒体信息创建成功后，可以将多媒体信息的资源属性信息存储于数据库中，需要时从数据库中获取。在多媒体信息创建之后，多媒体信息则可能被展示，则会产生相应的互动数据，互动数据也可以存储于数据库中，以便需要时从数据库中获取。互动数据可以为用户与多媒体信息进行互动的数据，例如可以包括多媒体信息的展示次数、点击次数或者转化次数等数据。其中，展示次数是指多媒体信息在信息展示为上进行展示的次数，也可以理解为多媒体信息的推荐次数，点击次数是指用户查看到该多媒体信息后，点击该多媒体信息以查看详情的次数，转化次数时基于多媒体信息的优化目标而言，当多媒体信息的优化目标实现一次，则转化次数增加一次，例如对于某多媒体信息而言，优化目标为下载应用，那么用户点击多媒体信息进入下载界面并下载应用成功，则可以算作该多媒体信息转化成功一次。

步骤202：分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合。

步骤203：根据各多媒体信息的资源属性信息与N个互动率偏差值集合，确定各多媒体信息在当前时间段的互动率偏差值。

本申请实施例中，可以通过设定资源属性信息与N个互动数据集合与N个时间段之后的第N+1个时间段的互动率偏差之间的映射关系，从而根据映射关系，来确定多媒体信息在当前时间段的互动率偏差值。或者，还可以通过将资源属性信息与N个互动数据集合输入已训练的互动率校正模型，以获取所述多媒体信息在当前时间段的互动率偏差值。

在具体实施时，还可以根据分别获取N个互动数据集合中每一互动数据集合对应的互动率偏差值集合，进而根据资源属性信息与N个互动率偏差值集合，来确定各多媒体信息在当前时间段的互动率偏差值。

本申请实施例中，每一互动率偏差值集合包括多媒体信息在多个特征维度上的互动率偏差值，每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差，预估互动率为预估的用户与多媒体信息进行互动的次数与多媒体信息的展示次数之间的比值。互动率偏差值可以定义为预估互动率与真实互动率的比值，或者预估互动率与真实互动率的差值。

步骤204：通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正。

步骤205：根据各多媒体信息校正后的预估互动率，从多个多媒体信息中确定目标多媒体信息，并将目标多媒体信息推荐给目标用户。

本申请实施例中，获取多媒体信息的资源属性信息，以及该多媒体信息在当前时间段之前的N个连续时间段的历史互动数据，并根据历史互动数据确定历史互动率偏差值，从而进而根据资源属性信息与历史互动率偏差值，确定该多媒体信息在当前时间段的互动率偏差值，进而通过当前时间段的互动率偏差值对预估互动率进行校正，以提升预估互动率的准确性，进而提升多媒体信息推荐的精准性。

如图3所示，为本申请实施例的多媒体信息推荐方案的整体框架示意图。其中，本申请实施例的方案主要涉及互动率偏差模型训练、互动率偏差预测和多媒体信息排序这三大过程。

其中，互动率偏差模型训练过程可以通过历史数据统计模块、训练数据准备模块和模型训练模块来实现，互动率偏差预测过程可以通过实时数据统计模块、预测数据准备模块和模型预测模块来实现，多媒体信息排序过程可以通过互动率预测模块和电子资源确定模块来实现，由于各个模块所执行的方法步骤将在后续的内容中进行介绍，因此在此先不过多进行介绍。

下面结合图3对通过互动率校正模型获取所述多媒体信息在当前时间段的互动率偏差值的过程具体进行介绍。由于互动率校正模型在投入实际使用前，需要提前进行训练，因此下面先对互动率校正模型的训练过程进行介绍。如图4所示，为互动率校正模型的训练过程的流程示意图。

步骤401：获取训练样本数据。

本申请实施例中，互动率校正模型是利用多个训练样本训练得到的，每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合，其中，多媒体信息的资源属性信息以及前N个连续时间段的互动率偏差值集合作为模型输入，第N+1个连续时间段的互动率偏差值集合组我诶模型验证数据。

具体的，可以通过图3所示的历史数据统计模块和训练数据准备模块来获得训练所需的训练样本数据。其中，历史数据统计模块负责统计多媒体信息的资源属性信息和历史互动数据，为后续的模型训练提供数据基础。历史数据统计模块具体可以将多媒体信息相关的信息进行汇总，以中间表格的形式进行存储。

以多媒体信息为广告为例，历史数据统计模块统计得到的中间表格所包括的特征字段可以如表1所示。

其中，表1中分区时间为历史数据统计模块统计得到的中间表格的时间，处理时间为广告互动数据产生的时间，商品身份信息（identity，ID）为广告推广的商品的ID，商品ID、商品类型、推广渠道、广告位ID、广告主ID等均可作为广告的资源属性信息，广告展示次数、广告点击次数和广告对应优化目标的转化次数则可以为该广告的效果数据，可作为本申请实施例中的互动数据。是否为新广告字段用于表征广告是否为新广告，对于新广告的定义可以是广告平台自行设定的，例如上线不超过3天的广告可称为新广告。新广告投放后在预设时间段内转化数量达到预设值，则认为新广告起量成功，例如在3天内转化数累积大于30个的广告，则认为起量成功，在一个考察的新广告集合中，广告起量成功的比例称为起量率。

表1

在实际应用时，多媒体信息相关的信息可以是持续产生的，将产生的数据存储与数据库中，历史数据统计模块可以定期进行多媒体信息相关的信息的汇总，例如多媒体信息可以每天进行数据的汇总。

本申请实施例中，历史数据统计模块统计的数据还无法直接用于模型的训练，因此还需要通过训练数据准备模块来对数据进行整理，来得到用于模型训练的样本数据。

具体的，训练数据准备模块可以根据模型训练的需求对历史数据统计模块输出的中间表进行整理。例如，本申请实施例中互动率校正模型的输入为多媒体信息的资源属性信息和多个特征维度在多个连续时间段的历史互动率偏差集合，多媒体信息的资源属性信息一般在多媒体信息创建时已经可以确定，因此，训练数据准备模块的主要任务是依据各个中间表统计多个连续时间段的历史互动率偏差集合。其中，考虑到后续模型需要特征维度的多样性，因此训练数据准备模块可以将数据汇总成不同特征维度的统计信息。

同样以多媒体信息为广告为例，训练数据准备模块可以统计得到各个广告的多个特征维度在各个时间段内的互动数据。时间段的时长可以根据实际需求进行设定，这里以一天为例，那么训练数据准备模块则可以按照天级别，将各个广告的多个特征维度的互动数据。其中，多个特征维度可以包括多个单一特征维度和由多个单一特征维度进行交叉得到的交叉特征维度。例如，单一特征维度可以为广告、广告所属的广告主、广告推广的商品类型、广告的优化目标，相应的，则训练数据准备模块可以得到广告级别的互动数据、广告主级别的互动数据、商品类型的互动数据和优化目标的互动数据。此外，还可以基于单一特征维度进行交叉得到交叉维度，例如交叉维度为广告主和优化目标，那么可以训练数据准备模块可以获取广告主和优化目标级别的互动数据，广告主和优化目标的互动数据是指属于该广告同时属于该优化目标的互动数据。

在获取各个特征维度在多个时间段内的互动数据之后，则可以基于这些互动数据计算多媒体信息历史的真实互动率偏差。同样以多媒体信息为广告为例，这里以互动率为转化率为例，广告的真实转化率偏差可以为某一时间段内广告的真实转化率与每一次预估的转化率的比值。若一个时间段为1天，那么广告的真实转化率偏差则为1天内的真实转化率与预估的该天的转化率的比值，所得到的转化率是大于0的实数。

通过训练数据准备模块，则可以得到用于训练的训练样本集合。以多媒体信息为广告为例，训练样本集合可以包括各个广告历史20天的转化率偏差值集合和各个广告的资源属性信息，每一天的转化率偏差集合包括设定的多个特征维度的转化率值偏差，而每一个训练样本可以包括一个广告的资源属性信息和连续8天的转化率偏差值集合，其中，资源属性信息和前7天的转化率偏差值集合作为模型输入，第8天的转化率偏差值集合作为模型验证数据。当然，时间段可以是根据实际情况进行设定的，本申请实施例对此不做限制。

本申请实施例中，获取的训练样本数据可以存储至训练样本库中，以便训练模型是从中获取训练样本。

步骤402：从训练样本库中获取设定数量的训练样本。

本申请实施例中，可以从训练样本库中获取用于模型训练的训练样本。设定数量可以根据需求进行设定，如可以设置模型的batch_size=4096，即从训练样本库中抽取4096个训练样本进行模型训练。

此外，模型的其他训练参数可以包括使用Tensorflow框架实现，利用Adam作为模型训练的优化器，采用批量随机梯度下降（batch stochastic gradient descent）方法更新模型权重参数，训练次数epoch=3，学习率learning_rate=0.0001。当然，这仅仅是一种可能的参数设置，根据实际需求可进行可能的调整或者改变，本申请实施例对此不做限制。

步骤403：将每一训练样本包括的资源属性信息以及前N个时间段的互动率偏差值集合作为互动率校正模型的输入，获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值。

本申请实施例中，获取训练样本后，则可以按照设定的训练参数对互动率校正模型进行多次训练，由于每一次训练过程是类似的，因此这里以一次训练过程为例进行介绍。

具体的，针对每一训练样本，可以将其包括的资源属性信息以及前N个时间段的互动率偏差值集合作为互动率校正模型的输入，获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值。该过程会在后续模型实际使用过程中进行具体介绍，因此在此先不过多赘述。

步骤404：根据模型预测的多媒体信息在第N+1个时间段的互动率偏差值，与训练样本中第N+1个时间段的互动率偏差值集合，获取互动率校正模型的损失值（loss）。

为了验证模型预测是否准确，可以将模型预测的多媒体信息在第N+1个时间段的互动率偏差值，与训练样本中第N+1个时间段的互动率偏差值集合进行比较，从而获取互动率校正模型的损失值。其中，第N+1个时间段的互动率偏差值集合可以包括多个特征维度的互动率偏差值，进行比较时，是将模型预测的多媒体信息的互动率偏差值与集合中多媒体信息的互动率偏差值进行比较。

针对每一训练样本而言，该样本的损失值可以是模型预测的多媒体信息在第N+1个时间段的互动率偏差值，与该训练样本中多媒体信息在第N+1个时间段的互动率偏差值的差值，进而基于所有训练样本的损失值得到互动率校正模型的损失值。

步骤405：根据损失值确定是否继续对互动率校正模型进行训练。

模型训练的过程是对模型不断进行优化的过程，在每一次的训练过程中，为了衡量模型是否需要继续训练，损失值可以表征模型预测的多媒体信息在第N+1个时间段的互动率偏差值，与该训练样本中多媒体信息在第N+1个时间段的互动率偏差值之间的差异度，从而损失值可以衡量当前的模型是否足够准确。

步骤406：若步骤405的确定结果为是，则对互动率校正模型的模型参数进行调整。

本申请实施例中，若损失值大于预设的损失阈值，则表明当前的互动率校正模型尚不满足准确度要求，则需要继续对模型进行训练。

具体的，可以根据损失值对互动率校正模型的模型参数进行调整，再通过调整后的互动率校正模型继续下一次训练，即跳转至步骤403。其中，模型调整例如可以采用上述的批量随机梯度下降法，当然也可以采用其他可能的模型优化方法，如梯度下降法（Gradient Descent）或者牛顿法（Newton's method）等优化算法。

步骤407：若步骤405的确定结果为否，则结束训练流程。

若确定互动率校正模型的损失值小于预设损失阈值，则表明当前的互动率校正模型已满足准确度要求，则可以将该互动率校正模型投入实际使用，因此，可以结束训练流程。

在模型训练完成之后，则可以将互动率校正模型应用于实际的互动率偏差预测过程，具体的，可以将互动率校正模型的模型训练和模型预测作为模型服务部署于服务器中，且模型服务可以为基于Tensorflow的model server，可部署在图形处理器（GraphicsProcessing Unit，GPU）上，采用多线程服务，以缓解模型服务的压力。

下面结合互动率校正模型对互动率校正的过程进行介绍。请参见图5，为利用互动率校正模型预测当前时间段的互动率校正的流程示意图。由于每一多媒体信息的互动率校正过程均是类似的，因此下面以一个多媒体信息的互动率校正过程为例进行介绍。

步骤501：获取多媒体信息的资源属性信息，以及该多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合。

步骤502：分别获取N个互动数据集合中每一互动数据集合对应的互动率偏差值集合。

步骤501和步骤502的过程可以通过实时数据统计模块和预测数据准备模块共同来实现，下面具体对步骤501和步骤502的过程进行介绍。

请继续参见图3所示，其中，可以通过实时数据统计模块统计多媒体信息的实时互动数据，以及多媒体信息的资源属性信息。其中，实时数据统计模块可以实时读取上游的实时数据库，获取实时数据文件，并进行整理统计，以供下游的预测数据准备模块使用。实时数据统计模块可以采用订阅的方式，从实时数据库订阅多媒体信息相关的信息，从而当有新的信息产生时，则数据库可以向实时数据统计模块推送这些信息。例如，对于广告而言，可以从广告投放端的业务数据库中，将广告相关的信息订阅出来。实时数据库例如可以为Hbase表，用于存储实时数据。实时数据统计模块获取的实时数据可以供预测数据准备模块进行使用，预测数据准备模块用于准备预测互动率偏差所需的资源属性信息、互动数据集合和互动率偏差值集合。

具体的，预测数据准备模块可以按照时间段对互动率偏差值集合进行整理。例如对于一个多媒体信息而言，以一个时间段为一天例，那么预测数据准备模块可以按照互动率校正模型的需求，每天获取实时数据统计模块获取的实时数据，并统计出每一个多媒体信息的多个特征维度的互动数据，并可进一步整理好多个特征维度的互动率偏差值。

此外，为了方便模型需要时直接取用数据，预测数据准备模块按照互动率校正模型的需求，将以此所需的数据整理完成一并存储。例如，对于一个多媒体信息而言，预测一次互动率偏差需要历史前7天的互动数据集合或者互动率偏差值集合，那么预测数据准备模块可以每次整理时将历史前7天的互动数据集合或者互动率偏差值集合一并存储。

本申请实施例中，互动率校正模型预测互动率偏差还需要多媒体信息的资源属性信息，因此预测数据准备模块还会从实时数据中获取各多媒体信息的资源属性信息。

本申请实施例中，为提升互动率校正模型的准确性，可通过新的训练数据以streaming的方式对模型进行更新，即将获取的各多媒体信息的资源属性信息和相应的互动数据集合或者互动率偏差值集合一并放入训练样本库中，以对互动率校正模型进行更新训练。

步骤503：利用已训练的互动率校正模型，获取多媒体信息在当前时间段的互动率偏差值。

步骤503的过程可以通过图3所示的模型训练模块训练得到的互动率校正模型和模型预测模块来进行。

如图6所示，为本申请实施例提供的互动率校正模型的一种模型架构示意图。其中，互动率校正模型可以包括深度部分（Deep Part）和宽度部分（Wide Part），即图6中所示的深度子模型和宽度子模型。下面对这两部分分别进行介绍，其中，宽度子模型的介绍如下。

本申请实施例中，根据多媒体信息在当前时间段之前的N个连续时间段的互动率偏差值集合，通过宽度子模型可以获取该多媒体信息的互动率偏差向量。

以多媒体信息为广告为例，考虑到目标是要预测广告播放时刻的互动率偏差，以一个时间段为一天为例的话，即需要预测多媒体信息展示当天的互动率偏差，其和该多媒体信息历史前N天的互动率偏差是存在一定联系的，因此可以通过历史N天广告级别的互动率偏差来对当天的互动率偏差进行预测。此外，新上线的广告可能不存在广告级别的历史播放信息，因此可能需要依赖其他方面的互动率偏差数据，如广告层级以上的信息比如广告主级别，商品类型级别，优化目标级别的历史互动率偏差，同时，还可以采用交叉特征来进一步提升模型的学习能力，比如引入由广告主和商品类型组成的交叉特征级别的历史互动率偏差。因此，当多媒体信息为广告时，可以采用了如下特征维度的历史互动率偏差数据，这里具体以互动率为转化率为例，特征维度可包括单一特征维度和有单一特征组合的交叉特征维度。

（1）单一特征维度的转化率偏差数据可以包括：

广告级别的转化率偏差数据，广告主级别的转化率偏差数据，商品类型级别的转化率偏差数据，优化目标级别的转化率偏差数据。其中，广告级别的转化率偏差数据是指该广告在一天内的真实转化率与该天的预估转化率之间的偏差，广告主级别的转化率偏差数据是指该广告主的所有广告的真实转化率与该天的预估转化率之间的偏差。

（2）交叉维度特征的转化率偏差数据可以包括如下的特征维度：

1）uid X product_id：由广告主和商品ID组成的交叉维度，其对应的转化数据则是既属于广告主又属于商品ID的转化数据，其对应的转化率偏差数据则可以是由既属于广告主又属于商品ID的转化数据获取得到的。举例来说，uid X product_id的实际转化率可以由广告主所有广告的实际转化率和属于该商品ID的所有广告的实际转化率计算得到，或者，也可以为广告主所有广告的所有转化次数和该商品ID的所有广告的转化次数之和，与广告主所有广告的展示次数和该商品ID的所有广告的展示次数之和的比值，预估转化率也可以同理得到。其中，转化次数是指转化成功的次数，完成一次优化目标则实现一次转化成功。

2）uid X product_type：由广告主和商品类型组成的交叉维度。

3）uid X optimization_goal：由广告主和优化目标组成的交叉维度。

4）uid X product_id X product_type：由广告主、商品ID和商品类型组成的交叉维度。

5）uid X product_id X optimization_goal：由广告主、商品ID和优化目标组成的交叉维度。

6）uid X product_type X optimization_goal：由广告主、商品类型和优化目标组成的交叉维度

7）uid X product_id X product_type X optimization_goal：由广告主、商品ID、商品类型和优化目标组成的交叉维度。

当然，在实际应用时，还可以包括其他可能的特征维度，本申请实施例对此不做限制。

考虑到互动次数的范围时很大的，而互动次数的值影响到基于该互动次数计算得到的转化率偏差的置信程度，例如互动次数较少时，基于该次数得到的转化率偏差的置信程度显然是很低的。因此，本申请实施例中基于此考虑，可以根据每一特征维度在每一时间段内的互动次数所属的数值区间，确定每一特征维度在每一时间段的互动率偏差子向量，其中，数值区间是根据互动次数的置信度进行划分的，再将各个特征维度在各时间段的互动率偏差子向量进行拼接，得到多媒体信息对应的互动率偏差向量。在进行拼接时，可以先将每一个特征维度在N个时间段的互动率偏差子向量进行拼接，以得到每一个特征维度对应的互动率偏差向量，再将多个特征维度进行组合，以得到多媒体信息对应的互动率偏差向量。

具体的，根据每一特征维度在每一时间段内的互动次数所属的数值区间，确定对应的互动率偏差子向量，可以是将每一特征维度在每一时间段内的互动次数所属的数值区间对应位置赋值为每一特征维度在每一时间段的互动率偏差值，除每一特征维度在每一时间段内的互动次数所属的数值区间之外的其余数值区间对应位置赋值为空值，以得到每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量。

同样以多媒体信息为广告，互动率为转化率为例，当计算转化率的转化次数仅为几次时，显然，这个转化率的置信程度是不如转化次数为几十或者几百次的。因此，本申请实施例可以将各个特征维度同对应时间段的转化次数进行交叉，将每一个特征维度在一个时间段内的转化率偏差扩展为一个多维的向量，该向量的维度与划分的区间数量有关，区间的划分可以是根据转化次数的置信程度进行的。

示例性的，可以将转化次数划分为(0，5]，(5，10]，(10，100]，(100，+∞)这四个区间，当一个特征维度在一个时间段的转化次数属于哪个区间时，则将思维向量中对应位置的值赋值为该特征维度在该时间段的转化率偏差，4个维度中只有1维会填写非0的转化率偏差，其他维度为0。例如，交叉特征维度uid X product_id X product_type在历史7天的转化数分别为2、2、2、6、15、200和300，历史7天对应的转化率偏差分别为1.1、1.2、1.3、1.4、1.5、1.6和1.7，以第一天为例，其转化数为2，落在第一个转化区间(0, 5]上，从而第一天的子向量为[1.1，0，0，0]，以此类推，由此可以得到整个历史7天的向量，即该特征维度历史7天中每一天对应的子向量分别为[1.1，0，0，0]、[1.2，0，0，0]、[1.3，0，0，0]、[0，1.4，0，0]、[0，0，1.5，0]、[0，0，0，1.6]和[0，0，0，1.7]，将其进行拼接则可以得到该特征维度历史7天对应的转化率偏差向量为[1.1，0，0，0，1.2，0，0，0，1.3，0，0，0，0，1.4，0，0，0，0，1.5，0，0，0，0，1.6，0，0，0，1.7]。

因此，对于上述的一个广告而言，其转化率偏差向量可表示如下：

feature_i= [Feature_j_day_ago，Feature_6_day_ago，…，Feature_1_day_ago]

i = 1 to m

其中，feature_i为第i个特征维度的转化率偏差向量，m为特征维度的数量，Feature_j_day_ago表示第i个特征维度j天前的转化率偏差子向量，j的取值为1~N，如Feature_6_day_ago表示第i个特征维度6天前的转化率偏差子向量，即N个时间段中第2个时间段的转化率偏差子向量。

其中feature_i每一天的子特征向量feature_j_day_ago表示如下：

Feature_j_day_ago = [a_j1，a_j1，a_j1，…，a_ji]

其中，a_ji表示j天前第i个数值区间的值，每个转化区间填写值a_ji根据如下公式决定：

即，当在j天前的转化数位于数值区间i时，则数值区间i对应维度赋值转化率偏差，其余数值区间为0。

最后，通过所有特征维度的转化率偏差向量拼接而成得到广告的转化率偏差向量，可表示如下：

Wide_ feature= [feature₁，feature₁，…，feature_m]

如上述的一个广告有11个特征维度，每一特征维度的feature_i由7个子向量feature_j_day_ago拼接而成，一个子向量feature_j_day_ago有4个维度，那么最终的wide_feature共有308维度。

下面对深度子模型进行介绍。

如图6所示，深度子模型可以包括特征向量化层和至少两个全连接层。当然，在实际使用时，深度子模型还可以采用其他可能的结构，本申请实施例对此不做限制。

具体的，特征向量化层可以用于将资源属性信息中各特征字段和各特征字段对应的特征值进行拼接，并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量（embedding）。例如，商品ID是特征字段，具体的商品ID值为特征值，将商品ID和商品ID实际值拼接在一起，再获取对应的词向量。词向量的获取可以是从词向量库中查找到拼接后的商品ID和商品ID实际值对应的词向量，该词向量库可以在互动率校正模型的训练过程中一并训练得到，且该词向量库包括所有拼接的特征字段和特征值对应的词向量。

在具体实施过程中，为了方便查找拼接的特征字段和特征值对应的词向量，可以将各特征字段和各特征字段对应的特征值进行编码，并将编码后的各特征字段和各特征字段对应的特征值进行拼接，得到各特征字段和各特征字段对应的特征值对应的索引号，进而根据各特征字段和各特征字段对应的特征值对应的索引号，从词向量库中获取索引号对应的词向量。

其中，编码例如可以采用计算哈希值的方式进行，通过将特征字段和特征值哈希化之后进行拼接，即可得到索引号，例如可以哈希化的特征字段和特征值直接进行拼接，也可以采用异或拼接的方式，即采用如下的计算公式获取索引号：

embedding_index = hash（feature_name）^ hash（feature_value）

对于ID类和离散型的特征，采用上述计算方式尤其适用。而对于连续型特征，则可以先进行离散化后，在通过上述方式计算得到。

具体的，可以确定特征字段的特征值所属的特征值区间，对特征值所属的特征值区间的索引号进行编码，并对特征字段进行编码，进而将编码后的特征值区间的索引号与编码后的特征字段进行拼接，得到特征字段和特征字段对应的特征值对应的索引号，已根据该索引号从词向量库中获取相应的词向量。

同样以广告为例，输入到深度子模型的广告的资源属性信息例如可以包括特征字段广告ID(adgroup_id)，广告主ID(advertiser_id)，商品ID(product_id)，推广渠道（site_set），广告位ID（position_id），推广计划ID(campaign_id)，商品类型(product_type)，优化目标(optimization_goal)，广告主行业(advertiser_industry)，是否是新广告（is_new_ad），广告主出价（target_cpa）等。此外，除了上述资源属性信息，还可以将广告的互动数据作为深度子模型的输入，以使得深度子模型的特征维度更多，使得模型预估更加准确。

对于ID类和离散特征，可以上述采用hash异或拼接的方式产生索引号，然后从词向量库中获取索引号对应的词向量。例如，对于广告ID为111111的广告，其对应的embedding编号为hash(“adgroup_id”) ^ hash(1111)，对于商品类型(product_type)为5的广告，其对应的索引号为hash(“product_type”) ^ hash(5)。而对于连续类特征，需要先进行特征的离散化，将相应的特征离散到某一个特征区间，然后再采用上述离散特征的方式得到对应的索引号。例如对于target_cpa特征，可以定义(0，20]，(20，50]，(50，100]，(100，200]，(200，500]，(500，+∞)这6个区间，当某个广告的target_cpa为38时，则落在第2个区间，其对应的索引号为hash(“target_cpa”)^hash(2)。

如图7所示，对于所有特征字段存在一个全局的embedding look up词表，此词表可以在模型训练的时候同步更新，是一个端到端（end to end）的embedding词表。对于每一个特征，凭借其对应索引号获取对应的词向量。

本申请实施例中，得到了所有特征字段对应的词向量之后，则可以得到：

Deep_feature = [embedding₁，embedding₂，…，embedding_P]

其中，Deep_feature为特征向量化层得到的词向量集合，embedding_P表示第P个特征字段对应的词向量。

如图6所示，深度子模型还包括至少两个全连接层，图6具体以两个进行示出。其中，至少两个全连接层用于对各特征字段对应的词向量进行特征映射，以得到多媒体信息的资源表示向量。

具体的，全连接网络的映射关系可以表示为：

a_L+1 = f（W_L* a_L + b_L）

其中，其中L为深度子模型的网络层的序号，如图6所示，包括3个网络层，则L取值为1~3，f表示激活函数，例如可以为线性整流函数（Rectified Linear Unit，ReLU），当然，也可以是其他可能的激活函数，a_L是第L个网络层的输出，且a₁即为上述Deep_feature，W_L为第L层的模型权重参数，b_L是第L层的模型偏置参数，模型权重参数和模型偏置参数可通过模型训练获得。

在获得宽度子模型获得的互动率偏差向量和深度子模型的顶层输出的资源表示向量之后，则可以基于宽度子模型和深度子模型的权重，基于互动率偏差向量和资源表示向量得到在当前时间段的互动率偏差值。

具体的，互动率校正模型的预测值y的表达式为宽度子模型获得的互动率偏差向量和深度子模型的顶层输出的资源表示向量之和，即：

其中，

和

分别为宽度子模型和深度子模型的模型权重，

即为深度子模型最终输出的资源表示向量，b为模型最后输出偏置，可通过模型训练得到。

步骤504：通过多媒体信息在当前时间段的互动率偏差值对预估互动率进行校正。

具体的，可以将上述互动率校正模型输出的互动率偏差值作为互动率校正因子，在预估互动率的基础上乘以互动率校正因子，以对预估互动率进行校正。

本申请实施例中，在对预估互动率进行校正之后，则可以基于校正后的预估互动率进行多媒体信息的推荐。请参见图8，为多媒体信息推荐过程的流程示意图。

步骤801：分别获取多个多媒体信息中各个多媒体信息对应的预估互动率，预估互动率为预估的用户与多媒体信息进行互动的次数与多媒体信息的展示次数之间的比值。

本申请实施例中，当存在一个多媒体信息的展示机会时，即目标用户打开的页面中存在多媒体信息的信息展示位，则会从存在的所有多媒体信息中进行粗略的筛选，得到多个多媒体信息，进而针对这多个多媒体信息进行排序，以确定最终推荐给目标用户的多媒体信息。

具体的，可以基于多媒体信息的数据对各个多媒体信息的互动率进行预估，来得到各个多媒体信息对应的预估互动率，以衡量各个多媒体信息的展示价值。其中，预估互动率为预估的用户与多媒体信息进行互动的次数与多媒体信息的展示次数之间的比值。互动率的预估可以通过设定的精确互动率预估模型得到。

上述的步骤801可通过如图3所示的互动率预测模块来实现。

步骤802：对各个多媒体信息的预估互动率进行校正，获得校正后的预估互动率。

具体的，可以利用图4或者图5所示的方法获得互动率偏差值，并将互动率偏差值作为互动率校正因子，对预估互动率进行校正，获得校正后的预估互动率。

步骤803：分别根据各个多媒体信息校正后的预估互动率，获取各个多媒体信息在信息展示位上进行展示所需提供的电子资源。

为了确定最终展示哪个多媒体信息，可以根据校正后的预估互动率，获取各个多媒体信息在信息展示位上进行展示所需提供的电子资源，进而根据电子资源的具体值来确定最终展示的多媒体信息。

上述的步骤802和步骤803可以通过图3所示的电子资源确定模块来实现。其中，图3中的模型预测模块可以将预测的每个时间段各个多媒体信息的互动率偏差值存储在数据库中，例如可以以词表的形式进行存储，则电子资源可以通过词表传送模块获取预测好的互动率偏差值，进而对预估互动率进行校正，并确定电子资源。

步骤804：根据各多媒体信息对应的电子资源，从多个多媒体信息中确定目标多媒体信息，并将目标多媒体信息推荐给目标用户。

具体的，可以根据电子资源值从大到小的顺序，对各个多媒体信息进行排序，进而选择排名靠前的一个或者多个多媒体信息作为目标多媒体信息，并将目标多媒体信息推荐给目标用户。

下面以多媒体信息为广告为例，由于对于广告而言，互动数据一般可以包括点击率和转化率等，相较点击率而言，由于转化率存在数据稀疏的特征，因而转化率的预估是更容易出现偏差的，因此下面讲具体以互动率为转化率为例进行介绍。如图9所示，为广告平台进行广告推荐的流程示意图。

步骤901：广告主创建广告。

如图10所示，为广告主创建广告的流程示意图。

其中，广告主在选择广告形式界面上选择想要创建的广告的形式，以ocpa广告为例，广告主可选择常规展示广告。进而进入广告定向设置界面，在该页面上，广告主可以设置该广告的定向用户，以便广告平台将该广告推荐给适合的用户。其中，广告主可选则多种设置方式，即新建定向，或者使用以往创建的定向设置。定向属性可以包括用户的地理位置、年龄、性别、行为兴趣意向、学历、联网方式或者资产状况等，此外，还可以设置特定的定向人群或者排除人群。

其次，广告主进入广告展示位设置界面，可以选择广告进行展示的位置，例如选择该广告平台所拥有的产品，这样，该广告则可以在这些产品中进行推荐。

接着，广告主还可以在广告排期与出价设置界面中设置广告的投放时间以及广告出价设置。其中，广告排期可以包括广告投放日期、这些日期中的投放时间等，广告出价设置可以包括设置该广告的出价方式、优化目标、出价策略以及具体出价值等。

完成上述设置之后，则可以创建一个新的广告。广告主则可以在广告监控页面上查看广告的互动数据，如展示次数、点击次数、点击率或者花费等。同时用户还可以将广告互动数据，如转化数据反馈给广告平台，以辅助平台优化互动率校正模型。

步骤902：广告平台将新创建的广告加入到全量广告库中。

其中，全量广告库包括该广告平台中的所有广告。此外，实时新增的广告还会进入增量广告库中，增量广告库为实时新增的广告集合。

步骤903：广告平台对全量广告进行离线排序，确定出向用户推荐的优质广告。

如图11所示，为广告平台为用户推荐广告的过程示意图。

具体的，全量广告库中的广告数量众多，因此可以从中选择出一些较为优质的广告，作为在线索引广告，在线索引广告为可能会被推荐给用户的广告。

步骤904：用户向广告平台发起广告请求。

其中，在网络页面中可以存在广告展示位，当用户在浏览这些网络页面时，则会触发向广告平台发起广告请求。

步骤905：广告平台基于广告请求进行定向匹配，检索获取候选广告。

具体的，接收到广告请求时，可以根据发起该广告请求的用户的用户画像从在线索引广告中检索得到适合该用户的多个广告，以提高广告的召回率。

步骤906：广告平台对候选广告进行粗排。

其中，粗排可以基于点击率预估模型（Litectr）和转化率预估模型（Litecvr）预估的点击率（click through rate，CTR）和转化率进行。粗排阶段的点击率预估模型和转化率预估模型所使用的特征维度一般少于精排阶段的点击率精准预估模型（Pctr）和转化率精准预估模型（Pcvr），以加快粗排阶段的速度。

步骤907：广告平台对多路粗排的结果进行多路归并排序，获取优选的候选广告。

粗排可以是多路并行进行的，因此，多路粗排完成后，需要对多路粗排结果进行归并，以从中选择出进入精排阶段的广告。

步骤908：广告平台对候选广告进行精排，选定目标广告。

步骤909：将目标广告推荐给用户。

本申请实施例的方案主要应用于精排阶段。通过本申请实施例提供的互动率校正模型可以得到转化率偏差值，并可将转化率偏差值作为转化率校正因子（pCVR_bias_factor），对转化率精准预估模型得到预估转化率的偏差（pCVR_bias）进行校正。当然，上述的方案对于点击率精准预估模型得到的预估点击率也是同样适用的。

对于进入精排阶段的广告，其基本信息，比如广告主出价以及实时调节因子lambda已经获得，还差精排因子的预估。其中实时调节因子lambda是一个通过独立的模块得到的，该模块负责实时输出一个调节因子，该因子作用在广告主设置的出价上，就相当于广告平台替广告主实时更新出价，其基本原理为根据当前统计的每个广告的实时成本，比较广告实时成本与广告主出价之间的差距，如果广告实时成本高于广告主出价，则将广告实时成本下降，即设置lambda<1，而如果广告实时成本高于广告主出价，则将广告实时成本上调，即设置lambda>1。为了维持线上系统的稳定性，lambda一般有上下界的控制。

广告进入精排阶段后，首先需要通过点击率精准预估模型和转化率精准预估模型进行点击率和转化率的预估，在完成所有进入精排阶段的广告的点击率和转化率预估之后，则会进行ecpm的计算，此时可以获取加载包括互动率校正模型得到的各个广告的转化率偏差值的转化率偏差词表，获得每个广告的转化率偏差值，至此，可以根据ecpm计算公式进行排序：

ecpm = bid × pCTR × pCVR × pCVR_bias_factor × lambda

其中，bid为广告主设定的出价，pCTR为点击率精准预估模型预估的点击率，pCVR为转化率精准预估模型预估的转化率，pCVR_bias_factor为转化率偏差值，lambda为实时调节因子。

根据上述公式，可以获取所有广告的ecpm，并依据ecpm进行排序，得到广告最终的排序顺序，从而将排序靠前的一个或者多个广告作为目标广告，推动给用户，使得在相应广告展示位上进行展示。

综上所述，出价是广告主投放广告的非常重要的一个环节，要得到符合预期的回报投入比(Return on Investment，ROI)，广告主必须为自己的广告设置一个合理的出价。在传统的cpc(cost per click)广告出价中，广告主存在反复试探出价以获得预设转化成本的等价点击出价的现象，对广告主来讲不是一个很好的体验。基于此，在这种背景下，广告平台推出智能出价广告，如ocpa广告，一方面从广告主真实关心的转化层面给予广告主出价的能力，同时提供底层算法引擎，保障广告能够维持在广告主预设成本的附近，另一方面，对广告主而言，转化成本可控，从而节省广告主频繁调节出价的操作。

由于本申请实施例中在出价时对预估转化率进行了校正，从而使得实时调节因子的功能更加单一可靠，只需要拟合历史成本偏差即可，而不需要同时兼顾各种模型预估偏差导致的广告成本偏离，从而使得出价公式中实时调节因子预估更合理，实时调节因子的调控更加合理。此外，单独引入广告级别的转化率偏差值，使得广告级别的转化率偏差更精准的被估计，从而使得出价公式中的转化率能够更好的向广告真实转化率靠近，从而使得广告的成本靠近广告主预设的出价，从而提高达成率。

其次，本申请实施例使用Wide和Deep结合的模型单独来获得转化率偏差值，估计结果更加准确。

请参见图12，基于同一发明构思，本申请实施例还提供了一种多媒体信息推荐装置120，该装置包括：

获取单元1201，用于获取多个多媒体信息的资源属性信息，以及多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合，其中，每一时间段的互动数据集合包括多媒体信息在多个特征维度上的互动数据；

获取单元1201，还用于分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合；其中，每一互动率偏差值集合包括多媒体信息在多个特征维度上的互动率偏差值，每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差；预估互动率为预估的用户与多媒体信息进行互动的次数与述多媒体信息的展示次数之间的比值；

确定单元1202，用于利用已训练的互动率校正模型，根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合，获取各多媒体信息在当前时间段的互动率偏差值；其中，互动率校正模型是利用多个训练样本训练得到的，每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合；互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差；

校正单元1203，用于通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正；

推荐单元1204，用于根据各多媒体信息校正后的预估互动率，从多个多媒体信息中确定目标多媒体信息，并将目标多媒体信息推荐给目标用户。

可选的，该装置还包括模型训练单元1205，用于：

从训练样本库中获取设定数量的训练样本；

通过获取的训练样本，按照设定的训练参数对互动率校正模型进行多次训练，每一次训练过程包括如下步骤：

根据资源属性信息以及N+1个连续时间段中前N个时间段的互动率偏差值集合，通过互动率校正模型，获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值；

根据训练样本的多媒体信息在第N+1个时间段的互动率偏差值，与训练样本中第N+1个时间段的互动率偏差值集合，获取互动率校正模型的损失值；

根据损失值确定是否继续对互动率校正模型进行训练；

若确定继续对互动率校正模型进行训练，则对互动率校正模型的模型参数进行调整，并通过调整后的互动率校正模型继续下一次训练过程。

可选的，互动率校正模型包括宽度子模型和深度子模型，则确定单元1202，用于：

根据N个互动率偏差值集合，通过宽度子模型获取多媒体信息的互动率偏差向量；

根据资源属性信息，通过深度子模型获取多媒体信息的资源表示向量；

基于宽度子模型和深度子模型的权重，根据互动率偏差向量和资源表示向量得到在当前时间段的互动率偏差值。

可选的，确定单元1202，用于：

根据每一特征维度在每一时间段内的互动次数所属的数值区间，确定每一特征维度在每一时间段的互动率偏差子向量，其中，数值区间是根据互动次数的置信度进行划分的；

将各个特征维度在各时间段的互动率偏差子向量进行拼接，得到多媒体信息对应的互动率偏差向量。

可选的，确定单元1202，用于：

将每一特征维度在每一时间段内的互动次数所属的数值区间对应位置赋值为每一特征维度在每一时间段的互动率偏差值，除每一特征维度在每一时间段内的互动次数所属的数值区间之外的其余数值区间对应位置赋值为空值，以得到每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量。

可选的，多个特征维度包括多个单一特征维度和由多个单一特征维度进行交叉得到的交叉特征维度。

可选的，深度子模型包括特征向量化层和至少两个全连接层，则确定单元，用于：

通过特征向量化层，将资源属性信息中各特征字段和各特征字段对应的特征值进行拼接，并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量；

通过至少两个全连接层，对各特征字段对应的词向量进行特征映射，以得到资源表示向量。

可选的，确定单元1202，用于：

根据各特征字段和各特征字段对应的特征值对应的索引号，从词向量库中获取索引号对应的词向量，其中，词向量库为在互动率校正模型的训练过程中训练得到的，词向量库包括所有拼接的特征字段和特征值对应的词向量。

可选的，若特征字段的类型为数值连续型字段，则确定单元1202，用于：

确定特征字段的特征值所属的特征值区间，对特征值所属的特征值区间的索引号进行编码，并对特征字段进行编码；

将编码后的特征值区间的索引号与编码后的特征字段进行拼接，得到特征字段和特征字段对应的特征值对应的索引号。

可选的，推荐单元1204，用于：

根据各多媒体信息对应的电子资源，对多个多媒体信息进行排序；

根据排序结果从多个多媒体信息确定目标多媒体信息，并将目标多媒体信息推荐给目标用户。

该装置可以用于执行图2~图11所示的实施例中服务器端所执行的方法，因此，对于该装置的各功能模块所能够实现的功能等可参考图2~图11所示的实施例的描述，不多赘述。其中，模型训练单元1205并不是必选的功能模块，因此在图12中以虚线进行示出。

请参见图13，基于同一技术构思，本申请实施例还提供了一种计算机设备130，可以包括存储器1301和处理器1302。

所述存储器1301，用于存储处理器1302执行的计算机程序。存储器1301可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1302，可以是一个中央处理单元（central processing unit， CPU），或者为数字处理单元等等。本申请实施例中不限定上述存储器1301和处理器1302之间的具体连接介质。本申请实施例在图13中以存储器1301和处理器1302之间通过总线1303连接，总线1303在图13中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线1303可以分为地址总线、数据总线、控制总线等。为便于表示，图13中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器1301可以是易失性存储器（volatile memory），例如随机存取存储器（random-access memory，RAM）；存储器1301也可以是非易失性存储器（non-volatilememory），例如只读存储器，快闪存储器（flash memory），硬盘（hard disk drive，HDD）或固态硬盘（solid-state drive，SSD）、或者存储器1301是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器1301可以是上述存储器的组合。

处理器1302，用于调用所述存储器1301中存储的计算机程序时执行如图2~图11所示的实施例中设备所执行的方法。

在一些可能的实施方式中，本申请提供的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤，例如，所述计算机设备可以执行如图2~图11所示的实施例中设备所执行的方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种多媒体信息推荐方法，其特征在于，所述方法包括：

分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合；其中，每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值，每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差；所述预估互动率为预估的用户与多媒体信息进行互动的次数与所述多媒体信息的展示次数之间的比值；

2.如权利要求1所述的方法，其特征在于，所述互动率校正模型是通过如下训练过程训练得到的：

从训练样本库中获取设定数量的训练样本；

3.如权利要求1所述的方法，其特征在于，所述互动率校正模型包括宽度子模型和深度子模型，则针对每一多媒体信息，利用互动率校正模型获取互动率偏差值，包括：

根据所述N个互动率偏差值集合，通过所述宽度子模型获取多媒体信息的互动率偏差向量；

根据所述资源属性信息，通过所述深度子模型获取多媒体信息的资源表示向量；

基于所述宽度子模型和所述深度子模型的权重，根据所述互动率偏差向量和所述资源表示向量得到在当前时间段的互动率偏差值。

4.如权利要求3所述的方法，其特征在于，根据所述N个互动率偏差值集合，通过所述宽度子模型获取多媒体信息的互动率偏差向量，包括：

根据每一特征维度在每一时间段内的互动次数所属的数值区间，确定所述每一特征维度在每一时间段的互动率偏差子向量，其中，所述数值区间是根据互动次数的置信度进行划分的；

5.如权利要求4所述的方法，其特征在于，根据每一特征维度在每一时间段内的互动次数所属的数值区间，确定所述每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量，包括：

6.如权利要求1-5任一所述的方法，其特征在于，所述多个特征维度包括多个单一特征维度和由所述多个单一特征维度进行交叉得到的交叉特征维度。

7.如权利要求3-5任一所述的方法，其特征在于，所述深度子模型包括特征向量化层和至少两个全连接层，则根据所述资源属性信息，通过所述深度子模型获取多媒体信息的资源表示向量，包括：

8.如权利要求7所述的方法，其特征在于，通过所述特征向量化层，将所述资源属性信息中各特征字段和各特征字段对应的特征值进行拼接，并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量，包括：

9.如权利要求8所述的方法，其特征在于，若特征字段的类型为数值连续型字段，则分别对各特征字段和各特征字段对应的特征值进行编码，并将数值化后的各特征字段和各特征字段对应的特征值进行拼接，得到各特征字段和各特征字段对应的特征值对应的索引号，包括：

10.如权利要求1所述的方法，其特征在于，根据各多媒体信息校正后的预估互动率，从所述多个多媒体信息中确定目标多媒体信息，并将所述目标多媒体信息推荐给目标用户，包括：

11.一种多媒体信息推荐装置，其特征在于，所述装置包括：

12.如权利要求11所述的装置，其特征在于，所述互动率校正模型包括宽度子模型和深度子模型，则所述确定单元，具体用于：

13.如权利要求11所述的装置，其特征在于，所述确定单元，具体用于：

14.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，

所述处理器执行所述计算机程序时实现权利要求1至10任一项所述方法的步骤。

15.一种计算机存储介质，其上存储有计算机程序指令，其特征在于，

该计算机程序指令被处理器执行时实现权利要求1至10任一项所述方法的步骤。