CN117349458B

CN117349458B - 一种多媒体推荐方法、装置、设备和存储介质

Info

Publication number: CN117349458B
Application number: CN202311652528.2A
Authority: CN
Inventors: 王宇哲
Original assignee: Beijing Sohu New Media Information Technology Co Ltd
Current assignee: Beijing Sohu New Media Information Technology Co Ltd
Priority date: 2023-12-05
Filing date: 2023-12-05
Publication date: 2024-04-09
Anticipated expiration: 2043-12-05
Also published as: CN117349458A

Abstract

本申请公开一种多媒体推荐方法、装置、设备和存储介质，获取用户信息并从用户信息中抽取包括用户标识、用户行为偏好画像和历史点击信息在内的用户信息特征，将用户信息特征输入至预设多媒体推荐模型，多媒体推荐模型能够根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个环节的分数，设定环节为行为转化链中与用户行为相关的环节，然后计算出多媒体池中各个多媒体在不同消费场景下的融合排序分，该预设多媒体推荐模型能够计算不同消费场景下的融合排序分，具有通用性。最后，根据融合排序分从高到低的顺序，向用户推荐多媒体。

Description

一种多媒体推荐方法、装置、设备和存储介质

技术领域

本申请属于计算机技术领域，尤其涉及一种多媒体推荐方法、装置、设备和存储介质。

背景技术

现有的多媒体推荐系统中，多媒体推荐模型缺乏通用性。具体表现为：不同消费场景对应有不同的多媒体推荐模型，各个多媒体推荐模型之间的信息无法共享，并且，多个多媒体推荐模型会增加多媒体推荐系统所在服务器的负载，影响服务器的性能，从而影响多媒体推荐系统的推荐效率。

发明内容

有鉴于此，本申请提供一种多媒体推荐方法、装置、设备和存储介质，以用于解决现有的推荐系统中的多媒体推荐模型缺乏通用性的问题。

为解决上述问题，本申请提供如下方案：

一种多媒体推荐方法，包括：

获取用户信息；

从用户信息中抽取用户特征信息，用户特征信息包括用户标识、用户行为偏好画像和历史点击信息；

将用户特征信息输入至预设多媒体推荐模型，多媒体推荐模型被配置为：根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个设定环节的分数，计算出多媒体池中各个多媒体在不同消费场景下的融合排序分；设定环节为行为转化链中与用户行为相关的环节；

按照融合排序分从高到低的顺序，向用户推荐多媒体。

可选的，计算出多媒体池中各个多媒体在不同消费场景下的融合排序分，包括：

按照预先确定的权重系数融合各个多媒体在各个设定环节的分数，计算得到融合排序分。

可选的，权重系数包括环节权重系数和场景权重系数，环节权重系数用于表征各个环节在不同消费场景下的重要性，场景权重系数用于表征消费场景的重要性。

可选的，按照以下步骤确定权重系数：

设置多组权重系数，将多组权重系数应用到计算融合排序分的步骤；

根据用户对推荐结果的反馈信息，从多组权重系数中确定符合权重系数更新规则的权重系数。

可选的，多媒体包括文本、音频和视频。

可选的，当多媒体为视频时，消费场景包括频道流、详情页、沉浸式。

一种多媒体推荐装置，包括：

获取单元、特征抽取单元、融合分数计算单元和推荐单元，其中：

获取单元，用于获取用户信息；

特征抽取单元，用于从用户信息中抽取用户特征信息，用户特征信息包括用户标识、用户行为偏好画像和历史点击信息；

融合分数计算单元，用于将用户特征信息输入至预设多媒体推荐模型，多媒体推荐模型被配置为：根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个设定环节的分数，计算出多媒体池中各个多媒体在不同消费场景下的融合排序分；设定环节为行为转化链中与用户行为相关的环节；

推荐单元，用于按照融合排序分从高到低的顺序，向用户推荐多媒体。

可选的，推荐单元，用于：

一种多媒体推荐设备，包括存储器和处理器；

存储器用于存储指令；

处理器用于执行存储器中存储的指令，以实现如上文任一项所述的多媒体推荐方法。

一种存储介质，其上存储有计算机程序，计算机程序被处理器执行时，能实现如上文任一项所述的多媒体推荐方法。

由以上方案可知，本申请公开的多媒体推荐方法、装置、设备和存储介质，获取用户信息并从用户信息中抽取包括用户标识、用户行为偏好画像和历史点击信息在内的用户信息特征，将用户信息特征输入至预设多媒体推荐模型，多媒体推荐模型能够根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个环节的分数，设定环节为行为转化链中与用户行为相关的环节，然后计算出多媒体池中各个多媒体在不同消费场景下的融合排序分，该预设多媒体推荐模型能够计算不同消费场景下的融合排序分，具有通用性。最后，根据融合排序分从高到低的顺序，向用户推荐多媒体。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本申请提供的多媒体推荐方法的流程示意图；

图2是本申请提供的多媒体推荐模型的结构示例图；

图3是本申请提供的多媒体推荐装置的组成结构图；

图4是本申请提供的多媒体推荐设备的硬件结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

现有的多媒体推荐系统中，不同的消费场景下对应有不同的多媒体推荐模型。由于消费场景复杂度逐渐提高，随之产生了很多的问题：

从多媒体推荐系统的精准度来看，不同的多媒体推荐模型在其对应的消费场景中运行，各自涉及的很多信息数据无法共享，实际上消费场景之间是存在一定的相关性的，信息数据无法共享会影响各多媒体推荐模型的推荐精准度；

从多媒体推荐系统的运行效率来看，随着消费场景越来越复杂，消费场景的数量也会越来越多，这就导致多媒体推荐系统中的多媒体推荐模型也会随之增加，多媒体推荐模型的数量以及数量的增多会影响多媒体推荐系统所在的服务器的运行性能，从而会影响多媒体推荐系统的推荐效率。

为了解决上述问题，发明人想到建立融合不同消费场景的多媒体推荐模型，对用户的行为转化链进行建模，从而增加多媒体推荐系统推荐的精准度以及推荐效率，实现推荐系统收益最大化。但是又有新的问题随之产生：

以视频消费为例，推荐系统的用户消费场景包括频道流、详情页、沉浸式等等。

对于频道流，用户滑动至视频全部露出时，视频会开始自动播放，用户可以通过这种方式初步了解视频的内容，然后选择点进详情页继续消费，或者在频道流场景下消费至视频结束。需要说明的是，用户在视频上的消费时长，主要来源于频道流自动播放的这种消费方式。

对于详情页，与频道流相比，增加了全屏播放、关注账号、点赞、观看其他相关视频等功能，故，在详情页场景下，能够获取更加丰富的用户兴趣反馈。

对于沉浸式，用户可以通过上划这一动作，直接消费下一条视频，吸引更多用户进入该消费场景，有利于视频消费时长的增长。

不同的消费场景具有不同的行为转化链，例如：

对于频道流，行为转化链一般为：曝光－﹥自动播放－﹥中插广告曝光。

对于详情页，行为转化链一般为：曝光－﹥点击－﹥视频完播。

需要说明的是，自动播放、点击属于浅度转化，视频中插广告曝光、完播属于深度转化。

不同场景的转化类型以及转化率差异大，转化类型差异表现在：对于频道流消费视频，是通过自动播放；详情页消费视频，是通过视频点击。也就是不同的消费场景的转化链是不同的。转化率差异大表现在：以中插广告曝光这一目标的转化率为例，视频播放到一定时长才会看到广告，用户通常会在频道流通过自动播放大致了解视频内容，非常感兴趣时才会点击进入详情页进行观看，这一行为模式使得频道流、详情页两个消费场景下的视频观看时长分布不一致，从而中插广告曝光的概率不一致。

相应的，对于发明人提出的建立融合不同消费场景的多媒体推荐模型的方法，在共同训练跨场景的异构数据的过程中，会出现梯度冲突、互相干扰的现象。

可以理解的是，在发明人提出的多媒体推荐系统构建多媒体推荐模型的过程中，涉及共享参数的更新，不同目标对某一参数的影响，产生的效果可能是相反的。

具体的，在跨场景共同训练异构数据的过程中，梯度在多维空间中指向了不同的方向，且夹角大于了90°，相当于两个梯度向量合成新向量的时候会出现相互抵消的情况，从而会影响多媒体推荐模型中参数的更新。这会导致混入其他场景的数据后，多媒体推荐模型在原场景下的预估效果会下降。

为了解决这个问题，发明人提出将行为转化链中的各个环节为目标进行建模，相当于是将转化率差异大的消费场景的数据进行拆分训练。

综上所述，发明人在构建新的多媒体推荐系统的过程中需要解决：

不同目标的正样本占比差异显著的问题，例如：由于产品的功能设定，自动播放的正样本占比远高于点击，因为视频展露到一定程度就会开始自动播放，但是，点击是用户的自发行为。另外，中插广告展现、完播等，是在视频播放到一定时长才会发生，也一定会比自动播放低。比如，自动播放的正样本占比可能为40%，自动播放完播的正样本占比为8%，点击的正样本占比为5%。

用户行为转化链长，导致的深度转化行为存在的样本选择偏差的问题，以曝光－﹥点击－﹥视频完播这一用户的行为转化链为例：视频完播，是发生在点击的基础上，因此，视频完播的正样本，一定首先是点击的正样本，这意味着视频完播的样本是有偏差的，转化链越长，目标的分布偏差就越严重。

目标融合困难的问题，能够将所有目标的预估分数，融合为一个排序分，并且该分数能够兼顾各种指标的效果，实现多媒体推荐系统的收益最大化。

需要说明的是，多媒体可以包括文本、音频和视频等等，在实际应用中可以是各种类型的文章、新闻、广播、小说、各种类型的视频等等。

参见图1，本申请提供的多媒体推荐方法的流程示意图，如图1所示，多媒体推荐方法包括以下处理步骤：

步骤101、获取用户信息。

需要说明的是，用户信息包括用户身份信息、用户消费信息等用户在使用多媒体推荐系统的相关软件时涉及的信息。

可选的，多媒体推荐系统获取用户信息。

步骤102、从所述用户信息中抽取用户特征信息，所述用户特征信息包括用户标识、用户行为偏好画像和历史点击信息。

可选的，通过特征抽取算法从用户信息中抽取用户标识、用户行为偏好画像和历史点击信息。

具体的，可以抽取用户id、设备类型、用户感兴趣的偏好以及历史点击内容。同时，还可以抽取出待推荐的特征，比如，待推荐的特征类别、关键词、主体、发布媒体号等等。需要说明的是，同一个特征可能对应多个特征值，比如，用户最关注的视频类别top3：体育类、美食类和搞笑类。

步骤103、将所述用户特征信息输入至预设多媒体推荐模型，所述多媒体推荐模型被配置为：根据所述用户行为偏好画像和所述历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个所述设定环节的分数，计算出所述多媒体池中各个多媒体在不同消费场景下的融合排序分；所述设定环节为行为转化链中与用户行为相关的环节。

需要说明的是，本申请提供的多媒体推荐模型可以根据用户行为偏好画像和历史点击信息计算各媒体池中在设定环节的分数，然后，利用各个多媒体在各个设定环节的分数，计算出多媒体池在不同消费场景下的融合排序分。需要说明的是，现有的多媒体推荐模型一般为二阶特征交叉的FM（Factorization Machines，因子分解机）模型，本申请提供的多媒体推荐模型为高阶特征交叉的MLP（Multilayer Perceptron，多感知器）模型，MLP模型可以根据应用场景将预估目标进行拆分，并调整MLP塔的数量。

本申请将用户行为转化链拆分成不同的设定环节，设定环节也可以称为一个个目标，多媒体推荐模型中目标的数量与MLP塔的数量一一对应，MLP塔主要负责为多媒体池中的各个多媒体进行打分。一个MLP塔会对应用户行为转化链的一个设定环节，MLP塔会为多媒体池中的各个多媒体的设定环节进行打分。之后，多媒体推荐模型会将MLP塔对多媒体池中各个多媒体的各个设定环节的分数融合起来，得到融合排序分，融合排序分的数量和多媒体池中的多媒体的数量一致。

需要说明的是，多媒体推荐模型会按照预先确定的权重系数融合各个多媒体在设定环节的分数，计算得到融合排序分。权重系数主要包括环节权重系数和场景权重系数，环节权重系数用于表征各个环节在不同消费场景下的重要性，场景权重系数用于表征消费场景的重要性。权重系数的设定能够更好的对用户在不同消费场景下的行为内容进行融合。

并且，权重系数是会进行更新的，多媒体推荐模型中会设置多组权重系数，并将多种权重系数应用到计算融合排序分的过程中，并按照计算结果向用户推荐多媒体，之后，收集用户对推荐结果的反馈信息，从多组权重系数中确定符合权重系数更新规则的权重系数。需要说明的是，权重系数更新规则为选择多组权重系数中用户的反馈结果最佳的权重系数投入使用。具体的，最佳的权重系数的确定过程可以如下：将用户划分为N个分桶，每个分桶使用一组权重系数，当每一组用户的总曝光量达到置信阈值时，多媒体推荐模型中的权重系数更新为N组权重系数中用户反馈最佳的权重系数。

需要说明的是，在多目标预估分融合过程中，可以采用Cross-entroy方法自动调参。该方法可以维护一个可能最优解的正态分布，基于该分布采样并将得到的参数用于排序分融合。然后观察这些参数的线上效果，抽取部分线上效果好的参数，例如top 20%，再根据这部分参数重新调整正态分布的均值，标准差，不断迭代上述步骤，完成参数优化。使用在线调参技术进行多目标预估分融合，直接优化线上指标，灵活性高且反馈迅速，实现的推荐更加的精准。

可选的，将用户标识、用户行为偏好以及历史点击信息输入到预设多媒体推荐模型中，得到多媒体池中的各多媒体的融合排序分。

以视频推荐为例：

视频从曝光到转化的路径呈多元化，考虑频道流、详情页两个消费场景，这两个消费场景中会涉及点击、时长等用户行为的相关环节，还可以称为用户行为的相关目标，进行多目标跨场景联合建模，为了避免数据异构造成的负迁移现象，将用户行为的相关目标进行拆分。例如：详情页和频道流这两个消费场景下的深度消费转化率差异大，这两个场景下数据混在一起训练，会导致视频推荐模型对详情页深度消费的转化率的预估效果下降，故，本申请对应的视频推荐模型将详情页的深度消费与频道流的深度消费拆分成两个目标。

本申请中的视频排序模型为高阶特征交叉的MLP模型，多个目标的MLP结构共享底层embedding，用数据更多的任务（例如点击分预估）指导学习数据较少的任务（时长分预估），从而可以解决数据稀疏的问题。

并且，本申请中的视频排序目标能够深度转化目标的学习，除选择“点击-深度转化”作为正样本，“点击-未深度转化”作为负样本，还选择“曝光-未点击”作为负样本，不会区分具体的场景，而现有技术中的视频推荐模型会根据具体的场景和预估目标去选择负样本。本申请提供的视频推荐模型在训练过程中会将不同消费场景下的用户行为转化链上的所有目标都曝光在样本空间中训练，从而能够缓解转换链过长带来的样本选择偏差的问题。需要说明的是，样本选择偏差本质上是选择了特定的样本，无意间控制了一些本来不该控制的变量，从而导致的虚假的因果效应，以“曝光－﹥点击－﹥深度转化”为例，如果深度转化在样本空间中训练，就意味着过滤掉了曝光未点击的这部分样本，模型学习的是点击的前提下发生的深度转化的概率，但是，此时发生深度转化的概率其实是被高估的，但是，实际上，我们认为用户点击后更有意愿进行深度消费。

步骤104、按照所述融合排序分从高到低的顺序，向所述用户推荐多媒体。

可选的，多媒体推荐系统按照多媒体推荐模型中输出的融合排序分从高到低的顺序，向用户推荐多媒体。

综上所述，本申请公开的多媒体推荐方法，获取用户信息并从用户信息中抽取包括用户标识、用户行为偏好画像和历史点击信息在内的用户信息特征，将用户信息特征输入至预设多媒体推荐模型，多媒体推荐模型能够根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个环节的分数，设定环节为行为转化链中与用户行为相关的环节，然后计算出多媒体池中各个多媒体在不同消费场景下的融合排序分，该预设多媒体推荐模型能够计算不同消费场景下的融合排序分，具有通用性。最后，根据融合排序分从高到低的顺序，向用户推荐多媒体。

可选的，参见图2，本申请提供的多媒体推荐模型的结构示例图。

确定需要建模的场景和用户行为转化链，将不同消费场景下的行为转化链进行数据分析与目标拆分，比如频道流*浅度转化、详情页*浅度转化、频道流*深度转化、详情页*深度转化。然后分析各种消费场景下多种浅度、深度转化形式的数据分布情况，将相关性强、后验差异小的目标合并。

可以使用ShareBottom模型进行多目标建模：

1）抽取用户特征，例如，用户id、设备类型、用户行为偏好画像、点击历史和待推荐的item特征，例如，item所属类别、关键字、主题、发布媒体号等等，这些特征会在EmbeddingLayer被映射为一个n维向量。如图2所示，在Embedding Layer输入的为用户特征和待推荐的item特征，还可以称为特征域。

2）同一特征可能会对应多个特征值，比如，用户最喜欢的频道top3，对应3个特征值，这些特征值在Embedding Layer被映射为对应的向量后，通过SumPooling操作生成一个n维向量，然后，将输入的特征域进行拼接。

3）拼接后的向量作为上层模型结果MLP的输入，每个预估目标对应一个MLP塔，计算MLP塔的输出与目标真实值之间的差异，然后，根据这一差异计算每个目标的Loss，修正模型参数。

模型的损失函数可以为：

其中，表示第i个目标的损失函数，/>用于衡量任务的不确定性，/>越大任务不确定性越高，表示任务相关的噪声越多。因此，在多媒体推荐模型的训练过程中，给不确定性高的任务赋予更小的权重，减小对其他任务的干扰，使整体的多媒体推荐模型的训练更加的有效。

对于排序分数的计算可以通过以下公式：

其中，p_ij表示用户的行为转化链的i环节在场景j下的目标预估分，用户转化环节在不同场景下的重要性通过环节权重系数w_ij调节，场景的重要性通过α_i调节；

排序分计算公式中的参数w_ij和α_i，可以通过Cross Entropy方法进行自动寻参。所有线上融合参数记为向量v=vector（w，α），假设其高斯分布。每次迭代，都会从高斯分布上采样N个样本v₁，v₂，…，v_N，作为多目标分数的线上融合权重，得到每一组样本对应的线上reward值，R（v₁），R（v₂），…，R（v_N）。reward可以结合具体业务场景进行设计，通常考虑用户的点击、消费时长等行为。

然后，对R（v₁），R（v₂），…，R（v_N）进行排序，取出其中的Top K，得到权重样本的子集M，更新高斯分布的均值和方差，以最大化高斯分布产生这些权重样本的概率。计算公式可以为：

其中，为第t轮迭代中top K权重样本的均值，/>为这些样本的标准差。

对于上述多媒体推荐方法，本申请还提供了一种多媒体推荐装置，该装置的组成如图3所示。

获取单元10、特征抽取单元20、融合分数计算单元30和推荐单元40，其中：

获取单元10，用于获取用户信息；

特征抽取单元20，用于从用户信息中抽取用户特征信息，用户特征信息包括用户标识、用户行为偏好画像和历史点击信息；

融合分数计算单元30，用于将用户特征信息输入至预设多媒体推荐模型，多媒体推荐模型被配置为：根据用户行为偏好画像和历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个设定环节的分数，计算出多媒体池中各个多媒体在不同消费场景下的融合排序分；设定环节为行为转化链中与用户行为相关的环节；

推荐单元40，用于按照融合排序分从高到低的顺序，向用户推荐多媒体。

在一实施方式中，融合分数计算单元30，具体用于：

在一实施方式中，融合分数计算单元30中的权重系数包括环节权重系数和场景权重系数，环节权重系数用于表征各个环节在不同消费场景下的重要性，场景权重系数用于表征消费场景的重要性。

在一实施方式中，融合分数计算单元30，具体用于：

确定权重系数：

在一实施方式中，融合分数计算单元30中的多媒体包括文本、音频和视频。

在一实施方式中，融合分数计算单元30中的多媒体为视频时，消费场景包括频道流、详情页、沉浸式。

可选的，本申请还提供了多媒体推荐设备，如图4所示的本申请提供的多媒体推荐设备的硬件结构框图，主要包括处理器1和存储器3，并且至少一个处理器1，至少一个通信接口2，至少一个存储器3和至少一个通信总线4。

存储器3用于存储指令；

处理器1用于执行存储器中存储的指令，以实现多媒体推荐方法的各个处理流程。

另外，本申请实施例还提供了一种存储介质，其上存储有计算机程序，计算机程序被处理器执行时，能实现多媒体推荐方法的各个处理流程。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

为了描述的方便，描述以上系统或装置时以功能分为各种模块或单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例或者实施例的某些部分所述的方法。

最后，还需要说明的是，在本文中，诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种多媒体推荐方法，其特征在于，包括：

获取用户信息；

从所述用户信息中抽取用户特征信息，所述用户特征信息包括用户标识、用户行为偏好画像和历史点击信息；

将所述用户特征信息输入至预设多媒体推荐模型，所述多媒体推荐模型被配置为：根据所述用户行为偏好画像和所述历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个所述设定环节的分数，计算出所述多媒体池中各个多媒体在不同消费场景下的融合排序分；所述设定环节为行为转化链中与用户行为相关的环节；所述多媒体推荐模型为MLP模型，所述MLP模型中的MLP塔与用户行为转化链中的各个设定环节一一对应；所述MLP塔用于计算所述用户行为转化链中对应设定环节的分数；

按照所述融合排序分从高到低的顺序，向用户推荐多媒体。

2.根据权利要求1所述的多媒体推荐方法，其特征在于，所述计算出所述多媒体池中各个多媒体在不同消费场景下的融合排序分，包括：

按照预先确定的权重系数融合所述各个多媒体在各个所述设定环节的分数，计算得到所述融合排序分。

3.根据权利要求2所述的多媒体推荐方法，其特征在于，所述权重系数包括环节权重系数和场景权重系数，所述环节权重系数用于表征各个环节在所述不同消费场景下的重要性，所述场景权重系数用于表征消费场景的重要性。

4.根据权利要求2所述的多媒体推荐方法，其特征在于，按照以下步骤确定所述权重系数：

5.根据权利要求1所述的多媒体推荐方法，其特征在于，所述多媒体包括文本、音频和视频。

6.根据权利要求1所述的多媒体推荐方法，其特征在于，当所述多媒体为视频时，所述消费场景包括频道流、详情页、沉浸式。

7.一种多媒体推荐装置，其特征在于，包括：

所述获取单元，用于获取用户信息；

所述特征抽取单元，用于从所述用户信息中抽取用户特征信息，所述用户特征信息包括用户标识、用户行为偏好画像和历史点击信息；

所述融合分数计算单元，用于将所述用户特征信息输入至预设多媒体推荐模型，所述多媒体推荐模型被配置为：根据所述用户行为偏好画像和所述历史点击信息，计算多媒体池中各个多媒体在设定环节的分数，并利用各个多媒体在各个所述设定环节的分数，计算出所述多媒体池中各个多媒体在不同消费场景下的融合排序分；所述设定环节为行为转化链中与用户行为相关的环节；所述多媒体推荐模型为MLP模型，所述MLP模型中的MLP塔与用户行为转化链中的各个设定环节一一对应；所述MLP塔用于计算所述用户行为转化链中对应设定环节的分数；

所述推荐单元，用于按照所述融合排序分从高到低的顺序，向所述用户推荐多媒体。

8.根据权利要求7所述的多媒体推荐装置，其特征在于，所述推荐单元，用于：

9.一种多媒体推荐设备，其特征在于，包括存储器和处理器；

所述存储器用于存储指令；

所述处理器用于执行所述存储器中存储的指令，以实现权利要求1-6任一项所述的多媒体推荐方法。

10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，能实现如权利要求1-6任一项所述的多媒体推荐方法。