CN116628236B

CN116628236B - 多媒体信息的投放方法、装置、电子设备及存储介质

Info

Publication number: CN116628236B
Application number: CN202310915455.5A
Authority: CN
Inventors: 谈圳
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-07-25
Filing date: 2023-07-25
Publication date: 2024-02-23
Anticipated expiration: 2043-07-25
Also published as: CN116628236A

Abstract

本申请公开一种多媒体信息的投放方法、装置、电子设备及存储介质，涉及智能投放技术领域，该方法中，从多维度的场景角度出发，结合一种目标投放场景和至少一种参考投放场景，基于对象的日志信息，获取该对象分别在N种场景下的场景操作特征，即对象在相应场景下对待投放的多媒体信息的触发倾向，再将N个场景操作特征融合为场景融合特征，以增强特征的辨别能力，然后，基于预设的各触发评估指标，分别对该场景融合特征进行特征分析处理，获得相应的评估信息，是故，当存在至少一个评估信息满足预设评估条件时，在目标投放场景下，向该对象投放多媒体信息，提高了多媒体信息的投放精度。

Description

多媒体信息的投放方法、装置、电子设备及存储介质

技术领域

本申请涉及智能投放技术领域，尤其涉及一种多媒体信息的投放方法、装置、电子设备及存储介质。

背景技术

随着互联网的兴起，互联网多媒体信息广泛流行在各大门户网站、搜索引擎、社交网络以及终端设备应用程序上。对象通在互联网浏览多媒体信息以及针对多媒体信息进行触发操作，来获取潜在的咨询信息。

相关技术中，通常根据合法合规获取的对象描述信息，来定位对多媒体信息具有触发倾向的对象，并向该对象投放多媒体信息。

然而，针对历史行为较少的长冷对象或没有历史行为的冷启动对象，相关技术缺少这部分对象的对象描述信息，难以定位这部分对象的触发倾向，导致向这部分对象投放多媒体信息的投放精度较差。

发明内容

本申请提供一种多媒体信息的投放方法、装置、电子设备及存储介质，用以解决针对长冷对象或冷启动对象投放多媒体信息的投放精度差的问题。

第一方面，本申请提供了一种多媒体信息的投放方法，包括：

基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，所述N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：所述对象在相应场景下对待投放的多媒体信息的触发倾向；

将获取的N个场景操作特征融合为场景融合特征；

基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息；其中，每种触发评估指标表征：针对一种触发操作的评估方式，以及，每种评估信息表征：在相应触发评估指标下，所述对象触发所述多媒体信息的概率信息；

当存在至少一个评估信息满足预设评估条件时，在所述目标投放场景下，向所述对象投放所述多媒体信息。

第二方面，本申请提供了一种多媒体信息的投放装置，包括：

获取单元，基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，所述N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：所述对象在相应场景下对待投放的多媒体信息的触发倾向；

融合单元，将获取的N个场景操作特征融合为场景融合特征；

预测单元，基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息；其中，每种触发评估指标表征：针对一种触发操作的评估方式，以及，每种评估信息表征：在相应触发评估指标下，所述对象触发所述多媒体信息的概率信息；

投放单元，当存在至少一个评估信息满足预设评估条件时，在所述目标投放场景下，向所述对象投放所述多媒体信息。

可选的，所述获取单元，具体用于：

基于对象的日志信息，提取所述对象的对象属性特征；

针对所述N种场景，分别执行以下操作：

获取一种场景对应的场景预测参数，所述场景预测参数表征：在所述一种场景下，各历史对象和各历史多媒体信息之间的关联程度；

基于所述对象属性特征和所述场景预测参数，获得所述对象在所述一种场景下，针对所述待投放的多媒体信息的场景操作特征。

可选的，所述获取单元，用于基于所述对象属性特征和所述场景预测参数，获得所述对象在所述一种场景下，针对所述待投放的多媒体信息的场景操作特征，具体用于：

获取所述目标投放场景对应的场景更新参数，所述场景更新参数表征：在所述目标投放场景下，所述对象和所述多媒体信息之间的关联程度；

基于所述场景预测参数，对所述对象属性特征进行特征分析处理，获得针对所述一种场景预测的初始场景操作特征；

基于所述场景更新参数，对所述初始场景操作特征进行特征更新处理，获得所述对象在所述一种场景下的场景操作特征。

可选的，所述场景更新参数，是通过如下方式获得的：

提取所述目标投放场景的场景描述特征，并对所述场景描述特征进行特征分析处理，获得场景描述参数，所述场景描述参数表征：所述目标投放场景与所述各历史多媒体信息之间的关联程度；

基于所述场景描述参数，分析在所述目标投放场景下，所述对象属性特征与所述多媒体信息的多媒体特征之间的关联程度，获得相应的场景更新参数。

可选的，所述融合单元，用于以下任意一种：

基于预设的拼接次序，对获取的N个场景操作特征进行特征拼接处理，获得场景融合特征；

基于所述N个场景各自对应的融合缩放参数，对获取的N个场景操作特征进行特征融合处理，获得场景融合特征；其中，每个融合缩放参数表征：相应场景相较所述N个场景的重要性；

基于获取的N个场景操作特征之间的特征差异，对所述N个场景操作特征进行特征融合处理，获得场景融合特征。

可选的，所述融合单元，用于基于所述N个场景各自对应的融合缩放参数，对获取的N个场景操作特征进行特征融合处理，获得场景融合特征，具体用于：

获取所述N种场景共同对应的融合更新参数，所述融合更新参数表征：在所述N种场景下，各历史对象与各历史多媒体信息之间的关联程度；

针对所述N种场景，分别执行如下操作：

基于一种场景对应的融合缩放参数，对获取的N个场景操作特征进行特征加权处理，获得所述一种场景的初始子融合特征；

基于所述融合更新参数，对所述初始子融合特征进行特征更新处理，获得所述一种场景的子融合特征；

针对获得的N种场景各自的子融合特征，进行特征拼接处理，得到场景融合特征。

可选的，所述融合单元，用于基于获取的N个场景操作特征之间的特征差异，对所述N个场景操作特征进行特征融合处理，获得场景融合特征，具体用于：

基于每个场景操作特征各自与所述N个场景操作特征之间的特征差异，获取所述每个场景操作特征对应的残差向量；

针对N个场景操作特征各自对应的残差向量，进行拼接处理，得到场景融合特征。

可选的，所述预测单元，用于：

获取预设的各触发评估指标共同关联的共享评估参数，所述共享评估参数表征：基于所述各触发评估指标的综合触发评估指标，各历史对象与各历史多媒体信息之间的关联程度；

针对所述各触发评估指标，分别执行以下操作：

获取单种触发评估指标关联的独享评估参数，所述独享评估参数表征：基于所述单种触发评估指标，所述各历史对象与所述各历史多媒体信息之间的关联程度；

基于所述独享评估参数和所述共享评估参数，对所述场景融合特征进行特征分析处理，获得所述单种触发评估指标对应的评估信息。

可选的，所述基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息，是通过已训练的评估模型执行的，则所述装置还包括：训练单元，所述训练单元用于训练所述评估模型，具体是通过以下方式训练得到的：

获取训练样本集，所述训练样本集中的每个训练样本包括：一个融合样本特征和相应的样本标签；其中，所述融合样本特征基于M种场景各自对应的场景操作样本特征融合得到，所述M种场景至少包括所述N种场景，所述样本标签表征：至少基于所述各触发评估指标确定、各历史对象触发各历史多媒体信息的真实概率信息；

从所述训练样本集中选取训练样本，并将相应的融合样本特征输入待训练的评估模型，获得基于所述各触发评估指标确定的、所述各历史对象触发各历史多媒体信息的样本概率信息；

基于各样本概率信息与相应真实概率信息之间的差异，对所述待训练的评估模型进行评估参数的调整。

可选的，所述各样本概率信息，是通过如下方式确定的：

基于所述融合样本特征，针对所述目标投放场景对应的场景操作样本特征进行梯度回传处理，并基于处理结果调整所述各触发评估指标关联的评估参数；

基于各评估参数，分别对所述场景融合样本特征进行特征分析处理，获得相应触发评估指标对应的样本概率信息。

可选的，所述投放单元，用于以下任意一种：

当存在一个评估信息满足针对相应触发评估指标预设的评估阈值时，在所述目标投放场景，向所述对象投放所述多媒体信息；

当各评估信息分别满足针对相应触发评估指标预设的评估阈值时，在所述目标投放场景，向所述对象投放所述多媒体信息；

当基于各评估信息计算得到的综合评估信息满足针对所述各触发评估指标预设的综合评估阈值时，在所述目标投放场景，向所述对象投放所述多媒体信息。

第三方面，本申请实施例提供的一种电子设备，包括处理器和存储器，其中，所述存储器存储有计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器执行上述任意一种多媒体信息的投放方法的步骤。

第四方面，本申请实施例提供一种计算机可读存储介质，其包括计算机程序，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行上述任意一种多媒体信息的投放方法的步骤。

第五方面，本申请实施例提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中；当电子设备的处理器从计算机可读存储介质读取所述计算机程序时，所述处理器执行所述计算机程序，使得所述电子设备执行上述任意一种多媒体信息的投放方法的步骤。

本申请有益效果如下：

本申请实施例提供了一种多媒体信息的投放方法、装置、电子设备及存储介质，设备首先基于对象的日志信息，分别获取该对象在N种场景下的场景操作特征，其中，N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：对象在相应场景下对待投放的多媒体信息的触发倾向。如此，基于对象的日志信息，获取该对象分别在N种场景下对同一多媒体信息的触发倾向，也即N个场景操作特征，使得后续能够从多维度的场景角度出发，基于N个场景操作特征，来评估该对象触发该多媒体信息的触发概率，避免仅从目标投放场景的单一角度进行评估，导致投放精度差的问题。

其次，将获取的N个场景操作特征融合为场景融合特征。通过特征融合，将N个场景操作特征，变换为更具辨别能力的场景融合特征，使得后续针对场景融合特征进行评估，还能同时结合N种场景各自对应的场景操作特征进行评估，提高了评估结果的准确性，进而有助于提升多媒体信息的投放精度。

然后，基于预设的各触发评估指标，分别对该场景融合特征进行特征分析处理，获得相应的评估信息，其中，每种触发评估指标表征：针对一种触发操作的评估方式，以及，每种评估信息表征：在相应触发评估指标下，该对象触发多媒体信息的概率信息；当存在至少一个评估信息满足预设评估条件时，在目标投放场景下，向该对象投放多媒体信息。如此，针对场景融合特征，从多维度的场景角度出发，评估对象针对多媒体信息进行各种触发操作的概率，获得相应的评估信息，换言之，每个评估信息是从一种触发操作的角度来衡量对象触发多媒体信息的概率，由于这个概率是结合N种场景进行分析评估得到的，使得获得的每个评估信息更趋近于真实场景下，对象触发多媒体信息的概率，进而当评估信息满足预设评估条件时，在目标投放场景下，向对象投放多媒体信息，提高了多媒体信息的投放精度。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例中可选的应用场景的示意图；

图2为本申请实施例提供的多媒体信息的投放方法的流程示意图；

图3为本申请实施例中可选的一种场景操作特征的获取流程图；

图4A~图4B为本申请实施例中可选的提取特征的过程示意图；

图5A~图5D为本申请实施例中可选的已训练的多场景预测模型的使用流程示意图；

图6A~图6C为本申请实施例中可选的场景融合特征的融合过程的示意图；

图7为本申请实施例中可选的评估模型的架构示意图；

图8为本申请实施例中可选的一种评估模型的使用过程的示意图；

图9为本申请实施例中可选的一种投放广告的流程示意图；

图10为本申请实施例提供的多媒体信息的投放装置的结构示意图；

图11为本申请实施例提供的计算机设备的一种结构示意图。

具体实施方式

本申请实施例中，所涉及的对象信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

本申请实施例涉及人工智能技术，主要涉及人工智能技术中的自然语言处理技术。

人工智能（Artificial Intelligence, AI）：是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

自然语言处理（Nature Language processing, NLP）：是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习：是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。人工神经网络（Artificial Neural Network，ANN），从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成，每个节点代表一种特定的输出函数，称为激励函数（activation function），每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆，网络的输出则依网络的连接方式，权重值和激励函数的不同而不同，而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

在本申请实施例中，将人工智能技术应用于智能投放领域，具体用于投放多媒体信息，以提高投放精度。

为便于理解本申请实施例提供的技术方案，下面对本申请实施例使用的一些关键名词进行解释。

多媒体信息：是组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体。媒体包括文字、图片、声音、影片等。在本申请实施例中，多媒体信息可以是广告、文章、资讯、视频、音乐等内容。本申请主要是以广告为例进行举例说明的。

场景：是承载对象与多媒体信息之间的交互体验的应用程序。场景包括目标投放场景、参考投放场景等。在本申请实施例中，目标投放场景为亟待投放多媒体信息的场景，参考投放场景为除目标投放场景外、历史投放过多媒体信息的场景。此外，一个场景可以对应一个应用软件、应用软件中的一个功能页面、一个功能页面中的子界面或一个界面中的显示区域等。本申请主要是以功能页面为例进行举例说明的。

触发评估指标：是针对一种触发操作的评估方式，用于在同一维度上衡量对象关于多媒体信息的触发行为。在本申请实施例中，触发行为可以是用户对于多媒体信息的加载、浏览、互动等行为。

评估条件：是指在多媒体信息投放时，判定是否需要在目标投放场景下向对象投放多媒体信息。以多媒体信息是广告为例，投放动作是通过评估条件来决定的，网络广告在进行投放时，可以选择评估条件，如广告浏览率条件、广告点击率条件、广告互动率条件等，对符合评估条件的对象投放广告，这样，只有符合评估条件的对象才有可能看到该广告。在网络广告投放时，选择合适的评估条件可以将广告投放的精度提升至一个预期的较高的水平，此类评估条件即为与该广告匹配的定向投放条件。

点击率（Click-Through-Rate，CTR）：可用于衡量多媒体信息的展示效果，也可以称为点击到达率。以多媒体信息是广告为例，点击率可以是广告实际点击次数除以广告的展现量。

转化率（Conversion Rate，CVR）：衡量多媒体信息展示效果的一个指标。以多媒体信息是广告为例，转化率可以是对象点击广告到成为一个有效激活或者注册甚至付费对象的转化率。

评估模型：是指针对对象触发多媒体信息的评估模型，评估模型是基于机器学习（Machine Learning，ML）的方法实现处理和理解场景融合特征表征的多维度场景信息的能力，例如不同场景之间的多维度学习，通过利用多场景维度之间的互补性，剔除维度之间的冗余性，从而学习到更好的特征表示。

Area Under the Curve（AUC）：是衡量评估模型优劣的一种评价指标。AUC被定义为Receiver Operating Characteristic（ROC）曲线下的面积，显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方，AUC的取值范围在0.5和1之间。AUC越接近1.0，推荐模型确定的预估概率的真实性越高；AUC等于0.5时，则真实性最低，无应用价值。

其中，ROC曲线是一个画在二维平面上的曲线，平面的横坐标是false positiverate（FRP），纵坐标是true positive rate（TPR）。

下面对本申请的发明思想进行详细介绍。

在目标投放场景中，主流多媒体信息的投放方法可概括为如下两种：

方式一，基于对象描述信息进行投放（即背景技术中的投放方式）。

该方式实现前提是能够获取到对象描述信息，如果是冷启动对象则会因缺少相应对象描述信息而无法投放多媒体信息，以及，如果长冷对象则会因为相应对象描述信息较少导致多媒体信息的投放精度较差。

方式二，基于对象的实时行为数据，生成相应的对象描述信息，在基于对象描述信息进行多媒体信息的投放。

该方式下，虽然通过加快数据收集，解决无法直接获取对象描述信息的问题，但其本质仍然是基于目标投放场景下，分析对象关于多媒体信息的触发行为，来进行投放的；换言之，如果是在目标投放场景下没有历史行为的冷启动对象，则其不存在跟多媒体信息有关的实时行为数据，导致多媒体信息的投放精度较差，以及，如果是历史行为较少的长冷对象，则其跟多媒体信息有关的实时行为数据较少或不存在，导致多媒体信息的投放精度较差。

有鉴于此，本申请实施例提供了一种多媒体信息的投放方法、装置、电子设备及存储介质，由于本申请从多维度的场景角度出发，结合一种目标投放场景和至少一种参考投放场景，基于对象的日志信息，获取该对象分别在N种场景下的场景操作特征，即对象在相应场景下对待投放的多媒体信息的触发倾向，再将N个场景操作特征融合为场景融合特征，以增强特征的辨别能力，然后，基于预设的各触发评估指标，分别对该场景融合特征进行特征分析处理，获得相应的评估信息，是故，当存在至少一个评估信息满足预设评估条件时，在目标投放场景下，向该对象投放多媒体信息，提高了多媒体信息的投放精度。

具体的，本申请实施例中多媒体信息的投放方法，并非是基于对象描述信息进行多媒体信息的投放，也不是基于对象在目标投放场景下的实时行为数据进行多媒体信息的投放，而是从N个场景角度出发，综合理解对象的触发倾向，获得相应的场景融合特征，以及，从预设的各触发评估指标出发，分别针对场景融合特征进行特征分析，获得相应的评估信息，进一步，引入预设评估条件评估是否进行投放，以提高多媒体信息的投放精度。

下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍，需要说明的是，以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中，可以根据实际需要灵活地应用本申请实施例提供的技术方案。

如图1所示，其为本申请实施例的应用场景示意图。该应用场景图中包括终端设备110和服务器120。

在本申请实施例中，终端设备110包括但不限于手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器、智能语音交互设备、智能家电、车载终端等设备；终端设备上可以安装有显示多媒体信息的客户端，该客户端可以是软件（例如浏览器、聊天软件、短视频软件、新闻资讯软件等），也可以是网页、小程序等。服务器120则是与软件或是网页、小程序等相对应的后台服务器，或者是专门用于进行多媒体投信息投放的服务器，本申请不做具体限定。服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络（Content Delivery Network，CDN）、以及大数据和人工智能平台等基础云计算服务的云服务器。

需要说明的是，本申请各实施例中的多媒体信息的投放方法可以由电子设备执行，该电子设备可以为终端设备110或者服务器120，即，该方法可以由终端设备110或者服务器120单独执行，也可以由终端设备110和服务器120共同执行。比如由服务器120共同执行时，首先服务器120基于对象分别在N种场景下对待投放的多媒体信息的触发倾向（即N个场景操作特征），获得场景融合特征。进而，服务器120通过评估对象触发多媒体信息的概率信息（即评估信息），来进行多媒体信息的投放。

其中，倾向指的是待投放的多媒体信息适合对象且被这个对象所喜欢，即“倾向”等于“适合”加“喜欢”。

以目标投放场景为某企鹅聊天软件的首页为例，例如存在一个购买书籍的广告，需要投放在企鹅聊天软件的首页上，该广告投放的目的是为了推广书籍，提高书籍的购买量，容易理解的，为了达成相应目的，这个广告适合投放给对广告感兴趣的人群，而不适合投放给从来不点击广告或不对广告进行其他触发操作的人群；而对广告感兴趣的对象会有很多，并非所有对广告感兴趣的对象都曾在企鹅聊天软件的首页上对历史投放的广告有过触发操作，但若存在对象在例如企鹅聊天软件的钱包页面等其他参考投放场景下对历史投放的广告有过较为频繁的触发操作，则这部分对象喜欢触发广告，即广告适合投放给这部分人群。

因而，本申请通过对象在N种场景下对待投放的多媒体信息的触发倾向（即场景操作特征），评估对象触发该多媒体信息的触发概率（评估信息），在实际的投放系统种，结合此信息提升多媒体信息投放的准确程度，为每个待投放的多媒体信息找到更为合适的投放对象。

具体的评估过程为：服务器120基于对象的日志信息，分别获取对象在N种场景下（包括一种目标投放场景和至少一种参考投放场景）对待投放的多媒体信息的触发倾向（即场景操作特征）；其次，将获取的N个场景操作特征融合为场景融合特征；再基于预设的各触发评估指标（即针对一种触发操作的评估方式），分别对场景融合特征进行特征分析处理，获得在相应触发评估指标下，对象触发多媒体信息的概率信息（即评估信息）；最后，当存在至少一个评估信息满足预设评估条件时，在目标投放场景下，向对象投放多媒体信息。

在一种可选的实施方式中，终端设备110与服务器120之间可以通过通信网络进行通信。

在一种可选的实施方式中，通信网络是有线网络或无线网络。

需要说明的是，图1所示只是举例说明，实际上终端设备和服务器的数量不受限制，在本申请实施例中不做具体限定。

本申请实施例中，当服务器的数量为多个时，多个服务器可组成为一区块链，而服务器为区块链上的节点；如本申请实施例所公开的多媒体信息的投放方法，其中所涉及的日志信息、N种场景、场景操作特征、融合操作特征、预设的触发评估指标、评估信息、预设评估条件、评估信息、训练样本集、评估参数、每种场景对应的场景预测参数、目标投放场景对应的场景更新参数、目标投放场景的场景描述参数、每种场景对应的融合缩放参数、N种场景共同对应的融合更新参数等。

此外，本申请实施例可应用于的使用场景，包括但不限于云技术、人工智能、智慧交通、辅助驾驶等场景。

下面结合上述描述的应用场景，参考附图来描述本申请示例性实施方式提供的多媒体信息的投放方法，需要注意的是，上述应用场景仅是为了便于理解本申请的精神和原理而示出，本申请的实施方式在此方面不受任何限制。

参阅图2所示，为本申请实施例提供的一种多媒体信息的投放方法的实施流程图，以服务器为执行主体为例，该方法的具体实施流程如下S21~S24：

S21：基于对象的日志信息，分别获取对象在N种场景下的场景操作特征，N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：对象在相应场景下对待投放的多媒体信息的触发倾向。

其中，待投放的多媒体信息指任一类信息流，例如：广告、文章、资讯、视频、音乐等。

下面以广告为例，对其他多媒体信息也是类似道理，文本不再重复赘述。

在本申请实施例中，同一对象针对同一待投放的多媒体信息在不同场景下的表征（即触发倾向）不同，为分别表征对象在N种场景下对待投放的多媒体信息的触发倾向，本申请实施例提出一种可能的实现方式，基于每种场景下，各历史对象和各历史多媒体信息的关联程度（即每种场景对应的场景预测参数），来分别获取对象在N种场景下的场景操作特征。

具体地，参见图3所示，为本申请实施例提供的一种场景操作特征的获取流程图，具体流程如下S21-A~S21-B。

S21-A：基于对象的日志信息，提取对象的对象属性特征。

本申请实施例中，对象的日志信息是经对象同意、通过合法合规途径和手段获取的，获取途径包括但不限于：从数据库中获取对象的日志信息，从对象进行交互的终端设备实时获取对应的日志信息，在此不对获取途径和手段作具体限定。

在一种可能的实施方式中，对于对象属性特征的特征提取方式可以包括但不限于：传统的特征提取方式以及深度学习的特征提取方式，其中，传统的特征提取方式主要是基于人类专家的先验知识设计对象的某些固有特征，深度学习的特征提取方式主要是基于样本自动训练用于区分对象属性的特征分类器。

例如，参见图4A所示，为提取对象属性特征的过程示意图，服务器从数据库获取对象的日志信息，然后基于该日志信息，提取该对象的对象属性特征，其中，对象属性特征可包括对象的多方面信息，具体包括但不限于：对象的标识信息（如：uid），对象的基础属性信息（如：性别、年龄、地域等），对象的偏好标签信息（如：{tag ₁ , tag ₂ , tag ₃ , …, tag _n}），对象针对指定时段在各场景下的触发操作信息（如：对象在场景A的近3个月的点击操作序列，对象在场景B近3个月的点击操作序列/> ，对象在场景B近3个月的购买操作序列/> ，对象在场景X近3个月的点击操作序列/> 等）。

可选的，为了使得后续基于对象属性特征，分别获得的N个场景操作特征更符合对象在实际相应场景下触发待投放的多媒体信息的触发倾向，则还可获取待投放的多媒体信息的多媒体特征，以及N种场景各自的场景描述特征。

例如，参见图4B所示，为提取多媒体特征及场景描述特征的过程示意图，服务器从数据库获取待投放的多媒体信息以及N种场景各自的场景信息，然后基于获取的信息，分别提取得到多媒体特征以及N个场景描述特征。其中，多媒体特征表征：待投放的多媒体信息与各历史对象之间的关联程度，多媒体特征可包括但不限于：多媒体信息的标识（如：aid）、多媒体信息在指定对象年龄段上的点击率、多媒体信息在指定对象性别上的点击率。每个场景描述特征表征：相应场景与各历史多媒体信息之间的关联程度，场景描述特征可包括但不限于：场景的标识（如：domain-id，简称为：did），场景的触发评价特征d（如：场景整体点击率、场景整体转化率等）。

需要说明的是，上述各特征还可直接从服务器中获取得到，在此不做展开描述。

S21-B：针对N种场景，分别执行以下S21-B1~S21-B2的操作：

S21-B1：获取一种场景对应的场景预测参数，场景预测参数表征：在一种场景下，各历史对象和各历史多媒体信息之间的关联程度。

其中，场景预测参数可以是预设在服务器的数据库中的数据，也可以是通过多场景学习获得的数据，例如：已训练的多场景预测模型中各场景表征网络的网络参数，下面主要以已训练的多场景预测模型为例，做进一步说明。

S21-B2：基于对象属性特征和场景预测参数，获得对象在一种场景下，针对待投放的多媒体信息的场景操作特征。

本申请实施例中，为了加强对象、待投放的多媒体特征以及相应场景之间的关联关系，以提升场景操作特征的特征表征，基于场景预测参数，统一分析对象属性特征在相应的场景描述特征下针对多媒体特征进行触发操作的表征，获得相应的场景操作特征。

进一步，为了强化目标投放场景在每个场景操作特征中的表征，以使得生成的每个场景操作特征不仅表征相应场景下对象与待投放的多媒体信息之间的触发倾向，还结合目标投放场景的表征，这样，有助于提升后续在目标投放场景投放多媒体信息的准确程度。

具体来说，可以包括以下几个步骤：第一步，获取目标投放场景对应的场景更新参数，场景更新参数表征：在目标投放场景下，对象和多媒体信息之间的关联程度；第二步，基于场景预测参数，对对象属性特征进行特征分析处理，获得针对一种场景预测的初始场景操作特征；第三步，基于场景更新参数，对初始场景操作特征进行特征更新处理，获得对象在一种场景下的场景操作特征。

更为具体的，针对上述场景更新参数的获取，服务器首先提取目标投放场景的场景描述特征，并对场景描述特征进行特征分析处理，获得场景描述参数，场景描述参数表征：目标投放场景与各历史多媒体信息之间的关联程度；然后基于场景描述参数，分析在目标投放场景下，对象属性特征与多媒体信息的多媒体特征之间的关联程度，获得相应的场景更新参数。

其中，场景描述特征可基于已训练的多场景预测模型中的第一个性化门控网络获得，例如：将目标投放场景的场景描述信息输入第一个性化门控网络，得到其输出的场景描述参数。相应的，场景更新参数可基于已训练的多场景预测模型中的第二个性化门控网络获得，例如：基于场景描述参数与对象属性特征、场景描述特征、多媒体特征的拼接特征进行加权求和处理，并将处理结果输入第二个性化门控网络，得到其输出的场景更新参数。

下面结合已训练的多场景预测模型，针对上面S21-B所执行的具体操作，做如下示例性说明。

需要说明的是，多场景预测模型的训练方式与使用方式类似思想，区别在于训练过程中，有些步骤只针对部分输入数据进行梯度回传更新，具体标注在如下使用方式的说明中，不再重复赘述。

参见图5A所示，为已训练的多场景预测模型的使用流程示意图，该多场景预测模型至少包括：第一个性化门控网络、第二个性化门控网络、至少N个场景表征网络；为便于理解，根据处理的先后次序，分为如下三个部分进行逐一讲解。

第一部分，第一个性化门控网络。

如图5B所示，为第一个性化门控网络的示意图，其中，第一次个性化的门控图示为Gate ₀，Gate ₀输入是目标投放场景的场景描述特征，Gate ₀的网络结构可以是n层DNN（Deep-Learning Neural Network，深度神经网络），将经过n层DNN后产生的1个向量作为场景描述参数（即个性化权重向量），再将场景描述参数向量按位乘到原始输入向量（即对象属性特征、场景描述特征、多媒体特征的拼接特征）进行个性化缩放。需要注意的是，个性化权重向量的维度要等于原始输入向量的维度。

更为具体的，以表示向量拼接，/>表示按元素相乘，第一个性化门控网络的处理过程，可抽象化表述为：

公式1中，E _user表示对象描述特征embedding（嵌入），E _ad表示多媒体特征embedding（嵌入），E _domain表示场景描述特征embedding（嵌入），表示前述全特征拼接的embedding（嵌入）。

公式2中，δ₁表示从场景描述特征得到的场景描述参数（即个性化权重向量），E(did)表示目标投放场景的标识did的embedding（嵌入），E(d)_i表征目标投放场景的触发评价特征d的embedding（嵌入）。

公式3中，将δ₁场景描述参数乘到全特征的embedding上得到第一次个性化输出O ₁，作为第二个性化门控网络的输入。需要注意的是，此处δ₁和/>需要维度对齐，且二者都是实数空间维度为d的向量，即/>。

第二部分，第二个性化门控网络。

如图5C所示，为第二个性化门控网络的示意图，其中，第二次个性化的门控图示为Gate _1…n（门控个数n大于等于场景表征网络层数L，L为大于0的整数），Gate _i输入是前面第一次个性化的输出O ₁，第i（1≤i≤n）个门控Gate _i网络输出（即场景更新参数）会分别乘到各场景表征网络第i层输出上，做输出的缩放。需要注意的是：一个场景对应一个场景表征网络；一个场景表征网络可以DNN结构，且网络层数和门控数量可保持一致。

更为具体的，以第i个门控为例，表示训练时不更新该参数（主要应用于训练），表示向量拼接，/>表示按元素相乘，第二个性化门控网络的处理过程，可抽象化表述为：

公式4中，δ_i表示第i个门控输出的权重（即场景更新参数i），E(aid)表示多媒体信息的标识aid的embedding（嵌入），分别E(uid)表示对象的标识信息uid的embedding（嵌入）。

第三部分，至少N个场景表征网络。

如图5D所示，为N个场景表征网络的示意图，其中，每个场景表征网络的输入是对象属性特征、场景描述特征、多媒体特征的拼接特征，或者，是第一次个性化输出O ₁，对于每个场景表征网络，基于其场景更新参数，依次对网络的相应每层的输出进行更新，得到场景i表征网络输出的场景i的场景操作特征。

更为具体的，表示按元素相乘，以场景i表征网络为例，场景表征网络的处理过程，可抽象化表述为：

公式5中，δ_i表示第i个门控输出的权重（即场景更新参数i），z _i表示场景表征网络的第i层输出，是个性化缩放后的输出。

公式6中，O _n表示某个场景对应的场景触发特征，其中，下标n表示相应的场景表征网络是n层的DNN。

此外，针对场景表征网络，以DNN网络结构为例，场景表征网络的第i+1层，可抽象化描述为：

公式7中，W _i和b _i分别表示第i层的权重和偏执。

综上所述，经过上面三个部分，可得到对象分别在N 个场景下针对待投放的多媒体信息的场景触发特征，其可抽象表征为向量：其中每个向量的维度相同，比如8维。N个场景触发特征可以理解为：对象和待投放的多媒体信息在不同场景下的隐语义表达。

S22：将获取的N个场景操作特征融合为场景融合特征。

在本申请实施例中，还将针对N个场景操作特征进行特征融合处理，该融合方式包括但不限于：门控网络、DNN、拼接、取均值（average_pooling）、编码融合。

为便于理解，将上述列举的融合方式，概述为如下的三种融合方式。

融合方式一，基于预设的拼接次序，对获取的N个场景操作特征进行特征拼接处理，获得场景融合特征。

例如，将N个场景表征拼接起来，可抽象化表述为：

公式8中，表示向量拼接，/>表示场景操作特征1的向量，以此类推。

融合方式二，基于N个场景各自对应的融合缩放参数，对获取的N个场景操作特征进行特征融合处理，获得场景融合特征；其中，每个融合缩放参数表征：相应场景相较N个场景的重要性。

本申请实施例中，为了提高最终场景融合特征的特征表征，获取N种场景共同对应的融合更新参数，融合更新参数表征：在N种场景下，各历史对象与各历史多媒体信息之间的关联程度。然后，针对所述N种场景，分别执行如下操作：

具体地，基于一种场景对应的融合缩放参数，对获取的N个场景操作特征进行特征加权处理，获得一种场景的初始子融合特征；再基于融合更新参数，对初始子融合特征进行特征更新处理，获得一种场景的子融合特征；针对获得的N种场景各自的子融合特征，进行特征拼接处理，得到场景融合特征。

需要说明的是，对N个子融合特征进行拼接处理并不是必须，一般来说，基于目标投放场景对应的融合缩放参数，获得的子融合特征，可作为最终的场景融合特征。

例如，参见图6A所示，为场景融合特征的融合过程的示意图一，以目标投放场景为例。其中，神经网络：在训练过程中针对每个场景操作样本特征进行梯度回传处理，并基于处理结果更新其中的融合更新参数；全连接层：在训练过程中只针对目标投放场景对应的场景操作样本特征进行梯度回传处理，并基于处理结果更新融合缩放参数，该融合缩放参数与目标投放场景相对应。如图6A所示，将N个场景操作特征分别输入神经网络和全连接层，神经网络基于融合更新参数，对N个场景操作特征进行处理，得到第一处理结果，同时，全连接层基于融合缩放特征，对N个场景操作特征进行处理，得到初始子融合特征，然后再基于第一处理结果和初始子融合特征，得到相应的子融合特征，作为实际的场景融合特征。

例如，参见图6B所示，为场景融合特征的融合过程的示意图二，以目标投放场景A和参考投放场景B为例，神经网络和全连接层的训练过程同上，在此不再赘述。如图6B所示，将N个场景操作特征分别输入神经网络和两个全连接层，神经网络基于融合更新参数，对N个场景操作特征进行处理，得到第一处理结果，同时，每个全连接层分别基于融合缩放特征，对N个场景操作特征进行处理，得到相应的初始子融合特征，然后再基于第一处理结果和单个初始子融合特征，分别得到子融合特征1和子融合特征2，再对这两个特征进行拼接和压缩处理，得到场景融合特征。

再例如，参见图6C所示，此处引入门控机制，以目标投放场景A和参考投放场景B为例，其中，Expert 1：在训练过程中针对每个场景操作样本特征进行梯度回传处理，并基于处理结果更新其中的融合更新参数；Expert 0或Expert 2：在训练过程中只针对目标投放场景A或参考投放场景B对应的场景操作样本特征进行梯度回传处理，并基于处理结果更新融合缩放参数，该融合缩放参数与目标投放场景相对应。如图6C所示，将N个场景操作特征分别输入Expert 0、Expert 1和Expert 2，Expert 1基于融合更新参数，对N个场景操作特征进行处理，得到第一处理结果，同时，Expert 0和Expert 2分别基于融合缩放特征，对N个场景操作特征进行处理，得到相应的初始子融合特征，然后再基于第一处理结果和单个初始子融合特征，分别得到子融合特征1和子融合特征2，再对这两个特征进行拼接和压缩处理，得到场景融合特征。当然，也可直接将子融合特征1作为场景融合特征，在此不做具体限制。

进一步，针对图6C所示的融合方式，可抽象表述为：

公式9中，表示第种场景的子融合特征，/>是N个场景操作特征的拼接特征，/>表示的n个专家网络（即DNN网络），图6C中n为2，/>表示第/>种场景的门控输出向量，其向量纬度和专家网的个数一致（即n），/>是输出向量中第i个权重。/>表示第i个专家网络。

融合方式三，基于获取的N个场景操作特征之间的特征差异，对N个场景操作特征进行特征融合处理，获得场景融合特征。

在本申请实施例中，基于每个场景操作特征各自与所述N个场景操作特征之间的特征差异，获取每个场景操作特征对应的残差向量，然后针对N个场景操作特征各自对应的残差向量，进行拼接处理，得到场景融合特征。

综上所述，通过特征融合，将N个场景操作特征，变换为更具辨别能力的场景融合特征，使得后续针对场景融合特征进行评估，还能同时结合N种场景各自对应的场景操作特征进行评估，提高了评估结果的准确性，进而有助于提升多媒体信息的投放精度。

S23：基于预设的各触发评估指标，分别对场景融合特征进行特征分析处理，获得相应的评估信息；其中，每种触发评估指标表征：针对一种触发操作的评估方式，以及，每种评估信息表征：在相应触发评估指标下，对象触发多媒体信息的概率信息。

在本申请实施例中，触发评估指标可以包括：针对对象点击多媒体信息的触发操作的评估方式，针对对象购买多媒体信息承载产品的触发操作的评估方式等。相应的，评估信息可以包括：对象针对多媒体信息的点击率、对象针对多媒体信息的购买率等。

具体的，针对各评估信息的获得，服务器首先获取预设的各触发评估指标共同关联的共享评估参数，该共享评估参数表征：基于各触发评估指标的综合触发评估指标，各历史对象与各历史多媒体信息之间的关联程度；然后针对各触发评估指标，分别执行以下操作：获取单种触发评估指标关联的独享评估参数，该独享评估参数表征：基于单种触发评估指标，各历史对象与各历史多媒体信息之间的关联程度；基于独享评估参数和共享评估参数，对场景融合特征进行特征分析处理，获得单种触发评估指标对应的评估信息。

可选的，上述各评估信息的获得，是通过已训练的评估模型执行的，为便于理解，下面先介绍一下评估模型的设计思想。

评估模型可以采用多任务学习的网络思想，例如：采用PLE来实现等。具体的，以每种触发评估指标对应为一种评估任务，则评估模型可通过一个模型预估多个任务的分数（如点击率、转化率、时长等），这样能够缓解多任务学习中存在的跷跷板现象和负迁移现象，即不同任务之间的性能提升和损失的不平衡。换言之，也就避免了在多个任务中，某些任务的数据量非常少，而其他任务的数据量非常多，模型出现过拟合或者欠拟合的问题，从而影响模型的性能。

此外，评估模型的另一重要思想是通过渐进式分层提取 (Progressive LayeredExtraction）来学习不同任务之间的共享和独享特征，从而实现更好的个性化推荐效果。例如，评估模型的输入是场景融合特征，表征的是对象在相应场景下对多媒体信息的触发倾向，而评估模型的输出则是不同评估任务的评估信息，比如点击率、转化率、观看时长等。评估模型的核心公式是一个门控网络 (Gate Control），它可以根据输入选择器（Selector）来动态地分配不同专家模块（Expert Module）的输出权重，从而融合不同专家模块的知识。专家模块分为两类，一类是任务共享的共享专家模块负责学习任务的共享模式，一类是任务独享的独享专家模块，负责学习任务的独享模式。

需要说明的是，在本申请实施例中，独享评估参数和共享评估参数可统称为评估参数，独享评估参数可理解为独享专家模块中的网络权重，共享评估参数可理解为共享专家模块中的网络权重。

例如，参见图7所示，为评估模型的架构示意图，其中，模型涉及任务A和任务B，Expert A和Expert B分别为任务A和任务B对应的专项专家模型，Experts Shared为任务A和任务B共享的共享专家模块，需要说明的是，评估模型中可以采用多层的门控网络来进行评估，下面以单层门控网络为例，其抽象表示参考如下：

公式10中，表示门控网络的输入（即场景融合特征），/>表示门控网络中任务k的输出，S ^k(x)表示门控网络中的参数矩阵，W ^k(x)表示各专家模块中的权重（即评估参数）。

公式11中，w ^k(x)表示各专家模块中的权重（即评估参数），其根据和输入/>经过softmax函数得到，softmax()表示一种非线性变换的函数，/>标识参数矩阵，其中，m_k、m_s分别是任务k独享专家模块的个数、共享专家模块的个数，/>是输入向量的纬度。

公式12中，S ^k(x)表示所有专家模块（包括：共享专家模块、各独享专家模块）的输出，例如，表示针对场景1的场景融合特征、任务k的独享专家模块的输出，/>表示针对场景2的场景融合特征、任务k的独享专家模块的输出，/>表示针对场景1的场景融合特征、任务k的共享专家模块的输出，以此类推。

公式13中，y ^k(x)表示任务k的输出打分（即评估信息），t ^k(x)是任务k的任务k的顶层DNN（如：tower网络），g ^k(x)是门控网络中任务k的输出。

需要说明的是，在介绍完评估模型的单层门控网络后，简要介绍包含多层门控网络的评估模型，以两次串联为例，与上面单层类似，右上角增加层数小标，其抽象表示参考如下：

公式14和公式15中，g ^k,j-1(x)是j-1层门控网络的输出，其余相比单层门控网络只是增加了右上角的角标j，用以表示第j层的输出网络权重。

在介绍完评估模型的模型架构后，结合本申请实施例的评估过程，来对评估模型的使用过程进行阐述，具体如下：

参见图8所示，为一种评估模型的使用过程的示意图，将场景融合特征输入评估模型，评估模型将自动筛选目标投放场景对应的专家模块，如图8所示，筛选出两个独享专家模块（分别对应任务A和任务B）以及一个共享专家模块，然后将场景融合特征分别输入各专家模块，基于各专家模块内部的评估参数（如：独享专家模块中的独享评估参数，再如：共享专家模块中的共享评估参数）进行特征分析处理，获得任务A对应的评估信息A，用于评估对象针对多媒体信息的点击率，以及，获得任务B对应的评估信息B，用于对象针对多媒体信息的购买率。

在一种可能的实施方式中，上述评估模型是通过以下方式训练得到的：获取训练样本集，训练样本集中的每个训练样本包括：一个融合样本特征和相应的样本标签；其中，融合样本特征基于M种场景各自对应的场景操作样本特征融合得到，M种场景至少包括N种场景，样本标签表征：至少基于各触发评估指标确定、各历史对象触发各历史多媒体信息的真实概率信息；然后从训练样本集中选取训练样本，并将相应的融合样本特征输入待训练的评估模型，获得基于各触发评估指标确定的、各历史对象触发各历史多媒体信息的样本概率信息；再基于各样本概率信息与相应真实概率信息之间的差异，对待训练的评估模型进行评估参数的调整。

需要说明的是，评估模型的训练过程可以是迭代的，上面描述了一次迭代的训练步骤，主要是迭代调整评估参数，当满足一定迭代条件（例如：迭代次数、模型精度等）后，即可获得已训练的评估模型。

此外，根据前文赘述的评估模型的设计思想，容易理解，评估参数包含共享评估参数和独享评估参数，因此还可通过相应场景的场景操作样本特征进行梯度回传操作进行相应独享评估参数的调整。

具体来讲，以目标投放场景为例，将其对应的融合样本特征输入评估模型时，可对融合样本特征进行处理，以使得评估模型只针对目标投放场景对应的场景操作样本特征进行梯度回传处理，而不针对各参考投放场景对应的场景操作样本特征进行梯度回传处理，即只更新目标投放场景对应的各独享专家模块（即各触发评估指标）关联的独享评估参数。进而，有利于后续基于各评估参数，分别对场景融合样本特征进行特征分析处理，获得相应触发评估指标对应的样本概率信息，更趋近于真实概率信息。

上述针对融合样本特征的处理，可抽象化表征为：

公式16中，表示评估模型针对场景i在训练过程中的输入，/>表示向量，/>表示向量拼接，/>表示不做梯度回传，/>分别表征融合场景特征中：各场景对应的场景操作特征。

综上所述，针对场景融合特征，从多维度的场景角度出发，评估对象针对多媒体信息进行各种触发操作的概率，获得相应的评估信息，换言之，每个评估信息是从一种触发操作的角度来衡量对象触发多媒体信息的概率，由于这个概率是结合N种场景进行分析评估得到的，使得获得的每个评估信息更趋近于真实场景下，对象触发多媒体信息的概率，进而提高了多媒体信息的投放精度。

S24：当存在至少一个评估信息满足预设评估条件时，在目标投放场景下，向对象投放所述多媒体信息。

其中，一个评估信息可以包括但不限于：对象点击多媒体信息的评估概率（pCTR）、对象针对多媒体信息购买商品的评估概率(pCVR)；以此为例，将相应的概率值分别记为：点击的评估概率值O ^i,ctr，购买的评估概率值O ^i,cvr。

本申请实施例中，针对预设评估场景，投放多媒体信息，可包括以下三种情况中的任意一种。

情况一，当存在一个评估信息满足针对相应触发评估指标预设的评估阈值时，在目标投放场景，向对象投放多媒体信息。

例如，点击的评估概率值O ^i,ctr大于预设的点击评估阈值O ^ctr, 或者，购买的评估概率值O ^i,cvr大于预设的购买评估阈值O ^cvr。

情况二，当各评估信息分别满足针对相应触发评估指标预设的评估阈值时，在目标投放场景，向对象投放多媒体信息。

例如，点击的评估概率值O ^i,ctr大于预设的点击评估阈值O ^ctr, 并且，购买的评估概率值O ^i,cvr大于预设的购买评估阈值O ^cvr。

情况三，当基于各评估信息计算得到的综合评估信息满足针对所述各触发评估指标预设的综合评估阈值时，在目标投放场景，向对象投放多媒体信息。

例如，针对点击的评估概率值O ^i,ctr和购买的评估概率值O ^i,cvr，计算和值为综合评估概率值score _i，该综合评估概率score _i预设的综合评估概率值score时，在目标投放场景，向对象投放多媒体信息。

综上所述，本申请实施例中多媒体信息的投放方法，并非是基于对象描述信息进行多媒体信息的投放，也不是基于对象在目标投放场景下的实时行为数据进行多媒体信息的投放，而是从N个场景角度出发，综合理解对象的触发倾向，获得相应的场景融合特征，以及，从预设的各触发评估指标出发，分别针对场景融合特征进行特征分析，获得相应的评估信息，进一步，引入预设评估条件评估是否进行投放，以提高多媒体信息的投放精度。

参见图9所示，为申请实施例提供的投放广告的流程示意图，简单来说，如图9所示，从小明的日志信息中提取小明属性特征，相应的，获取书籍推荐广告的书籍推荐广告信息以及企鹅钱包界面的界面描述特征，然后针对这三个特征一齐进行特征分析处理，再分别基于3个不同界面各自的场景预测参数，获取相应的场景操作特征，例如：基于企鹅钱包界面的场景预测参数1获取场景操作特征1，基于企鹅换装界面的场景预测参数2获得场景操作特征2，基于企鹅聊天界面的场景预测参数3获得场景操作特征3。然后，将获得的三个场景操作特征融合为场景融合参数，该场景融合参数与企鹅钱包界面相对应。接着，基于点击评估指标和购买评估指标，分别针对场景融合特征进行特征分析，获得点击的评估概率值和购买的评估概率值，基于二值计算综合评估概率值，当综合评估概率值＞预设的综合评估概率阈值时，认为小明是对广告特别感兴趣的对象，则在企鹅钱包界面下，向小明投放书籍推荐广告。

参见图10所述，基于同一发明构思，本申请实施例还提供了一种多媒体信息的投放装置100，该装置包括：

获取单元101，基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，所述N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：所述对象在相应场景下对待投放的多媒体信息的触发倾向；

融合单元102，将获取的N个场景操作特征融合为场景融合特征；

预测单元103，基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息；其中，每种触发评估指标表征：针对一种触发操作的评估方式，以及，每种评估信息表征：在相应触发评估指标下，所述对象触发所述多媒体信息的概率信息；

投放单元105，当存在至少一个评估信息满足预设评估条件时，在所述目标投放场景下，向所述对象投放所述多媒体信息。

可选的，所述获取单元101，具体用于：

基于对象的日志信息，提取所述对象的对象属性特征；

针对所述N种场景，分别执行以下操作：

可选的，所述获取单元101，用于基于所述对象属性特征和所述场景预测参数，获得所述对象在所述一种场景下，针对所述待投放的多媒体信息的场景操作特征，具体用于：

可选的，所述场景更新参数，是通过如下方式获得的，所述获取单元101用于：

可选的，所述融合单元102，用于以下任意一种：

可选的，所述融合单元102，用于基于所述N个场景各自对应的融合缩放参数，对获取的N个场景操作特征进行特征融合处理，获得场景融合特征，具体用于：

针对所述N种场景，分别执行如下操作：

可选的，所述融合单元102，用于基于获取的N个场景操作特征之间的特征差异，对所述N个场景操作特征进行特征融合处理，获得场景融合特征，具体用于：

可选的，所述预测单元103，用于：

针对所述各触发评估指标，分别执行以下操作：

可选的，所述基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息，是通过已训练的评估模型执行的，则所述装置还包括：训练单元104，所述训练单元用于训练所述评估模型，具体是通过以下方式训练得到的：

可选的，所述各样本概率信息，是通过如下方式确定的，则所述训练单元104还用于：

可选的，所述投放单元105，用于以下任意一种：

通过上述装置，基于对象的日志信息，分别获取该对象在N种场景下的场景操作特征，其中，N种场景包括一种目标投放场景和至少一种参考投放场景，每个场景操作特征表征：对象在相应场景下对待投放的多媒体信息的触发倾向。如此，基于对象的日志信息，获取该对象分别在N种场景下对同一多媒体信息的触发倾向，也即N个场景操作特征，使得后续能够从多维度的场景角度出发，基于N个场景操作特征，来评估该对象触发该多媒体信息的触发概率，避免仅从目标投放场景的单一角度进行评估，导致投放精度差的问题。

该装置可以用于执行本申请各实施例中所示的方法，因此，对于该装置的各功能模块所能够实现的功能等可参考前述实施例的描述，不多赘述。

请参见图11所示，基于同一技术构思，本申请实施例还提供了一种计算机设备1100，该计算机设备1100可以为图1所示的终端设备或服务器，该计算机设备1100可以包括存储器1101和处理器1102。

所述存储器1101，用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1102，可以是一个中央处理单元（central processing unit， CPU），或者为数字处理单元等等。本申请实施例中不限定上述存储器1101和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1103连接，总线1103在图11中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线1103可以分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器1101可以是易失性存储器（volatile memory），例如随机存取存储器（random-access memory，RAM）；存储器1101也可以是非易失性存储器（non-volatilememory），例如只读存储器，快闪存储器（flash memory），硬盘（hard disk drive，HDD）或固态硬盘（solid-state drive，SSD）、或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器1101可以是上述存储器的组合。

处理器1102，用于调用所述存储器1101中存储的计算机程序时执行本申请各实施例中设备所执行的方法。

在一些可能的实施方式中，本申请提供的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤，例如，所述计算机设备可以执行本申请各实施例中设备所执行的方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种多媒体信息的投放方法，其特征在于，所述方法包括：

基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，所述N种场景包括一种目标投放场景和至少一种参考投放场景，所述参考投放场景为除所述目标投放场景外的场景，每个场景操作特征表征：所述对象在相应场景下对待投放的多媒体信息的触发倾向；

基于已训练的第一专家网络中的融合更新参数，对获取的N个场景操作特征进行处理，得到第一处理结果，以及，分别基于N种场景各自对应已训练的N个第二专家网络中的场景缩放参数，对所述N个场景操作特征进行处理，得到相应的N个初始子融合特征后，通过结合所述第一处理结果和所述N个初始子融合特征，获得场景融合特征；其中，所述融合更新参数是在所述第一专家网络训练过程中，基于所述N种场景各自的场景操作样本特征的梯度回传处理结果进行更新获得的；每个融合缩放特征是在相应第二专家网络训练过程中，仅基于相应场景的场景操作特征的梯度回传处理结果进行更新获得的；

2.如权利要求1所述的方法，其特征在于，所述基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，包括：

基于对象的日志信息，提取所述对象的对象属性特征；

针对所述N种场景，分别执行以下操作：

3.如权利要求2所述的方法，其特征在于，所述基于所述对象属性特征和所述场景预测参数，获得所述对象在所述一种场景下，针对所述待投放的多媒体信息的场景操作特征，包括：

4.如权利要求3所述的方法，其特征在于，所述场景更新参数，是通过如下方式获得的：

5.如权利要求1~4任一所述的方法，其特征在于，所述分别获取所述对象在N种场景下的场景操作特征之后，还包括以下任意一种：

基于预设的拼接次序，对获取的N个场景操作特征进行特征拼接处理；基于获取的N个场景操作特征之间的特征差异，对所述N个场景操作特征进行特征融合处理。

6.如权利要求1~4任一项所述的方法，其特征在于，所述基于已训练的第一专家网络中的融合更新参数，对获取的N个场景操作特征进行处理，得到第一处理结果，以及，分别基于N种场景各自对应已训练的N个第二专家网络中的场景缩放参数，对所述N个场景操作特征进行处理，得到相应的N个初始子融合特征后，通过结合所述第一处理结果和所述N个初始子融合特征，获得场景融合特征，包括：

从已训练的第一专家网络中，获取所述N种场景共同对应的融合更新参数，所述融合更新参数表征：在所述N种场景下，各历史对象与各历史多媒体信息之间的关联程度；

针对所述N种场景，分别执行如下操作：

基于一种场景对应已训练的第二专家网络中的融合缩放参数，对获取的N个场景操作特征进行特征加权处理，获得所述一种场景的初始子融合特征；所述融合缩放参数表征：所述一种场景相较所述N种场景的重要性；

7.如权利要求5所述的方法，其特征在于，所述基于获取的N个场景操作特征之间的特征差异，对所述N个场景操作特征进行特征融合处理，包括：

针对N个场景操作特征各自对应的残差向量，进行拼接处理。

8.如权利要求1~4任一所述的方法，其特征在于，所述基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息，包括：

针对所述各触发评估指标，分别执行以下操作：

9.如权利要求1~4任一所述的方法，其特征在于，所述基于预设的各触发评估指标，分别对所述场景融合特征进行特征分析处理，获得相应的评估信息，是通过已训练的评估模型执行的，所述评估模型是通过以下方式训练得到的：

10.如权利要求9所述的方法，其特征在于，所述各样本概率信息，是通过如下方式确定的：

11.如权利要求1~4任一所述的方法，其特征在于，所述当存在至少一个评估信息满足预设评估条件时，在所述目标投放场景下，向所述对象投放所述多媒体信息，包括以下任意一种：

12.一种多媒体信息的投放装置，其特征在于，所述装置包括：

获取单元，基于对象的日志信息，分别获取所述对象在N种场景下的场景操作特征，所述N种场景包括一种目标投放场景和至少一种参考投放场景，所述参考投放场景为除所述目标投放场景外的场景，每个场景操作特征表征：所述对象在相应场景下对待投放的多媒体信息的触发倾向；

融合单元，基于已训练的第一专家网络中的融合更新参数，对获取的N个场景操作特征进行处理，得到第一处理结果，以及，分别基于N种场景各自对应已训练的N个第二专家网络中的场景缩放参数，对所述N个场景操作特征进行处理，得到相应的N个初始子融合特征后，通过结合所述第一处理结果和所述N个初始子融合特征，获得场景融合特征；其中，所述融合更新参数是在所述第一专家网络训练过程中，基于所述N种场景各自的场景操作样本特征的梯度回传处理结果进行更新获得的；每个融合缩放特征是在相应第二专家网络训练过程中，仅基于相应场景的场景操作特征的梯度回传处理结果进行更新获得的；

13.一种电子设备，其特征在于，其包括处理器和存储器，其中，所述存储器存储有计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1~11中任一所述方法的步骤。

14.一种计算机可读存储介质，其特征在于，其包括计算机程序，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行权利要求1~11中任一所述方法的步骤。

15.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序存储在计算机可读存储介质中；当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时，所述处理器执行所述计算机程序，使得所述电子设备执行权利要求1~11中任一所述方法的步骤。