CN115730142A - 一种确定投放内容的方法、装置、计算机设备及存储介质 - Google Patents

一种确定投放内容的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115730142A
CN115730142A CN202211463614.4A CN202211463614A CN115730142A CN 115730142 A CN115730142 A CN 115730142A CN 202211463614 A CN202211463614 A CN 202211463614A CN 115730142 A CN115730142 A CN 115730142A
Authority
CN
China
Prior art keywords
feature
characteristic
splicing
layer
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211463614.4A
Other languages
English (en)
Inventor
李为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202211463614.4A priority Critical patent/CN115730142A/zh
Publication of CN115730142A publication Critical patent/CN115730142A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种确定投放内容的方法、装置、计算机设备及存储介质,其中,该方法包括:获取待投放多媒体内容的第一特征信息和第二特征信息;基于第一特征信息和第二特征信息生成第一拼接特征,以及基于第一特征信息中的标识特征和第二特征信息生成第二拼接特征;基于第一拼接特征和第二拼接特征,确定待投放多媒体内容的投放预估结果;基于多个待投放多媒体内容的投放预估结果,筛选出目标多媒体内容。本公开实施例通过考虑多媒体内容在内容相关特征以及投放策略特征方面对投放效果的影响,可以更加全面、准确地确定待投放多媒体内容的投放预估结果,进而可以更加准确地筛选出优质的待投放多媒体内容。

Description

一种确定投放内容的方法、装置、计算机设备及存储介质
技术领域
本公开涉及互联网技术领域,具体而言,涉及一种确定投放内容的方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,越来越多的多媒体内容在互联网平台进行投放。例如,将物品或服务相关的多媒体内容在互联网平台投放后,可以使得用户通过投放的多媒体内容更加容易地了解相关的物品或服务。
优质的多媒体内容通常能够带来较好的投放效果,而实际筛选多媒体内容的方法中,通常侧重于经验筛选或者从历史投放效果好的多媒体内容中筛选,导致无法准确筛选出更多优质的多媒体内容。
发明内容
本公开实施例至少提供一种确定投放内容的方法、装置、计算机设备及存储介质。
第一方面,本公开实施例提供了一种确定投放内容的方法,包括:
获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征;
基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
一种可能的实施方式中,所述待投放多媒体内容是通过以下步骤获取的:
获取投放场景类型;
基于所述投放场景类型,确定与所述投放场景类型匹配的目标素材;
将所述目标素材按照预设的结构化模板进行整理后,生成所述待投放多媒体内容。
一种可能的实施方式中,所述基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,包括:
将所述第一特征信息和所述第二特征信息输入至预先训练的目标模型的第一特征拼接层,得到第一拼接特征;
所述基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征,包括:
将所述第一特征信息中的标识特征和所述第二特征信息输入至所述目标模型的第二特征拼接层,得到第二拼接特征。
一种可能的实施方式中,所述基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果,包括:
将所述第一拼接特征和所述第二拼接特征输入至所述目标模型的特征交互层,得到所述待投放多媒体内容的投放预估结果。
一种可能的实施方式中,所述特征交互层包括多个特征交互层;
所述将所述第一拼接特征和所述第二拼接特征输入至所述目标模型的特征交互层,得到所述待投放多媒体内容的投放预估结果,包括:
将所述第一拼接特征和所述第二拼接特征输入至第一层特征交互层,得到特征交互结果;
将除所述第一层特征交互层外的各所述特征交互层分别作为当前层特征交互层,将前一层特征交互层的特征交互结果、以及与所述当前层特征交互层的维度匹配的第三拼接特征作为输入,对所述前一层特征交互层的特征交互结果和所述第三拼接特征进行特征交互处理,直至得到最后一层所述特征交互层输出的特征交互结果;其中,与所述当前层特征交互层的维度匹配的第三拼接特征是按照所述当前层特征交互层的维度对所述第二拼接特征进行降维处理得到的;
基于所述最后一层所述特征交互层输出的特征交互结果,确定所述待投放多媒体内容的投放预估结果。
一种可能的实施方式中,所述目标模型是通过以下步骤训练得到的:
获取样本多媒体内容的第一样本特征信息和第二样本特征信息;
将所述第一样本特征信息和所述第二样本特征信息输入至待训练的目标模型的第一特征拼接层,得到第一样本拼接特征;
将所述第一样本特征信息中的标识特征和所述第二样本特征信息输入至所述待训练的目标模型的第二特征拼接层,得到第二样本拼接特征;
将所述第一样本拼接特征和所述第二样本拼接特征输入至所述待训练的目标模型的特征交互层,得到所述样本多媒体内容的预估投放结果;
基于所述预估投放结果和所述样本多媒体内容的真实投放结果,调节所述样本多媒体内容中的权重参数,得到所述训练完成的目标模型。
一种可能的实施方式中,所述内容相关特征包括内容特征;
所述获取待投放多媒体内容的第一特征信息中的内容相关特征,包括:
将所述待投放多媒体内容中的各帧图像信息分别输入至预先训练的图像分类模型中,得到所述各帧图像信息对应的图像理解特征;
将所述待投放多媒体内容中的文本信息输入至预先训练的自然语言处理模型中,得到所述文本信息对应的文本理解特征;
将所述图像理解特征和所述文本理解特征进行拼接处理,得到所述内容特征。
第二方面,本公开实施例还提供一种确定投放内容的装置,包括:
第一获取模块,用于获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征;
生成模块,用于基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
确定模块,用于基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
筛选模块,用于基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本公开实施例提供的确定投放内容的方法,不仅考虑了待投放多媒体内容在内容相关特征(例如内容特征、历史投放特征和标识特征)方面对投放效果的影响,而且考虑了待投放多媒体内容在投放策略特征方面对投放效果的影响,增加了对待投放多媒体内容进行预估的维度,从而可以更加全面、准确地确定待投放多媒体内容的投放预估结果,进而可以更加准确地筛选出优质的待投放多媒体内容。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种确定投放内容的方法的流程图;
图2示出了本公开实施例所提供的LHUC Deep Model网络模型的结构示意图;
图3示出了本公开实施例所提供的一种确定投放内容的装置的架构示意图;
图4示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
优质的多媒体内容通常能够带来较好的投放效果,而实际筛选多媒体内容的方法中,通常侧重于经验筛选或者从历史投放的多媒体内容中选择投放效果好的多媒体内容进行再次投放。而历史投放效果好的多媒体内容占全部多媒体内容的比例较小,未进行投放过的多媒体内容难以得到投放,导致大量优质的多媒体内容浪费,导致无法准确筛选出更多优质的多媒体内容。
基于此,本公开提供了一种确定投放内容的方法,不仅考虑了待投放多媒体内容在内容相关特征(例如内容特征、历史投放特征和标识特征)方面对投放效果的影响,而且考虑了待投放多媒体内容在投放策略特征方面对投放效果的影响,增加了对待投放多媒体内容进行预估的维度,从而可以更加全面、准确地确定待投放多媒体内容的投放预估结果,进而可以更加准确地筛选出优质的待投放多媒体内容。
针对以上方案所存在的缺陷以及所提出的解决方案,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种确定投放内容的方法进行详细介绍,本公开实施例所提供的确定投放内容的方法的执行主体一般为具有一定计算能力的计算机设备。
参见图1所示,为本公开实施例提供的一种确定投放内容的方法的流程图,所述方法包括S101~S104,其中:
S101:获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征。
在本公开实施例中,待投放多媒体内容可以是基于选取的目标素材生成的。在一种实施方式中,可以先获取投放场景类型。这里,投放场景类型可以是基于投放需求预设的投放场景类型。基于投放需求预设的投放场景类型可以包括投放平台类型、投放位类型(比如横屏投放、竖屏投放)、投放时长类型(比如长时间投放、短时间投放)等。然后,基于投放场景类型,确定与投放场景类型匹配的目标素材。目标素材可以是从素材库中召回的。根据投放平台、投放位、投放时长的限制,可以召回出符合投放位的目标素材。然后将目标素材按照预设的结构化模板进行整理后,可以生成待投放多媒体内容。在具体实施中,可以对目标素材搭配匹配的文案和落地页进行结构化整理。其中,文案可以包括标题、引导信息等,可以起到提示或引导的作用;落地页可以指引导用户点击投放的多媒体内容或者利用搜索引擎搜索后跳转显示扩展多媒体内容的网页。在具体实施中,将目标素材按照预设的结构化模板进行整理后,可以得到初始的多媒体内容,然后将对应的出价特征信息(出价方式、出价值)、投放定向特征信息(投放对象、投放渠道、应用程序平台、访问量等)与初始的多媒体内容进行绑定,得到待投放的多媒体内容。
在获取到待投放多媒体内容之后,可以对待投放多媒体内容进行特征提取,得到第一特征信息和第二特征信息。
其中,内容相关特征用于表征待投放多媒体内容在多媒体内容方面的特征,具体地,内容相关特征中可以包括内容特征、历史投放特征和标识特征。
具体地,内容特征可以包括由图像理解特征和文字理解特征拼接得到的特征。在一种实施方式中,待投放多媒体内容中可以包括视频信息,将视频信息拆帧后,可以得到各帧图像信息。将各帧图像信息分别输入至预先训练的图像分类模型中,可以得到各帧图像信息对应的图像理解特征。这里图像分类模型例如可以为残差网络(Residual Network,Res Net)模型。将各帧图像信息输入至Res Net模型中可以得到各帧图像信息分别对应的图像理解向量,各帧图像信息对应的图像理解向量可以形成用于表征视频信息的向量序列,用于表征视频信息的向量序列通过循环神经网络模型,例如门控制循环单元(GateRecurrent Unit,GRU)模型获取视频信息的图像理解向量。
待投放多媒体内容中也可以包括文本信息。将文本信息输入至预先训练的自然语言处理模型中,可以得到文本信息对应的文本理解特征。这里的自然语言处理模型例如可以为变压器的双向编码器表示(Bidirectional Encoder Representation fromTransformers,BERT)模型。
将上述图像理解特征和文本理解特征进行拼接处理,可以得到内容特征。
历史投放特征可以包括多媒体内容的历史投放次数、历史投放结果(例如过去30天投放后的点击次数、消费次数等)、投放后的生命周期、漏斗召回率、粗略排序、精确排序等特征。标识特征可以包括多媒体内容的标识、类别等特征。
第二特征信息中的投放策略特征可以表示待投放多媒体内容在投放时的策略特征,具体包括出价特征(出价方式、出价数量)、投放定向特征(投放对象、投放渠道、应用程序平台、访问量)等。其中出价方式具体可以包括投放该待投放媒体内容对应的资源消耗方式,例如在投放该待投放媒体内容之前消耗资源、在投放该待投放媒体内容达到预设效果之后消耗资源等。出价数量可以包括消耗资源的数量。
S102:基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征。
这里,分别对第一特征信息和第二特征信息进行哈希处理,然后根据预先生成的Embedding Space映射空间下的特征矩阵,查找分别与哈希处理后的第一特征信息对应的第一特征向量、以及哈希处理后的第二特征信息对应的第二特征向量。查找到的第一特征向量和第二特征向量为Embedding Space映射空间下的第一预设维度的特征向量。然后将Embedding Space映射空间下的第一特征向量和第二特征向量进行拼接处理,并通过多层感知机(Multilayer Perceptron,MLP)得到第一拼接特征。
这里,分别对第一特征信息中的标识特征和第二特征信息进行哈希处理,然后根据预先生成的Embedding Space映射空间下的特征矩阵,查找分别与哈希处理后的标识特征对应的第三特征向量、以及哈希处理后的第二特征信息对应的第四特征向量,查找到的第三特征向量和第四特征向量为Embedding Space映射空间下的第二预设维度的特征向量。这里,第二预设维度与前述第一预设维度可以是不同的维度。然后将Embedding Space映射空间下的第三特征向量和第四特征向量进行拼接处理,并通过MLP得到第二拼接特征。
在一种实施方式中,可以将第一特征信息和第二特征信息输入至预先训练的目标模型的第一特征拼接层,得到第一拼接特征;将第一特征信息中的标识特征和第二特征信息输入至所述目标模型的第二特征拼接层,得到第二拼接特征。
这里,目标模型可以为学习隐藏式单位贡献深度模型(Learning Hidden UnitContributions Deep Model,即LHUC Deep Model)。如图2所示,为LHUC Deep Model网络模型的结构示意图,LHUC Deep Model网络模型包括主塔和副塔,主塔为深度网络模型DeepModel,副塔为LHUC模型。主塔包括第一特征拼接层、与第一特征拼接层连接的MLP和多个特征交互层,副塔包括第二特征拼接层、与第二特征拼接层连接的MLP。第一特征拼接层可以对所有的特征信息进行处理,将第一特征信息和第二特征信息依次输入至主塔的第一特征拼接层、与第一特征拼接层连接的MLP,可以得到第一拼接特征;第二特征拼接层可以对标识特征和投放策略特征进行处理,将第一特征信息的标识特征和第二特征信息依次输入至副塔的第二特征拼接层、与第二特征拼接层连接的MLP,可以得到第二拼接特征。
S103:基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果。
第二拼接特征主要体现待投放多媒体内容的标识特征和投放策略特征,其中投放策略特征容易影响待投放多媒体内容的投放预估结果。比如,当出价方式不同的时候,相同预设时间段内待投放多媒体内容对应的用户转化率可能是不同的。这里,可以将第二拼接特征作为第一拼接特征的权重,确定在第二拼接特征对第一拼接特征的影响下,待投放多媒体内容的投放预估结果。
在一种实施方式中,可以将第一拼接特征和第二拼接特征输入至目标模型的特征交互层,得到待投放多媒体内容的投放预估结果。
为了更加准确地得到待投放多媒体内容的投放预估结果,在一种实施方式中,特征交互层可以包括多个特征交互层。不同的特征交互层所处理的特征的维度是不同的,并且不同的特征交互层所处理的特征的维度是按照特征交互层的预设排列顺序递减的,如图2所示,多个特征交互层所处理的特征的维度可以按照特征交互层由上及下的排列顺序递减。将第一拼接特征和所述第二拼接特征输入至多个特征交互层后,是按照以下步骤进行特征交互处理的:将第一拼接特征和第二拼接特征输入至第一层特征交互层,得到特征交互结果;将除第一层特征交互层外的各特征交互层分别作为当前层特征交互层,将前一层特征交互层的特征交互结果、以及与当前层特征交互层的维度匹配的第三拼接特征作为输入,对前一层特征交互层的特征交互结果和第三拼接特征进行特征交互处理,直至得到最后一层特征交互层输出的特征交互结果。其中,与当前层特征交互层的维度匹配的第三拼接特征是按照当前层特征交互层的维度对第二拼接特征进行降维处理得到的。
其中,在将第一拼接特征和第二拼接特征输入至第一层特征交互层之前,可以对第二拼接特征的维度进行处理,使得维度处理后得到的第三拼接特征的维度与第一拼接特征的维度相同。在一种实施方式中,目标模型的副塔中还可以包括深度神经网络(DeepNeural Network,DNN),DNN的输入层与第二特征拼接层的输出层连接,DNN的输出层分别与各层特征交互层连接。DNN用于根据各层特征交互层的维度,对第二拼接特征进行降维处理,得到降维处理后的、与各层特征交互层所处理的特征的维度匹配的第三拼接特征。其中,各层特征交互层的维度是基于前一层特征交互层输出的特征交互结果的维度确定的,确切来说,各层特征交互层的维度可以是与前一层特征交互层输出的特征交互结果的维度相同的。
在图2所示的LHUC Deep Model网络模型中,可以包含4层特征交互层,按照前述进行特征交互处理的步骤,具体可以包括:将第一拼接特征、以及维度与第一拼接特征相同的第三拼接特征输入至第一层特征交互层,对其进行特征交互处理,得到第一层特征交互结果;将第一层特征交互结果、以及与第二层特征交互层的维度匹配的第三拼接特征输入至第二层特征交互层,对其进行特征交互处理,得到第二层特征交互结果;将第二层特征交互结果、以及与第三层特征交互层的维度匹配的第三拼接特征输入至第三层特征交互层,对其进行特征交互处理,得到第三层特征交互结果;将第三层特征交互结果、以及与第三层特征交互层的维度匹配的第三拼接特征输入至第三层特征交互层,对其进行特征交互处理,得到第四层特征交互结果。其中,各层特征交互层的特征交互处理可以为内积运算处理。
基于最后一层所述特征交互层输出的特征交互结果,可以确定待投放多媒体内容的投放预估结果。
在一种实施方式中,待投放多媒体内容的投放预估结果可以为待投放多媒体内容被投放后的预设时间段内新增用户数量达到预设值的预估通过概率,即冷启动预估通过率,例如3天内新增用户数量达到200人的预估通过概率。这里,待投放多媒体内容被投放后的预设时间段内新增用户数量达到预设值则表示冷启动通过;待投放多媒体内容被投放后的预设时间段内新增用户数量未达到预设值则表示冷启动不通过。通过冷启动通过率可以判断待投放多媒体内容被投放后的预设时间段内新增用户数量能否达到预设值的概率。
针对上述投放预估结果,在得到最后一层特征交互层输出的特征交互结果之后,可以将最后一层特征交互层输出的特征交互结果输入至与最后一层特征交互层连接的MLP中,得到一维的特征交互结果。然后,利用目标函数(例如Sigmoid函数)对一维的特征交互结果进行反函数处理,得到冷启动的预估通过概率值。
S104:基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
在一种实施方式中,也可以设置投放预估结果的筛选条件,根据投放预估结果的筛选条件,从多个所述待投放多媒体内容中筛选出投放预估结果满足筛选条件的目标多媒体内容。例如,可以基于投放预估结果对多个待投放多媒体内容进行排序,筛选出排名符合预设条件的目标多媒体内容。再如,筛选条件可以为冷启动通过率达到预设数值(例如80%),基于此,可以筛选投放预估结果指示的冷启动通过率达到预设数值(例如80%)的目标多媒体内容。
下面对目标模型的训练过程进行详述。
步骤一:获取样本多媒体内容的第一样本特征信息和第二样本特征信息。
其中,第一样本特征信息包括样本多媒体内容的内容相关特征,具体可以包括内容特征、历史投放特征和标识特征;第二样本特征信息包括所述样本多媒体内容的投放策略特征。
这里,样本多媒体内容可以为对应真实投放结果的多媒体内容。第一样本特征信息包括的内容特征、历史投放特征和标识特征,以及第二样本特征信息包括的投放策略特征可以参照前文描述,这里不再赘述。
步骤二:将所述第一样本特征信息和所述第二样本特征信息输入至待训练的目标模型的第一特征拼接层,得到第一样本拼接特征。
这里,目标模型可以为LHUC Deep Model,目标模型的结构可以参见图2所示的LHUC Deep Model网络模型的结构示意图。这里,可以分别对第一样本特征信息和第二样本特征信息进行哈希处理,然后根据预先生成的Embedding Space映射空间下的特征矩阵,查找分别与哈希处理后的第一样本特征信息对应的第一样本特征向量、以及哈希处理后的第二样本特征信息对应的第二样本特征向量。查找到的第一样本特征向量和第二样本特征向量为Embedding Space映射空间下的第一预设维度的样本特征向量。然后将EmbeddingSpace映射空间下的第一样本特征向量和第二样本特征向量进行拼接处理,并通过MLP得到第一样本拼接特征。
步骤三:将所述第一样本特征信息中的标识特征和所述第二样本特征信息输入至所述待训练的目标模型的第二特征拼接层,得到第二样本拼接特征。
这里,可以分别对第一样本特征信息中的标识特征和第二样本特征信息进行哈希处理,然后根据预先生成的Embedding Space映射空间下的特征矩阵,查找分别与哈希处理后的标识特征对应的第三样本特征向量、以及哈希处理后的第二样本特征信息对应的第四样本特征向量,查找到的第三样本特征向量和第四样本特征向量为Embedding Space映射空间下的第二预设维度的样本特征向量。这里,第二预设维度与前述第一预设维度可以是不同的维度。然后将Embedding Space映射空间下的第三样本特征向量和第四样本特征向量进行拼接处理,并通过MLP得到第二样本拼接特征。
步骤四:将所述第一样本拼接特征和所述第二样本拼接特征输入至所述待训练的目标模型的特征交互层,得到所述样本多媒体内容的预估投放结果。
这里,目标模型的特征交互层可以包括多个特征交互层。将第一样本拼接特征和所述第二样本拼接特征输入至多个特征交互层后,是按照以下步骤进行特征交互处理的:将第一样本拼接特征和第二样本拼接特征输入至第一层特征交互层,得到特征交互结果;将除第一层特征交互层外的各特征交互层分别作为当前层特征交互层,将前一层特征交互层的特征交互结果、以及与当前层特征交互层的维度匹配的第三样本拼接特征作为输入,对前一层特征交互层的特征交互结果和第三样本拼接特征进行特征交互处理,直至得到最后一层特征交互层输出的特征交互结果。其中,与当前层特征交互层的维度匹配的第三样本拼接特征是按照当前层特征交互层的维度对第二样本拼接特征进行降维处理得到的。
步骤五:基于所述预估投放结果和所述样本多媒体内容的真实投放结果,调节所述样本多媒体内容中的权重参数,得到所述训练完成的目标模型。
在一种实施方式中,投放结果可以为待投放多媒体内容被投放后的预设时间段内新增用户数量达到预设值的预估通过概率,即冷启动预估通过率。各层特征交互层的特征交互处理可以为内积运算处理。在得到最后一层特征交互层输出的特征交互结果之后,可以将最后一层特征交互层输出的特征交互结果输入至与最后一层特征交互层连接的MLP中,得到一维的特征交互结果。然后,利用Sigmoid函数对一维的特征交互结果进行反函数处理,得到冷启动的预估通过概率值。
在得到样本多媒体内容的预估投放结果之后,可以确定预估投放结果与真实投放结果之间的损失信息,在具体实施中,可以计算二分类交叉熵,然后进行梯度回传,调整样本多媒体内容中的权重参数,从而使得目标模型的预估投放结果更加接近真实投放结果。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与确定投放内容的方法对应的确定投放内容的装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述确定投放内容的方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图3所示,为本公开实施例提供的一种确定投放内容的装置的架构示意图,所述装置包括:
第一获取模块301,用于获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信包括所述待投放多媒体内容的投放策略特征;
生成模块302,用于基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
确定模块303,用于基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
筛选模块304,用于基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
一种可能的实施方式中,所述装置还包括:第二获取模块;
所述第二获取模块,用于:
获取投放场景类型;
基于所述投放场景类型,确定与所述投放场景类型匹配的目标素材;
将所述目标素材按照预设的结构化模板进行整理后,生成所述待投放多媒体内容。
一种可能的实施方式中,生成模块302,具体用于:
将所述第一特征信息和所述第二特征信息输入至预先训练的目标模型的第一特征拼接层,得到第一拼接特征;
将所述第一特征信息中的标识特征和所述第二特征信息输入至所述目标模型的第二特征拼接层,得到第二拼接特征。
一种可能的实施方式中,确定模块303,具体用于:
将所述第一拼接特征和所述第二拼接特征输入至所述目标模型的特征交互层,得到所述待投放多媒体内容的投放预估结果。
一种可能的实施方式中,所述特征交互层包括多个特征交互层;
确定模块303,具体用于:
将所述第一拼接特征和所述第二拼接特征输入至第一层特征交互层,得到特征交互结果;
将除所述第一层特征交互层外的各所述特征交互层分别作为当前层特征交互层,将前一层特征交互层的特征交互结果、以及与所述当前层特征交互层的维度匹配的第三拼接特征作为输入,对所述前一层特征交互层的特征交互结果和所述第三拼接特征进行特征交互处理,直至得到最后一层所述特征交互层输出的特征交互结果;其中,与所述当前层特征交互层的维度匹配的第三拼接特征是按照所述当前层特征交互层的维度对所述第二拼接特征进行降维处理得到的;
基于所述最后一层所述特征交互层输出的特征交互结果,确定所述待投放多媒体内容的投放预估结果。
一种可能的实施方式中,所述装置还包括:训练模块,用于:
获取样本多媒体内容的第一样本特征信息和第二样本特征信息;
将所述第一样本特征信息和所述第二样本特征信息输入至待训练的目标模型的第一特征拼接层,得到第一样本拼接特征;
将所述第一样本特征信息中的标识特征和所述第二样本特征信息输入至所述待训练的目标模型的第二特征拼接层,得到第二样本拼接特征;
将所述第一样本拼接特征和所述第二样本拼接特征输入至所述待训练的目标模型的特征交互层,得到所述样本多媒体内容的预估投放结果;
基于所述预估投放结果和所述样本多媒体内容的真实投放结果,调节所述样本多媒体内容中的权重参数,得到所述训练完成的目标模型。
一种可能的实施方式中,所述内容相关特征包括内容特征;
所述第一获取模块301,具体用于:
将所述待投放多媒体内容中的各帧图像信息分别输入至预先训练的图像分类模型中,得到所述各帧图像信息对应的图像理解特征;
将所述待投放多媒体内容中的文本信息输入至预先训练的自然语言处理模型中,得到所述文本信息对应的文本理解特征;
将所述图像理解特征和所述文本理解特征进行拼接处理,得到所述内容特征。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本公开实施例还提供了一种计算机设备。参照图4所示,为本公开实施例提供的计算机设备400的结构示意图,包括处理器401、存储器402、和总线403。其中,存储器402用于存储执行指令,包括内存4021和外部存储器4022;这里的内存4021也称内存储器,用于暂时存放处理器401中的运算数据,以及与硬盘等外部存储器4022交换的数据,处理器401通过内存4021与外部存储器4022进行数据交换,当计算机设备400运行时,处理器401与存储器402之间通过总线403通信,使得处理器401在执行以下指令:
获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征;
基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的确定投放内容的方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的确定投放内容的方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种确定投放内容的方法,其特征在于,包括:
获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征;
基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
2.根据权利要求1所述的方法,其特征在于,所述待投放多媒体内容是通过以下步骤获取的:
获取投放场景类型;
基于所述投放场景类型,确定与所述投放场景类型匹配的目标素材;
将所述目标素材按照预设的结构化模板进行整理后,生成所述待投放多媒体内容。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,包括:
将所述第一特征信息和所述第二特征信息输入至预先训练的目标模型的第一特征拼接层,得到第一拼接特征;
所述基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征,包括:
将所述第一特征信息中的标识特征和所述第二特征信息输入至所述目标模型的第二特征拼接层,得到第二拼接特征。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果,包括:
将所述第一拼接特征和所述第二拼接特征输入至所述目标模型的特征交互层,得到所述待投放多媒体内容的投放预估结果。
5.根据权利要求4所述的方法,其特征在于,所述特征交互层包括多个特征交互层;
所述将所述第一拼接特征和所述第二拼接特征输入至所述目标模型的特征交互层,得到所述待投放多媒体内容的投放预估结果,包括:
将所述第一拼接特征和所述第二拼接特征输入至第一层特征交互层,得到特征交互结果;
将除所述第一层特征交互层外的各所述特征交互层分别作为当前层特征交互层,将前一层特征交互层的特征交互结果、以及与所述当前层特征交互层的维度匹配的第三拼接特征作为输入,对所述前一层特征交互层的特征交互结果和所述第三拼接特征进行特征交互处理,直至得到最后一层所述特征交互层输出的特征交互结果;其中,与所述当前层特征交互层的维度匹配的第三拼接特征是按照所述当前层特征交互层的维度对所述第二拼接特征进行降维处理得到的;
基于所述最后一层所述特征交互层输出的特征交互结果,确定所述待投放多媒体内容的投放预估结果。
6.根据权利要求3-5任一项所述的方法,其特征在于,所述目标模型是通过以下步骤训练得到的:
获取样本多媒体内容的第一样本特征信息和第二样本特征信息;
将所述第一样本特征信息和所述第二样本特征信息输入至待训练的目标模型中的第一特征拼接层,得到第一样本拼接特征;
将所述第一样本特征信息中的标识特征和所述第二样本特征信息输入至所述待训练的目标模型的第二特征拼接层,得到第二样本拼接特征;
将所述第一样本拼接特征和所述第二样本拼接特征输入至所述待训练的目标模型的特征交互层,得到所述样本多媒体内容的预估投放结果;
基于所述预估投放结果和所述样本多媒体内容的真实投放结果,调节所述样本多媒体内容中的权重参数,得到所述训练完成的目标模型。
7.根据权利要求1所述的方法,其特征在于,所述内容相关特征包括内容特征;
所述获取待投放多媒体内容的第一特征信息中的内容相关特征,包括:
将所述待投放多媒体内容中的各帧图像信息分别输入至预先训练的图像分类模型中,得到所述各帧图像信息对应的图像理解特征;
将所述待投放多媒体内容中的文本信息输入至预先训练的自然语言处理模型中,得到所述文本信息对应的文本理解特征;
将所述图像理解特征和所述文本理解特征进行拼接处理,得到所述内容特征。
8.一种确定投放内容的装置,其特征在于,包括:
第一获取模块,用于获取待投放多媒体内容的第一特征信息和第二特征信息;所述第一特征信息包括所述待投放多媒体内容的内容相关特征;所述第二特征信息包括所述待投放多媒体内容的投放策略特征;
生成模块,用于基于所述第一特征信息和所述第二特征信息,生成第一拼接特征,以及基于所述第一特征信息中的标识特征和所述第二特征信息,生成第二拼接特征;所述标识特征为用于标识所述待投放多媒体内容的特征;
确定模块,用于基于所述第一拼接特征和所述第二拼接特征,确定所述待投放多媒体内容的投放预估结果;
筛选模块,用于基于多个所述待投放多媒体内容的投放预估结果,从多个所述待投放多媒体内容中筛选出目标多媒体内容。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的确定投放内容的方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一项所述的确定投放内容的方法的步骤。
CN202211463614.4A 2022-11-22 2022-11-22 一种确定投放内容的方法、装置、计算机设备及存储介质 Pending CN115730142A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211463614.4A CN115730142A (zh) 2022-11-22 2022-11-22 一种确定投放内容的方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211463614.4A CN115730142A (zh) 2022-11-22 2022-11-22 一种确定投放内容的方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN115730142A true CN115730142A (zh) 2023-03-03

Family

ID=85297162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211463614.4A Pending CN115730142A (zh) 2022-11-22 2022-11-22 一种确定投放内容的方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115730142A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628236A (zh) * 2023-07-25 2023-08-22 腾讯科技(深圳)有限公司 多媒体信息的投放方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628236A (zh) * 2023-07-25 2023-08-22 腾讯科技(深圳)有限公司 多媒体信息的投放方法、装置、电子设备及存储介质
CN116628236B (zh) * 2023-07-25 2024-02-23 腾讯科技(深圳)有限公司 多媒体信息的投放方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11669744B2 (en) Regularized neural network architecture search
CN109871532B (zh) 文本主题提取方法、装置及存储介质
US11550871B1 (en) Processing structured documents using convolutional neural networks
US20200401896A1 (en) Generating larger neural networks
CN111291266A (zh) 基于人工智能的推荐方法、装置、电子设备及存储介质
CN110232183A (zh) 关键词提取模型训练方法、关键词提取方法、装置及存储介质
US20220121906A1 (en) Task-aware neural network architecture search
EP3602419B1 (en) Neural network optimizer search
US20200401899A1 (en) Computationally efficient neural network architecture search
CN107066464A (zh) 语义自然语言向量空间
CN112163165A (zh) 信息推荐方法、装置、设备及计算机可读存储介质
KR20190070625A (ko) 메타데이터를 이용한 아이템 추천 방법 및 장치
US20200410365A1 (en) Unsupervised neural network training using learned optimizers
US11276099B2 (en) Multi-perceptual similarity detection and resolution
WO2019075267A1 (en) ARTIFICIAL NEURON NETWORK AUTO-SYNCHRONIZATION ACTIVATION LAYERS
CN110097010A (zh) 图文检测方法、装置、服务器及存储介质
CN110633421A (zh) 特征提取、推荐以及预测方法、装置、介质和设备
Mohamad Nezami et al. Towards generating stylized image captions via adversarial training
CN109189922B (zh) 评论评估模型的训练方法和装置
CN110287341A (zh) 一种数据处理方法、装置以及可读存储介质
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN115730142A (zh) 一种确定投放内容的方法、装置、计算机设备及存储介质
CN112231516A (zh) 视频摘要生成模型的训练方法、视频摘要生成方法及装置
US10755171B1 (en) Hiding and detecting information using neural networks
CN113220893B (zh) 基于情感分析的产品反馈分析系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination