CN114331495A - 多媒体数据处理方法、装置、设备及存储介质 - Google Patents

多媒体数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114331495A
CN114331495A CN202111462968.2A CN202111462968A CN114331495A CN 114331495 A CN114331495 A CN 114331495A CN 202111462968 A CN202111462968 A CN 202111462968A CN 114331495 A CN114331495 A CN 114331495A
Authority
CN
China
Prior art keywords
multimedia data
candidate
asset
information
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111462968.2A
Other languages
English (en)
Inventor
严超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111462968.2A priority Critical patent/CN114331495A/zh
Publication of CN114331495A publication Critical patent/CN114331495A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种多媒体数据处理方法、装置、设备及存储介质,其中,该方法涉及人工智能和区块链技术领域,该方法包括:获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;根据目标对象属性信息和候选媒体属性信息,预测出用于反映目标对象针对候选多媒体数据Pi执行操对应的目标操作信息;根据候选媒体属性信息,确定候选多媒体数据Pi的媒体资产因子;根据目标操作信息以及媒体资产因子,从多媒体数据集合中选择用于推送至目标对象的候选多媒体数据,作为目标多媒体数据,向目标对象对应的终端推送目标多媒体数据。通过本申请能够提高多媒体数据的推送准确度。

Description

多媒体数据处理方法、装置、设备及存储介质
技术领域
本申请涉及人工智能和区块链技术领域,尤其涉及一种多媒体数据处理方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展,线上信息推送技术被应用于多种场景中,例如,在产品推广场景中,通过在网页、搜索引擎、浏览器或其它多媒体平台中推送关于产品的多媒体数据,以推广产品。目前主要采用随机推送方式,将多媒体平台中需要推送的多媒体数据推送给用户,实践中发现,这种推送方式无法实现精准推送,导致多媒体数据的推送准确度比较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种多媒体数据处理方法、装置、设备及存储介质,能够提高多媒体数据的推送准确度。
本申请实施例一方面提供一种多媒体数据处理方法,包括:
获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。本申请实施例一方面提供一种多媒体数据处理装置,包括:
获取模块,用于获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
预测模块,用于根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
确定模块,用于根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
选择模块,用于根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
本申请一方面提供了一种计算机设备,包括:处理器及存储器;
其中,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以执行上述方法中的步骤。
本申请实施例一方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序包括程序指令,上述程序指令当被处理器执行时,以执行上述方法中的步骤。
本申请实施例一方面提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述方法中的步骤。
本申请中,目标操作信息具体用于反映该目标对象对该候选多媒体数据执行操作(如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值。通过根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度;不仅可避免向用户推荐用户不感兴趣的多媒体数据,导致无效多媒体数据推荐,浪费多媒体平台的资源的问题,还可以避免向用户推荐商业价值比较低的多媒体数据,导致多媒体平台的资源利用率比较低的问题,可提高多媒体平台的资源利用率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请提供的一种智能定向广告的自动扩量的场景示意图;
图1b是本申请提供的一种智能定向广告的系统优选的场景示意图;
图2是本申请提供的一种多媒体数据处理系统的架构示意图;
图3是本申请提供的一种多媒体数据处理系统中的各个设备之间进行交互的场景示意图;
图4是本申请提供的第一种多媒体数据处理方法的流程示意图;
图5是本申请提供的第二种多媒体数据处理方法的流程示意图;
图6是本申请提供的一种的目标操作识别模型和目标资产识别模型示意图;
图7是本申请提供的第一种获取目标对象针对候选多媒体数据执行操作对应的目标操作信息的场景示意图;
图8是本申请提供的第一种获取候选多媒体数据的媒体资产因子的场景示意图;
图9是本申请提供的一种资产专家网络的结构示意图;
图10是本申请实施例提供的一种构造训练样本数据的场景示意图;
图11是本申请实施例提供的一种检索目标多媒体数据的场景示意图;
图12是本申请实施例提供的一种获取候选多媒体数据的商业价值的场景示意图;
图13a是本申请实施例提供的一种获取目标多媒体数据的场景示意图;
图13b是本申请实施例提供的一种获取目标多媒体数据的流程示意图;
图14是本申请实施例提供的一种多媒体数据处理的结构示意图;
图15是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对本申请实施例中涉及的名词进行介绍:
多媒体数据:用户可对其执行操作的数据,可包括图像、文字、视频、网页链接中的一种或多种,当多媒体数据展示在多媒体平台时,用户可以对该多媒体数据执行操作。此处执行操作可包括浅层转化操作、深层转化操作和非转化操作,深层转化操作是指本次能够给多媒体数据的发布者带来资产的操作,浅层转化操作可以是指在未来给多媒体数据的发布者带来资产的概率为第一概率的操作,非转化操作是指不会给多媒体数据的发布者带来资产的操作,或者,在未来给多媒体数据的发布者带来资产的概率为第二概率的操作,第一概率大于第二概率。浅层转化操作、深层转化操作和非转化操作具体可以根据多媒体数据的类型确定,例如,该多媒体数据为产品推广广告,当该产品推广广告展示在多媒体平台上时,如果用户对该产品推广广告执行点击操作,终端响应于该点击操作,跳转至该产品推广广告对应的网页,网页中包括用于购买该产品的应用程序。当该用户的终端中已经安装该应用程序,用户对该应用程序执行确认启动操作,或者,当该用户的终端中未安装该应用程序,该用户对该应用程序执行下载并安装操作,并进一步,在应用程序上对推广的产品执行下单操作。因此,上述点击操作可以称为非转化操作,下载操作(或确认启动操作) 可以称为浅层转化操作,下单操作可以称为转化操作。
多媒体数据的发布者:多媒体数据所属的对象,例如,该多媒体数据为广告,该发布者可以是指广告主,具体是在网上销售或宣传自己产品和服务的商家。广告主发布广告活动,并按照多媒体平台完成的广告活动中规定的营销效果的总数量及单位效果价格向多媒体平台支付费用。
oCPA(optimized click per action)广告:为一种采用新出价方式的广告形态,具体指广告主为某一种特定转化操作设定的预期成本价target_cpa,由平台负责控制每次曝光的出价,以达成每个转化平摊成本在广告主预期成本价target_cpa 的1.2之内;预期成本价也可以称为媒体预期资产信息。
广告的实际成本:针对广告主设定的转化操作,oCPA广告平均每个转化操作的消耗(即支出)即为成本。
eCPM:effective Cost per Mille(每千次曝光的总扣费),多媒体平台竞价排序的指标,高eCPM的广告,意味着能够多媒体平台带来更多的收入,优先获得曝光。
GMV:Gross Merchandise Volume(商品交易总额),多媒体平台中衡量广告主成交总额的指标,计算公式为广告主在投广告的转化数(被执行转化操作的次数)和转化出价的乘积和,高GMV意味着多媒体平台给广告主带来的价值越高。
召回/检索:多媒体平台中,从海量广告库中挑选符合当前用户感兴趣的广告集合称为召回,也称为检索。
智能定向广告:不同于传统广告定向,需要广告主基于他们的先验知识,挑选广告的用户受众定向,提供对应的人群包。智能定向广告允许广告主只需要提供广告受众的基定向(比如性别,年龄,地域等),此外就交给广告系统通过模型策略来自动选择满足基础定向的用户群体,只有在模型认为优质的用户请求来时,才会将对应广告主的广告召回,进行竞价,争取广告曝光的机会。智能定向广告存在两种形式:自动扩量和系统优选。
1)自动扩量通常搭配精准窄定向使用,这里的精准窄定向指的是广告主自助选择的原始定向偏窄定向,如图1a中的A and B and C and D(A/B/C/D指的是前面介绍的传统标签定向条件)。广告主在开启自动扩量时,还可以设置原始定向中的不可突破部分,即不可突破定向,假如是A and B,扩量策略人群用E代替,最终广告定向人群是在原始定向Aand B and C and D的基础上,再叠加上A and B and E,达到扩量的效果。
2)系统优选通常搭配通投宽定向使用,这里的通投宽定向指的是广告主自助选择的原始定向偏宽定向,如图1b中A and B,优选策略人群用F代替,最终广告定向人群是Aand B and F,达到优选调量的效果。
通常多媒体平台中包括大量待推送的多媒体数据,然而,多媒体平台中的用于展示的多媒体数据的区域(即广告位)有限,因此,每次只能挑选出部分多媒体数据进行曝光,只有被曝光的多媒体数据才有机会被执行转化操作,进而,才能给多媒体数据所属的对象以及多媒体数据平台带来资产(即商业价值)。目前主要采用随机推送方式,将多媒体平台中需要推送的多媒体数据推送给用户,无法实现精准推送,导致多媒体数据推送的准确度比较低。也就是说,这种推送方式每个多媒体数据的推送概率均相同,那么容易将用户不感兴趣的多媒体数据,或者,商业价值比较低的多媒体数据推送给用户,浪费多媒体数据的曝光机会,导致多媒体数据的推送准确度比较低。基于此,本申请提供一种多媒体数据处理方法,该方法包括:计算机设备可以目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据的候选媒体属性信息,根据该目标对象属性信息和该候选媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据执行操作对应的目标操作信息,即该目标操作信息用于反映该目标对象对该候选多媒体数据执行操作(如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。进一步,根据该候选多媒体属性信息,确定该候选多媒体数据的媒体资产因子,该媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值,然后,根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度。
为了便于更清楚理解本申请,首先介绍实现本申请的多媒体数据处理方法的多媒体数据处理系统,如图2所示,多媒体数据处理系统中包括如图2所示,该多媒体数据处理系统中包括服务器10和终端集群,终端集群可以包括一个或者多个终端,这里将不对终端的数量进行限制。如图2所示,终端集群具体可以包括终端1、终端2、…、终端n;可以理解的是,终端1、终端2、终端 3、…、终端n均可以与服务器10进行网络连接,以便于每个终端均可以通过网络连接与服务器10之间进行数据交互。
其中,服务器10可以是指多媒体数据管理设备,如,该服务器可以是指为多媒体平台提供后端服务的设备,该多媒体平台可以是指社交应用程序、视频应用程序、多媒体网页等等。具体的,该服务器10可以用于根据多媒体数据的媒体属性信息和用户的对象属性信息,向用户推荐多媒体数据。
其中,服务器可以是独立的一个物理服务器,也可以是至少两个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、中容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端具体可以是指具有多媒体数据处理功能的车载终端、智能手机、智能音箱、有屏音箱、智能手表等等,但并不局限于此。各个终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,同时,终端以及服务器的数量可以为一个或至少两个,本申请在此不做限制。
需要说明的是,本申请中的服务器可以是指区块链网络中的节点设备,该节点设备在接收到新的候选多媒体数据时,获取该候选多媒体数据的候选媒体数据信息,当终端接收到目标对象关于多媒体数据的获取请求,将该获取请求发送至节点设备,节点设备可以获取该目标对象的目标对象属性信息,根据目标对象属性信息,从该候选媒体属性信息中检索出推送至目标对象的候选媒体数据,作为目标媒体数据,将该目标媒体数据推送至目标对象。
基于图2所示的多媒体数据处理系统可用于实现本申请中的多媒体数据处理方法,在图3中以多媒体数据为广告为例进行说明,该多媒体数据处理方法可以包括离线处理过程和在线处理过程:
离线处理过程主要包括获取广告特征向量以及对模型进行训练,离线处理过程由服务器中的离线服务模块来实现,离线服务模块包括日志解析、特征构造、样本构造和模型训练、投放DB库、广告数据流、广告特征向量七大模块。其中,日志解析、特征构造、样本构造和模型训练主要用于从多媒体平台(即广告系统)的原始日志或特征数据库中,获取候选资产识别模型和候选操作识别模型需要的各种特征(包括广告特征、用户特征、广告竞争环境特征),根据这些特征,通过合适的样本构造方法构造候选资产识别模型和候选操作识别模型的训练样本。进一步,根据训练样本对候选资产识别模型和候选操作识别模型进行训练,得到目标资产识别模型和目标操作识别模型。其中,投放DB 库、广告数据流,广告特征向量三大模块,主要用于获取实时最新的广告状态,以及利用目标资产识别模型和目标操作识别模型计算最新的广告特征向量(即候选媒体属性信息)。
在线处理过程主要包括获取用户特征向量以及获取需推荐的多媒体数据,在线处理过程由终端中的在线服务模块来实现,在线服务模块包括精排、粗排、召回、模型服务以及广告库等五个模块。主要用于当接收到用户关于多媒体数据的获取请求时,利用目标操作识别模型计算出最新的用户特征向量,根据用户特征向量从广告库中检索出对应广告特征向量,检索出的广告经历多媒体平台后续的粗排、精排,直至竞价成功,获得在当前用户请求上的曝光机会。
进一步地,请参见图4,是本申请实施例提供的一种多媒体数据处理方法的流程示意图。如图4所示,该方法可由图2中的终端来执行,也可以由图2 中的服务器来执行,还可以由图2中的终端和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该多媒体数据处理方法可以包括如下步骤S101~S104:
S101、获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M 为所述多媒体数据集合中的候选多媒体数据对应的数量。
本申请中,发送多媒体数据获取请求的用户可以称为目标对象,计算机设备可以从获取多媒体平台的日志数据,对该日志数据进行解析,得到该目标对象的属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息。目标对象属性信息包括基本画像特征、历史行为统计特征、行为序列特征、行为兴趣挖掘特征等等中的一种或多种,基础画像特征包括年龄、性别、省份、职业、消费状态、婚恋状态以及学历等中的一种或多种。历史行为统计特征包括历史时间段内(如近一个月、近一周、近三个月)的点击数、点击多媒体数据详情页次数、视频点击关注次数、将多媒体数据设置为不感兴趣的多媒体数据的次数等、平均曝光多媒体数据次数中的一种或多种,行为序列特征包括目标对象历史时间段内的曝光、点击、转化的多媒体数据、app等信息;行为兴趣挖掘特征包括从目标对象的原始行为序列中挖掘出的长短期感兴趣的多媒体数据类型、关键词等标签特征。候选媒体属性信息包括上下文特征和基本属性信息,上下文特征包括多媒体数据位信息(比如多媒体数据位ID、多媒体数据位素材规格等)、设备信息(设备操作系统,设备联网类型)、多媒体数据位上下文信息等;基本属性信息包括媒体预期资产信息、多媒体数据ID、创意ID、商品ID、多媒体数据主ID、多媒体数据类型、创意内容关键词、多媒体数据关键词等其他特征。此处媒体预期资产信息用于反映当该候选多媒体数据Pi被转化执行操作时,该候选多媒体数据所属的对象需支出的预期资产量,该预期资产量为在候选多媒体数据Pi未曝光之前,候选多媒体数据Pi所属的对象给多媒体数据平台的报价(即出价)。
需要说明的是,目标对象属性信息可以称为用户embedding(即向量),候选对象属性信息可以称为多媒体数据embedding,用户embedding和多媒体数据embedding相互分离,即多媒体数据embedding可以离线提前计算得到的,用户embedding为线上实时计算得到的。例如,当目标对象请求多媒体数据时,可实时计算得到该目标对象的用户embedding,然后利用用户embedding检索出近邻的多媒体数据embedding,将近邻的多媒体数据embedding对应的候选多媒体数据推送至目标对象,这样能够提高获取目标多媒体数据的效率。
其中,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且目标对象的对象属性信息、样本对象的样本属性信息、目标对象和样本对象关于多媒体数据的日志数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。也就是说,计算机设备可以在获取到用户针对上述信息的授权信息时,计算机设备才能获取目标对象的对象属性信息、样本对象的样本属性信息、目标对象和样本对象关于多媒体数据的日志数据;即目标对象的对象属性信息、样本对象的样本属性信息、目标对象和样本对象关于多媒体数据的日志数据是用户授权后才获取得到的。
例如,在计算机设备在多媒体平台的多媒体界面中显示权限提示界面,该权限提示界面用于提示用户当前正在搜集目标对象的对象属性信息、样本对象的样本属性信息、目标对象和样本对象关于多媒体数据的日志数据,在获取到用户对该权限提示界面发出确认操作后,开始执行获取目标对象的对象属性信息、样本对象的样本属性信息、目标对象和样本对象关于多媒体数据的日志数据步骤,否则结束。
S102、根据该目标对象属性信息和所述候选媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息。
本申请中,计算机设备可以对该目标对象属性信息和该候选媒体属性信息进行关联识别,得到用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息,该目标操作信息用于反映该目标对象对该候选多媒体数据Pi执行操对应的概率,即该概率在一定程度上能够反映该目标对象对该候选多媒体数据Pi的兴趣度。例如,该目标对象对该候选多媒体数据Pi执行转化操对应的概率比较高,表明该目标对象对该候选多媒体数据Pi的兴趣度比较高;如果该目标对象对该候选多媒体数据Pi执行转化操对应的概率比较低,表明该目标对象对该候选多媒体数据Pi的兴趣度比较低。
S103、根据该候选媒体属性信息,确定该候选多媒体数据Pi的媒体资产因子;该媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量。
本申请中,计算机设备可以根据该候选媒体属性信息,确定该候选多媒体数据Pi的媒体资产因子;该媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,实际资产量为当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支付给多媒体平台的资产量。因此,该媒体资产因子在一定程度上能够反映该候选多媒体数据Pi的商业价值,例如,该媒体资产因子越高,表明该候选多媒体数据Pi所属的对象需支付给多媒体平台的实际资产量比较高,即该候选多媒体数据Pi的商业价值比较高;相反,该媒体资产因子越低,表明该候选多媒体数据Pi所属的对象需支付给多媒体平台的实际资产量比较低,即该候选多媒体数据Pi的商业价值比较低。
S104、根据该目标操作信息以及该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。
本申请中,由于多媒体平台中包括大量待推送的候选多媒体数据,不能一次性将所有的候选多媒体数据推送给目标对象,因此,计算机设备可以根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据;也就是说,综合考虑目标对象对该候选多媒体数据的兴趣度特征以及候选多媒体数据的商业价值,给目标对象推送多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度。
本申请中,计算机设备接收到目标对象针对多媒体数据的获取请求时,可以目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据的候选媒体属性信息,根据该目标对象属性信息和该候选媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据执行操作对应的目标操作信息,即该目标操作信息具体用于反映该目标对象对该候选多媒体数据执行操作 (如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。进一步,根据该候选多媒体属性信息,确定该候选多媒体数据的媒体资产因子,该媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值。然后,根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度;不仅可避免向用户推荐用户不感兴趣的多媒体数据,导致无效多媒体数据推荐,浪费多媒体平台的资源的问题,还可以避免向用户推荐商业价值比较低的多媒体数据,导致多媒体平台的资源利用率比较低的问题,可提高多媒体平台的资源利用率。
进一步地,请参见图5,是本申请实施例提供的一种多媒体数据处理方法的流程示意图。如图5所示,该方法可由图1中的终端来执行,也可以由图1 中的服务器来执行,还可以由图1中的终端和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该多媒体数据处理方法可以包括如下步骤S201~S206:
S201、获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M 为该多媒体数据集合中的候选多媒体数据对应的数量。
S202、从该目标对象属性信息中,提取出与该候选多媒体数据Pi的操作属性关联的关键对象属性信息。
本申请中,计算机设备可以根据历史经验或通过模型(如目标操作识别模型和目标资产识别模型)从该目标对象属性信息中,提取该与该候选多媒体数据Pi的操作属性关联的关键对象属性信息,如关键对象属性信息可以包括消费状态、职业、历史行为统计特征、行为序列特征、行为兴趣挖掘特征等等中的一项或多项。
可选的,该关键对象属性信息包括与该候选多媒体数据Pi的转化操作属性关联的第一关键对象属性信息,以及与该候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息,第一关键对象属性信息和第二关键对象属性信息具体可以是指根据该候选多媒体数据Pi的类型确定的。例如,该候选多媒体数据Pi为产品推广广告,第一关键对象属性信息包括消费状态、历史行为统计特征、行为序列特征、行为兴趣挖掘特征,第二关键对象属性信息包括职业、历史行为统计特征、行为序列特征等中的一种或多种。可选的,该第一关键对象属性信息具体可包括与该候选多媒体数据Pi的第一转化操作属性关联关键对象属性信息,以及与该候选多媒体数据Pi的第二转化操作属性关联关键对象属性信息中的任一种或两种。第一转化操作属性、第二转化操作属性、非转化操作属性可以是根据多媒体数据的类型确定的,例如,该多媒体数据为产品推广广告,第一转化操作属性是指下单操作属性,即深度转化操作属性,第二转化操作属性是指下载操作属性,即浅度转化操作属性,非转化操作属性可以是指点击操作属性。
例如,如图6所示,目标操作识别模型包括专家网络1、专家网络2以及专家网络3、以及专家网络1、专家网络2以及专家网络3分别对应的门控网络1、门控网络2、以及门控网络3。目标操作识别模型中的专家网络1和门控网络1用于从目标对象属性信息中提取与该候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息,具体的,目标操作识别模型中的专家网络1从目标对象属性信息中提取与该候选多媒体数据Pi的非转化操作属性关联的关键对象属性信息,目标操作识别模型中的门控网络1为专家网络1所输出的关键对象属性信息确定置信度,采用该置信度对专家网络1所输出的关键对象属性信息进行加权,得到第二关键对象属性信息。同理,目标操作识别模型中的专家网络2和门控网络2用于从目标对象属性信息中提取与该候选多媒体数据Pi的浅层转化操作属性关联的浅层关键对象属性信息,目标操作识别模型中的专家网络3和门控网络3用于从目标对象属性信息中提取与该候选多媒体数据Pi的深层转化操作属性关联的深层关键对象属性信息,将浅层关键对象属性信息和深层关键对象属性信息确定为第一关键对象属性信息。
S203、从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的操作属性关联的关键媒体属性信息。
本申请中,计算机设备可以从该候选多媒体属性信息中,提取出与该候选多媒体数据Pi的操作属性关联的关键媒体属性信息,如该关键媒体属性信息包括多媒体数据位上下文信息、多媒体数据类型、创意内容关键词、多媒体数据关键词等中的一项或多项。
可选的,该关键媒体属性信息包括与该候选多媒体数据Pi的转化操作属性关联的第一关键媒体属性信息,以及与该候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息;该第一关键媒体属性信息可包括与该候选多媒体数据Pi的第一转化操作属性关联的关键媒体属性信息,以及与该候选多媒体数据Pi的第二转化操作属性关联的关键媒体属性信息中的任一种或两种。第一关键媒体属性信息和第二关键媒体属性信息具体可以是根据该候选多媒体数据 Pi的类型确定的。
例如,如图6所示,目标资产识别模型包括专家网络1、专家网络2、专家网络3、资产专家网络、以及专家网络1、专家网络2、专家网络3、资产专家网络分别对应的门控网络1、门控网络2、门控网络3以及门控网络4。目标资产识别模型包括专家网络1和门控网络1用于候选多媒体属性信息中提取与该候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息,目标资产识别模型包括专家网络2和门控网络2用于候选多媒体属性信息中提取与该候选多媒体数据Pi的浅层转化操作属性关联的浅层关键媒体属性信息,目标资产识别模型包括专家网络3和门控网络3用于候选多媒体属性信息中提取与该候选多媒体数据Pi的深层转化操作属性关联的深层关键媒体属性信息,将浅层关键媒体属性信息和深层关键媒体属性信息确定为第一关键媒体属性信息。
S204、采用目标操作识别模型的操作识别网络,基于该关键对象属性信息和该关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息。
本申请中,计算机设备可以采用该目标操作失败模型的操作识别网络,基于该关键对象属性信息和关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息。通过分别从目标对象属性信息和候选媒体属性信息中,提取与该候选多媒体数据Pi的操作属性关联的关键特征信息,仅对关键特征信息进行分析,不需要对目标对象属性信息和候选媒体属性信息中的无效信息进行分析,可节省资源,
可选的,如图7所示,该关键对象属性信息包括与该候选多媒体数据Pi的转化操作属性关联的第一关键对象属性信息,以及与该候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息;该关键媒体属性信息包括与该候选多媒体数据Pi的转化操作属性关联的第一关键媒体属性信息,以及与该候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息;上述步骤 S204包括:采用该目标操作识别模型的操作识别网络,基于该第一关键对象属性信息和该第一关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行转化操作对应的转化操作信息;根据该第二关键对象属性信息和该第二关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行非转化操作对应的非转化操作信息;将该转化操作信息和该非转化操作信息,确定为用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息。
计算机设备可以采用该目标操作识别模型的操作识别网络,基于该第一关键对象属性信息和该第一关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行转化操作对应的该转化概率,将该转化概率确定为转化操作信息。然后,采用操作识别网络根据该第二关键对象属性信息和该第二关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行非转化操作对应的非转化操作概率,将该非转化操作概率确定为非转化操作信息。进一步,可以将该转化操作信息和该非转化操作信息,确定为用于反映该目标对象针对该候选多媒体数据Pi执行操对应的目标操作信息。通过分别获取该目标对象针对该候选多媒体数据Pi执行转化操作、执行非转化操作对应的操作信息,可挖掘出目标对象与该候选多媒体数据Pi之间更加细节的关联信息,进一步,提高多媒体数据的推荐准确度。
例如,如图6所示,该操作识别网络包括CTR(点击率)双塔、CVR(转化率)双塔、深层CVR双塔,采用CTR(点击率)双塔根据该第二关键对象属性信息和该第二关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行非转化操作对应的非转化操作概率,即采用CTR双塔根据该第二关键对象属性信息和该第二关键媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行点击操作对应的点击操作概率。采用CVR 双塔根据浅层对象属性信息和浅层媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行下载操作对应的下载操作概率,采用CTR双塔根据深层对象属性信息和深层媒体属性信息,预测出用于反映该目标对象针对该候选多媒体数据Pi执行下单操作对应的下单操作概率。
S205、根据该候选媒体属性信息,确定该候选多媒体数据Pi的媒体资产因子;该媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量。
可选的,上述步骤S205包括:从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的资产属性关联的关键资产属性信息;采用目标资产识别模型的资产识别网络,对该关键资产属性信息进行交叉关联关系识别,得到交叉关联关系信息;该目标资产识别模型与该目标操作识别模型相互独立;
对该关键资产属性信息进行深度关联关系识别,得到深度关联关系信息;根据该交叉关联关系信息和该深度关联关系信息,确定该媒体资产因子。
例如,如图8所示,目标资产识别模型的资产识别网络包括交叉子网络和深度子网络,计算机设备可以通过该资产识别网络获取媒体资产因子,该资产识别网络可以是指DCN(Deep and Cross Network),当然,也可以是指其他网络。具体的,计算机设备可以从该候选多媒体属性信息中提取与该候选多媒体数据Pi的资产属性关联的关键资产属性信息,采用资产识别网络的交叉子网络对该关键资产属性信息进行交叉关联关系识别,得到交叉关联关系信息,该交叉关联关系信息用于反映关键资产属性信息中每两个维度的关键资产属性信息之间的关联关系。进一步,采用资产识别网络的深度子网络对该关键资产属性信息进行深度关联关系识别,得到深度关联关系信息,深度关联关系信息用于反映关键资产属性信息中两个以上维度的关键资产属性信息之间的关联关系,根据该交叉关联关系信息和该深度关联关系信息,确定该媒体资产因子。通过挖掘关键资产属性信息中各个关键资产属性信息之间的交叉关联关系以及深度关联关系,能够挖掘出关于资产属性的细节信息,为确定媒体资产因子提供更多信息量,提高获取媒体资产因子的准确度。
可选的,上述从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的资产属性关联的关键资产属性信息,包括:采用该目标资产识别模型的资产专家网络,从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息;采用该目标资产识别模型的资产门控网络,确定该候选资产属性信息的置信度;采用该置信度对该候选资产属性信息进行加权,得到与该候选多媒体数据Pi的资产属性关联的关键资产属性信息。
该目标资产识别模型包括一个或多个资产专家网络,一个资产专家网络对应一个资产门控网络,计算机设备可以通过资产专家网络、资产门控网络获取关键资产属性信息。具体的,例如,如图6所示,当该目标资产识别模型包括一个资产专家网络和一个资产门控网络(即图6中的门控网络4)时,计算机设备可以采用该目标资产识别模型的资产专家网络,从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息,然后,采用该目标资产识别模型的资产门控网络,确定该候选资产属性信息的置信度,该置信度用于反映候选资产属性信息的准确度,进一步,采用该置信度对该候选资产属性信息进行加权,得到与该候选多媒体数据Pi的资产属性关联的关键资产属性信息。当该目标资产识别模型包括至少两个资产专家网络和至少两个资产门控网络时,计算机设备可以分别采用该目标资产识别模型的各个资产专家网络,从该候选媒体属性信息中,提取出与该候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息,然后,分别采用该目标资产识别模型的各个资产门控网络,确定对应的候选资产属性信息的置信度,进一步,采用该置信度对对应候选资产属性信息进行加权,得到加权后的候选资产属性信息,对加权后的候选资产属性信息进行融合,得到与该候选多媒体数据Pi的资产属性关联的关键资产属性信息。通过资产专家网络、资产门控网络获取关键资产属性信息,提高获取关键资产属性信息的准确度。需要说明的是,本申请中的该目标资产识别模型与该目标操作识别模型相互独立可以是指:模型的输出因子均独立拟合,独立建模优化,可以提高该目标资产识别模型和该目标操作识别模型的精度。
例如,该资产专家网络可以是指PNN结构,资产门控网络结构可以采用 softmax(逻辑回归)结构。其中,PNN结构如图9所示,资产门控网络可以包括映射层、实体层、隐藏层1和隐藏层2,其中,映射层用于将该候选媒体属性信息中各个维度的属性信息转化为相同长度的特征向量,实体层用于识别各个特征向量之间的关联关系。隐藏层1和隐藏层2用于根据该关联关系,从该候选媒体属性信息中提取中与该候选多媒体数据Pi的资产属性关联的关键资产属性信息。
可选的,获取样本对象的样本对象属性信息、样本多媒体数据的样本媒体属性信息以及该样本对象关于该样本多媒体数据的标注操作信息;采用候选操作识别模型,对该样本对象属性信息和该样本媒体属性信息进行预测,得到用于反映该样本对象针对该样本多媒体数据执行操作对应的预测操作信息;根据该标注操作信息和该预测操作信息,对该候选操作识别模型进行调整,将调整后的候选操作识别模型确定为该目标操作识别模型。
计算机设备可以根据样本对象的样本对象属性信息,以及样本多媒体数据的样本媒体属性信息以及该样本对象关于该样本多媒体数据的标注操作信息,该样本对象关于该样本多媒体数据的标注操作信息可以是指根据样本对象关于样本多媒体数据的日志数据确定得到的,这样可以避免人工标注带来的误差,可以自动生成标注操作信息,提高获取标注操作信息的效率和准确度;或者,计算机设备可以获取多个对象结合样本对象的对象属性信息对样本多媒体数据进行标注得到的标注操作信息,对多个标注操作信息进行校正,得到该样本多媒体数据的标注操作信息。采用候选操作识别模型,对该样本对象属性信息和该样本媒体属性信息进行预测,得到用于反映该样本对象针对该样本多媒体数据执行操作对应的预测操作信息,如果标注操作信息与预测操作信息相同或比较接近,则表明候选操作识别模型的操作预测准确度比较高;如果标注操作信息与预测操作信息之间的差异比较大,则表明候选操作识别模型的操作预测准确度比较低。因此,计算机设备可以根据该标注操作信息和该预测操作信息,对该候选操作识别模型进行调整,将调整后的候选操作识别模型确定为该目标操作识别模型。通过根据样本对象的样本对象属性信息和样本媒体属性信息,对候选操作识别模型进行训练,得到目标操作识别模型,提高获取目标操作识别模型的操作预测准确度,目标操作识别模型与目标资产识别模型单独训练优化,提高目标操作识别模型的准确度。
可选的,该标注操作信息包括第一标注转化操作信息、第二标注转化操作信息以及标注非转化操作信息;该预测操作信息包括第一预测转化操作信息、第二标预测化操作信息以及预测非转化操作信息;第一标注转化操作信息、第一预先转化操作信息用于反映目标对象针对该样本多媒体数据执行第一转化操作的概率,第二标注转化操作信息、第二预测转化操作信息用于反映目标对象针对该样本多媒体数据执行第二转化操作的概率,标注非转化操作信息、预测非转化操作信息用于反映目标对象针对该样本多媒体数据执行非转化操作的概率。上述根据该标注操作信息和该预测操作信息,对该候选操作识别模型进行调整,包括:根据该第一标注转化操作信息和该第一预测转化操作信息,确定该候选操作识别模型的第一转化操作预测误差;根据该第二标注转化操作信息和该第二预测转化操作信息,确定该候选操作识别模型的第二转化操作预测误差;根据该标注非转化操作信息和该预测非转化操作信息,确定该候选操作识别模型的非转化操作预测误差;根据该第一转化操作预测误差、该第二转化操作预测误差以及该非转化操作预测误差,对该候选操作识别模型进行调整,得到调整后的候选操作识别模型。
计算机设备可以根据该第一标注转化操作信息和该第一预测转化操作信息,确定该候选操作识别模型的第一转化操作预测误差,如果该第一转化操作预测误差越低,表明该候选操作识别模型的第一转化操作的识别准确度比较高;如果该第一转化操作预测误差越高,表明该候选操作识别模型的第一转化操作的识别准确度比较低。然后,根据该第二标注转化操作信息和该第二预测转化操作信息,确定该候选操作识别模型的第二转化操作预测误差;如果该第二转化操作预测误差越低,表明该候选操作识别模型的第二转化操作的识别准确度比较高;如果该第二转化操作预测误差越高,表明该候选操作识别模型的第二转化操作的识别准确度比较低。进一步,根据该标注非转化操作信息和该预测非转化操作信息,确定该候选操作识别模型的非转化操作预测误差;如果该非转化操作预测误差越低,表明该候选操作识别模型的非转化操作的识别准确度比较高;如果该非转化操作预测误差越高,表明该候选操作识别模型的非转化操作的识别准确度比较低。计算机设备可以根据该第一转化操作预测误差、该第二转化操作预测误差以及该非转化操作预测误差,分别对该候选操作识别模型进行调整,得到调整后的候选操作识别模型,如该候选操作识别模型的各个预测误差均处于收敛状态时,可以结束对候选操作识别模型进行训练,得到调整后的候选操作识别模型。或者,计算机设备根据该第一转化操作预测误差、该第二转化操作预测误差以及该非转化操作预测误差,确定该候选操作识别模型的操作预测误差,根据该操作预测误差对该候选操作识别模型进行调整,得到调整后的候选操作识别模型。通过多个维度的操作预测误差,来对候选操作识别模型信息训练,得到目标操作识别模型,提高目标操作识别模型的操作预测准确度。
可选的,上述根据该第一转化操作预测误差、该第二转化操作预测误差以及该非转化操作预测误差,对该候选操作识别模型进行调整,得到调整后的候选操作识别模型,包括:计算机设备可以对该第一转化操作预测误差、该第二转化操作预测误差以及该非转化操作预测误差进行加权求和,得到该候选操作识别模型的操作预测误差;若该操作预测误差未处于收敛状态,则根据该操作预测误差对该候选操作识别模型进行调整,得到调整后的候选操作识别模型。通过对多个维度的操作预测误差进行加权求和,得到操作预测误差,即操作预测总误差,根据操作预测总误差来对候选操作识别模型信息训练,得到目标操作识别模型,提高目标操作识别模型的操作预测准确度。
可选的,图10所示,在给目标对象推荐多媒体数据时的预测空间是整个多媒体数据集合(如整个广告库),如果训练样本仅仅选择被曝光的多媒体数据,这样会导致模型训练空间和预测空间不一致,即导致“样本选择偏差”问题,这样导致训练得到的模型的准确度比较低。因此,可以通过采用多级负样本构造方案,来避免模型训练空间和预测空间不一致的问题。具体的,计算机设备可以从样本多媒体数据集合中筛选出该样本对象在历史时间段内所执行操作的第一样本多媒体数据,即第一样本多媒体数据为历史时间段内曝光给样本对象的多媒体数据。进一步,可以根据该样本对象关于第一样本多媒体数据的日志数据(即历史时间段内的日志数据)确定该第一样本多媒体数据对应的标注操作信息;从该样本多媒体数据集合中筛选出该样本对象在历史时间段内未执行操作的第二样本多媒体数据;第二样本多媒体数据包括未曝光给样本对象的多媒体数据,以及曝光给样本对象,且样本对象未执行操作的多媒体数据中的一种或两种,即第二样本多媒体数据为负样本。将用于指示该样本对象未对该第二样本多媒体数据执行操作的标注操作信息,确定为该第二样本多媒体数据的标注操作信息,将该第一样本多媒体数据和该第二样本多媒体数据,确定为该样本对象对应的样本多媒体数据。通过该样本对象在历史时间段内未执行操作的第二样本多媒体数据,来构造负样本,为模型训练过程提供丰富、全面的训练数据,使模型的预测空间与训练空间保持一致,提高模型训练的准确度。
需要说明的是,上述样本多媒体数据集合与多媒体数据集合可以相同,也可以不同,但是,样本多媒体数据集合所包括的样本多媒体数据的类型可以覆盖多媒体数据集合所包括的候选多媒体数据的类型,样本多媒体数据集合所包括的样本多媒体数据的数量可以大于多媒体数据集合所包括的候选多媒体数据的数量,这样有利于提高模型训练的准确度。
可选的,上述从该样本多媒体数据集合中筛选出该样本对象在历史时间段内未执行操作的第二样本多媒体数据,包括:从该样本多媒体数据集合中随机选择在该历史时间段内未被推荐给该样本对象的样本多媒体数据,作为第一候选样本多媒体数据;从该样本多媒体数据集合中选择在该历史时间段内被推荐给该样本对象,且未被该样本对象执行操作的样本多媒体数据,作为第二候选样本多媒体数据;将该第一候选样本多媒体数据和该第二候选样本多媒体数据,确定为该样本对象在历史时间段内未执行操作的第二样本多媒体数据。
计算机设备可以从该样本多媒体数据集合中随机选择在该历史时间段内未被推荐(即未曝光)给该样本对象的样本多媒体数据,作为第一候选样本多媒体数据,从该样本多媒体数据集合中选择在该历史时间段内被推荐给该样本对象,且未被该样本对象执行操作的样本多媒体数据,作为第二候选样本多媒体数据,即第二候选样本多媒体数据为曝光给样本对象,且未被样本对象执行操作的多媒体数据。即第一候选样本多媒体数据和第二候选样本多媒体数据均属于负样本多媒体数据,将该第一候选样本多媒体数据和该第二候选样本多媒体数据,确定为该样本对象在历史时间段内未执行操作的第二样本多媒体数据。通过第一候选样本多媒体数据和第二候选样本多媒体数据,构造多级(即多种) 负样本多媒体数据,使模型的预测空间与训练空间保持一致,提高模型训练的准确度。
可选的,获取该样本多媒体数据的媒体预期资产信息;该媒体预期资产信息用于反映当该候选多媒体数据Pi被转化执行操作时,该候选多媒体数据所属的对象需支出的预期资产量;根据该预测操作信息和该媒体预期资产信息,确定该样本多媒体数据的媒体标注资产信息;采用候选资产识别模型,对该预测操作信息和该样本媒体属性信息进行预测,得到该样本多媒体数据的媒体预测资产信息;根据该媒体标注资产信息和该媒体预测资产信息,对该候选资产识别模型进行调整,将调整后的候选资产识别模型确定为目标资产识别模型。
计算机设备可以获取该样本多媒体数据的媒体预期资产信息;该媒体预期资产信息用于反映当该候选多媒体数据Pi被转化执行操作时,该候选多媒体数据所属的对象需支出的预期资产量。然后,根据该预测操作信息和该媒体预期资产信息,确定该样本多媒体数据的媒体标注资产信息,采用候选资产识别模型,对该预测操作信息和该样本媒体属性信息进行预测,得到该样本多媒体数据的媒体预测资产信息;如果媒体标注资产信息与媒体预测资产信息相同或比较接近,则表明候选资产识别模型的资产预测准确度比较高;如果媒体注资产信息与媒体预测资产信息之间的差异比较大,则表明候选资产识别模型的操作预测准确度比较低。因此,根据该媒体标注资产信息和该媒体预测资产信息,对该候选资产识别模型进行调整,将调整后的候选资产识别模型确定为目标资产识别模型。通过根据媒体预期资产信息和媒体标注资产信息,对候选资产识别模型进行训练,得到目标资产识别模型,提高获取目标资产识别模型的资产预测准确度,目标操作识别模型与目标资产识别模型单独训练优化,提高目标资产识别模型的准确度。同时,通过根据该预测操作信息和该媒体预期资产信息,自动生成该样本多媒体数据的媒体标注资产信息,不需要人工参与,提高媒体标注资产信息的生成效率。
例如,该传统的CTCVR模型的函数可以采用如下公式(1)表示:
CTCVR=sigmoid(user*ad) (1)
其中,公式(1)中user表示对象属性信息,即用户特征向量,ad是指媒体属性信息,即广告特征向量,当需要进一步考虑媒体数据的商业价值eCPM 时,在传统架构下CTCVR模型可以变形为如下公式(2):
ECPM=bid*sigmoid(user*ad) (2)
其中,公式(2)中bid表示样本多媒体数据被执行转化操作时,样本媒体数据所属的对象需支出的预期资产量。本申请中,基于ANN检索架构时,上述候选资产识别模型可以采用如下公式(3)表示:
Figure BDA0003389323360000221
其中,公式(3)Gann为媒体资产因子(即广告出价因子),其中,Gann- weighted-ad可以采用如下公式(4)来表示:
Gann-weighted-ad=Gann*ad (4)
其中,图11所示,传统的ANN检索架构是指采用目标对象属性信息
(即user embedding)检索候选媒体属性信息(即ad embedding),本申请中的ANN检索架构为利用user embedding检索G_ann加权过后的ad embedding,从而起到拟合eCPM的作用。
可选的,根据该媒体标注资产信息和该媒体预测资产信息,对该候选资产识别模型进行调整,包括:根据该媒体标注资产信息和该媒体预测资产信息,确定该候选资产识别模型的资产预测误差;若该资产预测误差未处于收敛状态,则根据该资产预测误差对该候选资产识别模型进行调整,得到调整后的候选资产识别模型。
计算机设备可以根据该媒体标注资产信息和该媒体预测资产信息,确定该候选资产识别模型的资产预测误差;该资产预测误差比较低,表明该候选资产识别模型的资产预测准确度比较高,反之,该资产预测误差比较高,表明该候选资产识别模型的资产预测准确度比较低。因此,若该资产预测误差未处于收敛状态,表明该候选资产识别模型的资产预测准确度比较低,因此,根据该资产预测误差对该候选资产识别模型进行调整,得到调整后的候选资产识别模型。
需要说明的是,此处媒体预测资产信息包括深层预测资产信息(即深层商业价值),以及浅层媒体预测资产信息(即浅层商业价值),可以媒体预测资产信息可以采用如下公式(5)表示:
Figure BDA0003389323360000231
其中,公式(5)中的shallow-predict是指浅层商业价值,deep-predict是指深层商业价值。该候选资产识别模型的损失函数可以采用回归loss中的Huber Loss,如下公式(6)所示:
lossaux=HuberLoss(predict,ecpm) (6)
其中,公式(6)中的predict表示shallow-predict或deep-predict,ecpm该媒体标注资产信息,该媒体标注资产信息可以包括浅层标注资产信息和深层资产标注信息。即predict表示shallow-predict时,ecpm表示浅层标注资产信息; predict表示deep-predict时,ecpm表示深层标注资产信息,可以采用如下公式 (7)表示:
eCPM=bid×pCTR×pCVR×λ (7)
其中,公式(7)中,pCTR、pCVR分别表示候选操作模型输出的预估点击率、转化率,Huber Loss定义如下(8)所示:
Figure BDA0003389323360000232
其中,公式(8)中的Lδ(a)表示候选资产识别模型的资产预测误差,a 表示媒体标注资产信息和媒体预测资产信息之间的残差,此处采用Huber Loss 的出发点是考虑到为了防止高eCPM的样本loss导致模型收敛不稳定。
需要说明的是,候选操作识别模型和候选资产识别模型的总预测误差Loss 可以采用如下公式(9)表示:
Loss=αlossctr+βlossshallow_cvr+γlossdeep_cvr+θlossaux (9)
在公式(9)中,lossaux表示候选资产识别模型的资产预测误差,lossctr表示候选操作识别模型的非转化操作预测误差,lossshallow-cvr表示候选操作识别模型的深层转化操作预测误差,lossdeep-cvr、lossshallow-cvr、lossctr均可以采用公式(10) 中的交叉熵损失函数表示:
lossx=-∑[yi*logPi+(1-yi)*log(1-Pi)] (10)
其中,公式(10)中的Pi为候选操作识别模型的预测操作信息,yi表示标注操作信息,x表示候选操作识别模型的输入,即样本对象属性信息和样本媒体属性信息。
S206、根据该目标操作信息以及该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。
可选的,上述步骤S206包括:根据该目标操作信息以及该媒体资产因子,确定该候选多媒体数据Pi的媒体预估资产信息,该媒体预估资产信息用于反映当该候选多媒体数据Pi被该目标对象执行操作时,该候选多媒体数据所属的对象需支出的资产量;根据该候选多媒体数据Pi的媒体预估资产信息,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据。
计算机设备可以根据该目标操作信息以及媒体资产因子,确定该候选多媒体数据Pi的媒体预估资产信息,该媒体预估资产信息用于反映当该候选多媒体数据Pi被该目标对象执行操作时,该候选多媒体数据所属的对象需支出的资产量,即该媒体预估资产信息用于反映当该候选多媒体数据Pi被该目标对象执行操作时,该候选多媒体数据所属的对象需向多媒体平台支付的预估资产量。该预估资产量越高,表明该候选多媒体数据所属的对象需向多媒体平台支付的资产量越高,即该候选多媒体数据Pi的商业价值越高;该预估资产量越低,表明该候选多媒体数据所属的对象需向多媒体平台支付的资产量越低,即该候选多媒体数据Pi的商业价值越低。计算机设备可以从该多媒体数据集合中选择媒体预估资产信息所指示的预估资产量大于资产量阈值的候选多媒体数据,作为目标多媒体数据,将目标多媒体数据推送至目标对象对应的终端。通过根据媒体预估资产信息来推荐多媒体数据,有利于给多媒体平台带来最大化商业价值,提高多媒体平台的利用价值以及资源利用率。
可选的,该转化操作信息包括用于反映该目标对象针对该候选多媒体数据 Pi执行第一转化操作对应的第一转化操作信息,以及用于反映该目标对象针对该候选多媒体数据Pi执行第二转化操作对应的第二转化操作信息,该第一转化操作给该候选多媒体数据Pi所属的对象来带的资产量,大于该第二转化操作给该候选多媒体数据Pi所属的对象来带的资产量。即第一转化操作信息用于反映目标对象对该候选多媒体数据Pi执行第一转化操作对应的第一转化概率(即深层转化概率),第二转化操作信息用于反映目标对象对该候选多媒体数据Pi执行第二转化操作对应的第二转化概率(即浅层转化概率)。上述根据该目标操作信息以及该媒体资产因子,确定该候选多媒体数据Pi的媒体预估资产信息,包括:根据该媒体资产因子、该第一转化操作信息以及该非转化操作信息,确定第一媒体预估资产信息,根据该媒体资产因子、该第二转化操作信息以及该非转化操作信息,确定第二媒体预估资产信息;将该第一媒体预估资产信息和该第二媒体预估资产信息,确定为该候选多媒体数据Pi的媒体预估资产信息。
计算机设备可以将该媒体资产因子、该第一转化操作信息对应第一转化概率以及该非转化操作信息对应的非转化概率之间的乘积,确定第一媒体预估资产信息,将媒体资产因子、该第二转化操作信息对应的第二转化概率以及该非转化操作信息对应的非转化概率之间的乘积,确定第二媒体预估资产信息;将该第一媒体预估资产信息和该第二媒体预估资产信息,确定为该候选多媒体数据Pi的媒体预估资产信息。通过分析目标对象针对该候选多媒体数据Pi执行操作对应的浅层转化概率、媒体资产因子、深度转化概率以及非转化概率,来获取该候选多媒体数据Pi的媒体预估资产信息,实现对目标对象的多维度的信息进行分析,提高获取该候选多媒体数据Pi的媒体预估资产信息的准确度,进一步,提高多媒体数据的推荐准确度。
例如,如图12所示,第一转化操作信息包括深层转化概率,如下单概率,第二转化操作信息包括浅层转化概率,如下载概率,非转化操作信息包括点击概率,计算机设备可以将深层转化概率、点击概率以及媒体资产因子之间的乘积,确定为深层商业价值(即第一媒体预估资产信息),将浅层转化概率、点击概率以及媒体资产因子之间的乘积,确定为浅层商业价值(即第二媒体预估资产信息)。
可选的,上述根据该候选多媒体数据Pi的媒体预估资产信息,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,包括:获取多媒体数据网络;该多媒体数据网络包括用于反映该多媒体数据集合中候选多媒体数据Pi的节点,以及具有关联关系的候选多媒体数据对应的节点相连接所构成的边;根据该多媒体数据网络的节点路径以及该媒体预估资产信息,对该多媒体数据网络中的节点进行遍历,得到与该目标对象属性信息之间具有近邻关系的候选多媒体数据;将该多媒体数据集合中与该目标对象属性信息之间具有近邻关系的候选多媒体数据,确定为用于推送至该目标对象的目标多媒体数据。
计算机可以获取多媒体数据网络,该多媒体数据网络包括用于反映该多媒体数据集合中候选多媒体数据Pi的节点,以及具有关联关系的候选多媒体数据对应的节点相连接所构成的边;如该媒体数据网络中的节点包括候选多媒体数据的候选媒体属性信息,该多媒体数据网络的边由候选多媒体属性信息之间的匹配度大于匹配度阈值的节点相连接构成的。该媒体数据网络可以包括一个或多个子网络,当媒体数据网络中包括一个子网络时,该子网络中可以包括M个节点,一个节点与一个候选多媒体数据相对应,计算机设备可以根据该多媒体数据网络的节点路径以及该媒体预估资产信息,对该多媒体数据网络中的节点进行遍历,得到与该目标对象属性信息之间具有近邻关系的候选多媒体数据,例如,按照媒体预估资产信息指示的预估资产量从大到小的顺序,对候选多媒体数据进行排序,将子网络中排序位于前k个候选多媒体数据,确定为与目标对象属性信息之间具有近邻关系的候选多媒体数据。或者,根据该多媒体数据网络的节点路径,当遍历到k个媒体预估资产信息指示的预估资产量大于资产量阈值的候选多媒体数据,结束遍历,将k个媒体预估资产信息指示的预估资产量大于资产量阈值的候选多媒体数据,确定为与目标对象属性信息之间具有近邻关系的候选多媒体数据。然后,将该多媒体数据集合中与该目标对象属性信息之间具有近邻关系的候选多媒体数据,确定为用于推送至该目标对象的目标多媒体数据。通过多媒体数据网络,可避免对全量的候选多媒体数据进行分析,可节省资源,提高获取目标媒体数据的效率。
例如,如图13a所示,该多媒体数据网络包括三层分别为layer0、layer1、 layer2,layer0包括多媒体数据集合中的所有候选多媒体数据的候选媒体属性信息,layer2层仅包括多媒体数据集合中的一个候选多媒体数据的候选媒体属性信息,可以将第一媒体预估资产信息(深层商业价值)为搜索指标,从该多媒体数据网络检索出与目标对象属性信息之间具有近邻关系的候选媒体属性信息对应的候选多媒体数据,将此类候选多媒体数据作为深层优化目标广告库。可以将第二媒体预估资产信息(浅层商业价值)为搜索指标,从该多媒体数据网络检索出与目标对象属性信息之间具有近邻关系的候选媒体属性信息对应的候选多媒体数据,将此类候选多媒体数据作为浅层优化目标广告库。
例如,如图13b所示,在得到深层优化目标数据库和浅层优化目标数据库后,计算机设备可以通过粗排、多路归并、精排处理深层优化目标数据库和浅层优化目标数据库中的候选多媒体数据,得到目标多媒体数据,将目标多媒体数据推送给目标对象对应的终端。其中,在粗排处理中,首先会对每个广告进行点击率,转化率的预估,求出每个广告的eCPM得分:eCPM=bid(广告出价) *liteCTR(预估点击率)*liteCVR(预估转化率),然后,根据广告eCPM的排序,选出Top N广告。在精排处理中,多媒体平台首先获取所有广告的pCTR(精准预估点击率)和pCVR(精准预估转化率),之后对Top N广告计算精排竞价得分:eCPM2=bid(广告出价)*pCTR(精准预估点击率)*pCVR(精准预估转化率),根据eCPM2的高低选出Top1-2的广告呈现给用户。
可选的,该媒体数据网络可以包括至少两个个子网络时,每个子网络中的节点数量可以相同,也可以不相同,子网络中的节点对应的候选多媒体数据可以部分不相同,也可以完全不相同。这时,计算机设备可以从至少两个子网络中随机选择一个目标子网络,当在目标子网络中遍历得到k个媒体预估资产信息指示的预估资产量大于资产量阈值的候选多媒体数据,结束遍历,将k个媒体预估资产信息指示的预估资产量大于资产量阈值的候选多媒体数据,确定为与目标对象属性信息之间具有近邻关系的候选多媒体数据。或者,将目标子网络中媒体预估资产信息指示的预估资产量排列在前k个候选多媒体数据,确定为与目标对象属性信息之间具有近邻关系的候选多媒体数据。这样可避免对全量的候选多媒体数据进行分析,可节省资源,提高获取目标媒体数据的效率。
可选的,该媒体数据网络可以包括至少两个个子网络时,该多媒体数据网络包括子网络Nj和子网络Nj+1,该子网络Nj中的节点数量小于该子网络Nj+1中的节点数量,该子网络Nj中的节点对应的候选多媒体数据所构成的集合为该子网络Nj+1中的节点对应的候选多媒体数据所构成的集合的子集,子网络NK中的节点数量与多媒体数据集合中的候选多媒体数据对应数量相同,j为小于K 的正整数,K为该多媒体数据网络中的子网络的数量。
上述根据该多媒体数据网络的节点路径以及该媒体预估资产信息,对该多媒体数据网络中的节点进行遍历,得到与该目标对象属性信息之间具有近邻关系的候选多媒体数据,包括:按照该多媒体数据网络的节点路径,从该子网络 Nj中确定出该媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,作为指定候选多媒体数据;将该子网络Nj+1中用于反映该指定候选多媒体数据的节点,确定为初始遍历节点;若该子网络Nj+1中的节点数量小于该多媒体数据集合中的候选多媒体数据对应的数量,则以该初始遍历节点为遍历起点,从该子网络Nj+1中确定出该媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,将从该子网络Nj+1确定出的候选多媒体数据,更新为指定候选多媒体数据;若该子网络Nj+1中的节点数量等于该多媒体数据集合中的候选多媒体数据对应的数量,则在与该初始遍历节点相连接的节点中,遍历出该媒体预估资产信息所指示的资产量大于资产量阈值的节点,作为与该对象属性信息之间具有近邻关系的候选多媒体数据。
计算机设备可以从子网络N1到NK的顺序,依次按照该多媒体数据网络的节点路径,从该子网络Nj中确定出该媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,作为指定候选多媒体数据;将该子网络 Nj+1中用于反映该指定候选多媒体数据的节点,确定为初始遍历节点。若该子网络Nj+1中的节点数量小于该多媒体数据集合中的候选多媒体数据对应的数量,表明存在子网络未被遍历,因此,以该初始遍历节点为遍历起点,从该子网络 Nj+1中确定出该媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,将从该子网络Nj+1确定出的候选多媒体数据,更新为指定候选多媒体数据。若该子网络Nj+1中的节点数量等于该多媒体数据集合中的候选多媒体数据对应的数量,表明所有子网络均被遍历完成,则在与该初始遍历节点相连接的节点中,遍历出该媒体预估资产信息所指示的资产量大于资产量阈值的节点,作为与该对象属性信息之间具有近邻关系的候选多媒体数据。这样可避免对全量的候选多媒体数据进行分析,可节省资源,提高获取目标媒体数据的效率。
本申请中,目标操作信息具体用于反映该目标对象对该候选多媒体数据执行操作(如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值。通过根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度;不仅可避免向用户推荐用户不感兴趣的多媒体数据,导致无效多媒体数据推荐,浪费多媒体平台的资源的问题,还可以避免向用户推荐商业价值比较低的多媒体数据,导致多媒体平台的资源利用率比较低的问题,可提高多媒体平台的资源利用率。
请参见图14,是本申请实施例提供的一种多媒体数据处理装置的结构示意图。上述多媒体数据处理装置可以是运行于计算机设备中的一个计算机程序 (包括程序代码),例如该多媒体数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图14所示,该多媒体数据处理装置可以包括:获取模块141、预测模块142、确定模块143以及选择模块144。
获取模块,用于获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
预测模块,用于根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
确定模块,用于根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
选择模块,用于根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
可选的,预测模块根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息,包括:
从所述目标对象属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键对象属性信息;
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键媒体属性信息;
采用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据 Pi执行操对应的目标操作信息。
可选的,所述关键对象属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键对象属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息;所述关键媒体属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键媒体属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息;
可选的,预测模块采用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息,包括:
采用所述目标操作识别模型的操作识别网络,基于所述第一关键对象属性信息和所述第一关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行转化操作对应的转化操作信息;
根据所述第二关键对象属性信息和所述第二关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行非转化操作对应的非转化操作信息;
将所述转化操作信息和所述非转化操作信息,确定为用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息。
可选的,确定模块根据所述候选媒体属性信息,确定所述候选多媒体数据 Pi的媒体资产因子,包括:
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息;
采用目标资产识别模型的资产识别网络,对所述关键资产属性信息进行交叉关联关系识别,得到交叉关联关系信息;所述目标资产识别模型与所述目标操作识别模型相互独立;
对所述关键资产属性信息进行深度关联关系识别,得到深度关联关系信息;
根据所述交叉关联关系信息和所述深度关联关系信息,确定所述媒体资产因子。
可选的,确定模块从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息,包括:
采用所述目标资产识别模型的资产专家网络,从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息;
采用所述目标资产识别模型的资产门控网络,确定所述候选资产属性信息的置信度;
采用所述置信度对所述候选资产属性信息进行加权,得到与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息。
可选的,选择模块根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,包括:
根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据 Pi的媒体预估资产信息;所述媒体预估资产信息用于反映当所述候选多媒体数据Pi被所述目标对象执行操作时,所述候选多媒体数据所属的对象需支出的预估资产量;
根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据。
可选的,所述转化操作信息包括用于反映所述目标对象针对所述候选多媒体数据Pi执行第一转化操作对应的第一转化操作信息,以及用于反映所述目标对象针对所述候选多媒体数据Pi执行第二转化操作对应的第二转化操作信息,所述第一转化操作给所述候选多媒体数据Pi所属的对象来带的资产量,大于所述第二转化操作给所述候选多媒体数据Pi所属的对象来带的资产量;
可选的,选择模块根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据Pi的媒体预估资产信息,包括:
根据所述媒体资产因子、所述第一转化操作信息以及所述非转化操作信息,确定第一媒体预估资产信息;
根据所述媒体资产因子、所述第二转化操作信息以及所述非转化操作信息,确定第二媒体预估资产信息;
将所述第一媒体预估资产信息和所述第二媒体预估资产信息,确定为所述候选多媒体数据Pi的媒体预估资产信息。
可选的,选择模块根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,包括:
获取多媒体数据网络;所述多媒体数据网络包括用于反映所述多媒体数据集合中候选多媒体数据Pi的节点,以及具有关联关系的候选多媒体数据对应的节点相连接所构成的边;
根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据;
将所述多媒体数据集合中与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,确定为用于推送至所述目标对象的目标多媒体数据。
可选的,所述多媒体数据网络包括子网络Nj和子网络Nj+1,所述子网络Nj中的节点数量小于所述子网络Nj+1中的节点数量,所述子网络Nj中的节点对应的候选多媒体数据所构成的集合为所述子网络Nj+1中的节点对应的候选多媒体数据所构成的集合的子集,j为小于K的正整数,K为所述多媒体数据网络中的子网络的数量;
选择模块根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,包括:
按照所述多媒体数据网络的节点路径,从所述子网络Nj中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,作为指定候选多媒体数据;
将所述子网络Nj+1中用于反映所述指定候选多媒体数据的节点,确定为初始遍历节点;
若所述子网络Nj+1中的节点数量小于所述多媒体数据集合中的候选多媒体数据对应的数量,则以所述初始遍历节点为遍历起点,从所述子网络Nj+1中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,将从所述子网络Nj+1确定出的候选多媒体数据,更新为指定候选多媒体数据;
若所述子网络Nj+1中的节点数量等于所述多媒体数据集合中的候选多媒体数据对应的数量,则在与所述初始遍历节点相连接的节点中,遍历出所述媒体预估资产信息所指示的资产量大于资产量阈值的节点,作为与所述对象属性信息之间具有近邻关系的候选多媒体数据。
可选的,获取模块,用于获取样本对象的样本对象属性信息、样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息;采用候选操作识别模型,对所述样本对象属性信息和所述样本媒体属性信息进行预测,得到用于反映所述样本对象针对所述样本多媒体数据执行操作对应的预测操作信息;根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,将调整后的候选操作识别模型确定为所述目标操作识别模型。
可选的,所述标注操作信息包括第一标注转化操作信息、第二标注转化操作信息以及标注非转化操作信息;所述预测操作信息包括第一预测转化操作信息、第二标预测化操作信息以及预测非转化操作信息;获取模块根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,包括:
根据所述第一标注转化操作信息和所述第一预测转化操作信息,确定所述候选操作识别模型的第一转化操作预测误差;
根据所述第二标注转化操作信息和所述第二预测转化操作信息,确定所述候选操作识别模型的第二转化操作预测误差;
根据所述标注非转化操作信息和所述预测非转化操作信息,确定所述候选操作识别模型的非转化操作预测误差;
根据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
可选的,获取模块据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型,包括:
对所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差进行加权求和,得到所述候选操作识别模型的操作预测误差;
若所述操作预测误差未处于收敛状态,则根据所述操作预测误差对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
可选的,所述获取模块获取样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息,包括:
从样本多媒体数据集合中筛选出所述样本对象在历史时间段内所执行操作的第一样本多媒体数据;
根据所述样本对象关于所述第一样本多媒体数据的日志数据确定所述第一样本多媒体数据对应的标注操作信息;
从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据;
将用于指示所述样本对象未对所述第二样本多媒体数据执行操作的标注操作信息,确定为所述第二样本多媒体数据的标注操作信息;
将所述第一样本多媒体数据和所述第二样本多媒体数据,确定为所述样本对象对应的样本多媒体数据。
可选的,所述获取模块从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据,包括:
从所述样本多媒体数据集合中随机选择在所述历史时间段内未被推荐给所述样本对象的样本多媒体数据,作为第一候选样本多媒体数据;
从所述样本多媒体数据集合中选择在所述历史时间段内被推荐给所述样本对象,且未被所述样本对象执行操作的样本多媒体数据,作为第二候选样本多媒体数据;
将所述第一候选样本多媒体数据和所述第二候选样本多媒体数据,确定为所述样本对象在历史时间段内未执行操作的第二样本多媒体数据。
可选的,获取模块,用于获取所述样本多媒体数据的媒体预期资产信息;所述媒体预期资产信息用于反映当所述候选多媒体数据Pi被转化执行操作时,所述候选多媒体数据所属的对象需支出的预期资产量;根据所述预测操作信息和所述媒体预期资产信息,确定所述样本多媒体数据的媒体标注资产信息;采用候选资产识别模型,对所述预测操作信息和所述样本媒体属性信息进行预测,得到所述样本多媒体数据的媒体预测资产信息;根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,将调整后的候选资产识别模型确定为目标资产识别模型。
可选的,获取模块根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,包括:
根据所述媒体标注资产信息和所述媒体预测资产信息,确定所述候选资产识别模型的资产预测误差;
若所述资产预测误差未处于收敛状态,则根据所述资产预测误差对所述候选资产识别模型进行调整,得到调整后的候选资产识别模型。
本申请中,目标操作信息具体用于反映该目标对象对该候选多媒体数据执行操作(如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值。通过根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度;不仅可避免向用户推荐用户不感兴趣的多媒体数据,导致无效多媒体数据推荐,浪费多媒体平台的资源的问题,还可以避免向用户推荐商业价值比较低的多媒体数据,导致多媒体平台的资源利用率比较低的问题,可提高多媒体平台的资源利用率。
请参见图15,是本申请实施例提供的一种计算机设备的结构示意图。如图 15所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:媒体中容接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,媒体中容接口1003可以包括显示屏(Display)、键盘(Keyboard),可选媒体中容接口1003还可以包括标准的有线接口、无线接口。网络接口 1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器 1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个在远离前述处理器1001的存储装置。如图15所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、媒体中容接口模块以及设备控制应用程序。
在图15所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而媒体中容接口1003主要用于为媒体中容提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
从所述目标对象属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键对象属性信息;
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键媒体属性信息;
采用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据 Pi执行操对应的目标操作信息。
可选的,所述关键对象属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键对象属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息;所述关键媒体属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键媒体属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息;处理器1001 可以用于调用存储器1005中存储的设备控制应用程序,以实现用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息,包括:
采用所述目标操作识别模型的操作识别网络,基于所述第一关键对象属性信息和所述第一关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行转化操作对应的转化操作信息;
根据所述第二关键对象属性信息和所述第二关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行非转化操作对应的非转化操作信息;
将所述转化操作信息和所述非转化操作信息,确定为用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子,包括:
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息;
采用目标资产识别模型的资产识别网络,对所述关键资产属性信息进行交叉关联关系识别,得到交叉关联关系信息;所述目标资产识别模型与所述目标操作识别模型相互独立;
对所述关键资产属性信息进行深度关联关系识别,得到深度关联关系信息;
根据所述交叉关联关系信息和所述深度关联关系信息,确定所述媒体资产因子。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息,包括:
采用所述目标资产识别模型的资产专家网络,从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息;
采用所述目标资产识别模型的资产门控网络,确定所述候选资产属性信息的置信度;
采用所述置信度对所述候选资产属性信息进行加权,得到与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,包括:
根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据 Pi的媒体预估资产信息;所述媒体预估资产信息用于反映当所述候选多媒体数据Pi被所述目标对象执行操作时,所述候选多媒体数据所属的对象需支出的预估资产量;
根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据。
可选的,所述转化操作信息包括用于反映所述目标对象针对所述候选多媒体数据Pi执行第一转化操作对应的第一转化操作信息,以及用于反映所述目标对象针对所述候选多媒体数据Pi执行第二转化操作对应的第二转化操作信息,所述第一转化操作给所述候选多媒体数据Pi所属的对象来带的资产量,大于所述第二转化操作给所述候选多媒体数据Pi所属的对象来带的资产量;
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据Pi的媒体预估资产信息,包括:
根据所述媒体资产因子、所述第一转化操作信息以及所述非转化操作信息,确定第一媒体预估资产信息;
根据所述媒体资产因子、所述第二转化操作信息以及所述非转化操作信息,确定第二媒体预估资产信息;
将所述第一媒体预估资产信息和所述第二媒体预估资产信息,确定为所述候选多媒体数据Pi的媒体预估资产信息。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,包括:
获取多媒体数据网络;所述多媒体数据网络包括用于反映所述多媒体数据集合中候选多媒体数据Pi的节点,以及具有关联关系的候选多媒体数据对应的节点相连接所构成的边;
根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据;
将所述多媒体数据集合中与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,确定为用于推送至所述目标对象的目标多媒体数据。
可选的,所述多媒体数据网络包括子网络Nj和子网络Nj+1,所述子网络Nj中的节点数量小于所述子网络Nj+1中的节点数量,所述子网络Nj中的节点对应的候选多媒体数据所构成的集合为所述子网络Nj+1中的节点对应的候选多媒体数据所构成的集合的子集,j为小于K的正整数,K为所述多媒体数据网络中的子网络的数量;可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,包括:
按照所述多媒体数据网络的节点路径,从所述子网络Nj中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,作为指定候选多媒体数据;
将所述子网络Nj+1中用于反映所述指定候选多媒体数据的节点,确定为初始遍历节点;
若所述子网络Nj+1中的节点数量小于所述多媒体数据集合中的候选多媒体数据对应的数量,则以所述初始遍历节点为遍历起点,从所述子网络Nj+1中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,将从所述子网络Nj+1确定出的候选多媒体数据,更新为指定候选多媒体数据;
若所述子网络Nj+1中的节点数量等于所述多媒体数据集合中的候选多媒体数据对应的数量,则在与所述初始遍历节点相连接的节点中,遍历出所述媒体预估资产信息所指示的资产量大于资产量阈值的节点,作为与所述对象属性信息之间具有近邻关系的候选多媒体数据。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现获取样本对象的样本对象属性信息、样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息;
采用候选操作识别模型,对所述样本对象属性信息和所述样本媒体属性信息进行预测,得到用于反映所述样本对象针对所述样本多媒体数据执行操作对应的预测操作信息;
根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,将调整后的候选操作识别模型确定为所述目标操作识别模型。
可选的,所述标注操作信息包括第一标注转化操作信息、第二标注转化操作信息以及标注非转化操作信息;所述预测操作信息包括第一预测转化操作信息、第二标预测化操作信息以及预测非转化操作信息;可选的,处理器1001 可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,包括:
根据所述第一标注转化操作信息和所述第一预测转化操作信息,确定所述候选操作识别模型的第一转化操作预测误差;
根据所述第二标注转化操作信息和所述第二预测转化操作信息,确定所述候选操作识别模型的第二转化操作预测误差;
根据所述标注非转化操作信息和所述预测非转化操作信息,确定所述候选操作识别模型的非转化操作预测误差;
根据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型,包括:
对所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差进行加权求和,得到所述候选操作识别模型的操作预测误差;
若所述操作预测误差未处于收敛状态,则根据所述操作预测误差对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现获取样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息,包括:
从样本多媒体数据集合中筛选出所述样本对象在历史时间段内所执行操作的第一样本多媒体数据;
根据所述样本对象关于所述第一样本多媒体数据的日志数据确定所述第一样本多媒体数据对应的标注操作信息;
从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据;
将用于指示所述样本对象未对所述第二样本多媒体数据执行操作的标注操作信息,确定为所述第二样本多媒体数据的标注操作信息;
将所述第一样本多媒体数据和所述第二样本多媒体数据,确定为所述样本对象对应的样本多媒体数据。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据,包括:
从所述样本多媒体数据集合中随机选择在所述历史时间段内未被推荐给所述样本对象的样本多媒体数据,作为第一候选样本多媒体数据;
从所述样本多媒体数据集合中选择在所述历史时间段内被推荐给所述样本对象,且未被所述样本对象执行操作的样本多媒体数据,作为第二候选样本多媒体数据;
将所述第一候选样本多媒体数据和所述第二候选样本多媒体数据,确定为所述样本对象在历史时间段内未执行操作的第二样本多媒体数据。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现获取所述样本多媒体数据的媒体预期资产信息;所述媒体预期资产信息用于反映当所述候选多媒体数据Pi被转化执行操作时,所述候选多媒体数据所属的对象需支出的预期资产量;
根据所述预测操作信息和所述媒体预期资产信息,确定所述样本多媒体数据的媒体标注资产信息;
采用候选资产识别模型,对所述预测操作信息和所述样本媒体属性信息进行预测,得到所述样本多媒体数据的媒体预测资产信息;
根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,将调整后的候选资产识别模型确定为目标资产识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,包括:
根据所述媒体标注资产信息和所述媒体预测资产信息,确定所述候选资产识别模型的资产预测误差;
若所述资产预测误差未处于收敛状态,则根据所述资产预测误差对所述候选资产识别模型进行调整,得到调整后的候选资产识别模型。
本申请中,目标操作信息具体用于反映该目标对象对该候选多媒体数据执行操作(如浅层转化操作、深度转化操作、非转化操作)对应的概率,该目标操作信息在一定程度上能够反映该目标对象对该候选多媒体数据的兴趣度,例如,该目标操作信息指示目标对象针对该候选多媒体数据执行深度转化操作的概率比较高,表明该目标对象对该候选多媒体数据的兴趣度比较高。媒体资产因子用于反映当该候选多媒体数据Pi被执行转化操作时,该候选多媒体数据所属的对象需支出的实际资产量,也就是说,该媒体资产因子在一定程度上能够反映该候选多媒体数据给多媒体平台带来的商业价值。通过根据该目标操作信息和该媒体资产因子,从该多媒体数据集合中选择用于推送至该目标对象的候选多媒体数据,作为目标多媒体数据,向该目标对象对应的终端推送该目标多媒体数据。也就是说,通过综合考虑用户对候选多媒体数据的兴趣特征和该候选多媒体数据的商业价值,来给用户推荐多媒体数据,可实现精准推荐,提高多媒体数据推荐的准确度;不仅可避免向用户推荐用户不感兴趣的多媒体数据,导致无效多媒体数据推荐,浪费多媒体平台的资源的问题,还可以避免向用户推荐商业价值比较低的多媒体数据,导致多媒体平台的资源利用率比较低的问题,可提高多媒体平台的资源利用率。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图4以及前文图5所对应实施例中对上述多媒体数据处理方法的描述,也可执行前文图 10所对应实施例中对上述多媒体数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的多媒体数据处理装置所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图4和图5对应实施例中对上述多媒体数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一个计算机设备上执行,或者被部署在一个地点的至少两个计算机设备上执行,又或者,在分布在至少两个地点且通过通信网络互连的至少两个计算机设备上执行,分布在至少两个地点且通过通信网络互连的至少两个计算机设备可以组成区块链网络。
上述计算机可读存储介质可以是前述任一实施例提供的多媒体数据处理装置或者上述计算机设备的中部存储单元,例如计算机设备的硬盘或中存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字 (secure digital,SD)卡,闪存卡(flashcard)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的中部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同媒体中容,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现前文图4和图5对应实施例中对上述多媒体数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品的实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程多媒体数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程多媒体数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程多媒体数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程多媒体数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (20)

1.一种多媒体数据处理方法,其特征在于,包括:
获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
2.如权利要求1所述的方法,其特征在于,所述根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息,包括:
从所述目标对象属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键对象属性信息;
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的操作属性关联的关键媒体属性信息;
采用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息。
3.如权利要求2所述的方法,其特征在于,所述关键对象属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键对象属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键对象属性信息;所述关键媒体属性信息包括与所述候选多媒体数据Pi的转化操作属性关联的第一关键媒体属性信息,以及与所述候选多媒体数据Pi的非转化操作属性关联的第二关键媒体属性信息;
所述采用目标操作识别模型的操作识别网络,基于所述关键对象属性信息和所述关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息,包括:
采用所述目标操作识别模型的操作识别网络,基于所述第一关键对象属性信息和所述第一关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行转化操作对应的转化操作信息;
根据所述第二关键对象属性信息和所述第二关键媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行非转化操作对应的非转化操作信息;
将所述转化操作信息和所述非转化操作信息,确定为用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子,包括:
从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息;
采用目标资产识别模型的资产识别网络,对所述关键资产属性信息进行交叉关联关系识别,得到交叉关联关系信息;所述目标资产识别模型与所述目标操作识别模型相互独立;
对所述关键资产属性信息进行深度关联关系识别,得到深度关联关系信息;
根据所述交叉关联关系信息和所述深度关联关系信息,确定所述媒体资产因子。
5.如权利要求4所述的方法,其特征在于,所述从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息,包括:
采用所述目标资产识别模型的资产专家网络,从所述候选媒体属性信息中,提取出与所述候选多媒体数据Pi的资产属性关联的属性信息,作为候选资产属性信息;
采用所述目标资产识别模型的资产门控网络,确定所述候选资产属性信息的置信度;
采用所述置信度对所述候选资产属性信息进行加权,得到与所述候选多媒体数据Pi的资产属性关联的关键资产属性信息。
6.如权利要求3所述的方法,其特征在于,所述根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,包括:
根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据Pi的媒体预估资产信息;所述媒体预估资产信息用于反映当所述候选多媒体数据Pi被所述目标对象执行操作时,所述候选多媒体数据所属的对象需支出的预估资产量;
根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据。
7.如权利要求6所述的方法,其特征在于,所述转化操作信息包括用于反映所述目标对象针对所述候选多媒体数据Pi执行第一转化操作对应的第一转化操作信息,以及用于反映所述目标对象针对所述候选多媒体数据Pi执行第二转化操作对应的第二转化操作信息,所述第一转化操作给所述候选多媒体数据Pi所属的对象来带的资产量,大于所述第二转化操作给所述候选多媒体数据Pi所属的对象来带的资产量;
所述根据所述目标操作信息以及所述媒体资产因子,确定所述候选多媒体数据Pi的媒体预估资产信息,包括:
根据所述媒体资产因子、所述第一转化操作信息以及所述非转化操作信息,确定第一媒体预估资产信息;
根据所述媒体资产因子、所述第二转化操作信息以及所述非转化操作信息,确定第二媒体预估资产信息;
将所述第一媒体预估资产信息和所述第二媒体预估资产信息,确定为所述候选多媒体数据Pi的媒体预估资产信息。
8.如权利要求6所述的方法,其特征在于,所述根据所述候选多媒体数据Pi的媒体预估资产信息,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,包括:
获取多媒体数据网络;所述多媒体数据网络包括用于反映所述多媒体数据集合中候选多媒体数据Pi的节点,以及具有关联关系的候选多媒体数据对应的节点相连接所构成的边;
根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据;
将所述多媒体数据集合中与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,确定为用于推送至所述目标对象的目标多媒体数据。
9.如权利要求8所述的方法,其特征在于,所述多媒体数据网络包括子网络Nj和子网络Nj+1,所述子网络Nj中的节点数量小于所述子网络Nj+1中的节点数量,所述子网络Nj中的节点对应的候选多媒体数据所构成的集合为所述子网络Nj+1中的节点对应的候选多媒体数据所构成的集合的子集,j为小于K的正整数,K为所述多媒体数据网络中的子网络的数量;
所述根据所述多媒体数据网络的节点路径以及所述媒体预估资产信息,对所述多媒体数据网络中的节点进行遍历,得到与所述目标对象属性信息之间具有近邻关系的候选多媒体数据,包括:
按照所述多媒体数据网络的节点路径,从所述子网络Nj中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,作为指定候选多媒体数据;
将所述子网络Nj+1中用于反映所述指定候选多媒体数据的节点,确定为初始遍历节点;
若所述子网络Nj+1中的节点数量小于所述多媒体数据集合中的候选多媒体数据对应的数量,则以所述初始遍历节点为遍历起点,从所述子网络Nj+1中确定出所述媒体预估资产信息所指示的预估资产量为最大预估资产量的候选多媒体数据,将从所述子网络Nj+1确定出的候选多媒体数据,更新为指定候选多媒体数据;
若所述子网络Nj+1中的节点数量等于所述多媒体数据集合中的候选多媒体数据对应的数量,则在与所述初始遍历节点相连接的节点中,遍历出所述媒体预估资产信息所指示的资产量大于资产量阈值的节点,作为与所述对象属性信息之间具有近邻关系的候选多媒体数据。
10.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取样本对象的样本对象属性信息、样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息;
采用候选操作识别模型,对所述样本对象属性信息和所述样本媒体属性信息进行预测,得到用于反映所述样本对象针对所述样本多媒体数据执行操作对应的预测操作信息;
根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,将调整后的候选操作识别模型确定为所述目标操作识别模型。
11.如权利要求10所述的方法,其特征在于,所述标注操作信息包括第一标注转化操作信息、第二标注转化操作信息以及标注非转化操作信息;所述预测操作信息包括第一预测转化操作信息、第二标预测化操作信息以及预测非转化操作信息;
所述根据所述标注操作信息和所述预测操作信息,对所述候选操作识别模型进行调整,包括:
根据所述第一标注转化操作信息和所述第一预测转化操作信息,确定所述候选操作识别模型的第一转化操作预测误差;
根据所述第二标注转化操作信息和所述第二预测转化操作信息,确定所述候选操作识别模型的第二转化操作预测误差;
根据所述标注非转化操作信息和所述预测非转化操作信息,确定所述候选操作识别模型的非转化操作预测误差;
根据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
12.如权利要求11所述的方法,其特征在于,所述根据所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差,对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型,包括:
对所述第一转化操作预测误差、所述第二转化操作预测误差以及所述非转化操作预测误差进行加权求和,得到所述候选操作识别模型的操作预测误差;
若所述操作预测误差未处于收敛状态,则根据所述操作预测误差对所述候选操作识别模型进行调整,得到调整后的候选操作识别模型。
13.如权利要求10所述的方法,其特征在于,所述获取样本多媒体数据的样本媒体属性信息以及所述样本对象关于所述样本多媒体数据的标注操作信息,包括:
从样本多媒体数据集合中筛选出所述样本对象在历史时间段内所执行操作的第一样本多媒体数据;
根据所述样本对象关于所述第一样本多媒体数据的日志数据确定所述第一样本多媒体数据对应的标注操作信息;
从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据;
将用于指示所述样本对象未对所述第二样本多媒体数据执行操作的标注操作信息,确定为所述第二样本多媒体数据的标注操作信息;
将所述第一样本多媒体数据和所述第二样本多媒体数据,确定为所述样本对象对应的样本多媒体数据。
14.如权利要求13所述的方法,其特征在于,所述从所述样本多媒体数据集合中筛选出所述样本对象在历史时间段内未执行操作的第二样本多媒体数据,包括:
从所述样本多媒体数据集合中随机选择在所述历史时间段内未被推荐给所述样本对象的样本多媒体数据,作为第一候选样本多媒体数据;
从所述样本多媒体数据集合中选择在所述历史时间段内被推荐给所述样本对象,且未被所述样本对象执行操作的样本多媒体数据,作为第二候选样本多媒体数据;
将所述第一候选样本多媒体数据和所述第二候选样本多媒体数据,确定为所述样本对象在历史时间段内未执行操作的第二样本多媒体数据。
15.如权利要求10所述的方法,其特征在于,所述方法还包括:
获取所述样本多媒体数据的媒体预期资产信息;所述媒体预期资产信息用于反映当所述候选多媒体数据Pi被转化执行操作时,所述候选多媒体数据所属的对象需支出的预期资产量;
根据所述预测操作信息和所述媒体预期资产信息,确定所述样本多媒体数据的媒体标注资产信息;
采用候选资产识别模型,对所述预测操作信息和所述样本媒体属性信息进行预测,得到所述样本多媒体数据的媒体预测资产信息;
根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,将调整后的候选资产识别模型确定为目标资产识别模型。
16.如权利要求15所述的方法,其特征在于,所述根据所述媒体标注资产信息和所述媒体预测资产信息,对所述候选资产识别模型进行调整,包括:
根据所述媒体标注资产信息和所述媒体预测资产信息,确定所述候选资产识别模型的资产预测误差;
若所述资产预测误差未处于收敛状态,则根据所述资产预测误差对所述候选资产识别模型进行调整,得到调整后的候选资产识别模型。
17.一种多媒体数据处理装置,其特征在于,包括:
获取模块,用于获取目标对象的目标对象属性信息,以及待推送的多媒体数据集合中的候选多媒体数据Pi的候选媒体属性信息;i为小于或等于M的正整数,M为所述多媒体数据集合中的候选多媒体数据对应的数量;
预测模块,用于根据所述目标对象属性信息和所述候选媒体属性信息,预测出用于反映所述目标对象针对所述候选多媒体数据Pi执行操对应的目标操作信息;
确定模块,用于根据所述候选媒体属性信息,确定所述候选多媒体数据Pi的媒体资产因子;所述媒体资产因子用于反映当所述候选多媒体数据Pi被执行转化操作时,所述候选多媒体数据所属的对象需支出的实际资产量;
选择模块,用于根据所述目标操作信息以及所述媒体资产因子,从所述多媒体数据集合中选择用于推送至所述目标对象的候选多媒体数据,作为目标多媒体数据,向所述目标对象对应的终端推送所述目标多媒体数据。
18.一种计算机设备,其特征在于,包括:处理器以及存储器;
上述处理器与存储器相连;所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-16任一项所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-16任一项所述的方法。
20.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1-16任一项所述方法的步骤。
CN202111462968.2A 2021-12-02 2021-12-02 多媒体数据处理方法、装置、设备及存储介质 Pending CN114331495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111462968.2A CN114331495A (zh) 2021-12-02 2021-12-02 多媒体数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111462968.2A CN114331495A (zh) 2021-12-02 2021-12-02 多媒体数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114331495A true CN114331495A (zh) 2022-04-12

Family

ID=81047769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111462968.2A Pending CN114331495A (zh) 2021-12-02 2021-12-02 多媒体数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114331495A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114528496A (zh) * 2022-04-22 2022-05-24 腾讯科技(深圳)有限公司 多媒体数据处理方法、装置、设备及存储介质
WO2024060856A1 (zh) * 2022-09-20 2024-03-28 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备、存储介质和程序产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114528496A (zh) * 2022-04-22 2022-05-24 腾讯科技(深圳)有限公司 多媒体数据处理方法、装置、设备及存储介质
WO2024060856A1 (zh) * 2022-09-20 2024-03-28 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
CN109902849B (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
CN110033314B (zh) 广告数据处理方法及装置
US10812870B2 (en) Yield optimization of cross-screen advertising placement
CN102737334B (zh) 微细分定义系统
Miralles-Pechuán et al. A novel methodology for optimizing display advertising campaigns using genetic algorithms
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
US8732015B1 (en) Social media pricing engine
US20140046777A1 (en) Methods and systems for using consumer aliases and identifiers
CN108205766A (zh) 信息推送方法、装置及系统
CN114331495A (zh) 多媒体数据处理方法、装置、设备及存储介质
CN108154379B (zh) 媒体信息的发布方法和装置
CN108777701A (zh) 一种确定信息受众的方法及装置
CN111798280A (zh) 多媒体信息推荐方法、装置和设备及存储介质
US20220256219A1 (en) Systems and methods for predicting television viewership patterns for advanced consumer segments
WO2014149608A1 (en) Methods and systems for using consumer aliases and identifiers
KR102163412B1 (ko) 창업정보 리포트 제공방법
CN113283948A (zh) 预测模型的生成方法、装置、设备和可读介质
CN113706211A (zh) 基于神经网络的广告点击率预测方法及系统
CN116739665A (zh) 信息投放方法、装置、电子设备及存储介质
US20160217490A1 (en) Automatic Computation of Keyword Bids For Pay-Per-Click Advertising Campaigns and Methods and Systems Incorporating The Same
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN114595323B (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN114662001A (zh) 资源交互预测模型训练方法和装置和资源推荐方法和装置
CN117114766A (zh) 成本控制因子确定方法、装置、设备及存储介质
CN114596108A (zh) 一种对象推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination