CN117807254A - 推荐多媒体数据的方法、装置、计算设备和存储介质 - Google Patents

推荐多媒体数据的方法、装置、计算设备和存储介质 Download PDF

Info

Publication number
CN117807254A
CN117807254A CN202211198028.1A CN202211198028A CN117807254A CN 117807254 A CN117807254 A CN 117807254A CN 202211198028 A CN202211198028 A CN 202211198028A CN 117807254 A CN117807254 A CN 117807254A
Authority
CN
China
Prior art keywords
array
feature vector
feature
target
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211198028.1A
Other languages
English (en)
Inventor
付煜文
乔阳
陈亮
何秀强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tengan Fund Sales Shenzhen Co ltd
Original Assignee
Tengan Fund Sales Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tengan Fund Sales Shenzhen Co ltd filed Critical Tengan Fund Sales Shenzhen Co ltd
Priority to CN202211198028.1A priority Critical patent/CN117807254A/zh
Publication of CN117807254A publication Critical patent/CN117807254A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种向目标对象推荐多媒体数据的方法,包括:提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;对目标对象的目标对象特征和候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列;至少基于初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列;根据目标特征向量阵列预测目标操作信息,目标操作信息反映目标对象针对候选多媒体数据执行目标操作的概率;以及根据目标操作信息向目标对象推荐候选多媒体数据。这样,对预测目标操作信息贡献度大的那些特征可以得到强化,对预测目标操作信息贡献度小的那些特征可以适当地弱化,从而有利于实现针对目标对象的多媒体数据精准推荐。

Description

推荐多媒体数据的方法、装置、计算设备和存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种向目标对象推荐多媒体数据的方法、装置、计算设备和存储介质。
背景技术
深度学习已经被学术界、产业界尝试应用于各类业务和应用场景,包括计算机视觉、语音识别、自然语言处理、搜索、推荐和广告等。在推荐领域,通常是将提取到的物品的特征提供给深度学习模型,然后预测用户进行相关操作的概率,例如,CTR(Click-Through-Rate点击概率)或CVR(Conversion Rate转化概率)。提取到的物品的特征往往是海量且稀疏的,深度学习模型很难学习大量的长尾和低频特征,但是直接丢弃这些长尾和低频特征会对深度学习模型的预测结果的准确性造成不利影响。因此,如何在学习模型中科学准确地强化有用特征、淡化无用特征是一个重要问题。
发明内容
有鉴于此,本申请提供了一种向目标对象推荐多媒体数据的方法,该方法包括:分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据。所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。
在一些实施例中,所述特征重要性权重阵列至少通过如下步骤获得:对所述初始特征向量阵列中的各初始特征向量进行池化处理,从而获得经池化的特征向量阵列;基于所述经池化的特征向量阵列获得第二权重的阵列;基于所述初始特征向量阵列获得第一权重的阵列;以及确定所述第一权重的阵列和所述第二权重的阵列的和从而获得所述特征重要性权重阵列。
在一些实施例中,所述方法还包括:基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表征所述初始特征向量阵列中不同特征向量之间的相关性;以及基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列,所述至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列包括:基于所述初始特征向量阵列和所述特征重要性权重阵列获得第二特征向量阵列,以及将所述第一特征向量阵列和所述第二特征向量阵列进行聚合以获得所述目标特征向量阵列。
在一些实施例中,基于所述初始特征向量阵列和所述特征重要性权重阵列获得第二特征向量阵列包括:确定所述初始特征向量阵列和所述特征重要性权重阵列的哈达玛积,从而获得所述第二特征向量阵列。
在一些实施例中,基于所述初始特征向量阵列获得特征相关性权重阵列包括:对所述初始特征向量阵列中的各个特征向量进行卷积获得中间特征向量阵列;确定所述中间特征向量阵列与所述中间特征向量阵列的转置的乘积;以及利用激活函数对所述乘积进行处理从而获得所述特征相关性权重阵列。
在一些实施例中,基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列包括:确定所述特征相关性权重阵列和所述初始特征向量阵列的乘积,从而获得所述第一特征向量阵列。
在一些实施例中,所述目标操作包括第一预期操作和第二预期操作,所述目标操作信息包括第一预期操作信息和第二预期操作信息,所述第一预期操作信息和第二预期操作信息分别表征所述目标对象针对所述候选多媒体数据执行所述第一预期操作和所述第二预期操作的概率,所述目标操作信息反映所述目标对象针对所述候选多媒体数据既执行所述第一预期操作操作又执行所述第二预期操作的概率。
在一些实施例中,所述特征重要性权重阵列包括第一任务特征重要性权重阵列和第二任务特征重要性权重阵列,所述第一任务特征重要性权重阵列中的每个第一任务特征重要性权重依赖于所述第一权重、所述第二权重以及第一任务影响因子,所述第二任务特征重要性权重阵列中的每个第二任务特征重要性权重依赖于所述第一权重、所述第二权重以及第二任务影响因子,所述第一任务影响因子表征预测所述第一预期操作信息的第一任务对所述初始特征向量阵列中的每个特征向量的影响,所述第二任务影响因子表征预测所述第二预期操作信息的第二任务对所述初始特征向量阵列中的每个特征向量的影响,所述至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列包括:至少基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第一任务目标特征向量阵列;以及至少基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第二任务目标特征向量阵列,所述根据目标特征向量阵列预测目标操作信息包括:根据所述第一任务目标特征向量阵列预测所述第一预期操作信息;以及根据所述第二任务目标特征向量阵列预测所述第二预期操作信息。
在一些实施例中,所述第一任务影响因子和第二任务影响因子至少通过以下步骤获得:获取第一任务信息和第二任务信息,所述第一任务信息和第二任务信息分别标识预测所述第一预期操作信息的第一任务和预测第二预期操作信息的第二任务;以及分别基于所述第一任务信息和第二任务信息获得所述第一任务影响因子和第二任务影响因子。
在一些实施例中,所述方法还包括:基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表征所述初始特征向量阵列中不同特征向量之间的相关性;以及基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列,所述至少基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第一任务目标特征向量阵列包括:基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第三特征向量阵列,以及对所述第一特征向量阵列和所述第三特征向量阵列进行聚合以获得所述第一任务目标特征向量阵列,所述至少基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第二任务目标特征向量阵列包括:基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第四特征向量阵列,以及对所述第一特征向量阵列和所述第四特征向量阵列进行聚合以获得所述第二任务目标特征向量阵列。
在一些实施例中,所述特征重要性权重阵列是利用经训练的重要性评估网络基于所述初始特征向量阵列而获得,其中所述经训练的重要性评估网络至少通过如下步骤对重要性评估网络进行训练而获得:获取目标对象样本的目标对象样本特征以及候选多媒体数据样本的多媒体数据样本特征;对所述目标对象样本特征和所述多媒体数据样本特征进行向量化从而获得初始样本特征向量阵列;对所述初始样本特征向量阵列中的各初始样本特征向量进行梯度截断,获得梯度截断样本特征向量阵列;以及利用所述梯度截断样本特征向量阵列对所述重要性评估网络进行训练获得所述经训练的重要性评估网络。
本申请的另一实施例提供了一种向目标对象推荐多媒体数据的装置,包括:特征提取模块,其被配置成分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;向量化模块,其被配置成对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;目标特征向量获取模块,其被配置成至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;目标操作信息预测模块,其被配置成根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及目标媒体数据推荐模块,其被配置成根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据,所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。
本申请的另一实施例提供了一种计算设备,包括存储器,其被配置成存储计算机可执行指令;处理器,其被配置成当所述计算机可执行指令被处理器执行时执行如前述方法实施例中的任一实施例所述的方法。
本申请的另一实施例提供了一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行如前述方法实施例中的任一实施例所述的方法。
本申请的另一实施例提供了一种计算机程序产品,包括计算机程序,其中所述计算机程序被处理器执行时实现如前述方法实施例中的任一实施例所述的方法。
本申请实施例提出的向目标对象推荐多媒体数据的方法不仅考虑了各个目标对象特征和各个多媒体数据特征在预测目标操作信息方面的重要性,而且从两个维度区分了同一特征(包括目标对象特特征和多媒体数据特征)在预测目标操作信息方面的不同重要性。因此,与常规的推荐多媒体数据的方法相比,本申请实施例提出的向目标对象推荐多媒体数据的方法可以更加准确地预测候选多媒体数据对应的目标操作信息,从而可以实现针对目标对象的多媒体数据精准推荐。
根据下文描述的实施例,本申请的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本申请的这些和其它优点。
附图说明
现在将更详细并且参考附图来描述本申请的实施例,其中:
图1图示了根据本申请一些实施例的向目标对象推荐多媒体数据的方法的示例实施环境;
图2示出了根据本申请实施例的向目标对象推荐多媒体数据的方法的流程图;
图3图示了用于实施图2中所示的方法中的步骤S120和S130的示例性结构;
图4图示了用于获取特征重要性权重阵列的示例;
图5示出了根据本申请另一实施例的向目标对象推荐多媒体数据的方法中的一些步骤;
图6a图示了根据本申请的一些实施例的基于初始特征向量阵列获得特征相关性权重阵列的示例;
图6b示出了用于实施图5所示的向目标对象推荐多媒体数据的方法的结构;
图7示意性地示出了获得第一任务目标特征向量阵列的示例;
图8示出了获得第一任务影响因子和第二任务影响因子的步骤;
图9a图示了基于第一特征向量阵列和第三特征向量阵列获得第一任务目标特征向量阵列的示例;
图9b图示了应用了图9a所图示的技术构思的向目标对象推荐多媒体数据的方法的示例;
图10图示了常规的深度学习模型Deep Crossing;
图11示意性地示出了图6b所示的实施例融合至图10所示的深度学习模型DeepCrossing的情形。
具体实施方式
下面的描述提供了本申请的各种实施例的特定细节,以便本领域的技术人员能够充分理解和实施本申请的各种实施例。应当理解,本申请的技术方案可以在没有这些细节中的一些细节的情况下被实施。在某些情况下,本申请并没有示出或详细描述一些熟知的结构或功能,以避免这些不必要的描述使对本申请的实施例的描述模糊不清。在本申请中使用的术语应当以其最宽泛的合理方式来理解,即使其是结合本申请的特定实施例被使用的。
在本申请中使用的术语应当以其最宽泛的合理方式来理解,即使其是结合本申请的特定实施例被使用的。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通、自动控制等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本文提到的“目标对象”指的是用户、机器人等具有信息接受能力的对象。例如,目标对象可以是通过终端对多媒体数据进行操作的人员。本文提到的“多媒体数据”指的是用于可以通过终端对其执行操作的数据,多媒体数据的示例包括图像、文字、视频和网页链接中的一种或多种。当多媒体数据通过终端向目标对象展示时,目标对象可以对多媒体数据进行操作。这里提到的“操作”的示例包括但不限于浏览图像、点击网页链接、点击视频文件、下载安装文件、支付用户资源、下单等。
本申请的实施例提供了一种向目标对象推荐多媒体数据的方法。图1图示了根据本申请一些实施例的向目标对象推荐多媒体数据的方法的示例性实施环境。如图1所示,各种类型的终端(终端1、终端2、终端3……终端n)通过网络与服务器10进行通信,终端的示例包括但不限于手机、个人电脑、平板电脑、笔记本电脑、智能语音交互设备、智能家电、车载终端、飞行器等。服务器10例如可以是独立的物理服务器,也可以是由多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络、以及大数据和人工智能平台等基础云计算服务的云服务器。各个终端和服务器可以通过有线或无线通信方式进行直接或间接地连接,服务器10也可以是区块链网络中的节点设备。
对于将在下文实施例中描述的向目标对象推荐多媒体数据的方法,该方法的各个步骤可以全部在服务器10中执行,也可以由终端执行。或者,向目标对象推荐多媒体数据的方法中的一部分步骤由服务器10执行,另一部分步骤由终端执行。即,本文对向目标对象推荐多媒体数据的方法中的哪些步骤由服务器执行、哪些步骤由终端执行不作限制。为了简便起见,下面以向目标对象推荐多媒体数据的方法由服务器执行为例进行详细说明。
图2图示了根据本申请的实施例的向目标对象推荐多媒体数据的方法的流程图。如图2所示,根据本申请的一个实施例,向目标对象推荐多媒体数据的方法包括:S110、分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;S120、对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;S130、至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;S140、根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及S150、根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据。所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。
如前所述,目标对象包括用户,相应地,步骤S110中提到的目标对象特征包括目标对象的基础特征、历史统计特征和挖掘特征等中的一种或多种,基础特征的示例包括年龄、性别、工作年限等。历史统计特征的示例包括对象对多媒体数据进行的操作次数或频率,例如,对网页链接的点击次数、观看视频的次数、将某类多媒体数据设置为不感兴趣的项目的次数等、点击图像数据然后支付用户资源的次数等。挖掘特征的示例包括挖掘出的感兴趣的多媒体数据的类型、关键词等标签特征。候选多媒体数据可以是包括多媒体数据的多媒体数据集合中单个或多个多媒体数据,候选多媒体数据的多媒体数据特征的示例包括多媒体数据ID、多媒体数据的关键词信息等。例如,多媒体数据可以是基金产品的基金产品信息的网页链接,多媒体数据特征可包括基金的代码、基金产品的产品介绍信息等。能够理解到的是,所提取到的目标对象特征和多媒体数据特征可包括类别型特征和数值型特征,也就是说,不同目标对象特征或不同多媒体数据特征之间的差别可以是类别方面的不同,也可以是数值方面的不同。例如,性别可以被视为类别型特征,而工作年限可以被视为数值型特征。
在步骤S120中,对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列。可以用任何适当的文本向量化模型对在步骤S110中获取的目标对象特征和多媒体数据特征进行向量化。文本向量化模型的示例包括但不限于词袋(Bag of Words)模型、Word2Vec模型、FastText模型等。在一个示例中,可以对目标对象特征和候选多媒体数据的多媒体数据特征分别进行独热(one-hot)编码,将各个目标对象特征和各个多媒体数据特征的独热编码提供给Word2Vec模型,从而获得与目标对象特征和多媒体数据特征分别对应的嵌入(Embedding)向量。各目标对象特征和各多媒体数据特征对应的Embedding向量拼接形成初始特征向量阵列。下面通过详细的示例来说明初始特征向量阵列。
假设在步骤S110中从目标对象提取到M个目标对象特征,从候选多媒体数据提取到N个多媒体数据特征,可以分别对这(M+N)个特征分别进行独热(one-hot)编码,从而获得(M+N)个独热编码向量。这(M+N)个独热编码向量分别与由Word2Vec模型所确定的嵌入向量矩阵相乘,从而获得包括(M+N)个初始特征向量的初始特征向量阵列。在另外的示例中,在获得初始特征向量的过程中,可以根据类别型特征和数值型特征而对各目标对象特征和各多媒体数据特征应用不同的嵌入向量矩阵。例如,在步骤S110中,从目标对象提取到的目标对象特征的数目和从候选多媒体数据提取到的多媒体数据特征的数目的总和为F,即一共提取到F个特征,这F个特征包括M个上述的类别型特征和N个上述的数值型特征/>。M个类别型特征所对应的嵌入向量/>可以表示为,/>(1≤/>)表示第i个类别型特征/>的嵌入向量矩阵。N个数值型特征的嵌入向量/>可以表示为,/>(1≤/>)表示第i个数值型特征/>的嵌入向量矩阵。将M个类别型特征的嵌入向量/>和N个数值型特征的嵌入向量/>拼接在一起,形成初始特征向量阵列
在步骤S130中、至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重,第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。也就是说,目标特征向量阵列中的各个目标特征向量不是各初始特征向量的直接复制,而是使得每个初始特征向量经受对应的特征重要性权重的作用或影响而获得目标特征向量阵列。
在步骤S140中,基于所获得的目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率。这里提到的目标操作指的是目标对象被预测针对多媒体数据要执行的操作,因此,目标操作所包含的内容与上文中解释的“操作”的内容基本相同。在获得目标特征向量阵列的基础上,可以利用任何适当的预测模型来预测所述目标对象针对所述候选多媒体数据执行目标操作的概率,即上述的目标操作信息。上述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率,因此,在步骤S150中,可以根据目标操作信息向目标对象推荐所述候选多媒体数据。例如,在一些示例中,如果目标操作信息的值较大,表明目标对象针对所述候选多媒体数据执行目标操作的可能性较高,则向目标对象推荐该候选多媒体数据,例如,向目标对象所使用的终端发送或展示该候选多媒体数据或提供针对该候选多媒体数据的引导信息。如果目标操作信息的值较小,表明目标对象针对所述候选多媒体数据执行目标操作的可能性较低,则不向目标对象推荐该候选多媒体数据。或者,通过上述的步骤S110至S140,可以获得与多个候选多媒体数据对应的多个目标操作信息,从而依据这些多个目标操作信息从多个候选多媒体数据中确定出一部分候选多媒体数据(例如,该部分候选多媒体数据对应的目标操作信息的值相对于余下的候选多媒体数据对应的目标操作信息的值较大),仅将该一部分候选多媒体数据推荐给目标对象。
在本申请的实施例中,并不是直接基于初始特征向量预测目标操作信息,而是让初始特征向量阵列中的每个初始特征向量经受特征重要性权重阵列对应的特征重要性权重的作用或影响而获得目标特征向量阵列,再基于目标特征向量阵列预测目标操作信息。特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重,第一权重表示在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,第二权重表示在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。举例来说,如果候选多媒体数据对应于某一基金产品,目标操作信息在该情形中表示目标对象通过网页链接购买上述基金产品的概率,初始特征向量阵列包括分别与目标对象的年龄和工作类型对应的年龄特征向量和工作类型特征向量,此时,每个第一权重表示在单独考虑年龄特征向量或工作类型特征向量情况下相应的特征向量在预测目标对象购买上述基金产品的概率方面的重要性,每个第二权重表示在联合考虑年龄特征向量和工作类型特征向量情况下相应的特征向量在预测目标对象购买上述基金产品的概率方面的重要性。例如,在单独考虑目标对象的年龄特征向量的情况下,如果目标对象的年龄不满十八周岁或者超过七十岁,则根据该年龄信息可以判断该目标对象购买基金产品的可能性很低,此时,年龄特征向量在预测目标操作信息方面的重要性较高,与年龄特征向量对应的第一权重可具有相对高的值。而如果目标对象的年龄在三十岁左右,则仅根据该年龄信息难以确定该目标对象是否购买基金产品,此时,年龄特征向量在预测目标操作信息方面的重要性较低,与年龄特征向量对应的第一权重可具有相对低的值。然而,如果该目标对象的工作类型为金融行业从业人员,在联合考虑年龄特征向量和工作类型特征向量情况下,则可以判断该目标对象购买基金产品的可能性较高,而不论该目标对象的年龄如何。此时,年龄特征向量在预测目标操作信息方面的重要性较低,与年龄特征向量对应的第二权重可具有相对低的值。上述的第一权重所表示的重要性也可被理解为仅从某一特征(包括目标对象特征或多媒体数据特征)自身的角度衡量该特征对预测所述目标操作信息的单方重要性,该特征所体现的单方重要性可随特征的具体的值而不同,上述的第二权重表示的重要性也可被理解成从综合考虑全部特征(包括各个目标对象特诊各个多媒体数据特征)的角度衡量上述某一特征对预测目标操作信息的重要性,因此,第二权重表示的重要性是一种在联合考虑全部特征情况下的全局重要性。因此,本申请实施例提出的向目标对象推荐多媒体数据的方法不仅考虑了各个目标对象特征和各个多媒体数据特征在预测目标操作信息方面的重要性,而且从两个维度区分了同一特征(包括目标对象特特征和多媒体数据特征)在预测目标操作信息方面的不同重要性。因此,与常规的推荐多媒体数据的方法相比,本申请实施例提出的向目标对象推荐多媒体数据的方法可以更加准确地预测候选多媒体数据对应的目标操作信息,从而可以实现针对目标对象的多媒体数据精准推荐。
图3图示了用于实施图2中所示的方法中的步骤S120和S130的示例性结构。如图3所示,向量化层310(例如,Word2Vec模型)基于目标对象特征和多媒体数据特征输出初始特征向量阵列,第一权重评估网络340(例如,多层感知器MLP)基于初始特征向量阵列/>获得与初始特征向量阵列/>中的各个特征向量对应的第一权重,形成第一权重阵列。初始特征向量阵列/>经过池化层320处理后输出经池化的特征向量阵列,第二权重评估网络330(例如,多层感知器MLP)基于经池化的特征向量阵列获得与初始特征向量阵列/>中的各个特征向量对应的第二权重,形成第二权重阵列。基于第一权重阵列和第二权重阵列可获得上述的特征重要性权重阵列。在图3的示例中,将第一权重阵列中的各个第一权重和第二权重阵列的各个第二权重分别相加可获得上述特征重要性权重阵列。当然,特征重要性权重阵列可经过激活函数350(例如,sigmoid)的进一步处理,使得特征重要性权重阵列中的各特征重要性权重映射到同一数值范围内(例如,区间[0,1])。
因此,根据本申请的一些实施例,如图4所示,上述特征重要性权重阵列至少通过如下步骤获取:S410、对所述初始特征向量阵列中的各初始特征向量进行池化处理,从而获得经池化的特征向量阵列;S420、基于所述经池化的特征向量阵列获得第二权重的阵列;S430、基于所述初始特征向量阵列获得第一权重的阵列;以及S440、确定所述第一权重阵列和所述第二权重阵列的和从而获得所述特征重要性权重阵列。上述步骤S410中提到的池化处理包括最大池化、平均池化和全局池化中的任一种。基于经池化的特征向量阵列,第二权重评估网络可以实现不同特征向量之间的交互,得到联合考虑全部特征情况下各特征向量的全局重要性。
图5示出了本申请的另一实施例的向目标对象推荐多媒体数据的方法中的一些步骤。图5中所示的步骤S510、S520、S570以及S580分别与图2中的步骤S110、S120、S140以及S150类似,在此不再赘述。与图2所示的实施例不同,图5所示的向目标对象推荐多媒体数据的方法还包括:S530、基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表示所述初始特征向量阵列中不同特征向量之间的相关性;S540、基于初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列。此时,如图2中所示的步骤S130—至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列可以被视为包括如下步骤:S550、基于初始特征向量阵列和特征重要性权重阵列获得第二特征向量阵列;S560、将所述第一特征向量阵列和所述第二特征向量阵列进行聚合以获得所述目标特征向量阵列。在该实施例中,目标特征向量阵列不仅包括基于初始特征向量阵列和特征重要性权重阵列获得的第二特征向量阵列,还包括基于初始特征向量阵列和特征相关性权重阵列获得第一特征向量阵列。特征相关性权重阵列中的每个特征相关性权重表示所述初始特征向量阵列中不同特征向量之间的相关性。例如,如果初始特征向量阵列中的某一特征向量与初始特征向量阵列中另一特征向量具有较强的相关性,与这两个特征向量相关的特征相关性权重可具有相对较大的值,反之,相应的特征相关性权重的值相对较小。适于确定上述的不同特征向量之间的相关性的方法的示例包括但不限于注意力机制、欧氏距离、余弦相似度等。根据特征相关性权重阵列中的各个特征相关性权重,可以从初始特征向量阵列中确定与其存在较强相关性的特征向量的数目较多的那些特征向量,这类特征向量可以被认为相对于其他特征向量具有更高的重要性,这种重要性将通过特征重要性权重阵列体现在第二特征向量阵列中,并最终影响目标特征向量阵列。因此,图5的实施例实际上增加了一个另外的维度(与其他特征之间的相关性)来衡量各个特征(包括目标对象特特征和多媒体数据特征)在预测目标操作信息方面的重要性,与图2所示的实施例相比,进一步优化了各个特征对预测目标操作信息的重要性的确定,有利于进一步提升向目标对象推荐多媒体数据的准确性和适当性。
图6a图示了上述步骤S530—基于所述初始特征向量阵列获得特征相关性权重阵列的示例。如图6a所示,基于所述初始特征向量阵列获得特征相关性权重阵列包括: S610、对所述初始特征向量阵列中的各个特征向量进行卷积获得中间特征向量阵列;S620、确定所述中间特征向量阵列与所述中间特征向量阵列的转置的乘积;以及S630、利用激活函数对所述乘积进行处理从而获得所述特征相关性权重阵列。进一步地,在一些实施例中,上述步骤S540—基于初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列包括:确定所述特征相关性权重阵列和所述初始特征向量阵列的乘积,从而获得所述第一特征向量阵列。上述的步骤S550—基于初始特征向量阵列和特征重要性权重阵列获得第二特征向量阵列包括:确定所述初始特征向量阵列和所述特征重要性权重阵列的哈达玛积,从而获得所述第二特征向量阵列。
下面通过图6b进一步示例说明图5所示的向目标对象推荐多媒体数据的方法的实施例。如图6b所示,向量化层610(例如,Word2Vec模型)基于目标对象特征和多媒体数据特征输出初始特征向量阵列,第一权重评估网络640(例如,多层感知器MLP)基于初始特征向量阵列/>获得与初始特征向量阵列/>中的各个特征向量对应的第一权重,形成第一权重的阵列。初始特征向量阵列/>经过池化层620处理后输出经池化的特征向量阵列,第二权重评估网络630(例如,多层感知器MLP)基于经池化的特征向量阵列获得与初始特征向量阵列/>中的各个特征向量对应的第二权重,形成第二权重的阵列。将第一权重阵列中的各个第一权重和第二权重阵列的各个第二权重分别相加可获得特征重要性权重阵列。特征重要性权重阵列可经过激活函数650(例如,sigmoid)的进一步处理,使得特征重要性权重阵列中的各特征重要性权重映射到同一数值范围内(例如,区间[0,1])。图6b还示出了卷积神经网络660(例如多层感知器MLP)、转置变换单元670以及激活函数680(例如,SoftMax)。卷积神经网络660对初始特征向量阵列中的各个特征向量进行卷积获得中间特征向量阵列A,转置变换单元670基于中间特征向量阵列A获得中间特征向量阵列的转置AT,激活函数680对中间特征向量阵列A与中间特征向量阵列的转置AT的乘积AAT进行处理从而获得特征相关性权重阵列。在一些实施例中,特征相关性权重阵列中的特征相关性权重/>可以被表示为:
表示初始特征向量阵列中第i个特征向量和第j个特征向量之间的相关性,F表示初始特征向量阵列中初始特征向量的数目。
进一步地,可以确定特征相关性权重的阵列和初始特征向量阵列的乘积,从而获得第一特征向量阵列,第一特征向量阵列可以表示为其中/>可以被表示为:/>
在图6b中,第一权重评估网络640、池化层620、第二权重评估网络630和激活函数650可形成门控机制网络,上述的第二特征向量阵列可被表示为,第二特征向量阵列可以是初始特征向量阵列Ef和特征重要性权重阵列的哈达玛积。在图6b中,卷积神经网络660(例如多层感知器MLP)、转置变换单元670以及激活函数680可形成注意力机制网络,第一特征向量阵列可以表示为/>。图6b还示出了聚合单元690,第一特征向量阵列和第二特征向量/>可经由聚合单元690聚合而获得目标特征向量/>。在一些实施例中,目标特征向量/>,其中/>均为常数,的取值范围在0至2之间。由此可见,与图3所示的实施例相比,在图6b所示的实施例中,目标特征向量还包含特征相关性权重阵列体现的特征相关性信息,可进一步提升向目标对象推荐多媒体数据的准确性。
根据本申请的另外的实施例,可以通过对第一特征向量阵列、第二特征向量阵列和初始特征向量阵列进行聚合而获得目标特征向量。例如,目标特征向量。让目标特征向量包含初始特征向量阵列,可以避免由于在获得第一特征向量阵列、第二特征向量阵列(例如,对初始特征阵列进行池化处理期间)的过程中可能导致的特征信息丢失。
在一些实施例中,目标操作包括第一预期操作和第二预期操作,所述目标操作信息包括第一预期操作信息和第二预期操作信息,所述第一预期操作信息和第二预期操作信息分别表征所述目标对象针对所述候选多媒体数据执行所述第一预期操作和所述第二预期操作的概率,所述目标操作信息反映所述目标对象针对所述候选多媒体数据同时执行所述第一预期操作操作和所述第二预期操作的概率。例如,第一预期操作可以是用户对多媒体数据的点击操作,例如,点击图片信息、点击网页链接等,第二预期操作可以是用户的转化操作,例如,用户根据图片信息或网页链接的指引完成了注册操作成为注册用户、或支付了用户资产等操作。在实践中,通常用点击率CTR(即,用户的点击量与图片或网页链接等信息的展示量的比值)和转化率CVR(即,用户的转化量与点击量的比值)来反映用户针对多媒体数据的操作,此时,上述的第一预期操作信息可以是表征目标对象针对候选多媒体数据执行点击操作的概率PCTR,第二预期操作信息可以是表征目标对象针对候选多媒体数据执行转化操作的概率PCVR,目标操作信息反映所述目标对象针对所述候选多媒体数据既执行点击操作又执行转化操作的概率。
根据本申请的一些实施例,上述的特征重要性权重阵列包括第一任务特征重要性权重阵列和第二任务特征重要性权重阵列,第一任务特征重要性权重阵列中的每个第一任务特征重要性权重依赖于所述第一权重、所述第二权重以及第一任务影响因子,所述第二任务特征重要性权重阵列中的每个第二任务特征重要性权重依赖于所述第一权重、所述第二权重以及第二任务影响因子,所述第一任务影响因子表征预测所述第一预期操作信息的第一任务对所述初始特征向量阵列中的每个特征向量的影响,所述第二任务影响因子表征预测所述第二预期操作信息的第二任务对所述初始特征向量阵列中的每个特征向量的影响。第一任务影响影子也可以被理解成仅从预测第一预期操作信息的第一任务的角度考虑的情况下特征向量的重要性,第二任务影响影子也可以被理解成仅从预测第二预期操作信息的第二任务的角度考虑的情况下特征向量的重要性。此时,图2中所示的步骤S130—至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列包括:至少基于初始特征向量阵列和第一任务特征重要性权重阵列获得第一任务目标特征向量阵列;以及至少基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第二任务目标特征向量阵列。图2中的步骤S140—根据目标特征向量阵列预测目标操作信息包括:根据第一任务目标特征向量阵列预测第一预期操作信息;以及根据第二任务目标特征向量阵列预测所述第二预期操作信息。也就是说,在该实施例中,分别针对第一任务(预测第一预期操作信息)和第二任务(预测第二预期操作信息)构建第一任务目标特征向量阵列和第二任务目标特征向量阵列,再分别基于第一任务目标特征向量阵列和第二任务目标特征向量阵列预测第一预期操作信息和第二预期操作信息。第一任务目标特征向量阵列和第二任务目标特征向量阵列中的各第一任务目标特征向量和各第二任务目标特征向量不仅包含上述的第一权重、第二权重所表征的信息,还考虑上述的第一任务影响因子和第二任务影响因子的信息,因此,在该实施例中,不仅考虑了前述实施例中提到的各个特征的单方重要性和全局重要性,还对每个特征(包括目标对象特特征和多媒体数据特征)对不同任务(预测不同对预期操作信息)方面的重要性进行了区分,可以更加准确地分别预测第一预期操作信息和第二预期操作信息,从而进一步提升向目标对象推荐多媒体数据的准确性和适当性。
图7示意性地示出了获得上述第一任务目标特征向量阵列的示例。图7中所示的向量化层710、第一权重评估网络740、第二权重评估网络730、池化层720分别与图3中所示的向量化层310、第一权重评估网络340、第二权重评估网络330、池化层320类似,在此不再赘述。图7中还示出了第一任务信息获取单元720'和第一任务影响因子获取单元730'。第一任务信息获取单元720'可以提取第一任务信息的特征,第一任务信息是第一任务所专有的信息,其标识预测第一预期操作信息的第一任务,第一任务信息的示例包括第一任务信息ID和一些先验的第一预期操作(例如,先验点击率)。第一任务影响因子获取单元730'可包括多层感知器MLP,其基于第一任务信息获得第一任务影响因子。在图7的示例中,将第一任务影响因子、第一权重评估网络740输出的第一权重以及第二权重评估网络730输出的第二权重相加获得第一任务特征重要性权重,激活函数750将各个第一任务特征重要性权重映射到同一数值范围内。相应地,在该实施例中,基于初始特征向量阵列Ef和第一任务特征重要性权重阵列的哈达玛积可以获得与第一任务对应的第二特征向量阵列。聚合单元790可以将该第二特征向量阵列/>和初始特征向量阵列Ef相加而获得第一任务目标特征向量阵列。采用与图7类似的方法,可以获得第二任务目标特征向量阵列,只需要将图7中的第一任务信息获取单元720'和第一任务影响因子获取单元730'分别替换成第二任务信息获取单元和第二任务影响因子获取单元即可。第二任务信息是第二任务所专有的信息,第二任务信息的示例包括第二任务信息ID和一些先验的第二预期操作(例如,先验转化率)。第二任务影响因子获取单元也可包括多层感知器MLP,只是该多层感知器MLP的参数与第一任务影响因子获取单元中的多层感知器MLP的参数可能有所不同。
因此,在一些实施例中,如图8所示,上述的第一任务影响因子和第二任务影响因子至少通过以下步骤获得:S810、获取第一任务信息和第二任务信息,所述第一任务信息和第二任务信息分别标识预测所述第一预期操作信息的第一任务和预测第二预期操作信息的第二任务;以及S820、分别基于所述第一任务信息和第二任务信息获得所述第一任务影响因子和第二任务影响因子。根据本申请的实施例,在目标操作信息包括第一预期操作信息和所述第二预期操作信息的情况下,可以根据第一预期操作信息和第二预期操作信息向所述目标对象推荐所述候选多媒体数据。例如,针对某一基金产品,目标对象可能需要先后进行点击操作和转化操作才能完成针对基金产品的购买,那么可以分别预测表征目标对象针对该基金产品执行点击操作的概率PCTR和表征目标对象针对该基金产品执行转化操作的概率PCVR,确定PCTR和PCVR的乘积即可获得目标对象购买该基金产品的概率,从而可以根据该乘积表示的概率确定是否向目标对象推荐该基金产品。
能够理解到的是,上述的图3、图6b和图7所示的实施例可以彼此融合形成另外的实施例。例如,可以将图6b中所示的基于特征相关性权重阵列和初始特征向量阵列获得的第一特征向量阵列与图7所示的实施例进行组合。此时,向目标对象推荐多媒体数据的方法还包括:基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表示所述初始特征向量阵列中不同特征向量之间的相关性;以及基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列。上述的至少基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第一任务目标特征向量阵列的步骤可包括:基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第三特征向量阵列;以及对所述第一特征向量阵列和所述第三特征向量阵列进行聚合以获得所述第一任务目标特征向量阵列。上述的至少基于初始特征向量阵列和第二任务特征重要性权重阵列获得第二任务目标特征向量阵列的步骤包括:基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第四特征向量阵列;以及对所述第一特征向量阵列和所述第四特征向量阵列进行聚合以获得所述第二任务目标特征向量阵列。
图9a图示了基于第一特征向量阵列和第三特征向量阵列获得第一任务目标特征向量阵列的示例。在该实施例中,第一任务为预测用户针对多媒体数据进行点击操作的概率。第一任务信息获取单元可以获取第一任务信息,例如,第一任务信息的ID、针对多媒体数据的先验点击率等。图9a中所示的向量化层910、池化层920、激活函数950、980、转置变换单元970以及聚合单元990与之前的实施例对应的单元相同。在图9a的示例中,第一权重评估网络、第二权重评估网络、第一任务影响因子获取单元、卷积神经网络均被图示为包括多层感知器MLP,并且每个多层感知器的输出经过ReLU函数的处理,从而可以丢弃无价值的信息。并且,取决于目标对象的目标对象特征和多媒体数据的多媒体数据特征的复杂程度,第一权重评估网络、第二权重评估网络、第一任务影响因子获取单元、卷积神经网络中每个可包括一个或多个多层感知器MLP,图9a中所示的第一权重评估网络和第二权重评估网络均包括2个多层感知器MLP。在图9a中,第一权重评估网络输出的第一权重、第二权重评估网络输出的第二权重、以及第一任务影响因子获取单元输出的第一任务影响因子分别被图示为w1、w2和w3,激活函数980输出的特征相关性权重被图示为Sa。基于第一任务特征重要性权重阵列和初始特征向量阵列获得的第三特征向量阵列被图示为,第一任务目标特征向量阵列Eout1可以为/>。可选地,可以基于初始特征向量阵列、第一特征向量阵列/>和第三特征向量阵列/>获得第一任务目标特征向量阵列,即,
可以用与图9a类似的方法获得第二任务特征重要性权重阵列和第四特征向量阵列,进而基于第一特征向量阵列和第四特征向量阵列获得第二任务目标特征向量阵列,只需将第一任务信息获取单元变换为第二任务信息获取单元,并对第一任务影响因子获取单元中的多层感知器MLP的参数进行调整即可。
图9b图示了应用了图9a所图示的技术构思的向目标对象推荐多媒体数据的方法的示例。如图9b所示,向目标对象推荐多媒体数据的方法包括:S910、分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;S920、
对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;S930、基于初始特征向量阵列获得特征相关性权重阵列,特征相关性权重阵列中的每个特征相关性权重表示所述初始特征向量阵列中不同特征向量之间的相关性;S940、基于初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列;S950a、基于初始特征向量阵列和第一任务特征重要性权重阵列获得第三特征向量阵列;S960a、对第一特征向量阵列和第三特征向量阵列进行聚合以获得第一任务目标特征向量阵列;S970a、根据第一任务目标特征向量阵列预测第一预期操作信息;S950b、基于初始特征向量阵列和第二任务特征重要性权重阵列获得第四特征向量阵列;S960b、对第一特征向量阵列和第四特征向量阵列进行聚合以获得第二任务目标特征向量阵列;S970b、根据第二任务目标特征向量阵列预测第二预期操作信息;以及S980、根据第一预期操作信息和第二预期操作信息向目标对象推荐所述候选多媒体数据。例如,第一预期操作信息和第二预期操作信息可以分别是前述的目标对象针对该基金产品执行点击操作的概率PCTR和目标对象针对该基金产品执行转化操作的概率PCVR,可以根据第一预期操作信息和第二预期操作信息的乘积表示的概率确定是否向目标对象推荐该基金产品。
图3、图6b、图7以及图9a所示的结构或者所图示的推荐方法可以融合至已有的向目标对象推荐多媒体数据的推荐模型。例如,图10图示了常规的深度学习模型DeepCrossing的基本结构。在提取多媒体数据的各个特征(特征1……特征n)后,通过Word2Vec网络可以获得与各个特征对应的嵌入向量,各个嵌入向量(嵌入向量1……嵌入向量n)经过拼接层后形成嵌入向量阵列。Deep Crossing的隐藏层基于对所获得的嵌入向量阵列的处理,可以从输出层输出目标对象针对多媒体数据执行目标操作的概率。
图11示意性地示出了图6b所示的实施例融合至图10所示的深度学习模型DeepCrossing的情形。在图11中,并不是将各个特征对应的嵌入向量直接拼接后提供给隐藏层处理,而是基于初始特征向量阵列(例如,嵌入向量阵列)分别获得第一特征向量阵列和第二特征向量阵列,第一特征向量阵列考虑了各个特征的特征相关性权重的信息,第二特征向量阵列考虑了各个特征的特征重要性权重的信息,而且,特征重要性权重的信息包括第一权重的信息和第二权重的信息,第一权重表示在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测目标操作信息方面的重要性,第二权重表示在联合考虑所述初始特征向量阵列中的各个特征向量的情况下初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。在此基础上,将第一特征向量阵列、第二特征向量阵列以及初始特征向量阵列进行聚合获得目标特征向量阵列,隐藏层基于目标特征向量阵列,从输出层输出目标对象针对多媒体数据执行目标操作的概率。因此,本申请的实施例实际上从三个不同的维度衡量各个特征(包括目标对象特征和多媒体数据特征)在预测目标操作信息方面的重要性,上述的单方重要性、全局重要性以及特征相关性所表示的信息最终体现在目标特征向量阵列中,这样,对预测目标操作信息贡献度大的那些特征可以得到合理地强化,对预测目标操作信息贡献度小的那些特征可以适当地弱化,从而有利于实现针对目标对象的多媒体数据精准推荐。图11中的虚线框表示本申请实施例提出的基于目标对象的目标对象特征和多媒体数据的多媒体数据特征获得目标特征向量阵列的过程,可将该虚线框内的结构称为特征预处理网络。
图9b所示的实施例可以融合至已有的多任务学习模型后获得更新的ESMM模型。第一预期操作信息和第二预期操作信息分别被表示为PCTR和PCVR。相应地,EESM模型中最终输出PCTR和PCVR的结构分别被表示为CTR塔和CVR塔。特征预处理网络基于目标对象的目标对象特征和多媒体数据的多媒体数据特征产生前述的第一任务目标特征向量阵列和第二任务目标特征向量阵列。并不是将各个特征对应的嵌入向量直接拼接后提供给ESMM模型中的特征联合(concatenate)层以及CTR塔或CVR塔处理,而是基于初始特征向量阵列(例如,嵌入向量阵列)分别获得第一特征向量阵列、第三特征向量阵列和第四特征向量阵列,第一特征向量阵列考虑了各个特征的特征相关性权重的信息,第三特征向量阵列和第四特征向量阵列均考虑各个特征的特征重要性权重的信息,特征重要性权重的信息包括第一权重的信息和第二权重的信息,第一权重表示在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测目标操作信息方面的重要性,第二权重表示在联合考虑所述初始特征向量阵列中的各个特征向量的情况下初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。而且,第三特征向量阵列还考虑各个特征的第一任务影响因子所表征的信息,第四特征向量阵列还考虑各个特征的第二任务影响因子所表征的信息,所述第一任务影响因子表征预测第一预期操作信息的第一任务对初始特征向量阵列中的每个特征向量的影响,所述第二任务影响因子表征预测所述第二预期操作信息的第二任务对所述初始特征向量阵列中的每个特征向量的影响。在此基础上,可以将初始特征向量阵列、第一特征向量阵列和第三特征向量阵列进行聚合获得第一任务目标特征向量阵列,将初始特征向量阵列、第一特征向量阵列和第四特征向量阵列进行聚合获得第二任务目标特征向量阵列,分别基于第一任务目标特征向量阵列和第二任务目标特征向量阵列预测第一预期操作信息PCTR和第二预期操作信息PCVR。目标操作信息被确定为第一预期操作信息PCTR和第二预期操作信息PCVR的乘积PCTCVR。因此,本申请的实施例实际上从四个不同的维度衡量各个特征(包括目标对象特征和多媒体数据特征)在预测目标操作信息方面的重要性,上述的第一或第二任务影响因子、单方重要性、全局重要性、以及特征相关性所表示的信息最终体现在第一任务目标特征向量阵列和第二任务目标特征向量阵列中,这样,对预测目标操作信息贡献度大的那些特征可以得到合理地强化,对预测目标操作信息贡献度小的那些特征可以适当地弱化,从而有利于实现针对目标对象的多媒体数据精准推荐。
如前所述,图3、图6b、图7以及图9a所示的结构可以融合至已有的向目标对象推荐多媒体数据的推荐模型,从而获得更新的推荐模型,例如,如图11所示的更新的DeepCrossing模型。这样,可以以更新的推荐模型为整体,利用样本数据和样本标签对更新的推荐模型进行训练,从而获得整个推荐模型的适当的参数,包括前述的预处理网络中各个模型的参数,例如上述实施例中提及的卷积神经网络的参数、多层感知器MLP的参数、以及聚合单元中涉及的常数α和β。根据本申请的一些实施例,前述的特征重要性权重阵列是利用经训练的重要性评估网络基于所述初始特征向量阵列而获得,该经训练的重要性评估网络至少通过如下所示的步骤对重要性评估网络进行训练而获得:获取目标对象样本的目标对象样本特征以及候选多媒体数据样本的多媒体数据样本特征;对所述目标对象样本特征和所述多媒体数据样本特征进行向量化从而获得初始样本特征向量阵列;对所述初始样本特征向量阵列中的各初始样本特征向量进行梯度截断,获得梯度截断样本特征向量阵列;以及利用所述梯度截断样本特征向量阵列对所述重要性评估网络进行训练获得所述经训练的重要性评估网络。例如,返回参照图6b,在对第一权重评估网络640和第二权重评估网络630进行训练时,并不将初始样本特征向量阵列Ef0提供给第一权重评估网络640和池化层620,而是对初始样本特征向量阵列Ef0中的各初始样本特征向量进行梯度截断,获得梯度截断样本特征向量阵列Esf0,即Esf0=stop_gradient(Ef0)由此,在对第一权重评估网络640和第二权重评估网络630进行训练时可以避免对向量化层(例如,Word2Vec模型)的参数的影响。
本申请的另一实施例提供了一种向目标对象推荐多媒体数据的装置,该装置包括:特征提取模块,其被配置成分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;向量化模块,其被配置成对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;目标特征向量获取模块,其被配置成至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;目标操作信息预测模块,其被配置成根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及目标媒体数据推荐模块,其被配置成根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据。所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。该装置可以更准确地预测候选多媒体数据对应的目标操作信息,从而可以实现针对目标对象的多媒体数据精准推荐。
前述实施例中提到的多媒体数据可以是在互联网上交易任何实体产品或虚拟商品的访问入口。本申请实施例提出的向目标对象推荐多媒体数据的方法或装置可以应用于多种场景。例如,如图11所示的更新的Deep Crossing模型可应用于基金产品的推荐。当然,图11中虚线框所示的预处理网络也可与其他的推荐模型(例如,DeepFM、CGC、ESMM)结合获得其他更新的推荐模型。下面的表1示出了分别应用Deep Crossing模型、包含如图11所示的预处理网络的更新的Deep Crossing、DeepFM模型、以及包含如图11所示的预处理网络的更新的DeepFM模型向目标对象推荐基金产品相关指标的变化。从表1可以看出,在应用更新的Deep Crossing模型和更新的DeepFM模型的情况下,离线评估指标指标AUC均得以提升,在线评估指标CVR(即,转化率)也得到了超过2%的增长。
表1
模型名称 AUC 线上CVR
Deep Crossing 0.8678 A
更新的Deep Crossing 0.8741 A+2.34%
DeepFM 0.8702 B
更新的DeepFM 0.8759 B+2.07%
下面的表2示出了分别应用ESMM模型、包含预处理网络的更新的ESMM模型、CGC模型、以及包含预处理网络的更新的CGC模型向目标对象推荐基金产品相关指标的变化。从表2可以看出,在应用更新的ESMM模型或更新的CGC模型的情况下,离线评估指标CTR AUC和CVR AUC均得到提升。而且,在线评估指标CVR(即,转化率)和CTR(点击率)也得到了超过1%或3%的增长。
表2
模型名称 CTR AUC CVR AUC 线上CTR 线上CVR
ESMM 0.8836 0.8887 C D
更新的ESMM 0.8871 0.8928 C+1.11% D+3.43%
CGC 0.8845 0.8880 E F
更新的CGC 0.8876 0.8924 E+1.04% F+3.92%
为了验证本申请实施例提出的向目标对象推荐多媒体数据的效果,针对图11所示的更新的Deep Crossing以及更新的ESMM进行了消融实验。如下面的表3所示,对于图11中所示的更新的Deep Crossing,在去除特征重要性权重和去除特征相关性权重的情况下,离线评估指标AUC存在不同幅度的下降,线上CVR也分别下降0.45%和0.29%。对于更新的ESMM,在去除任务影响因子(包括第一任务影响因子和第二任务影响因子),离线评估指标AUC、线上CTR、线上CVR的值均减小。
表3
从上述消融实验结果,可以进一步理解到本申请实施例提出的向目标对象推荐多媒体数据的方法对提高推荐准确性方面的贡献。
本申请的另外的实施例提供了一种计算设备,该计算设备包括:存储器,其被配置成存储计算机可执行指令;处理器,其被配置成当所述计算机可执行指令被处理器执行时执行如前述任一实施例所述的方法中的步骤。
特别地,上文参考流程图描述的方法中的方法可以被实现为计算机程序。例如,本申请的实施例提供一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行上述实施例所述的向目标对象推荐多媒体数据的方法中的至少一个步骤的程序代码。
本申请的另一实施例提供了一种或多种计算机可读存储介质,其上存储有计算机可读指令,该计算机可读指令在被执行时实现根据本申请一些实施例的向目标对象推荐多媒体数据的方法。向目标对象推荐多媒体数据的方法的各个步骤可以通过程序设计被转化为计算机可读指令,从而存储在计算机可读存储介质中。当这样的计算机可读存储介质被计算设备或计算机读取或访问时,其中的计算机可读指令被计算设备或计算机上的处理器执行以实现向目标对象推荐多媒体数据的方法。
本申请公开了示例系统,其包括代表可以实现本文各实施例描述的技术方案的一个或多个系统和/或设备中的示例计算设备。计算设备可以是例如服务提供商的服务器、与服务器相关联的设备、片上系统、和/或任何其它合适的计算设备或计算系统。上面的向目标对象推荐多媒体数据的装置可以采取计算设备的形式。替换地,向目标对象推荐多媒体数据的装置可以以应用的形式被实现为计算机程序。
示例计算设备包括彼此通信耦合的处理系统、一个或多个计算机可读介质以及一个或多个I/O接口。尽管未示出,但是计算设备还可以包括系统总线或其他数据和命令传送系统,其将各种组件彼此耦合。系统总线可以包括不同总线结构的任何一个或组合,所述总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。
处理系统代表使用硬件执行一个或多个操作的功能。因此,处理系统被图示为包括可被配置为处理器、功能块等的硬件元件。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以由(多个)半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质被图示为包括存储器/存储装置。存储器/存储装置表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。计算机可读介质可以以下面进一步描述的各种其他方式进行配置。一个或多个I/O接口代表允许用户使用各种输入设备向计算设备输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风(例如,用于语音输入)、扫描仪、触摸功能(例如,被配置为检测物理触摸的容性或其他传感器)、相机(例如,可以采用可见或不可见的波长(诸如红外频率)将不涉及触摸的运动检测为手势)等等。输出设备的示例包括显示设备(例如,显示器或投影仪)、扬声器、打印机、网卡、触觉响应设备等。因此,计算设备可以以下面进一步描述的各种方式进行配置以支持用户交互。
计算设备还包括应用。应用可以例如是向目标对象推荐多媒体数据的装置的软件实例,并且与计算设备中的其他元件相组合地实现本文描述的技术。
本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、组件、数据结构等。本文所使用的术语“模块”,“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的,意味着这些技术可以在具有各种处理器的各种计算平台上实现。
所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”是指能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带,磁盘存储装置或其他磁存储设备,或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。
“计算机可读信号介质”是指被配置为诸如经由网络将指令发送到计算设备的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号,该信号的特征中的一个或多个被设置或改变,从而将信息编码到该信号中。作为示例而非限制,通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。
如前所述,硬件元件和计算机可读介质代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑,其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上系统、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅中的其它实现或其他硬件设备的组件。在这种上下文中,硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备,以及用于存储用于执行的指令的硬件设备,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文所述的各种技术和模块。因此,可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件体现的一个或多个指令和/或逻辑。计算设备可以被配置为实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,例如通过使用处理系统的计算机可读存储介质和/或硬件元件,可以至少部分地以硬件来实现将模块实现为可由计算设备作为软件执行的模块。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备和/或处理系统)可执行/可操作以实现本文所述的技术、模块和示例。
各种实施方式中,计算设备可以采用各种不同的配置。例如,计算设备可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备还可以实现为电视类设备,其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。
本文描述的技术可以由计算设备的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式系统、诸如通过如下所述的平台而在“云”上全部或部分地实现。云包括和/或代表用于资源的平台。平台抽象云的硬件(例如,服务器)和软件资源的底层功能。资源可以包括在远离计算设备的服务器上执行计算机处理时可以使用的其它应用和/或数据。资源还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台可以抽象资源和功能以将计算设备与其他计算设备连接。平台还可以用于抽象资源的分级以提供遇到的对于经由平台实现的资源的需求的相应水平的分级。因此,在互连设备实施例中,本文描述的功能的实现可以分布在整个系统内。例如,功能可以部分地在计算设备上以及通过抽象云的功能的平台来实现。
应当理解,为清楚起见,参考不同的功能单元对本申请的实施例进行了描述。然而,将明显的是,在不偏离本申请的情况下,每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如,被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此,对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考,而不是表明严格的逻辑或物理结构或组织。因此,本申请可以被实施在单个单元中,或者可以在物理上和功能上被分布在不同的单元和电路之间。
将理解的是,尽管第一、第二、第三等术语在本文中可以用来描述各种设备、元件、部件或部分,但是这些设备、元件、部件或部分不应当由这些术语限制。这些术语仅用来将一个设备、元件、部件或部分与另一个设备、元件、部件或部分相区分。
尽管已经结合一些实施例描述了本申请,但是其不旨在被限于在本文中所阐述的特定形式。相反,本申请的范围仅由所附权利要求来限制。附加地,尽管单独的特征可以被包括在不同的权利要求中,但是这些可以可能地被有利地组合,并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外,在权利要求中,词“包括”不排除其它元件,并且术语“一”或“一个”不排除多个。
可以理解的是,在本公开的具体实施方式中,涉及到基础特征、历史统计特征等数据。当本公开中所描述的涉及这样的数据的实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

Claims (15)

1.一种向目标对象推荐多媒体数据的方法,包括:
分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;
对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;
至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;
根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及
根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据,
其中所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。
2.根据权利要求1所述的方法,其中所述特征重要性权重阵列至少通过如下步骤获得:
对所述初始特征向量阵列中的各初始特征向量进行池化处理,从而获得经池化的特征向量阵列;
基于所述经池化的特征向量阵列获得第二权重的阵列;
基于所述初始特征向量阵列获得第一权重的阵列;以及
确定所述第一权重的阵列和所述第二权重的阵列的和从而获得所述特征重要性权重阵列。
3.根据权利要求1所述的方法,所述方法还包括:
基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表征所述初始特征向量阵列中不同特征向量之间的相关性;以及
基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列,
其中所述至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列包括:
基于所述初始特征向量阵列和所述特征重要性权重阵列获得第二特征向量阵列,以及
将所述第一特征向量阵列和所述第二特征向量阵列进行聚合以获得所述目标特征向量阵列。
4.根据权利要求3所述的方法,其中基于所述初始特征向量阵列和所述特征重要性权重阵列获得第二特征向量阵列包括:
确定所述初始特征向量阵列和所述特征重要性权重阵列的哈达玛积,从而获得所述第二特征向量阵列。
5.根据权利要求3 所述的方法,其中基于所述初始特征向量阵列获得特征相关性权重阵列包括:
对所述初始特征向量阵列中的各个特征向量进行卷积获得中间特征向量阵列;
确定所述中间特征向量阵列与所述中间特征向量阵列的转置的乘积;以及
利用激活函数对所述乘积进行处理从而获得所述特征相关性权重阵列。
6.根据权利要求5所述的方法,其中基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列包括:
确定所述特征相关性权重阵列和所述初始特征向量阵列的乘积,从而获得所述第一特征向量阵列。
7.根据权利要求1所述的方法,其中所述目标操作包括第一预期操作和第二预期操作,所述目标操作信息包括第一预期操作信息和第二预期操作信息,所述第一预期操作信息和第二预期操作信息分别表征所述目标对象针对所述候选多媒体数据执行所述第一预期操作和所述第二预期操作的概率,所述目标操作信息反映所述目标对象针对所述候选多媒体数据既执行所述第一预期操作操作又执行所述第二预期操作的概率。
8.根据权利要求7所述的方法,其中所述特征重要性权重阵列包括第一任务特征重要性权重阵列和第二任务特征重要性权重阵列,所述第一任务特征重要性权重阵列中的每个第一任务特征重要性权重依赖于所述第一权重、所述第二权重以及第一任务影响因子,所述第二任务特征重要性权重阵列中的每个第二任务特征重要性权重依赖于所述第一权重、所述第二权重以及第二任务影响因子,所述第一任务影响因子表征预测所述第一预期操作信息的第一任务对所述初始特征向量阵列中的每个特征向量的影响,所述第二任务影响因子表征预测所述第二预期操作信息的第二任务对所述初始特征向量阵列中的每个特征向量的影响,
其中所述至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列包括:
至少基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第一任务目标特征向量阵列;以及
至少基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第二任务目标特征向量阵列,
其中所述根据目标特征向量阵列预测目标操作信息包括:
根据所述第一任务目标特征向量阵列预测所述第一预期操作信息;以及
根据所述第二任务目标特征向量阵列预测所述第二预期操作信息。
9.根据权利要求8所述的方法, 其中所述第一任务影响因子和第二任务影响因子至少通过以下步骤获得:
获取第一任务信息和第二任务信息,所述第一任务信息和第二任务信息分别标识预测所述第一预期操作信息的第一任务和预测第二预期操作信息的第二任务;以及
分别基于所述第一任务信息和第二任务信息获得所述第一任务影响因子和第二任务影响因子。
10.根据权利要求9所述的方法,其中所述方法还包括:
基于所述初始特征向量阵列获得特征相关性权重阵列,所述特征相关性权重阵列中的每个特征相关性权重表征所述初始特征向量阵列中不同特征向量之间的相关性;以及
基于所述初始特征向量阵列和所述特征相关性权重阵列获得第一特征向量阵列,
其中所述至少基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第一任务目标特征向量阵列包括:
基于所述初始特征向量阵列和所述第一任务特征重要性权重阵列获得第三特征向量阵列,以及
对所述第一特征向量阵列和所述第三特征向量阵列进行聚合以获得第一任务目标特征向量阵列,
其中所述至少基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第二任务目标特征向量阵列包括:
基于所述初始特征向量阵列和所述第二任务特征重要性权重阵列获得第四特征向量阵列,以及
对所述第一特征向量阵列和所述第四特征向量阵列进行聚合以获得第二任务目标特征向量阵列。
11.根据权利要求1所述的方法,其中所述特征重要性权重阵列是利用经训练的重要性评估网络基于所述初始特征向量阵列而获得,其中所述经训练的重要性评估网络至少通过如下步骤对重要性评估网络进行训练而获得:
获取目标对象样本的目标对象样本特征以及候选多媒体数据样本的多媒体数据样本特征;
对所述目标对象样本特征和所述多媒体数据样本特征进行向量化从而获得初始样本特征向量阵列;
对所述初始样本特征向量阵列中的各初始样本特征向量进行梯度截断,获得梯度截断样本特征向量阵列;以及
利用所述梯度截断样本特征向量阵列对所述重要性评估网络进行训练获得所述经训练的重要性评估网络。
12.一种向目标对象推荐多媒体数据的装置,包括:
特征提取模块,其被配置成分别提取目标对象的目标对象特征以及待推荐的多媒体数据集合中的候选多媒体数据的多媒体数据特征;
向量化模块,其被配置成对所述目标对象的目标对象特征和所述候选多媒体数据的多媒体数据特征进行向量化从而获得初始特征向量阵列,所述初始特征向量阵列中的各个初始特征向量分别与所述目标对象特征和所述多媒体数据特征对应;
目标特征向量获取模块,其被配置成至少基于所述初始特征向量阵列和特征重要性权重阵列获得目标特征向量阵列,所述特征重要性权重阵列中的每个特征重要性权重依赖于第一权重和第二权重;
目标操作信息预测模块,其被配置成根据所述目标特征向量阵列预测目标操作信息,所述目标操作信息反映所述目标对象针对所述候选多媒体数据执行目标操作的概率;以及
目标媒体数据推荐模块,其被配置成根据所述目标操作信息向所述目标对象推荐所述候选多媒体数据,
其中所述第一权重表征在单独考虑所述初始特征向量阵列中的每个特征向量的情况下所述特征向量在预测所述目标操作信息方面的重要性,所述第二权重表征在联合考虑所述初始特征向量阵列中的各个特征向量的情况下所述初始特征向量中的每个特征向量在预测所述目标操作信息方面的重要性。
13.一种计算设备,包括
存储器,其被配置成存储计算机可执行指令;
处理器,其被配置成当所述计算机可执行指令被处理器执行时执行如权利要求1-11中的任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行如权利要求1-11中的任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,其中所述计算机程序被处理器执行时实现权利要求1-11中任一项所述方法的步骤。
CN202211198028.1A 2022-09-29 2022-09-29 推荐多媒体数据的方法、装置、计算设备和存储介质 Pending CN117807254A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211198028.1A CN117807254A (zh) 2022-09-29 2022-09-29 推荐多媒体数据的方法、装置、计算设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211198028.1A CN117807254A (zh) 2022-09-29 2022-09-29 推荐多媒体数据的方法、装置、计算设备和存储介质

Publications (1)

Publication Number Publication Date
CN117807254A true CN117807254A (zh) 2024-04-02

Family

ID=90433981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211198028.1A Pending CN117807254A (zh) 2022-09-29 2022-09-29 推荐多媒体数据的方法、装置、计算设备和存储介质

Country Status (1)

Country Link
CN (1) CN117807254A (zh)

Similar Documents

Publication Publication Date Title
US10489688B2 (en) Personalized digital image aesthetics in a digital medium environment
US20240202491A1 (en) Recommendation method, method for training recommendation model, and related product
CN111966914A (zh) 基于人工智能的内容推荐方法、装置和计算机设备
US11663280B2 (en) Search engine using joint learning for multi-label classification
US11741956B2 (en) Methods and apparatus for intent recognition
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
US20190156177A1 (en) Aspect Pre-selection using Machine Learning
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
WO2024041483A1 (zh) 一种推荐方法及相关装置
CN111967924A (zh) 商品推荐方法、商品推荐装置、计算机设备和介质
CN116739695A (zh) 基于大数据的电子商务管理系统及其方法
CN115564517A (zh) 商品推荐方法、预测模型训练方法和相关设备
CN111143678A (zh) 推荐系统和推荐方法
Latha et al. Product recommendation using enhanced convolutional neural network for e-commerce platform
CN118043802A (zh) 一种推荐模型训练方法及装置
CN116157817A (zh) 伪造物品检测系统
CN117217284A (zh) 一种数据处理方法及其装置
CN110851600A (zh) 基于深度学习的文本数据处理方法及装置
CN117807254A (zh) 推荐多媒体数据的方法、装置、计算设备和存储介质
CN113159877B (zh) 数据处理方法、装置、系统、计算机可读存储介质
CN116109354A (zh) 内容推荐方法、装置、设备、存储介质及计算机程序产品
CN111915339A (zh) 数据的处理方法、装置及设备
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN115310547B (zh) 模型训练方法、物品识别方法及装置、电子设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination