CN113672807B - 推荐方法、装置、介质、装置和计算设备 - Google Patents

推荐方法、装置、介质、装置和计算设备 Download PDF

Info

Publication number
CN113672807B
CN113672807B CN202110898520.9A CN202110898520A CN113672807B CN 113672807 B CN113672807 B CN 113672807B CN 202110898520 A CN202110898520 A CN 202110898520A CN 113672807 B CN113672807 B CN 113672807B
Authority
CN
China
Prior art keywords
recommendation
user
scenes
live video
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110898520.9A
Other languages
English (en)
Other versions
CN113672807A (zh
Inventor
张钊
陈鸿翔
鲁沛瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Cloud Music Technology Co Ltd
Original Assignee
Hangzhou Netease Cloud Music Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Cloud Music Technology Co Ltd filed Critical Hangzhou Netease Cloud Music Technology Co Ltd
Priority to CN202110898520.9A priority Critical patent/CN113672807B/zh
Publication of CN113672807A publication Critical patent/CN113672807A/zh
Application granted granted Critical
Publication of CN113672807B publication Critical patent/CN113672807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本公开的实施方式提供了一种推荐方法、装置、介质、装置和计算设备。将推荐相关对象在至少两个业务场景下对应的场景共有特征输入目标模型,还将这至少两个业务场景分别对应的场景独有特征输入目标模型。如此,目标模型可以参考推荐相关对象与至少两个不同业务场景之间的关系,对推荐相关对象进行分析,输出的推荐度更加准确。

Description

推荐方法、装置、介质、装置和计算设备
技术领域
本公开的实施方式涉及信息技术领域,更具体地,本公开的实施方式涉及一种推荐方法、装置、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,利用根据人工智能算法训练得到的模型进行推荐业务,比较常见。通常,需要将推荐相关对象的特征输入到模型中,模型分析推荐相关对象的特征之后,输出用于表征推荐相关对象对应的推荐权重的推荐度。
基于此,如何获取更加准确的推荐度,是亟待解决的技术问题。
发明内容
本公开的实施方式期望提供一种推荐方法、装置、介质、装置和计算设备,以便基于更准确的推荐度进行推荐。
在本公开实施方式的第一方面中,提供了一种推荐方法,包括:
获取推荐相关数据;所述推荐相关数据包括:推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,N>1,所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度;
根据所述目标模型输出的推荐度,进行推荐。
在本公开的一个实施方式中,所述推荐相关对象,包括:
第一用户与用于推荐给所述第一用户的至少一个第二用户;
所述推荐相关对象在N个业务场景对应的场景共有特征,包括:
所述第一用户的用户画像特征;
所述第一用户在所述N个业务场景下的统计特征;
每个第二用户在所述N个业务场景下的统计特征。
在本公开的另一实施方式中,所述推荐相关对象在N个业务场景对应的场景共有特征,还包括:
每个第二用户的用户画像特征。
在本公开的又一个实施方式中,所述目标模型包括:输入层、专家网络层、权重网络层、加权计算层、输出层;
将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度,包括:
将所述推荐相关数据输入到输入层,输出第一类特征向量;所述输入层包括映射子层,用于将高纬度稀疏特征向量映射成低纬度稠密特征向量;
将所述第一类特征向量输入所述专家网络层,输出Q个第二类特征向量;Q>0;
将所述第一类特征向量输入所述权重网络层,输出与S个预测任务一一对应的S个权重值集合;每个权重值集合包括与Q个第二类特征向量一一对应的Q个权重值;S>1;
将Q个第二类特征向量与S个权重值集合输入所述加权计算层,输出与S个预测任务一一对应的S个第三类特征向量;所述加权计算层用于针对每个预测任务,根据该预测任务对应的权重值集合与Q个第二类特征向量,进行加权计算;
将S个第三类特征向量输入所述输出层,输出关于S个预测任务的推荐度;所述输出层包括全连接子层。
在本公开的再一个实施方式中,所述输入层还包括:特征向量裁剪Dropout子层,用于将映射子层输出的特征向量进行裁剪,得到第一类特征向量。
在本公开的又一实施方式中,所述输出层还包括:深度神经网络子层,用于利用深度神经网络,将S个第三类特征向量进一步进行特征提取,得到S个第四类特征向量;
所述全连接子层,用于将S个第四类特征向量映射成推荐度。
在本公开的一个实施方式中,根据所述目标模型输出的推荐度,进行推荐,包括:
依据推荐场景将在S个预测任务上分别预测的推荐度进行筛选计算得到最终推荐度,根据最终推荐度,向所述第一用户推荐预设数量的第二用户。
在本公开实施方式的第二方面中,提供一种模型训练方法,包括:
根据N个业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N;N>1,M>0;
构建用于实现所述S个具体预测任务的待训练模型;
以所述N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本;每个数据样本包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
针对每个数据样本,获取该数据样本对应的S个标签,其中第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S;
基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型。
在本公开实施方式的第三方面中,提供一种推荐装置,包括:
获取模块,获取推荐相关数据;所述推荐相关数据包括:推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,N>1,所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
处理模块,将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度;
推荐模块,根据所述目标模型输出的推荐度,进行推荐。
在本公开实施方式的第四方面中,提供一种模型训练装置,包括:
定义模块,根据N个业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N;N>1,M>0;
构建模块,构建用于实现所述S个具体预测任务的待训练模型;
样本获取模块,以所述N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本;每个数据样本包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
标签获取模块,针对每个数据样本,获取该数据样本对应的S个标签,其中第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S;
训练模块,基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型。
在本公开实施方式的第五方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现推荐方法或模型训练方法。
在本公开实施方式的第六方面中,提供了一种计算设备,包括存储器、处理器;所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现推荐方法或模型训练方法。
根据本公开提供的推荐方法,将推荐相关对象在至少两个业务场景下对应的场景共有特征输入目标模型,还将这至少两个业务场景分别对应的场景独有特征输入目标模型,如此,目标模型可以参考推荐相关对象与至少两个不同业务场景之间的关系,对推荐相关对象进行分析,输出的推荐度也更加准确。
此外,根据本公开提供的模型训练方法,上述的推荐方法中应用的目标模型可以是基于多任务学习的思想进行训练得到的。具体来说,可以基于N个业务场景与M个基本预测任务,组合出S(M*N)个具体预测任务,构建用于实现所述S个具体预测任务的待训练模型,将N个业务场景作为数据源获取数据样本,为每个数据样本标注S个标签(表征该数据样本在每个具体预测任务上对应的预测结果),进行模型训练。
如此,既可以解决以单个业务场景为数据源获取的数据样本不足的问题,又可以仅需要训练一个模型,就可以在不同业务场景下实现相同的基本预测任务。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示例性提供了一种推荐方法流程;
图2示例性提供了一种基于多任务学习算法构建的目标模型的结构;
图3示例性提供了另一种基于多任务学习算法构建的目标模型的结构;
图4示例性提供了一种模型训练方法的流程;
图5示例性提供一种推荐装置;
图6示例性提供一种模型训练装置;
图7是本公开提供的一种计算机可读存储介质的示意图;
图8是本公开提供的一种计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种推荐方法、装置、介质和计算设备。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
利用根据人工智能算法训练得到的模型来进行推荐业务,是常见的模式。推荐业务一般是指,将一个或多个对象进行推荐。在后文中,将推荐业务中被推荐的对象称为推荐相关对象。
通常,应用于推荐业务的模型的输入是推荐相关对象的特征,输出是推荐相关对象对应的推荐度。推荐度用于表征推荐相关对象的推荐权重,推荐权重越高,越有可能将推荐相关对象进行推荐。可以理解,输入到模型的推荐相关对象的特征越能够准确刻画推荐相关对象,从模型输出的推荐度也就越准确。
为了提升模型输出的推荐度的准确性,在本公开提供的技术方案中,将推荐相关对象在至少两个业务场景下对应的场景共有特征输入目标模型,还将这至少两个业务场景分别对应的场景独有特征输入目标模型,如此,目标模型可以参考推荐相关对象与至少两个不同业务场景之间的关系,对推荐相关对象进行分析,输出的推荐度也更加准确。
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
图1示例性提供了一种推荐方法流程,包括以下步骤:
S100:获取推荐相关数据。
推荐相关数据可以包括推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征。其中,N大于1。
在一些实施方式中,推荐相关对象在N个业务场景对应的场景共有特征,可以是指推荐相关对象在每个业务场景下都会表现出的共有特征,例如推荐相关对象自身的一些属性信息。
在一些实施方式中,推荐相关对象在N个业务场景对应的场景共有特征,可以是指推荐相关对象分别在不同业务场景下产生的统计特征的集合。例如,推荐相关对象在每个业务场景下与该业务场景进行交互产生了一些统计指标(例如交互频率),可以作为推荐相关对象在每个场景下产生的统计特征。
在一些实施方式中,推荐相关对象在N个业务场景对应的场景共有特征,可以既包括推荐相关对象在每个业务场景下都会表现出的共有特征,又包括推荐相关对象分别在不同业务场景下产生的统计特征的集合。N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分。理论上任何可以表征业务场景独特性的特征,都可以作为场景独有特征。
推荐相关对象在N个业务场景下对应的场景共有特征,不仅可以刻画推荐相关对象自身的特征,还可以刻画推荐相关对象与N个业务场景的共性联系。而N个业务场景分别对应的场景独有特征,可以刻画不同业务场景之间的区别。
因此,推荐相关数据所能表达的信息可以包括,推荐相关对象自身的特征、推荐相关对象与N个业务场景的共有联系、推荐相关对象与不同业务场景的独有联系。
S102:将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度。
S104:根据所述目标模型输出的推荐度,进行推荐。
在一些实施方式中,推荐相关对象可以包括第一用户与用于推荐给所述第一用户的至少一个第二用户。推荐相关对象在N个业务场景对应的场景共有特征可以包括:所述第一用户的用户画像特征,所述第一用户在所述N个业务场景下的统计特征,每个第二用户在所述N个业务场景下的统计特征。
此外,推荐相关对象在N个业务场景对应的场景共有特征还可以包括每个第二用户的用户画像特征。
举例来说,在视频直播领域,第一用户可以是视频观看方,第二用户可以是视频主播,不同的业务场景可以是不同的视频直播推荐入口,比如不同类型界面中部署的视频直播推荐入口。
第一用户在N个业务场景下的统计特征可以是第一用户选择点击业务场景下的视频直播推荐入口的频率(即点击率),也可以是第一用户点击业务场景下的视频直播推荐入口后选择观看视频直播达到指定时长以上的频率(即有效观看率),还可以是第一用户点击业务场景下的视频直播推荐入口之后,转化为符合指定标准的用户(比如付费用户)的频率。
第二用户在N个业务场景下的统计特征可以是第二用户在业务场景下被点击的频率,也可以是第二用户在业务场景下被点击并被观看达到指定时长以上的频率,还可以是第二用户在业务场景下吸纳的符合指定标准的用户的频率。
在一些实施方式中,推荐相关数据对应的数据格式可以包括:
与N个业务场景一一对应的N个相同维度的特征向量。其中,基于相同的划分规则,将每个特征向量划分为1个共有维度片段与N个独有维度片段,共有维度片段对应的维度值是基于N个业务场景的场景共有特征确定的。
进而,针对第i个业务场景对应的特征向量,该特征向量中第i个独有维度片段对应的维度值是基于第i个业务场景对应的独有特征确定的,该特征向量中其他独有维度片段对应的维度值为预设的默认值;i=1,…,N。此处的默认值可以为0。
在一些实施方式中,上述的N个业务场景之间可以彼此相似。例如,在视频直播领域,上述的N个业务场景可以是应用APP中不同类型界面中的视频直播入口,比如在评论界面中可以部署视频直播入口,在新闻界面中可以部署视频直播入口。
另外,用于构建上述目标模型的人工智能算法可以有多种选择,图2示例性提供了一种基于多任务学习算法构建的目标模型的结构。如图2所示,目标模型可以包括输入层、专家网络层、权重网络层、加权计算层、输出层。目标模型用于对S个预测任务进行预测,其中大于1。
其中,输入层可以包括映射子层,用于将高维度稀疏特征向量映射成低维度稠密特征向量,输入层的输出为第一类特征向量,将第一类特征向量分别输入到专家网络层与权重网络层。
专家网络层可以包括Q个专家网络,其中Q大于0,每个专家网络用于对第一类特征向量进行进一步的特征提取,如此,可以得到Q个第二类特征向量,作为专家网络层的输出,进而输入到加权计算层。
权重网络层可以包括S个权重网络,这S个权重网络与S个预测任务一一对应,每个权重网络内置对应的预测任务所决定的参数集合,用于根据第一类特征向量确定适应于对应预测任务的权重值集合,该权重值集合包括Q个权重值。也就是说,权重网络层的输出为S个包含Q个权重值的权重值集合,进而输入到加权计算层。
加权计算层用于针对每个预测任务,根据该预测任务对应的权重值集合与Q个第二类特征向量,进行加权计算,输出与S个预测任务一一对应的S个第三类特征向量,进而输入到输出层。
输出层包括全连接子层,全连接子层用于确定S个预测任务分别对应的推荐度。
在一些实施方式中,输入层还可以包括:特征向量裁剪Dropout子层,用于将映射子层输出的特征向量进行裁剪,得到第一类特征向量。Dropout子层可以通过忽略映射子层输出的特征向量中的一些特征信息,使得得到的第一类特征向量可以减少模型的过拟合现象,提升模型的泛化能力。
在一些实施方式中,输出层还可以包括:深度神经网络子层,用于利用深度神经网络,将S个第三类特征向量进一步进行特征提取,得到S个第四类特征向量。如此,全连接子层,可以用于将S个第四类特征向量映射成推荐度。
图3示例性提供另一种基于多任务学习算法构建的目标模型的结构,在图3所示的目标模型中,输入层还包括Dropout子层,输出层还包括深度神经网络子层。
另外,在根据目标模型输出的推荐度,进行推荐时,可以依据推荐场景将在S个预测任务上分别预测的推荐度进行筛选计算得到最终推荐度,根据最终推荐度,向所述第一用户推荐预设数量的第二用户。
图4示例性提供了一种模型训练方法的流程,包括以下步骤:
S400:根据N个业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务。
其中,M大于0,N大于1。
基本预测任务,可以理解为不限定于某个业务场景的预测任务。
例如,在视频直播领域,常用的基本预测任务可以是预测点击通过率CTR的任务,其中,CTR为,用户选择视频直播观看入口观看视频直播的概率。
又如,在视频直播领域,常用的基本预测任务也可以是预测点击通过率CTCVR的任务,CTCVR为,用户选择视频直播观看入口观看视频直播,且转化为符合指定标准的用户的概率。其中,指定标准可以包括:已激活,或,已注册,或已付费。
而将基本预测任务应用于具体的业务场景之后,就得到具体预测任务。换言之,可以基于在每个业务场景下适用每个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N。
S402:构建用于实现所述S个具体预测任务的待训练模型。
S404:以所述N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本。
每个数据样本可以包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征。其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分。
S406:针对每个数据样本,获取该数据样本对应的S个标签。
对于每个数据样本来说,第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S。
S408:基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型。
需要说明的是,在机器学习领域,通常利用数据样本训练模型,训练好的模型用于实现预测任务。有时为了提升模型的泛化效果,可以基于多任务学习的思想来进行模型训练,具体可以让彼此相关的多个预测任务共享相同的数据样本进行模型训练,训练好的模型可以同时用于实现这多个预测任务。然而,在基于多任务学习进行模型训练时,可能会面对数据样本量不足的问题。
而通过图4所示的模型训练方法,可以以多个业务场景为数据源获取足量的数据样本,并且,将业务场景与基本预测任务的组合定义为多任务模型所对应的具体预测任务,使得能够利用跨多个业务场景的数据样本进行模型训练。
在一些实施方式中,可以确定所述M个基本预测任务可适用的N个彼此相似的业务场景。以N个彼此相似的业务场景为数据源获取数据样本,可以取得比较好的模型训练效果。
在一些实施方式中,可以确定对所述M个基本预测任务有需求的业务类型,并确定应用App中对应于所述业务类型的不同的N个业务场景。
进而,在业务类型是视频直播的情况下,可以定义一个业务场景为:在所述应用APP的一个类型的业务界面中,推荐若干视频直播观看入口,以便浏览该业务界面的用户选择视频直播观看入口观看视频直播;不同业务场景对应于不同类型的业务界面。
如此,业务场景对应的业务界面的排版特征,和/或,用于表征该业务界面中推送的视频直播观看入口的被选择情况的统计特征,都可以作为业务场景的独有特征。
在一些实施方式中,如果第i个具体预测任务为预测CTR的任务,则数据样本的第i个标签可以表征:在第i个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播,或者,在第i个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际未选择该主播的视频直播观看入口观看视频直播。
在一些实施方式中,如果第i个具体预测任务为预测CTCVR的任务,则数据样本的第i个标签表征:在第i个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准的用户;或者,在第i个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,未发生该用户实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准的用户的情况。
另外,在应用通过图4所示方法训练得到的目标模型时,将推荐相关数据输入目标模型,输出推荐相关数据分别在S个具体预测任务上对应的预测结果(即推荐度)。
将目标模型应用于视频直播领域时,输入的推荐相关对象为一个用户与一个主播的组合,目标模型的输出可以是该用户与该主播的组合在N个业务场景下对应的CTR与CTCVR。
如此,可以针对至少一个业务场景,根据推荐相关对象在该业务场景下对应的CTR与CTCVR,计算所述推荐相关对象在该业务场景下对应的评分;其中,计算得到的评分与所述推荐相关数据在该业务场景下对应的CTR正相关,与所述推荐相关对象在该业务场景下对应的CTCVR正相关。然后可以根据计算得到的评分,判断是否将该主播的视频直播,推荐给该用户。
图5示例性提供一种推荐装置,包括:
获取模块501,获取推荐相关数据;所述推荐相关数据包括:推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,N>1,所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
处理模块502,将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度;
推荐模块503,根据所述目标模型输出的推荐度,进行推荐。
在一些实施方式中,所述推荐相关对象,包括:
第一用户与用于推荐给所述第一用户的至少一个第二用户。
在一些实施方式中,所述推荐相关对象在N个业务场景对应的场景共有特征,包括:
所述第一用户的用户画像特征;
所述第一用户在所述N个业务场景下的统计特征;
每个第二用户在所述N个业务场景下的统计特征。
在一些实施方式中,所述推荐相关对象在N个业务场景对应的场景共有特征,还包括:
每个第二用户的用户画像特征。
在一些实施方式中,所述目标模型包括:输入层、专家网络层、权重网络层、加权计算层、输出层;
所述处理模块,执行:
将所述推荐相关数据输入到输入层,输出第一类特征向量;所述输入层包括映射子层,用于将高纬度稀疏特征向量映射成低纬度稠密特征向量;
将所述第一类特征向量输入所述专家网络层,输出Q个第二类特征向量;Q>0;
将所述第一类特征向量输入所述权重网络层,输出与S个预测任务一一对应的S个权重值集合;每个权重值集合包括与Q个第二类特征向量一一对应的Q个权重值;S>1;
将Q个第二类特征向量与S个权重值集合输入所述加权计算层,输出与S个预测任务一一对应的S个第三类特征向量;所述加权计算层用于针对每个预测任务,根据该预测任务对应的权重值集合与Q个第二类特征向量,进行加权计算;
将S个第三类特征向量输入所述输出层,输出关于S个预测任务的推荐度;所述输出层包括全连接子层。
在一些实施方式中,所述输入层还包括:特征向量裁剪Dropout子层,用于将映射子层输出的特征向量进行裁剪,得到第一类特征向量。
在一些实施方式中,所述输出层还包括:深度神经网络子层,用于利用深度神经网络,将S个第三类特征向量进一步进行特征提取,得到S个第四类特征向量;
所述全连接子层,用于将S个第四类特征向量映射成推荐度。
在一些实施方式中,所述推荐模块503,依据推荐场景将在S个预测任务上分别预测的推荐度进行筛选计算得到最终推荐度,根据最终推荐度,向所述第一用户推荐预设数量的第二用户。
图6示例性提供一种模型训练装置,包括:
定义模块601,根据N个业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N;N>1,M>0;
构建模块602,构建用于实现所述S个具体预测任务的待训练模型;
样本获取模块603,以所述N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本;每个数据样本包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
标签获取模块604,针对每个数据样本,获取该数据样本对应的S个标签,其中第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S;
训练模块605,基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型。
图7是本公开提供的一种计算机可读存储介质的示意图,该介质140上存储有计算机程序,所述程序被处理器执行时实现本公开任一实施例的推荐方法或模型训练方法。
本公开还提供了一种计算设备,包括存储器、处理器;所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现本公开任一实施例的推荐方法或模型训练方法。
图8是本公开提供的一种计算设备的结构示意图,如图8所示,该计算设备15可以包括但不限于:处理器151、存储器152、连接不同系统组件(包括存储器152和处理器151)的总线153。
其中,存储器152存储有计算机指令,该计算机指令可以被处理器131执行,使得处理器151能够执行本公开任一实施例的方法。存储器152可以包括随机存取存储单元RAM1521、高速缓存存储单元1522和/或只读存储单元ROM1523。该存储器152还可以包括:具有一组程序模块1524的程序工具1525,该程序模块1524包括但不限于:操作系统、一个或多个应用程序、其他程序模块和程序数据,这些程序模块一种或多种组合可以包含网络环境的实现。
总线153例如可以包括数据总线、地址总线和控制总线等。该计算设备15还可以通过I/O接口154与外部设备155通信,该外部设备155例如可以是键盘、蓝牙设备等。该计算设备15还可以通过网络适配器156与一个或多个网络通信,例如,该网络可以是局域网、广域网、公共网络等。如图7所示,该网络适配器156还可以通过总线153与计算设备15的其他模块进行通信。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (24)

1.一种推荐方法,包括:
获取推荐相关数据;所述推荐相关数据包括:推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,N>1,所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度;
根据所述目标模型输出的推荐度,进行推荐;
其中,所述目标模型用于对S个具体预测任务进行预测,以得到所述S个具体预测任务分别对应的推荐度,所述S个具体预测任务基于所述N个业务场景和可适用于每个业务场景的M个基本预测任务组合得到,所述N个业务场景彼此相似,其中,S=M*N,M>0;
所述目标模型通过训练得到,用于训练所述目标模型的数据样本来自N个彼此相似的业务场景,每个数据样本对应有S个标签,每个标签对应于所述S个具体预测任务中的一个具体预测任务。
2.如权利要求1所述方法,所述推荐相关对象,包括:
第一用户与用于推荐给所述第一用户的至少一个第二用户;
所述推荐相关对象在N个业务场景对应的场景共有特征,包括:
所述第一用户的用户画像特征;
所述第一用户在所述N个业务场景下的统计特征;
每个第二用户在所述N个业务场景下的统计特征。
3.如权利要求2所述方法,所述推荐相关对象在N个业务场景对应的场景共有特征,还包括:
每个第二用户的用户画像特征。
4.如权利要求2或3所述方法,所述目标模型包括:输入层、专家网络层、权重网络层、加权计算层、输出层;
将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度,包括:
将所述推荐相关数据输入到输入层,输出第一类特征向量;所述输入层包括映射子层,用于将高维度稀疏特征向量映射成低维度稠密特征向量;
将所述第一类特征向量输入所述专家网络层,输出Q个第二类特征向量;Q>0;
将所述第一类特征向量输入所述权重网络层,输出与S个预测任务一一对应的S个权重值集合;每个权重值集合包括与Q个第二类特征向量一一对应的Q个权重值;S>1;
将Q个第二类特征向量与S个权重值集合输入所述加权计算层,输出与S个预测任务一一对应的S个第三类特征向量;所述加权计算层用于针对每个预测任务,根据该预测任务对应的权重值集合与Q个第二类特征向量,进行加权计算;
将S个第三类特征向量输入所述输出层,输出关于S个预测任务的推荐度;所述输出层包括全连接子层。
5.如权利要求4所述方法,所述输入层还包括:特征向量裁剪Dropout子层,用于将映射子层输出的特征向量进行裁剪,得到第一类特征向量。
6.如权利要求4所述方法,所述输出层还包括:深度神经网络子层,用于利用深度神经网络,将S个第三类特征向量进一步进行特征提取,得到S个第四类特征向量;
所述全连接子层,用于将S个第四类特征向量映射成推荐度。
7.如权利要求4所述方法,根据所述目标模型输出的推荐度,进行推荐,包括:
依据推荐场景将在S个预测任务上分别预测的推荐度进行筛选计算得到最终推荐度,根据最终推荐度,向所述第一用户推荐预设数量的第二用户。
8.一种模型训练方法,包括:
根据N个彼此相似的业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N;N>1,M>0;
构建用于实现S个具体预测任务的待训练模型;
以N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本;每个数据样本包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
针对每个数据样本,获取该数据样本对应的S个标签,其中第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S;
基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型;
其中,所述目标模型用于对S个具体预测任务进行预测,以得到推荐相关对象分别在所述S个具体预测任务上对应的推荐度,所述S个具体预测任务分别对应的推荐度用于对所述推荐相关对象进行推荐。
9.如权利要求8所述方法,其中,如果第j个具体预测任务为预测CTR的任务,CTR为用户选择视频直播观看入口观看视频直播的概率,则数据样本的第j个标签表征:在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播,或者,在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际未选择该主播的视频直播观看入口观看视频直播。
10.如权利要求8所述方法,其中,如果第j个具体预测任务为预测CTCVR的任务,CTCVR为用户选择视频直播观看入口观看视频直播,且转化为符合指定标准的用户的概率,则数据样本的第j个标签表征:在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准;或者,在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户未发生实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准。
11.如权利要求10所述方法,其中,所述指定标准包括:已激活,或已注册,或已付费。
12.一种推荐装置,包括:
获取模块,获取推荐相关数据;所述推荐相关数据包括:推荐相关对象在N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,N>1,所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
处理模块,将所述推荐相关数据输入到目标模型,输出所述推荐相关对象对应的推荐度;
推荐模块,根据所述目标模型输出的推荐度,进行推荐;
其中,所述目标模型用于对S个具体预测任务进行预测,以得到所述S个具体预测任务分别对应的推荐度,其中,S>1,所述S个具体预测任务基于所述N个业务场景和可适用于每个业务场景的M个基本预测任务组合得到,所述N个业务场景彼此相似;
所述目标模型通过训练得到,用于训练所述目标模型的数据样本来自N个彼此相似的业务场景,每个数据样本对应有S个标签,每个标签对应于所述S个具体预测任务中的一个具体预测任务。
13.如权利要求12所述装置,所述推荐相关对象,包括:
第一用户与用于推荐给所述第一用户的至少一个第二用户;
所述推荐相关对象在N个业务场景对应的场景共有特征,包括:
所述第一用户的用户画像特征;
所述第一用户在所述N个业务场景下的统计特征;
每个第二用户在所述N个业务场景下的统计特征。
14.如权利要求13所述装置,所述推荐相关对象在N个业务场景对应的场景共有特征,还包括:
每个第二用户的用户画像特征。
15.如权利要求13或14所述装置,所述目标模型包括:输入层、专家网络层、权重网络层、加权计算层、输出层;
所述处理模块,执行:
将所述推荐相关数据输入到输入层,输出第一类特征向量;所述输入层包括映射子层,用于将高纬度稀疏特征向量映射成低纬度稠密特征向量;
将所述第一类特征向量输入所述专家网络层,输出Q个第二类特征向量;Q>0;
将所述第一类特征向量输入所述权重网络层,输出与S个预测任务一一对应的S个权重值集合;每个权重值集合包括与Q个第二类特征向量一一对应的Q个权重值;S>1;
将Q个第二类特征向量与S个权重值集合输入所述加权计算层,输出与S个预测任务一一对应的S个第三类特征向量;所述加权计算层用于针对每个预测任务,根据该预测任务对应的权重值集合与Q个第二类特征向量,进行加权计算;
将S个第三类特征向量输入所述输出层,输出关于S个预测任务的推荐度;所述输出层包括全连接子层。
16.如权利要求15所述装置,所述输入层还包括:特征向量裁剪Dropout子层,用于将映射子层输出的特征向量进行裁剪,得到第一类特征向量。
17.如权利要求15所述装置,所述输出层还包括:深度神经网络子层,用于利用深度神经网络,将S个第三类特征向量进一步进行特征提取,得到S个第四类特征向量;
所述全连接子层,用于将S个第四类特征向量映射成推荐度。
18.如权利要求15所述装置,所述推荐模块,依据推荐场景将在S个预测任务上分别预测的推荐度进行筛选计算得到最终推荐度,根据最终推荐度,向所述第一用户推荐预设数量的第二用户。
19.一种模型训练装置,包括:
定义模块,根据N个彼此相似的业务场景与可适用于每个业务场景的M个基本预测任务,定义S个由业务场景与基本预测任务组合出的具体预测任务,S=M*N;N>1,M>0;
构建模块,构建用于实现S个具体预测任务的待训练模型;
样本获取模块,以N个业务场景为数据源,获取多个推荐相关对象分别对应的数据样本;每个数据样本包括:N个业务场景对应的场景共有特征,与所述N个业务场景分别对应的场景独有特征;其中,所述共有特征包括该数据样本对应的推荐相关对象在N个业务场景下对应的对象特征;所述N个业务场景分别对应的场景独有特征,用于对所述N个业务场景进行区分;
标签获取模块,针对每个数据样本,获取该数据样本对应的S个标签,其中第j个标签用于监督该数据样本在第j个具体预测任务上对应的预测结果;j=1、……、S;
训练模块,基于每个数据样本与每个数据样本对应的S个标签,训练所述待训练模型,得到目标模型;
其中,所述目标模型用于对S个具体预测任务进行预测,以得到推荐相关对象分别在所述S个具体预测任务上对应的推荐度,所述S个具体预测任务分别对应的推荐度用于对所述推荐相关对象进行推荐。
20.如权利要求19所述装置,其中,如果第j个具体预测任务为预测CTR的任务,CTR为用户选择视频直播观看入口观看视频直播的概率,则数据样本的第j个标签表征:在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播,或者,在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际未选择该主播的视频直播观看入口观看视频直播。
21.如权利要求19所述装置,其中,如果第j个具体预测任务为预测CTCVR的任务,CTCVR为用户选择视频直播观看入口观看视频直播,且转化为符合指定标准的用户的概率,则数据样本的第j个标签表征:在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准;或者,在第j个具体预测任务对应的业务场景下,向一个用户推送一个主播的视频直播观看入口之后,该用户未发生实际选择了该主播的视频直播观看入口观看视频直播并且转化为符合指定标准。
22.如权利要求21所述装置,其中,所述指定标准包括:已激活,或已注册,或已付费。
23.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1至11任一所述的方法。
24.一种计算设备,包括存储器、处理器;所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现权利要求1至11任一所述的方法。
CN202110898520.9A 2021-08-05 2021-08-05 推荐方法、装置、介质、装置和计算设备 Active CN113672807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110898520.9A CN113672807B (zh) 2021-08-05 2021-08-05 推荐方法、装置、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110898520.9A CN113672807B (zh) 2021-08-05 2021-08-05 推荐方法、装置、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN113672807A CN113672807A (zh) 2021-11-19
CN113672807B true CN113672807B (zh) 2024-03-05

Family

ID=78541585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110898520.9A Active CN113672807B (zh) 2021-08-05 2021-08-05 推荐方法、装置、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN113672807B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115237732A (zh) * 2022-06-30 2022-10-25 华为技术有限公司 一种操作预测方法及相关装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8966394B2 (en) * 2008-09-08 2015-02-24 Apple Inc. System and method for playlist generation based on similarity data
CN107357793A (zh) * 2016-05-10 2017-11-17 腾讯科技(深圳)有限公司 信息推荐方法和装置
CN107622336A (zh) * 2016-07-15 2018-01-23 阿里巴巴集团控股有限公司 任务的推送方法、装置及系统
CN110717536A (zh) * 2019-09-30 2020-01-21 北京三快在线科技有限公司 一种生成训练样本的方法及装置
CN111291900A (zh) * 2020-03-05 2020-06-16 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法及装置
CN111523982A (zh) * 2020-04-30 2020-08-11 北京三快在线科技有限公司 商品信息推荐方法、装置、服务器及存储介质
CN112256957A (zh) * 2020-09-21 2021-01-22 北京三快在线科技有限公司 一种信息排序方法、装置、电子设备及存储介质
US10930301B1 (en) * 2019-08-27 2021-02-23 Nec Corporation Sequence models for audio scene recognition
CN112699305A (zh) * 2021-01-08 2021-04-23 网易传媒科技(北京)有限公司 多目标推荐方法、装置、计算设备以及介质
CN112800053A (zh) * 2021-01-05 2021-05-14 深圳索信达数据技术有限公司 数据模型的生成方法、调用方法、装置、设备及存储介质
US11036801B1 (en) * 2018-09-25 2021-06-15 A9.Com, Inc. Indexing and presenting content using latent interests

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11715144B2 (en) * 2019-05-24 2023-08-01 Salesforce, Inc. Dynamic ranking of recommendation pairings

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8966394B2 (en) * 2008-09-08 2015-02-24 Apple Inc. System and method for playlist generation based on similarity data
CN107357793A (zh) * 2016-05-10 2017-11-17 腾讯科技(深圳)有限公司 信息推荐方法和装置
CN107622336A (zh) * 2016-07-15 2018-01-23 阿里巴巴集团控股有限公司 任务的推送方法、装置及系统
US11036801B1 (en) * 2018-09-25 2021-06-15 A9.Com, Inc. Indexing and presenting content using latent interests
US10930301B1 (en) * 2019-08-27 2021-02-23 Nec Corporation Sequence models for audio scene recognition
CN110717536A (zh) * 2019-09-30 2020-01-21 北京三快在线科技有限公司 一种生成训练样本的方法及装置
CN111291900A (zh) * 2020-03-05 2020-06-16 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法及装置
CN111523982A (zh) * 2020-04-30 2020-08-11 北京三快在线科技有限公司 商品信息推荐方法、装置、服务器及存储介质
CN112256957A (zh) * 2020-09-21 2021-01-22 北京三快在线科技有限公司 一种信息排序方法、装置、电子设备及存储介质
CN112800053A (zh) * 2021-01-05 2021-05-14 深圳索信达数据技术有限公司 数据模型的生成方法、调用方法、装置、设备及存储介质
CN112699305A (zh) * 2021-01-08 2021-04-23 网易传媒科技(北京)有限公司 多目标推荐方法、装置、计算设备以及介质

Also Published As

Publication number Publication date
CN113672807A (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN109104620B (zh) 一种短视频推荐方法、装置和可读介质
CN110929206B (zh) 点击率预估方法、装置、计算机可读存储介质和设备
WO2019051606A1 (en) SYSTEM AND METHOD FOR CLASSIFYING PASSIVE HUMAN DEVICE INTERACTIONS VIA CURRENT DEVICE CONTEXT PERCEPTION
CN111800289B (zh) 通信网络故障分析方法和装置
CN111291071B (zh) 数据处理方法、装置及电子设备
WO2022148186A1 (zh) 行为序列数据处理方法及装置
CN110046279B (zh) 视频文件特征的预测方法、介质、装置和计算设备
CN113743607A (zh) 异常检测模型的训练方法、异常检测方法及装置
EP4002216A1 (en) Method for recommending object, neural network, computer program product and computer-readable storage medium
CN111429204A (zh) 酒店推荐方法、系统、电子设备和存储介质
CN113672807B (zh) 推荐方法、装置、介质、装置和计算设备
CN113641835B (zh) 多媒体资源推荐方法、装置、电子设备及介质
CN113742590A (zh) 一种推荐方法、装置、存储介质及电子设备
CN111680218B (zh) 用户兴趣识别方法、装置、电子设备及存储介质
CN112784157A (zh) 行为预测模型的训练方法、行为预测方法及装置、设备
CN109960745B (zh) 视频分类处理方法及装置、存储介质和电子设备
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置
CN113420165B (zh) 二分类模型的训练、多媒体数据的分类方法及装置
CN113342988B (zh) 一种基于lda跨域的构建服务知识图谱实现服务组合优化的方法及系统
CN114139059A (zh) 资源推荐模型的训练方法、资源推荐方法及装置
CN112287144A (zh) 图片检索方法、设备及存储介质
CN114781557B (zh) 图像信息获取方法及装置、计算机可读存储介质
CN110516024B (zh) 地图搜索结果展现方法、装置、设备和存储介质
CN112925972B (zh) 信息推送方法、装置、电子设备和存储介质
CN114528472A (zh) 资源推荐模型训练方法、资源信息推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant