CN110704739A - 资源推荐方法、装置及计算机存储介质 - Google Patents

资源推荐方法、装置及计算机存储介质 Download PDF

Info

Publication number
CN110704739A
CN110704739A CN201910939300.9A CN201910939300A CN110704739A CN 110704739 A CN110704739 A CN 110704739A CN 201910939300 A CN201910939300 A CN 201910939300A CN 110704739 A CN110704739 A CN 110704739A
Authority
CN
China
Prior art keywords
resource
user
vector
candidate
creatives
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910939300.9A
Other languages
English (en)
Other versions
CN110704739B (zh
Inventor
李忆纯
王伊凡
张众一
徐宁文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanhai Information Technology Shanghai Co Ltd
Original Assignee
Hanhai Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanhai Information Technology Shanghai Co Ltd filed Critical Hanhai Information Technology Shanghai Co Ltd
Priority to CN201910939300.9A priority Critical patent/CN110704739B/zh
Publication of CN110704739A publication Critical patent/CN110704739A/zh
Application granted granted Critical
Publication of CN110704739B publication Critical patent/CN110704739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请公开了一种资源推荐方法、装置及计算机存储介质,属于信息处理技术领域。所述方法包括:根据目标用户的用户关联特征,通过用户向量模型确定目标用户的用户向量,用户关联特征包括用户特征和浏览资源创意的行为特征;获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,资源关联特征包括资源内容特征和资源创意特征;根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给目标用户。本申请基于内容特征和创意特征这两方面来为用户推荐资源,提高了推荐准确度。

Description

资源推荐方法、装置及计算机存储介质
技术领域
本申请涉及信息处理技术领域,特别涉及一种资源推荐方法、装置及计算机存储介质。
背景技术
随着互联网技术的发展,浏览网络资源逐渐成为用户日常娱乐的主要方式之一,如何通过更加精准的推荐算法推荐用户感兴趣的网络资源成为各个资源平台中重点关注的问题。其中,网络资源可以为文章、评价攻略或视频等。
相关技术中,资源平台一般根据网络资源的资源内容来对用户进行资源推荐。具体地,资源平台可以获取目标用户的用户特征,以及候选资源集中每个候选资源的资源内容特征,根据目标用户的用户特征以及每个候选资源的资源内容特征,通过资源推荐模型确定每个候选资源的推荐概率,然后,根据多个候选资源的推荐概率,从多个候选资源中选择推荐概率较高的预设数目个候选资源推荐给目标用户。其中,推荐概率用于指示对应候选资源被目标用户浏览的可能性。
相关技术中仅能根据资源内容来对用户进行资源推荐,资源推荐方式较为单一,为用户推荐的网络资源可能不是用户感兴趣的网络资源,用户感兴趣资源的召回准确度较低。
发明内容
本申请实施例提供了一种资源推荐方法,可以准确的为用户推荐用户感兴趣的网络资源。所述技术方案如下:
第一方面,提供了一种资源推荐方法,所述方法包括:
当接收到目标用户的资源推荐请求时,获取所述目标用户的用户关联特征,所述用户关联特征包括用户特征和浏览资源创意的行为特征,所述资源创意是指从网络资源的资源内容中提取的、用于吸引用户浏览资源内容的资源信息;
根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量,所述用户向量模型用于确定任一用户的用户向量;
获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,所述资源关联特征包括资源内容特征和资源创意特征,所述资源向量模型用于确定任一资源的资源向量;
根据每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户。
可选地,所述资源创意特征包括创意高阶特征和创意向量特征,所述创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种,所述创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征。
可选地,所述用户关联特征还包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种,所述资源关联特征还包括资源发布者特征。
可选地,所述根据每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户,包括:
按照资源向量与所述目标用户的用户向量之间的相似度从大到小的顺序,从所述候选资源集中选取排序在前的N个候选资源,所述N为正整数;
按照资源向量与所述目标用户的用户向量之间的相似度,对所述N个候选资源进行排序;
将排序后的N个候选资源推荐给所述目标用户。
可选地,所述根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量之前,还包括:
获取多个样本数据,每个样本数据包括样本用户的用户关联特征、样本资源的资源关联特征、以及浏览标签,所述浏览标签用于指示所述样本用户是否浏览了所述样本资源;
根据每个样本数据中的用户关联特征,通过待训练用户向量模型确定样本用户向量,以及根据每个样本数据中的资源关联特征,通过待训练资源向量模型确定样本资源向量;
计算每个样本数据对应的样本用户向量和样本资源向量之间的相似度,所述相似度用于指示样本资源向量对应的样本资源被样本用户向量对应的样本用户浏览的可能性;
根据每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度,对所述待训练用户向量模型和所述待训练资源向量模型的模型参数进行调整;
将模型参数调整后的待训练用户向量模型和待训练资源向量模型,分别确定为所述用户向量模型和所述资源向量模型。
可选地,所述获取候选资源集包括的多个候选资源中每个候选资源的资源向量,包括:
获取所述候选资源集中每个候选资源的资源关联特征;
根据每个候选资源的资源关联特征,通过所述资源向量模型确定每个候选资源的资源向量。
可选地,所述获取候选资源集中每个候选资源的资源关联特征之前,还包括:
获取多个资源创意,所述多个资源创意为多个备选资源对应的资源创意;
根据所述多个资源创意,通过先验模型确定所述多个资源创意的第一评估值,所述第一评估值用于指示资源创意被用户浏览的可能性,所述先验模型用于确定任一资源创意的评估值;
根据所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意;
将选取的资源创意对应的备选资源,确定为所述候选资源集中的多个候选资源。
可选地,所述根据所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意,包括:
根据对应资源创意的第一评估值,按照损失控制策略从所述多个备选资源中选择备选资源进行在线曝光;
根据选择的备选资源在线曝光后的用户浏览结果和所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意。
可选地,所述根据选择的备选资源在线曝光后的用户浏览结果和所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意,包括:
根据选择的备选资源在线曝光后的用户浏览结果,对所述选择的备选资源对应的资源创意的第一评估值进行调整,得到所述选择的备选资源对应的资源创意的第二评估值;
根据所述选择的备选资源对应的资源创意的第二评估值,对所述先验模型的模型参数进行调整;
基于模型参数调整后的先验模型,确定所述多个资源创意的第三评估值;
根据所述选择的备选资源对应的资源创意的第二评估值,以及所述多个资源创意的第三评估值,从所述多个资源创意中选取满足条件的资源创意。
可选地,所述根据所述多个资源创意,通过先验模型确定所述多个资源创意的第一评估值之前,还包括:
获取多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和所述两个资源创意的标注数据,所述两个资源创意的标注数据用于指示所述两个资源创意被用户浏览的概率的高低;
根据所述多个资源创意对样本,对待训练先验模型进行训练,得到所述先验模型。
第二方面,提供了一种资源推荐装置,所述装置包括:
第一获取模块,用于当接收到目标用户的资源推荐请求时,获取所述目标用户的用户关联特征,所述用户关联特征包括用户特征和资源创意浏览行为特征,资源创意是指从资源内容中提取的用于吸引用户浏览资源内容的资源信息;
第一确定模块,用于根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量,所述用户向量模型用于确定任一用户的用户向量;
第二获取模块,用于获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,所述资源关联特征包括资源内容特征和资源创意特征,所述资源向量模型用于确定任一资源的资源向量;
推荐模块,用于根据每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户。
可选地,所述资源创意特征包括创意高阶特征和创意向量特征,所述创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种,所述创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征。
可选地,所述用户关联特征还包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种,所述资源关联特征还包括资源发布者特征。
可选地,所述推荐模块,包括:
第一选取子模块,用于按照资源向量与所述目标用户的用户向量之间的相似度从大到小的顺序,从所述候选资源集中选取排序在前的N个候选资源,所述N为正整数;
排序子模块,用于按照资源向量与所述目标用户的用户向量之间的相似度,对所述N个候选资源进行排序;
推荐子模块,用于将排序后的N个候选资源推荐给所述目标用户。
可选地,所述装置,还包括:
第三获取模块,用于获取多个样本数据,每个样本数据包括样本用户的用户关联特征、样本资源的资源关联特征、以及浏览标签,所述浏览标签用于指示所述样本用户是否浏览了所述样本资源;
第二确定模块,用于根据每个样本数据中的用户关联特征,通过待训练用户向量模型确定样本用户向量,以及根据每个样本数据中的资源关联特征,通过待训练资源向量模型确定样本资源向量;
计算模块,用于计算每个样本数据对应的样本用户向量和样本资源向量之间的相似度,所述相似度用于指示样本资源向量对应样本资源被样本用户向量对应样本用户浏览的可能性;
调整模块,用于根据每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度,对所述待训练用户向量模型和所述待训练资源向量模型的模型参数进行调整;
第三确定模块,用于将模型参数调整后的待训练用户向量模型和待训练资源向量模型,分别确定为所述用户向量模型和所述资源向量模型。
可选地,所述装置,包括:
第四获取模块,用于获取候选资源集中每个候选资源的资源关联特征;
第四确定模块,用于根据每个候选资源的资源关联特征,通过所述资源向量模型确定每个候选资源的资源向量。
可选地,所述装置,还包括:
第五获取模块,用于获取多个资源创意,所述多个资源创意为多个备选资源对应的资源创意;
第五确定模块,用于根据所述多个资源创意,通过先验模型确定所述多个资源创意的第一评估值,所述第一评估值用于指示资源创意被用户浏览的可能性,所述先验模型用于确定任一资源创意的评估值;
选取模块,用于根据所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意;
第六确定模块,用于将选取的资源创意对应的备选资源,确定为所述候选资源集中的多个候选资源。
可选地,所述选取模块,包括:
选择子模块,用于根据对应资源创意的第一评估值,按照损失控制策略从所述多个备选资源中选择备选资源进行在线曝光;
第二选取子模块,用于根据选择的备选资源在线曝光后的用户浏览结果和所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意。
可选地,所述第二选取子模块,包括:
第一调整单元,用于根据选择的备选资源在线曝光后的用户浏览结果,对所述选择的备选资源对应的资源创意的第一评估值进行调整,得到所述选择的备选资源对应的资源创意的第二评估值;
第二调整单元,用于根据所述选择的备选资源对应的资源创意的第二评估值,对所述先验模型的模型参数进行调整;
确定单元,用于基于模型参数调整后的先验模型,确定所述多个资源创意的第三评估值;
选取单元,用于根据所述选择的备选资源对应的资源创意的第二评估值,以及所述多个资源创意的第三评估值,从所述多个资源创意中选取满足条件的资源创意。
可选地,所述装置,还包括:
第六获取模块,用于获取多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和所述两个资源创意的标注数据,所述两个资源创意的标注数据用于指示所述两个资源创意被用户浏览的概率的高低;
训练模块,用于根据所述多个资源创意对样本,对待训练的先验模型进行训练,得到所述先验模型。
第三方面,提供了一种资源推荐装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述第一方面所述任一方法的步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述第一方面所述任一方法的步骤。
本申请实施例提供的技术方案带来的有益效果至少包括:
在本申请实施例中,当接收到目标用户的资源推荐请求时,可以根据目标用户的用户特征和浏览资源创意的行为特征,确定目标用户的用户向量,以及根据候选资源集中每个候选资源的资源内容特征和资源创意特征,确定每个候选资源的资源向量,然后根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中确定待推荐给目标用户的候选资源。由于可以基于资源内容特征和资源创意特征这两方面来为用户推荐网络资源,因此推荐给用户的每个网络资源在内容和创意上都更符合用户的浏览兴趣,提高了用户感兴趣资源的召回准确率,使得推荐更精准,更加满足用户需求。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种资源推荐系统的示意图;
图2是本申请实施例提供的一种实施环境的示意图;
图3是本申请实施例提供的另一种资源推荐系统的示意图;
图4是本申请实施例提供的一种候选资源集的确定方法流程图;
图5是本申请实施例提供的一种精选资源创意候选集的方法流程图;
图6是本申请实施例提供的一种确定用户向量模型和资源向量模型的方法流程图;
图7是本申请实施例提供的一种资源推荐的方法流程图;
图8是本申请实施例提供的一种内容创意召回示意图;
图9是本申请实施例提供的一种资源推荐装置的结构示意图;
图10是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的一种资源推荐方法进行解释说明之前,先对本申请实施例的应用场景进行解释说明。
在互联网时代,资源平台可以为用户提供海量的网络资源,每个资源平台可以通过推荐系统来对网络资源进行筛选后,对用户感兴趣的网络资源进行有目的地召回,并对召回的网络资源进行精准排序后推荐给用户。目前业界主流的推荐系统仅针对内容本身来确定推荐资源,其中直面用户的资源创意信息仅在精准排序中用作特征使用,并不会在内容级创意层面进行个性化的优选,即每个资源内容展示给用户的资源创意都是一样的。
请参考图1,各个资源平台的推荐系统架构各不相同,但基本都会包四层,图1是本申请实施例提供的一种资源推荐系统100的示意图,如图1所示,该推荐系统一般都包括:数据特征层101、内容创意召回层102、精准排序层103 和应用层104。需要说明的是,区别于相关技术中以资源内容作为推荐网络资源筛选标准的推荐系统,本申请在通过创意内容召回层102完成用户感兴趣的资源内容召回的同时也优选出资源内容对应的、最适合用户的资源创意,也即是在创意内容召回层102中根据资源创意和资源内容召回用户感兴趣的网络资源,然后将召回的网络资源交给精准排序层103进行排序,并将排序结果传递至应用层104,进而呈现在终端的显示界面上,供用户浏览。本申请的资源推荐系统可以提高资源推荐效果,且对于推荐效果提升的假设是在内容质量基本盘不变的情况下变向大幅扩充了候选集,同时对资源进行创意级的建模,使得所推荐资源的资源创意更贴近用户真实的感知,个性化的粒度更精细更精准。
图2是本申请实施例提供的一种实施环境的示意图,如图2所示,该实施环境200包括多个终端201和服务器202,每个终端201和服务器202之间通过有线或无线方式连接以进行通信。
其中,图1所示的资源推荐系统部署在服务器202中。基于任一终端201 发送的资源推荐请求,当服务器202接收到该资源推荐请求时,启动资源推荐系统,从海量网络资源中筛选出该终端201对应用户感兴趣的网络资源,并将确定的网络资源发送给终端201,由终端201展示给用户。
在本申请实施例中,终端201可以为手机、台式计算机、笔记本电脑等设备,图2所示的实施环境示意图仅是以3个手机作为终端进行举例说明,并不构成对本申请实施例的限定。
此外,对于部署在服务器202上的资源推荐系统,为了保证增添资源创意的优选后内容创意召回层和精准排序层之间的协同运行,进而保证召回的网络资源是基于资源创意和资源内容进行优选过的,本申请在资源推荐系统中还增加了创意探索与利用机制,该创意探索与利用机制用于探索用户浏览率较高的资源创意,进而基于探索出的资源创意生成候选资源集。
图3是本申请实施例提供的另一种资源推荐系统的示意图,如图3所示,资源推荐系统300包括数据特征层301、内容创意召回层302、精准排序层303、应用层304,以及增加的创意探索与利用机制305。在资源推荐系统300中,由于增加了创意探索与利用机制,所以为了保证精准排序层和内容创意召回层之间的协同工作,在两层传递网络资源的过程中加入了训练样本、特征维度以及模型结构来保证层间协同和联动。
可选地,创意探索与利用机制305可以用于实现以下三个方面的功能:
1、在整个资源推荐系统的启动阶段,创意探索与利用机制用于积累资源创意对样本,每个资源创意对样本包括同一样本资源对应的不同的两个的资源创意以及这两个资源创意的标注数据,这两个资源创意的标注数据用于指示这两个资源创意被用户浏览的概率的高低。此外,根据积累的资源创意对样本,创意探索与利用机制根据这些资源创意对样本训练先验模型,该先验模型用于为网络资源对应的资源创意进行打分,评选最符合用户浏览习惯的资源创意。
2、创意探索与利用机制还可以为创意召回层和精准排序层推荐网络资源的过程中提供基于资源创意的训练样本,训练样本包括上述资源创意对样本对应的网络资源。同时创意探索与利用机制还为内容创意召回层确定待推荐资源集的过程中积累资源创意相关的数据,该数据包括先验模型对每个资源创意的评估值,以及该资源创意对应的网络资源曝光后的用户点击数据,根据上述评估值和用户点击数据调整先验模型的参数,持续优化先验模型。
3、此外,创意探索与利用机制根据先前终端反馈的资源创意对应的网络资源曝光后的用户点击数据,完成资源创意的曝光分配,获得最符合用户浏览兴趣的一个最优的资源创意。
另外,在资源推荐系统300中,特征维度机制用于将每个网络资源整体划分为器对应的资源内容和资源创意两个维度。划分过程通过包括但不限于各类 CF(CollaborativeFiltering,协同过滤算法)、MF(Matrix Factorization,基于矩阵分解)去挖掘资源推荐系统中数据特征层301中每个网络资源所对应的数据特征。特征维度机制对于挖掘的数据特征采用包括但不限于曝光后点击量统计的过滤逻辑对挖掘的数据特征进行筛选。通过上述数据特征挖掘和数据特征的筛选,特征维度机制的引入可以通过包括PV(Page View,网站浏览量),以及CTR(Click Through Rate,点击率)对数据特征进行用户反馈的统计,保证在推荐给用户的资源内容不变的情况下,加入了资源创意维度的数据筛选,扩大了数据筛选的范围。
另外,在资源推荐系统300中,模型结构机制包括用户向量模型和资源向量模型两种,上述两种模型组成的模型结构也可以称为双塔结构的深度模型。用户向量模型和资源向量模型均需要采用样本数据进行预训练获得,其中,资源向量模型通过预训练资源创意特征机制来进行训练。上述预训练资源创意特征机制提供包括资源内容特征和资源创意特征的双端特征。
本申请实施例中,资源推荐系统可以基于资源创意和资源内容在海量的网络资源中确定用户感兴趣的网络资源。而在进行资源推荐之前,需要先从海量网络资源中精选出用于进行资源推荐的候选资源集,候选资源集中的每个候选资源包括资源内容和资源创意。下面将对候选资源集的精选方法进行详细说明。
图4是本申请实施例提供的一种候选资源集的确定方法流程图,该方法应用于资源推荐装置中,该装置可以为终端或服务器等设备。该方法包括如下步骤:
步骤401:获取多个资源创意,多个资源创意为多个备选资源对应的资源创意。
需要说明的是,本申请实施例中所推荐的网络资源包括资源内容和资源创意。资源创意是指从网络资源的资源内容中提取的、用于吸引用户浏览资源内容的资源信息,比如资源创意可以为图片和/或标题。资源内容是指资源的具体内容,用户可以通过触发资源创意来浏览具体的资源内容。比如,用户可以通过点击网络资源的标题,浏览到具体的资源内容。
另外,该多个资源创意可以包括同一备选资源对应的m个资源创意,m为大于或等于1的整数。也即是,某个备选资源可以对应有1个资源创意,也可以对应有多个不同的资源创意。
作为一个示例,该多个资源创意可以从大量用户的历史资源创意浏览行为数据中获取得到,比如,该多个资源创意可以为历史浏览数据中用户点击率较高的资源创意。
步骤402:根据多个资源创意,通过先验模型确定多个资源创意的第一评估值,第一评估值用于指示资源创意被用户浏览的可能性,先验模型用于确定任一资源创意的评估值。
其中,第一评估值越高,表示资源创意被用户浏览的可能性越大,即用户被该资源创意吸引,进而点击浏览该资源创意的可能性大。作为一个示例,第一评估值可以为0%-100%之间的任一数值,该数值用于表示资源创意会被用户浏览到的概率。
其中,该先验模型可以预先根据创意样本数据进行训练得到,创意样本数据包括多个样本资源创意以及对应的样本标签,样本标签用于指示对应样本资源创意的样本评估值。示例的,该创意样本数据可以为多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和两个资源创意的标注数据,两个资源创意的标注数据用于指示两个资源创意被用户浏览的概率的高低。
在一种可能的实现方式中,可以将该多个资源创意作为该先验模型的输入,通过该先验模型对每个资源创意进行打分,输出每个资源创意的第一评估值。
接下来将以根据多个资源创意对样本对先验模型进行训练为例,对先验模型的训练过程进行说明。作为一个示例,先验模型的训练过程包括如下步骤:
1)获取多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和两个资源创意的标注数据,两个资源创意的标注数据用于指示两个资源创意的优劣。
示例的,质量较优的资源创意的标注数据为1,质量较差的资源创意的标注数据为0。进一步地,资源创意的优劣可以根据用户浏览的概率的高低确定,浏览概率越高,资源创意的质量越优。比如,两个资源创意的标注数据用于指示两个资源创意被用户浏览的概率的高低。
在本申请实施例中,可以对网络资源中的资源创意进行标注,根据先验模型标注的标注数据,快速确定两个资源创意中哪个资源创意更符合用户的点击习惯。
在资源平台的海量网络资源中,每个网络资源可以由资源内容和资源创意两部分组成,也即是,不同的资源内容和不同的资源创意组成不同的网络资源。比如,对于资源内容A,在该资源内容A对应的多个网络资源中可能有多个不同的资源创意,如下表1所示,资源内容为A的网络资源可以有网络资源1-网络资源7。
表1
Figure BDA0002222448310000131
同理,对于资源创意A,在该资源创意A对应的多个网络资源中可能有多个不同的资源内容,如下表2所示,资源创意为A的网络资源可以有网络资源 11-网络资源15。
表2
网络资源 资源内容 资源创意
网络资源11 资源内容A 资源创意A
网络资源12 资源内容B 资源创意A
网络资源13 资源内容C 资源创意A
网络资源14 资源内容D 资源创意A
网络资源15 资源内容E 资源创意A
对于资源平台中的网络资源,同一资源内容对应不同的两个资源创意可以组成一个资源创意对样本。此外,对于同一资源内容对应的两个不同的资源创意,可以根据基于每个资源创意浏览对应的网络资源的历史用户点击数据,对资源创意进行标注,得到对应的标注数据。比如,将历史用户点击率高的资源创意标注为1,将历史用户点击率低的资源创意标注为0。
2)根据多个资源创意对样本,对待训练先验模型进行训练,得到先验模型。
作为一个示例,模型训练过程包括:将每个创意对样本包括的资源创意作为待训练先验模型的输入,通过待训练先验模型确定每个资源创意的评估值,将评估值与资源创意对应的标注数据进行比较,根据比较结果对待训练的先验模型的模型参数进行调整。示例的,可以采用随机梯度下降法,根据比较结果对待训练的先验模型的模型参数进行调整。
比如,对于创意对样本包括的资源创意A和资源创意B,对应的资源创意 A的标注数据为1,资源创意B的标注数据为0,表示资源创意A比资源创意B 更符合用户的浏览兴趣。假设待训练先验模型对资源创意A的评估打分为20%,对资源创意B的评估打分为70%,则表示资源创意B比资源创意A更符合用户的浏览兴趣。由于预测结果与标注数据不一致,则调整待训练先验模型的模型参数,使得待训练先验模型对于创意对样本中资源创意的评估打分结果逐渐趋近于标注数据。
需要说明的是,先验模型的训练是一个持续的过程,需要根据用户的历史点击数据去不断优化先验模型。对于输入先验模型的资源创意,可以通过先验模型的持续优化,使得先验模型输出的评估打分结果更加准确。
步骤403:根据多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意。
本申请实施例中,根据多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意的操作可以包括以下几种实现方式:
第一种可能的实现方式:从多个资源创意中选取第一评估值大于预设评估值的创意资源。
其中,该预设评估值可以预先设置,可以由推荐装置默认设置,也可以由技术人员实现设置。示例的,预设评估值可以为50%或60%等。
第二种可能的实现方式:根据对应资源创意的第一评估值,按照损失控制策略从多个备选资源中选择备选资源进行在线曝光;根据在线曝光后的用户浏览结果和多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意。
其中,该损失控制策略用于根据选择曝光的资源创意与用户体验损失之间的平衡,控制该多个资源创意的曝光分布权重,使得选择的资源创意被曝光后仍然能够保证一定程度的用户访问量。示例的,该损失控制策略可以为基于 E-Greedy(贪婪算法)的损失控制策略。
在将选择的备选资源进行在线曝光后,可以对在线曝光后的用户浏览结果进行统计,然后结合在线曝光后的用户浏览结果和先验模型的评估结果,从多个资源创意精选资源创意。
作为一个示例,根据在线曝光后的用户浏览结果和多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意可以包括如下步骤:
1)根据选择的备选资源在线曝光后的用户浏览结果,对选择的备选资源对应的资源创意的第一评估值进行调整,得到选择的备选资源对应的资源创意的第二评估值。
比如,可以根据在线曝光后的用户浏览结果,对资源创意对样本中的资源创意的优劣重新进行判断,根据判断结果重新累积资源创意对样本。
示例的,可以先对在线曝光后的用户浏览结果进行阶梯平滑,然后根据阶梯平滑结果对资源创意对样本中的资源创意的优劣重新进行判断,根据判断结果重新累积资源创意对样本。
2)根据选择的备选资源对应的资源创意的第二评估值,对先验模型的模型参数进行调整。
如此,可以根据在线曝光结果,对先验模型的模型参数进行调整,进而实现对先验模型的持续优化,使得先验模型的评估结果更加准确。
3)根据选择的备选资源对应的资源创意的第二评估值,以及先验模型的模型评估结果,从多个资源创意中选取满足条件的资源创意。
作为一个示例,可以基于模型参数调整后的先验模型,确定多个资源创意的第三评估值;根据选择的备选资源对应的资源创意的第二评估值,以及多个资源创意的第三评估值,从多个资源创意中选取满足条件的资源创意。
如此,可以综合在线曝光结果和优化后的先验模型的模型评估结果,精选用于进行资源推荐的资源创意候选集。
作为一个示例,精选资源创意候选集的过程可以如图5所示。
步骤404:资源推荐系统将选取的资源创意对应的备选资源,确定为候选资源集中的多个候选资源。
作为一个示例,图4实施例中确定候选资源集的过程可以离线执行。
本申请实施例中,在推荐系统增加了创意探索与利用机制,可以通过先验模型对网络资源的资源创意进行评估打分,根据评估结果精选内容创意召回层使用的资源创意候选集。较相关技术而言,创意探索与利用机制的引入,为内容创意召回层在召回网络资源的过程中提供了关于资源创意维度的筛选,保证召回网络资源资源内容和资源创意两个方面都更符合用户的浏览兴趣,召回准确度高。
本申请实施例中,在对用户进行资源推荐时,需要用到一个用户向量模型和一个资源向量模型,用户向量模型用于根据用户的用户关联特征输出用户向量,资源向量模型用于根据资源的资源关联特征输出资源向量。下面将先对用户向量模型和资源向量模型的训练过程进行解释说明。
图6是本申请实施例提供的一种训练用户向量模型和资源向量模型的方法流程图,该方法应用于资源推荐装置中,该装置可以为终端或服务器等设备。
该方法包括如下步骤:
步骤601:获取多个样本数据,每个样本数据包括样本用户的用户关联特征、样本资源的资源关联特征、以及浏览标签,浏览标签用于指示样本用户是否浏览了样本资源。
其中,用户关联特征包括用户特征和浏览资源创意的行为特征。用户特征用于指示用户本身的一些特征,比如性别、年龄、职业或所在城市等属性特征;浏览资源创意的行为特征可以包括包括用户历史上所浏览过的一些资源创意的资源创意特征,可选地,浏览资源创意的行为特征可以从用户的历史浏览数据中获取得到。可选地,用户关联特征还可以包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种。
其中,样本资源的资源关联特征包括样本资源对应的资源内容特征和资源创意特征。资源内容特征指示样本资源的内容本身的一些特征,资源内容可以可以为文章,评论或视频等。资源创意特征包括创意高阶特征和创意向量特征,创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种。图片标签可以为二分类标签或多分类标签,比如图像标签可以包括人像、菜品、环境等二分类标签,以及菜品、类别、属性等多分类标签。文本标签可以包括主题或关键字等。创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征,创意向量特征可以为面向不同分类目标的提取向量、面向应用场景的点击转化目标的二分类提取向量,以及没有目标时,创意向量特征提取的隐式自编码向量等。可选地,资源关联特征还包括资源发布者特征,即作者特征。
步骤602:根据每个样本数据中的用户关联特征,通过待训练用户向量模型确定样本用户向量,以及根据每个样本数据中的资源关联特征,通过待训练资源向量模型确定样本资源向量。
在一种可能的实现方式中,将每个样本数据中的用户关联特征作为待训练用户向量模型的输入,通过待训练用户向量模型输出样本用户向量。将每个样本数据中的资源关联特征作为待训练资源向量模型的输入,通过待训练资源模型输出样本资源向量。
步骤603:计算每个样本数据对应的样本用户向量和样本资源向量之间的相似度,相似度用于指示样本资源向量对应的样本资源被样本用户向量对应的样本用户浏览的可能性。
步骤604:根据每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度,对待训练用户向量模型和待训练资源向量模型的模型参数进行调整。
在一种可能的实现方式中,可以将每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度进行比较,根据比较结果,对待训练用户向量模型和待训练资源向量模型的模型参数进行调整。
示例的,可以根据比较结果,采用随机梯度下降法对待训练用户向量模型和待训练资源向量模型的模型参数进行调整。
比如,若样本数据对应的样本用户向量和样本资源向量之间的相似度为 80%,但浏览标签指示样本用户没有浏览样本资源,即浏览标签为0,则可以计算80%与0之间的误差,根据该误差对待训练用户向量模型和待训练资源向量模型的模型参数进行调整,使得两者输出的用户向量和资源向量之间的相似度逐渐趋近于0。
步骤605:将模型参数调整后的待训练用户向量模型和待训练资源向量模型,分别确定为用户向量模型和资源向量模型。
这样,对于确定的用户向量模型和资源向量模型,当有新的用户关联特征或新的资源关联特征出现时,用户向量模型和资源向量模型输出用户向量和资源向量的准确定更高。
作为一个示例,图6实施例中训练用户向量模型和资源向量模型的过程可以离线执行。
本申请实施例中,可以基于上述训练好的用户模型和资源向量模型,为用户进行资源推荐。下面将对本申请提供的资源推荐方法进行解释说明。
图7是本申请实施例提供的一种资源推荐的方法流程图,该方法应用于资源推荐装置中,该资源推荐装置可以为终端或服务器等设备。该方法包括如下步骤:
步骤701:当接收到目标用户的资源推荐请求时,获取该目标用户的用户关联特征,用户关联特征包括用户特征和浏览资源创意的行为特征,资源创意是指从网络资源的资源内容中提取的、用于吸引用户浏览资源内容的资源信息。
其中,网络资源可以为视频、音频、文本或攻略等。资源推荐请求可以由目标用户的资源搜索操作或页面刷新操作触发,也可以由其他条件触发,本申请实施例对该资源推荐请求的触发方式不做限定。
其中,用户关联特征包括用户特征和浏览资源创意的行为特征。用户特征用于指示用户本身的一些特征,比如性别、年龄、职业或所在城市等属性特征;浏览资源创意的行为特征可以包括包括用户历史上所浏览过的一些资源创意的资源创意特征,可选地,浏览资源创意的行为特征可以从用户的历史浏览数据中获取得到。可选地,用户关联特征还可以包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种。
当接收到来自目标用户的在线资源推荐请求时,可以获取目标用户的用户信息,先从目标用户的用户信息中提取目标用户的上述用户关联特征。
步骤702:根据目标用户的用户关联特征,通过用户向量模型确定目标用户的用户向量,用户向量模型用于确定任一用户的用户向量。
在一种可能的实现方式中,可以将目标用户的用户关联特征作为用户向量模型的输入,通过用户向量模型输出目标用户的用户向量。
作为一个示例,请参考图8,图8是本申请实施例提供的一种内容创意召回示意图,如图8所示,可以在离线训练用户向量模型和资源向量模型,在线状态下,当接收到任一用户的资源推荐请求时,可以从用户信息中提取用户特征、上下文特征、历史浏览数据特征和浏览资源创意的行为特征,将这些特征输入到如图8所示的用户向量模型中,得到该用户的用户向量。本示例中,可以根据用户关联特征,通过用户向量模型在线实时计算用户的用户向量,获取用户向量的准确度更高。
在另一种可能的实现方式中,可以从用户标识和用户向量的对应关系中查找目标用户的用户向量。其中,用户标识和用户向量的对应关系中存储有多个用户标识以及每个用户标识对应的用户向量,每个用户标识对应的用户向量可以预先根据该用户标识对应用户的用户关联特征,通过用户向量模型确定得到。
作为另一示例,在图8所示的内容创意召回示意图中,资源推荐系统在离线训练用户向量模型时,获取了大量的样本数据,该样本数据中包括有用户关联特征,该用户关联特征包括用户特征和资源创意浏览行为特征,将用户关联特征输入用户向量模型时,用户向量模型计算其对应的用户向量。基于上述过程,在预训练用户向量模型的过程中,已经保存了多个用户关联特征对应的用户向量,并将这种对应关系保存在用户向量集中,所以当接收到目标用户携带有用户关联特征的资源推荐请求时,资源推荐系统可以在用户向量集中直接获取该用户关联特征对应的用户向量。本示例中,由于离线预先计算了各个用户的用户向量,因此在线获取用户向量的速度较快,提供了获取用户向量的效率。
步骤703:获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,资源关联特征包括资源内容特征和资源创意特征,资源向量模型用于确定任一资源的资源向量。
其中,候选资源的资源关联特征包括候选资源对应的资源内容特征和资源创意特征。资源内容特征指示样本资源的内容本身的一些特征,资源内容可以可以为文章,评论或视频等。资源创意特征包括创意高阶特征和创意向量特征,创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种。图片标签可以为二分类标签或多分类标签,比如图像标签可以包括人像、菜品、环境等二分类标签,以及菜品、类别、属性等多分类标签。文本标签可以包括主题或关键字等。创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征,创意向量特征可以为面向不同分类目标的提取向量、面向应用场景的点击转化目标的二分类提取向量,以及没有目标时,创意向量特征提取的隐式自编码向量等。可选地,资源关联特征还包括资源发布者特征,即作者特征。
对于候选资源集包括的多个候选资源中每个候选资源的资源向量,获取每个候选资源的资源向量的过程可以包括如下两种方式:
第一种可能的实现方式:从候选资源的资源信息中提取候选资源的资源关联特征,根据该候选资源的资源关联特征,通过资源向量模型确定该候选资源的资源向量。
作为一个示例,请参考图8,当接收到任一用户的资源推荐请求时,可以从提取候选资源集中每个候选资源的资源内容特征、资源发布者特征、创意高阶特征和创意向量特征,然后将这些特征输入到如图8所示的资源向量模型中,得到每个候选资源的资源向量。本示例中,可以根据每个候选资源的资源关联特征,通过资源向量模型在线实时计算每个候选资源的资源向量,获取资源向量的准确度更高。
在另一种可能的实现方式中,可以从候选资源标识和资源向量的对应关系中查找候选资源集中每个候选资源的资源向量。其中,候选资源标识和资源向量的对应关系中存储有多个候选资源标识以及每个候选资源标识对应的资源向量,每个候选资源标识对应的资源向量可以预先根据该候选资源标识对应候选资源的资源关联特征,通过资源向量模型确定得到。
作为另一个示例,如图8所示,该资源推荐系统在离线时通过资源向量模型,计算候选资源集中每个候选资源的资源向量,并存储在资源向量集中。在线进行资源召回时,可以直接根据每个候选资源的资源索引,从资源向量集中获取每个候选资源的资源向量。本示例中,由于离线预先计算了各个候选资源的资源向量,因此在线获取资源向量的速度较快,提供了获取资源向量的效率。
步骤704:根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给目标用户。
其中,该相似度用于指示目标用户浏览每个候选资源的可能性。相似度越高,目标用户浏览候选资源的可能性较大,即用户对该候选资源感兴趣的程度越高。
在一种可能的实现方式中,先计算每个候选资源的资源向量与目标用户的用户向量之间的相似度,然后根据计算的相似度,从候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给目标用户。
在一种可能的实现方式中,根据确定的多个资源向量与目标用户的用户向量之间的多个相似度,按照资源向量与目标用户的用户向量之间的相似度从大到小的顺序,从候选资源集中选取排序在前的N个候选资源,N为正整数。然后按照资源向量与目标用户的用户向量之间的相似度,对选取的N个候选资源进行排序,并将排序后的N个候选资源推荐给目标用户。
在本申请实施例中,当接收到目标用户的资源推荐请求时,可以根据目标用户的用户特征和浏览资源创意的行为特征,确定目标用户的用户向量,以及根据候选资源集中每个候选资源的资源内容特征和资源创意特征,确定每个候选资源的资源向量,然后根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中确定待推荐给目标用户的候选资源。由于可以基于资源内容特征和资源创意特征这两方面来为用户推荐网络资源,因此推荐给用户的每个网络资源在内容和创意上都更符合用户的浏览兴趣,提高了用户感兴趣资源的召回准确率,使得推荐更精准,更加满足用户需求。
此外,本申请实施例提供的方案可以在近千万级DAU的资源推荐场景中实现用户创意级个性化优选,并取得在线超过10%的业务效果提升,方案联动推荐系统多个子系统实现一套创意优选的完整机制,同时在模型、特征和样本上对创意完成了针对性建模,架构保证了在线支持高性能向量计算及大规模创意候选。本申请实施例提供的推荐系统的优点在于:1,实现用户个性化创意的优选,并在线上业务场景取得显著效果。2,机制上保证了推荐系统多个子系统间的协同,并在创意层面有针对性的模型、特征及样本的构造。3,在召回层完成创意优选,支撑高并发大候选集的高性能向量计算。
图9是根据一示例性实施例示出的一种资源推荐装置的结构示意图,该资源推荐装置可以由软件、硬件或者两者的结合实现。该资源装置装置可以包括:
第一获取模块,用于当接收到目标用户的资源推荐请求时,获取目标用户的用户关联特征,用户关联特征包括用户特征和资源创意浏览行为特征,资源创意是指从资源内容中提取的用于吸引用户浏览资源内容的资源信息;
第一确定模块,用于根据目标用户的用户关联特征,通过用户向量模型确定目标用户的用户向量,用户向量模型用于确定任一用户的用户向量;
第二获取模块,用于获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,资源关联特征包括资源内容特征和资源创意特征,资源向量模型用于确定任一资源的资源向量;
推荐模块,用于根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给目标用户。
可选地,资源创意特征包括创意高阶特征和创意向量特征,创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种,创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征。
可选地,用户关联特征还包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种,资源关联特征还包括资源发布者特征。
可选地,推荐模块包括:
第一选取子模块,用于按照资源向量与目标用户的用户向量之间的相似度从大到小的顺序,从候选资源集中选取排序在前的N个候选资源,N为正整数;
排序子模块,用于按照资源向量与目标用户的用户向量之间的相似度,对N 个候选资源进行排序;
推荐子模块,用于将排序后的N个候选资源推荐给目标用户。
可选地,装置还包括:
第三获取模块,用于获取多个样本数据,每个样本数据包括样本用户的用户关联特征、样本资源的资源关联特征、以及浏览标签,浏览标签用于指示样本用户是否浏览了样本资源;
第二确定模块,用于根据每个样本数据中的用户关联特征,通过待训练用户向量模型确定样本用户向量,以及根据每个样本数据中的资源关联特征,通过待训练资源向量模型确定样本资源向量;
计算模块,用于计算每个样本数据对应的样本用户向量和样本资源向量之间的相似度,相似度用于指示样本资源向量对应样本资源被样本用户向量对应样本用户浏览的可能性;
调整模块,用于根据每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度,对待训练用户向量模型和待训练资源向量模型的模型参数进行调整;
第三确定模块,用于将模型参数调整后的待训练用户向量模型和待训练资源向量模型,分别确定为用户向量模型和资源向量模型。
可选地,装置包括:
第四获取模块,用于获取候选资源集中每个候选资源的资源关联特征;
第四确定模块,用于根据每个候选资源的资源关联特征,通过资源向量模型确定每个候选资源的资源向量。
可选地,装置还包括:
第五获取模块,用于获取多个资源创意,多个资源创意为多个备选资源对应的资源创意;
第五确定模块,用于根据多个资源创意,通过先验模型确定多个资源创意的第一评估值,第一评估值用于指示资源创意被用户浏览的可能性,先验模型用于确定任一资源创意的评估值;
选取模块,用于根据多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意;
第六确定模块,用于将选取的资源创意对应的备选资源,确定为候选资源集中的多个候选资源。
可选地,选取模块包括:
选择子模块,用于根据对应资源创意的第一评估值,按照损失控制策略从多个备选资源中选择备选资源进行在线曝光;
第二选取子模块,用于根据选择的备选资源在线曝光后的用户浏览结果和多个资源创意的第一评估值,从多个资源创意中选取满足条件的资源创意。
可选地,第二选取子模块包括:
第一调整单元,用于根据选择的备选资源在线曝光后的用户浏览结果,对选择的备选资源对应的资源创意的第一评估值进行调整,得到选择的备选资源对应的资源创意的第二评估值;
第二调整单元,用于根据选择的备选资源对应的资源创意的第二评估值,对先验模型的模型参数进行调整;
确定单元,用于基于模型参数调整后的先验模型,确定多个资源创意的第三评估值;
选取单元,用于根据选择的备选资源对应的资源创意的第二评估值,以及多个资源创意的第三评估值,从多个资源创意中选取满足条件的资源创意。
可选地,装置还包括:
第六获取模块,用于获取多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和两个资源创意的标注数据,两个资源创意的标注数据用于指示两个资源创意被用户浏览的概率的高低;
训练模块,用于根据多个资源创意对样本,对待训练先验模型进行训练,得到先验模型。
在本申请中,当接收到目标用户的资源推荐请求时,可以根据目标用户的用户特征和浏览资源创意的行为特征,确定目标用户的用户向量,以及根据候选资源集中每个候选资源的资源内容特征和资源创意特征,确定每个候选资源的资源向量,然后根据每个候选资源的资源向量与目标用户的用户向量之间的相似度,从候选资源集中确定待推荐给目标用户的候选资源。由于可以基于资源内容特征和资源创意特征这两方面来为用户推荐网络资源,因此推荐给用户的每个网络资源在内容和创意上都更符合用户的浏览兴趣,提高了用户感兴趣资源的召回准确率,使得推荐更精准,更加满足用户需求。
需要说明的是:上述实施例提供的资源推荐装置在进行资源推荐时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的资源推荐装置与资源推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10是本申请实施例提供的一种服务器1000的结构示意图,该服务器1000 可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器 (centralprocessing units,CPU)1001和一个或一个以上的存储器1002,其中,所述存储器1002中存储有至少一条指令,所述至少一条指令由所述处理器1001 加载并执行以实现上述各个方法实施例提供的资源推荐方法。当然,该服务器 1000还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1000还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种非临时性计算机可读存储介质,当该存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述实施例提供的资源推荐方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在服务器上运行时,使得服务器执行上述实施例提供的资源推荐方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (13)

1.一种资源推荐方法,其特征在于,所述方法包括:
当接收到目标用户的资源推荐请求时,获取所述目标用户的用户关联特征,所述用户关联特征包括用户特征和浏览资源创意的行为特征,所述资源创意是指从网络资源的资源内容中提取的、用于吸引用户浏览资源内容的资源信息;
根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量,所述用户向量模型用于确定任一用户的用户向量;
获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,所述资源关联特征包括资源内容特征和资源创意特征,所述资源向量模型用于确定任一资源的资源向量;
根据每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户。
2.根据权利要求1所述的方法,其特征在于,所述资源创意特征包括创意高阶特征和创意向量特征,所述创意高阶特征包括资源创意中的图片标签和文本标签中的至少一种,所述创意向量特征为针对预设场景或预设目标从资源创意中提取的向量特征。
3.根据权利要求1所述的方法,其特征在于,所述用户关联特征还包括浏览资源创意的上下文特征和历史浏览数据特征中的至少一种,所述资源关联特征还包括资源发布者特征。
4.根据权利要求1所述的方法,其特征在于,所述根据每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户,包括:
按照资源向量与所述目标用户的用户向量之间的相似度从大到小的顺序,从所述候选资源集中选取排序在前的N个候选资源,所述N为正整数;
按照资源向量与所述目标用户的用户向量之间的相似度,对所述N个候选资源进行排序;
将排序后的N个候选资源推荐给所述目标用户。
5.根据权利要求1-4任一所述的方法,其特征在于,所述根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量之前,还包括:
获取多个样本数据,每个样本数据包括样本用户的用户关联特征、样本资源的资源关联特征、以及浏览标签,所述浏览标签用于指示所述样本用户是否浏览了所述样本资源;
根据每个样本数据中的用户关联特征,通过待训练用户向量模型确定样本用户向量,以及根据每个样本数据中的资源关联特征,通过待训练资源向量模型确定样本资源向量;
计算每个样本数据对应的样本用户向量和样本资源向量之间的相似度,所述相似度用于指示样本资源向量对应的样本资源被样本用户向量对应的样本用户浏览的可能性;
根据每个样本数据中的浏览标签,以及每个样本数据对应的样本用户向量和样本资源向量之间的相似度,对所述待训练用户向量模型和所述待训练资源向量模型的模型参数进行调整;
将模型参数调整后的待训练用户向量模型和待训练资源向量模型,分别确定为所述用户向量模型和所述资源向量模型。
6.根据权利要求1-4任一所述的方法,其特征在于,所述获取候选资源集包括的多个候选资源中每个候选资源的资源向量,包括:
获取所述候选资源集中每个候选资源的资源关联特征;
根据每个候选资源的资源关联特征,通过所述资源向量模型确定每个候选资源的资源向量。
7.根据权利要求6所述的方法,其特征在于,所述获取候选资源集中每个候选资源的资源关联特征之前,还包括:
获取多个资源创意,所述多个资源创意为多个备选资源对应的资源创意;
根据所述多个资源创意,通过先验模型确定所述多个资源创意的第一评估值,所述第一评估值用于指示资源创意被用户浏览的可能性,所述先验模型用于确定任一资源创意的评估值;
根据所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意;
将选取的资源创意对应的备选资源,确定为所述候选资源集中的多个候选资源。
8.根据权利要求7所述的方法,其特征在于,所述根据所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意,包括:
根据对应资源创意的第一评估值,按照损失控制策略从所述多个备选资源中选择备选资源进行在线曝光;
根据选择的备选资源在线曝光后的用户浏览结果和所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意。
9.根据权利要求8所述的方法,其特征在于,所述根据选择的备选资源在线曝光后的用户浏览结果和所述多个资源创意的第一评估值,从所述多个资源创意中选取满足条件的资源创意,包括:
根据选择的备选资源在线曝光后的用户浏览结果,对所述选择的备选资源对应的资源创意的第一评估值进行调整,得到所述选择的备选资源对应的资源创意的第二评估值;
根据所述选择的备选资源对应的资源创意的第二评估值,对所述先验模型的模型参数进行调整;
基于模型参数调整后的先验模型,确定所述多个资源创意的第三评估值;
根据所述选择的备选资源对应的资源创意的第二评估值,以及所述多个资源创意的第三评估值,从所述多个资源创意中选取满足条件的资源创意。
10.根据权利要求7所述的方法,其特征在于,所述根据所述多个资源创意,通过先验模型确定所述多个资源创意的第一评估值之前,还包括:
获取多个资源创意对样本,每个资源创意对样本包括样本资源对应的不同的两个的资源创意和所述两个资源创意的标注数据,所述两个资源创意的标注数据用于指示所述两个资源创意被用户浏览的概率的高低;
根据所述多个资源创意对样本,对待训练先验模型进行训练,得到所述先验模型。
11.一种资源推荐装置,其特征在于,所述装置包括:
第一获取模块,用于当接收到目标用户的资源推荐请求时,获取所述目标用户的用户关联特征,所述用户关联特征包括用户特征和浏览资源创意的行为特征,资源创意是指从资源内容中提取的、用于吸引用户浏览资源内容的资源信息;
第一确定模块,用于根据所述目标用户的用户关联特征,通过用户向量模型确定所述目标用户的用户向量,所述用户向量模型用于确定任一用户的用户向量;
第二获取模块,用于获取候选资源集包括的多个候选资源中每个候选资源的资源向量,每个候选资源的资源向量是根据每个候选资源的资源关联特征,通过资源向量模型确定得到,所述资源关联特征包括资源内容特征和资源创意特征,所述资源向量模型用于确定任一资源的资源向量;
推荐模块,用于根据资每个候选资源的资源向量与所述目标用户的用户向量之间的相似度,从所述候选资源集中选择待推荐的候选资源,将待推荐的候选资源推荐给所述目标用户。
12.一种资源推荐装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1至权利要求10中的任一项权利要求所述的方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述权利要求1至权利要求10中的任一项权利要求所述的方法的步骤。
CN201910939300.9A 2019-09-30 2019-09-30 资源推荐方法、装置及计算机存储介质 Active CN110704739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910939300.9A CN110704739B (zh) 2019-09-30 2019-09-30 资源推荐方法、装置及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910939300.9A CN110704739B (zh) 2019-09-30 2019-09-30 资源推荐方法、装置及计算机存储介质

Publications (2)

Publication Number Publication Date
CN110704739A true CN110704739A (zh) 2020-01-17
CN110704739B CN110704739B (zh) 2022-07-15

Family

ID=69197476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910939300.9A Active CN110704739B (zh) 2019-09-30 2019-09-30 资源推荐方法、装置及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110704739B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708950A (zh) * 2020-06-22 2020-09-25 腾讯科技(深圳)有限公司 内容推荐方法、装置及电子设备
CN111861699A (zh) * 2020-07-02 2020-10-30 北京睿知图远科技有限公司 一种基于运营商数据的反欺诈指数生成方法
CN112114968A (zh) * 2020-09-18 2020-12-22 北京达佳互联信息技术有限公司 推荐方法、装置、电子设备及存储介质
CN112152821A (zh) * 2020-09-23 2020-12-29 青岛海尔科技有限公司 定向通信方法和装置、存储介质及电子设备
CN112199586A (zh) * 2020-09-29 2021-01-08 北京字节跳动网络技术有限公司 一种作品分发方法、装置、计算机设备及存储介质
CN112559875A (zh) * 2020-12-22 2021-03-26 平安银行股份有限公司 基于应用启动画面的资源推荐方法、装置、设备及介质
CN112559874A (zh) * 2020-12-21 2021-03-26 周欢 基于智慧教育的用户推荐方法
CN112559901A (zh) * 2020-12-11 2021-03-26 百度在线网络技术(北京)有限公司 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品
CN112948417A (zh) * 2021-01-29 2021-06-11 上海维外科技有限公司 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
CN113204699A (zh) * 2020-02-03 2021-08-03 北京达佳互联信息技术有限公司 信息推荐方法、装置、电子设备及存储介质
CN113469752A (zh) * 2021-07-22 2021-10-01 北京沃东天骏信息技术有限公司 内容推荐方法、装置、存储介质及电子设备
CN113704596A (zh) * 2020-05-21 2021-11-26 北京沃东天骏信息技术有限公司 用于生成召回信息集合的方法和装置
CN114339772A (zh) * 2021-11-19 2022-04-12 煤炭科学技术研究院有限公司 一种资源配置方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330023A (zh) * 2017-06-21 2017-11-07 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN107492008A (zh) * 2017-08-09 2017-12-19 阿里巴巴集团控股有限公司 信息推荐方法、装置、服务器及计算机存储介质
CN108304441A (zh) * 2017-11-14 2018-07-20 腾讯科技(深圳)有限公司 网络资源推荐方法、装置、电子设备、服务器及存储介质
CN109165283A (zh) * 2018-08-20 2019-01-08 北京智能管家科技有限公司 资源推荐方法、装置、设备及存储介质
CN109284445A (zh) * 2018-12-11 2019-01-29 北京达佳互联信息技术有限公司 网络资源的推荐方法、装置、服务器及存储介质
CN110162700A (zh) * 2019-04-23 2019-08-23 腾讯科技(深圳)有限公司 信息推荐及模型的训练方法、装置、设备以及存储介质
CN110287417A (zh) * 2019-06-26 2019-09-27 北京谦仁科技有限公司 数据处理方法、存储介质和电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330023A (zh) * 2017-06-21 2017-11-07 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN107492008A (zh) * 2017-08-09 2017-12-19 阿里巴巴集团控股有限公司 信息推荐方法、装置、服务器及计算机存储介质
CN108304441A (zh) * 2017-11-14 2018-07-20 腾讯科技(深圳)有限公司 网络资源推荐方法、装置、电子设备、服务器及存储介质
CN109165283A (zh) * 2018-08-20 2019-01-08 北京智能管家科技有限公司 资源推荐方法、装置、设备及存储介质
CN109284445A (zh) * 2018-12-11 2019-01-29 北京达佳互联信息技术有限公司 网络资源的推荐方法、装置、服务器及存储介质
CN110162700A (zh) * 2019-04-23 2019-08-23 腾讯科技(深圳)有限公司 信息推荐及模型的训练方法、装置、设备以及存储介质
CN110287417A (zh) * 2019-06-26 2019-09-27 北京谦仁科技有限公司 数据处理方法、存储介质和电子设备

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204699A (zh) * 2020-02-03 2021-08-03 北京达佳互联信息技术有限公司 信息推荐方法、装置、电子设备及存储介质
CN113204699B (zh) * 2020-02-03 2023-10-31 北京达佳互联信息技术有限公司 信息推荐方法、装置、电子设备及存储介质
CN113704596A (zh) * 2020-05-21 2021-11-26 北京沃东天骏信息技术有限公司 用于生成召回信息集合的方法和装置
CN111708950B (zh) * 2020-06-22 2023-08-29 腾讯科技(深圳)有限公司 内容推荐方法、装置及电子设备
CN111708950A (zh) * 2020-06-22 2020-09-25 腾讯科技(深圳)有限公司 内容推荐方法、装置及电子设备
CN111861699A (zh) * 2020-07-02 2020-10-30 北京睿知图远科技有限公司 一种基于运营商数据的反欺诈指数生成方法
CN112114968A (zh) * 2020-09-18 2020-12-22 北京达佳互联信息技术有限公司 推荐方法、装置、电子设备及存储介质
CN112152821A (zh) * 2020-09-23 2020-12-29 青岛海尔科技有限公司 定向通信方法和装置、存储介质及电子设备
CN112199586A (zh) * 2020-09-29 2021-01-08 北京字节跳动网络技术有限公司 一种作品分发方法、装置、计算机设备及存储介质
CN112559901B (zh) * 2020-12-11 2022-02-08 百度在线网络技术(北京)有限公司 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品
CN112559901A (zh) * 2020-12-11 2021-03-26 百度在线网络技术(北京)有限公司 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品
CN112559874B (zh) * 2020-12-21 2023-05-16 南京康裕数字科技有限公司 基于智慧教育的用户推荐方法
CN112559874A (zh) * 2020-12-21 2021-03-26 周欢 基于智慧教育的用户推荐方法
CN112559875A (zh) * 2020-12-22 2021-03-26 平安银行股份有限公司 基于应用启动画面的资源推荐方法、装置、设备及介质
CN112948417A (zh) * 2021-01-29 2021-06-11 上海维外科技有限公司 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质
CN113469752A (zh) * 2021-07-22 2021-10-01 北京沃东天骏信息技术有限公司 内容推荐方法、装置、存储介质及电子设备
CN114339772A (zh) * 2021-11-19 2022-04-12 煤炭科学技术研究院有限公司 一种资源配置方法、装置及电子设备
CN114339772B (zh) * 2021-11-19 2023-04-07 煤炭科学技术研究院有限公司 一种资源配置方法、装置及电子设备

Also Published As

Publication number Publication date
CN110704739B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN110704739B (zh) 资源推荐方法、装置及计算机存储介质
CN110457581B (zh) 一种资讯推荐方法、装置、电子设备及存储介质
CN109086439B (zh) 信息推荐方法及装置
EP3757995A1 (en) Music recommendation method and apparatus, and computing device and medium
CN111143686B (zh) 资源推荐方法及装置
CN110321422A (zh) 在线训练模型的方法、推送方法、装置以及设备
CN108090208A (zh) 融合数据处理方法及装置
CN108885624B (zh) 信息推荐系统及方法
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN112348629A (zh) 一种商品信息推送方法和装置
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US10185983B2 (en) Least-ask: conversational recommender system with minimized user interaction
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN109074366A (zh) 用于计算机网络路由基础架构的增益调整组件
CN110472016B (zh) 文章推荐方法、装置、电子设备及存储介质
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN112883265A (zh) 信息推荐方法、装置、服务器及计算机可读存储介质
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
CN114428910A (zh) 资源推荐方法、装置、电子设备、产品及介质
CN116823410B (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
WO2024041483A1 (zh) 一种推荐方法及相关装置
CN116957678A (zh) 一种数据处理方法和相关装置
US11947589B2 (en) Web-scale personalized visual search recommendation service
CN112749296A (zh) 一种视频推荐方法、装置、服务器及存储介质
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant