CN111400615B - 一种资源推荐方法、装置、设备及存储介质 - Google Patents

一种资源推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111400615B
CN111400615B CN202010195961.8A CN202010195961A CN111400615B CN 111400615 B CN111400615 B CN 111400615B CN 202010195961 A CN202010195961 A CN 202010195961A CN 111400615 B CN111400615 B CN 111400615B
Authority
CN
China
Prior art keywords
resource
recommended
resources
feature
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010195961.8A
Other languages
English (en)
Other versions
CN111400615A (zh
Inventor
谭莲芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010195961.8A priority Critical patent/CN111400615B/zh
Publication of CN111400615A publication Critical patent/CN111400615A/zh
Application granted granted Critical
Publication of CN111400615B publication Critical patent/CN111400615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种资源推荐方法、装置、设备及存储介质,该方法包括:先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便将已选推荐资源和至少一个目标推荐资源推荐给目标用户。其中,因基于已选推荐资源与相关系数集,确定的各目标推荐资源是从不同方面与已选推荐资源相关的,实现在满足用户喜好的前提下尽可能地进行多方面的推荐,如此能够有效地解决推荐内容过于单一的问题。

Description

一种资源推荐方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种资源推荐方法、装置、设备及存储介质。
背景技术
资源推荐是指向用户推荐一些用户可能喜欢看的资源。另外,不同应用场景下需要向用户推荐不同类型的资源。例如,在视频播放场景下,需要向用户推荐一些用户可能喜欢观看的视频;又如,在商品买卖场景下,需要向用户推荐一些用户可能希望购买的商品。
目前,在资源推荐中存在推荐内容过于单一的问题。例如,在视频推荐中,若用户点击查看了一些关于“篮球”的视频,则随后视频推荐软件通常会不断地向用户推荐与“篮球”相关的视频,使得用户后续基本上只能看到与“篮球”相关的视频,如此易导致用户产生厌恶情绪。
发明内容
本申请实施例提供了一种资源推荐方法、装置、设备及存储介质,能够有效地实现资源推荐。
有鉴于此,本申请第一方面提供了一种资源推荐方法,包括:
获取待推荐资源的资源信息和资源点击率;资源信息包括至少两类信息;
利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;
根据待推荐资源的资源特征和资源点击率,确定相关系数集;相关系数集包括任意两个推荐资源的相关系数;
根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源;已选推荐资源是基于目标用户的历史点击行为确定的资源;
将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
本申请第二方面提供了一种资源推荐装置,包括:
获取单元,用于获取待推荐资源的资源信息和资源点击率;所述资源信息包括至少两类信息;
提取单元,用于利用至少两类特征提取模型对所述待推荐资源的资源信息进行特征提取,得到所述待推荐资源的资源特征;
确定单元,用于根据所述待推荐资源的资源特征和资源点击率,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
筛选单元,用于根据已选推荐资源和所述相关系数集,从所述待推荐资源中确定至少一个目标推荐资源;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
推荐单元,用于将所述已选推荐资源和所述至少一个目标推荐资源推荐给目标用户。
本申请第三方面提供了一种设备,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行上述第一方面所述的资源推荐方法。
本申请第四方面提供了计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的资源推荐方法。
本申请第五方面提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行上述第一方面所述的资源推荐方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例提供的资源推荐方法中,先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
其中,因资源信息包括资源推荐的多类影响信息,使得基于资源信息生成的资源特征携带有影响资源推荐的多类信息特征;还因资源点击率是影响资源推荐的重要因素,使得基于资源特征和资源点击率综合确定的相关系数集,能够更准确地表征不同待推荐资源在多种方面上的相关程度;还因已选推荐资源是基于目标用户的历史点击行为确定的资源,使得基于已选推荐资源与相关系数集,确定的各目标推荐资源是从不同方面与已选推荐资源相关的,如此实现了在满足用户喜好的前提下尽可能地进行多方面的推荐,如此能够有效地解决推荐内容过于单一的问题。
附图说明
图1为本申请实施例提供的资源推荐方法的一种应用场景示意图;
图2为本申请实施例提供的资源推荐方法的另一种应用场景示意图;
图3为本申请实施例提供的一种资源推荐方法的流程示意图;
图4为本申请实施例提供的应用于图1所示场景下的资源推荐方法的流程图;
图5为本申请实施例提供的一种触发资源推荐指令的示意图;
图6为本申请实施例提供的另一种触发资源推荐指令的示意图;
图7为本申请实施例提供的又一种触发资源推荐指令的示意图;
图8为本申请实施例提供的一种显示目标推荐资源的示意图;
图9为本申请实施例提供的一种资源推荐装置的结构示意图;
图10为本申请实施例提供的另一种资源推荐装置的结构示意图;
图11为本申请实施例提供的一种终端设备的结构示意图;
图12为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
发明人对传统的资源推荐过程研究中发现:因传统的资源推荐过程通常只根据待推荐资源的资源点击率来进行推荐的,使得被推荐的资源通常只满足用户某一方面的喜好(例如,篮球),如此易导致用户对这些一直推荐的内容单一的资源产生厌恶情绪。例如,在视频推荐中,如果用户点击了一些与篮球相关的视频,则该传统的资源推荐算法通常会基于上述用户的点击行为,不断地为用户推荐一些与篮球相关的视频,使得后续用户基本上只能看到与篮球相关的视频,如此因推荐内容过于易导致用户不再想看与篮球相关的视频,而是想看其他类型(例如,美食、旅游等)的视频。
针对上述传统的资源推荐过程存在的技术问题,本申请实施例还提供了一种资源推荐方法,能够提高资源推荐的多样性。
具体地,在本申请实施例提供的资源推荐方法中,先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
可见,因资源信息包括资源推荐的多类影响信息,使得基于资源信息生成的资源特征也携带有多类影响资源推荐的信息特征;还因资源点击率是影响资源推荐的重要因素,使得基于资源特征和资源点击率综合确定的相关系数集,能够更准确地表征不同待推荐资源在多种方面上的相关程度;还因已选推荐资源是基于目标用户的历史点击行为确定的资源,使得基于已选推荐资源与相关系数集,确定的目标推荐资源可以是从各种不同方面与已选推荐资源相关的,如此实现了在满足用户喜好的前提下尽可能地进行多方面的推荐,如此能够有效地解决推荐内容过于单一的问题。
应理解,本申请实施例提供的资源推荐方法可以应用于数据处理设备,如终端设备、服务器等;其中,终端设备具体可以为智能手机、计算机、个人数字助理(PersonalDigital Assitant,PDA)、平板电脑等;服务器具体可以为应用服务器,也可以为Web服务器,在实际部署时,该服务器可以为独立服务器,也可以为集群服务器。
若本申请实施例提供的资源推荐方法由终端设备执行时,则终端设备可以在基于待推荐资源的资源信息和资源点击率,确定出目标推荐资源之后,直接将已选推荐资源和目标推荐资源显示在终端设备上,以供用户查看。若本申请实施例提供的资源推荐方法由服务器执行时,则服务器可以在基于待推荐资源的资源信息和资源点击率,确定出目标推荐资源之后,直接将目标推荐资源发送给终端设备,以使终端设备将接收的已选推荐资源和目标推荐资源进行显示,以供用户查看。
为了便于理解本申请实施例提供的技术方案,下面对本申请实施例提供的资源推荐方法应用于终端设备为例,对本申请实施例提供的资源推荐方法适用的应用场景进行示例性介绍。
参见图1,图1为本申请实施例提供的资源推荐方法的应用场景示意图。如图1所示,该应用场景包括:终端设备101和用户102;其中,终端设备101用于执行本申请实施例提供的资源推荐方法进行资源推荐,以供用户102查看。
终端设备101在接收到用户102触发的资源推荐指令之后,终端设备101可以先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便终端设备101将已选推荐资源和至少一个目标推荐资源显示给用户102。
应理解,在实际应用中,也可以将本申请实施例提供的资源推荐方法应用于服务器,参见图2,该图为本申请实施例提供的资源推荐方法的另一种应用场景示意图。如图2所示,服务器201能够在接收到终端设备202发送的资源推荐请求之后,先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便服务器201可以将已选推荐资源和至少一个目标推荐资源反馈给终端设备202,使得用户203能够在终端设备202上查看已选推荐资源和至少一个目标推荐资源。
应理解,图1和图2所示的应用场景仅为示例,在实际应用中,本申请实施例提供的资源推荐方法还可以应用于其他进行资源推荐的应用场景,在此不对本申请实施例提供的资源推荐方法做任何限定。
下面通过实施例对本申请提供的资源推荐方法进行介绍。
方法实施例
参见图3,图3为本申请实施例提供的一种资源推荐方法的流程示意图。为了便于描述,下述实施例仅以终端设备为执行主体为例对该资源推荐方法进行介绍。如图3所示,该资源推荐方法包括S301-S305:
S301:获取待推荐资源的资源信息和资源点击率。
本申请实施例不限定资源的类型,例如,资源可以包括视频、商品、话题、资讯、文章、书籍、电影、游戏等中的至少一类。
资源信息用于描述待推荐资源的影响信息,而且资源信息包括至少两类信息。
本申请实施例不限定资源信息,例如,资源信息可以包括资源标题和/或资源标签。
资源标题用于标明待推荐资源的内容。例如,当资源为视频时,则资源标题可以为“这娃一开口其他人就笑了”。
资源标签用于标记待推荐资源的类型,而且每个待推荐资源通常具有多个资源标签。例如,当资源标题为“这娃一开口其他人就笑了”时,则资源标签可以是“幼儿搞笑”,可见该待推荐资源具有两个资源标签。
资源点击率用于表征待推荐资源的受欢迎程度,也就是用户对待推荐资源的认可程度,而且本申请实施例不限定资源点击率的计算方式,例如,资源点击率可以利用目标用户点击的预测点击率(Predict Click-Through Rate,pctr)分数来计算。其中,目标用户可以包括至少一个用户。
基于上述内容可知,终端设备在接收到用户触发的资源推荐指令之后,终端设备可以先获取M个待推荐资源的资源信息和资源点击率,以便后续终端设备可以基于M个待推荐资源的资源信息和资源点击率进行多样性推荐。其中,M为正整数,且M≥1。
需要说明的是,“资源推荐指令”的相关内容,请参见下文S401。
S302:利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征。
资源特征用于表征影响资源推荐的信息特征,而且本申请实施例不限定资源特征的表示形式,例如,资源特征可以采用向量形式进行表示。
另外,本申请实施例不限定获取资源特征(也就是S302)的实施方式,为了便于解释,下面结合获取资源特征的一种具体实施方式进行说明。
在一种可能的实施方式中,当资源信息包括资源标题和资源标签时,S302具体可以包括S302A1-S302A3:
S302A1:根据待推荐资源的资源标题,利用第一类特征提取模型生成待推荐资源的第一特征。
第一特征用于表征待推荐资源的标题特征,而且本申请实施例不限定第一特征的表示形式,例如,第一特征可以采用向量形式进行表示。
另外,本申请实施例不限定第一类特征提取模型,例如,第一类特征提取模型可以是基于转换的双向编码(Bidirectional Encoder Representations from Transformers,BERT)模型。
基于此,在一种可能的实施方式中,S302A1具体可以为:将待推荐资源的资源标题输入BERT模型,并根据该BERT模型中目标网络层的输出结果,生成待推荐资源的第一特征。
在一种可能的实施方式中,目标网络层可以是第7网络层,而且,目标网络层的输出结果可以是指第7网络层的输出向量。
基于上述内容可知,在本申请实施例中,在获取到待推荐资源的资源标题之后,可以利用第一类特征提取模型从待推荐资源的资源标题中提取标题特征,作为待推荐资源的第一特征,该过程具体可以为:先将待推荐资源的资源标题输入到BERT模型中,再将该BERT模型的目标网络层的输出结果(例如,第7网络层的输出向量),作为待推荐资源的第一特征。
S302A2:根据待推荐资源的资源标签,利用第二类特征提取模型生成待推荐资源的第二特征。
第二特征用于表征待推荐资源的标签特征,而且本申请实施例不限定第二特征的表示形式,例如,第二特征可以采用向量形式进行表示。
另外,本申请实施例不限定第二类特征提取模型,例如,第二类特征提取模型可以是文档主题生成(Latent Dirichlet Allocation,LDA)模型。
基于此,在一种可能的实施方式中,S302A2具体可以为:将待推荐资源的资源标签输入预先训练的LDA模型,得到LDA模型输出的待推荐资源的第二特征。
LDA模型是利用训练资源的资源标签训练得到的。需要说明的是,本申请实施例不限定训练资源,例如,训练资源可以是当前推荐所使用的待推荐资源。
基于上述内容可知,本申请实施例中,在获取到待推荐资源的资源标签之后,可以利用第二类特征提取模型从待推荐资源的资源标签中提取标签特征,作为待推荐资源的第二特征,该过程具体可以为:先将待推荐资源的资源标签输入到LDA模型中,再将LDA模型输出结果(例如,输出向量),作为待推荐资源的第二特征。
需要说明的是,本申请实施例不限定S302A1和S302A2执行顺序。
S302A3:根据待推荐资源的第一特征和待推荐资源的第二特征,生成待推荐资源的资源特征。
本申请实施例不限定生成资源特征(也就是S302A3)的具体实施方式,下面以生成资源特征的一种具体方式为例进行说明。
在一种可能的实施方式中,当待推荐资源的第一特征和待推荐资源的第二特征均是向量时,则S302A3具体可以包括S302A31-S302A35:
S302A31:获取处理维度。
本申请实施例不限定处理维度的获取方式,例如,处理维度可以预先根据应用场景设定,也可以基于待推荐资源的第一特征以及第二特征确定。
基于此,在一种可能的实施方式中,S302A31具体可以为:将待推荐资源的第一特征的维度和待推荐资源的第二特征的维度中的最小值,确定为处理维度。例如,当第一特征的维度为768和第二特征的维度为2048时,可以确定处理维度为768。
S302A32:根据待推荐资源的第一特征和处理维度,得到待推荐资源的第一目标特征,该第一目标特征的维度是处理维度。
本申请实施例中,在获取到处理维度之后,可以将待推荐资源的第一特征变换为具有处理维度的第一目标特征,该过程具体可以为:若待推荐资源的第一特征的维度高于处理维度,则将待推荐资源的第一特征降维至处理维度,得到待推荐资源的第一目标特征;若待推荐资源的第一特征的维度等于处理维度,则将待推荐资源的第一特征,作为待推荐资源的第一目标特征;若待推荐资源的第一特征的维度低于处理维度,则将待推荐资源的第一特征扩充至处理维度,得到待推荐资源的第一目标特征。
需要说明的是,本申请实施例不限定向量的降维方式,例如,可以利用全连接层进行降维。另外,本申请实施例也不限定向量的扩充方式,例如,利用添加预设字符(比如,字符“0”)的方式进行扩充。其中,预设字符可以根据应用场景设定。
S302A33:根据待推荐资源的第二特征和处理维度,得到待推荐资源的第二目标特征,该第二目标特征的维度是所述处理维度。
本申请实施例中,在获取到处理维度之后,可以将待推荐资源的第二特征变换为具有处理维度的第二目标特征,该过程具体可以为:若待推荐资源的第二特征的维度高于处理维度,则将待推荐资源的第二特征降维至处理维度,得到待推荐资源的第二目标特征;若待推荐资源的第二特征的维度等于处理维度,则将待推荐资源的第二特征,作为待推荐资源的第二目标特征;若待推荐资源的第二特征的维度低于处理维度,则将待推荐资源的第二特征扩充至处理维度,得到待推荐资源的第二目标特征。
需要说明的是,本申请实施例不限定S302A32和S302A33的执行顺序;而且,本申请实施例不限定S302A32和S302A33的执行时间,该两个步骤均需要在执行下文S302A34之前完成执行即可。
S302A34:根据待推荐资源的第一目标特征和待推荐资源的第二目标特征,得到待推荐资源的资源特征,资源特征的维度是处理维度。
本申请实施例中,在获取到待推荐资源的第一目标特征和待推荐资源的第二目标特征之后,可以基于待推荐资源的第一目标特征和待推荐资源的第二目标特征,生成待推荐资源的资源特征,使得资源特征的维度为处理维度。上述过程具体可以为:先将待推荐资源的第一目标特征和待推荐资源的第二目标特征合并为一个向量,作为原始特征向量,该原始特征向量的维度为二倍的处理维度;再将原始特征向量降维至处理维度,得到待推荐资源的资源特征,该资源特征的维度是处理维度。
基于上述S302A3的内容可知,在获取到待推荐资源的第一特征和第二特征之后,可以根据待推荐资源的第一特征和待推荐资源的第二特征,生成待推荐资源的资源特征,使得资源特征能够准确地表征待推荐资源的资源信息,以便于后续能够基于资源特征进行资源推荐。
另外,本申请实施例还可以进一步依据资源标题和资源标签的综合特征,来生成待推荐资源的资源特征。基于此,本申请还提供了S302的另一种实施方式。
在另一种可能的实施方式中,当资源信息包括资源标题和资源标签时,S302具体可以包括S302B1-S302B4:
S302B1:根据待推荐资源的资源标题,利用第一类特征提取模型生成待推荐资源的第一特征。
S302B1的内容与上文S302A1的内容相同,请参见上文。
S302B2:根据待推荐资源的资源标签,利用第二类特征提取模型生成待推荐资源的第二特征。
S302B2的内容与上文S302A2的内容相同,请参见上文。
S302B3:根据待推荐资源的资源标题和资源标签,生成待推荐资源的第三特征。
第三特征用于表征待推荐资源的资源标题和资源标签的综合特征,而且本申请实施例不限定第三特征的表示形式,例如,第三特征可以采用向量形式进行表示。
另外,本申请实施例不限定生成第三特征的(也就是S302B3)具体实施方式,例如,第三特征可以利用fasttext模型生成。
基于此,在一种可能的实施方式中,S302B3具体可以包括S302B31-S302B33:
S302B31:将待推荐资源的资源标题进行分词,得到待推荐资源的标题分词。
本申请实施例不限定将资源标题进行分词的分词方式,例如,可以采用预设分词器(如结巴(Jieba)分词器)进行分词,也可以采用任一分词方法进行分词。
本申请实施例中,在获取到待推荐资源的资源信息之后,可以先将资源信息中的资源标题进行分词,得到该待推荐资源的标题分词,该过程具体可以为:将待推荐资源的资源标题输入到预设分词器中进行分词,得到待推荐资源的资源标题对应的标题分词。例如,当资源标题为“这娃一开口其他人就笑了”,预设分词器为Jieba分词器时,则上述过程具体可以为:将资源标题“这娃一开口其他人就笑了”输入到Jieba分词器中进行分词,得到Jieba分词器输出的分词结果“这”、“娃”、“一”、“开口”、“其他人”、“就”、“笑”、“了”,作为该待推荐资源的标题分词。
S302B32:根据待推荐资源的标题分词和待推荐资源的资源标签,生成待推荐资源的目标分词。
本申请实施例中,在获取到待推荐资源的标题分词之后,可以根据待推荐资源的标题分词和待推荐资源的资源标签,生成待推荐资源的目标分词,该过程具体可以为:将待推荐资源的标题分词和待推荐资源的资源标签中的词语,均作为待推荐资源的目标分词。例如,当标题分词为“这”、“娃”、“一”、“开口”、“其他人”、“就”、“笑”、“了”,且资源标签为“幼儿搞笑”时,则可以将“这”、“娃”、“一”、“开口”、“其他人”、“就”、“笑”、“了”、“幼儿”、“搞笑”,作为待推荐资源的目标分词。
S302B33:根据待推荐资源的目标分词,生成待推荐资源的第三特征。
本申请实施例不限定基于目标分词生成第三特征的具体实施方式,例如,可以采用预设模型(如,利用fasttext工具训练得到skipgram模型)进行实施。其中,预设模型是利用训练资源的资源标签和资源标题对应的标题分词训练得到的。需要说明的是,本申请实施例不限定训练资源,例如,训练资源可以是当前推荐所使用的待推荐资源。
基于上述内容可知,本申请实施例中,在获取到待推荐资源的目标分词之后,可以从待推荐资源的目标分词中提取该待推荐资源的资源标题和资源标签的综合特征,作为待推荐资源的第三特征,该过程具体可以为:将待推荐资源的目标分词输入到预设模型中,并将预设模型输出的向量作为待推荐资源的第三特征。
基于上述S302B3的相关内容可知,本申请实施例中,在获取到待推荐资源的资源信息之后,可以从资源信息中的资源标题和资源标签中提取综合特征,以便后续能够基于该综合特征确定资源信息的资源特征。
需要说明的是,本申请实施例不限定S302B1、S302B2和S302B3的执行顺序,该三个步骤依次按照预设顺序执行,也可以同时执行;而且,本申请实施例不限定S302B1、S302B2和S302B3的执行时间,该三个步骤均需要在执行下文S302B4之前完成执行即可。
S302B4:根据待推荐资源的第一特征、待推荐资源的第二特征和待推荐资源的第三特征,生成待推荐资源的资源特征。
本申请实施例不限定生成资源特征(也就是S302B4)的具体实施方式,下面以生成资源特征的一种具体方式为例进行说明。
在一种可能的实施方式中,当待推荐资源的第一特征、待推荐资源的第二特征和待推荐资源的第三特征均是向量时,则S302B4具体可以包括S302B41-S302B45:
S302B41:获取目标维度。
本申请实施例不限定目标维度的获取方式,例如,目标维度可以预先根据应用场景设定,也可以基于待推荐资源的第一特征、第二特征以及第三特征确定。
基于此,在一种可能的实施方式中,S302B41具体可以为:将待推荐资源的第一特征的维度、待推荐资源的第二特征的维度和待推荐资源的第三特征的维度中的最小值,确定为目标维度。例如,当第一特征的维度为768、第二特征的维度为2048和第三特征的维度为100时,可以确定目标维度为100。
S302B42:根据待推荐资源的第一特征和目标维度,得到待推荐资源的第四特征,该第四特征的维度是目标维度。
本申请实施例中,在获取到目标维度之后,可以将待推荐资源的第一特征变换为具有目标维度的第四特征,该过程具体可以为:若待推荐资源的第一特征的维度高于目标维度,则将待推荐资源的第一特征降维至目标维度,得到待推荐资源的第四特征;若待推荐资源的第一特征的维度等于目标维度,则将待推荐资源的第一特征,作为待推荐资源的第四特征;若待推荐资源的第一特征的维度低于目标维度,则将待推荐资源的第一特征扩充至目标维度,得到待推荐资源的第四特征。
需要说明的是,本申请实施例不限定向量的降维方式,例如,可以利用全连接层进行降维。另外,本申请实施例也不限定向量的扩充方式,例如,利用添加预设字符(比如,字符“0”)的方式进行扩充。其中,预设字符可以根据应用场景设定。
S302B43:根据待推荐资源的第二特征和目标维度,得到待推荐资源的第五特征,该第五特征的维度是所述目标维度。
本申请实施例中,在获取到目标维度之后,可以将待推荐资源的第二特征变换为具有目标维度的第五特征,该过程具体可以为:若待推荐资源的第二特征的维度高于目标维度,则将待推荐资源的第二特征降维至目标维度,得到待推荐资源的第五特征;若待推荐资源的第二特征的维度等于目标维度,则将待推荐资源的第二特征,作为待推荐资源的第五特征;若待推荐资源的第二特征的维度低于目标维度,则将待推荐资源的第二特征扩充至目标维度,得到待推荐资源的第五特征。
S302B44:根据待推荐资源的第三特征和目标维度,得到待推荐资源的第六特征,该第六特征的维度是所述目标维度。
本申请实施例中,在获取到目标维度之后,可以将待推荐资源的第三特征变换为具有目标维度的第六特征,该过程具体可以为:若待推荐资源的第三特征的维度高于目标维度,则将待推荐资源的第三特征降维至目标维度,得到待推荐资源的第六特征;若待推荐资源的第三特征的维度等于目标维度,则将待推荐资源的第三特征,作为待推荐资源的第六特征;若待推荐资源的第三特征的维度低于目标维度,则将待推荐资源的第三特征扩充至目标维度,得到待推荐资源的第六特征。
需要说明的是,本申请实施例不限定S302B42、S302B43和S302B44的执行顺序,该三个步骤依次按照预设顺序执行,也可以同时执行;而且,本申请实施例不限定S302B42、S302B43和S302B44的执行时间,该三个步骤均需要在执行下文S302B45之前完成执行即可。
S302B45:根据待推荐资源的第四特征、待推荐资源的第五特征和待推荐资源的第六特征,得到待推荐资源的资源特征,资源特征的维度是目标维度。
本申请实施例中,在获取到待推荐资源的第四特征、待推荐资源的第五特征和待推荐资源的第六特征之后,可以基于待推荐资源的第四特征、待推荐资源的第五特征和待推荐资源的第六特征,生成待推荐资源的资源特征,使得资源特征的维度为目标维度。上述过程具体可以为:先将待推荐资源的第四特征、待推荐资源的第五特征和待推荐资源的第六特征合并为一个向量,作为初始特征向量,该初始特征向量的维度为三倍的目标维度;再将初始特征向量降维至目标维度,得到待推荐资源的资源特征,该资源特征的维度是目标维度。
基于上述S302B4的内容可知,在获取到待推荐资源的第一特征、第二特征和第三特征之后,可以根据待推荐资源的第一特征、待推荐资源的第二特征和待推荐资源的第三特征,生成待推荐资源的资源特征,使得资源特征能够准确地表征待推荐资源的资源信息,以便于后续能够基于资源特征进行资源推荐。
基于上述S302的相关内容可知,本申请实施例中,在获取到待推荐资源的资源信息之后,可以从待推荐资源的资源信息中提取待推荐资源的资源特征,以便后续能够基于该待推荐资源的资源特征进行资源推荐。
S303:根据待推荐资源的资源特征和资源点击率,确定相关系数集。
相关系数集包括任意两个推荐资源的相关系数。其中,两个推荐资源的相关系数用于表征该两个推荐资源之间的相关程度。
另外,本申请实施例不限定相关系数集的确定方式,为了便于解释,下面结合一种可能的实施方式进行说明。
在一种可能的实施方式中,S303可以为:先根据不同待推荐资源的资源特征,确定不同待推荐资源之间的相似度,再根据不同待推荐资源之间的相似度以及各待推荐资源的资源点击率,确定不同待推荐资源之间的相关程度,并将不同待推荐资源之间的相关程度的集合,确定为相关系数集。
可见,在本申请中,若利用矩阵L表示相关系数集,则可以利用公式(1)获取相关系数集。
Figure GDA0003753499340000151
式中,L表示相关系数集,该矩阵L中的lij表示第i个待推荐资源与第i个待推荐资源的相关程度,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;A表示由待推荐资源的资源点击率构成的对角矩阵,该矩阵中的ri表示第i个待推荐资源的资源点击率,i为正整数,且1≤i≤M;S表示由不同待推荐资源之间的相似度构成的矩阵,该矩阵中的sij表示第i个待推荐资源与第j个待推荐资源之间的相似度,且根据第i个待推荐资源的资源特征fi与第j个待推荐资源的资源特征fj确定sij,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;M为待推荐资源的总数,M正整数,且M≥1。
在上述公式(1)中,本申请实施例不限定第i个待推荐资源与第j个待推荐资源之间的相似度sij的获取方式,为了便于理解,下面结合两种可能的实施方式进行说明。
在一种可能的实施方式中,sij的获取方式为:将第i个待推荐资源的资源特征fi与第j个待推荐资源的资源特征fj的乘积,确定为sij
在另一种可能的实施方式中,若待推荐资源为视频,则本申请提供的资源推荐方法还包括:获取所述待推荐资源的画面特征,并获取所述待推荐资源的音频特征。
其中,画面特征用于表征视频中画面所具有的特征;音频特征用于表征视频中音频所具有的特征。另外,本申请实施例不限定画面特征和音频特征的获取方式。
此时,sij的获取方式具体可以包括以下四步:
步骤1:根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征的乘积,确定第一相似度。
步骤2:根据第i个待推荐资源的画面特征与第j个待推荐资源的画面特征,利用第一预设算法确定第二相似度。
其中,第一预设算法是预先设定的,而且,第一预设算法可以是任一种图像相似度的计算方法,例如,第一预设算法为NetVALD算法。需要说明的是,NetVALD算法的相关论文为NetVALD:CNN architecture for weakly supervised place recognition。
步骤3:根据第i个待推荐资源的音频特征与第j个待推荐资源的音频特征,利用第二预设算法确定第三相似度。
其中,第二预设算法是预先设定的,而且,第二预设算法可以是任一种音频相似度的计算方法,例如,第二预设算法为VGGish模型。
步骤4:将第一相似度、第二相似度和第三相似度进行加权求和,得到sij
需要说明的是,在加权求和中,第一相似度对应的权重、第二相似度对应的权重和第三相似度对应的权重均可以根据应用场景设定。
基于上述内容可知,本申请实施例中,可以根据待推荐资源的资源特征和资源点击率,确定相关系数集,以便使得该相关系数集能够记录有任意两个待推荐资源之间的相关系数。
S304:根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源。
已选推荐资源是基于目标用户的历史点击行为确定的资源,而且本申请实施例不限定已选推荐资源的获取方式,可以采用任一种基于用户的历史点击行为确定推荐资源的算法得到已选推荐资源。
目标推荐资源是指推荐给用户的资源。
另外,本申请实施例不限定确定目标资源(也就是S304)的具体实施方式,为了便于理解,下面结合一种确定目标资源的具体实施方式进行说明。
在一种可能的实施方式中,S304具体可以包括S3041-S3043:
S3041:将已选推荐资源,确定为行列式点过程DPP模型的初始化参数。
初始化参数是指行列式点过程(determinantal point process,DPP)模型进行资源排序时需要使用的参数。需要说明的是,DPP模型的初始化参数请参见下文。
本申请实施例中,可以直接将已选推荐资源确定为DPP模型中的初始推荐资源,以便后续DPP模型能够基于已选推荐资源,将与已选推荐资源相关程度较大的待推荐资源,放置在资源排序的最前面,以便后续能够将这些与已选推荐资源相关程度较大的待推荐资源,推荐给用户。
S3042:将相关系数集输入到DPP模型,得到DPP模型输出的待推荐资源的推荐排序。
本申请实施例中,在获取到相关系数集之后,可以利用相关系数集确定DPP模型的输入参数,以便DPP模型能够基于该输入参数,生成待推荐资源的推荐排序。例如,当相关系数集为矩阵L时,可以直接将相关系数集作为DPP模型的输入参数。需要说明的是,DPP模型的输入参数的相关内容,请参见下文。
待推荐资源的推荐排序用于描述每个待推荐资源的被推荐的顺序。例如,待推荐资源的推荐排序可以为:第1个资源、第2个资源、……、第M个资源,且在该待推荐资源的推荐排序中位置越靠前,则该待推荐资源被推荐的可能性越大。需要说明的是,在DPP模型输出的待推荐资源的推荐排序中,已选推荐资源位于第一位。
基于上述内容可知,本申请实施例中,在获取到相关系数集之后,可以先将相关系数集输入到DPP模型中,再由DPP模型基于已选推荐资源和相关系数集,进行资源排序,得到所有待推荐资源的推荐排序,使得已选推荐资源在该推荐排序中的位置最靠前,还使得与已选推荐资源相关程度比较大的其他待推荐资源在该推荐排序中的位置均比较靠前,如此使得后续能够将已选推荐资源以及与已选推荐资源相关程度比较大的其他待推荐资源,推荐给用户。
需要说明的是,本申请实施例还提供了DPP基于矩阵L生成待推荐资源的推荐排序的相关内容,技术详情请参见下文。
S3043:根据待推荐资源的推荐排序,确定至少一个目标推荐资源。
本申请实施例中,在DPP模型生成的待推荐资源的推荐排序中,已选推荐资源的位置最靠前,而且与已选推荐资源相关程度比较大的其他待推荐资源的位置均比较靠前。基于此,本申请可以将排序第2至第N的待推荐资源,均作为目标推荐资源。其中,N为目标推荐资源的总数,且N为正整数,N≥1。
S305:将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
本申请实施例中,由于已选推荐资源是最符合目标用户的历史点击行为的,使得已选推荐资源最符合用户喜好的资源,而且目标推荐资源是与已选推荐资源最相关的资源,因而,应该将已选推荐资源和各目标推荐资源均推荐给目标用户。其中,不同的目标推荐资源与已选推荐资源在不同方面上相关,使得不同的目标推荐资源类型不同。
基于上述S301至S305的相关内容可知,在本申请实施例提供的资源推荐方法中,可以先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
其中,因资源信息包括资源推荐的多类影响信息,使得基于资源信息生成的资源特征携带有影响资源推荐的多类信息特征;还因资源点击率是影响资源推荐的重要因素,使得基于资源特征和资源点击率综合确定的相关系数集,能够更准确地表征不同待推荐资源在多种方面上的相关程度;还因已选推荐资源是基于目标用户的历史点击行为确定的资源,使得基于已选推荐资源与相关系数集,确定的各目标推荐资源是从不同方面与已选推荐资源相关的,如此实现了在满足用户喜好的前提下尽可能地进行多方面的推荐,如此能够有效地解决推荐内容过于单一的问题。
为了便于理解本申请实施例提供的资源推荐方法,下面将介绍DPP模型的相关内容。
DPP模型的相关内容
DPP模型是一种性能较高的概率模型。DPP模型可以将复杂的概率计算转换成简单的行列式计算,并通过核矩阵(也就是上文矩阵L)的行列式计算每一个子集的概率,具体为:子集的概率正比于以该子集中元素作为行下标或列下标的主子式的行列式。另外,DPP模型通过最大后验概率估计,找到待推荐资源集合(如商品集)中相关性和多样性最大的子集,作为目标推荐资源推荐给用户的商品集。DPP不仅减少了计算量,而且提高了运行效率。
假设:Z={z1,z2,……,zM}表示M个待推荐资源的集合,Y属于Z的子集,LY表示由矩阵L中行和列的下标属于Y的元素组成的子矩阵,也就是LY是L的以Y中元素作为行下标或列下标的主子式。
DPP模型相关的理论推导如下:
LY的推荐概率P(Y)的计算公式为:P(Y)∝det(LY)。其中,P(Y)表示LY的推荐概率,det(LY)表示LY的行列式。
由于矩阵L是半正定的,因此存在矩阵B,使得L=BTB。其中,Bi表示矩阵B的第i个列向量,而且,Bi=ri*fi,ri表示第i个待推荐资源与用户的相关性(例如,上文中的资源点击率),sij=<fi,fj>表示第i个待推荐资源与第j个推荐资源之间的相似度。
基于此可知,矩阵L中的lij=<Bi,Bj>=<ri*fi,rj*fj>=ri*rj*sij
此时使得P(Y)∝det(LY)=∏i∈Yri 2.det(SY),其中,SY表示LY对应的相似度矩阵,且SY是相似度矩阵S的以Y中元素作为行下标或列下标的主子式。
从矩阵L的构造可知,待推荐资源与用户之间相关性越大,且待推荐资源之间多样性越丰富,则矩阵L的行列式越大。因此,我们可以建立如下最优化问题:Ymap=argmax{det(LY)},其中,Ymap表示最优解,也就是目标推荐资源的集合;argmax{}表示取最大值。
但是,因直接求解该优化问题比较难,因而基于贪婪算法提出了一种能加速行列式点过程推理过程的方法,其推导过程如下:
首先,将P(Y)∝det(LY)的正比号两边同时取对数(也就是,log)之后,得到的log(P(Y))∝log(det(LY)),其满足次模函数f(Y)=logdet(LY)。
其中,因次模函数是一个集合函数,随着输入集合中元素的增加,增加单个元素到输入集合导致的函数增量的差异减小。
也就是,对于任意zi∈Z,
Figure GDA0003753499340000201
都有f(X∪zi)-f(X)≥f(Y∪zi)-f(Y),其中,X为集合Y的任一子集,Y为集合Z的任一子集。
然后,基于上述理论可以将上述优化问题转换为贪婪的形式:y=argmax{f(Y∪zi)-f(Y)}=argmax{log(det(LY∪zi))-log(det(LY))},其中,y表示能够使得当前次选择达到收益最大值的一个待推荐资源。也就是,每次选择收益最大的一个待推荐资源,作为目标推荐资源,直到满足停止条件,停止收集目标推荐资源。
因在求解上述最优问题过程中,每次迭代的计算复杂度来源于行列式的计算,而求行列式的计算复杂度与该行列式长度的三次方成正比,如此导致该求解过程不适用于对实时性要求较高的应用场景。为了能够提高求解过程,基于以下理论对上述求解过程进行了改进。
首先,对矩阵LYg进行柯列斯基(Cholesky)分解,使得LYg=VVT。其中,Yg表示在逐一收集目标推荐资源过程中的集合,也就是说,Yg是一个用于收集各目标推荐资源的集合。V是一个下三角矩阵。
其次,对于任意zi∈Z\Yg,若将zi添加至Yg中表示为Yg∪zi,则对
Figure GDA0003753499340000202
进行Cholesky分解,得到/>
Figure GDA0003753499340000203
Figure GDA0003753499340000204
基于此可知,以下两个等式成立:/>
Figure GDA0003753499340000205
Figure GDA0003753499340000206
然后,基于上述
Figure GDA0003753499340000207
的Cholesky分解结果可知,在对/>
Figure GDA0003753499340000208
Figure GDA0003753499340000209
取log之后,可以推理得到/>
Figure GDA00037534993400002010
Figure GDA00037534993400002011
基于此式可知,在对/>
Figure GDA00037534993400002012
进行分解后,每次迭代只需计算每个待推荐资源zi对应的/>
Figure GDA00037534993400002013
即可。此时,为了得到/>
Figure GDA00037534993400002014
先需要求解线性方程:
Figure GDA0003753499340000211
得到/>
Figure GDA0003753499340000212
再将得到的/>
Figure GDA0003753499340000213
代入等式/>
Figure GDA0003753499340000214
Figure GDA0003753499340000215
中得到/>
Figure GDA0003753499340000216
此过程的计算复杂度来源于求解线性方程组,虽然求解线性方程组的计算复杂度也是三次方,但是系数矩阵是下三角矩阵,因此,每次迭代的计算复杂度可降到二次方。
然而,即使计算复杂度降到了二次方,但是相比于目前主流的推荐算法,可能依然没有效率优势。因此,为了降低计算复杂度,可以在每次迭代过程中也用增量的方式更新
Figure GDA0003753499340000217
和/>
Figure GDA0003753499340000218
从而避免了求解线性方程组带来的计算复杂度。具体理论推导如下:
首先,对于任意zi∈Z\(Yg∪zj),zj表示未来可能加入到Yg中的待推荐资源,都能推导出
Figure GDA0003753499340000219
然后,将
Figure GDA00037534993400002110
代入上述推导结果中,可以推导得到以下结果:
Figure GDA00037534993400002111
如此,利用上述两个等式,便可以将迭代的计算的复杂度进一步降低至一次方。
基于上述的所有的理论推导可以得到DPP模型的算法流程如下:
第一步:获取输入参数,其中,输入参数包括矩阵L和停止条件为
Figure GDA00037534993400002112
Figure GDA00037534993400002113
第二步:初始化过程参数,得到初始化的过程参数,其中,初始化后的过程参数包括
Figure GDA00037534993400002114
Yg={zm}。其中,zm是指上文中的已选推荐资源,也就是,直接将具有最大资源点击率的待推荐资源,作为上文提及的待推荐资源的推荐排序中的第一位,以便后续能够直接将zm确定为被推荐资源。
第三步:从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi。其中,H=Z\Yg表示集合H属于Z,且
Figure GDA0003753499340000221
H∪Yg=Z。
第四步:根据zi,按照公式
Figure GDA0003753499340000222
进行计算,得到/>
Figure GDA0003753499340000223
第五步:根据zi
Figure GDA0003753499340000224
按照公式/>
Figure GDA0003753499340000225
和/>
Figure GDA0003753499340000226
进行更新,得到更新后的/>
Figure GDA0003753499340000227
和/>
Figure GDA0003753499340000228
第六步:判断H中是否还有处理待推荐资源,若是,则返回执行第三步;若否,则继续执行第七步。
第七步:利用公式
Figure GDA0003753499340000229
筛选出zj,并将zj加入Yg集合中(也就是,利用公式Yg=Yg∪zj)。
第八步:判断zj是否满足停止条件,若是,则执行第九步;若否,则根据H=Z\Yg更新H,并返回执行第三步。
第九步:输出Yg。
基于上述DPP模型的算法流程可知,DPP模型最后可以输出待推荐资源的推荐排序,且在待推荐资源的推荐排序中,位置越靠前的待推荐资源被推荐的可能性越大。
另外,对于上文S3032步骤来说,当预设推荐模型为DPP模型时,则S3032具体可以为:将矩阵L输入到DPP模型中,DPP模型通过执行上述第一步至第九步得到待推荐资源的推荐排序。需要说明的是,因DPP模型输出的
Figure GDA00037534993400002210
使得DPP模型输出的待推荐资源的推荐排序可能只包括一些推荐概率较大的视频,可以不包括一些推荐概率很小的视频。
为了便于进一步理解本申请实施例提供的资源推荐方法,场景实施例将结合图4对本申请实施例提供的资源推荐方法进行整体介绍。
场景实施例
场景实施例是对方法实施例提供的资源推荐方法的示例性介绍,为了简要起见,场景实施例中与方法实施例中部分内容相同,在此不再赘述,该内容相同的部分的技术详情请参照方法实施例中的相关内容。
参见图4,该图为本申请实施例提供的应用于图1所示场景下的资源推荐方法的流程图。
本申请实施例提供的资源推荐方法,包括S401-S413:
S401:终端设备101接收到用户102触发的资源推荐指令之后,获取M个待推荐资源的资源标题、资源标签和资源点击率。其中,M为正整数,M≥1。
本申请实施例不限定资源推荐指令的触发方式。下面结合两个实施方式进行说明。
在一种可能的实施方式中,当用户打开用于进行资源查看的应用程序(Application,APP)、网站或设备时,可以触发资源推荐指令。例如,若资源为视频,则在用户打开视频播放器(如图5所示)、视频播放网站或视频播放设备时,触发资源推荐指令。
在一种可能的实施方式中,当用户选择更新当前页面上的显示资源(例如,用户点击更新按钮、用户通过向上滑动页面或向下滑动页面进行更新)时,可以触发资源推荐指令。例如,若资源为视频,则在用户点击“换一批”的按钮(如图6所示)或者用户向下滑动页面(如图7所示)进行更新时,可以触发资源推荐指令。
S402:终端设备101将各待推荐资源的资源标题输入BERT模型,并将BERT模型中第7网络层的输出向量,确定为各待推荐资源的第一特征。
S403:终端设备101将各待推荐资源的资源标签输入预先训练的LDA模型,得到LDA模型输出的各待推荐资源的第二特征。其中,LDA模型是利用各待推荐资源的资源标签训练得到的。
S404:终端设备101将各待推荐资源的资源标题进行分词,得到各待推荐资源的标题分词。
S405:终端设备101根据各待推荐资源的标题分词和资源标签,得到各待推荐资源的目标分词;
S406:终端设备101将各待推荐资源的目标分词输入预先训练好的fasttext模型,得到该fasttext模型输出的各待推荐资源的第三特征。
S407:终端设备101将各待推荐资源的第一特征的维度、第二特征的维度和第三特征的维度中的最小值,确定为目标维度。
S408:终端设备101根据各待推荐资源的第一特征、第二特征、第三特征和目标维度,分别得到所述各待推荐资源的第四特征、第五特征和第六特征。其中,第四特征的维度、第五特征的维度和第六特征的维度均是是目标维度。
S409:终端设备101将各待推荐资源的第四特征、第五特征和第六特征合并为一个初始特征向量,并将初始特征向量降维至目标维度,得到各待推荐资源的资源特征。其中,初始特征向量的维度为三倍的目标维度,且该资源特征的维度是目标维度。
S410:终端设备101根据M个待推荐资源的资源特征和资源点击率,利用公式(1),生成矩阵L。
S411:终端设备101将矩阵L输入到DPP模型中,使得DPP模型能够通过执行上文第一步至第九步,得到并输出待推荐资源的推荐排序。
S412:终端设备101将待推荐资源的推荐排序中位置最靠前的N个待推荐资源,确定为被推荐资源。
S413:终端设备101显示被推荐资源。
本申请实施例中,终端设备101在获取到被推荐资源之后,终端设备101可以将被推荐资源进行显示。例如,若资源为视频,且N为2时,则终端设备101显示这两个被推荐视频(如图8所示)。
基于上述S401至S413的内容可知,本申请实施例提供的资源推荐方法中,终端设备101先获取待推荐资源的资源信息和资源点击率,并根据待推荐资源的资源信息,生成待推荐资源的资源特征,再根据待推荐资源的资源特征和资源点击率,确定目标推荐资源。可见,因资源信息包括资源推荐的影响信息,使得基于资源信息生成的资源特征也携带有影响资源推荐的信息特征;还因资源点击率是影响资源推荐的重要因素,使得基于资源特征和资源点击率综合确定的目标推荐资源更准确。另外,因资源点击率可以表征用户对该资源的认可程度,且资源特征可以表征除了用户对该资源的认可程度以外的其他影响资源推荐的信息特征,使得综合资源点击率和资源特征确定的目标推荐资源是参考多种因素确定的,避免因只参考单一因素导致的推荐内容单一的现象,如此有利于提高资源推荐的多样性。
基于上述提供的资源推荐方法的相关内容,本申请实施例还提供了对应的资源推荐装置,以使得上述提供的资源推荐方法在实际中得以应用和实现。
装置实施例
需要说明的是,本实施例提供的资源推荐装置的技术详情可以参照上述提供的资源推荐方法。
参见图9,该图为本申请实施例提供的一种资源推荐装置的结构示意图。
本申请实施例提供的资源推荐装置900,包括:
获取单元901,用于获取待推荐资源的资源信息和资源点击率;所述资源信息包括至少两类信息;
提取单元902,用于利用至少两类特征提取模型对所述待推荐资源的资源信息进行特征提取,得到所述待推荐资源的资源特征;
确定单元903,用于根据所述待推荐资源的资源特征和资源点击率,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
筛选单元904,用于根据已选推荐资源和所述相关系数集,从所述待推荐资源中确定至少一个目标推荐资源;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
推荐单元905,用于将所述已选推荐资源和所述至少一个目标推荐资源推荐给目标用户。
可选的,在图9所示的资源推荐装置900的基础上,所述资源信息包括资源标题和资源标签;所述提取单元902,具体用于:
根据所述待推荐资源的资源标题,利用第一类特征提取模型生成所述待推荐资源的第一特征;
根据所述待推荐资源的资源标签,利用第二类特征提取模型生成所述待推荐资源的第二特征;
根据所述待推荐资源的第一特征和所述待推荐资源的第二特征,生成所述待推荐资源的资源特征。
可选的,在图9所示的资源推荐装置900的基础上,所述提取单元902,还用于:根据所述待推荐资源的资源标题和资源标签,利用第三类特征提取模型生成所述待推荐资源的第三特征;
所述提取单元902,具体用于:根据所述待推荐资源的第一特征、所述待推荐资源的第二特征和所述待推荐资源的第三特征,生成所述待推荐资源的资源特征。
可选的,在图9所示的资源推荐装置900的基础上,所述提取单元902,具体用于:
获取目标维度;
根据所述待推荐资源的第一特征和所述目标维度,得到所述待推荐资源的第四特征,所述第四特征的维度是所述目标维度;
根据所述待推荐资源的第二特征和所述目标维度,得到所述待推荐资源的第五特征,所述第五特征的维度是所述目标维度;
根据所述待推荐资源的第三特征和所述目标维度,得到所述待推荐资源的第六特征,所述第六特征的维度是所述目标维度;
根据所述待推荐资源的第四特征、所述待推荐资源的第五特征和所述待推荐资源的第六特征,得到所述待推荐资源的资源特征,所述资源特征的维度是所述目标维度。
可选的,在图9所示的资源推荐装置900的基础上,所述确定单元903,具体用于根据相关系数集的获取公式,确定所述相关系数集,该相关系数集的获取公式具体为:
Figure GDA0003753499340000261
式中,矩阵L表示相关系数集,矩阵L中的lij表示第i个待推荐资源与第i个待推荐资源的相关系数,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;A表示由待推荐资源的资源点击率构成的对角矩阵,该矩阵中的ri表示第i个待推荐资源的资源点击率,i为正整数,且1≤i≤M;S表示由不同待推荐资源之间的相似度构成的矩阵,该矩阵中的sij表示第i个待推荐资源与第j个待推荐资源之间的相似度,且根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征确定sij,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;M为待推荐资源的总数,M正整数,且M≥1。
可选的,在图9所示的资源推荐装置900的基础上,如图10所示,当所述待推荐资源为视频时,所述资源推荐装置900还包括:特征获取单元906;
所述特征获取单元906,用于获取所述待推荐资源的画面特征,并获取所述待推荐资源的音频特征;
所述所述确定单元903,具体用于:
根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征的乘积,确定第一相似度;
根据第i个待推荐资源的画面特征与第j个待推荐资源的画面特征,利用第一预设算法确定第二相似度;
根据第i个待推荐资源的音频特征与第j个待推荐资源的音频特征,利用第二预设算法确定第三相似度;
将所述第一相似度、所述第二相似度和所述第三相似度进行加权求和,得到sij
可选的,在图9或图10所示的资源推荐装置900的基础上,所述筛选单元904,具体用于:
将所述已选推荐资源,确定为行列式点过程DPP模型的初始化参数;
将所述相关系数集输入到所述DPP模型,得到所述DPP模型输出的所述待推荐资源的推荐排序;
根据所述待推荐资源的推荐排序,确定至少一个目标推荐资源。
基于上述资源推荐装置900的相关内容可知,本申请实施例中,先获取待推荐资源的资源信息和资源点击率,并利用至少两类特征提取模型对待推荐资源的资源信息进行特征提取,得到待推荐资源的资源特征;再根据待推荐资源的资源特征和资源点击率,确定包括任意两个推荐资源的相关系数的相关系数集,并根据已选推荐资源和相关系数集,从待推荐资源中确定至少一个目标推荐资源,以便将已选推荐资源和至少一个目标推荐资源推荐给目标用户。
可见,因资源信息包括资源推荐的多类影响信息,使得基于资源信息生成的资源特征携带有影响资源推荐的多类信息特征;还因资源点击率是影响资源推荐的重要因素,使得基于资源特征和资源点击率综合确定的相关系数集,能够更准确地表征不同待推荐资源在多种方面上的相关程度;还因已选推荐资源是基于目标用户的历史点击行为确定的资源,使得基于已选推荐资源与相关系数集,确定的目标推荐资源是从至少一种方面与已选推荐资源相关的,如此实现了在满足用户喜好的前提下尽可能地进行多方面的推荐,如此能够有效地解决推荐内容过于单一的问题。
本申请实施例还提供了一种用于推荐资源的终端设备和服务器,下面将从硬件实体化的角度对本申请实施例提供的用于推荐资源的终端设备和服务器进行介绍。
参见图11,为本申请实施例提供的一种终端设备的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称:Personal DigitalAssistant,英文缩写:PDA)、销售终端(英文全称:Point of Sales,英文缩写:POS)、车载电脑等任意终端设备,以终端为平板电脑为例:
图11示出的是与本申请实施例提供的终端相关的平板电脑的部分结构的框图。参考图11,平板电脑包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路1110、存储器1120、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(英文全称:wireless fidelity,英文缩写:WiFi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解,图11中示出的平板电脑结构并不构成对平板电脑的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储器1120可用于存储软件程序以及模块,处理器1180通过运行存储在存储器1120的软件程序以及模块,从而执行平板电脑的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据平板电脑的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1180是平板电脑的控制中心,利用各种接口和线路连接整个平板电脑的各个部分,通过运行或执行存储在存储器1120内的软件程序和/或模块,以及调用存储在存储器1120内的数据,执行平板电脑的各种功能和处理数据。可选的,处理器1180可包括一个或多个处理单元;优选的,处理器1180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1180中。
在本申请实施例中,该终端所包括的处理器1180还具有以下功能:
获取待推荐资源的资源信息和资源点击率;所述资源信息包括至少两类信息;
利用至少两类特征提取模型对所述待推荐资源的资源信息进行特征提取,得到所述待推荐资源的资源特征;
根据所述待推荐资源的资源特征和资源点击率,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
根据已选推荐资源和所述相关系数集,从所述待推荐资源中确定至少一个目标推荐资源;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
将所述已选推荐资源和所述至少一个目标推荐资源推荐给目标用户。
可选的,所述处理器1180还用于执行本申请实施例提供的资源推荐方法的任意一种实现方式的步骤。
本申请实施例还提供了一种服务器,图12是本申请实施例提供的一种服务器的结构示意图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1222(例如,一个或一个以上处理器)和存储器1232,一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中,存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1222可以设置为与存储介质1230通信,在服务器1200上执行存储介质1230中的一系列指令操作。
服务器1200还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258,和/或,一个或一个以上操作系统1241,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图12所示的服务器结构。
其中,CPU 1222用于执行如下步骤:
获取待推荐资源的资源信息和资源点击率;所述资源信息包括至少两类信息;
利用至少两类特征提取模型对所述待推荐资源的资源信息进行特征提取,得到所述待推荐资源的资源特征;
根据所述待推荐资源的资源特征和资源点击率,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
根据已选推荐资源和所述相关系数集,从所述待推荐资源中确定至少一个目标推荐资源;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
将所述已选推荐资源和所述至少一个目标推荐资源推荐给目标用户。
可选的,CPU 1222还可以用于执行本申请实施例中资源推荐方法的任意一种实现方式的步骤。
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的一种资源推荐方法中的任意一种实施方式。
本申请实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述各个实施例所述的一种资源推荐方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (5)

1.一种资源推荐方法,其特征在于,包括:
获取待推荐资源的资源信息和资源点击率;所述资源信息包括资源标题和资源标签;
根据所述待推荐资源的资源标题,利用第一类特征提取模型生成所述待推荐资源的第一特征;
根据所述待推荐资源的资源标签,利用第二类特征提取模型生成所述待推荐资源的第二特征;
将所述待推荐资源的资源标题进行分词,得到所述待推荐资源的标题分词;
根据所述待推荐资源的标题分词和所述待推荐资源的资源标签,生成所述待推荐资源的目标分词;
采用预设模型,基于所述待推荐资源的目标分词生成所述待推荐资源的第三特征;所述第三特征用于表征待推荐资源的资源标题和资源标签的综合特征;
根据所述待推荐资源的第一特征、所述待推荐资源的第二特征和所述待推荐资源的第三特征,生成所述待推荐资源的资源特征;
获取所述待推荐资源的画面特征与所述待推荐资源的音频特征,所述待推荐资源为视频;
根据由所述第一特征、所述第二特征和所述第三特征生成的所述待推荐资源的资源特征、所述待推荐资源的画面特征、所述待推荐资源的音频特征和资源点击率,以及相关系数集的获取公式,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
所述相关系数集的获取公式,具体为:
Figure DEST_PATH_IMAGE002
式中,矩阵L表示相关系数集,矩阵L中的
Figure DEST_PATH_IMAGE004
表示第i个待推荐资源与第j个待推荐资源的相关系数,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;A表示由待推荐资源的资源点击率构成的对角矩阵,该矩阵中的
Figure DEST_PATH_IMAGE006
表示第i个待推荐资源的资源点击率,i为正整数,且1≤i≤M;S表示由不同待推荐资源之间的相似度构成的矩阵,该矩阵中的
Figure DEST_PATH_IMAGE008
表示第i个待推荐资源与第j个待推荐资源之间的相似度,且根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征确定
Figure 945095DEST_PATH_IMAGE008
i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;M为待推荐资源的总数,M正整数,且M≥1;
所述根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征确定
Figure 331077DEST_PATH_IMAGE008
包括:
根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征的乘积,确定第一相似度;
根据第i个待推荐资源的画面特征与第j个待推荐资源的画面特征,利用第一预设算法确定第二相似度;
根据第i个待推荐资源的音频特征与第j个待推荐资源的音频特征,利用第二预设算法确定第三相似度;
将所述第一相似度、所述第二相似度和所述第三相似度进行加权求和,得到
Figure 845235DEST_PATH_IMAGE008
将已选推荐资源,确定为行列式点过程DPP模型的初始化参数;
获取所述DPP模型的输入参数,其中,所述输入参数包括所述矩阵L和停止条件为
Figure DEST_PATH_IMAGE010
<ε;
初始化过程参数,得到初始化后的过程参数,其中,初始化后的过程参数包括
Figure DEST_PATH_IMAGE012
=[ ],
Figure DEST_PATH_IMAGE014
,zj=argmaxi∈Zlog(
Figure DEST_PATH_IMAGE016
),Yg={zm};其中,Yg是用于收集目标推荐资源的集合;zm是所述已选推荐资源;Z={z1,z2,……,zM}表示M个待推荐资源的集合;zj表示未来可能加入到Yg中的待推荐资源;
从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi;其中,H=Z\Yg表示集合H属于Z,且H∩Yg=∅,H∪Yg=Z;
根据zi,按照公式
Figure DEST_PATH_IMAGE018
进行计算,得到
Figure DEST_PATH_IMAGE020
根据zi
Figure 381390DEST_PATH_IMAGE020
,按照公式
Figure DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE024
进行更新,得到更新后的
Figure 5882DEST_PATH_IMAGE012
Figure 562765DEST_PATH_IMAGE016
判断H中是否还有处理待推荐资源,若是,则返回执行所述从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi的步骤;若否,则利用公式zj =argmaxi∈Hlog(
Figure 688853DEST_PATH_IMAGE016
),筛选出zj,并将筛选出的zj加入Yg集合中;
判断zj是否满足停止条件,若否,则根据H=Z\Yg更新H,并返回执行所述从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi的步骤;若是,则输出Yg,得到所述待推荐资源的推荐排序;
根据所述待推荐资源的推荐排序,将排序第2至第N的待推荐资源确定为目标推荐资源,N为正整数,N≥1;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
将所述已选推荐资源和所述目标推荐资源推荐给目标用户。
2.根据权利要求1所述的方法,其特征在于,所述待推荐资源的第一特征、所述待推荐资源的第二特征和所述待推荐资源的第三特征均是向量;所述根据所述待推荐资源的第一特征、所述待推荐资源的第二特征和所述待推荐资源的第三特征,生成所述待推荐资源的资源特征,包括:
获取目标维度;
根据所述待推荐资源的第一特征和所述目标维度,得到所述待推荐资源的第四特征,所述第四特征的维度是所述目标维度;
根据所述待推荐资源的第二特征和所述目标维度,得到所述待推荐资源的第五特征,所述第五特征的维度是所述目标维度;
根据所述待推荐资源的第三特征和所述目标维度,得到所述待推荐资源的第六特征,所述第六特征的维度是所述目标维度;
根据所述待推荐资源的第四特征、所述待推荐资源的第五特征和所述待推荐资源的第六特征,得到所述待推荐资源的资源特征,所述资源特征的维度是所述目标维度。
3.一种资源推荐装置,其特征在于,包括:
获取单元,用于获取待推荐资源的资源信息和资源点击率;所述资源信息包括资源标题和资源标签;
提取单元,用于根据所述待推荐资源的资源标题,利用第一类特征提取模型生成所述待推荐资源的第一特征;根据所述待推荐资源的资源标签,利用第二类特征提取模型生成所述待推荐资源的第二特征;将所述待推荐资源的资源标题进行分词,得到所述待推荐资源的标题分词;根据所述待推荐资源的标题分词和所述待推荐资源的资源标签,生成所述待推荐资源的目标分词;采用预设模型,基于所述待推荐资源的目标分词生成所述待推荐资源的第三特征,第三特征用于表征待推荐资源的资源标题和资源标签的综合特征;根据所述待推荐资源的第一特征、所述待推荐资源的第二特征和所述待推荐资源的第三特征,生成所述待推荐资源的资源特征;
特征获取单元,用于获取所述待推荐资源的画面特征与所述待推荐资源的音频特征,所述待推荐资源为视频;
确定单元,用于根据由所述第一特征、所述第二特征和所述第三特征生成的所述待推荐资源的资源特征、所述待推荐资源的画面特征、所述待推荐资源的音频特征和资源点击率,以及相关系数集的获取公式,确定相关系数集;所述相关系数集包括任意两个推荐资源的相关系数;
所述相关系数集的获取公式,具体为:
Figure DEST_PATH_IMAGE002A
式中,矩阵L表示相关系数集,矩阵L中的
Figure 700802DEST_PATH_IMAGE004
表示第i个待推荐资源与第j个待推荐资源的相关系数,i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;A表示由待推荐资源的资源点击率构成的对角矩阵,该矩阵中的
Figure 838523DEST_PATH_IMAGE006
表示第i个待推荐资源的资源点击率,i为正整数,且1≤i≤M;S表示由不同待推荐资源之间的相似度构成的矩阵,该矩阵中的
Figure 566307DEST_PATH_IMAGE008
表示第i个待推荐资源与第j个待推荐资源之间的相似度,且根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征确定
Figure 179691DEST_PATH_IMAGE008
i为正整数,且1≤i≤M,j为正整数,且1≤j≤M;M为待推荐资源的总数,M正整数,且M≥1;
所述根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征确定
Figure 385545DEST_PATH_IMAGE008
包括:
根据第i个待推荐资源的资源特征与第j个待推荐资源的资源特征的乘积,确定第一相似度;
根据第i个待推荐资源的画面特征与第j个待推荐资源的画面特征,利用第一预设算法确定第二相似度;
根据第i个待推荐资源的音频特征与第j个待推荐资源的音频特征,利用第二预设算法确定第三相似度;
将所述第一相似度、所述第二相似度和所述第三相似度进行加权求和,得到
Figure 643351DEST_PATH_IMAGE008
筛选单元,用于将已选推荐资源,确定为行列式点过程DPP模型的初始化参数;获取所述DPP模型的输入参数,其中,所述输入参数包括所述矩阵L和停止条件为
Figure 682982DEST_PATH_IMAGE010
<ε;初始化过程参数,得到初始化后的过程参数,其中,初始化后的过程参数包括
Figure 659028DEST_PATH_IMAGE012
=[ ],
Figure 668572DEST_PATH_IMAGE014
,zj=argmaxi∈Zlog(
Figure 46464DEST_PATH_IMAGE016
),Yg={zm};其中,Yg是用于收集目标推荐资源的集合;zm是所述已选推荐资源;Z={z1,z2,……,zM}表示M个待推荐资源的集合;zj表示未来可能加入到Yg中的待推荐资源;从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi;其中,H=Z\Yg表示集合H属于Z,且H∩Yg=∅,H∪Yg=Z;根据zi,按照公式
Figure 240685DEST_PATH_IMAGE018
进行计算,得到
Figure 438448DEST_PATH_IMAGE020
;根据zi
Figure 251683DEST_PATH_IMAGE020
,按照公式
Figure 359448DEST_PATH_IMAGE022
Figure 865516DEST_PATH_IMAGE024
进行更新,得到更新后的
Figure 284996DEST_PATH_IMAGE012
Figure 26556DEST_PATH_IMAGE016
;判断H中是否还有处理待推荐资源,若是,则返回执行所述从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi的步骤;若否,则利用公式zj =argmaxi∈Hlog(
Figure 113460DEST_PATH_IMAGE016
),筛选出zj,并将筛选出的zj加入Yg集合中;判断zj是否满足停止条件,若否,则根据H=Z\Yg更新H,并返回执行所述从H=Z\Yg集合中获取一个未处理的待推荐资源,作为zi的步骤;若是,则输出Yg,得到所述待推荐资源的推荐排序;根据所述待推荐资源的推荐排序,将排序第2至第N的待推荐资源确定为目标推荐资源,N为正整数,N≥1;所述已选推荐资源是基于目标用户的历史点击行为确定的资源;
推荐单元,用于将所述已选推荐资源和所述目标推荐资源推荐给目标用户。
4.一种资源推荐设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行权利要求1-2中任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于使计算机设备执行权利要求1-2中任一项所述的方法。
CN202010195961.8A 2020-03-19 2020-03-19 一种资源推荐方法、装置、设备及存储介质 Active CN111400615B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010195961.8A CN111400615B (zh) 2020-03-19 2020-03-19 一种资源推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010195961.8A CN111400615B (zh) 2020-03-19 2020-03-19 一种资源推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111400615A CN111400615A (zh) 2020-07-10
CN111400615B true CN111400615B (zh) 2023-03-24

Family

ID=71428885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010195961.8A Active CN111400615B (zh) 2020-03-19 2020-03-19 一种资源推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111400615B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861678B (zh) * 2020-08-03 2024-03-26 上海秒针网络科技有限公司 一种资源推荐方法、装置、电子设备及存储介质
CN112395496A (zh) * 2020-10-22 2021-02-23 上海众源网络有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN112650778B (zh) * 2020-12-24 2024-03-12 北京达佳互联信息技术有限公司 信息推荐系统、方法、装置、服务器及存储介质
CN113157951A (zh) * 2021-03-26 2021-07-23 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法、装置、服务器及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN109800325A (zh) * 2018-12-26 2019-05-24 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101634996A (zh) * 2009-08-13 2010-01-27 浙江大学 基于综合考量的个性化视频排序方法
CN104156472B (zh) * 2014-08-25 2018-05-08 北京四达时代软件技术股份有限公司 一种视频推荐方法及系统
CN106354867A (zh) * 2016-09-12 2017-01-25 传线网络科技(上海)有限公司 多媒体资源的推荐方法及装置
CN109815368A (zh) * 2018-12-10 2019-05-28 百度在线网络技术(北京)有限公司 资源推荐方法、装置、设备及计算机可读存储介质
CN110213670B (zh) * 2019-05-31 2022-01-07 北京奇艺世纪科技有限公司 视频处理方法、装置、电子设备及存储介质
CN110413894B (zh) * 2019-07-31 2023-09-26 腾讯科技(深圳)有限公司 内容推荐模型的训练方法、内容推荐的方法及相关装置
CN110446065A (zh) * 2019-08-02 2019-11-12 腾讯科技(武汉)有限公司 一种视频召回方法、装置及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN109800325A (zh) * 2018-12-26 2019-05-24 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
个性化推荐系统技术进展;刘君良等;《计算机科学》;20200628(第07期);第47-55页 *

Also Published As

Publication number Publication date
CN111400615A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111400615B (zh) 一种资源推荐方法、装置、设备及存储介质
US20220198289A1 (en) Recommendation model training method, selection probability prediction method, and apparatus
KR102122373B1 (ko) 사용자 포트레이트를 획득하는 방법 및 장치
CN109508584B (zh) 视频分类的方法、信息处理的方法以及服务器
CN106776673B (zh) 多媒体文档概括
EP4145308A1 (en) Search recommendation model training method, and search result sorting method and device
EP3862893A1 (en) Recommendation model training method, recommendation method, device, and computer-readable medium
CN110232403B (zh) 一种标签预测方法、装置、电子设备及介质
CN103955464B (zh) 一种基于情境融合感知的推荐方法
US9875294B2 (en) Method and apparatus for classifying object based on social networking service, and storage medium
CN109471978B (zh) 一种电子资源推荐方法及装置
CN110781407A (zh) 用户标签生成方法、装置及计算机可读存储介质
WO2018196718A1 (zh) 图像消歧方法、装置、存储介质和电子设备
WO2019228316A1 (zh) 动作识别方法和装置
CN108959429A (zh) 一种融合视觉特征端对端训练的电影推荐的方法及系统
CN108228844A (zh) 一种图片筛选方法及装置、存储介质、计算机设备
CN113657087B (zh) 信息的匹配方法及装置
CN111709398A (zh) 一种图像识别的方法、图像识别模型的训练方法及装置
CN110765286A (zh) 跨媒体检索方法、装置、计算机设备和存储介质
CN116108267A (zh) 一种推荐方法及相关设备
CN112785005A (zh) 多目标任务的辅助决策方法、装置、计算机设备及介质
CN116186326A (zh) 视频推荐方法、模型训练方法、电子设备及存储介质
CN117459575A (zh) 业务数据推送方法、装置、计算机设备和存储介质
CN116049536A (zh) 一种推荐方法及相关装置
CN111062440A (zh) 一种样本选择方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant