CN112464106B - 对象推荐方法及装置 - Google Patents

对象推荐方法及装置 Download PDF

Info

Publication number
CN112464106B
CN112464106B CN202011347159.2A CN202011347159A CN112464106B CN 112464106 B CN112464106 B CN 112464106B CN 202011347159 A CN202011347159 A CN 202011347159A CN 112464106 B CN112464106 B CN 112464106B
Authority
CN
China
Prior art keywords
target user
user account
recommended
recommendation
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011347159.2A
Other languages
English (en)
Other versions
CN112464106A (zh
Inventor
王磊
曹煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bilibili Technology Co Ltd
Original Assignee
Shanghai Bilibili Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bilibili Technology Co Ltd filed Critical Shanghai Bilibili Technology Co Ltd
Priority to CN202011347159.2A priority Critical patent/CN112464106B/zh
Publication of CN112464106A publication Critical patent/CN112464106A/zh
Application granted granted Critical
Publication of CN112464106B publication Critical patent/CN112464106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供对象推荐方法及装置,其中所述对象推荐方法包括:获取目标用户账号;根据目标用户账号与待推荐对象相关的历史数据对目标用户账号进行分类;在目标用户账号属于第一类型的情况下,通过推荐值预测模型确定目标用户账号对应的对象推荐列表;在目标用户账号属于第二类型的情况下,通过相似度确定目标用户账号对应的对象推荐列表;向目标用户展示对象推荐列表。如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行对象推荐,提高了向目标用户推荐对象的准确率。

Description

对象推荐方法及装置
技术领域
本申请涉及计算机技术领域,特别涉及一种对象推荐方法。本申请同时涉及一种对象推荐装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着计算机技术的快速发展,人们日常生活中面临的信息与日俱增,为解决人们面对海量信息的无所适从,各种各样的推荐方法应运而生,向人们推荐其可能会感兴趣的对象。
现有技术中,往往是通过计算用户相似度或对象相似度来进行对象推荐,具体的,可以先确定目标用户的相似用户,然后将相似用户关注的对象推荐给目标用户;或者,可以先确定向目标用户推荐过的对象,然后将与该对象相似的对象也推荐给目标用户。
然而,通过计算用户相似度或对象相似度来进行对象推荐的方式,需要大量用户与选择对象的数据,计算出的相似度才会准确,后续向目标用户推荐的对象才会较为准确,对于缺少用户与选择对象的数据的情况,计算出的相似度准确性较差,从而导致向目标用户推荐对象的准确率较低。
发明内容
有鉴于此,本申请实施例提供了一种对象推荐方法。本申请同时涉及一种对象推荐装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的向目标用户推荐对象的准确率较低的问题。
根据本申请实施例的第一方面,提供了一种对象推荐方法,包括:
获取目标用户账号;
根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
向所述目标用户展示所述对象推荐列表。
根据本申请实施例的第二方面,提供了一种对象推荐装置,包括:
第一获取模块,被配置为获取目标用户账号;
分类模块,被配置为根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
确定模块,被配置为在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
展示模块,被配置为向所述目标用户展示所述对象推荐列表。
根据本申请实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:
获取目标用户账号;
根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
向所述目标用户展示所述对象推荐列表。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意所述对象推荐方法的步骤。
本申请提供的对象推荐方法,可以在获取目标用户账号之后,根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;并在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;然后,向所述目标用户展示所述对象推荐列表。这种情况下,在获取到目标用户账号后,可以对目标用户账号进行分类处理,一部分目标用户账号可以通过计算相似度的方式进行对象推荐,而一部分目标用户账号可以通过推荐值预测模型进行对象推荐;如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行对象推荐,提高了向目标用户推荐对象的准确率。
附图说明
图1是本申请一实施例提供的一种对象推荐方法的流程图;
图2是本申请一实施例提供的一种应用于游戏场景的对象推荐方法的示意图;
图3是本申请一实施例提供的一种深度因子分解机模型示意图;
图4是本申请一实施例提供的一种基于用户相似度确定游戏推荐列表的示意图;
图5是本申请一实施例提供的一种基于游戏相似度确定游戏推荐列表的示意图;
图6是本申请一实施例提供的一种对象推荐装置的结构示意图;
图7是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
协同过滤算法:常常被用于分辨用户可能感兴趣的对象,是一种较为著名和常用的推荐算法,它基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的对象进行推荐。主要实现由:根据和目标用户有共同喜好的用户给目标用户推荐;根据目标用户喜欢的对象给目标用户推荐相似对象;根据以上条件综合推荐。因此,可以得出常用的协同过滤算法分为两种,基于用户的协同过滤算法(user-based collaboratIvefiltering),通过不同用户对对象的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐;基于对象的协同过滤算法(item-based collaborative filtering),通过用户对不同对象的评分来评测对象之间的相似性,基于对象之间的相似性做出推荐。
深度因子分解机(DeepFM)模型:是一个新的神经网络框架,结合了因子分解机函数(FM)在推荐中的优势和深度学习在特征学习中的优势,即DeepFM模型包含两部分:神经网络和因子分解机函数,分别负责低阶特征的提取和高阶特征的提取。
点击通过率(Click-Through-Rate,CTR):是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Show content),CTR是衡量互联网广告效果(即推荐效果)的一项重要指标。
在本申请中,提供了一种对象推荐方法,本申请同时涉及一种对象推荐装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例提供的一种对象推荐方法的流程图,具体包括以下步骤:
步骤102:获取目标用户账号。
实际应用中,往往是通过基于用户的协同过滤算法,计算用户相似度,对用户进行对象推荐;或者,通过基于对象的协同过滤算法,计算对象相似度,来对用户进行对象推荐。具体的,可以先确定目标用户的相似用户,然后将相似用户关注的对象推荐给目标用户;或者,可以先确定向目标用户推荐过的对象,然后将与该对象相似的对象也推荐给目标用户。然而,上述基于协同过滤算法的推荐方法,需要大量用户与选择对象的数据,对于缺少用户与选择对象的数据的情况,计算出的相似度准确性较差,从而导致向目标用户推荐对象的准确率较低。
因而,本申请中为了提高向目标用户推荐对象的准确率,提供了一种对象推荐方法,可以在获取目标用户账号之后,根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;并在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;然后,向所述目标用户展示所述对象推荐列表。如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行对象推荐。
具体的,目标用户账号是等待推荐对象的用户账号,该目标用户账号可以是批量获取到的用户账号,即该目标用户账号的个数可以为多个。
步骤104:根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类。
具体的,在获取目标用户账号的基础上,进一步的,将根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类。
实际实现时,待推荐对象可以为游戏、应用程序、商品等可以向用户推荐的对象,相应的,与待推荐对象相关的历史数据可以为目标用户账号对应的所有历史数据中与游戏相关的历史数据,或者可以为目标用户账号对应的所有历史数据中与应用程序相关的历史数据,又或者可以为目标用户账号对应的所有历史数据中与商品相关的历史数据,本申请对此不进行限制。
需要说明的是,由于通过协同过滤算法计算用户相似度或对象相似度,进行对象推荐,需要足够多的与待推荐对象相关的历史数据支持,因而可以通过与待推荐对象相关的历史数据对所述目标用户账号进行分类,便于后续分类进行处理。
本实施例一个可选的实施方式中,根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类,具体实现过程可以如下:
确定所述历史数据的第一数据量;
在所述第一数据量大于数据量阈值的情况下,确定所述目标用户账号属于第二类型;
在所述第一数据量不大于数据量阈值的情况下,确定所述目标用户账号属于第一类型。
具体的,第一类型可以是指与待推荐对象相关的历史数据较少的用户账号对应的类型;第二类型可以是指与待推荐对象相关的历史数据较多的用户账号对应的类型。另外,数据量阈值是预先设置的,用于判断与待推荐对象相关的历史数据是否足够支持相似度计算。
实际实现时,由于通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表,需要耗费的服务器资源比较多,因而当服务器负载过大时,需要使得尽量少的目标用户通过推荐值预测模型方式进行对象推荐,而当服务器负载较小时,为了保证对象推荐的准确率,则需要使得较多的目标用户通过推荐值预测模型方式进行对象推荐;也就是说,该数据量阈值可以根据服务器的负载进行设置,从而灵活确定对象推荐方式,适应服务器的不同负载情况。
需要说明的是,如果历史数据的第一数据量大于数据量阈值,则说明目标用户账号与待推荐对象相关的历史数据充足,足以支持相似度计算,因而确定所述目标用户账号属于第二类型,后续可以通过相似度确定所述目标用户账号对应的对象推荐列表;而如果历史数据的第一数据量不大于数据量阈值,则说明目标用户账号与待推荐对象相关的历史数据较少,不足以支持相似度计算,因而确定所述目标用户账号属于第一类型,后续可以通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表。
本申请中可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,后续采用不同的方式进行对象推荐,确定向目标用户推荐的对象的灵活性更高,适用于各种不同的实际应用场景。
步骤106:在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表。
需要说明的是,在所述目标用户账号属于第一类型的情况下,说明目标用户账号与待推荐对象相关的历史数据较少,无法准确计算用户相似度或对象相似度,因而可以通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表,其中,推荐值预测模型是一个可以对目标用户特征和对象特征进行分析,从而输出所述待推荐对象针对所述目标用户的预测推荐值的模型,如该推荐值预测模型可以为深度因子分解机模型。
本实施例一个可选的实施方式中,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表,具体实现过程可以如下:
确定所述目标用户对应的至少一个特征向量,每个所述特征向量包括目标用户账号的用户特征和第一待推荐对象的对象特征;
针对所述至少一个特征向量中的每个所述特征向量,通过所述推荐值预测模型确定所述第一待推荐对象针对所述目标用户账号的预测推荐值;
将确定出的各个所述第一待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
具体的,目标用户账号的用户特征可以是指描述用户信息的特征,如目标用户账号的用户特征可以为用户关注领域、关注博主等。第一待推荐对象的对象特征可以是指描述对象信息的特征,如第一待推荐对象为游戏,第一待推荐对象的对象特征可以为游戏的类别、热度、排名等。
需要说明的是,确定出各个第一待推荐对象针对目标用户账号的预测推荐值之后,可以对预测推荐值进行降序排序,然后选取前预设数值个预测推荐值,或者选取大于推荐值阈值的预测推荐值,将选取出的预测推荐值对应的第一待推荐对象组和成对象推荐列表。
本实施例一个可选的实施方式中,确定所述目标用户对应的至少一个特征向量,具体实现过程可以如下:
从所述历史数据中获取所述目标用户账号的用户特征;
获取预先设置的至少一个第一待推荐对象对应的对象特征;
针对所述至少一个第一待推荐对象中的每个所述第一待推荐对象,将所述用户特征和所述对象特征组合成一个特征向量,得到所述至少一个特征向量。
需要说明的是,每个特征向量是由目标用户账号的用户特征和一个第一待推荐对象的对象特征构成,将该特征向量输入所述推荐值预测模型,就可以得到该第一待推荐对象针对该目标用户账号的预测推荐值,因而获取到多少个第一待推荐对象,就可以和目标用户账号的用户特征组成多少个特征向量,然后通过推荐值预测模型可以确定出各个第一待推荐对象针对目标用户账号的预测推荐值。
示例的,待推荐对象为游戏,从游戏排行榜中获取排行前3的游戏对应的游戏特征:游戏1的特征、游戏2的特征和游戏3的特征,假设目标用户账号为用户账号A,分别将上述5个游戏的特征和用户账号A的用户特征进行组合,得到5个特征向量,分别为:特征向量1[用户账号A的用户特征,游戏1的特征],特征向量2[用户账号A的用户特征,游戏2的特征],特征向量3[用户账号A的用户特征,游戏3的特征]。将上述3个特征向量分别输入推荐值预测模型,可以分别得到游戏1、游戏2和游戏3针对用户账号A的预测推荐值,将该预测推荐值进行降序排序,选择靠前的2个组成用户账号A对应的对象推荐列表。
本实施例一个可选的实施方式中,推荐值预测模型包括预设特征分解函数、第一特征分析网络和第二特征分析网络;
所述针对所述至少一个特征向量中的每个所述特征向量,通过所述推荐值预测模型确定所述第一待推荐对象针对所述目标用户账号的预测推荐值,具体实现过程可以如下:
根据所述特征向量包括的用户特征和对象特征对应的属性,将所述用户特征和所述对象特征划分为高阶特征和低阶特征;
通过所述预设特征分解函数确定所述低阶特征的第一特征分析结果;
通过第一特征分析网络确定出所述高阶特征的第二特征分析结果;
通过第二特征分析网络对所述第一特征分析结果和所述第二特征分析结果进行融合,得到所述第一待推荐对象针对所述目标用户账号的预测推荐值。
具体的,高阶特征可以是指数据分布较稀疏的特征,如游戏热度、关注人数等;低阶特征可以是指数据分布较密集的特征,如用户账号ID、游戏类别、用户关注领域等。
需要说明的是,预设特征分解函数用于对低阶特征进行分析处理,得到低阶特征的分析结果,该预设特征分解函数可以为因子分解机函数;第一特征分析网络用于对高阶特征进行分析处理,得到高阶特征的分析结果,该第一特征分析网络可以为深度神经网络(DNN);第二特征分析网络用于对低阶特征的分析结果和高阶特征的分析结果进行融合,得到特征向量总的分析结果,该第二特征分析网络可以为三层神经网络。
本申请中对于数据分布较稀疏的高阶特征,可以将其输入深度神经网络进行特征分析处理,而对于数据分布较密集的低阶特征,可以将其输入因子分解机函数进行特征分析处理,此后再将两者输出汇入一个三层神经网络,将高阶特征和低阶特征的分析处理结果融合,得到第一待推荐对象针对目标用户账号的预测推荐值。如此,对于特征向量中的高阶特征和低阶特征,可以分别采用不同的网络进行处理,并不是所有的特征都必须经深度神经网络进行处理,节省了处理资源,提高了处理效率。
本实施例一个可选的实施方式中,通过第一特征分析网络确定出所述高阶特征的第二特征分析结果,具体实现过程可以如下:
通过预设编码规则对所述高阶特征进行编码,得到所述高阶特征对应的编码结果;
对所述高阶特征对应的编码结果进行分区处理,得到至少一个区域编码;
将所述至少一个区域编码输入所述第一特征分析网络,得到至少一个区域处理结果;
对所述至少一个区域处理结果进行拼接,得到所述第二特征分析结果。
具体的,预设编码规则为预先设置的用于对高阶特征进行编码的规则,如该预设编码规则可以为one-hot特征编码,即对特征向量中的每个特征都采用预设数值个0或1进行编码表示(使用由0和1构成的向量对特征进行唯一标识)。
需要说明的是,为应对编码后的特征数据可能出现维度爆炸的问题,本申请中对于高阶特征进行特征分区域降维处理,即将高阶特征中的每一个特征作为一个区域,通过深度神经网络的全连接层分别在区域内进行降维,再将各区域处理后的结果进行拼接,从而大幅度降低运算复杂度,提高运算效率。
其中,所述推荐值预测模型通过如下方法训练得到:
获取样本对象,所述样本对象包括对象特征和点击通过率;
将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值;
基于所述输出推荐值和所述点击通过率确定损失值,基于损失值对初始模型进行训练,直至达到训练停止条件,得到所述推荐值预测模型。
具体的,样本对象包括的对象特征为样本,而点击通过率为样本标签,可以基于输出推荐值与点击通过率(样本标签)计算交叉熵损失函数,生成损失值。其中,样本标签可以是指真实想要推荐值预测模型输出的结果(即预测推荐值),也即样本标签包括的点击通过率为真实结果,而将对象特征输入初始模型,得到的输出推荐值就是模型的输出结果,在模型的输出结果和真实结果之间的差值足够小时,说明模型的输出结果足够接近真实结果,此时初始模型训练完成,得到推荐值预测模型。
本申请中通过计算损失值可以直观的示出模型的输出结果与真实结果之间的差异,再对初始模型进行针对性训练,调整参数,可以有效提高模型训练的速率及模型训练的效果。
其中,基于损失值对初始模型进行训练,直至达到训练停止条件,可以包括:
判断损失值是否小于预设阈值;
若否,则返回执行上述将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值的步骤,并继续训练;
若是,则确定达到该训练停止条件。
其中,预设阈值为损失值的临界值,在损失值大于或等于预设阈值的情况下,说明初始模型的输出结果与真实结果之间仍存在一定偏差,仍需调整初始模型的参数,并继续将获取到的样本对象的对象特征输入输入初始模型继续进行训练;在损失值小于预设阈值的情况下,说明初始模型的输出结果与真实结果的接近程度已经足够,可以停止训练。预设阈值的数值可以根据实际情况确定,本申请对此不做限制。
本申请中可以根据损失值判断初始模型的具体训练情况,并在训练未合格的情况下根据损失值反向调整初始模型的参数以提高该模型的分析能力,训练速率高,且训练效果好。
本实施例一个可选的实施方式中,获取到样本对象之后,还可以对样本对象进行筛选,然后再对初始模型进行训练,也即所述获取样本对象之后,还包括:
确定所述样本对象中点击通过率属于目标数值的第一样本对象,以及点击通过率不属于目标数值的第二样本对象;
根据所述样本对象对应的用户账号,对所述第一样本对象进行抽样,得到抽样样本对象;
相应的,将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值,包括:
将所述抽样样本对象和所述第二样本对象中的所述对象特征输入初始模型,得到输出推荐值。
具体的,目标数值为0,在获取到样本数据之后,可以筛选出样本数据中点击通过率(样本标签)为0的样本数据,然后仅抽取部分点击通过率为0的样本数据与全部点击通过率不为0的样本数据共同对初始模型进行训练。
需要说明的是,在将点击通过率作为样本对象的样本标签对初始模型进行训练时,大量点击通过率为0的样本对象可能会对模型训练结果有较大影响,导致模型训练完成后,模型的参数更趋向于输出点击通过率(预测推荐值)为0,导致初始模型不准确,从而导致后续通过模型确定推荐对象的结果不准确。
因而本申请中,在获取到大量的样本对象后,不直接利用获取到的样本对象进行训练,而是先对样本对象中点击通过率为0的样本对象进行抽样,降低初始模型的实际训练数据中点击通过率为0的样本对象所占比例,从而降低点击通过率为0的样本对象对模型训练结果的影响。
示例的,获取到5000个样本对象,其中,点击通过率为0的样本对象有4000个,点击通过率不为0的样本对象有1000个,用户账号A对应的点击通过率为0的样本对象有1000个,用户账号B对应的点击通过率为0的样本对象有2000个,用户账号C对应的点击通过率为0的样本对象有1000个,获取到的样本对象中点击通过率为0的样本对象对应不同的用户账号所占比例为1:2:1,按照该比例进行样本对象抽样,从用户账号A对应的点击通过率为0的样本对象中抽取100个,从用户账号B对应的点击通过率为0的样本对象中抽取200个,从用户账号C对应的点击通过率为0的样本对象中抽取100个,通过抽取出的400个样本对象和1000个点击通过率不为0的样本对象对初始模型进行训练。
步骤108:在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表。
需要说明的是,在所述目标用户账号属于第二类型的情况下,说明目标用户账号与待推荐对象相关的历史数据充足,可以准确计算用户相似度或对象相似度,因而可以通过相似度确定所述目标用户账号对应的对象推荐列表。
本实施例一个可选的实施方式中,由于相似度可以分为用户相似度和对象相似度,因而还需要对属于第二类型的目标用户账号进一步分类,确定采用用户相似度还是对象相似度,因而在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表,具体实现过程可以如下:
确定所述历史数据中与用户相关的历史数据的第二数据量,以及与对象相关的历史数据的第三数据量;
在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的对象推荐列表;
在所述第二数据量不大于所述第三数据量的情况下,通过对象相似度确定所述目标用户账号对应的对象推荐列表。
需要说明的是,可以通过判断历史数据中与用户相关的历史数据的第二数据量较大,还是与对象相关的历史数据的第三数据量较大,来确定通过用户相似度还是对象相似度进行对象推荐。若第二数据量大于第三数据量,则说明与用户相关的历史数据较多,此时可以通过用户相似度确定目标用户账号对应的对象推荐列表;若第二数据量不大于第三数据量,则说明与对象相关的历史数据较多,此时可以通过对象相似度确定目标用户账号对应的对象推荐列表。
本实施例一个可选的实施方式中,在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的对象推荐列表,具体实现方式可以如下:
确定所述目标用户账号与至少一个其他用户账号之间的用户相似度;
根据所述用户相似度,确定所述目标用户账号对应的相似用户集合;
根据所述相似用户集合包括的所述其他用户账号对应的对象关注列表,确定所述目标用户账号对应的对象推荐列表。
其中,确定所述目标用户账号与至少一个其他用户账号之间的用户相似度,具体实现过程可以如下:
从所述历史数据中获取所述目标用户账号对应的第二待推荐对象的点击通过率,并获取所述至少一个其他用户账号对应的第二待推荐对象的点击通过率;
通过所述第二待推荐对象的点击通过率计算所述目标用户账号与所述至少一个其他用户账号之间的相似度。
需要说明的是,获取到目标用户账号后,可以从数据库中提取已经存储的用户-游戏-点击通过率数据,计算目标用户账号与至少一个其他用户账号之间的用户相似度,对对象的点击率越接近的用户越相似。之后,可以对计算得到的用户相似度降序排列,并筛选预设数值个相似用户组成相似用户集合。
本实施例一个可选的实施方式中,根据所述相似用户集合包括的所述其他用户账号对应的对象关注列表,确定所述目标用户账号对应的对象推荐列表,具体实现过程可以如下:
获取所述相似用户集合中包括的所述其他用户账号对应的对象关注列表,并获取所述对象关注列表中包括的第三待推荐对象对应的点击通过率;
将所述目标用户账号与所述其他用户账号之间的相似度、所述其他用户账号对应的对象关注列表中的所述第三待推荐对象的点击通过率相乘,得到所述第三待推荐对象的预测推荐值;
将确定出的所述第三待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
需要说明的是,其他用户账号对应的对象关注列表可以是指其他用户关注的对象,可以获取其他用户对应的点击通过率大于预设阈值的对象确定为其他用户关注的对象。也即,本申请中可以确定目标用户账号的相似用户账号,然后将相似用户账号关注的对象推荐给目标用户账号。
示例的,目标用户账号为用户账号A,相似用户集合中包括用户账号B和用户账号C,假设用户账号A与用户账号B的相似度为X1,与用户账号C的相似度为X2,用户账号B对应的对象关注列表为{游戏1(点击通过率为a1)、游戏2(点击通过率为a2)},用户账号C对应的对象关注列表为{游戏3(点击通过率为b1)}。将相似度X1、点击通过率a1相乘,得到游戏1的预测推荐值;将相似度X1、点击通过率为a2相乘,得到游戏2的预测推荐值;将相似度X2、点击通过率为b1相乘,得到游戏3的预测推荐值。
本实施例一个可选的实施方式中,在所述第二数据量不大于所述第三数据量的情况下,通过对象相似度确定所述目标用户账号对应的对象推荐列表,具体实现方式可以如下:
确定已推荐对象与至少一个第四待推荐对象之间的对象相似度,所述已推荐对象为向所述目标用户账号展示过的对象;
根据所述对象相似度,确定所述已推荐对象对应的相似对象集合;
根据所述相似对象集合,确定所述目标用户账号对应的对象推荐列表。
其中,确定已推荐对象与至少一个第四待推荐对象之间的对象相似度,包括:
从所述历史数据中获取所述已推荐对象对应的点击通过率,并分别获取所述至少一个第四待推荐对象对应的点击通过率;
通过所述已推荐对象对应的点击通过率和所述至少一个第四待推荐对象对应的点击通过率,计算所述已推荐对象与所述至少一个第四待推荐对象之间的相似度。
需要说明的是,获取到目标用户账号后,可以从数据库中提取已经存储的用户-游戏-点击通过率数据,计算已推荐对象与至少一个第四待推荐对象之间的对象相似度,被用户点击通过的概率越接近的用户越相似。之后,可以对计算得到的对象相似度降序排列,并筛选预设数值个相似用户组成相似对象集合。其中,已推荐对象是已经推荐给目标用户账号的对象,即目标用户账号关注的对象为已推荐对象,从而根据目标用户账号已关注的对象,向其推荐与该对象相似的对象。
本实施例一个可选的实施方式中,根据所述相似对象集合,确定所述目标用户账号对应的对象推荐列表,包括:
获取所述第四待推荐对象的预设对象指数;
将所述已推荐对象与所述至少一个第四待推荐对象之间的对象相似度、所述第四待推荐对象的预设对象指数相乘,得到所述至少一个第四待推荐对象的预测推荐值;
将确定出的所述第四待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
具体的,第四待推荐对象是从对象热度信息或榜单信息中获取的热门对象,如游戏榜单排名信息中的游戏;第四待推荐对象的预设对象指数可以是指第四待推荐对象的排行指数或热度指数。
本申请中已推荐对象是目标用户账号关注的对象,因而可以确定与已推荐对象相似的其他对象,从而将其他对象也推荐给目标用户账号。另外,可以赋予热门对象一定权重,保证大众热门对象可以得到推荐,从而得到最后输出的推荐的对象推荐列表。
示例的,目标用户账号关注的已推荐对象为游戏1,相似对象集合中包括游戏2、游戏3和游戏4,假设游戏1与游戏2的相似度为Y1,与游戏3的相似度为Y2,与游戏4的相似度为Y3,游戏2、游戏3和游戏4在游戏排行中的热度指数分别为c1、c2和c3。将相似度Y1、热度指数c1相乘,得到游戏2的预测推荐值;将相似度Y2、热度指数c2相乘,得到游戏3的预测推荐值;将相似度Y3、热度指数为c3相乘,得到游戏4的预测推荐值。
步骤110:向所述目标用户展示所述对象推荐列表。
需要说明的是,在确定出目标用户账号对应的对象推荐列表后,就可以向目标用户账号对应的客户端发送该对象推荐列表,从而将对象推荐列表展示给目标用户。
本实施例一个可选的实施方式中,向所述目标用户展示所述对象推荐列表之后,还包括:
获取所述目标用户基于所述对象推荐列表的响应数据,所述响应数据包括目标对象和所述目标对象的点击通过率;
将所述响应数据作为所述样本对象,继续对所述推荐值预测模型进行训练。
需要说明的是,向目标用户展示对象推荐列表后,目标用户可能会选择其中的对象,因而数据库中关于对象的数据可能会发生变化,因而为了使得推荐值预测模型更为准确的确定向目标用户账号推荐的对象,可以使用目标用户基于对象推荐列表的响应数据继续对推荐值预测模型进行训练,保证推荐值预测模型的预测推荐的准确性,从而使得通过推荐值预测模型确定出的对象推荐列表更能适应目标用户账号。
本申请提供的对象推荐方法,可以在获取目标用户账号之后,根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;并在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;然后,向所述目标用户展示所述对象推荐列表。这种情况下,在获取到目标用户账号后,可以对目标用户账号进行分类处理,一部分目标用户账号可以通过计算相似度的方式进行对象推荐,而一部分目标用户账号可以通过推荐值预测模型进行对象推荐;如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行对象推荐,提高了向目标用户推荐对象的准确率。
需要说明的是,本申请提供的对象推荐方法可以应用于游戏推荐场景、应用程序推荐场景、商品推荐场景等众多推荐场景下,以下以对象推荐方法应用于游戏推荐场景为例进行举例说明。
下述结合附图2,以本申请提供的对象推荐方法在游戏场景的应用为例,对所述对象推荐方法进行进一步说明。其中,图2示出了本申请一实施例提供的一种应用于游戏场景的对象推荐方法的示意图,具体包括以下步骤:
步骤202:获取目标用户账号。
实际应用中,随着计算机技术的快速发展,人们的娱乐需求也越来越高,越来越多的人们喜欢在空余时间玩游戏,各式各样的游戏应运而生。为了提升用户体验,经常需要向用户推荐其感兴趣的游戏。目前往往是基于用户相似度或对象相似度向用户推荐游戏,然而此方式需要大量用户点击游戏的数据,对于缺少用户点击游戏的数据的情况,计算出的相似度准确性较差,从而导致向目标用户推荐游戏的准确率较低。
因而,本申请中为了提高向目标用户推荐对象的准确率,提供了一种对象推荐方法,可以在获取目标用户账号之后,根据所述目标用户账号与游戏相关的历史数据对所述目标用户账号进行分类;并在所述目标用户账号属于第一类型的情况下,通过深度因子分解机模型确定所述目标用户账号对应的游戏推荐列表;在所述目标用户账号属于第二类型的情况下,进一步确定所述历史数据中与用户相关的历史数据的第二数据量,以及与游戏相关的历史数据的第三数据量,在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的游戏推荐列表,在所述第二数据量不大于所述第三数据量的情况下,通过游戏相似度确定所述目标用户账号对应的游戏推荐列表;然后,向所述目标用户展示所述对象推荐列表。如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行游戏推荐。
步骤204:根据所述目标用户账号与待推荐游戏相关的历史数据对所述目标用户账号进行分类。
步骤206:在所述目标用户账号属于第一类型的情况下,通过深度因子分解机模型确定所述目标用户账号对应的游戏推荐列表。
图3是本申请一实施例提供的一种深度因子分解机模型示意图,如图3所示,先从历史数据中获取目标用户账号的用户特征,然后获取游戏排行榜中排行前预设数值个的游戏对应的游戏特征,将用户特征分别和每个游戏特征组合,生成预设数值个特征向量。针对预设数值个特征向量中的每个特征向量,根据该特征向量包括的用户特征和对象特征对应的属性,将用户特征和对象特征划分为高阶特征和低阶特征,将低阶特征输入因子分解机函数,得到第一特征分析结果,将高阶特征输入深度神经网络,得到第二特征分析结果,然后通过三层神经网络对第一特征分析结果和第二特征分析结果进行融合,得到该特征向量对应的游戏针对目标用户账号的预测推荐值。之后,将确定出的各个游戏针对目标用户账号的预测推荐值进行排序、截取,就可以得到目标用户账号对应的游戏推荐列表。
步骤208:在所述目标用户账号属于第二类型的情况下,确定所述历史数据中与用户相关的历史数据的第二数据量,以及与游戏相关的历史数据的第三数据量。
步骤210:在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的游戏推荐列表。
图4是本申请一实施例提供的一种基于用户相似度确定游戏推荐列表的示意图,如图4所示,从数据库中获取点击通过率数据,通过该点击通过率数据,确定目标用户账号与至少一个其他用户账号之间的用户相似度,从而进行排序,确定出相似用户;然后,获取相似用户对应的关注游戏,计算相似用户与目标用户之间的相似度和该相似用户关注游戏的点击通过率的乘积,将给乘积作为预测推荐值。之后,将确定出的预测推荐值进行排序、截取,得到目标用户账号对应的游戏推荐列表。
步骤212:在所述第二数据量不大于所述第三数据量的情况下,通过游戏相似度确定所述目标用户账号对应的游戏推荐列表。
图5是本申请一实施例提供的一种基于游戏相似度确定游戏推荐列表的示意图,如图5所示,从数据库中获取点击通过率数据,提取目标用户账号的关注游戏,并获取游戏榜单排名中靠前的游戏,通过该点击通过率数据,确定关注游戏与其他游戏之间的游戏相似度,从而进行排序,确定出相似游戏。然后,获取其他游戏在游戏榜单中的热度指数,将其与关注游戏和其他游戏的相似度的乘积作为预测推荐值。之后,将确定出的预测推荐值进行排序、截取,得到目标用户账号对应的游戏推荐列表。
步骤214:向所述目标用户展示所述游戏推荐列表。
本申请提供的对象推荐方法,在获取到目标用户账号后,可以对目标用户账号进行分类处理,一部分目标用户账号可以通过计算相似度的方式进行游戏推荐,而一部分目标用户账号可以通过深度因子分解机模型进行游戏推荐;如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行游戏推荐,提高了向目标用户推荐游戏的准确率。
与上述方法实施例相对应,本申请还提供了对象推荐装置实施例,图6示出了本申请一实施例提供的一种对象推荐装置的结构示意图。如图6所示,该装置包括:
第一获取模块602,被配置为获取目标用户账号;
分类模块604,被配置为根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
确定模块606,被配置为在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
展示模块608,被配置为向所述目标用户展示所述对象推荐列表。
可选的,分类模块604进一步被配置为:
确定所述历史数据的第一数据量;
在所述第一数据量大于数据量阈值的情况下,确定所述目标用户账号属于第二类型;
在所述第一数据量不大于数据量阈值的情况下,确定所述目标用户账号属于第一类型。
可选的,确定模块606进一步被配置为:
确定所述历史数据中与用户相关的历史数据的第二数据量,以及与对象相关的历史数据的第三数据量;
在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的对象推荐列表;
在所述第二数据量不大于所述第三数据量的情况下,通过对象相似度确定所述目标用户账号对应的对象推荐列表。
可选的,确定模块606进一步被配置为:
确定所述目标用户对应的至少一个特征向量,每个所述特征向量包括目标用户账号的用户特征和第一待推荐对象的对象特征;
针对所述至少一个特征向量中的每个所述特征向量,通过所述推荐值预测模型确定所述第一待推荐对象针对所述目标用户账号的预测推荐值;
将确定出的各个所述第一待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
可选的,确定模块606进一步被配置为:
从所述历史数据中获取所述目标用户账号的用户特征;
获取预先设置的至少一个第一待推荐对象对应的对象特征;
针对所述至少一个第一待推荐对象中的每个所述第一待推荐对象,将所述用户特征和所述对象特征组合成一个特征向量,得到所述至少一个特征向量。
可选的,所述推荐值预测模型包括预设特征分解函数、第一特征分析网络和第二特征分析网络;确定模块606进一步被配置为:
根据所述特征向量包括的用户特征和对象特征对应的属性,将所述用户特征和所述对象特征划分为高阶特征和低阶特征;
通过所述预设特征分解函数确定所述低阶特征的第一特征分析结果;
通过第一特征分析网络确定出所述高阶特征的第二特征分析结果;
通过第二特征分析网络对所述第一特征分析结果和所述第二特征分析结果进行融合,得到所述第一待推荐对象针对所述目标用户账号的预测推荐值。
可选的,确定模块606进一步被配置为:
通过预设编码规则对所述高阶特征进行编码,得到所述高阶特征对应的编码结果;
对所述高阶特征对应的编码结果进行分区处理,得到至少一个区域编码;
将所述至少一个区域编码输入所述第一特征分析网络,得到至少一个区域处理结果;
对所述至少一个区域处理结果进行拼接,得到所述第二特征分析结果。
可选的,确定模块606进一步被配置为:
确定所述目标用户账号与至少一个其他用户账号之间的用户相似度;
根据所述用户相似度,确定所述目标用户账号对应的相似用户集合;
根据所述相似用户集合包括的所述其他用户账号对应的对象关注列表,确定所述目标用户账号对应的对象推荐列表。
可选的,确定模块606进一步被配置为:
从所述历史数据中获取所述目标用户账号对应的第二待推荐对象的点击通过率,并获取所述至少一个其他用户账号对应的第二待推荐对象的点击通过率;
通过所述第二待推荐对象的点击通过率计算所述目标用户账号与所述至少一个其他用户账号之间的相似度。
可选的,确定模块606进一步被配置为:
获取所述相似用户集合中包括的所述其他用户账号对应的对象关注列表,并获取所述对象关注列表中包括的第三待推荐对象对应的点击通过率;
将所述目标用户账号与所述其他用户账号之间的相似度、所述其他用户账号对应的对象关注列表中的所述第三待推荐对象的点击通过率相乘,得到所述第三待推荐对象的预测推荐值;
将确定出的所述第三待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
可选的,确定模块606进一步被配置为:
确定已推荐对象与至少一个第四待推荐对象之间的对象相似度,所述已推荐对象为向所述目标用户账号展示过的对象;
根据所述对象相似度,确定所述已推荐对象对应的相似对象集合;
根据所述相似对象集合,确定所述目标用户账号对应的对象推荐列表。
可选的,确定模块606进一步被配置为:
从所述历史数据中获取所述已推荐对象对应的点击通过率,并分别获取所述至少一个第四待推荐对象对应的点击通过率;
通过所述已推荐对象对应的点击通过率和所述至少一个第四待推荐对象对应的点击通过率,计算所述已推荐对象与所述至少一个第四待推荐对象之间的相似度。
可选的,确定模块606进一步被配置为:
获取所述第四待推荐对象的预设对象指数;
将所述已推荐对象与所述至少一个第四待推荐对象之间的对象相似度、所述第四待推荐对象的预设对象指数相乘,得到所述至少一个第四待推荐对象的预测推荐值;
将确定出的所述第四待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
可选的,所述装置还包括第一训练模块,被配置为:
获取样本对象,所述样本对象包括对象特征和点击通过率;
将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值;
基于所述输出推荐值和所述点击通过率确定损失值,基于损失值对初始模型进行训练,直至达到训练停止条件,得到所述推荐值预测模型。
可选的,所述第一训练模块进一步被配置为:
确定所述样本对象中点击通过率属于目标数值的第一样本对象,以及点击通过率不属于目标数值的第二样本对象;
根据所述样本对象对应的用户账号,对所述第一样本对象进行抽样,得到抽样样本对象;
相应的,将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值,包括:
将所述抽样样本对象和所述第二样本对象中的所述对象特征输入初始模型,得到输出推荐值。
可选的,所述装置还包括:
第二获取模块,被配置为获取所述目标用户基于所述对象推荐列表的响应数据,所述响应数据包括目标对象和所述目标对象的点击通过率;
第二训练模块,被配置为将所述响应数据作为所述样本对象,继续对所述推荐值预测模型进行训练。
本申请提供的对象推荐装置,在获取到目标用户账号后,可以对目标用户账号进行分类处理,一部分目标用户账号可以通过计算相似度的方式进行对象推荐,而一部分目标用户账号可以通过推荐值预测模型进行对象推荐;如此,可以根据目标用户账号的实际历史数据情况进行分类,针对不同的目标用户,采用不同的方式进行对象推荐,提高了向目标用户推荐对象的准确率。
上述为本实施例的一种对象推荐装置的示意性方案。需要说明的是,该对象推荐装置的技术方案与上述的对象推荐方法的技术方案属于同一构思,对象推荐装置的技术方案未详细描述的细节内容,均可以参见上述对象推荐方法的技术方案的描述。
图7示出了根据本申请一实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720用于执行如下计算机可执行指令,以实现下述方法:
获取目标用户账号;
根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
向所述目标用户展示所述对象推荐列表。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的对象推荐方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述对象推荐方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于所述对象推荐方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的对象推荐方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述对象推荐方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (18)

1.一种对象推荐方法,其特征在于,包括:
获取目标用户账号;
根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
向所述目标用户展示所述对象推荐列表;
其中,所述根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类,包括:
确定所述历史数据的第一数据量;
在所述第一数据量大于数据量阈值的情况下,确定所述目标用户账号属于第二类型;
在所述第一数据量不大于数据量阈值的情况下,确定所述目标用户账号属于第一类型。
2.根据权利要求1所述的对象推荐方法,其特征在于,所述在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表,包括:
确定所述历史数据中与用户相关的历史数据的第二数据量,以及与对象相关的历史数据的第三数据量;
在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的对象推荐列表;
在所述第二数据量不大于所述第三数据量的情况下,通过对象相似度确定所述目标用户账号对应的对象推荐列表。
3.根据权利要求1或2所述的对象推荐方法,其特征在于,所述通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表,包括:
确定所述目标用户对应的至少一个特征向量,每个所述特征向量包括目标用户账号的用户特征和第一待推荐对象的对象特征;
针对所述至少一个特征向量中的每个所述特征向量,通过所述推荐值预测模型确定所述第一待推荐对象针对所述目标用户账号的预测推荐值;
将确定出的各个所述第一待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
4.根据权利要求3所述的对象推荐方法,其特征在于,所述确定所述目标用户对应的至少一个特征向量,包括:
从所述历史数据中获取所述目标用户账号的用户特征;
获取预先设置的至少一个第一待推荐对象对应的对象特征;
针对所述至少一个第一待推荐对象中的每个所述第一待推荐对象,将所述用户特征和所述对象特征组合成一个特征向量,得到所述至少一个特征向量。
5.根据权利要求3所述的对象推荐方法,其特征在于,所述推荐值预测模型包括预设特征分解函数、第一特征分析网络和第二特征分析网络;
所述针对所述至少一个特征向量中的每个所述特征向量,通过所述推荐值预测模型确定所述第一待推荐对象针对所述目标用户账号的预测推荐值,包括:
根据所述特征向量包括的用户特征和对象特征对应的属性,将所述用户特征和所述对象特征划分为高阶特征和低阶特征;
通过所述预设特征分解函数确定所述低阶特征的第一特征分析结果;
通过第一特征分析网络确定出所述高阶特征的第二特征分析结果;
通过第二特征分析网络对所述第一特征分析结果和所述第二特征分析结果进行融合,得到所述第一待推荐对象针对所述目标用户账号的预测推荐值。
6.根据权利要求5所述的对象推荐方法,其特征在于,所述通过第一特征分析网络确定出所述高阶特征的第二特征分析结果,包括:
通过预设编码规则对所述高阶特征进行编码,得到所述高阶特征对应的编码结果;
对所述高阶特征对应的编码结果进行分区处理,得到至少一个区域编码;
将所述至少一个区域编码输入所述第一特征分析网络,得到至少一个区域处理结果;
对所述至少一个区域处理结果进行拼接,得到所述第二特征分析结果。
7.根据权利要求2所述的对象推荐方法,其特征在于,所述在所述第二数据量大于所述第三数据量的情况下,通过用户相似度确定所述目标用户账号对应的对象推荐列表,包括:
确定所述目标用户账号与至少一个其他用户账号之间的用户相似度;
根据所述用户相似度,确定所述目标用户账号对应的相似用户集合;
根据所述相似用户集合包括的所述其他用户账号对应的对象关注列表,确定所述目标用户账号对应的对象推荐列表。
8.根据权利要求7所述的对象推荐方法,其特征在于,所述确定所述目标用户账号与至少一个其他用户账号之间的用户相似度,包括:
从所述历史数据中获取所述目标用户账号对应的第二待推荐对象的点击通过率,并获取所述至少一个其他用户账号对应的第二待推荐对象的点击通过率;
通过所述第二待推荐对象的点击通过率计算所述目标用户账号与所述至少一个其他用户账号之间的相似度。
9.根据权利要求7所述的对象推荐方法,其特征在于,所述根据所述相似用户集合包括的所述其他用户账号对应的对象关注列表,确定所述目标用户账号对应的对象推荐列表,包括:
获取所述相似用户集合中包括的所述其他用户账号对应的对象关注列表,并获取所述对象关注列表中包括的第三待推荐对象对应的点击通过率;
将所述目标用户账号与所述其他用户账号之间的相似度、所述其他用户账号对应的对象关注列表中的所述第三待推荐对象的点击通过率相乘,得到所述第三待推荐对象的预测推荐值;
将确定出的所述第三待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
10.根据权利要求2所述的对象推荐方法,其特征在于,所述在所述第二数据量不大于所述第三数据量的情况下,通过对象相似度确定所述目标用户账号对应的对象推荐列表,包括:
确定已推荐对象与至少一个第四待推荐对象之间的对象相似度,所述已推荐对象为向所述目标用户账号展示过的对象;
根据所述对象相似度,确定所述已推荐对象对应的相似对象集合;
根据所述相似对象集合,确定所述目标用户账号对应的对象推荐列表。
11.根据权利要求10所述的对象推荐方法,其特征在于,所述确定已推荐对象与至少一个第四待推荐对象之间的对象相似度,包括:
从所述历史数据中获取所述已推荐对象对应的点击通过率,并分别获取所述至少一个第四待推荐对象对应的点击通过率;
通过所述已推荐对象对应的点击通过率和所述至少一个第四待推荐对象对应的点击通过率,计算所述已推荐对象与所述至少一个第四待推荐对象之间的相似度。
12.根据权利要求10所述的对象推荐方法,其特征在于,所述根据所述相似对象集合,确定所述目标用户账号对应的对象推荐列表,包括:
获取所述第四待推荐对象的预设对象指数;
将所述已推荐对象与所述至少一个第四待推荐对象之间的对象相似度、所述第四待推荐对象的预设对象指数相乘,得到所述至少一个第四待推荐对象的预测推荐值;
将确定出的所述第四待推荐对象的预测推荐值进行排序,得到所述目标用户账号对应的对象推荐列表。
13.根据权利要求1所述的对象推荐方法,其特征在于,所述推荐值预测模型通过如下方法训练得到:
获取样本对象,所述样本对象包括对象特征和点击通过率;
将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值;
基于所述输出推荐值和所述点击通过率确定损失值,基于损失值对初始模型进行训练,直至达到训练停止条件,得到所述推荐值预测模型。
14.根据权利要求13所述的对象推荐方法,其特征在于,所述获取样本对象之后,还包括:
确定所述样本对象中点击通过率属于目标数值的第一样本对象,以及点击通过率不属于目标数值的第二样本对象;
根据所述样本对象对应的用户账号,对所述第一样本对象进行抽样,得到抽样样本对象;
相应的,将所述样本对象中的所述对象特征输入初始模型,得到输出推荐值,包括:
将所述抽样样本对象和所述第二样本对象中的所述对象特征输入初始模型,得到输出推荐值。
15.根据权利要求13所述的对象推荐方法,其特征在于,所述向所述目标用户展示所述对象推荐列表之后,还包括:
获取所述目标用户基于所述对象推荐列表的响应数据,所述响应数据包括目标对象和所述目标对象的点击通过率;
将所述响应数据作为所述样本对象,继续对所述推荐值预测模型进行训练。
16.一种对象推荐装置,其特征在于,包括:
第一获取模块,被配置为获取目标用户账号;
分类模块,被配置为根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
确定模块,被配置为在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
展示模块,被配置为向所述目标用户展示所述对象推荐列表;
其中,所述分类模块进一步被配置为:
确定所述历史数据的第一数据量;
在所述第一数据量大于数据量阈值的情况下,确定所述目标用户账号属于第二类型;
在所述第一数据量不大于数据量阈值的情况下,确定所述目标用户账号属于第一类型。
17.一种计算设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:
获取目标用户账号;
根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类;
在所述目标用户账号属于第一类型的情况下,通过推荐值预测模型确定所述目标用户账号对应的对象推荐列表;在所述目标用户账号属于第二类型的情况下,通过相似度确定所述目标用户账号对应的对象推荐列表;
向所述目标用户展示所述对象推荐列表;
其中,所述根据所述目标用户账号与待推荐对象相关的历史数据对所述目标用户账号进行分类,包括:
确定所述历史数据的第一数据量;
在所述第一数据量大于数据量阈值的情况下,确定所述目标用户账号属于第二类型;
在所述第一数据量不大于数据量阈值的情况下,确定所述目标用户账号属于第一类型。
18.一种计算机可读存储介质,其特征在于,其存储有计算机指令,该指令被处理器执行时实现权利要求1至15任意一项所述对象推荐方法的步骤。
CN202011347159.2A 2020-11-26 2020-11-26 对象推荐方法及装置 Active CN112464106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011347159.2A CN112464106B (zh) 2020-11-26 2020-11-26 对象推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011347159.2A CN112464106B (zh) 2020-11-26 2020-11-26 对象推荐方法及装置

Publications (2)

Publication Number Publication Date
CN112464106A CN112464106A (zh) 2021-03-09
CN112464106B true CN112464106B (zh) 2022-12-13

Family

ID=74809498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011347159.2A Active CN112464106B (zh) 2020-11-26 2020-11-26 对象推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112464106B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021060A (zh) * 2021-11-10 2022-02-08 北京达佳互联信息技术有限公司 一种用户标签展示方法、装置、电子设备及存储介质
CN114707488B (zh) * 2022-02-25 2024-02-09 马上消费金融股份有限公司 数据处理方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009056A (zh) * 2019-04-15 2019-07-12 秒针信息技术有限公司 一种社交账号的分类方法及分类装置
CN110134870A (zh) * 2019-05-21 2019-08-16 重庆忽米网络科技有限公司 一种基于大数据的推送方法及系统
CN110851729A (zh) * 2019-11-19 2020-02-28 深圳前海微众银行股份有限公司 资源信息推荐方法、装置、设备及计算机存储介质
CN111611388A (zh) * 2020-05-29 2020-09-01 北京学之途网络科技有限公司 账号分类方法、装置和设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020162B (zh) * 2017-12-14 2021-09-03 北京京东尚科信息技术有限公司 用户识别方法和装置
CN110223186B (zh) * 2018-05-09 2023-06-13 腾讯科技(深圳)有限公司 用户相似度确定方法以及信息推荐方法
CN109934704A (zh) * 2019-03-22 2019-06-25 深圳乐信软件技术有限公司 信息推荐方法、装置、设备和存储介质
US10867000B2 (en) * 2019-03-31 2020-12-15 Td Ameritrade Ip Company, Inc. Recommendation system for providing personalized and mixed content on a user interface based on content and user similarity
CN110046965A (zh) * 2019-04-18 2019-07-23 北京百度网讯科技有限公司 信息推荐方法、装置、设备和介质
CN110245687B (zh) * 2019-05-17 2021-06-04 腾讯科技(上海)有限公司 用户分类方法以及装置
CN111105297A (zh) * 2019-12-30 2020-05-05 广州探途网络技术有限公司 一种信息推送方法与相关装置
CN111709812A (zh) * 2020-06-19 2020-09-25 山东财经大学 基于用户动态分类的电商平台商品推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009056A (zh) * 2019-04-15 2019-07-12 秒针信息技术有限公司 一种社交账号的分类方法及分类装置
CN110134870A (zh) * 2019-05-21 2019-08-16 重庆忽米网络科技有限公司 一种基于大数据的推送方法及系统
CN110851729A (zh) * 2019-11-19 2020-02-28 深圳前海微众银行股份有限公司 资源信息推荐方法、装置、设备及计算机存储介质
CN111611388A (zh) * 2020-05-29 2020-09-01 北京学之途网络科技有限公司 账号分类方法、装置和设备

Also Published As

Publication number Publication date
CN112464106A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN112395487B (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN110555753A (zh) 基于推荐的排序控制方法、装置、计算机设备及存储介质
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN112464106B (zh) 对象推荐方法及装置
CN112669096A (zh) 对象推荐模型训练方法以及装置
CN110008977B (zh) 聚类模型构建方法以及装置
CN111582341A (zh) 用户异常操作预测方法及装置
CN111191133A (zh) 业务搜索处理方法、装置及设备
CN112749330A (zh) 信息推送方法、装置、计算机设备和存储介质
CN115994226A (zh) 基于联邦学习的聚类模型训练系统及方法
CN115712780A (zh) 一种基于云计算和大数据的信息推送方法及装置
CN116010574A (zh) 智能对话处理的方法、云服务器及可读存储介质
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
Akram et al. ChoseAmobile: A web-based recommendation system for mobile phone products
CN110851694A (zh) 基于用户记忆网络和树形结构的深度模型的个性化推荐系统
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN114048294B (zh) 相似人群扩展模型训练方法、相似人群扩展方法和装置
CN113327154B (zh) 基于大数据的电商用户讯息推送方法及系统
CN114637920A (zh) 对象推荐方法以及装置
Agarwal et al. Binarized spiking neural networks optimized with Nomadic People Optimization-based sentiment analysis for social product recommendation
Mutturaj et al. A survey on hybrid recommendation engine for businesses and users
CN111860870A (zh) 交互行为确定模型的训练方法、装置、设备及介质
CN114329167A (zh) 超参数学习、智能推荐、关键词和多媒体推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant