CN111339406A - 个性化推荐方法、装置、设备及存储介质 - Google Patents

个性化推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111339406A
CN111339406A CN202010097164.6A CN202010097164A CN111339406A CN 111339406 A CN111339406 A CN 111339406A CN 202010097164 A CN202010097164 A CN 202010097164A CN 111339406 A CN111339406 A CN 111339406A
Authority
CN
China
Prior art keywords
cold
demographic
start user
user
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010097164.6A
Other languages
English (en)
Other versions
CN111339406B (zh
Inventor
付琰
陈亮辉
王全斌
杨晓璇
彭炼钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010097164.6A priority Critical patent/CN111339406B/zh
Publication of CN111339406A publication Critical patent/CN111339406A/zh
Application granted granted Critical
Publication of CN111339406B publication Critical patent/CN111339406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种个性化推荐方法、装置、设备及存储介质,涉及大数据技术领域。具体实现方案为:通过获取冷启动用户在目标网站注册时确定的冷启动用户信息,再根据冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及冷启动用户所属的至少一个人口统计学属性人群,最后根据冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对冷启动用户的待推荐物品。该技术方案,实现了冷启动用户的准确推荐,成本低,易于实现。

Description

个性化推荐方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种大数据技术领域中的个性化推荐方法、装置、设备及存储介质。
背景技术
在互联网普及的大环境下,针对不同用户的兴趣偏好,将适合的物品呈现并推荐给用户,可以提高推荐的转化率,从而创造巨大的产品商业价值。传统的推荐方法是根据用户的历史行为数据,推荐用户对不同物品的偏好,从而有针对性的推荐,但是其无法适用于没有历史信息的用户,即无法针对冷启动用户进行合理的推荐。因此,如何针对冷启动用户进行个性化推荐对产品规模增长有十分重要的意义。
现有技术中,可以采用兴趣标签匹配的方式实现,具体的,借助于用户画像中的兴趣标签,通过直接匹配或者语义匹配的方式确定出相关的物品,也即,用户兴趣的直接迁移。其中,用户画像即给用户贴标签,通过充斥在网络上的用户信息,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化。
但是,兴趣标签匹配的方式要求用户画像来源的产品场景和用户画像应用的产品场景相似,而相似产品通常属于竞争对手,数据获取十分困难,且从不同产品提取的兴趣标签,可能不能完全通用,需要根据当前应用情况,高成本地进行标签筛选,存在成本高、推荐成功率低的问题。
发明内容
本申请实施例提供一种个性化推荐方法、装置、设备及存储介质,用于解决现有针对冷启动用户的个性化推荐方法存在成本高、推荐不准确的问题。
第一方面,本申请提供一种个性化推荐方法,包括:
获取冷启动用户在目标网站注册时确定的冷启动用户信息;
根据所述冷启动用户信息,确定所述冷启动用户具有的人口统计学属性,以及所述冷启动用户所属的至少一个人口统计学属性人群;
根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在本实施例中,仅依赖于人口统计学属性确定针对冷启动用户的待推荐物品,不仅实现冷启动用户的准确推荐,而且成本低,易于实现,物品的转化成功率高。
在第一方面的一种可能设计中,所述方法还包括:
获取所述目标网站中的所有物品的信息;
将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,所述推荐模型是利用所述目标网站中的历史行为数据集合对预设网络进行训练得到的;
根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
在本实施例中,首先基于目标网站中所有物品的信息确定出每个人口统计学属性人群的物品排序索引,为后续确定待推荐物品提供了实现可能。
可选的,所述根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,包括:
根据所述冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定所述冷启动用户在每个人口统计学属性人群中的物品排序索引;
根据所述冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在本实施例中,电子可以基于冷启动用户在每个人口统计学属性人群中的物品排序索引,确定出待推荐物品,实现方式简单,推荐准确率高。
在第一方面的另一种可能设计中,所述方法还包括:
根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布;
根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
在实施例中,通过这种概率分布相乘的方式确定的不同人口统计学属性人群组合中的总概率分布,能够灵活地对属性进行组合,无需重新训练模型,易于实现,扩展了应用范围。
可选的,所述根据所述至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,包括:
根据所述冷启动用户所属的至少一个人口统计学属性人群,确定所述冷启动用户对应的人口统计学属性人群组合;
根据所述冷启动用户对应的人口统计学属性人群组合和所述人口统计学属性人群组合中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在本实施例中,利用冷启动用户对应的人口统计学属性人群组合和确定的人口统计学属性人群组合的物品排序索引,进一步提高了推荐物品的准确性。
在第一方面的再一种可能设计中,所述方法还包括:
获取所述目标网站中的历史行为数据集合,所述历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性;
将所述历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本;
以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型。
在本实施例中,推荐模型的训练仅依赖于人口统计学属性,训练样本容易获得,成本低,此外,该方案的训练数据不受热门内容的影响,能够满足个性化的推荐需要,提高了转化的成功率。
可选的,所述以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型,包括:
对所述训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息;
将所述训练样本中每条训练数据的操作物品特征向量信息依次输入所述预设网络,通过调整所述预设网络的参数,直到所述预设网络的输出结果依次为对应训练数据的人口统计学属性,得到所述推荐模型。
本实施例中,基于已有用户的历史行为数据,训练推荐模型,对每个物品预估对其感兴趣的人群分布,最终得到不同人群的物品偏好,从而实现了对用户的个性化推荐。
示例性的,所述操作物品信息由其所属物品所在的业务确定,所述操作物品信息至少包括如下一种:物品名称、标题、点击数、评论数、点赞数、收藏数。
在第一方面的又一种可能设计中,所述获取冷启动用户在目标网站注册时确定的冷启动用户信息,包括:
获取所述冷启动用户在所述目标网络注册时的用户标识;
根据所述用户标识在其他网站中的历史行为数据,获取所述冷启动用户信息。
在本实施例中,电子设备可以基于用户标识获取在其他网站上的冷启动用户信息,完善了在目标网站中获取到的冷启动用户用户信息,为后续执行准确的商品推荐奠定了基础。
本申请第二方面提供一种个性化推荐装置,包括:获取模块和处理模块;
所述获取模块,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息;
所述处理模块,用于根据所述冷启动用户信息,确定所述冷启动用户具有的人口统计学属性,以及所述冷启动用户所属的至少一个人口统计学属性人群,根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在第二方面的一种可能设计中,所述获取模块,还用于获取所述目标网站中的所有物品的信息;
所述处理模块,还用于将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,所述推荐模型是利用所述目标网站中的历史行为数据集合对预设网络进行训练得到的,以及根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
可选的,所述处理模块,用于根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
所述处理模块,具体用于根据所述冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定所述冷启动用户在每个人口统计学属性人群中的物品排序索引,根据所述冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在第二方面的另一种可能设计中,所述处理模块,还用于根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布,根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
可选的,所述处理模块,用于根据所述至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
所述处理模块,具体用于根据所述冷启动用户所属的至少一个人口统计学属性人群,确定所述冷启动用户对应的人口统计学属性人群组合,根据所述冷启动用户对应的人口统计学属性人群组合和所述人口统计学属性人群组合中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
在第二方面的再一种可能设计中,所述获取模块,还用于获取所述目标网站中的历史行为数据集合,所述历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
所述处理模块,还用于根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性,将所述历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本,以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型。
可选的,所述处理模块,用于以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型,具体为:
所述处理模块,具体用于对所述训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息,将所述训练样本中每条训练数据的操作物品特征向量信息依次输入所述预设网络,通过调整所述预设网络的参数,直到所述预设网络的输出结果依次为对应训练数据的人口统计学属性,得到所述推荐模型。
在第二方面的又一种可能设计中,所述获取模块,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息,具体为:
所述获取模块,具体用于获取所述冷启动用户在所述目标网络注册时的用户标识,根据所述用户标识在其他网站中的历史行为数据,获取所述冷启动用户信息。
本申请第二方面提供的装置,可用于执行第一方面提供的方法,其实现原理和技术效果类似,在此不再赘述。
第三方面,本申请提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面以及第一方面各可能设计所述的方法。
第四方面,本申请提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面以及第一方面各可能设计所述的方法。
第五方面,本申请提供一种个性化推荐方法,包括:
确定冷启动用户具有的人口统计学属性;
根据所述冷启动用户具有的人口统计学属性和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
上述申请中的一个实施例具有如下优点或有益效果:通过获取冷启动用户在目标网站注册时确定的冷启动用户信息,再根据冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及冷启动用户所属的至少一个人口统计学属性人群,最后根据冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对冷启动用户的待推荐物品。因为该技术方案仅依赖于人口统计学属性确定针对冷启动用户的待推荐物品,所以克服了现有针对冷启动用户的个性化推荐方法存在成本高、推荐不准确的问题,不仅实现冷启动用户的准确推荐,而且成本低,易于实现。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请提供的个性化推荐方法的一种应用场景示意图;
图2是本申请第一实施例提供的个性化推荐方法的流程示意图;
图3为本申请第二实施例提供的个性化推荐方法的流程示意图;
图4为本申请第三实施例提供的个性化推荐方法的流程示意图;
图5为本申请实施例中推荐模型的结构示意图;
图6是本实施例提供的个性化推荐方法的整体流程示意图;
图7是本申请实施例提供的个性化推荐装置的结构示意图;
图8是用来实现本申请实施例的个性化推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在介绍本申请的技术方案之前,首先对本申请实施例中涉及到的术语进行解释:
用户画像:
用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效工具。在实际操作过程中,往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联系起来。通俗来讲,用户画像即给用户贴标签,通过获取用户在其他客户端(app)、网站上的行为数据和用户信息,将该行为数据和用户信息抽象成标签,利用这些标签将用户形象具体化的过程。
冷启动用户:
当前网站或网页中,没有历史行为数据的用户即该当前网站或网页的冷启动用户。
人口统计学属性:
人口统计学属性也即人口统计学特征,主要是基于视力水平、记忆力、理解能力、学习能力等指标对人口统计学数据进行统计得到的。通常情况下,人口统计学属性主要包括:性别、年龄、健康状况、职业、婚姻、文化水平、收入等等方面。
值得说明的是,上述仅是对人口统计学属性进行简单的解释,在实际应用中,人口统计学属性还可以包括其他的内容,其可以根据实际情况确定,此处不对其进行赘述。
随着网络中产品的数量和种类不断增多,为了帮助用户在大量产品中找到他需要的产品,产品的个性化推荐技术应运而生。传统的服务推荐方法大多是根据目标用户的历史行为数据,借助于用户画像中的兴趣标签,通过直接匹配或者语义匹配的方式确定出相关的物品,也即,用户兴趣的直接迁移。
而对于没有历史行为数据的用户即冷启动用户,这些方法无法进行推荐。任何一个互联网产品,用户都是不断增长变化的,如何为新用户推荐满意的物品,从而留住用户,对产品规模增长有十分重要的意义。因此,如何针对冷启动用户进行个性化推荐成为了目前亟待解决的问题。
目前,针对冷启动用户的个性化推荐方案,首先获取用户的个性化信息,再基于用户画像得到一些用户的人口统计学属性、兴趣标签。通过应用用户画像,将用户在其他产品的行为迁移到当前产品,从而实现对新用户的个性化推荐。
但是,上述针对冷启动用户的个性化推荐方法存在成本高、推荐不准确的问题,针对该问题,本申请实施例提供了一种个性化推荐方法,通过获取冷启动用户在目标网站注册时确定的冷启动用户信息,再根据冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及冷启动用户所属的至少一个人口统计学属性人群,最后根据冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对冷启动用户的待推荐物品。该技术方案,能够实现冷启动用户的准确推荐,而且成本低,易于实现。
本申请实施例的整体思路是:基于已有用户的历史行为数据,训练推荐模型,对每个物品预估对其感兴趣的人群分布,最终得到不同人群的物品偏好,从而对用户进行个性化推荐。另外,本申请实施例还可以通过多任务学习的方式,结合多种不同的人口统计学属性(性别、年龄等)对个性化推荐方法进行介绍。
下面结合图1介绍本申请实施例设计的一种系统结构。图1是本申请提供的个性化推荐方法的一种应用场景示意图。如图1所示,该应用场景可以包括:训练设备11、处理设备12和数据存储设备13。示例性的,在图1所示的应用场景中,训练设备11可以从目标网站中获取携带已注册用户的标识和操作物品信息的历史行为数据,并将其存储至数据存储设备13中,以便构建推荐模型;处理设备12可以获取冷启动用户在目标网站上注册时确定的冷启动用户信息,并基于其确定出冷启动用户具有的人口统计学属性和该冷启动用户所属的至少一个人口统计学属性人群以及预先确定的每个人口统计学属性人群的物品排序索引,确定针对该冷启动用户的待推荐物品,以及可以将处理结果存储至数据存储设备13中。
在本实施例中,数据存储设备13可以存储大量用于建立推荐模型的历史行为数据,也可以存储冷启动用户在目标网站上注册时确定的冷启动用户信息,还可以存储处理设备12的处理结果,训练设备11用于基于数据存储设备13中存储的目标网站上的历史行为数据,执行创建推荐模型的程序代码,以构建推荐模型,还可以基于创建的推荐模型和获取到的目标网站中的所有物品的信息,确定确定每个人口统计学属性人群的物品排序索引;处理设备12用于基于数据存储设备13中的个性化推荐方法的程序代码,得到针对冷启动用户的待推荐物品。
需要说明的是,附图1仅是本申请实施例提供的一种应用场景的示意图,图1中所示设备之间的位置关系不构成任何限制,例如,在附图1中,数据存储设备13相对处理设备12可以是外部存储器,在其它情况下,也可以将数据存储设备13置于处理设备12中。本申请实施例中训练设备11和处理设备12可以是同一设备,或者不同设备,本申请实施例对此不作限定。
示例性的,下述以训练设备11和处理设备12为同一电子设备为例,对本申请的技术方案进行详细说明。关于电子设备具体为服务器,还是终端设备,本申请实施例不对其进行限定,其可以实际情况确定。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2是本申请第一实施例提供的个性化推荐方法的流程示意图。如图2所示,该方法可以包括如下步骤:
S201、获取冷启动用户在目标网站注册时确定的冷启动用户信息;
在本申请的实施例中,当用户注册某一目标网站时,电子设备可以获取到该冷启动用户的冷启动用户信息,该冷启动用户信息可以是用户在该目标网站注册时输入的用户信息,还可以是根据该冷启动用户的标识从其他网站获取到的用户信息。本申请实施例并不对冷启动用户信息的获取方式和来源进行限定,其可以根据实际应用场景确定。
可以理解的是,本申请实施例中的目标网站也可以是目标应用,即用户在首次注册该目标应用时,该用户即为该目标应用的冷启动用户。这时,电子设备便可以获取该冷启动用户注册时输入的或其他目标应用中记录的冷启动用户信息。可选的,本申请实施例中的目标网站还可以是目标网页或其他形式等,本申请实施例不对目标网站的替代形式进行限定。
示例性的,在本申请的实施例中,该步骤S201具体可以通过如下方式实现:首先获取该冷启动用户在该目标网络注册时的用户标识,再根据该用户标识在其他网站中的历史行为数据,获取上述冷启动用户信息。
值得说明的是,该用户标识可以是用户所使用终端设备的设备号,也可以是用户在目标网站的注册账号等。可选的,该注册账号可以是通过手机号、QQ号、微信号等联络方式表示的账号,还可以是通过其他方式表示的账号。本申请实施并不对用户标识的具体表现形式进行限定,其可以根据实际场景确定。
S202、根据上述冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及该冷启动用户所属的至少一个人口统计学属性人群。
在本申请的实施例中,电子设备获取到的冷启动用户信息后,对该冷启动用户信息进行分析,确定该冷启动用户具有的人口统计学属性,例如,年龄、性别、职业、学历等,再确定该冷启动用户所属的至少一个人口统计学属性人群,例如,年龄段为20至30岁,女性,白领,硕士等等。
可以理解的是,本申请实施例并不限定该冷启动用户具有的人口统计学属性的数量,例如,本申请实施例可以只确定出该冷启动用户所属的2个人口统计学属性,比如,年龄段、性别等,关于具体确定的属性或其他数量的属性均可以根据实际情况确定,此处不再赘述。
S203、根据该冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对该冷启动用户的待推荐物品。
在本申请的实施例中,电子设备确定出该冷启动用户所属的上述至少一个人口统计学属性人群后,获取电子设备中预先确定的每个人口统计学属性人群的物品排序索引,进而基于每个人口统计学属性人群的物品排序索引和冷启动用户所属的至少一个人口统计学属性人群,确定出针对该冷启动用户的待推荐物品。
具体的,电子设备根据获取到的冷启动用户信息(用户画像),则能够得到该冷启动用户的人口统计学属性,进而再根据预先定义的规则对人口统计学属性进行组合,查询排序索引得到对应的召回物品列表。可选的,该召回物品列表还可以融合其他召回结果对目标网站中的物品进行排序,并输出最终确定的针对该冷启动用户的待推荐物品。
可选的,作为一种示例,在本申请的实施例中,该步骤S203可以通过如下可能设计实现:
A1、根据该冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定该冷启动用户在每个人口统计学属性人群中的物品排序索引。
A2、根据该冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对该冷启动用户的待推荐物品。
在本申请实施例中,当冷启动用户所属多个人口统计学属性人群时,可以分别针对每个人口统计学属性人群和每个人口统计学属性人群的物品排序索引,确定出该冷启动用户在每个人口统计学属性人群中的物品排序索引,然后结合多个人口统计学属性人群中的物品排序索引,确定出针对冷启动用户的待推荐物品。
举个例子,一个护肤品相关的物品,若在预先确定的每个人口统计学属性人群的物品排序索引中,确定女生更有可能对该物品感兴趣。因而,假设对于人口统计学属性性别的最终预测结果为(男,女):(0.2,0.8),则意味着女生对这个物品更感兴趣,所以可以将护肤品这个物品作为个性化召回结果推荐给女性用户。而对于一些没有个性化偏好的热门物品,例如,最近的热点新闻,由于训练数据中无法统计不同性别用户对这个物品拥有不同的点击偏好,最终的预测值可能是(男,女):(0.5,0.5),因此,热点新闻这个物品不会作为个性化召回结果推荐给用户。
本申请实施例提供的个性化推荐方法,通过获取冷启动用户在目标网站注册时确定的冷启动用户信息,再根据冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及冷启动用户所属的至少一个人口统计学属性人群,最后根据冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对冷启动用户的待推荐物品。该技术方案,能够实现冷启动用户的准确推荐,而且成本低,易于实现。
示例性的,在上述实施例的基础上,图3为本申请第二实施例提供的个性化推荐方法的流程示意图。本申请实施例主要用于介绍每个人口统计学属性人群的物品排序索引的确定方案。参照图3所示,在本申请的实施例中,该方法还可以包括如下步骤:
S301、获取该目标网站中的所有物品的信息。
在本申请的实施例中,电子设备若需要向用户推荐物品,则首先需要确定并获取该目标网站中的所有物品的信息。例如,若目标网站为电商网站,则电商网站中的物品为可以进行买卖的商品,物品的信息包括:商品的名称、标题、链接、商品介绍、用户评论等。再比如,若目标网站为视频网站,则视频网站中的物品为能够观看的视频资源,物品的信息包括:视频资源的名称、链接、简介等信息。
可以理解的是,本申请实施例并不对目标网站、目标网站中的物品种类进行限定,其可以根据实际应用场景确定,此处不再赘述。
S302、将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,该推荐模型是利用该目标网站中的历史行为数据集合对预设网络进行训练得到的。
在本申请的实施例中,为了确定每种物品在每个人口统计学属性人群中的分布情况,电子设备可以将所有物品的信息输入到推荐模型中,利用推荐模型的处理结果,可以得到每种物品在每个人口统计学属性人群中的概率分布。
例如,电子设备将电商网站中的商品输入到推荐模型中后,例如,护肤品,对于人口统计学属性性别的最终预测结果为(男,女):(0.2,0.8),则意味着女生对这个物品更感兴趣。
可选的,在本实施例中,该推荐模型可以是电子设备基于目标网站中的历史行为数据集合对预设网络进行训练得到的,即首先获取目标网站中的历史行为数据集合,再利用历史行为数据集合中的历史行为数据对预设网络进行训练,并更新预设网络的参数,从而确定出能够准确分类的推荐模型。
S303、根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
在本申请的实施例中,电子设备确定出每种物品在每个人口统计学属性人群中的概率分布后,分别针对每个人口统计学属性人群,确定出一个物品排序索引。
示例性的,假设基于性别划分的人口统计学属性人群为女性和男性,则基于上述S301至S303确定的女性这个人口统计学人群的物品排序索引可以是护肤品1、衣服2、食品3等等;基于上述S301至S303确定的男性这个人口统计学人群的物品排序索引可以是电子产品1、球类2、食品3等等。可以理解的是,上述给出的物品索引仅是一种示例性说明,本申请实施例并不对其进行限定,其可以根据实际的人口统计学确定。
可选的,在本申请的实施例中,参照图3所示,该方法还可以包括如下步骤:
S304、根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布。
在本申请的实施例中,电子设备还可以通过多属性组合的方式确定待推荐的物品,因而,电子设备首先根据每种物品在每个人口统计学属性人群中的概率分布,通过概率相乘的方式确定出每种物品在不同人口统计学属性人群组合中的总概率分布。
示例性的,若电子设备在确定出每种物品在每个人口统计学属性人群中的概率分布的基础上,还可以统计每种物品在多个人口统计学属性人群的总概率分布,电子设备可以对用户的不同人口统计学人群属性进行分类。
例如,仍以护肤品的例子进行说明:假设电子设备基于性别确定的护肤品在男性和女性等人群中的概率分布是(男,女):(0.2,0.8),基于年龄确定的护肤品在各年龄段中的概率分布是(18岁以下,18-24,24-35,35以上):(0.2,0.4,0.3,0.1)。因而,对所有可能的性别和年龄段组合进行概率相乘,最终得到18-24岁的女生对护肤品这个物品最感兴趣。
本申请实施例通过这种概率分布相乘的方式确定的不同人口统计学属性人群组合中的总概率分布,能够灵活地对属性进行组合,无需重新训练模型,易于实现,扩展了应用范围。
S305、根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
在本申请的实施例中,电子设备确定出每种物品在不同人口统计学属性人群组合中的总概率分布后,还可以基于该总概率分布对所有的物品进行排序,从而确定不同人口统计学属性人群组合中的物品排序索引。
例如,基于上述S304和S305可以确定出年龄和性别等人口统计学属性人群组合中的物品排序索引,例如,对于年龄段在(18岁以下,18-24,24-35,35以上)的女性,物品排序索引分别位于首位的物品分别是为书本、护肤品、育儿产品、家具用品等等;对于年龄段在(18岁以下,18-24,24-35,35以上)的男性,物品排序索引分别位于首位的物品分别是为书本、电子产品、汽车用品、健身用品等等。可以理解的是,本申请实施例给出的各物品的排序仅是一种示例性说明,此处不对其进行限定。
可选的,在图3所示实施例的基础上,上述S203还可以通过如下可能设计实现:
B1、根据该冷启动用户所属的至少一个人口统计学属性人群,确定该冷启动用户对应的人口统计学属性人群组合;
B2、根据冷启动用户对应的人口统计学属性人群组合和人口统计学属性人群组合中的物品排序索引,确定针对该冷启动用户的待推荐物品。
在本申请的实施例中,对于上述冷启动用户,若该冷启动用户属于女性人群,且年龄段在24至35之间,则可以确定该冷启动用户对应的人口统计学属性人群组合为年龄段在24至35之间女性群体。
相应的,若电子设备基于确定的推荐模型确定了年龄段在24至35之间女性群体的物品排序索引为护肤品1、健身用品2、育儿用品3,则电子设备可以确定针对该冷启动用户的待推荐物品,即首个推荐物品为护肤品,其次为健身用品等,进而基于待推荐位置的数量确定待推荐物品的数量,并基于推荐顺序依次推荐或显示。
本申请实施例提供的个性化推荐方法,电子设备获取所述目标网站中的所有物品的信息,将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,最后根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引,进一步的,还可以确定出不同人口统计学属性人群组合中的物品排序索引。该技术方案中,依赖人口统计学属性确定待推荐物品,成本低,易于实现,而且可以灵活选择需要组合的属性分类,扩展了可适用的应用场景。
可选的,在上述图3所示实施例的基础上,下述介绍推荐模型的建立过程。具体的,图4为本申请第三实施例提供的个性化推荐方法的流程示意图。参照图4所示,该方法还可以包括如下步骤:
S401、获取该目标网站中的历史行为数据集合。
其中,该历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
可选的,该操作物品信息由其所属物品所在的业务确定。示例性的,该操作物品信息至少包括如下一种:物品名称、标题、点击数、评论数、点赞数、收藏数。
在本申请的实施例中,电子设备针对给定的目标网站,首先获取目标网站生成的行为日志,再对该行为日志进行分析,分离出该目标网站中的历史行为数据集合,从而得到已注册用户对目标网站中的物品进行操作时,生成历史行为数据。
可以理解的是,为了表征每个已注册用户的行为,每条历史行为数据均携带已注册用户的标识和操作物品信息。因而,该历史行为数据集合中的多条历史行为数据可以作为构建推荐模型的样本。
示例性的,已注册用户的标识可以是用户账号、设备号、IP地址等,操作物品信息可以是已注册用户操作(点击、购买)的物品的信息,包括但不限定物品名称、标题、用户评价等内容。关于操作物品信息的具体表现形式可以根据目标网站的性质确定,此处不再赘述。
S402、根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性。
在本实施例中,电子设备可以对每条历史行为数据进行处理,基于每条历史行为数据携带的已注册用户的标识,利用人口统计学技术,确定出每条历史行为数据所属已注册用户的具有的多个人口统计学属性。
例如,对于某一电商网站,通过分析该电商网站生成的日志数据,提取日志数据中携带已注册用户的标识和操作物品信息的历史行为数据,基于该已注册用户的标识确定该已注册用户的性别,所处的年龄段、所处地域、职业等多个人口统计学属性。
可理解,本申请实施例给出的已注册用户具有的多个人口统计学属性仅是一种示例性说明,其可以根据实际数据确定,此处不再赘述。
S403、将该历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本。
在本实施例中,为了建立推荐结果准确的推荐模型,电子设备可以将上述确定的已注册用户具有的多个人口统计学属性和该已注册用户的操作信息进行整合,即将每条历史行为数据的人口统计学属性和操作物品信息关联起来,从而得到每条训练数据,多条训练数据即可以组成用于建立推荐模型的训练样本。
S404、以该训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到上述推荐模型。
在本申请的实施例中,要建立的推荐模型的属性是当操作物品信息作为输入时,可以输出对应的人口统计学属性,因而,电子设备在训练推荐模型时以每条训练数据的操作物品信息作为预设网络的输入,相应的,以该条训练数据的人口统计学属性作为预设网络的目标输出,依次更新预设网的参数,直接预设网络收敛,即得到了推荐模型。
示例性的,基于训练数据训练推荐模型的过程可以通过如下步骤实现:
C1、对训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息;
C2、将训练样本中每条训练数据的操作物品特征向量信息依次输入该预设网络,通过调整预设网络的参数,直到该预设网络的输出结果依次为对应训练数据的人口统计学属性,得到该推荐模型。
可选的,图5为本申请实施例中推荐模型的结构示意图。如图5所示,在本实施例中,该推荐模型可以包括:输入层、编码层和输出层。
其中,最低层的是输入层,该输入层中输入的是每条训练数据的操作物品信息,即,物品的特性,这些特征可以由具体业务来决定,包括但不限于物品的标题、点赞数、评论数、收藏数等等。
往上一层是编码层,该编码层用于对输入层获取到的操作物品信息进行编码,转化成稠密的向量,即操作物品特征向量信息,以提高训练效率。
最后一层是输出层,该输出层可以包含多个分类器,对不同的人口统计学属性进行预测,输出每条训练数据具有的多个人口统计学属性,例如,性别、年龄等。
可以理解的是,本实施例中给出的推荐模型的结构只是一种示例性说明,本申请的主要保护点是推荐模型的输入为操作物品信息,输出是具有的人口统计学属性,关于推荐模型的具体结构可以根据实际数据特点进行修改,此处不再赘述。
本申请实施例提供的个性化推荐方法,通过获取所述目标网站中的历史行为数据集合,根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性,进而结合操作物品信息,得到训练样本,最后利用该训练样本中的每条训练数据对预设网络进行训练,得到推荐模型。该技术方案中,推荐模型的训练仅依赖于人口统计学属性,训练样本容易获得,而且成本低,此外,该方案的训练数据不受热门内容的影响,能够满足个性化的推荐需要,提高了转化的成功率。
综合上述各实施例,下面通过一个例子对本申请的技术方案进行说明。示例性的,图6是本实施例提供的个性化推荐方法的整体流程示意图。如图6所示,在本实施例中,个性化推荐方法可以包括离线过程和在线过程。
其中,离线过程主要是推荐模型的训练和物品排序索引确定。具体的,参照图6所示,首先收集目标网站的点击日志,拼接用户画像,即收集已注册用户的点击行为数据,包括收集产品的点击日志,与已注册用户的人口统计学属性进行拼接,得到训练样本;其次,初始化预设网络,对样本进行训练,即将已注册用户的每一条点击行为作为推荐模型的一条训练样本,输入为点击的物品特征,人口统计学属性为预测目标,训练推荐模型直到收敛;最后,预测目标网站中的所有物品喜好人群分布,得到物品排序索引,也即,对于每一种人口统计学属性人群,将所有物品按照对该人群的兴趣预估概率排序,建立人群到物品的物品排序索引,该物品排序索引用于用户在线请求时进行查找。
可以理解的是,此处所述的所有物品包括在训练样本中的物品,也包括不在训练样本中的物品。
在线过程主要是根据冷启动用户的人口统计学属性和离线过程确定的物品排序索引,确定针对冷启动用户的待推荐物品。具体的,电子设备基于获取到的用户标识查询画像,得到该用户的人口统计学属性,再根据预先定义的规则对人口统计学属性进行组合,查询物品排序索引得到对应的召回物品列表,从而确定出针对该冷启动用户的待推荐物品。
由上述分析可知,本申请的技术方案只依赖人口统计学属性,和现有技术的兴趣标签相比,更容易获得,可以低成本地接入,而且多个分类器(即多人口统计学属性组合)的设计可扩展性强,可以根据实际需求灵活选择需要对哪些属性进行分类,自由地对不同属性进行组合,应用场景广泛,此外,本方案不易受训练数据中热门内容的影响,能够满足个性化的推荐需求,并且训练数据只需要正样本,即点击行为,无需人为构造负样本,实现复杂度更低。
上述介绍了本申请实施例提到的个性化推荐方法的具体实现,下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图7是本申请实施例提供的个性化推荐装置的结构示意图。该装置可以集成在电子设备中或通过电子设备实现。如图7所示,在本实施例中,该个性化推荐装置70可以包括:获取模块701和处理模块702。
其中,该获取模块701,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息;
该处理模块702,用于根据所述冷启动用户信息,确定所述冷启动用户具有的人口统计学属性,以及所述冷启动用户所属的至少一个人口统计学属性人群,根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
可选的,在本申请的一种可能设计中,该获取模块701,还用于获取所述目标网站中的所有物品的信息;
该处理模块702,还用于将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,所述推荐模型是利用所述目标网站中的历史行为数据集合对预设网络进行训练得到的,以及根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
示例性的,该处理模块702,用于根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
该处理模块702,具体用于根据所述冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定所述冷启动用户在每个人口统计学属性人群中的物品排序索引,根据所述冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
可选的,在本申请的另一种可能设计中,该处理模块702,还用于根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布,根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
示例性的,该处理模块702,用于根据所述至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
该处理模块702,具体用于根据所述冷启动用户所属的至少一个人口统计学属性人群,确定所述冷启动用户对应的人口统计学属性人群组合,根据所述冷启动用户对应的人口统计学属性人群组合和所述人口统计学属性人群组合中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
可选的,在本申请的再一种可能设计中,该获取模块701,还用于获取所述目标网站中的历史行为数据集合,所述历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
该处理模块702,还用于根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性,将所述历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本,以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型。
示例性的,该处理模块702,用于以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型,具体为:
该处理模块702,具体用于对所述训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息,将所述训练样本中每条训练数据的操作物品特征向量信息依次输入所述预设网络,通过调整所述预设网络的参数,直到所述预设网络的输出结果依次为对应训练数据的人口统计学属性,得到所述推荐模型。
可选的,在本申请的又一可能设计中,该获取模块701,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息,具体为:
该获取模块701,具体用于获取所述冷启动用户在所述目标网络注册时的用户标识,根据所述用户标识在其他网站中的历史行为数据,获取所述冷启动用户信息。
本申请实施例提供的装置,可用于执行图2至图6所示实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,处理模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上处理模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
进一步的,根据本申请的实施例,本申请还提供了一种电子设备和一种计算机可读存储介质。
图8是用来实现本申请实施例的个性化推荐方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图8所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的个性化推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的个性化推荐方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的个性化推荐方法对应的程序指令/模块(例如,附图7所示的获取模块701和处理模块702)。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的个性化推荐方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据个性化推荐的电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至个性化推荐的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
个性化推荐方法的电子设备还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图8中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与个性化推荐的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
进一步的,本申请还提供一种个性化推荐方法,包括:
确定冷启动用户具有的人口统计学属性;
根据所述冷启动用户具有的人口统计学属性和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
根据本申请实施例的技术方案,通过获取冷启动用户在目标网站注册时确定的冷启动用户信息,再根据冷启动用户信息,确定该冷启动用户具有的人口统计学属性,以及冷启动用户所属的至少一个人口统计学属性人群,最后根据冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对冷启动用户的待推荐物品。该技术方案,能够实现冷启动用户的准确推荐,而且成本低,易于实现。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种个性化推荐方法,其特征在于,包括:
获取冷启动用户在目标网站注册时确定的冷启动用户信息;
根据所述冷启动用户信息,确定所述冷启动用户具有的人口统计学属性,以及所述冷启动用户所属的至少一个人口统计学属性人群;
根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标网站中的所有物品的信息;
将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,所述推荐模型是利用所述目标网站中的历史行为数据集合对预设网络进行训练得到的;
根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
3.根据权利要求2所述的方法,其特征在于,所述根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,包括:
根据所述冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定所述冷启动用户在每个人口统计学属性人群中的物品排序索引;
根据所述冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布;
根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
5.根据权利要求4所述的方法,其特征在于,所述根据所述至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,包括:
根据所述冷启动用户所属的至少一个人口统计学属性人群,确定所述冷启动用户对应的人口统计学属性人群组合;
根据所述冷启动用户对应的人口统计学属性人群组合和所述人口统计学属性人群组合中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
6.根据权利要求2-5任一项所述的方法,其特征在于,所述方法还包括:
获取所述目标网站中的历史行为数据集合,所述历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性;
将所述历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本;
以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型。
7.根据权利要求6所述的方法,其特征在于,所述以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型,包括:
对所述训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息;
将所述训练样本中每条训练数据的操作物品特征向量信息依次输入所述预设网络,通过调整所述预设网络的参数,直到所述预设网络的输出结果依次为对应训练数据的人口统计学属性,得到所述推荐模型。
8.根据权利要求6所述的方法,其特征在于,所述操作物品信息由其所属物品所在的业务确定,所述操作物品信息至少包括如下一种:物品名称、标题、点击数、评论数、点赞数、收藏数。
9.根据权利要求1-5任一项所述的方法,其特征在于,所述获取冷启动用户在目标网站注册时确定的冷启动用户信息,包括:
获取所述冷启动用户在所述目标网络注册时的用户标识;
根据所述用户标识在其他网站中的历史行为数据,获取所述冷启动用户信息。
10.一种个性化推荐装置,其特征在于,包括:获取模块和处理模块;
所述获取模块,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息;
所述处理模块,用于根据所述冷启动用户信息,确定所述冷启动用户具有的人口统计学属性,以及所述冷启动用户所属的至少一个人口统计学属性人群,根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
11.根据权利要求10所述的装置,其特征在于,所述获取模块,还用于获取所述目标网站中的所有物品的信息;
所述处理模块,还用于将所有物品的信息输入到推荐模型中,得到每种物品在每个人口统计学属性人群中的概率分布,所述推荐模型是利用所述目标网站中的历史行为数据集合对预设网络进行训练得到的,以及根据每种物品在每个人口统计学属性人群中的概率分布,对所有的物品进行排序,确定每个人口统计学属性人群的物品排序索引。
12.根据权利要求11所述的装置,其特征在于,所述处理模块,用于根据所述冷启动用户所属的至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
所述处理模块,具体用于根据所述冷启动用户所属的每个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定所述冷启动用户在每个人口统计学属性人群中的物品排序索引,根据所述冷启动用户在所有人口统计学属性人群中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
13.根据权利要求11所述的装置,其特征在于,所述处理模块,还用于根据每种物品在每个人口统计学属性人群中的概率分布,确定每种物品在不同人口统计学属性人群组合中的总概率分布,根据每种物品在不同人口统计学属性人群组合中的总概率分布,对所有的物品进行排序,确定不同人口统计学属性人群组合中的物品排序索引。
14.根据权利要求13所述的装置,其特征在于,所述处理模块,用于根据所述至少一个人口统计学属性人群和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品,具体为:
所述处理模块,具体用于根据所述冷启动用户所属的至少一个人口统计学属性人群,确定所述冷启动用户对应的人口统计学属性人群组合,根据所述冷启动用户对应的人口统计学属性人群组合和所述人口统计学属性人群组合中的物品排序索引,确定针对所述冷启动用户的待推荐物品。
15.根据权利要求11-14任一项所述的装置,其特征在于,所述获取模块,还用于获取所述目标网站中的历史行为数据集合,所述历史行为数据集合包括:多条历史行为数据,每条历史行为数据携带已注册用户的标识和操作物品信息;
所述处理模块,还用于根据每条历史行为数据携带的已注册用户的标识,确定每条历史行为数据所属已注册用户具有的多个人口统计学属性,将所述历史行为数据集合中每条历史行为数据所属的已注册用户具有的多个人口统计学属性和操作物品信息进行整合,得到训练样本,以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型。
16.根据权利要求15所述的装置,其特征在于,所述处理模块,用于以所述训练样本中每条训练数据包括的操作物品信息作为输入,人口统计学属性作为输出,对预设网络进行训练,得到所述推荐模型,具体为:
所述处理模块,具体用于对所述训练样本中每条训练数据包括的操作物品信息进行向量化处理,得到每条训练数据的操作物品特征向量信息,将所述训练样本中每条训练数据的操作物品特征向量信息依次输入所述预设网络,通过调整所述预设网络的参数,直到所述预设网络的输出结果依次为对应训练数据的人口统计学属性,得到所述推荐模型。
17.根据权利要求10-14任一项所述的装置,其特征在于,所述获取模块,用于获取冷启动用户在目标网站注册时确定的冷启动用户信息,具体为:
所述获取模块,具体用于获取所述冷启动用户在所述目标网络注册时的用户标识,根据所述用户标识在其他网站中的历史行为数据,获取所述冷启动用户信息。
18.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-9中任一项所述的方法。
20.一种个性化推荐方法,其特征在于,包括:
确定冷启动用户具有的人口统计学属性;
根据所述冷启动用户具有的人口统计学属性和预先确定的每个人口统计学属性人群的物品排序索引,确定针对所述冷启动用户的待推荐物品。
CN202010097164.6A 2020-02-17 2020-02-17 个性化推荐方法、装置、设备及存储介质 Active CN111339406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010097164.6A CN111339406B (zh) 2020-02-17 2020-02-17 个性化推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010097164.6A CN111339406B (zh) 2020-02-17 2020-02-17 个性化推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111339406A true CN111339406A (zh) 2020-06-26
CN111339406B CN111339406B (zh) 2023-05-16

Family

ID=71183460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010097164.6A Active CN111339406B (zh) 2020-02-17 2020-02-17 个性化推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111339406B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116395A (zh) * 2020-09-24 2020-12-22 北京百度网讯科技有限公司 一种用户数据处理方法、装置、电子设备以及存储介质
CN112817952A (zh) * 2021-01-20 2021-05-18 北京明略软件系统有限公司 数据质量评估方法及系统
CN112948699A (zh) * 2021-04-14 2021-06-11 上海明略人工智能(集团)有限公司 一种人群定向推荐方法、系统、电子设备及存储介质
CN113360780A (zh) * 2021-08-10 2021-09-07 北京黑马企服科技有限公司 一种基于大数据的信息推荐方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323828A1 (en) * 2011-06-17 2012-12-20 Microsoft Corporation Functionality for personalizing search results
US20160063065A1 (en) * 2014-08-28 2016-03-03 Chandra Khatri Systems, apparatuses, and methods for providing a ranking based recommendation
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
CN106850314A (zh) * 2016-12-20 2017-06-13 上海掌门科技有限公司 一种用于确定用户属性模型及用户属性信息的方法与设备
CN108197211A (zh) * 2017-12-28 2018-06-22 百度在线网络技术(北京)有限公司 一种信息推荐方法、装置、服务器和存储介质
CN109299997A (zh) * 2018-09-03 2019-02-01 中国平安人寿保险股份有限公司 产品推荐方法、装置及计算机可读存储介质
CN109558535A (zh) * 2018-11-05 2019-04-02 重庆中科云丛科技有限公司 基于人脸识别的个性化推送物品的方法及系统
CN109597899A (zh) * 2018-09-26 2019-04-09 中国传媒大学 媒体个性化推荐系统的优化方法
CN110019943A (zh) * 2017-09-11 2019-07-16 中国移动通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN110019940A (zh) * 2017-08-03 2019-07-16 Tcl集团股份有限公司 一种影视推送方法及装置
CN110427548A (zh) * 2019-03-05 2019-11-08 北京京东尚科信息技术有限公司 信息推送方法、信息推送装置及计算机可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120323828A1 (en) * 2011-06-17 2012-12-20 Microsoft Corporation Functionality for personalizing search results
US20160063065A1 (en) * 2014-08-28 2016-03-03 Chandra Khatri Systems, apparatuses, and methods for providing a ranking based recommendation
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
CN106850314A (zh) * 2016-12-20 2017-06-13 上海掌门科技有限公司 一种用于确定用户属性模型及用户属性信息的方法与设备
CN110019940A (zh) * 2017-08-03 2019-07-16 Tcl集团股份有限公司 一种影视推送方法及装置
CN110019943A (zh) * 2017-09-11 2019-07-16 中国移动通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN108197211A (zh) * 2017-12-28 2018-06-22 百度在线网络技术(北京)有限公司 一种信息推荐方法、装置、服务器和存储介质
CN109299997A (zh) * 2018-09-03 2019-02-01 中国平安人寿保险股份有限公司 产品推荐方法、装置及计算机可读存储介质
CN109597899A (zh) * 2018-09-26 2019-04-09 中国传媒大学 媒体个性化推荐系统的优化方法
CN109558535A (zh) * 2018-11-05 2019-04-02 重庆中科云丛科技有限公司 基于人脸识别的个性化推送物品的方法及系统
CN110427548A (zh) * 2019-03-05 2019-11-08 北京京东尚科信息技术有限公司 信息推送方法、信息推送装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李佳琪等: "应用商城中用户年龄的推断及在推荐中的应用", 《计算机科学与探索》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116395A (zh) * 2020-09-24 2020-12-22 北京百度网讯科技有限公司 一种用户数据处理方法、装置、电子设备以及存储介质
CN112817952A (zh) * 2021-01-20 2021-05-18 北京明略软件系统有限公司 数据质量评估方法及系统
CN112948699A (zh) * 2021-04-14 2021-06-11 上海明略人工智能(集团)有限公司 一种人群定向推荐方法、系统、电子设备及存储介质
CN113360780A (zh) * 2021-08-10 2021-09-07 北京黑马企服科技有限公司 一种基于大数据的信息推荐方法及系统

Also Published As

Publication number Publication date
CN111339406B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
US11714816B2 (en) Information search method and apparatus, device and storage medium
CN108021929B (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN111339406B (zh) 个性化推荐方法、装置、设备及存储介质
CN111143686B (zh) 资源推荐方法及装置
Qian et al. Social media based event summarization by user–text–image co-clustering
CN109471978B (zh) 一种电子资源推荐方法及装置
CN111818370B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN111259222A (zh) 物品推荐方法、系统、电子设备及存储介质
CN112559901B (zh) 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品
CN112528147A (zh) 内容推荐方法和装置、训练方法、计算设备和存储介质
CN111522940A (zh) 用于处理评论信息的方法和装置
CN112380104A (zh) 用户属性识别方法、装置、电子设备及存储介质
CN112818230A (zh) 内容推荐方法、装置、电子设备和存储介质
CN112818111A (zh) 文档推荐方法、装置、电子设备和介质
CN111563198A (zh) 一种物料召回方法、装置、设备及存储介质
CN115329131A (zh) 素材标签推荐方法、装置、电子设备及存储介质
CN116823410B (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN109829033B (zh) 数据展示方法和终端设备
CN111787042B (zh) 用于推送信息的方法和装置
CN113495991A (zh) 一种推荐方法和装置
CN112541145A (zh) 一种页面展现方法、装置、设备及存储介质
CN111552835A (zh) 文件推荐方法、装置及服务器
CN114036397B (zh) 数据推荐方法、装置、电子设备和介质
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant