CN111159549B

CN111159549B - 一种信息推荐方法及系统

Info

Publication number: CN111159549B
Application number: CN201911380469.1A
Authority: CN
Inventors: 陈果如; 董宾
Original assignee: Feihu Information Technology Tianjin Co Ltd
Current assignee: Feihu Information Technology Tianjin Co Ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2023-09-12
Anticipated expiration: 2039-12-27
Also published as: CN111159549A

Abstract

本发明提供一种信息推荐方法及系统，通过获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志，计算用户对融合用户行为日志中每一日志信息的喜爱评分。基于预设相似度算法得到用户历史行为日志中用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的相似度。利用喜爱评分和相似度列表进行类物品过滤计算，得到用户未浏览的日志信息对应的推荐度，并基于推荐度构成推荐度列表。基于预设推荐比例，选取推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。基于本发明，能基于用户喜爱评分和相似度算法得出用户未浏览的信息的推荐度，能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

Description

一种信息推荐方法及系统

技术领域

本发明涉及互联网技术领域，尤其涉及一种信息推荐方法及系统。

背景技术

随着社会的发展，人们生活在一个发达的互联网信息时代，海量的信息通过互联网展示在人们眼前。用户在互联网浏览信息时，依据自身所喜欢的内容搜索信息。然而，互联网中的信息严重过载，用户进行搜索后会得到大量的信息，其中，只有一小部分信息才是用户所喜爱浏览的。因此，针对用户偏好的信息推荐技术应运而生。

目前，传统推荐技术一般通过分布式系统基础架构（Hadoop Distributed FileSystem，Hdfs）对用户行为日志每间隔一段时间进行一次离线训练，然后使用训练得到的模型为用户生成信息推荐列表。由于该方案需要间隔一段时间进行离线训练，显然无法根据用户兴趣偏好的实时变化向用户推荐合理的信息，推荐的信息的满意度过低，降低用户体验。

发明内容

有鉴于此，本发明实施例提供一种信息推荐方法及系统，以解决无法根据用户兴趣偏好的实时变化向用户推荐合理的信息，造成推荐的信息的满意度过低的问题。

为实现上述目的，本发明实施例提供如下技术方案：

本发明实施例第一方面公开了一种信息推荐方法，所述方法包括：

获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志，所述最新行为日志包括N个未被读取的用户最新浏览信息，所述短期行为日志包括M个已被读取的用户历史浏览信息，N为正整数，M为正整数；

基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分；

获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例；

利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表；

基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。

优选的，在上述信息推荐方法中，所述基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分，包括：

通过计算所述融合用户行为日志中每一日志信息的权重，S指任一日志信息对应的排序位置，S为正整数；

将所述每一日志信息中，包含不同信息的单一日志信息的权重作为所述单一日志信息的喜爱评分，以及将所述每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到所述重复日志信息的喜爱评分。

优选的，在上述信息推荐方法中，所述获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例，包括：

获取所述用户历史行为日志；

利用预设相似度算法，计算所述用户历史行为日志中的每一日志信息之间的相似度，所述预设相似度算法至少包括物品内容属性的相似度算法、物品协同过滤的相似度算法和word2vec的相似度算法中的一种或多种组合；

获取利用所述预设相似度算法计算得到的所述每一日志信息之间的相似度，构成相似度列表；

基于所述相似度列表中包含的相似度，确定所述预设推荐比例。

优选的，在上述信息推荐方法中，所述利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表，包括：

获取利用所述预设相似度算法计算得到的所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度，构成相似度列表；

基于类物品过滤算法，计算所述的融合用户行为日志中的每一日志信息喜爱评分和所述相似度列表，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，并基于所述推荐度构成所述推荐度列表。

优选的，在上述信息推荐方法中，所述基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐，包括：

基于所述预设推荐比例，确定当前获取的所述推荐度列表中待推荐的信息的数量；

依据所述推荐度列表中待推荐的信息的数量，从所述推荐度列表中选出待推荐的信息；

集合各个所述待推荐的信息，构建所述最优推荐度列表，并向所述用户推荐所述最优推荐度列表。

优选的，在上述信息推荐方法中，还包括：

滤除所述最优推荐度列表中的不符合浏览要求的信息。

本发明实施例第二方面公开了一种信息推荐系统，所述系统包括：

融合单元，用于获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志，所述最新行为日志包括N个未被读取的用户最新浏览信息，所述短期行为日志包括M个已被读取的用户历史浏览信息，N为正整数，M为正整数；

喜爱评分单元，用于基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分；

获取单元，用于获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例；

推荐度列表单元，用于利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表；

推荐单元，用于基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。

优选的，在上述信息推荐系统中，所述获取单元包括：

获取模块，用于获取所述用户历史行为日志；

计算模块，用于利用预设相似度算法，计算所述用户历史行为日志中的每一日志信息之间的相似度，所述预设相似度算法至少包括物品内容属性的相似度算法、物品协同过滤的相似度算法和word2vec的相似度算法中的一种或多种组合；

构建模块，用于获取利用所述预设相似度算法计算得到的所述每一日志信息之间的相似度，构成相似度列表；

比例模块，用于基于所述相似度列表中包含的相似度，确定所述预设推荐比例。

优选的，在上述信息推荐系统中，所述推荐单元包括：

确定模块，用于基于所述预设推荐比例，确定当前获取的所述推荐度列表中待推荐的信息的数量；

选取模块，用于依据所述推荐度列表中待推荐的信息的数量，从所述推荐度列表中选出待推荐的信息；

推荐模块，用于集合各个所述待推荐的信息，构建所述最优推荐度列表，并向所述用户推荐所述最优推荐度列表。

优选的，在上述信息推荐信息系统中，还包括：

滤除单元，用于滤除所述最优推荐度列表中的不符合浏览要求的信息。

基于上述本发明实施例提供的信息推荐方法及系统，通过获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分。获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表。基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。基于本发明实施例，通过用户的行为日志，实时更新用户的对不同日志信息的喜爱评分，基于用户喜爱评分和相似度算法得出用户未浏览的信息的推荐度，依据推荐度构成的最优推荐度列表为用户推荐信息，从而保证能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种信息推荐方法的流程示意图；

图2为本发明实施例提供的一种计算喜爱评分的方法的流程示意图；

图3为本发明实施例提供的一种获取相似度列表和预设推荐比例的方法的流程示意图；

图4为本发明实施例提供的一种构建推荐度列表的方法的流程示意图；

图5为本发明实施例提供的一种构建最优推荐度列表的方法的流程示意图；

图6为本发明实施例提供的另一种信息推荐方法的流程示意图；

图7为本发明实施例提供的一种信息推荐系统的结构示意图；

图8为本发明实施例提供的另一种信息推荐系统的结构示意图；

图9为本发明实施例提供的另一种信息推荐系统的结构示意图；

图10为本发明实施例提供的另一种信息推荐系统的结构示意图；

图11为本发明实施例提供的另一种信息推荐系统的结构示意图；

图12为本发明实施例提供的另一种信息推荐系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这个过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明实施例提供的信息推荐方法及系统，适用于分布式实时大数据处理（Storm）系统。此外，本发明实施例中所采用的信息传输方式为消息队列，所述消息队列可以为kafka、RabbitMQ、RocketMQ等类型，具体的消息队列类型可由技术人员根据实际情况进行选择和使用。本发明实施例中，存储信息的方式为数据库存储，所述数据库可以为Redis、OracleBDB等类型，具体的数据库类型可由技术人员根据实际情况进行选择和使用。

如图1所示，为本发明实施例提供的一种信息推荐方法的流程示意图，所述方法包括如下步骤：

S101：获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。

在S101中，所述最新行为日志包括N个未被读取的用户最新浏览信息，所述短期行为日志包括M个已被读取的用户历史浏览信息，N为正整数，M为正整数。其中，任一所述用户历史浏览信息的记录时间都早于任一所述用户最新浏览信息的记录时间。

需要说明的是，在具体融合所述最新行为日志和所述短期行为日志的过程中，将所述最新行为日志和所述短期行为日志中的每一记录信息，按照记录时间由后至先的顺序排序，得到所述融合用户行为日志。

在具体实现中，假设所述短期行为日志包括第一A信息、B信息、C信息和第二A信息，所述最新行为日志包括D信息。其中，第一A信息和第二A信息为相同信息，第一A信息的记录时间早于B信息的记录时间，B信息的记录时间早于C信息，C信息的记录时间早于第二A信息的记录时间，第二A信息的记录时间早于D信息。融合所述最新行为日志和所述短期行为日志，得到的融合用户行为日志具体为“D信息，第二A信息，C信息，B信息，第一A信息”。需要说明的是，上述实现过程仅仅用于举例说明。

S102：基于融合用户行为日志，计算用户对融合用户行为日志中每一日志信息的喜爱评分。

在S102中，所述用户对所述融合用户行为日志中每一日志信息的喜爱评分，代表了所述用户对所述每一日志信息的喜爱程度。其中，所述日志信息的喜爱评分越高，则代表所述用户对所述日志信息的喜爱程度越高。

需要说明的是，基于任一日志信息与所述融合用户行为日志所包括的所有日志信息之间的权重关系，可以计算得出所述用户对所述任一日志信息的喜爱评分。

在具体实现中，假设所述融合用户行为日志包括A信息、B信息、C信息和D信息，通过计算得出A信息、B信息、C信息和D信息的喜爱评分如表1所示。由此可知，用户对A信息的喜爱程度最高，对D信息的喜爱程度次之，接下来是对C信息的喜爱程度，对B信息的喜爱程度最低。需要说明的是，上述实现过程仅仅用于举例说明。

表1：

S103：获取基于用户历史行为日志进行离线的相似度计算，得到由用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。

在S103中，用于进行离线的相似度计算的预设相似度算法可以为一种或多种，基于多种预设相似度算法能够计算得出多种不同的相似度列表，并且所述相似度列表与所述预设推荐比例之间具有相应关系。

S104：利用喜爱评分和相似度列表进行类物品过滤计算，得到用户历史行为日志中用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的推荐度，基于推荐度构成推荐度列表。

在S104中，所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息互不相同。

所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，由所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度列表和所述喜爱评分确定。

需要说明的是，若所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度列表为R个，则所述推荐度构成的推荐度列表为R个，R为大于1的正整数。换而言之，所述相似度列表的数量和所述推荐度列表的数量呈一致性。

在本发明实施例中，利用所述喜爱评分和所述相似度列表进行类物品过滤计算的实现过程具体可为：

假设所述用户未浏览的日志信息包括C信息、D信息和E信息，所述融合用户行为日志中的日志信息包括A信息和B信息。其中，用户对所述融合用户行为日志中的每一日志信息的喜爱评分如表2所示，所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度列表如表3所示。

基于类物品过滤算法，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表如表4所示。

需要说明的是，上述实现过程仅仅用于举例说明。

表2：

表3：

表4：

S105：基于预设推荐比例，选取推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。

在S105中，各个所述待推荐的信息之间互不相同。此外，所述待推荐的信息对应的推荐度大于所述推荐度列表中其他信息对应的推荐度。

需要说明的是，所述预设推荐比例与所述推荐度列表之间具有相应关系。

在具体实现中，假设所述预设推荐比例为，所述推荐度列表包括第一推荐度列表和第二推荐度列表。

进一步的，从所述第一推荐度列表中选出X个待推荐的信息，从所述第二推荐度列表中选出Y个待推荐的信息，X、Y为正整数。最终，集合所述X个待推荐的信息和所述Y个待推荐的信息，构建最优推荐度列表并推荐。

需要说明的是，上述实现过程仅仅用于举例说明。

在本发明实施例中，通过获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分。获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表。基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。基于本发明实施例，通过用户的行为日志，实时更新用户的对不同日志信息的喜爱评分，基于用户喜爱评分和相似度算法得出用户未浏览的信息的推荐度，依据推荐度构成的最优推荐度列表为用户推荐信息，从而保证能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

优选的，结合上述图1示出的步骤S102，所述基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分，在具体实现中，参考图2，为本发明实施例提供的一种计算喜爱评分的方法的流程示意图，包括如下步骤：

S201：通过公式（1）计算融合用户行为日志中每一日志信息的权重。

在S203中，所述公式（1）为：

（1）

其中，所述S指所述融合用户行为日志中任一日志信息对应的排序位置，S为正整数。

在具体实现中，假设所述融合用户行为日志包括中的排序顺序A信息、B信息、C信息和D信息，并且所述融合用户行为日志中各个日志信息对应的排序顺序为“A信息，B信息，C信息，D信息”，相应的，A信息对应的排序位置为1，B信息对应的排序位置为2，C信息对应的排序位置为3，D信息对应的排序位置为4。由此可知，A信息的权重为，B信息的权重为/>，C信息的权重为/>，D信息的权重为/>。需要说明的是，上述实现过程仅仅用于举例说明。

S202：将每一日志信息中，包含不同信息的单一日志信息的权重作为单一日志信息的喜爱评分，以及将每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到重复日志信息的喜爱评分。

在S202中，所述单一日志信息的喜爱评分和所述重复日志信息的喜爱评分构成了用户对所述融合用户行为日志中不同的日志信息的喜爱评分。

在具体实现中，假设所述融合用户行为日志包括第一A信息、第二A信息、B信息和C信息。通过计算，得到第一A信息的权重为0.5，第二A信息的权重为0.6，B信息的权重为0.3，C信息的权重为0.7。其中，第一A信息和第二A信息为包含相同的A信息的重复日志信息，B信息和C信息为包含不同信息的单一日志信息。由此可知，所述融合用户行为日志中不同的日志信息的喜爱评分具体为：A信息的喜爱评分为1.1，B信息的喜爱评分为0.3，C信息的喜爱评分为0.7。

在本发明实施例中，通过公式（1）计算所述融合用户行为日志中每一日志信息的权重，将所述每一日志信息中，包含不同信息的单一日志信息的权重作为所述单一日志信息的喜爱评分，以及将所述每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到所述重复日志信息的喜爱评分。基于本发明实施例，通过计算用户行为日志中不同的日志信息的权重，实时获取用户对不同日志信息的喜爱评分，从而保证能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

优选的，结合上述图1示出的步骤S103，所述获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例，在具体实现过程中，参考图3，为本发明实施例提供的一种获取相似度列表和预设推荐比例的方法的流程示意图，包括如下步骤：

S301：获取用户历史行为日志。

在S301中，所述用户历史行为日志包括用户的最新行为日志和短期行为日志。

S302：利用预设相似度算法，计算用户历史行为日志中的每一日志信息之间的相似度。

在S302中，所述预设相似度算法至少包括物品内容属性的相似度算法、物品协同过滤的相似度算法和word2vec的相似度算法中的一种或多种组合。

需要说明的是，每一种预设相似度算法能够计算得出一种相似度。例如，通过所述物品内容属性的相似度算法能够计算得出一种相似度，通过所述物品协同过滤的相似度算法能够计算得出另一种相似度，通过所述word2vec的相似度算法能够计算得出另一种相似度。

S303：获取利用预设相似度算法计算得到的每一日志信息之间的相似度，构成相似度列表。

在S303中，因每一种预设相似度算法能够计算得出一种相似度，故每一种预设相似度算法能够计算得出一种相似度列表。例如，通过所述物品内容属性的相似度算法能够计算得出一种相似度列表，通过所述物品协同过滤的相似度算法能够计算得出另一种相似度列表，通过所述word2vec的相似度算法能够计算得出另一种相似度列表。

在具体实现中，假设所述预设相似度算法包括第一相似度算法和第二相似度算法，所述用户历史行为日志包括A信息、B信息、C信息和D信息。基于所述第一相似度算法得到的所述用户历史行为日志中每一日志信息之间的相似度如表5所示，基于所述第二相似度算法得到的所述用户历史行为日志中每一日志信息之间的相似度如表6所示。

表5：

表6：

S304：基于相似度列表中包含的相似度，确定预设推荐比例。

在S304中，所述预设推荐比例与所述相似度列表中的包含的相似度之间具有相应关性。

在具体实现中，假设所述相似度列表的数量为2个，则所述预设推荐比例为；所述相似度列表的数量为3个，则所述预设推荐比例为/>，其中，X、Y、Z为正整数，X、Y、Z的具体数值由技术人员根据实际情况进行设置。需要说明的是，上述实现过程仅仅用于举例说明。

在本发明实施例中，通过获取所述用户历史行为日志，利用预设相似度算法，计算所述用户历史行为日志中的每一日志信息之间的相似度。并获取利用所述预设相似度算法计算得到的所述每一日志信息之间的相似度，构成相似度列表。基于所述相似度列表中包含的相似度，确定所述预设推荐比例。基于本发明实施例，能够得到用户未浏览的信息与用户已浏览的信息之间的相似度，为向用户推荐的信息提供可靠依据。

优选的，结合上述图1示出的步骤S104，所述利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表，在具体实现过程中，参考图4，为本发明实施例提供的一种构建推荐度列表的方法的流程示意图，包括如下步骤：

S401：获取利用预设相似度算法计算得到的用户历史行为日志中用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的相似度，构成相似度列表。

在S401中，若所述预设相似度算法为R种，则能够计算得出R种不同的相似度，从而得到R种不同的相似度列表，R为大于1的正整数。

S402：基于类物品过滤算法，计算融合用户行为日志中的每一日志信息喜爱评分和相似度列表，得到用户历史行为日志中用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的推荐度，并基于推荐度构成推荐度列表。

在S402中，将所述喜爱评分与所述相似度列表中包含的各个相似度进行对应的相乘，得到两者的乘积。所述乘积与所述用户未浏览的日志信息之间存在对应关系，换而言之，每一个所述用户未浏览的日志信息对应的乘积的数量，与所述融合用户行为日志中的日志信息的数量一致。将每一个所述用户未浏览的日志信息对应的各个乘积进行相加，最终得到每一个所述用户未浏览的日志信息对应的推荐度。

为了方便理解上述步骤S401至步骤S402，下面通过A1-A2进行举例说明：

假设所述预设相似度算法包括第一相似度算法和第二相似度算法，所述融合用户行为日志包括A信息和B信息，所述用户未浏览的日志信息包括C信息、D信息和E信息。其中，A信息对应的喜爱评分为1，B信息对应的喜爱评分为2。

A1、利用所述第一相似度算法，计算得到第一相似度列表，如表7所示。利用所述第二相似度算法，计算得到第二相似度列表，如表8所示。

表7：

表8：

A2、将A信息对应的喜爱评分和B信息对应的喜爱评分，分别与表7和表8中各个对应的相似度进行相乘，得到乘积，并基于所述乘积得到C信息、D信息和E信息的第一推荐度列表如表9所示，以及第二推荐度列表如表10所示。

表9：

表10：

在本发明实施例中，通过获取利用预设相似度算法计算得到的用户历史行为日志中所述用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的相似度，构成相似度列表，并基于类物品过滤算法，计算所述的融合用户行为日志中的每一日志信息喜爱评分和所述相似度列表，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，并基于所述推荐度构成所述推荐度列表。基于本发明实施例，能够得到用户未浏览的信息的推荐度，依据推荐度构成的推荐度列表选取合适的信息推荐给用户，保证用户能够感兴趣。

优选的，结合上述图1示出的步骤S105，基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐，在具体实现过程中，参考图5，为本发明实施例提供的一种构建最优推荐度列表的方法的流程示意图，包括如下步骤：

S501：基于预设推荐比例，确定当前获取的推荐度列表中待推荐的信息的数量。

在S501中，任一预设相似度算法计算得出的任一推荐度列表中的待推荐的信息的数量由所述预设推荐比例确定。

S502：依据推荐度列表中待推荐的信息的数量，从推荐度列表中选出待推荐的信息。

在S502中，任一推荐度列表中选出的待推荐的信息对应的推荐度，高于所述推荐度列表中其他信息对应的推荐度。并且，从各个推荐度列表中选出的各个所述待推荐的信息之间互不相同。

S503：集合各个待推荐的信息，构建最优推荐度列表，并向用户推荐最优推荐度列表。

在S503中，所述最优推荐度列表中的各个所述待推荐的信息可以按照对应的推荐度由高至低的顺序进行排序。

为了方便理解上述步骤S501至步骤S503，下面通过B1-B3进行举例说明：

假设所述推荐度列表包括第一推荐度列表和第二推荐度列表，预设推荐比例为，所述最优推荐度列表总共包含5个信息。所述第一推荐度列表如表11所示，所述第二推荐度列表如表12所示。

表11：

表12：

B1、基于所述预设推荐比例，确定从表11中选2个待推荐的信息，从表12中选出3个待推荐的信息。

B2、因表11和表12中都具有D信息，从表11中选出的是C信息和B信息，从表12中选出的是D信息、E信息和F信息。

B3、集合各个待推荐的信息，构建成最优推荐度列表，所述最优推荐度列表如表13所示。

表13：

在本发明实施例中，通过基于预设推荐比例，确定当前获取的推荐度列表中待推荐的信息的数量，并依据推荐度列表中待推荐的信息的数量，从推荐度列表中选出待推荐的信息。最终，集合各个待推荐的信息，构建最优推荐度列表，并向用户推荐最优推荐度列表。基于本发明实施例，能从任一预设相似度算法对应计算得到的推荐度列表中，选出待推荐的信息，由所述待推荐的信息构成的最优推荐度列表，能保证用户对最优推荐度列表中的任一信息都有极大的兴趣。

需要说明的是，在向用户推荐最优推荐度列表后，所述用户有可能会隔一段时间后才进行浏览。然而，在这段时间中，所述最优推荐度列表中的部分信息可能会由于某种原因导致无法浏览。换而言之，该部分信息是无效的，需要滤除无效的信息，保证所述用户能够正常浏览。

优选的，如图6所示，为本发明实施例提供的另一种信息推荐方法的流程示意图，包括如下步骤：

S601：获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。

在S601中，步骤S601的具体执行过程和实现原理与上述图1示出的步骤S101的具体执行过程和实现原理一致，可参见，这里不再赘述。

S602：基于融合用户行为日志，计算用户对融合用户行为日志中每一日志信息的喜爱评分。

在S602中，步骤S602的具体执行过程和实现原理与上述图1示出的步骤S102的具体执行过程和实现原理一致，可参见，这里不再赘述。

S603：获取基于用户历史行为日志进行离线的相似度计算，得到由用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。

在S603中，步骤S603的具体执行过程和实现原理与上述图1示出的步骤S103的具体执行过程和实现原理一致，可参见，这里不再赘述。

S604：利用喜爱评分和相似度列表进行类物品过滤计算，得到用户历史行为日志中用户未浏览的日志信息与融合用户行为日志中的每一日志信息之间的推荐度，基于推荐度构成推荐度列表。

在S604中，步骤S604的具体执行过程和实现原理与上述图1示出的步骤S104的具体执行过程和实现原理一致，可参见，这里不再赘述。

S605：基于预设推荐比例，选取推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。

在S605中，步骤S605的具体执行过程和实现原理与上述图1示出的步骤S105的具体执行过程和实现原理一致，可参见，这里不再赘述。

S606：滤除最优推荐度列表中的不符合浏览要求的信息。

在S606中，所述不符合浏览要求的信息包括但不限于已下架的信息、违反法规的信息等类型。

在本发明实施例中，通过获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分。获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表。基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。此外，能够滤除最优推荐度列表中部分不符合浏览要求的信息。基于本发明实施例，通过用户的行为日志，实时更新用户的对不同日志信息的喜爱评分，基于用户喜爱评分和相似度算法得出用户未浏览的信息的推荐度，依据推荐度构成的最优推荐度列表为用户推荐信息，从而保证能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

基于上述本发明实施例提供的信息推荐方法，本发明实施例还对应一种信息推荐系统的结构示意图，如图7所示，所述系统包括：

融合单元100，用于获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志，所述最新行为日志包括N个未被读取的用户最新浏览信息，所述短期行为日志包括M个已被读取的用户历史浏览信息，N为正整数，M为正整数。

喜爱评分单元200，用于基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分。

获取单元300，用于获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。

推荐度列表单元400，用于利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表。

推荐单元500，用于基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。

优选的，结合图7，参考图8，为本发明实施例提供的另一种信息推荐系统的结构示意图，所述喜爱评分单元200包括：

权重计算模块201，用于通过公式（1）计算所述融合用户行为日志中每一日志信息的权重。

喜爱评分确定模块202，用于将所述每一日志信息中，包含不同信息的单一日志信息的权重作为所述单一日志信息的喜爱评分，以及将所述每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到所述重复日志信息的喜爱评分。

优选的，结合图7，参考图9，为本发明实施例提供的另一种信息推荐系统的结构示意图，所述获取单元300包括：

获取模块301，用于获取所述用户历史行为日志。

计算模块302，用于利用预设相似度算法，计算所述用户历史行为日志中的每一日志信息之间的相似度，所述预设相似度算法至少包括物品内容属性的相似度算法、物品协同过滤的相似度算法和word2vec的相似度算法中的一种或多种组合。

构建模块303，用于获取利用所述预设相似度算法计算得到的所述每一日志信息之间的相似度，构成相似度列表。

比例模块304，用于基于所述相似度列表中包含的相似度，确定所述预设推荐比例。

优选的，结合图7，参考图10，为本发明实施例提供的另一种信息推荐系统的结构示意图，所述推荐度列表单元400包括：

相似度列表模块401，用于获取利用所述预设相似度算法计算得到的所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度，构成相似度列表。

推荐度列表模块402，用于基于类物品过滤算法，计算所述的融合用户行为日志中的每一日志信息喜爱评分和所述相似度列表，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，并基于所述推荐度构成所述推荐度列表。

优选的，结合图7，参考图11，为本发明实施例提供的另一种信息推荐系统的结构示意图，所述推荐单元500包括：

确定模块501，用于基于所述预设推荐比例，确定当前获取的所述推荐度列表中待推荐的信息的数量。

选取模块502，用于依据所述推荐度列表中待推荐的信息的数量，从所述推荐度列表中选出待推荐的信息。

推荐模块503，用于集合各个所述待推荐的信息，构建所述最优推荐度列表，并向所述用户推荐所述最优推荐度列表。

在本发明实施例中，通过基于预设推荐比例，确定当前获取的推荐度列表中待推荐的信息的数量，并依据推荐度列表中待推荐的信息的数量，从推荐度列表中选出待推荐的信息。最终，集合各个待推荐的信息，构建最优推荐度列表，并向用户推荐最优推荐度列表。基于本发明实施例，能从任一预设相似度算法对应得到的推荐度列表中，选出待推荐的信息，由所述待推荐的信息构成的最优推荐度列表，能保证用户对最优推荐度列表中的任一信息都有极大兴趣。

优选的，结合图7，参考图12，为本发明实施例提供的另一种信息推荐系统的结构示意图，所述系统还包括：

滤除单元600，用于滤除所述最优推荐度列表中的不符合浏览要求的信息。

综上所述，在本发明实施例提供的信息推荐方法及系统中，通过获取并融合用户的最新行为日志和短期行为日志，得到融合用户行为日志。基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分。获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例。利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表。基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐。此外，能够滤除最优推荐度列表中部分不符合浏览要求的信息。基于本发明实施例，通过用户的行为日志，实时更新用户的对不同日志信息的喜爱评分，基于用户喜爱评分和相似度算法得出用户未浏览的信息的推荐度，依据推荐度构成的最优推荐度列表为用户推荐信息，从而保证能够根据用户兴趣偏好的实时变化向用户推荐合理的信息，提高推荐满意度和用户体验。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这个实现不应认为超出本发明的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多个修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种信息推荐方法，其特征在于，适用于分布式实时大数据处理系统，所述方法包括：

获取并融合用户的最新行为日志和短期行为日志，将所述最新行为日志和所述短期行为日志中的每一记录信息，按照记录时间由后至先的顺序排序，得到融合用户行为日志，所述最新行为日志中所记录的信息包括N个未被所述分布式实时大数据处理系统读取的用户最新浏览信息，所述短期行为日志中的所记录的信息包括M个已被所述分布式实时大数据处理系统读取的用户短期历史浏览信息，N为正整数，M为正整数；

利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表；

基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐；

其中，所述基于所述融合用户行为日志，计算用户对所述融合用户行为日志中每一日志信息的喜爱评分，包括：

将所述每一日志信息中，包含不同信息的单一日志信息的权重作为所述单一日志信息的喜爱评分，以及将所述每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到所述重复日志信息的喜爱评分；

其中，所述利用所述喜爱评分和所述相似度列表进行类物品过滤计算，得到所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的推荐度，基于所述推荐度构成推荐度列表，包括：

将所述喜爱评分和所述相似度列表中包含的各个相似度进行对应的相乘，将每一所述用户未浏览的日志信息对应的各个乘积进行相加，得到每一个所述用户未浏览的日志信息对应的推荐度，并基于所述推荐度构成所述推荐度列表。

2.根据权利要求1所述的方法，其特征在于，所述获取基于用户历史行为日志进行离线的相似度计算，得到由所述用户历史行为日志中每一日志信息之间的相似度构成的相似度列表，以及预设推荐比例，包括：

获取所述用户历史行为日志；

3.根据权利要求1所述的方法，其特征在于，所述基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐，包括：

4.根据权利要求1所述的方法，其特征在于，还包括：

滤除所述最优推荐度列表中的不符合浏览要求的信息。

5.一种信息推荐系统，其特征在于，适用于分布式实时大数据处理系统，包括：

融合单元，用于获取并融合用户的最新行为日志和短期行为日志，将所述最新行为日志和所述短期行为日志中的每一记录信息，按照记录时间由后至先的顺序排序，得到融合用户行为日志，所述最新行为日志中所记录的信息包括N个未被所述分布式实时大数据处理系统读取的用户最新浏览信息，所述短期行为日志中所记录的信息包括M个已被所述分布式实时大数据处理系统读取的用户短期历史浏览信息，N为正整数，M为正整数；

推荐单元，用于基于所述预设推荐比例，选取所述推荐度列表中待推荐的信息，确定最优推荐度列表并推荐；

其中，所述喜爱评分单元包括：

权重计算模块，用于通过计算所述融合用户行为日志中每一日志信息的权重，S指任一日志信息对应的排序位置，S为正整数；

喜爱评分确定模块，用于将所述每一日志信息中，包含不同信息的单一日志信息的权重作为所述单一日志信息的喜爱评分，以及将所述每一日志信息中，包含相同信息的重复日志信息的权重进行合并，得到所述重复日志信息的喜爱评分；

其中，所述推荐度列表单元包括：

相似度列表模块，用于获取利用所述预设相似度算法计算得到的所述用户历史行为日志中所述用户未浏览的日志信息与所述融合用户行为日志中的每一日志信息之间的相似度，构成相似度列表；

推荐度列表模块，用于将所述喜爱评分和所述相似度列表中包含的各个相似度进行对应的相乘，将每一所述用户未浏览的日志信息对应的各个乘积进行相加，得到每一个所述用户未浏览的日志信息对应的推荐度，并基于所述推荐度构成所述推荐度列表。

6.根据权利要求5所述的系统，其特征在于，所述获取单元包括：

获取模块，用于获取所述用户历史行为日志；

7.根据权利要求5所述的系统，其特征在于，所述推荐单元包括：

8.根据权利要求5所述的系统，其特征在于，还包括：