CN108153791B

CN108153791B - 一种资源推荐方法和相关装置

Info

Publication number: CN108153791B
Application number: CN201611110259.7A
Authority: CN
Inventors: 张祥; 安伟亭; 魏虎
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2016-12-02
Filing date: 2016-12-02
Publication date: 2023-04-25
Anticipated expiration: 2036-12-02
Also published as: CN108153791A

Abstract

本发明实施例公开了一种资源推荐方法和相关装置，资源推荐系统在向目标用户推荐资源例如资讯前，可以根据用于标识类目在所属行业中重要程度的热度值，以及目标用户在类目中资源的历史关联参数计算出相对于该目标用户，各个类目的偏好得分，并依据偏好得分的高低确定出该目标用户具有偏好的类目。资源推荐系统还可以进一步确定待推荐资源与类目之间的关联关系，从而可以在向目标用户推荐资源时，可以选择与目标用户的偏好类目具有关联关系的待推荐资源推荐给目标用户，由于推荐给目标用户的资源与偏好类目相关，被目标用户接受的几率将会比较大，从而提高了资源推荐的效率。

Description

一种资源推荐方法和相关装置

技术领域

本发明涉及数据处理领域，特别是涉及一种资源推荐方法和相关装置。

背景技术

随着互联网的普及，越来越多的事情可以通过互联网实现，例如通过应用APP来浏览互联网上的资源，如新闻、资讯等。

在用户通过互联网浏览资源的过程中，如果可以有针对性的向用户展示资源，例如将可能是用户感兴趣的、符合用户需求的资源优先推荐给用户的话，用户可以第一时间浏览到自己感兴趣的资源，从而提高用户浏览资源的用户体验。

然而，目前并没有有效的资源推荐方式。

发明内容

为了解决上述技术问题，本发明提供了一种资源推荐方法和相关装置，推荐给目标用户的资源与偏好类目相关，被目标用户接受的几率将会比较大，从而提高了资源推荐的效率。

本发明实施例公开了如下技术方案：

第一方面，本发明提供了一种资源推荐方法，所述方法包括：

资源推荐系统根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，一个类目的热度值用于标识在这个类目所属行业中这个类目的重要程度；

所述资源推荐系统将偏好得分超出第一阈值的类目确定为所述目标用户的偏好类目；

所述资源推荐系统根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，所述资源包括资讯。

可选的，第一类目为所述各个类目中的任意一个类目，所述资源推荐系统根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，包括：

所述资源推荐系统获取第一类目的热度值，所述第一类目的热度值用于标识在所述第一类目所属行业中所述第一类目的重要程度；

所述资源推荐系统根据所述第一类目的热度值和目标用户与所述第一类目所属行业中资源的历史关联参数，计算出所述目标用户对所述第一类目的期望关联参数；

所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分。

可选的，所述资源推荐系统获取第一类目的热度值，包括：

所述资源推荐系统获取用户与所述第一类目中资源的历史关联参数；

所述资源推荐系统根据用户与所述第一类目中资源的历史关联参数，以及用户与所述第一类目所属行业中资源的历史关联参数确定出所述第一类目的热度值。

可选的，所述资源推荐系统将所述目标用户对所述第一类目中资源的历史选取次数作为所述目标用户与所述第一类目中资源的历史关联参数；或者，

所述资源推荐系统根据当前时刻和所述目标用户对所述第一类目中资源的历史选取的发生时刻之间的差值计算出所述目标用户与所述第一类目中资源的历史关联参数。

可选的，所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分，包括：

所述资源推荐系统获取不同时段下的所述目标用户对所述第一类目的期望关联参数；

所述资源推荐系统根据所述不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数和标准差；

所述资源推荐系统根据所述平均参数和标准差计算出所述目标用户针对所述第一类目的历史行为因子，所述历史行为因子用于标识所述目标用户针对所述第一类目的历史行为影响程度；

所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数、对所述第一类目的期望关联参数和所述历史行为因子确定出所述目标用户对所述第一类目的偏好得分。

可选的，在所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分之前，还包括：

所述资源推荐系统根据不同时段下所述目标用户与所述第一类目中资源的历史关联参数，以及不同时段下所述目标用户对所述第一类目的期望关联参数建立模型；

根据所述模型得到所述目标用户针对所述第一类目规范化的期望满足度；

若所述期望满足度小于等于第二阈值，将所述第一类目确定为所述目标用户不具有偏好的类目。

可选的，第一资源为所述资源中的任意一个资源，所述资源推荐系统根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，包括：

所述资源推荐系统根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，所述目标用户所具有特征包括所述偏好类目；

所述资源推荐系统根据所述目标用户所具有特征、所述第一资源所具有特征以及所述目标用户与第一资源的交叉特征确定出所述第一资源相对于所述目标用户的排序得分；

若所述第一资源相对于所述目标用户的排序得分满足预设条件，所述资源推荐系统将所述第一资源确定为所述待推荐资源。

可选的，所述资源推荐系统根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，包括：

所述资源推荐系统获取根据所述第一资源所具有特征划分的第一组集合，以及获取根据所述目标用户所具有特征划分的第二组集合，同一个特征组中的特征具有相同的属性，所述第一组集合中包括多个特征组，所述第二组集合中包括多个特征组；

所述资源推荐系统将根据所述第一组集合和第二组集合之间的组交叉关系，确定出多个交叉组，所述多个交叉组中任意一个交叉组包括一个第一组集合中的特征组和一个第二交叉组中的一个特征组；

所述资源推荐系统根据交叉组中携带的特征生成交叉特征；

所述资源推荐系统根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征；

所述资源推荐系统将计算得到的统计特征作为所述目标用户与第一资源的交叉特征。

可选的，还包括：

若交叉特征的历史生成参数中，具有第一属性的交叉组和具有第二属性的交叉组之间确定出可作为交叉特征的数量低于第三阈值，所述资源推荐系统将具有第一属性的交叉组和具有第二属性的交叉组之间的组交叉关系删除；或者，

若交叉特征的历史生成参数中，具有第三属性的交叉组和具有第四属性的交叉组之间确定出可作为交叉特征中无意义特征的比例超出第四阈值，所述资源推荐系统将具有第三属性的交叉组和具有第四属性的交叉组之间的组交叉关系删除，其中，所述无意义特征为相对于资源推荐，不能用于计算待推荐资源的交叉特征。

可选的，第一交叉组为所述多个交叉组中的任意一个交叉组，所述资源推荐系统根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征，包括：

所述资源推荐系统根据资源推荐的需求，从所述第一交叉组中的交叉特征选取对应的统计参数；

所述资源推荐系统根据资源推荐的需求，利用所选取的统计参数计算得出所述第一交叉组对应的统计特征，所述第一交叉组对应的统计特征的数量小于所述第一交叉组中的交叉特征的数量。

第二方面，本发明提供了一种资源推荐装置，所述装置包括计算单元和确定单元：

所述计算单元，用于根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，一个类目的热度值用于标识在这个类目所属行业中这个类目的重要程度；

所述确定单元，用于将偏好得分超出第一阈值的类目确定为所述目标用户的偏好类目；

所述确定单元还用于根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，所述资源包括资讯。

可选的，第一类目为所述各个类目中的任意一个类目，所述计算单元还用于获取第一类目的热度值，所述第一类目的热度值用于标识在所述第一类目所属行业中所述第一类目的重要程度；根据所述第一类目的热度值和目标用户与所述第一类目所属行业中资源的历史关联参数，计算出所述目标用户对所述第一类目的期望关联参数；根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分。

可选的，所述计算单元还用于获取用户与所述第一类目中资源的历史关联参数；根据用户与所述第一类目中资源的历史关联参数，以及用户与所述第一类目所属行业中资源的历史关联参数确定出所述第一类目的热度值。

可选的，所述计算单元还用于将所述目标用户对所述第一类目中资源的历史选取次数作为所述目标用户与所述第一类目中资源的历史关联参数；或者，根据当前时刻和所述目标用户对所述第一类目中资源的历史选取的发生时刻之间的差值计算出所述目标用户与所述第一类目中资源的历史关联参数。

可选的，所述计算单元还用于获取不同时段下的所述目标用户对所述第一类目的期望关联参数；根据所述不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数和标准差；根据所述平均参数和标准差计算出所述目标用户针对所述第一类目的历史行为因子，所述历史行为因子用于标识所述目标用户针对所述第一类目的历史行为影响程度；根据所述目标用户与所述第一类目中资源的历史关联参数、对所述第一类目的期望关联参数和所述历史行为因子确定出所述目标用户对所述第一类目的偏好得分。

可选的，所述计算单元还用于根据不同时段下所述目标用户与所述第一类目中资源的历史关联参数，以及不同时段下所述目标用户对所述第一类目的期望关联参数建立模型；根据所述模型得到所述目标用户针对所述第一类目规范化的期望满足度；若所述期望满足度小于等于第二阈值，将所述第一类目确定为所述目标用户不具有偏好的类目。

可选的，第一资源为所述资源中的任意一个资源，所述确定单元还用于根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，所述目标用户所具有特征包括所述偏好类目；根据所述目标用户所具有特征、所述第一资源所具有特征以及所述目标用户与第一资源的交叉特征确定出所述第一资源相对于所述目标用户的排序得分；若所述第一资源相对于所述目标用户的排序得分满足预设条件，将所述第一资源确定为所述待推荐资源。

可选的，所述确定单元还用于获取根据所述第一资源所具有特征划分的第一组集合，以及获取根据所述目标用户所具有特征划分的第二组集合，同一个特征组中的特征具有相同的属性，所述第一组集合中包括多个特征组，所述第二组集合中包括多个特征组；将根据所述第一组集合和第二组集合之间的组交叉关系，确定出多个交叉组，所述多个交叉组中任意一个交叉组包括一个第一组集合中的特征组和一个第二交叉组中的一个特征组；根据交叉组中携带的特征生成交叉特征；根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征；将计算得到的统计特征作为所述目标用户与第一资源的交叉特征。

可选的，若交叉特征的历史生成参数中，具有第一属性的交叉组和具有第二属性的交叉组之间确定出可作为交叉特征的数量低于第三阈值，所述确定单元还用于将具有第一属性的交叉组和具有第二属性的交叉组之间的组交叉关系删除；或者，

若交叉特征的历史生成参数中，具有第三属性的交叉组和具有第四属性的交叉组之间确定出可作为交叉特征中无意义特征的比例超出第四阈值，所述确定单元还用于将具有第三属性的交叉组和具有第四属性的交叉组之间的组交叉关系删除，其中，所述无意义特征为相对于资源推荐，不能用于计算待推荐资源的交叉特征。

可选的，第一交叉组为所述多个交叉组中的任意一个交叉组，所述确定单元还用于根据资源推荐的需求，从所述第一交叉组中的交叉特征选取对应的统计参数；根据资源推荐的需求，利用所选取的统计参数计算得出所述第一交叉组对应的统计特征，所述第一交叉组对应的统计特征的数量小于所述第一交叉组中的交叉特征的数量。

第三方面，本发明听过了一种推荐系统框架，所述推荐系统框架包括离线部分、近实时部分和在线部分：

所述离线部分用于负责用户Profile构建以及关联数据挖掘；

所述近实时部分用于包括新发布资讯的实时分析引擎，模型流式更新引擎；

所述实时部分用于基于通用的推荐管道，并结合离线、近实时模块的产出结果，完成整套的推荐逻辑。

由上述技术方案可以看出，资源推荐系统在向目标用户推荐资源例如资讯前，可以根据用于标识类目在所属行业中重要程度的热度值，以及目标用户在类目中资源的历史关联参数计算出相对于该目标用户，各个类目的偏好得分，并依据偏好得分的高低确定出该目标用户具有偏好的类目。资源推荐系统还可以进一步确定待推荐资源与类目之间的关联关系，从而可以在向目标用户推荐资源时，可以选择与目标用户的偏好类目具有关联关系的待推荐资源推荐给目标用户，由于推荐给目标用户的资源与偏好类目相关，被目标用户接受的几率将会比较大，从而提高了资源推荐的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种资源推荐方法的方法流程图；

图2为本发明实施例提供的一种偏好得分的计算方法的方法流程图；

图3为本发明实施例提供的一种偏好得分的计算方法的方法流程图；

图4为本发明实施例提供的一种待推荐资源的确定方法的方法流程图；

图5为本发明实施例提供的一种生成交叉特征方法的方法流程图；

图6为本发明实施例提供的一种依据应用场景的特点，动态调整后的组交叉关系示意图；

图7为本发明实施例提供的千牛头条双11和热门频道展示示意图；

图8为本发明实施例提供的千牛头条推荐系统总体框架示意图；

图9为本发明实施例提供的算法核心指标-UV点击率的变化示意图；

图10为本发明实施例提供的一种资源推荐装置的装置结构图。

具体实施方式

下面结合附图，对本发明的实施例进行描述。

随着互联网的普及，越来越多的事情可以通过互联网实现，例如，用户可以从互联网平台获取的资源，如产品、服务等，也可以通过APP来浏览互联网上的资源，如新闻、资讯等。

在用户通过互联网浏览、获取资源的过程中，如果可以有针对性的向用户展示资源，例如将可能是用户感兴趣的、符合用户需求的资源优先推荐给用户的话，可以一定程度上提高用户获取被推荐资源的可能，从而缩短了用户从海量资源中寻找资源所消耗的时间。或者，用户还可以第一时间浏览到自己感兴趣的资源，从而提高用户浏览资源的用户体验。

可见，能够体现用户兴趣或需求的用户偏好对于资源推荐来说，是一个非常重要的特征。若能够准确的确定出一个用户的偏好，那么就可以针对用户偏好有针对性的向这个用户推荐符合该用户偏好的资源。

然而，目前并没有有效的确定出用户偏好的方式。传统的个性化系统中，可以为每个用户构建对应的用户参数(Profile)，用户Profile中可以包含基础的人口统计学信息以及用户偏好信息(如所偏好的类目)。人口统计学信息可以较方便地从注册信息中获取，传统方式中，确定用户偏好可以基于用户的历史行为计算得到。从而可以确定出用户近期对资源的历史关联参数，其中可以包括用户对资源的浏览次数，点击次数等。根据该用户的这些历史关联参数的统计，可以将浏览次数、点击次数较多的类目作为该用户具有偏好的类目。

传统计算用户偏好的方式首先多位人工统计，及其依赖用户经验。其次，在计算时并没有考虑到类目自身的流行程度，不同类目之间的流行度差别很大，若无视这一明显特点，将所有类目的流行程度都视作相同，那么仅根据用户点击次数得到的用户偏好的准确性显然是不高的，甚至是错误的。例如，一个年轻女性用户一个月浏览美妆类目的次数为100，浏览园艺类目的次数为30，单从次数来看，可以推测该用户更喜欢美妆类目。然而美妆是一个热门类目，平均而言每个用户每个月浏览次数为200；而园艺是一个冷门类目，平均浏览次数只有5。从这个角度来看，该用户实际上应该更偏好园艺类目。

由于传统方式确定出的用户偏好难以保证准确性，故此，本发明实施例提供了一种资源推荐方法和相关装置，资源推荐系统在向目标用户推荐资源例如资讯前，可以根据用于标识类目在所属行业中重要程度的热度值，以及目标用户在类目中资源的历史关联参数计算出相对于该目标用户，各个类目的偏好得分，并依据偏好得分的高低确定出该目标用户具有偏好的类目。资源推荐系统还可以进一步确定待推荐资源与类目之间的关联关系，从而可以在向目标用户推荐资源时，可以选择与目标用户的偏好类目具有关联关系的待推荐资源推荐给目标用户，由于推荐给目标用户的资源与偏好类目相关，被目标用户接受的几率将会比较大，从而提高了资源推荐的效率。

在本发明实施例中，在计算用户的偏好类目时，除了考虑该用户对类目的历史关联参数，还需要考虑到类目的热度值，即考虑到类目在所属行业中的重要程度，从而提高了计算用户偏好类目的准确性。

本发明实施例中所提出的资源主要是指互联网中所提供的资源，该资源可以包括实体资源，也可以包括虚拟资源。实体资源可以是具有实体结构的物品，例如家电用品、衣物、化妆品等。虚拟资源可以是虚拟化的产品，例如游戏中的虚拟物品、游戏币、电子代金券等，虚拟资源还可以是一种服务性或管理性的资源，例如保洁人员所提供的上门清扫服务、网络店铺的管理服务，或者是新闻、咨询等。与资源相关的特征还有类目，由于互联网上所提供的资源很多，为了方便用户浏览到或者搜索到所需的资源，节省用户时间，可以对互联网上所提供的资源进行分类，将具有相同属性的资源归为一个类目。类目可以理解为是对可以归为一类资源的总称，这一类目下的资源均具有至少一个相同的属性。例如“鞋子”可以作为一个类目，其中可以包括具有“鞋子”这一属性的各个资源，如运动鞋、休闲鞋、凉鞋、帆布鞋或者更为详细的各个品牌尺码的具体资源等。例如“帆布鞋”也可以作为一个类目，其中可以包括具有“帆布鞋”这一属性的各个资源，如a品牌帆布鞋、b品牌帆布鞋、加绒帆布鞋、高帮帆布鞋等具体资源。针对资源为资讯的场景，类目可以通过资讯所表达的主旨、资讯类型等进行划分，例如“电商”可以是一个类目，表达主旨与电商相关的资讯都可以属于这一类目。而行业可以是包括多个类目的领域，例如“军事”、“体育”等都可以算作行业，行业“军事”下可以包括“国外军事”、“国内军事”等类目，行业“体育”可以包括“足球”、“篮球”等类目。在不同的划分粒度下，“足球”也可以作为行业，所包括的类目可以有“英超”、“中超”等，或者，也可以将“互联网”作为行业，所包括的类目可以有“体育”、“军事”等。如何划分类目、行业本发明并不限定，可以根据不同的场景需求采用不同的划分粒度或精度。

图1为本发明实施例提供的一种资源推荐方法的方法流程图，所述方法包括：

S101：资源推荐系统根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，一个类目的热度值用于标识在这个类目所属行业中这个类目的重要程度。

举例说明，一个类目的热度值可以体现出一个类目的重要程度，尤其是所属行业内，相对于该行业其他类目的重要程度。以行业“服装”为例，若该行业包括了三个类目“男装”、“女装”和“童装”，若“男装”的热度值为0.3，“女装”的热度值为0.5，“童装”的热度值为0.2，则可以通过热度值确定出类目“女装”在所属行业“服装”中最为重要。类目的热度值可以通过用户对类目中资源的历史关联参数确定得出，对资源的历史关联参数可以包括用户需要与资源产生关联的操作例如对资源的浏览、点选、购买、收藏等所产生的参数。

由于热度值可以客观的体现一个类目在所属行业中的重要程度，而用户对类目中资源的历史关联参数可以一定程度上体现用户对类目的关注程度，故结合这两者确定出的偏好参数可以既考虑到类目本身的特点，也考虑到用户的需求，从而提高了偏好得分的准确性和全面性。需要注意的是，同一个类目，针对不同用户可以计算出不同的偏好得分。之后会在图2对应的实施例中详细说明如何通过热度值和历史关联参数计算偏好得分。

针对类目热度值、历史关联参数、偏好得分等所需进行的计算和数据的收集，资源推荐系统可以通过离线部分来实现。这里的资源推荐系统可以是针对商家的千牛头条资讯推荐系统，也可以是针对买家的天猫商城等。而目标用户可以是使用资源推荐系统的用户，例如使用千牛头条资讯推荐系统的一名商家，或者使用天猫商城的一名买家。

S102：所述资源推荐系统将偏好得分超出第一阈值的类目确定为所述目标用户的偏好类目。

举例说明，通过S101的计算，可以得到针对目标用户的不同类目的偏好得分，每一个类目都可以得到一个偏好得分。例如资源推荐系统中划分有3个类目，计算与目标用户的偏好得分，分别是类目a针对目标用户的偏好得分A，类目b针对目标用户的偏好得分B，类目c针对目标用户的偏好得分C。

一个类目针对目标用户的偏好得分越高，体现出这个类目越符合目标用户的需求、喜好。故可以通过第一阈值对各个类目针对目标用户的偏好得分进行筛选，从中确定出偏好得分较高的类目可以确定为目标用户的偏好类目。第一阈值的具体数值可以根据具体场景进行设置。

S103：所述资源推荐系统根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源。

举例说明，这里所述的待推荐资源可以包括资讯。对于资讯类的待推荐资源，通过对文字内容的处理，以及资讯特征和目标用户特征(其中包括偏好类目)之间的交叉，由于偏好类目较为准确的体现了目标用户的需求和喜好，故最终确定出的需要向所述目标用户推荐的待推荐资源和目标用户需求、喜好的相关性更高，目标用户愿意浏览、查看被推荐资源的可能性越大。

可见，资源推荐系统在向目标用户推荐资源例如资讯前，可以根据用于标识类目在所属行业中重要程度的热度值，以及目标用户在类目中资源的历史关联参数计算出相对于该目标用户，各个类目的偏好得分，并依据偏好得分的高低确定出该目标用户具有偏好的类目。资源推荐系统还可以进一步确定待推荐资源与类目之间的关联关系，从而可以在向目标用户推荐资源时，可以选择与目标用户的偏好类目具有关联关系的待推荐资源推荐给目标用户，由于推荐给目标用户的资源与偏好类目相关，被目标用户接受的几率将会比较大，从而提高了资源推荐的效率。

接下来将详细介绍本发明实施例提出的计算资源针对目标用户的偏好得分的方式。为了说明清楚，接下来将以第一类目，即资源推荐系统中任意一个类目为例进行说明，针对其他类目的计算方式可以参见第一类目。图2为本发明实施例提供的一种偏好得分的计算方法的方法流程图。在图2中，第一类目中资源可以是资讯，也可以是资源的其他可能，例如商品等。

S201：所述资源推荐系统获取第一类目的热度值，所述第一类目的热度值用于标识在所述第一类目所属行业中所述第一类目的重要程度。

举例说明，第一类目在所属行业中的重要程度可以通过用户与第一类目中资源的历史关联参数来体现。一般情况下，一个类目的热度值同时只有一个，但是，类目的热度值可以随着用户的关注改变而发生变化，由于用户的需求和兴趣可能随时时间的推移发生变化，故在选取用户的历史关联参数时，可以更多的考虑更能够体现用户的需求的近期历史关联参数，例如一周内，一天内的历史关联参数等，这个近期具体是多少可以根据具体场景需求来定。而较早的针对一个类目的历史关联参数对判断这个类目的热度值影响较小，可以不考虑，或者，在考虑时配置较小的权重。

本发明实施例提供了一种具体的使用用户与第一类目中资源的历史关联参数来计算第一类目热度值的方式，所述资源推荐系统获取用户与所述第一类目中资源的历史关联参数。所述资源推荐系统根据用户与所述第一类目中资源的历史关联参数，以及用户与所述第一类目所属行业中资源的历史关联参数确定出所述第一类目的热度值(w_j)。

这里所述的用户可以是指资源推荐系统所服务的所有用户，也可以是指具有特定特征的一类用户，例如男性用户或女性用户。而本发明中的目标用户可以是这里所述的用户中的任意一个用户。

针对第一类目的热度值的具体计算方式可以如下式所示：

其中，i用于标识用户；j用于标识第一类目；C用于标识第一类目所属的行业，行业C中可以有多个类目；X_ij用于标识用户i(如目标用户)对第一类目的历史关联参数。

使用哪些历史关联参数进行计算本发明并不限定，不过，本发明实施例提供了两种可选方式。

第一种，所述资源推荐系统将所述目标用户对所述第一类目中资源的历史选取次数作为所述目标用户与所述第一类目中资源的历史关联参数。

举例说明，这里的选取次数可以理解为用户点击第一类目中资源的次数，和/或查看第一类目中资源的次数。一般情况下用户多在感兴趣的情况下选取一个资源，故用户对第一类目中资源的选取次数直接体现了用户的需求。

或者，第二种，所述资源推荐系统根据当前时刻和所述目标用户对所述第一类目中资源的历史选取的发生时刻之间的差值计算出所述目标用户与所述第一类目中资源的历史关联参数。

举例说明，用户实施选取的时刻与当前时刻的差也可以体现用户的需求，例如针对第一类目中资源的大量的选取均实施在邻近当前时刻的时间，体现出近期用户对第一类目中资源的需求很高。

具体通过当前时刻和所述目标用户对所述第一类目中资源的历史选取的发生时刻之间的差值计算出所述目标用户与所述第一类目中资源的历史关联参数可以如下式所示：

其中，T_now为当前时刻，t为用户对第一类目中资源实施选取的时刻，T_half可以是预设的半衰期，例如T_half＝3小时，这样当实施选取的时刻与当前时刻之差达到半衰期时，X_ij恰好等于0.5。

S202：所述资源推荐系统根据所述第一类目的热度值和目标用户与所述第一类目所属行业中资源的历史关联参数，计算出所述目标用户对所述第一类目的期望关联参数。

举例说明，目标用户对所述第一类目的期望关联参数可以理解为对用户对所述第一类目中资源的历史关联参数的平均值。

本发明实施例提供了具体计算目标用户对所述第一类目的期望关联参数(E_ij)的方式，可以如下式所示：

E_ij＝w_j∑_j∈CX_ij

可见，以E_ij，即整体用户对所述第一类目中资源的历史关联参数的平均值作为目标用户对所述第一类目的期望关联参数，从而考虑到了用户自身的行为习惯。由于用户中具有活跃用户和初级用户，活跃用户相比初级用户对资源的关联次数要多出一个数据级，因此，单纯依赖用户对资源的关联次数难以准确计算用户偏好。

S203：所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分。

举例说明，将整体用户对所述第一类目中资源的历史关联参数的平均值作为目标用户对所述第一类目的期望关联参数，而X_ij可以是目标用户自身对第一类目中资源的历史关联参数，通过两者的比较，若X_ij偏大，则反映目标用户对第一类目的需求相对于用户的平均需求要高，反之若X_ij偏小，则相对于用户的平均需求要低。本发明实施例提供了一种具体计算目标用户对所述第一类目的偏好得分(S_ij)的方式，可以如下式所示：

可见，当S_ij大于1时，反映目标用户对第一类目的需求相对于用户的平均需求要高，从而体现出目标用户对第一类目具有一定的偏好，当S_ij小于等于1时，反映目标用户对第一类目的需求相对于用户的平均需求相同或较低，从而体现出目标用户对第一类目不具有偏好。为了让偏好得分更为平滑，还可以对S_ij进行求log的运算。

需要注意的是，当目标用户对第一类目的历史关联次数较少时，会导致数据样本较少或者数据稀疏，这种情况计算出的偏好得分准确性有待商榷，当数据样本较多时才具备统计意义。针对这种情况，本发明实施例提供了一种解决数据稀疏的方式。图3为本发明实施例提供的一种偏好得分的计算方法的方法流程图，所述方法包括：

S301：所述资源推荐系统获取不同时段下的所述目标用户对所述第一类目的期望关联参数。

举例说明，通过增加所选取的历史关联参数的时段，可以通过重复S201至S202获取多个E_ij。

S302：所述资源推荐系统根据所述不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数和标准差。

举例说明，多个E_ij的平均参数相当于对多个E_ij求出的平均值，而多个E_ij的标准差相当于每一个E_ij与平均参数之差的平均值，可以体现出多个E_ij的数据波动情况。

S303：所述资源推荐系统根据所述平均参数和标准差计算出所述目标用户针对所述第一类目的历史行为因子，所述历史行为因子用于标识所述目标用户针对所述第一类目的历史行为影响程度。

S304：所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数、对所述第一类目的期望关联参数和所述历史行为因子确定出所述目标用户对所述第一类目的偏好得分。

举例说明，历史行为因子是通过平均参数和标准差计算出的，故体现出的也是E_ij对第一类目的影响。故可以将历史行为因子增加到计算偏好得分中，不仅对偏好得分的准确性影响较小，还可以解决一些情况下数据稀疏的问题。

本发明实施例提供了一种具体计算目标用户针对所述第一类目的历史行为因子(θ(E_ij))的方式，可以如下式所示：

其中，μ为不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数，σ为不同时段下所述目标用户对所述第一类目的期望关联参数的标准差，K为平滑项，可以取值为1，用于防止分母部分出现0导致计算出错的可能。

相应的，针对加入历史行为因子的偏好得分的具体计算方式可以如下式所示：

在所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分之前，还包括：

若所述期望满足度小于等于第二阈值，将所述第一类目确定为所述目标用户不具有偏好的类目。其中，X_ij需要符合泊松分布X_ij～Poisson(λ_ij)，S_ij需要符合伽马分布S_ij～Gamma(E_ij+θ(E_ij),E_ij+θ(E_ij))；

期望满足度(γ_ij)可以为：

交叉特征属于根据原始特征构建出的新特征，交叉特征在一些场景中例如在资源推荐时会起到关键指导作用。接下来，将以第一资源，即所述资源中的任意一个资源为例，详细说明如何将交叉特征应用于判断第一资源是否为可用于推荐的资源的。图4为本发明实施例提供的一种待推荐资源的确定方法的方法流程图，包括：

S401：所述资源推荐系统根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，所述目标用户所具有特征包括所述偏好类目。

举例说明，在向目标用户推荐资源的过程中，需要判断一个资源是否符合目标用户的喜好、需求，若能够将符合目标用户的喜好、需求的资源推荐给目标用户，才能有效提高目标用户点击、查看被推荐资源的可能性，从而提高资源推荐效率。故在从海量资源中确定出哪些是符合目标用户喜好、需求的资源时，需要参考目标用户所具有的特征例如偏好类目，还需要参考到每一个资源所具有的特征。

一个资源所具有的特征通常用于标识这个资源本身所具有的特点或携带的信息，以资源为一条资讯为例，该资讯所表达的主题、收藏量、浏览数等都可以作为该资讯所具有的特征，以资源为一件衣服为例，该衣服的质地、品牌、价格等都可以作为该衣服所具有的特征。

资源的特征可以通过预先处理或实时分析得出，以资讯为例，对新发布的资讯可以进行实时文本分析，例如包括分词、关键词抽取。可以对抽取的分词、关键词通过行业profile和Multi-task语义向量生成行业标签，根据每条资讯的行业标签可以对资讯建立倒排索引，实现实时更新。在具体的实现技术上，可以集成使用Text Rank，MutualInformation,Log Odds Ratio等关键词抽取算法实现对资讯的关键词的精准抽取。Multi-task语义向量模型与传统的Word2Vector词向量模型不同，使用词的meta data数据，使得模型在给定上下文的情况下，同时学习词的分布和词meta信息分布。

针对不同的场景，还有不同的处理方式，例如千牛头条资讯推荐系统中具有的用户在百万量级，然而每天的新资讯相对较少，故每篇资讯能够累计较多的与用户相关的关联参数，为此可以采用PerArticle的模型计算方法，即针对每篇资讯单独训练一个在线贝叶斯逻辑回归(Online Bayesian Logistic Regression，BLR)模型，从而精细化地刻画每篇资讯。相比传统的伙计回归LR模型，BLR模型认为模型参数本身是有先验分布的，具有更优的泛化能力，上线后点击通过率(Click-Through-Rate，CTR)也有20％的提升。针对一条资讯，其在线贝叶斯逻辑回归学习算法可以参见如下步骤：

a)每一个参数有有一个独立的高斯先验；

b)得到一批数据；

c)优化目标函数；

d)拉普拉斯逼近(Laplace approximation)求解目标函数，得到模型的均值，方差。

目标用户与第一资源的一个交叉特征可以由一个目标用户所具有特征和一个第一资源所具有特征组合生成，由此得到的交叉特征可以更准确的体现出目标用户与第一资源之间的关联关系。

S402：所述资源推荐系统根据所述目标用户所具有特征、所述第一资源所具有特征以及所述目标用户与第一资源的交叉特征确定出所述第一资源相对于所述目标用户的排序得分。

由于通过S401确定出更能够体现目标用户与第一资源之间关联关系的交叉特征，故确定出的第一资源相对于所述目标用户的排序得分可以更准确的体现出第一资源与目标用户的关联程度。

S403：若所述第一资源相对于所述目标用户的排序得分满足预设条件，所述资源推荐系统将所述第一资源确定为所述待推荐资源。

可见，得到的交叉特征可以更准确的体现出目标用户与第一资源之间的关联关系，将其应用于资源推荐中，可以提高将与目标用户更具有关联关系的资源推荐给目标用户的可能性，从而有效的提高资源推荐准确性。

然而，传统的特征交叉方式多采用

笛卡尔积方法，以将用户a与商品b之间的特征进行交叉为例，该方法将用户a的所有基础特征作为集合X，商品b的所有基础特征作为集合Y，对两个集合X,Y执行笛卡尔积运算得到X×Y，将X×Y中的每一个元素作为一个新的特征，即交叉特征。由于笛卡尔积方法采用的是特征之间的全交叉方式，若集合X中具有x个特征，集合Y中有y个特征，通过交叉将得到x×y个交叉特征，可见，这种方法很容易导致特征爆炸，交叉后大量冗余的特征容易导致模型过拟合。为了解决上述问题，本发明实施例提供了一种生成交叉特征的方式，继续以第一资源为例进行介绍。图5为本发明实施例提供的一种生成交叉特征方法的方法流程图，所述方法包括如下步骤：

S501：所述资源推荐系统获取根据所述第一资源所具有特征划分的第一组集合，以及获取根据所述目标用户所具有特征划分的第二组集合，同一个特征组中的特征具有相同的属性，所述第一组集合中包括多个特征组，所述第二组集合中包括多个特征组。

举例说明，通过预先对特征进行分组，可以在通过统计特征作为交叉特征时以交叉组为单位进行，能够在保证交叉特征质量的前提下，有效减少交叉特征的数量。每一个特征组中可以包括至少一个特征，每个特征组所包括的特征数量可以不同。

对特征进行分组的依据可以利用特征本身所具有的属性，而特征所具有的属性可以基于特定的应用场景和领域知识确定。例如可以将具有人口统计学属性的特征分为一组，将具有线上反馈属性的特征分为一组。利用何种属性进行分组本发明并不限定，可以根据具体场景需求选取属性进行分组，选取属性的数量或者分组的数量也可以根据具体场景需求进行调整。

通过附图进一步说明，图6为特征的分组交叉示意图，图6所示的是一个用户(目标用户)与一个商品(第一资源)之间特征的分组交叉，应用场景可以是资源推荐，即生成的交叉资源是用于资源推荐的。图6左侧展示的是用户特征的集合(例如可以相当于第一组集合)，基于特定的应用场景和领域知识可以将用户特征划分成三个特征组，分别用uf_group1,uf_group2,uf_group3来表示。

其中，uf_group1为具有用户的人口统计学属性的特征组，包含用户的性别、年龄、收入水平、人身阶段等特征。

uf_group2为具有用户偏好类属性的特征组，包括偏好的类目、价格段、品牌等特征。

uf_group3为具有用户的消费属性的特征组，包括用户所在的人群(如蓝领、白领、金领等)、消费类型(如价格敏感型、冲动型、习惯型等)等特征。

图6的右侧展示的为商品特征的集合(例如可以相当于第二组集合)，基于业务经验以及基于特定的应用场景和领域知识可以将其分为两个特征组，分别用if_group1,if_group2来表示。

其中，if_group1为具有商品自身的偏静态的属性的特征组，如包括价格、所在的类目、所属的品牌等特征。

if_group2为具有商品的线上反馈属性的特征组，如包括总销量、月销量、一周内被浏览的次数、收藏的次数等特征。

S502：所述资源推荐系统将根据所述第一组集合和第二组集合之间的组交叉关系，确定出多个交叉组，所述多个交叉组中任意一个交叉组包括一个第一组集合中的特征组和一个第二交叉组中的一个特征组。

举例说明，由于首先对从特征中划分出特征组的概念，故在进行特征交叉时，可以先根据组交叉关系确定出用于特征交叉的特征组。

这里所述的组交叉关系可以采取全交叉的形式确定，即用户侧的任意一个特征组与商品侧的每个特征组都建立组交叉关系。组交叉关系也可以根据对历史生成参数的分析进行动态调整，可以根据两个特征组交叉后得到的交叉特征的数量或质量来衡量是否需要保留这两个特征组之前的组交叉关系，从而可以减少不必要的计算量。

针对动态调整的方式，可以包括：

若交叉特征的历史生成参数中，具有第三属性的交叉组和具有第四属性的交叉组之间确定出可作为交叉特征中无意义特征的比例超出第四阈值，所述资源推荐系统将具有第三属性的交叉组和具有第四属性的交叉组之间的组交叉关系删除，其中，所述无意义特征可以为相对于场景需求，不能用于实现场景需求的交叉特征。或者具体的，所述无意义特征为相对于资源推荐，不能用于计算待推荐资源的交叉特征。

也就是说，若两个特征组确定出可以作为交叉特征的数量过少，导致投入的计算量与获得的交叉特征参数不成比例，在计算量较大或系统资源紧张的情况下，可以不对这两个特征组进行交叉特征的计算，以提高计算效率。或者，若应用场景需要通过交叉特征参与场景需求相关的计算，但是某一类交叉特征所标识的信息对实现场景需求的计算没有帮助，那么这类特征相对于当前场景来说是无意义的。例如针对资源推荐的场景，场景需求是希望通过计算确定出待推荐资源，但是有些交叉特征所标识的信息并不能用于计算待推荐资源，那么这对资源推荐的场景，这类交叉特征属于无意义特征。将计算量投入到计算无意义特征没有必要，故可以删除计算出无意义特征的两个特征组之间的组交叉关系。

组交叉关系可以与应用场景对应，也可以与参与计算的特征所对应主体相关，通过历史生成参数的动态调整，针对不同应用场景都可以有分别对应的组交叉关系，针对不同主体也可以由分别对应的组交叉关系，例如针对用户与商品，在一个应用场景下可以有对应的组交叉关系，针对用户与用户，在同一个应用场景下还可以有对应的另一种组交叉关系。

以图6为例，展示了一种依据应用场景的特点，动态调整后的组交叉关系。以图示中所使用的连接线定义了特征组间的组交叉关系，从而得到了如下4个交叉组，分别为：

(uf_group1,if_group1)，

(uf_group1,if_group2)

(uf_group2,if_group1)

(uf_group3,if_group2)

S503：所述资源推荐系统根据交叉组中携带的特征生成交叉特征。

在确定出交叉组后，针对每一个交叉组，可以将交叉组中两个特征组中的特征进行全交叉，得到多个交叉特征，在进行交叉时，一个特征组中的特征仅与另一个特征组中的特征进行交叉。

以图6中一个交叉分组(uf_group1,if_group1)为例，说明统计交叉特征的生成方法。

假设uf_group1包含性别、年龄两个特征，即uf_group1＝{gender,age},if_group1包含物品价格、类目两个特征，即if_group1＝{price,category}，通过交叉，我们可以得到以下4个交叉特征(entry)，分别为：

gender_price

gender_category

age_price

age_category

S504：所述资源推荐系统根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征。

S505：所述资源推荐系统将计算得到的统计特征作为所述目标用户与第一资源的交叉特征。

需要注意的是，将全交叉得到的每个交叉特征直接作为目标用户与第一资源的交叉特征的话，同样会存在一定的特征爆炸问题。为此，本发明实施例提出通过计算交叉特征的统计特征来解决特征爆炸的方案。

主要可以利用交叉特征所携带的统计参数作为计算统计特征的方式，这里所利用的统计参数可以具有统计学特征的参数，而且，这类统计参数还可以一定程度上体现携带这类统计参数的交叉特征所体现的实质，从而使得计算出的统计特征可以体现出交叉参数原本体现的信息。

这里计算出的统计特征需要符合计算资源推荐这一具体场景的需求，当然，当为其他的具体场景时，计算出的统计特征可以符合其他的具体场景的需求。

接下来以第一交叉组，即所述多个交叉组中的任意一个交叉组为例，说明在应用场景为资源推荐时，如何计算第一交叉组的统计特征。

所述资源推荐系统根据资源推荐的需求，从所述第一交叉组中的交叉特征选取对应的统计参数。也就是说，获取哪些统计参数与应用场景相关，不同的应用场景的需求可以不同，故所获取的统计参数也可以不同。

所述资源推荐系统根据资源推荐的需求，利用所选取的统计参数计算得出所述第一交叉组对应的统计特征，所述第一交叉组对应的统计特征的数量小于所述第一交叉组中的交叉特征的数量。计算哪些统计特征可以与应用场景的需求相关，不同的应用场景的需求可以不同，故所计算的统计特征也可以不同。例如符合资源推荐的需求的统计特征可以包括CTR或者点击转化率(Click Value Rate，CVR)等。

需要注意的是，需要计算多少个统计特征本发明并不限定，可以与场景需求来进行确定，只要符合计算出的统计特征的数量要比第一交叉组中通过S503得到的交叉特征要少即可，通过将统计特征作为目标用户与第一资源的交叉特征，最终确定出作为所述目标用户与第一资源的交叉特征的数量会相对减少，从而一定程度上解决了特征爆炸的问题，同时生成的统计类特征有较好的泛化性。

继续以S503中的例子说明。假设特征的取值uf_group1＝{gender:v1,age:v2},if_group1＝{price:w1,category:w2}，每个交叉特征在历史上被浏览和点击的次数分布用均值M和N表示。M,N可以以2*2的矩阵进行统计，M11表示gender_price这个交叉特征在历史上被浏览的次数，或者具体的，当gender为男性是，M11为男性浏览这个price的历史次数。N11表示gender_price这个交叉特征在历史一段时间内被点击的次数，或者具体的，当gender为男性是，M11为男性点击这个price的历史次数。

为了仅使用少量的特征来表示交叉组，我们可以计算各个交叉特征的统计特征，符合资源推荐需求的常见的统计特征例如可以包括均值(avg)，最小值(min)，最大值(max)，微平均(micro-sum)和宏平均(macro-sum)等，对于上述示例，下面给出各统计量的计算方法。

计算avg可以通过下式：

avg(v1*w1*N11/M11,v1*w2*N12/M12,v2*w1*N21/M21,v2*w2*N22/M22)

计算min可以通过下式：

min(v1*w1*N11/M11,v1*w2*N12/M12,v2*w1*N21/M21,v2*w2*N22/M22)

计算max可以通过下式：

max(v1*w1*N11/M11,v1*w2*N12/M12,v2*w1*N21/M21,v2*w2*N22/M22)

计算micro-sum-ctr可以通过下式：

(v1*w1*N11+v1*w2*N12+v2*w1*N21+v2*w2*N22)/

(v1*w1*M11+v1*w2*M12+v2*w1*M21+v2*w2*M22)

计算macro-sum-ctr可以通过下式：

(v1*w1*N11/M11+v1*w2*N12/M12+v2*w1*N21/M21+v2*w2*N22/M22)/(v1*w1+v1*w2+v2*w1+v2*w2)

接下来将以千牛头条这一定位于通过内容传播与运营，满足商家内容消费需求的商业媒体平台为例，进一步的说明本发明实施例所提供的技术方案如何应用于该平台。

千牛头条是一个定位于通过内容传播与运营，满足商家内容消费需求的商业媒体平台。为了满足商家获取实时、个性化资讯的需求，同时提高千牛平台的流量效率，为千牛头条上线了一套个性化的资讯推荐系统。如图7所示的千牛头条双11和热门频道展示示意图。目前个性化算法支持了热门feeds流、双11频道，后续会支持更多的频道和场景。

一种推荐系统框架，所述推荐系统框架包括离线部分、近实时部分和在线部分：

所述离线部分用于负责用户Profile构建以及关联数据挖掘；

推荐系统框架可以为千牛头条资讯推荐系统，其总体框架如图8所示，整个框架可分为离线、近实时、实时三部分。

离线部分主要负责用户Profile构建以及关联数据挖掘；近实时部分主要包括新发布资讯的实时分析引擎，模型流式更新引擎；实时部分基于通用的推荐pipeline，并结合离线、近实时模块的产出结果，完成整套的推荐逻辑。

在千牛头条中，主要有五个部分应用了本发明实施例所提供的技术方案。这五个部分的具体实现可以参见图8所示的千牛头条推荐系统的总体框架示意图。

1.基于期望偏好的用户profile

为了全方位地刻画用户兴趣，从关键词、类目、行业等维度对用户兴趣进行建模。在计算用户profile过程时引入期望偏好，期望偏好是根据用户个体行为分布和群体行为分布计算的用户预期行为分布，通过用户的期望偏好分布和实际偏好比较得到偏好分，最后用伽马泊松分布对偏好分进行平滑。

2.资讯实时分析引擎

3.在线贝叶斯逻辑回归(Online Bayesian Logistic Regression，BLR)模型

针对不同的场景，还有不同的处理方式，例如千牛头条资讯推荐系统中具有的用户在百万量级，然而每天的新资讯相对较少，故每篇资讯能够累计较多的与用户相关的关联参数，为此可以采用PerArticle的模型计算方法，即针对每篇资讯单独训练一个BLR模型，从而精细化地刻画每篇资讯。相比传统的伙计回归LR模型，BLR模型认为模型参数本身是有先验分布的，具有更优的泛化能力，上线后点击通过率(Click-Through-Rate，CTR)也有20％的提升。针对一条资讯，其在线贝叶斯逻辑回归学习算法可以参见如下步骤：

a)每一个参数有有一个独立的高斯先验；

b)得到一批数据；

c)优化目标函数；

4.高阶泛化统计类特征

模型使用的特征包含用户特征、资讯特征、用户与资讯的交叉特征等，其中用户与资讯的交叉特征是关键特征。传统的做法直接对用户特征和资讯特征进行交叉，这种方法很容易导致特征爆炸，交叉后大量冗余的特征容易导致模型过拟合；为了解决上述问题，采用了一种根据业务经验进行特征交叉，然后对交叉特征计算统计量的方法，该方法可以很好地解决特征组合爆炸问题，同时生成的统计类特征有较好的泛化性。

5.资讯冷启动

时效性在资讯推荐中至关重要，而新资讯由于缺乏线上反馈导致CF等基于行为的推荐算法失效。

从文章维度来看新文章没有用户行为，但是从新文章包含的关键词、主题等维度看，历史上有很多文章也都包含这些特征，因此可以根据新文章包含关键词、主题的历史表现推断新文章的表现。

千牛头条经历了两次大的算法升级，核心指标如点击率、资讯消耗量等都有了显著的提升，如图9所示。第一次升级增加了基于用户行为的个性化；第二次升级引入文本算法以及在线排序模型。头条平时资讯消耗日150万，11号当天内容消耗440万，突破400万大关，人均阅读数2.94。

图10为本发明实施例提供的一种资源推荐装置的装置结构图，所述装置包括计算单元1001和确定单元1002：

所述计算单元1001，用于根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，一个类目的热度值用于标识在这个类目所属行业中这个类目的重要程度；

所述确定单元1002，用于将偏好得分超出第一阈值的类目确定为所述目标用户的偏好类目；

所述确定单元1002还用于根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，所述资源包括资讯。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质可以是下述介质中的至少一种：只读存储器(英文：read-only memory，缩写：ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明的一种具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种资源推荐方法，其特征在于，所述方法包括：

所述资源推荐系统根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，所述资源包括资讯；

其中，目标用户对资源推荐系统中的第一类目的偏好得分按照以下方式计算：获取不同时段下的所述目标用户对所述第一类目的期望关联参数；确定所述不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数和标准差；根据所述平均参数和标准差计算出所述目标用户针对所述第一类目的历史行为因子，所述历史行为因子用于标识所述目标用户针对所述第一类目的历史行为影响程度；根据所述目标用户与所述第一类目中资源的历史关联参数、对所述第一类目的期望关联参数和所述历史行为因子确定出所述目标用户对所述第一类目的偏好得分；所述历史关联参数包括用户需要与资源产生关联的操作所产生的参数。

2.根据权利要求1所述的方法，其特征在于，第一类目为所述各个类目中的任意一个类目，所述资源推荐系统根据各个类目的热度值、目标用户与各个类目中资源的历史关联参数计算出所述目标用户对各个类目的偏好得分，包括：

3.根据权利要求2所述的方法，其特征在于，所述资源推荐系统获取第一类目的热度值，包括：

4.根据权利要求2所述的方法，其特征在于，所述资源推荐系统将所述目标用户对所述第一类目中资源的历史选取次数作为所述目标用户与所述第一类目中资源的历史关联参数；或者，

5.根据权利要求2至4任意一项所述的方法，其特征在于，在所述资源推荐系统根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分之前，还包括：

6.根据权利要求1所述的方法，其特征在于，第一资源为所述资源中的任意一个资源，所述资源推荐系统根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，包括：

7.根据权利要求6所述的方法，其特征在于，所述资源推荐系统根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，包括：

所述资源推荐系统根据交叉组中携带的特征生成交叉特征；

8.根据权利要求7所述的方法，其特征在于，还包括：

9.根据权利要求7所述的方法，其特征在于，第一交叉组为所述多个交叉组中的任意一个交叉组，所述资源推荐系统根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征，包括：

10.一种资源推荐装置，其特征在于，所述装置包括计算单元和确定单元：

所述确定单元还用于根据所述偏好类目和资源的特征，从资源中确定出需要向所述目标用户推荐的待推荐资源，所述资源包括资讯；

所述计算单元还用于获取不同时段下的所述目标用户对第一类目的期望关联参数；根据所述不同时段下所述目标用户对所述第一类目的期望关联参数的平均参数和标准差；根据所述平均参数和标准差计算出所述目标用户针对所述第一类目的历史行为因子，所述历史行为因子用于标识所述目标用户针对所述第一类目的历史行为影响程度；根据所述目标用户与所述第一类目中资源的历史关联参数、对所述第一类目的期望关联参数和所述历史行为因子确定出所述目标用户对所述第一类目的偏好得分；所述历史关联参数包括用户需要与资源产生关联的操作所产生的参数。

11.根据权利要求10所述的装置，其特征在于，第一类目为所述各个类目中的任意一个类目，所述计算单元还用于获取第一类目的热度值，所述第一类目的热度值用于标识在所述第一类目所属行业中所述第一类目的重要程度；根据所述第一类目的热度值和目标用户与所述第一类目所属行业中资源的历史关联参数，计算出所述目标用户对所述第一类目的期望关联参数；根据所述目标用户与所述第一类目中资源的历史关联参数，以及对所述第一类目的期望关联参数确定出所述目标用户对所述第一类目的偏好得分。

12.根据权利要求11所述的装置，其特征在于，所述计算单元还用于获取用户与所述第一类目中资源的历史关联参数；根据用户与所述第一类目中资源的历史关联参数，以及用户与所述第一类目所属行业中资源的历史关联参数确定出所述第一类目的热度值。

13.根据权利要求11所述的装置，其特征在于，所述计算单元还用于将所述目标用户对所述第一类目中资源的历史选取次数作为所述目标用户与所述第一类目中资源的历史关联参数；或者，根据当前时刻和所述目标用户对所述第一类目中资源的历史选取的发生时刻之间的差值计算出所述目标用户与所述第一类目中资源的历史关联参数。

14.根据权利要求11至13任意一项所述的装置，其特征在于，所述计算单元还用于根据不同时段下所述目标用户与所述第一类目中资源的历史关联参数，以及不同时段下所述目标用户对所述第一类目的期望关联参数建立模型；根据所述模型得到所述目标用户针对所述第一类目规范化的期望满足度；若所述期望满足度小于等于第二阈值，将所述第一类目确定为所述目标用户不具有偏好的类目。

15.根据权利要求10所述的装置，其特征在于，第一资源为所述资源中的任意一个资源，所述确定单元还用于根据所述目标用户所具有特征和所述第一资源所具有特征生成所述目标用户与第一资源的交叉特征，所述目标用户所具有特征包括所述偏好类目；根据所述目标用户所具有特征、所述第一资源所具有特征以及所述目标用户与第一资源的交叉特征确定出所述第一资源相对于所述目标用户的排序得分；若所述第一资源相对于所述目标用户的排序得分满足预设条件，将所述第一资源确定为所述待推荐资源。

16.根据权利要求15所述的装置，其特征在于，所述确定单元还用于获取根据所述第一资源所具有特征划分的第一组集合，以及获取根据所述目标用户所具有特征划分的第二组集合，同一个特征组中的特征具有相同的属性，所述第一组集合中包括多个特征组，所述第二组集合中包括多个特征组；将根据所述第一组集合和第二组集合之间的组交叉关系，确定出多个交叉组，所述多个交叉组中任意一个交叉组包括一个第一组集合中的特征组和一个第二交叉组中的一个特征组；根据交叉组中携带的特征生成交叉特征；根据每个交叉组中交叉特征所携带的统计参数计算资源推荐所需的统计特征；将计算得到的统计特征作为所述目标用户与第一资源的交叉特征。

17.根据权利要求16所述的装置，其特征在于，若交叉特征的历史生成参数中，具有第一属性的交叉组和具有第二属性的交叉组之间确定出可作为交叉特征的数量低于第三阈值，所述确定单元还用于将具有第一属性的交叉组和具有第二属性的交叉组之间的组交叉关系删除；或者，

18.根据权利要求16所述的装置，其特征在于，第一交叉组为所述多个交叉组中的任意一个交叉组，所述确定单元还用于根据资源推荐的需求，从所述第一交叉组中的交叉特征选取对应的统计参数；根据资源推荐的需求，利用所选取的统计参数计算得出所述第一交叉组对应的统计特征，所述第一交叉组对应的统计特征的数量小于所述第一交叉组中的交叉特征的数量。

19.一种推荐系统框架，其特征在于，所述推荐系统框架包括离线部分、近实时部分和在线部分：

所述离线部分用于负责用户Profile构建以及关联数据挖掘；

所述实时部分用于基于通用的推荐管道，并结合离线、近实时模块的产出结果，完成整套的推荐逻辑；

其中，所述实时部分用于执行并实现权利要求1至9中任一项所述方法的相关步骤。