CN106445971A

CN106445971A - 一种应用推荐方法和系统

Info

Publication number: CN106445971A
Application number: CN201510490560.4A
Authority: CN
Inventors: 唐竞胜; 曹国栋; 王振凯
Original assignee: Beijing Qihoo Technology Co Ltd; Qizhi Software Beijing Co Ltd
Current assignee: Beijing Qihoo Technology Co Ltd; Qizhi Software Beijing Co Ltd
Priority date: 2015-08-11
Filing date: 2015-08-11
Publication date: 2017-02-22

Abstract

本发明公开了一种应用推荐方法和系统，其中，所述方法包括：根据用户对应用的历史行为信息，确定用户的第一属性信息；分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值；根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值；根据所述排序分值推送所述各个待推荐应用。通过本发明解决了应用推荐准确性差的问题。

Description

一种应用推荐方法和系统

技术领域

本发明涉及互联网技术领域，特别是涉及一种应用推荐方法和系统。

背景技术

互联网是人们获取信息的一个重要途径，传统互联网的主要特点在于用户在寻找自己感兴趣的事物时，需要通过进行大量的搜索和浏览操作，并且，还需要对搜索和浏览结果进行人工筛选过滤，最终才能得到满足需求的结果，整个获取过程操作繁琐，耗费大量的时间和精力。

应用(Application)的获取更是如此。目前，已有一些网站基于对应用的标签信息进行分析，然后根据应用的标签信息进行应用的推荐。然而，由于目前互联网上的应用数量庞杂、种类繁多，标签的分类标准良莠不齐，每个应用对应的标签也并不完全准确，如，打着生活类标签的应用实际可能是一个娱乐类的应用，进而造成推荐结果的准确性差，难以满足用户需求。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种应用推荐方法和系统。

依据本发明的一个方面，提供了一种应用推荐方法，包括：

根据用户对应用的历史行为信息，确定用户的第一属性信息；所述第一属性信息中包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息；

分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值；

根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值；

根据所述排序分值推送所述各个待推荐应用。

可选地，根据用户对应用的历史行为信息，确定用户的第一属性信息，包括：

依次从所述历史行为信息所指示的至少一个历史应用中提取得到对应的至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息；

从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

可选地，从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息，包括：

根据所述历史行为信息，分别确定各个历史应用的访问次数；其中，所述访问次数包括：下载次数、搜索次数和浏览次数中的至少一种；

根据各个历史应用的访问次数，分别对所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息进行加权处理，得到对应的第一加权结果、第二加权结果和第三加权结果；

分别根据所述第一加权结果、第二加权结果和第三加权结果从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

可选地，从所述至少一个历史应用中提取得到对应的至少一个应用主题信息，包括：

分别获取各个应用对应的描述信息；

分别对所述各个应用对应的描述信息进行分词处理，得到各个应用的分词处理结果；

根据所述各个应用的分词处理结果，抽取得到各个应用对应的应用主题信息。

可选地，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值，包括：

将所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值带入回归模型，得到各个待推荐应用的排序分值；其中，所述回归模型根据至少一个样本用户的样本历史行为信息训练得到。

可选地，通过如下步骤训练得到所述回归模型：

获取至少一个样本用户的样本历史行为信息；其中，所述至少一个样本用户的样本历史行为信息包括：所述至少一个样本用户对应的样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值；

对所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值进行训练，得到所述回归模型。

可选地，分别确定所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

可选地，通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

分别获取当前历史应用和当前待推荐应用的第一访问信息和第二访问信息；其中，所述当前历史应用为所述至少一个历史应用中的应用，所述当前待推荐应用为所述各个待推荐应用中的应用；

根据所述第一访问信息和所述第二访问信息分别确定所述当前历史应用的第一用户访问数量和所述当前待推荐应用的第二用户访问数量，以及，所述当前历史应用与所述当前待推荐应用的共同用户访问数量；

根据所述第一用户访问数量、第二用户访问数量和共同用户访问数量确定所述当前历史应用与所述当前待推荐应用之间的应用偏好相关性分值；

依次计算至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

依据本发明的另一个方面，还提供了一种应用推荐统，包括：

属性信息确定模块，用于根据用户对应用的历史行为信息，确定用户的第一属性信息；所述第一属性信息中包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息；

第一分值确定模块，用于分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值；

第二分值确定模块，用于分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值；

第三分值确定模块，用于根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值；

推送模块，用于根据所述排序分值推送所述各个待推荐应用。

可选地，属性信息确定模块，包括：

信息获取子模块，用于依次从所述历史行为信息所指示的至少一个历史应用中提取得到对应的至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息；

信息提取子模块，用于从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

可选地，信息提取子模块，包括：

访问次数确定子单元，用于根据所述历史行为信息，分别确定各个历史应用的访问次数；其中，所述访问次数包括：下载次数、搜索次数和浏览次数中的至少一种；

加权处理子单元，用于根据各个历史应用的访问次数，分别对所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息进行加权处理，得到对应的第一加权结果、第二加权结果和第三加权结果；

提取子单元，用于分别根据所述第一加权结果、第二加权结果和第三加权结果从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

可选地，信息提取子模块在从所述至少一个历史应用中提取得到对应的至少一个应用主题信息时，包括：

分别获取各个应用对应的描述信息；

可选地，第三分值确定模块，用于将所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值带入回归模型，得到各个待推荐应用的排序分值；其中，所述回归模型根据至少一个样本用户的历史行为信息训练得到。

可选地，通过如下模块训练得到所述回归模型：

样本获取模块，用于获取至少一个样本用户的样本历史行为信息；其中，所述至少一个样本用户的样本历史行为信息包括：所述至少一个样本用户对应的样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值；

训练模块，用于对所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值进行训练，得到所述回归模型。

可选地，第二分值确定模块，用于通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

可选地，第二分值确定模块，包括：

访问信息获取子模块，用于分别获取当前历史应用和当前待推荐应用的第一访问信息和第二访问信息；其中，所述当前历史应用为所述至少一个历史应用中的应用，所述当前待推荐应用为所述各个待推荐应用中的应用；

访问数量确定子模块，用于根据所述第一访问信息和所述第二访问信息分别确定所述当前历史应用的第一用户访问数量和所述当前待推荐应用的第二用户访问数量，以及，所述当前历史应用与所述当前待推荐应用的共同用户访问数量；

应用偏好相关性分值计算子模块，用于根据所述第一用户访问数量、第二用户访问数量和共同用户访问数量确定所述当前历史应用与所述当前待推荐应用之间的应用偏好相关性分值；以及，依次计算至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

本发明实施例公开的一种应用推荐方案，可以根据用户对应用的历史行为信息，确定用户的第一属性信息；所述第一属性信息中包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。可见，在本发明实施例中，至少可以从四个维度对用户进行定义(标识)，提高了对用户定义(标识)的准确性，进而提高了后续推送的应用的准确性。

此外，在确定用户的第一属性之后，可以分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值；最后，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值；并，根据所述排序分值推送所述各个待推荐应用。其中，所述排序分值可以指示待推荐应用与用户喜欢程度的大小。可见，在本发明实施例中，可以通过与用户匹配的至少四个维度的参数(应用偏好相关性分值、第一相关性分值、第二相关性分值和第三相关性分值)来计算得到各个待推荐应用的排序分值，提高了计算结果的准确性，将排序分值较高的、与用户喜好(需求)最匹配的待推荐应用推送给用户，针对性强，准确度高。避免了无效或匹配度差的应用的推送，提升了用户体验。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例一中一种应用推荐方法的步骤流程图；

图2是本发明实施例二中一种应用推荐方法的步骤流程图；

图3是本发明实施例三中针对用户A的应用推荐流程的步骤图；

图4是本发明实施例四中一种应用推荐系统的结构框图；

图5是本发明实施例五中一种应用推荐系统的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

参照图1，示出了本发明实施例一中一种应用推荐方法的步骤流程图。在本实施例中，所述应用推荐方法可以包括：

步骤102，根据用户对应用的历史行为信息，确定用户的第一属性信息。

在本实施例中，用户对应用的历史行为信息包括但不仅限于：用户访问过的至少一个历史应用。其中，所述访问过的至少一个历史应用可以但不仅限于：用户浏览、或搜索、或点击、或下载过的应用。

所述第一属性信息中至少可以包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。其中，所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息可以用于从三个维度对用户进行标识，以对不同用户进行区别，进而提供与用户相匹配的个性化的应用推荐。换而言之，所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息可以均是与用户相匹配的信息。

例如，一种可行的确定与用户匹配的设定的应用主题信息、设定的应用标签信息和设定的应用类目信息的方式可以如下：从用户访问过的至少一个历史应用中分别提取出各个应用对应的应用主题信息、应用标签信息和应用类目信息，然后从提取出的多个应用主题信息、多个应用标签信息和多个应用类目信息中筛选得到满足设定要求的应用主题信息、应用标签信息和应用类目信息作为所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。其中，所述设定要求可以但不仅限于是：将出现频率最高的应用主题信息、应用标签信息和应用类目信息作为所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

本领域技术人员应当明了的是，各个应用各自对应的应用主题信息、应用标签信息和应用类目信息可以采用任意一种适当的方式获取，如，可以但不仅限于从至少一个第三方应用下载平台获取，或，从应用发布方直接获取、或，从服务器中保存的应用信息中获取，本实施例对此不作限制。

步骤104，分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值。

在本实施例中，可以通过任意一种适当的相关性算法对两个数据的相关性进行分析和计算。例如，一种可行的方式可以如下：可以通过余弦方式计算得到各个相关性分值。以第一相关性分值的计算为例，可以将用户对应的设定的应用主题信息与待推荐应用对应的应用信息1进行余弦计算，将计算得到的分值作为所述第一相关性分值。本实施例对此不一一说明。

又例如，另一种可行的方式可以如下：可以通过协同过滤算法进行分值的计算得到各个相关性分值。以应用偏好相关性分值的计算为例，可以采用协同过滤算法对历史应用和待推荐应用进行相关性计算，将计算得到的分值作为所述应用偏好相关性分值。

步骤106，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值。

在本实施例中，可以采用任意一种适当的方式对所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值进行拟合计算，以得到排序分值。

例如，可以但不限于采用数学模型来对所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值进行处理，以得到所述排序分值。其中，所述数学模型可以是根据历史数据(经验值)训练得到。又或者，可以根据预先设置的权重/系数分别对所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值进行加权处理，将加权处理结果之和作为所述排序分值。本实施例对此不作限制。

步骤108，根据所述排序分值推送所述各个待推荐应用。

在本实施例中，为了提高推送的待推荐应用与用户的匹配度，提高推送待推荐应用的准确性和针对性，可以将排序分值较高的待推荐应用推送给用户，例如，可以将排序分值前5的待推荐应用推送给用户。其中，所述排序分值的高低可以指示待推荐应用与用户的匹配度，一般地，排序分值越高越满足用户的喜好。

综上所述，本实施例所述的应用推荐方法，可以根据用户对应用的历史行为信息，确定用户的第一属性信息；所述第一属性信息中包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。可见，在本实施例中，至少可以从四个维度对用户进行定义(标识)，提高了对用户定义(标识)的准确性，进而提高了后续推送的应用的准确性。

此外，在确定用户的第一属性之后，可以分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值；最后，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值；并，根据所述排序分值推送所述各个待推荐应用。其中，所述排序分值可以指示待推荐应用与用户喜欢程度的大小。可见，在本实施例中，可以通过与用户匹配的至少四个维度的参数(应用偏好相关性分值、第一相关性分值、第二相关性分值和第三相关性分值)来计算得到各个待推荐应用的排序分值，提高了计算结果的准确性，将排序分值较高的、与用户喜好(需求)最匹配的待推荐应用推送给用户，针对性强，准确度高。避免了无效或匹配度差的应用的推送，提升了用户体验。

实施例二

参照图2，示出了本发明实施例二中一种应用推荐方法的步骤流程图。在本实施例中，所述应用推荐方法可以但不仅限于基于应用平台实现，所述应用平台可以应用于移动终端、PC(Personal computer，个人计算机)、Pad(Portable android device，平板电脑)等智能终端设备中。

其中，所述应用推荐方法可以包括：

步骤202，根据用户对应用的历史行为信息，确定用户的第一属性信息。

在本实施例中，所述历史行为信息可以包括：用户访问过的至少一个历史应用。所述第一属性信息中可以包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。其中，所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息可以理解为是用户的三个维度的标签，可以用于对用户进行标识、指示用户。

优选地，可以通过如下方式确定用户对应的第一属性信息：

子步骤2022，依次从所述至少一个历史应用中提取得到对应的至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息。

一般地，每个应用在发布时或在第三方平台使用过程中，可以携带有如下属性信息：应用主题信息、应用标签信息和应用类目信息。在本实施例中，可以直接从应用中携带的属性信息中直接获取各个历史应用对应的应用主题信息、应用标签信息和应用类目信息。当然，应用主题信息、应用标签信息和应用类目信息的获取方式并不仅限于此。以应用主题信息的获取为例，一种可行的获取应用主题信息的方式可以如下：

首先，分别获取各个应用对应的描述信息。其中，所述描述信息可以但不仅限于是：应用的说明/简介/详情等。

然后，分别对所述各个应用对应的描述信息进行分词处理，得到各个应用的分词处理结果。

最后，根据所述各个应用的分词处理结果，抽取得到各个应用对应的应用主题信息。例如，可以通过LDA模型(Latent Dirichlet Allocation，文档主题生成模型)对所述分词处理结果进行抽取，得到应用主题信息。

子步骤2024，从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

在本实施例中，一种可行的从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息的方式可以如下：

首先，根据所述历史行为信息，分别确定各个历史应用的访问次数。在本实施例中，所述历史行为信息中还可以包括：用户对各个历史应用的访问次数；其中，所述访问次数包括：下载次数、搜索次数和浏览次数中的至少一种。

然后，根据各个历史应用的访问次数，分别对所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息进行加权处理，得到对应的第一加权结果、第二加权结果和第三加权结果。

最后，分别根据所述第一加权结果、第二加权结果和第三加权结果从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。例如，可以从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中分别选择加权分值最高的应用主题信息、应用标签信息和应用类目信息作为所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

步骤204，分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，以及，分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值。

在本实施例中，各个相关性的分值可以采用任意一种适当的相关性分值计算方法进行计算。如下，给出了两种可行的相关性计算方法：

其一，可以通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

具体地，可以分别获取当前历史应用和当前待推荐应用的第一访问信息和第二访问信息；其中，所述当前历史应用为所述至少一个历史应用中的应用，所述当前待推荐应用为所述各个待推荐应用中的应用。然后，根据所述第一访问信息和所述第二访问信息分别确定所述当前历史应用的第一用户访问数量和所述当前待推荐应用的第二用户访问数量，以及，所述当前历史应用与所述当前待推荐应用的共同用户访问数量；最后，根据所述第一用户访问数量、第二用户访问数量和共同用户访问数量确定所述当前历史应用与所述当前待推荐应用之间的应用偏好相关性分值；并，依次计算至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

其中,对于每个待推荐应用,与当前用户的历史应用中的各个应用之间都能得到一个初始的应用偏好相关性分值，然后可以将这些初始的应用偏好相关性分值加权计算得到总的应用偏好相关性分值。该总的应用偏好相关性分值可表示当前用户对该带推荐应用的偏好程度。

其二，可以通过余弦算法计算相关性分值。如：

根据所述设定的应用主题信息，通过余弦计算得到所述第一相关性分值。根据所述设定的应用标签信息，通过余弦计算得到所述第二相关性分值；和，根据所述设定的应用类目信息，通过余弦计算得到所述第二相关性分值。

步骤206，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值。

在本实施例中，一种可行的确定所述排序分值的方式可以如下：将所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值带入回归模型，得到各个待推荐应用的排序分值；其中，所述回归模型根据至少一个样本用户的样本历史行为信息训练得到。

步骤208，根据所述排序分值推送所述各个待推荐应用。

例如，可以根据各个待推荐应用对应的排序分值，从所述各个待推荐应用中周期性地选择设定数量的待推荐应用进行推送。当然，本领域技术人员应当明了的是，推送的方式并不仅限于此，可以根据实际情况选择任意一种适当的推送规则来推送所述待推荐应用。

在本实施例的一优选方案中，可以通过如下步骤训练得到所述回归模型：

步骤210，获取至少一个样本用户的样本历史行为信息。

其中，所述至少一个样本用户的样本历史行为信息包括但不仅限于：所述至少一个样本用户对应的样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值。需要说明的是，在本实施例中，所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值可以采用任意一种相关性算法进行计算得到，如，可以采用上述的余弦算法、协同过滤算法进行计算各个样本的相关性分值的计算，并对得到的多个结果进行加权求和，进而得到最终的所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值。本实施例对此不作限制。

步骤212，对所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值进行训练，得到所述回归模型。

如，可以通过回归函数进行训练，拟合得到各相关性参数(应用相关性、第一相关性、第二相关性和第三相关性)的权重。

需要说明的是，上述步骤210和步骤212可以在上述步骤206计算所述排序分值之前的任一步骤之前或之后执行。本实施例对此不作限制。

进一步地，本实施例可以根据用户的历史行为信息进行分析得到各个维度的参数，如根据访问次数来确定与用户匹配的设定的应用主题信息、设定的应用标签信息和设定的应用类目信息，准确反映了用户的喜好，进一步提高了最终推送结果的针对性和准确性。而余弦算法和相关性算法的应用，以及回归模型的预先建立，提高了整个数据过程的处理效率、节约了时间。

实施例三

结合上述实施例，以针对用户A的应用推荐流程为例对所述应用推荐方法进行详细说明。

参照图3，示出了本发明实施例三中针对用户A的应用推荐流程的步骤图。在本实施例中，所述针对用户A的应用推荐流程可以如下：

步骤302，通过日志信息获取用户A的历史行为信息。

在本实施例中，用户A的历史行为信息至少可以包括：用户A访问过的历史应用，以及，用户A对各个历史应用的访问次数。需要说明的是，所述访问包括但不仅限于：点击、浏览、搜索等。

在本实施例中，用户A访问过的历史应用及访问次数可以如下表1所示：

表1

由上述表1可知，用户A访问过的历史应用包括：应用1、应用2和应用3。当然，本领域技术人员应当明了的是，上述表1仅是示例性说明，用户A并不仅限于仅访问过应用1、应用2和应用3.

步骤304，分别获取所述应用1、应用2和应用3对应的应用主题信息、应用标签信息和应用类目信息。

例如，应用1对应的应用主题信息、应用标签信息和应用类目信息分别为：应用主题信息1、应用标签信息1和应用类目信息1；应用2对应的应用主题信息、应用标签信息和应用类目信息分别为：应用主题信息2、应用标签信息2和应用类目信息2；应用3对应的应用主题信息、应用标签信息和应用类目信息分别为：应用主题信息3、应用标签信息3和应用类目信息3。

步骤306，根据用户对历史应用的点击次数，分别对应用主题信息1、应用主题信息2、应用主题信息3、应用标签信息1、应用标签信息2、应用标签信息3、应用类目信息1、应用类目信息2和应用类目信息3进行加权，得到加权结果。

例如，应用主题信息1、应用主题信息2和应用主题信息3对应的加权结果分别为：0.3、0.5和0.3。应用标签信息1、应用标签信息2、应用标签信息3对应的加权结果分别为：0.4、0.6、0.3。应用类目信息1、应用类目信息2和应用类目信息3对应的加权结果分别为：0.6、0.9、0.7。需要说明的是，上述加权结果的数值仅是示例性说明。

步骤308，根据加权结果确定用户A的第一属性信息。

在本实施例中，如前所述，可以选择应用主题信息2、应用标签信息2和应用类目信息2作为设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。并，将所述应用主题信息2、应用标签信息2和应用类目信息3作为用户A的标记信息，也即，作为用户A的第一属性信息。

步骤310，确定用户A对应的应用偏好相关性分值、第一相关性分值、第二相关性分值和第三相关性分值。

在本实施例中，以待推荐应用A、应用B和应用C为例进行说明。

针对应用偏好相关性分值：

由于应用2的访问次数最大，故可以选择应用2作为应用相关性计算的参数：对于应用A：应用2-应用A的应用偏好相关性分值A＝n/(n1+n2)；其中，n为：应用2和应用A的共同用户数量，n1为应用2的用户数量，n2为应用A的用户数量。应用2-应用B的应用偏好相关性分值B、以及，应用2-应用C的应用偏好相关性分值C的计算不再一一说明。

针对第一相关性分值：

对于应用A，可以提取应用A的应用主题信息A，通过余弦算法计算设定的应用主题信息(应用主题信息2)和应用主题信息A的余弦相似性，并将计算结果作为用户A与应用A之间的第一相关性分值A。类似地，可以依次计算得到用户A与应用B和应用C之间的第一相关性分值B和第一相关性分值C。

第二相关性分值和第三相关性分值的计算可以参照上述第一相关性分值的计算，不再一一说明，最终可以得到：用户A与应用A、应用B和应用C之间的第二相关性分值A、第二相关性分值B和第二相关性分值C；用户A与应用A、应用B和应用C之间的第三相关性分值A、第三相关性分值B和第三相关性分值C。

步骤312，根据应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值。

在本实施例中，可以通过预先训练的回归模型来计算排序分值。其中，一种可行的回归模型可以如下：f(x)＝k1*x1+k2*x2+k3*x3+k4*x4；其中，k1、k2、k3和k4为通过训练得到已知权重系数，x1、x2、x3和x4分别对应应用偏好相关性分值、第一相关性分值、第二相关性分值和第三相关性分值。

有前所述，可以将上述

应用偏好相关性分值A、应用偏好相关性分值B和应用偏好相关性分值C、

第一相关性分值A、第一相关性分值B和第一相关性分值C、

第二相关性分值A、第二相关性分值B和第二相关性分值C、

第三相关性分值A、第三相关性分值B和第三相关性分值C、

分别代入上述函数模型f(x)中进行计算，分别得到应用A、应用B和应用C的排序分值。

步骤314，根据排序分值推送所述各个待推荐应用。

例如，根据上述步骤得到的应用A、应用B和应用C的排序分值分别为：10、8和9，则可以选择应用A进行推送。

需要说明的是，对于前述的方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明所必需的。

实施例四

基于与上述方法实施例同一发明构思。参照图4，示出了本发明实施例四中一种应用推荐系统的结构框图。在本实施例中，所述应用推荐系统可以包括：

属性信息确定模块402，用于根据用户对应用的历史行为信息，确定用户的第一属性信息。

在本实施例中，所述历史行为信息可以包括：用户访问过的至少一个历史应用。所述第一属性信息中可以包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

第一分值确定模块404，用于分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

第二分值确定模块406，用于分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值。

第三分值确定模块408，用于根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值。

推送模块410，用于根据所述排序分值推送所述各个待推荐应用。

综上所述，本实施例所述的应用推荐系统，可以根据用户对应用的历史行为信息，确定用户的第一属性信息；所述第一属性信息中包括：设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。可见，在本实施例中，至少可以从四个维度对用户进行定义(标识)，提高了对用户定义(标识)的准确性，进而提高了后续推送的应用的准确性。

实施例五

参照图5，示出了本发明实施例五中一种应用推荐系统的结构框图。在本实施例中，所述应用推荐系统可以包括：

属性信息确定模块502，用于根据用户对应用的历史行为信息，确定用户的第一属性信息。

优选地，所述属性信息确定模块502可以包括：信息获取子模块5022，用于依次从所述至少一个历史应用中提取得到对应的至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息。信息提取子模块5024，用于从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。需要说明的是，信息提取子模块5024在从所述至少一个历史应用中提取得到对应的至少一个应用主题信息时，可以包括：分别获取各个应用对应的描述信息；分别对所述各个应用对应的描述信息进行分词处理，得到各个应用的分词处理结果；根据所述各个应用的分词处理结果，抽取得到各个应用对应的应用主题信息。

进一步优选地，信息提取子模块5024可以包括：访问次数确定子单元，用于根据所述历史行为信息，分别确定各个历史应用的访问次数；其中，所述访问次数包括：下载次数、搜索次数和浏览次数中的至少一种。加权处理子单元，用于根据各个历史应用的访问次数，分别对所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息进行加权处理，得到对应的第一加权结果、第二加权结果和第三加权结果。提取子单元，用于分别根据所述第一加权结果、第二加权结果和第三加权结果从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息。

第一分值确定模块504，用于分别确定所述历史行为信息所指示的至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

第二分值确定模块506，用于分别根据所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息确定的用户与各个待推荐应用之间的第一相关性分值、第二相关性分值和第三相关性分值。

优选地，第二分值确定模块506，具体可以用于通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

进一步优选地，第二分值确定模块506，可以包括：访问信息获取子模块5062，用于分别获取当前历史应用和当前待推荐应用的第一访问信息和第二访问信息；其中，所述当前历史应用为所述至少一个历史应用中的应用，所述当前待推荐应用为所述各个待推荐应用中的应用。访问数量确定子模块5064，用于根据所述第一访问信息和所述第二访问信息分别确定所述当前历史应用的第一用户访问数量和所述当前待推荐应用的第二用户访问数量，以及，所述当前历史应用与所述当前待推荐应用的共同用户访问数量。应用偏好相关性分值计算子模块5066，用于根据所述第一用户访问数量、第二用户访问数量和共同用户访问数量确定所述当前历史应用与所述当前待推荐应用之间的应用偏好相关性分值；以及，依次计算至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

第三分值确定模块508，用于根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值。

优选地，第三分值确定模块508，具体可以用于将所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值带入回归模型，得到各个待推荐应用的排序分值；其中，所述回归模型根据至少一个样本用户的历史行为信息训练得到。

进一步优选地，可以通过如下模块训练得到所述回归模型：样本获取模块，用于获取至少一个样本用户的样本历史行为信息；其中，所述至少一个样本用户的样本历史行为信息可以包括：所述至少一个样本用户对应的样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值。训练模块，用于对所述样本应用偏好相关性分值、第一样本相关性分值、第二样本相关性分值和第三样本相关性分值进行训练，得到所述回归模型。

推送模块510，用于根据所述排序分值推送所述各个待推荐应用。

对于上述装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的应用推荐设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明公开了A1、一种应用推荐方法，包括：

根据所述排序分值推送所述各个待推荐应用。

A2、如A1所述的方法，根据用户对应用的历史行为信息，确定用户的第一属性信息，包括：

A3、如A2所述的方法，从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息，包括：

A4、如A2所述的方法，从所述至少一个历史应用中提取得到对应的至少一个应用主题信息，包括：

分别获取各个应用对应的描述信息；

A5、如A1所述的方法，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值，包括：

A6、如A5所述的方法，通过如下步骤训练得到所述回归模型：

A7、如A1所述的方法，分别确定所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

A8、如A7所述的方法，通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

本发明还公开了B9、一种应用推荐系统，包括：

B10、如B9所述的系统，属性信息确定模块，包括：

B11、如B10所述的系统，信息提取子模块，包括：

B12、如B10所述的系统，信息提取子模块在从所述至少一个历史应用中提取得到对应的至少一个应用主题信息时，包括：

分别获取各个应用对应的描述信息；

B13、如B9所述的系统，第三分值确定模块，用于将所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值带入回归模型，得到各个待推荐应用的排序分值；其中，所述回归模型根据至少一个样本用户的历史行为信息训练得到。

B14、如B13所述的系统，通过如下模块训练得到所述回归模型：

B15、如B9所述的系统，第二分值确定模块，用于通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值。

B16、如B15所述的系统，第二分值确定模块，包括：

Claims

1.一种应用推荐方法，包括：

根据所述排序分值推送所述各个待推荐应用。

2.根据权利要求1所述的方法，其特征在于，根据用户对应用的历史行为信息，确定用户的第一属性信息，包括：

3.根据权利要求2所述的方法，其特征在于，从所述至少一个应用主题信息、至少一个应用标签信息和至少一个应用类目信息中提取得到所述设定的应用主题信息、设定的应用标签信息和设定的应用类目信息，包括：

4.根据权利要求2所述的方法，其特征在于，从所述至少一个历史应用中提取得到对应的至少一个应用主题信息，包括：

分别获取各个应用对应的描述信息；

5.根据权利要求1所述的方法，其特征在于，根据所述应用偏好相关性分值、所述第一相关性分值、第二相关性分值和第三相关性分值，确定各个待推荐应用的排序分值，包括：

6.根据权利要求5所述的方法，其特征在于，通过如下步骤训练得到所述回归模型：

7.根据权利要求1所述的方法，其特征在于，分别确定所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

8.根据权利要求7所述的方法，其特征在于，通过协同过滤算法，计算所述至少一个历史应用与各个待推荐应用之间的应用偏好相关性分值，包括：

9.一种应用推荐系统，包括：

10.根据权利要求9所述的系统，其特征在于，属性信息确定模块，包括：