CN107423308A

CN107423308A - 主题推荐方法以及装置

Info

Publication number: CN107423308A
Application number: CN201610351369.6A
Authority: CN
Inventors: 刘志容; 唐睿明; 董振华; 何秀强; 曹国祥
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-05-24
Filing date: 2016-05-24
Publication date: 2017-12-01
Anticipated expiration: 2036-05-24
Also published as: US11830033B2; US20190087884A1; CN107423308B; WO2017201976A1

Abstract

本发明公开了一种主题推荐方法以及装置。其中，所述方法包括：采集样本用户对M个对象的历史操作行为，并根据样本用户对M个对象中的每个对象的历史操作行为预测目标用户对M个对象中的每个对象的喜好值；采集N个推荐对象的类别区分数据，并根据N个推荐对象的类别区分数据将N个推荐对象进行类别区分得到X个主题，X个主题中的每个主题均包括N个推荐对象中的至少一个推荐对象，N个推荐对象为M个对象中的部分或者全部；根据目标用户对X个主题中的每个主题中包括的推荐对象的喜好值计算得到目标用户对X个主题中的每个主题的喜好值；将目标主题推送给目标用户，目标主题为X个主题中的，目标用户的喜好值大于推荐阈值的主题。

Description

主题推荐方法以及装置

技术领域

本发明涉及终端领域，尤其涉及一种主题推荐方法以及装置。

背景技术

随着应用市场的发展，应用供应商之间的竞争也越来越激烈。在国内，华为应用市场、百度应用市场、360应用市场和豌豆荚应用市场等犹如雨后春笋般出现；在国外，AppStore，Google Play等占据了非大陆用户的应用市场的巨大份额。为了抢占应用市场，应用供应商通常通过各种方法将自己的应用推荐给用户，以吸引用户使用自己的应用。

但是，在实践中发现，现有的推荐方式只是简单地估计用户可能感兴趣的几个应用并推荐给用户，难以真正引起用户的兴趣并带来收益。

发明内容

本发明提供了一种主题推荐方法以及装置，能够以主题的形式将推荐对象推荐给用户。

第一方面，本发明提供了一种主题推荐方法。计算设备采集样本用户对M个对象的历史操作行为，并根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值。M为大于或者等于1的正整数。计算设备还采集N个推荐对象的类别区分数据，并根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题。所述N个推荐对象为所述M个对象中的部分或者全部。所述X个主题中的每个主题均包括所述N个推荐对象中的至少一个推荐对象。X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M。计算设备根据所述目标用户对所述X个主题中的每个主题中包括的推荐对象的喜好值计算得到所述目标用户对所述X个主题中的每个主题的喜好值，并将目标主题推送给所述目标用户。所述目标主题为所述X个主题中的，所述目标用户的喜好值大于推荐阈值的主题。

不同于现有技术只是简单地估计用户可能感兴趣的几个应用并推荐给用户，本发明提出的主题推荐方法先将推荐对象分类成多个主题，然后，将对主题的喜好值大于阈值的主题推送给目标用户。上述方法能够将目标用户感兴趣的主题的多个推荐对象进行推送，使得目标用户在同一主题中可以有多种选择。而且，可以向目标用户推送不止一个主题，使得目标用户能够在多个主题中进行选择，从而真正引起目标用户的兴趣并带来收益。

结合第一方面，第一方面的第一种可能的实施方式中，计算设备根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据。计算设备再根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练。最后，计算设备将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

结合第一方面，第一方面的第二种可能的实施方式中，计算设备根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图，再根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性。然后，根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值。所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象。n为大于或者等于1的正整数，n≤M。最后，计算设备根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

结合第一方面任意一种实施方式，第一方面的第四种可能的实施方式中，计算设备根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。因此，计算设备能够将相类似的推荐对象自动划分到同一个主题下，不需要人工进行干预。

结合第一方面任意一种实施方式，第一方面的第五种可能的实施方式中，计算设备预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件。不同的主题对应不同的分类预设条件。计算设备判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。因此，计算设备能够按照需要自主设定主题的分类预设条件以筛选出自定义的主题。

第二方面，本发明提供了一种主题推荐装置，所述装置包括预测模块、分类模块、计算模块以及推荐模块。所述预测模块用于采集样本用户对M个对象的历史操作行为，并根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值。M为大于或者等于1的正整数。所述分类模块用于采集N个推荐对象的类别区分数据，并根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题。所述N个推荐对象为所述M个对象中的部分或者全部。所述X个主题中的每个主题均包括所述N个推荐对象中的至少一个推荐对象。X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M。所述计算模块用于根据所述目标用户对所述X个主题中的每个主题中包括的推荐对象的喜好值计算得到所述目标用户对所述X个主题中的每个主题的喜好值。并且，所述推荐模块用于将目标主题推送给所述目标用户。所述目标主题为所述X个主题中的，所述目标用户的喜好值大于推荐阈值的主题。

结合第二方面，第二方面的第一种可能的实施方式中，所述预测模块包括确定单元、训练单元以及预测单元。所述确定单元用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据。所述训练单元用于根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练。最后，所述预测单元用于将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

结合第二方面，第二方面的第二种可能的实施方式中，所述预测模块包括构建单元、计算单元、确定单元以及预测单元。所述构建单元用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图。所述计算单元用于根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性。然后，所述确定单元用于根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值。所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象。n为大于或者等于1的正整数，n≤M。最后，所述预测单元用于根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

结合第二方面任意一种实施方式，第二方面的第四种可能的实施方式中，所述分类模块包括聚类单元。所述聚类单元用于根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。因此，计算设备能够将相类似的推荐对象自动划分到同一个主题下，不需要人工进行干预。

结合第二方面任意一种实施方式，第二方面的第五种可能的实施方式中，所述分类模块包括预设单元以及归入单元。所述预设单元用于预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件。不同的主题对应不同的分类预设条件。然后，所述归入单元用于判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。因此，计算设备能够按照需要自主设定主题的分类预设条件以筛选出自定义的主题。

第三方面，本发明提供了一种计算设备。所述计算设备包括存储单元、通信接口及与所述存储单元和通信接口耦合的处理器。其中，所述存储单元用于存储指令，所述处理器用于执行所述指令，所述通信接口用于与目标用户传输数据。当所述处理器在执行所述指令时，可根据所述指令执行在第一方面中的方法。

第四方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质存储了计算设备所执行的用于主题推荐的程序代码。所述程序代码包括用于执行在第一方面中的方法的指令。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种主题推荐方法的流程图；

图2是图1所示的主题推荐方法中的步骤110的一种具体步骤的流程图；

图3是图1所示的主题推荐方法中的步骤110的另一种具体步骤的流程图；

图4是本发明实施例提供的一种主题推荐方法中的样本用户和对象之间的交互图；

图5是本发明实施例提供的一种主题推荐方法中的展示表的示意图；

图6是本发明实施例提供的一种主题推荐方法中的标签云的示意图；

图7是本发明实施例提供的一种主题推荐装置的结构示意图；

图8是本发明实施例提供的另一种主题推荐装置的结构示意图；

图9是本发明实施例提供的又一种主题推荐装置的结构示意图；

图10是本发明实施提供的一种计算设备的结构示意图。

具体实施方式

下面结合附图和实施例进行说明。

计算设备可以是台式电脑(computer)、笔记本电脑(notebook)、平板电脑(TabletPersonal Computer)、智能手机(Smart phone)等等，计算设备还可以是具有CPU(中央处理单元，Central Processing Unit)、MCU(微控制单元，Microcontroller Unit)、DSP(数字信号处理器，Digital Signal Processor)或用于执行控制或运算的逻辑电路等处理器的设备。

请参阅图1，图1是本发明实施例提供的一种主题推荐方法的流程图。本实施的主题推荐方法的执行主体为计算设备，本实施的主题推荐方法包括如下步骤：

110：计算设备采集样本用户对M个对象的历史操作行为，并根据样本用户对M个对象中的每个对象的历史操作行为预测目标用户对M个对象中的每个对象的喜好值。

对象(Item)可以是应用，例如，应用可以是Uber、facebook、Myspace、twitter以及MSN(Microsoft Service Network)等等，此外，对象还可以是文章、视频、歌曲等等，本发明不作具体限定。样本用户是曾经对对象有历史操作行为并被选取作为样本的用户。其中，样本用户对对象的历史操作行为包括但不限于浏览、点击、下载、使用、付费、卸载和评价。样本用户对对象的历史操作行为可以包括目标用户对对象的历史操作行为，也可以不包括目标用户对对象的历史操作行为。

在一具体的实施例中，如图2所示，根据样本用户对M个对象中的每个对象的历史操作行为预测目标用户对M个对象中的每个对象的喜好值具体包括如下步骤：

111：计算设备根据样本用户对M个对象中的每个对象的历史操作行为确定样本用户对M个对象中的每个对象的喜好数据。其中，M为大于或者等于1的正整数。

喜好数据可以是区间[0,1]之间的一个数值，当数值为1时，表示样本用户对对象的喜好程度最高，当数值为0时，表示样本用户对对象的喜好程度最低。

下面举例说明计算设备如何根据样本用户对M个对象中的每个对象的历史操作行为确定样本用户对M个对象中的每个对象的喜好数据。例如，A对象为M个对象中的其中一个对象，计算设备可以预先设定样本用户对A对象的历史操作行为与样本用户对A对象的喜好数据之间的对应关系，然后，根据样本用户对A对象的历史操作行为和上述对应关系确定样本用户对A对象的喜好数据。预先设定样本用户对A对象的历史操作行为与样本用户对A对象的喜好数据之间的对应关系为：如果样本用户对A对象进行了付费，则样本用户对A对象的喜好数据为1，如果样本用户对A对象进行了下载，则样本用户对A对象的喜好数据为0.8，如果样本用户对A对象进行了浏览，则样本用户对A对象的喜好数据为0.2。所以，一旦样本用户对A对象进行了付费，就可以确定样本用户对A对象的喜好数据为1。或者，一旦样本用户同时对A对象进行了浏览、下载和付费，则可以确定样本用户对A对象的喜好数据为最高的一个，或者，确定样本用户对A对象的喜好数据为三者之和等等。

113：计算设备根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练。

样本用户的特征数据是能够反映样本用户的特点的数据，例如，样本用户的特征数据可以包括但不限于样本用户的性别、年龄以及居住地等等。简单地，样本用户的性别可以用“0”和“1”进行表示，“0”表示为女性，“1”表示为男性。样本用户的年龄可以直接用样本用户的年龄来表示，样本用户的居住地可以用代码进行表示，例如，“1”表示纽约，“2”表示华盛顿等等。

上下文特征是能够反应环境特点的数据，例如，天气等等。

对象的特征数据是能够反应样本用户的特点的数据，例如，对象的特征数据可以包括但不限于对象的类别(购物类或者游戏类等等)等等。简单地，对象的类别可以用代码进行表示，例如，“1”表示购物类，“2”表示游戏类等等。

预测模型可以是逻辑回归(Logistic Regression)模型、决策树和矩阵分解等等。

训练时，将样本用户的特征数据、样本用户对M个对象中的每个对象的喜好数据、上下文特征和M个对象中的每个对象的特征数据对预测模型进行训练。例如，样本用户包括样本用户A₁，样本用户A₂，……；M个对象包括：对象a₁，对象a₂，……。将样本用户A₁的特征数据，上下文特征，对象a₁的特征数据以及样本用户A₁对对象a₁的喜好数据作为其中一条训练数据对预测模型进行训练；将样本用户A₁的特征数据，上下文特征，对象a₂的特征数据以及样本用户A₁对对象a₂的喜好数据作为一条训练数据对预测模型进行训练；将样本用户A₂的特征数据，上下文特征，对象a₂的特征数据以及样本用户A₂对对象a₂的喜好数据作为一条训练数据对预测模型进行训练……。经过大量数据进行训练后，预测模型学习到了具有某些特征数据的用户对具有某些特征数据的对象的喜好值的先验知识。

115：计算设备将目标用户的特征数据和M个对象中的每个对象的特征数据输入到训练好的预测模型以预测目标用户对M个对象中的每个对象的喜好值。

喜好值可以是区间[0,1]之间的一个数值，当数值为1时，表示目标用户对对象的喜好程度最高，当数值为0时，表示目标用户对对象的喜好程度最低。

对于训练好的预测模型，模型中已经具有某些特征数据的用户对具有某些特征数据的对象的喜好值的先验知识，所以，当输入目标用户的特征数据和M个对象中的每个对象的特征数据后，就可以预测到目标用户对M个对象中的每个对象的喜好值。举例说明，目标用户为目标用户u，M个对象包括对象a₁，对象a₂……。当向预测模型输入目标用户u的特征数据和对象a₁的特征数据后，预测模型就可以预测出目标用户u对对象a₁的喜好值；当向预测模型输入目标用户u的特征数据和对象a₂的特征数据后，预测模型就可以预测出目标用户u对对象a₂的喜好值……。

在一具体的实施例中，如图3所示，根据样本用户对M个对象中的每个对象的历史操作行为预测目标用户对M个对象中的每个对象的喜好值具体包括如下步骤：

112：计算设备根据样本用户对M个对象中的每个对象的历史操作行为构建样本用户和M个对象之间的交互图。

例如，样本用户和M个对象之间的交互图可以根据如下方式进行构建，如图4所示，图中的一个黑点表示为一个样本用户，图中的一个白点表示为M个对象中的一个对象，图中连接黑点和白点之间的一条边表示为该黑点对应的样本用户对该白点对应的对象具有历史操作行为。此外，还可以根据该黑点对应的样本用户对该白点对应的对象具有历史操作行为的不同，人为为这条边赋予不同的权值。例如，当历史操作行为为付费时，赋予权值为1；当历史操作行为为下载时，赋予权值为0.8，当历史操作行为为浏览时，赋予权值为0.2等等。

114：计算设备根据样本用户和M个对象之间的交互图计算M个对象两两之间的相似性。

在一具体的实施方式中，计算设备可以根据SimRank算法计算出M个对象两两之间的相似性。其中，SimRank算法的特点为：当输入为交互图(交互图由多个点和两点之间的边构成)时，输出为交互图中所有点两两之间的相似性。SimRank算法是一种成熟的算法，具体的算法请参阅有关资料。计算设备将样本用户和M个对象之间的交互图作为SimRank算法的输入时，输出为交互图中的所有点两两之间的相似性，即，包括样本用户两两之间的相似性，样本用户和M个对象两两之间的相似性以及M个对象两两之间的相似性。计算设备从输出中选择出M个对象两两之间的相似性。其中，M个对象两两之间的相似性可以是区间[0,1]之间的一个数值，当数值为1时，表示两个对象相似度最高，当数值为0时，表示两个对象的相似度最低。

可以理解的是，计算M个对象两两之间的相似性的算法可以有多种，例如，PPR(personal page rank)算法等等，此处SimRank算法只是一种举例而非限定。

116：计算设备根据目标用户对n个操作对象中的每个操作对象的历史操作行为确定目标用户对n个操作对象中的每个操作对象的喜好值。其中，操作对象为M个对象中，目标用户曾经进行了历史操作行为的对象，n为大于或者等于1的正整数，n≤M。

计算设备可以预先设置目标用户对操作对象的历史操作行为和目标用户对操作对象的喜好值之间的关系，例如，目标用户为目标用户u，操作对象a是n个操作对象中的一个操作对象，如果目标用户u曾经对操作对象a进行付费，则目标用户u对操作对象a的喜好值为1；如果目标用户u曾经对操作对象a进行下载，则目标用户u对操作对象a的喜好值为0.8，如果目标用户u曾经对操作对象a进行浏览，则目标用户u对操作对象a的喜好值为0.2等等。然后，计算设备根据目标用户对n个操作对象中的每个操作对象的历史操作行为确定目标用户对n个操作对象中的每个操作对象的喜好值。举例来说，当n个操作对象包括Uber、facebook和google时，目标用户对n个操作对象中的每个操作对象的喜好值可以确定为：如果目标用户曾经对Uber进行付费，则目标用户对Uber的喜好值确定为1；如果目标用户曾经对facebook进行下载，则目标用户对facebook的喜好值确定为0.8，如果目标用户曾经对google进行浏览，则目标用户对google的喜好值确定为0.2。上述仅以目标用户对n个操作对象的历史操作行为不同时，则目标用户对n个操作对象中的每个操作对象的喜好值不同为例，但是，在实际应用中，当浏览次数、付费金额、使用频率等不同时，也会导致目标用户对n个操作对象中的每个操作对象的喜好值不同。

118：计算设备根据目标用户对n个操作对象中的每个操作对象的喜好值以及M个对象两两之间的相似性预测目标用户对M个对象中的每个对象的喜好值。

计算设备将目标用户对n个操作对象中的每个操作对象的喜好值以及M个对象两两之间的相似性作为公式(1)的输入，以计算目标用户对n个操作对象中的每个操作对象的喜好值。其中，公式(1)为：

Sim(u,a)＝g(SimRank(a₁,a),...,SimRank(a_k,a),...,SimRank(a_n,a),w(u,a₁),...,w(u,a_k),...,w(u,a_n)) 公式(1)

其中，Sim(u,a)表示目标用户u对对象a的喜好值，SimRank(a_k,a)表示操作对象a_k与对象a之间的相似性，w(u,a_k)表示目标用户u对操作对象a_k的喜好值，a_k表示为n个操作对象中的任意一个，n为所述操作对象的数量，0<k≤n，函数g为任意一个聚合函数，例如聚合函数为加权平均函数等等。当函数g为加权平均函数时，公式(1)也可以表示为：

下面举例进行说明计算设备是如何根据操作对象Uber、facebook以及google预测目标用户对对象Hailo的喜好值的。假设目标用户对Uber的喜好值为1，目标用户对facebook的喜好值为0.8，目标用户对google的喜好值为0.2，而，Uber和Hailo的相似性为1，facebook和Hailo的相似性为0.5，google和Hailo的相似性为0.2，则根据加权平均函数计算可知：目标用户对对象Hailo的喜好值＝(1*1+0.8*0.5+0.2*0.2)/3≈0.85。

120：计算设备采集N个推荐对象的类别区分数据，并根据N个推荐对象的类别区分数据将N个推荐对象进行类别区分，从而得到X个主题。其中，X个主题中的每个主题均包括N个推荐对象中的至少一个推荐对象，X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M。

N个推荐对象为M个对象中的部分或者全部。当N个推荐对象为M个对象中的部分时，可以随意从M个对象中选择其中的N个对象作为推荐对象，也可以根据一定的条件从M个对象中选择其中的N个对象作为推荐对象。在一具体的实施例中，将M个对象中，目标用户的喜好值大于选择阈值的对象选择为推荐对象；或者，按照目标用户的喜好值对M个对象从高至低进行排序，并将M个对象中序号为前N的对象选择为推荐对象。其中，选择阈值可以根据需要人为进行设置，当选择阈值设置得越高，则推荐对象的数量越少，反之，则推荐对象的数量越多。N的数值可以是正整数，并且N的数值同样可以根据需要人为进行设置，当N的数值越大时，则推荐对象的数量越多，反之，则推荐对象的数量越少。

主题可以是人为定义的，例如：主题可以人为定义为购物、体育、金融、娱乐、最需要的，最流行的、最新的等等。在一具体的实施例中，主题至少包括第一级主题以及第二级主题，其中，第一级主题为第二级主题的上级主题，每个第一级主题包括至少一个第二级主题。例如，第一级主题为“娱乐”，第二级主题为“影视明星”以及“歌手明星”等等。

在一具体的实施例中，计算设备根据N个推荐对象的类别区分数据进行聚类，从而得到X个主题。具体地，计算设备将N个推荐对象的类别区分数据作为聚类算法的输入，则输出为N个推荐对象的分类情况。举例进行说明，将推荐对象a₁至a₈的类别区分数据作为聚类算法的输入，则输出为对象a₁至a₃被聚合到同一个类别中，对象a₄和a₇被聚合到同一个类别中，对象a₅、a₆和a₈被聚合到同一个类别中。计算设备根据被聚合到同一类别的推荐对象的标签确定该类别的主题。例如，对象a₅、a₆和a₈的标签分别为金融、金融和财经，则对象a₅、a₆和a₈所在类别的主题可以确定为金融。其中，推荐对象的类别区分数据可以为推荐对象的类别和标签等等。聚类算法可以是K-means聚类算法、hierarchical聚类算法、K-MEDOIDS算法、CLARANS算法、BIRCH算法、CURE算法以及CHAMELEON算法等等。

在一具体的实施例中，计算设备预先设置X个主题以及X个主题中的每个主题对应的分类预设条件，其中，不同的主题对应不同的分类预设条件。例如，计算设备可以预先设置X个主题分别为“最需要的”、“最流行的”、“最新的”等等，则主题“最需要的”对应的分类预设条件为使用最频繁的且是在目标用户对对象的喜好值最高的前N个中的对象；“最流行的”对应的分类预设条件为大家都比较喜欢下载且是在目标用户对对象的喜好值最高的前N个中的对象；“最新的”可以定义为上架时间较短的且是在目标用户对对象的喜好值最高的前N个中的对象。计算设备判断N个推荐对象中的每个推荐对象的类别区分数据是否符合X个主题中的任意一个主题对应的分类预设条件，并将符合X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。其中，推荐对象的类别区分数据可以为推荐对象的使用次数、被下载次数和上架时间等等。

130：计算设备根据目标用户对X个主题中的每个主题中包括的推荐对象的喜好值计算得到目标用户对X个主题中的每个主题的喜好值。

将目标用户对X个主题中的每个主题中包括的推荐对象的喜好值作为公式(2)的输入，则输出为目标用户对X个主题中的每个主题中的喜好值。

Score(u,t)＝F(Sim(u,a₁),...,Sim(u,a_j),...,Sim(u,a_m)) 公式(2)

其中，Score(u,t)表示目标用户u对主题t的喜好值，Sim(u,a_j)表示目标用户u对推荐对象a_j的喜好值，a_j表示主题t中的任意一个推荐对象，m为表示主题t中的推荐对象的数量，0<j≤m，函数F为任意一个聚合函数，例如聚合函数为平均函数时，则公式(2)可以表示为：

Score(u,t)＝(Sim(u,a₁)+...+Sim(u,a_j)+...+Sim(u,a_m))/m。

举例进行说明，如果主题t中包括推荐对象a₁至a₃，目标用户对a₁的喜好值为0.8，目标用户对a₂的喜好值为0.6，目标用户对a₃的喜好值为0.4，则目标用户对主题t的喜好值＝(0.8+0.6+0.4)/3＝0.6。

140：计算设备将目标主题推送给目标用户。其中，目标主题为X个主题中的，目标用户的喜好值大于推荐阈值的主题。

推荐阈值可以根据需要人为进行设置，当推荐阈值设置得越高，则推荐的主题的数量越少，反之，则推荐的主题的数量越多。

在一具体的实施例中，计算设备将目标主题以如图5所示的展示表的方式推送给所述目标用户。其中，如图5所示的展示表500包括目标主题的名称510、目标主题中的推荐对象的图标520以及目标主题的主题描述530。其中，主题描述530对目标主题的特点或者推荐目标主题的理由等等进行描述。目标主题的名称510以大写居中的方式设置在展示表500的上方。目标主题510中的多个推荐对象的图标520以并列的方式设置在目标主题的名称510之下。目标主题510的主题描述530以明显的字体设置在多个推荐对象的图标520之下。通过展示表这种方式进行显示，能够清楚地表示出目标主题510的名称、目标主题510包括哪些推荐对象以及目标主题的主题描述530，吸引用户的兴趣并产生可观的收益。

在一具体的实施例中，计算设备将目标主题以图6所示的标签云的方式推送给目标用户。图6所示的标签云600包括目标主题的名称610以及目标主题中的推荐对象的标签620。在标签云600中，目标主题的名称610以大写的方式显示在标签云600中，目标主题中的推荐对象的标签620以比目标主题的名称610小的字号分布式显示在标签云600中。通过标签云600这种方式进行显示，能够便于对多个主题同时进行显示，而且，展示方式生动，能够吸引用户的兴趣并产生可观的收益。

请参阅图7，图7是本发明实施例提供的一种主题推荐装置的结构示意图。本实施例的主题推荐装置700包括：预测模块710、分类模块720、计算模块730以及推荐模块740。

预测模块710用于采集样本用户对M个对象的历史操作行为，并根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值，其中，M为大于或者等于1的正整数。

分类模块720用于采集N个推荐对象的类别区分数据，并根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题，其中，所述X个主题中的每个主题均包括所述N个推荐对象中的至少一个推荐对象，其中，所述N个推荐对象为所述M个对象中的部分或者全部，X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M。

计算模块730用于根据所述目标用户对所述X个主题中的每个主题中包括的推荐对象的喜好值计算得到所述目标用户对所述X个主题中的每个主题的喜好值。

推荐模块740用于将目标主题推送给所述目标用户，其中，所述目标主题为所述X个主题中的，所述目标用户的喜好值大于推荐阈值的主题。

可选地，所述历史操作行为包括以下至少一种操作行为：浏览、点击、下载、使用、付费、卸载和评价。

可选地，推荐模块740用于将所述目标主题以标签云的方式推送给所述目标用户，其中，所述标签云包括所述目标主题的名称以及所述目标主题中的推荐对象的标签

可选地，推荐模块740用于将所述目标主题以展示表的方式推送给所述目标用户，其中，所述展示表包括所述目标主题的名称以及所述目标主题中的推荐对象的图标。

可选地，所述主题至少包括第一级主题以及第二级主题，其中，所述第一级主题包括至少一个第二级主题。

可理解的是，主题推荐装置的具体执行步骤还可以参考前述方法实施例的内容，此处不再赘述。

请参阅图8，图8是本发明实施例提供的另一种主题推荐装置的结构示意图.本实施例的主题推荐装置是对图7所示的主题推荐装置的预测模块710、分类模块720优化而得到的。其中，所述预测模块710包括确定单元711、训练单元713以及预测单元715。所述分类模块720包括聚类单元721。

所述确定单元711用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据。

所述训练单元713用于根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练。

所述预测单元715用于将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

所述聚类单元721用于根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。

请参阅图9，图9是本发明实施例提供的又一种主题推荐装置的结构示意图.本实施例的主题推荐装置是对图7所示的主题推荐装置优化而得到的。

所述主题推荐装置还包括选择模块750。所述选择模块750用于将所述M个对象中，所述目标用户的喜好值大于选择阈值的对象选择为推荐对象；或者，按照目标用户的喜好值对所述M个对象从高至低进行排序，并将所述M个对象中序号为前N的对象选择为推荐对象。

所述预测模块710包括构建单元712、计算单元714、确定单元716以及预测单元718。其中，

构建单元712用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图。

计算单元714用于根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性。

确定单元716用于根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值，所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象，n为大于或者等于1的正整数，n≤M。

预测单元718用于根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

所述分类模块720包括预设单元722以及归入单元724。其中，

预设单元722用于预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件，其中，不同的主题对应不同的分类预设条件。

归入单元724用于判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。

请参阅图10，图10是本发明实施例提供的一种计算设备的结构示意图。本实施的计算设备1000包括：处理器1010、用户接口1020、输入输出单元、通讯单元1060以及存储器1070。

处理器1010是计算设备1000的运算中心，具有强大的运算能力，能够高速地进行各种运算。处理器1010可以是中央处理单元(Central Processing Unit，CPU)、数字信号处理(Digital Signal Process，DSP)器，微控制单元(MCU，Microcontroller Unit)或用于执行控制或运算的逻辑电路等。处理器1010可以是单核处理器，也可以是多核处理器。

用户接口(User Interface，UI)1020是系统和用户之间进行交互和信息交换的媒介，它实现信息的内部形式与人类可以接受形式之间的转换。用户接口1020可以包括命令接口、程序接口、图形接口三种。

输入输出单元可包括触控单元1040以及其他输入设备1050。触控单元1040也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控单元1040可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1010，并能接收处理器1010发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面，输入输出单元还可以包括其他输入设备1050。具体地，其他输入设备1050可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

通讯单元1060可以采用蜂窝技术、蓝牙技术、zibee技术、WLAN等无线技术进行通信，通讯单元1060还可以采用UART技术、打印口技术、USB技术和有线网络传输技术等等有线技术进行通信。

存储单元1070可以包括内部存储器以及外部存储器。内部存储器用来存放当前运行程序的指令和数据，并直接与处理器1010交换信息，是处理器1010处理数据的主要来源。内部存储器可以包括只读存储器以及随机存储器。外部存储器储存容量大，价格低，但储存速度慢，用于存放大量暂时不用的程序，数据和中间结果，需要时，可成批的与内部存储器进行信息交换。外部存储器只能与内部存储器交换信息，不能被计算机系统的其他部件直接访问。常用的外部存储器有磁盘，磁带，光盘等。

处理器1010执行述一个或者一个以上程序包含用于进行以下操作的指令：

采集样本用户对M个对象的历史操作行为，并根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值，其中，M为大于或者等于1的正整数；

采集N个推荐对象的类别区分数据，并根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题，其中，所述X个主题中的每个主题均包括所述N个推荐对象中的至少一个推荐对象，其中，所述N个推荐对象为所述M个对象中的部分或者全部，X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M；

根据所述目标用户对所述X个主题中的每个主题中包括的推荐对象的喜好值计算得到所述目标用户对所述X个主题中的每个主题的喜好值；

将目标主题推送给所述目标用户，其中，所述目标主题为所述X个主题中的，所述目标用户的喜好值大于推荐阈值的主题。

可选地，处理器1010还用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据；根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练；将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

可选地，处理器1010还用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图；根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性；根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值，所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象，n为大于或者等于1的正整数，n≤M；根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

可选地，处理器1010还用于根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。

可选地，处理器1010还用于预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件，其中，不同的主题对应不同的分类预设条件；判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。

可选地，处理器1010还用于将所述目标主题以展示表的方式推送给所述目标用户，其中，所述展示表包括所述目标主题的名称以及所述目标主题中的推荐对象的图标。

可选地，处理器1010还用于将所述目标主题以标签云的方式推送给所述目标用户，其中，所述标签云包括所述目标主题的名称以及所述目标主题中的推荐对象的标签。

可选地，处理器1010还用于将所述M个对象中，所述目标用户的喜好值大于选择阈值的对象选择为推荐对象；或者，按照目标用户的喜好值对所述M个对象从高至低进行排序，并将所述M个对象中序号为前N的对象选择为推荐对象。

可以理解的是，计算设备1000具体执行步骤还可以参考前述方法实施例的内容，此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

Claims

1.一种主题推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值具体包括：

根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据；

根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练；

将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

3.根据权利要求1所述的方法，其特征在于，根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值具体包括：

根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图；

根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性；

根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值，所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象，n为大于或者等于1的正整数，n≤M；

根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

4.根据权利要求1至3任一权利要求所述的方法，其特征在于，所述历史操作行为包括以下至少一种操作行为：浏览、点击、下载、使用、付费、卸载和评价。

5.根据权利要求1至4任一权利要求所述的方法，其特征在于，根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题具体包括：

根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。

6.根据权利要求1至4任一权利要求所述的方法，其特征在于，根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题具体包括：

预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件，其中，不同的主题对应不同的分类预设条件；

判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。

7.根据权利要求1-6任一权利要求所述的方法，其特征在于，将目标主题推送给所述目标用户具体为：

将所述目标主题以展示表的方式推送给所述目标用户，其中，所述展示表包括所述目标主题的名称以及所述目标主题中的推荐对象的图标。

8.根据权利要求1至6任一权利要求所述的方法，其特征在于，将目标主题推送给所述目标用户具体为：

将所述目标主题以标签云的方式推送给所述目标用户，其中，所述标签云包括所述目标主题的名称以及所述目标主题中的推荐对象的标签。

9.根据权利要求1至8任一权利要求所述的方法，其特征在于，所述主题至少包括第一级主题以及第二级主题，其中，所述第一级主题包括至少一个第二级主题。

10.根据权利要求1至9任一权利要求所述的方法，其特征在于，所述采集N个推荐对象的类别区分数据之前，所述方法还包括：

将所述M个对象中，所述目标用户的喜好值大于选择阈值的对象选择为推荐对象；或者，

按照目标用户的喜好值对所述M个对象从高至低进行排序，并将所述M个对象中序号为前N的对象选择为推荐对象。

11.一种主题推荐装置，其特征在于，所述装置包括预测模块、分类模块、计算模块以及推荐模块，其中，

所述预测模块用于采集样本用户对M个对象的历史操作行为，并根据所述样本用户对所述M个对象中的每个对象的历史操作行为预测目标用户对所述M个对象中的每个对象的喜好值，其中，M为大于或者等于1的正整数；

所述分类模块用于采集N个推荐对象的类别区分数据，并根据所述N个推荐对象的类别区分数据将所述N个推荐对象进行类别区分，从而得到X个主题，其中，所述X个主题中的每个主题均包括所述N个推荐对象中的至少一个推荐对象，其中，所述N个推荐对象为所述M个对象中的部分或者全部，X为大于或者等于1的正整数，N为大于或者等于1的正整数，且，N≤M；

所述计算模块用于根据所述目标用户对所述X个主题中的每个主题中包括的推荐对象的喜好值计算得到所述目标用户对所述X个主题中的每个主题的喜好值；

所述推荐模块用于将目标主题推送给所述目标用户，其中，所述目标主题为所述X个主题中的，所述目标用户的喜好值大于推荐阈值的主题。

12.根据权利要求10所述的装置，其特征在于，所述预测模块包括确定单元、训练单元以及预测单元，其中，

所述确定单元用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为确定所述样本用户对所述M个对象中的每个对象的喜好数据；

所述训练单元用于根据样本用户的特征数据、样本用户对所述M个对象中的每个对象的喜好数据、上下文特征和所述M个对象中的每个对象的特征数据对预测模型进行训练；

所述预测单元用于将所述目标用户的特征数据和所述M个对象中的每个对象的特征数据输入到训练好的预测模型以预测所述目标用户对所述M个对象中的每个对象的喜好值。

13.根据权利要求11所述的装置，其特征在于，所述预测模块包括构建单元、计算单元、确定单元以及预测单元，

所述构建单元用于根据所述样本用户对所述M个对象中的每个对象的历史操作行为构建所述样本用户和所述M个对象之间的交互图；

所述计算单元用于根据所述样本用户和所述M个对象之间的交互图计算所述M个对象两两之间的相似性；

所述确定单元用于根据所述目标用户对n个操作对象中的每个操作对象的历史操作行为确定所述目标用户对所述n个操作对象中的每个操作对象的喜好值，所述操作对象为所述M个对象中，所述目标用户曾经进行了历史操作行为的对象，n为大于或者等于1的正整数，n≤M；

所述预测单元用于根据所述目标用户对所述n个操作对象中的每个操作对象的喜好值以及所述M个对象两两之间的相似性预测所述目标用户对所述M个对象中的每个对象的喜好值。

14.根据权利要求11至13任一权利要求所述的装置，其特征在于，所述历史操作行为包括以下至少一种操作行为：浏览、点击、下载、使用、付费、卸载和评价。

15.根据权利要求11至14任一权利要求所述的装置，其特征在于，所述分类模块包括聚类单元，

所述聚类单元用于根据所述N个推荐对象的类别区分数据进行聚类，从而得到X个主题。

16.根据权利要求11至14任一权利要求所述的装置，其特征在于，所述分类模块包括预设单元以及归入单元，

所述预设单元用于预先设置所述X个主题以及所述X个主题中的每个主题对应的分类预设条件，其中，不同的主题对应不同的分类预设条件；

所述归入单元用于判断所述N个推荐对象中的每个推荐对象的类别区分数据是否符合所述X个主题中的任意一个主题对应的分类预设条件，并将符合所述X个主题中的任意一个主题对应的分类预设条件的推荐对象归入对应的主题。

17.根据权利要求11-16任一权利要求所述的装置，其特征在于，所述推荐模块具体用于将所述目标主题以展示表的方式推送给所述目标用户，其中，所述展示表包括所述目标主题的名称以及所述目标主题中的推荐对象的图标。

18.根据权利要求11至16任一权利要求所述的装置，其特征在于，所述推荐模块具体用于将所述目标主题以标签云的方式推送给所述目标用户，其中，所述标签云包括所述目标主题的名称以及所述目标主题中的推荐对象的标签。

19.根据权利要求11至18任一权利要求所述的装置，其特征在于，所述主题至少包括第一级主题以及第二级主题，其中，所述第一级主题包括至少一个第二级主题。

20.根据权利要求11至19任一权利要求所述的装置，其特征在于，所述装置还包括选择模块，

所述选择模块用于将所述M个对象中，所述目标用户的喜好值大于选择阈值的对象选择为推荐对象；或者，

所述选择模块用于按照目标用户的喜好值对所述M个对象从高至低进行排序，并将所述M个对象中序号为前N的对象选择为推荐对象。