CN105989005A

CN105989005A - 一种信息的推送方法及装置

Info

Publication number: CN105989005A
Application number: CN201510041409.2A
Authority: CN
Inventors: 刘娟
Original assignee: China Mobile Communications Group Co Ltd
Current assignee: China Mobile Communications Group Co Ltd
Priority date: 2015-01-27
Filing date: 2015-01-27
Publication date: 2016-10-05
Anticipated expiration: 2035-01-27
Also published as: CN105989005B

Abstract

本发明公开了一种信息的推送方法及装置，该方法包括：获取用户标识和与所述用户标识对应的用户的活动历史数据，针对任一用户标识对应的用户，分别第一概率和根据所述用户的好友活动历史数据，确定第二概率；并确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率；根据所述第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率；根据第四概率，向所述用户进行信息推送，用以解决基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。

Description

一种信息的推送方法及装置

技术领域

本发明涉及通信技术领域，尤其是涉及一种信息的推送方法及装置。

背景技术

随着互联网的飞速发展，互联网中的内容也呈现着爆炸式的增长，为了解决用户在面临海量内容时的信息过载问题，推荐技术应运而生。作为最早和最成功的推荐技术之一，协同过滤推荐(英文：Collaborative FilteringRecommendations，缩写：CFR)算法已被成功的运用于电子商务系统中。

通常情况下，可以基于协同过滤推荐算法对用户的活动进行挖掘，进而根据挖掘结果向用户推送相应的信息。其中活动是指由共同目的联合起来并完成一定社会职能的动作的总和。活动由目的、动机和动作构成，具有完整的结构系统。例如，用户出外就餐，可以做为一个活动，包括就餐时间、就餐地点、就餐内容等等，又如用户进行商场购物等，也可以作为一个活动。而基于协同过滤推荐算法向用户推送信息的方式主要分为下述两种方式：

第一种方式：基于内容的协同过滤推荐。

基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜好，并分析内容之间的相似性，为目标用户推荐和他过去喜欢的内容类似的内容。该种方式的缺陷在于基于内容的推荐需要对内容的特征做抽取和处理，而很多情况下很难从内容中抽取出能准确代表该内容的信息，而且推荐的结果缺乏多样性，不能挖掘用户的潜在兴趣。

第二种方式：基于用户的协同过滤推荐。

基于用户的协同过滤推荐则根据目标用户与其他用户的相似性，为目标用户推荐和他最为相似的一些用户喜欢的内容：即根据用户的历史评价信息计算两用户的相似性，选出目标用户的最近邻居用户，利用他们对某一内容评价的加权平均值来预测目标用户对该内容的喜好程度。基于用户的推荐则需要依赖于其他用户，由于有用户评价的内容往往只占全部内容的少数，所以能够用来计算用户相似性的数据极端稀疏，导致推荐的结果有偏差；而且对于一个新的内容，缺乏历史用户评价数据，也很难得到推荐，导致可扩展性不足。

综上所述，基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大。

发明内容

本发明提供了一种信息的推送方法，用以解决基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。

一种信息的推送方法，包括：

获取用户标识和与所述用户标识对应的用户的活动历史数据，其中所述活动历史数据包括用户参加活动的活动场景和活动类型；

针对任一用户标识对应的用户，根据所述用户的活动历史数据，针对任一活动类型，分别确定第一概率和第二概率，其中所述第一概率是用户未参加过的活动的概率，所述未参加过的活动包含在所述活动类型中；所述第二概率是根据所述用户的好友活动历史数据，确定出的用户参加过的活动的概率，所述参加过的活动包含在所述活动类型中；并

确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率；

根据所述第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率；

根据第四概率，向所述用户进行信息推送。

针对任一活动类型，确定第一概率，包括：

针对任一活动类型，确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合；

确定所述活动类型中，所述用户之前未参加过的活动与所述活动集合的相似度；

所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。

针对任一活动类型，根据所述用户的好友活动历史数据，确定第二概率，包括：

针对任一活动类型，根据所述用户的好友活动历史数据，获得最邻居节点集合，其中所述邻居节点集合是在所述活动类型中，所述用户和好友共同参加的活动的相似度符合设定规则的用户；

针对邻居节点集合中的任一邻居节点，确定所述邻居节点参加所述活动类型中的活动的比率；

根据所述比率确定邻居节点集合的权重和值；

根据所述权重和值，确定所述用户参加所述活动类型的活动的第二概率。

确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率，包括：

针对任一活动类型，确定所述用户在不同活动场景中参加所述活动类型的频率；以及

在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值；

所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。

按照下述公式根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率：

P₄＝P₃*[δ*P₁+(1-δ)*P₂]

其中，P₄是第四概率，P₃是第三概率，P₁是第一概率，δ是设定的权重值，P₂是第二概率。

一种信息的推送装置，包括：

获取单元，用于获取用户标识和与所述用户标识对应的用户的活动历史数据，其中所述活动历史数据包括用户参加活动的活动场景和活动类型；

概率确定单元，用于针对任一用户标识对应的用户，根据所述用户的活动历史数据，针对任一活动类型，分别确定第一概率和第二概率，其中所述第一概率是用户未参加过的活动的概率，所述未参加过的活动包含在所述活动类型中；所述第二概率是根据所述用户的好友活动历史数据，确定出的用户参加过的活动的概率，所述参加过的活动包含在所述活动类型中；并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率；根据所述第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率；

信息推送单元，用于根据第四概率，向所述用户进行信息推送。

所述概率确定单元，具体用于针对任一活动类型，确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合；确定所述活动类型中，所述用户之前未参加过的活动与所述活动集合的相似度；所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。

所述概率确定单元，具体用于针对任一活动类型，根据所述用户的好友活动历史数据，获得最邻居节点集合，其中所述邻居节点集合是在所述活动类型中，所述用户和好友共同参加的活动的相似度符合设定规则的用户；针对邻居节点集合中的任一邻居节点，确定所述邻居节点参加所述活动类型中的活动的比率；根据所述比率确定邻居节点集合的权重和值；根据所述权重和值，确定所述用户参加所述活动类型的活动的第二概率。

所述概率确定单元，具体用于针对任一活动类型，确定所述用户在不同活动场景中参加所述活动类型的频率；以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值；所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。

所述概率确定单元，具体用于按照下述公式根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率：

P₄＝P₃*[δ*P₁+(1-δ)*P₂]

通过上述技术方案，综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法，并将目标用户所处的活动场景作为一个影响因子，加入到推荐的过程中，从而根据不同的活动情景调整推荐结果，可以进一步满足用户的心理需求。解决基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。

附图说明

图1为本发明实施例一中，提出的信息的推送方法流程图；

图2为本发明实施例二中，提出的信息的推送装置结构组成示意图。

具体实施方式

针对一般情况下基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题，本发明实施例提出的技术方案中，综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法，并将目标用户所处的活动场景作为一个影响因子，加入到推荐的过程中，从而根据不同的活动情景调整推荐结果，可以进一步满足用户的心理需求。解决基于协同过滤推荐方式进行信息推送时，推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。

下面将结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。

实施例一

本发明实施例一提出一种信息的推送方法，如图1所示，其具体处理过程如下述：

步骤101，获取用户标识和与用户标识对应的用户的活动历史数据。

其中活动历史数据包括用户参加活动的活动场景和活动类型。

以一具体实例来详细阐述本发明实施例一提出的技术方案。

用户标识以u表示，获取用户标识，全部用户标识组成用户集合。用户集合以U表示，具体如下述：

步骤一：用户u_i及其它用户共同组成的用户集合U＝{u₁,u₂,...u_i,...u_m}。

步骤二：获得各用户的活动历史数据。

首先，确定活动集合及活动类型。具体如下述：

A：所有活动的集合作为活动集合，以A＝{a₁,a₂,...a_j,...a_n}表示。

其中，本发明实施例一提出的技术方案中，活动可以是任何类型的活动，例如餐厅就餐、商场购物等。以餐厅就餐为例，例如餐厅1就餐、餐厅2就餐…餐厅n就餐等。

具体地，活动集合中的每个元素表示一个活动，元素的值表示该活动在不同纬度的平均评分。

例如，活动a_j的特征向量为其中每一个值都代表该活动在不同维度的平均评分。以活动为餐厅就餐为例，其特征向量可以表示为(口味评分、价格评分、服务评分、环境评分、速度评分等)，评分以5分为满分制，例如

{\overset{&RightArrow;}{a}}_{j} = (2,5,3,1,4) .

B：确定活动类型。以C＝{c₁,c₂,...c_h,...c_k},k＜＜n表示活动类型集合。以活动是餐厅就餐为例，活动类型可以分为火锅、西餐、快餐、烧烤、粤菜等。

C：将活动集合A＝{a₁,a₂,...an}中的元素a_j按照所属活动类型进行排序，可以得到新的活动集合

A = {A_{c_{1}}, A_{c_{2}}, . . . A_{c_{h}}, . . . A_{c_{k}}},

其中表示在活动集合A中属于活动类型c_h的活动a_j的集合；

其次，确定活动场景，将活动场景进行分类。

假设有两个维度的活动场景，第一维度E₁＝{e_1,1,e_1，2,...e_1,r,...e_1,s}，例如早上、中午、晚上；第二维度E₂＝{e_2,1,e_2，2,...e_2,r,...e_2,s}，例如工作日，节假日。

再次，构建用户标识和活动历史数据矩阵。

用户u_i在活动场景e_1,r参加了活动a_j的历史次数为在活动场景e_2,r参加了活动a_j的历史次数为

假设e_1,r表示中午，e_2,r表示晚上，a_j表示火锅分类下的小肥羊餐厅，用户u_i在中午去小肥羊吃饭的次数为15，工作日去小肥羊吃饭的次数为12。

步骤三：对获得的活动历史数据进行统计分析。

例如，用户u_i参加了活动a_j的历史总次数为在某一维度所有活动场景下参加该活动的总和：

R_{u_{i}, a_{j}} = \underset{e_{1, r} &Element; E_{1}}{Σ} r_{u_{i}, a_{j}, e_{1, r}} = \underset{e_{2, r} &Element; E_{2}}{Σ} r_{u_{i}, a_{j}, e_{2, r}} .

其中，是用户u_i参加了活动a_j的历史总次数为在某一维度所有活动场景下参加该活动的总和。

用户u_i参加的属于活动类型c_h的活动集合为活动总次数

R_{u_{i}, c_{h}} = \underset{a_{j} &Element; A_{c_{h}}}{Σ} R_{u_{j}, a_{j}} .

其中，是活动总次数。

用户u_i在活动场景e_1,r中参加的属于活动类型c_h的活动历史次数在活动场景e_2,r中参加的属于活动类型c_h的活动历史次数为

R_{u_{i}, c_{h}, e_{2, r}} = \underset{a_{j} &Element; c_{h}}{Σ} r_{u_{i}, a_{j}, e_{2, r}} .

其中，是用户u_i在活动场景e_1,r中参加的属于活动类型c_h的活动历史次数，是用户u_i在活动场景e_2,r中参加的属于活动类型c_h的活动历史次数。

步骤102，针对任一用户标识对应的用户，以及针对任一活动类型，根据该用户的活动历史数据，分别确定第一概率和第二概率。

其中第一概率是用户未参加过的活动的概率，未参加过的活动包含在所述活动类型中；第二概率是根据用户的好友活动历史数据，确定出的用户参加过的活动的概率，所述参加过的活动包含在所述活动类型中。

其中，针对任一活动类型，确定用户参加所述活动类型中之前未参加过的活动的第一概率，包括：

步骤一：针对任一活动类型，确定该用户参加过的属于该活动类型的全部活动特征组成的活动集合。

步骤二：确定该活动类型中，该用户之前未参加过的活动与该活动集合的相似度。

步骤三：将确定出的相似度作为该用户参加该活动类型中之前未参加过的活动的第一概率。

下面以一具体实例来详细阐述第一概率的计算方法。确定基于用户u_i历史活动的记录，预测用户u_i会参加活动类型c_h中该用户u_i之前未参加过的活动a_j的第一概率，其具体方法如下述：

A：获取用户u_i参加过的属于活动类型c_h的所有活动特征。

对于用户u_i，参加过的属于活动类型c_h的所有活动的次数为活动集合记为计算活动集合的平均特征向量

\overset{&RightArrow;}{A_{u_{i}, c_{h}}} = \underset{a_{j} &Element; A_{u_{i}, c_{h}}}{Σ} \overset{&RightArrow;}{a_{j}} / num (A_{u_{i}, c_{h}}) .

其中，该平均特征向量表示该用户u_i对于活动类型c_h活动的喜好特征值。

以火锅类和(口味评分、价格评分、服务评分、环境评分、速度评分)为特征属性为例，评分以5分为满分制，针对用户张三可以计算出则代表张三在选择火锅时，更喜欢口味好和价格实惠的餐厅，对环境要求最低。

B：计算活动类型c_h中新活动a_j与活动集合的相似度。

对于用户u_i未参加过的属于活动类型c_h的活动的a_j，令其和活动集合的相似度为：

{sim}_{a_{j}, A_{u_{i}, c_{h}}} = &PartialD; * \frac{\overset{&RightArrow;}{a_{j}} * \overset{&RightArrow;}{A_{u_{i}, c_{h}}}}{| \overset{&RightArrow;}{a_{j}} | * | \overset{&RightArrow;}{A_{u_{i}, c_{h}}} |} + (1 - &PartialD;) * (1 - \frac{| | \overset{&RightArrow;}{a_{j}} | - | \overset{&RightArrow;}{A_{u_{i}, c_{h}}} | |}{\max (| \overset{&RightArrow;}{a_{j}} |, | \overset{&RightArrow;}{A_{u_{i}, c_{h}}} |)})

其中，表示a_j和之间的相似度，表示两向量夹角的余弦值，即方向相似度，表示两向量的长度相似性，表示权重，本发明实施例一中提出的技术方案，

针对任一活动类型，根据该用户的好友活动历史数据，确定该用户参加所述活动类型的活动的第二概率，包括下述流程：

步骤一：针对任一活动类型，根据该用户的好友活动历史数据，获得邻居节点集合。

其中邻居节点集合是在活动类型中，该用户和好友共同参加的活动的相似度符合设定规则的用户。

步骤二：针对邻居节点集合中的任一邻居节点，确定该邻居节点参加该活动类型中的活动的比率。

步骤三：根据比率确定邻居节点集合的权重和值。

步骤四：根据得到的权重和值，确定该用户参加所述活动类型的活动的第二概率。

下面以一具体实例来详细阐述第二概率的计算方法。

基于用户u_i的好友的活动历史数据，在当前提出的基于用户协同过滤推荐算法的基础上，本发明实施例一提出的技术方案中，通过在某一类中与用户u_i最为相似的一些用户(即用户u_i关于活动类型c_h的邻居节点)来预测用户u_i在活动类型c_h中会参加某活动a_j的第二概率，其具体处理如下述：

首先，计算用户u_i关于活动类型c_h的邻居节点。

令用户u_i与用户u_i’共同参加的属于活动类型c_h的活动集合为则可以采用余弦相似性的方法来计算用户u_i与用户u_i’在参加活动类型c_h的活动时的相似度

{sim}_{u_{i}, u_{i^{,}}, c_{h}} = \underset{a_{j} &Element; A_{u_{i}, u_{i}^{,}, c_{h}}}{Σ} R_{u_{i}, a_{j}} * R_{u_{i^{'}}, a_{j}} / \sqrt{\underset{a_{j} &Element; A_{u_{i}, u_{i}^{,}, c_{h}}}{Σ} {R^{2}}_{u_{i}, a_{j}}} * \sqrt{\underset{a_{j} &Element; A_{u_{i}, u_{i}^{,}, c_{h}}}{Σ} {R^{2}}_{u_{i^{'}}, a_{j}}}

其中，是相似度。

一种较佳地实施方式，根据得到的相似度，取得到的相似度中最大的m₀个用户作为用户u_i关于活动类型c_h的最佳邻居节点该得到的最佳邻居节点作为符合设定规则的邻居节点。

在确定符合设定规则的邻居节点时，也可采用阈值过滤的方法，例如可以取的所有用户作为符合设定规则的邻居节点，即最佳邻居节点

其次，预测用户u_i参加活动类型c_h中某活动a_j的第二概率。

步骤一：计算邻居节点用户u_i’在活动类型c_h中参加了活动a_j的比率：

P_{(u_{i^{,}}, a_{j}) / c_{h}} = R_{u_{i^{,}}, a_{j}} / R_{u_{i^{,}}, c_{h}} .

其中，该比率标识用户u_i’在活动类型c_h中对活动a_j的偏好。

步骤二：用中所有用户的权重和值，来预测用户u_i会参加活动a_j的第二概率：

P_{(u_{i}, a_{j}) / c_{h}} = \underset{u_{i^{,}} &Element; {NBU}_{u_{i}, c_{h}}}{Σ} {sim}_{u_{i}, u_{i^{,}}, c_{h}} * P_{u_{i^{,}}, a_{j}} / \underset{u_{i^{,}} &Element; {NBU}_{u_{i}, c_{h}}}{Σ} {sim}_{u_{i}, u_{i^{,}}, c_{h}}

其中是第二概率。

步骤103，确定该用户在不同活动场景中参加不同活动类型的活动的第三概率。

确定用户在不同活动场景中参加不同活动类型的活动的第三概率，包括：

步骤一：针对任一活动类型，确定该用户在不同活动场景中参加该活动类型的频率。

步骤二：在任一活动场景中参加该活动类型的活动占参加全部类型活动的比值。

步骤三：得到的比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。

下面以一具体实例来详细阐述确定第三概率的具体实施方式。

首先，当前活动场景为任意活动场景e_1,r和活动场景e_2,r的组合，根据活动场景，情景化的计算用户u_i在该活动场景下参加属于活动类型c_h的活动频率：

R_{u_{i}, c_{h}, (e_{1, r}, e_{2, r})} = R_{u_{i}, c_{h}, e_{1, r}} * (R_{u_{i}, c_{h}, e_{2, r}} * R_{u_{i}, c_{h}}) .

其中是用户u_i在该活动场景下参加属于活动类型c_h的活动频率。

其次，计算在当前活动场景下参加该活动类型活动占全部活动类型的活动的比值：

P_{u_{i}, c_{h}, (e_{1, r}, e_{2, r})} = R_{u_{i}, c_{h}, (e_{1, r}, e_{2, r})} / \underset{c_{h} &Element; C}{Σ} R_{u_{i}, c_{h}, (e_{1, r}, e_{2, r})}

其中，是在当前活动场景下参加该活动类型活动占全部活动类型的活动的比值。

从而针对用户当前所处的活动场景，根据比值来针对性的推荐属于不同活动类型的活动。

下面以一具体实例来进行详细阐述：

例如下述表1是某用户张三在活动场景为E₁＝{中午，晚上}，E₁＝{工作日，周末}两个维度，活动有C＝{火锅,西餐,快餐}三种情况下的活动-活动场景分布表格：

表1

	中午	晚上	工作日	周末	合计
						火锅	6	24	12	18	30
西餐	4	6	6	4	10
						快餐	30	15	40	5	45

则张三在工作日的中午：

选择吃火锅的次数：

R(火锅/工作日*中午)＝12*(6/30)＝12/5。

选择吃西餐的次数：

R(西餐/工作日*中午)＝6*(4/10)＝12/5。

选择吃快餐的次数：

R(快餐/工作日*中午)＝40*(30/45)＝80/3。

吃火锅的概率：

P(火锅/工作日*中午)＝12/5/(12/5+12/5+80/3)＝9/118。

吃西餐的概率：

P(西餐/工作日*中午)＝12/5/(12/5+12/5+80/3)＝9/118。

吃快餐的概率：

P(快餐/工作日*中午)＝80/3/(12/5+12/5+80/3)＝50/59。

步骤104，根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率。

P₄＝P₃*[δ*P₁+(1-δ)*P₂]

下面以一具体实例来详细阐述本发明实施例提出的第四概率的确定方法。

结合当前用户所处的活动情景，综合基于活动的协同过滤和基于用户的协同过滤两个方面，预测用户u_i在当前活动场景下参加活动a_j的概率：

假设当前活动场景为e_1,r、e_2,r，则用户u_i未参加过的任一活动a_j，用户u_i会参加该活动a_j的概率为：

P_{(u_{i}, a_{j}) / (e_{1, r}, e_{2, r})} = P_{(u_{i}, c_{h}) / (e_{1, r}, e_{2, r})} * [σ * si m_{a_{j}, A_{u_{i}, c_{h}}} + (1 - σ) * P_{(u_{i}, a_{j}) / c_{h}}]

其中是当前活动场景为e_1,r、e_2,r，用户u_i会参加未参加过的活动a_j的概率，

δ是设定的权重值，0≤σ≤1，表示基于活动的协同过滤在结果中所占的权重，即用户历史数据对当前推荐结果的影响程度；δ的取值根据推荐方法的策略，可动态灵活调整；

步骤105，根据第四概率，向该用户进行信息推送。

本发明实施例提出的技术方案中，针对任一用户，和所有的活动类型，对该用户未参加过的所有活动都确定第四概率值。

也就是说，针对任一用户u_i，和所有的活动类型，首先对该用户u_i未参加过的所有活动a_j都求概率

其次，针对活动类型集合C＝{c₁,c₂,...c_h,...c_k}进行遍历，对每个活动类型都执行上述求取过程，得到用户u_i在当前活动场景下，在所有活动类型集合中，会参加活动a_j的概率

再次结合当前活动情景确定用户u_i的最佳候选活动节点取最大的n₀个活动作为用户u_i的候选活动节点

最后，结合当前活动场景对用户u_i进行活动推荐：从中按从大到小的顺序选出活动节点，为用户u_i进行推荐。

实施例二

本发明实施例特提出一种信息的推送装置，如图2所示，该装置包括：

获取单元201，用于获取用户标识和与所述用户标识对应的用户的活动历史数据，其中所述活动历史数据包括用户参加活动的活动场景和活动类型。

概率确定单元202，用于针对任一用户标识对应的用户，根据所述用户的活动历史数据，针对任一活动类型，分别确定第一概率和第二概率，其中所述第一概率是用户未参加过的活动的概率，所述未参加过的活动包含在所述活动类型中；所述第二概率是根据所述用户的好友活动历史数据，确定出的用户参加过的活动的概率，所述参加过的活动包含在所述活动类型中；并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率；根据所述第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率。

具体地，上述概率确定单元202，具体用于针对任一活动类型，确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合；确定所述活动类型中，所述用户之前未参加过的活动与所述活动集合的相似度；所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。

具体地，上述概率确定单元202，具体用于针对任一活动类型，根据所述用户的好友活动历史数据，获得最邻居节点集合，其中所述邻居节点集合是在所述活动类型中，所述用户和好友共同参加的活动的相似度符合设定规则的用户；针对邻居节点集合中的任一邻居节点，确定所述邻居节点参加所述活动类型中的活动的比率；根据所述比率确定邻居节点集合的权重和值；根据所述权重和值，确定所述用户参加所述活动类型的活动的第二概率。

具体地，上述概率确定单元202，具体用于针对任一活动类型，确定所述用户在不同活动场景中参加所述活动类型的频率；以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值；所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。

具体地，上述概率确定单元202，具体用于按照下述公式根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率：

P₄＝P₃*[δ*P₁+(1-δ)*P₂]

信息推送单元203，用于根据第四概率，向所述用户进行信息推送。

基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜好，并分析内容之间的相似性，为目标用户推荐和他过去喜欢的内容类似的内容。基于内容的推荐不依赖于其他用户，可以有效避免有用户恶意作弊的情况；并且新的内容可以及时得到推荐。基于用户的协同过滤推荐则根据目标用户与其他用户的相似性，为目标用户推荐和他最为相似的一些用户喜欢的内容：即根据用户的历史评价信息计算两用户的相似性，选出目标用户的最近邻居用户，利用他们对某一内容评价的加权平均值来预测目标用户对该内容的喜好程度。该推荐方法能够挖掘用户潜在的喜好，为用户推荐与其历史喜好不同的新型内容，并且无需对内容做复杂的特征处理。但是基于内容的推荐需要对内容的特征做抽取和处理，而很多情况下很难从内容中抽取出能准确代表该内容的信息，且推荐的结果缺乏多样性，不能挖掘用户的潜在兴趣。基于用户的推荐则需要依赖于其他用户，由于有用户评价的内容往往只占全部内容的少数，所以能够用来计算用户相似性的数据极端稀疏，导致推荐的结果有偏差；而且对于一个新的内容，缺乏历史用户评价数据，也很难得到推荐，导致可扩展性不足。

基于此，本发明实施例上述提出的技术方案中，综合这两种协同过滤推荐方法，为每一种推荐方法赋予一定的权重并进行加权组合，能得到更为准确和丰富的推荐结果。

并且，以上两种传统的协同过滤推荐方法只考虑了用户-内容评分这两个维度，较少考虑到户当前所处的情景会对用户的喜好产生影响，导致推荐结果无法完全体现用户的意图。用户对一个内容的喜好往往很大程度上依赖于当前的环境(时间、位置、天气等)，但是用户的选择会根据环境的不同而发生变化，例如用户在中午往往比在晚上更倾向于吃快餐；所以推荐算法不仅需要采用历史数据和其他用户的数据来挖掘目标用户的喜好，更需要根据目标用户所处的环境作为辅助判断。而传统的协同过滤推荐方法也没有考虑内容所属的类别会对内容的相似性与用户最近邻居的选择产生影响。因为两个用户的相似性会因为内容的类别而有所不同，例如对于餐厅这项内容，用户A和用户B都喜欢吃火锅类，但是用户A还喜欢烧烤类，但是用户B不喜欢烧烤类，则对火锅类内容进行预测时，选择用户B作为用户A的邻居节点较为合理，但是对烧烤类内容进行预测时，则不应选择用户B作为用户A的邻居节点。故利用用户对同一个类别内容的评价计算用户对于该类别的相似性更为合理。同理，对属于同一个类别的内容计算相似性也更为精确，例如对同属于火锅类的餐厅来比较相似性。

本发明综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法，并做了如下优化：

一、将目标用户所处的情景信息作为一个影响因子，加入到推荐的过程中，得到在当前场景下目标用户会选择某一类型内容的概率；从而根据不同的情景调整推荐结果，可以进一步满足用户的心理需求。

二、对每个类别的内容分别进行内容相似性和用户相似性的计算，使得内容的最近邻居节点和用户的最佳邻居节点随着内容类别的变化而动态调整，即得出在某一类别下，目标用户最可能喜好的内容；再结合在当前场景下用户选择该类别的概率，最后得到在当面场景下用户选择该内容的概率，用该概率值为用户进行推荐，能够提高对用户喜好的预测精确度。

本发明实施例提出的技术方案，可以避免了单独基于内容协同过滤推荐和单独基于用户协同过滤推荐的不足，而且由于推荐时考虑了不同类别内容的差异，使得推荐结果更为准确；并根据目标用户所处的当前场景对推荐结果进行了个性化动态调整，使得推荐结果更符合用户心理；最终对目标用户进行更精确、更符合当前场景的推荐。

本领域的技术人员应明白，本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种信息的推送方法，其特征在于，包括：

根据第四概率，向所述用户进行信息推送。

2.如权利要求1所述的方法，其特征在于，针对任一活动类型，确定第一概率，包括：

3.如权利要求1所述的方法，其特征在于，针对任一活动类型，根据所述用户的好友活动历史数据，确定第二概率，包括：

根据所述比率确定邻居节点集合的权重和值；

4.如权利要求1所述的方法，其特征在于，确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率，包括：

5.如权利要求1所述的方法，其特征在于，按照下述公式根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率：

P₄＝P₃*[δ*P₁+(1-δ)*P₂]

6.一种信息的推送装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述概率确定单元，具体用于针对任一活动类型，确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合；确定所述活动类型中，所述用户之前未参加过的活动与所述活动集合的相似度；所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。

8.如权利要求6所述的装置，其特征在于，所述概率确定单元，具体用于针对任一活动类型，根据所述用户的好友活动历史数据，获得最邻居节点集合，其中所述邻居节点集合是在所述活动类型中，所述用户和好友共同参加的活动的相似度符合设定规则的用户；针对邻居节点集合中的任一邻居节点，确定所述邻居节点参加所述活动类型中的活动的比率；根据所述比率确定邻居节点集合的权重和值；根据所述权重和值，确定所述用户参加所述活动类型的活动的第二概率。

9.如权利要求6所述的装置，其特征在于，所述概率确定单元，具体用于针对任一活动类型，确定所述用户在不同活动场景中参加所述活动类型的频率；以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值；所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。

10.如权利要求6所述的装置，其特征在于，所述概率确定单元，具体用于按照下述公式根据第一概率、第二概率和第三概率，确定用户在任一活动场景中参加指定类型活动的第四概率：

P₄＝P₃*[δ*P₁+(1-δ)*P₂]