CN105989005A - 一种信息的推送方法及装置 - Google Patents

一种信息的推送方法及装置 Download PDF

Info

Publication number
CN105989005A
CN105989005A CN201510041409.2A CN201510041409A CN105989005A CN 105989005 A CN105989005 A CN 105989005A CN 201510041409 A CN201510041409 A CN 201510041409A CN 105989005 A CN105989005 A CN 105989005A
Authority
CN
China
Prior art keywords
probability
activity
user
type
activity type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510041409.2A
Other languages
English (en)
Other versions
CN105989005B (zh
Inventor
刘娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201510041409.2A priority Critical patent/CN105989005B/zh
Publication of CN105989005A publication Critical patent/CN105989005A/zh
Application granted granted Critical
Publication of CN105989005B publication Critical patent/CN105989005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种信息的推送方法及装置,该方法包括:获取用户标识和与所述用户标识对应的用户的活动历史数据,针对任一用户标识对应的用户,分别第一概率和根据所述用户的好友活动历史数据,确定第二概率;并确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率;根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;根据第四概率,向所述用户进行信息推送,用以解决基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。

Description

一种信息的推送方法及装置
技术领域
本发明涉及通信技术领域,尤其是涉及一种信息的推送方法及装置。
背景技术
随着互联网的飞速发展,互联网中的内容也呈现着爆炸式的增长,为了解决用户在面临海量内容时的信息过载问题,推荐技术应运而生。作为最早和最成功的推荐技术之一,协同过滤推荐(英文:Collaborative FilteringRecommendations,缩写:CFR)算法已被成功的运用于电子商务系统中。
通常情况下,可以基于协同过滤推荐算法对用户的活动进行挖掘,进而根据挖掘结果向用户推送相应的信息。其中活动是指由共同目的联合起来并完成一定社会职能的动作的总和。活动由目的、动机和动作构成,具有完整的结构系统。例如,用户出外就餐,可以做为一个活动,包括就餐时间、就餐地点、就餐内容等等,又如用户进行商场购物等,也可以作为一个活动。而基于协同过滤推荐算法向用户推送信息的方式主要分为下述两种方式:
第一种方式:基于内容的协同过滤推荐。
基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜好,并分析内容之间的相似性,为目标用户推荐和他过去喜欢的内容类似的内容。该种方式的缺陷在于基于内容的推荐需要对内容的特征做抽取和处理,而很多情况下很难从内容中抽取出能准确代表该内容的信息,而且推荐的结果缺乏多样性,不能挖掘用户的潜在兴趣。
第二种方式:基于用户的协同过滤推荐。
基于用户的协同过滤推荐则根据目标用户与其他用户的相似性,为目标用户推荐和他最为相似的一些用户喜欢的内容:即根据用户的历史评价信息计算两用户的相似性,选出目标用户的最近邻居用户,利用他们对某一内容评价的加权平均值来预测目标用户对该内容的喜好程度。基于用户的推荐则需要依赖于其他用户,由于有用户评价的内容往往只占全部内容的少数,所以能够用来计算用户相似性的数据极端稀疏,导致推荐的结果有偏差;而且对于一个新的内容,缺乏历史用户评价数据,也很难得到推荐,导致可扩展性不足。
综上所述,基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大。
发明内容
本发明提供了一种信息的推送方法,用以解决基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。
一种信息的推送方法,包括:
获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据包括用户参加活动的活动场景和活动类型;
针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并
确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;
根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;
根据第四概率,向所述用户进行信息推送。
针对任一活动类型,确定第一概率,包括:
针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;
确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;
所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
针对任一活动类型,根据所述用户的好友活动历史数据,确定第二概率,包括:
针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;
针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率;
根据所述比率确定邻居节点集合的权重和值;
根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率,包括:
针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及
在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;
所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
一种信息的推送装置,包括:
获取单元,用于获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据包括用户参加活动的活动场景和活动类型;
概率确定单元,用于针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;
信息推送单元,用于根据第四概率,向所述用户进行信息推送。
所述概率确定单元,具体用于针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
所述概率确定单元,具体用于针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率;根据所述比率确定邻居节点集合的权重和值;根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
所述概率确定单元,具体用于针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
所述概率确定单元,具体用于按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
通过上述技术方案,综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法,并将目标用户所处的活动场景作为一个影响因子,加入到推荐的过程中,从而根据不同的活动情景调整推荐结果,可以进一步满足用户的心理需求。解决基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。
附图说明
图1为本发明实施例一中,提出的信息的推送方法流程图;
图2为本发明实施例二中,提出的信息的推送装置结构组成示意图。
具体实施方式
针对一般情况下基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题,本发明实施例提出的技术方案中,综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法,并将目标用户所处的活动场景作为一个影响因子,加入到推荐的过程中,从而根据不同的活动情景调整推荐结果,可以进一步满足用户的心理需求。解决基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。
下面将结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
实施例一
本发明实施例一提出一种信息的推送方法,如图1所示,其具体处理过程如下述:
步骤101,获取用户标识和与用户标识对应的用户的活动历史数据。
其中活动历史数据包括用户参加活动的活动场景和活动类型。
以一具体实例来详细阐述本发明实施例一提出的技术方案。
用户标识以u表示,获取用户标识,全部用户标识组成用户集合。用户集合以U表示,具体如下述:
步骤一:用户ui及其它用户共同组成的用户集合U={u1,u2,...ui,...um}。
步骤二:获得各用户的活动历史数据。
首先,确定活动集合及活动类型。具体如下述:
A:所有活动的集合作为活动集合,以A={a1,a2,...aj,...an}表示。
其中,本发明实施例一提出的技术方案中,活动可以是任何类型的活动,例如餐厅就餐、商场购物等。以餐厅就餐为例,例如餐厅1就餐、餐厅2就餐…餐厅n就餐等。
具体地,活动集合中的每个元素表示一个活动,元素的值表示该活动在不同纬度的平均评分。
例如,活动aj的特征向量为其中每一个值都代表该活动在不同维度的平均评分。以活动为餐厅就餐为例,其特征向量可以表示为(口味评分、价格评分、服务评分、环境评分、速度评分等),评分以5分为满分制,例如 a → j = ( 2,5,3,1,4 ) .
B:确定活动类型。以C={c1,c2,...ch,...ck},k<<n表示活动类型集合。以活动是餐厅就餐为例,活动类型可以分为火锅、西餐、快餐、烧烤、粤菜等。
C:将活动集合A={a1,a2,...an}中的元素aj按照所属活动类型进行排序,可以得到新的活动集合 A = { A c 1 , A c 2 , . . . A c h , . . . A c k } , 其中表示在活动集合A中属于活动类型ch的活动aj的集合;
其次,确定活动场景,将活动场景进行分类。
假设有两个维度的活动场景,第一维度E1={e1,1,e1,2,...e1,r,...e1,s},例如早上、中午、晚上;第二维度E2={e2,1,e2,2,...e2,r,...e2,s},例如工作日,节假日。
再次,构建用户标识和活动历史数据矩阵。
用户ui在活动场景e1,r参加了活动aj的历史次数为在活动场景e2,r参加了活动aj的历史次数为
假设e1,r表示中午,e2,r表示晚上,aj表示火锅分类下的小肥羊餐厅,用户ui在中午去小肥羊吃饭的次数为15,工作日去小肥羊吃饭的次数为12。
步骤三:对获得的活动历史数据进行统计分析。
例如,用户ui参加了活动aj的历史总次数为在某一维度所有活动场景下参加该活动的总和: R u i , a j = Σ e 1 , r ∈ E 1 r u i , a j , e 1 , r = Σ e 2 , r ∈ E 2 r u i , a j , e 2 , r .
其中,是用户ui参加了活动aj的历史总次数为在某一维度所有活动场景下参加该活动的总和。
用户ui参加的属于活动类型ch的活动集合为活动总次数 R u i , c h = Σ a j ∈ A c h R u j , a j .
其中,是活动总次数。
用户ui在活动场景e1,r中参加的属于活动类型ch的活动历史次数在活动场景e2,r中参加的属于活动类型ch的活动历史次数为 R u i , c h , e 2 , r = Σ a j ∈ c h r u i , a j , e 2 , r .
其中,是用户ui在活动场景e1,r中参加的属于活动类型ch的活动历史次数,是用户ui在活动场景e2,r中参加的属于活动类型ch的活动历史次数。
步骤102,针对任一用户标识对应的用户,以及针对任一活动类型,根据该用户的活动历史数据,分别确定第一概率和第二概率。
其中第一概率是用户未参加过的活动的概率,未参加过的活动包含在所述活动类型中;第二概率是根据用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中。
其中,针对任一活动类型,确定用户参加所述活动类型中之前未参加过的活动的第一概率,包括:
步骤一:针对任一活动类型,确定该用户参加过的属于该活动类型的全部活动特征组成的活动集合。
步骤二:确定该活动类型中,该用户之前未参加过的活动与该活动集合的相似度。
步骤三:将确定出的相似度作为该用户参加该活动类型中之前未参加过的活动的第一概率。
下面以一具体实例来详细阐述第一概率的计算方法。确定基于用户ui历史活动的记录,预测用户ui会参加活动类型ch中该用户ui之前未参加过的活动aj的第一概率,其具体方法如下述:
A:获取用户ui参加过的属于活动类型ch的所有活动特征。
对于用户ui,参加过的属于活动类型ch的所有活动的次数为活动集合记为计算活动集合的平均特征向量 A u i , c h → = Σ a j ∈ A u i , c h a j → / num ( A u i , c h ) .
其中,该平均特征向量表示该用户ui对于活动类型ch活动的喜好特征值。
以火锅类和(口味评分、价格评分、服务评分、环境评分、速度评分)为特征属性为例,评分以5分为满分制,针对用户张三可以计算出则代表张三在选择火锅时,更喜欢口味好和价格实惠的餐厅,对环境要求最低。
B:计算活动类型ch中新活动aj与活动集合的相似度。
对于用户ui未参加过的属于活动类型ch的活动的aj,令其和活动集合的相似度为:
sim a j , A u i , c h = ∂ * a j → * A u i , c h → | a j → | * | A u i , c h → | + ( 1 - ∂ ) * ( 1 - | | a j → | - | A u i , c h → | | max ( | a j → | , | A u i , c h → | ) )
其中,表示aj之间的相似度,表示两向量夹角的余弦值,即方向相似度,表示两向量的长度相似性,表示权重,本发明实施例一中提出的技术方案,
针对任一活动类型,根据该用户的好友活动历史数据,确定该用户参加所述活动类型的活动的第二概率,包括下述流程:
步骤一:针对任一活动类型,根据该用户的好友活动历史数据,获得邻居节点集合。
其中邻居节点集合是在活动类型中,该用户和好友共同参加的活动的相似度符合设定规则的用户。
步骤二:针对邻居节点集合中的任一邻居节点,确定该邻居节点参加该活动类型中的活动的比率。
步骤三:根据比率确定邻居节点集合的权重和值。
步骤四:根据得到的权重和值,确定该用户参加所述活动类型的活动的第二概率。
下面以一具体实例来详细阐述第二概率的计算方法。
基于用户ui的好友的活动历史数据,在当前提出的基于用户协同过滤推荐算法的基础上,本发明实施例一提出的技术方案中,通过在某一类中与用户ui最为相似的一些用户(即用户ui关于活动类型ch的邻居节点)来预测用户ui在活动类型ch中会参加某活动aj的第二概率,其具体处理如下述:
首先,计算用户ui关于活动类型ch的邻居节点。
令用户ui与用户ui’共同参加的属于活动类型ch的活动集合为则可以采用余弦相似性的方法来计算用户ui与用户ui’在参加活动类型ch的活动时的相似度
sim u i , u i , , c h = Σ a j ∈ A u i , u i , , c h R u i , a j * R u i ' , a j / Σ a j ∈ A u i , u i , , c h R 2 u i , a j * Σ a j ∈ A u i , u i , , c h R 2 u i ' , a j
其中,是相似度。
一种较佳地实施方式,根据得到的相似度,取得到的相似度中最大的m0个用户作为用户ui关于活动类型ch的最佳邻居节点该得到的最佳邻居节点作为符合设定规则的邻居节点。
在确定符合设定规则的邻居节点时,也可采用阈值过滤的方法,例如可以取的所有用户作为符合设定规则的邻居节点,即最佳邻居节点
其次,预测用户ui参加活动类型ch中某活动aj的第二概率。
步骤一:计算邻居节点用户ui’在活动类型ch中参加了活动aj的比率:
P ( u i , , a j ) / c h = R u i , , a j / R u i , , c h .
其中,该比率标识用户ui’在活动类型ch中对活动aj的偏好。
步骤二:用中所有用户的权重和值,来预测用户ui会参加活动aj的第二概率:
P ( u i , a j ) / c h = Σ u i , ∈ NBU u i , c h sim u i , u i , , c h * P u i , , a j / Σ u i , ∈ NBU u i , c h sim u i , u i , , c h
其中是第二概率。
步骤103,确定该用户在不同活动场景中参加不同活动类型的活动的第三概率。
确定用户在不同活动场景中参加不同活动类型的活动的第三概率,包括:
步骤一:针对任一活动类型,确定该用户在不同活动场景中参加该活动类型的频率。
步骤二:在任一活动场景中参加该活动类型的活动占参加全部类型活动的比值。
步骤三:得到的比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
下面以一具体实例来详细阐述确定第三概率的具体实施方式。
首先,当前活动场景为任意活动场景e1,r和活动场景e2,r的组合,根据活动场景,情景化的计算用户ui在该活动场景下参加属于活动类型ch的活动频率:
R u i , c h , ( e 1 , r , e 2 , r ) = R u i , c h , e 1 , r * ( R u i , c h , e 2 , r * R u i , c h ) .
其中是用户ui在该活动场景下参加属于活动类型ch的活动频率。
其次,计算在当前活动场景下参加该活动类型活动占全部活动类型的活动的比值:
P u i , c h , ( e 1 , r , e 2 , r ) = R u i , c h , ( e 1 , r , e 2 , r ) / Σ c h ∈ C R u i , c h , ( e 1 , r , e 2 , r )
其中,是在当前活动场景下参加该活动类型活动占全部活动类型的活动的比值。
从而针对用户当前所处的活动场景,根据比值来针对性的推荐属于不同活动类型的活动。
下面以一具体实例来进行详细阐述:
例如下述表1是某用户张三在活动场景为E1={中午,晚上},E1={工作日,周末}两个维度,活动有C={火锅,西餐,快餐}三种情况下的活动-活动场景分布表格:
表1
中午 晚上 工作日 周末 合计
火锅 6 24 12 18 30
西餐 4 6 6 4 10
快餐 30 15 40 5 45
则张三在工作日的中午:
选择吃火锅的次数:
R(火锅/工作日*中午)=12*(6/30)=12/5。
选择吃西餐的次数:
R(西餐/工作日*中午)=6*(4/10)=12/5。
选择吃快餐的次数:
R(快餐/工作日*中午)=40*(30/45)=80/3。
吃火锅的概率:
P(火锅/工作日*中午)=12/5/(12/5+12/5+80/3)=9/118。
吃西餐的概率:
P(西餐/工作日*中午)=12/5/(12/5+12/5+80/3)=9/118。
吃快餐的概率:
P(快餐/工作日*中午)=80/3/(12/5+12/5+80/3)=50/59。
步骤104,根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率。
按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
下面以一具体实例来详细阐述本发明实施例提出的第四概率的确定方法。
结合当前用户所处的活动情景,综合基于活动的协同过滤和基于用户的协同过滤两个方面,预测用户ui在当前活动场景下参加活动aj的概率:
假设当前活动场景为e1,r、e2,r,则用户ui未参加过的任一活动aj,用户ui会参加该活动aj的概率为:
P ( u i , a j ) / ( e 1 , r , e 2 , r ) = P ( u i , c h ) / ( e 1 , r , e 2 , r ) * [ σ * si m a j , A u i , c h + ( 1 - σ ) * P ( u i , a j ) / c h ]
其中是当前活动场景为e1,r、e2,r,用户ui会参加未参加过的活动aj的概率,
δ是设定的权重值,0≤σ≤1,表示基于活动的协同过滤在结果中所占的权重,即用户历史数据对当前推荐结果的影响程度;δ的取值根据推荐方法的策略,可动态灵活调整;
步骤105,根据第四概率,向该用户进行信息推送。
本发明实施例提出的技术方案中,针对任一用户,和所有的活动类型,对该用户未参加过的所有活动都确定第四概率值。
也就是说,针对任一用户ui,和所有的活动类型,首先对该用户ui未参加过的所有活动aj都求概率
其次,针对活动类型集合C={c1,c2,...ch,...ck}进行遍历,对每个活动类型都执行上述求取过程,得到用户ui在当前活动场景下,在所有活动类型集合中,会参加活动aj的概率
再次结合当前活动情景确定用户ui的最佳候选活动节点最大的n0个活动作为用户ui的候选活动节点
最后,结合当前活动场景对用户ui进行活动推荐:从中按从大到小的顺序选出活动节点,为用户ui进行推荐。
实施例二
本发明实施例特提出一种信息的推送装置,如图2所示,该装置包括:
获取单元201,用于获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据包括用户参加活动的活动场景和活动类型。
概率确定单元202,用于针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率。
具体地,上述概率确定单元202,具体用于针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
具体地,上述概率确定单元202,具体用于针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率;根据所述比率确定邻居节点集合的权重和值;根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
具体地,上述概率确定单元202,具体用于针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
具体地,上述概率确定单元202,具体用于按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
信息推送单元203,用于根据第四概率,向所述用户进行信息推送。
基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜好,并分析内容之间的相似性,为目标用户推荐和他过去喜欢的内容类似的内容。基于内容的推荐不依赖于其他用户,可以有效避免有用户恶意作弊的情况;并且新的内容可以及时得到推荐。基于用户的协同过滤推荐则根据目标用户与其他用户的相似性,为目标用户推荐和他最为相似的一些用户喜欢的内容:即根据用户的历史评价信息计算两用户的相似性,选出目标用户的最近邻居用户,利用他们对某一内容评价的加权平均值来预测目标用户对该内容的喜好程度。该推荐方法能够挖掘用户潜在的喜好,为用户推荐与其历史喜好不同的新型内容,并且无需对内容做复杂的特征处理。但是基于内容的推荐需要对内容的特征做抽取和处理,而很多情况下很难从内容中抽取出能准确代表该内容的信息,且推荐的结果缺乏多样性,不能挖掘用户的潜在兴趣。基于用户的推荐则需要依赖于其他用户,由于有用户评价的内容往往只占全部内容的少数,所以能够用来计算用户相似性的数据极端稀疏,导致推荐的结果有偏差;而且对于一个新的内容,缺乏历史用户评价数据,也很难得到推荐,导致可扩展性不足。
基于此,本发明实施例上述提出的技术方案中,综合这两种协同过滤推荐方法,为每一种推荐方法赋予一定的权重并进行加权组合,能得到更为准确和丰富的推荐结果。
并且,以上两种传统的协同过滤推荐方法只考虑了用户-内容评分这两个维度,较少考虑到户当前所处的情景会对用户的喜好产生影响,导致推荐结果无法完全体现用户的意图。用户对一个内容的喜好往往很大程度上依赖于当前的环境(时间、位置、天气等),但是用户的选择会根据环境的不同而发生变化,例如用户在中午往往比在晚上更倾向于吃快餐;所以推荐算法不仅需要采用历史数据和其他用户的数据来挖掘目标用户的喜好,更需要根据目标用户所处的环境作为辅助判断。而传统的协同过滤推荐方法也没有考虑内容所属的类别会对内容的相似性与用户最近邻居的选择产生影响。因为两个用户的相似性会因为内容的类别而有所不同,例如对于餐厅这项内容,用户A和用户B都喜欢吃火锅类,但是用户A还喜欢烧烤类,但是用户B不喜欢烧烤类,则对火锅类内容进行预测时,选择用户B作为用户A的邻居节点较为合理,但是对烧烤类内容进行预测时,则不应选择用户B作为用户A的邻居节点。故利用用户对同一个类别内容的评价计算用户对于该类别的相似性更为合理。同理,对属于同一个类别的内容计算相似性也更为精确,例如对同属于火锅类的餐厅来比较相似性。
本发明综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法,并做了如下优化:
一、将目标用户所处的情景信息作为一个影响因子,加入到推荐的过程中,得到在当前场景下目标用户会选择某一类型内容的概率;从而根据不同的情景调整推荐结果,可以进一步满足用户的心理需求。
二、对每个类别的内容分别进行内容相似性和用户相似性的计算,使得内容的最近邻居节点和用户的最佳邻居节点随着内容类别的变化而动态调整,即得出在某一类别下,目标用户最可能喜好的内容;再结合在当前场景下用户选择该类别的概率,最后得到在当面场景下用户选择该内容的概率,用该概率值为用户进行推荐,能够提高对用户喜好的预测精确度。
本发明实施例提出的技术方案,可以避免了单独基于内容协同过滤推荐和单独基于用户协同过滤推荐的不足,而且由于推荐时考虑了不同类别内容的差异,使得推荐结果更为准确;并根据目标用户所处的当前场景对推荐结果进行了个性化动态调整,使得推荐结果更符合用户心理;最终对目标用户进行更精确、更符合当前场景的推荐。
本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种信息的推送方法,其特征在于,包括:
获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据包括用户参加活动的活动场景和活动类型;
针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并
确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;
根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;
根据第四概率,向所述用户进行信息推送。
2.如权利要求1所述的方法,其特征在于,针对任一活动类型,确定第一概率,包括:
针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;
确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;
所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
3.如权利要求1所述的方法,其特征在于,针对任一活动类型,根据所述用户的好友活动历史数据,确定第二概率,包括:
针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;
针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率;
根据所述比率确定邻居节点集合的权重和值;
根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
4.如权利要求1所述的方法,其特征在于,确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率,包括:
针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及
在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;
所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
5.如权利要求1所述的方法,其特征在于,按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
6.一种信息的推送装置,其特征在于,包括:
获取单元,用于获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据包括用户参加活动的活动场景和活动类型;
概率确定单元,用于针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;
信息推送单元,用于根据第四概率,向所述用户进行信息推送。
7.如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
8.如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率;根据所述比率确定邻居节点集合的权重和值;根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
9.如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。
10.如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于按照下述公式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
P4=P3*[δ*P1+(1-δ)*P2]
其中,P4是第四概率,P3是第三概率,P1是第一概率,δ是设定的权重值,P2是第二概率。
CN201510041409.2A 2015-01-27 2015-01-27 一种信息的推送方法及装置 Active CN105989005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510041409.2A CN105989005B (zh) 2015-01-27 2015-01-27 一种信息的推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510041409.2A CN105989005B (zh) 2015-01-27 2015-01-27 一种信息的推送方法及装置

Publications (2)

Publication Number Publication Date
CN105989005A true CN105989005A (zh) 2016-10-05
CN105989005B CN105989005B (zh) 2019-06-21

Family

ID=57034796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510041409.2A Active CN105989005B (zh) 2015-01-27 2015-01-27 一种信息的推送方法及装置

Country Status (1)

Country Link
CN (1) CN105989005B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512883A (zh) * 2017-04-10 2018-09-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及可读介质
CN109710852A (zh) * 2018-12-27 2019-05-03 丹翰智能科技(上海)有限公司 一种用于确定财经信息的标签信息的方法与设备
CN109993392A (zh) * 2017-12-31 2019-07-09 中国移动通信集团安徽有限公司 业务投诉风险预估方法、装置、计算设备及存储介质
CN113254772A (zh) * 2021-05-31 2021-08-13 温州行动者网络科技有限公司 基于大数据的信息推送方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
US8732097B2 (en) * 2012-02-22 2014-05-20 Palo Alto Research Center Incorporated Automatically triggering predictions in recommendation systems based on an activity-probability threshold
CN104408043A (zh) * 2014-10-17 2015-03-11 深圳大学 一种信息处理方法及服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732097B2 (en) * 2012-02-22 2014-05-20 Palo Alto Research Center Incorporated Automatically triggering predictions in recommendation systems based on an activity-probability threshold
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104408043A (zh) * 2014-10-17 2015-03-11 深圳大学 一种信息处理方法及服务器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAROL WAGA 等: "Recommendation of points of interest from user generated data collection", 《8TH INTERNATIONAL CONFERENCE ON COLLABORATIVE COMPUTING: NETWORK, APPLICATIONS AND WORKSHARING(COLLABORATIVECOM)》 *
LIMING CHEN 等: "A Knowledge-Driven Approach to Activity Recognition in Smart Homes", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
常玮: "旅游移动商务环境中基于情景的多维用户偏好模型及个性化推荐方法研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108512883A (zh) * 2017-04-10 2018-09-07 腾讯科技(深圳)有限公司 一种信息推送方法、装置及可读介质
WO2018188588A1 (zh) * 2017-04-10 2018-10-18 腾讯科技(深圳)有限公司 一种信息推送方法、可读介质及电子设备
US11064040B2 (en) 2017-04-10 2021-07-13 Tencent Technology (Shenzhen) Company Limited Information push method, readable medium, and electronic device
CN109993392A (zh) * 2017-12-31 2019-07-09 中国移动通信集团安徽有限公司 业务投诉风险预估方法、装置、计算设备及存储介质
CN109710852A (zh) * 2018-12-27 2019-05-03 丹翰智能科技(上海)有限公司 一种用于确定财经信息的标签信息的方法与设备
CN113254772A (zh) * 2021-05-31 2021-08-13 温州行动者网络科技有限公司 基于大数据的信息推送方法
CN113254772B (zh) * 2021-05-31 2022-01-11 山东远桥信息科技有限公司 基于大数据的信息推送方法

Also Published As

Publication number Publication date
CN105989005B (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
US11574139B2 (en) Information pushing method, storage medium and server
CN106303955B (zh) 用于对无线热点和poi进行匹配的方法和装置
CN104778173B (zh) 目标用户确定方法、装置及设备
CN104391853B (zh) Poi推荐方法、poi信息处理方法及服务器
Whiteside et al. Spatial characteristics of professional tennis serves with implications for serving aces: A machine learning approach
US10965775B2 (en) Discovering signature of electronic social networks
CN105373597B (zh) 基于k‑medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN105468598B (zh) 好友推荐方法及装置
CN103795613B (zh) 一种在线社交网络中朋友关系预测的方法
CN106776930B (zh) 一种融入时间和地理位置信息的地点推荐方法
AU2020273319A1 (en) Interest profile of a user of a mobile application
CN105824911B (zh) 基于lda用户主题模型的视频推荐方法
D’Urso et al. Bagged fuzzy clustering for fuzzy data: An application to a tourism market
CN109948066B (zh) 一种基于异构信息网络的兴趣点推荐方法
CN107562947A (zh) 一种移动时空感知下动态即时推荐服务模型建立方法
US9208444B1 (en) Determining happiness indices
CN105989005A (zh) 一种信息的推送方法及装置
CN103353920A (zh) 基于社交网络推荐游戏的方法和装置
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统
CN107391670A (zh) 一种融合协同过滤和用户属性过滤的混合推荐方法
CN109213926A (zh) 一种基于社区划分和多源信息融合的地点推荐方法
CN104732422A (zh) 基于移动用户标签的个性化美食推荐方法
CN109325177B (zh) 信息推送方法、系统、可读存储介质和计算机设备
CN110210892B (zh) 产品推荐方法、装置和可读存储介质
CN103279944A (zh) 一种基于生物地理优化的图像分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant