发明内容
为了解决现有技术的问题,本发明实施例提供了一种信息推荐方法及装置。所述技术方案如下:
第一方面,提供了一种信息推荐方法,所述方法包括:
根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,每个信息频繁项集合中包括待推荐的至少一条第一信息及至少一条第二信息,所述第一信息访问记录为第一用户的信息访问记录,所述第二信息访问记录为多个第二用户的信息访问记录,所述第一信息为根据所述第一信息访问记录和第二信息访问记录确定的信息,所述第二信息为所述第一信息访问记录中任一条信息;
计算所述至少一个信息频繁项集合的提升度,所述提升度用于描述信息频繁项集合中所述至少一条第一信息与所述至少一条第二信息之间的正负相关性;
根据所述至少一个信息频繁项集合的提升度,计算所述至少一个信息频繁项集合的推荐值;
对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合;
向所述第一用户推荐所述预设数量的目标信息频繁项集合中的至少一条第一信息。
结合第一方面,在第一方面的第一种可能的实施方式中,所述根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,包括:
从所述第一信息访问记录中选取至少一条第二信息;
根据所述至少一条第二信息,确定所述第二信息访问记录中的至少一条第一信息;
对所述至少一条第一信息及所述至少一条第二信息进行组合,得到至少一个信息集合;
根据所述第二信息访问记录,计算所述至少一个信息集合的置信度,所述置信度为在所述至少一条第二信息被访问的前提下,所述至少一条第一信息及所述至少一条第二信息同时被访问的条件概率;
将置信度大于预设阈值的信息集合作为信息频繁项集合。
结合第一方面,在第一方面的第二种可能的实施方式中,所述计算所述至少一个信息频繁项集合的提升度,包括:
根据所述第二信息访问记录,分别计算所述至少一个信息频繁项集合中所述至少一条第一信息被访问的第一概率、所述至少一条第二信息被访问的第二概率及所述至少一条第一信息及所述至少一条第二信息同时被访问的第三概率;
将所述第三概率除以所述第一概率与所述第二概率之间的乘积,将得到的商作为所述至少一个信息频繁项集合的提升度。
结合第一方面或第一方面的第一种可能的实施方式,在第一方面的第三种可能的实施方式中,所述根据所述至少一个信息频繁项集合的提升度,计算所述至少一个信息频繁项集合的推荐值,包括:
对所述至少一个信息频繁项集合的提升度取自然对数值;
计算所述至少一个信息频繁项集合的置信度的开方值;
将所述自然对数值与所述开方值之间的乘积作为所述至少一个信息频繁项集合的推荐值。
结合第一方面的第三种可能的实施方式,在第一方面的第四种可能的实施方式中,所述根据所述至少一个信息频繁项集合的提升度,计算所述至少一个信息频繁项集合的推荐值之前,还包括:
根据所述第二信息访问记录,获取同时访问过所述至少一条第一信息及所述至少一条第二信息的第三用户对所述至少一条第一信息的评分值;
根据第三用户对所述至少一条第一信息的评分值及第三用户的数量,计算所述至少一条第一信息对应的第一平均评分值;
根据所述第二信息访问记录,获取访问过所述至少一条第一信息的第四用户对所述至少一条第一信息的评分值;
根据第四用户对所述至少一条第一信息的评分值及第四用户的数量,计算所述至少一条第一信息对应的第二平均评分值;
通过自然常数为底的指数函数,对所述第一平均评分值与所述第二平均评分值之间的差值进行计算,得到计算结果;
所述根据所述至少一个信息频繁项集合的提升度,计算所述至少一个信息频繁项集合的推荐值,包括:
将所述自然对数值、所述开方值与所述计算结果之间的乘积作为所述至少一个信息频繁项集合的推荐值。
第二方面,提供了一种信息推荐装置,所述装置包括:
第一获取模块,用于根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,每个信息频繁项集合中包括待推荐的至少一条第一信息及至少一条第二信息,所述第一信息访问记录为第一用户的信息访问记录,所述第二信息访问记录为多个第二用户的信息访问记录,所述第一信息为根据所述第一信息访问记录和第二信息访问记录确定的信息,所述第二信息为所述第一信息访问记录中任一条信息;
第一计算模块,用于计算所述至少一个信息频繁项集合的提升度,所述提升度用于描述信息频繁项集合中所述至少一条第一信息与所述至少一条第二信息之间的正负相关性;
第二计算模块,用于根据所述至少一个信息频繁项集合的提升度,计算所述至少一个信息频繁项集合的推荐值;
排序模块,用于对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合;
推荐模块,用于向所述第一用户推荐所述预设数量的目标信息频繁项集合中的至少一条第一信息。
结合第二方面,在第二方面的第一种可能的实施方式中,所述第一获取模块,用于从所述第一信息访问记录中选取至少一条第二信息;根据所述至少一条第二信息,确定所述第二信息访问记录中的至少一条第一信息;对所述至少一条第一信息及所述至少一条第二信息进行组合,得到至少一个信息集合;根据所述第二信息访问记录,计算所述至少一个信息集合的置信度,所述置信度为在所述至少一条第二信息被访问的前提下,所述至少一条第一信息及所述至少一条第二信息同时被访问的条件概率;将置信度大于预设阈值的信息集合作为信息频繁项集合。
结合第二方面,在第二方面的第二种可能的实施方式中,所述第一计算模块,用于根据所述第二信息访问记录,分别计算所述至少一个信息频繁项集合中所述至少一条第一信息被访问的第一概率、所述至少一条第二信息被访问的第二概率及所述至少一条第一信息及所述至少一条第二信息同时被访问的第三概率;将所述第三概率除以所述第一概率与所述第二概率之间的乘积,将得到的商作为所述至少一个信息频繁项集合的提升度。
结合第二方面或第二方面的第一种可能的实施方式,在第二方面的第三种可能的实施方式中,所述第二计算模块,用于对所述至少一个信息频繁项集合的提升度取自然对数值;计算所述至少一个信息频繁项集合的置信度的开方值;将所述自然对数值与所述开方值之间的乘积作为所述至少一个信息频繁项集合的推荐值。
结合第二方面的第三种可能的实施方式,在第二方面的第四种可能的实施方式中,所述装置还包括:
第二获取模块,用于根据所述第二信息访问记录,获取同时访问过所述至少一条第一信息及所述至少一条第二信息的第三用户对所述至少一条第一信息的评分值;
第三计算模块,用于根据第三用户对所述至少一条第一信息的评分值及第三用户的数量,计算所述至少一条第一信息对应的第一平均评分值;
第三获取模块,用于根据所述第二信息访问记录,获取访问过所述至少一条第一信息的第四用户对所述至少一条第一信息的评分值;
第四计算模块,用于根据第四用户对所述至少一条第一信息的评分值及第四用户的数量,计算所述至少一条第一信息对应的第二平均评分值;
第五计算模块,用于通过自然常数为底的指数函数,对所述第一平均评分值与所述第二平均评分值之间的差值进行计算,得到计算结果;
所述第二计算模块,用于将所述自然对数值、所述开方值与所述计算结果之间的乘积作为所述至少一个信息频繁项集合的推荐值。
本发明实施例提供的技术方案带来的有益效果是:
通过根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,计算至少一个信息频繁项集合的提升度,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合,向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。由于可计算信息频繁项集合的推荐值,根据推荐值的排序结果向用户推荐信息,从而能够筛选出推荐值较高的,用户可能较感兴趣的信息。同时,由于推荐值的计算过程中融入了用于描述信息之间正负相关性的提升度,从而能通过提升度拉低包含负相关信息的信息频繁项集合的推荐值,使得根据推荐值的排序结果筛选出的信息更加精准。因此,信息推荐的效果较佳。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种信息推荐方法,该方法应用于服务器。参见图1,本实施例提供的方法流程包括:
101、根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,每个信息频繁项集合中包括待推荐的至少一条第一信息及至少一条第二信息,第一信息访问记录为第一用户的信息访问记录,第二信息访问记录为多个第二用户的信息访问记录,第一信息为根据第一信息访问记录和第二信息访问记录确定的信息,第二信息为第一信息访问记录中任一条信息。
102、计算至少一个信息频繁项集合的提升度,提升度用于描述信息频繁项集合中至少一条第一信息与至少一条第二信息之间的正负相关性。
103、根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值。
104、对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合。
105、向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。
本发明实施例提供的方法,通过根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,计算至少一个信息频繁项集合的提升度,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合,向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。由于可计算信息频繁项集合的推荐值,根据推荐值的排序结果向用户推荐信息,从而能够筛选出推荐值较高的,用户可能较感兴趣的信息。同时,由于推荐值的计算过程中融入了用于描述信息之间正负相关性的提升度,从而能通过提升度拉低包含负相关信息的信息频繁项集合的推荐值,使得根据推荐值的排序结果筛选出的信息更加精准。因此,信息推荐的效果较佳。
作为一种可选实施例,根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,包括:
从第一信息访问记录中选取至少一条第二信息;
根据至少一条第二信息,确定第二信息访问记录中的至少一条第一信息;
对至少一条第一信息及至少一条第二信息进行组合,得到至少一个信息集合;
根据第二信息访问记录,计算至少一个信息集合的置信度,置信度为在至少一条第二信息被访问的前提下,至少一条第一信息及至少一条第二信息同时被访问的条件概率;
将置信度大于预设阈值的信息集合作为信息频繁项集合。
作为一种可选实施例,计算至少一个信息频繁项集合的提升度,包括:
根据第二信息访问记录,分别计算至少一个信息频繁项集合中至少一条第一信息被访问的第一概率、至少一条第二信息被访问的第二概率及至少一条第一信息及至少一条第二信息同时被访问的第三概率;
将第三概率除以第一概率与第二概率之间的乘积,将得到的商作为至少一个信息频繁项集合的提升度。
作为一种可选实施例,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,包括:
对至少一个信息频繁项集合的提升度取自然对数值;
计算至少一个信息频繁项集合的置信度的开方值;
将自然对数值与开方值之间的乘积作为至少一个信息频繁项集合的推荐值。
作为一种可选实施例,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值之前,还包括:
根据第二信息访问记录,获取同时访问过至少一条第一信息及至少一条第二信息的第三用户对至少一条第一信息的评分值;
根据第三用户对至少一条第一信息的评分值及第三用户的数量,计算至少一条第一信息对应的第一平均评分值;
根据第二信息访问记录,获取访问过至少一条第一信息的第四用户对至少一条第一信息的评分值;
根据第四用户对至少一条第一信息的评分值及第四用户的数量,计算至少一条第一信息对应的第二平均评分值;
通过自然常数为底的指数函数,对第一平均评分值与第二平均评分值之间的差值进行计算,得到计算结果;
根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,包括:
将自然对数值、开方值与计算结果之间的乘积作为至少一个信息频繁项集合的推荐值。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
本发明实施例提供了一种信息推荐方法,该方法应用于服务器。参见图2,本实施例提供的方法流程包括:
201、根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,每个信息频繁项集合中包括待推荐的至少一条第一信息及至少一条第二信息,第一信息访问记录为第一用户的信息访问记录,第二信息访问记录为多个第二用户的信息访问记录,第一信息为根据第一信息访问记录和第二信息访问记录确定的信息,第二信息为第一信息访问记录中任一条信息。
其中,信息可以为歌曲信息、视频信息、书籍信息及商品信息等,本实施例不对信息的类型作具体限定。相应地,由于不同的信息类型可对应不同的应用场景,如歌曲信息可对应听歌场景、视频信息可对应观看视频场景、书籍信息可对应购书场景,商品信息可对应购物场景,因此,本实施例提供的信息推荐方法可根据信息类型,适用于不同的应用场景。第一用户为待推送信息的目标用户,多个第二用户为已访问过信息的其他用户,第一信息访问记录为第一用户的信息访问记录,第二信息访问记录为多个第二用户的信息访问记录。
在根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合时,可从第一信息访问记录中选取至少一条第二信息,根据至少一条第二信息,确定第二信息访问记录中的至少一条第一信息,对至少一条第一信息及至少一条第二信息进行组合,得到至少一个信息集合,根据第二信息访问记录,计算至少一个信息集合的置信度,置信度为在至少一条第二信息被访问的前提下,至少一条第一信息及至少一条第二信息同时被访问的条件概率,将置信度大于预设阈值的信息集合作为信息频繁项集合。需要说明的是,在根据至少一条第二信息,确定第二信息访问记录中的至少一条第一信息时,可对第二信息访问记录进行检索,确定第二用户在访问至少一条第二信息的同时还访问过哪些信息,从而能够确定至少一条第一信息。在计算信息集合的置信度时,可采用如下公式(1):
其中,confidence(A→B)表示信息集合[A、B]的置信度,P(B|A)表示在第二信息A被访问的前提下,第一信息B及第二信息A同时被访问的条件概率,supportcount(A∪B)表示第一信息B及第二信息A同时被访问的概率,supportcount(A)表示第二信息A被访问的概率。
例如,以第一信息访问记录包括2条第二信息,且为[A、B],第二信息访问记录包括10个第二用户的信息访问记录,且分别为[A、C、D]、[A、C]、[A、C、D]、[C、E]、[A、E]、[A、D]、[A、C、E]、[C、D、E]、[A、D、E]及[A、D]为例。若从第一信息访问记录中选取了一条第二信息A,根据第二信息A,可确定第二信息访问记录中的3条第一信息C、D、E,即根据第二信息访问记录,可确定第二用户在访问过第二信息A之外,还访问过C、D、E这3条第一信息。将第二信息A与第一信息C、D、E进行组合,可得到[A、C]、[A、D]、[A、E]这三个信息集合。根据第二信息访问记录,计算每个信息集合的置信度。其中,置信度为第一信息及第二信息同时被访问的概率除以第二信息被访问的概率所得到的条件概率。
以信息集合为[A、C]为例,根据上述10个第二用户的信息访问记录,可确定第二信息A被访问的概率为0.8,第一信息C与第二信息A同时被访问的概率为0.4,因此,在第一信息A被访问的前提下,第一信息A及第二信息C同时被访问的条件概率为0.4/0.8=0.5,即信息集合[A、C]的置信度为0.5。同理,可计算得到信息集合[A、D]的置信度为0.5/0.8=0.625、信息集合[A、E]的置信度为0.3/0.8=0.375。若预设阈值为0.3,由于上述三个信息集合的置信度均大于预设阈值,因此,可确定上述三个信息集合均为信息频繁项集合。
202、根据第二信息访问记录,分别计算至少一个信息频繁项集合中至少一条第一信息被访问的第一概率、至少一条第二信息被访问的第二概率及至少一条第一信息及至少一条第二信息同时被访问的第三概率。
对于任意一个信息频繁项集合,可计算该信息频繁项集合中至少一条第一信息被访问的第一概率、至少一条第二信息被访问的第二概率及至少一条第一信息及至少一条第二信息同时被访问的第三概率。通过计算得到的第一概率、第二概率及第三概率,能够计算信息频繁项集合的提升度,从而根据提升度确定信息频繁项集合中第一信息与第二信息之间的正负相关性,具体过程详见后续步骤。通过上述步骤201中的内容可知,在计算信息集合的置信度时,第二概率及第三概率均以计算得到,因此,本步骤计算至少一条第一信息被访问的第一概率即可。例如,信息频繁项集合[A、C]中第一信息C被访问的第一概率为0.6、第二信息A被访问的第二概率为0.8,第一信息C与第二信息A同时被访问的概率为0.4。同理,可确定信息频繁项集合[A、D]中第一信息D被访问的第一概率为0.6、第二信息A被访问的第二概率为0.8,第一信息C与第二信息A同时被访问的概率为0.625。信息频繁项集合[A、E]中第一信息E被访问的第一概率为0.5、第二信息A被访问的第二概率为0.8,第一信息E与第二信息A同时被访问的概率为0.375。
203、将第三概率除以第一概率与第二概率之间的乘积,将得到的商作为至少一个信息频繁项集合的提升度,提升度用于描述信息频繁项集合中至少一条第一信息与至少一条第二信息之间的正负相关性。
提升度用于描述信息频繁项集合中至少一条第一信息与至少一条第二信息之间的正负相关性。当提升度的值小于1时,表明至少一条第一信息与至少一条第二信息是负相关的,即当至少一条第二信息被访问时,至少一条第一信息可能不会被访问。当提升度的值大于1时,表明至少一条第一信息与至少一条第二信息是正相关的,即当至少一条第二信息被访问时,至少一条第一信息可能也会被访问。当提升度的值等于1时,表明至少一条第一信息与至少一条第二信息是独立的,它们之间没有相关性,即当至少一条第二信息被访问时,对至少一条第一信息不会有任何影响。上述计算过程可通过如下公式(2)进行表示:
其中,lift(A→B)表示信息频繁项集合[A、B]的提升度,P(A∪B)表示第一信息B及第二信息A同时被访问的第三概率,P(A)表示第二信息A被访问的第二概率,P(B)表示第一信息B被访问的第一概率。
例如,以上述步骤202中的内容为基础,可计算得到信息频繁项集合[A、C]的提升度为0.4/(0.6*0.8)=0.83,信息频繁项集合[A、D]的提升度为0.625/(0.6*0.8)=1.3,信息频繁项集合[A、E]的提升度为0.375/(0.5*0.8)=0.93。其中,由于信息频繁项集合[A、C]及[A、E]的提升度小于1,表明第二信息A与第一信息C之间是负相关的,第二信息A与第一信息E之间是负相关的。信息频繁项集合[A、D]的提升度大于1,表明第二信息A与第一信息D之间是正相关的。
204、根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值。
通过上述步骤203计算出信息频繁项集合的提升度后,可根据信息频繁项集合的提升度及置信度,计算信息频繁项集合的推荐值,具体方法包括:对至少一个信息频繁项集合的提升度取自然对数值;计算至少一个信息频繁项集合的置信度的开方值;将自然对数值与开方值之间的乘积作为至少一个信息频繁项集合的推荐值。上述计算过程可通过如下公式(3)进行表示:
其中,recmd_index(B|A)为信息频繁项集合的推荐值,为置信度的开方值,ln(lift(A→B))为提升度的自然对数值。
例如,以上述步骤中的内容为基础,可计算得到信息频繁项集合[A、C]的推荐值为-0.131,信息频繁项集合[A、D]的推荐值为0.207,信息频繁项集合[A、E]的推荐值为-0.044。
需要说明的是,上述过程主要为根据第一用户的信息访问记录及多个第二用户的信息访问记录,推测出第一用户可能会感兴趣的信息,该信息均为多个第二用户所访问过的信息。考虑到第二用户在访问信息后,可能会对访问的信息进行评分,以表示自身对该信息的感兴趣程度,而第二用户的评分值对向第一用户推荐信息同样具有参考意义,因此,本实施例提供的方法在根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值之前,还可以计算第二用户对信息的评分值,从而后续将第二用户的评分值融入到推荐值的计算过程中,本实施例对此不作具体限定。上述计算过程具体如下:根据第二信息访问记录,获取同时访问过至少一条第一信息及至少一条第二信息的第三用户对至少一条第一信息的评分值;根据第三用户对至少一条第一信息的评分值及第三用户的数量,计算至少一条第一信息对应的第一平均评分值;根据第二信息访问记录,获取访问过至少一条第一信息的第四用户对至少一条第一信息的评分值;根据第四用户对至少一条第一信息的评分值及第四用户的数量,计算至少一条第一信息对应的第二平均评分值;通过自然常数为底的指数函数,对第一平均评分值与第二平均评分值之间的差值进行计算,得到计算结果;将自然对数值、开方值与计算结果之间的乘积作为至少一个信息频繁项集合的推荐值。
其中,在根据第三用户对至少一条第一信息的评分值及第三用户的数量,计算至少一条第一信息对应的第一平均评分值时,可通过如下公式(4)进行计算:
在上述公式(4)中,score(B|A)为第一信息B对应的第一平均评分值,∑u∈U(A)Vu,b为所有第三用户对第一信息B的评分值总和,|U(A)|为所有第三用户的数量。
在根据第四用户对至少一条第一信息的评分值及第四用户的数量,计算至少一条第一信息对应的第二平均评分值,可通过如下公式(5)进行计算:
在上述公式(5)中,score(B)为第一信息B对应的第二平均评分值,∑u∈U(B)Vu,b为所有第四用户对第一信息B的评分值总和,|U(B)|为所有第四用户的数量。
在计算得到第一平均评分值与第二平均评分值后,可通过自然常数为底的指数函数,对第一平均评分值与第二平均评分值之间的差值进行计算,得到计算结果。相应地,可将上述计算结果融入到推荐值的计算过程中,该计算过程可通过如下公式(6)进行表示:
其中,exp(score(B|A)-score(B))为通过自然常数为底的指数函数,对第一平均评分值与第二平均评分值之间的差值进行计算,得到的计算结果。
205、对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合。
对所有的信息频繁项集合的推荐值进行排序,根据排序结果可选取推荐值较大的前预设数量的目标信息频繁项集合。例如,当通过上述过程计算得到信息频繁项集合[A、C]的推荐值为-0.131,信息频繁项集合[A、D]的推荐值为0.207,信息频繁项集合[A、E]的推荐值为-0.044,且预设数量为1时,可确定目标信息频繁项集合为[A、D]。
206、向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。
通过上述步骤205,在确定预设数量的目标信息频繁项集合后,可向第一用户推荐目标信息频繁项集合中的第一信息。其中,推荐第一信息可以为1条也可以为多条,本实施例对此不作具体限定。
为了便于理解,现以应用场景为听歌场景,音乐播放应用向用户推荐歌曲为例,对上述过程进行解释说明:
若用户A当前在听歌曲a,音乐播放应用可根据其他用户的听歌记录,确定听过歌曲a的其他用户还听过什么样的歌曲。若确定其他用户还听过歌曲b,歌曲c及歌曲d,则可按照上述过程计算上述三首歌曲对应的推荐值,并对计算的推荐值进行排序。当音乐播放应用每次只向用户推荐一首歌曲时,则可将推荐值最大的歌曲推荐给用户A。通过上述过程,能够根据用户的听歌记录精准地“猜测”该用户可能还喜欢的歌曲,从而实现了歌曲的精准推荐。
本发明实施例提供的方法,通过根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,计算至少一个信息频繁项集合的提升度,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合,向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。由于可计算信息频繁项集合的推荐值,根据推荐值的排序结果向用户推荐信息,从而能够筛选出推荐值较高的,用户可能较感兴趣的信息。同时,由于推荐值的计算过程中融入了用于描述信息之间正负相关性的提升度,从而能通过提升度拉低包含负相关信息的信息频繁项集合的推荐值,使得根据推荐值的排序结果筛选出的信息更加精准。因此,信息推荐的效果较佳。
另外,由于可在计算推荐值的过程中引入用户对待推荐信息的评分值,并以评分值作为确定信息推荐值的一项指标,使得能够更精确“猜测”用户可能感兴趣的信息,从而实现了信息的精准推荐。
本发明实施例提供了一种信息推荐装置,该装置用于执行上述图1或图2对应的实施例中的信息推荐方法。参见图3,该装置包括:
第一获取模块301,用于根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,每个信息频繁项集合中包括待推荐的至少一条第一信息及至少一条第二信息,第一信息访问记录为第一用户的信息访问记录,第二信息访问记录为多个第二用户的信息访问记录,第一信息为根据第一信息访问记录和第二信息访问记录确定的信息,第二信息为第一信息访问记录中任一条信息;
第一计算模块302,用于计算至少一个信息频繁项集合的提升度,提升度用于描述信息频繁项集合中至少一条第一信息与至少一条第二信息之间的正负相关性;
第二计算模块303,用于根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值;
排序模块304,用于对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合;
推荐模块305,用于向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。
作为一种可选实施例,第一获取模块,用于从第一信息访问记录中选取至少一条第二信息;根据至少一条第二信息,确定第二信息访问记录中的至少一条第一信息;对至少一条第一信息及至少一条第二信息进行组合,得到至少一个信息集合;根据第二信息访问记录,计算至少一个信息集合的置信度,置信度为在至少一条第二信息被访问的前提下,至少一条第一信息及至少一条第二信息同时被访问的条件概率;将置信度大于预设阈值的信息集合作为信息频繁项集合。
作为一种可选实施例,第一计算模块,用于根据第二信息访问记录,分别计算至少一个信息频繁项集合中至少一条第一信息被访问的第一概率、至少一条第二信息被访问的第二概率及至少一条第一信息及至少一条第二信息同时被访问的第三概率;将第三概率除以第一概率与第二概率之间的乘积,将得到的商作为至少一个信息频繁项集合的提升度。
作为一种可选实施例,第二计算模块,用于对至少一个信息频繁项集合的提升度取自然对数值;计算至少一个信息频繁项集合的置信度的开方值;将自然对数值与开方值之间的乘积作为至少一个信息频繁项集合的推荐值。
作为一种可选实施例,参见图4,装置还包括:
第二获取模块306,用于根据第二信息访问记录,获取同时访问过至少一条第一信息及至少一条第二信息的第三用户对至少一条第一信息的评分值;
第三计算模块307,用于根据第三用户对至少一条第一信息的评分值及第三用户的数量,计算至少一条第一信息对应的第一平均评分值;
第三获取模块308,用于根据第二信息访问记录,获取访问过至少一条第一信息的第四用户对至少一条第一信息的评分值;
第四计算模块309,用于根据第四用户对至少一条第一信息的评分值及第四用户的数量,计算至少一条第一信息对应的第二平均评分值;
第五计算模块310,用于通过自然常数为底的指数函数,对第一平均评分值与第二平均评分值之间的差值进行计算,得到计算结果;
第二计算模块303,用于将自然对数值、开方值与计算结果之间的乘积作为至少一个信息频繁项集合的推荐值。
本发明实施例提供的装置,通过根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,计算至少一个信息频繁项集合的提升度,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合,向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。由于可计算信息频繁项集合的推荐值,根据推荐值的排序结果向用户推荐信息,从而能够筛选出推荐值较高的,用户可能较感兴趣的信息。同时,由于推荐值的计算过程中融入了用于描述信息之间正负相关性的提升度,从而能通过提升度拉低包含负相关信息的信息频繁项集合的推荐值,使得根据推荐值的排序结果筛选出的信息更加精准。因此,信息推荐的效果较佳。
图5是根据一示例性实施例示出的一种用于的服务器500的框图。参照图5,服务器500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述信息处理方法。
服务器500还可以包括一个电源组件526被配置为执行服务器500的电源管理,一个有线或无线网络接口550被配置为将服务器500连接到网络,和一个输入输出(I/O)接口558。服务器500可以操作基于存储在存储器532的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本发明实施例提供的服务器,通过根据第一信息访问记录和第二信息访问记录,获取至少一个信息频繁项集合,计算至少一个信息频繁项集合的提升度,根据至少一个信息频繁项集合的提升度,计算至少一个信息频繁项集合的推荐值,对至少一个信息频繁项集合的推荐值进行排序,根据排序结果选取预设数量的目标信息频繁项集合,向第一用户推荐预设数量的目标信息频繁项集合中的至少一条第一信息。由于可计算信息频繁项集合的推荐值,根据推荐值的排序结果向用户推荐信息,从而能够筛选出推荐值较高的,用户可能较感兴趣的信息。同时,由于推荐值的计算过程中融入了用于描述信息之间正负相关性的提升度,从而能通过提升度拉低包含负相关信息的信息频繁项集合的推荐值,使得根据推荐值的排序结果筛选出的信息更加精准。因此,信息推荐的效果较佳。
需要说明的是:上述实施例提供的信息推荐装置在推荐信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息推荐装置与信息推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。