CN103365842B - 一种页面浏览推荐方法及装置 - Google Patents

一种页面浏览推荐方法及装置 Download PDF

Info

Publication number
CN103365842B
CN103365842B CN201210082666.7A CN201210082666A CN103365842B CN 103365842 B CN103365842 B CN 103365842B CN 201210082666 A CN201210082666 A CN 201210082666A CN 103365842 B CN103365842 B CN 103365842B
Authority
CN
China
Prior art keywords
page
subset
transition probability
probability matrix
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210082666.7A
Other languages
English (en)
Other versions
CN103365842A (zh
Inventor
陈欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210082666.7A priority Critical patent/CN103365842B/zh
Publication of CN103365842A publication Critical patent/CN103365842A/zh
Priority to HK13114117.4A priority patent/HK1186789A1/zh
Application granted granted Critical
Publication of CN103365842B publication Critical patent/CN103365842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开了一种页面浏览推荐方法及装置,包括:针对页面全集中的指定页面子集,确定该指定页面子集分别与页面全集中的各页面子集的相关性指标值;并基于确定的相关性指标值,从页面全集中的各页面子集中,确定与该指定页面子集对应的相关页面子集;以及当用户浏览该页面子集中的页面时,将相关页面子集中的至少一个页面推荐给用户。采用本申请实施例提供的方案,在进行页面浏览推荐时,减少了处理资源的消耗,并提高了处理效率。

Description

一种页面浏览推荐方法及装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种页面浏览推荐方法及装置。
背景技术
目前,在现有的页面浏览推荐技术中,主要是基于页面与页面之间的相关性,进行页面浏览推荐,即当用户在浏览网站上的一个页面时,基于该页面与其它页面之间的相关性,向用户推荐与当前浏览的页面相关性较高的页面。
其中,页面之间的相关性,可以基于页面上的主体内容进行确定,即两个页面上的主体内容越相关,表示这两个页面的相关性越高。例如,以电子商务网站为例,其页面的主体内容大多为展现的产品,所以可以基于产品之间的相关性确定页面之间的相关性,并作为页面浏览推荐的依据,向用户推荐与当前浏览页面所展现产品相关的产品页面。
然而,在上述基于页面之间的相关性进行页面浏览推荐的方案中,需要对网站上的页面之间的相关性进行确定,并在针对一个页面确定对应的推荐页面时,需要比较该页面与其它页面之间的相关性,当网站上的页面数量较多时,实现上述方案需要的处理资源较多,且由于需要处理的数据量较大,导致处理效率较低。
发明内容
有鉴于此,本申请实施例提供一种页面浏览推荐方法及装置,用于解决现有技术中存在的页面浏览推荐的处理资源消耗较大,处理效率较低的问题。
本申请实施例通过如下技术方案实现:
根据本申请实施例的一个方面,提供了一种页面浏览推荐方法,包括:
针对页面全集中的指定页面子集,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值;
基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集;
当用户浏览所述指定页面子集中的页面时,将所述指定页面子集的相关页面子集中的至少一个页面推荐给用户。
根据本申请实施例的另一个方面,还提供了一种页面浏览推荐装置,包括:
统计单元,用于针对页面全集中的指定页面子集,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值;
子集确定单元,用于基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集;
推荐单元,用于当用户浏览所述指定页面子集中的页面时,将所述指定页面子集的相关页面子集中的至少一个页面推荐给用户。
根据本申请实施例的另一个方面,还提供了一种页面浏览推荐方法,包括:
针对指定页面集合中的指定页面,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值;
基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面;
当用户浏览所述指定页面时,将所述指定页面的相关页面中的至少一个页面推荐给用户。
根据本申请实施例的另一个方面,还提供了一种页面浏览推荐装置,包括:
统计单元,用于针对指定页面集合中的指定页面,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值;
页面确定单元,基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面;
推荐单元,用于当用户浏览所述指定页面时,将所述指定页面的相关页面中的至少一个页面推荐给用户。
本申请实施例提供的上述技术方案中,将页面全集划分为若干个页面子集,并针对其中的指定页面子集,确定该指定页面子集分别与页面全集中的各页面子集的相关性指标值,并基于确定的相关性指标值,从页面全集中的各页面子集中,确定与该指定页面子集对应的相关页面子集,从而当用户浏览该指定页面子集中的页面时,将对应的该相关页面子集中的至少一个页面推荐给用户。相比现有技术中在页面浏览推荐时需要参考相关性的页面的数量,本申请实施例提供的上述方案中,需要参考相关性的页面子集的数量更少,所以,在基于页面子集之间的相关性进行页面浏览推荐时,需要处理的数据量更少,因此,减少了处理资源的消耗,提高了处理效率。
本申请实施例提供的上述另一技术方案中,针对页面全集中的指定页面集合,并针对其中的指定页面,确定该指定页面分别与页面集合中的其它各页面的相关性指标值,并基于确定的相关性指标值,从页面集合中的其它各页面中,确定与该指定页面对应的相关页面,从而当用户浏览该指定页面时,将对应的该相关页面中的至少一个页面推荐给用户。相比现有技术中在页面浏览推荐时需要参考相关性的页面全集中页面的数量,本申请实施例提供的上述方案中,由于是针对指定页面集合中的页面进行推荐,需要参考相关性的页面的数量更少,所以,在基于页面之间的相关性进行页面浏览推荐时,需要处理的数据量更少,因此,减少了处理资源的消耗,提高了处理效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
图1为本申请实施例提供的页面浏览推荐方法的流程图;
图2为本申请实施例中提供的将页面全集划分为各页面子集的处理流程图;
图3为本申请实施例中提供的确定页面全集的处理流程图;
图4为本申请实施例中提供的页面浏览推荐方法的详细流程图之一;
图5为本申请实施例中提供的页面浏览推荐方法的详细流程图之二;
图6为本申请实施例中提供的页面浏览推荐装置的结构示意图;
图7为本申请实施例提供的页面浏览推荐方法的流程图;
图8为本申请实施例中提供的页面浏览推荐方法的详细流程图之三;
图9为本申请实施例中提供的页面浏览推荐方法的详细流程图之四;
图10为本申请实施例中提供的页面浏览推荐装置的结构示意图。
具体实施方式
为了给出在进行页面浏览推荐时减少处理资源的消耗,并提高处理效率的实现方案,本申请实施例提供了一种页面浏览推荐方法及装置,该技术方案可以应用于在用户浏览页面时向该用户推荐页面的过程,既可以实现为一种方法,也可以实现为一种装置。以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请实施例提供一种页面浏览推荐方法,如图1所示,包括:
步骤101、针对页面全集中的指定页面子集,确定该指定页面子集分别与页面全集中的各页面子集的相关性指标值。
步骤102、基于确定的相关性指标值,从页面全集中的各页面子集中,确定与该指定页面子集对应的相关页面子集。
步骤103、当用户浏览该页面子集中的页面时,将相关页面子集中的至少一个页面推荐给用户。
在本申请实施例提供的上述页面浏览推荐方法中,将页面全集划分成了若干个页面子集,并基于页面子集之间的相关性指标值,进行页面浏览推荐处理。
具体的,上述相关性指标值,可以为基于用户历史的页面浏览记录,统计页面子集到页面子集的转移概率,并基于统计的转移概率,进行后续的页面浏览推荐处理。
由于目前互联网技术的快速发展,一个网站上的页面数量较多,且用户浏览页面记录的数量较多,因此,本申请实施例中提出上述基于页面子集之间相关性指标值,进行页面浏览推荐的方案,能够减少计算量,提高处理效率,且减少了处理资源的消耗。
并且,在现有技术中基于页面主体内容之间相关性的页面浏览推荐方案中,仅考虑了各页面内容之间的相关性,并没有对用户的浏览习惯进行估计,所以,经常会出现所推荐的页面并非是用户感兴趣的页面,而未被用户点击浏览的情况,即页面浏览推荐的准确性较低,效果较差。而本申请实施例中,当该相关性指标值为统计的页面子集到页面子集的转移概率时,由于转移概率是基于用户的历史页面浏览记录统计的,所以能够真实的反应用户实际的页面浏览习惯,所以,基于转移概率所确定的与该指定页面子集对应的相关页面子集中的页面,更有可能成为浏览该页面子集中页面的用户感兴趣的页面,因此,在用户浏览该页面时,将该相关页面子集中的页面推荐给用户,提高了页面浏览推荐的准确性,并可获得更好的推荐效果。
下面结合附图,以页面子集之间的相关性指标值为页面子集到页面子集的上述转移概率为例,用具体实施例对本申请提供的方法及装置进行详细描述。
为了统计页面子集到页面子集的转移概率,在上述步骤101之前,需要将页面全集划分为若干个页面子集,具体可以将属性或特性相关的页面划分为一个页面子集,具体可以采用各种现有技术中的划分方法,本申请实施例提出如下具体划分方式,如图2所示,包括:
步骤201、按照页面全集中各页面的页面主体内容ID,对页面全集中的各页面进行分类。
目前,为了对网站上的各页面进行有效的管理,一般会基于页面的页面主体内容,为该页面分配一个对应的ID,该ID可以称作页面主体内容ID,也可以称作spu id。例如,在电子商务网站上,可以将产品ID作为展现该产品的页面的页面主体内容ID;在社区网站上,可以将帖子内容ID作为发布该帖子的页面的页面主体内容ID。
本步骤是对页面全集的第一次划分,为了进一步的提高页面推荐的准确性,可以将页面子集划分的更加精细,即通过执行后续的步骤202,对每类页面进行第二次划分。
步骤202、针对每个分类,基于该分类中各页面的页面属性信息,对该分类中各页面进行聚类处理,并将每个聚类结果确定为一个页面子集。
本步骤中,所基于的页面属性信息,根据不同的网站特性,可以进行灵活的选择和设置。例如,针对电子商务网站,可以基于页面中产品的价格、产品的评价、页面美观程度和页面中店铺的信用分等属性信息,进行聚类处理;针对社区网站,可以基于页面中发布帖子的回帖数量、帖子内容的丰富程度、帖子内容是否包括多媒体信息等属性信息,进行聚类处理。
所采用的聚类算法,具体可以采用现有技术中的各种算法,例如,sofm聚类算法,具体的聚类处理步骤,在此不再进行详细描述。
进一步的,为了减少将页面全集划分为各页面子集时的计算量,以及为了减少后续统计转移概率的计算量,本申请实施例中提出如下确定页面全集的方案,如图3所示,包括:
步骤301、基于设定时间段内的页面浏览记录,从全部可浏览页面中确定孤立页面,孤立页面为用户从该页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面。
根据需要,在统计用户的页面浏览记录时,可以统计用户每次从一个页面转移浏览另一个页面的记录,并保存。
本步骤中,基于统计的上述页面浏览记录,从网站上全部可浏览页面中确定孤立页面,即用户从一个页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面。
步骤302、由于孤立页面与其它页面之间不存在浏览转移的关系,所以后续确定的转移概率不受该孤立页面的影响,因此,在确定出孤立页面后,确定由全部可浏览页面中除孤立页面外的其它页面组成页面全集,即将所有孤立页面从全部可浏览页面中排除,并确定由剩余的其它页面组成页面全集。
在完成上述页面全集的确定,以及页面子集的划分后,即可执行上述页面浏览推荐方法中的步骤101-步骤103,本申请实施例中,针对上述步骤101-步骤103的处理流程,提出如图4所示的具体处理流程,包括:
步骤401、针对页面全集中的指定页面子集,分别统计设定时间段内,用户从该指定页面子集中的页面,转移浏览页面全集中的各页面子集中的页面的转移概率。为描述方便,后续将该转移概率称作页面子集到页面子集的转移概率。
其中,指定页面子集可以根据实际需要进行设置,例如,为了更全面的进行页面浏览推荐,可以将页面全集中的每个页面子集设置为上述指定页面子集。
具体可以根据设定时间段内的页面浏览记录,统计转移概率。
根据需要,在统计用户的页面浏览记录时,可以统计用户每次从一个页面转移浏览另一个页面的记录,并保存;也可以根据已划分的各页面子集,直接统计用户每次从一个页面子集中的页面,转移浏览另一个页面子集中的页面的记录。
基于上述统计的浏览记录,针对页面全集中的一个指定页面子集,在统计用户从该指定页面子集到页面全集中的各页面子集(包括指定页面子集自身)的转移概率时,具体包括:
首先确定用户从该指定页面子集中的页面,转移浏览各页面子集中的页面的总数量,以及确定用户从该指定页面子集中的页面,转移浏览页面全集中的一个页面子集中的页面的数量,并使用该数量除以总数量,得到该指定页面子集到该页面子集的转移概率。采用上述相同的方式,确定该指定页面子集到每个页面子集的转移概率。
本申请实施例中,在上述步骤102中,具体可以基于各转移概率的大小关系,确定出值最大的转移概率对应的页面子集,并将该值最大的转移概率对应的页面子集,确定为该指定页面子集对应的相关页面子集。
然而,由于在统计转移概率时,是基于设定时间段内有限的页面浏览记录进行统计的,所以可能出现统计出的转移概率,不足以直接准确的反应用户浏览页面时从一个页面转移到另一个页面的习惯,所以,为了进一步提高页面浏览推荐的准确性,提出如下处理流程:
步骤402、构建转移概率矩阵P,其中,转移概率矩阵P中的元素pij为用户从第i个页面子集中的页面,转移浏览第j个页面子集中的页面的转移概率,i和j为[1,m]中的整数,m为页面全集中全部页面子集的个数。
本步骤中构建的转移概率矩阵P,实质即为马尔可夫(Markov)转移概率矩阵。
步骤403、使用C-K(Chapman-Kolmogorov)方程,确定该转移概率矩阵P的n1步转移概率矩阵P(n1),其中,n1步转移概率矩阵P(n1)中的元素与元素pij对应。
n1的值,可根据实际应用时所统计出的各转移概率的分布情况进行灵活设置,以便后续各元素中更容易出现值收敛至1的元素,或者达到稳定。本申请实施例中,n1值可以取30。
具体可以采用如下公式计算n1步转移概率矩阵P(n1)
其中,n1=a+b,a和b均大于等于1,i,j,k∈S,S为状态集合。
具体还可以采用如下公式计算n1步转移概率矩阵P(n1)
P(n1)=P*P(n1-1)
在确定出n1步转移概率矩阵P(n1)后,既可以基于n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素确定与第i个页面子集对应的相关页面子集,其中,x分别取[1,m]中的整数,即分别取1、2、......、m,对应得到
较容易实现的方案,具体可以从n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面子集,确定为与第i个页面子集对应的相关页面子集。
然而,基于马尔可夫转移概率矩阵的特性可知,当计算n步转移概率矩阵中,存在值收敛至1的元素时,该元素才是希望获得的最佳结果,所以,本申请实施例中,为了进一步的提高页面浏览推荐的准确性,提出如下具体方案:
步骤404、判断n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,是否存在值收敛至1的元素,如果存在,进入步骤405,如果不存在,进入步骤406。
步骤405、从n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
步骤406、使用C-K方程,确定所述转移概率矩阵P的n2步转移矩阵P(n2),其中,n2步转移概率矩阵P(n2)中的元素与元素pij对应,n2大于n1,例如,n2值可以取50。
步骤407、判断n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,是否存在值收敛至1的元素,如果存在,进入步骤408,如果不存在,进入步骤409。
步骤408、从n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
步骤409、使用C-K方程,确定转移概率矩阵P的n3步转移矩阵P(n3),其中,n3步转移概率矩阵P(n3)中的元素与元素pij对应,n3小于n1,例如,n3值可以取20。
步骤410、从n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面子集,确定为与第i个页面子集对应的相关页面子集。
在通过上述步骤401-步骤410,确定出与页面全集中每个页面子集对应的相关页面子集后,可以将确定结果保存,用于后续向用户推荐页面时使用。
步骤411、当用户浏览一个页面子集中的页面时,将该页面子集对应的相关页面子集中的页面推荐给用户。
具体的,可以预先在相关页面子集中选择出若干个特征页面,作为推荐使用的候选页面,并在推荐时,将相关页面子集中的候选页面推荐给用户。
候选页面的选择,具体可以将上述聚类处理过程中的聚类中心页面,以及靠近聚类中心的页面,作为候选页面;也可以根据页面的属性信息,预先为每个页面进行打分,并将分值较高的页面,作为候选页面。具体的候选页面选择过程,可参照现有技术中的各中方法,在此不再进行详细描述。
具体的,在相关页面子集中选择推荐使用的候选页面时,还可以基于保存的页面浏览记录,从相关页面子集中的全部页面中,确定在该设定时间段内,被用户从该页面子集中的页面转移浏览的次数较多的页面,并将被转移浏览的次数较多的前设定数量的页面作为候选页面。
上述图4所示的具体处理流程中,在步骤403中确定该转移概率矩阵P的n1步转移概率矩阵P(n1)之后,是基于是否存在值收敛至1的元素,确定相关页面子集,本申请实施例中,还可以基于n步转移概率矩阵是否达到稳定,确定相关页面子集,具体如图5所示,包括如下处理步骤:
步骤501、针对页面全集中的指定页面子集,分别统计设定时间段内,用户从该指定页面子集中的页面,转移浏览页面全集中的各页面子集中的页面的转移概率。
具体可以与上述步骤401相同,在此不再进行详细描述。
步骤502、构建转移概率矩阵P,其中,转移概率矩阵P中的元素pij为用户从第i个页面子集中的页面,转移浏览第j个页面子集中的页面的转移概率,i和j为[1,m]中的整数,m为页面全集中全部页面子集的个数。
步骤503、使用C-K(Chapman-Kolmogorov)方程,确定该转移概率矩阵P的n1步转移概率矩阵P(n1)和n1+1步转移概率矩阵P(n1+1),其中,n1步转移概率矩阵P(n1)中的元素与元素pij对应,n1+1步转移概率矩阵P(n1+1)中的元素与元素pij对应。
n步转移概率矩阵的具体确定过程,可以与上述步骤403中的相同,在此不再进行详细描述。
步骤504、判断n1步转移概率矩阵P(n1)与n1+1步转移概率矩阵P(n1+1)是否相同,如果相同,进入步骤505,如果不相同,进入步骤506。
其中,当n1步转移概率矩阵P(n1)中的元素,与n1+1步转移概率矩阵P(n1+1)中的对应元素均相同时,表示n1步转移概率矩阵P(n1)与n1+1步转移概率矩阵P(n1+1)相同。
步骤505、从n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面子集,确定为与第i个页面子集对应的相关页面子集。
步骤506、使用C-K方程,确定转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),其中,n2步转移概率矩阵P(n2)中的元素与元素pij对应,其中,n2+1步转移概率矩阵P(n2+1)中的元素与元素pij对应,n2大于n1,例如,n2值可以取50。
步骤507、判断n2步转移概率矩阵P(n2)与n2+1步转移概率矩阵P(n2+1)是否相同,如果相同,进入步骤508,如果不同,进入步骤509。
步骤508、从n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者,
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面子集,确定为与第i个页面子集对应的相关页面子集。
步骤509、使用C-K方程,确定转移概率矩阵P的n3步转移矩阵P(n3),其中,n3步转移概率矩阵P(n3)中的元素与元素pij对应,n3小于n1,例如,n3值可以取20。
步骤510、从n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者,
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面子集,确定为与第i个页面子集对应的相关页面子集。
在通过上述步骤501-步骤510,确定出与页面全集中每个页面子集对应的相关页面子集后,可以将确定结果保存,用于后续向用户推荐页面时使用。
步骤511、当用户浏览一个页面子集中的页面时,将该页面子集对应的相关页面子集中的页面推荐给用户。
具体可以与上述步骤411相同,在此不再进行详细描述。
采用本申请实施例提供的上述页面浏览推荐方法,由于是基于页面子集之间的相关性指标值进行页面浏览推荐,所以能够减少计算量,提高了处理效率,且减少了处理资源的消耗。
并且,当页面子集之间的相关性指标值,为基于用户的历史页面浏览记录统计的页面子集到页面子集的转移概率时,还提高了页面浏览推荐的准确性,并可获得更好的推荐效果。
基于同一发明构思,根据本申请上述实施例提供的页面浏览推荐方法,相应地,本申请另一实施例还提供了一种页面浏览推荐装置,其结构示意图如图6所示,具体包括:
统计单元601,用于针对页面全集中的指定页面子集,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值;
子集确定单元602,用于基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集;
推荐单元603,用于当用户浏览所述指定页面子集中的页面时,将所述指定页面子集的相关页面子集中的至少一个页面推荐给用户。
进一步的,统计单元601,具体用于针对页面全集中的每个页面子集,分别统计设定时间段内,用户从该页面子集中的页面,转移浏览所述页面全集中的各页面子集中的页面的各转移概率;
子集确定单元602,具体用于基于统计的所述各转移概率,从所述页面全集中的各页面子集中,确定与该页面子集对应的相关页面子集。
进一步的,子集确定单元602,具体用于构建转移概率矩阵P,所述转移概率矩阵P中的元素pij为用户从第i个页面子集中的页面,转移浏览第j个页面子集中的页面的转移概率,i和j为[1,m]中的整数,m为所述页面全集中全部页面子集的个数;并使用C-K方程,确定所述转移概率矩阵P的n1步转移概率矩阵P(n1);以及基于所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素确定与第i个页面子集对应的相关页面子集,其中,x分别取[1,m]中的整数。
进一步的,子集确定单元602,具体用于从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者
从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;并当所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,没有值收敛至1的元素时,使用C-K方程,确定所述转移概率矩阵P的n2步转移矩阵P(n2),n2大于n1,从所述n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;以及当所述n2步转移概率矩阵P(n2)与第i个页面子集对应的m个元素中,没有值收敛至1的元素时,使用C-K方程,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
进一步的,所述子集确定单元602,具体用于在所述构建转移概率矩阵P后,确定所述转移概率矩阵P的n1+1步转移概率矩阵P(n1+1)
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)相同时,从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)不同时,确定所述转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),n2大于n1,并当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,从所述n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;
当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
进一步的,上述装置还包括:
全集确定单元604,用于基于所述设定时间段内的页面浏览记录,从全部可浏览页面中确定孤立页面,所述孤立页面为用户从该页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面;并确定由所述全部可浏览页面中除所述孤立页面外的其它页面组成页面全集。
进一步的,上述装置还包括:
子集划分单元605,用于按照所述页面全集中各页面的页面主体内容ID,对所述页面全集中的各页面进行分类;并针对每个分类,基于该分类中各页面的页面属性信息,对该分类中各页面进行聚类处理,并将每个聚类结果确定为一个页面子集。
上述各模块的功能可对应于图1-图4所示流程中的相应处理步骤,在此不再赘述。
综上所述,本申请实施例提供的方案,包括:针对页面全集中的指定页面子集,确定该指定页面子集分别与页面全集中的各页面子集的相关性指标值;并基于确定的相关性指标值,从页面全集中的各页面子集中,确定与该指定页面子集对应的相关页面子集;以及当用户浏览该页面子集中的页面时,将相关页面子集中的至少一个页面推荐给用户。采用本申请实施例提供的方案,在进行页面浏览推荐时,减少了处理资源的消耗,并提高了处理效率。
本申请还实施例提供一种页面浏览推荐方法,如图7所示,包括:
步骤701、针对指定页面集合中的指定页面,确定该指定页面分别与指定页面集合中的其它各页面的相关性指标值。
步骤702、基于确定的相关性指标值,从指定页面集合中的其它各页面中,确定与该指定页面对应的相关页面。
步骤703、当用户浏览该指定页面时,将该指定页面的相关页面中的至少一个页面推荐给用户。
在本申请实施例提供的上述页面浏览推荐方法中,从页面全集中划分出指定页面结合,并基于指定页面结合中的页面之间的相关性指标值,进行页面浏览推荐处理。
具体的,上述相关性指标值,可以为基于用户历史的页面浏览记录,统计页面到页面的转移概率,并基于统计的转移概率,进行后续的页面浏览推荐处理。
由于目前互联网技术的快速发展,一个网站上的页面数量较多,且用户浏览页面记录的数量较多,因此,本申请实施例中提出上述基于指定页面集合中的页面之间相关性指标值,进行页面浏览推荐的方案,能够减少计算量,提高处理效率,且减少了处理资源的消耗。
并且,在现有技术中基于页面主体内容之间相关性的页面浏览推荐方案中,仅考虑了各页面内容之间的相关性,并没有对用户的浏览习惯进行估计,所以,经常会出现所推荐的页面并非是用户感兴趣的页面,而未被用户点击浏览的情况,即页面浏览推荐的准确性较低,效果较差。而本申请实施例中,当该相关性指标值为统计的页面到页面的转移概率时,由于转移概率是基于用户的历史页面浏览记录统计的,所以能够真实的反应用户实际的页面浏览习惯,所以,基于转移概率所确定的与该指定页面对应的相关页面,更有可能成为浏览该指定页面的用户感兴趣的页面,因此,在用户浏览该指定页面时,将该相关页面推荐给用户,提高了页面浏览推荐的准确性,并可获得更好的推荐效果。
下面结合附图,以页面之间的相关性指标值为页面到页面的上述转移概率为例,用具体实施例对本申请提供的方法及装置进行详细描述。
为了统计页面到页面的转移概率,在上述步骤701之前,需要将页面全集划分为若干个页面子集,并将划分得到的一个页面子集作为上述指定页面集合。具体可以将属性或特性相关的页面划分为一个页面子集,具体可以采用各种现有技术中的划分方法,本申请实施例提出了如上述图2所示的划分方法,在此不再进行详细描述。
进一步的,为了减少将页面全集划分为各页面子集时的计算量,以及为了减少后续统计转移概率的计算量,本申请实施例中还提出了如上述图3所示的页面全集确定方法,在此不再进行详细描述。
在通过上述方式确定指定页面集合后,即可执行上述页面浏览推荐方法中的步骤701-步骤703,本申请实施例中,针对上述步骤701-步骤703的处理流程,提出如图8所示的具体处理流程,包括:
步骤801、针对指定页面集合中的指定页面,分别统计设定时间段内,用户从该指定页面,转移浏览指定页面集合中的其它各页面的转移概率。
其中,指定页面可以根据实际需要进行设置,例如,为了更全面的进行页面浏览推荐,可以将指定页面集合中的每个页面设置为上述指定页面。
具体可以根据设定时间段内的页面浏览记录,统计转移概率。
根据需要,在统计用户的页面浏览记录时,可以统计用户每次从一个页面转移浏览另一个页面的记录,并保存。
基于上述统计的浏览记录,针对指定页面集合中的一个指定页面,在统计用户从该指定页面到指定页面集合中的其它各页面的转移概率时,具体包括:
首先确定用户从该指定页面,转移浏览其它各页面的总数量,以及确定用户从该指定页面,转移浏览指定页面集合中的一个页面的数量,并使用该数量除以总数量,得到该指定页面到该页面的转移概率。采用上述相同的方式,确定该指定页面到每个页面的转移概率。
本申请实施例中,在上述步骤702中,具体可以基于各转移概率的大小关系,确定出值按照从大到小的顺序排列的前设定数量的转移概率,并将确定的这前设定数量的转移概率分别对应的页面,确定为该指定页面对应的相关页面。
然而,由于在统计转移概率时,是基于设定时间段内有限的页面浏览记录进行统计的,所以可能出现统计出的转移概率,不足以直接准确的反应用户浏览页面时从一个页面转移到另一个页面的习惯,所以,为了进一步提高页面浏览推荐的准确性,提出如下处理流程:
步骤802、构建转移概率矩阵P,其中,转移概率矩阵P中的元素pij为用户从第i个页面,转移浏览第j个页面的转移概率,i和j为[1,m]中的整数,m为指定页面集合中全部页面的个数。
本步骤中构建的转移概率矩阵P,实质即为马尔可夫(Markov)转移概率矩阵。
步骤803、使用C-K(Chapman-Kolmogorov)方程,确定该转移概率矩阵P的n1步转移概率矩阵P(n1),其中,n1步转移概率矩阵P(n1)中的元素与元素pij对应。
n1的值,可根据实际应用时所统计出的各转移概率的分布情况进行灵活设置,以便后续各元素中更容易出现值收敛至1的元素,或者达到稳定。本申请实施例中,n1值可以取30。
具体可以采用如下公式计算n1步转移概率矩阵P(n1)
其中,n1=a+b,a和b均大于等于1,i,j,k∈S,S为状态集合。
具体还可以采用如下公式计算n1步转移概率矩阵P(n1)
P(n1)=P*P(n1-1)
在确定出n1步转移概率矩阵P(n1)后,既可以基于n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素,确定与第i个页面对应的相关页面,其中,x分别取[1,m]中除i以外的整数,即分别取1、2、......、m,对应得到
较容易实现的方案,具体可以从n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面,确定为与第i个页面对应的相关页面。
然而,基于马尔可夫转移概率矩阵的特性可知,当计算n步转移概率矩阵中,存在值收敛至1的元素时,该元素才是希望获得的最佳结果,所以,本申请实施例中,为了进一步的提高页面浏览推荐的准确性,提出如下具体方案:
步骤804、判断n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,是否存在值收敛至1的元素,如果存在,进入步骤805,如果不存在,进入步骤806。
步骤805、从n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面。
步骤806、使用C-K方程,确定转移概率矩阵P的n2步转移矩阵P(n2),其中,n2步转移概率矩阵P(n2)中的元素与元素pij对应,n2大于n1,例如,n2值可以取50。
步骤807、判断n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,是否存在值收敛至1的元素,如果存在,进入步骤808,如果不存在,进入步骤809。
步骤808、从n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面。
步骤809、使用C-K方程,确定转移概率矩阵P的n3步转移矩阵P(n3),其中,n3步转移概率矩阵P(n3)中的元素与元素pij对应,n3小于n1,例如,n3值可以取20。
步骤810、从n3步转移矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面,确定为与第i个页面对应的相关页面。
在通过上述步骤801-步骤810,确定出与指定页面集合中每个页面对应的相关页面后,可以将确定结果保存,用于后续向用户推荐页面时使用。
步骤811、当用户浏览该指定页面集合中的页面时,将该页面对应的相关页面推荐给用户。
上述图8所示的具体处理流程中,在步骤803中确定该转移概率矩阵P的n1步转移概率矩阵P(n1)之后,是基于是否存在值收敛至1的元素,确定相关页面,本申请实施例中,还可以基于n步转移概率矩阵是否达到稳定,确定相关页面,具体如图9所示,包括如下处理步骤:
步骤901、针对指定页面集合中的指定页面,分别统计设定时间段内,用户从该指定页面,转移浏览指定页面集合中的其它各页面的转移概率。
具体可以与上述步骤801相同,在此不再进行详细描述。
步骤902、构建转移概率矩阵P,其中,转移概率矩阵P中的元素pij为用户从第i个页面,转移浏览第j个页面的转移概率,i和j为[1,m]中的整数,m为指定页面集合中全部页面的个数。
步骤903、使用C-K(Chapman-Kolmogorov)方程,确定该转移概率矩阵P的n1步转移概率矩阵P(n1)和n1+1步转移概率矩阵P(n1+1),其中,n1步转移概率矩阵P(n1)中的元素与元素pij对应,n1+1步转移概率矩阵P(n1+1)中的元素与元素pij对应。
n步转移概率矩阵的具体确定过程,可以与上述步骤803中的相同,在此不再进行详细描述。
步骤904、判断n1步转移概率矩阵P(n1)与n1+1步转移概率矩阵P(n1+1)是否相同,如果相同,进入步骤905,如果不相同,进入步骤906。
其中,当n1步转移概率矩阵P(n1)中的元素,与n1+1步转移概率矩阵P(n1+1)中的对应元素均相同时,表示n1步转移概率矩阵P(n1)与n1+1步转移概率矩阵P(n1+1)相同。
步骤905、从n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面,确定为与第i个页面对应的相关页面。
步骤906、使用C-K方程,确定转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),其中,n2步转移概率矩阵P(n2)中的元素与元素pij对应,其中,n2+1步转移概率矩阵P(n2+1)中的元素与元素pij对应,n2大于n1,例如,n2值可以取50.
步骤907、判断n2步转移概率矩阵P(n2)与n2+1步转移概率矩阵P(n2+1)是否相同,如果相同,进入步骤908,如果不同,进入步骤909。
步骤908、从n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面,确定为与第i个页面对应的相关页面。
步骤909、使用C-K方程,确定转移概率矩阵P的n3步转移矩阵P(n3),其中,n3步转移概率矩阵P(n3)中的元素与元素pij对应,n3小于n1,例如,n3值可以取20。
步骤910、从n3步转移矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;或者
确定值最大的前设定数量的元素,并将该前设定数量的元素对应页面,确定为与第i个页面对应的相关页面。
在通过上述步骤901-步骤910,确定出与指定页面集合中每个页面对应的相关页面后,可以将确定结果保存,用于后续向用户推荐页面时使用。
步骤911、当用户浏览该指定页面集合中的页面时,将该页面对应的相关页面推荐给用户。
采用本申请实施例提供的上述页面浏览推荐方法,由于是基于一个指定页面集合中的各页面之间的相关性指标值进行页面浏览推荐,所以能够减少计算量,提高了处理效率,且减少了处理资源的消耗。
并且,当页面之间的相关性指标值,为基于用户的历史页面浏览记录统计的页面到页面的转移概率时,还提高了页面浏览推荐的准确性,并可获得更好的推荐效果。
针对上述图9所示的页面浏览推荐方法,下面以实际应用中的一个实例进行描述,其中,指定页面集合包括4个页面,分别为页面1、页面2、页面3和页面4,如下表1为统计的转移次数矩阵:
表1
页面1 页面2 页面3 页面4
页面1 0 3 1 0
页面2 2 0 4 8
页面3 5 2 0 3
页面4 4 1 0 0
表1中的数值表示从其所在横项的页面转移到其所在纵项的页面的次数。如下表2为基于上述表1所示的转移次数矩阵,构建的转移概率矩阵:
表2
页面1 页面2 页面3 页面4
页面1 0 3/4 1/4 0
页面2 1/7 0 2/7 4/7
页面3 1/2 1/5 0 3/10
页面4 4/5 1/5 0 0
表1中的数值表示从其所在横项的页面转移到其所在纵项的页面的转移概率。
如下表3为上述表2所示的转移概率矩阵的30步转移概率矩阵:
表3
页面1 页面2 页面3 页面4
页面1 0.3052 0.3066 0.1639 0.2243
页面2 0.3052 0.3066 0.1639 0.2243
页面3 0.3052 0.3066 0.1639 0.2243
页面4 0.3052 0.3066 0.1639 0.2243
如下表4为上述表2所示的转移概率矩阵的31步转移概率矩阵:
表4
页面1 页面2 页面3 页面4
页面1 0.3052 0.3066 0.1639 0.2243
页面2 0.3052 0.3066 0.1639 0.2243
页面3 0.3052 0.3066 0.1639 0.2243
页面4 0.3052 0.3066 0.1639 0.2243
比较表3和表4可知,30步转移概率矩阵和31步转移概率矩阵相同,表示30步转移概率矩阵达到稳定,所以可以基于30步转移概率矩阵确定相关页面,以表3中所示数值可知,页面1作为指定页面时,页面2对应元素的值最大,所以可以将页面2确定为页面1的相关页面,当需要确定两个相关页面时,还可以将页面4确定为页面1的第二个相关页面。
基于同一发明构思,根据本申请上述实施例提供的页面浏览推荐方法,相应地,本申请另一实施例还提供了一种页面浏览推荐装置,其结构示意图如图10所示,具体包括:
统计单元1001,用于针对指定页面集合中的指定页面,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值;
页面确定单元1002,基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面;
推荐单元1003,用于当用户浏览所述指定页面时,将所述指定页面的相关页面中的至少一个页面推荐给用户。
进一步的,统计单元1001,具体用于针对指定页面集合中的指定页面,分别统计设定时间段内,用户从所述指定页面,转移浏览所述指定页面集合中的其它各页面的转移概率;
页面确定单元1002,具体用于基于统计的所述转移概率,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面。
进一步的,页面确定单元1002,具体用于构建转移概率矩阵P,所述转移概率矩阵P中的元素pij为用户从第i个页面,转移浏览第j个页面的转移概率,i和j为[1,m]中的整数,m为所述指定页面集合中全部页面的个数;并确定所述转移概率矩阵P的n1步转移概率矩阵P(n1);以及基于所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素,确定与第i个页面对应的相关页面,其中,x分别取[1,m]中除i以外的整数。
进一步的,页面确定单元1002,具体用于从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;或者
从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;并当所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n2步转移矩阵P(n2),n2大于n1,从所述n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;以及当所述n2步转移概率矩阵P(n2)与第i个页面对应的m个元素中除外的m-1个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面。
进一步的,页面确定单元1002,还用于在所述构建转移概率矩阵P后,确定所述转移概率矩阵P的n1+1步转移概率矩阵P(n1+1)
具体用于当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)相同时,从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)不同时,确定所述转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),n2大于n1,并当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,从所述n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;
当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移概率矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面。
进一步的,上述装置,还包括:
集合划分单元1004,用于采用如下步骤从页面全集中确定所述指定页面集合:
按照所述页面全集中各页面的页面主体内容ID,对所述页面全集中的各页面进行分类;并针对每个分类,基于该分类中各页面的页面属性信息,对该分类中各页面进行聚类处理,并将每个聚类结果确定为一个页面子集;以及从确定的页面子集中选择一个页面子集作为所述指定页面结合。
进一步的,上述装置,还包括:
全集确定单元1005,用于基于所述设定时间段内的页面浏览记录,从全部可浏览页面中确定孤立页面,所述孤立页面为用户从该页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面;并确定由所述全部可浏览页面中除所述孤立页面外的其它页面组成页面全集。
上述各模块的功能可对应于图7-图9所示流程中的相应处理步骤,在此不再赘述。
综上所述,本申请实施例提供的方案,包括:针对指定页面集合中的指定页面,确定该指定页面分别与指定页面集合中的其它各页面的相关性指标值;并基于确定的相关性指标值,从指定页面集合中的其它各页面中,确定与该指定页面对应的相关页面;以及当用户浏览该指定页面时,将该指定页面的相关页面中的至少一个页面推荐给用户。采用本申请实施例提供的方案,在进行页面浏览推荐时,减少了处理资源的消耗,并提高了处理效率。
本申请的实施例所提供的页面浏览推荐装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要页面浏览推荐装置具有上述功能,都应该在本申请的保护范围之内。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种页面浏览推荐方法,其特征在于,包括:
针对页面全集中的指定页面子集,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值;
基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集;
当用户浏览所述指定页面子集中的页面时,将所述指定页面子集的相关页面子集中的至少一个页面推荐给用户。
2.如权利要求1所述的方法,其特征在于,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值,具体为:
分别统计设定时间段内,用户从所述指定页面子集中的页面,转移浏览所述页面全集中的各页面子集中的页面的转移概率;
基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集,具体为:
基于统计的所述转移概率,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集。
3.如权利要求2所述的方法,其特征在于,基于统计的所述转移概率,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集,具体包括:
构建转移概率矩阵P,所述转移概率矩阵P中的元素pij为用户从第i个页面子集中的页面,转移浏览第j个页面子集中的页面的转移概率,i和j为[1,m]中的整数,m为所述页面全集中全部页面子集的个数;
确定所述转移概率矩阵P的n1步转移概率矩阵P(n1)
基于所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素确定与第i个页面子集对应的相关页面子集,其中,x分别取[1,m]中的整数。
4.如权利要求3所述的方法,其特征在于,基于所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素确定与第i个页面子集对应的相关页面子集,具体包括:
从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;或者
从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;并当所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n2步转移矩阵P(n2),n2大于n1,从所述n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;以及当所述n2步转移概率矩阵P(n2)与第i个页面子集对应的m个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
5.如权利要求3所述的方法,其特征在于,在所述构建转移概率矩阵P后,还包括:
确定所述转移概率矩阵P的n1+1步转移概率矩阵P(n1+1)
基于所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素确定与第i个页面子集对应的相关页面子集,具体包括:
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)相同时,从所述n1步转移概率矩阵P(n1)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)不同时,确定所述转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),n2大于n1,并当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,从所述n2步转移概率矩阵P(n2)中与第i个页面子集对应的m个元素中,确定值最大的元素y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集;
当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面子集对应的m个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面子集为与第i个页面子集对应的相关页面子集。
6.如权利要求1-5任一所述的方法,其特征在于,采用如下步骤确定页面全集:
基于设定时间段内的页面浏览记录,从全部可浏览页面中确定孤立页面,所述孤立页面为用户从该页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面;
确定由所述全部可浏览页面中除所述孤立页面外的其它页面组成页面全集。
7.如权利要求1-5任一所述的方法,其特征在于,采用如下步骤确定页面全集中的各页面子集:
按照所述页面全集中各页面的页面主体内容ID,对所述页面全集中的各页面进行分类;
针对每个分类,基于该分类中各页面的页面属性信息,对该分类中各页面进行聚类处理,并将每个聚类结果确定为一个页面子集。
8.一种页面浏览推荐装置,其特征在于,包括:
统计单元,用于针对页面全集中的指定页面子集,确定所述指定页面子集分别与所述页面全集中的各页面子集的相关性指标值;
子集确定单元,用于基于确定的所述相关性指标值,从所述页面全集中的各页面子集中,确定与所述指定页面子集对应的相关页面子集;
推荐单元,用于当用户浏览所述指定页面子集中的页面时,将所述指定页面子集的相关页面子集中的至少一个页面推荐给用户。
9.一种页面浏览推荐方法,其特征在于,包括:
针对指定页面集合中的指定页面,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值;其中,将页面全集划分为若干个页面子集,将划分得到的一个页面子集作为所述指定页面集合;
基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面;
当用户浏览所述指定页面时,将所述指定页面的相关页面中的至少一个页面推荐给用户。
10.如权利要求9所述的方法,其特征在于,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值,具体为:
分别统计设定时间段内,用户从所述指定页面,转移浏览所述指定页面集合中的其它各页面的转移概率;
基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面,具体为:
基于统计的所述转移概率,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面。
11.如权利要求10所述的方法,其特征在于,基于统计的所述转移概率,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面,具体包括:
构建转移概率矩阵P,所述转移概率矩阵P中的元素pij为用户从第i个页面,转移浏览第j个页面的转移概率,i和j为[1,m]中的整数,m为所述指定页面集合中全部页面的个数;
确定所述转移概率矩阵P的n1步转移概率矩阵P(n1)
基于所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素,确定与第i个页面对应的相关页面,其中,x分别取[1,m]中除i以外的整数。
12.如权利要求11所述的方法,其特征在于,基于所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素确定与第i个页面对应的相关页面,具体包括:
从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;或者
从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;并当所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n2步转移矩阵P(n2),n2大于n1,从所述n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值收敛至1的元素y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面;以及当所述n2步转移概率矩阵P(n2)与第i个页面对应的m个元素中除外的m-1个元素中,没有值收敛至1的元素时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值最大的y为[1,m]中的整数,并确定第y个页面为与第i个页面对应的相关页面。
13.如权利要求11所述的方法,其特征在于,在所述构建转移概率矩阵P后,还包括:
确定所述转移概率矩阵P的n1+1步转移概率矩阵P(n1+1)
基于所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素,确定与第i个页面对应的相关页面,具体包括:
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)相同时,从所述n1步转移概率矩阵P(n1)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;
当所述n1步转移概率矩阵P(n1)与所述n1+1步转移概率矩阵P(n1+1)不同时,确定所述转移概率矩阵P的n2步转移矩阵P(n2)和n2+1步转移概率矩阵P(n2+1),n2大于n1,并当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,从所述n2步转移概率矩阵P(n2)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面;
当所述n2步转移概率矩阵P(n2)与所述n2+1步转移概率矩阵P(n2+1)相同时,确定所述转移概率矩阵P的n3步转移矩阵P(n3),n3小于n1,从所述n3步转移概率矩阵P(n3)中与第i个页面对应的m个元素中除外的m-1个元素中,确定值按照从大到小的顺序排列的前设定数量的元素,并确定所述前设定数量的元素对应的页面为与第i个页面对应的相关页面。
14.如权利要求9-13任一所述的方法,其特征在于,采用如下步骤从页面全集中确定所述指定页面集合:
按照所述页面全集中各页面的页面主体内容ID,对所述页面全集中的各页面进行分类;
针对每个分类,基于该分类中各页面的页面属性信息,对该分类中各页面进行聚类处理,并将每个聚类结果确定为一个页面子集;
从确定的页面子集中选择一个页面子集作为所述指定页面集合。
15.如权利要求14所述的方法,其特征在于,采用如下步骤确定页面全集:
基于设定时间段内的页面浏览记录,从全部可浏览页面中确定孤立页面,所述孤立页面为用户从该页面未转移浏览过其它页面,并且也未从其它页面转移浏览过该页面的页面;
确定由所述全部可浏览页面中除所述孤立页面外的其它页面组成页面全集。
16.一种页面浏览推荐装置,其特征在于,包括:
统计单元,用于针对指定页面集合中的指定页面,确定所述指定页面分别与所述指定页面集合中的其它各页面的相关性指标值;其中,将页面全集划分为若干个页面子集,将划分得到的一个页面子集作为所述指定页面集合;
页面确定单元,基于确定的所述相关性指标值,从所述指定页面集合中的其它各页面中,确定与所述指定页面对应的相关页面;
推荐单元,用于当用户浏览所述指定页面时,将所述指定页面的相关页面中的至少一个页面推荐给用户。
CN201210082666.7A 2012-03-26 2012-03-26 一种页面浏览推荐方法及装置 Active CN103365842B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210082666.7A CN103365842B (zh) 2012-03-26 2012-03-26 一种页面浏览推荐方法及装置
HK13114117.4A HK1186789A1 (zh) 2012-03-26 2013-12-20 種頁面瀏覽推薦方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210082666.7A CN103365842B (zh) 2012-03-26 2012-03-26 一种页面浏览推荐方法及装置

Publications (2)

Publication Number Publication Date
CN103365842A CN103365842A (zh) 2013-10-23
CN103365842B true CN103365842B (zh) 2016-08-24

Family

ID=49367219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210082666.7A Active CN103365842B (zh) 2012-03-26 2012-03-26 一种页面浏览推荐方法及装置

Country Status (2)

Country Link
CN (1) CN103365842B (zh)
HK (1) HK1186789A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279289B (zh) * 2015-12-04 2019-03-22 中国传媒大学 基于指数衰减窗口的个性化音乐推荐排序方法
CN109101502B (zh) * 2017-06-20 2021-10-19 阿里巴巴集团控股有限公司 一种页面的流量配置方法、切换方法及装置
CN109542297B (zh) * 2017-09-22 2022-04-26 阿里巴巴集团控股有限公司 提供操作引导信息的方法、装置及电子设备
CN110473043A (zh) * 2018-05-11 2019-11-19 北京京东尚科信息技术有限公司 一种基于用户行为的物品推荐方法和装置
CN109902706B (zh) * 2018-11-09 2023-08-22 华为技术有限公司 推荐方法及装置
CN111666485B (zh) * 2019-03-07 2024-01-09 深圳市雅阅科技有限公司 一种信息推荐方法、装置及终端
CN111324842B (zh) * 2020-02-13 2022-06-07 贝壳技术有限公司 用于实现页面优化的方法、装置、介质和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN101814083A (zh) * 2010-01-08 2010-08-25 上海复歌信息科技有限公司 网页自动分类方法和系统
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN102124462A (zh) * 2008-06-23 2011-07-13 谷歌公司 查询识别和关联

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100987330B1 (ko) * 2008-05-21 2010-10-13 성균관대학교산학협력단 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법
TWI428770B (zh) * 2010-08-02 2014-03-01 Pc Home Online Inc 紀錄及搜尋網頁之方法以及紀錄瀏覽網頁之方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN102124462A (zh) * 2008-06-23 2011-07-13 谷歌公司 查询识别和关联
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN101814083A (zh) * 2010-01-08 2010-08-25 上海复歌信息科技有限公司 网页自动分类方法和系统

Also Published As

Publication number Publication date
CN103365842A (zh) 2013-10-23
HK1186789A1 (zh) 2014-03-21

Similar Documents

Publication Publication Date Title
CN103365842B (zh) 一种页面浏览推荐方法及装置
Shinde et al. Hybrid personalized recommender system using centering-bunching based clustering algorithm
CN106557513B (zh) 事件信息推送方法及事件信息推送装置
CN104077714B (zh) 访问网站的用户的偏好获取、广告推送方法和系统
CN103425677B (zh) 关键词分类模型确定方法、关键词分类方法及装置
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
Lai et al. Novel personal and group-based trust models in collaborative filtering for document recommendation
CN109711925A (zh) 具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统
CN104111941A (zh) 信息展示的方法及设备
CN106407349A (zh) 一种产品推荐方法及装置
CN105247507A (zh) 品牌的影响力得分
CN103544623A (zh) 一种基于用户偏好特征建模的Web 服务推荐方法
CN105893585B (zh) 一种结合标签数据的二部图模型学术论文推荐方法
CN106446189A (zh) 一种资讯推荐方法及系统
CN110197404A (zh) 可降低流行度偏差的个性化长尾商品推荐方法和系统
CN104615631A (zh) 一种信息推荐的方法及装置
CN110473073A (zh) 线性加权推荐的方法及装置
CN111340522B (zh) 资源推荐方法、装置、服务器及存储介质
CN105654361A (zh) 一种基于社区o2o的信用评价方法和系统
Gan et al. ROUND: Walking on an object–user heterogeneous network for personalized recommendations
CN103761246B (zh) 一种基于链接网络的用户领域识别方法及其装置
CN106156113A (zh) 一种视频推荐的方法、系统及电子设备
CN104537095B (zh) 一种基于吸引力模型的信息精准推送方法和系统
CN101639856A (zh) 检测互联网信息传播的网页关联评价装置
CN115129964A (zh) 推送待推荐内容项的方法、推送系统、电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1186789

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1186789

Country of ref document: HK