CN103995893A - 一种浏览器中的快链推荐方法、装置和系统 - Google Patents

一种浏览器中的快链推荐方法、装置和系统 Download PDF

Info

Publication number
CN103995893A
CN103995893A CN201410245573.0A CN201410245573A CN103995893A CN 103995893 A CN103995893 A CN 103995893A CN 201410245573 A CN201410245573 A CN 201410245573A CN 103995893 A CN103995893 A CN 103995893A
Authority
CN
China
Prior art keywords
user
network address
fast chain
web page
statistical information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410245573.0A
Other languages
English (en)
Inventor
尹程果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201410245573.0A priority Critical patent/CN103995893A/zh
Publication of CN103995893A publication Critical patent/CN103995893A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种浏览器中的快链推荐方法、装置和系统,本发明实施例采用获取网页访问统计信息,其中,该网页访问统计信息包括该用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息,获取快链候选池,然后计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向该用户推荐快链;该方案中可以实现对不同的用户的个性化推荐。

Description

一种浏览器中的快链推荐方法、装置和系统
技术领域
本发明涉及通信技术领域,具体涉及一种浏览器中的快链推荐方法、装置和系统。
背景技术
随着互联网技术的发展,各式各样的网站也如雨后春笋般涌现,为了方便用户在众多网址中能够快速获取到所需的网址,现有的浏览器一般都会以网址导航的方式自行向用户推荐一些网址,其中,这种以网址导航的方式向用户推荐网址的方式称为快链推荐,而打开浏览器后显示的网址导航则称为快链。其中,在进行快链推荐时,所推荐的网址可以是人工挑选的,也可以由系统根据网址的热度自行进行筛选。
在对现有技术的研究和实践过程中,本发明的发明人发现,无论是人工挑选还是根据网址的热度自行进行筛选,所有用户所接收到的快链推荐都是相同的,而这些快链并不一定能够满足所有用户的需求,因此,推荐效果并不佳,灵活性也较低。
发明内容
本发明实施例提供一种浏览器中的快链推荐方法、装置和系统,可以对不同的用户进行个性化推荐,提高灵活性。
一种浏览器中的快链推荐方法,包括:
获取用户的网页访问统计信息,所述网页访问统计信息包括所述用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息;
获取快链候选池,所述快链候选池包括推荐快链的网址;
计算所述网页访问统计信息中的网址到所述快链候选池中的网址之间的转移概率;
根据所述转移概率确定需要推荐给所述用户的快链,得到推荐集合;
根据所述推荐集合向所述用户推荐快链。
一种快链推荐装置,包括信息获取单元、候选池获取单元、运算单元、确定单元和推荐单元,如下:
信息获取单元,用于获取用户的网页访问统计信息,所述网页访问统计信息包括所述用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息;
候选池获取单元,用于获取快链候选池,所述快链候选池包括推荐快链的网址;
运算单元,用于计算所述网页访问统计信息中的网址到所述快链候选池中的网址之间的转移概率;
确定单元,用于根据所述转移概率确定需要推荐给所述用户的快链,得到推荐集合;
推荐单元,用于根据所述推荐集合向所述用户推荐快链。
一种通信系统,包括本发明实施例提供的任一种快链推荐装置。
本发明实施例采用获取网页访问统计信息,其中,该网页访问统计信息包括该用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息,获取快链候选池,然后计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向该用户推荐快链;由于在该方案中,可以根据用户的访问网页喜好和习惯,从快链候选池中估算出符合用户喜好和习惯的快链,并推荐给用户,所以,大大提高了推荐的灵活性,可以实现对不同的用户的个性化推荐,提高用户服务质量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供浏览器中的快链推荐方法的流程图;
图2是本发明实施例提供浏览器中的快链推荐方法的另一流程图;
图3是本发明实施例提供的快链推荐装置的结构示意图;
图4是本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种浏览器中的快链推荐方法、装置和系统。以下分别进行详细说明。
实施例一、
本发明实施例将从快链推荐装置的角度进行描述,该快链推荐装置具体可以集成在服务器等设备中。
一种浏览器中的快链推荐方法,包括:获取用户的网页访问统计信息,其中,该网页访问统计信息包括该用户的用户标识、用户访问的网页的网址和用户对该网页的兴趣程度信息,获取快链候选池,其中,该快链候选池包括系统推荐快链的网址,然后,计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向所述用户推荐快链。
如图1所示,该浏览器中的快链推荐方法的具体流程可以如下:
101、获取用户的网页访问统计信息,例如,具体可以如下:
获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息。
其中,该网页浏览日志可以包括该用户的用户标识、该用户访问的网页的网址和该用户访问网页的时间等信息。而该网页访问统计信息可以包括该用户的用户标识、该用户访问的网页的网址、以及该用户对网页的兴趣程度信息等。
其中,该用户对网页的兴趣程度信息可以包括网页被所述用户访问的次数,还可以包括网页被所述用户浏览的时间、以及被浏览的完成度等信息,其中,网页被所述用户浏览的时间、以及被浏览的完成等信息可以根据该用户访问网页的时间等信息来确定,在此不再赘述。
102、获取快链候选池。
其中,该快链候选池可以根据实际应用的需求进行设置,该快链候选池可以包括推荐快链的网址,该推荐快链的网址也可以根据实际应用的需求进行设置。
此外,该快链候选池还可以定时或根据需求进行更新,比如由服务器提供商进行更新或由用户自行下载更新包进行更新,等等,在此不再赘述。
103、计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率。
其中,计算转移概率的方式可以有多种,例如,如果该用户对网页的兴趣程度信息包括网页被该用户访问的次数,则步骤103(即分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率)具体可以包括:
确定该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,以及确定该第j个网址被该用户访问的次数,然后计算该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,与该第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。
比如,如果将该网页访问统计信息中第i个网址记为URLi,该快链候选池中第j个网址记为URLj,将该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数记为C(URLi,URLj),该第j个网址被所述用户访问的次数记为C(URLj),则该第i个网址到第j个网址的转移概率aij可以用如下公式表示:
a ij = C ( URL i , URL j ) C ( URL j ) .
其中,i和j为正整数,i小于等于该网页访问统计信息中网址的总数m,j小于等于该快链候选池中的网址的总数n。
104、根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,例如,具体可以如下:
以该网页访问统计信息中的网址总数m为行数,以该快链候选池中网址的总数n为列数,建立关于该转移概率的矩阵A,计算该矩阵A的转置矩阵,然后根据该转置矩阵确定需要推荐给该用户的快链,得到推荐集合,比如,可以如下:
A = a 11 a 12 · · · a 1 n a 21 a 22 · · · a 2 n · · · · · · · · · · · · a m 1 a m 2 · · · a mn .
在得到矩阵A之后,计算该矩阵A的转置矩阵,得到AT,然后根据该转置矩阵AT确定需要推荐给该用户的快链,得到推荐集合。
其中,可以直接将该转置矩阵AT直接转化为向量,并作为推荐集合对应的向量。当然,为了提高推荐的准确度和效果,此时还可以将该用户对网页的兴趣程度信息也作为确定推荐集合的因素之一,即步骤“根据该转置矩阵AT确定需要推荐给本地用户的快链,得到推荐集合”具体可以如下:
分别根据该用户对网页的兴趣程度信息确定在该网页访问统计信息的所有网址中,各个网址的权重,根据该权重将该网页访问统计信息转换为对应的向量,为了描述方便,在本发明实施例中,将该得到的向量称为第一向量,记作X,将该转置矩阵AT乘以所述第一向量X,得到推荐集合对应的向量,在本发明实施例中称为第二向量,记作Y,如下:
Y=ATX。
105、根据该推荐集合向该用户推荐快链。
其中,具体可以将推荐集合中的网址都作为快链推荐为该用户,也可以根据一定的策略从中选择部分网址作为快链推荐给该用户,比如,可以设置将第二向量Y中元素的值大于某个阈值的元素所对应的网址作为快链推荐给该用户,或者,按照第二向量Y中元素的值的大小对Y中的元素进行排序,选取值最大的前几个元素所对应的网址作为快链推荐给该用户,等等,即,步骤“根据该推荐集合向该用户推荐快链”具体可以采用如下任一种方式:
(1)将该第二向量Y中所有元素对应的网址作为快链推荐给该用户。
(2)将该第二向量Y中元素的取值大于预置阈值的元素对应的网址作为快链推荐给该用户。
其中,该阈值可以根据实际应用的需求进行设置,在此不再赘述。
(3)根据该第二向量Y中元素的取值大小对第二向量Y中的元素进行排序,将取值最大的前K个元素对应的网址作为快链推荐给所述用户.
其中,K为正整数,且K小于等于该第二向量Y中元素的总数。
需说明的是,第二向量Y中元素的取值对应着推荐得分。
由上可知,本发明实施例采用获取网页访问统计信息,其中,该网页访问统计信息包括该用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息,获取快链候选池,然后分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向该用户推荐快链;由于在该方案中,可以根据用户的访问网页喜好和习惯,从预置的快链候选池中估算出符合用户喜好和习惯的快链,并推荐给用户,所以,大大提高了推荐的灵活性,可以实现对不同的用户的个性化推荐,提高用户服务质量。
实施例二、
根据实施例一所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该快链推荐装置具体可以集成在服务器中为例进行说明。
如图2所示,一种浏览器中的快链推荐方法,具体流程可以如下:
201、服务器获取用户的网页浏览日志。
其中,该网页浏览日志可以包括该用户的用户标识、该用户访问的网页的网址和该用户访问网页的时间等信息。
202、服务器根据该网页浏览日志生成网页访问统计信息。
其中,该网页访问统计信息可以包括该用户的用户标识、该用户访问的网页的网址、以及该用户对网页的兴趣程度信息等。而该用户对网页的兴趣程度信息可以包括网页被所述用户访问的次数,还可以包括网页被所述用户浏览的时间、以及被浏览的完成度等信息,其中,网页被所述用户浏览的时间、以及被浏览的完成等信息可以根据该用户访问网页的时间等信息来确定,在此不再赘述。
其中,该网页访问统计信息具体可以表现为多种数据结构,比如,具体可以以数据表形式来对该网页访问统计信息进行记录,为了描述方便,在本发明实施例中,将该数据表称为用户—网址列表,如表一所示:
表一:
其中,Usr则表示用户标识,weight(权重)的值可以反映出该用户对网页的兴趣程度,即该weight为该用户对网页的兴趣程度信息,而URL,比如URL1、URL2、URL3……URLN等等,则为用户访问的网页的网址。
当然,也可以采用其他的数据结构来记录上述信息,在此不再赘述。
203、服务器获取快链候选池。
其中,该快链候选池可以包括推荐快链的网址,该快链候选池还可以定时或根据需求进行更新,比如由服务器提供商进行更新或由用户自行下载更新包进行更新,等等,在此不再赘述。
204、服务器分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,例如,具体可以如下:
确定该网页访问统计信息中第i个网址URLi和该快链候选池中第j个网址URLj同时被该用户访问的次数C(URLi,URLj),以及确定该第j个网址URLj被该用户访问的次数C(URLj),然后计算C(URLi,URLj)与C(URLj)的商,得到第i个网址到第j个网址的转移概率aij,如下:
a ij = C ( URL i , URL j ) C ( URL j ) .
其中,i和j为正整数,i小于等于该网页访问统计信息中网址的总数m,j小于等于该快链候选池中的网址的总数n。
205、服务器以该网页访问统计信息中的网址总数m为行数,以该快链候选池中网址的总数n为列数,建立关于该转移概率的矩阵A,如下:
A = a 11 a 12 · · · a 1 n a 21 a 22 · · · a 2 n · · · · · · · · · · · · a m 1 a m 2 · · · a mn .
206、服务器计算该矩阵A的转置矩阵AT,根据该转置矩阵AT确定需要推荐给该用户的快链,得到推荐集合。
其中,可以直接将该转置矩阵AT直接转化为向量,并作为推荐集合对应的向量。当然,为了提高推荐的准确度和效果,此时还可以将该用户对网页的兴趣程度信息也作为确定推荐集合的因素之一,即步骤“根据该转置矩阵AT确定需要推荐给本地用户的快链,得到推荐集合”具体可以如下:
分别根据该用户对网页的兴趣程度信息确定在该网页访问统计信息的所有网址中,各个网址的权重,根据该权重将该网页访问统计信息转换为对应的向量,为了描述方便,在本发明实施例中,将该得到的向量称为第一向量,记作X,将该转置矩阵AT乘以所述第一向量X,得到推荐集合对应的向量,在本发明实施例中称为第二向量,记作Y,如下:
Y=ATX。
207、服务器根据该推荐集合向该用户推荐快链。
其中,具体可以将推荐集合中的网址都作为快链推荐为该用户,也可以根据一定的策略从中选择部分网址作为快链推荐给该用户,比如,可以设置将第二向量Y中元素的值大于某个阈值的元素所对应的网址作为快链推荐给该用户,或者,按照第二向量Y中元素的值的大小对Y中的元素进行排序,选取值最大的前几个元素所对应的网址作为快链推荐给该用户,等等,即,步骤“根据该推荐集合向该用户推荐快链”具体可以采用如下任一种方式:
(1)将该第二向量Y中所有元素对应的网址作为快链推荐给该用户。
(2)将该第二向量Y中元素的取值大于预置阈值的元素对应的网址作为快链推荐给该用户。
其中,该阈值可以根据实际应用的需求进行设置,在此不再赘述。
(3)根据该第二向量Y中元素的取值大小对第二向量Y中的元素进行排序,将取值最大的前K个元素对应的网址作为快链推荐给所述用户.
其中,K为正整数,且K小于等于该第二向量Y中元素的总数。
需说明的是,第二向量Y中元素的取值对应着推荐得分。
由上可知,本发明实施例采用获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息,并获取快链候选池,然后计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向该用户推荐快链;由于在该方案中,可以根据用户的访问网页喜好和习惯,从预置的快链候选池中估算出符合用户喜好和习惯的快链,并推荐给用户,所以,大大提高了推荐的灵活性,可以实现对不同的用户的个性化推荐,提高用户服务质量。
实施例三、
为了更好地实施以上方法,本发明实施例还提供一种快链推荐装置,如图3所示,该快链推荐装置可以包括信息获取单元301、候选池获取单元302、运算单元303、确定单元304和推荐单元305,如下:
信息获取单元301,用于获取用户的网页访问统计信息。
其中,该网页访问统计信息可以包括该用户的用户标识、该用户访问的网页的网址、以及该用户对网页的兴趣程度信息等。该用户对网页的兴趣程度信息可以包括网页被所述用户访问的次数,还可以包括网页被所述用户浏览的时间、以及被浏览的完成度等信息,其中,网页被所述用户浏览的时间、以及被浏览的完成等信息可以根据该用户访问网页的时间等信息来确定,在此不再赘述。
候选池获取单元302,用于获取快链候选池。
其中,该快链候选池可以根据实际应用的需求进行设置,该快链候选池可以包括推荐快链的网址,该推荐快链的网址也可以根据实际应用的需求进行设置。
此外,该快链候选池还可以定时或根据需求进行更新,比如由服务器提供商进行更新或由用户自行下载更新包进行更新,等等,在此不再赘述。
运算单元303,用于计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率。
确定单元304,用于根据该转移概率确定需要推荐给该用户的快链,得到推荐集合。
推荐单元305,用于根据所述推荐集合向所述用户推荐快链。
例如,该候选池获取单元302,具体可以获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息。
其中,该网页浏览日志可以包括该用户的用户标识、该用户访问的网页的网址和该用户访问网页的时间等信息。
其中,计算转移概率的方式可以多种,例如,如果该用户对网页的兴趣程度信息包括网页被该用户访问的次数的话,则可以如下:
运算单元303,具体用于确定该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,以及确定该第j个网址被该用户访问的次数,然后计算该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,与该第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。
比如,如果将该网页访问统计信息中第i个网址记为URLi,该快链候选池中第j个网址记为URLj,将该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数记为C(URLi,URLj),该第j个网址被所述用户访问的次数记为C(URLj),则该第i个网址到第j个网址的转移概率aij可以用如下公式表示:
a ij = C ( URL i , URL j ) C ( URL j ) .
其中,i和j为正整数,i小于等于该网页访问统计信息中网址的总数m,j小于等于该快链候选池中的网址的总数n。
可选的,其中,确定单元304可以包括计算子单元和确定子单元,如下:
计算子单元,用于以所述网页访问统计信息中的网址总数n为行数,以所述快链候选池中网址的总数m为列数,建立关于该转移概率的矩阵A;计算该矩阵的转置矩阵AT,如下:
A = a 11 a 12 · · · a 1 n a 21 a 22 · · · a 2 n · · · · · · · · · · · · a m 1 a m 2 · · · a mn .
确定子单元,用于根据该转置矩阵确定需要推荐给该用户的快链,得到推荐集合。
其中,可以直接将该转置矩阵AT直接转化为向量,并作为推荐集合对应的向量。当然,为了提高推荐的准确度和效果,此时还可以将该用户对网页的兴趣程度信息也作为确定推荐集合的因素之一,即具体可以如下:
确定子单元,具体可以用于分别根据该用户对网页的兴趣程度信息确定在该网页访问统计信息的所有网址中,各个网址的权重,根据该权重将该网页访问统计信息转换为对应的向量,得到第一向量,记作X,将该转置矩阵AT乘以所述第一向量X,得到推荐集合对应的向量,即第二向量,记作Y,如下:
Y=ATX。
则此时,推荐单元305具体用于可以将推荐集合中的网址都作为快链推荐为该用户,也可以根据一定的策略从中选择部分网址作为快链推荐给该用户,比如,可以设置将第二向量Y中元素的值大于某个阈值的元素所对应的网址作为快链推荐给该用户,或者,按照第二向量Y中元素的值的大小对Y中的元素进行排序,选取值最大的前几个元素所对应的网址作为快链推荐给该用户,等等,即推荐单元305,具体可以执行如下任意方式来进行推荐:
(1)将该第二向量Y中所有元素对应的网址作为快链推荐给该用户。
(2)将该第二向量Y中元素的取值大于预置阈值的元素对应的网址作为快链推荐给该用户。
其中,该阈值可以根据实际应用的需求进行设置,在此不再赘述。
(3)根据该第二向量Y中元素的取值大小对第二向量Y中的元素进行排序,将取值最大的前K个元素对应的网址作为快链推荐给所述用户.
其中,K为正整数,且K小于等于该第二向量Y中元素的总数。
需说明的是,第二向量Y中元素的取值对应着推荐得分。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,该快链推荐装置具体可以集成在服务器等设备中。
由上可知,本发明实施例的信息获取单元301可以获取网页访问统计信息,其中,该网页访问统计信息包括该用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息,然后由候选池获取单元302获取快链候选池,并由运算单元303分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,再然后,由确定单元304根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,由推荐单元305根据该推荐集合向该用户推荐快链;由于在该方案中,可以根据用户的访问网页喜好和习惯,从预置的快链候选池中估算出符合用户喜好和习惯的快链,并推荐给用户,所以,大大提高了推荐的灵活性,可以实现对不同的用户的个性化推荐,提高用户服务质量。
实施例四、
相应的,本发明实施例还提供一种通信系统,包括本发明实施例提供的任一种快链推荐装置,该快链推荐装置具体可以参见实施例三,例如可以如下:
快链推荐装置,用于获取用户的网页访问统计信息,获取快链候选池,计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向所述用户推荐快链。
其中,快链推荐装置获取用户的网页访问统计信息可以有多种方式,例如,具体可以获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息。
其中,该网页浏览日志可以包括该用户的用户标识、该用户访问的网页的网址和该用户访问网页的时间等信息。而该网页访问统计信息可以包括该用户的用户标识、该用户访问的网页的网址、以及该用户对网页的兴趣程度信息等。该用户对网页的兴趣程度信息可以包括网页被所述用户访问的次数,还可以包括网页被所述用户浏览的时间、以及被浏览的完成度等信息,其中,网页被所述用户浏览的时间、以及被浏览的完成等信息可以根据该用户访问网页的时间等信息来确定,在此不再赘述。
其中,快链推荐装置计算转移概率以及确定推荐集合的方式也可以有多种,例如,可以如下:
确定该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,以及确定该第j个网址被该用户访问的次数,然后计算该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,与该第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。然后,以该网页访问统计信息中的网址总数m为行数,以该快链候选池中网址的总数n为列数,建立关于该转移概率的矩阵A,计算该矩阵A的转置矩阵,然后根据该转置矩阵确定需要推荐给该用户的快链,得到推荐集合
其中,可以直接将该转置矩阵AT直接转化为向量,并作为推荐集合对应的向量。当然,为了提高推荐的准确度和效果,还可以将该用户对网页的兴趣程度信息也作为确定推荐集合的因素之一,具体可参见前面的实施例,在此不再赘述。
此外,该链推荐装置在根据该推荐集合向该用户推荐快链时,可以将推荐集合中的网址都作为快链推荐为该用户,也可以根据一定的策略从中选择部分网址作为快链推荐给该用户,比如,可以设置将第二向量Y中元素的值大于某个阈值的元素所对应的网址作为快链推荐给该用户,或者,按照第二向量Y中元素的值的大小对Y中的元素进行排序,选取值最大的前几个元素所对应的网址作为快链推荐给该用户,等等。
以上各个操作具体可参见前面的实施例,在此不再赘述。
由于该通信系统包括本发明实施例提供的任一种快链推荐装置,因此可以实现与本发明实施例所提供的任一种快链推荐装置同样的有益效果,详见实施例三,在此不再赘述。
实施例五、
在一个实施例中,如图4所示,提供了一种可运行前述浏览器中的快链推荐方法的服务器结构示意图,该服务器结构可应用于互联网应用的服务器上。该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(CPU,Central Processing Units)401(例如,一个或一个以上处理器)和存储器403,一个或一个以上存储操作系统4021、数据4022或应用程序4023的存储介质402(例如一个或一个以上海量存储设备)。其中,存储器403和存储介质402可以是短暂存储或持久存储。存储在存储介质402
的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器401可以设置为与存储介质402通信,在服务器上执行存储介质402中的一系列指令操作。服务器还可以包括一个或一个以上电源406,一个或一个以上有线或无线网络接口404,一个或一个以上输入输出接口405,和/或,一个或一个以上操作系统4021,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中所述的由服务器所执行的步骤可以基于该图4所示的服务器结构。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
尽管未示出,服务器还可以包括其他的模块,在此不再赘述。具体在本实施例中,可以由中央处理器401来运行存储在存储介质402中的应用程序,从而实现各种功能,如下:
获取用户的网页访问统计信息,获取预置的快链候选池,分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向所述用户推荐快链。
其中,获取用户的网页访问统计信息可以有多种方式,例如,具体可以获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息。
其中,该网页浏览日志可以包括该用户的用户标识、该用户访问的网页的网址和该用户访问网页的时间等信息。而该网页访问统计信息可以包括该用户的用户标识、该用户访问的网页的网址、以及该用户对网页的兴趣程度信息等。该用户对网页的兴趣程度信息可以包括网页被所述用户访问的次数,还可以包括网页被所述用户浏览的时间、以及被浏览的完成度等信息,其中,网页被所述用户浏览的时间、以及被浏览的完成等信息可以根据该用户访问网页的时间等信息来确定,在此不再赘述。
其中,计算转移概率以及确定推荐集合的方式也可以有多种,例如,可以如下:
确定该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,以及确定该第j个网址被该用户访问的次数,然后计算该网页访问统计信息中第i个网址和该快链候选池中第j个网址同时被该用户访问的次数,与该第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。然后,以该网页访问统计信息中的网址总数m为行数,以该快链候选池中网址的总数n为列数,建立关于该转移概率的矩阵A,计算该矩阵A的转置矩阵,然后根据该转置矩阵确定需要推荐给该用户的快链,得到推荐集合
其中,可以直接将该转置矩阵AT直接转化为向量,并作为推荐集合对应的向量。当然,为了提高推荐的准确度和效果,还可以将该用户对网页的兴趣程度信息也作为确定推荐集合的因素之一,具体可参见前面的实施例,在此不再赘述。
此外,在根据该推荐集合向该用户推荐快链时,可以将推荐集合中的网址都作为快链推荐为该用户,也可以根据一定的策略从中选择部分网址作为快链推荐给该用户,比如,可以设置将第二向量Y中元素的值大于某个阈值的元素所对应的网址作为快链推荐给该用户,或者,按照第二向量Y中元素的值的大小对Y中的元素进行排序,选取值最大的前几个元素所对应的网址作为快链推荐给该用户,等等。
以上各个操作具体可参见前面的实施例,在此不再赘述。
由上可知,本发明实施例的服务器采用获取用户的网页浏览日志,根据该网页浏览日志生成网页访问统计信息,并获取预置的快链候选池,然后分别计算该网页访问统计信息中的网址到该快链候选池中的网址之间的转移概率,根据该转移概率确定需要推荐给该用户的快链,得到推荐集合,最后,根据该推荐集合向该用户推荐快链;由于在该方案中,可以根据用户的访问网页喜好和习惯,从预置的快链候选池中估算出符合用户喜好和习惯的快链,并推荐给用户,所以,大大提高了推荐的灵活性,可以实现对不同的用户的个性化推荐,提高用户服务质量。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种浏览器中的快链推荐方法、装置和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种浏览器中的快链推荐方法,其特征在于,包括:
获取用户的网页访问统计信息,所述网页访问统计信息包括所述用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息;
获取快链候选池,所述快链候选池包括推荐快链的网址;
计算所述网页访问统计信息中的网址到所述快链候选池中的网址之间的转移概率;
根据所述转移概率确定需要推荐给所述用户的快链,得到推荐集合;
根据所述推荐集合向所述用户推荐快链。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的网页访问统计信息包括:
获取用户的网页浏览日志,所述网页浏览日志包括所述用户的用户标识、用户访问的网页的网址和用户访问网页的时间;
根据所述网页浏览日志生成网页访问统计信息。
3.根据权利要求2所述的方法,其特征在于,所述用户对网页的兴趣程度信息包括网页被所述用户访问的次数,则所述计算所述网页访问统计信息中的网址到所述快链候选池中的网址之间的转移概率,包括:
确定所述网页访问统计信息中第i个网址和所述快链候选池中第j个网址同时被所述用户访问的次数,以及确定所述第j个网址被所述用户访问的次数,所述i和j为正整数,所述i小于等于所述网页访问统计信息中网址的总数,所述j小于等于所述快链候选池中的网址的总数;
计算所述网页访问统计信息中第i个网址和所述快链候选池中第j个网址同时被所述用户访问的次数,与所述第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述转移概率确定需要推荐给所述用户的快链,得到推荐集合,包括:
以所述网页访问统计信息中的网址总数为行数,以所述快链候选池中网址的总数为列数,建立关于所述转移概率的矩阵;
计算所述矩阵的转置矩阵;
根据所述转置矩阵确定需要推荐给所述用户的快链,得到推荐集合。
5.根据权利要求4所述的方法,其特征在于,所述根据所述转置矩阵确定需要推荐给本地用户的快链,得到推荐集合,包括:
分别根据所述用户对网页的兴趣程度信息确定在所述网页访问统计信息的所有网址中,各个网址的权重;
根据所述权重将所述网页访问统计信息转换为对应的向量,得到第一向量;
将所述转置矩阵乘以所述第一向量,得到第二向量,所述第二向量为所述推荐集合对应的向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述推荐集合向所述用户推荐快链,包括:
将所述第二向量中所有元素对应的网址作为快链推荐给所述用户;或者,
将所述第二向量中元素的取值大于预置阈值的元素对应的网址作为快链推荐给所述用户;或者,
根据所述第二向量中元素的取值大小对第二向量中的元素进行排序,将取值最大的前K个元素对应的网址作为快链推荐给所述用户,所述K为正整数,且所述K小于等于所述第二向量中元素的总数。
7.一种快链推荐装置,其特征在于,包括:
信息获取单元,用于获取用户的网页访问统计信息,所述网页访问统计信息包括所述用户的用户标识、用户访问的网页的网址和用户对所述网页的兴趣程度信息;
候选池获取单元,用于获取快链候选池,所述快链候选池包括推荐快链的网址;
运算单元,用于计算所述网页访问统计信息中的网址到所述快链候选池中的网址之间的转移概率;
确定单元,用于根据所述转移概率确定需要推荐给所述用户的快链,得到推荐集合;
推荐单元,用于根据所述推荐集合向所述用户推荐快链。
8.根据权利要求7所述的快链推荐装置,其特征在于,
所述信息获取单元,具体用于获取多个用户的网页浏览日志,所述网页浏览日志包括所述用户的用户标识、用户访问的网页的网址和用户访问网页的时间;根据所述网页浏览日志生成网页访问统计信息。
9.根据权利要求8所述的快链推荐装置,其特征在于,所述用户对网页的兴趣程度信息包括网页被所述用户访问的次数,则:
所述运算单元,具体用于确定所述网页访问统计信息中第i个网址和所述快链候选池中第j个网址同时被所述用户访问的次数,以及确定所述第j个网址被所述用户访问的次数,所述i和j为正整数,所述i小于等于所述网页访问统计信息中网址的总数,所述j小于等于所述快链候选池中的网址的总数;计算所述网页访问统计信息中第i个网址和所述快链候选池中第j个网址同时被所述用户访问的次数,与所述第j个网址被所述用户访问的次数之间的商,得到第i个网址到第j个网址的转移概率。
10.根据权利要求7至9任一项所述的快链推荐装置,其特征在于,所述确定单元包括计算子单元和确定子单元;
所述计算子单元,用于以所述网页访问统计信息中的网址总数为行数,以所述快链候选池中网址的总数为列数,建立关于所述转移概率的矩阵;计算所述矩阵的转置矩阵;
所述确定子单元,用于根据所述转置矩阵确定需要推荐给所述用户的快链,得到推荐集合。
11.根据权利要求10所述的快链推荐装置,其特征在于,
所述确定子单元,具体用于分别根据所述用户对网页的兴趣程度信息确定在所述网页访问统计信息的所有网址中,各个网址的权重;根据所述权重将所述网页访问统计信息转换为对应的向量,得到第一向量;将所述转置矩阵乘以所述第一向量,得到第二向量,所述第二向量为所述推荐集合对应的向量。
12.根据权利要求11所述的快链推荐装置,其特征在于,所述推荐单元,具体用于:
将所述第二向量中所有元素对应的网址作为快链推荐给所述用户;或者,
将所述第二向量中元素的取值大于预置阈值的元素对应的网址作为快链推荐给所述用户;或者,
根据所述第二向量中元素的取值大小对第二向量中的元素进行排序,将取值最大的前K个元素对应的网址作为快链推荐给所述用户,所述K为正整数,且所述K小于等于所述第二向量中元素的总数。
13.一种通信系统,其特征在于,包括权利要求7至12任一项所述的快链推荐装置。
CN201410245573.0A 2014-06-04 2014-06-04 一种浏览器中的快链推荐方法、装置和系统 Pending CN103995893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410245573.0A CN103995893A (zh) 2014-06-04 2014-06-04 一种浏览器中的快链推荐方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410245573.0A CN103995893A (zh) 2014-06-04 2014-06-04 一种浏览器中的快链推荐方法、装置和系统

Publications (1)

Publication Number Publication Date
CN103995893A true CN103995893A (zh) 2014-08-20

Family

ID=51310058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410245573.0A Pending CN103995893A (zh) 2014-06-04 2014-06-04 一种浏览器中的快链推荐方法、装置和系统

Country Status (1)

Country Link
CN (1) CN103995893A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361085A (zh) * 2014-11-14 2015-02-18 百度在线网络技术(北京)有限公司 信息推荐方法、装置、浏览器、服务器及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080313168A1 (en) * 2007-06-18 2008-12-18 Microsoft Corporation Ranking documents based on a series of document graphs
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN103793465A (zh) * 2013-12-20 2014-05-14 武汉理工大学 基于云计算的海量用户行为实时分析方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080313168A1 (en) * 2007-06-18 2008-12-18 Microsoft Corporation Ranking documents based on a series of document graphs
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN103793465A (zh) * 2013-12-20 2014-05-14 武汉理工大学 基于云计算的海量用户行为实时分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361085A (zh) * 2014-11-14 2015-02-18 百度在线网络技术(北京)有限公司 信息推荐方法、装置、浏览器、服务器及系统
CN104361085B (zh) * 2014-11-14 2018-11-09 百度在线网络技术(北京)有限公司 信息推荐方法、装置、浏览器、服务器及系统

Similar Documents

Publication Publication Date Title
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN103714084B (zh) 推荐信息的方法和装置
CN104123332B (zh) 搜索结果的显示方法及装置
US8290945B2 (en) Web searching
CN103353872B (zh) 一种基于神经网络的教学资源个性化推荐方法
CN103942712A (zh) 基于产品相似度的电子商务推荐系统及其方法
CN108345702A (zh) 实体推荐方法和装置
CN102215300B (zh) 电信业务推荐方法和系统
CN103699669B (zh) 一种浏览器中进行消息推送的方法和一种浏览器终端
CN105630800B (zh) 一种节点重要性排序的方法和系统
CN103886048B (zh) 一种基于聚类的增量数字图书推荐方法
CN106874292A (zh) 话题处理方法及装置
CN106484777A (zh) 一种多媒体数据处理方法以及装置
JP2014515514A (ja) 提案される語を提供するための方法および装置
CN105930507A (zh) 一种获得用户的Web浏览兴趣的方法及装置
CN105302903A (zh) 搜索方法、装置、系统以及搜索结果调序依据的确定方法
CN104750798A (zh) 一种应用程序的推荐方法和装置
CN104102696A (zh) 一种内容推荐方法及装置
CN104079960A (zh) 文件推荐方法和装置
CN106202482A (zh) 一种基于用户行为分析的网站优化方法及系统
CN110009486A (zh) 一种欺诈检测的方法、系统、设备及计算机可读存储介质
CN103500213A (zh) 基于预读取的页面热点资源更新方法和装置
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN110390056A (zh) 大数据处理方法、装置、设备及可读存储介质
CN103885977A (zh) 一种网页数据的分类方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140820