CN103678479A - 浏览器预读取加速方法、装置及浏览器 - Google Patents

浏览器预读取加速方法、装置及浏览器 Download PDF

Info

Publication number
CN103678479A
CN103678479A CN201310462855.1A CN201310462855A CN103678479A CN 103678479 A CN103678479 A CN 103678479A CN 201310462855 A CN201310462855 A CN 201310462855A CN 103678479 A CN103678479 A CN 103678479A
Authority
CN
China
Prior art keywords
category
page
list
personalized
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310462855.1A
Other languages
English (en)
Inventor
汤传喜
郭奇
罗兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201310462855.1A priority Critical patent/CN103678479A/zh
Publication of CN103678479A publication Critical patent/CN103678479A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种浏览器预读取加速方法、装置及浏览器,其中方法包括:根据当前用户的操作记录获取当前用户的兴趣类别;从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对所述个性化列表页面对应的页面内容进行预读取;对所述个性化列表页面上特定链接对应的页面内容进行预读取。本方法提高了用户的浏览效率,而且由于符合用户兴趣类别的个性化列表页已缓存至当前用户的浏览器缓存中,无论用户从何处看到的属于其兴趣类别的链接,只要该链接位于缓存中的个性化列表页中,即使不打开该个性化列表页,也形成对待阅读页面的两次或两次以上的加速效果。

Description

浏览器预读取加速方法、装置及浏览器
技术领域
本发明属于浏览器技术领域,特别是涉及一种浏览器预读取加速方法、装置及浏览器。
背景技术
浏览器作为用户上网冲浪的工具,承担着将各种互联网服务呈现给用户的任务。浏览器厂商为了优化用户的上网体验,在基本的工具属性之外,加入了很多附加的服务,网页加速就是其中一项很重要的特性。
预读取加速是网页加速的一种方式,提前预缓存网页及网页呈现所依赖的关键资源至本地,当用户实际访问该页面时,由于网页展现所需要的资源大部分或者全部都在本地的缓存中,降低了用户直接从网络上获取对应页面内容的时间开销,从而获得页面访问加速的效果。预读取加速常用的方法是基于统计的方法,原理是:在打开的当前页面中,统计出当前页面对应点出最多的页面集合,在访问当前页时提前预读取这些点出页及这些页面中展示所依赖的关键资源,使当前用户在实际访问这些点出页面时达到加速的效果。基于统计的方式倾向于下发热点链接(即从当前页中点出最多的链接)时,往往需要先打开待阅读的当前页面,并对当前页面的各链接进行分析,对候选热点链接较多的链接进行预加载,当前用户感兴趣的待预加载的页面往往由于排序靠后无法预读取;而且如果页面的点出链接对应的点击很少没有达到候选阈值,则也无法实现预读取,从而降低了用户的阅读效率。
发明内容
本发明目的之一提供一种浏览器预读取加速方法、装置及浏览器。
本发明提供了如下方案:一种浏览器预读取加速方法,其包括:
根据当前用户的操作记录获取当前用户的兴趣类别;
从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对所述个性化列表页面对应的页面内容进行预读取;
对所述个性化列表页面上特定链接对应的页面内容进行预读取。
进一步地,所述根据当前用户操作记录获取当前用户的兴趣类别包括:
根据当前用户的浏览网页的主题,并结合浏览时间和/或浏览量从既定的行业类别中确定当前用户兴趣所属的行业类别。
进一步地,所述从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面时:
从服务器端的目标站点的列表页集合中查找与当前用户的所述兴趣类别匹配的目标站点的列表页作为个性化列表页面。
进一步地,所述目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按行业类别分别进行结构化分类存储。
进一步地,所述对所述个性化列表页面上特定链接对应的页面内容进行预读取时:在当前用户的兴趣类别的基础上,根据当前用户的浏览记录识别当前用户的兴趣类别中对应的细分类别,对所述个性化列表页面上的所属所述细分类别的各网页链接对应的页面内容分别进行预读取;或
获取由服务器端根据全网用户的浏览记录统计得出的所述个性化列表页面内各链接的点击分布,并根据该点击分布对该个性化列表页面内的各网页链接和对应的页面内容分别进行预读取。
进一步地,该浏览器预读取加速方法还包括:在网页链接对应的文本页面预读取时,将网页页面对应的通用资源缓存到本地。
本发明还提供一种浏览器预读取加速装置,其包括:
用户兴趣获取模块,根据当前用户的操作记录获取当前用户的兴趣类别;
第一预读取模块,从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对所述个性化列表页面对应的页面内容进行预读取;
第二预读取模块,对所述个性化列表页面上特定链接对应的页面内容进行预读取。
进一步地,所述第一预读取模块包括:个性化列表页面选取单元,从目标站点的列表页集合中查找与当前用户的所述兴趣类别匹配的目标站点的列表页作为个性化列表页面;所述目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按行业类别分别进行结构化分类存储;
个性化列表页预读取单元,将所述个性化列表页面选取单元从服务器端查找到的个性化列表页面预读取到本地缓存中。
进一步地,所述第二预读取模块包括识别单元,在当前用户的兴趣类别的基础上,根据当前用户的浏览记录识别当前用户的兴趣类别中对应的细分类别;网页信息预读取单元,对所述个性化列表页面上的所属所述细分类别的各网页链接对应的页面内容分别进行预读取。
进一步地,所述第二预读取模块包括点击分布获取单元,获取由服务器端根据全网用户的浏览记录统计得出的所述个性化列表页面内各链接的点击分布;网页信息预读取单元,根据该点击分布对该个性化列表页面内的各网页链接和对应的页面内容分别进行预读取。
进一步地,该浏览器预读取加速装置还包括:通用资源缓存模块,在网页链接对应的文本页面预读取时,将网页页面对应的通用资源缓存到本地。
本发明还提供一种浏览器,其包括所述的浏览器预读取加速装置。
根据本发明提供的浏览器预读取加速方法、装置及浏览器,首先能根据用户的兴趣类别获取个性化列表页面,并对获取的个性化列表页面进行预读取,然后再根据用户的浏览记录对所述个性化列表页面上的网页链接和所述网页链接对应的页面进行预读取,根据用户的兴趣类别对站点中的个性化列表页进行预读取的同时,也将个性化列表页中的最终页进行进一步的预读取,从而形成对待阅读页面的两次或两次以上的加速;
另一方面,由于符合用户兴趣类别的个性化列表页已缓存至当前用户的浏览器缓存中,无论用户从何处看到的属于其兴趣类别的链接,只要该链接位于缓存中的个性化列表页中,即使不打开该个性化列表页,也形成对待阅读页面的两次或两次以上的加速效果,从而提高了用户的浏览效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的浏览器预读取加速方法的流程图;
图2是本发明实施例提供的浏览器预读取加速方法中一界面示意图;
图3是本发明实施例提供的浏览器预读取加速装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明实施例提供的浏览器预读取加速方法,包括:
步骤10、根据当前用户的操作记录获取当前用户的兴趣类别;
在一实施方式中,当操作记录为用户的浏览记录时,可以根据当前用户浏览网页的主题,结合浏览网页的时间从既定的行业类别中获取该用户的兴趣类别。既定的行业类别是根据网页内容的性质、标签划分出的行业类别,通常包括视频、体育、娱乐、军事、购物、交友及社区等。每个行业类别可以划分出一些关键词用于用户兴趣匹配,例如,体育包括篮球、足球及羽毛球等关键词;军事包括武器、军事人物等关键词;美食包括饭店、菜谱等关键词。当然这些关键词可以作为大行业类别下的小行业类别的代表,同时也可以反映用户具体的兴趣类别。如果用户经常(例如,每天或间隔特定的时间等)浏览相关主题的网页,那么可以结合既定的行业类别将用户的兴趣类别识别出来。具体实现方式可以为:在对浏览记录分析时,可以抓取主题的关键词(关键词通常是出现的频率较高的词),从既定的行业类别中分析出用户的兴趣类别。例如,如果一个用户经常浏览“武器”和“篮球”主题的网页,浏览器抓取“武器”和“篮球”这两个主题的关键词分别符合既定的行业类别中的“军事”和“体育”类别,从而确定该用户的兴趣类别为“军事”和“体育”。当然,对于不经常访问的某个主题的网页,但在特定的时间内,用户也可能对该主题比较感兴趣,浏览量比较大,那么通过浏览器抓取该主题的关键词从既定的行业类别确定出该主题的网页属于哪一行业类别,即确定用户兴趣所属的行业类别。例如,在某段时间内,用户想请客人吃饭,那么可能浏览“饭店”主题的网页很多,那么浏览器抓取“饭店”这个主题符合既定的行业类别中的“美食”,从而确定用户的兴趣类别为“美食”。
在另一实施方式中,操作记录可以为用户聊天记录、用户写日记的记录、用户发表文章的记录或玩游戏的记录等。通过分析这些记录可从既定的行业类别中确定用户的兴趣。例如,用户通过IM即时工具软件进行聊天,如果聊天主题涉及到某部电影或某个饭店,就可以通过浏览器抓取这些关键词,可从既定的行业类别中确定当前用户兴趣为娱乐或美食。例如,用户写日记中记录了一些旅游地方和旅游的感受,通过抓取相应的关键词,可从既定的行业类别中确定当前用户兴趣为旅游。
所述用户的兴趣类别可根据全网中各站点的对应标签进行确定,也可以根据网络中起黄页作用的导航页,如http://123.sogou.com/中收录的各站点对应的既定的行业类别,如“影视”、“音乐”、“购物”等进行确定,其中,每一行业类别下,还有细分的行业类别,如点击http://123.sogou.com/中行业类别“体育”的对应链接,还存在“足球”、“NBA”等细分的行业类别,均可作为用户的兴趣类别。
以上两种实施方式只是对用户操作记录的举例,本发明的实施方式不限于此,只要能被浏览器获取的信息,并能结合既定的行业类别反映出用户的兴趣类别的方式都属于本发明保护的方式。
步骤20、从服务器端获取与兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对个性化列表页面对应的页面内容进行预读取;
具体可以是:服务器端会根据全网用户(即使用浏览器的全体用户)操作记录计算出有效的目标站点的列表页集合,例如,Hub列表页集合。目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按既定的行业类别分别进行结构化分类存储。服务器端可根据用户浏览网页的主题,结合浏览网页的时间和/或次数从既定的行业类别中分析全网用户的兴趣类别,从而计算出有效的目标站点的列表页集合。本实施例中,目标站点的列表页集合按行业类别分别进行结构化分类存储,由于全网中,各行业类别排名靠前的站点往往收录的资源较丰富,则分别抓取全网中各行业类别中排名靠前的,即大站、名站作为目标站点所对应的列表页,作为目标站点的列表页集合中的元素。例如,如果用户天天访问新浪体育查看新闻,则可以从既定的行业类别中确定“体育”是用户感兴趣的类别,并将全网中的“新浪体育”、“腾讯体育”、“搜狐体育”作为一个Hub列表页。如果用户经常访问“新浪体育”下的“篮球”,则将行业类别“体育”下的行业类别“篮球”作为当前用户的兴趣类别,将目标站点的列表页集合下的行业类别“篮球”中对应页面“http://sports.sina.com.cn/basketball/”、http://sports.sohu.com/lanqiu.shtml等作为一个hub列表页,即个性化列表页预加载至当前用户的浏览器缓存中,如果当前用户经常访问“新浪体育”,一旦某天访问“搜狐体育”中所含的“篮球”列表页,则由于http://sports.sohu.com/lanqiu.shtml已缓存至用户的浏览器中,则“搜狐体育”的“篮球”列表页也会快速地进行加载,从而提高了用户的浏览效率。
例如,用户不经常访问大众点评网,但每次访问时相关的访问量很大(如,在大众点评网上去搜索各个餐厅的评价及价格信息),则可将大众点评网的检索页面“http://www.dianping.com/search/category/2/10”作为Hub列表页存储至服务器端的目标站点的列表页集合供用户进行预加载。另外,服务器端在生成有效的目标站点的列表页集合时,在借助分析用户浏览记录的基础上,也可以设定相应的行业类别,从而使Hub列表页可以按设定的行业类别进行分类。而目标站点的列表页集合中的Hub列表页是否有效取决于用户浏览记录,例如,如果一Hub列表页多天内重复出现,那么可以认为该Hub列表页是有效的,反之则是无效的;如果一Hub列表页的点出较多,也可以认为该Hub列表页是有效的;如果Hub列表页频繁出现在用户上网路径上,也可以将该Hub列表页存储至服务器端的目标站点的列表页集合供用户进行预加载。以上所举得例子仅仅是为了示意,本发明实施例不限于此。
浏览器在获取到当前用户兴趣类别后,可以将该用户兴趣与服务器端的Hub页集合进行匹配,当匹配后则从服务器端将符合该用户兴趣的Hub页预读取到本地。预读取的过程可如下:由浏览器定期或者不定期向服务器端的发送Hub页预读取请求,服务器端接收到浏览器的Hub页预读取请求后,下发与当前用户兴趣类别匹配的Hub列表页,并对Hub列表页对应的页面内容进行预读取,并由浏览器存储到本地缓存。当然,服务器端也可以根据全网用户的操作记录定期或者不定期对Hub列表页集合中的Hub列表页进行更新,因为用户兴趣类别是动态变化的过程,就需要剔除原有的Hub列表页的页面内容,同时可以主动向当前用户下发缓存一些更新后的Hub列表页的页面内容。例如,当前浏览器通过分析用户的浏览记录,发现用户对体育新闻进行了大量的访问,由此从既定的行业类别中确定用户的兴趣类别为“体育”,在将该用户兴趣类别与服务器端的Hub页集合进行匹配时,确定服务器端的Hub页集合中存在一个与“体育”相关的Hub列表页,该Hub列表页可包括“新浪体育”、“腾讯体育”、“搜狐体育”及“雅虎体育”等,那么从服务器端的Hub列表页集合中预读取与该Hub列表页并缓存到本地。如果过一段时间,当前浏览器通过分析用户的浏览记录,发现用户除了对体育新闻进行了大量访问外,还对军事新闻进行了大量的访问,由此从既定的行业类别中确定用户的兴趣类别为“军事”,那么在从服务器端的Hub列表页集合中预读取与“军事”相关的Hub列表页的同时,对当前Hub列表页进行更新,更新后的Hub列表页既包括与“体育”相关的Hub列表页也包括与“军事”相关的Hub列表页。另外,还发现用户对“科技”方面的新闻进行了少量的访问,那么可以从既定的行业类别中确定该用户的兴趣类别还有“科技”,那么从服务器端的Hub列表页集合中预读取与“科技”相关的Hub列表页,并缓存到本地。这就解决了现有技术中,由于Hub列表页内的其他列表页往往点击稀疏,未达到候选目标值无法预读取,通过对用户兴趣的分析可确定用户感兴趣的其他列表页,实现对这些列表页的预读取。
步骤30、对已经预读取的个性化列表页面上特定链接对应的页面进行预读取。
作为一种实施方式,具体可以是:在当前用户的兴趣类别的基础上,根据当前用户的浏览记录分析当前用户的兴趣类别中对应的细分类别,对个性化列表页面上的符合细分类别的各网页链接和对应的页面进行预读取。其中,兴趣类别中对应的细分类别是对兴趣类别进一步细化分类,例如,体育兴趣包括篮球兴趣、足球兴趣及羽毛球兴趣等;其中,篮球还可以进一步细化,例如CBA、NBA等。影视兴趣包括电视剧、电影及动漫等。电影还可以进一步细化,娱乐片,武侠片及战争片等。例如,通过分析当前用户的浏览记录,确定该用户的兴趣类别中对应的细分类别为“NBA”,那么对已经预读取的个性化列表页面上所有符合“NBA”的网页链接及其网页链接对应的页面进行预读取。另外,如果发现用户的兴趣类别还有“科技”,则对已经预读取的个性化列表页面上所有符合“科技”的网页链接及其网页链接对应的页面进行预读取。当然,如果分析前用户的浏览记录,确定该用户的兴趣类别中对应的细分类别为“NBA”下的球队“湖人队”,那么进一步对已经预读取的个性化列表页面上所有符合“湖人队”的网页链接及其网页链接对应的页面进行预读取。
作为另一种实施方式,具体可以是:由服务器端根据全网用户的浏览记录统计得出个性化列表页面内各链接的点击分布,然后由浏览器获取该点击分布,再根据该点击分布和阈值(可根据实际情况进行灵活设定)对该个性化列表内的各网页链接和对应的页面进行预读取。当该点击分布超过该阈值时,则对该个性化列表内的各网页链接和对应的页面进行预读取。如果小于,则不预读取。阈值可根据实际情况(例如,用户的访问时间和/或访问的数量)进行灵活设定,例如,每周一的时候,用户访问网页的数量比较大,此时可以将阈值设定的大些,这样个性化列表内的各网页链接和对应的页面预读取的数量就比较多。例如,每周3-周5用户访问网页的数量较小,此时可以将阈值设定的小些,这样个性化列表内的各网页链接和对应的页面预读取的数量就比较少。这样能节省用户浏览网页的时间,提高浏览效率。参见图2所示,http://sports.sina.com.cn页面下基于全网用户的浏览记录统计得出的个性化列表页面内各链接的点击分布,浏览器根据点击分布对个性化列表内的各网页链接和对应的页面进行预读取,其中有底色的代表了目标页面的预取url,[]中的数字代表了该url在预取队列中的位置(如果一网页链接在全网浏览记录的数目多,那么相对应的在预取队列中的位置靠前)。如果设阈值为10的话,那么高于10的网页链接及对应页面将会预取,低于10的网页链接及对应页面将不会预取。
以上两种实施方式,通过对用户兴趣的分析或基础统计的方式可直接确定用户感兴趣的目标页面,可以解决Hub列表页面的候选点出链接很多,目标页面往往由于排序靠后无法预取的问题。特别是,由于符合用户兴趣类别的个性化列表页已缓存至当前用户的浏览器缓存中,无论用户从何处看到的特定链接,如QQ好友发给当前用户属于其兴趣类别的链接,或者在http://news.baidu.com/这类机器抓取的由各站点最终内容组成的集成页面,只要该链接位于缓存中的个性化列表页中,即使当前用户近期没有浏览过该个性化列表页,也可形成对待阅读页面的两次或两次以上的加速效果,从而提高了用户的网页浏览效率。
为了进一步提高浏览器预读取的速度,本发明实施例提供的浏览器预读取加速方法,还包括:在Hub列表页中选取网页链接对应文本页面进行预加载时,将网页链接对应文本页面对应的通用资源(例如,cs、css等)缓存到本地,使各站点的列表页中访问量小的冷门页面也能预加载通用资源,提高了预加载的覆盖率。
本实施例公开的浏览器预读取加速方法,首先能根据用户的兴趣类别获取个性化列表页面,并对获取的个性化列表页面进行预读取,然后再根据用户的浏览记录对个性化列表页面上的网页链接和网页链接对应的页面进行预读取,根据用户的兴趣类别对站点中的个性化列表页进行预读取的同时,也将个性化列表页中的最终页进行进一步的预读取,从而形成对待阅读页面的两次或两次以上的加速;
另一方面,由于符合用户兴趣类别的个性化列表页已缓存至当前用户的浏览器缓存中,无论用户从何处看到的属于其兴趣类别的链接,只要该链接位于缓存中的个性化列表页中,即使不打开该个性化列表页,也形成对待阅读页面的两次或两次以上的加速效果,从而提高了用户的浏览效率。
参见图3,本发明实施例还提供一种浏览器预读取加速装置,该浏览器预读取加速装置可以实现图1所示的浏览器预读取方法。该浏览器预读取加速装置包括用户兴趣获取模块1、第一预读取模块2及第二预读取模块3。用户兴趣获取模块1用于根据当前用户的操作记录获取当前用户的兴趣类别。第一预读取模块用于从服务器端获取与兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对个性化列表页面对应的页面内容进行预读取。第二预读取模块3对个性化列表页面上特定链接对应的页面内容进行预读取。
第一预读取模块2包括个性化列表页面选取单元和个性化列表页预读取单元。其中,个性化列表页面选取单元用于从目标站点的列表页集合中查找与当前用户的兴趣类别匹配的目标站点的列表页作为个性化列表页面;所述目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按行业类别分别进行结构化分类存储。个性化列表页预读取单元用于将个性化列表页面选取单元从服务器端查找到的个性化列表页面预读取到本地缓存中。
在一种实施方式中,第二预读取模块3包括识别单元,该识别单元在当前用户的兴趣类别的基础上,根据当前用户的浏览记录识别当前用户的兴趣类别中对应的细分类别;网页信息预读取单元,对个性化列表页面上的所属细分类别的各网页链接对应的页面内容分别进行预读取。第二预读取模块3通过对用户兴趣的分析可直接确定用户感兴趣的目标页面,可以解决Hub列表页面的候选点出链接很多,目标页面往往由于排序靠后无法预取的问题。
在另一种实施方式中,第二预读取模块3包括点击分布获取单元。该点击分布获取单元获取由服务器端根据全网用户的浏览记录统计得出的个性化列表页面内各链接的点击分布;网页信息预读取单元,根据该点击分布对该个性化列表页面内的各网页链接和对应的页面内容分别进行预读取。第二预读取模块3通过基础统计的方式可直接确定用户感兴趣的目标页面,可以解决Hub列表页面的候选点出链接很多,目标页面往往由于排序靠后无法预取的问题。
为了进一步提高浏览器预读取的速度,该浏览器预读取加速装置还包括:通用资源缓存模块,在网页链接对应的文本页面预读取时,将网页页面对应的通用资源(例如,cs、css等)缓存到本地,使各站点的列表页中访问量小的冷门页面也能预加载通用资源,提高了预加载的覆盖率。
本发明的其他实施例中,还公开了一种浏览器,其包括所述的浏览器预读取加速装置。
本实施例公开的浏览器预读取加速装置及使用该浏览器预读取加速装置的浏览器,首先能根据用户的兴趣类别获取个性化列表页面,并对获取的个性化列表页面进行预读取,然后再根据用户的浏览记录对个性化列表页面上的网页链接和网页链接对应的页面进行预读取,根据用户的兴趣类别对站点中的个性化列表页进行预读取的同时,也将个性化列表页中的最终页进行进一步的预读取,从而形成对待阅读页面的两次或两次以上的加速。另一方面,由于符合用户兴趣类别的个性化列表页已缓存至当前用户的浏览器缓存中,无论用户从何处看到的属于其兴趣类别的链接,只要该链接位于缓存中的个性化列表页中,即使不打开该个性化列表页,也形成对待阅读页面的两次或两次以上的加速效果,从而提高了用户的浏览效率。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器端,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明所提供的网页预读取方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种浏览器预读取加速方法,其特征在于,包括:
根据当前用户的操作记录获取当前用户的兴趣类别;
从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对所述个性化列表页面对应的页面内容进行预读取;
对所述个性化列表页面上特定链接对应的页面内容进行预读取。
2.根据权利要求1所述的方法,其特征在于,所述根据当前用户操作记录获取当前用户的兴趣类别包括:
根据当前用户的浏览网页的主题,并结合浏览时间和/或浏览量从既定的行业类别中确定当前用户兴趣所属的行业类别。
3.根据权利要求1所述的方法,其特征在于,所述从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面时:
从服务器端的目标站点的列表页集合中查找与当前用户的所述兴趣类别匹配的目标站点的列表页作为个性化列表页面。
4.根据权利要求3所述的方法,其特征在于:所述目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按行业类别分别进行结构化分类存储。
5.根据权利要求1或3所述的方法,其特征在于,所述对所述个性化列表页面上特定链接对应的页面内容进行预读取时:
在当前用户的兴趣类别的基础上,根据当前用户的浏览记录识别当前用户的兴趣类别中对应的细分类别,对所述个性化列表页面上的所属所述细分类别的各网页链接对应的页面内容分别进行预读取;
获取由服务器端根据全网用户的浏览记录统计得出的所述个性化列表页面内各链接的点击分布,并根据该点击分布对该个性化列表页面内的各网页链接和对应的页面内容分别进行预读取。
6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
在网页链接对应的文本页面预读取时,将网页页面对应的通用资源缓存到本地。
7.一种浏览器预读取加速装置,其特征在于,包括:
用户兴趣获取模块,根据当前用户的操作记录获取当前用户的兴趣类别;
第一预读取模块,从服务器端获取与所述兴趣类别匹配的目标站点对应的列表页作为当前用户的个性化列表页面,对所述个性化列表页面对应的页面内容进行预读取;
第二预读取模块,对所述个性化列表页面上特定链接对应的页面内容进行预读取。
8.根据权利要求7所述的装置,其特征在于,所述第一预读取模块包括:
个性化列表页面选取单元,从目标站点的列表页集合中查找与当前用户的所述兴趣类别匹配的目标站点的列表页作为个性化列表页面;所述目标站点的列表页集合为根据全网用户的浏览记录提取出的有效站点中的列表页集合,并按行业类别分别进行结构化分类存储;
个性化列表页预读取单元,将所述个性化列表页面选取单元从服务器端查找到的个性化列表页面预读取到本地缓存中。
9.根据权利要求7或8所述的装置,其特征在于,所述第二预读取模块包括:
识别单元,在当前用户的兴趣类别的基础上,根据当前用户的浏览记录识别当前用户的兴趣类别中对应的细分类别;
网页信息预读取单元,对所述个性化列表页面上的所属所述细分类别的各网页链接对应的页面内容分别进行预读取。
10.根据权利要求7或8所述的装置,其特征在于,所述第二预读取模块包括:
点击分布获取单元,获取由服务器端根据全网用户的浏览记录统计得出的所述个性化列表页面内各链接的点击分布;
网页信息预读取单元,根据该点击分布对该个性化列表页面内的各网页链接和对应的页面内容分别进行预读取。
11.根据权利要求10所述的装置,其特征在于,还包括:
通用资源缓存模块,在网页链接对应的文本页面预读取时,将网页页面对应的通用资源缓存到本地。
12.一种浏览器,其特征在于,包括如权利要求7-11任一权利要求所述的浏览器预读取加速装置。
CN201310462855.1A 2013-09-30 2013-09-30 浏览器预读取加速方法、装置及浏览器 Pending CN103678479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310462855.1A CN103678479A (zh) 2013-09-30 2013-09-30 浏览器预读取加速方法、装置及浏览器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310462855.1A CN103678479A (zh) 2013-09-30 2013-09-30 浏览器预读取加速方法、装置及浏览器

Publications (1)

Publication Number Publication Date
CN103678479A true CN103678479A (zh) 2014-03-26

Family

ID=50316026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310462855.1A Pending CN103678479A (zh) 2013-09-30 2013-09-30 浏览器预读取加速方法、装置及浏览器

Country Status (1)

Country Link
CN (1) CN103678479A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298790A (zh) * 2014-11-11 2015-01-21 北京奇虎科技有限公司 浏览器加速方法和具有加速器的浏览器装置
WO2015185020A1 (en) * 2014-06-06 2015-12-10 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
CN105450579A (zh) * 2014-05-30 2016-03-30 广州市动景计算机科技有限公司 网络资源预加载方法、客户端及中间件服务器
CN106446112A (zh) * 2016-09-14 2017-02-22 北京小米移动软件有限公司 页面显示方法及装置
CN106611010A (zh) * 2015-10-26 2017-05-03 北京国双科技有限公司 网页加载速度的确定方法和装置
CN110209855A (zh) * 2019-06-04 2019-09-06 成都终身成长科技有限公司 图片展示方法、装置、电子设备及计算机可读存储介质
CN110709834A (zh) * 2017-04-24 2020-01-17 谷歌有限责任公司 用于检索与链接相关联的内容的方法、系统和介质
CN112347363A (zh) * 2020-11-18 2021-02-09 北京百家科技集团有限公司 一种页面生成方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551806A (zh) * 2008-04-03 2009-10-07 北京搜狗科技发展有限公司 一种个性化网址导航的方法和系统
CN101770520A (zh) * 2010-03-05 2010-07-07 南京邮电大学 基于用户浏览行为的用户兴趣建模方法
WO2011079443A1 (en) * 2009-12-30 2011-07-07 Nokia Corporation Intelligent reception of broadcasted information items
CN102737037A (zh) * 2011-04-07 2012-10-17 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器
CN102810101A (zh) * 2011-06-03 2012-12-05 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551806A (zh) * 2008-04-03 2009-10-07 北京搜狗科技发展有限公司 一种个性化网址导航的方法和系统
WO2011079443A1 (en) * 2009-12-30 2011-07-07 Nokia Corporation Intelligent reception of broadcasted information items
CN101770520A (zh) * 2010-03-05 2010-07-07 南京邮电大学 基于用户浏览行为的用户兴趣建模方法
CN102737037A (zh) * 2011-04-07 2012-10-17 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器
CN102810101A (zh) * 2011-06-03 2012-12-05 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450579A (zh) * 2014-05-30 2016-03-30 广州市动景计算机科技有限公司 网络资源预加载方法、客户端及中间件服务器
WO2015185020A1 (en) * 2014-06-06 2015-12-10 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
US10346496B2 (en) 2014-06-06 2019-07-09 Tencent Technology (Shenzhen) Company Limited Information category obtaining method and apparatus
CN104298790A (zh) * 2014-11-11 2015-01-21 北京奇虎科技有限公司 浏览器加速方法和具有加速器的浏览器装置
CN106611010A (zh) * 2015-10-26 2017-05-03 北京国双科技有限公司 网页加载速度的确定方法和装置
CN106611010B (zh) * 2015-10-26 2020-02-07 北京国双科技有限公司 网页加载速度的确定方法和装置
CN106446112A (zh) * 2016-09-14 2017-02-22 北京小米移动软件有限公司 页面显示方法及装置
CN110709834B (zh) * 2017-04-24 2023-10-03 谷歌有限责任公司 用于检索与链接相关联的内容的方法、系统和介质
CN110709834A (zh) * 2017-04-24 2020-01-17 谷歌有限责任公司 用于检索与链接相关联的内容的方法、系统和介质
US11991262B2 (en) 2017-04-24 2024-05-21 Google Llc Methods, systems, and media for retrieving content associated with links
CN110209855A (zh) * 2019-06-04 2019-09-06 成都终身成长科技有限公司 图片展示方法、装置、电子设备及计算机可读存储介质
CN110209855B (zh) * 2019-06-04 2021-05-14 成都终身成长科技有限公司 图片展示方法、装置、电子设备及计算机可读存储介质
CN112347363A (zh) * 2020-11-18 2021-02-09 北京百家科技集团有限公司 一种页面生成方法及装置

Similar Documents

Publication Publication Date Title
CN103678479A (zh) 浏览器预读取加速方法、装置及浏览器
CN102663012B (zh) 一种网页预加载方法及系统
Wertime et al. DigiMarketing: The essential guide to new media and digital marketing
Wang et al. Mashup-oriented API recommendation via random walk on knowledge graph
CN104602042B (zh) 基于用户行为的标签设置方法
CN100367270C (zh) 成本降低的联机服务和自适应确定广告目标的方法和装置
US6169997B1 (en) Method and apparatus for forming subject (context) map and presenting Internet data according to the subject map
CN100403305C (zh) 包括按子域线索搜索及按子域提供赞助结果的产生搜索结果的系统
KR101622742B1 (ko) 신디케이션에 적합한 포괄적인 온라인 랭킹 시스템 및 방법
Davis Search engine optimization
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
JP5256293B2 (ja) 検索結果ページ上に対話要素を含めるためのシステム及び方法
Lewandowski Is Google responsible for providing fair and unbiased results?
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
US20120331102A1 (en) Targeted Content Delivery for Networks
US20090249229A1 (en) System and method for display of relevant web page images
Clay et al. Search engine optimization all-in-one for dummies
KR20090092341A (ko) 디지털 매체 개체들의 링크 개선
Van Hoboken Search engine freedom: on the implications of the right to freedom of expression for the legal governance of Web search engines
CN102057375A (zh) 在线参引的收集和记分
CN104503988B (zh) 搜索方法及装置
CN103888466A (zh) 用户兴趣发现方法和装置
Lewandowski Understanding search engines
CN109408723A (zh) 一种推送方法及装置
KR20230003602A (ko) 단일 콘텐츠 항목에 대한 다양한 사용자 상호작용에 기초한 상이한 콘텐츠 페이지들의 제공

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140326

RJ01 Rejection of invention patent application after publication