CN103500213B - 基于预读取的页面热点资源更新方法和装置 - Google Patents

基于预读取的页面热点资源更新方法和装置 Download PDF

Info

Publication number
CN103500213B
CN103500213B CN201310461879.5A CN201310461879A CN103500213B CN 103500213 B CN103500213 B CN 103500213B CN 201310461879 A CN201310461879 A CN 201310461879A CN 103500213 B CN103500213 B CN 103500213B
Authority
CN
China
Prior art keywords
temperature
page
link
time
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310461879.5A
Other languages
English (en)
Other versions
CN103500213A (zh
Inventor
罗兴
汤传喜
胡又欢
郭奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201310461879.5A priority Critical patent/CN103500213B/zh
Publication of CN103500213A publication Critical patent/CN103500213A/zh
Application granted granted Critical
Publication of CN103500213B publication Critical patent/CN103500213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于预读取的页面热点资源更新方法和装置,其中的方法包括:根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H;根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。

Description

基于预读取的页面热点资源更新方法和装置
技术领域
本发明涉及网络访问技术,具体涉及基于预读取的页面热点资源更新方法和装置。
背景技术
用户在使用浏览器(如搜狗高速浏览器)访问网站过程中,往往会因为网站的服务能力、用户的带宽以及访问网页内容的大小等多种因素,而导致该网站网页的打开速度较慢,从而影响了用户的上网体验。
目前,可以采用预读取方法来提高网站访问速度,即提前获取相应网页对应的资源,并本地缓存这些资源,当用户真正去访问这些网页时,只需从本地缓存中读取相应的资源即可,从用户角度而言,该方法提高了网站网页的打开速度,从而提高了用户体验。
发明人在实现本发明过程中发现,在现有的预读取方法中,准确的预测用户会访问哪些网页是非常重要的,如何准确的预测用户会访问哪些网页,以不断改善用户的网络访问体验,是一个需要持续关注的课题。
发明内容
本发明的目的在于,克服现有的预读取方法存在的技术问题,而提供一种针对移动设备的基于预读取的页面热点资源更新方法和装置,所要解决的技术问题是,保证预读取的高准确性和高有效性,以提高用户体验。
本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
依据本发明提出的一种基于预读取的页面热点资源更新方法,其中,所述方法包括:根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H; 根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述方法在更新所述累积热度N以及热度H之后还包括:根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息的步骤包括:实时获取各终端设备的网络访问的客户端日志;从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述方法在更新所述累积热度N以及热度H之前还包括:对所述链接对信息进行过滤的步骤,且所述过滤的步骤包括:根据所述链接对信息确定点出页的类型;滤除出点出页的类型属于预定类型的链接对信息。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括:在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点 出页在过去预定时长的时间窗内的热度H的步骤包括:在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;其中,所述热度H根据热度衰减周期定期恢复为初始值。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理的步骤包括:根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;N=N×X×A;其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理的步骤包括:根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;N=N×Y×(H/H’)×(N’/H’);其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
依据本发明提出的一种基于预读取的页面热点资源更新装置,其中,该装置包括:获取模块,用于根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;第一更新模块,用于根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H;热度衰减模块,用于根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;第二更新模块,用于根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述装置还包括:时间衰减模块,与第一更新模块连接,用于根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述获取模块具体用于:实时获取各终端设备的网络访问的客户端日志,并从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述装置还包括:过滤模块,与所述获取模块和第一更新模块分别连接,且所述过滤模块用于根据所述链接对信息确定点出页的类型,并滤除出点出页的类型属于预定类型的链接对信息。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述第一更新模块具体用于:在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述第一更新模块具体用于:在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;其中,所述热度H根据热度衰减周期定期恢复为初始值。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述时间衰减模块具体用于:根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;N=N×X×A;其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问 的时间,所述Now为当前时间。
可选的,上述基于预读取的页面热点资源更新装置,其中,所述热度衰减模块具体用于:根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;N=N×Y×(H/H’)×(N’/H’);其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
借由上述技术方案,本发明提供的针对移动设备的基于预读取的页面热点资源更新方法和装置至少具有下列优点及有益效果:本发明实施例通过获取各网络访问的来源地址与点出页地址的链接对信息,并根据该链接对信息对点出页的累积热度N进行时间衰减处理以及热度衰减处理,使各点出页的累积热度N可以准确的反应各点出页的用户的消费趋势,这样,在向用户基于预读取进行页面推送时,通过参考各点出页的累积热度N,可以使服务端提前向用户推送的页面被用户选中点击的命中概率会大大提高,进而保证了预读取的高准确性和高有效性,最终提高了用户体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于预读取的页面热点资源更新方法流程图;
图2是本发明实施例提供的基于预读取的页面热点资源更新装置示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
实施例一、基于预读取的页面热点资源更新方法。该更新方法的流程如图1所示。
图1中,S100、根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息。
具体的,本发明实施例可以通过各终端设备的网络访问的客户端日志实时的获取到上述链接对信息;该网络访问的客户端日志通常是由终端设备的浏览器客户端产生的。该终端设备可以为台式计算机、笔记型计算机、平板电脑以及智能型移动电话等可以通过客户端浏览器进行网络访问的终端设备。
本步骤的一个具体的例子,服务器可以通过构建后台服务端来实时获取网络中的所有终端设备的网络访问的客户端日志,该客户端日志中记录有用户通过客户端进行网络访问的浏览路径,从而服务器(如服务器的后台服务端)可以从上述实时获得的网络访问的客户端日志的浏览路径中提取出网络访问的来源地址以及针对该来源地址的点出页地址,从而获得上述链接对信息。
上述获取的链接对信息可以具体包括:来源地址以及针对该来源地址的点出页地址,且该链接对信息可以使用Refer->Url信息来表示,其中,Refer表示来源地址,而Url表示针对该来源地址的点出页地址。
S110、根据获取的各链接对信息更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
具体的,本发明实施例可以在获取到链接对信息之后,先对获取到的链接对信息进行过滤处理,然后,再利用过滤处理后的链接对信息对累积热度N 以及热度H进行更新处理。
对获取到的链接对信息进行过滤的目的包括:避免一些不需要向用户提前推送的网页对应的链接对信息对本发明实施例中的页面热点资源更新的影响。
本发明实施例对上述S100中获得的链接对信息进行过滤的一个具体实现方式为:根据链接对信息中的来源地址以及点出页地址判断链接对的点出页的类型,如果判断出点出页的类型属于需要进行滤除的预定类型,则滤除该链接对信息,否则,保留该链接对信息。
上述需要进行滤除的预定类型可以包括:不可预读取类型、信息含量少类型以及具有破坏性功能类型等。上述不可预读取类型可以包括广告类型等;上述信息含量少类型可以包括微博类型等;上述具有破坏性功能类型可以包括用户登录类型等。
广告类型的点出页的特点可以为:链接对信息中通常包含有类似“www.alimama.com”这样的特征信息,从而在判断出链接对信息中包含有类似“www.alimama.com”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
信息含量少类型的点出页的特点可以为:链接对信息中通常包含有类似“weibo”这样的特征信息,从而在判断出链接对信息中包含有类似“weibo”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
用户登录类型的点出页的特点可以为:链接对信息中通常包含有类似“login”、“logout”以及“account=”这样的特征信息,从而在判断出链接对信息中包含有类似“login”、“logout”或者“account=”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
本发明实施例可以利用预先设定的过滤模板对上述S100中获得的链接对信息进行过滤处理。
在本发明实施例包含有上述过滤处理操作的情况下,应利用过滤处理后的链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,而不是利用S100中获取到的所有链 接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
在本发明实施例不包含有上述过滤处理操作的情况下,应直接利用S100中获取到的所有链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
不论本发明实施例是利用过滤处理后的链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,还是利用S100中获取到的所有链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,都可以采用下述更新处理方式,即:
针对每一条链接对信息,分别判断链接对信息中的点出页地址是否为针对该链接对信息中的来源地址的一个新的点出页地址(即该点出页地址是否已存在于之前记录的该来源地址下的各点出页地址中),如果是一个新的点出页地址,则针对该新的点出页地址执行下述第一操作;如果不是一个新的点出页地址,则针对该新的点出页地址执行下述第二操作。
第一操作:存储该点出页地址,并将该点出页地址的访问时间作为该点出页地址的第一次被访问的时间存储;同时,将该点出页地址的累积热度N设置为在N的初始值的基础上根据第一预定步长的递增值,如N=N初始值+1;将该点出页在过去预定时长的时间窗内的热度H设置为在H的初始值的基础上根据第二预定步长的递增值,如H=H初始值+1,该热度H可以表示出在过去预定时长的时间窗内该点出页被点击的次数。上述N初始值可以设置为0,且上述H初始值也可以设置为0。当然,上述第一预定步长和第二预定步长也可以不为1,且上述N初始值和H初始值也可以为除0之外的其他数值。
第二操作:根据第一预定步长使该链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,如N=N当前值+1;根据第二预定步长使链接对信息所属的链接对的点出页在过去预定时长的时间窗内的热度H在当前热度数值的基础上递增,如H=H当前值+1;当然,这里的第一预定步长和 第二预定步长也可以不为1。上述点出页的累积热度N通常并不会周期性的被恢复为初始值(即N初始值,如0),然而,上述热度H应根据热度衰减周期定期恢复为初始值(即H初始值,如0),即上述时间窗的预定时长为热度衰减周期的时长。另外,上述热度衰减周期的时长(即时间窗的预定时长)的取值可根据实际需求以及服务器的计算能力等进行设置,如设置为1分钟或者设置为5分钟等。
本发明实施例可以针对一个来源地址设置一个列表,该列表可以称为页面热点资源列表,该页面热点资源列表中可以主要包括:针对来源地址的时间衰减因子、针对来源地址的热度衰减因子、点出页地址、点出页地址的累积热度N、点出页在过去预定时长的时间窗内的热度H以及点出页地址第一次被访问的时间。当然,该页面热点资源列表中还可以包括其他内容,如来源地址的热度以及在该列表中所记录的来源地址下的点出页的数量等。另外,本发明实施例也可以针对多个来源地址设置一个页面热点资源列表,此时,该列表中还应包括来源地址这一项。
需要说明的是,对于新的点出页地址而言,其出现的时间可能是在当前时间窗的中间位置或者中间偏后的位置,因此,在当前时间窗(即针对新的点出页地址的第一个时间窗内),新的点出页的累积热度N以及热度H的数值大小可能会偏低,在进入下一个时间窗(即针对新的点出页地址的第二个时间窗)后,其累积热度N以及热度H的数值大小很可能会逐步提高。
S120、根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理。
具体的,上述S120中还可以包含有根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理,本发明实施例对这两个衰减处理操作的先后执行顺序并不进行特殊限定;且上述时间衰减周期和热度衰减周期的时长可以相同,也可以不相同,用户可以根据实际需求灵活设置上述时间衰减周期和热度衰减周期的时长。需要说明的是,由于热度衰减周期的时长应为上述时间窗的预定时长,因此,在根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减后,热度H 被恢复为初始值,如0。
页面热点资源具有的一个特点为:随着时间的推移,页面热点资源会呈现出降温的趋势,且老的页面热点资源由于已经累积了一定的热度,因此,老的页面热点资源的降温趋势会比新的页面热点资源的降温趋势更明显;本发明实施例对累积热度N进行时间衰减即是针对页面热点资源的这一特点设计的。
页面热点资源具有的另一个特点为:针对新出现的页面热点资源,如果一开始热度就很高,那么其热的趋势会继续上升,该页面热点资源会快速上升到一定的热度;对于老的页面热点资源,如果热度开始降低,那么其热的趋势会继续下降,该页面热点资源会快速下降出一定的热度区域。另外,通过进行热度的平均可以平衡短暂内热门的页面热点资源的所出现的波动现象。本发明实施例对累积热度N进行热度衰减即是针对页面热点资源的这一特点设计的。
根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理的一个具体例子为:周期性(基于时间衰减周期)的利用下述公式(1)计算累积热度N在时间衰减处理操作后的数值;
N=N×X×T/Now; 公式(1)
在上述公式(1)中,X为时间衰减因子,T为链接对信息中的点出页第一次被访问的时间,Now为当前时间(如服务器当前时间),上述第一次被访问的时间以及当前时间均可以包括:年、月、日、小时、分钟以及秒,如第一次被访问的时间以及当前时间均可以采用格林威治时间表示方法,格林威治时间表示方法的一个具体例子:1970年1月1日00:00:00。
由于上述T的取值为固定值,而Now的取值会不断增加,因此,时间衰减体现的是基于当前时间的倒数的曲线,由此可知,上述T/Now也可采用对数、指数、开方或者幂等多种数学形式,其区别在于:曲线的变化速率不同。
根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理的一个具体的例子为:周期性的利用下述公式(2)计算累积热度N在时间窗内的热度衰减处理后的数值;
N=N×Y×(H/H’)×(N’/H’); 公式(2)
在上述公式(2)中,Y为热度衰减因子,H’为所有属于同一个来源地址的点出页在同一时间窗内的的热度H的平均值,即n为属于同一个来源地址的所有点出页的数量;N’表示一个点出页地址在其存储的时间段内单位时间的热度值,如N’=N/(Now–T+1);上述H/H’可以描述为:一个点出页地址的热度如果高于上述平均值,且高出的程度越高,则H/H’所表示出来的系数越大,相反,如果低于上述平均值,且低出的程度越低,则H/H’所表示出来的系数越小。考虑到一个点出页在某些时间窗内的热度H可能很低,这样会造成曲线的波动很大,因此,上述N’/H’中的单位时间的热度值N’可以起到平滑曲线的作用,具体的,由于用户的访问时间的不可控等因素很可能会使H在某一时间窗内的计算结果产生非常大的变化,因此,本发明实施例通过利用点出页地址在其存储的时间段内单位时间的热度值N’来平衡H,可以避免H在某一时间窗内的计算结果具有非常大的变化,从而使相应的曲线表现的更趋平滑。
同理,由于上述T的取值为固定值,而Now的取值会不断增加,因此,热度衰减体现的是基于当前时间的倒数的曲线,从而上述H/H’以及N’/H’也可采用对数、指数、开方或者幂等多种数学形式,其区别在于:曲线的变化速率不同。
上述时间衰减因子X和热度衰减因子Y可以是通过对客户端日志进行数据挖掘后而设置的,对不同的来源地址(Refer)配置的时间衰减因子X和热度衰减因子Y通常并不相同;一个具体的例子,对于变化更新比较快的来源地址(如http://www.sina.com.cn/以及http://www.sohu.com/等),所设置的时间衰减因子X和热度衰减因子Y的取值,应与对于变化更新比较慢的来源地址(如http://www.sogou.com/等)所设置的时间衰减因子X和热度衰减因子Y的取值具有比较明显的差别。且对于一个点出页地址而言,针对其来源地址的时间衰减因子X和针对其来源地址的热度衰减因子Y一旦确定通常不会再发生变化。
S130、根据衰减处理结果更新相应链接对的点出页的累积热度N。
具体的,本发明实施例可以根据上述衰减处理后获得的N更新页面热点资源列表中的相应链接对的点出页的累积热度N,并可以按照该积累热度N由大到小的顺序对列表中的点出页进行重新排序,从而在向用户基于预读取进行页面推送时,可以参考当前页面热点资源列表,由于该列表可以准确的反应各点出页的消费趋势,因此,在预读取过程中,提前推送的页面被用户选中点击的命中概率会被大大提高,从而提高了用户的体验。当然,本发明实施例也可以不对该列表进行重新排序,而是将一个来源地址下的各点出页地址提取出来放在一个新的列表中,且在该新的列表中,各点出页地址是按照点出页的累积热度N由大到小的顺序依次排列的。
实施例二、基于预读取的页面热点资源更新方法的一个具体实例。
在本实施例中,来源地址(下述用Refer表示)为新浪国际足球的网页地址,即http://sports.sina.com.cn/global/,并使用Url来表示针对Refer的点出页地址。
云端服务器的服务端实时收集网络中所有用户的客户端浏览器在http://sports.sina.com.cn/global/上的点击信息,从而产生链接对信息(refer,url);服务端收集的链接对信息如下:
根据对收集到的上述信息进行整理可以得出如下结果:
在9月22日09:10对Url的累积热度N进行时间衰减处理,即根据公式N=N×X×T/Now进行计算得到新的Url的累积热度N,如下:
在9月22日09:10对Url的累积热度进行热度衰减处理,即根据公式 计算获得H’=27;根据公式N=N*Y*(H/H’)*(N’/H’)获得新的Url的累积热度N,如下:
http://sports.sina.com.cn/g/pl/2013-09-22/09096794446.shtml 282 9月22 日09:07 50
http://sports.sina.com.cn/g/seriea/2013-09-22/09076794442.shtml 38 9 月22日09:01 20
http://sports.sina.com.cn/g/laliga/2013-09-22/08206794366.shtml 198 9 月22日08:20 10
在进行了上述计算后,根据Url的累积热度N对Refer下的所有Url进行重新排序,得到的排序结果(即新的页面热点资源列表)如下:
1 http://sports.sina.com.cn/g/pl/2013-09-22/09096794446.shtml
2 http://sports.sina.com.cn/g/laliga/2013-09-22/08206794366.shtml
3 http://sports.sina.com.cn/g/seriea/2013-09-22/09076794442.shtml
该页面热点资源列表可以是云端服务器在进行基于预读取的页面推送时的一个重要参考内容。
实施例三、基于预读取的页面热点资源更新装置。该装置的示意图如图2所示。
图2中,该装置主要包括:获取模块200、第一更新模块210、热度衰减模块230以及第二更新模块240;另外,该装置还可以可选的包括:时间衰减模块220以及过滤模块250。
获取模块200主要用于根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息。
具体的,获取模块200可以通过各终端设备的网络访问的客户端日志实时的获取到上述链接对信息;该网络访问的客户端日志通常是由终端设备的浏览器客户端产生的。
一个具体的例子,获取模块200可以通过构建后台服务端来实时获取网络中的所有终端设备的网络访问的客户端日志,该客户端日志中记录有用户通过客户端进行网络访问的浏览路径,从而获取模块200可以从上述实时获得的网络访问的客户端日志的浏览路径中提取出网络访问的来源地址以及针对该来源地址的点出页地址,从而获得上述链接对信息。
上述获取的链接对信息可以具体包括:来源地址以及针对该来源地址的点出页地址,且该链接对信息可以使用Refer->Url信息来表示,其中,Refer表示来源地址,而Url表示针对该来源地址的点出页地址。
过滤模块250与获取模块200和第一更新模块210分别连接。过滤模块250主要用于根据获取模块200获取的链接对信息确定点出页的类型,并滤除出点出页的类型属于预定类型的链接对信息。
过滤模块250对链接对信息进行过滤的目的包括:避免一些不需要向用户提前推送的网页对应的链接对信息对页面热点资源更新的影响。
具体的,过滤模块250可以根据链接对信息中的来源地址以及点出页地址判断链接对的点出页的类型,如果判断出点出页的类型属于需要进行滤除的预定类型,则滤除该链接对信息,否则,保留该链接对信息。
上述需要进行滤除的预定类型可以包括:不可预读取类型、信息含量少类型以及具有破坏性功能类型等。上述不可预读取类型可以包括广告类型等;上述信息含量少类型可以包括微博类型等;上述具有破坏性功能类型可以包括用户登录类型等。广告类型的点出页的特点、信息含量少类型的点出页的特点以及用户登录类型的点出页的特点如上述方法实施例中的描述,在此不再重复说明。
第一更新模块210与上述过滤模块250连接,在本发明实施例不包含有过滤模块250的情况下,第一更新模块210与上述获取模块200连接。
第一更新模块210主要用于根据上述获取模块200获取的链接对信息/过滤模块250过滤后的链接对信息更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
第一更新模块210执行的更新操作的一个具体的例子为:针对每一条链接对信息,第一更新模块210分别判断链接对信息中的点出页地址是否为针对该链接对信息中的来源地址的一个新的点出页地址(即该点出页地址是否已存在于之前记录的该来源地址下的各点出页地址中),如果是一个新的点出页地址,则第一更新模块210针对该新的点出页地址执行下述第一操作;如果不是一个新的点出页地址,则第一更新模块210针对该新的点出页地址执行下述第二操作。
第一操作:第一更新模块210存储该点出页地址,并将该点出页地址的访问时间作为该点出页地址的第一次被访问的时间存储;同时,第一更新模块210将该点出页地址的累积热度N设置为在N的初始值的基础上根据第一预定步长的递增值,如N=N初始值+1;第一更新模块210将该点出页在过去预定时长的时间窗内的热度H设置为在H的初始值的基础上根据第二预定步长的递增 值,如H=H初始值+1,该热度H可以表示出在过去预定时长的时间窗内该点出页被点击的次数。上述N初始值可以设置为0,且上述H初始值也可以设置为0。当然,上述第一预定步长和第二预定步长也可以不为1,且上述N初始值和H初始值也可以为除0之外的其他数值。
第二操作:第一更新模块210根据第一预定步长使该链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,如N=N当前值+1;第一更新模块210根据第二预定步长使链接对信息所属的链接对的点出页在过去预定时长的时间窗内的热度H在当前热度数值的基础上递增,如H=H当前值+1;当然,这里的第一预定步长和第二预定步长也可以不为1。上述点出页的累积热度N通常并不会周期性的被恢复为初始值(即N初始值,如0),然而,上述热度H应根据热度衰减周期定期恢复为初始值(即H初始值,如0),即上述时间窗的预定时长为热度衰减周期的时长。另外,上述热度衰减周期的时长(即时间窗的预定时长)的取值可根据实际需求以及服务器的计算能力等进行设置,如设置为1分钟或者设置为5分钟等。
本发明实施例可以针对一个来源地址设置一个列表,该列表可以称为页面热点资源列表,该页面热点资源列表中可以主要包括:针对来源地址的时间衰减因子、针对来源地址的热度衰减因子、点出页地址、点出页地址的累积热度N、点出页在过去预定时长的时间窗内的热度H以及点出页地址第一次被访问的时间。当然,该页面热点资源列表中还可以包括其他内容,如来源地址的热度以及在该列表中所记录的来源地址下的点出页的数量等。另外,本发明实施例也可以针对多个来源地址设置一个页面热点资源列表,此时,该列表中还应包括来源地址这一项。
时间衰减模块220与第一更新模块210连接,时间衰减模块220主要用于根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理。
时间衰减模块220根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理的一个具体例子为:时间衰减模块220周期性(基于时间衰减周期)的利用上述公式(1)计算累积热度N在时间衰减处理 操作后的数值。公式(1)的相关描述如上述方法实施例的描述,在此不再详细说明。
热度衰减模块230与第一更新模块210连接。热度衰减模块230主要用于根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理。
热度衰减模块230根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理的一个具体的例子为:热度衰减模块230周期性的利用上述公式(2)计算累积热度N在时间窗内的热度衰减处理后的数值。公式(2)的相关描述如上述方法实施例的描述,在此不再详细说明。
需要说明的是,本发明实施例对时间衰减模块220和热度衰减模块230执行衰减处理操作的先后执行顺序并不进行特殊限定;且上述时间衰减周期和热度衰减周期的时长可以相同,也可以不相同,用户可以根据实际需求灵活设置上述时间衰减周期和热度衰减周期的时长。另外,由于热度衰减周期的时长应为上述时间窗的预定时长,因此,在热度衰减模块230根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减后,热度H被恢复为初始值,如0。
第二更新模块240与时间衰减模块220和热度衰减模块230分别连接。第二更新模块240主要用于根据时间衰减模块220和热度衰减模块230的衰减处理结果更新相应链接对的点出页的累积热度N,该累积热度N为选取向终端设备提前推送资源的一个参数。
具体的,第二更新模块240可以根据上述时间衰减模块220和热度衰减模块230进行衰减处理后获得的N更新页面热点资源列表中的相应链接对的点出页的累积热度N,并可以按照该积累热度N由大到小的顺序对列表中的点出页进行重新排序,从而服务器在向用户基于预读取进行页面推送时,可以参考当前页面热点资源列表。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或者系统的实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明所提供的针对移动设备的基于预读取的页面热点资源更新方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种基于预读取的页面热点资源更新方法,其特征在于,该方法包括:
根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;
根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H;
根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;
根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
2.如权利要求1所述的方法,其特征在于,所述方法在更新所述累积热度N以及热度H之后还包括:
根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
3.如权利要求1所述的方法,其特征在于,所述根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息的步骤包括:
实时获取各终端设备的网络访问的客户端日志;
从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
4.如权利要求1所述的方法,其特征在于,所述方法在更新所述累积热度N以及热度H之前还包括:对所述链接对信息进行过滤的步骤,且所述过滤的步骤包括:
根据所述链接对信息确定点出页的类型;
滤除出点出页的类型属于预定类型的链接对信息。
5.如权利要求1所述的方法,其特征在于,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括:
在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;
将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;
将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
6.如权利要求1所述的方法,其特征在于,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括:
在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;
其中,所述热度H根据热度衰减周期定期恢复为初始值。
7.如权利要求2所述的方法,其特征在于,所述根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理的步骤包括:
根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;
N=N×X×A;
其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
8.如权利要求1至7中任一权利要求所述的方法,其中,所述根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理的步骤包括:
根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;
N=N×Y×(H/H’)×(N’/H’);
其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
9.一种基于预读取的页面热点资源更新装置,其特征在于,该装置包括:
获取模块,用于根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;
第一更新模块,用于根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H;
热度衰减模块,用于根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;
第二更新模块,用于根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
10.如权利要求9所述的装置,其特征在于,所述装置还包括:
时间衰减模块,与第一更新模块连接,用于根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
11.如权利要求9所述的装置,其特征在于,所述获取模块具体用于:实时获取各终端设备的网络访问的客户端日志,并从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
12.如权利要求9所述的装置,其特征在于,所述装置还包括:
过滤模块,与所述获取模块和第一更新模块分别连接,且所述过滤模块用于根据所述链接对信息确定点出页的类型,并滤除出点出页的类型属于预定类型的链接对信息。
13.如权利要求9所述的装置,其特征在于,所述第一更新模块具体用于:
在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;
将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;
将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
14.如权利要求9所述的装置,其特征在于,所述第一更新模块具体用于:
在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;
其中,所述热度H根据热度衰减周期定期恢复为初始值。
15.如权利要求10所述的装置,其特征在于,所述时间衰减模块具体用于:
根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;
N=N×X×A;
其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
16.如权利要求9至15中任一权利要求所述的装置,其特征在于,所述热度衰减模块具体用于:
根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;
N=N×Y×(H/H’)×(N’/H’);
其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
CN201310461879.5A 2013-09-30 2013-09-30 基于预读取的页面热点资源更新方法和装置 Active CN103500213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310461879.5A CN103500213B (zh) 2013-09-30 2013-09-30 基于预读取的页面热点资源更新方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310461879.5A CN103500213B (zh) 2013-09-30 2013-09-30 基于预读取的页面热点资源更新方法和装置

Publications (2)

Publication Number Publication Date
CN103500213A CN103500213A (zh) 2014-01-08
CN103500213B true CN103500213B (zh) 2017-01-11

Family

ID=49865424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310461879.5A Active CN103500213B (zh) 2013-09-30 2013-09-30 基于预读取的页面热点资源更新方法和装置

Country Status (1)

Country Link
CN (1) CN103500213B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731974A (zh) * 2015-04-13 2015-06-24 上海新炬网络信息技术有限公司 基于大数据流式计算的动态页面加载方法
CN105357192B (zh) * 2015-10-29 2018-12-25 小米科技有限责任公司 网页推送的方法、装置及系统
CN108156193B (zh) * 2016-12-02 2022-08-19 阿里巴巴集团控股有限公司 一种热点确定方法及系统
CN107832434B (zh) * 2017-11-15 2022-05-06 百度在线网络技术(北京)有限公司 基于语音交互生成多媒体播放列表的方法和装置
CN107844587B (zh) * 2017-11-16 2022-02-22 百度在线网络技术(北京)有限公司 用于更新多媒体播放列表的方法和装置
CN108062418B (zh) * 2018-01-05 2022-07-22 北京奇艺世纪科技有限公司 一种数据搜索方法、装置及服务器
CN109635192A (zh) * 2018-12-05 2019-04-16 宁波深擎信息科技有限公司 面向微服务的海量资讯热度排行更新方法及平台
CN110674412A (zh) * 2019-08-20 2020-01-10 广州视源电子科技股份有限公司 资源的推荐信息推送方法及装置、电子设备
CN114417216B (zh) * 2022-01-04 2022-11-29 马上消费金融股份有限公司 数据采集方法、装置、电子设备及可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807570B1 (en) * 1997-01-21 2004-10-19 International Business Machines Corporation Pre-loading of web pages corresponding to designated links in HTML
CN101477556A (zh) * 2009-01-22 2009-07-08 苏州智讯科技有限公司 一种从互联网海量信息中发现热点的方法
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
CN102314423A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 一种用于检测开放式互动平台中子集的热度的方法与设备
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法
CN102663012A (zh) * 2012-03-20 2012-09-12 北京搜狗信息服务有限公司 一种网页预加载方法及系统
CN102737037A (zh) * 2011-04-07 2012-10-17 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器
CN103218390A (zh) * 2012-12-31 2013-07-24 百度在线网络技术(北京)有限公司 一种站点资源管理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
US6766422B2 (en) * 2001-09-27 2004-07-20 Siemens Information And Communication Networks, Inc. Method and system for web caching based on predictive usage
US20060069617A1 (en) * 2004-09-27 2006-03-30 Scott Milener Method and apparatus for prefetching electronic data for enhanced browsing
US8126879B2 (en) * 2007-05-17 2012-02-28 Microsoft Corporation Assisted management of bookmarked web pages
US20100100607A1 (en) * 2008-10-22 2010-04-22 Scholz Martin B Adjusting Content To User Profiles

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807570B1 (en) * 1997-01-21 2004-10-19 International Business Machines Corporation Pre-loading of web pages corresponding to designated links in HTML
CN101477556A (zh) * 2009-01-22 2009-07-08 苏州智讯科技有限公司 一种从互联网海量信息中发现热点的方法
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置
CN102054004A (zh) * 2009-11-04 2011-05-11 清华大学 一种网页推荐方法和装置
CN102314423A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 一种用于检测开放式互动平台中子集的热度的方法与设备
CN102737037A (zh) * 2011-04-07 2012-10-17 北京搜狗科技发展有限公司 一种网页预读取的方法、装置及一种浏览器
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法
CN102663012A (zh) * 2012-03-20 2012-09-12 北京搜狗信息服务有限公司 一种网页预加载方法及系统
CN103218390A (zh) * 2012-12-31 2013-07-24 百度在线网络技术(北京)有限公司 一种站点资源管理方法及装置

Also Published As

Publication number Publication date
CN103500213A (zh) 2014-01-08

Similar Documents

Publication Publication Date Title
CN103500213B (zh) 基于预读取的页面热点资源更新方法和装置
CN103729438B (zh) 网页预加载方法及装置
CN106020715B (zh) 存储池容量管理
CN105701216B (zh) 一种信息推送方法及装置
CN103348342B (zh) 基于用户话题简档的个人内容流
CN102194015B (zh) 根据检索信息热度统计实现检索的方法
CN104794177B (zh) 一种数据存储方法及装置
CN106503014A (zh) 一种实时信息的推荐方法、装置和系统
Ali et al. Intelligent Naïve Bayes-based approaches for Web proxy caching
CN107066476A (zh) 一种基于物品相似度的实时推荐方法
CN102902775B (zh) 互联网实时计算的方法和系统
CN103309960B (zh) 一种网络舆情事件多维信息提取的方法及装置
CN105117501A (zh) 网络爬虫调度方法及应用其的网络爬虫系统
CN105589917B (zh) 浏览器日志信息的分析方法和装置
CN104182482B (zh) 一种新闻列表页判断方法及筛选新闻列表页的方法
CN107122457A (zh) 记录网络用户行为数据的方法及其装置、计算机可读介质
CN105930507A (zh) 一种获得用户的Web浏览兴趣的方法及装置
CN103699614B (zh) 一种确定下载资源时的默认保存路径的方法和装置
CN106649313A (zh) 用于处理缓存数据的方法和设备
CN107623732A (zh) 一种基于云平台的数据存储方法、装置、设备及存储介质
CN105653550B (zh) 网页过滤方法和装置
CN109635192A (zh) 面向微服务的海量资讯热度排行更新方法及平台
CN103034655A (zh) 一种用户行为信息的收集方法、系统及相关设备
CN107707621B (zh) 一种实现智能缓存的方法及装置
CN106910082A (zh) 一种调取广告进行推送的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant