CN105589919B - 网页资源处理方法及装置 - Google Patents

网页资源处理方法及装置 Download PDF

Info

Publication number
CN105589919B
CN105589919B CN201510600114.4A CN201510600114A CN105589919B CN 105589919 B CN105589919 B CN 105589919B CN 201510600114 A CN201510600114 A CN 201510600114A CN 105589919 B CN105589919 B CN 105589919B
Authority
CN
China
Prior art keywords
web page
data cached
page resources
text
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510600114.4A
Other languages
English (en)
Other versions
CN105589919A (zh
Inventor
梁捷
吴伟勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Dongjing Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Dongjing Computer Technology Co Ltd filed Critical Guangzhou Dongjing Computer Technology Co Ltd
Priority to CN201510600114.4A priority Critical patent/CN105589919B/zh
Publication of CN105589919A publication Critical patent/CN105589919A/zh
Application granted granted Critical
Publication of CN105589919B publication Critical patent/CN105589919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本发明实施例提出一种网页资源处理方法及装置,可以减少缓存数据的冗余,使http缓存空间能够存储更多缓存数据。所述方法包括接收由web服务器获取的网页资源;根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中包括指向所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;分别对所述正文缓存数据和所述头部缓存数据进行缓存。

Description

网页资源处理方法及装置
技术领域
本发明涉及计算机移动通信技术领域,具体而言,涉及一种网页资源处理方法及装置。
背景技术
浏览器在加载web服务器提供的网页资源(web资源)后,会根据web资源的http应答数据的应答头部(response headers)信息,对可缓存的(或需要校验的)web资源进行http缓存,便于后续在浏览器使用同一个网页资源时,可以复用本地保存的该网页资源副本,从而可以减少向web服务器请求网页资源的次数,进而可以减少从web服务器加载资源导致的流量耗费。此外,使用本地保存的副本,能够加快页面的解析和渲染,可以提升用户的浏览体验。
http应答数据,又称为http应答(响应)报文,主要由状态行(status line)、应答头部(response headers)、应答正文(body)这三部分组成。状态行与应答头部之间使用“\r\n”回车换行符分隔;应答头部各字段之间也是使用“\r\n”回车换行符分隔;最后一个应答头部字段与应答正文之间使用一个独立的“\r\n”回车换行符分隔。基于这样的约定,可以保证http客户端(例如移动浏览器)在接收到http应答数据后可以解析出各部分信息。对于各种类型的网页资源(例如html页面、JavaScript(一种直译式脚本语言)、CSS(一种样式设计语言)、图片),应答正文就是实际的内容。现有的http缓存一般都是将web资源的地址、http应答头部及应答正文一次写入http缓存空间。
对于移动浏览器使用的http缓存服务,由于移动设备的硬件配置的限制,其容量是受限的。这样,意味着,随着用户浏览的页面增多,存在某些有效的http缓存资源会由于缓存容量达到上限而被淘汰的情况。因此,如何减少缓存数据的冗余成为现在亟待解决的问题。
发明内容
本发明的目的在于提供一种网页资源处理方法及装置以减少缓存数据的冗余。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种网页资源处理方法,包括:接收由web服务器获取的网页资源;根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中还包括指向所述正文缓存数据的第一键值,其中,相同的正文缓存数据具有相同的第一键值;分别对所述正文缓存数据和所述头部缓存数据进行缓存。
第二方面,本发明实施例还提供了一种网页资源处理方法,包括:响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;当查询到与所述键值对应的有效缓存数据时,解析查找到的所述有效缓存数据,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式,其中,所述头部缓存数据的预定缓存格式中包括指向与其对应的所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;如果是,则在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据,当查询到有效的目标正文缓存数据时,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息;如果不是,则直接根据所述有效缓存数据获得所述待加载网页资源的信息。
第三方面,本发明实施例还提供了一种网页资源处理装置,包括:网页资源接收模块,用于接收由web服务器获取的网页资源;缓存数据生成模块,用于根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中包括指向所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;缓存模块,用于分别对所述正文缓存数据和所述头部缓存数据进行缓存。
第四方面,本发明另一实施例还提供了一种网页资源处理装置,包括:查询模块,用于响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;解析判断模块,用于当查询到与所述键值对应的有效缓存数据时,解析查找到的所述有效缓存数据,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式,其中,所述头部缓存数据的预定缓存格式中包括指向与其对应的所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;资源获取模块,用于如果所述解析判断模块的判断结果为是,在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据,当查询到有效的目标正文缓存数据时,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息,如果所述解析判断模块的判断结果为不是,则直接根据所述有效缓存数据获得所述待加载网页资源的信息。
本发明实施例提供的网页资源处理方法和装置根据由web服务器获取的网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,头部缓存数据中包括指向该正文缓存数据的第一键值,并且相同的正文缓存数据具有相同的第一键值,从而可以实现让具有相同正文缓存数据的不同网页资源在http缓存中有各自的头部缓存数据,但都指向同一份正文缓存数据,从而减少缓存数据的冗余,使http缓存空间能够存储更多缓存数据。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的网页资源处理方法及装置的应用环境示意图;
图2示出了本发明实施例提供的用户终端的结构框图;
图3示出了本发明第一实施例提供的一种网页资源处理方法的流程示意图;
图4示出了本发明第二实施例提供的一种网页资源处理方法的流程示意图;
图5示出了本发明第三实施例提供的一种网页资源处理方法的流程示意图;
图6示出了本发明第四实施例提供的一种网页资源处理装置的结构框图;
图7示出了本发明第五实施例提供的一种网页资源处理装置的结构框图。
具体实施方式
本发明实施例所提供的网页资源处理方法及装置可应用于如图1所示的应用环境中。如图1所示,用户终端100、web服务器200位于无线网络或有线网络300中,通过该无线网络或有线网络300,用户终端100与web服务器200进行数据交互。
于本发明实施例中,用户终端100优选为移动终端设备,例如可以包括智能手机、平板电脑、电子书阅读器、膝上型便携计算机、车载电脑、穿戴式移动终端等等。
图2示出了一种可应用于本发明实施例中的用户终端的结构框图。如图2所示,用户终端100包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、音频模块112、触控屏幕114等。这些组件通过一条或多条通讯总线/信号线116相互通讯。
存储器102可用于存储软件程序以及模块,如本发明实施例中的网页资源处理方法及装置对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本发明实施例提供的网页资源处理方法。
存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
触控屏幕114在用户终端100与用户之间同时提供一个输出及输入界面。
可以理解,图2所示的结构仅为示意,用户终端100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。
于本发明实施例中,用户终端100中安装有浏览器,与web服务器200相对应,为用户提供服务。浏览器具有浏览器内核和http缓存服务系统。
本发明实施例提出的网页资源处理方法和装置,提供了一种新的应用于网页资源的http缓存存储及查询机制。
发明人通过对不同的web页面的采样数据分析,发现对于一些网页资源,例如JavaScript资源或者CSS资源,虽然web地址不同,但是其内容可能存在一致。比如前端开源框架Jquery开源Javascritp库(或者Jquery开源CSS库)。如果某个浏览器用户刚好访问了三个页面,分别各自引用Jquery类库,那么在其http缓存空间中则有三份缓存数据。但是,如果三个页面引用的Jquery类库的Javascript资源的数据都是一样的,就浪费了存放两个应答正文的http缓存空间,假设应答正文的大小是210KB,那么就浪费了420KB的缓存空间。
本发明实施例提供的网页资源处理方法和装置根据网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,头部缓存数据中包括指向该正文缓存数据的第一键值,并且相同的正文缓存数据具有相同的第一键值,从而可以实现让具有相同正文缓存数据的不同网页资源在http缓存中有各自的头部缓存数据,但都指向同一份正文缓存数据,从而减少缓存数据冗余,让http缓存空间能够存储更多缓存数据。例如,对于上述场景,可以节省将近420KB的缓存空间。
需要说明的是,本发明实施例中的http缓存服务系统使用key-value数据库(或者类key-value数据库)来实现,在对数据进行存储与检索时基本遵循key-value数据库的以下要素:缓存数据之间相互独立;数据格式分为key和value部分,key作为缓存数据的索引,便于管理,且具有唯一性,value是实际缓存的数据;当缓存的数据已经占满缓存空间时,如果增加新的缓存数据,需要淘汰已有的缓存数据来腾出空间存放新的缓存数据。
本发明实施例中,将以现有的http缓存格式进行缓存的数据,定义为实体缓存数据,实体缓存数据包括了网页资源的http应答数据的所有部分,也就是包括http应答数据的状态行、应答头部、以及应答正文。
本发明实施例中,应答正文相同的不同网页资源定义为同值资源,以本发明实施例提供的新的缓存格式缓存的数据定义为同值缓存数据。因为需要实现多个同值资源在http缓存中可以使用同一份正文缓存数据,所以引入了两个新的缓存格式:头部缓存数据的预定缓存格式和正文缓存数据的预定缓存格式。
本发明实施例中,头部缓存数据的键值(key)为网页资源的URI(UniformResource Identifier,统一资源标识符),URI用来唯一的标识一个网页资源。头部缓存数据的value包括序列化的状态行、应答头部及指向与其对应的正文缓存数据的第一键值,该第一键值是关联网页资源应答头部和正文缓存数据的索引。头部缓存数据中不包括应答正文(body)。
本发明实施例中,正文缓存数据以第一键值作为key,value是对应网页资源的应答正文(body)。第一键值的格式包括:网页资源的类型名称、以及基于所述正文缓存数据的内容(也就是应答正文)计算出来的哈希值、经编码后生成的字符串。
由于同值资源的正文缓存数据是相同的,因此,在写入同值缓存数据的正文缓存数据时,如果http缓存空间中已经存储有与该正文缓存数据相同的正文缓存数据,新写入的正文缓存数据会覆盖http缓存空间中原本存在的正文缓存数据,也就是说对于多个同值资源,会在http缓存空间保存各自的头部缓存数据,但是由于其正文缓存数据是相同的,因此http缓存空间中仅会保存一份相同的正文缓存数据,这样就可以实现减少缓存数据冗余。
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一实施例
图3示出了本发明第一实施例提供的一种网页资源处理方法的流程图,请参阅图3,本实施例描述的是浏览器的处理流程,所述方法包括:
步骤S110,接收由web服务器获取的网页资源;
步骤S120,根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中包括指向所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
所述第一键值包括:所述网页资源的类型名称、以及基于所述网页资源的应答正文计算出来的哈希值、经编码后生成的字符串。
例如第一键值的格式可以是:网页资源的schema://body内容的md5值进行base64编码后生成的24个字节字符串。
其中,网页资源的schema是网页资源的类型名称,例如可以是“Js”和”Css”(大小写敏感),当然也可以扩展容纳更多的资源类型。使用网页资源的schema,主要意图在于从key的层面可以区分资源类别。Js:指代该正文缓存数据是Javascript资源的应答正文(body)数据。Css:指代该正文缓存数据是CSS资源的应答正文(body)数据。
第一键值中包含“body内容的md5值进行base64编码后生成的24个字节字符串”,主要的意图在于可以保证正文缓存数据存储的唯一性。因为md5值是基于数据内容(而不是数据大小)而计算出来的哈希值,已经在算法层面上保证了在极大的数据空间里,不同内容产生的哈希值肯定不同。
步骤S130,分别对所述正文缓存数据和所述头部缓存数据进行缓存。
对正文缓存数据和头部缓存数据进行缓存也就是将正文缓存数据和头部缓存数据分别写入http缓存空间,如果http缓存空间中已经存储有与该正文缓存数据相同的正文缓存数据,新写入的正文缓存数据就会覆盖http缓存空间中原本存在的正文缓存数据,也就是说对于多个同值资源,会在http缓存空间保存各自的头部缓存数据,但是由于其正文缓存数据是相同的,因此http缓存空间中仅会保存一份相同的正文缓存数据,这样就可以实现减少缓存数据冗余。
进一步的,所述分别对所述正文缓存数据和所述头部缓存数据进行缓存之后,还可以包括:将所述正文缓存数据的过期时间设置为0。将正文缓存数据的过期时间设置为0,也就是将正文缓存数据设置为永不过期,可以最大程度的保证该正文缓存数据的持久性。
由于http缓存空间是有限的,因此,当缓存的数据已经占满缓存空间时,如果增加新的缓存数据,还是需要淘汰已有的缓存数据来腾出空间来存放新的缓存数据,具体的淘汰策略,例如可以采用LRU算法(Last Recently Used)进行数据淘汰。LRU算法可以在一定程度上保证访问频率高且有效的数据能够一致保留在缓存队列前部,而访问频率低或者已失效的数据会被推送到队列尾部便于淘汰。当然,也可以采用其他淘汰策略,本发明的具体实施并不以此为限。
下面将通过具体的示例说明本实施例中的网页资源处理方法,以下是三个Jquery的Javacript类型的网页资源的地址及http应答报文的应答头部:
网页资源一
地址(URI):
http://spuvvn.edu/bitrix/templates/sardar_patel/js/jquery-ui-1.8.16.custom.min.js
应答头部:
HTTP/1.0200OK
Date:Wed,08 Jul 2015 06:43:45 GMT
Server:Apache/2.2.27(Unix)mod_ssl/2.2.27OpenSSL/1.0.1e-fips DAV/2mod_jk/1.2.37 mod_bwlimited/1.4PHP/5.3.28
Last-Modified:Thu,16 Feb 2012 17:55:54 GMT
ETag:"31000b8-3361f-4b9188a179e80"
Accept-Ranges:bytes
Content-Length:210463
Content-Type:application/javascript
X-Cache:MISS from devy.ucweb.local
X-Cache-Lookup:MISS from devy.ucweb.local:3128
Via:1.0devy.ucweb.local:3128(squid/2.6.STABLE21)
Proxy-Connection:close
网页资源二
地址(URI):
http://m.sportzwiki.com/assets/js/jquery-ui-1.8.16.custom.min.js
应答头部:
HTTP/1.0 200 OK
Date:Wed,08 Jul 2015 06:47:55 GMT
Content-Type:application/javascript
Content-Length:210463
Set-Cookie:
__cfduid=d3d61c97334953c660457bbb5a0e183a51436338075;
expires=Thu,07-Jul-16 06:47:55 GMT;path=/;domain=.sportzwiki.com;HttpOnly
Last-Modified:Wed,18Mar 2015 13:43:31 GMT
ETag:"94e599-3361f-5119044d006c0"
CF-Cache-Status:HIT
Expires:Mon,13 Jul 2015 06:47:55 GMT
Cache-Control:public,max-age=432000
Accept-Ranges:bytes
Server:cloudflare-nginx
CF-RAY:2029d72c77d30bab-HKG
X-Cache:MISS from devy.ucweb.local
X-Cache-Lookup:MISS from devy.ucweb.local:3128
Via:1.0devy.ucweb.local:3128(squid/2.6.STABLE21)
Proxy-Connection:close
网页资源三
地址(URI):
http://www.rcs-rds.ro/resources/jquery_ui/js/jquery-ui-1.8.16.custom.min.js
应答头部:
HTTP/1.0 200 OK
X-Varnish:1089339340
Vary:Accept-Encoding
X-Cache:MISS
Content-Type:application/javascript
Date:Wed,08 Jul 2015 06:50:54 GMT
Accept-Ranges:bytes
Accept-Ranges:bytes
ETag:"503dde-3361f-4aeb148764ec0"
Last-Modified:Fri,07 Oct 2011 08:32:35 GMT
Age:0
Content-Length:210463
X-Cache:MISS from devy.ucweb.local
X-Cache-Lookup:MISS from devy.ucweb.local:3128
Via:1.1varnish,1.0 devy.ucweb.local:3128(squid/2.6.STABLE21)
Proxy-Connection:close
可以看出,三个网页资源的URI不同且跨域(处于不同域名),但从三个网页资源的Content-Length字段值来看,应答正文(body)的大小都是210463字节(约210KB)。
假设对三个网页资源的应答正文(body)的内容计算md5值再进行base64编码,得出的校验值都是“ZcfHB93eoMeGFxTfJQ1UxA==”,那么可以证明该三个网页资源的应答正文(body)的内容都是一样的。也就是说这三个网页资源就是本发明实施例所说的“同值资源”。
存在“同值资源”的原因在于大多数站点可能采用了类似的站点模板进行建站,这样,由于模板相同或者类似,其所采用的前端技术可能都使用了一些比较主流且功能强大的Javascript类库或者CSS库,比如Jquery。即便使用不同的站点模板,由于需要实现某些前端功能特性,也会不约而同的使用主流的Javascript类库或者CSS库。所以对于不同站点的外联Javascript资源(或者Css资源),应该存在一定比例的同值资源。比如上述三个Jquery资源,其名称本身就相同。但也会存在名称不同但资源内容一致的场景,通常是站点方对名称进行了修改,不过通常资源名字会保留库名称的关键词,比如Jquery。
前文所提及的三个Jquery资源的正文缓存数据的第一键值可以表示为:
Js://ZcfHB93eoMeGFxTfJQ1UxA==
由前述可知,使用同值缓存方式存储的网页资源,相比现有的http缓存方式,其实际存储了两个http缓存数据,一个是头部缓存数据,另一个是正文缓存数据。对于头部缓存数据,其value中可以通过在应答头部字段新增一个特殊字段“body-key:”来存放指向与其对应的正文缓存数据的第一键值,优选的,该字段放置在value中的第一行。
下面以一个Jquery资源来说明其头部缓存数据和正文缓存数据的格式。
头部缓存数据的预定缓存格式:
Key:
http://spuvvn.edu/bitrix/templates/sardar_patel/js/jquery-ui-1.8.16.custom.min.js
Value:
body-key:Js://ZcfHB93eoMeGFxTfJQ1UxA==\r\n
HTTP/1.0200OK\r\n
Date:Wed,08Jul 2015 06:43:45 GMT\r\n
Server:Apache/2.2.27(Unix)mod_ssl/2.2.27OpenSSL/1.0.1e-fips DAV/2mod_jk/1.2.37 mod_bwlimited/1.4PHP/5.3.28\r\n
Last-Modified:Thu,16 Feb 2012 17:55:54 GMT\r\n
ETag:"31000b8-3361f-4b9188a179e80"\r\n
Accept-Ranges:bytes\r\n
Content-Length:210463\r\n
Content-Type:application/javascript\r\n
X-Cache:MISS from devy.ucweb.local\r\n
X-Cache-Lookup:MISS from devy.ucweb.local:3128\r\n
Via:1.0devy.ucweb.local:3128(squid/2.6.STABLE21)\r\n
Proxy-Connection:close\r\n
正文缓存数据的预定缓存格式:
key:
Js://ZcfHB93eoMeGFxTfJQ1UxA==
value:
Body数据
本实施例提供的网页资源处理方法可以减少缓存数据的冗余,使http缓存空间能够存储更多缓存数据。在一定程度上可以提高http缓存命中率,达到效益更大化,既减少了资源在网络侧加载产生的流量,也减少了web浏览的响应耗时。
第二实施例
图4示出了本发明第二实施例提供的一种网页资源处理方法的流程图。请参阅图4,本实施例描述的是浏览器处理缓存写入的流程,所述方法包括:
步骤S210,接收由web服务器获取的网页资源;
步骤S220,判断所述网页资源是否可缓存;
对于网页资源是否可以进行http缓存,浏览器可以基于http应答头部和缓存相关字段或者是否需要校验进行判断,例如,如果与缓存相关的字段声明是可缓存的网页资源,或者是需要校验的网页资源,浏览器可以判定该网页资源可缓存。
如果是,则执行步骤S230。否则,不进行缓存,也就是缓存写入流程结束。
步骤S230,判断所述网页资源是否符合预定条件;
如果符合所述预定条件,执行步骤S240,否则,执行步骤S260。
由于本发明实施例提出的同值缓存对头部缓存数据和正文缓存数据要分别进行写入缓存,比现有的写入缓存增加了一次写入操作,响应的读取操作也增加一次(详见第三实施例),所以,为了提高效率,可以对使用同值缓存方法进行缓存的网页资源加以限制,也就是在进行同值缓存前,先对网页资源是否符合预定条件进行一个判断,如果符合预定条件就按照同值缓存的方式进行处理,否则,按照现有的缓存方式进行处理。
于本实施例中,所述预定条件可以包括以下一种或几种的组合:
所述网页资源的类型为预设类型;
所述网页资源的大小大于预设阈值;以及
所述网页资源的名称存在于预设关键词列表中。
在各类网页资源中,可缓存的网页资源集中在外联的JavaScript(一种直译式脚本语言),CSS(一种样式设计语言)和图片资源。其中,JavaScript和CSS资源对于页面的解析和渲染速度有一定影响。而且对网页资源而言,JavaScript和CSS资源存在同值资源的可能性较大,而页面和图片存在同值资源的可能性较小,所以可以对网页资源的类型加以限制。于本实施例中,预设类型优选的为JavaScript类型或CSS类型,只要网页资源的类型为这两种预设类型之一即可。
通过判断网页资源的大小是否大于预设阈值可以更有针对性的对同值资源进行同值缓存处理。于本实施例中,网页资源大小的预设阈值例如可以为50KB,当然,预设阈值的大小也可根据实际情况进行调整,并不作为对本发明实施方式的限定。
网页资源的名称(文件名)是否存在于预设关键词列表,也就是指网页资源的名称是否能够匹配到关键词列表资源使用同值缓存策略。比如“jquery”就是其中一个关键词。
这些判定条件可以由浏览器配置,通过后台下发机制来进行控制。也可以通过设置缓存控制开关来控制该功能的开启或关闭。假设设定需要同时满足以上三个条件,那么当某个网页资源同时满足上述三个条件时,触发同值缓存,也就是执行步骤S240。当然,也可以根据实际情况设定具体的判定条件。
步骤S240,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据;
步骤S250,分别对所述正文缓存数据和所述头部缓存数据进行缓存。
步骤S260,根据所网页资源的信息生成实体缓存数据,直接对所述实体缓存数据进行缓存。
其中,所述实体缓存数据包括所述网页资源的所有http应答数据,也就是包括http应答数据的状态行、应答头部、以及应答正文。
于一种具体实施方式中,浏览器内核进行页面加载处理,加载了某个由web服务器获取的网页资源,判断所述网页资源是否可缓存,如果可缓存则判断所述网页资源是否符合预定条件,如果不可缓存则结束写入缓存的流程。如果可缓存且网页资源符合预定条件,则浏览器内核根据所述网页资源的信息生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据。优选的,将所述正文缓存数据的过期时间设定为0。浏览器内核将所述头部缓存数据与正文缓存数据分别写入http缓存服务系统的缓存空间。如果可缓存但是网页资源不符合预定条件,则浏览器内核根据所网页资源的信息生成实体缓存数据,直接将所述实体缓存数据写入http缓存服务系统的缓存空间。
需要说明的是,本具体实施方式中,浏览器中数据的缓存在浏览器内核和http缓存服务系统之间进行。缓存的逻辑可以由移动浏览器内核实现,http缓存服务系统保持不变。在其他具体实施方式中,也可以将存储逻辑都在http缓存服务系统上实现,而浏览器内核逻辑不变。优选的,缓存逻辑由浏览器内核实现,一方面可以保持http缓存服务系统中数据存储的纯粹性,不需要了解数据格式,另一方面在浏览器内核上实现更加灵活。
第三实施例
图5示出了本发明第三实施例提供的一种网页资源处理方法的流程图,请参阅图5,本实施例描述的是浏览器处理缓存读取的流程,所述方法包括:
步骤S310,响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;
如果查询结果为不存在,则执行步骤S320,如果查询结果为存在,则执行步骤S330。
步骤S320,向web服务器请求所述待加载的网页资源,接着执行步骤S210,进入缓存流程,也就是第二实施例中所描述的流程,这里不再赘述。
步骤S330,解析查找到的有效缓存数据;
步骤S340,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式;
如果所述有效缓存数据的格式符合头部缓存数据的预定缓存格式,也就是说,有效缓存数据是头部缓存数据,执行步骤S350。如果不是,则执行步骤S370。
步骤S350,在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据。
如果存在且有效,则执行步骤S360,如果不存在所述目标正文缓存数据或者存在所述目标正文缓存数据但是已失效,则判定该待加载网页资源的http缓存不命中,执行步骤S320。
步骤S360,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息。
步骤S370,直接根据所述有效缓存数据获得所述待加载网页资源的信息。
于一种具体实施方式中,浏览器内核进行页面加载处理,需要加载某个外联的网页资源,浏览器内核可以先以待加载的网页资源的唯一资源标识符(URI)为key向http缓存服务系统查询与该key对应的缓存数据。http缓存服务系统在缓存空间的数据队列中检索与该key对应的缓存数据(第一次get操作),如果不存在对应的缓存数据或者缓存数据已失效,浏览器内核判定该网页资源的http缓存不命中,向web服务器请求该待加载网页资源。如果查询结果为存在,则浏览器内核解析查找到的有效缓存数据的value值。如果发现是实体缓存数据,也就是是现有的缓存数据格式,则直接根据查找到的有效缓存数据获得待加载网页资源的信息。如果发现是头部缓存数据,则浏览器内核基于头部缓存格式,根据应答头部的“body-key”字段,解析出正文缓存数据的key值,也就是第一键值,并以该第一键值再次向http缓存系统发起查询(第二次get操作)。如果存在且有效,则http缓存系统将该正文缓存数据返回给浏览器内核,浏览器内核基于头部缓存数据和正文缓存数据,获得待加载网页资源的信息。如果不存在所述目标正文缓存数据或者存在所述目标正文缓存数据但是已失效,则判定该待加载网页资源的http缓存不命中,向web服务器请求该待加载网页资源。
发明人基于多个用户在一段时间内的web浏览数据,统计了jquery相关的JS资源数据。共有1565个JS资源,其中有743个资源属于内容重复资源(同值资源);而在这743个同值资源中,通过按照内容重复排重后(比如A、B、C是同值资源,只保留A,而剔除B和C),剩余141个资源,平均的重复指数约为4.27(剔除的重复资源总数/排重后的资源总数)。由此,可以看出本实施例提供的网页资源处理方法可以减少缓存数据的冗余,使http缓存空间能够存储更多缓存数据。
需要说明的是,本具体实施方式中,浏览器中数据的读取在浏览器内核和http缓存服务系统之间进行。读取的逻辑可以由移动浏览器内核实现,http缓存服务系统保持不变。在其他具体实施方式中,也可以将读取逻辑都在http缓存服务系统上实现,而浏览器内核逻辑不变。
第四实施例
图6示出了本发明第四实施例提供的一种网页资源处理装置的结构框图,请参阅图6,本实施例中的装置可运行于用户终端100的浏览器,本实施例中的装置40包括:
网页资源接收模块41,用于接收由web服务器获取的网页资源;
缓存数据生成模块42,用于根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中包括指向所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
缓存模块43,用于分别对所述正文缓存数据和所述头部缓存数据进行缓存。
进一步的,所述头部缓存数据还包括所述网页资源的http应答数据的状态行和应答头部,所述正文缓存数据包括所述网页资源的http应答数据的应答正文。
进一步的,所述第一键值包括:所述网页资源的类型名称、以及基于所述网页资源的应答正文计算出来的哈希值、经编码后生成的字符串。
进一步的,所述装置40还包括:
判断模块44,用于判断所述网页资源是否符合预定条件;
如果符合所述预定条件,所述缓存数据生成模块42生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据;
否则,所述缓存数据生成模块42根据所网页资源的信息生成实体缓存数据,所述缓存模块43直接对所述实体缓存数据进行缓存,所述实体缓存数据包括所述网页资源的所有http应答数据。
进一步的,所述预定条件包括以下一种或几种的组合:
所述网页资源的类型为预设类型;
所述网页资源的大小大于预设阈值;以及
所述网页资源的名称存在于预设关键词列表中。
进一步的,所述缓存模块43还用于在分别对所述正文缓存数据和所述头部缓存数据进行缓存之后,将所述正文缓存数据的过期时间设置为0。
本实施例中的各单元可以是由软件代码实现,此时,上述的各单元可存储于用户终端100的存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。
第五实施例
图7示出了本发明五实施例提供的网页资源处理装置的结构框图,请参照图7,本实施例中的装置可运行于用户终端的浏览器,本实施例中的装置50包括:
查询模块51,用于响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;
解析判断模块52,用于当查询到与所述键值对应的有效缓存数据时,解析查找到的所述有效缓存数据,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式,其中,所述头部缓存数据的预定缓存格式中包括指向与其对应的所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
资源获取模块53,用于如果所述解析判断模块52的判断结果为是,在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据,当查询到有效的目标正文缓存数据时,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息,如果所述解析判断模块52的判断结果为不是,则直接根据所述有效缓存数据获得所述待加载网页资源的信息。
可以理解的是,在其他实施例中,网页资源处理装置可以同时包括第五实施例中的各模块以及第四实施例中的各模块。
本实施例中的各单元可以是由软件代码实现,此时,上述的各单元可存储于用户终端100的存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。
综上所述,本发明实施例提供的网页资源处理方法和装置根据由web服务器获取的网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,头部缓存数据中包括指向该正文缓存数据的第一键值,并且相同的正文缓存数据具有相同的第一键值,从而可以实现让具有相同正文缓存数据的不同网页资源在http缓存中有各自的头部缓存数据,但都指向同一份正文缓存数据,从而减少缓存数据的冗余,使http缓存空间能够存储更多缓存数据,在一定程度上提高http缓存命中率。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的网页资源处理装置及系统,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
另外,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本发明实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (12)

1.一种网页资源处理方法,其特征在于,所述方法包括:
接收由web服务器获取的网页资源;
判断所述网页资源是否符合预定条件;
如果符合所述预定条件,根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中还包括指向所述正文缓存数据的第一键值,其中,相同的正文缓存数据具有相同的第一键值;
分别对所述正文缓存数据和所述头部缓存数据进行缓存,其中,在缓存的过程中,所述正文缓存数据覆盖与其相同的数据,所述头部缓存数据均进行保留;
否则,根据所述网页资源的信息生成实体缓存数据,直接对所述实体缓存数据进行缓存,所述实体缓存数据包括所述网页资源的所有http应答数据。
2.如权利要求1所述的方法,其特征在于,所述第一键值包括:所述网页资源的类型名称、以及基于所述网页资源的应答正文计算出来的哈希值经编码后生成的字符串。
3.如权利要求1所述的方法,其特征在于,所述根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据之前,包括:
判断所述网页资源是否可缓存,如果是,则执行所述生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据的步骤,否则,不进行缓存。
4.如权利要求1所述的方法,其特征在于,所述预定条件包括以下一种或几种的组合:
所述网页资源的类型为预设类型;
所述网页资源的大小大于预设阈值;以及
所述网页资源的名称存在于预设关键词列表中。
5.如权利要求1所述的方法,其特征在于,所述分别对所述正文缓存数据和所述头部缓存数据进行缓存之后,还包括:
将所述正文缓存数据的过期时间设置为0。
6.一种网页资源处理方法,其特征在于,所述方法包括:
响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;
当查询到与所述键值对应的有效缓存数据时,解析查找到的所述有效缓存数据,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式,其中,所述头部缓存数据的预定缓存格式中包括指向与其对应的正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
如果是,则在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据,当查询到有效的目标正文缓存数据时,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息;
如果不是,则直接根据所述有效缓存数据获得所述待加载网页资源的信息。
7.一种网页资源处理装置,其特征在于,包括:
网页资源接收模块,用于接收由web服务器获取的网页资源;
判断模块,用于判断所述网页资源是否符合预定条件;
缓存数据生成模块,用于如果所述网页资源符合所述预定条件,根据所述网页资源的信息,生成包括所述网页资源的应答头部的头部缓存数据和包括所述网页资源的应答正文的正文缓存数据,所述头部缓存数据中包括指向所述正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
缓存模块,用于分别对所述正文缓存数据和所述头部缓存数据进行缓存,其中,在缓存的过程中,所述正文缓存数据覆盖与其相同的数据,所述头部缓存数据均进行保留;
否则,所述缓存数据生成模块根据所网页资源的信息生成实体缓存数据,所述缓存模块直接对所述实体缓存数据进行缓存,所述实体缓存数据包括所述网页资源的所有http应答数据。
8.如权利要求7所述的装置,其特征在于,所述头部缓存数据还包括所述网页资源的http应答数据的状态行和应答头部,所述正文缓存数据包括所述网页资源的http应答数据的应答正文。
9.如权利要求8所述的装置,其特征在于,所述第一键值包括:所述网页资源的类型名称、以及基于所述网页资源的应答正文计算出来的哈希值经编码后生成的字符串。
10.如权利要求7所述的装置,其特征在于,所述预定条件包括以下一种或几种的组合:
所述网页资源的类型为预设类型;
所述网页资源的大小大于预设阈值;以及
所述网页资源的名称存在于预设关键词列表中。
11.如权利要求7所述的装置,其特征在于,所述缓存模块还用于在分别对所述正文缓存数据和所述头部缓存数据进行缓存之后,将所述正文缓存数据的过期时间设置为0。
12.一种网页资源处理装置,其特征在于,包括:
查询模块,用于响应于网页资源加载请求,以待加载的网页资源的唯一资源标识符为键值,在本地查询对应的有效缓存数据;
解析判断模块,用于当查询到与所述键值对应的有效缓存数据时,解析查找到的所述有效缓存数据,判断所述有效缓存数据的格式是否符合头部缓存数据的预定缓存格式,其中,所述头部缓存数据的预定缓存格式中包括指向与其对应的正文缓存数据的第一键值,相同的正文缓存数据具有相同的第一键值;
资源获取模块,用于如果所述解析判断模块的判断结果为是,在所述有效缓存数据中获取第一键值,根据所获取的第一键值查询对应的目标正文缓存数据,当查询到有效的目标正文缓存数据时,基于所述有效缓存数据以及所述目标正文缓存数据获得所述待加载网页资源的信息,如果所述解析判断模块的判断结果为不是,则直接根据所述有效缓存数据获得所述待加载网页资源的信息。
CN201510600114.4A 2015-09-18 2015-09-18 网页资源处理方法及装置 Active CN105589919B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510600114.4A CN105589919B (zh) 2015-09-18 2015-09-18 网页资源处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510600114.4A CN105589919B (zh) 2015-09-18 2015-09-18 网页资源处理方法及装置

Publications (2)

Publication Number Publication Date
CN105589919A CN105589919A (zh) 2016-05-18
CN105589919B true CN105589919B (zh) 2018-01-09

Family

ID=55929500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510600114.4A Active CN105589919B (zh) 2015-09-18 2015-09-18 网页资源处理方法及装置

Country Status (1)

Country Link
CN (1) CN105589919B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015978B (zh) * 2016-01-27 2020-07-07 阿里巴巴(中国)有限公司 一种网页资源处理方法以及装置
CN106294663A (zh) * 2016-08-04 2017-01-04 网宿科技股份有限公司 一种电子设备、及其应用的图片处理方法及系统
CN108563469A (zh) * 2017-10-20 2018-09-21 五八有限公司 页面加载方法、装置、存储介质及终端设备
CN108234639A (zh) * 2017-12-29 2018-06-29 北京奇虎科技有限公司 一种基于内容分发网络cdn的数据访问方法和装置
CN108875036B (zh) * 2018-06-26 2021-03-16 北京永安信通科技有限公司 页面数据缓存方法、装置和电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100465955C (zh) * 2004-10-12 2009-03-04 国际商业机器公司 用于高速缓存万维网内容的方法和系统
KR101431205B1 (ko) * 2007-07-13 2014-08-18 삼성전자주식회사 캐시 메모리 장치 및 캐시 메모리 장치의 데이터 처리 방법
CN101488135B (zh) * 2008-01-14 2012-07-04 盛大计算机(上海)有限公司 延后个性化网页的设计和获取方法
CN101706825B (zh) * 2009-12-10 2011-04-20 华中科技大学 一种基于文件内容类型的重复数据删除方法
CN102096712A (zh) * 2011-01-28 2011-06-15 深圳市五巨科技有限公司 一种移动终端缓存控制的方法和装置
CN104731722B (zh) * 2015-04-17 2018-08-07 吉林大学 一种针对缓存页面的页面管理方法及装置

Also Published As

Publication number Publication date
CN105589919A (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN105589919B (zh) 网页资源处理方法及装置
US20240080374A1 (en) Smart caching based on reputation information
EP2653987B1 (en) Displaying web pages without downloading static files
Ali et al. Intelligent web proxy caching approaches based on machine learning techniques
US9253278B2 (en) Using entity tags (ETags) in a hierarchical HTTP proxy cache to reduce network traffic
CN104077310B (zh) 加载资源文件的方法、设备和系统
US8959162B2 (en) Publisher-based message data cashing in a publish-subscription environment
CN107015978A (zh) 一种网页资源处理方法以及装置
CN106664592A (zh) 通过无线网络在选定时间使用保证预取的有效内容分发
CN105210352A (zh) 基于指纹的智能内容预取
CN107315646B (zh) 页面组件间的数据流向控制方法和装置
CN103916474B (zh) 缓存时间的确定方法、装置及系统
CN108476222A (zh) 钓鱼攻击的检测和减轻
CN107329963A (zh) 加速网页访问的方法和装置
CN105337735A (zh) 数字证书处理及校验的方法和装置
CN102402613A (zh) 网页文本信息过滤系统及方法
CN108694215A (zh) 网页缓存预热的方法、装置、电子设备和计算机可读介质
US9667737B2 (en) Publisher-assisted, broker-based caching in a publish-subscription environment
CN103580991B (zh) 一种邮件附件的上传方法和设备
Wu et al. Malicious website detection based on urls static features
CN110020297A (zh) 一种网页内容的加载方法、装置及系统
CN107291923A (zh) 信息处理方法和装置
US11321415B2 (en) Method, apparatus and computer program for processing URL collected in web site
CN107301224A (zh) 一种信息分享的方法及装置
CN108073585A (zh) 网络字体加载方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200525

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping B radio 14 floor tower square

Patentee before: GUANGZHOU UCWEB COMPUTER TECHNOLOGY Co.,Ltd.