CN108241689A - 页面资源获取方法、装置和客户端设备 - Google Patents

页面资源获取方法、装置和客户端设备 Download PDF

Info

Publication number
CN108241689A
CN108241689A CN201611220376.9A CN201611220376A CN108241689A CN 108241689 A CN108241689 A CN 108241689A CN 201611220376 A CN201611220376 A CN 201611220376A CN 108241689 A CN108241689 A CN 108241689A
Authority
CN
China
Prior art keywords
page
resource content
visited
resource
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611220376.9A
Other languages
English (en)
Inventor
刘恒兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Dongjing Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Dongjing Computer Technology Co Ltd filed Critical Guangzhou Dongjing Computer Technology Co Ltd
Priority to CN201611220376.9A priority Critical patent/CN108241689A/zh
Publication of CN108241689A publication Critical patent/CN108241689A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Abstract

本发明提出了一种页面资源获取方法、装置和客户端设备。该方法包括:根据待访问页面的特征信息,确定所述待访问页面的资源内容;和在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。由此,通过使用特征信息辨认页面间能够共用的资源内容,减少对网络访问的需求,从而提升页面显示速度。

Description

页面资源获取方法、装置和客户端设备
技术领域
本发明涉及网页展示,尤其涉及一种页面资源获取方法、装置和客户端设备。
背景技术
随着网络信息技术的发展和终端设备的普及,越来越多的用户通过各种各样的终端设备浏览网页并获取信息。如何快速获取网页内容并顺畅显示给用户成为各方致力于实现的目标。
网页是一种使用HTML语言撰写的文档。随着技术的发展,现在网页的样式更为丰富,使用CSS样式语言和JavaScript语言对网页显示特性进行控制。其中,CSS用于描述网页的显示信息,而JavaScript代码用于控制网页的内部逻辑。上述资源内容本身往往并不包含在网页代码内,而是需要通过链接引用。因此,在终端设备获取了网页代码之后,往往仍需保持联网来获取网页代码中指示的、正确显示网页的必要资源内容。
由于这些资源内容会被网站的众多页面使用,各个网站往往会把这些资源内容放在自己的服务器上。因此,当终端设备例如通过浏览器访问各大网站时,即使显示页面时所引用的位于这些服务器上的文件一模一样,浏览器也需要请求多遍来获取。这样无形中浪费了带宽,并且延长了从网页请求到显示的等待时间,从而降低了用户体验。
因此,需要一种用来解决上述问题的新的页面资源获取方法、装置和客户端设备。
发明内容
为了解决如上的至少一个问题,本发明提出了一种页面资源获取方法、装置和客户端设备,其通过特征信息判断出页面中所需引用的资源内容与本地缓存中预先缓存的内容相同,于是便直接使用本地缓存的相同数据来用于页面展示,这样通过省略对资源内容的网络请求,加快网站访问和页面显示的速度,由此提升用户体验。
根据本发明的一个方面,提出了一种页面资源获取方法,包括:根据待访问页面的特征信息,确定所述待访问页面的资源内容;和在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
由此,对在前访问页面的缓存除了能够提升随后对相同网页的访问速度,还能够通过共用相同的资源内容,提升不同页面的访问速度,由此进一步提升页面显示的效率和速度。
优选地,对本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的判断是根据所述特征信息的相互匹配做出的。通过提取的特征信息进行匹配,能够确定格式不同但指代相同的资源内容,由此进一步提升识别效率。
优选地,所述资源内容是JavaScript文件,所述特征信息包括用于指示JavaScript文件的库名、版本号和/或版本类型。通过引入JS,能够在不显著增加网络开销的情况下进一步优化网页的显示效果。
优选地,所述待访问页面的特征信息是从所述待访问页面的HTML代码包含的URL中提取的。由此能够确保对资源内容的定位和描述的准确性。
优选地,所述页面资源方法还包括:在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。这样,可以在缓存资源不可用的情况下回归普通的页面显示方法。进一步地,可以在所述本地缓存中缓存所述从外部获取的资源内容,使得今后在遇到该相同的资源内容时能够免除对资源内容的另行网络获取。
优选地,所述本地缓存是本地用于默认缓存所述资源内容之外的缓存。由于默认缓存经常会被清空且存储空间有限,通过另行开辟一个缓存,能够更为灵活准确地对资源内容加以控制。
优选地,所述页面资源方法还包括后置验证步骤,包括从外部获取所述待访问页面的资源内容;和在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。由此,能够排除特征信息相同但资源内容本身不相同的少数例外情况,进一步完善本发明的技术方案。进一步地,在后置验证判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。由此确保资源内容的正常获取以及网页的正常显示。
根据本发明的另一个方面,提出了一种页面资源获取装置,包括:资源内容确定单元,用于根据待访问页面的特征信息确定所述待访问页面的资源内容;和资源内容本地读取单元,在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
优选地,所述页面资源装置还可以包括资源内容外部获取单元,用于在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。
优选地,所述页面资源装置还可以包括资源内容本地缓存单元,用于在所述本地缓存中缓存所述从外部获取的资源内容。
优选地,所述页面资源装置还可以包括后置验证单元,用于从外部获取所述待访问页面的资源内容,并且在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。
优选地,所述资源内容外部获取单元在所述后置验证单元判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。
根据本发明的再一个方面,提出了一种客户端设备,包括:存储器,用于存储针对已访问页面的资源内容;网络设备;处理器,用于:根据由所述网络设备获取的待访问页面的特征信息确定所述待访问页面的资源内容,在判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取所述存储器中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
优选地,所述网络设备还可以在所述处理器判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。相应地,所述存储器可以存储所述从外部获取的资源内容。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了可用于实施本发明原理的计算设备的示意性结构图。
图2示出了根据本发明一个实施例的页面资源获取方法。
图3示出了根据本发明一个实施例的页面资源获取装置。
图4示出了根据本发明一个实施例的客户端设备。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
用户使用客户端设备,通常是客户端设备上安装的浏览器或是其他带页面浏览功能的应用,来访问网站并浏览网页。计算设备可以实现为客户端设备。图1示出了可用于实施本发明原理的计算设备的示意性结构图。计算设备可以实施为各种类型的计算机装置,例如台式机、便携式计算机、平板电脑、移动智能电话、个人数据助理(PDA),或者其他类型的计算机装置,但是不限于任何特定形式。计算机可以包括处理模块100,存储子系统200,输入装置300、显示器400、网络接口500,以及总线600。
处理模块100可以是一个单核或多核的处理器,也可以包含多个处理器。在一些实施例中,处理模块100可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中,处理模块100可以使用定制的电路实现,例如特定用途集成电路(ASIC)或者现场可编程逻辑门阵列(FPGA)。在一些实施方式中,处理模块100可以是类似的电路执行存储在自身上的可执行指令。在另外一些实施方式中,处理模块100可以执行存储在存储子系统200上的可执行指令。在图1示出的实施方式中,处理模块100设有操作系统110和运行在操作系统110上的浏览器(或是带有页面浏览功能模块的其他应用)120。
存储子系统200可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。ROM可以存储处理模块100或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储子系统200可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM、SRAM、SDRAM、闪存、可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储子系统200可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘只读蓝光光盘、超密度光盘、闪存、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。在一些实施方式中,存储子系统200能够存储一个或多个能被处理模块100执行的软件程序或需要调用的资源文件,资源文件可以包含一些第三方库,包括但不限于音频库、视频库、2D图形库、3D图形库。在一些实施例中,存储子系统200能够为浏览器120存储在前访问的网页数据,其中包括网页中引用并由浏览器获取的资源内容,例如,指定了库、版本和类型的JavaScript文件。
用户界面可以由一个或多个用户输入装置300、显示器400,和/或一个或多个其他用户输出设备提供。输入装置300可以包括用户向计算机输入信号的装置,计算机可以解释这些信号包含有特定的用户请求或信息。在一些实施方式中,可以通过键盘向用户界面输入网址,要求浏览器120通过用户界面显示输入网址对应的网页内容。在一些实施方式中,输入装置300可以包含一些或所有的键盘按钮、触摸屏、鼠标或其他输入设备等。
显示器400可以显示由计算机生成的图像,可以包括各种类型的图像设备,例如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)(包括有机发光二极管(OLED))、投射系统等等与其他支持电子装置(例如DAC、ADC、信号处理器等等)的集合。在一些实施方式中,也可能额外提供其他用户输出设备,或者取代显示器400,例如信号灯、扬声器、触觉传感器、打印机等。
在一些实施方式中,用户界面可以通过图形用户界面提供。在显示器400中的某些区域定义一些可视的图形元素作为用户通过输入装置300选择的交互对象或者控制对象。例如,用户可以操作用户输入装置300移动屏幕上的指定位置输入网址,控制浏览器在显示器400上显示该网址对应的网页内容。在一些实施方式中,可以识别用户手势的触摸设备作为输入设备,这些手势可以但不必须与显示器400上的阵列相联系。
网络接口500为计算机提供声音和/或数据通讯功能。在一些实施方式中,网络接口500可以包括射频收发器来传递声音和/或数据(例如使用蜂窝式电话技术,例如3G、4G或EDGE、WIFI的数据网络技术)、GPS接受模块和/或其他模块。在一些实施方式中,网络接口500可以提供额外的无线网络连接或替代无线接口。网络接口500可以是硬件(例如天线、调制解调器、编解码器以及其他模拟和/或数字信号处理电路)和软件模块的结合。
总线600可以包括各种连接计算机内部各部件的系统、外部设备和芯片总线。例如总线600将处理模块100和存储子系统200连接,还可以连接输入装置300和显示器400。总线600也可以使得计算机通过网络接口500与网络连接。在这种情况下,计算机可以作为多个联网计算机设备的一部分。计算机的任意或所有部件都可以在本发明的实施方式中协调使用。
一些实施方式中包含电子元件,例如微处理器、在计算机可读存储媒介中存储有计算机指令和数据的存储器。在具体实施方式部分描述的许多特征都可以通过执行存储在计算机可读存储媒介上的计算机指令的方法步骤实现。当这些计算机指令被执行,计算机处理单元完成指令的各种功能。程序指令或计算机编码的实施方式可以是机器码,例如使用计算机、电子元件或待解析器的微处理器编译其他高级语言得到的代码。
通过适当的编程,处理模块100可以为计算机可以实现多种类型的功能。例如,处理模块100通过网络接口500从服务器下载网页内容至存储子系统200。然后,处理模块100从存储子系统200中读取网页文件至浏览器120以进行网页内容的渲染与显示。在网页内容的显示过程中,处理模块100还有可能通过总线从存储子系统200的第三方库中读取所需的音频/视频文件和/或2D/3D图形,绘制成最终图像并在显示器400上显示。
需要理解的是,图1中的计算机是示意性的,并且还可具有其他没有具体描述的功能(例如移动通话、GPS、电源管理,摄像头、各种用于连接外部设备的连接端口或附件等等)。进一步,此处对计算机100涉及的特定功能模块进行了描述,这些功能模块的描述是为了便于描述,而且也不意味着对功能部件特定的物理配置。而且,这些功能模块不需要与物理模块一一对应。模块可以被配置成用来完成各种操作,例如通过编程或设置合适的控制电路,模块也可能会根据初始设置重新被配置。本发明的实施例可以在各种设备包括电子设备中,通过使用硬件和软件的结合来实现。
在图1示出的实施方式中,浏览器或是其他应用中的浏览模块的处理器主要作用是用于显示网页。目前,网页是一种使用HTML语言撰写的文档,并且为了网页样式的丰富,可以使用CSS样式语言和JavaScript语言对网页显示特性进行控制。上述资源内容本身往往并不包含在网页代码内,而是需要通过引用来获取。因此,计算装置在获取了网页代码之后仍需保持联网来获取网页代码中指示的、正确显示网页的必要资源内容。
另一方面,虽然资源内容多种多样,并且各大网站通常会在自己的服务器上存储这些资源内容。但是由于大家都愿意使用最为流行或是最为稳定的资源内容,因此在一定的时间段内,各大网站所使用的资源内容往往相同或相近。这就导致了浏览器在浏览各大网站的网页时,虽然为了获取资源内容访问了不同的地址,但这些资源内容本身很可能是相同的。另外,网页中通常包括能够指示资源内容身份的特征信息,例如,指示资源内容的文件名称,或是版本类型等。这些特征信息能够帮助识别出要访问的资源内容到底是什么资源内容。正是出于上述考虑,本发明提出了一种新的页面资源获取方案。
图2示出了根据本发明一个实施例的页面资源获取方法的示意图。该页面资源获取方法可由图1的计算设备实施,例如,可由浏览器120或是其他带有网页浏览功能的应用实施。浏览器可以利用特征信息识别出即将要访问的资源内容是与本地缓存相同的资源内容,于是可以直接使用本地缓存的相同数据,而不再进行网络请求,由此加快网站的访问速度和网页的显示效率。
在步骤S210,根据待访问页面的特征信息,确定所述待访问页面的资源内容。浏览器在获取了待访问页面的页面内容(例如,HTML代码)之后,需要对页面内容进行解析和后续处理以实现页面在客户端设备上的实际显示。在页面显示过程中,往往需要另行获取页面内容中所指示的资源内容,由此才能实现页面的正确完整显示。页面代码中通常会包括用于指示资源内容的特征信息,例如,资源内容的文件名,或是版本号。通过上述特征信息,能够确定待访问页面中的资源内容究竟是什么资源内容。
在步骤S220,在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,已访问页面不同于待访问页面。通过直接读取本地缓存,能够节省网络访问时间,由此加速页面的显示并提升用户的使用流畅度。
在一个实施例中,可以通过上述特征信息的匹配来检测本地缓存中是否缓存有相同的资源内容。可以通过例如相同的文件名来判断资源内容的相同。还可以通过文件命名所具备的某些特征,例如版本号来区别不同的资源内容。在一个实施例中,还可以为本地缓存中缓存的资源内容编写一份特征列表,以便与待访问页面中的资源内容的特征信息相比较。
在一个实施例中,资源内容可以是JavaScript文件。JavaScript拥有例如jQuery、Bootstrap等的开源库,被众多网站所使用。“库”是一种JavaScript框架,网页编写中实际使用的是符合特定框架的特定版本的JavaScript文件。因此,通过识别出页面内容中的关于JavaScript文件的特定特征信息(例如,库名和版本号),就能够识别出特定的JavaScript文件。另外,有些资源文件还会包含文件类型,例如“min”指示文件大小最小化版,“compressed”指示压缩版,并且跟没有此特征的文件属于不同的文件。因此,在一些实施例中,特征信息还可以包括资源内容的文件类型信息。
在一个实施例中,可以从待访问页面的HTML代码包含的URL中提取资源内容的特征信息。页面代码中通常包含用于指示资源内容访问地址的URL。虽然不是必须的,但URL中通常会包含用于指明资源内容身份所需的特征。这里的资源内容优选地可以是JavaScript文件。在实际操作中,可以首先根据URL确定文件后缀名,即URL的最后几个字符,例如js、css、woff、ttf等,由此确定JavaScript开源库及其附属资源文件的后缀名。随后可以从URL中的特定位置中提取出该文件的版本号。对于版本号1.3.4,都可以通过特定方法提取出例如http://www.example.com/……/1.3.4/…….js(在两个“/”斜杆中间)或是http://www.example.com/……/……-1.3.4.js(在文件名内部)中的版本号。可选地,还可以提取URL中名包含文件类型,例如“min”指代最小化版,“compressed”指代压缩版等。由此,根据提取的库名、版本名和可选的类型,就能够识别出特定的JavaScript文件,用于与本地缓存的JavaScript文件相比较。另外,本发明的提案还可以准备一份关键字列表,用于存储常用的JavaScript开源库。于是优选地,在确定资源后缀名之后,将获取的库名与关键字列表相比较。只有在判断后缀名所示的是常用库(即,与关键字列表中的一项相吻合)之后,才进行随后的特征提取、比较和本地读取。对于属于不常见库的资源内容,可以选择直接访问该资源内容。
在一个实施例中,当判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,可以从外部获取所述待访问页面的资源内容。优选地,可以在本地缓存中缓存从外部获取的上述资源内容,以便在今后使用。在为本地缓存中缓存的资源内容编写了特征列表的情况下,还可以将上述资源内容的特征加入所述列表,以便今后的查找和比较。
另外,虽然通常可以根据从获取的页面内容中提取的特征信息来识别出特定的资源内容,但也存在诸如待访问资源内容的文件名被有意或无意修改而导致判断相同的资源内容实际上不同的情况。因此,为了容错,本发明的页面资源获取方案可以增加后置验证步骤。该后置验证步骤可以包括从外部获取所述待访问页面的资源内容,例如根据页面中的URL实际获取资源内容,并且对获取的资源内容和在前判定相同的本地读取的资源内容进行比较。在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。进一步地,在判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。由于通常同一个网站上各网页会引用相同的资源内容,因此上述后置验证步骤可以优选地针对每个网站进行一次。
本地默认缓存,例如浏览器的默认缓存,可以对在前访问的页面内容进行存储,本发明可以通过例如向资源内容添加标识来使用默认缓存存储已访问网页的资源内容,然而,优选地,本提案可以使用本地用于默认缓存所述资源内容之外的缓存来缓存资源内容。例如,浏览器可以专门开辟一个缓存区域用于缓存在前的资源内容,例如各个库下、各版本和类型的JavaScript文件。由于是专门开辟的缓存区域,因此对该区域的管理,例如,如何排序,如何清理等都更为自由,也能进一步提高本地读取相比于网络获取的速度和处理优势。
如上参考图2描述了根据本发明的页面资源获取方法,如下将参考图3-4描述根据本发明的页面资源获取装置和客户端设备。
图3示出了根据本发明一个实施例的页面资源获取装置的例子。页面资源获取装置300可以包括资源内容确定单元310和资源内容本地读取单元320。资源内容确定单元310可以根据待访问页面的特征信息确定所述待访问页面的资源内容。资源内容本地读取单元320则可在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,已访问页面不同于待访问页面。
在一个实施例中,页面资源获取装置300还可以包括资源内容外部获取单元330,后者可以在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。页面资源获取装置300还可以包括资源内容本地缓存单元340,用于在所述本地缓存中缓存所述从外部获取的资源内容。
在一个实施例中,页面资源获取装置300还可以包括后置验证单元350,用于从外部获取所述待访问页面的资源内容,并且在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。资源内容外部获取单元330可以在后置验证单元350判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。
图4示出了根据本发明一个实施例的客户端设备。该客户端设备可以具备图1所示计算装置的相应结构。客户端设备400可以包括处理器410、存储器420和网络设备450,上述处理器、存储器和网络设备可以分别对应于图1中的处理模块100、存储子系统200和网络接口500。
存储器420可以存储针对已访问页面的资源内容。网络设备450用于发送访问请求并获取请求的数据。处理器410可以用于根据由网络设备450获取的待访问页面的特征信息确定所述待访问页面的资源内容,在判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取所述存储器中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
另外,网络设备450还在所述处理器判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容,并由存储器420存储从外部获取的资源内容。
【应用例】
如下将结合一个具体应用来说明本发明的具体实现。
百度和新浪都使用jQuery库,在他们各自的主页中,都包括用于指向资源内容的URL,所述URL分别为:
http://libs.baidu.com/jquery/1.9.1/jquery.min.js
http://lib.sinaapp.com/js/jquery/1.9.1/jquery-1.9.1.min.js
百度和新浪都是从jQuery的官方网站拷贝到自己的服务器,文件内容是相同的。浏览器根据特征进行匹配,发现两者:文件名后缀都是js;都是jQuery库;都是1.9.1版本;都是min版本,因此可以认定百度和新浪主页上所用于的JavaScript文件相同。
在浏览器已经访问过百度并存储了该资源内容的情况下,在访问新浪时,可以直接使用百度缓存的资源内容来做应答,减少了网络数据传输,提高了访问效率。
上文中已经参考附图详细描述了根据本发明的页面资源获取方法、装置和客户端设备。
此外,根据本发明的方法还可以实现为一种计算机程序,该计算机程序包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。或者,根据本发明的方法还可以实现为一种计算机程序产品,该计算机程序产品包括计算机可读介质,在该计算机可读介质上存储有用于执行本发明的上述方法中限定的上述功能的计算机程序。本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (17)

1.一种页面资源获取方法,包括:
根据待访问页面的特征信息,确定所述待访问页面的资源内容;和
在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
2.如权利要求1所述的方法,其中,对本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的判断是根据所述特征信息的相互匹配做出的。
3.如权利要求2所述的方法,其中所述资源内容是JavaScript文件,所述特征信息包括用于指示JavaScript文件的库名、版本号和/或版本类型。
4.如权利要求1所述的方法,其中,所述待访问页面的特征信息是从所述待访问页面的HTML代码包含的URL中提取的。
5.如权利要求1所述的方法,还包括:
在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。
6.如权利要求5所述的方法,还包括:
在所述本地缓存中缓存所述从外部获取的资源内容。
7.如权利要求1所述的方法,其中,所述本地缓存是本地用于默认缓存所述资源内容之外的缓存。
8.如权利要求1所述的方法,还包括:
从外部获取所述待访问页面的资源内容;和
在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。
9.如权利要求8所述的方法,还包括:
在判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。
10.一种页面资源获取装置,包括:
资源内容确定单元,用于根据待访问页面的特征信息确定所述待访问页面的资源内容;和
资源内容本地读取单元,在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取本地缓存中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
11.如权利要求10所述的装置,还包括:
资源内容外部获取单元,用于在判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。
12.如权利要求11所述的装置,还包括:
资源内容本地缓存单元,用于在所述本地缓存中缓存所述从外部获取的资源内容。
13.如权利要求10所述的装置,还包括:
后置验证单元,用于从外部获取所述待访问页面的资源内容,并且在所述从外部获取的资源内容与所述本地读取的资源内容不相同的情况下,判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的。
14.如权利要求13所述的装置,其中,所述资源内容外部获取单元在所述后置验证单元判断所述特征信息的相互匹配无法判定本地缓存中缓存的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容是相同的情况下,从外部获取所述待访问页面的资源内容。
15.一种客户端设备,包括:
存储器,用于存储针对已访问页面的资源内容;
网络设备,用于从网络上获取数据;
处理器,用于:
根据由所述网络设备获取的待访问页面的特征信息确定所述待访问页面的资源内容,在判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容相同的情况下,直接读取所述存储器中的针对所述已访问页面的资源内容用于所述待访问页面,其中,所述已访问页面不同于所述待访问页面。
16.如权利要求15所述的客户端设备,其中,所述网络设备还在所述处理器判定所述存储器中存储的针对已访问页面的资源内容与所确定的针对所述待访问页面的资源内容不相同的情况下,从外部获取所述待访问页面的资源内容。
17.如权利要求16所述的客户端设备,其中,所述存储器存储所述从外部获取的资源内容。
CN201611220376.9A 2016-12-26 2016-12-26 页面资源获取方法、装置和客户端设备 Pending CN108241689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611220376.9A CN108241689A (zh) 2016-12-26 2016-12-26 页面资源获取方法、装置和客户端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611220376.9A CN108241689A (zh) 2016-12-26 2016-12-26 页面资源获取方法、装置和客户端设备

Publications (1)

Publication Number Publication Date
CN108241689A true CN108241689A (zh) 2018-07-03

Family

ID=62702139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611220376.9A Pending CN108241689A (zh) 2016-12-26 2016-12-26 页面资源获取方法、装置和客户端设备

Country Status (1)

Country Link
CN (1) CN108241689A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800372A (zh) * 2019-01-03 2019-05-24 北京字节跳动网络技术有限公司 提升第三方网页打开速度的方法、装置及电子设备
CN110727890A (zh) * 2019-08-22 2020-01-24 中国平安财产保险股份有限公司 一种页面加载方法、装置及计算机设备、存储介质
CN110781424A (zh) * 2019-10-12 2020-02-11 四川长虹电器股份有限公司 用于Web项目自动化测试的智能清除浏览器缓存的方法
CN112040340A (zh) * 2020-08-25 2020-12-04 海信电子科技(深圳)有限公司 资源文件获取方法及显示设备
CN113590618A (zh) * 2021-07-19 2021-11-02 上海淇玥信息技术有限公司 一种零访问量页面资源的清理方法、装置和电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320372A (zh) * 2008-05-22 2008-12-10 上海爱数软件有限公司 一种重复数据的压缩方法
CN101382958A (zh) * 2008-10-21 2009-03-11 深圳华为通信技术有限公司 网页加载方法和网页加载装置
CN103218434A (zh) * 2013-04-15 2013-07-24 北京小米科技有限责任公司 一种加载静态资源的方法和装置
US8527905B2 (en) * 2006-06-07 2013-09-03 International Business Machines Corporsation Providing archived web page content in place of current web page content
CN103294718A (zh) * 2012-02-29 2013-09-11 腾讯科技(深圳)有限公司 网页缓存管理方法和装置
CN104239480A (zh) * 2011-09-19 2014-12-24 北京奇虎科技有限公司 一种快速访问网页的方法、装置
CN104376122A (zh) * 2014-12-08 2015-02-25 浪潮通用软件有限公司 浏览器客户端获得静态文件的方法及服务器
CN105022750A (zh) * 2014-04-28 2015-11-04 腾讯科技(北京)有限公司 资源文件加载方法和装置
CN105824909A (zh) * 2016-03-15 2016-08-03 腾讯科技(深圳)有限公司 页面生成方法和装置
CN106202179A (zh) * 2016-06-27 2016-12-07 北京奇虎科技有限公司 一种页面加载方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8527905B2 (en) * 2006-06-07 2013-09-03 International Business Machines Corporsation Providing archived web page content in place of current web page content
CN101320372A (zh) * 2008-05-22 2008-12-10 上海爱数软件有限公司 一种重复数据的压缩方法
CN101382958A (zh) * 2008-10-21 2009-03-11 深圳华为通信技术有限公司 网页加载方法和网页加载装置
CN104239480A (zh) * 2011-09-19 2014-12-24 北京奇虎科技有限公司 一种快速访问网页的方法、装置
CN103294718A (zh) * 2012-02-29 2013-09-11 腾讯科技(深圳)有限公司 网页缓存管理方法和装置
CN103218434A (zh) * 2013-04-15 2013-07-24 北京小米科技有限责任公司 一种加载静态资源的方法和装置
CN105022750A (zh) * 2014-04-28 2015-11-04 腾讯科技(北京)有限公司 资源文件加载方法和装置
CN104376122A (zh) * 2014-12-08 2015-02-25 浪潮通用软件有限公司 浏览器客户端获得静态文件的方法及服务器
CN105824909A (zh) * 2016-03-15 2016-08-03 腾讯科技(深圳)有限公司 页面生成方法和装置
CN106202179A (zh) * 2016-06-27 2016-12-07 北京奇虎科技有限公司 一种页面加载方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800372A (zh) * 2019-01-03 2019-05-24 北京字节跳动网络技术有限公司 提升第三方网页打开速度的方法、装置及电子设备
CN109800372B (zh) * 2019-01-03 2020-12-29 北京字节跳动网络技术有限公司 提升第三方网页打开速度的方法、装置及电子设备
CN110727890A (zh) * 2019-08-22 2020-01-24 中国平安财产保险股份有限公司 一种页面加载方法、装置及计算机设备、存储介质
CN110781424A (zh) * 2019-10-12 2020-02-11 四川长虹电器股份有限公司 用于Web项目自动化测试的智能清除浏览器缓存的方法
CN112040340A (zh) * 2020-08-25 2020-12-04 海信电子科技(深圳)有限公司 资源文件获取方法及显示设备
CN113590618A (zh) * 2021-07-19 2021-11-02 上海淇玥信息技术有限公司 一种零访问量页面资源的清理方法、装置和电子设备
CN113590618B (zh) * 2021-07-19 2023-10-13 上海淇玥信息技术有限公司 一种零访问量页面资源的清理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
US11681699B2 (en) Automated extraction of data from web pages
US10055507B2 (en) Infinite scrolling
US10198527B2 (en) Graphical user interface machine to present a window
US20120233239A1 (en) Device Specific Handling of User Interface Components
US9507480B1 (en) Interface optimization application
US8612418B2 (en) Mobile web browser for pre-loading web pages
US9348939B2 (en) Web site sectioning for mobile web browser usability
CN108241689A (zh) 页面资源获取方法、装置和客户端设备
US20150370912A1 (en) Method and system for displaying customized webpage on double webview
WO2016026384A1 (zh) 一种客户端页面显示方法、装置及系统
US20150149885A1 (en) Systems and Methods for Contextual Vocabularies and Customer Segmentation
US20170177319A1 (en) Dependency-Aware Transformation Of Multi-Function Applications For On-Demand Execution
CN104798094B (zh) 确定内容项目显示环境的配置
CN105426508B (zh) 网页生成方法和装置
US20170177318A1 (en) Dependency-Aware Transformation of Multi-Function Applications for On-Demand Execution
TWI469075B (zh) 搜尋庫
JP6440828B2 (ja) デジタルコンテンツの可視性の検出
CN107315827A (zh) 一种电子阅读中的关联推荐的方法及其装置
US11720407B2 (en) Resource pre-fetch using age threshold
KR102179768B1 (ko) 3차원 캐릭터에 기반하여 정보를 제공하는 전자 장치 및 방법
US20180121049A1 (en) Terminal device and method for displaying image by same, and web server and method for providing web page by same
CN109948085A (zh) 浏览器内核初始化方法、装置、计算设备和存储介质
US20230267532A1 (en) Shopping mobile application
CN107688650A (zh) 一种web页面生成方法和装置
WO2022062664A1 (en) Embedding asynchronous content in text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200713

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping B radio square 14 storey tower

Applicant before: Guangzhou Dongjing Computer Technology Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180703