CN110502713A - 网页资源处理方法、装置、电子设备以及存储介质 - Google Patents

网页资源处理方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN110502713A
CN110502713A CN201910740904.0A CN201910740904A CN110502713A CN 110502713 A CN110502713 A CN 110502713A CN 201910740904 A CN201910740904 A CN 201910740904A CN 110502713 A CN110502713 A CN 110502713A
Authority
CN
China
Prior art keywords
web page
page resources
content
resolved
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910740904.0A
Other languages
English (en)
Inventor
刘汉军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910740904.0A priority Critical patent/CN110502713A/zh
Publication of CN110502713A publication Critical patent/CN110502713A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Abstract

本申请实施例公开了一种网页资源处理方法、装置、电子设备以及存储介质。所述方法包括:获取待解析的网页资源;检测所述网页资源是否为目标网页资源;若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源;对所述内容替换后的网页资源进行解析。从而通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。

Description

网页资源处理方法、装置、电子设备以及存储介质
技术领域
本申请涉及计算机技术领域,更具体地,涉及一种网页资源处理方法、装置、电子设备以及存储介质。
背景技术
随着经济和社会的发展,手机已经变成了人们的必需品,上网的人数越来越多,浏览器作为浏览网页的工具,访问网页的可靠性就变的越来越重要。但是,当浏览器出现一些显示内容不正常时,在相关方式中通常需要重新更新浏览器来解决显示不正常的问题。
发明内容
鉴于上述问题,本申请提出了一种网页资源处理方法、装置、电子设备以及存储介质,以改善上述问题。
第一方面,本申请提供了一种网页资源处理方法,应用于客户端,所述方法包括:获取待解析的网页资源;检测所述网页资源是否为目标网页资源;若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源;对所述内容替换后的网页资源进行解析。
第二方面,本申请提供了一种网页资源处理装置,所述装置包括:资源获取单元,用于获取待解析的网页资源;资源检测单元,用于检测所述网页资源是否为目标网页资源;资源处理单元,用于若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源;资源解析单元,用于对所述内容替换后的网页资源进行解析。
第三方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行以实现上述的方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的方法。
本申请提供的一种网页资源处理方法、装置、电子设备以及存储介质,先获取待解析的网页资源,然后检测所述网页资源是否为目标网页资源,若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源,再对所述内容替换后的网页资源进行解析。从而通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种网页资源处理方法所应用的客户端对网页资源处理流程的示意图;
图2示出了本申请实施例提出的一种网页资源处理方法的流程图;
图3示出了本申请再一实施例提出的一种网页资源处理方法的流程图;
图4示出了本申请实施例提出的一种网页资源处理方法中的配置文件中所包括的数据块的示意图;
图5示出了本申请实施例提出的一种网页资源处理方法中用于用户输入更新信息的界面的示意图;
图6示出了本申请另一实施例提出的一种网页资源处理方法的流程图;
图7示出了本申请实施例提出的一种网页资源处理装置的结构框图;
图8示出了本申请再一实施例提出的一种网页资源处理装置的结构框图;
图9示出了本申请另一实施例提出的一种网页资源处理装置的结构框图;
图10示出了本申请实时中的用于执行根据本申请实施例的网页资源处理方法的电子设备的结构框图;
图11示出了本申请实时中的用于保存或者携带实现根据本申请实施例的网页资源处理方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
浏览器是指可以显示网页服务器或者文件系统的Html(Hyper Text MarkupLanguage)文件(标准通用标记语言的一个应用)内容,并让用户与这些文件交互的一种软件。浏览器的主要功能就是向服务器发出请求,在浏览器窗口中展示用户所选择的网络资源。通常这里所说的资源一般是指Html文档,也可以是PDF、图片或其他的类型。资源的位置由用户使用URI(统一资源标符,Uniform Resource Locator)指定。其中,这里的浏览器可以是指单独的浏览器客户端,也可以是其他客户端中支持网页资源展示的浏览器模块。那么本申请中后续所称的客户端可以为浏览器客户端,也可以为具有浏览器模块的客户端。
其中,浏览器的主要组件包括:
用户界面:除了浏览器主窗口显示的你请求的页面外,其他显示的各个部分都属于用户界面。
浏览器引擎:在用户界面和渲染引擎之间传送指令。
渲染引擎:负责显示请求的内容。负责解析代码,并将解析后的内容显示在屏幕上。
网络:用于网络调用,比如HTTP请求。其接口与平台无关,并为所有平台提供底层实现。
用户界面后端:用于绘制基本的窗口小部件,比如组合框和窗口。其公开了与平台无关的通用接口,而在底层使用操作系统的用户界面方法。
JavaScript解释器:用于解析和执行JavaScript代码。
数据存储:这是持久层。浏览器需要在硬盘上保存各种数据,例如Cookie。
而在浏览器的各个组件中,与网页资源最为密切的就是渲染引擎。如图1所示,渲染引擎一开始会从网络层获取请求文档的内容(即图中的网页资源),解析Html文档,并将文档中的标签转化为dom节点树,即”内容树”。同时,它也会解析外部Css文件以及style标签中的样式数据。这些样式信息连同Html中的”可见内容”一道,被用于构建另一棵树——”渲染树(Render树)”。渲染树由一些带有视觉属性(如颜色、大小等)的矩形组成,这些矩形将按照正确的顺序显示在频幕上。
渲染树构建完毕之后,将会进入”布局”处理阶段,即为每一个节点分配一个屏幕坐标。再下一步就是绘制(painting),即遍历render树,并使用UI后端层绘制每个节点。
而发明人在对浏览器的工作过程的研究中发现,现有电子设备(例如,智能手机、平板电脑等)中的浏览器针对用户体验,增加了一些适用电子设备用户的操作或者体验方式。但是不同开发商的开发页面技术层次不一,势必会引起某些电子设备的浏览器显示效果存在差异或者异常,影响用户体验。而在相关的方式中,为了克服不同的开发方式或者开发技术所造成的浏览器无法正常显示网页资源的问题,通常需要对浏览器进行升级更新,对应的浏览器开发者也需要进行更新版本的开发,进而造成极大的资源消耗。
因此,发明人提出了申请中的通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变的网页资源处理方法、装置、电子设备以及存储介质。
下面将结合附图具体描述本申请的各实施例。
请参阅图2,本申请实施例提供的一种网页资源处理方法,应用于客户端,所述方法包括:
步骤S110:获取待解析的网页资源。
在本申请实施例中,客户端可以基于多种方式来获取待解析的网页资源。
作为一种方式,客户端可以基于用户输入的域名来获取待解析的网页资源。在这种方式中,若客户端检测到域名输入区域中输入有域名,然后检测到开始搜索的控件被触发后,即可开始生成并发送一个请求该输入的域名对应的网络资源的网络资源请求。然后将响应该网络资源请求返回的网页资源作为待解析的网页资源。
作为另外一种方式,客户端的界面中显示有一个配置有超链接的文本,例如,该文本对应的超链接为oppo.com,那么当客户端检测到该文本被触控后,即可生成并发送一个请求域名为oppo.com的网络资源的网络资源请求。然后将响应该网络资源请求返回的网页资源作为待解析的网页资源。
需要说明的是,对于一个网络资源请求的响应结果可能会是包括所请求资源的响应数据,可能是包括错误代码的响应数据,也可以会是在指定时间内没有响应数据返回。在这种情况下,当客户端确定获取到的响应数据包括所请求的资源时,判定所述响应结果表征获取成功后,才会将响应该网络资源请求返回的网页资源作为待解析的网页资源。当客户端确定获取到的响应数据包括错误代码或者客户端确定在指定时间内没有响应数据返回的情况下,确定响应结果表征没有获取成功。
此外,在另外的方式中,客户端也可以从本地获取待解析的网页资源。可选的,客户端可以将预先下载的网页资源缓存到本地。那么在这种方式下,客户端可以在访问网页资源时,预先判断本地是否存储有所需请求的网页资源,如果有就先从本地获取。例如,还是以访问超链接为oppo.com为例。若用户触发访问域名为oppo.com的站点的网页资源后,可以先判断本地是否缓存有域名也为oppo.com的网页资源,如果有,就直接将本地缓存的域名为oppo.com的网页资源作为待解析的网页资源。
步骤S120:检测所述网页资源是否为目标网页资源。
可以理解的是,客户端可以不用对每一个所获取的网页资源都进行一次内容替换,而是可以只对部分的网页资源进行内容替换。那么客户端在获取到待解析的网页资源的后,可以进一步的检测该待解析的网页资源是否为需要进行内容替换的目标网页资源。
可选的,客户端可以通过多种方式来检测所述网页资源是否为目标网页资源。作为一种方式,客户端可以通过网页数据的来源确定是否为目标网页资源。例如,客户端可以直接将从网络获取的待解析的网页资源确定为目标网页资源,而将从本地获取的待解析的网页资源确定为非目标网页资源。
可以理解的是,客户端进行内容替换是需要消耗一定的处理资源的,而对于客户端本地缓存的网页资源通常是已经成功显示过的网页资源。例如,当用户需要后续离线阅览时,可能通过操作客户端将当前已经显示的网页资源缓存在本地。对应的,从网络获取的网页资源可能是最新版本的网页资源,那么可能就涉及到与当前的客户端所支持的解析方式不匹配的问题,所以客户端就可以将从网络获取的网页资源作为目标网页资源。进而通过识别待解析的网页资源的来源就可以确定是否为目标网页资源。
步骤S130:若否,将所述待解析的网页资源进行解析。
可以理解的是,对于不是目标网页资源的解析的网页资源可以直接按照图1所示的流程进行解析、渲染以及绘制,进而最终显示在屏幕中。
步骤S131:若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源。
其中,本申请实施例中的网页资源可以网页文件,例如,可以为Html文件。也可以为资源文件,例如,格式为Js、Xml或者Css的资源文件。在为Html文件的情况下,其中的目标内容可以为影响最终显示效果的内容。例如,可以为Js代码、Css代码或者某一个插件的代码。需要说明的是,通常Html文件的Js代码、Css代码可以定义文本内容或者一些图表的显示位置以及占用区域,那么客户端通过对其中的Js代码或者Css代码进行替换就可以改变文本内容或者一些图表的显示位置以及占用区域,以便可以进行适配当前客户端所在的电子设备的屏幕。
对应的,若待解析的网页资源为Js、Xml或者Css的资源文件的情况下,所替换的目标内容为各自文件中的内容。
可以理解的是,在将所述待解析的网页资源中的目标内容替换为指定内容的过程中,所替换得到的指定内容为适配客户端所在电子设备的内容。例如,若待解析的网页资源中有代码为:“hidden;height:0px;width:1000px”,在该代码中定义有宽度为1000px。但是,客户端当前所运行在的电子设备的屏幕宽度为720px,那么若直接运行该实例性的网页资源,那么将会造成所显示的网页资源被非等比例压缩或者或者屏幕的宽度方向上显示一滚动条,进而都会给用户造成较差的阅览效果。那么客户端直接将代码中的“width:1000px”修改为“width:720px”,那么客户端在解析网页资源中的代码时,就会按照720px的宽度分配占位,进而使得网页内容可以等比例缩小以适配户端当前所运行在的电子设备的屏幕宽度。
需要说明的是,在本申请的实施例中,目标内容和指定内容可以为不同的格式的数据内容。例如,目标内容可以为Js代码,而指定内容可以为Css代码,对应的,目标内容可以为Css代码,而指定内容可以为Js代码。进而可以进一步的提升网页资源的内容替换范围,提升内容替换的灵活性,以便可以更加适配性的提升客户端的网页资源解析灵活性和适配性。
可以理解的是,Js在网页的解析过程中是一种阻塞式的解析方式。阻塞加载会阻止浏览器的后续处理,停止了后续的文件的解析,执行,如图像的渲染。而一些Js文件其实是起到一些样式美化效果,那么在这种情况下,可以直接采用Css文件进行替换(Css的加载不会造成解析的阻塞),进而可以使得浏览器不必阻塞解析网页资源,进而提升解析速率。
步骤S140:对所述内容替换后的网页资源进行解析。
可以理解的是,客户端在对网页资源进行解析后即可得到对应的渲染树,进而在进行渲染以及绘制。
本申请提供的一种网页资源处理方法,先获取待解析的网页资源,然后检测所述网页资源是否为目标网页资源,若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源,再对所述内容替换后的网页资源进行解析。从而通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。
请参阅图3,本申请实施例提供的一种网页资源处理方法,应用于客户端,所述方法包括:
步骤S210:对所述客户端进行初始化。
需要说明的是,客户端在启动之初或者在运行出现问题后,可能会对客户端的一些数据进行初始化,以便将客户端的数据恢复到指定状态。
步骤S220:将配置文件加载到所述客户端所分配得到的内存中。
需要说明的是,本实施例中的配置文件存储有需要进行后续内容替换网页资源的标识。那么客户端为了便于后续确认所获取的待解析的网页资源是否为需要进行内容替换的目标网页资源,可以预先将配置文件加载到客户端所分配得到的内存中,作为客户端的全局数据。
其中,作为一种方式,可以通过一个配置文件就存储所有的需要进行内容替换的网页资源的标识。也可以分多个配置文件进行存储。
例如,在一种方式中,可以按照网页资源的类别来分成多个配置文件存储不同类别的网页资源。具体的,可以配置有一个配置文件来存储第一类别的网页资源,可以配置有另一个配置文件来存储第二类别的网页资源,甚至还可以配置有再一个配置文件来存储第三类别的网页资源。需要说明的是,本实施例中的网页类别可以根据其功能进行划分,例如,可以分类为文本展示类网页、视频浏览类网页以及图片浏览类网页等。那么在这种情况下,客户端在加载配置文件的过程中,可以将多个配置文件同时加载到客户端所分配得到的内存中。
此外,作为另外一种方式,可以按照网页的访问量分别配置为多个配置文件。具体的,在进行配置文件生成的过程中,生成服务器可以统计以每个网页资源的域名为唯一性标识统计每个网页资源被访问的频率,然后将访问频率高于指定阈值的网页资源配置在一个配置文件中,而将其他的配置文件配置在另一个配置文件中。那么在这种方式下,客户端可以先将存储有访问频率高于指定阈值的配置文件先加载到客户端所分配得到的内存中。而继续保留另外一个配置文件,即存储有访问频率不高于指定阈值的网页资源的配置文件,存储在磁盘中,从而可以减小在客户端运行过程中对电子设备的内存的占用。
步骤S230:获取待解析的网页资源。
步骤S240:获取所述配置文件。
可以理解的是,在本步骤中客户端是从内存中获取所述配置文件。而基于不同的配置文件的配置方式,客户端对应的也会有不同的配置文件获取方式。
可选的,若客户端识别到配置文件的配置方式为单一配置,即所有的需要进行内容替换的网页资源的标识均存在同一个配置文件的这种方式下,客户端会直接读取内存中的一个配置文件,进而实现获取配置文件。例如,若客户端预先从网络中获取到了配置文件A,那么在将配置文件A写入到客户端所分配得到的内存中,将配置文件中的数据均作为全局数据后,在步骤S240中,客户端会直接从内存中读取配置文件A。
可选的,若客户端识别到配置文件的配置方式为分类配置,那么客户端会先识别当前待解析的网页资源的类别,然后再从内存中读取与当前待解析的网页资源的类别所对应的配置文件。例如,若客户端预先从网络中获取到了配置文件包括配置文件A1、配置文件A2、配置文件A3以及配置文件A4,那么客户端也会同时记录配置文件A1、配置文件A2、配置文件A3以及配置文件A4各自所对应的网页资源分类,并且将配置文件A1、配置文件A2、配置文件A3以及配置文件A4以及各自所对应的网页资源分类对应的存储在内存中,那么当客户端需要获取配置文件时,识别到待解析的网页资源的类型与配置文件A2的类型匹配,那么客户端就会直接获取配置文件A2,从而可以减少查询基础,提升查询效率。
可选的,若客户端识别到配置文件的配置方式为按照网页的访问量配置。那么客户端会先从内存中读取配置文件。然后,从内存中读取的配置文件查找是否记录有与当前的待解析的网页资源的标识匹配的标识,如果没有,则会再次从磁盘中读取另一个配置文件(即前述的存储有访问频率不高于指定阈值的网页资源的配置文件),如果查询到从磁盘中读取另一个配置文件有记录有当前的待解析的网页资源的标识,那么将所述当前待解析的网页资源确认为目标网页资源。并且,同时会将该待解析的网页资源的标识同步到内存中的配置文件中。
例如,若客户端预先从网络中获取到了配置文件包括配置文件B以及配置文件C,其中,配置文件B为记录有访问频率高于指定阈值的网页资源的配置文件,而配置文件C为记录有访问频率不高于指定阈值的网页资源的配置文件。那么客户端在初始化之后,或者在初始化过程中会先将配置文件B加载待内存中,然后会优先在配置文件B中查找是否记录有与当前的待解析的网页资源的标识匹配的标识,如果查询到,当然就直接将所述待解析的网页资源确认为目标网页资源。而如果未查询到,再从存储在磁盘中的配置文件C中查找是否记录有与当前的待解析的网页资源的标识匹配的标识,如果有,就依然将所述待解析的网页资源确认为目标网页资源。并且,将查询到的网页资源的标识从配置文件C中同步到配置文件B中,进而减小在查找过程中从磁盘读取数据的概率。
其中,需要说明的是,客户端中的配置文件为从服务器中获取的,那么服务器中生成配置文件的方式与客户端所获取到的配置文件的配置方式是对应的。即若服务器中的配置方式为单一配置,那么客户端所获取到的配置文件的配置方式也为单一配置。而若服务器中的配置方式为分类配置,那么客户端在获取到的配置文件也为分类配置。而若服务器中的配置方式按照网页的访问量配置,那么客户端在获取到的配置文件也为按照网页的访问量配置。那么在这种方式下,客户端本地可以存储有一个同步文件来记录当前配置文件的配置方式。
可选的,该同步文件可以通过单独专门配置一个文件来作为同步文件,也可以通过复用该客户端的其他文件来作为同步文件。
在这种情况下,客户端在检测到自身被安装后,可以在自己的安装包中的文件中选取任一txt格式的文件,然后在该查找到的txt格式的文件中添加一个变量,进而将该变量的值作为表征配置方式的变量,进而将该被选取的txt格式的文件作为同步文件。通过这种方式,可以在不新增加文件的情况下,利用应用程序本申请的程序配置文件即可实现配置方式的检测。
在这种情况下,为了避免对配置文件原本功能的影响,作为一种方式,可以以注释的方式,将变量添加到查找到的txt格式的文件中。例如,对于txt格式的文件,其中以“//”或者“/*”开头的字符位注释内容。那么在这种情况下,客户端配置的变量为syn的情况下,向txt文件中插入的内容可以为“//syn=1”,即表征基于1所对应的配置方式生成配置文件,而若向txt文件中插入的内容可以为“//syn=2”,即表征基于1所对应的配置方式生成配置文件。
需要说明的是,对于一些应用程序被更新或者重新安装后,其对应的配置文件会被修改或者被其他文件替换掉。那么在这种情况下,若检测到客户端更新后或者重新安装后,客户端可以先检测是否还存在之前选中的txt格式的文件,若存储则进一步的检测更新后的或者重新安装后的应用程序对应的之前被选中的txt中是否还可以读取出之前插入的变量,若读取失败,则重新以前述的方式插入变量。若检测到已经不存在之前选中的txt格式的文件,则重新选择txt文件。
步骤S250:查找所述配置文件中是否记录有所述待解析的网页资源对应的标识。
步骤S260:若没有,将所述待解析的网页资源进行解析。
步骤S270:若有,将所述待解析的网页资源确认为目标网页资源。
步骤S280:将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源。
步骤S290:对所述内容替换后的网页资源进行解析。
作为一种方式,所述配置文件包括多个数据块,每个所述数据块包括对应的目标网页资源的标识、待替换内容以及替代内容。可以理解的是,在配置文件中可以以固定的格式存储每个需要进行内容替换的网页资源的信息,而这个固定格式存储的信息即为一个数据块。如图4所示,在图4中所示的配置文件内容中以<oppobrowser issues="1">开头,并且以</oppobrowser>结尾的内容就可以理解为一个数据块。而另外一个以<oppobrowserissues="2">开头,并且以</oppobrowser>结尾的内容就可以理解为另一个数据块。在数据块中有字段:
1)hostname:表征站点域名
2)uniqueKeyword:唯一关键字,用于表征需要替换的网页资源的链接URL(统一资源定位符),可以理解的是,即使是同一个站点下的网页资源,也会有各自不同的资源定位符。例如下述的两个URL:
https://news.sina.com.cn/gov/xlxw/2019-06-26/doc-ihytcerk9430154.sHtml;
https://news.sina.com.cn/gov/xlxw/2019-06-27/doc-ihytcerk9437854.sHtml。
虽然他们的站点域名都是相同的,即均为news.sina.com.cn,但是他们的资源定位符确实有所差异的,
即一个为“2019-06-26/doc-ihytcerk9430154.sHtml”,
而另一个为“/2019-06-27/doc-ihytcerk9437854.sHtml”。因此,客户端可以通过资源定位符来区分同一个域名站点下的不同网页资源。
3)sourceType:表征替换资源文件类型(Css/Js/Html/JsP等)
4)originalContent:表征资源文件中的内容(即前述的目标内容)
5)replaceContent:表征替换的内容(即前述的指定内容)。
6)contentCount:originalContent在当前资源文件中出现的位置(第几次),默认都是第一次。
在这种方式下,所述查找所述配置文件中是否记录有所述待解析的网页资源对应的标识的步骤包括:从所述多个数据块中查找是否有目标数据块,所述目标数据块所包括的目标网页资源的标识与所述待解析的网页资源对应的标识一致;若有,判定所述配置文件中记录有所述待解析的网页资源对应的标识;
所述将所述待解析的网页资源中的目标内容替换为指定内容的步骤包括:将所述待解析的网页资源中与所述目标数据块所包括的待替换内容匹配的内容作为目标内容;用所述目标数据块所包括的替代内容作为指定内容替换所述目标内容。
需要说明的是,服务器中的配置文件为统一进行配置的,而不同的用户对于相同的内容可能会有所区别喜好。例如,有的用户喜欢标题可以更加醒目,以便自己阅读。而有的用户喜欢不同的类别的文本可以有不同的的展示方式,那么为了便于每个用户都可以由个性化的网页资源编辑方式,所述方法还包括:获取用户配置的新的数据块,所述新的数据块包括用户配置的目标网页资源的标识、待替换内容以及替代内容;基于所述新的数据块对所述配置文件进行更新。
例如,如图5所示,在图5所示的界面中,用户可以根据下拉菜单选择所要替换的标签,即图5中所示的标识,以及该标签所对应的待替换内容以及替代内容。那么可以理解的是,这里的所要替换的标签可以理解为是一种目标网页资源的标识。例如,通常<title>标签是标识的网页资源的标题,那么用户可以将该<title>标签中内容的字体大小以及颜色进行替换,以便可以适应自己的阅读习惯。例如,将<title>标签中的font属性(图5中的待替换内容)的值由3替换为5。当然,对于其中的待替换内容值用户也可以默认不填写,那么在这种方式下,客户端会将<title>标签中所有的font属性的值均替换为5。
本申请提供的一种网页资源处理方法,通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。并且,对于存储有多个数据块的配置文件可以在进行网页资源解析之前就预先进行读取,可以提升后续的网页资源处理的效率。再者,用户还可以根据自己的需要对配置文件中的数据进行更新,使得配置文件可以更佳个性化适配。
请参阅图6,本申请实施例提供的一种网页资源处理方法,应用于客户端,所述方法包括:
步骤S310:获取待解析的网页资源。
步骤S320:检测所述网页资源是否为目标网页资源。
步骤S330:若否,检测所述网页资源是否为目标网页资源。
步骤S331:若是,解析所述网页资源,并对解析过程进行监测。
步骤S340:若监测所述网页资源解析异常,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源。
可以理解的是,在一些网页采用比较新的开发技术进行开发后,如果客户端的版本未跟随更新,那么就可能会出现不兼容的情况,造成客户端无法识别网页资源中的代码,进而造成解析出错。那么作为一种方式,客户端可以在开始解析所述网页资源时,开始监测UI线程是否有阻塞,如果检测到在解析所述网页资源的过程中,UI线程出现有阻塞,那么判定所述网页资源解析异常。然后将解析失败的内容(目标内容)替换为默认内容(指定内容)。其中,默认内容可以为一张默认内容的图片或者一段文字,以提示用户此处的内容展示失败。
步骤S350:对所述内容替换后的网页资源进行解析。
若监测所述网页资源解析正常,对所述解析后的结果进行绘制并显示在屏幕。
本申请提供的一种网页资源处理方法,通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。并且,在解析的过程中,还可以对解析过程进行监测,进而可以及时的发现解析所出现的问题,进而进行内容替换,以便可以及时的向用户展示正常的内容。
请参阅图7,本申请实施例提供的一种网页资源处理装置400,所述装置400包括:
资源获取单元410,用于获取待解析的网页资源。
资源检测单元420,用于检测所述网页资源是否为目标网页资源。
作为一种方式,资源检测单元420,具体用于获取配置文件;查找所述配置文件中是否记录有所述待解析的网页资源对应的标识;若有,将所述待解析的网页资源确认为目标网页资源。
资源处理单元430,用于若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源。
资源解析单元440,用于对所述内容替换后的网页资源进行解析。
在一种方式中,所述配置文件包括多个数据块,每个所述数据块包括对应的目标网页资源的标识、待替换内容以及替代内容。资源检测单元420,具体用于从所述多个数据块中查找是否有目标数据块,所述目标数据块所包括的目标网页资源的标识与所述待解析的网页资源对应的标识一致;若有,判定所述配置文件中记录有所述待解析的网页资源对应的标识。在这种方式下,资源处理单元430,具体用于将所述待解析的网页资源中与所述目标数据块所包括的待替换内容匹配的内容作为目标内容;用所述目标数据块所包括的替代内容作为指定内容替换所述目标内容。
需要说明的是,所述标识包括所述网页资源所属站点的域名以及所述网页资源对应的统一资源定位符中的关键字,所述关键字用于区别同一域名下的不同的统一资源定位符。所述目标内容为Css资源内容或者为Js资源内容,所述指定内容为Css资源内容或者为Js资源内容。
在一种方式中,如图8所示,所述装置400还包括数据更新单元450,用于获取用户配置的新的数据块,所述新的数据块包括用户配置的目标网页资源的标识、待替换内容以及替代内容;基于所述新的数据块对所述配置文件进行更新。
在一种方式中,如图9所示,所述装置400还包括文件加载单元460,用于对所述客户端进行初始化;将所述配置文件加载到所述客户端所分配得到的内存中。
需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
下面将结合图10对本申请提供的一种电子设备进行说明。
请参阅图10,基于上述的网页资源处理方法、装置,本申请实施例还提供的另一种可以执行前述网页资源处理方法的电子设备100。电子设备100包括相互耦合的一个或多个(图中仅示出一个)处理器102、存储器104以及网络模块106。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个处理核。处理器102利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
所述网络模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。所述网络模块106可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。所述网络模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如,网络模块106可以与基站进行信息交互。
请参考图11,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
综上所述,本申请提供的一种网页资源处理方法、装置、电子设备以及存储介质,先获取待解析的网页资源,然后检测所述网页资源是否为目标网页资源,若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源,再对所述内容替换后的网页资源进行解析。从而通过上述方式,使得对于要解析以进行后续展示的网页资源,可以通过内容替换的方式,先在解析之前对网页资源中的部分内容进行替换,从而改变解析后的结果,以便改变最终的显示效果,进而避免只能通过升级显示网页资源的客户端才能克服显示异常的问题,而是通过对待解析的网页资源的内容替换,就可以达到对显示效果的改变。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种网页资源处理方法,其特征在于,所述方法包括:
获取待解析的网页资源;
检测所述网页资源是否为目标网页资源;
若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源;
对所述内容替换后的网页资源进行解析。
2.根据权利要求1所述的方法,其特征在于,所述检测所述网页资源是否为目标网页资源的步骤包括:
获取配置文件;
查找所述配置文件中是否记录有所述待解析的网页资源对应的标识;
若有,将所述待解析的网页资源确认为目标网页资源。
3.根据权利要求2所述的方法,其特征在于,所述配置文件包括多个数据块,每个所述数据块包括对应的目标网页资源的标识、待替换内容以及替代内容,所述查找所述配置文件中是否记录有所述待解析的网页资源对应的标识的步骤包括:
从所述多个数据块中查找是否有目标数据块,所述目标数据块所包括的目标网页资源的标识与所述待解析的网页资源对应的标识一致;
若有,判定所述配置文件中记录有所述待解析的网页资源对应的标识;
所述将所述待解析的网页资源中的目标内容替换为指定内容的步骤包括:
将所述待解析的网页资源中与所述目标数据块所包括的待替换内容匹配的内容作为目标内容;
用所述目标数据块所包括的替代内容作为指定内容替换所述目标内容。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取用户配置的新的数据块,所述新的数据块包括用户配置的目标网页资源的标识、待替换内容以及替代内容;
基于所述新的数据块对所述配置文件进行更新。
5.根据权利要求2所述的方法,其特征在于,所述获取待解析的网页资源的步骤之前还包括:
对所述客户端进行初始化;
将所述配置文件加载到所述客户端所分配得到的内存中。
6.根据权利要求2-5任一所述的方法,其特征在于,所述标识包括所述网页资源所属站点的域名以及所述网页资源对应的统一资源定位符中的关键字,所述关键字用于区别同一域名下的不同的统一资源定位符。
7.根据权利要求1-5任一所述的方法,其特征在于,所述目标内容为Css资源内容或者为Js资源内容,所述指定内容为Css资源内容或者为Js资源内容。
8.一种网页资源处理装置,其特征在于,所述装置包括:
资源获取单元,用于获取待解析的网页资源;
资源检测单元,用于检测所述网页资源是否为目标网页资源;
资源处理单元,用于若是,将所述待解析的网页资源中的目标内容替换为指定内容,得到内容替换后的网页资源;
资源解析单元,用于对所述内容替换后的网页资源进行解析。
9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行以实现权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-7任一所述的方法。
CN201910740904.0A 2019-08-12 2019-08-12 网页资源处理方法、装置、电子设备以及存储介质 Pending CN110502713A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910740904.0A CN110502713A (zh) 2019-08-12 2019-08-12 网页资源处理方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910740904.0A CN110502713A (zh) 2019-08-12 2019-08-12 网页资源处理方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN110502713A true CN110502713A (zh) 2019-11-26

Family

ID=68586473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910740904.0A Pending CN110502713A (zh) 2019-08-12 2019-08-12 网页资源处理方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN110502713A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114329265A (zh) * 2021-12-29 2022-04-12 中国人民解放军国防科技大学 一种自动采集网络资源的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663126A (zh) * 2012-04-23 2012-09-12 奇智软件(北京)有限公司 一种在移动终端中显示网页的方法及装置
KR101443071B1 (ko) * 2013-12-10 2014-09-22 주식회사 브이시스템즈 웹페이지의 에러 체크 시스템
CN108090069A (zh) * 2016-11-22 2018-05-29 北京神州泰岳软件股份有限公司 一种在浏览器中显示网页资源的方法和装置
CN108376161A (zh) * 2018-02-13 2018-08-07 广东欧珀移动通信有限公司 显示网页的方法、装置、终端及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663126A (zh) * 2012-04-23 2012-09-12 奇智软件(北京)有限公司 一种在移动终端中显示网页的方法及装置
KR101443071B1 (ko) * 2013-12-10 2014-09-22 주식회사 브이시스템즈 웹페이지의 에러 체크 시스템
CN108090069A (zh) * 2016-11-22 2018-05-29 北京神州泰岳软件股份有限公司 一种在浏览器中显示网页资源的方法和装置
CN108376161A (zh) * 2018-02-13 2018-08-07 广东欧珀移动通信有限公司 显示网页的方法、装置、终端及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114329265A (zh) * 2021-12-29 2022-04-12 中国人民解放军国防科技大学 一种自动采集网络资源的方法

Similar Documents

Publication Publication Date Title
US11372935B2 (en) Automatically generating a website specific to an industry
US20190251143A1 (en) Web page rendering method and related device
US20160283499A1 (en) Webpage advertisement interception method, device and browser
US20190034441A1 (en) Digital communications platform for webpage overlay
US9311283B2 (en) System for clipping webpages by traversing a dom, and highlighting a minimum number of words
US20180191798A1 (en) Methods and systems for server-side rendering of native content for presentation
US20090019386A1 (en) Extraction and reapplication of design information to existing websites
US20130326333A1 (en) Mobile Content Management System
US20210149842A1 (en) System and method for display of document comparisons on a remote device
CN104834753A (zh) 生成网页截图的方法及其装置
CN104035753A (zh) 一种双WebView展示定制页面的方法及系统
EP2987088A2 (en) Client side page processing
JP2004510254A (ja) ネットワークサーバ
US20130007586A1 (en) Method and system for creating and using web feed display templates
CN112100550A (zh) 一种页面构建方法和装置
US20150254219A1 (en) Method and system for injecting content into existing computerized data
CN108595697B (zh) 网页集成方法、装置及系统
CN113238741A (zh) 表单配置方法、装置、电子设备及存储介质
US20170109442A1 (en) Customizing a website string content specific to an industry
CN110245069A (zh) 页面版本的测试方法和装置、页面的展示方法和装置
CN110968314B (zh) 一种页面生成方法及装置
CN112631591B (zh) 表元素联动方法、装置、设备与计算机可读存储介质
US20190392024A1 (en) Digital Content Editing of a Document Object Model (DOM)
US20140337709A1 (en) Method and apparatus for displaying web page
CN110502713A (zh) 网页资源处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191126