CN113721923B - 一种网页代码优化方法、装置、电子设备及存储介质 - Google Patents

一种网页代码优化方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113721923B
CN113721923B CN202111028001.3A CN202111028001A CN113721923B CN 113721923 B CN113721923 B CN 113721923B CN 202111028001 A CN202111028001 A CN 202111028001A CN 113721923 B CN113721923 B CN 113721923B
Authority
CN
China
Prior art keywords
file
codes
css
files
deleting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111028001.3A
Other languages
English (en)
Other versions
CN113721923A (zh
Inventor
邹长生
彭璐婷
徐明礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Original Assignee
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Topsec Technology Co Ltd, Beijing Topsec Network Security Technology Co Ltd, Beijing Topsec Software Co Ltd filed Critical Beijing Topsec Technology Co Ltd
Priority to CN202111028001.3A priority Critical patent/CN113721923B/zh
Publication of CN113721923A publication Critical patent/CN113721923A/zh
Application granted granted Critical
Publication of CN113721923B publication Critical patent/CN113721923B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/443Optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/38Creation or generation of source code for implementing user interfaces

Abstract

本申请涉及一种网页代码优化方法、装置、电子设备及存储介质,属于计算机技术领域。该网页代码优化方法包括:获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件;删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。本申请实施例中,通过获取待优化网站的Web(网页)根目录,这样就可以实现对整个目录下的文件进行优化,避免了针对单文件优化时,当单文件较多时存在操作步骤繁琐,并且容易遗漏待优化文件的问题。

Description

一种网页代码优化方法、装置、电子设备及存储介质
技术领域
本申请属于计算机技术领域,具体涉及一种网页代码优化方法、装置、电子设备及存储介质。
背景技术
随着Web技术的发展,基于前端框架和插件进行开发的网站越来越多,然而框架和插件中有很多CSS(Cascading Style Sheets,层叠样式表)代码和JS(JavaScript)代码并未被网页所引用,使得CSS无效代码和JavaScript无效代码堆积,文件加载缓慢,严重影响网页加载速度。
现有的网页优化方法中,局限于对单页面或单文件的逐个清除,操作步骤繁琐,容易遗漏待优化的页面或者文件。
发明内容
鉴于此,本申请的目的在于提供一种网页代码优化方法、装置、电子设备及存储介质,以改善现有当单文件较多时存在操作步骤繁琐,并且容易遗漏待优化文件的问题。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供了一种网页代码优化方法,包括:获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件;删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。本申请实施例中,通过获取待优化网站的Web(网页)根目录,这样就可以实现对整个目录下的文件进行优化,避免了针对单文件优化时,当单文件较多时存在操作步骤繁琐,并且容易遗漏待优化文件的问题,同时,在删除CSS文件中无效代码时,只删除未被HTML文件下的HTML代码引用,且在JS文件下的JS代码中未动态创建元素的CSS代码,这样能避免误删除。
结合第一方面实施例的一种可能的实施方式,所述方法还包括:删除所述JS文件中的无效代码。本申请实施例中,通过删除JS文件中的无效代码来进一步优化网页代码,提高网页的加载速度。
结合第一方面实施例的一种可能的实施方式,删除所述JS文件中的无效代码,包括:提取所述JS文件下的JS代码中的监听事件和函数;遍历提取到的监听事件,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的事件代码;遍历提取到的函数,删除其中未被HTML代码调用,且未被JS代码调用的函数的函数代码。本申请实施例中,在删除无效代码时,通过JS文件下的JS代码中的监听事件和函数,然后删除其中未被HTML代码引用,且在JS代码中未动态创建元素的事件代码,删除其中未被HTML代码调用,且未被JS代码调用的函数的函数代码,这样便可将JS文件下的无效代码尽可能的清除。
结合第一方面实施例的一种可能的实施方式,删除所述JS文件中的无效代码包,包括:从获取到的JS文件中删除其中无效的JS文件;删除剩余的JS文件中的无效代码。本申请实施例中,先从获取到的JS文件中删除其中无效的JS文件,然后再删除剩余的JS文件中的无效代码,这样在删除JS文件中的无效JS代码时,不必再对无效的JS文件进行遍历,可以节省匹配时间,从而提高处理速度。
结合第一方面实施例的一种可能的实施方式,从获取到的JS文件中删除其中无效的JS文件,包括:遍历获取到的JS文件,通过正则表达式在所述HTML文件下的HTML代码和所述JS文件下的JS代码中查找未被引用的无效JS文件;将查找到的未被引用的无效JS文件删除。本申请实施例中,通过正则表达式在HTML代码和JS代码中查找获取到的JS文件中未被引用的无效JS文件,将查找到的未被引用的无效JS文件删除,这样可以快速删除其中无效的JS文件。
结合第一方面实施例的一种可能的实施方式,删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,包括:提取所述CSS文件下的CSS代码中的选择器名称;遍历提取到的选择器名称,删除其中未被所述HTML代码引用,且在JS代码中未动态创建元素的选择器代码。本申请实施例中,通过提取CSS代码中的选择器名称,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的选择器代码,这样在避免误删除的同时,可以尽可能的将无效的CSS代码删除。
结合第一方面实施例的一种可能的实施方式,删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码包括:从获取到的CSS文件中删除其中无效的CSS文件;删除剩余的CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码。本申请实施例中,先从获取到的CSS文件中删除其中无效的CSS文件,然后再删除剩余的CSS文件中的无效代码,这样在删除CSS文件中的无效CSS代码时,不必再对无效的CSS文件进行遍历,可以节省匹配时间,从而提高处理速度。
第二方面,本申请实施例还提供了一种网页代码优化装置,包括:获取模块、优化模块;获取模块,用于获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件;优化模块,用于删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
第三方面,本申请实施例还提供了一种电子设备,包括:存储器和处理器,所述处理器与所述存储器连接;所述存储器,用于存储程序;所述处理器,用于调用存储于所述存储器中的程序,以执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本申请的主旨。
图1示出了本申请实施例提供的一种网页代码优化方法的流程示意图。
图2示出了本申请实施例提供的一种从获取到的CSS文件中删除其中无效的CSS文件的流程示意图。
图3示出了本申请实施例提供的又一种网页代码优化方法的流程示意图。
图4示出了本申请实施例提供的一种网页代码优化装置的模块示意图。
图5示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
再者,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请实施例提供了一种网页代码优化方法,在进行网页代码优化时,不再是局限于对单页面或单文件的代码进行优化,而是通过获取待优化网站的Web(网页)根目录,这样就可以实现对整个目录下的文件进行优化,避免了针对单文件优化时,当单文件较多时存在操作步骤繁琐,并且容易遗漏待优化文件的问题。下面将结合图1,对本申请实施例提供的网页代码优化方法进行说明。
S1:获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件。
当需要对某个网站的代码进行优化时,获取待优化网站的Web根目录(包含多个网页)中的HTML(Hyper Text Markup Language,超文本标记语言)文件、CSS(CascadingStyle Sheets,层叠样式表)文件、JS(JavaScript)文件。
其中,在获取HTML文件、CSS文件、JS文件时,是针对整个Web根目录,这样就可以获取整个Web根目录下包含的所有网页的取HTML文件、CSS文件、JS文件,从而提高优化效率,避免遗漏待优化文件的问题。
可以通过递归读取待优化网站的Web根目录,通过判断文件后缀为html或者为htm,从而获取到HTML文件;通过判断文件后缀为css,从而获取到CSS文件;通过判断文件后缀为js,从而获取到JS文件。在判断文件后缀的过程中,忽略后缀名称的大小写。
S2:删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
在获取到HTML文件、CSS文件、JS文件后,便可从获取到的CSS文件进行优化,一种实施方式下,可以是删除CSS文件中未被HTML文件下的HTML代码引用,且在JS文件下的JS代码中未动态创建元素的CSS代码,也即删除CSS文件中无效的CSS代码,从而得到删除冗余代码之后的Web根目录。针对获取到每个CSS文件,删除该CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码,这样便可得到删除冗余代码之后的Web根目录。
一种可选实施方式下,在删除CSS文件中无效的CSS代码时,也即在除CSS文件中未被HTML文件下的HTML代码引用,且在JS文件下的JS代码中未动态创建元素的CSS代码时,可以通过提取CSS文件下的CSS代码中的选择器名称,通过遍历提取到的选择器名称,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的选择器代码,从而实现删除CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码。通过遍历CSS文件,通过正则表达式对每个CSS文件下的CSS代码进行选择器名称的提取,遍历提取到的选择器名称,对在HTML代码中未引用,并且在JS代码中未动态创建元素的选择器进行删除,这样可以避免对于通过JS动态创建的元素,造成误删除的问题。
一种可选实施方式下,删除CSS文件中未被HTML文件下的HTML代码引用,且在JS文件下的JS代码中未动态创建元素的CSS代码的过程可以是:首先从获取到的CSS文件中删除其中无效的CSS文件,然后再删除剩余的CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码,这样在删除CSS文件中的无效CSS代码时,不必再对无效的CSS文件进行遍历,可以节省匹配时间,从而提高处理速度。在该种实施方式下,需要先从获取到的CSS文件中删除其中无效的CSS文件,再从剩余的CSS文件中删除其中无效的CSS代码。其中,删除剩余的CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码与前述删除CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码的过程一致。
一种实施方式下,从获取到的CSS文件中删除其中无效的CSS文件的过程可以参阅图2所示。
S21:遍历获取到的CSS文件,通过正则表达式在所述HTML文件下的HTML代码和所述JS文件下的JS代码中查找未被引用的无效CSS文件。
在获取到HTML文件、CSS文件、JS文件后,便可从获取到的CSS文件中删除无效的CSS文件,一种实施方式下,可以是通过遍历获取到的CSS文件,通过正则表达式在HTML文件下的HTML代码和JS文件下的JS代码中查找未被引用的无效CSS文件,也即通过正则表达式在HTML代码和JS代码中查找获取到的CSS文件中未被引用的无效CSS文件。
S22:将查找到的未被引用的无效CSS文件删除,得到删除冗余代码之后的Web根目录。
在将查找到的未被引用的无效CSS文件删除,保留剩余的CSS文件。
其中,在进行网页代码优化时,除了删除无效的CSS文件或者CSS文件中的无效CSS代码外,还可以删除其中冗余的JS代码。一种可选实施方式下,所述方法还包括:删除JS文件中的无效代码。通过遍历获取到的JS文件,删除其中无效的代码。
一种可选实施方式下,删除JS文件中的无效代码的过程可以是:提取JS文件下的JS代码中的监听事件和函数;遍历提取到的监听事件,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的事件代码;遍历提取到的函数,删除其中未被HTML代码调用,且未被JS代码调用的函数的函数代码。遍历获取到的JS文件,通过正则表达式提取JS文件下JS代码中的监听事件和函数。遍历提取到的监听事件和函数,对于在HTML代码中未引用,并且在JS代码中未动态创建的元素,删除该元素的事件代码。对于在HTML代码和JS代码中均未调用的函数,删除该函数代码,实现了清除无效JS代码的目的。
一种实施方式下,删除JS文件中的无效代码的过程可以是:先从获取到的JS文件中删除其中无效的JS文件,然后再删除剩余的JS文件中的无效代码。这样可以提高删除JS文件中的无效代码的速度。删除剩余的JS文件中的无效代码的过程与前述删除JS文件中的无效代码的过程一致。
一种实施方式下,从获取到的JS文件中删除其中无效的JS文件的过程可以是:遍历获取到的JS文件,通过正则表达式在HTML文件下的HTML代码和JS文件下的JS代码中查找未被引用的无效JS文件,将查找到的未被引用的无效JS文件删除。也即通过正则表达式在HTML代码和JS代码中查找获取到的JS文件中未被引用的无效JS文件,将查找到的未被引用的无效JS文件删除,即可实现从获取到的JS文件中删除其中无效的JS文件。
一种实施方式下,网页代码优化方法的流程示意图可以如图3所示:获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件,删除其中无效的CSS文件、JS文件,删除剩余JS文件中的无效代码,删除剩余CSS文件中的无效代码,从而得到删除冗余代码之后的Web根目录,删除冗余代码之后的Web根目录中的CSS文件和JS文件的大小相对于删除之前文件的大小会小很多,从而降低网页加载文件的时间,进而提升网页加载速度。
本申请实施例还提供了一种网页代码优化装置100,如图4所示,该网页代码优化装置100,包括:获取模块110、优化模块120。
获取模块110,用于获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件。
优化模块120,用于删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
可选地,优化模块120,用于提取所述CSS文件下的CSS代码中的选择器名称;遍历提取到的选择器名称,删除其中未被所述HTML代码引用,且在JS代码中未动态创建元素的选择器代码。
可选地,优化模块120,用于从获取到的CSS文件中删除其中无效的CSS文件;删除剩余的CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码。
可选地,优化模块120,还用于删除所述JS文件中的无效代码。
可选地,优化模块120,用于提取所述JS文件下的JS代码中的监听事件和函数;遍历提取到的监听事件,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的事件代码;遍历提取到的函数,删除其中未被HTML代码调用,且未被JS代码调用的函数的函数代码。
可选地,优化模块120,用于从获取到的JS文件中删除其中无效的JS文件;删除剩余的JS文件中的无效代码。
可选地,优化模块120,用于遍历获取到的JS文件,通过正则表达式在所述HTML文件下的HTML代码和所述JS文件下的JS代码中查找未被引用的无效JS文件;将查找到的未被引用的无效JS文件删除。
本申请实施例所提供的网页代码优化装置100,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
如图5所示,图5示出了本申请实施例提供的一种电子设备200的结构框图。所述电子设备200包括:收发器210、存储器220、通讯总线230以及处理器240。
所述收发器210、所述存储器220、处理器240各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线230或信号线实现电性连接。其中,收发器210用于收发数据。存储器220用于存储计算机程序,如存储有图4中所示的软件功能模块,即网页代码优化装置100。其中,网页代码优化装置100包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器220中或固化在所述电子设备200的操作系统(Operating System,OS)中的软件功能模块。所述处理器240,用于执行存储器220中存储的可执行模块,例如网页代码优化装置100包括的软件功能模块或计算机程序。例如,处理器240,用于获取待优化网站的Web根目录中的HTML文件、CSS文件、JS文件;删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
其中,存储器220可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器240可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器240也可以是任何常规的处理器等。
其中,上述的电子设备200,包括但不限于计算机,如计算机可以是服务器。
本申请实施例还提供了一种非易失性的计算机可读取存储介质(以下简称存储介质),该存储介质上存储有计算机程序,该计算机程序被计算机如上述的电子设备200运行时,执行上述所示的网页代码优化方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,或者电子设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种网页代码优化方法,其特征在于,包括:
获取待优化网站的Web根目录包含的所有网页中的HTML文件、CSS文件、JS文件;
删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
删除所述JS文件中的无效代码。
3.根据权利要求2所述的方法,其特征在于,删除所述JS文件中的无效代码,包括:
提取所述JS文件下的JS代码中的监听事件和函数;
遍历提取到的监听事件,删除其中未被HTML代码引用,且在JS代码中未动态创建元素的事件代码;
遍历提取到的函数,删除其中未被HTML代码调用,且未被JS代码调用的函数的函数代码。
4.根据权利要求2所述的方法,其特征在于,删除所述JS文件中的无效代码包,包括:
从获取到的JS文件中删除其中无效的JS文件;
删除剩余的JS文件中的无效代码。
5.根据权利要求4所述的方法,其特征在于,从获取到的JS文件中删除其中无效的JS文件,包括:
遍历获取到的JS文件,通过正则表达式在所述HTML文件下的HTML代码和所述JS文件下的JS代码中查找未被引用的无效JS文件;
将查找到的未被引用的无效JS文件删除。
6.根据权利要求1所述的方法,其特征在于,删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,包括:
提取所述CSS文件下的CSS代码中的选择器名称;
遍历提取到的选择器名称,删除其中未被所述HTML代码引用,且在JS代码中未动态创建元素的选择器代码。
7.根据权利要求1-6中任一项所述的方法,其特征在于,删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码包括:
从获取到的CSS文件中删除其中无效的CSS文件;
删除剩余的CSS文件中未被HTML代码引用,且在JS代码中未动态创建元素的CSS代码。
8.一种网页代码优化装置,其特征在于,包括:
获取模块,用于获取待优化网站的Web根目录包含的所有网页中的HTML文件、CSS文件、JS文件;
优化模块,用于删除所述CSS文件中未被所述HTML文件下的HTML代码引用,且在所述JS文件下的JS代码中未动态创建元素的CSS代码,得到删除冗余代码之后的Web根目录。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述处理器与所述存储器连接;
所述存储器,用于存储程序;
所述处理器,用于调用存储于所述存储器中的程序,以执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器运行时,执行如权利要求1-7中任一项所述的方法。
CN202111028001.3A 2021-09-02 2021-09-02 一种网页代码优化方法、装置、电子设备及存储介质 Active CN113721923B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111028001.3A CN113721923B (zh) 2021-09-02 2021-09-02 一种网页代码优化方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111028001.3A CN113721923B (zh) 2021-09-02 2021-09-02 一种网页代码优化方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113721923A CN113721923A (zh) 2021-11-30
CN113721923B true CN113721923B (zh) 2023-10-13

Family

ID=78681117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111028001.3A Active CN113721923B (zh) 2021-09-02 2021-09-02 一种网页代码优化方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113721923B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218395A (zh) * 2013-03-04 2013-07-24 星云融创(北京)信息技术有限公司 页面压缩方法和系统
CN103336812A (zh) * 2013-06-27 2013-10-02 优视科技有限公司 用于提高二次加载效率的网页资源缓存方法及装置
CN103500118A (zh) * 2013-10-24 2014-01-08 北京奇虎科技有限公司 一种级联样式表优化方法和装置
WO2015196442A1 (zh) * 2014-06-27 2015-12-30 华为技术有限公司 一种网页优化的设备及方法
CN111045684A (zh) * 2019-12-18 2020-04-21 深圳前海环融联易信息科技服务有限公司 Css代码冗余检测优化方法与装置和设备及存储介质
CN111857898A (zh) * 2019-04-25 2020-10-30 京东数字科技控股有限公司 网页地址选择组件的显示方法、装置、存储介质及终端

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0623912D0 (en) * 2006-11-30 2007-01-10 Bayne Duncan J Improved electronic form software and brower programming methods
US10303760B2 (en) * 2014-04-17 2019-05-28 Entit Software Llc Cascading style sheet meta language performance

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218395A (zh) * 2013-03-04 2013-07-24 星云融创(北京)信息技术有限公司 页面压缩方法和系统
CN103336812A (zh) * 2013-06-27 2013-10-02 优视科技有限公司 用于提高二次加载效率的网页资源缓存方法及装置
CN103500118A (zh) * 2013-10-24 2014-01-08 北京奇虎科技有限公司 一种级联样式表优化方法和装置
WO2015196442A1 (zh) * 2014-06-27 2015-12-30 华为技术有限公司 一种网页优化的设备及方法
CN105393247A (zh) * 2014-06-27 2016-03-09 华为技术有限公司 一种网页优化的设备及方法
CN111857898A (zh) * 2019-04-25 2020-10-30 京东数字科技控股有限公司 网页地址选择组件的显示方法、装置、存储介质及终端
CN111045684A (zh) * 2019-12-18 2020-04-21 深圳前海环融联易信息科技服务有限公司 Css代码冗余检测优化方法与装置和设备及存储介质

Also Published As

Publication number Publication date
CN113721923A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
US9448999B2 (en) Method and device to detect similar documents
US20140059423A1 (en) Display of Hypertext Documents Grouped According to Their Affinity
US20120078874A1 (en) Search Engine Indexing
US8756215B2 (en) Indexing documents
CN104516982A (zh) 一种基于Nutch的Web信息提取方法和系统
Huston et al. Efficient indexing of repeated n-grams
US9350823B2 (en) Identifying properties of a communication device
US10482175B2 (en) Identifying properties of a communication device
CN105653697B (zh) 一种推荐词检索方法及系统
CN111782907B (zh) 新闻分类方法、装置及电子设备
WO2017063596A1 (zh) 一种处理网站地图的方法、装置及设备
CN114817811B (zh) 一种网站解析方法和装置
CN105975599B (zh) 一种监测网站的页面埋点的方法和装置
CN111125485A (zh) 基于Scrapy的网站URL爬取方法
CN113721923B (zh) 一种网页代码优化方法、装置、电子设备及存储介质
CN108153741B (zh) 基于多语言高效数据采集方法、计算机程序
CN103914479A (zh) 资源请求的匹配方法和装置
CN106021582B (zh) 位置信息过滤的方法、提取有效网页信息的方法及装置
Wang et al. A novel web page text information extraction method
CN108090128B (zh) 一种合并存储空间回收方法、装置及电子设备
US10380195B1 (en) Grouping documents by content similarity
CN106095854B (zh) 一种确定信息块的位置信息的方法及装置
WO2015049719A1 (ja) ストレージシステム及びストレージ方法
CN109145220B (zh) 数据处理方法、装置及电子设备
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant