CN115982499A - 页面的保存方法、装置、设备及存储介质 - Google Patents

页面的保存方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115982499A
CN115982499A CN202211684585.4A CN202211684585A CN115982499A CN 115982499 A CN115982499 A CN 115982499A CN 202211684585 A CN202211684585 A CN 202211684585A CN 115982499 A CN115982499 A CN 115982499A
Authority
CN
China
Prior art keywords
webpage
target
address
saving
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211684585.4A
Other languages
English (en)
Other versions
CN115982499B (zh
Inventor
石文良
郭超
方绪鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronics Industry Engineering Co ltd
Secworld Information Technology Beijing Co Ltd
Original Assignee
China Electronics Industry Engineering Co ltd
Secworld Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronics Industry Engineering Co ltd, Secworld Information Technology Beijing Co Ltd filed Critical China Electronics Industry Engineering Co ltd
Priority to CN202211684585.4A priority Critical patent/CN115982499B/zh
Publication of CN115982499A publication Critical patent/CN115982499A/zh
Application granted granted Critical
Publication of CN115982499B publication Critical patent/CN115982499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本申请是关于一种页面的保存方法、装置、设备及存储介质。该方法首先接收鉴定保存指令;然后根据所述鉴定保存指令确定目标浏览器;之后调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;最后至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的网页资源的网页格式。本申请提供的方案,能够在鉴定服务过程中能够自动保存页面的全部资源,减少了工程师的操作流程,提高了工作效率。

Description

页面的保存方法、装置、设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及页面的保存方法、装置、设备及存储介质。
背景技术
鉴定服务工程师的工作内容之一是对案件数据进行取证、鉴定、分析。
在日常鉴定工作中,如果需要对客户指定的网站的页面进行保存,相关技术中能够通过脚本将页面保存为html格式的文件。
然而,如果需要将页面中的全部资源或者说全部元素,例如样式、多媒体等内容一并保存时,由于html格式的文件并不包括样式、脚本等资源,因此需要鉴定服务工程师手动保存为能够展现全部资源的格式的文件。
可见,相关技术中,如果需要保存页面的全部资源时,需要手动操作,保存流程复杂,工作效率低。
发明内容
为克服相关技术中存在的问题,本申请提供一种页面的保存方法、装置、设备及存储介质,该方法能够自动保存页面的全部资源,减少了工程师的操作流程,提高了工作效率。
本申请第一方面提供一种页面的保存方法,包括:
接收鉴定保存指令;
根据所述鉴定保存指令确定目标浏览器;
调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;
解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;
至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的全部网页资源的网页格式。
在一些实施例中,所述根据所述鉴定保存指令确定目标浏览器包括:
调用目标代码库中的目标驱动代码;
加载所述目标驱动代码;
确定所述鉴定保存指令中的浏览器标识;
根据所述浏览器标识查找所述目标驱动代码中对应的浏览器作为目标浏览器。
在一些实施例中,所述调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址包括:
解析所述鉴定保存指令对应的网页地址;
调用所述目标代码库中的页面加载函数;所述页面加载函数用于将所述页面地址加载到所述目标浏览器的地址栏中。
在一些实施例中,所述解析所述网页地址对应的网页资源包括:
加载所述目标代码库中的开发命令代码;
执行所述开发命令代码解析所述网页地址对应网页的网页资源;所述网页资源还包括网页的结构。
在一些实施例中,所述至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件包括:
解析所述鉴定保存指令对应的保存地址;
依据所述网页的结构将所述网页的样式以及所述网页的脚本封装为MHTML格式的文件;
将所述MHTML格式的文件保存到所述保存地址中。
在一些实施例中,所述鉴定保存指令为特定编程语言的脚本生成的。
在一些实施例中,所述鉴定保存指令中对应的网页地址包括:链接列表中记录的多个网页地址。
本申请第二方面提供一种页面的保存装置,包括:
接收模块,用于接收鉴定保存指令;
确定模块,用于根据所述鉴定保存指令确定目标浏览器;
调用模块,用于调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;
解析模块,用于解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;
保存模块,用于至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的全部网页资源的网页格式。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的一种页面的保存方法首先接收鉴定保存指令;然后根据所述鉴定保存指令确定目标浏览器;之后调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;最后至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的网页资源的网页格式。本申请提供的方案,能够在鉴定服务过程中能够自动保存页面的全部资源,减少了工程师的操作流程,提高了工作效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的一种页面的保存方法的流程示意图。
图2是本申请实施例示出的一种页面的保存方法中根据鉴定保存指令确定目标浏览器的流程示意图。
图3是本申请实施例示出的一种页面的保存方法中调用目标浏览器打开鉴定保存指令中对应的网页地址的流程示意图。
图4是本申请实施例示出的一种页面的保存方法中解析网页地址对应的网页资源的流程示意图。
图5是本申请实施例示出的一种页面的保存方法中保存为目标格式的文件的流程示意图。
图6是本申请实施例示出的一种页面的保存装置的结构示意图。
图7是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的优选实施方式。虽然附图中显示了本申请的优选实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本申请实施例主要应用鉴定服务的场景中,当用户需要对某个网站的页面进行固定时,若需要将网页的全部资源如脚本、样式等信息一并保存时,需要鉴定服务工程师手动保存,尤其是需要保存的页面较多时,工作效率很低下。
针对上述问题,本申请实施例提供一种页面的保存方法,能够无需手动保存,实现完全自动化的存储。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的一种页面的保存方法的流程示意图。
参见图1,本申请公开的一种页面的保存方法包括:
S100、接收鉴定保存指令。
本申请实施例中,执行主体可以是鉴定服务工程师所使用的电子设备的处理装置,也可以是云服务器的处理装置,只要能够实现本申请方法的流程的处理装置即可,再此不进行具体限定。
本申请实施例中,鉴定保存指令可以是特定编程语言的脚本生成的。其中,特定编程语言例如python语言。鉴定保存指令可以用于表征需要对网页进行保存。
本申请实施例中,鉴定保存指令可以通过特定方式触发,例如,当固定过程中,确定出目标网页是需要进行固定的指定页面时,自动触发鉴定保存指令。其中,确定目标网页是指定网页的过程可以是通过设置指定页面中包括元素的内容来进行匹配,当匹配度大于预设值时,确定网页为与指定网页相关联的目标网页。
可以理解的是,本申请实施例中,已经安装了能够执行相关语言的系统环境,能够支持特定语言的执行。
S101、根据鉴定保存指令确定目标浏览器。
本申请实施例中,如果要保存页面,需要先指定目标浏览器。例如,目标浏览器为Chrome浏览器。其中,目标浏览器具有保存页面的全部资源的功能。当然,如果目标浏览器支持保存
可以理解的是,鉴定保存指令中可以携带有目标浏览器的标识。
S102、调用目标浏览器打开鉴定保存指令中对应的网页地址。
本申请实施例中,鉴定保存指令可以对应有多个网页地址,也可以携带有一个网页地址。其中,多个网页地址可以是链接列表中记录的多个网页地址。对于链接列表中的每一个网页地址,可以分别执行本申请实施例中步骤103到步骤104的过程。
S103、解析网页地址对应网页的网页资源;其中,网页资源至少包括网页的样式、网页的脚本。
本申请实施例中,网页资源可以包括有网页的样式,如css样式,脚本数据,如java脚本,多媒体数据,如音视频;当然,还应当包括网页的文字和图片等基本资源。
本申请实施例中,可以对网页地址的网页进行解析,能够解析出该网页所包括的全部资源。
S104、至少将网页的样式以及网页的脚本保存为目标格式的文件;其中,目标格式用于表征能够展现网页的全部网页资源的网页格式。
本申请实施例中,能够将网页的资源自动保存为目标格式的文件。例如MHTML格式的文件。其中,目标格式的文件能够通过目标浏览器打开,进而呈现出原本网页中所展现的全部资源,并能够执行网页的脚本对应的功能。
通过上述实施例可以看出,本申请实施例,可以自动将网页保存为目标格式的文件,无需鉴定服务工程师手动操作,减少了用户的操作步骤,提高了工作效率。
在一些实施例中,如图2,图2是本申请实施例示出的一种页面的保存方法中根据鉴定保存指令确定目标浏览器的流程示意图。
根据鉴定保存指令确定目标浏览器包括:
S201、调用目标代码库中的目标驱动代码。
S202、加载目标驱动代码。
S203、确定鉴定保存指令中的浏览器标识。
S204、根据浏览器标识查找目标驱动代码中对应的浏览器作为目标浏览器。
本申请实施例中,通过鉴定保存指令可以自动确定出目标浏览器的类型。可以首先调用目标代码库中的目标驱动代码。
其中,目标代码库可以是第三方代码库,也可以是鉴定服务领域中所设置的特定的代码库。目标代码库可以是例如Python的相关代码库。
目标驱动代码可以携带有浏览器标识,通过浏览器标识可以对应出目标浏览器的类型。
实际使用中,可以使用Python语言例如,driver=webdrive.chrom()作为目标驱动代码。其中Chrome为目标浏览器的标识。当然,可以根据实际需要设置成其他内核的浏览器。
本申请实施例中,能够自动加载目标驱动代码,进而确定出其对应的浏览器标识,并通过浏览器标识来确定出目标浏览器。
可以理解的是,如果当前主机并未安装目标浏览器,还可以包括:
调用鉴定保存指令对应的目标浏览器安装包,安装目标浏览器。
本申请实施例中,能够自动安装所需要的浏览器,便于后续流程中的网页保存。
本申请实施例中,目标代码库可以是例如鉴定服务工程师实时指定的。例如,步骤102执行时,可以弹出用于指示目标浏览器的输入框,鉴定服务工程师能够根据需要,输入浏览器的类型,来实现对目标浏览器的指定。提高了保存网页的灵活性。
如图3,图3是本申请实施例示出的一种页面的保存方法中调用目标浏览器打开鉴定保存指令中对应的网页地址的流程示意图。
本申请实施例中,调用目标浏览器打开鉴定保存指令中对应的网页地址包括:
S301、解析鉴定保存指令对应的网页地址;
S302、调用目标代码库中的页面加载函数;页面加载函数用于将页面地址加载到目标浏览器的地址栏中。
本申请实施例中,鉴定保存指令能够携带网页地址,也可以是通过指定链接列表的方式指定网页地址。
其中,网页地址可以是网址,也可以是IP地址,可以是内网地址,也可以是公网地址。
本申请实施例中,页面加载函数可以将网页地址加载到目标浏览器中进行显示的函数。页面加载函数可以是Python语言的代码。例如driver.get(X)函数,可以将get中的网页地址通过浏览器加载后打开。
可以理解的是,get后携带的X的具体内容即是前述的网页地址。
可以理解的是,如果网页地址是一级地址例如主页地址,而需要保存的网页应当是全部的多级地址,后续还可以将网页地址对应的多级进行解析后放入层级列表中,将层级列表中的网页地址作为鉴定保存指令对应的网页地址执行后续保存流程。
可以看出,本申请实施例中,能够自动解析出网页地址,为后续自动保存做好准备工作。并且,还可以解析出单一网页地址所包含的下级网页地址,将下级网页地址对应的网页进行保存。
可以理解的是,下级网页地址如果较多,可能不是需要固定的内容,因此,当下级网络地址对应的页面中不包括有指定的元素时,则不会将其作为鉴定保存指令所对应的网页地址。其中,指定的元素可以是图片、文字、脚本等。
可以理解的是,当出现网页地址出现下级页面时,本申请实施例可以执行S301后弹出用于指示用户输入指定的元素的输入框。
可以看出,本申请实施例可以自动对网页地址进行解析,并能够让用户指定元素,使得后续保存的网页更加符合用户需要。
例如,用户需要固定的网页是对某种牙刷进行销售的页面,可以在步骤301弹出的输入框中输入牙刷对应的图片,使得该网页地址对应的下级网页中如果包括该牙刷对应的网页也一并进行保存。省去了用户对网页地址逐个指定的繁琐过程。其中,对下级网页中的图片比对的方法可以参照相关成熟技术例如机器学习、图像比对算法等,再此不进行具体限定。
如图4,图4是本申请实施例示出的一种页面的保存方法中解析网页地址对应的网页资源的流程示意图。
解析网页地址对应的网页资源包括:
S401、加载目标代码库中的开发命令代码。
S402、执行开发命令代码解析网页地址对应网页的网页资源。网页资源包括,网页的样式、网页的脚本以及网页的结构。
如图5,图5是本申请实施例示出的一种页面的保存方法中保存为目标格式的文件的流程示意图。
本申请实施例中,至少将网页的样式以及网页的脚本保存为目标格式的文件包括:
S501、解析鉴定保存指令对应的保存地址。
S502、依据网页的结构将网页的样式以及网页的脚本封装为MHTML格式的文件。
S503、将MHTML格式的文件保存到保存地址中。
本申请实施例中,开发命令代码用于解析网页的资源。可以获取网页对应的目标格式所需要的内容,例如mhtml格式的内容,例如,网页的脚本、样式、html结构等。可以通过网页的结构以及网页的样式、脚本等资源保存为mhtml格式的文件,在使用时,加载mhtml格式的文件与浏览的页面完全一致,不会像html格式的文件仅包括基本内容例如文字等。
可以理解的是,开发命令代码也可以是如Python语言的代码。
本申请实施例中,保存地址可以是在鉴定保存指令中所携带的,也可以是实时指定的。例如执行完步骤402后,可以弹出供用户选择的保存地址信息列表,也可以让用户指定一个保存地址。
可以理解的是,保存地址可以是本地的地址,也可以是网络地址或远程地址。提高了网页保存的灵活性。
可以理解的是,如果是自动保存多个网页时,可以是通过页码的方式来命名,逐一进行保存。
能够模拟人工对目标浏览器的操作,例如跳转、输入、点击、下拉等操作。
可以看出,本申请实施例能够实现对网页的各种资源或者说全部元素的保存,且能够实现多级目录的网页的保存,还能够实现灵活性的配置与保存,大大提高了网页保存的灵活性。
与前述应用功能实现方法实施例相对应,本申请还提供了一种页面的保存装置、电子设备及相应的实施例。
图6是本申请实施例示出的一种页面的保存装置的结构示意图。
参见图6,本申请公开的一种页面的保存装置,包括:
接收模块1,用于接收鉴定保存指令;
确定模块2,用于根据鉴定保存指令确定目标浏览器;
调用模块3,用于调用目标浏览器打开鉴定保存指令中对应的网页地址;
解析模块4,用于解析网页地址对应网页的网页资源;其中,网页资源至少包括网页的样式以及网页的脚本;
保存模块5,用于至少将网页的样式以及网页的脚本保存为目标格式的文件;其中,目标格式用于表征能够展现网页的全部网页资源的网页格式。
确定模块具体用于:
调用目标代码库中的目标驱动代码;
加载目标驱动代码;
确定鉴定保存指令中的浏览器标识;
根据浏览器标识查找目标驱动代码中对应的浏览器作为目标浏览器。
调用模块具体用于:
解析鉴定保存指令对应的网页地址;
调用目标代码库中的页面加载函数;页面加载函数用于将页面地址加载到目标浏览器的地址栏中。
解析模块具体用于:
加载目标代码库中的开发命令代码;
执行开发命令代码解析网页地址对应网页的网页资源;网页资源还包括网页的结构。
至少将网页的样式以及网页的脚本保存为目标格式的文件包括:
解析鉴定保存指令对应的保存地址;
依据网页的结构将网页的样式以及网页的脚本封装为MHTML格式的文件;
将MHTML格式的文件保存到保存地址中。
在一些实施例中,鉴定保存指令为特定编程语言的脚本生成的。
在一些实施例中,鉴定保存指令中对应的网页地址包括:链接列表中记录的多个网页地址。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图7是本申请实施例示出的电子设备的结构示意图。
参见图7,电子设备1000包括存储器1010和处理器1020。
处理器1020可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器1010可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器1020或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器1010可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器1010可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器1010上存储有可执行代码,当可执行代码被处理器1020处理时,可以使处理器1020执行上文述及的方法中的部分或全部。
上文中已经参考附图详细描述了本申请的方案。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域技术人员也应该知悉,说明书中所涉及的动作和模块并不一定是本申请所必须的。另外,可以理解,本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或电子设备、服务器等)的处理器执行时,使所述处理器执行根据本申请的上述方法的各个步骤的部分或全部。
本领域技术人员还将明白的是,结合这里的申请所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本申请的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种页面的保存方法,其特征在于,包括:
接收鉴定保存指令;
根据所述鉴定保存指令确定目标浏览器;
调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;
解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;
至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的全部网页资源的网页格式。
2.根据权利要求1所述的保存方法,其特征在于,所述根据所述鉴定保存指令确定目标浏览器包括:
调用目标代码库中的目标驱动代码;
加载所述目标驱动代码;
确定所述鉴定保存指令中的浏览器标识;
根据所述浏览器标识查找所述目标驱动代码中对应的浏览器作为目标浏览器。
3.根据权利要求2所述的保存方法,其特征在于,所述调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址包括:
解析所述鉴定保存指令对应的网页地址;
调用所述目标代码库中的页面加载函数;所述页面加载函数用于将所述页面地址加载到所述目标浏览器的地址栏中。
4.根据权利要求2的保存方法,其特征在于,所述解析所述网页地址对应的网页资源包括:
加载所述目标代码库中的开发命令代码;
执行所述开发命令代码解析所述网页地址对应网页的网页资源;所述网页资源还包括网页的结构。
5.根据权利要求4所述的保存方法,其特征在于,所述至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件包括:
解析所述鉴定保存指令对应的保存地址;
依据所述网页的结构将所述网页的样式以及所述网页的脚本封装为MHTML格式的文件;
将所述MHTML格式的文件保存到所述保存地址中。
6.根据权利要求1所述的保存方法,其特征在于,所述鉴定保存指令为特定编程语言的脚本生成的。
7.根据权利要求1所述的保存方法,其特征在于,所述鉴定保存指令中对应的网页地址包括:链接列表中记录的多个网页地址。
8.一种页面的保存装置,其特征在于,包括:
接收模块,用于接收鉴定保存指令;
确定模块,用于根据所述鉴定保存指令确定目标浏览器;
调用模块,用于调用所述目标浏览器打开所述鉴定保存指令中对应的网页地址;
解析模块,用于解析所述网页地址对应网页的网页资源;其中,所述网页资源至少包括所述网页的样式以及所述网页的脚本;
保存模块,用于至少将所述网页的样式以及所述网页的脚本保存为目标格式的文件;其中,所述目标格式用于表征能够展现所述网页的全部网页资源的网页格式。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
CN202211684585.4A 2022-12-27 2022-12-27 页面的保存方法、装置、设备及存储介质 Active CN115982499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211684585.4A CN115982499B (zh) 2022-12-27 2022-12-27 页面的保存方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211684585.4A CN115982499B (zh) 2022-12-27 2022-12-27 页面的保存方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115982499A true CN115982499A (zh) 2023-04-18
CN115982499B CN115982499B (zh) 2024-04-05

Family

ID=85971866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211684585.4A Active CN115982499B (zh) 2022-12-27 2022-12-27 页面的保存方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115982499B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699674A (zh) * 2013-12-31 2014-04-02 优视科技有限公司 网页保存、网页打开方法及装置和网页浏览系统
CN107943997A (zh) * 2017-12-05 2018-04-20 厦门市美亚柏科信息股份有限公司 一种基于谷歌浏览器的远程网站取证方法、终端设备及存储介质
WO2018090139A1 (en) * 2016-11-18 2018-05-24 Eye-In Inc. Enhanced customer interaction
CN108153778A (zh) * 2016-12-05 2018-06-12 腾讯科技(深圳)有限公司 网页保存方法、网页读取方法及装置
CN110297994A (zh) * 2019-06-03 2019-10-01 北京金蝶管理软件有限公司 网页数据的采集方法、装置、计算机设备和存储介质
CN110555179A (zh) * 2019-09-05 2019-12-10 厦门市美亚柏科信息股份有限公司 一种动态网站脚本取证方法、终端设备及存储介质
US20200050540A1 (en) * 2018-08-10 2020-02-13 International Business Machines Corporation Interactive automation test
CN112784202A (zh) * 2021-02-03 2021-05-11 中国电子科技集团公司第二十八研究所 一种基于web技术的提高网页截图清晰度的方法
CN113495730A (zh) * 2020-03-20 2021-10-12 北京沃东天骏信息技术有限公司 资源包的生成及解析方法和装置
CN114490401A (zh) * 2022-01-28 2022-05-13 中国农业银行股份有限公司 网页的自动化测试方法、装置、设备
CN114499971A (zh) * 2021-12-27 2022-05-13 杭州趣链科技有限公司 证据保全方法、装置、计算机设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699674A (zh) * 2013-12-31 2014-04-02 优视科技有限公司 网页保存、网页打开方法及装置和网页浏览系统
WO2018090139A1 (en) * 2016-11-18 2018-05-24 Eye-In Inc. Enhanced customer interaction
CN108153778A (zh) * 2016-12-05 2018-06-12 腾讯科技(深圳)有限公司 网页保存方法、网页读取方法及装置
CN107943997A (zh) * 2017-12-05 2018-04-20 厦门市美亚柏科信息股份有限公司 一种基于谷歌浏览器的远程网站取证方法、终端设备及存储介质
US20200050540A1 (en) * 2018-08-10 2020-02-13 International Business Machines Corporation Interactive automation test
CN110297994A (zh) * 2019-06-03 2019-10-01 北京金蝶管理软件有限公司 网页数据的采集方法、装置、计算机设备和存储介质
CN110555179A (zh) * 2019-09-05 2019-12-10 厦门市美亚柏科信息股份有限公司 一种动态网站脚本取证方法、终端设备及存储介质
CN113495730A (zh) * 2020-03-20 2021-10-12 北京沃东天骏信息技术有限公司 资源包的生成及解析方法和装置
CN112784202A (zh) * 2021-02-03 2021-05-11 中国电子科技集团公司第二十八研究所 一种基于web技术的提高网页截图清晰度的方法
CN114499971A (zh) * 2021-12-27 2022-05-13 杭州趣链科技有限公司 证据保全方法、装置、计算机设备及存储介质
CN114490401A (zh) * 2022-01-28 2022-05-13 中国农业银行股份有限公司 网页的自动化测试方法、装置、设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PIERRE LAPERDRIX 等: "Browser Fingerprinting: A Survey", 《 TRANSACTIONS ON THE WEB (TWEB)》, 30 April 2020 (2020-04-30), pages 1 - 33 *
孟庆儒: "基于界面特征的iOS仿冒应用检测系统的设计与实现", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, 15 April 2021 (2021-04-15), pages 1 - 86 *

Also Published As

Publication number Publication date
CN115982499B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
US9602347B2 (en) Method, system and program for browser to switch IE kernel
WO2015196954A1 (zh) 网页元素的显示方法以及浏览器装置
US10191838B2 (en) Method and device for checking influence of deleting cache file, and mobile terminal
CN110442815B (zh) 页面生成方法、系统、装置及计算机可读存储介质
US20190332367A1 (en) Method and apparatus for installing application
CN105183760B (zh) 一种网页组件加载方法和装置
CN106294113B (zh) 一种基于可编程式测试服务的创建方法及装置
CN110825600B (zh) 一种页面信息处理方法、服务器和页面展示装置
CN111124525A (zh) 一种网站功能实现方法和装置
CN111679828B (zh) 一种数据处理的方法及装置、电子设备、存储介质
CN113076501A (zh) 一种页面处理方法、存储介质及设备
US20080189593A1 (en) System and method for enabling flash playback of MP3 files available on a web page
CN115982499B (zh) 页面的保存方法、装置、设备及存储介质
CN110708270B (zh) 异常链接检测方法以及装置
CN112887352B (zh) 一种Docker容器的镜像文件上传方法、装置
CN115080114A (zh) 应用程序的移植处理方法、装置和介质
CN112256991B (zh) 一种融合多链接地址的信息流的原生渲染的方法与设备
CN111475748B (zh) 图片的展示方法及装置
CN112579221A (zh) 模态弹窗显示方法及装置
CN111611007A (zh) 基于脚本实现的应用程序安装包的打包方法及设备
CN110955813A (zh) 一种数据爬取方法及装置
CN112169326B (zh) 图片处理方法、装置、电子设备和存储介质
CN116610823B (zh) 一种统一访问多媒体资源的方法和系统
CN114816385B (zh) 一种异构系统的集成方法、装置和设备以及存储介质
CN112596838B (zh) 通用Web页面的显示方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant