CN112559463B - 压缩文件处理的方法及装置 - Google Patents
压缩文件处理的方法及装置 Download PDFInfo
- Publication number
- CN112559463B CN112559463B CN202011511277.2A CN202011511277A CN112559463B CN 112559463 B CN112559463 B CN 112559463B CN 202011511277 A CN202011511277 A CN 202011511277A CN 112559463 B CN112559463 B CN 112559463B
- Authority
- CN
- China
- Prior art keywords
- file
- compressed file
- compressed
- decompression
- url
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供一种压缩文件处理的方法及装置、电子设备、存储介质,该方法可以包括:获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。通过本申请的技术方案,可以自动获取并解压压缩文件,不需要手动单独对各个压缩文件进行操作,减小了人工的工作量,并提高了解压效率和解压准确度。
Description
技术领域
本申请涉及计算机技术领域,特别是压缩文件处理的方法及装置。
背景技术
在网络传输过程中,文件压缩技术运用广泛,为了便于传输,通常可以对文件进行压缩处理,将体积较大的文件或者多个零散文件压缩成体积较小的压缩文件,可以有效节约传输带宽。
相关技术中,对于接收到的压缩文件,需要人工手动来对文件进行解压,以供后续程序针对指定地址进行文件读取,当接收到的压缩文件较多数据量较大时,人工的工作繁琐,工作效率低且工作的准确性低。
发明内容
有鉴于此,本申请提供压缩文件处理的方法、装置,用以自动获取压缩文件并自动对压缩文件进行解压。
具体的,本申请通过如下技术方案实现:
根据本申请的第一方面,提出了一种压缩文件处理的方法,包括:
获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;
通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;
获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
根据本申请的第二方面,提出了一种压缩文件处理的装置,包括:
第一获取单元,用于获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;
处理单元,用于通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;
第二获取单元,用于获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
根据本申请的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如上述第一方面的实施例中所述的方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如上述第一方面的实施例中所述方法的步骤。
由以上本申请提供的技术方案可见,本申请通过获取压缩文件的目标URL,使虚拟文件系统自动获取压缩文件,并调用解压缩工具对压缩文件进行解压,可以自动获取并解压压缩文件,不需要手动单独对各个压缩文件进行操作,减小了人工的工作量,并提高了解压效率和解压准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据本申请一示例性实施例示出的一种压缩文件处理方法的流程图;
图2是应用本申请实施例的压缩文件处理系统的网络架构示意图;
图3是根据本申请一示例性实施例示出的一种加密压缩文件处理方法的流程图;
图4是根据本申请一示例性实施例示出的一种压缩文件处理电子设备示意图;
图5是根据本申请一示例性实施例示出的一种压缩文件处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
接下来对本申请实施例进行详细说明。
图1为根据本申请一示例性实施例示出的一种压缩文件处理方法的流程图。如图1所示,可以包括如下步骤:
步骤102:获取压缩文件的目标URL(Uniform Resource Locator,统一资源定位系统),所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成。
在一实施例中,所述压缩文件的原始URL通过将读取到的压缩文件配置信息按照特定顺序拼接而成,所述配置信息包括压缩文件所在文件服务器、服务器用户名、服务器密码、服务器名称、文件路径和文件类型,其中所述文件类型可以是压缩文件,也可以是包含有压缩文件的文件夹。举例而言,读取用户配置的压缩文件信息,得到文件服务器为FTP服务器,主机名为ftphost,服务器用户名为ftpuser,服务器密码为ftp123,压缩文件所在文件路径为/ftp/dir1/,当文件类型为压缩文件时,读取得到压缩文件为zipfile.zip,将其按照服务器、用户名、密码、路径、压缩文件的规则顺序拼接,得到原始URL:ftp://ftpuser:ftp123@ftphost/ftp/dir1/zipfile.zip;当文件类型为包含压缩文件的文件夹时,读取得到包含压缩文件的文件夹为folder,则将配置信息按照服务器、用户名、密码、路径、文件夹的规则顺序拼接,得到原始URL:ftp://ftpuser:ftp123@ftphost/ftp/dir1/folder。其中,URL由一串字符组成,用于表示互联网上指定资源的位置和访问方法,是互联网上标准资源的地址,可以指向具体的文件,也可以指向文件夹,本申请对此不作限制。
在一实施例中,将原始URL与预设解压标识进行拼接得到目标URL,所述预设解压标识可以拼接在原始URL的整个字符串的首部,本申请对此不作限制。举例而言,预设解压标识符为dxtzip,应当清楚的是,这仅仅是一种示例性的描述,本申请对于预设解压标识符的具体内容不做限制,将所述预设解压标识拼接在原始URL的整个字符串首部时,得到的目标URL可以为:dxtzip:ftp://ftpuser:ftp123@ftphost/ftp/dir1/zipfile.zip。
其中,所述预设解压标识用于将压缩文件与对应的解压缩工具相关联,使得虚拟文件系统可以通过该预设解压标识对解压缩工具进行调用,以通过解压缩工具对压缩文件进行解压处理。举例而言,可以通过虚拟文件系统识别预设解压标识,调用对应的API(Application Programming Interface,应用程序接口),建立压缩文件与解压缩工具之间的联系,调用解压缩工具。其中,API是一个预先定义的函数,可以连接不同的程序进行沟通,使得无需访问源码,或理解内部工作机制的细节即可对程序进行访问。
步骤104:通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具。
虚拟文件系统(VFS,Virtual File System)用于为各类文件系统提供统一的操作界面和API,可以使上层的应用程序能够使用特定的应用程序接口访问对应的文件系统。虚拟文件系统可以为Commons VFS,本申请对此不做限制。其中,Commons VFS是一种虚拟文件系统的开源工具,用于提供可以访问各种文件系统的对应应用程序接口。
解压缩工具可以根据用户提供的压缩文件密码针对加密压缩文件创建、添加、抽取、更新、移出文件。举例而言,解压缩工具可以为zip4j,本申请对此不做限制。其中,zip4j是一种针对zip格式压缩文件的开源工具,用于对zip格式的压缩文件进行处理,可以实现读写有密码保护的zip文件。
在一实施例中,通过虚拟文件系统可以对目标URL进行处理,获取到目标URL中包含的原始URL,根据原始URL中包含的压缩文件所在文件服务器信息,调用与所述文件服务器相对应的API连接压缩文件所在的服务器,从而获取到压缩文件。举例而言,原始URL包含的配置信息中包括压缩文件所在文件服务器为FTP服务器,虚拟文件系统则可以调用与FTP服务器相对应的API,使用FTP Client(FTP客户端)连接FTP服务器,获取FTP服务器中对应路径下的压缩文件。通过虚拟文件系统能够自动获取对应路径地址的压缩文件的,不再需要对其手动发送或者接收,减少了人工工作量。
在一实施例中,读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件定义的第一正则表达式,根据所述第一正则表达式对所述目标URL路径下的文件进行筛选,获取筛选得到的所述压缩文件,并将获取到的压缩文件复制到本地保存。举例而言,当第一正则表达式被配置为“^天气.*.zip”时,根据所述第一正则表达式可以筛选出目标URL路径下文件名以“天气”两字开头的zip格式的压缩文件。通过根据针对压缩文件定义的第一正则表达式筛选压缩文件,使在获取压缩文件的过程中可以自动过滤掉不必要的文件,提高了压缩文件的获取效率并节约了存储空间。其中正则表达式通常被用来检索符合某个规则的文本,通过事先定义好的特定字符,或者特定字符组合形成的“规则字符串”来对字符串进行过滤,检索出与“规则字符串”具有相同规则的文本。在本申请中,用户配置的针对压缩文件的第一正则表达式可以用于筛选以特定文件命名规则进行命名的压缩文件,也可以用于筛选具有特定的文件格式的压缩文件,本申请对此不做限制。
在一实施例中,预设解压标识用于使压缩文件能够与解压缩工具相连接,举例而言,可以在虚拟文件系统中预先配置好预设解压标识与API的对应关系,使得当虚拟文件系统识别到URL中具有预设解压标识时,调用对应的API连接解压缩工具的客户端与压缩文件。通过获取到的目标URL中的预设解压标识,方便虚拟文件系统选取对应的API连接压缩文件与解压缩工具。
在一实施例中,虚拟文件系统识别目标URL中的预设解压标识,调用该预设解压标识对应的API,将压缩文件与解压缩工具相连接,调用解压缩工具对所述压缩文件进行解压处理。通过预设解压标识可以使虚拟文件系统将压缩文件与解压缩工具相连接,方便后续对压缩文件进行解压。
步骤106:获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
通过解压缩工具可以在不需要手动单独对各个压缩文件进行操作的情况下,自动获取压缩文件内的文件内容,减少了人工的工作量,同时也提升了解压效率与准确度。
在一实施例中,解压缩工具可以在不对压缩文件进行解压的情况下直接获取压缩文件所含的文件内容。举例而言,当压缩文件格式为zip格式时,zip文件具有标准格式规范“文件头+文件数据+数据描述符+核心目录+目录结束标识”,解压缩工具可以根据zip文件标准格式规范解析得到压缩文件内的所有子文件名称、大小、文件数据等信息,而无需将压缩文件所含的文件内容都解压出来,从而避免造成对存储空间的大量占用。
在一实施例中,读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件内文件内容定义的第二正则表达式;根据所述第二正则表达式对所述压缩文件内的文件内容进行筛选,获取筛选得到的所述文件内容。举例而言,第二正则表达式被配置为“^下雨.*.jpg”时,可以仅获取压缩文件内文件名以“下雨”开头的jpg格式的文件内容。通过第二正则表达式可以在解压过程中过滤掉不需要的文件内容,使最终解压出的文件均为用户所需要的文件,提高解压效率,节省对解压得到的文件内容的存储空间。
在一实施例中,所述压缩文件处于加密状态,当各个压缩文件使用的密码相同时,配置压缩文件密码为统一密码,向解压缩工具提供预配置的统一密码,以对所述压缩文件进行解密;当各个压缩文件使用的密码不同时,每个压缩文件配置有各自的专用密码,根据预配置的密码与压缩文件的映射关系,获取所述压缩文件对应的专用密码;向解压缩工具提供所述压缩文件的专用密码,以对所述压缩文件进行解密。通过读取密码与压缩文件的映射关系,使得解压缩工具可以获取各个压缩文件所对应的密码,从而能够实现加密压缩文件的解密与解压。
在一实施例中,在所述压缩文件对应的密码处于加密状态的情况下,获取相应的加解密规则,以根据所述加解密规则对所述加密状态下的密码进行解密,得到适用于所述压缩文件的所述统一密码或所述专用密码。其中根据所述加密规则对所述加密状态下的密码进行解密,可以是在虚拟文件系统中进行,将解密后得到的统一密码或者专用密码,也可以是通过解压缩工具进行的,本申请对此不做限制。通过对压缩文件密码进行加密,只有事先配置好加解密规则的解压缩工具能够对其解密解压,可以使压缩文件不易被破解,传输过程更加安全。
在一实施例中,当密码数量为多个时,对使用频率排列在先的预设数量的密码进行缓存。通过缓存常用密码,可以减少对配置信息的读取次数,减少对加密密码的解密次数,使得解压缩工具对压缩文件解压更迅速。
在一实施例中,可以根据预定义的读取规则,对获取到的文件内容进行结构化处理,得到结构化数据;将所述结构化数据写入目标数据库。通过对数据进行结构化处理使得数据能够更规范化的保存在数据库中,便于对数据进行查询和修改。其中,结构化数据是将数据以二维形式展现,使数据符合特定的格式和长度规范,对数据进行有规律的存储和排列。
由以上本申请提供的技术方案可见,虚拟文件系统可以根据目标URL中压缩文件的实际URL获取所述压缩文件,根据目标URL中的预设解压标识调用解压缩工具对压缩文件进行解压,以获取压缩文件解压得到的文件内容。通过虚拟文件系统和解压缩工具可以实现对压缩文件的自动获取,并且不需要人工对各个压缩文件进行分别操作,实现了压缩文件的自动解压,解压过程更加高效且自动化。
图2所示,为应用本申请实施例的压缩文件处理系统的网络架构示意图。如图2所示,该压缩文件处理系统可以包括服务器21、客户端22a、客户端22b和客户端22c等,本申请并不限制客户端的数量。上述客户端22a~22c中任一客户端均可以将文件压缩后上传至服务器21,也可以实现对服务器21中压缩文件的获取和解压。客户端22a~22c可以通过虚拟文件系统从服务器21中获取任意压缩文件,再调用解压缩工具对压缩文件进行解压处理,获取压缩文件解压得到的文件内容。其中,任一客户端获取的压缩文件可以由其自身预先压缩并上传,也可以为其他客户端预先压缩并上传,即压缩文件的生成方和处理方并不存在必然关联。
在本申请的技术方案中,通过客户端22可以实现对服务器21中压缩文件的自动获取并解压,下面结合图3进行详细说明。其中,图3根据本申请一示例性实施例示出的一种压缩文件处理方法的多方交互流程图。如图3所示,客户端22对服务器21中的压缩文件处理流程包括以下步骤:
步骤301,获取目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成。
其中所述压缩文件的原始URL通过读取所述压缩文件对应的配置信息,并按照预设规则拼接所述压缩文件的配置信息得到,所述配置信息包括压缩文件所在文件服务器、服务器用户名、服务器密码、服务器名称、文件路径和文件类型。
举例而言,读取用户配置的压缩文件信息,得到文件服务器为FTP,主机名为ftphost,服务器用户名为ftpuser,服务器密码为ftp123,压缩文件所在文件路径为/ftp/dir1/,压缩文件为zipfile.zip,将其按照服务器、用户名、密码、路径的规则顺序拼接,得到原始URL:ftp://ftpuser:ftp123@ftphost/ftp/dir1/zipfile.zip。
在上述原始URL中拼接预设解压标识符,所述预设解压标识符为dxtzip,获取拼接得到的目标URL:dxtzip:ftp://ftpuser:ftp123@ftphost/ftp/dir1/zipfile.zip。
步骤302,通过虚拟文件系统处理所述目标。
当目标URL中包含预设解压标识符时,虚拟文件系统可以对所述目标URL进行处理,获取所述目标URL中所包含的原始URL。
举例而言,对于上述目标URL,虚拟文件系统Commons VFS可以处理得到所述压缩文件的原始URL:ftp://ftpuser:ftp123@ftphost/ftp/dir1/zipfile.zip。
步骤303,根据所述原始URL获取所述压缩文件。
虚拟文件系统可以识别原始URL中的服务器协议,调用对应的API连接服务器,获取原始URL中包含的文件路径下的压缩文件。
举例而言,Commons VFS可以识别到上述原始URL包含ftp协议,调用FTP Client连接FTP服务器,获取到FTP服务器内/ftp/dir1/路径下的压缩文件zipfile.zip。
步骤304,根据所述预设解压标识调用解压缩工具。
虚拟文件系统可以识别目标URL中的预设解压标识,根据预设解压标识调用对应的API,调用对应的解压缩工具连接所述压缩文件。
举例而言,预设解压标识dxtzip在Commons VFS中设置有对应于解压缩工具zip4j的API,Commons VFS可以根据上述目标URL中包含的预设解压标识dxtzip,将解压缩工具zip4j与压缩文件zipfile.zip相连接,调用解压缩根据zip4j对压缩文件进行解压。
步骤305,获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
当压缩文件处于加密状态时,解压缩工具可以读取所述压缩文件的配置信息得到压缩文件的解压密码,根据压缩文件的密码对压缩文件进行解压处理。
举例而言,该压缩文件与其他压缩文件使用相同的密码,读取用户配置的压缩文件统一密码abc,解压缩工具zip4j根据所述统一密码abc对压缩文件zipfile.zip进行解密,获取所述压缩文件内的文件内容。
步骤306,根据预定义的读取规则,对获取到的文件内容进行结构化处理,得到结构化数据。
举例而言,压缩文件解压得到的文件内容为:
id,name
1,张三
2,李四
预先定义“以换行符来区分每一条记录,以逗号为分隔符区分各个字段”的读取规则,如表1所述,为结构化处理得到结构化数据:
id | name |
1 | 张三 |
2 | 李四 |
表1
步骤307,将所述结构化数据写入目标数据库。
在本实施例中,可以将表1所示的结构化数据写入目标数据库。
与上述方法实施例相对应,本说明书还提供了一种装置的实施例。
图4是根据本申请一示例性实施例示出的一种压缩文件处理电子设备示意图。参考图4,在硬件层面,该电子设备包括处理器402、内部总线404、网络接口406、内存408以及非易失性存储器410,当然还可能包括其他业务所需要的硬件。处理器402从非易失性存储器410中读取对应的计算机程序到内存408中然后运行,在逻辑层面上形成压缩文件的处理装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
图5是根据本申请一示例性实施例示出的一种压缩文件处理装置的框图。参照图5,该装置包括第一获取单元502、处理单元504和第二获取单元506,其中:
第一获取单元502被配置为获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成。
处理单元504被配置为通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具。
第二获取单元506被配置为获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
可选的,所述根据所述原始URL获取所述压缩文件,包括:读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件定义的第一正则表达式;根据所述第一正则表达式对所述目标URL路径下的文件进行筛选,获取筛选得到的所述压缩文件。
可选是,所述获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容包括:读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件内文件内容定义的第二正则表达式;根据所述第二正则表达式对所述压缩文件内的文件内容进行筛选,获取筛选得到的所述文件内容。
可选的,当所述压缩文件处于加密状态时,所述获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容,包括:向解压缩工具提供预配置的统一密码,以对所述压缩文件进行解密;或,根据预配置的密码与压缩文件的映射关系,获取所述压缩文件对应的专用密码;向解压缩工具提供所述压缩文件的专用密码,以对所述压缩文件进行解密。
可选的,所述装置还包括:
缓存单元508,被配置为当密码数量为多个时,对使用频率排列在先的预设数量的密码进行缓存。
可选的,所述装置还包括:
解密单元510,用于在所述压缩文件对应的密码处于加密状态的情况下,获取相应的加解密规则,以根据所述加解密规则对所述加密状态下的密码进行解密,得到适用于所述压缩文件的所述统一密码或所述专用密码。
可选的,所述装置还包括:
结构化处理单元512,用于根据预定义的读取规则,对获取到的文件内容进行结构化处理,得到结构化数据。
写入单元514,用于将所述结构化数据写入目标数据库。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由压缩文件处理装置的处理器执行以实现如上述实施例中任一所述的方法,比如该方法可以包括:
获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容。
其中,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等,本申请并不对此进行限制。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种压缩文件的处理方法,其特征在于,包括:
获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;
通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;
获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容;
根据预定义的读取规则,对获取到的文件内容进行结构化处理,得到结构化数据;
将所述结构化数据写入目标数据库。
2.根据权利要求1所述方法,其特征在于,通过下述方式获取所述压缩文件的原始URL:
读取所述压缩文件对应的配置信息,所述配置信息包括压缩文件所在文件服务器、服务器用户名、服务器密码、服务器名称、文件路径和文件类型;
按照预设规则拼接所述压缩文件的配置信息,得到所述压缩文件的原始URL。
3.根据权利要求1所述方法,其特征在于,所述根据所述原始URL获取所述压缩文件,包括:
读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件定义的第一正则表达式;
根据所述第一正则表达式对所述目标URL路径下的文件进行筛选,获取筛选得到的所述压缩文件。
4.根据权利要求1所述方法,其特征在于,所述获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容包括:
读取所述压缩文件对应的配置信息,所述配置信息包括针对压缩文件内文件内容定义的第二正则表达式;
根据所述第二正则表达式对所述压缩文件内的文件内容进行筛选,获取筛选得到的所述文件内容。
5.根据权利要求1所述方法,其特征在于,所述压缩文件处于加密状态;所述获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容,包括:
向解压缩工具提供预配置的统一密码,以对所述压缩文件进行解密;或,
根据预配置的密码与压缩文件的映射关系,获取所述压缩文件对应的专用密码;向解压缩工具提供所述压缩文件的专用密码,以对所述压缩文件进行解密。
6.根据权利要求5所述方法,其特征在于,还包括:
当密码数量为多个时,对使用频率排列在先的预设数量的密码进行缓存。
7.根据权利要求5所述方法,其特征在于,还包括:
在所述压缩文件对应的密码处于加密状态的情况下,获取相应的加解密规则,以根据所述加解密规则对所述加密状态下的密码进行解密,得到适用于所述压缩文件的所述统一密码或所述专用密码。
8.一种压缩文件处理的装置,其特征在于,所述装置包括:
第一获取单元,用于获取压缩文件的目标URL,所述目标URL由所述压缩文件的原始URL与预设解压标识拼接生成;
处理单元,用于通过虚拟文件系统处理所述目标URL,使所述虚拟文件系统根据所述原始URL获取所述压缩文件,并根据所述预设解压标识调用解压缩工具;
第二获取单元,用于获取所述解压缩工具对所述压缩文件进行解压处理得到的文件内容;
写入单元,用于根据预定义的读取规则,对获取到的文件内容进行结构化处理,得到结构化数据;以及,将所述结构化数据写入目标数据库。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011511277.2A CN112559463B (zh) | 2020-12-18 | 2020-12-18 | 压缩文件处理的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011511277.2A CN112559463B (zh) | 2020-12-18 | 2020-12-18 | 压缩文件处理的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112559463A CN112559463A (zh) | 2021-03-26 |
CN112559463B true CN112559463B (zh) | 2023-08-25 |
Family
ID=75030376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011511277.2A Active CN112559463B (zh) | 2020-12-18 | 2020-12-18 | 压缩文件处理的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559463B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377386B (zh) * | 2021-06-23 | 2022-10-18 | 支付宝(杭州)信息技术有限公司 | 一种无解压的安装包安装方法、装置以及设备 |
CN114205424B (zh) * | 2021-12-01 | 2023-08-29 | 招联消费金融有限公司 | 账单文件解压方法、装置、计算机设备和存储介质 |
CN114817160A (zh) * | 2022-04-08 | 2022-07-29 | 深圳Tcl新技术有限公司 | 文件解压方法、装置、电子设备及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104980313A (zh) * | 2008-10-31 | 2015-10-14 | 电子湾有限公司 | 测试可执行指令的系统和方法 |
CN106612264A (zh) * | 2015-10-26 | 2017-05-03 | 广州市动景计算机科技有限公司 | 一种获取文件解压密码的方法及装置 |
CN106873958A (zh) * | 2016-07-06 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种应用编程接口的调用方法及装置 |
CN106936441A (zh) * | 2017-02-27 | 2017-07-07 | 深圳国泰安教育技术股份有限公司 | 一种数据压缩方法和装置 |
CN108197204A (zh) * | 2017-12-28 | 2018-06-22 | 北京安博通科技股份有限公司 | 文件处理方法及装置 |
CN109033247A (zh) * | 2018-07-05 | 2018-12-18 | Oppo(重庆)智能科技有限公司 | 一种应用程序的管理方法、装置、存储介质及终端 |
CN109408471A (zh) * | 2018-10-12 | 2019-03-01 | 厦门市美亚柏科信息股份有限公司 | 一种基于匹配树的压缩包解压方法、装置及存储介质 |
KR102080230B1 (ko) * | 2019-10-28 | 2020-02-21 | 주식회사 코어소프트 | Rest api 서비스의 다중 호출 처리 시스템 및 그 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9280665B2 (en) * | 2013-09-13 | 2016-03-08 | Airwatch Llc | Fast and accurate identification of message-based API calls in application binaries |
US11829454B2 (en) * | 2018-03-09 | 2023-11-28 | Patrick Robert Koren | Method and apparatus for preventing and investigating software piracy |
-
2020
- 2020-12-18 CN CN202011511277.2A patent/CN112559463B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104980313A (zh) * | 2008-10-31 | 2015-10-14 | 电子湾有限公司 | 测试可执行指令的系统和方法 |
CN106612264A (zh) * | 2015-10-26 | 2017-05-03 | 广州市动景计算机科技有限公司 | 一种获取文件解压密码的方法及装置 |
CN106873958A (zh) * | 2016-07-06 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种应用编程接口的调用方法及装置 |
CN106936441A (zh) * | 2017-02-27 | 2017-07-07 | 深圳国泰安教育技术股份有限公司 | 一种数据压缩方法和装置 |
CN108197204A (zh) * | 2017-12-28 | 2018-06-22 | 北京安博通科技股份有限公司 | 文件处理方法及装置 |
CN109033247A (zh) * | 2018-07-05 | 2018-12-18 | Oppo(重庆)智能科技有限公司 | 一种应用程序的管理方法、装置、存储介质及终端 |
CN109408471A (zh) * | 2018-10-12 | 2019-03-01 | 厦门市美亚柏科信息股份有限公司 | 一种基于匹配树的压缩包解压方法、装置及存储介质 |
KR102080230B1 (ko) * | 2019-10-28 | 2020-02-21 | 주식회사 코어소프트 | Rest api 서비스의 다중 호출 처리 시스템 및 그 방법 |
Non-Patent Citations (1)
Title |
---|
压缩软件 经验技巧;新电脑(09);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112559463A (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559463B (zh) | 压缩文件处理的方法及装置 | |
CN109040252B (zh) | 文件传输方法、系统、计算机设备和存储介质 | |
CN109451006B (zh) | 一种数据传输方法、装置、服务器及计算机存储介质 | |
US9336406B2 (en) | Multiprotocol access control list with guaranteed protocol compliance | |
JP4859549B2 (ja) | 管理用シンボルを用いた情報管理方法、及び情報管理サーバ | |
KR101035302B1 (ko) | 클라우드 시스템 및 클라우드 시스템에서 파일 압축 및 전송 방법 | |
WO2019201003A1 (zh) | 文件打包、文件包解包方法、装置及网络设备 | |
US9613156B2 (en) | Cookie information sharing method and system | |
CN107908632B (zh) | 网站文件处理方法、装置、网站文件处理平台及存储介质 | |
CN109885577B (zh) | 数据处理方法、装置、终端及存储介质 | |
JP2016186782A (ja) | データ処理方法及びデータ処理装置 | |
CN114385091A (zh) | 网盘盘符的实现方法、装置、网盘及存储介质 | |
US20140164574A1 (en) | Method and System for Downloading a Font File | |
CN105554136B (zh) | 备份数据还原方法、装置及系统 | |
CN111803917A (zh) | 资源的处理方法和装置 | |
CN106878145B (zh) | 一种自定义图片的显示方法、显示装置及显示系统 | |
US6714950B1 (en) | Methods for reproducing and recreating original data | |
CN110519656B (zh) | 自适应流媒体的播放方法、系统以及服务器 | |
CN111414339A (zh) | 一种文件的处理方法、系统、装置、设备及介质 | |
CN108063713B (zh) | 一种网络请求的处理方法及装置 | |
CN115250467A (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
CN113553344A (zh) | 一种业务数据管理方法、系统、计算机设备和存储介质 | |
CN113438503A (zh) | 视频文件还原方法、装置、计算机设备和存储介质 | |
CN106506478B (zh) | 一种针对移动终端Zello应用的数据取证方法 | |
CN112464255A (zh) | 一种数据处理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |