CN115544304A - 文件解析方法、装置、可读存储介质及文件解析设备 - Google Patents
文件解析方法、装置、可读存储介质及文件解析设备 Download PDFInfo
- Publication number
- CN115544304A CN115544304A CN202211249480.6A CN202211249480A CN115544304A CN 115544304 A CN115544304 A CN 115544304A CN 202211249480 A CN202211249480 A CN 202211249480A CN 115544304 A CN115544304 A CN 115544304A
- Authority
- CN
- China
- Prior art keywords
- file
- format
- analyzed
- output
- target function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Stored Programmes (AREA)
Abstract
本申请提供了一种文件解析方法、装置、可读存储介质及文件解析设备,该方法包括:获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。本申请解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
Description
技术领域
本申请涉及文件解析领域,具体而言,涉及一种文件解析方法、装置、可读存储介质及文件解析设备。
背景技术
在数据解析处理时,往往需要对特定数据字段进行数据转换操作(如:字符串截取、ip地址转换、时间格式转换等),通常传统做法是需要对各种待处理数据编写其特定的解析程序,每种待处理数据都要编写一套与其对应的解析程序需要进行大量的重复编码工作,浪费大量的人力物力,耗时较长,造成不必要的资源浪费。
发明内容
本申请的主要目的在于提供一种文件解析方法、装置、可读存储介质及文件解析设备,以解决现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种文件解析方法,该方法包括:获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
可选地,所述关键词有M个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:步骤S1,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据所述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将所述待解析文件的格式从所述输入格式转换为第i种输出格式,其中,i=1;步骤S2,继续读取第i+1个关键词,根据所述第i+1个关键词之后的第i+1个目标函数名,调用第i+1个目标函数,以将所述待解析文件的格式从所述第i种输出格式转换为第i+1种输出格式,其中,2≤i+1≤M;步骤S3,判断i+1是否等于M,如是,第i+1个输出格式为最终输出格式;如否,返回至步骤S2。
可选地,所述关键词有两个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第一个关键词时,根据所述第一个关键词之后的第一个目标函数名,调用第一个目标函数,以将所述待解析文件的格式从所述输入格式转换为第一种输出格式,其中,所述第一个目标函数为将小写格式转换为大写格式的函数;在读到第二个关键词时,根据所述第二个关键词之后的第二个目标函数名,调用第二个目标函数,以将所述待解析文件的格式从所述第一种输出格式转换为第二种输出格式,所述第二个目标函数为提取目标字符串的函数。
可选地,所述待解析文件的输入格式至少为以下之一:小写格式、大写格式、指数格式、对数格式。
可选地,所述待解析文件的输出格式至少为以下之一:小写格式、大写格式、指数格式、对数格式、截取某段字符串。
可选地,所述方法还包括:生成第一XML文件,所述第一XML文件用于表征输入描述信息;生成第二XML文件,所述第二XML文件用于表征输入描述信息。
根据本申请的另一方面,提供了一种文件解析装置,该装置包括获取模块与解析模块,所述获取模块用于获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;所述解析模块用于采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
可选地,所述获取模块还包括第一生成模块与第二生成模块,其中,所述第一生成模块用于生成第一XML文件,所述第一XML文件用于表示输入描述信息;所述第二生成模块用于生成第二XML文件,所诉第二XML文件用于表述输入描述信息。
根据本发明实施例的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述任意一种所述方法。
根据本发明实施例的又一方面,还提供了一种文件解析设备,包括:一个或多个存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括用于执行上述任意一种所述的文件解析方法。
应用本申请的技术方案,上述文件解析方法,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请的实施例的文件解析方法的流程示意图;
图2示出了根据本申请的实施例的文件解析方法的另一种方法流程示意图;
图3示出了根据本申请的实施例的文件解析方法的又一种方法流程示意图;
图4示出了根据本申请的实施例的文件解析装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
正如背景技术中所说的,现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种文件解析方法、装置、可读存储介质及文件解析设备。
根据本申请的实施例,提供了一种文件解析方法,该方法可以应用于解析多种格式的文本文件或者数据流,例如:cap文件、map文件、xml文件、json格式、csv格式、kv格式、固定分隔符固定列格式等,但不限于上述格式,只要可被描述定义即可。
图1是根据本申请实施例的文件解析方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式。
在一个可选地实施例中,上述方法还包括:生成第一XML文件,上述第一XML文件用于表征输入描述信息;生成第二XML文件,上述第二XML文件用于表征输入描述信息。XML格式保存的数据具有自我描述性,并且有统一的格式和语法,便于读取且提高效率。
具体地,上述待解析文件的输入格式至少为以下之一:小写格式、大写格式、指数格式、对数格式;上述待解析文件的输出格式至少为以下之一:小写格式、大写格式、指数格式、对数格式、截取某段字符串。其中,上述待解析文件的输出格式还可以是:截取前几段字符串、截取后几段字符串、截取中间几段字符串、截取符合某一要求的字符串。
需要注意的是,上述输入格式与上述输出格式需为对应关系,例如:上述输入格式为小写格式时,上述输出格式可以为大写格式;上述输入格式为指数格式时,上述输出格式可以为对数格式。具体地,本实施例是一个对特定数据字段进行数据转换操作的过程,例如:字符串截取、ip地址转换、时间格式转换等。
步骤S102,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,解放了人力。
具体地,上述关键词可以设置为“execute”,还可以设置为其他关键词。
其中,在上述关键词有M个的情况下,如图2所示,步骤S102具体实施步骤如下:
步骤S1,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据上述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将上述待解析文件的格式从上述输入格式转换为第i种输出格式,其中,i=1;
步骤S2,继续读取第i+1个关键词,根据上述第i+1个关键词之后的第i+1个目标函数名,调用第i+1个目标函数,以将上述待解析文件的格式从上述第i种输出格式转换为第i+1种输出格式,其中,2≤i+1≤M;
步骤S3,判断i+1是否等于M,如是,第i+1个输出格式为最终输出格式;如否,返回至步骤S2。
在其他实施例中,上述关键词有两个,如图3所示,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式的实施步骤可以如下:
步骤S201,采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第一个关键词时,根据上述第一个关键词之后的第一个目标函数名,调用第一个目标函数,以将上述待解析文件的格式从上述输入格式转换为第一种输出格式,其中,上述第一个目标函数为将小写格式转换为大写格式的函数;
步骤S202,在读到第二个关键词时,根据上述第二个关键词之后的第二个目标函数名,调用第二个目标函数,以将上述待解析文件的格式从上述第一种输出格式转换为第二种输出格式,上述第二个目标函数为提取目标字符串的函数。
本申请的上述文件解析方法中,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种文件解析装置,需要说明的是,本申请实施例的文件解析装置可以用于执行本申请实施例所提供的文件解析方法。以下对本申请实施例提供的文件解析装置进行介绍。
图4是根据本申请实施例的文件解析装置的示意图。如图4所示,该装置包括获取模块10与解析模块20,上述获取模块10用于获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块20用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。
获取上述输入描述信息与上述输出描述信息的方法有多种,本实例中,上述获取模块还包括第一生成模块与第二生成模块,其中,上述第一生成模块用于生成第一XML文件,上述第一XML文件用于表示输入描述信息;上述第二生成模块用于生成第二XML文件,所诉第二XML文件用于表述输入描述信息。
示例性的,上述解析模块还包括第一读取模块、第二读取模块与判断模块,上述第一读取模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据上述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将上述待解析文件的格式从上述输入格式转换为第i种输出格式,其中,i=1;上述第二读取模块用于继续读取第i+1个关键词,根据上述第i+1个关键词之后的第i+1个目标函数名,调用第i+1个目标函数,以将上述待解析文件的格式从上述第i种输出格式转换为第i+1种输出格式,其中,2≤i+1≤M;上述判断模块用于判断i+1是否等于M,如是,第i+1个输出格式为最终输出格式;如否,返回至上述第二读取模块。
本申请的上述文件解析装置,通过上述获取模块获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块上述解析模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。上述装置通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行上述文件解析方法。
本发明实施例提供了一种文件解析设备,设备包括一个或多个存储器,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,上述一个或多个程序包括用于执行上述任意一种上述的文件解析方法。本文中的设备可以是服务器、PC、PAD、手机等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的上述文件解析方法中,首先获取待解析文件的输入描述信息和待解析文件的输出描述信息,输入描述信息用于描述待解析文件的输入格式,输出描述信息用于描述待解析文件的欲输出格式;之后采用解析程序对待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据关键词之后的目标函数名,调用目标函数,以将待解析文件的格式从输入格式转换为输出格式,目标函数是由待解析文件的输入格式和待解析文件的欲输出格式决定的。上述方法通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
2)、本申请的上述文件解析装置,通过上述获取模块获取待解析文件的输入描述信息和上述待解析文件的输出描述信息,上述输入描述信息用于描述上述待解析文件的输入格式,上述输出描述信息用于描述上述待解析文件的欲输出格式;上述解析模块上述解析模块用于采用解析程序对上述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据上述关键词之后的目标函数名,调用目标函数,以将上述待解析文件的格式从上述输入格式转换为输出格式,上述目标函数是由上述待解析文件的输入格式和上述待解析文件的欲输出格式决定的。上述装置通过在解析程序中设置关键词,在解析过程中提取与输出描述对应的目标函数,可以不对每种待处理数据都编写一套与其对应的解析程序,仅需设置一种解析程序即可,更易于维护扩展且更加灵活,解决了现有技术中对每种待处理数据都要编写一套与其对应的解析程序的大量重复编码工作浪费人力物力的问题。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种文件解析方法,其特征在于,包括:
获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;
采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读取到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
2.根据权利要求1所述的方法,其特征在于,所述关键词有M个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:
步骤S1,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第i个关键词时,根据所述第i个关键词之后的第i个目标函数名,调用第i个目标函数,以将所述待解析文件的格式从所述输入格式转换为第i种输出格式,其中,i=1;
步骤S2,继续读取第i+1个关键词,根据所述第i+1个关键词之后的第i+1个目标函数名,调用第i+1个目标函数,以将所述待解析文件的格式从所述第i种输出格式转换为第i+1种输出格式,其中,2≤i+1≤M;
步骤S3,判断i+1是否等于M,如是,第i+1个输出格式为最终输出格式;如否,返回至步骤S2。
3.根据权利要求2所述的方法,其特征在于,所述关键词有两个,采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,包括:
采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到第一个关键词时,根据所述第一个关键词之后的第一个目标函数名,调用第一个目标函数,以将所述待解析文件的格式从所述输入格式转换为第一种输出格式,其中,所述第一个目标函数为将小写格式转换为大写格式的函数;
在读到第二个关键词时,根据所述第二个关键词之后的第二个目标函数名,调用第二个目标函数,以将所述待解析文件的格式从所述第一种输出格式转换为第二种输出格式,所述第二个目标函数为提取目标字符串的函数。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述待解析文件的输入格式至少为以下之一:
小写格式、大写格式、指数格式、对数格式。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述待解析文件的输出格式至少为以下之一:
小写格式、大写格式、指数格式、对数格式、截取某段字符串。
6.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
生成第一XML文件,所述第一XML文件用于表征输入描述信息;
生成第二XML文件,所述第二XML文件用于表征输入描述信息。
7.一种文件解析装置,其特征在于,包括:
获取模块,用于获取待解析文件的输入描述信息和所述待解析文件的输出描述信息,所述输入描述信息用于描述所述待解析文件的输入格式,所述输出描述信息用于描述所述待解析文件的欲输出格式;
解析模块,用于采用解析程序对所述待解析文件进行解析,且在解析的过程中,在读到关键词的情况下,根据所述关键词之后的目标函数名,调用目标函数,以将所述待解析文件的格式从所述输入格式转换为输出格式,所述目标函数是由所述待解析文件的输入格式和所述待解析文件的欲输出格式决定的。
8.根据权利要求7所述的装置,其特征在于,所述获取模块还包括:
第一生成模块,用于生成第一XML文件,所述第一XML文件用于表示输入描述信息;
第二生成模块,用于生成第二XML文件,所诉第二XML文件用于表述输入描述信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至6中任意一项所述方法。
10.一种文件解析设备,其特征在于,包括:一个或多个存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括用于执行权利要求1至6中任意一项所述的文件解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211249480.6A CN115544304A (zh) | 2022-10-12 | 2022-10-12 | 文件解析方法、装置、可读存储介质及文件解析设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211249480.6A CN115544304A (zh) | 2022-10-12 | 2022-10-12 | 文件解析方法、装置、可读存储介质及文件解析设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115544304A true CN115544304A (zh) | 2022-12-30 |
Family
ID=84733292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211249480.6A Pending CN115544304A (zh) | 2022-10-12 | 2022-10-12 | 文件解析方法、装置、可读存储介质及文件解析设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115544304A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115981798A (zh) * | 2023-03-21 | 2023-04-18 | 北京探境科技有限公司 | 文件解析方法、装置、计算机设备及可读存储介质 |
CN116405091A (zh) * | 2023-04-10 | 2023-07-07 | 北京和德宇航技术有限公司 | 一种遥测数据的解析方法、装置、电子设备及存储介质 |
CN116932626A (zh) * | 2023-07-27 | 2023-10-24 | 北京和德宇航技术有限公司 | 一种数据解析方法、装置、设备及存储介质 |
-
2022
- 2022-10-12 CN CN202211249480.6A patent/CN115544304A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115981798A (zh) * | 2023-03-21 | 2023-04-18 | 北京探境科技有限公司 | 文件解析方法、装置、计算机设备及可读存储介质 |
CN116405091A (zh) * | 2023-04-10 | 2023-07-07 | 北京和德宇航技术有限公司 | 一种遥测数据的解析方法、装置、电子设备及存储介质 |
CN116405091B (zh) * | 2023-04-10 | 2023-12-19 | 北京和德宇航技术有限公司 | 一种遥测数据的解析方法、装置、电子设备及存储介质 |
CN116932626A (zh) * | 2023-07-27 | 2023-10-24 | 北京和德宇航技术有限公司 | 一种数据解析方法、装置、设备及存储介质 |
CN116932626B (zh) * | 2023-07-27 | 2024-04-02 | 北京和德宇航技术有限公司 | 一种数据解析方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115544304A (zh) | 文件解析方法、装置、可读存储介质及文件解析设备 | |
CN110020353B (zh) | 网页表单的构建方法及装置 | |
CN107943465B (zh) | 一种生成html表单的方法及装置 | |
CN112416365A (zh) | 文件转换方法、装置及存储介质 | |
CN110020343B (zh) | 网页编码格式的确定方法和装置 | |
CN114490641A (zh) | 一种工业互联网数据的共享方法、设备及介质 | |
CN109271180B (zh) | 一种数据处理方法及装置 | |
CN111381935A (zh) | 一种基于dsl配置表达式的功能实现方法及系统 | |
CN111078905A (zh) | 一种数据处理方法、装置、介质以及设备 | |
CN112346761B (zh) | 前端资源上线方法、设备、系统及存储介质 | |
CN115470283A (zh) | 数据解析方法、装置、计算机可读存储介质与电子设备 | |
CN107291439B (zh) | 一种目标增量数据构建方法及装置 | |
CN111124399B (zh) | 弹窗组件的处理方法及装置、存储介质及处理器 | |
CN111079392A (zh) | 网页表单自动填写方法、装置、存储介质及电子设备 | |
CN110969461B (zh) | 公众号信息的处理方法及装置、存储介质、处理器 | |
CN112748947A (zh) | 系统的配置方法、装置、存储介质及电子设备 | |
CN110956672A (zh) | 一种营销策略的构建方法及装置 | |
CN110908898B (zh) | 生成测试方案的方法及系统 | |
CN111125998A (zh) | 文本处理方法和装置 | |
CN112445784B (zh) | 一种文本结构化的方法、设备及系统 | |
CN113608803A (zh) | 一种用于多运行环境下实现功能操作的方法与设备 | |
CN112579248A (zh) | 数据生成方法和装置 | |
CN110968709B (zh) | 数据传输方法及相关系统 | |
CN110968756B (zh) | 网页爬取方法及装置 | |
CN110968781B (zh) | 视频页面剧目确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |