CN111611788B - 一种数据处理的方法及装置、电子设备、存储介质 - Google Patents
一种数据处理的方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN111611788B CN111611788B CN202010291796.6A CN202010291796A CN111611788B CN 111611788 B CN111611788 B CN 111611788B CN 202010291796 A CN202010291796 A CN 202010291796A CN 111611788 B CN111611788 B CN 111611788B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- text file
- target
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000003672 processing method Methods 0.000 title abstract description 4
- 238000004458 analytical method Methods 0.000 claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims description 81
- 230000004048 modification Effects 0.000 claims description 55
- 238000012986 modification Methods 0.000 claims description 55
- 238000013075 data extraction Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 17
- 238000013519 translation Methods 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 11
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 230000008520 organization Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 22
- 238000012795 verification Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 101150035574 mcl2 gene Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/162—Delete operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
Abstract
本申请实施例提供了一种数据处理的方法及装置、电子设备、存储介质,所述方法包括:获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;采用所述一个或多个目标数据,生成解析结果数据,实现了在文本解析过程中,同时提取多个目标数据,提高了文本解析效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理的方法及装置、电子设备、存储介质。
背景技术
在现有技术中,可以对采集到的文本数据进行提取,获取特定的内容。在进行数据提取时,可以采用正则表达式对目标内容进行提取。
然而,正则表达式语法复杂晦涩难懂,在使用正则表达式过程中,仅能实现对目标的匹配和提取,无法对提取后的数据进行灵活处理和格式化输出,在复杂规则中效率较低。
发明内容
鉴于上述问题,提出了以便提供克服上述问题或者至少部分地解决上述问题的一种数据处理的方法及装置、电子设备、存储介质,包括:
一种数据处理的方法,所述方法包括:
获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;
按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
采用所述一个或多个目标数据,生成解析结果数据。
可选地,所述按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据的步骤,包括:
生成针对所述文本文件的指针;
确定所述指针的当前位置信息;
当所述配置信息包括提取操作信息时,确定所述提取操作信息对应的提取范围信息;
采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据。
可选地,所述确定所述指针的当前位置信息的步骤,包括:
当所述配置信息包括定位操作信息时,确定所述定位操作信息对应的目标字符串;
判断所述文本文件是否包含所述目标字符串;
当所述文本文件包含所述目标字符串,确定所述目标字符串对应的目标位置信息;
将所述目标位置信息确定为所述指针的当前位置信息。
可选地,所述确定所述指针的当前位置信息的步骤,包括:
当所述配置信息包括移动操作信息时,确定所述移动操作信息对应的移动方式信息;
确定所述指针的初始位置信息;
采用所述初始位置信息和所述移动方式信息,确定所述指针的当前位置信息。
可选地,所述采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据的步骤包括:
采用所述提取范围信息和所述当前位置信息,对所述文本文件执行数据提取操作,得到一个或多个待修改数据;
当所述配置信息包括数据修改信息时,采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据。
可选地,所述数据修改信息为数据替换信息,所述采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据的步骤,包括:
确定针对所述一个或多个待处理数据的替换数据;
采用所述替换数据对所述一个或多个待处理数据进行替换,得到一个或多个目标数据。
可选地,所述配置信息包括以下任一项或多项:
提取操作信息、定位操作信息、移动操作信息、循环操作信息、数据修改信息;
所述数据修改信息包括以下任一项或多项:
数据替换信息、数据翻译信息、数据分割信息、数据删除信息;
所述对所述文本文件执行数据提取操作的步骤,包括:
确定数据提取操作的提取模式;
采用所述提取模式对所述文本文件执行数据提取操作;其中,所述提取模式包括以下任一项或多项:字符模式、词模式、区间模式、列表模式、对象模式。
一种数据处理的装置,所述装置包括:
获取模块,用于获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;
解析操作执行模块,用于按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
解析结果数据生成模块,用于采用所述一个或多个目标数据,生成解析结果数据。
一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据处理的方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理的方法的步骤。
本申请实施例具有以下优点:
在本申请实施例中,通过获取待解析的文本文件和解析模板,解析模板包括针对文本文件进行解析操作的配置信息,按照配置信息,对文本文件执行解析操作,得到一个或多个目标数据,采用一个或多个目标数据,生成解析结果数据,实现了在文本解析过程中,同时提取多个目标数据,提高了文本解析效率。
附图说明
为了更清楚地说明本申请的技术方案,下面将对本申请的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种数据处理的方法的步骤流程图;
图2是本申请一实施例提供的文本解析方法的示意图;
图3是本申请一实施例提供的另一种数据处理的方法的步骤流程图;
图4是本申请一实施例提供的一种数据处理的装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图1,示出了本申请一实施例提供的一种数据处理的方法的步骤流程图,具体可以包括如下步骤:
步骤101,获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;
作为一示例,解析模板可以是采用预设语言格式的模板,配置信息可以包括以下任一项或多项:
提取操作信息、定位操作信息、移动操作信息、循环操作信息、数据修改信息。
其中,提取操作信息可以是Distill(提取)的缩写“D”,定位操作信息可以是Locate(定位)的缩写“L”,移动操作信息可以是Move(移动)的缩写“M”,循环操作信息可以包括“<LOOP>”和“</LOOP>”。
在实际应用中,可以获取待解析的文本文件和解析模板,在解析模板中,可以包括针对文本文件进行解析操作的配置信息。
具体的,待解析的文本文件可以是在设备巡检时采集到的文本数据,文本数据可以具有多样化的存储格式,在对文本文件中的目标数据进行提取时,目标数据可以具有数据特征;或者,在文本文件中,目标数据具有与存储格式对应的分布特征。可以预先针对数据特征或分布特征设置对应的配置信息,并将配置信息存储至解析模板中,在进行文本解析时,获取解析模板。
具体而言,数据特征可以是目标数据的数据组织方式;目标数据的分布特征可以是目标数据在文本文件中的分布特点,如分布特征可以是目标数据对应的标识,其中,该标识可以文本文件中,除目标数据以外的,与目标数据关联的标识,在标识的预设范围内,可以获取目标数据。
例如,待解析的文本文件可以是由设备GE(GigabitEthernet,千兆以太网)接口产生的原始报文,原始报文中包括设备上各个接口对应的主要指标信息,在对主要指标信息进行提取时,各个接口产生的数据都可以以“GigabitEthernet”标识为起始,以“Outputbandwidth utilization”标识为结尾,则可以将“GigabitEthernet”和“Output bandwidthutilization”确定为分布特征,并采用该分布特征设置对应的配置信息。
步骤102,按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
在获取解析模板后,可以按照解析模板中的配置信息,对文本文件进行解析操作,得到一个或多个目标数据。
在具体实现中,可以通过正则表达式对目标数据进行提取,在正则表达式中,采用预先定义的字符或字符串组合组成规则字符串生成逻辑公式,并对文本文件中的字符逐一进行匹配、过滤。
然而,文本文件中的数据可以是多样化的,目标数据并不固定,用户在使用正则表达式前需要学习多种语法规则,并熟知多种符号,导致使用门槛高,针对不同的目标数据,需要设置不同正则表达式,正则表达使用门槛高;并且,无法在数据提取后对数据进行处理和格式化输出。
而在本申请中,可以基于Java语言进行程序开发,通过Java语言开发本申请中用于文本解析的程序,并结合解析模板进行数据提取,能够避免学习过多的语法规则。Java语言具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点。
通过使用Java语言开发的解析模板,无需学习正则表达式过多的语法规则和多种字符串的使用方法,降低了用户在提取目标数据时的门槛。并且,配置信息可以与数据特征或分布特征设置对应,避免多次编辑不同的配置信息。在文本文件解析过程中,通过按照解析模板中的配置信息进行解析操作,可以在一次解析过程中直接提取一个或多个目标数据,避免对字符串进行过滤。
在本申请一实施例中,在步骤102之前,还可以包括如下步骤:
获取预置的模板验证信息;采用所述模板验证信息对所述解析模板进行验证,判断所述解析模板是否符合预设模板格式;若是,则执行步骤102;若否,生成验证失败信息。
在实际应用中,可以获取预置的模板验证信息,并采用模板验证信息对解析模板进行验证,判断解析模板是否符合预设的模板格式。若是,则可以进一步执行步骤102;若否,则可以生成验证失败信息,结束文本文件的解析过程。
在生成验证失败信息时,可以确定模板验证失败的原因,并获取与该原因对应提示信息,添加至验证失败信息中,提示用户根据提示信息进行适应性调整。
步骤103,采用所述一个或多个目标数据,生成解析结果数据。
在提取目标数据后,可以对目标数据进行暂存。在配置信息执行后,可以采用暂存的一个或多个目标数据,生成解析结果数据,进行展示。
在本申请实施例中,通过获取待解析的文本文件和解析模板,解析模板包括针对文本文件进行解析操作的配置信息,按照配置信息,对文本文件执行解析操作,得到一个或多个目标数据,采用一个或多个目标数据,生成解析结果数据,实现了在文本解析过程中,同时提取多个目标数据,提高了文本解析效率。
为了使本领域技术人员能够更好地理解上述步骤,以下通过一个例子对本申请实施例加以示例性说明,但应当理解的是,本申请实施例并不限于此。
如图2所示,在实际应用中,可以加载待解析的文本文件并按行读取文本文件。在获取文本文件后,可以提取与文本文件对应的解析模板,并对解析模板进行验证,使解析模板中的信息可以转化为配置信息,在验证过程中,若解析模板未通过验证,则可以生成验证失败信息,提示解析模板验证失败的原因,并退出文本文件解析过程。
在解析模板验证通过后,则可以从解析模板中获取配置信息并存储。然后,可以执行配置信息对应的解析操作,在执行过程中,可以判断解析操作是否执行成功,若否,可以终止解析过程并输出解析操作执行失败的原因;若是,则可以将执行解析动作后得到的目标数据暂存,并判断解析模板中配置信息对应的解析操作是否均已执行完毕,若是,则可以采用一个或多个目标数据生成解析结果数据,并返回给用户,结束文本文件解析过程;若否,则可以返回执行解析操作对文本文件进行解析的步骤。
参照图3,示出了本申请一实施例提供的另一种数据处理的方法的步骤流程图,具体可以包括如下步骤:
步骤301,获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;
在实际应用中,可以获取待解析的文本文件和解析模板,在解析模板中,可以包括针对文本文件进行解析操作的配置信息。
具体的,解析模板中的配置信息可以是以“<”号起始,“>”号结尾,配置信息可以包括解析操作信息和数据修改信息中的一种或多种,当解析模板中包括多个配置信息时,配置信息可以依次排列,在文本文件的解析过程中,从左向右执行。例如“<LS.M><MCL2>”。
步骤302,生成针对所述文本文件的指针;
作为一示例,指针可以包括词指针或字符指针。
在获取待解析的文本文件后,可以生成针对文本文件的指针。
在实际应用中,指针可以是Java语言中的一个对象,指针可以通过词坐标或字符坐标确定,其中,词坐标可以通过(行号,词索引)表示,词索引为指针在当前行的词组中的位置,由左向右按词数量计算,初始值是1;字符坐标可以通过(行号,字符索引)表示,字符索引为指针在当前行字符内容中的位置,由左向右按字符数量计算,初始值是1。指针初始的字符坐标可以为(1,1),初始的词坐标为(1,1)。
步骤303,确定所述指针的当前位置信息;
在生成针对文本文件的指针后,可以进一步确定指针的当前位置信息。
在实际应用中,在生成指针后,可以对指针进行定位操作或者移动操作,并将定位或者移动后指针的位置信息确定为指针的当前位置信息。或者,也可以将指针初始的字符坐标或者词坐标确定为指针的当前位置信息。
在本申请一实施例中,步骤303可以包括如下子步骤:
当所述配置信息包括定位操作信息时,确定所述定位操作信息对应的目标字符串;判断所述文本文件是否包含所述目标字符串;当所述文本文件包含所述目标字符串,确定所述目标字符串对应的目标位置信息;将所述目标位置信息确定为所述指针的当前位置信息。
当配置信息中包括定位操作信息时,可以从配置信息中,获取定位操作信息对应的目标字符串。在确定目标字符串后,可以采用指针对文本文件进行扫描,读取文本文件中的数据,判断文本文件是否包含目标字符串。
当文本文件包含目标字符串时,可以确定目标字符串对应的目标位置信息,如目标字符串在文本文件中的位置信息,并将目标位置信息确定为指针的当前位置信息,将指针定位至目标字符串对应的位置。
在实际应用中,配置信息中可以包括模式标识,模式标识可以包括以下任一项或多项:
字符标识、字符串标识、词标识、行标识、区间标识、列表标识。
其中,字符(Char)可以是字母、数字、字和符号,字符标识可以是“C”;字符串也可以称为串(String),是由数字、字母、下划线组成的一串字符,字符串标识可以是“S”;文文本件中的词最小的可以是能够独立运用的最小的语言单位,词标识可以是“W”;行(Line)标识可以是“L”,在获取待解析的文本文件时,可以根据文本文件中的换行符(\n)对文本文件按行读取,并确定每一行的行号,行号的初始值可以是1,由上往下计算;区间(Between)标识可以是“B”;列表(List)标识可以是“L”。
具体的,定位操作信息可以是“L”,包括定位操作信息的配置信息可以采用“LS.xxx”的格式。其中,“S”为模式标识,“.”为分隔符;“xxx”为定位操作信息对应的目标字符串。
在获取该配置信息时,可以将指针向右扫描至行末尾,若当前行中未获取与“xxx”匹配的字符串,则扫描下一行,直至匹配或到达文本文件的末尾;在匹配成功时,确定文本文件包含目标字符串,可以将指针的当前位置信息更新为“xxx”对应的目标位置信息,在更新时,可以更新“行号”、“词索引”和“字符索引”的值。若扫描结束均未匹配,则可以确定文本文件中不包含目标字符串,指针位置可以保持不变。
在本申请另一实施例中,步骤303可以包括如下子步骤:
当所述配置信息包括移动操作信息时,确定所述移动操作信息对应的移动方式信息;确定所述指针的初始位置信息;采用所述初始位置信息和所述移动方式信息,确定所述指针的当前位置信息。
作为一示例,移动方式信息可以包括方向标识、移动单位和操作数,其中,可以采用模式标识确定指针的移动单位,例如按字符移动、按词移动或者按行移动。
在具体实现中,当配置信息包括移动操作信息时,可以在配置信息中确定移动操作信息对应的移动方式信息,并确定指针的初始位置信息,进而可以基于初始位置信息,结合移动方式信息对指针进行移动,将移动后指针的位置信息确定为指针的当前位置信息。
当模式标识为字符标识时,可以按照方向标识对应的方向,以字符为单位移动与操作数对应的字符数。例如,配置信息的格式可以是“MC[L|R]n”,其中,“L”(Left)为向左移动,“R”(Right)为向右移动,可以选取“L”或者“R”作为方向标识,并将指针移动与操作数n对应的字符数。当操作数为0,方向标识为L时,可以移动指针至当前行的首个字符的位置;当操作数为0,方向标识为R时,可以移动指针至当前行的最后一个字符的位置。
当模式标识为词标识时,可以按照方向标识对应的方向,以词为单位移动与操作数对应的词数。例如,配置信息的格式可以是“MW[L|R]n”,其中,其中,“L”(Left)为向左移动,“R”(Right)为向右移动,可以选取“L”或者“R”作为方向标识,并将指针移动与操作数对应的词数。当操作数为0,方向标识为L时,可以移动指针至当前行的首个词的位置;当操作数为0,方向标识为R时,可以移动指针至当前行的最后一个词的位置。
当模式标识为行标识时,可以按照方向标识对应的方向,以行为单位移动与操作数对应的词行数。例如,配置信息的格式可以是“ML[U|D]n”,其中,“U”(Up)为向上移动,“D”(Down)为向下移动,可以选取“U”或者“D”作为方向标识,并将指针移动与操作数对应的行数。当操作数为0,方向标识为U时,可以移动指针至文本文件的首行;当操作数为0,方向标识为D时,可以移动指针至文本文件的末行。在按行移动后,可以将“词索引”和“字符索引”修改为初始值1,可以更快捷清晰地确定“词索引”和“字符索引”值。
步骤304,当所述配置信息包括提取操作信息时,确定所述提取操作信息对应的提取范围信息;
作为一示例,提取范围信息可以包括提取单位、方向标识和操作数,其中,可以采用模式标识确定提取单位,例如按字符提取、按词提取,或者按列表提取。
在确定指针的当前位置信息后,当配置信息包括提取操作信息,可以从配置信息中,确定提取操作信息对应的提取范围信息。
步骤305,采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
在确定提取范围信息后,可以基于当前位置信息,在提取范围信息对应的范围内,对文本文件执行解析操作,得到一个或多个目标数据。具体的,在进行提取时,可以基于当前位置信息,按照方向标识,提取与操作数和提取单位对应的目标数据。
在本申请一实施例中,所述对所述文本文件执行数据提取操作的步骤可以包括如下子步骤:
确定数据提取操作的提取模式;采用所述提取模式对所述文本文件执行数据提取操作;其中,所述提取模式包括以下任一项或多项:字符模式、词模式、区间模式、列表模式、对象模式。
在具体实现中,可以采用不同的模式进行数据提取,在对文本文件执行数据提取操作时,可以确定数据提取操作当前的提取模式,并在确定提取模式后,按照提取模式对文本文件进行数据提取操作,对文本文件提取字符、提取词、提取区间、提取列表或提取对象。
例如,当模式标识为字符标识,确定提取模式为字符模式,配置信息的格式可以为“DC[L|R]n.kye”,其中,“L”(Left)为向左提取,“R”(Right)为向右提取,可以选取“L”或者“R”作为方向标识,key为存储目标数据的键名称。当方向标识为“L”,n为0时,可以从指针的当前位置按字符提取至当前行的首个字符间的字符数据,确定为目标数据;若方向标识为“R”,n为0,则可以从当前位置按字符提取至当前行的最后一个字符间的所有词数据;若n为正整数,可以从指针的当前位置,按照方向标识对应的方向提取与n对应的字符数。
又如,当模式标识为词标识,确定提取模式为词模式,配置信息的格式可以为“DW[L|R]n.kye”,其中,“L”(Left)为向左提取,“R”(Right)为向右提取,可以选取“L”或者“R”作为方向标识,key为存储目标数据的键名称。当方向标识为“L”,n为0时,可以从指针的当前位置按词提取至当前行的首个词间的词数据,确定为目标数据;当方向标识为“R”,n为0,则可以从当前位置按词提取至当前行的最后一个词间的所有词数据;若n为正整数,可以从指针的当前位置按字符提取与n对应的词数。
或者,当模式标识为列表标识,确定提取模式为列表模式,配置信息的格式可以为“DL[U|D]n(MAX=最大列数,MIN=最小列数,FILTER=过滤标识,列号=列名,列号=列名)”。当方向标识为“U”,n为0时,可以从指针当前位置所在行至首行的范围中提取目标数据;若方向标识为“D”,n为0时,可以从指针当前位置所在行至末尾行的范围中提取目标数据;若n为正整数,可以从指针当前位置所在行,以及与操作数n和方向标识对应的范围中,提取目标数据。
在该模式下,可以针对操作数范围内的数据,设置提取规则,例如,“(MAX=最大列数,MIN=最小列数,FILTER=过滤标识,列号=列名,列号=列名)”为在操作范围标识对应的操作范围中,目标数据的提取规则。
其中,“MAX”可以是最大列数,“MIN”可以是最小列数,若操作范围中的数据满足MIN≤当前行的列数≤MAX,则可以对该行的数据进行提取。“FILTER”为可选内容,若在提取规则中增加该信息,则在满足MIN≤当前行的列数≤MAX且当前内容不包含“过滤标识”时,对数据进行提取。“列号”可以是需要提取的列对应的号数,初始值可以是1;“列名”可以是存储目标数据的键名称;若需提取多列则,可以使用“,”进行分隔。
在本申请的另一示例中,在按照配置信息,对文本文件执行解析操作,得到一个或多个目标数据的步骤中,在区间模式下,提取操作信息对应的提取范围信息包括起始位置标识和末尾位置标识时,可以确定起始位置标识在文本文件中对应的起始位置,以及末尾位置标识在文本文件中对应的末尾位置,直接在起始位置和末尾位置所确定的区间范围中进行数据提取。
例如,配置信息可以是“DB[Y|N](startFlag,endFlag,stopFlag).key”,其中,“startFlag”可以是起始位置标识,“startFlag”可以是末尾位置标识,在进行数据提取时,提取以“startFlag”开始,“endFlag”结束的目标数据,达到提取区间以内一个或多个目标数据的效果。
其中,[Y|N]可以是“判断标识”,Y(Yes)表示包含标识,N(No)表示不包含标识,可以选择Y或N;若为Y,在提取目标数据是时,可以包含“startFlag”和“endFlag”对应的数据,若为N,则可以不包含“startFlag”和“endFlag”对应的数据。
“stopFlag”可以是停止标识,为可选内容。若配置停止标识,在匹配“stopFlag”对应的数据前均未找到“startFlag”和“endFlag”则返回“”内容;若找到“startFlag”但未找到“endFlag”,同样返回“”内容,该标识可以用于停止查找,防止数据提取错误并优化处理速度。“.”为分隔符,key可以是为存储目标数据的键名称。
在一示例中,在对象模式中,可以将多个解析操作提取到的目标数据封装在对象中,例如,可以将定位、移动、提取等动作封装在一个对象中,具体的,对象提取可以是以<OBJECT>标签开始,</OBJECT>标签结束。
在配置信息包括循环操作信息时,可以重复执行解析操作信息,例如,可以以开始标签“<LOOP>”开始,以开始结束标签“</LOOP>”结束,组成循环体。开始标签与结束标签之间的解析操作信息可以是循环执行的操作。在实际应用中,在循环体中的解析操作信息执行完毕后,可以将指针移动至下一行;为了避免死循环,可以针对循环设置执行次数阈值,执行循环体中解析操作信息的次数可以小于执行次数阈值。
在本申请中,通过执行定位、移动、提取和循环四种解析操作,可以对数据进行提取,在一次解析过程中,可以提取一个或多个目标数据,当提取多个目标数据时,目标数据可以是连续或不连续的。并且,通过配置信息可以在文本文件中进行定位,直接提取目标数据,避免处理和匹配过多的逻辑规则,提高了对文本文件的提取性能,缩短了文本解析过程的响应周期。
在本申请一实施例中,步骤305可以包括如下子步骤:
子步骤11,采用所述提取范围信息和所述当前位置信息,对所述文本文件执行数据提取操作,得到一个或多个待修改数据;
在确定提取范围信息后,可以基于当前位置信息,在提取范围信息对应的范围内,对文本文件执行解析操作,得到一个或多个待修改数据。具体的,在进行提取时,可以基于当前位置信息,按照方向标识,提取与操作数和提取单位对应的待修改数据。
子步骤12,当所述配置信息包括数据修改信息时,采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据。
作为一示例,数据修改信息可以包括以下任一项或多项:
数据替换信息,数据翻译信息,数据分割信息,数据删除信息。
具体的,当配置信息中包括数据修改信息时,可以采用数据修改信息对一个或多个待修改数据进行修改,得到一个或多个目标数据。
在实际应用中,虽然可以采用正则表达式对文本文件中的字符或字符串进行过滤以获取数据,但在获取数据后,并没有进一步对数据进行处理,导致用户还需要对已获取的数据进行额外处理。而在本申请中,在获取待修改数据后,可以采用数据修改信息对目标数据待修改数据进行修改,获取目标数据。
在设置数据修改信息时,可以在提取操作信息后通过“~”连接数据修改信息,如“DB[Y|N](startFlag,endFlag,stopFlag).key~{数据修改信息}”。
在本申请一实施例中,数据修改信息可以是数据替换信息,所述采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据的步骤,可以包括如下子步骤:
确定针对所述一个或多个待处理数据的替换数据;采用所述替换数据对所述一个或多个待处理数据进行替换,得到一个或多个目标数据。
在获取数据修改信息后,可以在数据修改信息中确定针对目标数据的替换数据,并采用替换数据对目标数据进行替换,生成解析结果信息。
具体的,可以在提取字符、词、列表或区间值时,对待修改数据进行数据替换。
数据修改信息可以是“R[key:目标字符串,替换字符串]”格式,其中,“R”为数据替换(Replace)信息,“key”可以是进行替换操作的待修改数据的键名称,“目标字符串”是待修改数据中需要被替换的数据,“替换字符串”可以是替换“目标字符串”的数据,在替换数据为空时,则可以不设置“替换字符串”。
例如“<DWR1.CPU~{R[CPU:%,];}>”,通过执行解析操作信息“DWR1.CPU”后,可以获取键名称为CPU的目标数据“25%”,在确定数据修改信息为“{R[CPU:%,];}”后,可以得到解析结果信息“[{"CPU":"25"}]”。
在本申请一实施例中,数据修改信息可以是数据翻译信息,所述采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据的步骤,可以包括如下子步骤:
从所述数据修改信息中获取数据翻译模板;其中,所述数据翻译模板包含预设键名信息;确定所述一个或多个待修改数据对应的目标键名信息;当所述预设键名信息与所述目标键名信息匹配时,采用所述待修改数据和所述数据翻译模板生成一个或多个目标数据。
在获取数据修改信息后,可以在数据修改信息为数据翻译信息时,从数据修改信息中获取数据翻译模板,数据翻译模板中可以包括预设键名信息。例如,数据修改信息可以为“T[(待翻译内容@key).finalKey]”的格式,其中,T为数据翻译信息,数据翻译模板可以是“待翻译内容@key”,“key”可以是预设键名信息,“finalKey”是存储翻译后的解析结果信息的键名称。
在获取预设键名信息后,可以确定待修改数据对应的目标键名信息,目标键名信息可以是存储待修改数据的键名称。
当预设键名信息与目标键名信息匹配时,可以采用待修改数据和数据翻译模板生成解析结果信息,具体的,可以采用待修改数据替换数据翻译模板中的“预设键名信息”。
在具体实现中,可以在提取字符、词、列表或区间值时,对目标数据进行数据翻译。例如,已提取到目标数据“M N O”,存储目标数据的键名称为“data”,数据翻译模板为“(提取到的内容是@data).desc”,则可以获取解析结果信息“提取到的内容是M N O”,解析结果信息的键名称为“desc”。
在本申请一实施例中,数据修改信息可以是数据分割信息,所述采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据的步骤,可以包括如下子步骤:
确定所述数据分割信息对应的分隔符;在所述一个或多个待修改数据中,确定所述分隔符对应的分割位置信息;采用所述分割位置信息对所述一个或多个待修改数据进行分割,得到一个或多个目标数据。
在获取数据修改信息后,可以在数据修改信息包括数据分割信息时,从数据修改信息中确定数据分割信息对应的分隔符,并确定一个或多个待修改数据中分隔符对应的分割位置信息。在确定分割位置信息后,可以在分割位置信息对应的位置对待修改数据进行分割,生成一个或多个目标数据。
例如,数据修改信息可以是“S[key:分割符(下标号=存储键名,下标号=存储键名)]”的格式,其中,“S”可以是数据分割信息,“key”可以是待修改数据的键名称,“下标号”可以是分割后产生的数据顺序标识,初始值可以为1,“存储键名”可以是分割后下标号对应的数据存储的键名称。
在具体实现中,可以在提取字符、词、列表或区间值时,对目标数据进行数据分割。例如配置信息为“<DWR3.data~{S[data:(1=M,2=N)];}>”,执行该配置信息对应的解析操作后,可以生成如下目标数据:
在本申请另一实施例中,当数据修改信息包括数据删除信息时,可以从数据修改信息中获取待删除数据的键名称。
在实际应用中,在提取待修改数据后,可以将待修改数据存储在一个或多个指定的键名称中,则在对待修改数据进行修改时,可以获取待删除数据的键名称,若待删除数据的键名称与待修改数据的键名称匹配,可以删除该键名称对应的待修改数据。
例如,数据删除信息可以是“D[key]”的格式,其中,“key”可以是待删除数据的键名称。在具体实现中,可以在提取字符、词、列表或区间值时,对目标数据进行删除。
步骤306,采用所述一个或多个目标数据,生成解析结果数据。
在本申请实施例中,通过生成针对文本文件的指针,确定指针的当前位置信息,当配置信息包括提取操作信息时,确定提取操作信息对应的操作范围信息,采用操作范围信息和当前位置信息,对文本文件执行解析操作,得到一个或多个目标数据,采用一个或多个目标数据,生成解析结果数据,实现了通过配置信息对目标数据进行提取,可以在确定指针当前位置信息后,直接提取指针对应操作范围内的一个或多个目标数据,避免匹配多种过滤逻辑,提高了解析过程中的数据提取效率,缩短了文本解析的响应周期。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图4,示出了本申请一实施例提供的一种数据处理的装置的结构示意图,具体可以包括如下模块:
获取模块401,用于获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;
解析操作执行模块402,用于按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
解析结果数据生成模块403,用于采用所述一个或多个目标数据,生成解析结果数据。
在本申请一实施例中,所述解析操作执行模块402包括:
指针生成子模块,用于生成针对所述文本文件的指针;
当前位置信息确定子模块,用于确定所述指针的当前位置信息;
范围信息确定子模块,用于当所述配置信息包括提取操作信息时,确定所述提取操作信息对应的提取范围信息;
目标数据获取子模块,用于采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据。
在本申请一实施例中,所述当前位置信息确定子模块包括:
目标字符串确定单元,用于当所述配置信息包括定位操作信息时,确定所述定位操作信息对应的目标字符串;
判断单元,用于判断所述文本文件是否包含所述目标字符串;
目标位置信息确定单元,用于当所述文本文件包含所述目标字符串,确定所述目标字符串对应的目标位置信息;
第一确定单元,用于将所述目标位置信息确定为所述指针的当前位置信息。
在本申请一实施例中,所述当前位置信息确定子模块包括:
移动方式信息确定单元,用于当所述配置信息包括移动操作信息时,确定所述移动操作信息对应的移动方式信息;
移动方式信息确定单元,用于确定所述指针的初始位置信息;
第二确定单元,用于采用所述初始位置信息和所述移动方式信息,确定所述指针的当前位置信息。
在本申请一实施例中,所述目标数据获取子模块包括:
待修改数据获取单元,用于采用所述提取范围信息和所述当前位置信息,对所述文本文件执行数据提取操作,得到一个或多个待修改数据;
修改单元,用于当所述配置信息包括数据修改信息时,采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据。
在本申请另一实施例中,所述数据修改信息为数据替换信息,所述修改单元包括:
替换数据确定子单元,用于确定针对所述一个或多个待处理数据的替换数据;
替换子单元,用于采用所述替换数据对所述一个或多个待处理数据进行替换,得到一个或多个目标数据。
在本申请另一实施例中,所述配置信息包括以下任一项或多项:
提取操作信息、定位操作信息、移动操作信息、循环操作信息、数据修改信息;
所述数据修改信息包括以下任一项或多项:
数据替换信息、数据翻译信息、数据分割信息、数据删除信息;
所述待修改数据获取单元包括:
提取模式确定子单元,用于确定数据提取操作的提取模式;
数据提取子单元,用于采用所述提取模式对所述文本文件执行数据提取操作;其中,所述提取模式包括以下任一项或多项:字符模式、词模式、区间模式、列表模式、对象模式。
在本申请实施例中,通过获取待解析的文本文件和解析模板,解析模板包括针对文本文件进行解析操作的配置信息,按照配置信息,对文本文件执行解析操作,得到一个或多个目标数据,采用一个或多个目标数据,生成解析结果数据,实现了在文本解析过程中,同时提取多个目标数据,提高了文本解析效率。
本申请一实施例还提供了一种电子设备,可以包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上数据处理的方法的步骤。
本申请一实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上数据处理的方法的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对所提供的一种数据处理的方法及装置、电子设备、存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种数据处理的方法,其特征在于,所述方法包括:
获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;其中,所述配置信息与所述文本文件中目标数据的数据特征和/或分布特征对应,且包括以下一种或多种:提取操作信息、定位操作信息、移动操作信息、循环操作信息、数据修改信息;所述数据特征包括所述目标数据的数据组织方式;所述分布特征包括与所述目标数据关联的标识,所述标识用于在所述标识的预设范围内获取所述目标数据;
按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
采用所述一个或多个目标数据,生成解析结果数据;
所述按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据,包括:
生成针对所述文本文件的指针;
确定所述指针的当前位置信息;
当所述配置信息包括提取操作信息时,确定所述提取操作信息对应的提取范围信息;
采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据。
2.根据权利要求1所述的方法,其特征在于,所述确定所述指针的当前位置信息的步骤,包括:
当所述配置信息包括定位操作信息时,确定所述定位操作信息对应的目标字符串;
判断所述文本文件是否包含所述目标字符串;
当所述文本文件包含所述目标字符串,确定所述目标字符串对应的目标位置信息;
将所述目标位置信息确定为所述指针的当前位置信息。
3.根据权利要求1所述的方法,其特征在于,所述确定所述指针的当前位置信息的步骤,包括:
当所述配置信息包括移动操作信息时,确定所述移动操作信息对应的移动方式信息;
确定所述指针的初始位置信息;
采用所述初始位置信息和所述移动方式信息,确定所述指针的当前位置信息。
4.根据权利要求1所述的方法,其特征在于,所述采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据的步骤包括:
采用所述提取范围信息和所述当前位置信息,对所述文本文件执行数据提取操作,得到一个或多个待修改数据;
当所述配置信息包括数据修改信息时,采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据。
5.根据权利要求4所述的方法,其特征在于,所述数据修改信息为数据替换信息,所述采用所述数据修改信息对所述一个或多个待修改数据进行修改,得到一个或多个目标数据的步骤,包括:
确定针对所述一个或多个待处理数据的替换数据;
采用所述替换数据对所述一个或多个待处理数据进行替换,得到一个或多个目标数据。
6.根据权利要求4所述的方法,其特征在于,所述数据修改信息包括以下任一项或多项:
数据替换信息、数据翻译信息、数据分割信息、数据删除信息;
所述对所述文本文件执行数据提取操作的步骤,包括:
确定数据提取操作的提取模式;
采用所述提取模式对所述文本文件执行数据提取操作;其中,所述提取模式包括以下任一项或多项:字符模式、词模式、区间模式、列表模式、对象模式。
7.一种数据处理的装置,其特征在于,所述装置包括:
获取模块,用于获取待解析的文本文件和解析模板;所述解析模板包括针对所述文本文件进行解析操作的配置信息;其中,所述配置信息与所述文本文件中目标数据的数据特征和/或分布特征对应,且包括以下一种或多种:提取操作信息、定位操作信息、移动操作信息、循环操作信息、数据修改信息;所述数据特征包括所述目标数据的数据组织方式;所述分布特征包括与所述目标数据关联的标识,所述标识用于在所述标识的预设范围内获取所述目标数据;
解析操作执行模块,用于按照所述配置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据;
解析结果数据生成模块,用于采用所述一个或多个目标数据,生成解析结果数据;
所述解析操作执行模块包括:
指针生成子模块,用于生成针对所述文本文件的指针;
当前位置信息确定子模块,用于确定所述指针的当前位置信息;
范围信息确定子模块,用于当所述配置信息包括提取操作信息时,确定所述提取操作信息对应的提取范围信息;
目标数据获取子模块,用于采用所述提取范围信息和所述当前位置信息,对所述文本文件执行所述解析操作,得到一个或多个目标数据。
8.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的数据处理的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的数据处理的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010291796.6A CN111611788B (zh) | 2020-04-14 | 2020-04-14 | 一种数据处理的方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010291796.6A CN111611788B (zh) | 2020-04-14 | 2020-04-14 | 一种数据处理的方法及装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611788A CN111611788A (zh) | 2020-09-01 |
CN111611788B true CN111611788B (zh) | 2024-02-09 |
Family
ID=72205608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010291796.6A Active CN111611788B (zh) | 2020-04-14 | 2020-04-14 | 一种数据处理的方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611788B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112486479A (zh) * | 2020-11-30 | 2021-03-12 | 浙江中控技术股份有限公司 | 一种数据采集方法及装置 |
CN112560038A (zh) * | 2020-12-24 | 2021-03-26 | 深信服科技股份有限公司 | 一种数据解析方法、装置、设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177045A (zh) * | 2011-12-26 | 2013-06-26 | 中国移动通信集团广东有限公司 | 文本解析方法及装置 |
CN106919542A (zh) * | 2015-12-24 | 2017-07-04 | 北京国双科技有限公司 | 规则匹配方法及装置 |
CN107203504A (zh) * | 2017-05-18 | 2017-09-26 | 北京京东尚科信息技术有限公司 | 字符串替换方法和装置 |
CN107506190A (zh) * | 2017-08-16 | 2017-12-22 | 中国银行股份有限公司 | 基于Spring框架的XML文件修改方法及装置 |
CN108804140A (zh) * | 2018-06-15 | 2018-11-13 | 中国建设银行股份有限公司 | 一种批量指令解析方法、装置及设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005032047A (ja) * | 2003-07-08 | 2005-02-03 | Yoshihide Kobayashi | ファイル自動生成装置、方法、プログラム及び記憶媒体 |
US7663511B2 (en) * | 2008-06-18 | 2010-02-16 | Microsoft Corporation | Dynamic character encoding |
-
2020
- 2020-04-14 CN CN202010291796.6A patent/CN111611788B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177045A (zh) * | 2011-12-26 | 2013-06-26 | 中国移动通信集团广东有限公司 | 文本解析方法及装置 |
CN106919542A (zh) * | 2015-12-24 | 2017-07-04 | 北京国双科技有限公司 | 规则匹配方法及装置 |
CN107203504A (zh) * | 2017-05-18 | 2017-09-26 | 北京京东尚科信息技术有限公司 | 字符串替换方法和装置 |
CN107506190A (zh) * | 2017-08-16 | 2017-12-22 | 中国银行股份有限公司 | 基于Spring框架的XML文件修改方法及装置 |
CN108804140A (zh) * | 2018-06-15 | 2018-11-13 | 中国建设银行股份有限公司 | 一种批量指令解析方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111611788A (zh) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177184A (zh) | 基于自然语言的结构化查询语言转换方法、及其相关设备 | |
CN108959257B (zh) | 一种自然语言解析方法、装置、服务器及存储介质 | |
CN107729526B (zh) | 一种文本结构化的方法 | |
CN107341102B (zh) | 一种测试用例文件生成方法及装置 | |
CN111611788B (zh) | 一种数据处理的方法及装置、电子设备、存储介质 | |
CN107885501B (zh) | 获取Android中组件相互引用关系的方法及装置 | |
CN110007906B (zh) | 脚本文件的处理方法、装置和服务器 | |
CN112579466A (zh) | 测试用例的生成方法、装置及计算机可读存储介质 | |
CN110347390B (zh) | 一种快速生成web页面的方法、存储介质、设备及系统 | |
CN114238575A (zh) | 文档解析方法、系统、计算机设备及计算机可读存储介质 | |
CN111159497A (zh) | 正则表达式的生成方法及基于正则表达式的数据提取方法 | |
CN109753976B (zh) | 语料标注装置和方法 | |
CN113419721B (zh) | 基于web的表达式编辑方法、装置、设备和存储介质 | |
CN115796146A (zh) | 一种文件对比方法及装置 | |
CN111061927B (zh) | 数据处理方法、装置及电子设备 | |
CN111401005B (zh) | 文本转换方法、装置及可读存储介质 | |
US10853559B2 (en) | Symmetric text replacement | |
CN110554860B (zh) | 一种软件项目自然语言编程接口nli的构造方法及代码生成方法 | |
CN112925874A (zh) | 基于案例标记的相似代码搜索方法及系统 | |
JP2017091024A (ja) | 入力支援装置 | |
CN117033464B (zh) | 一种基于聚类的日志并行解析算法及应用 | |
CN113408250B (zh) | 一种项目文件的处理方法和装置 | |
CN115951891A (zh) | 代码克隆检测方法、装置、终端设备与可读存储介质 | |
CN113778426B (zh) | 一种页面生成方法和装置 | |
CN110825376B (zh) | 一种解析带注释json文件的方法、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |