CN115099216A - 一种统一文本解析方法及装置 - Google Patents

一种统一文本解析方法及装置 Download PDF

Info

Publication number
CN115099216A
CN115099216A CN202210741628.1A CN202210741628A CN115099216A CN 115099216 A CN115099216 A CN 115099216A CN 202210741628 A CN202210741628 A CN 202210741628A CN 115099216 A CN115099216 A CN 115099216A
Authority
CN
China
Prior art keywords
text
analyzed
analysis
parsing
unified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210741628.1A
Other languages
English (en)
Inventor
张剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202210741628.1A priority Critical patent/CN115099216A/zh
Publication of CN115099216A publication Critical patent/CN115099216A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请实施例提供一种统一文本解析方法及装置,该统一文本解析方法包括:获取待解析文本集合;识别待解析文本集合中每个文本的文本类型;根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合;通过解析策略集合对待解析文本集合进行解析,得到解析数据集合。可见,实施这种实施方式,能够一次性解析不同类型的文本解析,避免频繁的导入导出,有利于提升文本解析效率。

Description

一种统一文本解析方法及装置
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种统一文本解析方法及装置。
背景技术
系统日常业务中,经常需要批量导入文本和导出报表的菜单功能,因此程序员们会高频次的接触文本解析和生成文本的需求开发。现有的统一文本解析方法中,通常需要对应的解析方式来解析对应的文本文件,然而,在实践中发现,现有方法一次只能解析一个或者多个同类型的文本文件,当有多个不同类型的文本时,需要引入不同的解析工具进行解析,从而导致频繁的导入导出,降低了文本解析效率。
发明内容
本申请实施例的目的在于提供一种统一文本解析方法及装置,能够一次性解析不同类型的文本解析,避免频繁的导入导出,有利于提升文本解析效率。
本申请实施例第一方面提供了一种统一文本解析方法,包括:
获取待解析文本集合;
识别所述待解析文本集合中每个文本的文本类型;
根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合;
通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合。
在上述实现过程中,该方法可以先获取待解析文本集合;然后再识别待解析文本集合中每个文本的文本类型;并根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合;最后再通过解析策略集合对待解析文本集合进行解析,得到解析数据集合。可见,该方法能够一次性解析不同类型的文本解析,避免频繁的导入导出,有利于提升文本解析效率。
进一步地,识别所述待解析文本集合中每个文本的文本类型,包括:
识别所述待解析文本集合中每个文本的后缀名;
根据所述后缀名确定所述待解析文本集合中每个文本的文本类型。
进一步地,根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合,包括:
根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合中每个文本相匹配的目标解析策略;
解析所述目标解析策略,得到所述待解析文本集合中每个文本相匹配的目标解析方法;
获取所述待解析文本集合中每个文本的文本顺序;
将所述目标解析方法按照所述文本顺序生成解析策略集合。
进一步地,通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合,包括:
通过所述解析策略集合中每个文本相匹配的目标解析方法,对相应文本进行解析,得到解析数据;
按照所述文本顺序汇总所有解析数据,得到解析数据集合。
进一步地,所述解析数据的数据格式为List<Map<k,v>>格式,其中k表示第一行字段名,v为对应字段值。
本申请实施例第二方面提供了一种统一文本解析装置,所述统一文本解析装置包括:
获取单元,用于获取待解析文本集合;
识别单元,用于识别所述待解析文本集合中每个文本的文本类型;
匹配单元,用于根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合;
解析单元,用于通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合。
在上述实现过程中,该统一文本解析装置可以通过获取单元获取待解析文本集合;然后通过识别单元识别待解析文本集合中每个文本的文本类型;再通过匹配单元来根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合;最后再通过解析单元基于解析策略集合对待解析文本集合进行解析,得到解析数据集合。可见,该装置能够一次性解析不同类型的文本解析,避免频繁的导入导出,有利于提升文本解析效率。
进一步地,所述识别单元包括:
识别子单元,用于识别所述待解析文本集合中每个文本的后缀名;
确定子单元,用于根据所述后缀名确定所述待解析文本集合中每个文本的文本类型。
进一步地,所述匹配单元包括:
匹配子单元,用于根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合中每个文本相匹配的目标解析策略;
策略解析子单元,用于解析所述目标解析策略,得到所述待解析文本集合中每个文本相匹配的目标解析方法;
生成子单元,用于获取所述待解析文本集合中每个文本的文本顺序;以及将所述目标解析方法按照所述文本顺序生成解析策略集合。
进一步地,解析单元包括:
文本解析子单元,用于通过所述解析策略集合中每个文本相匹配的目标解析方法,对相应文本进行解析,得到解析数据;
汇总子单元,用于按照所述文本顺序汇总所有解析数据,得到解析数据集合。
进一步地,所述解析数据的数据格式为List<Map<k,v>>格式,其中k表示第一行字段名,v为对应字段值。
本申请实施例第三方面提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例第一方面中任一项所述的统一文本解析方法。
本申请实施例第四方面提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例第一方面中任一项所述的统一文本解析方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种统一文本解析方法的流程示意图;
图2为本申请实施例提供的另一种统一文本解析方法的流程示意图;
图3为本申请实施例提供的一种统一文本解析方法的举例示意图;
图4为本申请实施例提供的一种统一文本解析装置的结构示意图;
图5为本申请实施例提供的另一种统一文本解析装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
请参看图1,图1为本申请实施例提供了一种统一文本解析方法的流程示意图。其中,该统一文本解析方法包括:
S101、获取待解析文本集合。
本实施例中,该方法预先获取待解析的文本集合。其中,待解析文本集合包括至少一个待解析的文本。
S102、识别待解析文本集合中每个文本的文本类型。
本实施例中,该方法可以自主识别每个文本的文本类型,其中文本类型包括txt,csv,xls,xlsx。
S103、根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合。
本实施例中,该方法可以基于不同的文本类型适配相应的解析策略。
S104、通过解析策略集合对待解析文本集合进行解析,得到解析数据集合。
本实施例中,该方法可以通过匹配出来的解析策略进行对应的文本解析,从而得到解析数据集合,进而实现统一文本解析的效果。
应当了解的是,目前在系统日常业务中,经常需要批量导入文本和导出报表的菜单功能,这使得程序员们会高频次的接触文本解析和生成文本的需求开发。但由于文本存在多种格式(例如txt,csv,xls,xlsx等),每种格式又需要用不同的解析方式。具体的,txt格式文本用文件流读取解析,而xls、xlsx格式的文本需要引入特定的jar包(poi),再用提供的方法进行解析。可见,目前的程序中会出现很多功能相似但重复冗余的代码。因此,本实施例提出了一种统一文本解析方法来解决这一痛点。
本申请实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本申请实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。
可见,实施本实施例所描述的统一文本解析方法,能够通过统一文本解析策略引入一个jar包来处理多种文本类型的数据。具体的,通过实施本实施例所描述的统一文本解析方法,能够大大减少了重复冗余的代码,使导入导出这一频繁和较为费时的功能编程,很简单地通过配置一些自定义参数来实现。从而能够较大程度地减轻开发人员的工作量,进而提高整体开发效率。
实施例2
请参看图2,图2为本申请实施例提供了一种统一文本解析方法的流程示意图。其中,该统一文本解析方法包括:
S201、获取待解析文本集合。
本实施例中,该方法预先获取待解析的文本集合。其中,待解析文本集合包括至少一个待解析的文本。
S202、识别待解析文本集合中每个文本的后缀名。
本实施例中,该方法可以通过识别每个文本的后缀名来确定每个文本的文本类型。
S203、根据后缀名确定待解析文本集合中每个文本的文本类型。
本实施例中,后缀名包括txt,csv,xls,xlsx。
在本实施例中,该方法在识别不同的文本,并适配相应的解析策略的过程中,可以调用统一文本解析策略的jar包的方法parse(file),识别文本对应的后缀名,然后再通过后缀名来匹配对应的解析策略。
S204、根据文本类型和预存的统一解析策略库匹配与待解析文本集合中每个文本相匹配的目标解析策略。
本实施例中,该方法在程序代码中引入统一解析策略jar包one-parase-strategy.jar。以java为例,该方法可以在maven包引入one-parase-strategy Jar包依赖。
在本实施例中,预存的统一解析策略库可以为预先引入的统一解析策略jar包one-parase-strategy.jar。
S205、解析目标解析策略,得到待解析文本集合中每个文本相匹配的目标解析方法。
本实施例中,该步骤目的是在目标解析策略中匹配每个文本的目标解析方法。具体的,txt匹配到目标解析方法0,csv匹配到目标解析方法1,xls匹配到目标解析方法2,xlsx匹配倒目标解析方法3。
举例来说,基于目标解析方法0,该方法对文本第一行字段名使用数组a[]进行保存,字段可以使用任意英文符号截取,该方法中只需设置策略strategy.setSplitLine(“|”)读取在后的行,存入map。然后再以第一行的字段名为k,value为读取的对应的列值。直到读取完毕,将其存入List<Map<k,v>>。
S206、获取待解析文本集合中每个文本的文本顺序。
S207、将目标解析方法按照文本顺序生成解析策略集合。
本实施例中,该方法可以基于文本顺序生成对应的解析策略集合,从而使得两者之间相互契合,便于数据读取与处理。
S208、通过解析策略集合中每个文本相匹配的目标解析方法,对相应文本进行解析,得到解析数据。
本实施例中,解析数据的数据格式为List<Map<k,v>>格式,其中k表示第一行字段名,v为对应字段值。
S209、按照文本顺序汇总所有解析数据,得到解析数据集合。
请参阅图3,图3示出了一种统一文本解析方法的举例示意图。其中,该图表示除了用文本解析策略导出对应的文本的过程。具体的,该方法调用export(List<Map<k,v>>),并设置好对应的后缀名。然后再根据不同策略生成对应的文本,并在最后第一行为列名,之后行分别对应列值。同理,该图中示出了反向处理的解析举例过程,基于相同的统一文本解析策略,对于其中过程此处不进行赘述。
本申请实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本申请实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。
可见,实施本实施例所描述的统一文本解析方法,能够通过统一文本解析策略引入一个jar包来处理多种文本类型的数据。具体的,通过实施本实施例所描述的统一文本解析方法,能够大大减少了重复冗余的代码,使导入导出这一频繁和较为费时的功能编程,很简单地通过配置一些自定义参数来实现。从而能够较大程度地减轻开发人员的工作量,进而提高整体开发效率。
实施例3
请参看图4,图4为本申请实施例提供的一种统一文本解析装置的结构示意图。如图4所示,该统一文本解析装置包括:
获取单元310,用于获取待解析文本集合;
识别单元320,用于识别待解析文本集合中每个文本的文本类型;
匹配单元330,用于根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合;
解析单元340,用于通过解析策略集合对待解析文本集合进行解析,得到解析数据集合。
本申请实施例中,对于统一文本解析装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的统一文本解析装置,能够通过统一文本解析策略引入一个jar包来处理多种文本类型的数据。具体的,通过实施本实施例所描述的统一文本解析方法,能够大大减少了重复冗余的代码,使导入导出这一频繁和较为费时的功能编程,很简单地通过配置一些自定义参数来实现。从而能够较大程度地减轻开发人员的工作量,进而提高整体开发效率。
实施例4
请参看图5,图5为本申请实施例提供的一种统一文本解析装置的结构示意图。如图5所示,该统一文本解析装置包括:
获取单元310,用于获取待解析文本集合;
识别单元320,用于识别待解析文本集合中每个文本的文本类型;
匹配单元330,用于根据文本类型和预存的统一解析策略库匹配与待解析文本集合相匹配的解析策略集合;
解析单元340,用于通过解析策略集合对待解析文本集合进行解析,得到解析数据集合。
本实施例中,该方法预先获取待解析的文本集合。其中,待解析文本集合包括至少一个待解析的文本。
本实施例中,该方法可以自主识别每个文本的文本类型,其中文本类型包括txt,csv,xls,xlsx。
本实施例中,该方法可以基于不同的文本类型适配相应的解析策略。
本实施例中,该方法可以通过匹配出来的解析策略进行对应的文本解析,从而得到解析数据集合,进而实现统一文本解析的效果。
作为一种可选的实施方式,识别单元320包括:
识别子单元321,用于识别待解析文本集合中每个文本的后缀名;
确定子单元322,用于根据后缀名确定待解析文本集合中每个文本的文本类型。
本实施例中,该装置能够识别不同的文本,并适配相应的解析策略。具体的,该装置接收导入的待解析文本集合,并调用统一文本解析策略的jar包的方法parse(file),识别文本对应的后缀名,并通过后缀名来匹配对应的解析策略。
作为一种可选的实施方式,匹配单元330包括:
匹配子单元331,用于根据文本类型和预存的统一解析策略库匹配与待解析文本集合中每个文本相匹配的目标解析策略;
策略解析子单元332,用于解析目标解析策略,得到待解析文本集合中每个文本相匹配的目标解析方法;
生成子单元333,用于获取待解析文本集合中每个文本的文本顺序;以及将目标解析方法按照文本顺序生成解析策略集合。
作为一种可选的实施方式,解析单元340包括:
文本解析子单元341,用于通过解析策略集合中每个文本相匹配的目标解析方法,对相应文本进行解析,得到解析数据;
汇总子单元342,用于按照文本顺序汇总所有解析数据,得到解析数据集合。
作为一种可选的实施方式,解析数据的数据格式为List<Map<k,v>>格式,其中k表示第一行字段名,v为对应字段值。
本实施例中,对于统一文本解析装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的统一文本解析装置,能够通过统一文本解析策略引入一个jar包来处理多种文本类型的数据。具体的,通过实施本实施例所描述的统一文本解析方法,能够大大减少了重复冗余的代码,使导入导出这一频繁和较为费时的功能编程,很简单地通过配置一些自定义参数来实现。从而能够较大程度地减轻开发人员的工作量,进而提高整体开发效率。
本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例1或实施例2中的统一文本解析方法。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例1或实施例2中的统一文本解析方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种统一文本解析方法,其特征在于,包括:
获取待解析文本集合;
识别所述待解析文本集合中每个文本的文本类型;
根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合;
通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合。
2.根据权利要求1所述的统一文本解析方法,其特征在于,识别所述待解析文本集合中每个文本的文本类型,包括:
识别所述待解析文本集合中每个文本的后缀名;
根据所述后缀名确定所述待解析文本集合中每个文本的文本类型。
3.根据权利要求1所述的统一文本解析方法,其特征在于,根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合,包括:
根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合中每个文本相匹配的目标解析策略;
解析所述目标解析策略,得到所述待解析文本集合中每个文本相匹配的目标解析方法;
获取所述待解析文本集合中每个文本的文本顺序;
将所述目标解析方法按照所述文本顺序生成解析策略集合。
4.根据权利要求3所述的统一文本解析方法,其特征在于,通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合,包括:
通过所述解析策略集合中每个文本相匹配的目标解析方法,对相应文本进行解析,得到解析数据;
按照所述文本顺序汇总所有解析数据,得到解析数据集合。
5.根据权利要求4所述的统一文本解析方法,其特征在于,所述解析数据的数据格式为List<Map<k,v>>格式,其中k表示第一行字段名,v为对应字段值。
6.一种统一文本解析装置,其特征在于,所述统一文本解析装置包括:
获取单元,用于获取待解析文本集合;
识别单元,用于识别所述待解析文本集合中每个文本的文本类型;
匹配单元,用于根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合相匹配的解析策略集合;
解析单元,用于通过所述解析策略集合对所述待解析文本集合进行解析,得到解析数据集合。
7.根据权利要求6所述的统一文本解析装置,其特征在于,所述识别单元包括:
识别子单元,用于识别所述待解析文本集合中每个文本的后缀名;
确定子单元,用于根据所述后缀名确定所述待解析文本集合中每个文本的文本类型。
8.根据权利要求6所述的统一文本解析装置,其特征在于,所述匹配单元包括:
匹配子单元,用于根据所述文本类型和预存的统一解析策略库匹配与所述待解析文本集合中每个文本相匹配的目标解析策略;
策略解析子单元,用于解析所述目标解析策略,得到所述待解析文本集合中每个文本相匹配的目标解析方法;
生成子单元,用于获取所述待解析文本集合中每个文本的文本顺序;以及将所述目标解析方法按照所述文本顺序生成解析策略集合。
9.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至5中任一项所述的统一文本解析方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1至5任一项所述的统一文本解析方法。
CN202210741628.1A 2022-06-27 2022-06-27 一种统一文本解析方法及装置 Pending CN115099216A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210741628.1A CN115099216A (zh) 2022-06-27 2022-06-27 一种统一文本解析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210741628.1A CN115099216A (zh) 2022-06-27 2022-06-27 一种统一文本解析方法及装置

Publications (1)

Publication Number Publication Date
CN115099216A true CN115099216A (zh) 2022-09-23

Family

ID=83295784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210741628.1A Pending CN115099216A (zh) 2022-06-27 2022-06-27 一种统一文本解析方法及装置

Country Status (1)

Country Link
CN (1) CN115099216A (zh)

Similar Documents

Publication Publication Date Title
CN109902073B (zh) 日志处理方法、装置、计算机设备和计算机可读存储介质
CN111460241B (zh) 一种数据查询方法、装置、电子设备及存储介质
CN109344193B (zh) 一种将结构化数据转化为非结构化数据的方法及系统
CN112698868B (zh) 一种应用于多系统的统一错误码方法和存储设备
CN104102701A (zh) 一种基于hive的历史数据存档与查询方法
CN113177090A (zh) 数据处理方法及装置
CN114625809A (zh) 一种基于Binlog日志的数据同步方法、装置以及存储介质和电子设备
CN111259038B (zh) 一种数据库查询及数据导出方法、系统、介质及设备
CN110362630B (zh) 数据管理方法、装置、设备与计算机可读存储介质
CN114661686A (zh) 日志文件的报文提取方法、装置、设备、介质和程序产品
CN111475196A (zh) 编译告警溯源方法、装置、电子设备及计算机可读介质
CN112988776B (zh) 文本解析规则的更新方法、装置、设备及可读存储介质
CN113778947A (zh) 一种kafka流处理平台的数据导入方法、装置及设备
CN109740130B (zh) 用于生成文件的方法和装置
CN112162951A (zh) 一种信息检索方法、服务器及存储介质
CN115099216A (zh) 一种统一文本解析方法及装置
CN111783482A (zh) 一种文本翻译方法、装置、计算机设备及存储介质
CN113536316B (zh) 组件依赖信息的检测方法及装置
CN113703753B (zh) 用于产品开发的方法、装置和产品开发系统
CN115796146A (zh) 一种文件对比方法及装置
CN115310127A (zh) 一种数据脱敏方法及装置
CN112214494B (zh) 检索方法及装置
CN115203494A (zh) 一种面向文本的时间信息抽取方法及装置
CN114072799A (zh) Node.js组件漏洞检测方法及系统
CN114090135A (zh) 具有纠错功能且支持跨平台调用组件的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination