CN114357967A - 一种票据文件的解析方法和装置 - Google Patents
一种票据文件的解析方法和装置 Download PDFInfo
- Publication number
- CN114357967A CN114357967A CN202111401050.7A CN202111401050A CN114357967A CN 114357967 A CN114357967 A CN 114357967A CN 202111401050 A CN202111401050 A CN 202111401050A CN 114357967 A CN114357967 A CN 114357967A
- Authority
- CN
- China
- Prior art keywords
- bill
- data
- analysis
- information
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种票据文件的解析方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接收待解析票据文件,根据待解析票据文件的目标对象数据,查询相匹配的票据解析模板;获取票据解析模板的配置信息,根据配置信息中的解析器信息,创建对应的解析器实例;其中,配置信息包括票据解析模板的解析区域的第一位置信息和解析器信息,解析区域对应票据解析模板的数据项;使用解析器实例,将第一位置信息转化为相同数据项在待解析票据文件的第二位置信息,读取第二位置信息处所记载的数据信息,完成解析。该方法将票据解析模板中各数据项对应解析区域的位置转换为相同数据项在待解析票据文件的位置,完成票据解析,通用性好。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种票据文件的解析方法和装置。
背景技术
随着电子发票的普及,企业为开展业务需要从电子发票上读取相关数据信息,因此数据读取的准确性,对业务的正常运转起着非常重要的作用。由于电子发票通常来自于多个开票方,且各开票方在生成电子发票时所使用的模板不同,导致需要针对各开票方的电子发票分别进行解析;同时,由于电子发票数据不规范,造成识别失败、识别不准确。
发明内容
有鉴于此,本发明实施例提供一种票据文件的解析方法和装置,该方法预先为开票方构建票据解析模板,在需要对待解析票据文件进行解析时,通过获取与待解析票据文件相匹配的票据解析模板,进而将票据解析模板中各数据项对应解析区域的位置转换为相同数据项在待解析票据文件的位置,使得可以基于该位置读取待解析票据文件的数据信息,完成票据解析,通用性好。
为实现上述目的,根据本发明实施例的一个方面,提供了一种票据文件的解析方法。
本发明实施例的一种票据文件的解析方法,包括:接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板;获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例;其中,所述配置信息包括所述票据解析模板的解析区域的第一位置信息和所述解析器信息,所述解析区域对应所述票据解析模板的数据项;使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。
可选地,所述第一位置信息包括所述解析区域的顶点坐标;
所述将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,包括:根据所述解析区域的顶点坐标,以及所述票据解析模板的第一总宽度和第一总高度,计算相应数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比;根据所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比,以及所述待解析票据文件的第二总宽度和第二总高度,计算相同数据项在待解析票据文件的第二位置信息。
可选地,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区,位于所述主票区的解析区域对应一个所述数据项,位于所述明细区的解析区域对应多个所述数据项;
所述计算相应数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比,包括:在所述解析区域位于所述主票区的情况下,将所述解析区域的起始横坐标、起始纵坐标分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的起始位置占比;以及计算所述解析区域的宽度和高度,将所述解析区域的宽度、高度分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的数据宽度占比和数据高度占比;
在所述解析区域位于所述明细区的情况下,计算所述解析区域的宽度和高度,根据所述解析器信息的总行数和总列数,计算每个所述数据项的宽度和高度;以及根据所述解析区域的起始横坐标、起始纵坐标和每个所述数据项的宽度和高度,计算每个所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比。
可选地,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区;所述解析器信息包括解析器类型,所述主票区的解析器类型与所述明细区的解析器类型不同;
所述根据所述配置信息中的解析器信息,创建对应的解析器实例,包括:根据所述解析器信息的解析器类型,将所述配置信息划分为基本配置和明细配置;根据所述基本配置和所述明细配置,分别创建对应的主要解析实例和明细解析实例,所述主要解析实例和所述明细解析实例构成解析器实例;
所述使用所述解析器实例,包括:在所述解析区域位于所述主票区的情况下,使用所述主要解析实例;以及在所述解析区域位于所述明细区的情况下,使用所述明细解析实例。
可选地,所述主票区的解析器类型包括普通类型和分隔符类型;
所述读取所述第二位置信息处所记载的数据信息,包括:在所述解析区域位于所述主票区,且解析器类型为普通类型的情况下,直接读取所述第二位置信息处所记载的数据信息;在所述解析区域位于所述主票区,且解析器类型为分隔符类型的情况下,分别读取所述第二位置信息处、设定分隔符前后的数据信息。
可选地,所述方法还包括:将所述数据项抽象为数据节点,为所述数据节点创建节点标识;将所述节点标识、相应数据项的起始位置占比、数据宽度占比和数据高度占比作为所述数据节点的节点信息写入数据节点集合;
所述计算相同数据项在待解析票据文件的第二位置信息,包括:重复执行以下步骤,直至全部数据节点处理结束:按照所述节点标识,从所述数据节点集合中索引相应数据节点的节点信息,以计算相同数据项在待解析票据文件的第二位置信息;所述读取所述第二位置信息处所记载的数据信息的步骤之后,所述方法还包括:将所述数据信息赋值到所述数据节点。
可选地,所述方法还包括:接收原始票据文件,当检测到对所述原始票据文件的编辑操作时,将所述编辑操作的操作区域作为所述解析区域,返回用于对所述解析区域进行配置的属性编辑界面;接收用户在所述属性编辑界面输入的配置信息,组装所述解析区域的配置信息,生成相应的票据解析模板;建立所述票据解析模板与所述目标对象数据之间的关联关系;其中,所述目标对象数据包括开票方标识。
为实现上述目的,根据本发明实施例的另一方面,提供了一种票据文件的解析装置。
本发明实施例的一种票据文件的解析装置,包括:模板查询模块,用于接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板;实例创建模块,用于获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例;其中,所述配置信息包括所述票据解析模板的解析区域的第一位置信息和所述解析器信息,所述解析区域对应所述票据解析模板的数据项;文件解析模块,用于使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。
可选地,所述第一位置信息包括所述解析区域的顶点坐标;
所述文件解析模块,还用于根据所述解析区域的顶点坐标,以及所述票据解析模板的第一总宽度和第一总高度,计算相应数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比;根据所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比,以及所述待解析票据文件的第二总宽度和第二总高度,计算相同数据项在待解析票据文件的第二位置信息。
可选地,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区,位于所述主票区的解析区域对应一个所述数据项,位于所述明细区的解析区域对应多个所述数据项;
所述文件解析模块,还用于在所述解析区域位于所述主票区的情况下,将所述解析区域的起始横坐标、起始纵坐标分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的起始位置占比;以及计算所述解析区域的宽度和高度,将所述解析区域的宽度、高度分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的数据宽度占比和数据高度占比;
在所述解析区域位于所述明细区的情况下,计算所述解析区域的宽度和高度,根据所述解析器信息的总行数和总列数,计算每个所述数据项的宽度和高度;以及根据所述解析区域的起始横坐标、起始纵坐标和每个所述数据项的宽度和高度,计算每个所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比。
可选地,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区;所述解析器信息包括解析器类型,所述主票区的解析器类型与所述明细区的解析器类型不同;
所述实例创建模块,还用于根据所述解析器信息的解析器类型,将所述配置信息划分为基本配置和明细配置;根据所述基本配置和所述明细配置,分别创建对应的主要解析实例和明细解析实例,所述主要解析实例和所述明细解析实例构成解析器实例;
所述文件解析模块,还用于在所述解析区域位于所述主票区的情况下,使用所述主要解析实例;以及在所述解析区域位于所述明细区的情况下,使用所述明细解析实例。
可选地,所述主票区的解析器类型包括普通类型和分隔符类型;
所述文件解析模块,还用于在所述解析区域位于所述主票区,且解析器类型为普通类型的情况下,直接读取所述第二位置信息处所记载的数据信息;在所述解析区域位于所述主票区,且解析器类型为分隔符类型的情况下,分别读取所述第二位置信息处、设定分隔符前后的数据信息。
可选地,所述装置还包括:集合构建模块,用于将所述数据项抽象为数据节点,为所述数据节点创建节点标识;将所述节点标识、相应数据项的起始位置占比、数据宽度占比和数据高度占比作为所述数据节点的节点信息写入数据节点集合;
所述文件解析模块,还用于:重复执行以下步骤,直至全部数据节点处理结束:按照所述节点标识,从所述数据节点集合中索引相应数据节点的节点信息,以计算相同数据项在待解析票据文件的第二位置信息;所述方法还包括:节点赋值模块,用于将所述数据信息赋值到所述数据节点。
可选地,所述装置还包括:模板构建模块,用于接收原始票据文件,当检测到对所述原始票据文件的编辑操作时,将所述编辑操作的操作区域作为所述解析区域,返回用于对所述解析区域进行配置的属性编辑界面;接收用户在所述属性编辑界面输入的配置信息,组装所述解析区域的配置信息,生成相应的票据解析模板。模板关联模块,用于建立所述票据解析模板与所述目标对象数据之间的关联关系;其中,所述目标对象数据包括开票方标识。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种票据文件的解析方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种票据文件的解析方法。
上述发明中的一个实施例具有如下优点或有益效果:预先为开票方构建票据解析模板,在需要对待解析票据文件进行解析时,通过获取与待解析票据文件相匹配的票据解析模板,进而将票据解析模板中各数据项对应解析区域的位置转换为相同数据项在待解析票据文件的位置,使得可以基于该位置读取待解析票据文件的数据信息,完成票据解析,通用性好。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的票据文件的解析方法的主要步骤的示意图;
图2是根据本发明实施例的票据文件的解析方法的主要流程示意图;
图3是本发明实施例的将各解析区域的配置处理成数据节点集合的主要流程示意图;
图4是本发明实施例的对待解析票据文件中部分数据项的数据信息进行读取的结果示意图;
图5是本发明实施例的对待解析票据文件中部分数据项的数据信息进行结构化处理的结果示意图;
图6是根据本发明实施例的票据文件的解析装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
实施例一
图1是根据本发明实施例的票据文件的解析方法的主要步骤的示意图。如图1所示,本发明实施例的票据文件的解析方法,主要包括如下步骤:
步骤S101:接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板。预先根据原始票据文件,为不同开票方生成各自的票据解析模板,并建立票据解析模板与目标对象数据之间的关联关系,该目标对象数据可以是开票方标识。
在接收到待解析票据文件后,可以获取该待解析票据文件的目标对象数据,进而以目标对象数据作为检索条件,查询相应的票据解析模板,查询到的票据解析模板即与待解析票据文件相匹配的票据解析模板。
步骤S102:获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例。其中,配置信息是指为票据解析模板的各解析区域配置的相关信息,可以包括解析区域的第一位置信息和解析器信息,解析区域对应该票据解析模板的数据项,解析器信息是指为该解析区域配置的、用于后续解析的信息。
在获取到票据解析模板的配置信息之后,从配置信息中提取解析器信息,进而使用createInstance命令创建解析器实例,以便后续进行票据解析。
步骤S103:使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。第一位置信息可以是解析区域的顶点坐标。由于待解析票据文件的各数据项与票据解析模板的各数据项一一对应,且票据解析模板的各数据项与具有第一位置信息的解析区域相对应,因此可以对第一位置信息进行转化,以得到同一数据项在待解析票据文件的第二位置信息。
具体地,可以根据解析区域的顶点坐标,以及票据解析模板的第一总宽度和第一总高度,计算该解析区域的相应数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比;之后根据各数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比,以及待解析票据文件的第二总宽度和第二总高度,计算相同数据项在待解析票据文件的第二位置信息。
其中,起始位置占比代表数据项的开始位置占票据解析模板的总宽度和总高度的比例,数据宽度占比代表数据项的数据宽度占票据解析模板的总宽度的比例,数据高度占比代表所述数据项的数据高度占票据解析模板的总高度的比例。
在获得待解析票据文件的一个数据项的第二位置信息之后,调用现有的数据读取工具,读取该第二位置信息处记载的数据信息。按照上述方式,获得待解析票据文件的全部数据项的第二位置信息,并读取该第二位置信息处记载的数据信息,即可得到最终的解析结果。
实施例二
原始票据文件通常包括票据代码、交款人、开票日期等票据基本信息,也可以包括票据的二级分类、费用明细等票据明细信息(包含列表)。为了提高票据解析的准确率,可以将原始票据文件划分为主票区和明细区,且主票区包括票据基本信息,明细区包括票据明细信息,并对主票区和明细区分别配置,得到票据解析模板。后续使用该票据解析模板对待解析票据文件进行票据解析。下面结合实施例二进行详细说明。
图2是根据本发明实施例的票据文件的解析方法的主要流程示意图。如图2所示,本发明实施例的票据文件的解析方法,主要包括如下步骤:
步骤S201:接收原始票据文件,对原始票据文件进行可视化配置,生成相应的票据解析模板。原始票据文件可以是某个开票方开具的电子票据PDF文件。在一可选的实施例中,同一开票方的票据文件所包含的数据项是固定的,不同开票方之间会有区别,因此还可以构建一个包括已有开票方全部数据项的原始票据文件,后续根据开票方的不同,对原始票据文件的相应数据项进行可视化配置。
该步骤,首先接收原始票据文件,当检测到对原始票据文件的编辑操作时,将编辑操作的操作区域作为解析区域,返回用于对该解析区域进行配置的属性编辑界面。实施例中,用户可使用鼠标点击原始票据文件的某个区域,当检测到该点击操作后,为该区域绘制边框,得到解析区域。属性编辑界面用于配置解析区域的位置信息、以及解析区域对应数据项的属性信息和解析器信息。
实施例中,数据项的属性信息可以包括名称、代码、数据类型等。比如,对于原始票据文件中票据代码这一数据项,其名称可以是“票据代码”,代码可以是“invoiceCode”,数据类型可以字符串(可用数字1表示)。再比如,对于原始票据文件中住院时间这一数据项,包括用分隔符“|”分开的入院时间和出院时间,其名称可以是“住院时间”,代码可以是“inhospitalDate”,数据类型可以是分隔符(可用数字3表示)。
数据项的解析器信息可以包括解析器类型以及该类型对应的解析因子。实施例中,解析器类型可为三种,分别为普通类型、列表类型和分隔符类型。普通类型的解析因子为空,该类型解析器用于解析不含分隔符的票据基本信息(比如票据代码)。列表类型的解析因子包括总行数和总列数,该类型解析器用于解析票据明细信息(比如费用明细)。分隔符类型的解析因子包括所使用的分隔符和分隔详情,该类型解析器用于解析含有分隔符的票据基本信息(比如住院时间)。
用户接收到属性编辑界面之后,在属性编辑界面输入对解析区域的配置信息,之后组装解析区域的配置信息,生成相应的票据解析模板。之后可以对票据解析模板进行测试,以验证该票据解析模板是否可以正确解析票据文件。
在一可选的实施例中,原始票据文件通常为PDF文件,可以使用PDFBox工具将该原始票据文件转换为图片文件,再对图片文件进行可视化配置。其中,PDFBox工具是用于处理PDF文档的Java工具,其提供的功能包括:提取文本、文档合并/拆分、表单填充、PDF打印、PDF转换等。该处理实现了自适应模板配置,使得后续解析时,在用户界面是图片解析,转换到底层是通过票据解析文件和待解析票据文件之间位置转化,实现数据读取。
步骤S202:建立票据解析模板与目标对象数据之间的关联关系。票据解析模板配置完毕后,将其与开票方之间建立关联。一个开票方可以开具多种类型的票据,比如开票方为医院,其开具的票据可以是住院票据、普通门诊票据、住院前后门诊票据、境外就医票据等。为了区分各开票方,以及同一开票方的各种票据类型,目标对象数据可以是开票方标识和票据类型。
可以理解的是,如果一个开票方仅开具一种类型的票据,则目标对象数据可以仅包括开票方标识,用于区分不同开票方。
步骤S203:当接收到待解析票据文件时,根据待解析票据文件的目标对象数据,查询与待解析票据文件相匹配的票据解析模板。实施例中,获取待解析票据文件的开票方标识和票据类型,之后以开票方标识和票据类型为查询条件,查询对应的票据解析模板,该票据解析模板与待解析票据文件相匹配。
步骤S204:获取票据解析模板的配置信息,根据配置信息中的解析器信息,创建主要解析实例和明细解析实例。获取票据解析模板的配置信息,该配置信息包括主票区的配置信息(可称为基本配置)和明细区的配置信息(可称为明细配置),且主票区和明细区的配置信息均包括解析区域的位置信息、以及解析区域对应数据项的属性信息和解析器信息。
如前所述,解析器信息包括解析器类型以及该类型对应的解析因子。由于主票区是由票据基本信息构成,明细区是由票据明细信息构成,可知,主票区的解析器类型包括普通类型和分隔符类型,明细区的解析器类型包括列表类型,两者不同。因此,在创建解析器实例时,需要根据解析器信息的解析器类型,将配置信息划分为基本配置和明细配置;之后根据基本配置和明细配置,分别创建对应的主要解析实例和明细解析实例,主要解析实例和明细解析实例构成解析器实例。
也即,在某个解析区域对应的解析器类型为普通类型或分隔符类型时,则将该解析区域的配置信息划分为基本配置;在某个解析区域对应的解析器类型为列表类型时,则将该解析区域的配置信息划分为明细配置。进而使用createInstance命令,为基本配置创建主要解析实例;使用createInstance命令,为明细配置创建明细解析实例。
步骤S205:判断票据解析模板的各解析区域位于主票区还是明细区,以使用对应的解析实例,将各解析区域的配置处理成数据节点集合。位于主票区的解析区域对应一个数据项,位于明细区的解析区域对应多个数据项,将每个数据项抽象为一个数据节点,并为数据节点创建节点标识。实施例中,数据节点可用DataNode标识,具体字段说明如表1。
表1
上述字段中,startX和startY可以组合为(startX,startY),表示起始位置占比。假设解析区域为矩形,位于主票区,即对应一个数据项,其对角线上的两个顶点坐标为:(x,y)和(x1,y1),且x1>x,y1>y,票据解析模板的第一总宽度为W1,第一总高度为H1,则startX、startY、width和height,分别可用如下公式表示。
式中,x表示解析区域的起始横坐标,y表示解析区域的起始纵坐标,x1表示解析区域的结束横坐标,y1表示解析区域的结束纵坐标,(x1-x)表示解析区域的宽度,(y1-y)表示解析区域的高度。
该步骤的具体实现见关于图3的描述。经过此处理,DataNode中的各字段仅text字段为待填充项,其他字段均已获得,并可以填充到DataNode的相应字段。
步骤S206:从数据节点集合中选择一个数据节点作为当前数据节点。从数据节点集合中不重复地选择一个数据节点作为当前数据节点。
步骤S207:按照节点标识,从数据节点集合中索引当前数据节点的节点信息。节点信息即数据节点各字段的内容。
步骤S208:根据节点信息,计算相同数据项在待解析票据文件的第二位置信息。实施例中,根据节点信息中记录的数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比,以及待解析票据文件的第二总宽度和第二总高度,计算相同数据项在待解析票据文件的第二位置信息。此处的相同数据项是指待解析票据文件中与票据解析模板的数据项相同的数据项。比如,与票据解析模板的票据代码这一数据项相同的数据项即待解析票据文件的票据代码。
在计算相同数据项在待解析票据文件的第二位置信息时,可以基于公式1和公式2反推数据项在待解析票据文件的第二位置信息。比如,先基于公式1,将起始位置占比与第二总宽度、第二总高度对应相乘,得到该数据项的一个顶点坐标;之后将数据项的宽度、高度与上一步得到的顶点坐标的横坐标、纵坐标对应相加,得到该数据项的另一个顶点坐标。这两个顶点坐标构成该数据项在待解析票据文件的第二位置信息。
步骤S209:读取第二位置信息处所记载的数据信息,将数据信息赋值到当前数据节点的节点信息。使用数据读取工具,比如PDFBox工具读取第二位置信息处所记载的数据信息,并将数据信息赋值到当前数据节点的text字段。
实施例中,如果解析区域位于主票区,且解析器类型为普通类型,则直接读取第二位置信息处所记载的数据信息。如果解析区域位于主票区,且解析器类型为分隔符类型,则分别读取第二位置信息处、设定分隔符前后的数据信息。如果解析区域位于列表区,则直接读取第二位置信息处所记载的数据信息。
另外,对于分隔符类型,还可以将分隔符前后的数据分别赋值到分隔详情的指定字段。比如,对于住院时间这一数据项,包括用分隔符“|”分开的入院时间和出院时间,则可以通过分隔符“|”获取入院时间和出院时间,并将入院时间赋值到分隔详情的住院日期字段,将出院时间赋值到分隔详情的出院日期字段。该处理能够对使用分隔符分隔的数据拆分,保证数据的正确读取。
步骤S210:判断当前数据节点是否为数据节点集合的最后一个数据节点,如果是,则结束本流程;如果否,则执行步骤S206。循环处理,得到最终的数据解析结果。
在一优选的实施例中,可以将数据解析结果组装成结构化数据。其中,结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。以医院开具的电子发票为例,可以将该电子发票解析为三张结构化数据表,分别是电子发票的基本表,电子发票的二级分类表,电子发票的费用明细表。其中,基本表对应存储票据基本信息,二级分类表和费用明细表存储票据明细信息。
在另一实施例中,为了避免由于同一数据项的数据内容换行,导致将数据内容读取到两行,以及字体覆盖问题(见图4中“医疗机构类型”这一数据项),可以在对原始票据文件中存在字体覆盖的数据项绘制边框时,增大边框框选区域,进而从该区域读取数据,防止因内容换行、字体遮挡,导致读取数据错误。
本实施例通过设置解析区域的位置信息,使得该位置信息能够与票据解析模板的数据项进行对应,进而通过该位置信息读取待解析票据文件中同一数据项的数据信息,能够解决由于数据不规范,导致的识别失败和失败不准确的问题,提升抗干扰能力;同时可以解决内容换行、字体覆盖、包含分隔符导致的读取错误,提高了解析准确率。
另外,本实施例通过以可视化方式建立票据解析模板,并将票据解析模板与开票方相关联,在保证通用性的同时,实现了个性化配置,灵活性好。同时,针对新接入的开票方,能够根据开票方的票据样例文件,快速生成个性化的票据解析模板,实现快速上线。即将票据样例文件与原始票据文件比对,得出存在差异的数据项,后续对存在差异的数据项进行配置即可。另外,通过解析不同开票方的票据文件,输出统一标准的票据文件的结构化数据,便于业务应用。
图3是本发明实施例的将各解析区域的配置处理成数据节点集合的主要流程示意图。如图3所示,本发明实施例的将各解析区域的配置处理成数据节点集合的主要过程(即步骤S205),包括以下步骤:
步骤S301:判断票据解析模板的当前解析区域位于主票区还是明细区,如果当前解析区域位于主票区,则执行步骤S302;如果当前解析区域位于明细区,则执行步骤S304。当前解析区域为从票据解析模板的全部解析区域中不重复的选择出的解析区域。
步骤S302:根据当前解析区域的顶点坐标,以及票据解析模板的第一总宽度和第一总高度,计算相应数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比。具体计算过程见公式1和公式2。
步骤S303:将当前解析区域对应的数据项抽象为数据节点,为该数据节点创建节点标识,并将起始位置占比、数据宽度占比、数据高度占比的节点标识赋值到数据节点的对应字段,将赋值后的数据节点添加到主票节点集合,执行步骤S307。主票节点集合可用mainNodeList表示。
步骤S304:计算当前解析区域的宽度和高度,根据解析器信息的总行数和总列数,计算每个数据项的宽度和高度。当前解析区域的宽度除以总列数,得到每个数据项的宽度。当前解析区域的高度除以总行数,得到每个数据项的高度。
步骤S305:根据当前解析区域的顶点坐标、每个数据项的宽度和高度、票据解析模板的第一总宽度和第一总高度,计算每个数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比。该步骤在计算每个数据项在票据解析模板的起始位置占比时,首先根据当前解析区域的顶点坐标、每个数据项的宽度和高度,计算每个数据项的起始位置(包括起始横坐标和起始纵坐标);之后将每个数据项的起始横坐标与第一总宽度作比,将每个数据项的起始纵坐标与第一总高度作比,得到每个数据项在票据解析模板的起始位置占比。
另外,将每个数据项的宽度与第一总高度作比,得到每个数据项在票据解析模板的数据宽度占比。将每个数据项的高度与第一总高度作比,得到每个数据项在票据解析模板的数据高度占比。
在一可选的实施例中,还可以计算当前解析区域的数据项数量(即总行数和总列数的乘积),通过在每计算出一个数据项的在票据解析模板的起始位置占比占比之后,执行数据项数量递减操作,保证可以计算全部数据项在票据解析模板的起始位置占比。
步骤S306:将当前解析区域的每个数据项分别抽象为数据节点,为各数据节点创建节点标识,并将起始位置占比、数据宽度占比、数据高度占比的节点标识赋值到各数据节点的对应字段,将赋值后的各数据节点添加到明细节点集合。明细节点集合可用itemNodeList表示。
步骤S307:重复执行步骤S301-步骤S306,直至票据解析模板的最后一个解析区域,将主票节点集合和明细节点集合作为最终的数据节点集合。
本实施例通过将票据解析模板划分为主票区和明细区,并基于解析区域在票据解析模板的位置,使用不同方式计算数据项在票据解析模板的起始位置占比、数据宽度占比和数据高度占比,进而根据该计算结果确定待解析票据文件中相同数据项的位置信息,进一步保证了数据读取的准确性,提高了解析准确率。同时将数据项抽象为数据节点,便于后续生成结构化数据。
下面以医疗收费的电子票据为例,对本发明实施例的票据文件的解析方法进行进一步说明。
在接收到待解析票据文件之后,获取待解析票据文件的开票方标识和票据类型,以查询该开票方的、同一票据类型的票据解析模板。之后,根据该票据解析模板的配置信息,创建解析器实例,以使用解析器实例,将票据解析模板中解析区域的位置信息转化为相同数据项在待解析票据文件的位置信息。之后读取该转化后的位置信息处记录的数据信息(见图4),并进行结构化处理,得到结构化数据(见图5)。
如图4和图5,“医疗机构”这一数据项存在数据内容换行以及字体覆盖问题,为了避免将其数据内容读取到两行以及字体覆盖问题,在绘制边框时,增大了边框框选区域,保证“医疗机构”的数据内容读取到一行,且避免字体覆盖。“住院时间”这一数据项存在分隔符,通过本实施例的解析方法,将其数据内容划分为住院日期和出院日期两项。
本实施例的解析方法可用于医疗票据报销管理平台的理赔报销业务。即可基于上述结构化数据进行理赔计算,进而进行理赔报销,提高报销效率和报销准确率。
图6是根据本发明实施例的票据文件的解析装置的主要模块的示意图。如图6所示,本发明实施例的票据文件的解析装置600,主要包括:
模板查询模块601,用于接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板。预先根据原始票据文件,为不同开票方生成各自的票据解析模板,并建立票据解析模板与目标对象数据之间的关联关系,该目标对象数据可以是开票方标识。
在接收到待解析票据文件后,可以获取该待解析票据文件的目标对象数据,进而以目标对象数据作为检索条件,查询相应的票据解析模板,查询到的票据解析模板即与待解析票据文件相匹配的票据解析模板。
实例创建模块602,用于获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例。其中,配置信息是指为票据解析模板的各解析区域配置的相关信息,可以包括解析区域的第一位置信息和解析器信息,解析区域对应该票据解析模板的数据项,解析器信息是指为该解析区域配置的、用于后续解析的信息。
在获取到票据解析模板的配置信息之后,从配置信息中提取解析器信息,进而使用createInstance命令创建解析器实例,以便后续进行票据解析。
文件解析模块603,用于使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。第一位置信息可以是解析区域的顶点坐标。由于待解析票据文件的各数据项与票据解析模板的各数据项一一对应,且票据解析模板的各数据项与具有第一位置信息的解析区域相对应,因此可以对第一位置信息进行转化,以得到同一数据项在待解析票据文件的第二位置信息。
在获得待解析票据文件的一个数据项的第二位置信息之后,调用现有的数据读取工具,读取该第二位置信息处记载的数据信息。按照上述方式,获得待解析票据文件的全部数据项的第二位置信息,并读取该第二位置信息处记载的数据信息,即可得到最终的解析结果。
另外,本发明实施例的票据文件的解析装置600还可以包括:集合构建模块、节点赋值模块、模板构建模块和模板关联模块(图6中未示出)。其中,集合构建模块,用于将所述数据项抽象为数据节点,为所述数据节点创建节点标识;将所述节点标识、相应数据项的起始位置占比、数据宽度占比和数据高度占比作为所述数据节点的节点信息写入数据节点集合。节点赋值模块,用于将所述数据信息赋值到所述数据节点。
模板构建模块,用于接收原始票据文件,当检测到对所述原始票据文件的编辑操作时,将所述编辑操作的操作区域作为所述解析区域,返回用于对所述解析区域进行配置的属性编辑界面;接收用户在所述属性编辑界面输入的配置信息,组装所述解析区域的配置信息,生成相应的票据解析模板。模板关联模块,用于建立所述票据解析模板与所述目标对象数据之间的关联关系;其中,所述目标对象数据包括开票方标识。
从以上描述可以看出,预先为开票方构建票据解析模板,在需要对待解析票据文件进行解析时,通过获取与待解析票据文件相匹配的票据解析模板,进而将票据解析模板中各数据项对应解析区域的位置转换为相同数据项在待解析票据文件的位置,使得可以基于该位置读取待解析票据文件的数据信息,完成票据解析,通用性好。
图7示出了可以应用本发明实施例的票据文件的解析方法或票据文件的解析装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703发送的待解析票据文件进行处理的后台管理服务器。后台管理服务器可以查询相匹配的票据解析模板,获取其配置信息,创建解析器实例,进而使用解析器实例,实现位置转化,读取转化所得位置处的数据信息,进行结构化处理并将处理结果(例如最终的解析结果)反馈给终端设备。
需要说明的是,本申请实施例所提供的票据文件的解析方法一般由服务器705执行,相应地,票据文件的解析装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种票据文件的解析方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种票据文件的解析方法。
下面参考图8,其示出了适用于来实现本发明实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有计算机系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括模板查询模块、实例创建模块和文件解析模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,模板查询模块还可以被描述为“接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板;获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例;其中,所述配置信息包括所述票据解析模板的解析区域的第一位置信息和所述解析器信息,所述解析区域对应所述票据解析模板的数据项;使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。
根据本发明实施例的技术方案,预先为开票方构建票据解析模板,在需要对待解析票据文件进行解析时,通过获取与待解析票据文件相匹配的票据解析模板,进而将票据解析模板中各数据项对应解析区域的位置转换为相同数据项在待解析票据文件的位置,使得可以基于该位置读取待解析票据文件的数据信息,完成票据解析,通用性好。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种票据文件的解析方法,其特征在于,包括:
接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板;
获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例;其中,所述配置信息包括所述票据解析模板的解析区域的第一位置信息和所述解析器信息,所述解析区域对应所述票据解析模板的数据项;
使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。
2.根据权利要求1所述的方法,其特征在于,所述第一位置信息包括所述解析区域的顶点坐标;
所述将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,包括:
根据所述解析区域的顶点坐标,以及所述票据解析模板的第一总宽度和第一总高度,计算相应数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比;
根据所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比,以及所述待解析票据文件的第二总宽度和第二总高度,计算相同数据项在待解析票据文件的第二位置信息。
3.根据权利要求2所述的方法,其特征在于,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区,位于所述主票区的解析区域对应一个所述数据项,位于所述明细区的解析区域对应多个所述数据项;
所述计算相应数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比,包括:
在所述解析区域位于所述主票区的情况下,将所述解析区域的起始横坐标、起始纵坐标分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的起始位置占比;以及
计算所述解析区域的宽度和高度,将所述解析区域的宽度、高度分别与所述第一总宽度、所述第一总高度作比,得到所述相应数据项在所述票据解析模板的数据宽度占比和数据高度占比;
在所述解析区域位于所述明细区的情况下,计算所述解析区域的宽度和高度,根据所述解析器信息的总行数和总列数,计算每个所述数据项的宽度和高度;以及
根据所述解析区域的起始横坐标、起始纵坐标和每个所述数据项的宽度和高度,计算每个所述数据项在所述票据解析模板的起始位置占比、数据宽度占比和数据高度占比。
4.根据权利要求1所述的方法,其特征在于,所述票据解析模板包括由票据基本信息构成的主票区和由票据明细信息构成的明细区;所述解析器信息包括解析器类型,所述主票区的解析器类型与所述明细区的解析器类型不同;
所述根据所述配置信息中的解析器信息,创建对应的解析器实例,包括:
根据所述解析器信息的解析器类型,将所述配置信息划分为基本配置和明细配置;
根据所述基本配置和所述明细配置,分别创建对应的主要解析实例和明细解析实例,所述主要解析实例和所述明细解析实例构成解析器实例;
所述使用所述解析器实例,包括:在所述解析区域位于所述主票区的情况下,使用所述主要解析实例;以及
在所述解析区域位于所述明细区的情况下,使用所述明细解析实例。
5.根据权利要求4所述的方法,其特征在于,所述主票区的解析器类型包括普通类型和分隔符类型;
所述读取所述第二位置信息处所记载的数据信息,包括:
在所述解析区域位于所述主票区,且解析器类型为普通类型的情况下,直接读取所述第二位置信息处所记载的数据信息;
在所述解析区域位于所述主票区,且解析器类型为分隔符类型的情况下,分别读取所述第二位置信息处、设定分隔符前后的数据信息。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述数据项抽象为数据节点,为所述数据节点创建节点标识;
将所述节点标识、相应数据项的起始位置占比、数据宽度占比和数据高度占比作为所述数据节点的节点信息写入数据节点集合;
所述计算相同数据项在待解析票据文件的第二位置信息,包括:
重复执行以下步骤,直至全部数据节点处理结束:按照所述节点标识,从所述数据节点集合中索引相应数据节点的节点信息,以计算相同数据项在待解析票据文件的第二位置信息;
所述读取所述第二位置信息处所记载的数据信息的步骤之后,所述方法还包括:将所述数据信息赋值到所述数据节点。
7.根据权利要求1至6的任一项所述的方法,其特征在于,所述方法还包括:
接收原始票据文件,当检测到对所述原始票据文件的编辑操作时,将所述编辑操作的操作区域作为所述解析区域,返回用于对所述解析区域进行配置的属性编辑界面;
接收用户在所述属性编辑界面输入的配置信息,组装所述解析区域的配置信息,生成相应的票据解析模板;
建立所述票据解析模板与所述目标对象数据之间的关联关系;其中,所述目标对象数据包括开票方标识。
8.一种票据文件的解析装置,其特征在于,包括:
模板查询模块,用于接收待解析票据文件,根据所述待解析票据文件的目标对象数据,查询与所述待解析票据文件相匹配的票据解析模板;
实例创建模块,用于获取所述票据解析模板的配置信息,根据所述配置信息中的解析器信息,创建对应的解析器实例;其中,所述配置信息包括所述票据解析模板的解析区域的第一位置信息和所述解析器信息,所述解析区域对应所述票据解析模板的数据项;
文件解析模块,用于使用所述解析器实例,将所述第一位置信息转化为相同数据项在所述待解析票据文件的第二位置信息,读取所述第二位置信息处所记载的数据信息,完成解析。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111401050.7A CN114357967A (zh) | 2021-11-19 | 2021-11-19 | 一种票据文件的解析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111401050.7A CN114357967A (zh) | 2021-11-19 | 2021-11-19 | 一种票据文件的解析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114357967A true CN114357967A (zh) | 2022-04-15 |
Family
ID=81095546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111401050.7A Pending CN114357967A (zh) | 2021-11-19 | 2021-11-19 | 一种票据文件的解析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357967A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116049293A (zh) * | 2023-03-23 | 2023-05-02 | 北京沐融信息科技股份有限公司 | 基于数据库配置实现解析csv文件方法、装置、设备及介质 |
-
2021
- 2021-11-19 CN CN202111401050.7A patent/CN114357967A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116049293A (zh) * | 2023-03-23 | 2023-05-02 | 北京沐融信息科技股份有限公司 | 基于数据库配置实现解析csv文件方法、装置、设备及介质 |
CN116049293B (zh) * | 2023-03-23 | 2024-02-13 | 北京沐融信息科技股份有限公司 | 基于数据库配置实现解析csv文件方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150026556A1 (en) | Systems and Methods for Extracting Table Information from Documents | |
CN111512315A (zh) | 文档元数据的按块提取 | |
CN111813804B (zh) | 一种数据查询方法、装置、电子设备及存储介质 | |
CN110020358B (zh) | 用于生成动态页面的方法和装置 | |
CN112070608B (zh) | 信息处理方法、装置、介质及电子设备 | |
CN113377653B (zh) | 生成测试用例的方法和装置 | |
CN113626223A (zh) | 一种接口调用方法和装置 | |
CN111241180A (zh) | 一种信息处理的方法、装置、设备及存储介质 | |
CN114357967A (zh) | 一种票据文件的解析方法和装置 | |
CN110704432A (zh) | 数据索引的建立方法和装置、可读存储介质、电子设备 | |
CN109740130B (zh) | 用于生成文件的方法和装置 | |
CN115469849B (zh) | 一种业务处理系统、方法、电子设备和存储介质 | |
CN116594683A (zh) | 一种代码注释信息生成方法、装置、设备及存储介质 | |
CN116185393A (zh) | 接口文档的生成方法、装置、设备、介质及产品 | |
CN115391343A (zh) | 账单数据处理方法、装置、电子设备和存储介质 | |
CN115640279A (zh) | 一种数据血缘关系的构建方法和装置 | |
CN113515271B (zh) | 服务代码生成方法、装置、电子设备及可读存储介质 | |
CN113792138B (zh) | 报表生成方法、装置、电子设备及存储介质 | |
CN113778401A (zh) | 一种页面生成的方法和装置 | |
CN111178014A (zh) | 一种处理业务流程的方法和装置 | |
CN106528718B (zh) | 用于处理来自第三方的数据的方法及装置 | |
CN110874302A (zh) | 一种埋点配置信息的确定方法和装置 | |
CN113110873A (zh) | 统一系统编码规范的方法和装置 | |
CN110727897B (zh) | 支持多终端操作的地质调查信息服务快速发布方法及系统 | |
CN117807038A (zh) | 文件生成方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |