CN105760450A - 一种表单文件解析方法及装置 - Google Patents

一种表单文件解析方法及装置 Download PDF

Info

Publication number
CN105760450A
CN105760450A CN201610078128.9A CN201610078128A CN105760450A CN 105760450 A CN105760450 A CN 105760450A CN 201610078128 A CN201610078128 A CN 201610078128A CN 105760450 A CN105760450 A CN 105760450A
Authority
CN
China
Prior art keywords
object table
list
table monofile
monofile
form group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610078128.9A
Other languages
English (en)
Inventor
郑明建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur General Software Co Ltd
Original Assignee
Inspur General Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur General Software Co Ltd filed Critical Inspur General Software Co Ltd
Priority to CN201610078128.9A priority Critical patent/CN105760450A/zh
Publication of CN105760450A publication Critical patent/CN105760450A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种表单文件解析方法及装置,其中方法包括:预先配置第一格式组和第二格式组;获取待解析的目标表单文件;根据目标表单文件,构建包括有第一格式组的第一列表和包括有第二格式组的第二列表;根据第一列表和第二列表,对目标表单文件进行解析。根据本方案,通过将待解析的目标表单文件构建第一列表和第二列表,其中,第一列表包括第一格式组,第二列表包括第二格式组,由于第一格式组和第二格式组是预先配置的固定格式,因此,通过将目标表单文件按照固定格式进行读取,可以只利用预先配置好的一种解析方式即可对所有类型的目标表单文件实现解析,从而无需重新配置解析方式,进而可以提高表单文件的解析效率。

Description

一种表单文件解析方法及装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种表单文件解析方法及装置。
背景技术
随着计算机技术的飞速发展,在企业办公领域内包括大量的表单文件,这些表单文件一般用于实现采购信息、会计信息、保税信息、物流信息和销售信息的存储。通常在信息系统开发和实施过程中,对于表单文件的解析十分重要。
目前,在针对不同业务类型的表单文件进行解析时,往往会开发多种解析方式,以利用不同的解析方式实现对相应业务类型的表单文件的解析。
然而,对于表单文件的业务类型较多,且可能存在需要对表单文件进行解析时,信息系统中不包括该业务类型表单文件所对应的解析方式,从而导致无法对该表单文件进行解析,进而影响表单文件解析的效率。
发明内容
本发明实施例提供了一种表单文件解析方法及装置,以实现对表单文件的解析。
第一方面,本发明通过了一种表单文件解析方法,预先配置第一格式组和第二格式组;所述方法还包括:
获取待解析的目标表单文件;
根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表;
根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
优选地,在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同,则构建的所述第一列表中包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组,构建的所述第二列表中包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组。
优选地,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
优选地,所述对所述目标表单文件进行解析,包括:
获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;
根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
优选地,在对所述目标表单文件进行解析之后,进一步包括:
针对所述目标表单文件生成第三列表,以使信息系统获知已执行对所述目标表单文件的解析,其中,所述第三列表包括:ROW_ID、配置编号、租户编号、租户名称、用户编号、用户名称、服务器IP、文件目录、文件名中的至少一种。
优选地,所述对所述目标表单文件的内容进行校验之后,进一步包括:在校验结果错误时,生成第四列表,并将所述第四列表进行反馈,以使信息系统根据所述第四列表对所述目标表单文件进行处理;其中,所述第四列表包括:ROW_ID、批次ID、配置编号、文件ID、错误行、列名和错误信息中至少一种。
第二方面,本发明还提供了一种表单文件解析装置,包括:
配置单元,用于配置第一格式组和第二格式组,并将所述第一格式组和第二格式组发送给构建单元;
获取单元,用于获取待解析的目标表单文件,并将所述目标表单文件发送给所述构建单元;
所述构建单元,用于根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表,并将所述第一列表和所述第二列表发送给解析单元;
所述解析单元,用于根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
优选地,所述构建单元,具体用于在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,构建包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组的第一列表,构建包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组的第二列表。
优选地,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
优选地,所述解析单元,具体用于获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
本发明实施例提供了一种表单文件解析方法及装置,通过将待解析的目标表单文件构建第一列表和第二列表,其中,第一列表包括第一格式组,第二列表包括第二格式组,由于第一格式组和第二格式组是预先配置的固定格式,因此,通过将目标表单文件按照固定格式进行读取,可以只利用预先配置好的一种解析方式即可对所有类型的目标表单文件实现解析,从而无需重新配置解析方式,进而可以提高表单文件的解析效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种方法流程图;
图2是本发明一个实施例提供的另一种方法流程图;
图3是本发明一个实施例提供的一种装置所在设备的硬件架构图;
图4是本发明一个实施例提供的一种装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种表单文件解析方法,预先配置第一格式组和第二格式组;该方法可以包括以下步骤:
步骤101:获取待解析的目标表单文件。
步骤102:根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表。
步骤103:根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
根据上述方案,通过将待解析的目标表单文件构建第一列表和第二列表,其中,第一列表包括第一格式组,第二列表包括第二格式组,由于第一格式组和第二格式组是预先配置的固定格式,因此,通过将目标表单文件按照固定格式进行读取,可以只利用预先配置好的一种解析方式即可对所有类型的目标表单文件实现解析,从而无需重新配置解析方式,进而可以提高表单文件的解析效率。
在现有技术中,需要对多个目标表单文件进行解析时,需要逐个确定每一个目标表单文件所对应的解析方式,并利用确定的各个解析方式分别对相应的目标表单文件进行解析,效率较低,因此,在本发明一个实施例中,在目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,则构建的所述第一列表中包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组,构建的所述第二列表中包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组,且在解析时,只需根据该第一列表和第二列表,对该多个目标表单文件同时进行解析。
在本发明一个实施例中,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种。
在本发明一个实施例中,所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
在本发明一个实施例中,对目标表单文件的解析包括对目标表单文件的校验过程,对于目标表单文件的校验可以根据第一列表和第二列表来决定,其中,所述对所述目标表单文件进行解析,包括:
获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;
根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
在本发明一个实施例中,由于在对目标表单文件校验过程中,存在校验结果为错误的情况,因此,在校验结果错误时,生成第四列表,并将所述第四列表进行反馈,以使信息系统根据所述第四列表对所述目标表单文件进行处理;其中,所述第四列表包括:ROW_ID、批次ID、配置编号、文件ID、错误行、列名和错误信息中至少一种。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
如图2所示,本发明实施例提供了一种表单文件解析方法,该方法可以包括以下步骤:
步骤201:配置第一格式组和第二格式组。
在本实施例中,该第一格式组可以如下表1所示:
表1:
其中,该第一格式组用于实现对表单文件内容的分析,其中,配置编号用于表述该表单文件的业务功能,例如,配置编号为1时,对应配置名称为财务报表,配置编号为2时,对应配置名称为销售报表等。
其中,表头类型为0时,用于表述该表头为英文形式,表头类型为1时,用于表述该表头为中文形式。当头检查标识为0时,用于表述不对表头进行校验,当头检查标识为1时,用于表述对表头进行校验。
在本实施例中,该第二格式组可以如下表2所示:
表2:
其中,该第二格式组用于实现对表单文件中数据属性信息以及校验方式的配置。
其中,该校验方式可以包括对如下各个数据类型的校验:1、String:字符型;2、Money:金额型;3、Integer:整型;4、Date:日期型;5、Card:身份证。
步骤202:获取待解析的目标表单文件。
其中,该目标表单文件可以为一个也可以为多个。
例如,获取的如下两个目标表单文件:数据类型为Excel格式表单1,以及,数据类型为CSV(Comma-SeparatedValues,逗号分隔值)格式的表单2。其中,表单1中存储数据的业务功能为财务报表,表单2中存储数据的业务功能为销售报表。
步骤203:分别读取表单1和表单2,并分别针对表单1和表单2构建包括有第一格式组的第一列表和包括有第二格式组的第二列表。
在本实施例中,可以针对表单1构建列表1和列表2,针对表单2构建列表3和列表4。
步骤204:分别获取表单1和表单2的文件名称,并根据文件名称确定表单1的文件类型为Excel,表单2的文件类型为CSV。
步骤205:根据表单1、表单2的文件类型,分别调用Excel所对应的API接口读取表单1,调用CSV所对应的API接口读取表单2。
步骤206:根据包括第一格式组的列表中头检查标识确定是否需要对表单的表头进行校验,若需要,则执行步骤207;若不需要,则执行步骤208。
步骤207:根据包括第一格式组的列表中表头所在行对表单的表头进行校验,并在校验通过时,执行步骤208,在校验未通过时,执行步骤210。
步骤208:根据包括第二格式组的列表中校验方式、数据开始行和数据开始列对表单的内容进行校验,并在校验通过时,执行步骤209;在校验未通过时,执行步骤210。
步骤209:分别针对表单1、表单2生成相应的第三列表,并将表单存储到相关变量中,结束。
其中,该相关变量为内存的相应位置处。
其中,该第三列表用于表明该表单已经被解析,该第三列表请参考下表3。
表3:
名称 编码 数据类型 主键 外键 是否必须
ROW_ID ROW_ID NUMBER(18) TRUE FALSE TRUE
配置编号 CFG_CODE VARchar2(32) FALSE FALSE TRUE
租户编号 TENANT_CODE VARchar2(10) FALSE FALSE FALSE
租户名称 TENANT_NAME VARchar2(100) FALSE FALSE FALSE
用户编号 USER_CODE VARchar2(32) FALSE FALSE TRUE
用户名称 USER_NAME VARchar2(100) FALSE FALSE TRUE
服务器IP SERVER_IP VARchar2(32) FALSE FALSE TRUE
文件目录 FILEPATH VARchar2(200) FALSE FALSE TRUE
文件名 FILENAME VARchar2(200) FALSE FALSE TRUE
步骤210:生成第四列表,并将该第四列表进行反馈,以使信息系统根据第四列表对表单进行处理。
在本实施例中,为了保证信息系统能够获知到出现校验错误的数据内容,可以针对校验错误的数据内容生成一个列表,以反馈给信息系统,信息系统可以根据该列表中的内容获知到出现校验错误的数据内容,进而对表单进行验证处理。
其中,该第四列表请参考下表4。
表4:
名称 编码 数据类型 主键 外键 是否必须
ROW_ID ROW_ID NUMBER(18) TRUE FALSE TRUE
批次ID BATCH_ID NUMBER(18) FALSE FALSE TRUE
配置编号 CFG_CODE VARchar2(32) FALSE FALSE TRUE
文件ID FILE_ID NUMBER(18) FALSE TRUE TRUE
错误行 ERROR_ROW NUMBER(8) FALSE FALSE TRUE
列名 COL_NAME VARchar2(100) FALSE FALSE TRUE
错误信息 ERROR_INFO VARchar2(255) FALSE FALSE TRUE
根据上述方案,通过将待解析的目标表单文件构建第一列表和第二列表,其中,第一列表包括第一格式组,第二列表包括第二格式组,由于第一格式组和第二格式组是预先配置的固定格式,因此,通过将目标表单文件按照固定格式进行读取,可以只利用预先配置好的一种解析方式即可对所有类型的目标表单文件实现解析,从而无需重新配置解析方式,进而可以提高表单文件的解析效率。
如图3、图4所示,本发明实施例提供了一种表单文件解析装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的一种表单文件解析装置所在设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种表单文件解析装置,包括:
配置单元401,用于配置第一格式组和第二格式组,并将所述第一格式组和第二格式组发送给构建单元403;
获取单元402,用于获取待解析的目标表单文件,并将所述目标表单文件发送给所述构建单元403;
所述构建单元403,用于根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表,并将所述第一列表和所述第二列表发送给解析单元404;
所述解析单元404,用于根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
其中,所述构建单元403,具体用于在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,构建包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组的第一列表,构建包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组的第二列表。
其中,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
其中,所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
其中,所述解析单元404,具体用于获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
综上,本发明实施例至少可以实现如下有益效果:
1、在本发明实施例中,通过将待解析的目标表单文件构建第一列表和第二列表,其中,第一列表包括第一格式组,第二列表包括第二格式组,由于第一格式组和第二格式组是预先配置的固定格式,因此,通过将目标表单文件按照固定格式进行读取,可以只利用预先配置好的一种解析方式即可对所有类型的目标表单文件实现解析,从而无需重新配置解析方式,进而可以提高表单文件的解析效率。
2、在本发明实施例中,在目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,那么构建包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组的第一列表,构建包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组的第二列表,在解析时只需根据该第一列表和第二列表,对该多个目标表单文件同时进行解析,从而进一步提高了表单的解析效率。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃〃〃〃〃〃”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种表单文件解析方法,其特征在于,预先配置第一格式组和第二格式组;所述方法还包括:
获取待解析的目标表单文件;
根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表;
根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
2.根据权利要求1所述的方法,其特征在于,
在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同,则构建的所述第一列表中包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组,构建的所述第二列表中包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组。
3.根据权利要求1或2所述的方法,其特征在于,
所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标表单文件进行解析,包括:
获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;
根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
5.根据权利要求1所述的方法,其特征在于,在对所述目标表单文件进行解析之后,进一步包括:
针对所述目标表单文件生成第三列表,以使信息系统获知已执行对所述目标表单文件的解析,其中,所述第三列表包括:ROW_ID、配置编号、租户编号、租户名称、用户编号、用户名称、服务器IP、文件目录、文件名中的至少一种。
6.根据权利要求4所述的方法,其特征在于,所述对所述目标表单文件的内容进行校验之后,进一步包括:在校验结果错误时,生成第四列表,并将所述第四列表进行反馈,以使信息系统根据所述第四列表对所述目标表单文件进行处理;其中,所述第四列表包括:ROW_ID、批次ID、配置编号、文件ID、错误行、列名和错误信息中至少一种。
7.一种表单文件解析装置,其特征在于,包括:
配置单元,用于配置第一格式组和第二格式组,并将所述第一格式组和第二格式组发送给构建单元;
获取单元,用于获取待解析的目标表单文件,并将所述目标表单文件发送给所述构建单元;
所述构建单元,用于根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表,并将所述第一列表和所述第二列表发送给解析单元;
所述解析单元,用于根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
8.根据权利要求7所述的表单文件解析装置,其特征在于,
所述构建单元,具体用于在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,构建包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组的第一列表,构建包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组的第二列表。
9.根据权利要求7或8所述的表单文件解析装置,其特征在于,
所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
10.根据权利要求9所述的表单文件解析装置,其特征在于,所述解析单元,具体用于获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
CN201610078128.9A 2016-02-04 2016-02-04 一种表单文件解析方法及装置 Pending CN105760450A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610078128.9A CN105760450A (zh) 2016-02-04 2016-02-04 一种表单文件解析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610078128.9A CN105760450A (zh) 2016-02-04 2016-02-04 一种表单文件解析方法及装置

Publications (1)

Publication Number Publication Date
CN105760450A true CN105760450A (zh) 2016-07-13

Family

ID=56329977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610078128.9A Pending CN105760450A (zh) 2016-02-04 2016-02-04 一种表单文件解析方法及装置

Country Status (1)

Country Link
CN (1) CN105760450A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227575A (zh) * 2016-07-26 2016-12-14 浪潮通用软件有限公司 一种生成与解析文本文件的方法
CN107038646A (zh) * 2016-12-29 2017-08-11 平安科技(深圳)有限公司 数据处理方法及装置
CN108763185A (zh) * 2018-05-31 2018-11-06 苏州市计量测试院 Excel文件的校验方法及系统
CN109815235A (zh) * 2018-12-29 2019-05-28 东软集团股份有限公司 生成数据源的方法、装置、存储介质及电子设备
CN111476009A (zh) * 2020-03-23 2020-07-31 一汽奔腾轿车有限公司 一种新车报税配置信息一致性校验系统
CN112241883A (zh) * 2019-07-19 2021-01-19 傲为信息技术(江苏)有限公司 一种待认证数字资产数据包的处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277177A1 (en) * 2005-06-02 2006-12-07 Lunt Tracy T Identifying electronic files in accordance with a derivative attribute based upon a predetermined relevance criterion
CN101452441A (zh) * 2008-12-05 2009-06-10 山东浪潮齐鲁软件产业股份有限公司 一种电子表格通用数据解析导入方法
CN101661512A (zh) * 2009-09-25 2010-03-03 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
CN102789382A (zh) * 2012-06-28 2012-11-21 用友软件股份有限公司 用于表单生成和运行的系统及方法
CN103377038A (zh) * 2012-04-11 2013-10-30 怡丰联合(北京)科技有限责任公司 自定义表单的描述及表单解析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277177A1 (en) * 2005-06-02 2006-12-07 Lunt Tracy T Identifying electronic files in accordance with a derivative attribute based upon a predetermined relevance criterion
CN101452441A (zh) * 2008-12-05 2009-06-10 山东浪潮齐鲁软件产业股份有限公司 一种电子表格通用数据解析导入方法
CN101661512A (zh) * 2009-09-25 2010-03-03 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
CN103377038A (zh) * 2012-04-11 2013-10-30 怡丰联合(北京)科技有限责任公司 自定义表单的描述及表单解析方法
CN102789382A (zh) * 2012-06-28 2012-11-21 用友软件股份有限公司 用于表单生成和运行的系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227575A (zh) * 2016-07-26 2016-12-14 浪潮通用软件有限公司 一种生成与解析文本文件的方法
CN106227575B (zh) * 2016-07-26 2019-05-07 浪潮通用软件有限公司 一种生成与解析文本文件的方法
CN107038646A (zh) * 2016-12-29 2017-08-11 平安科技(深圳)有限公司 数据处理方法及装置
CN107038646B (zh) * 2016-12-29 2020-05-22 平安科技(深圳)有限公司 数据处理方法及装置
CN108763185A (zh) * 2018-05-31 2018-11-06 苏州市计量测试院 Excel文件的校验方法及系统
CN109815235A (zh) * 2018-12-29 2019-05-28 东软集团股份有限公司 生成数据源的方法、装置、存储介质及电子设备
CN109815235B (zh) * 2018-12-29 2021-10-15 东软集团股份有限公司 生成数据源的方法、装置、存储介质及电子设备
CN112241883A (zh) * 2019-07-19 2021-01-19 傲为信息技术(江苏)有限公司 一种待认证数字资产数据包的处理方法及系统
CN111476009A (zh) * 2020-03-23 2020-07-31 一汽奔腾轿车有限公司 一种新车报税配置信息一致性校验系统

Similar Documents

Publication Publication Date Title
CN105760450A (zh) 一种表单文件解析方法及装置
US8019795B2 (en) Data warehouse test automation framework
KR102214297B1 (ko) 조건부 검증 규칙
US20100211539A1 (en) System and method for building a data warehouse
US11093521B2 (en) Just-in-time data quality assessment for best record creation
CN101515289B (zh) 一种对通用数据文件进行检查的装置及方法
US11347719B2 (en) Multi-table data validation tool
CN110781231A (zh) 基于数据库的批量导入方法、装置、设备及存储介质
CN112181804A (zh) 一种参数校验方法、设备以及存储介质
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
CN110427375B (zh) 字段类别的识别方法及装置
CN109408366B (zh) 数据源配置测试方法、系统、计算机设备和存储介质
CN111597069B (zh) 程序处理方法、装置、电子设备和存储介质
CN105740219A (zh) 一种报表的自定义方法及装置
CN112416784A (zh) 基于配置中心的接口校验方法、系统及装置及存储介质
CN105700917A (zh) 一种dll与数据库同步的方法及装置
US11182375B2 (en) Metadata validation tool
CN112506897A (zh) 一种分析、定位数据质量问题的方法及系统
US10248638B2 (en) Creating forms for hierarchical organizations
CN109343891B (zh) 数据处理的系统、方法及装置
US20150193854A1 (en) Automated compilation of graph input for the hipergraph solver
CN111459817B (zh) 一种程序执行码的检验方法及装置
CN114661671A (zh) 文件处理方法、装置、计算机可读存储介质及电子设备
CN108255887B (zh) 校验行业文本的方法和装置
CN113138936B (zh) 数据处理方法、装置、存储介质及处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713