CN116978051A

CN116978051A - 一种表格图像关键信息提取方法和装置

Info

Publication number: CN116978051A
Application number: CN202310979093.6A
Authority: CN
Inventors: 褚一平; 黄叶珏; 郑义; 陈建勇; 郁星星; 张雪妮; 陈士春; 唐志学; 朱华山
Original assignee: Hangzhou Hailiang Information Technology Co ltd
Current assignee: Hangzhou Hailiang Information Technology Co ltd
Priority date: 2023-08-03
Filing date: 2023-08-03
Publication date: 2023-10-31

Abstract

本发明公开一种表格图像关键信息提取方法和装置，包括以下步骤：步骤S1、识别业务表格图像中的交点位置和交点类型；步骤S2、根据交点的位置和交点类型按规则进行排列，得到业务表格图像中表格的行列有序交点集；步骤S3、所述业务表格图像中表格的行列有序交点集与预设的模板参数进行匹配，得到关键字和键值单元格位置信息；步骤S4、根据键值单元格位置信息从OCR识别结果抽取键值，实现表格关键信息的提取。采用本发明的技术方案，可以应用于智能经办业务系统中，提高智能经办业务处理效率，节省了人工成本。

Description

一种表格图像关键信息提取方法和装置

技术领域

本发明属于信息处理的技术领域，尤其涉及一种表格图像关键信息提取方法和装置。

背景技术

在社会保险等业务办理过程中，涉及提交和处理大量的盖章纸质材料。业务经办人员需要把用户提交的纸质材料录入到业务系统中。由于每起业务办理所涉及的录入工作量比较大，不但影响业务办理的个人体验，而且人工成本也非常高。

发明内容

本发明要解决的技术问题是，提供一种表格图像关键信息提取方法和装置，提高经办业务处理效率，节省了人工成本。

为实现上述目的，本发明采用如下的技术方案：

一种表格图像关键信息提取方法，包括以下步骤：

步骤S1、识别业务表格图像中的交点位置和交点类型；

步骤S2、根据交点的位置和交点类型按规则进行排列，得到业务表格图像中表格的行列有序交点集；

步骤S3、所述业务表格图像中表格的行列有序交点集与预设的模板参数进行匹配，得到关键字和键值单元格位置信息；

步骤S4、根据键值单元格位置信息从OCR识别结果抽取键值，实现表格关键信息的提取。

作为优选，步骤S1中，通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

作为优选，表格交点检测器的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。

作为优选，步骤S2中，采用表格交点行列有序化方法得到业务表格图像中表格的行列有序交点集。

本发明还提供一种表格图像关键信息提取装置，包括：

识别模块，用于识别业务表格图像中的交点位置和交点类型；

排列模块，用于根据交点的位置和交点类型按规则进行排列，得到业务表格图像中表格的行列有序交点集；

匹配模块，用于所述业务表格图像中表格的行列有序交点集与预设的模板参数进行匹配，得到关键字和键值单元格位置信息；

提取模块，用于根据键值单元格位置信息从OCR识别结果抽取键值，实现表格关键信息的提取。

作为优选，识别模块通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

作为优选，表格交点检测器的的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。

作为优选，排列模块采用表格交点行列有序化方式得到业务表格图像中表格的行列有序交点集。

本发明识别业务表格图像中的交点位置和交点类型；根据交点的位置和交点类型按规则进行排列，得到业务表格图像中表格的行列有序交点集；所述业务表格图像中表格的行列有序交点集与预设的模板参数进行匹配，得到关键字和键值单元格位置信息；根据键值单元格位置信息从OCR识别结果抽取键值，实现表格关键信息的提取。采用本发明的技术方案，可以应用于智能经办业务系统中，提高智能经办业务处理效率，节省了人工成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例的表格图像关键信息提取方法的流程图；

图2为本发明实施例的表格图像关键信息提取装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1：

如图1所示，本发明实施例提供一种表格图像关键信息提取方法，包括以下步骤：

步骤S1、识别业务表格图像中的交点位置和交点类型；

作为本发明实施例的一种实施方式，步骤S1中，通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

进一步，表格交点检测器的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。表格图像输入到网络中后，先经过编码器进行特征编码，再送解码器进行特征解码，最后分成两个网络支路分别输出结果。一个网络支路由两层卷积和一个Sigmoid层组成，输出每个像素属于交点的概率，称为交点回归支路；另一个网络支路由两层卷积单元构成，输出每个像素属于交点类型，称为交点类型支路。根据表格中的两条线段相交情况，设计了L型交点、倒L型交点、7型交点、倒7型交点、T型交点、倒T型交点、顺时针90度T型交点、逆时针90度T型交点和十字型交点9种交点类型。表格交点检测器采用联合损失函数进行训练，联合损失函数定义为：

其中，为交点回归支路的均方误差损失函数，/>为交点类型支路的交叉熵损失函数。表格交点检测器先在合成数据进行预训练，再使用智能经办业务中的表格图像数据进行微调训练得到。

作为优选，步骤S2中，采用表格交点行列有序化方法得到业务表格图像中表格的行列有序交点集。具体包括：

先按x坐标对表格交点集从小到大排序，再按y坐标从小到大排序，得到初选交点集。

先创建一个空的行列有序交点集，从初选交点集的第一个交点开始，

如果该交点的类型是“倒L型交点”，则向后搜索直至找到一个类型为“7型交点”，把这些交点从初选交点集中拆分出来，作为一个行有序交点子集并入到行列有序交点集中；

如果该交点的类型是“逆时针90度T型交点”，则向后搜索直至找到一个类型为“顺时针90度T型交点”，把这些交点从初选交点集中拆分出来，作为一个行有序交点子集并入到行列有序交点集中；

如果该交点的类型是“L型交点”，则向后搜索直至找到一个类型为“倒7型交点”，把这些交点从初选交点集中拆分出来，作为一个行有序交点子集并入到行列有序交点集中；

直至最后一个交点，得到行列有序交点集。

作为本发明实施例的一种实施方式，步骤S3中，预设模板的构建方法包括：

选择一张质量较好的智能经办业务表格的图像作为模板图像，先使用表格交点检测器得到表格交点集。

在表格交点集中搜索L型交点、倒L型交点、7型交点和倒7型交点这4个表格顶角交点。

使用表格交点行列有序化方法得到行列有序交点集，并按行号以及行号顺序对行列有序交点集进行编号。根据业务办理内容设置关键信息的关键字和键值单元格位置，其中键值单元格位置由其左上、右上、左下和右下4个表格交点的编号确定。把表格顶角交点、行列有序交点集、关键字和键值单元格位置等数据作为该业务表格的模板参数进行预存储。

作为本发明实施例的一种实施方式，步骤S3中，业务表格行列有序交点集与模板参数中的行列有序交点集进行逐行对齐，并根据模板参数的关键字和键值单元格位置得到业务表格的关键字和键值单元格位置。

作为本发明实施例的一种实施方式，步骤S4中，根据业务表格的关键字和键值单元格位置，根据键值单元格的左上、右上、左下和右下4个表格交点的坐标，提取该区域的OCR的文字识别结果，生成业务表格的“关键字-键值”数据对。

业务材料信息都是由固定形式的表格组织的，本发明实施例根据业务表格种类固定的特点，设计一种基于业务表格类型的模板的表格关键信息提取方法，并把这些关键信息结构化传递给业务系统，可以大大提高效率、降低人工录入的成本。通过表格交点检测器，检测表格图像中的交点位置和交点类型，并采用表格交点行列有序化方法，把表格的交点数据转变成行列有序交点集。对每种表格类型设置关键字和健值信息等各种模板参数，业务表格图像的行列有序交点集与模板参数进行匹配，得到关键字和键值单元格位置，并进一步从OCR识别结果抽取键值，实现表格图像的关键信息的提取。采用本发明技术方案，提高经办业务处理效率，节省了人工成本。

实施例2：

如图2所示，本发明实施例提供一种表格图像关键信息提取装置，包括：

作为本发明实施例的一种实施方式，识别模块通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

作为本发明实施例的一种实施方式，表格交点检测器的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。

作为本发明实施例的一种实施方式，排列模块采用表格交点行列有序化方式得到业务表格图像中表格的行列有序交点集。

以上所述的实施例仅是对本发明优选方式进行的描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种表格图像关键信息提取方法，其特征在于，包括以下步骤：

步骤S1、识别业务表格图像中的交点位置和交点类型；

2.如权利要求1所述的表格图像关键信息提取方法，其特征在于，步骤S1中，通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

3.如权利要求2所述的表格图像关键信息提取方法，其特征在于，表格交点检测器的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。

4.如权利要求3所述的表格图像关键信息提取方法，其特征在于，步骤S2中，采用表格交点行列有序化方法得到业务表格图像中表格的行列有序交点集。

5.一种表格图像关键信息提取装置，其特征在于，包括：

6.如权利要求5所述的表格图像关键信息提取装置，其特征在于，识别模块通过表格交点检测器识别业务表格图像中的交点位置和交点类型。

7.如权利要求6所述的表格图像关键信息提取装置，其特征在于，表格交点检测器的网络结构采用图像输入-编码器-解码器-支路结果输出的结构。

8.如权利要求7所述的表格图像关键信息提取装置，其特征在于，排列模块采用表格交点行列有序化方式得到业务表格图像中表格的行列有序交点集。