CN116189212A

CN116189212A - 一种基于图像的表格智能识别与计分方法

Info

Publication number: CN116189212A
Application number: CN202310353451.2A
Authority: CN
Inventors: 许剑; 武建林
Original assignee: Anhui Lanjiexin Information Technology Co ltd
Current assignee: Anhui Lanjiexin Information Technology Co ltd
Priority date: 2023-04-04
Filing date: 2023-04-04
Publication date: 2023-05-30

Abstract

本发明涉及表格识别计分，具体涉及一种基于图像的表格智能识别与计分方法，利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架；对初级表格结构框架进行分析，筛选关键点；基于关键点得到目标表格结构框架；根据目标表格结构框架生成表格型文本，并从表格型文本中抽取待识别字段的文本数据；构建与表格实体布局关联的文本识别模型，根据待识别字段的文本数据来源选择对应的文本识别模型获取文本识别结果；根据待识别字段的文本识别结果及相应评分标准进行计分；本发明提供的技术方案能够有效克服现有技术所存在的无法对不同类型表格进行高效、准确地识别，以及文本识别准确度较低的缺陷。

Description

一种基于图像的表格智能识别与计分方法

技术领域

本发明涉及表格识别计分，具体涉及一种基于图像的表格智能识别与计分方法。

背景技术

考试是老师对学生学习成果的一种考核方式，通过考试可以对学生的学习成果进行检验。现有技术中，针对表格的阅卷方式一般是通过模板匹配的方法来提取感兴趣区域中的文字，再利用文字识别技术进行文字识别和计分。上述方法的实现过程如下：首先，上传与待识别表格结构一致的模板图像，并在模板图像中框选出感兴趣区域；其次，记录感兴趣区域的位置信息(如角点坐标、框体长度/宽度等)，基于感兴趣区域的位置信息生成表格模板；最后，根据表格模板确定待识别表格中的感兴趣区域，并利用文字识别技术识别感兴趣区域中的文字，基于文字识别结果进行分数统计。

上述现有技术方案主要存在以下问题：表格模板对于固定版式的表格较为适用，但是对于每次的考卷，其中包含待识别表格的版式或类型是多样的，如果为每种待识别表格都生成一个表格模板，不仅费时费力，而且需要付出非常大的成本。换句话说，上述表格模板存在局限性大、灵活性低的问题。

发明内容

(一)解决的技术问题

针对现有技术所存在的上述缺点，本发明提供了一种基于图像的表格智能识别与计分方法，能够有效克服现有技术所存在的无法对不同类型表格进行高效、准确地识别，以及文本识别准确度较低的缺陷。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种基于图像的表格智能识别与计分方法，包括以下步骤：

S1、利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架；

S2、对初级表格结构框架进行分析，筛选关键点；

S3、基于关键点得到目标表格结构框架；

S4、根据目标表格结构框架生成表格型文本，并从表格型文本中抽取待识别字段的文本数据；

S5、构建与表格实体布局关联的文本识别模型，根据待识别字段的文本数据来源选择对应的文本识别模型获取文本识别结果；

S6、根据待识别字段的文本识别结果及相应评分标准进行计分。

优选地，S1中利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架之后，包括：

生成水平梯度卷积核和竖直梯度卷积核，并利用水平梯度卷积核、竖直梯度卷积核分别对初级表格结构框架进行卷积处理，以分别提取初级表格结构框架中的水平线框像素点集合、竖直线框像素点集合。

优选地，S2中对初级表格结构框架进行分析，筛选关键点，包括：

基于初级表格结构框架中的水平线框像素点集合、竖直线框像素点集合，得到多个连通区域；

获取各连通区域的最小外接矩形，并根据各连通区域的最小外接矩形获取关键点。

优选地，所述连通区域为同行、同列相邻，且像素值相同的像素点的集合。

优选地，所述获取各连通区域的最小外接矩形，包括：

基于初级表格结构框架中的水平线框像素点集合、竖直线框像素点集合，生成像素点的坐标；

将对应连通区域面积最小的外接矩形最为该连通区域的最小外接矩形，得到各连通区域的最小外接矩形。

优选地，所述根据各连通区域的最小外接矩形获取关键点，包括：

提取并连接各最小外接矩形的短边的中点，得到多条连接线；

叠加多条连接线，筛选多条连接线中具有相同坐标的点，得到关键点。

优选地，S3中基于关键点得到目标表格结构框架，包括：

依次获取关键点的坐标，重构相应的单元格，生成表格的目标表格结构框架。

优选地，S4中根据目标表格结构框架生成表格型文本，包括：

根据目标表格结构框架将包含表格的图像转换为文本形式，得到表格型文本。

优选地，S4中从表格型文本中抽取待识别字段的文本数据，包括：

对表格型文本中的待识别字段进行标注，利用文本抽取模型抽取标注后待识别字段的文本数据。

优选地，所述待识别字段的文本数据中配置有反映待识别字段在表格中位置来源的位置坐标信息。

(三)有益效果

与现有技术相比，本发明所提供的一种基于图像的表格智能识别与计分方法，具有以下有益效果：

1)利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架，对初级表格结构框架进行分析，筛选关键点，基于关键点得到目标表格结构框架，通过获取不同类型表格的关键点，并根据关键点得到表格的目标表格结构框架，能够实现对不同类型表格高效、准确地识别，有效获取不同类型表格的结构信息，为后续准确进行文本识别提供支持；

2)根据目标表格结构框架生成表格型文本，并从表格型文本中抽取待识别字段的文本数据，构建与表格实体布局关联的文本识别模型，根据待识别字段的文本数据来源选择对应的文本识别模型获取文本识别结果，通过选择与待识别字段的文本数据来源相匹配的文本识别模型进行文本识别，能够有效提高对于待识别字段文本识别的准确度，从而能够对考卷中的表格进行准确计分。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的流程示意图；

图2为本发明中对不同类型表格进行智能识别的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于图像的表格智能识别与计分方法，如图1和图2所示，①利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架。

其中，利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架之后，包括：

②对初级表格结构框架进行分析，筛选关键点，具体包括：

1)获取各连通区域的最小外接矩形，包括：

2)根据各连通区域的最小外接矩形获取关键点，包括：

本申请技术方案中，连通区域为同行、同列相邻，且像素值相同的像素点的集合。

③基于关键点得到目标表格结构框架，具体包括：

上述技术方案，利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架，对初级表格结构框架进行分析，筛选关键点，基于关键点得到目标表格结构框架，通过获取不同类型表格的关键点，并根据关键点得到表格的目标表格结构框架，能够实现对不同类型表格高效、准确地识别，有效获取不同类型表格的结构信息，为后续准确进行文本识别提供支持。

如图1所示，④根据目标表格结构框架生成表格型文本，并从表格型文本中抽取待识别字段的文本数据。

1)根据目标表格结构框架生成表格型文本，包括：

2)从表格型文本中抽取待识别字段的文本数据，包括：

本申请技术方案中，待识别字段的文本数据中配置有反映待识别字段在表格中位置来源的位置坐标信息。

⑤构建与表格实体布局关联的文本识别模型，根据待识别字段的文本数据来源选择对应的文本识别模型获取文本识别结果。

⑥根据待识别字段的文本识别结果及相应评分标准进行计分。

上述技术方案，根据目标表格结构框架生成表格型文本，并从表格型文本中抽取待识别字段的文本数据，构建与表格实体布局关联的文本识别模型，根据待识别字段的文本数据来源选择对应的文本识别模型获取文本识别结果，通过选择与待识别字段的文本数据来源相匹配的文本识别模型进行文本识别，能够有效提高对于待识别字段文本识别的准确度，从而能够对考卷中的表格进行准确计分。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于图像的表格智能识别与计分方法，其特征在于：包括以下步骤：

S2、对初级表格结构框架进行分析，筛选关键点；

S3、基于关键点得到目标表格结构框架；

2.根据权利要求1所述的基于图像的表格智能识别与计分方法，其特征在于：S1中利用预设的线框识别模型对图像中的线框进行识别，得到初级表格结构框架之后，包括：

3.根据权利要求2所述的基于图像的表格智能识别与计分方法，其特征在于：S2中对初级表格结构框架进行分析，筛选关键点，包括：

4.根据权利要求3所述的基于图像的表格智能识别与计分方法，其特征在于：所述连通区域为同行、同列相邻，且像素值相同的像素点的集合。

5.根据权利要求3所述的基于图像的表格智能识别与计分方法，其特征在于：所述获取各连通区域的最小外接矩形，包括：

6.根据权利要求5所述的基于图像的表格智能识别与计分方法，其特征在于：所述根据各连通区域的最小外接矩形获取关键点，包括：

7.根据权利要求6所述的基于图像的表格智能识别与计分方法，其特征在于：S3中基于关键点得到目标表格结构框架，包括：

8.根据权利要求7所述的基于图像的表格智能识别与计分方法，其特征在于：S4中根据目标表格结构框架生成表格型文本，包括：

9.根据权利要求8所述的基于图像的表格智能识别与计分方法，其特征在于：S4中从表格型文本中抽取待识别字段的文本数据，包括：

10.根据权利要求1或9所述的基于图像的表格智能识别与计分方法，其特征在于：所述待识别字段的文本数据中配置有反映待识别字段在表格中位置来源的位置坐标信息。