CN116994261B

CN116994261B - 一种大数据精准教学智能题卡图像智能识别系统

Info

Publication number: CN116994261B
Application number: CN202311255642.1A
Authority: CN
Inventors: 杜超然; 丁云; 刘瑞华; 孙召亮
Original assignee: Shandong Jinbangyuan Culture Media Co ltd
Current assignee: Shandong Jinbangyuan Culture Media Co ltd
Priority date: 2023-09-27
Filing date: 2023-09-27
Publication date: 2023-12-15
Anticipated expiration: 2043-09-27
Also published as: CN116994261A

Abstract

本发明涉及图像处理技术领域，具体涉及一种大数据精准教学智能题卡图像智能识别系统，包括：答题卡图像采集模块，第一字符区域的粘连字符区域获取模块，第二字符区域获取模块，文字识别模块，用于根据答题卡图像得到多个第一字符区域，计算每个第一字符区域的粘连程度；根据第一字符区域的粘连程度得到第一字符区域的粘连字符区域；根据第一字符区域的粘连字符区域得到若干第二字符区域，对每个第二字符区域进行识别处理得到识别结果，从而实现对粘连字符准确分割，进而提高文字识别的准确性。

Description

一种大数据精准教学智能题卡图像智能识别系统

技术领域

本发明涉及图像处理技术领域，具体涉及一种大数据精准教学智能题卡图像智能识别系统。

背景技术

大数据精准教学智能题卡图像智能识别系统可以实现答题卡的自动化识别和评分，一般采取OCR技术进行字符识别时，首先需将答题卡图像分割成多个单个字符区域，然后进行特征提取和识别。

对答题卡图像进行单独字符分割时，一般可采取垂直投影算法。在答题卡解答题区域，由于手写体字符存在严重的粘连、覆盖问题，垂直投影法无法得到准确的分割点，导致分割出的单独字符区域不够准确，从而影响答题卡识别的准确性。

发明内容

本发明提供一种大数据精准教学智能题卡图像智能识别系统，以解决现有的问题：手写字体粘连、覆盖等导致的无法准确的获取分割点的问题。

本发明的一种大数据精准教学智能题卡图像智能识别系统采用如下技术方案：

本发明一个实施例提供了一种大数据精准教学智能题卡图像智能识别系统，该系统包括以下模块：

答题卡图像获取模块，用于获取答题卡图像；

第一字符区域的粘连字符区域获取模块，用于获取答题卡图像的二值图像，根据二值图像得到每个行字符区域，根据每个行字符区域得到多个第一字符区域，计算每个第一字符区域的粘连程度；根据第一字符区域的粘连程度得到第一字符区域的粘连字符区域；

第二字符区域获取模块，用于将第一字符区域的粘连字符区域作为第一分析区域，获取第一分析区域的所有第一候选分割点，根据每个第一候选分割点通过的最短路径的个数得到每个第一候选分割点的介数，根据每个第一候选分割点的介数得到每个第一候选分割点的分割点程度，根据每个第一候选分割点的分割点程度得到第一分析区域的若干粘连字符区域和若干第二字符区域；

将第一分析区域的每个粘连字符区域作为第二分析区域，获取第二分析区域的所有第二候选分割点，获取每个第二候选分割点的介数，根据每个第二候选分割点的介数得到每个第二候选分割点的分割点程度，根据每个第二候选分割点的分割点程度得到第二分析区域的若干粘连字符区域和若干第二字符区域；

以此类推，直至分析区域不存在粘连字符区域，得到所有的第二字符区域；

文字识别模块，用于对每个第二字符区域进行文字识别处理得到每个第二字符区域的识别结果。

优选的，所述根据二值图像得到每个行字符区域，包括的具体方法为：

对二值图像进行膨胀处理得到膨胀后图像，然后对膨胀后图像进行连通域分析得到多个连通域，获取每个连通域的最小外接矩形；

在二值图像中获取每个最小外接矩形的图像区域作为每个行字符区域。

优选的，所述根据每个行字符区域得到多个第一字符区域，包括的具体方法为：

对于每个行字符区域，计算每列像素的灰度值均值得到每列的灰度值，将灰度值等于255的列记为分割列，利用所有分割列将行字符区域分割成多个第一字符区域。

优选的，所述计算每个第一字符区域的粘连程度，包括的具体方法为：

其中，表示第i个第一字符区域的宽度，表示第i个第一字符区域的高度，表示第i个第一字符区域的粘连程度。

优选的，所述获取第一分析区域的所有第一候选分割点，包括的具体方法为：

将每个分析区域中灰度值等于0的像素称为字符像素；

对第一分析区域中的所有字符像素进行骨架化提取得到骨架化后的第一分析区域；

对于骨架化后的第一分析区域，获取每个字符像素8邻域内包含字符像素的个数，记为每个字符像素的邻域字符像素个数，利用最大值最小值归一化方法对每个字符像素的邻域字符像素个数进行归一化处理得到每个字符像素的归一化后的邻域字符像素个数；将归一化后的邻域字符像素个数小于预设第一字符个数阈值A或者归一化后的邻域字符像素个数大于预设第二字符个数阈值B的字符像素，记为候选分割点像素。

优选的，所述根据每个第一候选分割点通过的最短路径的个数得到每个第一候选分割点介数，包括的具体方法为：

对于第一分析区域，以每个第一候选分割点为节点，将字符像素构成节点之间的连接路径，将每两个节点之间的字符像素个数作为每两个节点之间的路径长度，构建出无向图，获取每两个第一候选分割点之间最短路径，将每两个第一候选分割点的最小路径中包含的字符像素构成每两个第一候选分割点的最小路径像素集合，获取包含每个第一候选分割点的最小路径像素集合的个数，记为每个第一候选分割点的介数。

优选的，所述根据每个第一候选分割点的介数得到每个第一候选分割点的分割点程度，包括的具体方法为：

所述第一分析区域为从二值图像中分割出的矩形的粘连字符区域；

获取每个第一候选分割点到第一分析区域的左侧边的最短距离，记为每个第一候选分割点的第一宽度，获取每个第一候选分割点到第一分析区域的右侧边的最短距离，记为每个第一候选分割点的第二宽度，将第一宽度与第二宽度中的较小值作为每个第一候选分割点的参考宽度；

将每个第一候选分割点的介数与参考宽度的乘积作为每个第一候选分割点的分割点程度。

优选的，所述根据每个第一候选分割点的分割点程度得到第一分析区域的若干粘连字符区域和若干第二字符区域，包括的具体方法为：

将最大分割点程度对应的第一候选分割点作为第一分析区域的分割点，将第一分析区域的分割点所在列作为第一分析区域的分割列，利用分割列将第一分析区域分割成第一分析区域的左侧分割区域和右侧分割区域，计算第一分析区域的左、右侧分割区域的粘连程度；

将粘连程度大于预设粘连程度阈值的第一分析区域的左、右侧分割区域作为第一分析区域的粘连字符区域，将粘连程度小于等于预设粘连程度阈值的第一分析区域的左、右侧分割区域作为第一分析区域的第二字符区域。

优选的，所述根据第一字符区域的粘连程度得到第一字符区域的粘连字符区域，包括的具体方法为：

将粘连程度大于预设粘连程度阈值的第一字符区域作为第一字符区域的粘连字符区域。

优选的，所述获取答题卡图像的二值图像，包括的具体方法为：

对答题卡图像进行分割处理，将灰度值大于分割阈值的像素的灰度值设置为255，将灰度值小于等于分割阈值的像素的灰度值设置为0，得到二值图像。

本发明的技术方案的有益效果是：

获取答题卡图像，根据答题卡图像得到多个第一字符区域，计算每个第一字符区域的粘连程度；根据第一字符区域的粘连程度得到第一字符区域的粘连字符区域；获取第一字符区域的粘连区域的所有第一候选分割点，获取每个第一候选分割点的介数，根据每个第一候选分割点的介数得到每个第一候选分割点的分割点程度，根据每个第一候选分割点的分割点程度对第一粘连字符区域进行分割处理得到第二字符区域；对每个第二字符区域进行文字识别处理得到每个第二字符区域的识别结果，从而实现利用字符之间的粘连点的特征得到准确的分割点，从而提高粘连字符分割的准确性，进而提高文字识别的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种大数据精准教学智能题卡图像智能识别系统的结构框图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种大数据精准教学智能题卡图像智能识别系统，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种大数据精准教学智能题卡图像智能识别系统的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种大数据精准教学智能题卡图像智能识别系统的结构框图，该系统包括以下模块：

答题卡图像采集模块101，用于采集答题卡图像。

需要说明的是，由于整幅答题卡图像中包含多个手写字符，当前文字识别方法无法对多个手写字符一起进行识别处理，需要把答题卡图像中每个手写字符分割开得到每个手写字符区域，然后对每个手写字符区域进行文字识别处理。手写字符之间容易存在粘连问题，传统方法的垂直投影法在处理粘连字符的分割时，其分割准确率较低。

为了实现本实施例提出的一种大数据精准教学智能题卡图像智能识别系统，首先需要采集答题卡图像，具体过程为：利用光电扫描仪对答题卡进行扫描处理得到答题卡图像。

至此，通过上述方法得到答题卡图像。

第一字符区域的粘连字符区域获取模块102，用于对答题卡图像进行分割处理得到多个第一字符区域，根据计算每个第一字符区域的粘连程度，根据每个第一字符区域的粘连程度得到第一字符区域的粘连字符区域。

具体的，利用大津阈值算法对答题卡图像进行分割处理，将灰度值大于分割阈值的像素的灰度值设置为255，将灰度值小于等于分割阈值的像素的灰度值设置为0，得到二值图像。将二值图像中灰度值为255的像素为背景像素，灰度值为0的像素为字符像素。

利用形态学处理算法对二值图像进行膨胀处理得到膨胀后图像，然后对膨胀后图像进行连通域分析得到多个连通域，获取每个连通域的最小外接矩形。

需要说明的是，当一列的灰度值均值为255时，说明该列只存在背景像素，所以该列为字符之间的间隙，所以可以利用该列将行字符区域分割成多个字符区域。

进一步的，对于每个行字符区域，计算每列像素的灰度值均值得到每列的灰度值，将灰度值等于255的列记为分割列，利用所有分割列将行字符区域分割成多个第一字符区域。

需要说明的是，上述过程是根据每列像素中存在背景像素的情况来对行字符区域进行分割，但是当存在字符粘连时，字符之间不会存在间隙，因而字符之间不会存在只有背景像素的列，所以就会将粘连的多个字符分割在一个区域，一般一个手写字符的宽度与高度相近，当存在字符粘连时，多个粘连字符所在的区域包含的字符量较多，因而这个区域的宽度要比高度大很多，因而可以基于此来进行粘连程度判断。

进一步的，获取每个第一字符区域的高度和宽度，根据每个第一字符的高度和宽度得到每个第一字符区域的粘连程度的计算方法为：

将粘连程度大于预设粘连程度阈值C的第一字符区域作为第一字符区域的粘连字符区域，本实施例以C取1.5为例进行叙述，其他实施例可以取其他值，本实施例不进行具体限制。

至此，通过上述过程得到粘连字符区域。

第二字符区域获取模块103，用于根据第一字符区域的粘连字符区域得到候选分割点，计算每个候选分割点的分割点程度，根据分割点程度对粘连字符区域进行分割处理得到第二字符区域。

需要说明的是，通过每个第一字符区域的粘连程度获得粘连字符区域，由于粘连字符区域中包含多个粘连在一起的字符，因而为了将粘连的字符分割开，需对粘连字符区域进行进一步分析，获取准确的分割点，将粘连字符区域中多个粘连的字符分割开。由于粘连字符的分割点一般为交点或者端点，因而需先获取所有的交点或者端点。

需要进一步说明的是，一般以粘连字符的粘连点作为两粘连字符的分割点分割出的字符的完整性较高，因而根据每个候选分割点为粘连点的情况来计算每个候选分割点的分割点程度；粘连字符之间的粘连点一般为粘连字符之间的枢纽点，因而通过粘连点的最小路径的个数较多，因而基于此来计算每个候选分割点的分割点程度，根据分割点程度来获取分割列，根据分割列来对粘连字符区域进行分割处理。

具体的，将任意一个第一字符区域的粘连字符区域作为第一分析区域，获取第一分析区域的所有第一候选分割点，计算每个第一候选分割点的分割点程度，根据每个第一候选分割点的分割点程度得到第一分析区域的若干粘连字符区域和若干第二字符区域；

将第一分析区域的每个粘连字符区域作为第二分析区域，获取第二分析区域的所有第二候选分割点，获取每个第二候选分割点的分割点程度，根据每个第二候选分割点的分割点程度得到第二分析区域的若干粘连字符区域和若干第二字符区域。

以此类推，将第j-1分析区域的每个粘连字符区域作为第j分析区域，获取第j分析区域的所有第j候选分割点，获取每个第j候选分割点的分割点程度，根据每个第j候选分割点的分割点程度得到第j分析区域的若干粘连字符区域和若干第二字符区域。

直至分析区域不存在粘连字符区域，得到所有的第二字符区域。

进一步的，获取第j分析区域的所有候选分割点的具体方法为：

对第j分析区域中的所有字符像素进行骨架化提取得到骨架化后的第j分析区域；

对于骨架化后的第j分析区域，获取每个字符像素8邻域内包含字符像素的个数，记为每个字符像素的邻域字符像素个数，利用最大值最小值归一化方法对每个字符像素的邻域字符像素个数进行归一化处理得到每个字符像素的归一化后的邻域字符像素个数。将归一化后的邻域字符像素个数小于预设第一字符个数阈值A或者归一化后的邻域字符像素个数大于预设第二字符个数阈值B的字符像素，记为候选分割点像素，本实施例以A取0.2，B取0.8为例进行叙述，其他实施例可以取其他值，本实施例不进行具体限制。

进一步的，获取每个第j候选分割点的分割点程度的方法为：

所述第j分析区域为一个矩形区域。

对于第j分析区域，以每个第j候选分割点为节点，将字符像素构成节点之间的连接路径，将每两个节点之间的字符像素个数作为每两个节点之间的路径长度，构建出无向图，获取每两个第j候选分割点之间最短路径，将每两个第j候选分割点的最小路径中包含的字符像素构成每两个第j候选分割点的最小路径像素集合，获取包含每个第j候选分割点的最小路径像素集合的个数，记为每个第j候选分割点的介数，该值越大说明通过该候选分割点的最小路径的个数越多，因而该候选分割点为多个物体的连接点的可能性较大，即该候选分割点为字符之间的粘连点的可能性较大。

获取每个第j候选分割点到第j分析区域的左侧边的最短距离，记为每个第j候选分割点的第一宽度，获取每个第j候选分割点到第j分析区域的右侧边的最短距离，记为每个第j候选分割点的第二宽度，将第一宽度与第二宽度中的较小值作为每个第j候选分割点的参考宽度。

将每个第j候选分割点的介数与参考宽度的乘积作为每个第j候选分割点的分割点程度。

进一步的，根据每个第j候选分割点的分割点程度得到第j分析区域的若干粘连字符区域和若干第二字符区域具体操作方法为：

将分割点程度取最大值的第j候选分割点作为第j分析区域的分割点，将第j分析区域的分割点所在列作为第j分析区域的分割列，利用分割列将第j分析区域分割成第j分析区域的左侧分割区域和右侧分割区域，利用计算每个第一字符区域的粘连程度的计算方法计算第j分析区域的左、右侧分割区域的粘连程度，将粘连程度大于预设粘连程度阈值C的第j分析区域的左、右侧分割区域作为第j分析区域的粘连字符区域，将粘连程度小于等于预设粘连程度阈值C的第j分析区域的左、右侧分割区域作为第j分析区域的第二字符区域。

进一步的，将粘连程度小于等于预设粘连程度阈值C的第一字符区域作为第二字符区域。

至此，根据上述过程得到所有的第二字符区域。

文字识别模块104，用于对每个第二字符区域进行识别处理得到每个第二字符区域的识别结果。

需要说明的是，通过上述过程得到所有的第二字符区域，每个第二字符区域中只包含一个完整的字符，因而基于每个第二字符区域得到的识别结果更加准确。

具体的，利用文字识别算法对每个第二字符区域进行识别处理得到每个第二字符区域的识别结果。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种大数据精准教学智能题卡图像智能识别系统，其特征在于，该系统包括以下模块：

答题卡图像采集模块，用于采集答题卡图像；

文字识别模块，用于对每个第二字符区域进行文字识别处理得到每个第二字符区域的识别结果；

所述获取第一分析区域的所有第一候选分割点，包括的具体方法为：

将每个分析区域中灰度值等于0的像素称为字符像素；

对于骨架化后的第一分析区域，获取每个字符像素8邻域内包含字符像素的个数，记为每个字符像素的邻域字符像素个数，利用最大值最小值归一化方法对每个字符像素的邻域字符像素个数进行归一化处理得到每个字符像素的归一化后的邻域字符像素个数；将归一化后的邻域字符像素个数小于预设第一字符个数阈值A或者归一化后的邻域字符像素个数大于预设第二字符个数阈值B的字符像素，记为候选分割点像素；

所述根据每个第一候选分割点通过的最短路径的个数得到每个第一候选分割点的介数，包括的具体方法为：

对于第一分析区域，以每个第一候选分割点为节点，将字符像素构成节点之间的连接路径，将每两个节点之间的字符像素个数作为每两个节点之间的路径长度，构建出无向图，获取每两个第一候选分割点之间最短路径，将每两个第一候选分割点的最小路径中包含的字符像素构成每两个第一候选分割点的最小路径像素集合，获取包含每个第一候选分割点的最小路径像素集合的个数，记为每个第一候选分割点的介数；

所述根据每个第一候选分割点的介数得到每个第一候选分割点的分割点程度，包括的具体方法为：

将每个第一候选分割点的介数与参考宽度的乘积作为每个第一候选分割点的分割点程度；

所述根据每个第一候选分割点的分割点程度得到第一分析区域的若干粘连字符区域和若干第二字符区域，包括的具体方法为：

2.根据权利要求1所述一种大数据精准教学智能题卡图像智能识别系统，其特征在于，所述根据二值图像得到每个行字符区域，包括的具体方法为：

3.根据权利要求1所述一种大数据精准教学智能题卡图像智能识别系统，其特征在于，所述根据每个行字符区域得到多个第一字符区域，包括的具体方法为：

4.根据权利要求1所述一种大数据精准教学智能题卡图像智能识别系统，其特征在于，所述计算每个第一字符区域的粘连程度，包括的具体方法为：

其中，表示第i个第一字符区域的宽度，/>表示第i个第一字符区域的高度，/>表示第i个第一字符区域的粘连程度。

5.根据权利要求1所述一种大数据精准教学智能题卡图像智能识别系统，其特征在于，所述根据第一字符区域的粘连程度得到第一字符区域的粘连字符区域，包括的具体方法为：

6.根据权利要求1所述一种大数据精准教学智能题卡图像智能识别系统，其特征在于，所述获取答题卡图像的二值图像，包括的具体方法为：