CN115410209B

CN115410209B - 一种基于图像处理的煤矿工单识别方法

Info

Publication number: CN115410209B
Application number: CN202211341298.3A
Authority: CN
Inventors: 张书磊; 连涛; 李强; 田兆龙; 刘继鹏; 董桂锋; 路飞; 韩青; 王帅; 刘方
Original assignee: Yangcheng Coal Mine Of Shandong Jikuang Luneng Coal Power Co ltd
Current assignee: Yangcheng Coal Mine Of Shandong Jikuang Luneng Coal Power Co ltd
Priority date: 2022-10-31
Filing date: 2022-10-31
Publication date: 2023-01-31
Anticipated expiration: 2042-10-31
Also published as: CN115410209A

Abstract

本发明涉及图像处理领域，具体涉及一种基于图像处理的煤矿工单识别方法。获取煤矿工单图像，获取单元格手写字符区域中的多个连通域；根据两两连通域的像素点横坐标范围交集将对应连通域合并，获取第一连通域；对第一连通域进行垂直投影并对垂直投影进行曲线拟合；根据拟合曲线对第一连通域进行分割，得到第二连通域；将每个单元格手写字符区域中第二连通域的高度均值作为宽度阈值；从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并，得到完整连通域；根据完整连通域进行字符识别。本发明以连通域为基础分别对手写字符进行纵向和横向合并，能够在去除粘连字符影响的同时有效提高分割的准确率。

Description

一种基于图像处理的煤矿工单识别方法

技术领域

本发明涉及图像处理领域，具体涉及一种基于图像处理的煤矿工单识别方法。

背景技术

随着互联网技术的快速发展和信息系统的广泛应用，让企业能及时、全面的了解到各类信息，然而信息系统中上传的各类扫描件，使信息的准确核查变得十分困难，在煤矿企业中每天都需要系统打印一些工程派遣工单、安全隐患排查工单和工程验收工单等，交给工人现场核查填写和领导签字确认，最后进行信息扫描电子存档，用于后续的工单流程审批和审核，然而工单内的手写内容复杂多变，数字和汉字混合存在，加大了字符识别正确率提高的难度，而字符准确识别的前提是完成字符的准确分割。

现有技术中存在通过投影分割法对手写字符进行分割的技术手段，但是，由于工单中的手写内容往往经过多人书写，且由于手写汉字的非限定性以及汉字书写方式千变万化，对于手写字符中可能存在粘连的字符，投影分割法会将重叠或粘连的多个汉字分成一个字符块，从而影响后续字符识别的准确度，而利用笔画分割的方法对手写字符进行分割时容易造成过度分割，其对于一些存在粘连或重叠的手写字符的分割准确度仍然较差。

发明内容

为了解决现有技术中无法对存在粘连或重叠的手写字符进行准确分割的问题，本发明提供一种基于图像处理的煤矿工单识别方法，获取煤矿工单图像，获取单元格手写字符区域中的多个连通域；根据两两连通域的像素点横坐标范围交集将对应连通域合并，获取第一连通域；对第一连通域进行垂直投影并对垂直投影进行曲线拟合；根据拟合曲线对第一连通域进行分割，得到第二连通域；将每个单元格手写字符区域中第二连通域的高度均值作为宽度阈值；从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并，得到完整连通域；根据完整连通域进行字符识别。本发明以连通域为基础分别对手写字符进行纵向和横向合并，能够在去除粘连字符影响的同时有效提高分割的准确率。

本发明采用如下技术方案，一种基于图像处理的煤矿工单识别方法，包括：

对煤矿工单进行扫描得到煤矿工单图像，获取煤矿工单图像中每个单元格手写字符区域的连通域并作为第一连通域。

对每个单元格手写字符区域中的第一连通域进行垂直投影，并利用每个单元格手写字符区域中每个第一连通域的垂直投影进行曲线拟合得到每个单元格的拟合曲线。

根据每个单元格的拟合曲线对每个单元格手写字符区域中的第一连通域进行分割，得到每个单元格手写字符区域中的多个第二连通域。

获取每个单元格手写字符区域中每个第二连通域的实际宽度，并从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并，得到每个单元格手写字符区域中的多个完整连通域。

将得到的多个完整连通域输入到神经网络中，输出为每个单元格手写字符区域中的字符。

进一步的，一种基于图像处理的煤矿工单识别方法，获取煤矿工单图像中每个单元格手写字符区域的连通域并作为第一连通域的方法为：

获取煤矿工单图像中每个单元格中的手写字符区域，并对每个单元格的手写字符区域进行连通域分析，得到每个单元格手写字符区域中的多个连通域；

根据每个单元格手写字符区域中的连通域的像素点横坐标范围将每个单元格手写字符区域中的连通域进行合并；

将合并后每个单元格手写字符区域中的连通域作为第一连通域。

进一步的，一种基于图像处理的煤矿工单识别方法，将每个单元格中的连通域进行合并的方法为：

获取每个单元格手写字符区域中的各个连通域的像素点横坐标范围；

从左到右依次获取两两连通域中像素点横坐标范围的交集，并获取对应两两连通域中像素点横坐标范围最大值；

判断两两连通域中像素点横坐标范围的交集与对应两两连通域中像素点横坐标范围最大值的比值是否大于阈值；

将比值大于阈值的对应两两连通域进行合并，并以该合并后的连通域为新的连通域继续进行合并，直至该比值小于阈值；

以比值小于阈值时对应的连通域开始重新进行合并，直至单元格中不存在可以合并的连通域。

进一步的，一种基于图像处理的煤矿工单识别方法，对每个单元格手写字符区域中的第一连通域进行分割的方法为：

对每个单元格手写字符区域中的每个第一连通域进行垂直投影，并获取每个第一连通域垂直投影对应的拟合曲线；

当第一连通域垂直投影对应的拟合曲线存在多个波峰时，根据两两波峰之间的波谷点在对应第一连通域中的位置对该第一连通域进行分割。

进一步的，一种基于图像处理的煤矿工单识别方法，从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并的方法为：

从左到右获取每个单元格手写字符区域中的第一个第二连通域的实际宽度

，当该第二连通域的实际宽度小于宽度阈值时，将第一个第二连通域与第二个第二连通域进行合并，获取合并后连通域的实际宽度

；

当合并后连通域的实际宽度

大于宽度阈值时，将该合并后的连通域作为对应单元格手写字符区域的完整连通域，并从该单元格手写字符区域的第三个第二连通域开始继续进行合并，直至得到每个单元格手写字符区域的所有完整连通域。

进一步的，一种基于图像处理的煤矿工单识别方法，从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并时，还包括：

当合并后连通域的实际宽度

小于宽度阈值时，获取第三个第二连通域的实际宽度

；

若第三个第二连通域的实际宽度

大于宽度阈值，将该合并后连通域作为完整连通域；

若第三个第二连通域的实际宽度

小于宽度阈值，从水平方向上任意选取十条同时通过第二个、第三个以及第四个第二连通域的直线，分别获取十条直线中第二个第二连通域与第三个第二连通域之间的距离之和

，以及第三个第二连通域与第四个第二连通域之间的距离之和

；

当

时，将该合并后连通域与第三个第二连通域进行合并，得到完整连通域；

当

时，该合并后连通域作为完整连通域，并从第三个第二连通域开始重新进行合并。

当第一个第二连通域的实际宽度大于宽度阈值，且第二个第二连通域的实际宽度也大于宽度阈值时，将第一个第二连通域作为完整连通域；

当单元格手写字符区域中每个第二连通域及其相邻两个第二连通域的实际宽度均大于宽度阈值时，将该第二连通域作为完整连通域。

进一步的，一种基于图像处理的煤矿工单识别方法，根据每个单元格手写字符区域中的多个完整连通域进行字符识别的方法为：

建立手写字符数据库，并利用数据库中的手写字符对卷积神经网络进行训练；

利用训练好的卷积神经网络对煤矿工单中每个单元格手写字符区域中的多个完整连通域进行字符识别。

本发明的有益效果是：本发明首先将煤矿工单中手写字符进行连通域分析，从而便于后续进行手写字符的合并和分割，进一步本发明根据汉字的结构类型，首先通过连通域横向重叠范围对手写字符区域的连通域进行纵向合并，即纵向合并能够将结构为中上下结构、上中下结构、包围结构以及半包围结构的手写字符连通域合并，保证后续在进行垂直投影时能够去除手写字符中纵向结构粘连或重叠带来的影响，减少了后续进行字符分割需要考虑的因素；此时对手写字符进行分割只需考虑汉字结构中的左右结构、左中右结构以及独体字，因此通过垂直投影对连通域进行分割，能够在横向上将粘连的手写字符连通域分割开，有利于根据此时汉字的结构进行合并，并根据每个单元格内手写字符的平均高度设定该单元格内手写字符的标准宽度，通过依次对每个连通域的宽度与标准宽度进行对比进行连通域的合并，能够得到准确的手写字符分割结果，从而有效提高对煤矿工单中手写字符识别的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的一种基于图像处理的煤矿工单识别方法结构示意图；

图2为本发明实施例的一种煤矿工单示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，给出了本发明实施例的一种基于图像处理的煤矿工单识别方法结构示意图，包括：

101.对煤矿工单进行扫描得到煤矿工单图像，获取煤矿工单图像中每个单元格手写字符区域的连通域并作为第一连通域。

本发明首先通过光学扫描将煤矿工单上的字符信息转化为图像信息，然后利用光学扫描获取的已知的印刷字符与各种类型的打印煤矿工单的电子模板进行模板匹配，模板匹配时使扫描图像尺寸与模板尺寸一致，由于人工手写的字符与复印机打印的字符由于使用的墨水的不同，两者会在颜色上存在明显的差异，因此通过模板匹配可以得到煤矿工单图像中各个单元格的位置以及单元格中的打印字符信息，将煤矿工单图像中的打印字符去除，则每个单元格中剩余的字符即为手写字符区域，然后对每个单元格中的手写字符区域进行筛选。

煤矿工单上各单元格内的书写内容都存在固定的格式，因此各单元格内的手写字符可分为只存在汉字、只存在数字和两者都可能存在，如图2中所示的煤矿工单图像中，填写日期的单元格应当只存在手写数字，填写矿长姓名处应当只存在手写汉字，而填写工程量处手写数字和汉字都可能存在。

由于在手写数字和汉字都可能存在的单元格内，手写的数字1可能和汉字的一部分相似，如“旧”字中的左部分，因此需要规定在人工书写时，若表格内需要同时出现汉字和数字时，需要将数字书写为汉字形式。

根据各单元格存在其相应的格式进行连通域分析，对于多行单元格以其设置的行数和每行的高度进行分行处理，对应单行单元格不做处理，再从上至下、从左至右逐单元格、逐行对手写字符进行连通域分析，从而可以得到每个单元格内手写字符的单连通域，对于手写字符的单连通域，其可能仅为一个笔画或一个偏旁，因此在得到每个单元格手写字符区域的连通域后，基于汉字的结构首先对连通域进行纵向合并。

获取煤矿工单图像中每个单元格手写字符区域的连通域并作为第一连通域的方法为：

统计同一单元格中手写字符块区域的每个连通域像素点的横坐标值的范围集合，依次选取相邻两个连通域内像素点的横坐标值的范围集合，其中范围大的集合为B，范围小的集合为C，取两集合的交集为D，若这两个汉字字符块内连通域为一个汉字的上下结构、上中下结构、包围结构或者半包围结构时，则交集D应完全属于集合C或者大部分属于集合C，因此当该交集D与集合C的比值大于0.85时，该两个连通域对应为一个手写字符的上下结构、上中下结构、包围结构或者半包围结构，因此将该两个连通域进行合并，则合并的区域的字符像素点的横坐标值的范围集合为集合B和集合C的并集E，并以该并集继续和下一个连通域进行比较。

当该交集D与集合C的比值小于0.85时，则该两个连通域不存在对应的结构关系，不进行合并，同时继续获取下一对两两连通域之间的像素点横坐标范围的交集，依次对每个单元格中的连通域进行合并，直至每个单元格中的连通域无法合并，此时得到每个单元格内的多个连通域即为第一连通域。

将每个单元格手写字符区域中的对应两两连通域合并的方法为：

获取每个单元格手写字符区域的各个连通域的像素点横坐标范围；

以比值小于阈值时对应的连通域开始重新进行合并，直至单元格手写字符区域中不存在可以合并的连通域。

至此，通过对每个单元格内手写字符区域的连通域进行纵向合并后，此时手写字符区域的连通域仅能够构成手写字符的左右结构、左中右结构或者一个完整汉字，同时还可能为存在横向粘连的手写字符。

102.对每个单元格手写字符区域中的第一连通域进行垂直投影，并利用每个单元格手写字符区域中每个第一连通域的垂直投影进行曲线拟合得到每个单元格的拟合曲线；根据每个单元格的拟合曲线对每个单元格手写字符区域中的第一连通域进行分割，得到每个单元格手写字符区域中的多个第二连通域。

对此时的每个单元格中手写字符区域的各个连通域做垂直投影，然后对各垂直投影直方图进行波动曲线拟合，由于粘连字符是由书写时的连笔造成的，故粘连字符交接处往往只有单笔画宽度，因此当垂直投影直方图拟合的波动曲线为单波峰时，认定其为一个汉字的左右结构、左中右结构或者一个完整汉字，而不是粘连字符，当垂直投影直方图拟合的波动曲线为多波峰时，认定其为粘连字符，并以相邻两波峰之间的波谷点处对该字符块进行分割。

根据拟合曲线对每个单元格手写字符区域中的第一连通域进行分割的方法为：

至此将每个单元格中手写字符区域的粘连连通域进行了分割，此时被分割的连通域只能为一个手写字符的左右结构、左中右结构或者一个完整汉字。

103.获取每个单元格手写字符区域中每个第二连通域的实际宽度，并从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并，得到每个单元格手写字符区域中的多个完整连通域。

统计此时每个单元格手写字符区域中每个连通域的高度，即字符区域的起始行和终止行的距离，获得每个单元格的高度集合

，其中n表示该单元格内字符块的数量，i表示第i个连通域，取此集合的均值

表示该单元格内手写字符区域连通域的标准高度，一般情况下，手写字符的高度与其宽度大致相同，故本发明将高度均值

作为当前单元格内手写汉字的宽度阈值，由于不同人群书写方式以及书写习惯不同，因此本发明中的宽度阈值并不是唯一的选择，可根据实际应用场景中的手写字符形状以及大小进行设定。

此时一个完整汉字最多由连续相邻的三个连通域组成，因此本发明在每个单元格中从左至右分析相邻的第二连通域是否需要合并。

首先统计各连通域的宽度K，即字符区域中每个连通域的起始列和终止列的距离，若第一个第二连通域的宽度

，则认为第一个第二连通域为一个手写字符的偏旁字符，第一个汉字为左右结构或者左中右结构，因此将第一个第二连通域直接与第二个第二连通域合并；若合并后的连通域宽度

，则认为当前合并后的连通域组成的手写字符为左右结构，将其标记为完整连通域，然后分析剩余第二连通域。

若合并后的连通域宽度

，则该合并后连通域所构成的手写字符可能为左中右结构，此时需要判断第三个第二连通域，若第三个第二连通域的宽度

，则认定该合并后的连通域所构成的手写字符为左右结构，将其标记为完整连通域；若第三个第二连通域的宽度

，则需要分析该第三个第二连通域是该合并连通域所组成手写字符的右偏旁，还是下一个手写字符的左偏旁；

本发明根据汉字的书写规律，即同一汉字内各个结构之间的间距应当小于相邻两个汉字的间距，若第三个第二连通域为合并连通域所组成手写字符的右偏旁，则第三个第二连通域与第二个第二连通域之间的距离应当小于第三个第二连通域与第四个第二连通域之间的距离，若第三个第二连通域为下一个手写字符的左偏旁，则第三个第二连通域与第二个第二连通域之间的距离应当大于第三个第二连通域与第四个第二连通域之间的距离。

本发明在第二、第三和第四个第二连通域内的水平交集内随机选取10条同时过第二、第三和第四个第二连通域的水平直线，取这10条直线上第二和第三个第二连通域之间距离的和值

和第三和第四个第二连通域之间距离的和值

；若

，则继续合并第三个第二连通域，第一个手写字符为左中右结构；若

，则认定该合并的连通域所构成的手写字符为左右结构，标记其为完整连通域；若

，则在第二、第三和第四个第二连通域内的水平交集内重新随机选取10条水平直线，直至

。

；

当合并后连通域的实际宽度

从左到右依次将实际宽度小于宽度阈值的连续第二连通域合并时，还包括：

当合并后连通域的实际宽度

小于宽度阈值时，获取第三个第二连通域的实际宽度

；

若第三个第二连通域的实际宽度

大于宽度阈值，将该合并后连通域作为完整连通域；

若第三个第二连通域的实际宽度

；

当

当

需要说明的是，当第一个第二连通域的实际宽度大于宽度阈值，且第二个第二连通域的实际宽度也大于宽度阈值时，直接将第一个第二连通域作为完整连通域；

同理，当单元格手写字符区域中每个第二连通域及其相邻两个第二连通域的实际宽度均大于宽度阈值时，将该第二连通域作为完整连通域。

由此完成了对煤矿工单中每个单元格手写字符中连通域的分割，得到了每个单元格中的多个完整连通域，进而通过卷积神经网络对完整连通域进行字符识别；

104.将得到的多个完整连通域输入到神经网络中，输出为每个单元格手写字符区域中的字符。

根据每个单元格手写字符区域中的多个完整连通域进行字符识别的方法为：

利用训练好的卷积神经网络对煤矿工单中每个单元格手写字符区域中的多个完整连通域进行字符识别，其中，本发明中所选择的卷积神经网络可以为DNN卷积神经网络或BP卷积神经网络。

进而将煤矿工单图像中各个单元格识别出的手写字符信息进行录入保存，从而完成了煤矿工单信息的识别，可以用于后续工单的流程审批或自动审核。

本发明首先将煤矿工单中手写字符进行连通域分析，从而便于后续进行手写字符的合并和分割，进一步本发明根据汉字的结构类型，首先通过连通域横向重叠范围对手写字符区域的连通域进行纵向合并，即纵向合并能够将结构为中上下结构、上中下结构、包围结构以及半包围结构的手写字符连通域合并，保证后续在进行垂直投影时能够去除手写字符中纵向结构粘连或重叠带来的影响，减少了后续进行字符分割需要考虑的因素；此时对手写字符进行分割只需考虑汉字结构中的左右结构、左中右结构以及独体字，因此通过垂直投影对连通域进行分割，能够在横向上将粘连的手写字符连通域分割开，有利于根据此时汉字的结构进行合并，并根据每个单元格内手写字符的平均高度设定该单元格内手写字符的标准宽度，通过依次对每个连通域的宽度与标准宽度进行对比进行连通域的合并，能够得到准确的手写字符分割结果，从而有效提高对煤矿工单中手写字符识别的准确率。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。