CN110472550A

CN110472550A - 一种文本图像拍摄完整度判断方法及系统

Info

Publication number: CN110472550A
Application number: CN201910733241.XA
Authority: CN
Inventors: 严京旗; 张成栋; 钱之越; 郭利敏; 戴文静
Original assignee: Nantong Ai Ai Smart Technology Co Ltd
Current assignee: Jingpu Shanghai Artificial Intelligence Technology Co ltd
Priority date: 2019-08-02
Filing date: 2019-08-02
Publication date: 2019-11-19

Abstract

本发明公开了一种文本图像拍摄完整度判断方法及系统，该方案包括：对待判别图像进行图像二值化，得到二值图像；识别所述二值图像中的文字区域，所述文字区域的呈行列排布的多个文字区域；判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。本发明整个过程涉及的计算参数少，且参数简单易识别，使本发明具有计算量小、准确性高的特点。

Description

一种文本图像拍摄完整度判断方法及系统

技术领域

本发明涉及图像处理技术领域，特别是涉及一种文本图像拍摄完整度判断方法及系统。

背景技术

办公自动化趋势显著，而绝大多数的字符识别算法对文档图像的降质十分敏感，文档图像主要呈现三种降质形式：倾斜、清晰度、扭曲。在大批量的文本图像处理中首先需要对文本图像质量进行检测，给后续图像处理提供依据或减小不必要的资源消耗是必要的。

研究领域对于倾斜、扭曲和矫正方法研究的文章较多，场景图像清晰度的检测的研究较多。在实际应用中，除了三种主要降质形式，还存在其它情况，如文本图片可能存在文字过于贴边，导致内容不全的现象。因此，如何将判断文本图像是否完整成为本领域亟待解决的问题。

发明内容

本发明的目的是提供一种文本图像拍摄完整度判断方法及系统，以解决上述问题。

为实现上述目的，本发明提供了一种文本图像拍摄完整度判断方法，所述方法包括：

对待判别图像进行图像二值化，得到二值图像；

识别所述二值图像中的文字区域，所述文字区域的呈行列排布的多个文字区域；

判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。

可选的，所述对待判别图像进行图像二值化，得到二值图像，具体包括：

选取不同边缘阈值，根据边缘像素数目设定值提取所述待判别图像的边缘，得到边缘图像；

根据区域阈值去除所述边缘图像中面积连通区域，得到滤噪图像；

将所述滤噪图像与所述边缘图像进行边缘信息比较，修正所述滤噪图像的边缘信息，得到修正图像；

利用OTSU算法对所述修正图像进行局部二值化处理，得到初始二值图像；

滤除所述初始二值图像中的线条噪声和面积连通区域，得到滤噪二值图像；

将所述滤噪二值图像与所述修正图像对比，修正所述滤噪二值图像的边缘，得到保留文字区域的二值图像。

可选的，所述识别所述二值图像中的文字区域，具体包括：

滤除所述二值图像中的孤立点噪声，并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点，得到按行和列的方向排列的分段区域；

将所有所述分段区域中的文字区域连接，得到文字区域连接图像；

利用轮廓信息对所述文字区域连接图像定位轮廓区域；

根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域，得到按行和列的方向排列多个文字区域。

可选的，所述判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度，具体包括：

按照逐行逐区块顺序，判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果；所述文本区域尺寸特征为高度和长宽的比值预设区间；

当所述尺寸判断结果表示是时，判断所述文字区域是否满足贴边条件，得到贴边判断结果；所述贴边条件为所述文字区域的四个顶点的阈值范围；

当所述贴边判断结果表示是时，贴边行数加1；当所述贴边判断结果表示否时，判断该行的下一个所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至该行所有所述文字区域全部判断完毕；

判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边，若是，则判断该行是否是最后一行，如不是最后一行则判断下一行的所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至所有所述文字区域全部判断完毕；

计算贴边行数与总行数的比值得到图像文字贴边概率；

判断所述图像文字贴边概率是否超出概率阈值，得到概率判断结果；或者所述贴边行数是否超出贴边行数阈值，得到贴边行数判断结果；

当所述概率判断结果表示是时，和/或当所述贴边行数判断结果表示是时，确定所述待判别图像存在文字贴边现象，并计算有贴边可信度；

当所述概率判断结果表示否时，且当所述贴边行数判断结果表示否时，判断文本图像没有文字贴边现象，并计算无贴边可信度可信度。

可选的，所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。

本发明还提供了一种文本图像拍摄完整度判断系统，所述系统包括：

二值化单元，用于对待判别图像进行图像二值化，得到二值图像；

识别单元，用于识别所述二值图像中的文字区域，所述文字区域的呈行列排布的多个文字区域；

完整度判断单元，用于判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。

可选的，所述二值化单元具体包括：

边缘图像提取子单元，用于选取不同边缘阈值，根据边缘像素数目设定值提取所述待判别图像的边缘，得到边缘图像；

第一滤噪子单元，用于根据区域阈值去除所述边缘图像中面积连通区域，得到滤噪图像；

第一修正子单元，用于将所述滤噪图像与所述边缘图像进行边缘信息比较，修正所述滤噪图像的边缘信息，得到修正图像；

二值化子单元，用于利用OTSU算法对所述修正图像进行局部二值化处理，得到初始二值图像；

第二滤噪子单元，用于滤除所述初始二值图像中的线条噪声和面积连通区域，得到滤噪二值图像；

第二修正子单元，用于将所述滤噪二值图像与所述修正图像对比，修正所述滤噪二值图像的边缘，得到保留文字区域的二值图像。

可选的，所述识别单元具体包括：

分段滤噪子单元，用于滤除所述二值图像中的孤立点噪声，并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点，得到按行和列的方向排列的分段区域；

区域连接子单元，用于将所有所述分段区域中的文字区域连接，得到文字区域连接图像；

轮廓定位子单元，用于利用轮廓信息对所述文字区域连接图像定位轮廓区域；

文字区域识别子单元，用于根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域，得到按行和列的方向排列多个文字区域。

可选的，所述完整度判断单元具体包括：

尺寸判断子单元，用于按照逐行逐区块顺序，判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果；所述文本区域尺寸特征为高度和长宽的比值预设区间；

贴边判断子单元，用于当所述尺寸判断结果表示是时，判断所述文字区域是否满足贴边条件，得到贴边判断结果；所述贴边条件为所述文字区域的四个顶点的阈值范围；

贴边行数累计子单元，用于当所述贴边判断结果表示是时，贴边行数加1；当所述贴边判断结果表示否时，判断该行的下一个所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至该行所有所述文字区域全部判断完毕；

循环判断子单元，用于判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边，若是，则判断该行是否是最后一行，如不是最后一行则判断下一行的所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至所有所述文字区域全部判断完毕；

概率计算子单元，用于计算贴边行数与总行数的比值得到图像文字贴边概率；

概率行数判断子单元，用于判断所述图像文字贴边概率是否超出概率阈值，得到概率判断结果；或者所述贴边行数是否超出贴边行数阈值，得到贴边行数判断结果；

存在贴边结果确定子单元，用于当所述概率判断结果表示是时，和/或当所述贴边行数判断结果表示是时，确定所述待判别图像存在文字贴边现象，并计算有贴边可信度；

无贴边结果确定子单元，用于当所述概率判断结果表示否时，且当所述贴边行数判断结果表示否时，判断文本图像没有文字贴边现象，并计算无贴边可信度可信度。

需要说明的是，所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明提供的文本图像拍摄完整度判断方法及系统具有以下优点：

1、与传统文本图像质量评价方法相比，本发明结合实际应用中存在文字贴边的问题设计检测判断方案，减小不必要的计算开销，并为进一步的处理提供依据。

2、与通过检测文本图像倾斜、扭曲检测等参数评价图像质量的方法相比，本发明将待判别图像进行图像二值化，将二值图像中的文字区域识别呈行列排布的多个文字区域，再对多个文字区域的贴片情况进行检测判断，整个过程涉及的计算参数少，且参数简单易识别，使本发明具有计算量小、准确性高的特点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的文本图像拍摄完整度判断方法的流程图；

图2为本发明实施例提供的文本图像拍摄完整度判断系统的框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种文本图像拍摄完整度判断方法及系统，以识别文本图片可能存在文字过于贴边，导致内容不全的现象，实现对文本图像拍摄完整度的准确判断。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本实施例提供的文本图像拍摄完整度判断方法包括：

步骤101：对待判别图像进行图像二值化，得到二值图像；

本实施例中的待判别图像可以为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。但该图像具备一共同特性，即都含有文本部分，本发明是借助文本与图像背景的差别从而实现对图像完整度的准确判断。

在实际应用中，该步骤101具体可以包括以下步骤：

S11：选取不同边缘阈值，根据边缘像素数目设定值提取所述待判别图像的边缘，得到边缘图像；

实际上，本边缘图像的提取可以利用图像边缘提取算法(例如canny边缘检测算法)实现，只是针对不同的图像尺寸，那么边缘的尺寸也有所差别，因此在利用图像边缘提取算法实现图像边缘的提取时，可以设定边缘阈值，且由于图像为四边形或是其他形状，那么其边缘阈值会有所不同，因此设定多个不同的边缘阈值更有利于图像边缘的提取，且能够提高边缘提取精度。

S12：根据区域阈值去除所述边缘图像中面积连通区域，得到滤噪图像；

对于图像中的面积连通区域，其像素值或其他表征颜色的参数是相同或在一定数值范围内，因此可以通过设定区域阈值的方式将面积连通区域识别出，该面积连通区域存在文字的可能性较小，因此可以将该部分去除，以减少不必要的识别过程和相应的计算量，进而提高该方案的判断速度。

S13：将所述滤噪图像与所述边缘图像进行边缘信息比较，修正所述滤噪图像的边缘信息，得到修正图像；

对于步骤S12中滤除的面积连通区域中可能会含有边缘信息，例如该部分无文字，即连通面积内无文字，边缘也无文字，那么该部分边缘直接在S12中滤除，这样会严重影响后续边缘信息的检测与判断，因此需要与原始的边缘信息进行比对，并按照原始的边缘信息进行修正，即可减小S12中因误滤除边缘而导致的识别误差，提高了本方案的判断准确度。

S14：利用OTSU算法对所述修正图像进行局部二值化处理，得到初始二值图像；

当然，该OTSU算法并不是本发明采用的独一无二的二值化算法，只要能够实现对图像进行二值化处理的方法，均可以应用于本方案中，且将本方案中的OTSU算法替换为其他二值化算法，实现对图像进行二值化处理的目的的，也都属于本发明所保护的范围。

S15：滤除所述初始二值图像中的线条噪声和面积连通区域，得到滤噪二值图像；

经过二值化后的图像中会出现新的面积连通区域，因此基于上述S12相同的目的，可以将该新的面积连通区域滤除；同时文字与线条的差别较大，也可以直接将线条滤除，更进一步的减少的待识别内容，也就减少了识别时间，提高了判断效率，同时也避免了线条对判断结果的影响，提高了判断准确性。

S16：将所述滤噪二值图像与所述修正图像对比，修正所述滤噪二值图像的边缘，得到保留文字区域的二值图像。

该步骤与上述步骤S13的原因一致，所产生的技术效果相同，在此不再赘述。

步骤102：识别所述二值图像中的文字区域，所述文字区域的呈行列排布的多个文字区域；

该步骤102具体可以包括以下步骤：

S21：滤除所述二值图像中的孤立点噪声，并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点，得到按行和列的方向排列的分段区域；

该步骤进一步滤除了其他散点噪声，相比面积连通区域，该步骤中噪声的滤除更进一步的消除的噪声影响，更进一步提高本方案的判断准确度。并且本步骤还将图像进行区域划分，将大氛围改成小范围识别，更提高了识别判断的精度。且为后续判断提供了清晰的顺序。

S22：将所有所述分段区域中的文字区域连接，得到文字区域连接图像；

该部分的连接并非是还原成原始图像的状态，该连接图像还存在文字区域的划分，连接只是为了能够规定文字区域的顺序，避免混乱各个文字区域的排布，也就避免混乱所造成的误差甚至错误。

S23：利用轮廓信息对所述文字区域连接图像定位轮廓区域；

S24：根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域，得到按行和列的方向排列多个文字区域。

定位轮廓区域后，结合文字特征，能够更准确的划分每一文字区域，这样可以在后续的判断步骤中避免文字区域的交叉而导致的误差。

步骤103：判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。

S31：按照逐行逐区块顺序，判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果；所述文本区域尺寸特征为高度和长宽的比值预设区间；

S32：当所述尺寸判断结果表示是时，判断所述文字区域是否满足贴边条件，得到贴边判断结果；所述贴边条件为所述文字区域的四个顶点的阈值范围；

S33：当所述贴边判断结果表示是时，贴边行数加1；当所述贴边判断结果表示否时，判断该行的下一个所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至该行所有所述文字区域全部判断完毕；

S34：判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边，若是，则判断该行是否是最后一行，如不是最后一行则判断下一行的所述文字区域，返回所述“判断每一所述文字区域是否满足文本区域尺寸特征，得到尺寸判断结果”的步骤，直至所有所述文字区域全部判断完毕；

在步骤S31和S32中分别通过区域尺寸和贴边条件判断该文字区域是否为贴片区域，可见本方案中的判断条件非常简单，易于实现，并且涉及的计算量也较少，相比现有的判断方法，本方案更简单，计算量更小，效率更高。

S35：计算贴边行数与总行数的比值得到图像文字贴边概率；

S36：判断所述图像文字贴边概率是否超出概率阈值，得到概率判断结果；或者所述贴边行数是否超出贴边行数阈值，得到贴边行数判断结果；

S37：当所述概率判断结果表示是时，和/或当所述贴边行数判断结果表示是时，确定所述待判别图像存在文字贴边现象，并计算有贴边可信度；

设文字区域靠近边缘的文字贴边行数阈值为th，贴边行数累计为n，总行数为N，文字有贴边可信度为p，定义变量belief，有贴边可信度计算公式如下：

belief＝0.5+(n-th)x0.1

S38：当所述概率判断结果表示否时，且当所述贴边行数判断结果表示否时，判断文本图像没有文字贴边现象，并计算无贴边可信度可信度，计算公式如下：

belief＝0.5+(th-n)x0.1

本实施例还提供了一种与上述文本图像拍摄完整度判断方法相应的文本图像拍摄完整度判断系统，如图2所示，该系统包括：

二值化单元201，用于对待判别图像进行图像二值化，得到二值图像；

该二值化单元201具体包括：

识别单元202，用于识别所述二值图像中的文字区域，所述文字区域的呈行列排布的多个文字区域；

该识别单元202具体包括：

完整度判断单元203，用于判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。

该完整度判断单元203具体包括：

需要说明的是，对于该实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本发明提出的文本图像拍摄完整度判断方法，是利用图像处理等领域的技术，结合canny边缘检测算法对图像进行二值化处理，并且针对文本图像可能存在印章、线条等噪声问题进行滤噪处理，定位轮廓区域，再结合文字特征定位文字区域，根据文字贴边时图像的特征判断图像是否存在文字贴边现象，计算结果符合人眼判断，达到了文本图像拍摄完整度判断的目的。

本发明的应用实例如下：

应用实例1：

在一般的计算机上，对一张某医院病人费用小项统计图片进行处理，使用本发明所述的方法，获得图像数据后，经过步骤101图像二值化处理，得到的二值图像很好地滤除表格线条，步骤102定位文字区域，效果良好，经过步骤103判断文字区域是否贴边，判断图片不存在贴边现象，可信度合理，与人眼观观察一致。

应用实例2

在一般的计算机上，对一张左右两边不完整的某医院病人费用汇总清单图片进行处理，使用本发明所述的方法，获得图像数据后，经过步骤101图像二值化处理，得到的二值图像很好的滤除表格线条，步骤102定位文字区域，经过步骤103判断文字区域存在贴边现象，判断结果与人眼观察一致。

应用实例3

例如，在一般的计算机上，对拍入某保险单照片处理，使用本发明所述的方法，获得图像数据后，经过步骤101图像二值化处理，步骤102定位文字区域，经过步骤103判断文字区域是否贴边，判断结果为存在贴边现象，信息不完整，可信度合理，与人眼观观察一致。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种文本图像拍摄完整度判断方法，其特征在于，所述方法包括：

对待判别图像进行图像二值化，得到二值图像；

2.根据权利要求1所述的文本图像拍摄完整度判断方法，其特征在于，所述对待判别图像进行图像二值化，得到二值图像，具体包括：

3.根据权利要求1所述的文本图像拍摄完整度判断方法，其特征在于，所述识别所述二值图像中的文字区域，具体包括：

利用轮廓信息对所述文字区域连接图像定位轮廓区域；

4.根据权利要求1所述的文本图像拍摄完整度判断方法，其特征在于，所述判断每一所述文字区域中是否存在贴边现象，并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度，具体包括：

计算贴边行数与总行数的比值得到图像文字贴边概率；

5.根据权利要求1所述的文本图像拍摄完整度判断方法，其特征在于，所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。

6.一种文本图像拍摄完整度判断系统，其特征在于，所述系统包括：

7.根据权利要求6所述的文本图像拍摄完整度判断系统，其特征在于，所述二值化单元具体包括：

8.根据权利要求6所述的文本图像拍摄完整度判断系统，其特征在于，所述识别单元具体包括：

9.根据权利要求6所述的文本图像拍摄完整度判断系统，其特征在于，所述完整度判断单元具体包括：

10.根据权利要求6所述的文本图像拍摄完整度判断系统，其特征在于，所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。