CN110472550A - 一种文本图像拍摄完整度判断方法及系统 - Google Patents
一种文本图像拍摄完整度判断方法及系统 Download PDFInfo
- Publication number
- CN110472550A CN110472550A CN201910733241.XA CN201910733241A CN110472550A CN 110472550 A CN110472550 A CN 110472550A CN 201910733241 A CN201910733241 A CN 201910733241A CN 110472550 A CN110472550 A CN 110472550A
- Authority
- CN
- China
- Prior art keywords
- image
- welt
- character area
- text
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims description 30
- 238000001514 detection method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 8
- 108010001267 Protein Subunits Proteins 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 208000024780 Urticaria Diseases 0.000 claims description 4
- 230000006837 decompression Effects 0.000 claims description 4
- 235000013399 edible fruits Nutrition 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000729 antidote Substances 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种文本图像拍摄完整度判断方法及系统,该方案包括:对待判别图像进行图像二值化,得到二值图像;识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。本发明整个过程涉及的计算参数少,且参数简单易识别,使本发明具有计算量小、准确性高的特点。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种文本图像拍摄完整度判断方法及系统。
背景技术
办公自动化趋势显著,而绝大多数的字符识别算法对文档图像的降质十分敏感,文档图像主要呈现三种降质形式:倾斜、清晰度、扭曲。在大批量的文本图像处理中首先需要对文本图像质量进行检测,给后续图像处理提供依据或减小不必要的资源消耗是必要的。
研究领域对于倾斜、扭曲和矫正方法研究的文章较多,场景图像清晰度的检测的研究较多。在实际应用中,除了三种主要降质形式,还存在其它情况,如文本图片可能存在文字过于贴边,导致内容不全的现象。因此,如何将判断文本图像是否完整成为本领域亟待解决的问题。
发明内容
本发明的目的是提供一种文本图像拍摄完整度判断方法及系统,以解决上述问题。
为实现上述目的,本发明提供了一种文本图像拍摄完整度判断方法,所述方法包括:
对待判别图像进行图像二值化,得到二值图像;
识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
可选的,所述对待判别图像进行图像二值化,得到二值图像,具体包括:
选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
可选的,所述识别所述二值图像中的文字区域,具体包括:
滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
利用轮廓信息对所述文字区域连接图像定位轮廓区域;
根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
可选的,所述判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度,具体包括:
按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
计算贴边行数与总行数的比值得到图像文字贴边概率;
判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度。
可选的,所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。
本发明还提供了一种文本图像拍摄完整度判断系统,所述系统包括:
二值化单元,用于对待判别图像进行图像二值化,得到二值图像;
识别单元,用于识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
完整度判断单元,用于判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
可选的,所述二值化单元具体包括:
边缘图像提取子单元,用于选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
第一滤噪子单元,用于根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
第一修正子单元,用于将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
二值化子单元,用于利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
第二滤噪子单元,用于滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
第二修正子单元,用于将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
可选的,所述识别单元具体包括:
分段滤噪子单元,用于滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
区域连接子单元,用于将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
轮廓定位子单元,用于利用轮廓信息对所述文字区域连接图像定位轮廓区域;
文字区域识别子单元,用于根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
可选的,所述完整度判断单元具体包括:
尺寸判断子单元,用于按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
贴边判断子单元,用于当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
贴边行数累计子单元,用于当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
循环判断子单元,用于判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
概率计算子单元,用于计算贴边行数与总行数的比值得到图像文字贴边概率;
概率行数判断子单元,用于判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
存在贴边结果确定子单元,用于当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
无贴边结果确定子单元,用于当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度。
需要说明的是,所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的文本图像拍摄完整度判断方法及系统具有以下优点:
1、与传统文本图像质量评价方法相比,本发明结合实际应用中存在文字贴边的问题设计检测判断方案,减小不必要的计算开销,并为进一步的处理提供依据。
2、与通过检测文本图像倾斜、扭曲检测等参数评价图像质量的方法相比,本发明将待判别图像进行图像二值化,将二值图像中的文字区域识别呈行列排布的多个文字区域,再对多个文字区域的贴片情况进行检测判断,整个过程涉及的计算参数少,且参数简单易识别,使本发明具有计算量小、准确性高的特点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文本图像拍摄完整度判断方法的流程图;
图2为本发明实施例提供的文本图像拍摄完整度判断系统的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种文本图像拍摄完整度判断方法及系统,以识别文本图片可能存在文字过于贴边,导致内容不全的现象,实现对文本图像拍摄完整度的准确判断。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本实施例提供的文本图像拍摄完整度判断方法包括:
步骤101:对待判别图像进行图像二值化,得到二值图像;
本实施例中的待判别图像可以为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。但该图像具备一共同特性,即都含有文本部分,本发明是借助文本与图像背景的差别从而实现对图像完整度的准确判断。
在实际应用中,该步骤101具体可以包括以下步骤:
S11:选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
实际上,本边缘图像的提取可以利用图像边缘提取算法(例如canny边缘检测算法)实现,只是针对不同的图像尺寸,那么边缘的尺寸也有所差别,因此在利用图像边缘提取算法实现图像边缘的提取时,可以设定边缘阈值,且由于图像为四边形或是其他形状,那么其边缘阈值会有所不同,因此设定多个不同的边缘阈值更有利于图像边缘的提取,且能够提高边缘提取精度。
S12:根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
对于图像中的面积连通区域,其像素值或其他表征颜色的参数是相同或在一定数值范围内,因此可以通过设定区域阈值的方式将面积连通区域识别出,该面积连通区域存在文字的可能性较小,因此可以将该部分去除,以减少不必要的识别过程和相应的计算量,进而提高该方案的判断速度。
S13:将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
对于步骤S12中滤除的面积连通区域中可能会含有边缘信息,例如该部分无文字,即连通面积内无文字,边缘也无文字,那么该部分边缘直接在S12中滤除,这样会严重影响后续边缘信息的检测与判断,因此需要与原始的边缘信息进行比对,并按照原始的边缘信息进行修正,即可减小S12中因误滤除边缘而导致的识别误差,提高了本方案的判断准确度。
S14:利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
当然,该OTSU算法并不是本发明采用的独一无二的二值化算法,只要能够实现对图像进行二值化处理的方法,均可以应用于本方案中,且将本方案中的OTSU算法替换为其他二值化算法,实现对图像进行二值化处理的目的的,也都属于本发明所保护的范围。
S15:滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
经过二值化后的图像中会出现新的面积连通区域,因此基于上述S12相同的目的,可以将该新的面积连通区域滤除;同时文字与线条的差别较大,也可以直接将线条滤除,更进一步的减少的待识别内容,也就减少了识别时间,提高了判断效率,同时也避免了线条对判断结果的影响,提高了判断准确性。
S16:将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
该步骤与上述步骤S13的原因一致,所产生的技术效果相同,在此不再赘述。
步骤102:识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
该步骤102具体可以包括以下步骤:
S21:滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
该步骤进一步滤除了其他散点噪声,相比面积连通区域,该步骤中噪声的滤除更进一步的消除的噪声影响,更进一步提高本方案的判断准确度。并且本步骤还将图像进行区域划分,将大氛围改成小范围识别,更提高了识别判断的精度。且为后续判断提供了清晰的顺序。
S22:将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
该部分的连接并非是还原成原始图像的状态,该连接图像还存在文字区域的划分,连接只是为了能够规定文字区域的顺序,避免混乱各个文字区域的排布,也就避免混乱所造成的误差甚至错误。
S23:利用轮廓信息对所述文字区域连接图像定位轮廓区域;
S24:根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
定位轮廓区域后,结合文字特征,能够更准确的划分每一文字区域,这样可以在后续的判断步骤中避免文字区域的交叉而导致的误差。
步骤103:判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
S31:按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
S32:当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
S33:当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
S34:判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
在步骤S31和S32中分别通过区域尺寸和贴边条件判断该文字区域是否为贴片区域,可见本方案中的判断条件非常简单,易于实现,并且涉及的计算量也较少,相比现有的判断方法,本方案更简单,计算量更小,效率更高。
S35:计算贴边行数与总行数的比值得到图像文字贴边概率;
S36:判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
S37:当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
设文字区域靠近边缘的文字贴边行数阈值为th,贴边行数累计为n,总行数为N,文字有贴边可信度为p,定义变量belief,有贴边可信度计算公式如下:
belief=0.5+(n-th)x0.1
S38:当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度,计算公式如下:
belief=0.5+(th-n)x0.1
本实施例还提供了一种与上述文本图像拍摄完整度判断方法相应的文本图像拍摄完整度判断系统,如图2所示,该系统包括:
二值化单元201,用于对待判别图像进行图像二值化,得到二值图像;
该二值化单元201具体包括:
边缘图像提取子单元,用于选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
第一滤噪子单元,用于根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
第一修正子单元,用于将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
二值化子单元,用于利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
第二滤噪子单元,用于滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
第二修正子单元,用于将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
识别单元202,用于识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
该识别单元202具体包括:
分段滤噪子单元,用于滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
区域连接子单元,用于将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
轮廓定位子单元,用于利用轮廓信息对所述文字区域连接图像定位轮廓区域;
文字区域识别子单元,用于根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
完整度判断单元203,用于判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
该完整度判断单元203具体包括:
尺寸判断子单元,用于按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
贴边判断子单元,用于当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
贴边行数累计子单元,用于当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
循环判断子单元,用于判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
概率计算子单元,用于计算贴边行数与总行数的比值得到图像文字贴边概率;
概率行数判断子单元,用于判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
存在贴边结果确定子单元,用于当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
无贴边结果确定子单元,用于当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度。
需要说明的是,对于该实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本发明提出的文本图像拍摄完整度判断方法,是利用图像处理等领域的技术,结合canny边缘检测算法对图像进行二值化处理,并且针对文本图像可能存在印章、线条等噪声问题进行滤噪处理,定位轮廓区域,再结合文字特征定位文字区域,根据文字贴边时图像的特征判断图像是否存在文字贴边现象,计算结果符合人眼判断,达到了文本图像拍摄完整度判断的目的。
本发明的应用实例如下:
应用实例1:
在一般的计算机上,对一张某医院病人费用小项统计图片进行处理,使用本发明所述的方法,获得图像数据后,经过步骤101图像二值化处理,得到的二值图像很好地滤除表格线条,步骤102定位文字区域,效果良好,经过步骤103判断文字区域是否贴边,判断图片不存在贴边现象,可信度合理,与人眼观观察一致。
应用实例2
在一般的计算机上,对一张左右两边不完整的某医院病人费用汇总清单图片进行处理,使用本发明所述的方法,获得图像数据后,经过步骤101图像二值化处理,得到的二值图像很好的滤除表格线条,步骤102定位文字区域,经过步骤103判断文字区域存在贴边现象,判断结果与人眼观察一致。
应用实例3
例如,在一般的计算机上,对拍入某保险单照片处理,使用本发明所述的方法,获得图像数据后,经过步骤101图像二值化处理,步骤102定位文字区域,经过步骤103判断文字区域是否贴边,判断结果为存在贴边现象,信息不完整,可信度合理,与人眼观观察一致。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种文本图像拍摄完整度判断方法,其特征在于,所述方法包括:
对待判别图像进行图像二值化,得到二值图像;
识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
2.根据权利要求1所述的文本图像拍摄完整度判断方法,其特征在于,所述对待判别图像进行图像二值化,得到二值图像,具体包括:
选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
3.根据权利要求1所述的文本图像拍摄完整度判断方法,其特征在于,所述识别所述二值图像中的文字区域,具体包括:
滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
利用轮廓信息对所述文字区域连接图像定位轮廓区域;
根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
4.根据权利要求1所述的文本图像拍摄完整度判断方法,其特征在于,所述判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度,具体包括:
按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
计算贴边行数与总行数的比值得到图像文字贴边概率;
判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度。
5.根据权利要求1所述的文本图像拍摄完整度判断方法,其特征在于,所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。
6.一种文本图像拍摄完整度判断系统,其特征在于,所述系统包括:
二值化单元,用于对待判别图像进行图像二值化,得到二值图像;
识别单元,用于识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
完整度判断单元,用于判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
7.根据权利要求6所述的文本图像拍摄完整度判断系统,其特征在于,所述二值化单元具体包括:
边缘图像提取子单元,用于选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
第一滤噪子单元,用于根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
第一修正子单元,用于将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
二值化子单元,用于利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
第二滤噪子单元,用于滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
第二修正子单元,用于将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
8.根据权利要求6所述的文本图像拍摄完整度判断系统,其特征在于,所述识别单元具体包括:
分段滤噪子单元,用于滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
区域连接子单元,用于将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
轮廓定位子单元,用于利用轮廓信息对所述文字区域连接图像定位轮廓区域;
文字区域识别子单元,用于根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
9.根据权利要求6所述的文本图像拍摄完整度判断系统,其特征在于,所述完整度判断单元具体包括:
尺寸判断子单元,用于按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
贴边判断子单元,用于当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
贴边行数累计子单元,用于当所述贴边判断结果表示是时,贴边行数加1;当所述贴边判断结果表示否时,判断该行的下一个所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至该行所有所述文字区域全部判断完毕;
循环判断子单元,用于判断该行中是否检测到存在文字区域贴边或者该行所有文字区域都不贴边,若是,则判断该行是否是最后一行,如不是最后一行则判断下一行的所述文字区域,返回所述“判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果”的步骤,直至所有所述文字区域全部判断完毕;
概率计算子单元,用于计算贴边行数与总行数的比值得到图像文字贴边概率;
概率行数判断子单元,用于判断所述图像文字贴边概率是否超出概率阈值,得到概率判断结果;或者所述贴边行数是否超出贴边行数阈值,得到贴边行数判断结果;
存在贴边结果确定子单元,用于当所述概率判断结果表示是时,和/或当所述贴边行数判断结果表示是时,确定所述待判别图像存在文字贴边现象,并计算有贴边可信度;
无贴边结果确定子单元,用于当所述概率判断结果表示否时,且当所述贴边行数判断结果表示否时,判断文本图像没有文字贴边现象,并计算无贴边可信度可信度。
10.根据权利要求6所述的文本图像拍摄完整度判断系统,其特征在于,所述待判别图像为用数码相机拍摄得到的图像数据、用手机拍摄得到的图像数据、用扫描仪得到的图像数据、读取预先存在图像数据的文件中的数据并解压后得到的图像数据中的一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910733241.XA CN110472550A (zh) | 2019-08-02 | 2019-08-02 | 一种文本图像拍摄完整度判断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910733241.XA CN110472550A (zh) | 2019-08-02 | 2019-08-02 | 一种文本图像拍摄完整度判断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110472550A true CN110472550A (zh) | 2019-11-19 |
Family
ID=68510524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910733241.XA Pending CN110472550A (zh) | 2019-08-02 | 2019-08-02 | 一种文本图像拍摄完整度判断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472550A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383193A (zh) * | 2020-02-21 | 2020-07-07 | 泰康保险集团股份有限公司 | 图像修复方法和装置 |
CN112287188A (zh) * | 2020-10-19 | 2021-01-29 | 珠海格力电器股份有限公司 | 字符切边识别方法和装置 |
CN113696647A (zh) * | 2021-09-13 | 2021-11-26 | 武汉先同科技有限公司 | 一种应用于喷码机的图像数据压缩方法及系统 |
CN114328990A (zh) * | 2021-10-13 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 图像完整性识别方法、装置、计算机设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063619A (zh) * | 2010-11-30 | 2011-05-18 | 汉王科技股份有限公司 | 文字行提取方法和装置 |
CN103049911A (zh) * | 2012-12-20 | 2013-04-17 | 成都理想境界科技有限公司 | 轮廓检测稳定性判断方法及图像检索方法 |
CN103679168A (zh) * | 2012-08-30 | 2014-03-26 | 北京百度网讯科技有限公司 | 文字区域检测方法及装置 |
US20170309003A1 (en) * | 2016-04-26 | 2017-10-26 | Adobe Systems Incorporated | Removing artifacts from document images |
CN107945197A (zh) * | 2017-12-20 | 2018-04-20 | 南通使爱智能科技有限公司 | 一种用于图像边缘提取的智能图像处理仪 |
CN108038458A (zh) * | 2017-12-20 | 2018-05-15 | 首都师范大学 | 基于特征摘要图的视频中的户外场景文本自动获取方法 |
CN109460725A (zh) * | 2018-10-29 | 2019-03-12 | 苏州派维斯信息科技有限公司 | 小票消费明细内容融合及提取方法 |
CN109903210A (zh) * | 2019-01-04 | 2019-06-18 | 阿里巴巴集团控股有限公司 | 水印的去除方法、装置和服务器 |
CN109933756A (zh) * | 2019-03-22 | 2019-06-25 | 腾讯科技(深圳)有限公司 | 基于ocr的图像转档方法、装置、设备及可读存储介质 |
CN110009650A (zh) * | 2018-12-20 | 2019-07-12 | 浙江新再灵科技股份有限公司 | 一种扶梯扶手边界区域越界检测方法与系统 |
-
2019
- 2019-08-02 CN CN201910733241.XA patent/CN110472550A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063619A (zh) * | 2010-11-30 | 2011-05-18 | 汉王科技股份有限公司 | 文字行提取方法和装置 |
CN103679168A (zh) * | 2012-08-30 | 2014-03-26 | 北京百度网讯科技有限公司 | 文字区域检测方法及装置 |
CN103049911A (zh) * | 2012-12-20 | 2013-04-17 | 成都理想境界科技有限公司 | 轮廓检测稳定性判断方法及图像检索方法 |
US20170309003A1 (en) * | 2016-04-26 | 2017-10-26 | Adobe Systems Incorporated | Removing artifacts from document images |
CN107945197A (zh) * | 2017-12-20 | 2018-04-20 | 南通使爱智能科技有限公司 | 一种用于图像边缘提取的智能图像处理仪 |
CN108038458A (zh) * | 2017-12-20 | 2018-05-15 | 首都师范大学 | 基于特征摘要图的视频中的户外场景文本自动获取方法 |
CN109460725A (zh) * | 2018-10-29 | 2019-03-12 | 苏州派维斯信息科技有限公司 | 小票消费明细内容融合及提取方法 |
CN110009650A (zh) * | 2018-12-20 | 2019-07-12 | 浙江新再灵科技股份有限公司 | 一种扶梯扶手边界区域越界检测方法与系统 |
CN109903210A (zh) * | 2019-01-04 | 2019-06-18 | 阿里巴巴集团控股有限公司 | 水印的去除方法、装置和服务器 |
CN109933756A (zh) * | 2019-03-22 | 2019-06-25 | 腾讯科技(深圳)有限公司 | 基于ocr的图像转档方法、装置、设备及可读存储介质 |
Non-Patent Citations (3)
Title |
---|
DAVE ELLIMAN等: "Integrity Check for Printed Binary Document Images", 《NDT 2010: NETWORKED DIGITAL TECHNOLOGIE》 * |
周景超: "视频文本检测算法研究", 《中国博士学位论文全文数据库_信息科技辑》 * |
高士林: "图像中的文本定位技术研究", 《中国优秀硕士学位论文全文数据库_信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383193A (zh) * | 2020-02-21 | 2020-07-07 | 泰康保险集团股份有限公司 | 图像修复方法和装置 |
CN112287188A (zh) * | 2020-10-19 | 2021-01-29 | 珠海格力电器股份有限公司 | 字符切边识别方法和装置 |
CN113696647A (zh) * | 2021-09-13 | 2021-11-26 | 武汉先同科技有限公司 | 一种应用于喷码机的图像数据压缩方法及系统 |
CN113696647B (zh) * | 2021-09-13 | 2022-12-30 | 武汉先同科技有限公司 | 一种应用于喷码机的图像数据压缩方法及系统 |
CN114328990A (zh) * | 2021-10-13 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 图像完整性识别方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472550A (zh) | 一种文本图像拍摄完整度判断方法及系统 | |
US9292759B2 (en) | Methods and systems for optimized parameter selection in automated license plate recognition | |
CN102945366B (zh) | 一种人脸识别的方法及装置 | |
CN107992807B (zh) | 一种基于cnn模型的人脸识别方法及装置 | |
CN105608409A (zh) | 指纹识别的方法及装置 | |
CN107622489A (zh) | 一种图像篡改检测方法及装置 | |
CN108197644A (zh) | 一种图像识别方法和装置 | |
CN108009472A (zh) | 一种基于卷积神经网络和贝叶斯分类器的指背关节纹识别方法 | |
CN107609558A (zh) | 文字图像处理方法及装置 | |
CN110321905A (zh) | 基于语义分割的异常区域检测方法、系统及相关组件 | |
CN108268823A (zh) | 目标再识别方法和装置 | |
US20070292005A1 (en) | Method and apparatus for adaptive hierarchical processing of print images | |
CN109409227A (zh) | 一种基于多通道cnn的手指静脉图质量评估方法及其装置 | |
CN111914748A (zh) | 人脸识别方法、装置、电子设备及计算机可读存储介质 | |
CN109697353A (zh) | 一种点击验证码的验证方法和装置 | |
CN113673396A (zh) | 一种孢子发芽率计算方法、装置及存储介质 | |
CN111881803B (zh) | 一种基于改进YOLOv3的畜脸识别方法 | |
CN107038792B (zh) | 纸币的面向识别方法和系统 | |
CN111027474B (zh) | 人脸区域获取方法、装置、终端设备和存储介质 | |
CN110210425B (zh) | 人脸识别方法、装置、电子设备及存储介质 | |
US8879805B2 (en) | Automated image identification method | |
CN112200174A (zh) | 人脸框检测方法及模块和活体人脸验证方法及系统 | |
CN112686189A (zh) | 违规用户处理方法、装置及电子设备 | |
CN109165551B (zh) | 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 | |
CN111191587A (zh) | 一种行人重识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200806 Address after: Room 2087, No. 100, Lane 130, Taopu Road, Putuo District, Shanghai Applicant after: Jingpu (Shanghai) Artificial Intelligence Technology Co.,Ltd. Address before: 226000 Jiangsu city of Nantong province No. 2 Building 1 room 110494 Hyde Applicant before: NANTONG SHIAI INTELLIGENT TECHNOLOGY Co.,Ltd. |
|
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20231201 |