CN109325492B - 字符切割方法、装置、计算机设备及存储介质 - Google Patents
字符切割方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109325492B CN109325492B CN201810939326.9A CN201810939326A CN109325492B CN 109325492 B CN109325492 B CN 109325492B CN 201810939326 A CN201810939326 A CN 201810939326A CN 109325492 B CN109325492 B CN 109325492B
- Authority
- CN
- China
- Prior art keywords
- character
- characters
- cutting
- segmentation
- adhered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005520 cutting process Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 230000011218 segmentation Effects 0.000 claims abstract description 94
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 52
- 238000004590 computer program Methods 0.000 claims description 16
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 13
- 238000003708 edge detection Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 239000000853 adhesive Substances 0.000 description 12
- 230000001070 adhesive effect Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 238000003706 image smoothing Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 235000012434 pretzels Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本申请公开了一种字符切割方法、装置、计算机设备及存储介质,具有较高的适用性,可有效地提高切割准确度。其中,方法部分包括:对目标图像中的字符进行字符定位以确定出字符区域;对字符区域的字符进行分割以得到粘连字符分割块;确定粘连字符分割块中字符边界的波峰位置和波峰高度;根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;根据起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
Description
技术领域
本申请涉及图像处理领域,尤其涉及一种字符切割方法、装置、计算机设备及存储介质。
背景技术
目前,常用的字符分割方法为滴水算法或投影法进行字符切割,投影法是指,利用二值化图像的像素进行分布直方图分析,根据直方图分析结果中寻找分界点,以分界点作为切割点进行切割,而滴水算法,是模拟水滴的滚动,而使用滴水算法切割,由于滴水算法切割是模拟水滴从高处向地处滴落的过程对字符进行划分,水滴从字符串顶部在重力的作用下,沿着字符轮廓向下滴落,当水滴陷在轮廓的凹处时,将渗透到字符笔划中,最终水滴经过的轨迹构成字符的分割路径。
传统上,常利用上述2种切割方式进行切割,利用投影切割,由于只对待处理图像进行一刀切割,不可避免会有过分切割或出现粘连字符,只适用于无字符粘连的情况,而使用滴水算法,由于一些待处理图像的字符错综复杂,大小不一,待处理图像存在干扰背景等应用场景十分复杂的情况,无法准确的确定滴水渗漏处,导致字符分割点位置有误,不能有效地对字符进行正确分割,另外,上述两种切割方式均是针对长宽规则一致的特定字符,不具备普遍适用性,切割准确度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种可有效地提高切割准确度的字符切割方法、装置、计算机设备及存储介质。
一种字符切割方法,包括:
对目标图像中的字符进行字符定位以确定出字符区域;
对字符区域的字符进行分割以得到粘连字符分割块;
确定粘连字符分割块中字符边界的波峰位置和波峰高度;
根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
根据起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
一种字符切割装置,包括:
第一确定模块,用于对目标图像中的字符进行字符定位以确定出字符区域;
分割模块,用于对第一确定模块确定的字符区域的字符进行分割以得到粘连字符分割块;
第二确定模块,用于确定分割模块分割的粘连字符分割块中字符边界的波峰位置和波峰高度;
第三确定模块,用于根据第二确定模块确定的粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
切割模块,用于根据第三确定模块确定的起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述字符切割方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述字符切割方法的步骤。
上述字符切割方法、装置、计算机设备及存储介质所提供的方案中,先是利用简单切割方法将非粘连的字符切割开,继而再改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请中字符切割方法一个应用框架示意图;
图2是本申请中字符切割方法一个实施例流程示意图;
图3是图2中步骤S10一具体实施方式流程示意图;
图4是图3中步骤S12一具体实施方式流程示意图;
图5是图2中步骤S20一具体实施方式流程示意图;
图6是图2中步骤S40一具体实施方式流程示意图;
图7是本申请中字符切割装置一个实施例结构示意图;
图8是本申请中字符切割装置另一实施例结构示意图;
图9是本申请中计算机设备一个实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供的字符切割方法中,可应用在如图1所示的网络框架中中,其中,字符切割装置为一具备计算处理能力的计算机设备,在字符切割方法中,字符切割装置对目标图像中的字符进行字符定位以确定出字符区域;对字符区域的字符进行分割以得到粘连字符分割块;确定粘连字符分割块中字符边界的波峰位置和波峰高度;根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;根据起始分割点使用滴水算法对粘连字符分割块进行切割,从而可对粘连字符分割块中的字符进行切割,由此可得,在本申请中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
在一实施例中,如图2所示,提供一种字符切割方法,包括如下步骤:S10、对目标图像中的字符进行字符定位以确定出字符区域;
其中,目标图像是指包含有待切割的字符的图像,应理解,在一些应用场景中,获取的目标图像通常包含有字符区域和非字符区域,因此,在本申请中,获取了目标图像后,可对目标图像中的字符进行字符定位以确定出字符区域。这里有必要对上述应用场景进行说明,示例性的,可以是识别车牌号码的应用场景中,也就是,待切割字符为车牌号码,上述目标图像为包含有待切割的车牌号码的图像;示例性的,还可以是手写字符的应用场景中,目标图像为包含手写字符的图像,需要说明的是,上述示例场景在这里只是举例说明,但并不对本申请构成限定,具体不做限定,例如也可是为了识别出获取的一张图像中的某个字符而做的字符切割应用场景。
顾名思义,目标图像的字符区域是指目标图像中包含字符的区域。
S20、对字符区域的字符进行分割以得到粘连字符分割块;
在得到目标图像的字符区域后,对字符区域的字符进行分割以得到粘连字符分割块。其中,字符区域找的字符通常包含有粘连字符和非粘连字符,粘连字符是指字符之间存在粘连的字符,在本申请中,在对字符区域的字符进行分割后,可得到包含粘连字符的切割块,也就是上述粘连字符分割块。
S30、确定粘连字符分割块中字符边界的波峰位置和波峰高度;
在对字符区域的字符进行分割以得到粘连字符分割块后,可确定粘连字符分割块中字符边界的波峰位置和波峰高度。其中,粘连字符分割块中的字符边界是指围绕字符区域中的字符的边线区域,而根据字符边界内的字符大小和粘连情况,存在不同的波峰高度,以及波峰高度对应的波峰坐标,在本申请中,可确定上述波峰边界的波峰位置和波峰高度。
S40、根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
在确定粘连字符分割块中字符边界的波峰位置和波峰高度后,可进一步根据粘连字符分割块中字符边界的波峰位置和波峰高度确定出起始切割点。
S50、根据起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
其中,为了便于理解,这里先对滴水算法进行简单的介绍。滴水算法就是模拟水滴在重力作用下的行为特征来进行切分字符的,一般的滴水算法中,水滴从字符图像的初始切割开始沿着水平和垂直两个方向运动,在遇到字符轮廓的凹陷处后,就会滴落到凹槽之中,直至将其穿过之后形成一条水滴的路径,作为字符的分割路径。因此,在这条路径的选择过程中最重要的因素有:水滴起始分割点的选择以及水滴的路径,这些都会影响到水滴的路径的形成,因此,在确定了起始切割点后,根据起始分割点使用滴水算法对粘连字符分割块进行切割,从而切割出粘连字符分割块中每个字符,完成粘连字符分割块中字符的切割。由此可得,在本申请中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
在一实施例中,如图3所示,在步骤S10中,也即对目标图像中的字符进行字符定位以确定出字符区域,具体包括如下步骤:
S11、对目标图像中的字符进行边缘检测以获得目标图像的边缘区域;
其中,上述对目标图像的边缘检测,主要目的就是将目标图像中的字符特征确认出来。所谓的边缘区域就是目标图像中灰度值发生跳变的地方,而图像灰度分布梯度可以反映出目标图像中图像灰度的这种变化,边缘检测是检测每个字符的像素及其周围像素灰度值的变化。常用的边缘检测算法有如下几种:拉普拉斯(Laplacian)边缘算法、罗伯特(Roberts)边缘算子、索贝尔(Sobel)算子、坎尼(Canny)边缘算子等,具体不做限定,通过对目标图像中的字符进行边缘检测可得到上述目标图像的边缘区域。
S12、采取垂直投影算法对边缘区域进行定位以得到字符区域。
值得注意的是,经过大量的先验知识可以知道,边缘区域除了包含待切割的字符外,通常还会有其他的干扰信息存在,例如噪声等,因此,本申请中结合垂直投影算法准确的定位出含有字符的边缘区域对应的字符区域。
在一实施例中,如图4所示,步骤S12中,也即采取垂直投影算法对边缘区域进行定位以得到字符区域,具体包括如下步骤:
S121、确定出边缘区域的第一垂直投影图;
其中,上述边缘区域对应垂直方向的投影就是边缘区域的第一垂直投影图,也就是在该垂直方向上取一条直线,统计垂直于该直线(轴)的边缘区域上的像素的黑点数量,累加求和作为该直线(轴)该位置的值,即可得到边缘区域的第一垂直投影图。
S122、从第一垂直投影图的底部开始,用直线穿过第一垂直投影图,将直线向上移动直到达到第一垂直投影图的顶部,以记录直线移动过程中与第一垂直投影图的交点个数的集合;
S123、从记录的交点个数的集合中找到最大的交点个数N;
S124、若N大于或等于预设阈值,则将直线与第一垂直投影图的交点个数为N时对应的区域作为字符区域。
对于步骤S122-S124,应理解,第一垂直投影图为包含有字符的边缘区域对垂直方向的投影所获得,因此,当用直线穿过第一垂直投影图,将直线向上移动直到达到第一垂直投影图的顶部时,由于边缘区域中的字符,会存在不同数量的直线与第一垂直投影图的交点个数,将直线每次移动过程中与第一垂直投影图的交点个数进行记录,这样可以得到至今向上移动到第一垂直投影图的顶部而从记录的交点个数中找到最大的交点个数N反映出了实际的字符数量,将直线与第一垂直投影图的交点个数最大的个数N对应的区域作为字符区域,囊括了边缘区域中的所有字符,这样,可以有效地减少漏掉字符的情况,提高了字符切割中遗漏字符的可能性。
其中,进一步的,在本方案中,可设置预设阈值,预设阈值可根据实际情况或实际需求进行配置,例如,在车牌识别领域中,由于某些地区或国家的车牌码的字符个数是确定的,例如中国为七位数,因此,这里可将预设阈值设置为7,这里可将预设阈值设为7。应理解,在本申请的一些应用场景中,对字符进行垂直投影发现其投影图呈现多锯齿状,水平方向出现有规律的明暗交替,因此本申请中利用该特点来辨别是不是真正的字符,从而确定出真正的字符区域。用一条直线与字符的投影图相交,统计出交点的最大个数,利用统计记录的最大个数确定出交点个数为N时对应的区域作为字符区域。由此可得,这里提出了一种具体的根据含有字符的边缘区域,确地出字符区域的方式,提高了方案的可实施性。
另外需要说明的是,上述只是提出了其中一种采取垂直投影算法对边缘区域进行定位以得到字符区域的方式,采取垂直投影算法对边缘区域进行定位以得到字符区域还有其他方式,具体这里不做限定。
在一实施例中,如图5所示,步骤S20中,也即对字符区域的字符进行分割以得到粘连字符分割块,具体包括如下步骤:
S21、确定字符区域的二值图像;
二值图像(Binary Image)是指将字符区域的每一个像素只有两种可能的取值或灰度等级状态,通常经常用黑白或单色图像表示二值图像,这里不做限定。
S22、将字符区域的二值图像在垂直方向进行投影以得到第二垂直投影图;
在确定出字符区域的二值图像,将字符区域的二值图像在垂直方向进行投影以得到第二垂直投影图。
S23、确定第二垂直投影图中投影值为0的投影位置;
S24、以竖直方向上投影值为0的投影位置作为切割方向进行切割以得到粘连字符分割块。
需要说明的是,上述提出了一种对字符区域的字符进行分割以得到粘连字符分割块的方式,除此之外,还可以有其他的分割方式,具体不做限定,例如,根据连通域分割法对上述字符区域的字符进行分割以获得粘连字符分割块,具体地,根据连通域分割法对上述字符区域的字符进行分割以获得粘连字符分割块包括:对字符区域上的每一个像素点进行扫描,为字符区域上每一个像素点进行标记,具体的,可以采用种子填充算法对字符区域上的每一个像素点进行标记,经过上述扫描后,根据标记确定字符区域中的连通域,将连通域的左右边缘作为分割线进行分割,将不联通的字符块分割开,从而得到本申请中的粘连字符分割块。
在一实施例中,如图6所示,步骤S40中,也即根据波峰位置以及波峰高度确定起始分割点,具体包括如下步骤:
S41、若第一字符的波峰高度小于或等于第二字符的波峰高度,则从第一字符的波峰位置坐标从左向右开始搜索,以首个由白变黑的像素点作为起始分割点,其中,第一字符和第二字符为相邻的字符;
S42、若第一字符的波峰高度大于第二字符的波峰高度,则从第二字符的波峰位置坐标左从右开始搜索,以第二个由白点黑的像素点作为起始分割点。
为了便于理解上述过程,这里举例来说,假设左右两边相邻两字符的波峰高度分别为h1和h2,其对应的波峰位置坐标分别为t1(tx1,ty1)和t2(tx2,ty2)。若h1<h2,从t1开始从左往右搜索,遇到第一个由白变黑的白点则将其选为起始分割点;若h2<h1,从t2开始从右往左搜索,遇到第二个由白变黑的白点则将其选为起始分割点。
在一实施例中,步骤S10之前,也即对目标图像中的字符进行字符定位以确定出字符区域之前,还包括如下步骤:获取携带有字符的待处理图像;对待处理图像进行预处理以获得目标图像。
在本申请中,对该待处理图像进行预处理以获得目标图像,包括:对待处理图像进行图像灰度转换、图像增强、图像二值化、去噪处理以得到目标图像。下面分别对上述预处理环节展开描述。其中,图像灰度转换,是指对待处理图像进行灰度值转化,这么做可以降低系统开销并提高后续的处理速度。图像增强,是指增强待处理图像的字符轮廓的显示、降低噪声的影响等,从而提高待处理图像的可读性,选择性地把感兴趣的特征突出而把其他的特征衰减的过程,具体的,图像增强的方式包括图像灰度修正、图像平滑、滤波、直方图增强以及图像锐化等方式,可以采用上述任意一种或几种结合的方式,这里不做限定。为了提取更好的待识别的图像图像特征,还需对待处理图像进行二值化处理。
在本申请中,可利用二值化算法,例如ostu算法(最大类间差方法)对待处理图像进行二值化处理。待处理图像的预处理的好坏将直接关系到后面字符的提取,图像去噪则是这部分中的关键地方。一般在图像中主要的噪声有:高斯噪声、瑞利噪声、伽马噪声、椒盐噪声等,因此,在本申请中,还需对待处理图像进行去噪,具体地,可采用如下方式对待处理图像进行去噪:如均值滤波算法、中值滤波、维纳滤波(wiener filtering)等,具体不做限定。可以看出,通过对待处理图像的预处理以得到的目标图像,可以改善待处理图像质量,包括增强图像对比度、保留图像细节和去除噪声等,从而使得待处理图像的细节更加清楚,字符易于被识别,为保证后续的字符分割提供了一定的保障。
由此可得,在本申请提供的字符切割方法中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在一实施例中,提供一种字符切割装置,该字符切割装置与上述实施例中字符切割方法一一对应。如图7所示,该字符切割装置70包括第一确定模块701、分割模块702、第二确定模块703、第三确定模块704和切割模块705。各功能模块详细说明如下:
第一确定模块701,用于对目标图像中的字符进行字符定位以确定出字符区域;
分割模块702,用于对第一确定模块701确定的字符区域的字符进行分割以得到粘连字符分割块;
第二确定模块703,用于确定分割模块702分割的粘连字符分割块中字符边界的波峰位置和波峰高度;
第三确定模块704,用于根据第二确定模块703确定的粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
切割模块705,用于根据第三确定模块704确定的起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
在一实施例中,第一确定模块701具体用于:
对目标图像中的字符进行边缘检测以获得含有字符的边缘区域;
采取垂直投影算法对边缘区域进行定位以得到字符区域。
在一实施例中,第一确定模块701用于采取垂直投影算法对含有字符的边缘区域进行定位以得到字符区域,包括:
第一确定模块701用于:
确定出边缘区域的第一垂直投影图;
从第一垂直投影图的底部开始,用直线穿过第一垂直投影图,将直线向上移动直到达到第一垂直投影图的顶部,以记录直线与第一垂直投影图的交点个数;
从记录的交点个数中找到最大的交点个数N;
若N大于或等于预设阈值,则将直线与第一垂直投影图的交点个数为N时对应的区域作为字符区域。
在一实施例中,分割模块702具体用于:
确定字符区域的二值图像;
将字符区域的二值图像在垂直方向进行投影以得到第二垂直投影图;
确定第二垂直投影图中投影值为0的位置;
以竖直方向上投影值为0的位置作为切割方向进行切割以得到粘连字符分割块。
在一实施例中,第二确定模块703,具体用于:
若第一字符的波峰高度小于或等于第二字符的波峰高度,则从第一字符的波峰位置坐标从左向右开始搜索,以首个由白变黑的像素点作为起始分割点;
若第一字符的波峰高度大于第二字符的波峰高度,则从第二字符的波峰位置坐标总左向右开始搜索,以第二个由白点黑的像素点作为起始分割点。
在一实施例中,如图8所示,字符切割装置70还包括获取模块706和预处理模块707;
获取模块706,用于对目标图像中的字符进行字符定位以确定出字符区域之前,获取携带有字符的待处理图像;
预处理模块707,用于所述获取模块706获取的对待处理图像进行预处理以获得目标图像。
由此可得,本申请提供了一种字符切割装置,该字符切割装置实现的方案中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
关于字符切割装置的具体限定可以参见上文中对于字符切割方法的限定,在此不再赘述。上述字符切割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储获取的目标图像等等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种字符切割方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
对目标图像中的字符进行字符定位以确定出字符区域;
对字符区域的字符进行分割以得到粘连字符分割块;
确定粘连字符分割块中字符边界的波峰位置和波峰高度;
根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
根据起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
需要说明的是,计算机设备的处理器执行计算机程序时还可以实现上述操作指引管理方法中的其他步骤或功能,具体可参阅前述方法实施例中关于字符切割方法中的对应描述,这里不再重复描述。
在本申请提供的计算机设备中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
对目标图像中的字符进行字符定位以确定出字符区域;
对字符区域的字符进行分割以得到粘连字符分割块;
确定粘连字符分割块中字符边界的波峰位置和波峰高度;
根据粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点;
根据起始分割点使用滴水算法对粘连字符分割块的字符进行切割。
需要说明的是,该计算机可读存储介质中的计算机程序被处理器执行时实现以下步骤的其他步骤或功能,具体可参阅前述方法实施例中关于字符切割方法中的对应描述,这里不再重复描述。
在本申请提供的计算机可读存储介质中,先是利用简单切割方法将非粘连的字符切割开,继而再基于改进的滴水算法对粘连字符进行切割,其中,将非粘连与粘连的切割方式分割开,在一定程度上降低系统计算量,继而再对粘连字符区域,另外使用改进的确定滴水算法的起始切割点的方式,对粘连字符进行切割,而不是直接利用传统滴水算法进行切割,综合考虑了粘连字符区域中粘连字符的波峰,具有较高的适用性,可有效地提高切割准确度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种字符切割方法,其特征在于,包括:
对目标图像中的字符进行字符定位以确定出字符区域;
对所述字符区域的字符进行分割以得到粘连字符分割块,包括:
确定所述字符区域的二值图像;
将所述字符区域的二值图像在垂直方向进行投影以得到第二垂直投影图;
确定所述第二垂直投影图中投影值为0的投影位置;
以竖直方向上所述投影值为0的投影位置作为切割方向进行切割以得到所述粘连字符分割块;
确定所述粘连字符分割块中字符边界的波峰位置和波峰高度;
根据所述粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点,包括:
若第一字符的波峰高度小于或等于第二字符的波峰高度,则从所述第一字符的波峰位置坐标从左向右开始搜索,以首个由白变黑的像素点作为所述起始分割点,其中,所述第一字符和第二字符为所述字符边界内相邻的字符;
若所述第一字符的波峰高度大于所述第二字符的波峰高度,则从所述第二字符的波峰位置坐标从左向右开始搜索,以第二个由白变黑的像素点作为所述起始分割点;
根据所述起始分割点使用滴水算法对所述粘连字符分割块的字符进行切割。
2.如权利要求1所述的字符切割方法,其特征在于,所述对目标图像中的字符进行字符定位以确定出字符区域,包括:
对所述目标图像中的字符进行边缘检测以获得所述目标图像的边缘区域;
采取垂直投影算法对所述边缘区域进行定位以得到所述字符区域。
3.如权利要求2所述的字符切割方法,其特征在于,所述采取垂直投影算法对所述边缘区域进行定位以得到所述字符区域,包括:
确定出所述边缘区域的第一垂直投影图;
从所述第一垂直投影图的底部开始,用直线穿过所述第一垂直投影图,将所述直线向上移动直到达到所述第一垂直投影图的顶部,以记录所述直线移动过程中与所述第一垂直投影图的交点个数的集合;
从所述记录的交点个数的集合中找到最大的交点个数N;
若所述N大于或等于预设阈值,则将所述直线与所述第一垂直投影图的交点个数为所述N时对应的区域作为所述字符区域。
4.如权利要求1所述的字符切割方法,其特征在于,所述对目标图像中的字符进行字符定位以确定出字符区域之前,所述方法还包括:
获取携带有字符的待处理图像;
对所述待处理图像进行预处理以获得所述目标图像。
5.一种字符切割装置,其特征在于,包括:
第一确定模块,用于对目标图像中的字符进行字符定位以确定出字符区域;
分割模块,用于对所述第一确定模块确定的所述字符区域的字符进行分割以得到粘连字符分割块,包括:
确定所述字符区域的二值图像;
将所述字符区域的二值图像在垂直方向进行投影以得到第二垂直投影图;
确定所述第二垂直投影图中投影值为0的投影位置;
以竖直方向上所述投影值为0的投影位置作为切割方向进行切割以得到所述粘连字符分割块;
第二确定模块,用于确定所述分割模块分割的所述粘连字符分割块中字符边界的波峰位置和波峰高度;
第三确定模块,用于根据所述第二确定模块确定的所述粘连字符分割块中字符边界的波峰位置和波峰高度确定起始分割点,包括:
若第一字符的波峰高度小于或等于第二字符的波峰高度,则从所述第一字符的波峰位置坐标从左向右开始搜索,以首个由白变黑的像素点作为所述起始分割点,其中,所述第一字符和第二字符为所述字符边界内相邻的字符;
若所述第一字符的波峰高度大于所述第二字符的波峰高度,则从所述第二字符的波峰位置坐标从左向右开始搜索,以第二个由白变黑的像素点作为所述起始分割点;
切割模块,用于根据所述第三确定模块确定的所述起始分割点使用滴水算法对所述粘连字符分割块的字符进行切割。
6.如权利要求5所述的字符切割装置,其特征在于,所述第一确定模块具体用于:
对所述目标图像进行边缘检测以获得含有字符的边缘区域;
采取垂直投影算法对所述含有字符的边缘区域进行定位以得到所述字符区域。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述字符切割方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述字符切割方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810939326.9A CN109325492B (zh) | 2018-08-17 | 2018-08-17 | 字符切割方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810939326.9A CN109325492B (zh) | 2018-08-17 | 2018-08-17 | 字符切割方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325492A CN109325492A (zh) | 2019-02-12 |
CN109325492B true CN109325492B (zh) | 2023-12-19 |
Family
ID=65263280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810939326.9A Active CN109325492B (zh) | 2018-08-17 | 2018-08-17 | 字符切割方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325492B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829460A (zh) * | 2019-04-02 | 2019-05-31 | 安徽省安瑞机电科技有限公司 | 一种应用于停车管理系统的车牌字符分割识别方法及其系统 |
CN110634222B (zh) * | 2019-08-27 | 2021-07-09 | 河海大学 | 一种银行票据信息识别方法 |
CN110728687B (zh) * | 2019-10-15 | 2022-08-02 | 卓尔智联(武汉)研究院有限公司 | 文件图像分割方法、装置、计算机设备和存储介质 |
CN111079762B (zh) * | 2019-11-26 | 2022-02-08 | 合肥联宝信息技术有限公司 | 一种粘连字符的切割方法及电子设备 |
CN113495849A (zh) * | 2020-04-08 | 2021-10-12 | 慧荣科技股份有限公司 | 物理层的数据流切割装置及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103310435A (zh) * | 2012-03-21 | 2013-09-18 | 华中科技大学 | 将垂直投影和最优路径相结合对车牌字符进行分割的方法 |
CN103729636A (zh) * | 2013-12-18 | 2014-04-16 | 小米科技有限责任公司 | 字符切割方法、装置及电子设备 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
WO2018028230A1 (zh) * | 2016-08-10 | 2018-02-15 | 东方网力科技股份有限公司 | 一种基于深度学习的车牌字符分割方法、装置及存储介质 |
CN107729899A (zh) * | 2016-08-11 | 2018-02-23 | 杭州海康威视数字技术股份有限公司 | 一种车牌号码识别方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960244B (zh) * | 2018-07-10 | 2023-06-20 | 北京智芯原动科技有限公司 | 一种车牌的字符投影分割方法及装置 |
-
2018
- 2018-08-17 CN CN201810939326.9A patent/CN109325492B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103310435A (zh) * | 2012-03-21 | 2013-09-18 | 华中科技大学 | 将垂直投影和最优路径相结合对车牌字符进行分割的方法 |
CN103729636A (zh) * | 2013-12-18 | 2014-04-16 | 小米科技有限责任公司 | 字符切割方法、装置及电子设备 |
WO2018028230A1 (zh) * | 2016-08-10 | 2018-02-15 | 东方网力科技股份有限公司 | 一种基于深度学习的车牌字符分割方法、装置及存储介质 |
CN107729899A (zh) * | 2016-08-11 | 2018-02-23 | 杭州海康威视数字技术股份有限公司 | 一种车牌号码识别方法及装置 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109325492A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325492B (zh) | 字符切割方法、装置、计算机设备及存储介质 | |
US9292759B2 (en) | Methods and systems for optimized parameter selection in automated license plate recognition | |
US9251614B1 (en) | Background removal for document images | |
US9275030B1 (en) | Horizontal and vertical line detection and removal for document images | |
CN109426814B (zh) | 一种发票图片特定板块的定位、识别方法、系统、设备 | |
CN108108734B (zh) | 一种车牌识别方法及装置 | |
CN108921813B (zh) | 一种基于机器视觉的无人机检测桥梁结构裂缝识别方法 | |
CN110136069B (zh) | 文本图像矫正方法、装置与电子设备 | |
CN108573251B (zh) | 文字区域定位方法和装置 | |
CN105469027A (zh) | 针对文档图像的水平和垂直线检测和移除 | |
CN105069452A (zh) | 基于局部结构分析的直线移除方法 | |
CN104298947A (zh) | 一种对二维条码精确定位的方法及装置 | |
CN111027343A (zh) | 条形码区域定位方法和装置 | |
CN108734161B (zh) | 冠字号区域的识别方法、装置、设备及存储介质 | |
CN111598104A (zh) | 一种车牌字符识别方法及其系统 | |
CN113610772B (zh) | 易拉罐瓶底喷码缺陷检测方法、系统、装置及存储介质 | |
CN111159150A (zh) | 一种数据扩充方法及装置 | |
CN113283439B (zh) | 基于图像识别的智能计数方法、装置及系统 | |
CN109211919B (zh) | 磁瓦崩缺区域的识别方法及装置 | |
JP2000048120A (ja) | 濃淡画像の文字領域抽出方法及びそのプログラムを記録した記録媒体 | |
CN114529570A (zh) | 图像分割方法、图像识别方法、用户凭证补办方法及系统 | |
CN110895849A (zh) | 冠字号切割定位方法、装置、计算机设备及存储介质 | |
CN111508017B (zh) | 一种弱对比度定位标记中心的方法和系统 | |
CN113112432A (zh) | 自动识别图像条带的方法 | |
CN111178111A (zh) | 二维码检测方法、电子设备、存储介质及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |