CN113378847A - 字符分割方法、系统、计算机设备和存储介质 - Google Patents

字符分割方法、系统、计算机设备和存储介质 Download PDF

Info

Publication number
CN113378847A
CN113378847A CN202110716440.7A CN202110716440A CN113378847A CN 113378847 A CN113378847 A CN 113378847A CN 202110716440 A CN202110716440 A CN 202110716440A CN 113378847 A CN113378847 A CN 113378847A
Authority
CN
China
Prior art keywords
character
image
rect
rectangle
segmented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110716440.7A
Other languages
English (en)
Other versions
CN113378847B (zh
Inventor
陈宏燔
黄茜
胡志辉
乔腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110716440.7A priority Critical patent/CN113378847B/zh
Publication of CN113378847A publication Critical patent/CN113378847A/zh
Application granted granted Critical
Publication of CN113378847B publication Critical patent/CN113378847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20028Bilateral filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种字符分割方法、系统、计算机设备和存储介质,所述方法包括:获取待分割图像,并将所述待分割图像转化为灰度图像;对所述灰度图像进行预处理,得到预处理后图像;使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。本发明通过基于垂直投影和连通域相结合,对图像中的文字进行单个分割,得到单个字符,提高了字符分割的效率和准确率。

Description

字符分割方法、系统、计算机设备和存储介质
技术领域
本发明属于计算机视觉和图像处理领域,特别是涉及一种字符分割方法、系统、计算机设备和存储介质。
背景技术
在工业生产领域中,对文字进行缺陷检测是一项十分重要的工作。工业产品的表面印有数量众多的文字标识辅助人们的使用,字符的清晰完整与否直接影响着产品体验好坏。生产过程中任何一个流程出现问题,都可能导致最终产品表面字符出现漏印、过印、印刷不清晰的瑕疵,这些带有缺陷的不合格产品,需要回炉重造。目前,计算机视觉和图像处理相关的技术的应用,可以实现字符的智能缺陷检测代替人工检测流程,极大地提升生产的效率、降低出错的概率。在全自动的字符缺陷检测系统中,具体的检测流程包括以下步骤:(1)相机拍摄需要检测的产品图像;(2)对拍摄的图像进行字符分割,得到单个字符图像;(3)对分割好的单个字符图像进行图像校准;(4)将校准好的单个字符图像与标准字库的图像进行比对,判断对应字符是否存在缺陷。从以上步骤可知,字符分割是非常重要的一步,该步骤的结果直接影响着最终的缺陷检测结果是否准确。因此,对于字符分割算法的研究,有助于提升字符缺陷检测的准确性以及效率,对于实际生产具有重要的意义。
发明内容
为了解决上述现有技术的不足,本发明提供了一种字符分割方法、系统、计算机设备和存储介质,该方法通过基于垂直投影和连通域相结合,对图像中的文字进行单个分割,得到单个字符,提高了字符分割的效率和准确率。
本发明的第一个目的在于提供一种字符分割方法。
本发明的第二个目的在于提供一种字符分割系统。
本发明的第三个目的在于提供一种计算机设备。
本发明的第四个目的在于提供一种存储介质。
本发明的第一个目的可以通过采取如下技术方案达到:
一种字符分割方法,所述方法包括:
获取待分割图像,并将所述待分割图像转化为灰度图像;
对所述灰度图像进行预处理,得到预处理后图像;
使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
进一步的,所述使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像,具体包括:
用长宽像素个数均为第一设定阈值的矩形,对所述预处理后图像I2进行膨胀操作,得到图像
Figure BDA0003135154860000021
找出图像
Figure BDA0003135154860000022
中所有的连通域;
找出每个连通域的最小外接正矩形,得到所有的最小外接正矩形;
遍历所有的最小外接正矩形,对于每一个最小外接正矩形,若最小外接正矩形的长、宽分别均大于第二设定阈值、小于第三设定阈值且矩形的面积大于第四设定阈值,则保留最小外接正矩形,否则,丢弃最小外接正矩形;
对所有保留的最小外接正矩形进行排序,得到排序后最小外接正矩形;
根据所述排序后最小外接正矩形的边界信息,将待分割图像中的字符段分割出来,得到字符段图像。
进一步的,所述通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符,具体包括:
对字符段图像I3,i进行预处理,得到字符段图像
Figure BDA0003135154860000023
对字符段图像
Figure BDA0003135154860000024
进行垂直投影,得到字符投影块;其中,每个字符投影块的起始位置为verj,begin,结束位置为verj,end,j=1,2,3,……,M,M为字符投影块的数目;
对字符段图像
Figure BDA0003135154860000025
进行连通域标记,对于每一个连通域,找到最小外接正矩形;其中,每个最小外接正矩形的左边界位置为rectk,left、右边界位置为rectk,right、上边界位置为rectk,up、下边界位置为rectk,bottom、中心横坐标为
Figure BDA0003135154860000026
纵坐标为
Figure BDA0003135154860000027
k=1,2,3,……,N,其中N为最小外接正矩形的数目;
根据M和N,得到待分割图像的单个字符。
进一步的,所述根据M和N,得到待分割图像的单个字符,具体包括:
若M>N,则返回错误信息,并结束对字符段图像I3,i的分割;否则:
对所有最小外接正矩形进行排序,得到排序后的最小外接正矩形;
若M=N,则根据字符投影块的边界对字符段图像进行切割,得到待分割图像的单个字符,并结束分割;否则:
遍历每一个排序后的最小外接正矩形rectk,若
Figure BDA0003135154860000031
Figure BDA0003135154860000036
则最小外接正矩形rectk包含在字符投影块verj中;
若字符投影块verj包含一个最小外接正矩形,则根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;
若字符投影块verj包含两个最小外接正矩形,则若
Figure BDA0003135154860000033
则对最小外接正矩形进行剪切,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;否则,根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;其中,
Figure BDA0003135154860000034
为字符投影块verj中第一个最小外接正矩形中心坐标的横坐标,
Figure BDA0003135154860000035
为字符投影块verj中第二个最小外接正矩形中心坐标的横坐标;
若字符投影块verj包含四个最小外接正矩形,则根据最小外接正矩形的边界条件对字符投影块verj中的最小外接正矩形进行合并,合并完成后,每个矩形包含一个单个字符,对矩形进行剪切,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;
若字符投影块veri包含其他数目的最小外接正矩形,则根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割。
进一步的,所述根据最小外接正矩形的边界条件对字符投影块verj中的最小外接正矩形进行合并,具体包括:
字符投影块verj中包含的最小外接正矩形为rectm
若rectm,up-rectm-1,bottom<第六设定阈值且rectm-1,right-rectm,left>k1*(rectm,right-rectm,left),则将最小外接正矩形rectm和rectm-1合并;
若rectm,up-rectm-1,bottom<第六设定阈值且rectm,right-rectm+1,left>k1*(rectm,right-rectm,left),则将最小外接正矩形rectm和rectm+1合并;
其中,最小外接正矩形rectm-1和rectm+1分别包含于字符投影块verj中,rectm-1和rectm+1分别是最小外接正矩形rectm的上一个和下一个最小外接正矩形;k1为宽度系数。
进一步的,所述对字符段图像
Figure BDA0003135154860000041
进行垂直投影,得到字符投影块,具体包括:
对字符段图像
Figure BDA0003135154860000042
进行垂直积分投影,得到垂直投影曲线图I4,i
从垂直投影曲线图I4,i左侧的起始列向右遍历整个曲线图;
第一个纵坐标不为零的位置为第一个字符投影块的左边界;继续向右遍历,第一个纵坐标为零的位置为第一个字符投影块的右边界;根据左右边界得到第一个字符投影块;
继续向右遍历,直到垂直投影曲线图I4,i最右端,得到字符段图像
Figure BDA0003135154860000043
中所有的字符投影块;
对于每一个字符投影块verj,若字符投影块verj的宽度大于第七设定阈值,则保留字符投影块verj,否则,丢弃字符投影块verj
保留的字符投影块,即为得到的字符投影块;
所述对字符段图像I3,i进行连通域标记,对于每一个连通域,找到最小外接正矩形,具体包括:
对字符段图像I3,i采用种子填充法进行连通域标记,对于每一个连通域,找到最小的外接正矩形;
对于每一个最小外接正矩形rectk,若最小外接正矩形rectk的面积大于第八设定阈值,则保留最小外接正矩形rectk,否则,丢弃最小外接正矩形rectk
保留的最小外接正矩形,即为找到的最小外接正矩形。
进一步的,所述进行预处理,具体包括:
若进行预处理的图像为I1;则:
使用双边滤波方法对图像I1进行图像滤波,去除图像中的噪声干扰,得到滤波图像
Figure BDA0003135154860000044
使用直方图法对滤波图像
Figure BDA0003135154860000045
进行二值化,得到二值化图像
Figure BDA0003135154860000046
对所述二值化图像
Figure BDA0003135154860000047
进行运算,去除毛刺和孤立点噪声,得到预处理后图像。
本发明的第二个目的可以通过采取如下技术方案达到:
一种字符分割系统,所述系统包括:
图像获取模块,用于获取待分割图像,并将所述待分割图像转化为灰度图像;
图像预处理模块,用于对所述灰度图像进行预处理,得到预处理后图像;
字符段分割模块,用于使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
字符分割模块,用于通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
本发明的第三个目的可以通过采取如下技术方案达到:
一种计算机设备,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现上述的字符分割方法。
本发明的第四个目的可以通过采取如下技术方案达到:
一种存储介质,存储有程序,所述程序被处理器执行时,实现上述的字符分割方法。
本发明相对于现有技术具有如下的有益效果:
1、本发明提出的方法通用性较强,能够实现对图像中的中文字符、英文字符和数学符号多种类型字符的分割,并且适用于字符数量众多的复杂场景。
2、本发明提出的方法,能够实现对字符的精准分割,准确率高。
3、本发明提出的方法鲁棒性强,图像中光照、背景污渍、字符的颜色都不会影响字符分割的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例1的字符分割方法的应用环境图。
图2为本发明实施例1的字符分割方法的流程图。
图3为本发明实施例1的字符段分割的流程图。
图4为本发明实施例1的单个字符分割的流程图。
图5本发明实施例2的计算器面板的灰度图像。
图6为本发明实施例2中预处理后的计算器面板图像。
图7为本发明实施例2的字符段分割的结果示意图。
图8为本发明实施例2的字符段垂直投影的结果示意图。
图9为本发明实施例2的单个字符分割的结果示意图。
图10为本发明实施例3的字符分割系统的结构框图。
图11为本发明实施例4的计算机设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本申请提供的字符分割方法,可以应用于如图1所示的应用环境中。将获取的待分割图像输入计算机设备102,计算机设备102对待分割图像进行预处理,得到预处理后图像;然后计算机设备102使用基于连通域的字符段分割方法对预处理后图像进行字符段分割,得到字符段图像;最后计算机设备102对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。其中,计算机设备102可以是终端,也可以是服务器。终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,本实施例提供了一种字符分割方法,该方法包括:
S201、获取待分割图像,并将所述待分割图像转化为灰度图像。
进一步的,步骤S201具体包括:
(1)获取待分割图像。
在一个实施例中,待分割图像是照相机拍摄的图像,或者待分割图像是从摄像机拍摄的一段视频中抽取的一帧图像,或者待分割图像是RGB格式的彩色图像,图像中的每个像素用R、G、B三个分量来表示,也可以是通过其他方式获得的文本图像。
(2)将待分割图像转化为灰度图像I1,排除字符颜色对分割精准度的影响。
S202、对灰度图像进行预处理,得到预处理后图像。
灰度图像为I1,得到预处理图像为I2
进一步的,步骤S202具体包括:
(1)使用双边滤波方法对图像I1进行图像滤波,去除图像中的噪声干扰,得到滤波图像
Figure BDA0003135154860000071
(2)使用直方图法对滤波图像
Figure BDA0003135154860000072
进行二值化得到二值化图像
Figure BDA0003135154860000073
具体包括:
(2-1)画出滤波图像
Figure BDA0003135154860000074
的灰度直方图Ihist,Ihist共有255个灰度级;
(2-2)从左至右遍历Ihist,如果Ihist,i<th1且Ihist,i-Ihist,i+1<(Ihist,i-1-Ihist,i)/3,则i就是对图像进行二值化的目标阈值T。其中i表示图像的灰度级,0≤i≤255,Ihist,i为灰度直方图Ihist在灰度级i的像素点个数,Ihist,i+1为灰度直方图Ihist在灰度级i+1的像素点个数,Ihist,i-1为灰度直方图Ihist在灰度级i-1的像素点个数,th1的大小为150000,单位为像素;
(2-3)从左至右,从上至下遍历图像
Figure BDA0003135154860000075
的每一个像素点,如果像素点的灰度级小于目标阈值T,则置为0,如果像素点的灰度级大于目标阈值T,则置为255。遍历完成即可得到二值化图像
Figure BDA0003135154860000076
使用直方图法对滤波图像
Figure BDA0003135154860000077
进行二值化,光照会使直方图中的波峰左右平移,但依然可以找到目标阈值T,二值化结果不变,排除光照对分割精准度的影响。
(3)对二值化图像
Figure BDA0003135154860000078
进行开运算,去除毛刺和孤立点噪声,最终得到预处理后图像I2
对图像I1进行图像滤波,且对二值图像
Figure BDA0003135154860000079
进行开运算,排除了背景污渍对分割精准度的影响
S203、使用基于连通域的字符段分割方法对预处理后图像进行字符段分割,得到字符段图像。
得到的字符段图像为I3,i,i=1,2…Z,Z为字符段图像个数。
进一步的,如图3所示,步骤S203具体包括:
(1)用长宽像素个数均为第一设定阈值的的矩形结构对预处理后图像I2进行膨胀操作,得到图像
Figure BDA0003135154860000081
在一个实施例中,第一设定阈值设为单个字符高度的1/3至1/2。
(2)找出图像
Figure BDA0003135154860000082
所有的连通域。
(3)找出每个连通域的最小外接正矩形,得到所有的最小外接正矩形。
(4)遍历所有的最小外接正矩形,对于每一个最小外接正矩形,如果该最小外接正矩形的长和宽均大于第二设定阈值、第三设定阈值且矩形的面积大于第四设定阈值,则保留该最小外接正矩形,否则丢弃最小外接正矩形。
第二设定阈值、第三设定阈值和第四设定阈值的大小,根据实际应用情况设置为固定值。
在一个实施例中,第二设定阈值的大小设为6,第三设定阈值的大小设为1000,单位均为像素;第四设定阈值的大小设为80,单位为像素的平方。
(5)对所有保留的最小外接正矩形进行排序,得到排序后最小外接正矩形。
对于两个最小外接正矩形,优先将中心坐标的纵坐标小的矩形排在前面,如果两个矩形的中心坐标的纵坐标相等,则再比较两个矩形的中心坐标的横坐标,将中心坐标的横坐标小的矩形排在前面;
(6)根据排序后最小外接正矩形的边界信息,将待分割图像I1中的字符段分割出来,得到字符段图像I3,i,i=1,2…Z,Z为字符段图像个数。
S204、通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
进一步的,如图4所示,步骤S204具体包括:
(1)对每一张字符段图像I3,i进行预处理。
每一张字符段图像为I3,i,i=1,2…Z,Z为字符图像个数。
使用OTSU法对图像进行二值化,得到二值化图像
Figure BDA0003135154860000083
对二值图像
Figure BDA0003135154860000084
进行开运算,去除毛刺和孤立点噪声;
(2)对于一张二值化的字符段图像
Figure BDA0003135154860000085
进行垂直投影,得到字符投影块。
首先做垂直积分投影,得到垂直投影曲线图I4,i。然后从左侧的起始列向右遍历整个曲线图I4,i,第一个纵坐标不为零的位置即为第一个字符投影块的左边界,继续向右遍历,下一个纵坐标为零的位置为第一个字符投影块的右边界,根据左右边界可以得到第一个字符投影块。按照此方法继续向右遍历,直到图像最右端,可以得到一定数量的字符投影块。
因为图像中可能存在斑点噪声,需要剔除宽度小于一定阈值的字符投影块。对于每一个字符投影块verj,如果verj的宽度大于第七设定阈值,则保留该字符投影块,否则丢弃。
第七设定阈值的大小,根据实际应用情况设置为固定值。
在一个实施例中,第七设定阈值的大小为4,单位为像素。
分别记录各个投影块的起始位置verj,begin和结束位置verj,end,j=1,2,3,……,M,其中,M为字符投影块的数目。
(3)对同一张字符段图像
Figure BDA0003135154860000091
采用种子填充法进行连通域标记,对于每一个连通域,找到包含该区域的最小外接正矩形。
因为找到的连通域可能不是字符,对于每一个最小外接正矩形rectk,如果rectk的面积大于第八设定阈值,则保留该矩形,否则丢弃。
第八设定阈值的大小,根据实际应用情况设置为固定值。
在一个实施例中,第八设定阈值的大小设为16,单位为像素的平方。
然后分别记录每个连通域最小外接正矩形的左边界位置rectk,left、右边界位置rectk,right、上边界位置rectk,up、下边界位置rectk,bottom和矩形中心横坐标
Figure BDA0003135154860000092
纵坐标
Figure BDA0003135154860000093
k=1,2,3,……,N,其中,N为所有最小外接正矩形的个数。
(4)如果字符投影块数目大于最小外接正矩形数目,即M>N,则停止分割并返回错误信息,因为实际分割中不存在这种情况,否则,继续执行后面的步骤(5)。
(5)对所有最小外接正矩形进行排序。对于两个最小外接正矩形,优先将中心坐标的横坐标小的矩形排在前面,如果两个矩形的中心坐标的横坐标相等,则再比较两个矩形的中心坐标的纵坐标,将中心坐标的纵坐标小的矩形排在前面。
(6)如果字符投影块数目和最小外接正矩形相等,即M=N,则说明该字符段图像在垂直投影块中不存在不充分分割和过分分割的情况,即每个字符投影块内都是一个完整的单个字符,根据字符投影块的边界对字符段图像进行切割,得到准确分割的单个字符。
(7)如果字符投影块数目小于最小外接正矩形数目,即M<N,说明单个字符投影块中可能包含多个最小外接正矩形。
(7-1)首先找到每一个字符投影块verj中所包含的最小外接正矩形。遍历每一个最小外接正矩形rectk,只要满足
Figure BDA0003135154860000101
Figure BDA0003135154860000102
就说明最小外接正矩形rectk在字符投影块verj中。verj包含的最小外接正矩形用rects_in_verj表示。
(7-2)如果字符投影块verj只包含一个最小外接正矩形,则说明该投影块中只有一个单个字符,直接根据字符投影块的边界将字符分割出来。
(7-3)如果字符投影块verj包含两个最小外接正矩形,则需要判断两个最小外接正矩形包含的字符是否为重叠字符。若
Figure BDA0003135154860000103
则通过对矩形的剪切将重叠字符分开,否则根据字符投影块的边界将字符分割出来。其中
Figure BDA0003135154860000104
为字符投影块中第一个最小外接正矩形中心坐标的横坐标,
Figure BDA0003135154860000105
为字符投影块中第二个最小外接正矩形中心坐标的横坐标。
在一个实施例中,第五设定阈值的大小为10,单位为像素。
(7-4)如果字符投影块verj中包含四个最小外接正矩形,符合这种条件的字符投影块有4个,其中两个字符投影块包含两个数学字符,另外两个字符投影块分别包含单个中文字符。接下来根据最小外接正矩形的边界条件对字符投影块verj中的最小外接正矩形进行合并、拆分。遍历字符投影块包含的每一个最小外接正矩形rectm
最小外接正矩形rectm-1和rectm+1分别是rectm的上一个和下一个矩形,均包含于字符投影块verj中;
(7-4-1)如果rectm,up<rectm-1,bottom+第六设定阈值且rectm-1,right-rectm,left>k1*(rectm,right-rectm,left),则最小外接正矩形rectm和rectm-1合并。其中第六设定阈值和k1均为人工设定的参数,第六设定阈值为像素阈值,k1为宽度系数。
在一个实施例中,第六设定阈值的大小为10,单位为像素;k1的大小为0.4。
(7-4-2)如果rectm,up<rectm-1,bottom+第六设定阈值且rectm,right-rectm+1,left>k1*(rectm,right-rectm,left),则最小外接正矩形rectm和rectm+1合并。
(7-4-3)合并完成后,每一个矩形所包含的就是一个单个字符,通过对矩形的剪切完成对单个字符的分割。
(7-5)如果字符投影块veri只包含其他数目的最小外接正矩形,直接根据字符投影块的边界将字符分割出来。
本领域技术人员可以理解,实现上述实施例的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,相应的程序可以存储于计算机可读存储介质中。
应当注意,尽管在附图中以特定顺序描述了上述实施例的方法操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
实施例2:
本实施例提供了一种计算器面板的字符分割方法。
(1)待分割图像为计算器面板图像,并将所计算器面板图像转化为灰度图像I1,如图5所示。
(2)对计算器面板图像I1进行预处理得到图像I2,如图6所示。
(3)根据矩形的边界信息将图像I1中的字符段分割出来,结果如图7所示。
在一个实施例中,第一设定阈值设为单个字符高度的1/3至1/2之间。
在一个实施例中,第一设定阈值取为20个像素。
(4)对每一个字符段图像进行单个字符分割,完成字符分割。
进一步的,步骤(4)具体包括:
(4-1)对每一张字符段图像I3,i进行图像预处理。
(4-2)对一张二值化的字符段图像
Figure BDA0003135154860000111
首先做垂直积分投影,得到垂直投影曲线图I4,i,如图8所示;然后统计字符投影块的数目。
(4-3)对同一张字符段图像I3,i,进行连通域标记;根据连通域,统计最小外接正矩形的数目。
(4-4)如果字符投影块数目大于最小外接正矩形的数目,则停止分割并返回错误信息,因为实际分割中不存在这种情况;否则,进行步骤(4-5)。
(4-5)对所有最小外接正矩形进行排序。
(4-6)将“sin-1”、“cos-1”、“tan-1”中的“-1”进行合并。如果最小外接正矩形数目大于1,即N>1,首先得到该字符段中最后两个最小外接正矩形的中心纵坐标
Figure BDA0003135154860000121
Figure BDA0003135154860000122
如果两个最小外接正矩形都位于字符段的上半部分,即
Figure BDA0003135154860000123
Figure BDA0003135154860000124
说明这两个字符分别是“-”和“1”,对两个字符进行合并。hi为字符段图像I3,i的高度。合并后,更新字符投影块数目M=M-1和矩形数目N=N-1。
(4-7)如果字符投影块数目和最小外接正矩形数目相等,根据字符投影块的边界对字符段图像进行切割,得到准确分割的单个字符,并停止分割。
(4-8)如果字符投影块数目小于最小外接正矩形数目,说明单个字符投影块中可能包含多个最小外接正矩形;根据单个字符投影块中包含的最小外接正矩形的数目,得到分割的单个字符,并停止分割。
最终得到的结果,如图9所示。
实施例3:
如图10所示,本实施例提供了一种字符分割系统,该系统包括图像获取模块1001、图像预处理模块1002、字符段分割模块1003和字符分割模块1004,其中:
图像获取模块1001,用于获取待分割图像,并将所述待分割图像转化为灰度图像;
图像预处理模块1002,用于对所述灰度图像进行预处理,得到预处理后图像;
字符段分割模块1003,用于使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
字符分割模块1004,用于通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
本实施例中各个模块的具体实现可以参见上述实施例1,在此不再一一赘述;需要说明的是,本实施例提供的系统仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
实施例4:
本实施例提供了一种计算机设备,该计算机设备可以为计算机,如图10所示,其通过系统总线1101连接的处理器1102、存储器、输入系统1103、显示器1104和网络接口1105,该处理器用于提供计算和控制能力,该存储器包括非易失性存储介质1106和内存储器1107,该非易失性存储介质1106存储有操作系统、计算机程序和数据库,该内存储器1107为非易失性存储介质中的操作系统和计算机程序的运行提供环境,处理器1102执行存储器存储的计算机程序时,实现上述实施例1的字符分割方法,如下:
获取待分割图像,并将所述待分割图像转化为灰度图像;
对所述灰度图像进行预处理,得到预处理后图像;
使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
实施例5:
本实施例提供了一种存储介质,该存储介质为计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述实施例1的字符分割方法,如下:
获取待分割图像,并将所述待分割图像转化为灰度图像;
对所述灰度图像进行预处理,得到预处理后图像;
使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
需要说明的是,本实施例的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
综上所述,本发明对待分割图像进行预处理,得到预处理后图像;使用基于连通域的字符段分割方法对预处理后图像进行字符段分割,得到字符段图像;然后通过垂直投影和连通域相结合,对图像中的文字进行单个分割,得到单个字符。本发明提供的方法极大地提高了字符分割的效率和准确率。
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (10)

1.一种字符分割方法,其特征在于,所述方法包括:
获取待分割图像,并将所述待分割图像转化为灰度图像;
对所述灰度图像进行预处理,得到预处理后图像;
使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
2.根据权利要求1所述的字符分割方法,其特征在于,所述使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像,具体包括:
用长宽像素个数均为第一设定阈值的矩形,对所述预处理后图像I2进行膨胀操作,得到图像
Figure FDA0003135154850000014
找出图像
Figure FDA0003135154850000015
中所有的连通域;
找出每个连通域的最小外接正矩形,得到所有的最小外接正矩形;
遍历所有的最小外接正矩形,对于每一个最小外接正矩形,若最小外接正矩形的长、宽分别均大于第二设定阈值、小于第三设定阈值且矩形的面积大于第四设定阈值,则保留最小外接正矩形,否则,丢弃最小外接正矩形;
对所有保留的最小外接正矩形进行排序,得到排序后最小外接正矩形;
根据所述排序后最小外接正矩形的边界信息,将待分割图像中的字符段分割出来,得到字符段图像。
3.根据权利要求1所述的字符分割方法,其特征在于,所述通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符,具体包括:
对字符段图像I3,i进行预处理,得到字符段图像
Figure FDA0003135154850000011
对字符段图像
Figure FDA0003135154850000012
进行垂直投影,得到字符投影块;其中,每个字符投影块的起始位置为verj,begin,结束位置为verj,end,j=1,2,3,......,M,M为字符投影块的数目;
对字符段图像
Figure FDA0003135154850000013
进行连通域标记,对于每一个连通域,找到最小外接正矩形;其中,每个最小外接正矩形的左边界位置为rectk,left、右边界位置为rectk,right、上边界位置为rectk,up、下边界位置为rectk,bottom、中心横坐标为
Figure FDA0003135154850000021
纵坐标为
Figure FDA0003135154850000022
k=1,2,3,......,N,其中N为最小外接正矩形的数目;
根据M和N,得到待分割图像的单个字符。
4.根据权利要求3所述的字符分割方法,其特征在于,所述根据M和N,得到待分割图像的单个字符,具体包括:
若M>N,则返回错误信息,并结束对字符段图像I3,i的分割;否则:
对所有最小外接正矩形进行排序,得到排序后的最小外接正矩形;
若M=N,则根据字符投影块的边界对字符段图像进行切割,得到待分割图像的单个字符,并结束分割;否则:
遍历每一个排序后的最小外接正矩形rectk,若
Figure FDA0003135154850000023
Figure FDA0003135154850000025
则最小外接正矩形rectk包含在字符投影块verj中;
若字符投影块verj包含一个最小外接正矩形,则根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;
若字符投影块verj包含两个最小外接正矩形,则若
Figure FDA0003135154850000029
第五设定阈值,则对最小外接正矩形进行剪切,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;否则,根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;其中,
Figure FDA0003135154850000027
为字符投影块verj中第一个最小外接正矩形中心坐标的横坐标,
Figure FDA0003135154850000028
为字符投影块verj中第二个最小外接正矩形中心坐标的横坐标;
若字符投影块verj包含四个最小外接正矩形,则根据最小外接正矩形的边界条件对字符投影块veri中的最小外接正矩形进行合并,合并完成后,每个矩形包含一个单个字符,对矩形进行剪切,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割;
若字符投影块veri包含其他数目的最小外接正矩形,则根据字符投影块的边界将字符分割出来,得到待分割图像的单个字符,并结束对字符段图像I3,i的分割。
5.根据权利要求4所述的字符分割方法,其特征在于,所述根据最小外接正矩形的边界条件对字符投影块verj中的最小外接正矩形进行合并,具体包括:
字符投影块verj中包含的最小外接正矩形为rectm
若rectm,up-rectm-1,bottom<第六设定阈值且rectm-1,right-rectm,left>k1*(rectm,right-rectm,left),则将最小外接正矩形rectm和rectm-1合并;
若rectm,up-rectm-1,bottom<第六设定阈值且rectm,right-rectm+1,left>k1*(rectm,right-rectm,left),则将最小外接正矩形rectm和rectm+1合并;
其中,最小外接正矩形rectm-1和rectm+1分别包含于字符投影块verj中,rectm-1和rectm+1分别是最小外接正矩形rectm的上一个和下一个最小外接正矩形;k1为宽度系数。
6.根据权利要求3所述的字符分割方法,其特征在于,所述对字符段图像
Figure FDA0003135154850000031
进行垂直投影,得到字符投影块,具体包括:
对字符段图像
Figure FDA0003135154850000032
进行垂直积分投影,得到垂直投影曲线图I4,i
从垂直投影曲线图I4,i左侧的起始列向右遍历整个曲线图;
第一个纵坐标不为零的位置为第一个字符投影块的左边界;继续向右遍历,第一个纵坐标为零的位置为第一个字符投影块的右边界;根据左右边界得到第一个字符投影块;
继续向右遍历,直到垂直投影曲线图I4,i最右端,得到字符段图像
Figure FDA0003135154850000033
中所有的字符投影块;
对于每一个字符投影块verj,若字符投影块verj的宽度大于第七设定阈值,则保留字符投影块verj,否则,丢弃字符投影块verj
保留的字符投影块,即为得到的字符投影块;
所述对字符段图像I3,i进行连通域标记,对于每一个连通域,找到最小外接正矩形,具体包括:
对字符段图像I3,i采用种子填充法进行连通域标记,对于每一个连通域,找到最小的外接正矩形;
对于每一个最小外接正矩形rectk,若最小外接正矩形rectk的面积大于第八设定阈值,则保留最小外接正矩形rectk,否则,丢弃最小外接正矩形rectk
保留的最小外接正矩形,即为找到的最小外接正矩形。
7.根据权利要求1-6任一项所述的字符分割方法,其特征在于,所述进行预处理,具体包括:
若进行预处理的图像为I1;则:
使用双边滤波方法对图像I1进行图像滤波,去除图像中的噪声干扰,得到滤波图像
Figure FDA0003135154850000041
使用直方图法对滤波图像
Figure FDA0003135154850000042
进行二值化,得到二值化图像
Figure FDA0003135154850000043
对所述二值化图像
Figure FDA0003135154850000044
进行运算,去除毛刺和孤立点噪声,得到预处理后图像。
8.一种字符分割系统,其特征在于,所述系统包括:
图像获取模块,用于获取待分割图像,并将所述待分割图像转化为灰度图像;
图像预处理模块,用于对所述灰度图像进行预处理,得到预处理后图像;
字符段分割模块,用于使用基于连通域的字符段分割方法对所述预处理后图像进行字符段分割,得到字符段图像;
字符分割模块,用于通过垂直投影和连通域相结合,对每个字符段图像进行单个字符分割,得到待分割图像的单个字符。
9.一种计算机设备,包括处理器以及用于存储处理器可执行程序的存储器,其特征在于,所述处理器执行存储器存储的程序时,实现权利要求1-7任一项所述的字符分割方法。
10.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1-7任一项所述的字符分割方法。
CN202110716440.7A 2021-06-28 2021-06-28 字符分割方法、系统、计算机设备和存储介质 Active CN113378847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110716440.7A CN113378847B (zh) 2021-06-28 2021-06-28 字符分割方法、系统、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110716440.7A CN113378847B (zh) 2021-06-28 2021-06-28 字符分割方法、系统、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN113378847A true CN113378847A (zh) 2021-09-10
CN113378847B CN113378847B (zh) 2022-10-25

Family

ID=77579385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110716440.7A Active CN113378847B (zh) 2021-06-28 2021-06-28 字符分割方法、系统、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113378847B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862016A (zh) * 2023-02-16 2023-03-28 金现代信息产业股份有限公司 一种小尺寸光学字符识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN110516592A (zh) * 2019-08-26 2019-11-29 广东世纪晟科技有限公司 一种基于手写数字字符的识别方法
CN111598104A (zh) * 2020-06-30 2020-08-28 成都鹏业软件股份有限公司 一种车牌字符识别方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062141A (en) * 1988-06-02 1991-10-29 Ricoh Company, Ltd. Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN110516592A (zh) * 2019-08-26 2019-11-29 广东世纪晟科技有限公司 一种基于手写数字字符的识别方法
CN111598104A (zh) * 2020-06-30 2020-08-28 成都鹏业软件股份有限公司 一种车牌字符识别方法及其系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WU CHENGDONG 等: "License plate character segmentation based on differencing projection and preferably segmented character", 《JOURNAL OF NORTHEASTERN UNIVERSITY (NATURAL SCIENCE)》 *
WU CHENGDONG 等: "License plate character segmentation based on differencing projection and preferably segmented character", 《JOURNAL OF NORTHEASTERN UNIVERSITY (NATURAL SCIENCE)》, vol. 29, no. 7, 31 July 2008 (2008-07-31), pages 920 - 3 *
路敬祎 等: "基于改进的连通域算法与垂直投影相结合的车牌字符分割", 《自动化技术与应用》, vol. 34, no. 12, 31 December 2015 (2015-12-31), pages 93 - 97 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862016A (zh) * 2023-02-16 2023-03-28 金现代信息产业股份有限公司 一种小尺寸光学字符识别方法及系统

Also Published As

Publication number Publication date
CN113378847B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN110276754B (zh) 一种表面缺陷检测方法、终端设备及存储介质
CN106960208B (zh) 一种仪表液晶数字自动切分和识别的方法及系统
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN111179243A (zh) 一种基于计算机视觉的小尺寸芯片裂纹检测方法及系统
CN110781885A (zh) 基于图像处理的文本检测方法、装置、介质及电子设备
CN107045634B (zh) 一种基于最大稳定极值区域与笔画宽度的文本定位方法
CN111612781A (zh) 一种屏幕缺陷检测方法、装置及头戴显示设备
CN111027546B (zh) 一种字符分割方法、装置以及计算机可读存储介质
CN109948521B (zh) 图像纠偏方法和装置、设备及存储介质
CN110660072B (zh) 一种直线边缘的识别方法、装置、存储介质及电子设备
CN112734729B (zh) 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN110570442A (zh) 一种复杂背景下轮廓检测方法、终端设备及存储介质
CN113160161A (zh) 目标边缘处缺陷的检测方法和装置
CN113609984A (zh) 一种指针式仪表读数识别方法、装置及电子设备
CN114723677A (zh) 图像缺陷检测方法、检测装置、检测设备及存储介质
CN113033558A (zh) 一种用于自然场景的文本检测方法及装置、存储介质
CN113808131A (zh) 一种连接器缺陷识别方法及系统及装置及介质
CN112419207A (zh) 一种图像矫正方法及装置、系统
CN116468680A (zh) 一种元器件反极缺陷检测方法、系统、设备及存储介质
CN115471476A (zh) 一种部件缺陷检测方法、装置、设备及介质
CN113378847B (zh) 字符分割方法、系统、计算机设备和存储介质
CN113705564B (zh) 一种指针式仪表识别读数方法
Gui et al. A fast caption detection method for low quality video images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant