CN105335745B - 图像中数字的识别方法、装置及设备 - Google Patents

图像中数字的识别方法、装置及设备 Download PDF

Info

Publication number
CN105335745B
CN105335745B CN201510849103.XA CN201510849103A CN105335745B CN 105335745 B CN105335745 B CN 105335745B CN 201510849103 A CN201510849103 A CN 201510849103A CN 105335745 B CN105335745 B CN 105335745B
Authority
CN
China
Prior art keywords
image
pixel
column
numeric area
area image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510849103.XA
Other languages
English (en)
Other versions
CN105335745A (zh
Inventor
杨松
王百超
汪平仄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510849103.XA priority Critical patent/CN105335745B/zh
Publication of CN105335745A publication Critical patent/CN105335745A/zh
Application granted granted Critical
Publication of CN105335745B publication Critical patent/CN105335745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于一种图像中数字的识别方法、装置及设备,其方法包括:从所述图像中获取包含数字字符的待处理图像;对所述待处理图像进行二值化处理,得到二值化图像;从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;确定所述数字区域图像中各数字字符所占图像宽度;根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。本公开可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。

Description

图像中数字的识别方法、装置及设备
技术领域
本公开涉及通信领域,尤其涉及图像中数字的识别方法、装置及设备。
背景技术
随着科学技术的快速发展,图像识别的应用也越来越广泛,而且深度卷积神经网络的进一步发展和广泛应用,使得图像识别的准确率有了非常大的提升。
相关技术中,对图像中的数字进行识别时,可以通过以下步骤进行:步骤A:视频图像文字区域粗定位:通过计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;步骤B:视频图像文字区域定位验证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否有文字,剔除未检测文字的候选文字区域。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像中数字的识别方法、装置及设备。
根据本公开实施例的第一方面,提供一种图像中数字的识别方法,包括:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。
结合第一方面,在第一方面的第一种可能的实现方式中,所述二值化图像为N行Q列像素的图像;所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,包括:
从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p行列的像素;其中,p为小于或等于Q的整数;
从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
通过去除数字字符所在像素区域周围的像素区域,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
结合第一方面,在第一方面的第二种可能的实现方式中,所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括:
根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置,包括:
根据公式计算所述前景像素的重心的横坐标;
根据公式计算所述前景像素的重心的纵坐标;
其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
相应的,根据所述重心位置,对所述数字区域图像进行裁剪,包括:
以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
利用前景像素的重心位置对数字区域图像的边界进行优化,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
通过获取小数点所占的图像宽度,从而获知各个数字字符所占的图像宽度,使得确定数字区域图像中各数字字符所占图像宽度的方式较简单,从而提高了对数字字符识别的效率。
结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式,在第一方面的第五种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的宽度;
确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的图像宽度,可以提高每个数字字符图像宽度确定的准确度。
根据本公开实施例的第二方面,提供一种图像中数字的识别装置,包括:
获取模块,被配置为从所述图像中获取包含数字字符的待处理图像;
处理模块,被配置为对所述待处理图像进行二值化处理,得到二值化图像;
去除模块,被配置为从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定模块,被配置为确定所述数字区域图像中各数字字符所占图像宽度;
分割模块,被配置为根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
结合第二方面,在第二方面的第一种可能的实现方式中,所述二值化图像为N行Q列像素的图像;所述去除模块包括:
第一扫描子模块,被配置为从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
第二扫描子模块,被配置为从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
第三扫描子模块,被配置为从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p行列的像素;其中,p为小于或等于Q的整数;
第四扫描子模块,被配置为从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
结合第二方面,在第二方面的第二种可能的实现方式中,所述装置还包括:
计算模块,被配置为根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
裁剪模块,被配置为根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述计算模块包括:
第一计算子模块,被配置为根据公式计算所述前景像素的重心的横坐标;
第二计算子模块,被配置为根据公式计算所述前景像素的重心的纵坐标;
其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
所述裁剪模块包括:
裁剪子模块,被配置为以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
结合第二方面、第二方面的第一种或第二方面的第三种任一种可能的实现方式,在第二方面的第四种可能的实现方式中,所述确定模块包括:
第五扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第一统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
第一确定子模块,被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第三计算子模块,被配置为计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
结合第二方面、第二方面的第一种或第二方面的第三种任一种可能的实现方式,在第二方面的第五种可能的实现方式中,所述确定模块包括:
第六扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第二统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
第二确定子模块,被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第四计算子模块,被配置为计算所述k列像素所占的图像宽度;
第三确定子模块,被配置为确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
第四确定子模块,被配置为根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
根据本公开实施例的第三方面,提供一种图像中数字的识别装置,包括:
存储器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
本公开的实施例提供的技术方案可以包括以下有益效果:
本实施例的图像中数字的识别方法、装置及设备,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种图像中数字的识别方法的流程图;
图2A为待处理图像的示意图;
图2B为二值化图像的示意图;
图3为对二值化图像进行处理后获得的数字区域图像的示意图;
图4是根据另一示例性实施例示出的一种图像中数字的识别方法的流程图;
图5为数字区域图像的示意图;
图6是根据再一示例性实施例示出的一种图像中数字的识别方法的流程图
图7A为前景像素的重心位置的示意图;
图7B为对数字区域图像进行裁剪之后的示意图;
图8是根据又一示例性实施例示出的一种图像中数字的识别方法的流程图;
图9是根据又一示例性实施例示出的一种图像中数字的识别方法的流程图;
图10是根据一示例性实施例示出的一种图像中数字的识别装置的框图;
图11是根据另一示例性实施例示出的一种图像中数字的识别装置的框图;
图12是根据又一示例性实施例示出的一种图像中数字的识别装置的框图;
图13是根据再一示例性实施例示出的一种图像中数字的识别装置的框图;
图14是根据再一示例性实施例示出的一种图像中数字的识别装置的框图;
图15是根据再一示例性实施例示出的一种图像中数字的识别装置的框图;
图16是根据再一示例性实施例示出的一种图像中数字的识别装置的框图;
图17是根据一示例性实施例示出的一种用于图像中数字的识别的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像中数字的识别方法的流程图,如图1所示,本实施例涉及的图像中数字的识别方法用于服务器中,也可以用于具有图像识别功能的其他设备。该图像中数字的识别方法包括以下步骤。
在步骤S11中,从所述图像中获取包含数字字符的待处理图像。
在本公开实施例中,可以采用相关技术中的方式从图像中获取包含数字字符的待处理图像,例如可以通过计算图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域,以对图像中的数字字符区域进行定位,从而获得包含数字字符的待处理图像。当然,也可以采用其他的方式获取包含数字字符的待处理图像,对于具体的获取方式,本实施例在此不作限制。
在步骤S12中,对所述待处理图像进行二值化处理,得到二值化图像。
在本公开实施例中,在获取到包含数字字符的待处理图像之后,采用局部自适应二值化方法对该待处理图像进行二值化处理,在具体的实现过程中,可以将待处理图像中的前景像素和背景像素分别设置为不同的数值,举例来说,图2A为待处理图像的示意图,图2B为二值化图像的示意图,如图2A-图2B所示,将待处理图像中的前景像素设置为255,将背景像素设置为0之后,会将前景图像中的数字字符与背景像素进行区分。另外,也可以将前景像素和背景像素设置为其他值,前景像素和背景像素的具体值,可以根据实际情况或者经验选取,对于具体值的选取,本实施例在此不作限制。
在步骤S13中,从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像。
图3为对二值化图像进行处理后获得的数字区域图像的示意图,如图3所示,在通过二值化处理获得二值化图像之后,需要从二值化图像中去除数字字符所在像素区域周围的像素区域,以将二值化图像的周边区域中,不包含数字字符的像素区域裁剪掉,获得完全包含数字字符的数字区域图像。
在步骤S14中,确定所述数字区域图像中各数字字符所占图像宽度。
在步骤S15中,根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
在本公开实施例中,在获得数字区域图像后,通过扫描数字区域图像中的像素,可确定出数字区域图像中各数字字符所占图像宽度。由于图像中各数字字符都是等间距的,也即每个数字字符所占图像宽度是相等的,在确定出单个数字字符所占图像宽度之后,根据整个数字区域图像的宽度,即可对该数字区域图像进行分割,获得单个数字字符的图像。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。
图4是根据另一示例性实施例示出的一种图像中数字的识别方法的流程图,本实施例涉及的图像中数字的识别方法用于服务器中,本实施例在图1所示实施例的基础上,对步骤S13中如何获得数字区域图像的实施例,作详细说明,如图4所示,该图像中数字的识别方法包括以下步骤。
在步骤S41中,从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数。
在本公开实施例中,在获得二值化图像之后,从二值化图像的第1行开始进行正序逐行像素扫描,并统计所扫描行中像素值为前景像素值的个数,例如:若将背景像素值设置为0,将前景像素值设置为255,则需要统计所扫描行中像素值为255的像素个数。统计出所扫描行中像素值为前景像素值的个数之后,需要判断该个数与预设阈值之间的关系,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值时,说明前景像素在第n+1行开始出现,此时,将停止扫描并从二值化图像中去除第1行~第n行的像素,即将前景像素的个数小于预设阈值的行滤除。
在步骤S42中,从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数。
在本公开实施例中,在滤除第1行~第n行的像素之后,再从二值化图像的第N行开始进行倒序逐行像素扫描,并依然统计所扫描行中像素值为前景像素值的个数,例如:若将背景像素值设置为0,将前景像素值设置为255,则需要统计所扫描行中像素值为255的像素个数。统计出所扫描行中像素值为前景像素值的个数之后,需要判断该个数与预设阈值之间的关系,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值时,说明前景像素在第m+1行之后开始消失,此时,将停止扫描并从二值化图像中去除第m+1行~第N行的像素,即将前景像素的个数小于预设阈值的行滤除。
在步骤S43中,从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p行列的像素;其中,p为小于或等于Q的整数。
在步骤S44中,从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
步骤S43-步骤S44与步骤S41-步骤S42的不同之处在于,步骤S43-步骤S44是对二值化图像进行列扫描,其扫描方法与对列像素进行去除的判断方式与步骤S41-步骤S42中相似,此处不再赘述。
举例来说,图5为数字区域图像的示意图,如图2B和图5所示,将图2B中的二值化图像进行像素的滤除之后,即可获得图5所示的数字区域图像。
需要进行说明的是,在步骤S41-步骤S44中,也可以通过对所扫描行或所扫描列的像素值中为背景像素值的个数进行统计,以从二值化图像的第1行开始进行正序逐行像素扫描为例进行说明,在统计到所扫描行的像素值中为背景像素值的个数之后,在第n行的个数大于预设阈值且第n+1行的个数不大于预设阈值之后,停止扫描并从二值化图像中去除第1行~第n行的像素。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。另外,通过去除数字字符所在像素区域周围的像素区域,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
图6是根据再一示例性实施例示出的一种图像中数字的识别方法的流程图,本实施例涉及的图像中数字的识别方法用于服务器中,本实施例在图1所示实施例的基础上,在步骤S13之后,对获得的数字区域图像如何去除噪点的实施例,作详细说明,如图6所示,该图像中数字的识别方法包括以下步骤。
在步骤S61中,根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置。
在本公开实施例中,在从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,若数字区域图像中包含噪点,也就是说,若在数字区域图像中存在一些错误的前景像素,此时,得到的数字区域图像并不是非常准确的,因此需要对这些错误的像素进行滤除。针对这一问题,在本公开实施例中,根据像素的重心位置对数字区域图像的边界进行优化。在实际应用中,可以根据公式(1)和公式(2)计算前景像素的重心位置:
其中,(Wx,Wy)为前景像素的重心的坐标,N为数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素。当I(x,y)为前景像素时,[I(x,y)]的值为1,若当I(x,y)为背景像素时,[I(x,y)]的值为0。
在步骤S62中,根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
理论上来说,在前景像素大体均匀分布时,前景像素的重心应该位于数字区域图像的中心位置,因此,可以根据该假设对数字区域图像进行裁剪,以去除错误的前景像素。在具体的实现过程中,通常以距离重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于图片中心的位置。例如:图7A为前景像素的重心位置的示意图,图7B为对数字区域图像进行裁剪之后的示意图,如图7A-图7B所示,在图7A和图7B中,所示的阴影部分为前景像素的重心位置,由于距离中心位置较近的边为左边的边,因此,以左边的边为基准,根据左边的边与重心之间的距离对右边的边进行裁剪,使前景像素的重心位于图片左右两边的中心位置。类似的,采用同样的方式,可以对数字区域图像的上下边进行裁剪,裁剪完成之后,前景像素的重心将位于数字区域图像的中心位置。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。另外,利用前景像素的重心位置对数字区域图像的边界进行优化,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
图8是根据又一示例性实施例示出的一种图像中数字的识别方法的流程图,本实施例涉及的图像中数字的识别方法用于服务器中,本实施例在图1所示实施例的基础上,对确定数字区域图像中各数字字符所占图像宽度的实施例,作详细说明,如图8所示,该图像中数字的识别方法包括以下步骤。
在步骤S81中,从所述图像中获取包含数字字符的待处理图像。
在步骤S82中,对所述待处理图像进行二值化处理,得到二值化图像。
在步骤S83中,从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像。
步骤S81-步骤S83与步骤S11-步骤S13类似,此处不再赘述。
在步骤S84中,对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景像素的个数进行统计。
在本公开实施例中,由于各个数字字符所占的图像宽度相等,因此,可以通过获取数字字符中小数点的位置,来确定各个字符所占的图像宽度。在实际应用中,由于小数点一般位于数字区域图像的下半部分,所以可以通过对数字区域图像的上半部分图像按列进行像素扫描,并统计所扫描列的前景像素的个数。
在步骤S85中,确定各列像素中所述个数连续低于预设阈值的k列像素。
在本公开实施例中,在统计出所扫描列的前景像素的个数之后,确定各列像素中个数连续低于预设阈值的k列像素,也即小数点所占的区域。
在步骤S86中,计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度。
在本公开实施例中,当确定出小数点所占的区域位置之后,根据扫描后的k列像素,确定该k列像素所占的图像宽度,也即小数点所占的图像宽度,由于各个数字字符所占的图像宽度相同,因此,根据小数点所占的图像宽度,即可确定出其他数字字符所占的图像宽度。
在步骤S87中,根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。另外,通过获取小数点所占的图像宽度,从而获知各个数字字符所占的图像宽度,使得确定数字区域图像中各数字字符所占图像宽度的方式较简单,从而提高了对数字字符识别的效率。
图9是根据又一示例性实施例示出的一种图像中数字的识别方法的流程图,本实施例涉及的图像中数字的识别方法用于服务器中,本实施例在图1所示实施例的基础上,对确定数字区域图像中各数字字符所占图像宽度的实施例,作详细说明,本实施例与图8所示实施例的不同之处在于,本实施例中确定各数字字符所占图像宽度是通过整个数字区域图像的宽度来确定的。如图9所示,该图像中数字的识别方法包括以下步骤。
在步骤S91中,从所述图像中获取包含数字字符的待处理图像。
在步骤S92中,对所述待处理图像进行二值化处理,得到二值化图像。
在步骤S93中,从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像。
步骤S91-步骤S93与步骤S11-步骤S13类似,此处不再赘述。
在步骤S94中,对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像中的前景像素的个数进行统计。
在步骤S95中,确定各列像素中所述个数连续低于预设阈值的k列像素。
在步骤S96中,计算所述k列像素所占的宽度。
步骤S94-步骤S96与步骤S84-步骤S86类似,此处不再赘述。
在步骤S97中,确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度。
在本公开实施例中,当确定出小数点所占的区域位置之后,根据数字区域图像的宽度,可以确定出在数字区域图像中k列像素所占的宽度右侧的图像宽度,也即小数点后面的图像宽度。
在步骤S98中,根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定单个数字字符所占的图像宽度。
在本公开实施例中,在确定出小数点右侧的图像宽度之后,根据预知的小数点后的数字字符个数以及该右侧的图像宽度,即可确定出单个数字字符所占的图像宽度。例如,若预设的小数点后的数字字符的个数为n,k列像素所占的宽度右侧的图像宽度为w,则可以计算出单个数字字符所占的图像宽度为w/n。
值得注意的是,为了使得计算出的单个数字字符所占的图像宽度更加准确,还可以通过数字区域图像的整体宽度进行优化,具体的,若计算出的单个数字字符所占的图像宽度为w/n,由于各个数字字符之间的间距都是相等的,因此,数字区域图像中全部数字字符的个数N可以通过数字区域图像的整体宽度W进行计算,即N=W/(w/n),其中,N取四舍五入之后的整数,此时,可以进一步进行优化,即可得到单个数字字符的宽度为w=W/N。通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的图像宽度,提高了图像宽度确定的准确度。
在步骤S99中,根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。另外,通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的图像宽度,可以提高每个数字字符图像宽度确定的准确度。
图10是根据一示例性实施例示出的一种图像中数字的识别装置的框图,如图10所示,该图像中数字的识别装置包括获取模块11、处理模块12、去除模块13、确定模块14和分割模块15。
获取模块11被配置为从所述图像中获取包含数字字符的待处理图像;
处理模块12被配置为对所述待处理图像进行二值化处理,得到二值化图像;
去除模块13被配置为从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定模块14被配置为确定所述数字区域图像中各数字字符所占图像宽度;
分割模块15被配置为根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
本实施例的图像中数字的识别装置,通过对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。
其中,如图11所示,图11是根据另一示例性实施例示出的一种图像中数字的识别装置的框图,在图10所示实施例的基础上,所述二值化图像为N行Q列像素的图像;去除模块13包括第一扫描子模块131、第二扫描子模块132、第三扫描子模块133、第四扫描子模块134。
第一扫描子模块131被配置为从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
第二扫描子模块132被配置为从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
第三扫描子模块133被配置为从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p行列的像素;其中,p为小于或等于Q的整数;
第四扫描子模块134被配置为从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
本实施例的图像中数字的识别装置,通过去除数字字符所在像素区域周围的像素区域,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
其中,如图12所示,图12是根据又一示例性实施例示出的一种图像中数字的识别装置的框图,在图10所示实施例的基础上,所述装置还包括计算模块16和裁剪模块17。
计算模块16被配置为根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
裁剪模块17被配置为根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
其中,如图13所示,图13是根据再一示例性实施例示出的一种图像中数字的识别装置的框图,在图12所示实施例的基础上,所述计算模块16包括第一计算子模块161和第二计算子模块162,所述裁剪模块17包括裁剪子模块171。
第一计算子模块161被配置为根据公式计算像素重心的横坐标;
第二计算子模块162被配置为根据公式计算像素重心的纵坐标;
其中,(Wx,Wy)为像素重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
裁剪子模块171被配置为以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
本实施例的图像中数字的识别装置,利用前景像素的重心位置对数字区域图像的边界进行优化,使获得的数字区域图像更准确,从而可以提高数字字符识别的精确度。
其中,如图14所示,图14是根据再一示例性实施例示出的一种图像中数字的识别装置的框图,在图10所示实施例的基础上,所述确定模块14包括第五扫描子模块141、第一统计子模块142、第一确定子模块143和第三计算子模块144。
第五扫描子模块141被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第一统计子模块142被配置为对所扫描列中的前景像素的个数进行统计;
第一确定子模块143被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第三计算子模块144被配置为计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
本实施例的图像中数字的识别装置,通过获取小数点所占的图像宽度,从而获知各个数字字符所占的图像宽度,使得确定数字区域图像中各数字字符所占图像宽度的方式较简单,从而提高了对数字字符识别的效率。
其中,如图15所示,图15是根据再一示例性实施例示出的一种图像中数字的识别装置的框图,在图10所示实施例的基础上,所述确定模块14包括第六扫描子模块145、第二统计子模块146、第二确定子模块147和第四计算子模块148、第三确定子模块149和第四确定子模块150。
第六扫描子模块145被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第二统计子模块146被配置为对所扫描列中的前景像素的个数进行统计;
第二确定子模块147被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第四计算子模块148被配置为计算所述k列像素所占的图像宽度;
第三确定子模块149被配置为确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
第四确定子模块150被配置为根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
本实施例的图像中数字的识别装置,通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的图像宽度,可以提高每个数字字符图像宽度确定的准确度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
以上描述了图像中数字的识别装置的内部功能和结构,如图16所示,该图像中数字的识别装置可实现为:
存储器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
本实施例的图像中数字的识别方法,从图像中获取包含数字字符的待处理图像,对该待处理图像进行二值化处理,得到二值化图像,从二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,确定数字区域图像中各数字字符所占图像宽度,根据图像宽度对数字区域图像进行分割,得到单个数字字符的图像。由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。
图17是根据一示例性实施例示出的一种用于图像中数字的识别的装置的框图。例如,装置1900可以被提供为一服务器。参照图16,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行下述方法:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。
其中,所述二值化图像为N行Q列像素的图像;所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,包括:
从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p行列的像素;其中,p为小于或等于Q的整数;
从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
其中,所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括:
根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
其中,所述根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置,包括:
根据公式计算所述前景像素的重心的横坐标;
根据公式计算所述前景像素的重心的纵坐标;
其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
相应的,根据所述重心位置,对所述数字区域图像进行裁剪,包括:
以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
其中,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
其中,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的宽度;
确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (11)

1.一种图像中数字的识别方法,其特征在于,包括:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像;
其中,所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括:
根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
2.根据权利要求1所述的方法,其特征在于,所述二值化图像为N行Q列像素的图像;所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像,包括:
从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p列的像素;其中,p为小于或等于Q的整数;
从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置,包括:
根据公式计算所述前景像素的重心的横坐标;
根据公式计算所述前景像素的重心的纵坐标;
其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
相应的,根据所述重心位置,对所述数字区域图像进行裁剪,包括:
以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
5.根据权利要求1~3中任一项所述的方法,其特征在于,所述确定所述数字区域图像中各数字字符所占图像宽度,包括:
对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像中的前景像素的个数进行统计;
确定各列像素中所述个数连续低于预设阈值的k列像素;
计算所述k列像素所占的宽度;
确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
6.一种图像中数字的识别装置,其特征在于,包括:
获取模块,被配置为从所述图像中获取包含数字字符的待处理图像;
处理模块,被配置为对所述待处理图像进行二值化处理,得到二值化图像;
去除模块,被配置为从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定模块,被配置为确定所述数字区域图像中各数字字符所占图像宽度;
分割模块,被配置为根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像;
所述装置还包括:
计算模块,被配置为根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
裁剪模块,被配置为根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
7.根据权利要求6所述的装置,其特征在于,所述二值化图像为N行Q列像素的图像;所述去除模块包括:
第一扫描子模块,被配置为从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第n行的个数小于预设阈值且第n+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第n行的像素;其中,n为小于或等于N的整数;
第二扫描子模块,被配置为从二值化图像的第N行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或等于N的整数;
第三扫描子模块,被配置为从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第p列的个数小于预设阈值且第p+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1列~第p列的像素;其中,p为小于或等于Q的整数;
第四扫描子模块,被配置为从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+1列的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第q+1列~第Q列的像素;其中,q为小于或等于Q的整数。
8.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
第一计算子模块,被配置为根据公式计算所述前景像素的重心的横坐标;
第二计算子模块,被配置为根据公式计算所述前景像素的重心的纵坐标;
其中,(Wx,Wy)为所述前景像素的重心的坐标,N为所述数字区域图像中前景像素的总数,I(x,y)表示坐标(x,y)处的像素;
所述裁剪模块包括:
裁剪子模块,被配置为以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的边进行裁剪,使重心位于所述数字区域图像的中心位置。
9.根据权利要求6-8中任一所述的装置,其特征在于,所述确定模块包括:
第五扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第一统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
第一确定子模块,被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第三计算子模块,被配置为计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述各数字字符所占的图像宽度;
其中,k为正整数。
10.根据权利要求6-8中任一所述的装置,其特征在于,所述确定模块包括:
第六扫描子模块,被配置为对所述数字区域图像的上半部分图像按列进行像素扫描;
第二统计子模块,被配置为对所扫描列中的前景像素的个数进行统计;
第二确定子模块,被配置为确定各列像素中所述个数连续低于预设阈值的k列像素;
第四计算子模块,被配置为计算所述k列像素所占的图像宽度;
第三确定子模块,被配置为确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度;
第四确定子模块,被配置为根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符所占的图像宽度;
其中,k为正整数。
11.一种图像中数字的识别装置,其特征在于,包括:
存储器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
从所述图像中获取包含数字字符的待处理图像;
对所述待处理图像进行二值化处理,得到二值化图像;
从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;
确定所述数字区域图像中各数字字符所占图像宽度;
根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像;
其中,所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括:
根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置;
根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述数字区域图像的前景像素的中心。
CN201510849103.XA 2015-11-27 2015-11-27 图像中数字的识别方法、装置及设备 Active CN105335745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510849103.XA CN105335745B (zh) 2015-11-27 2015-11-27 图像中数字的识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510849103.XA CN105335745B (zh) 2015-11-27 2015-11-27 图像中数字的识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN105335745A CN105335745A (zh) 2016-02-17
CN105335745B true CN105335745B (zh) 2018-12-18

Family

ID=55286261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510849103.XA Active CN105335745B (zh) 2015-11-27 2015-11-27 图像中数字的识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN105335745B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229932B (zh) * 2016-03-25 2021-05-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN106022142B (zh) * 2016-05-04 2019-12-10 泰康保险集团股份有限公司 图像隐私信息处理方法及装置
CN106022346B (zh) * 2016-05-24 2019-06-07 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN107203768B (zh) * 2017-06-12 2021-04-13 歌尔光学科技有限公司 Led显示屏数字自动识别方法及系统
CN108108746B (zh) * 2017-09-13 2021-04-09 湖南理工学院 基于Caffe深度学习框架的车牌字符识别方法
CN108133216B (zh) * 2017-11-21 2021-10-12 武汉中元华电科技股份有限公司 基于机器视觉的可实现小数点读取的数码管读数识别方法
CN109409372B (zh) * 2018-08-22 2020-08-04 珠海格力电器股份有限公司 一种字符分割方法、装置、存储介质及视觉检测系统
CN109325481A (zh) * 2018-09-04 2019-02-12 南宁学院 一种物流编号识别方法
CN109376739B (zh) * 2018-10-19 2021-03-26 北京奇艺世纪科技有限公司 一种编组方式确定方法及装置
CN109543770A (zh) * 2018-11-30 2019-03-29 合肥泰禾光电科技股份有限公司 点阵字符识别方法及装置
CN110533003B (zh) * 2019-09-06 2022-09-20 兰州大学 一种穿线法车牌数字识别方法及设备
CN111058183B (zh) * 2019-12-19 2021-08-10 佛山市君丽织造有限公司 基于图像形态识别的纱线检测方法
CN112733834B (zh) * 2021-03-30 2021-07-06 恒银金融科技股份有限公司 一种基于非矩阵窗方式的字符区域定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831416A (zh) * 2012-08-15 2012-12-19 广州广电运通金融电子股份有限公司 一种字符识别方法及相关装置
CN104361312A (zh) * 2014-10-16 2015-02-18 北京捷通华声语音技术有限公司 一种对图像进行字符识别的方法和装置
CN104834926A (zh) * 2015-04-09 2015-08-12 孙晓航 一种字符区域提取方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398894B (zh) * 2008-06-17 2011-12-07 浙江师范大学 机动车车牌自动识别方法及其实现装置
JP5703574B2 (ja) * 2009-09-11 2015-04-22 富士ゼロックス株式会社 画像処理装置、システム及びプログラム
CN102163287B (zh) * 2011-03-28 2014-06-18 北京邮电大学 一种基于类Haar特征和支持向量机的车牌字符识别方法
CN102402686B (zh) * 2011-12-07 2016-04-27 北京云星宇交通科技股份有限公司 一种基于连通域分析的车牌字符分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831416A (zh) * 2012-08-15 2012-12-19 广州广电运通金融电子股份有限公司 一种字符识别方法及相关装置
CN104361312A (zh) * 2014-10-16 2015-02-18 北京捷通华声语音技术有限公司 一种对图像进行字符识别的方法和装置
CN104834926A (zh) * 2015-04-09 2015-08-12 孙晓航 一种字符区域提取方法及系统

Also Published As

Publication number Publication date
CN105335745A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
CN105335745B (zh) 图像中数字的识别方法、装置及设备
KR101690981B1 (ko) 형태 인식 방법 및 디바이스
CN106650740B (zh) 一种车牌识别方法及终端
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN104809452A (zh) 一种指纹识别方法
CN107092871B (zh) 基于多尺度多特征融合的遥感影像建筑物检测方法
CN104809464A (zh) 一种指纹信息处理方法
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN104809453A (zh) 一种基于指纹的认证方法
CN102693409A (zh) 一种快速的图像中二维码码制类型识别方法
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN102592148A (zh) 基于非负矩阵分解和多种距离函数的人脸识别方法
CN111652825B (zh) 基于梯度方向约束的边缘跟踪直线段快速检测装置及方法
CN107644032A (zh) 离群点检测方法和装置
CN105184225B (zh) 一种多国纸币图像识别方法和装置
CN105303153A (zh) 一种车辆车牌识别方法及装置
Fan et al. Faster-than-real-time linear lane detection implementation using soc dsp tms320c6678
CN108154132A (zh) 一种身份证文字提取方法、系统及设备和存储介质
CN104484650B (zh) 素描人脸识别的方法和装置
CN105184294A (zh) 一种基于像素追踪的倾斜文字判断识别方法
CN111951283A (zh) 一种基于深度学习的医学图像识别方法及系统
CN114241522A (zh) 现场作业安全穿戴识别方法、系统、设备及存储介质
JP6338429B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
CN105590112A (zh) 一种图像识别中倾斜文字判断方法
CN104834926B (zh) 一种字符区域提取方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant