CN106446900A - 数字切割方法及装置 - Google Patents

数字切割方法及装置 Download PDF

Info

Publication number
CN106446900A
CN106446900A CN201610856597.9A CN201610856597A CN106446900A CN 106446900 A CN106446900 A CN 106446900A CN 201610856597 A CN201610856597 A CN 201610856597A CN 106446900 A CN106446900 A CN 106446900A
Authority
CN
China
Prior art keywords
numeral
digital
projection
module
connected domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610856597.9A
Other languages
English (en)
Inventor
杨松
陈志军
龙飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201610856597.9A priority Critical patent/CN106446900A/zh
Publication of CN106446900A publication Critical patent/CN106446900A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了数字切割方法及装置,其中,所述方法包括:确定每个数字在图片中的起始位置和终止位置;根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。本公开基于每个数字的起始位置和终止位置进行数字切割,提高了数字切割的准确性。

Description

数字切割方法及装置
技术领域
本公开涉及图像识别领域,尤其涉及数字切割方法及装置。
背景技术
相关技术中,在识别图像中的数字时,需要先对每个数字进行切割后,再分别对切割出的数字进行光学字符识别(Optical Character Recognition,OCR),从而确定该图像中的数字。
但是,在进行数字切割时,由于噪声和光照等因素的干扰,只能大致确定每个数字所在的位置范围,造成数字切割的效果较差,也影响了后续对切割出的数字进行OCR的准确度。
发明内容
本公开提供了数字切割方法及装置,以解决相关技术中的不足。
根据本公开实施例的第一方面,提供一种数字切割方法,所述方法包括:
确定每个数字在图片中的起始位置和终止位置;
根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
可选地,所述获取包括多个数字的图片之后,所述方法还包括:
对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片;
所述确定每个数字在所述图片中的起始位置和终止位置,包括:
确定每个数字在所述目标图片中的起始位置和终止位置。
可选地,所述确定每个数字在所述目标图片中的起始位置和终止位置,包括:
将所述目标图片向水平轴方向进行积分投影,得到投影图;
基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置;
基于所述连通域和所述每个数字的所述起始位置,确定所述每个数字的终止位置;
其中,所述连通域为所述投影图中的连续非零区间。
可选地,所述基于所述连通域和所述每个数字的所述起始位置,确定所述每个数字的终止位置,包括:
计算每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置;
将所述投影图中最接近所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
可选地,所述将所述目标图片向水平轴方向进行积分投影,得到投影图,包括:
计算所述目标图片的每列像素中所包括的目标像素点的数目,所述目标像素点是灰度值为预设值的像素点;
将所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
可选地,所述基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置,包括:
对所述目标图片进行数字检测,确定每个数字所在的窗口位置;
将所述投影图中与所述窗口位置对应的连通域的起始点位置,作为所述每个数字的起始位置。
可选地,所述基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置,包括:
当多个数字为连续数字时,对所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置;
将所述投影图中与所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置;
根据上一个数字的终止位置和所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
可选地,所述根据上一个数字的终止位置和所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置,包括:
将位于上一个数字的终止位置之后的首个连通域的起始点位置,作为所述当前数字的所述起始位置。
根据本公开实施例的第二方面,提供一种数字切割装置,所述装置包括:
位置确定模块,被配置为确定每个数字在图片中的起始位置和终止位置;
数字切割模块,被配置为根据所述位置确定模块确定的每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
可选地,所述装置还包括:
处理模块,被配置为对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片;
所述位置确定模块被配置为确定每个数字在经过所述处理模块处理后得到的所述目标图片中的起始位置和终止位置。
可选地,所述位置确定模块包括:
投影子模块,被配置为将经过所述处理模块处理后得到的所述目标图片向水平轴方向进行积分投影,得到投影图;
第一确定子模块,被配置为基于所述处理模块处理后得到的所述目标图片和所述投影子模块得到的所述投影图中形成的连通域,确定每个数字的起始位置;
第二确定子模块,被配置为基于所述投影子模块得到的所述投影图中形成的所述连通域和所述第一确定子模块确定的所述每个数字的所述起始位置,确定所述每个数字的终止位置;
其中,所述连通域为所述投影图中的连续非零区间。
可选地,所述第二确定子模块包括:
第一计算子模块,被配置为计算所述第一确定子模块确定的所述每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置;
第三确定子模块,被配置为将所述投影子模块得到的所述投影图中最接近所述第一计算子模块计算的所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
可选地,所述投影子模块包括:
第二计算子模块,被配置为计算经过所述处理模块处理后得到的所述目标图片的每列像素中所包括的目标像素点的数目,所述目标像素点是灰度值为预设值的像素点;
第四确定子模块,被配置为将所述第二计算子模块计算出的所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
可选地,所述第一确定子模块包括:
第一窗口确定子模块,被配置为对基于所述处理模块处理后得到的所述目标图片进行数字检测,确定每个数字所在的窗口位置;
第五确定子模块,被配置为将所述投影子模块得到的所述投影图中与所述第一窗口确定子模块确定的所述窗口位置对应的连通域的起始点位置,作为所述每个数字的起始位置。
可选地,所述第一确定子模块包括:
第二窗口确定子模块,被配置为当多个数字为连续数字时,对基于所述处理模块处理后得到的所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置;
第六确定子模块,被配置为将所述投影子模块得到的所述投影图中与所述第二窗口确定子模块确定的所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置;
第七确定子模块,被配置为根据所述第二确定子模块确定的上一个数字的终止位置和所述投影子模块得到的所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
可选地,所述第七确定子模块被配置为将位于根据所述第二确定子模块确定的上一个数字的终止位置之后的所述投影子模块得到的所述投影图中的首个连通域的起始点位置,作为所述当前数字的所述起始位置。
根据本公开实施例的第三方面,提供一种数字切割装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定每个数字在图片中的起始位置和终止位置;
根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开实施例中,可以在确定出每个数字在图片中的起始位置和终止位置后,从所述图片中切割出每个数字。通过上述过程,基于每个数字的起始位置和终止位置进行数字切割,提高了数字切割的准确性。
本公开实施例中,可选地,可以对包括多个数字的图片进行二值化处理,从而区分所述图片中的前景和背景;进一步地,对所述图片进行形态学开运算处理,从而对所述图片中较小的噪声进行滤除。后续基于上述处理后的目标图片进行数字切割,提高了数字切割的准确性。
本公开实施例中,可选地,可以将目标图片向水平轴方向进行积分投影,得到投影图,从而基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。进一步地,可以通过对所述目标图片进行数字检测的方式,结合所述投影图中的连通域来确定每个数字的起始位置。如果多个数字是连续的,为了加快确定起始位置的速度,可以通过对所述目标图片进行数字检测的方式,确定出首个数字的起始位置,后续其他数字的起始位置可以根据上一个数字的终止位置和所述投影图中形成的连通域来确定。实现简便,可用性高。
本公开实施例中,在确定每个数字的终止位置时,可以基于投影图中形成的连通域和每个数字的起始位置来确定。本公开实施例中,首先计算每个数字的所述起始位置和预设数字宽度值的和值,并将所述和值作为所述每个数字的备选终止位置,即先对终止位置进行预估。进一步地,在预估的备选终止位置附近搜索最接近该备选终止位置的连通域,并将该连通域的终止点位置作为当前数字的终止位置。通过上述过程,可以有效避免对数字的过度切割,确保了数字切割的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开根据一示例性实施例示出的一种数字切割方法流程图;
图2是本公开根据一示例性实施例示出的一种数字切割场景示意图;
图3A至图3C是本公开根据一示例性实施例示出的数字切割场景示意图;
图4是本公开根据一示例性实施例示出的另一种数字切割方法流程图;
图5是本公开根据一示例性实施例示出的另一种数字切割方法流程图;
图6是本公开根据一示例性实施例示出的另一种数字切割方法流程图;
图7A至图7B是本公开根据一示例性实施例示出的数字切割场景示意图;
图8是本公开根据一示例性实施例示出的另一种数字切割场景示意图;
图9A至图9B是本公开根据一示例性实施例示出的数字切割场景示意图;
图10是本公开根据一示例性实施例示出的另一种数字切割方法流程图;
图11是本公开根据一示例性实施例示出的另一种数字切割场景示意图;
图12是本公开根据一示例性实施例示出的另一种数字切割方法流程图;
图13A至图13B是本公开根据一示例性实施例示出的数字切割场景示意图;
图14是本公开根据一示例性实施例示出的一种数字切割装置框图;
图15是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图16是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图17是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图18是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图19是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图20是本公开根据一示例性实施例示出的另一种数字切割装置框图;
图21是本公开根据一示例性实施例示出的一种用于数字切割装置的一结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开运行的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所运行的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中运行的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所运行的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本公开实施例提供的数字切割方法可以用于数字切割装置。如图1所示,图1是根据一示例性实施例示出的一种数字切割方法,包括以下步骤:
在步骤101中,确定每个数字在图片中的起始位置和终止位置。
本步骤中,所述数字切割装置可以在包括多个数字的所述图片中,分别确定不同数字各自的起始位置以及终止位置,例如图2所示。
在步骤102中,根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
本步骤中,所述数字切割装置可以根据步骤101确定的某一数字的所述起始位置和所述终止位置,将所述起始位置到所述终止位置之间的该数字准确切割出来,直到将所述图片中的所有数字均切割出来为止。
上述实施例中,基于图片中每个数字的起始位置和终止位置进行数字切割,提高了数字切割的准确性。
本公开实施例中,可选地,上述的图片为多个数字所在文字行的图片。例如,在进行身份证号码的数字切割时,相关技术中会扫描整个身份证件的图片,如图3A所示。对于数字切割装置而言,只需要在图3A中截取包括身份证号码所在文字行的图片即可,如图3B所示。
进一步地,上述数字切割方法如图4所示,图4是在前述图1所示实施例的基础上示出的另一种数字切割方法,在完成步骤101之后,还包括以下步骤:
在步骤100中,对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片。
本步骤中,为了区分所述图片中的前景和背景,所述数字切割装置可以按照相关技术对所述图片进行二值化处理,将文字和数字(前景)设置为白色(灰度值为255),背景设置为黑色(灰度值为0)。
在完成二值化处理后,为了对图片中较小的噪声进行滤除,所述数字切割装置还可以按照相关技术对所述图片进行形态学开运算处理,从而得到目标图片。所述开运算处理包括先腐蚀后膨胀的过程。其中,所述腐蚀过程是消除边界点,使边界向内部收缩的过程;所述膨胀过程是将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程。对二值化处理后的所述图片进行形态学开运算处理,可以用来消除较小的噪声影响,平滑文字和数字的边界的同时并不明显改变其面积。
对图3B的图片经过上述处理后得到的图片如图3C所示。
相应地,上述步骤101确定每个数字在所述图片中的起始位置和终止位置的过程,就是确定每个数字在经过上述处理后得到的目标图片中的起始位置和终止位置的过程。
上述实施例中,可以对包括多个数字的图片进行二值化处理,从而区分所述图片中的前景和背景;进一步地,对所述图片进行形态学开运算处理,从而对所述图片中较小的噪声进行滤除。后续基于上述处理后的目标图片进行数字切割,提高了数字切割的准确性。
本公开实施例中,上述确定每个数字在所述目标图片中的起始位置和终止位置的过程如图5所示,图5是在前述图1所示实施例的基础上示出的另一种数字切割方法,包括以下步骤:
在步骤101-1中,将所述目标图片向水平轴方向进行积分投影,得到投影图。
本步骤中,可选地,获得投影图的过程如图6所示,图6是在前述图5所示实施例的基础上示出的另一种数字切割方法,包括以下步骤:
在步骤101-11中,计算所述目标图片的每列像素中所包括的目标像素点的数目。
其中,所述目标像素点是灰度值为预设值的像素点,这里的预设值为255。即目标像素点为二值化处理后的目标图片中的白色像素点。本步骤需要计算每列像素中所包括的灰度值为255的目标像素点的数目。
例如,假设所述目标图片中的一列像素如图7A所示,则灰度值为255的目标像素点的数目为2。
在步骤101-12中,将所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
本步骤中,所述数字切割装置可以将每一列对应的目标像素点的数目作为所述目标图片在所述水平轴方向上的积分投影值,从而得到每个数字对应的行向量x=[x1,x2,…xn],即所述投影图,例如图7B所示为某个数字的所述投影图。
在步骤101-2中,基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。
本公开实施例中,所述连通域为所述投影图中的连续非零区间。其中,所述连续非零区间为多个连续且数值不为零的所述积分投影值所对应的区间,例如图8中,该区间内的所有所述积分投影值均不为零,因此该区域即为一个连通域。
在确定每个数字的起始位置时,可选地,可以采用数字检测的方式确定所述起始位置。
所述数字切割装置可以按照相关技术,通过支持向量机分类器(Support VectorMachine,SVM)结合方向梯度直方图(Histogram of Oriented Gradient,HOG)特征,采用窗口检测的方式对所述目标图片从左至右进行数字检测。在检测到某个数字时,确定该数字所对应的窗口位置,例如图9A所示。
进一步地,所述数字切割装置可以将所述投影图中与上述窗口位置对应的连通域的起始点位置,直接作为当前数字的起始位置。例如图9B所示,连通域A与所述窗口位置对应,则将连通域A的起始点位置作为当前数字的起始位置。
另外,本公开实施例中,如果多个数字为连续数字,为了加快确定每个数字起始位置的速度,只需要通过数字检测确定首个数字的起始位置,后续数字的起始位置可以由上一个数字的终止位置和所述投影图中形成的连通域来确定。当然,上述多个数字的每个数字的字符宽度相同。如图10所示,图10是在前述图5所示实施例的基础上示出的另一种数字切割方法,步骤101-2包括以下步骤:
在步骤101-21中,当多个数字为连续数字时,对所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置。
本步骤中,所述数字切割装置同样可以按照相关技术,通过SVM结合HOG特征,采用窗口检测的方式对所述目标图片从左至右进行数字检测。在检测到第一个数字时,确定该数字所对应的目标窗口位置。
在步骤101-22中,将所述投影图中与所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置。
本步骤中,所述数字切割装置直接将所述投影图中与上述目标窗口位置对应的连通域的起始点位置,直接作为首个数字的起始位置。
在步骤101-23中,根据上一个数字的终止位置和所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
本步骤中,可选地,将位于上一个数字的终止位置之后的首个连通域的起始点位置,作为所述当前数字的所述起始位置即可。
例如图11所示,在确定数字1的起始位置时,可以将上一个数字5的终止位置之后的首个连通域的起始点位置作为数字1的起始位置。
在步骤101-3中,基于所述连通域和所述每个数字的所述起始位置,确定所述每个数字的终止位置。
可选地,步骤101-3如图12所示,图12是在前述图5所示实施例的基础上示出的另一种数字切割方法,包括以下步骤:
在步骤101-31中,计算每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置。
本步骤中,所述数字切割装置在确定了每个数字的起始位置之后,可以计算起始位置和预设数字宽度值的和值,并将该和值作为相应数字的备选终止位置。其中,所述预设数字宽度值相对于所述目标图片是固定的。
例如图13A所示,在确定了数字5的起始位置之后,计算该起始位置和所述预设数字宽度值的和值,得到备选终止位置。
在步骤102-32中,将所述投影图中最接近所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
本步骤中,所述数字切割装置将所述投影图中最接近所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
例如图13B所示,在确定了数字5的备选终止位置后,最接近所述备选终止位置的连通域为连通域B,则连通域B的终止点位置即为数字5的终止位置。
每个数字的终止位置均可以采用以上方式进行确定。通过上述过程,在预估的备选终止位置附近搜索最接近该备选终止位置的连通域,并将该连通域的终止点位置作为当前数字的终止位置,可以有效避免对数字的过度切割,即将一个数字切割为两个数字的问题,确保了数字切割的准确性。
上述实施例中,可以将目标图片向水平轴方向进行积分投影,得到投影图,从而基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。如果多个数字是连续的,为了加快确定起始位置的速度,可以通过对所述目标图片进行数字检测的方式,确定出首个数字的起始位置,后续其他数字的起始位置可以根据上一个数字的终止位置和所述投影图中形成的连通域来确定。实现简便,可用性高。另外,在预估的备选终止位置附近搜索最接近该备选终止位置的连通域,并将该连通域的终止点位置作为当前数字的终止位置。通过上述过程,可以有效避免对数字的过度切割,确保了数字切割的准确性。
对上述数字切割过程进一步举例说明如下。
在进行身份证号码的数字切割时,数字切割装置可以只获取身份证号码所在文字行的图片,如图3B所示。进一步地,依次对该图片进行二值化处理和形态学开运算处理,得到目标图片,例如图3C所示。向水平轴方向进行积分投影,得到投影图,例如图7B所示。投影过程与上述实施例中的投影过程相同,在此不再赘述。
由于身份证号码是多个连续数字,则所述数字切割装置可以按照相关技术,通过SVM结合HOG特征,采用窗口检测的方式对所述目标图片从左至右进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置。进一步地,将所述投影图中与所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置。
假设首个数字的起始位置为x1 start,预设数字宽度值为ω,则首个数字的备选终止位置x1 end′=x1 start+ω。进一步地,在备选终止位置附近进行搜索,距离x1 end′最近的连通域的终止点位置,即为首个数字的终止位置x1 end。然后,将位于x1 end之后的首个连通域的起始点位置,作为第二个数字的起始位置x2 start。在确定了第二个数字的起始位置之后,可以按照与确定首个数字终止位置相同的方式确定所述第二个数字的终止位置。按照上述方式直到确定出身份证号码的18位数字各自的起始位置和终止位置。
进一步地,所述数字切割装置就可以按照相关技术,根据每个数字的所述起始位置和所述终止位置,依次切割出起始位置到相应的终止位置对应的数字,例如图2所示。
上述实施例中,滤除了较小的噪声,提高了数字切割的准确性。另外,可以将目标图片向水平轴方向进行积分投影,得到投影图,从而基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。如果多个数字是连通的,为了加快确定起始位置的速度,可以通过对所述目标图片进行数字检测的方式,确定出首个数字的起始位置,后续其他数字的起始位置可以根据上一个数字的终止位置和所述投影图中形成的连通域来确定。实现简便,可用性高。在确定每个数字的终止位置时,在预估的备选终止位置附近搜索最接近该备选终止位置的连通域,并将该连通域的终止点位置作为当前数字的终止位置。通过上述过程,可以有效避免对数字的过度切割,确保了数字切割的准确性。
与前述方法实施例相对应,本公开还提供了装置的实施例。
如图14所示,图14是本公开根据一示例性实施例示出的一种数字切割装置框图,包括:
位置确定模块210,被配置为确定每个数字在图片中的起始位置和终止位置;
数字切割模块220,被配置为根据所述位置确定模块210确定的每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
上述实施例中,基于每个数字的起始位置和终止位置进行数字切割,提高了数字切割的准确性。
如图15所示,图15是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图14所示实施例的基础上,所述装置还包括:
处理模块230,被配置为对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片;
所述位置确定模块210被配置为确定每个数字在经过所述处理模块230处理后得到的所述目标图片中的起始位置和终止位置。
上述实施例中,可以对包括多个数字的图片进行二值化处理,从而区分所述图片中的前景和背景;进一步地,对所述图片进行形态学开运算处理,从而对所述图片中较小的噪声进行滤除。后续基于上述处理后的目标图片进行数字切割,提高了数字切割的准确性。
如图16所示,图16是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图15所示实施例的基础上,所述位置确定模块210包括:
投影子模块211,被配置为将经过所述处理模块230处理后得到的所述目标图片向水平轴方向进行积分投影,得到投影图;
第一确定子模块212,被配置为基于所述处理模块230处理后得到的所述目标图片和所述投影子模块211得到的所述投影图中形成的连通域,确定每个数字的起始位置;
第二确定子模块213,被配置为基于所述投影子模块211得到的所述投影图中形成的所述连通域和所述第一确定子模块212确定的所述每个数字的所述起始位置,确定所述每个数字的终止位置;
其中,所述连通域为所述投影图中的连续非零区间。
上述实施例中,可以将目标图片向水平轴方向进行积分投影,得到投影图,从而基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。在确定每个数字的终止位置时,可以基于投影图中形成的连通域和每个数字的起始位置来确定。实现简便,可用性高。
如图17所示,图17是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图16所示实施例的基础上,所述第二确定子模块213包括:
第一计算子模块214,被配置为计算所述第一确定子模块212确定的所述每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置;
第三确定子模块215,被配置为将所述投影子模块211得到的所述投影图中最接近所述第一计算子模块214计算的所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
上述实施例中,首先计算每个数字的所述起始位置和预设数字宽度值的和值,并将所述和值作为所述每个数字的备选终止位置,即先对终止位置进行预估。进一步地,在预估的备选终止位置附近搜索最接近该备选终止位置的连通域,并将该连通域的终止点位置作为当前数字的终止位置。通过上述过程,可以有效避免对数字的过度切割,确保了数字切割的准确性。
如图18所示,图18是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图16所示实施例的基础上,所述投影子模块211包括:
第二计算子模块216,被配置为计算经过所述处理模块230处理后得到的所述目标图片的每列像素中所包括的目标像素点的数目,所述目标像素点是灰度值为预设值的像素点;
第四确定子模块217,被配置为将所述第二计算子模块216计算出的所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
上述实施例中,可以将目标图片向水平轴方向进行积分投影,得到投影图,从而基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置。每个所述连通域对应不同的数字,提高了数字切割的准确性。
如图19所示,图19是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图17所示实施例的基础上,所述第一确定子模块212包括:
第一窗口确定子模块218,被配置为对基于所述处理模块230处理后得到的所述目标图片进行数字检测,确定每个数字所在的窗口位置;
第五确定子模块219,被配置为将所述投影子模块211得到的所述投影图中与所述第一窗口确定子模块219确定的所述窗口位置对应的连通域的起始点位置,作为所述每个数字的起始位置。
如图20所示,图20是本公开根据一示例性实施例示出的另一种数字切割装置框图,该实施例在前述图16所示实施例的基础上,所述第一确定子模块212包括:
第二窗口确定子模块2110,被配置为当多个数字为连续数字时,对基于所述处理模块230处理后得到的所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置;
第六确定子模块2111,被配置为将所述投影子模块211得到的所述投影图中与所述第二窗口确定子模块2110确定的所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置;
第七确定子模块2112,被配置为根据所述第二确定子模块213确定的上一个数字的终止位置和所述投影子模块211得到的所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
可选地,所述第七确定子模块2112被配置为将位于根据所述第二确定子模块213确定的上一个数字的终止位置之后的所述投影子模块211得到的所述投影图中的首个连通域的起始点位置,作为所述当前数字的所述起始位置。
上述实施例中,为了加快确定起始位置的速度,可以通过对所述目标图片进行数字检测的方式,确定出首个数字的起始位置,后续其他数字的起始位置可以根据上一个数字的终止位置和所述投影图中形成的连通域来确定。实现简便,可用性高。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本公开还提供一种数字切割装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定每个数字在图片中的起始位置和终止位置;
根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
如图21所示,图21是根据一示例性实施例示出的另一种数字切割装置800的一结构示意图。参照图21,装置800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理组件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述数字切割方法。
装置800还可以包括一个电源组件826被配置为执行装置800的电源管理,一个有线或无线网络接口850被配置为将装置800连接到网络,和一个输入输出(I/O)接口858。装置800可以操作基于存储在存储器832的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或者惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。

Claims (17)

1.一种数字切割方法,其特征在于,所述方法包括:
确定每个数字在图片中的起始位置和终止位置;
根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
2.根据权利要求1所述的方法,其特征在于,所述获取包括多个数字的图片之后,所述方法还包括:
对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片;
所述确定每个数字在所述图片中的起始位置和终止位置,包括:
确定每个数字在所述目标图片中的起始位置和终止位置。
3.根据权利要求2所述的方法,其特征在于,所述确定每个数字在所述目标图片中的起始位置和终止位置,包括:
将所述目标图片向水平轴方向进行积分投影,得到投影图;
基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置;
基于所述连通域和所述每个数字的所述起始位置,确定所述每个数字的终止位置;
其中,所述连通域为所述投影图中的连续非零区间。
4.根据权利要求3所述的方法,其特征在于,所述基于所述连通域和所述每个数字的所述起始位置,确定所述每个数字的终止位置,包括:
计算每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置;
将所述投影图中最接近所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
5.根据权利要求3所述的方法,其特征在于,所述将所述目标图片向水平轴方向进行积分投影,得到投影图,包括:
计算所述目标图片的每列像素中所包括的目标像素点的数目,所述目标像素点是灰度值为预设值的像素点;
将所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
6.根据权利要求3所述的方法,其特征在于,所述基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置,包括:
对所述目标图片进行数字检测,确定每个数字所在的窗口位置;
将所述投影图中与所述窗口位置对应的连通域的起始点位置,作为所述每个数字的起始位置。
7.根据权利要求3所述的方法,其特征在于,所述基于所述目标图片和所述投影图中形成的连通域,确定每个数字的起始位置,包括:
当多个数字为连续数字时,对所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置;
将所述投影图中与所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置;
根据上一个数字的终止位置和所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
8.根据权利要求7所述的方法,其特征在于,所述根据上一个数字的终止位置和所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置,包括:
将位于上一个数字的终止位置之后的首个连通域的起始点位置,作为所述当前数字的所述起始位置。
9.一种数字切割装置,其特征在于,所述装置包括:
位置确定模块,被配置为确定每个数字在图片中的起始位置和终止位置;
数字切割模块,被配置为根据所述位置确定模块确定的每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
处理模块,被配置为对所述图片依次进行二值化处理和形态学开运算处理,获得处理后的目标图片;
所述位置确定模块被配置为确定每个数字在经过所述处理模块处理后得到的所述目标图片中的起始位置和终止位置。
11.根据权利要求10所述的装置,其特征在于,所述位置确定模块包括:
投影子模块,被配置为将经过所述处理模块处理后得到的所述目标图片向水平轴方向进行积分投影,得到投影图;
第一确定子模块,被配置为基于所述处理模块处理后得到的所述目标图片和所述投影子模块得到的所述投影图中形成的连通域,确定每个数字的起始位置;
第二确定子模块,被配置为基于所述投影子模块得到的所述投影图中形成的所述连通域和所述第一确定子模块确定的所述每个数字的所述起始位置,确定所述每个数字的终止位置;
其中,所述连通域为所述投影图中的连续非零区间。
12.根据权利要求11所述的方法,其特征在于,所述第二确定子模块包括:
第一计算子模块,被配置为计算所述第一确定子模块确定的所述每个数字的所述起始位置和预设数字宽度值的和值,将所述和值作为所述每个数字的备选终止位置;
第三确定子模块,被配置为将所述投影子模块得到的所述投影图中最接近所述第一计算子模块计算的所述备选终止位置的连通域的终止点位置,作为所述每个数字的终止位置。
13.根据权利要求11所述的装置,其特征在于,所述投影子模块包括:
第二计算子模块,被配置为计算经过所述处理模块处理后得到的所述目标图片的每列像素中所包括的目标像素点的数目,所述目标像素点是灰度值为预设值的像素点;
第四确定子模块,被配置为将所述第二计算子模块计算出的所述数目作为所述目标图片在所述水平轴方向上的积分投影值,得到所述投影图。
14.根据权利要求11所述的装置,其特征在于,所述第一确定子模块包括:
第一窗口确定子模块,被配置为对基于所述处理模块处理后得到的所述目标图片进行数字检测,确定每个数字所在的窗口位置;
第五确定子模块,被配置为将所述投影子模块得到的所述投影图中与所述第一窗口确定子模块确定的所述窗口位置对应的连通域的起始点位置,作为所述每个数字的起始位置。
15.根据权利要求11所述的装置,其特征在于,所述第一确定子模块包括:
第二窗口确定子模块,被配置为当多个数字为连续数字时,对基于所述处理模块处理后得到的所述目标图片进行数字检测,确定所述多个数字中首个数字所在的目标窗口位置;
第六确定子模块,被配置为将所述投影子模块得到的所述投影图中与所述第二窗口确定子模块确定的所述目标窗口位置对应的连通域的起始点位置,作为所述首个数字的起始位置;
第七确定子模块,被配置为根据所述第二确定子模块确定的上一个数字的终止位置和所述投影子模块得到的所述投影图中形成的连通域,确定所述多个数字中除了所述首个数字之外的当前数字的起始位置。
16.根据权利要求15所述的装置,其特征在于,所述第七确定子模块被配置为将位于根据所述第二确定子模块确定的上一个数字的终止位置之后的所述投影子模块得到的所述投影图中的首个连通域的起始点位置,作为所述当前数字的所述起始位置。
17.一种数字切割装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定每个数字在图片中的起始位置和终止位置;
根据每个数字的所述起始位置和所述终止位置,从所述图片中切割出每个数字。
CN201610856597.9A 2016-09-27 2016-09-27 数字切割方法及装置 Pending CN106446900A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610856597.9A CN106446900A (zh) 2016-09-27 2016-09-27 数字切割方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610856597.9A CN106446900A (zh) 2016-09-27 2016-09-27 数字切割方法及装置

Publications (1)

Publication Number Publication Date
CN106446900A true CN106446900A (zh) 2017-02-22

Family

ID=58170582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610856597.9A Pending CN106446900A (zh) 2016-09-27 2016-09-27 数字切割方法及装置

Country Status (1)

Country Link
CN (1) CN106446900A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110587704A (zh) * 2019-08-29 2019-12-20 瀚德(中国)汽车密封系统有限公司 切断位置的确定方法、设备及系统
CN111571826A (zh) * 2020-05-20 2020-08-25 南京欧赛尔齿业有限公司 一种假牙材料数字化切割方法及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833859A (zh) * 2010-05-14 2010-09-15 山东大学 基于虚拟线圈的自触发车牌识别方法
CN101877050A (zh) * 2009-11-10 2010-11-03 青岛海信网络科技股份有限公司 一种车牌字符的自动提取方法
CN101957920A (zh) * 2010-09-08 2011-01-26 中国人民解放军国防科学技术大学 基于数字视频的车牌查找方法
CN102043945A (zh) * 2010-11-23 2011-05-04 聊城大学 基于车辆实时跟踪和二进指数分类车牌字符识别的方法
CN102184399A (zh) * 2011-03-31 2011-09-14 上海名图信息技术有限公司 基于水平投影和连通域分析的字符分割方法
CN102521588A (zh) * 2011-12-30 2012-06-27 四川九洲电器集团有限责任公司 一种车牌字符分割方法
CN102722711A (zh) * 2012-05-31 2012-10-10 信帧电子技术(北京)有限公司 一种车牌类型识别中的车牌字符序列识别方法及装置
CN104966107A (zh) * 2015-07-10 2015-10-07 安徽清新互联信息科技有限公司 一种基于机器学习的信用卡卡号识别方法
CN105894487A (zh) * 2014-08-25 2016-08-24 武汉科技大学 钢材图像编号的提取与分割方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877050A (zh) * 2009-11-10 2010-11-03 青岛海信网络科技股份有限公司 一种车牌字符的自动提取方法
CN101833859A (zh) * 2010-05-14 2010-09-15 山东大学 基于虚拟线圈的自触发车牌识别方法
CN101957920A (zh) * 2010-09-08 2011-01-26 中国人民解放军国防科学技术大学 基于数字视频的车牌查找方法
CN102043945A (zh) * 2010-11-23 2011-05-04 聊城大学 基于车辆实时跟踪和二进指数分类车牌字符识别的方法
CN102184399A (zh) * 2011-03-31 2011-09-14 上海名图信息技术有限公司 基于水平投影和连通域分析的字符分割方法
CN102521588A (zh) * 2011-12-30 2012-06-27 四川九洲电器集团有限责任公司 一种车牌字符分割方法
CN102722711A (zh) * 2012-05-31 2012-10-10 信帧电子技术(北京)有限公司 一种车牌类型识别中的车牌字符序列识别方法及装置
CN105894487A (zh) * 2014-08-25 2016-08-24 武汉科技大学 钢材图像编号的提取与分割方法
CN104966107A (zh) * 2015-07-10 2015-10-07 安徽清新互联信息科技有限公司 一种基于机器学习的信用卡卡号识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡利梅: "《数字图像处理》", 31 August 2014 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110587704A (zh) * 2019-08-29 2019-12-20 瀚德(中国)汽车密封系统有限公司 切断位置的确定方法、设备及系统
CN111571826A (zh) * 2020-05-20 2020-08-25 南京欧赛尔齿业有限公司 一种假牙材料数字化切割方法及设备

Similar Documents

Publication Publication Date Title
US11410277B2 (en) Method and device for blurring image background, storage medium and electronic apparatus
CN111862296B (zh) 三维重建方法及装置、系统、模型训练方法、存储介质
EP3651055A1 (en) Gesture recognition method, apparatus, and device
CN110858295B (zh) 一种交警手势识别方法、装置、整车控制器及存储介质
JP6655878B2 (ja) 画像認識方法及び装置、プログラム
RU2601185C2 (ru) Способ, система и компьютерный носитель данных для детектирования лица
JP4137969B2 (ja) 眼部検出装置、眼部検出方法及びプログラム
US11100341B2 (en) Lane line tracking method and device
JP2005316973A (ja) 赤目検出装置および方法並びにプログラム
CN108154149B (zh) 基于深度学习网络共享的车牌识别方法
JPH11250267A (ja) 目の位置検出方法、目の位置検出装置および目の位置検出プログラムを記録した記録媒体
CN111314689B (zh) 识别影像中前景物件的方法与电子装置
JP2000137792A (ja) 眼部検出装置
US10740907B2 (en) Moving body tracking method, moving body tracking device, and program
CN106447701A (zh) 用于图像相似性确定、对象检测和跟踪的方法和装置
JP2010165046A (ja) 情報処理装置及び情報処理方法
EP3611691A1 (en) Recognition device, recognition system, recognition method, and recognition program
CN108171229B (zh) 一种空心粘连验证码的识别方法及系统
CN106446900A (zh) 数字切割方法及装置
US7403636B2 (en) Method and apparatus for processing an image
CN111368674B (zh) 图像识别方法及装置
US20060126940A1 (en) Apparatus and method for detecting eye position
CN109255307A (zh) 一种基于唇部定位的人脸分析方法和系统
CN105654082A (zh) 字符识别后处理方法、设备及包括该设备的图像拾取设备
KR20030012193A (ko) 다양한 배경의 영상데이터에서의 눈 위치 검출방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222

RJ01 Rejection of invention patent application after publication