CN104899588B - 识别图像中的字符的方法及装置 - Google Patents

识别图像中的字符的方法及装置 Download PDF

Info

Publication number
CN104899588B
CN104899588B CN201510369334.0A CN201510369334A CN104899588B CN 104899588 B CN104899588 B CN 104899588B CN 201510369334 A CN201510369334 A CN 201510369334A CN 104899588 B CN104899588 B CN 104899588B
Authority
CN
China
Prior art keywords
character
image
zero pixels
picture
pixels point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510369334.0A
Other languages
English (en)
Other versions
CN104899588A (zh
Inventor
龙飞
陈志军
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510369334.0A priority Critical patent/CN104899588B/zh
Publication of CN104899588A publication Critical patent/CN104899588A/zh
Application granted granted Critical
Publication of CN104899588B publication Critical patent/CN104899588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本公开是关于一种确定图像中的字符的方法及装置,用以降低字符识别过程中的计算量。所述方法包括:确定所述图像中所包含的字符的第一个数;将所述图像中所包含的字符分割为所述第一个数的字符图片;将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。本公开技术方案简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强字符识别时的鲁棒性。

Description

识别图像中的字符的方法及装置
技术领域
本公开涉及图像识别技术领域,尤其涉及一种识别图像中的字符的方法及装置。
背景技术
在对诸如印刷数字进行识别时,需要对数字进行特征提取。在对数字进行特征提取前,需要对图像进行相应的预处理,从而使数字的特征提取能更加顺利或使得数字的特征能更好地显露出,梯度算子是相关技术中对图像进行预处理时的一个重要手段,然而,梯度算子在对图像进行预处理时,计算量较大。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种识别图像中的字符的方法及装置,用以降低字符识别过程中的计算量。
根据本公开实施例的第一方面,提供一种识别图像中的字符的方法,包括:
确定所述图像中所包含的字符的第一个数;
将所述图像中所包含的字符分割为所述第一个数的字符图片;
将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
在一实施例中,所述方法还可包括:
对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,执行所述确定所述图像中所包含的字符的个数的步骤。
在一实施例中,所述方法还包括:
从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像中的梯度;
通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,执行所述根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。
在一实施例中,所述根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符,可包括:
依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中的字符。
在一实施例中,所述根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中的字符,可包括:
依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个数的差值的绝对值;
确定所述第二个数的绝对值的和值中的最小值对应的字符模板;
将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
根据本公开实施例的第二方面,提供一种识别图像中的字符的装置,包括:
第一确定模块,被配置为确定所述图像中所包含的字符的第一个数;
第一分割模块,被配置为将所述图像中所包含的字符分割为所述第一确定模块确定的所述第一个数的字符图片;
第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
在一实施例中,所述装置还可包括:
图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,所述第一确定模块执行所述确定所述图像中所包含的字符的第一个数的步骤。
在一实施例中,所述装置还可包括:
第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像中的梯度;
第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,所述第一分割模块执行所述根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。
在一实施例中,所述识别模块可包括:
第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零像素点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述图像中的字符。
在一实施例中,所述第一识别子模块可包括:
计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个数的差值的绝对值;
确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的和值中的最小值对应的字符模板;
第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
根据本公开实施例的第三方面,提供一种识别图像中的字符的装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定所述图像中所包含的字符的第一个数;
将所述图像中所包含的字符分割为所述第一个数的字符图片;
将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
本公开的实施例提供的技术方案可以包括以下有益效果:由于印刷字符在水平方向与竖直方向均存在很强的边缘,并且在字符图片的分辨率确定的情况下,设定字符的非零像素点的个数较为固定,因此通过第二个数的图片单元内的非零像素点的个数识别图像中的字符可以简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强了字符识别时的鲁棒性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图。
图1B是根据一示例性实施例示出的图像的示意图。
图1C是根据一示例性实施例示出的字符图片的示意图。
图1D是根据一示例性实施例示出的图片单元的示意图。
图1E是根据一示例性实施例一示出的二值化后的字符图片的示意图。
图2是根据一示例性实施例一示出的识别图像中的字符的方法的流程图。
图3A是根据一示例性实施例二示出的识别图像中的字符的方法的流程图。
图3B是根据一示例性实施例二示出的步骤S304的流程图。
图4是根据一示例性实施例示出的一种识别图像中的字符的装置的框图。
图5是根据一示例性实施例示出的另一种识别图像中的字符的装置的框图。
图6是根据一示例性实施例示出的一种适用于识别图像中的字符的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图,图1B是根据一示例性实施例示出的图像的示意图,图1C是根据一示例性实施例示出的字符图片的示意图,图1D是根据一示例性实施例示出的图片单元的示意图,图1E是根据一示例性实施例一示出的二值化后的字符图片的示意图;该识别图像中的字符的方法可以应用在终端设备(例如:智能手机、平板电脑、台式计算机)上,可以通过在终端设备上安装应用的方式或者在台式计算机上安装软件的方式实现,如图1A所示,该识别图像中的字符的方法包括以下步骤S101-S104:
在步骤S101中,确定图像中所包含的字符的第一个数。
在一实施例中,图像中所包含的字符可以为数字,也可以为英文字母,还可以为希腊字母,本公开对字符的具体类型不做限制。如图1B所示,图像10中所包含的身份证号的部分数字。
在步骤S102中,将图像中所包含的字符分割为第一个数的字符图片。
在一实施例中,可以采用图像分割技术将图像中的数字分割为单个的包含一个字符的字符图片,例如,可以在检测到字符的左右边沿和上下边沿部分,从而沿着左右边沿和上下边沿将字符图片从图像中分割出来,例如,通过对图像10沿着数字“9”的左右边沿和上下边沿识别梯度,从而可以将数字“9”从图像10中分割出来,得到图1C所示的字符图片11。在一实施例中,可以通过将图像进行二值化处理,再识别二值化后的图像中的字符的边沿部分,从而将二值化后的字符从图像中分割出来,例如,通过将图像10进行二值化处理后,识别图像10中的数字的边沿部分,依据边沿将数字“9”从二值化后的图像10中分割出来,形成图1D所示的二值化后的字符图片12。
在步骤S103中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第二个数的图片单元。
在一实施例中,设定大小的窗口可以根据字符图片的分辨率来定,例如,字符图片的分辨率为48*48,则设定大小的窗口可以设置为4*4,即窗口的大小应以能够在字符图片上滑动为准,在一实施例中,窗口滑动的幅度可以确保相邻窗口之间有重叠,例如,第一个窗口滑动到了字符图片11的1至4行,1至4列,得到了图1E所示的图片单元13,第二个窗口可以为字符图片11的3至6行,1至4列等,从而在相同行数上滑动的过程中确保顺次得到的图片单元之间具有重叠的像素点。
在步骤S104中,根据第二个数的图片单元内的非零像素点的个数识别图像中的字符。
在一实施例中,可以将第二个数的图片单元内的非零像素点的个数与字符数据库中的字符模板对应的模板单元的非零像素点的个数进行比较,将两个非零像素点的个数的差值最小的字符识别为字符图片中的字符,例如,将字符图片中的“9”分割为第二个数的图片单元,将字符数据库中的与图片单元具有相同分辨率的字符模板也分割为与图片单元相同分辨率的模板单元,将相同窗口位置的图片单元内的非零像素点的个数与模板单元内的非零像素点的个数求差值的绝对值,并将第二个数的差值的绝对值求和,将字符图片11与字符数据库中的字符的差值的绝对值的和值最小的字符模板识别为与字符图片对应的字符,例如,经过上述计算,确定字符数据库中的字符模板“9”与字符图片11对应的差值的绝对值的和值最小,则将字符图片11中的字符识别为“9”。
本实施例中,由于印刷字符在水平方向与竖直方向均存在很强的边缘,并且在字符图片的分辨率确定的情况下,设定字符的非零像素点的个数较为固定,因此通过第二个数的图片单元内的非零像素点的个数识别图像中的字符可以简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强了字符识别时的鲁棒性。
在一实施例中,方法还可包括:
对图像进行边缘增强并二值化,得到二值化后的图像;之后,执行确定图像中所包含的字符的个数的步骤。
在一实施例中,方法还包括:
从二值化后的图像的水平方向与竖直方向确定第一个数的字符在图像中的梯度;
通过梯度确定字符在水平方向与竖直方向的边界;之后,执行根据水平边界和竖直边界将图像中所包含的字符分割为第一个数的字符图片的步骤。
在一实施例中,根据第二个数的图片单元内的非零像素点的个数识别图像中的字符,可包括:
依据窗口滑动顺序统计第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
根据第一组非零像素点的个数和第二组非零像素点的个数识别图像中的字符。
在一实施例中,根据第一组非零像素点的个数和第二组非零像素点的个数识别图像中的字符,可包括:
依据窗口滑动顺序统计第一组非零像素点的个数与第二组非零像素点的个数的差值的绝对值;
确定第二个数的绝对值的和值中的最小值对应的字符模板;
将最小值对应的字符模板对应的字符识别为字符图片中的字符。
具体如何识别图像中的字符的,请参考后续实施例。
至此,本公开实施例提供的上述方法,可以简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强了字符识别时的鲁棒性。
下面以具体实施例来说明本公开实施例提供的技术方案。
图2是根据一示例性实施例一示出的识别图像中的字符的方法的流程图;本实施例利用本公开实施例提供的上述方法,以如何从图像中分割字符图片为例并结合图1B至图1E进行示例性说明,如图2所示,包括如下步骤:
在步骤S201中,对图像进行边缘增强并二值化,得到二值化后的图像。
在一实施例中,可以通过相关技术中对图像进行边缘增强并二值化处理的方法对图像10进行相应的处理,得到二值化后的图像(图中未视)。
在步骤S202中,确定二值化后的图像中所包含的字符的个数。
在一实施例中,可以根据对图像进行分割的次数来确定图像中所包含的字符的个数,例如,在对图像进行粗分割的过程中,在确定相邻字符之间的相邻区域时,即可在该相邻区域进行分割,并统计分割的次数,得到图像中所包含的字符的个数,以图像10为例,在图像10中,包含数字“0219860”,在识别上述数字的过程中,可以先确定相邻数字的相邻区域,然后在相邻区域对相邻的数字进行分割,在统计分割次数后,可以确定图像10中所包含的数字的第一个数为7个。
在步骤S203中,从二值化后的图像的水平方向与竖直方向确定第一个数的字符在图像中的梯度。
在步骤S204中,通过梯度确定字符在水平方向与竖直方向的边界,根据水平方向的边界和竖直方向的边界作为字符图片的边界。
在步骤S205中,根据水平边界和竖直边界将图像中所包含的字符分割为第一个数的字符图片。
上述步骤S203至步骤S205中,在一实施例中,可以通过sobel或者canny算子来确定字符在图像中的梯度,例如,通过sobel算子识别到数字“9”的梯度后,进而可以根据梯度确定数字“9”的水平边界和竖直边界,通过水平边界和竖直边界即可将数字“9”从图像10中分割出来,得到如图1C所示的字符图片12,图像中给其它数字的分割方法请参考上述描述,在此不再详述。
在步骤S206中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第二个数的图片单元。
步骤S206的描述可以参考上述步骤S103的描述,在此不再详述。
在步骤S207中,根据第二个数的图片单元内的非零像素点的个数识别图像中的字符。
步骤S207的描述可以参考上述步骤S104的描述,在此不再详述。
本实施例在具有上述实施例的有益技术效果的基础上,通过对图像进行图像增强以及二值化处理,使字符更易于在图像中识别到,进一步提高了字符识别的准确度,进而达到了很好的识别效果。
图3A是根据一示例性实施例二示出的识别图像中的字符的方法的流程图,图3B是根据一示例性实施例二示出的步骤S304的流程图;本实施例利用本公开实施例提供的上述方法,以如何通过非零像素点的个数识别图像中的字符为例并结合图1B至图1E进行示例性说明,如图3A所示,包括如下步骤:
在步骤S301中,确定图像中所包含的字符的第一个数。
在步骤S302中,将图像中所包含的字符分割为第一个数的字符图片。
在步骤S303中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第二个数的图片单元。
步骤S301至步骤S303的描述请参见上述步骤S101至步骤S103,在此不再详述。
在步骤S304中,依据窗口滑动顺序统计第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数。
在步骤S305中,依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数。
在步骤S306中,根据第一组非零像素点的个数和第二组非零像素点的个数识别图像中的字符。
在上述步骤S304至步骤S306中,若将字符图片分割成了M个的图片单元,对M个的图片单元中的每一个图片单元中的非零像素点的个数进行统计,得到第一组非零像素点的个数,例如,第一组非零像素点的个数为[N1,N2,N3,N4,…,NM];对字符数据库中的每一个字符的模板分割为与图片单元相同分辨了的模板单元,得到M1个模板单元,对M1个模板单元中的每一个模板单元中的非零像素点的个数进行统计,得到第二组非零像素点的个数,例如,第二组非零像素点的个数为[n1,n2,n3,n4,…,nM],其中,M表示图片单元的个数,n1与N1具有相同的窗口位置,n2与N2具有相同的窗口位置,以此类推,nM与NM具有相同的窗口位置;通过顺次比较第一组非零像素点的个数与第二组非零像素点的个数,实现对图像中的字符进行识别。
如图3B所示,在一实施例中,步骤S306可包括:
在步骤S311中,依据窗口滑动顺序统计第一组非零像素点的个数与第二组非零像素点的个数的差值的绝对值。
在步骤S312中,确定第二个数的绝对值的和值中的最小值对应的字符模板。
在步骤S313中,将最小值对应的字符模板对应的字符识别为字符图片中的字符。
在上述步骤S311至步骤S313中,例如,计算N1与n1的差值的绝对值|N1-n1|、N2与n2的差值的绝对值|N2-n2|、N3与n3的差值的绝对值|N3-n3|、…、NM与nM的差值的绝对值|NM-nM|,计算上述的差值的绝对值的和值为由于字符数据库中具有多个(本公开中的第二个数)字符模板,因此上述差值的绝对值的和值也为多个,由此,从多个和值中确定和值的最小值,例如,字符图片12对应的和值的最小值对应的字符模板为“9”,则可以将字符图片12上的字符识别为数字“9”。
本实施例在具有上述实施例的有益技术效果的基础上,通过将图片单元对应的非零像素值的个数与字符数据库中的每一个字符的模板对应的模板单元中的非零像素点的个数来识别字符图片中的字符,通过参考字符数据库中的字符的非零像素点的信息,简化了字符识别过程中的计算复杂度,进一步提高了字符识别的准确度,进而达到了很好的识别效果。
图4是根据一示例性实施例示出的一种识别图像中的字符的装置的框图,如图4所示,识别图像中的字符的装置包括:
第一确定模块41,被配置为确定图像中所包含的字符的第一个数;
第一分割模块42,被配置为将图像中所包含的字符分割为第一确定模块41确定的第一个数的字符图片;
第二分割模块43,被配置为将第一分割模块42分割得到的字符图片沿着设定大小的窗口滑动从而将字符图片分割成第二个数的图片单元;
识别模块44,被配置为根据第二分割模块43分割得到的第二个数的图片单元内的非零像素点的个数识别图像中的字符。
图5是根据一示例性实施例示出的另一种识别图像中的字符的装置的框图,如图5所示,在上述图4所示实施例的基础上,在一实施例中,装置还可包括:
图像预处理模块45,被配置为对图像进行边缘增强并二值化,得到二值化后的图像;之后,第一确定模块41执行确定图像中所包含的字符的第一个数的步骤。
在一实施例中,装置还可包括:
第二确定模块46,被配置为从图像预处理模块45二值化后的图像的水平方向与竖直方向确定第一个数的字符在图像中的梯度;
第三确定模块47,被配置为通过第二确定模块46确定的梯度确定字符在水平方向与竖直方向的边界;之后,第一分割模块42执行根据水平边界和竖直边界将图像中所包含的字符分割为第一个数的字符图片的步骤。
在一实施例中,识别模块44可包括:
第一统计子模块441,被配置为依据窗口滑动顺序统计第二分割模块43分割后的第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
第二统计子模块442,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
第一识别子模块443,被配置为根据第一统计子模块441统计得到的第一组非零像素点的个数和第二统计子模块442统计得到的第二组非零像素点的个数识别图像中的字符。
在一实施例中,第一识别子模块443可包括:
计算子模块4431,被配置为依据窗口滑动顺序统计第一组非零像素点的个数与第二组非零像素点的个数的差值的绝对值;
确定子模块4432,被配置为确定计算子模块计4431算得到的第二个数的绝对值的和值中的最小值对应的字符模板;
第二识别子模块4433,被配置为将确定子模块4432确定的最小值对应的字符模板对应的字符识别为字符图片中的字符。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种适用于识别图像中的字符的装置的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件606为装置600的各种组件提供电力。电力组件606可以包括电源管理系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当装置600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到装置600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (6)

1.一种识别图像中的字符的方法,其特征在于,所述方法包括:
对所述图像进行边缘增强并二值化,得到二值化后的图像;
确定二值化后的所述图像中所包含的字符的第一个数;
从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像中的梯度;
通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;
根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片;
将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符,包括:
依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中的字符。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中的字符,包括:
依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个数的差值的绝对值;
确定所述第二个数的绝对值的和值中的最小值对应的字符模板;
将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
4.一种识别图像中的字符的装置,其特征在于,所述装置包括:
图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的图像;
第一确定模块,被配置为确定二值化后的所述图像中所包含的字符的第一个数;
第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像中的梯度;
第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;
第一分割模块,被配置为根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一确定模块确定的所述第一个数的字符图片;
第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
5.根据权利要求4所述的装置,其特征在于,所述识别模块包括:
第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零像素点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述图像中的字符。
6.根据权利要求5所述的装置,其特征在于,所述第一识别子模块包括:
计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个数的差值的绝对值;
确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的和值中的最小值对应的字符模板;
第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
CN201510369334.0A 2015-06-26 2015-06-26 识别图像中的字符的方法及装置 Active CN104899588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510369334.0A CN104899588B (zh) 2015-06-26 2015-06-26 识别图像中的字符的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510369334.0A CN104899588B (zh) 2015-06-26 2015-06-26 识别图像中的字符的方法及装置

Publications (2)

Publication Number Publication Date
CN104899588A CN104899588A (zh) 2015-09-09
CN104899588B true CN104899588B (zh) 2018-12-11

Family

ID=54032242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510369334.0A Active CN104899588B (zh) 2015-06-26 2015-06-26 识别图像中的字符的方法及装置

Country Status (1)

Country Link
CN (1) CN104899588B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426890B (zh) * 2015-11-09 2018-12-18 成都数之联科技有限公司 一种字符扭曲粘连的图形验证码识别方法
CN106022329B (zh) * 2016-05-12 2019-09-20 福建南威软件有限公司 一种字符识别过程中的字符降噪处理方法
CN107609560A (zh) * 2017-09-27 2018-01-19 北京小米移动软件有限公司 文字识别方法及装置
CN108510636B (zh) * 2018-03-27 2020-01-14 深圳怡化电脑股份有限公司 图像分割方法、图像分割装置及终端设备
CN114005115A (zh) * 2021-10-15 2022-02-01 上海欧菲智能车联科技有限公司 一种库位号确定方法、车辆以及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5542006A (en) * 1994-06-21 1996-07-30 Eastman Kodak Company Neural network based character position detector for use in optical character recognition
CN103226706A (zh) * 2013-05-17 2013-07-31 广东今盛投资有限公司 一种基于滚动匹配的水电气表读数自动识别方法
CN103455823A (zh) * 2013-08-27 2013-12-18 电子科技大学 一种基于分类模糊及图像分割的英文字符识别方法
CN104112130A (zh) * 2014-06-26 2014-10-22 小米科技有限责任公司 光学字符识别方法及装置
CN104239879A (zh) * 2014-09-29 2014-12-24 小米科技有限责任公司 分割字符的方法及装置
CN104715252A (zh) * 2015-03-12 2015-06-17 电子科技大学 一种动态模板结合像素点的车牌字符分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8335381B2 (en) * 2008-09-18 2012-12-18 Xerox Corporation Handwritten word spotter using synthesized typed queries

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5542006A (en) * 1994-06-21 1996-07-30 Eastman Kodak Company Neural network based character position detector for use in optical character recognition
CN103226706A (zh) * 2013-05-17 2013-07-31 广东今盛投资有限公司 一种基于滚动匹配的水电气表读数自动识别方法
CN103455823A (zh) * 2013-08-27 2013-12-18 电子科技大学 一种基于分类模糊及图像分割的英文字符识别方法
CN104112130A (zh) * 2014-06-26 2014-10-22 小米科技有限责任公司 光学字符识别方法及装置
CN104239879A (zh) * 2014-09-29 2014-12-24 小米科技有限责任公司 分割字符的方法及装置
CN104715252A (zh) * 2015-03-12 2015-06-17 电子科技大学 一种动态模板结合像素点的车牌字符分割方法

Also Published As

Publication number Publication date
CN104899588A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
US11532180B2 (en) Image processing method and device and storage medium
EP3163504B1 (en) Method, device and computer-readable medium for region extraction
JP6392468B2 (ja) 領域認識方法及び装置
CN105512685B (zh) 物体识别方法和装置
EP3163500A1 (en) Method and device for identifying region
US10007841B2 (en) Human face recognition method, apparatus and terminal
CN104899588B (zh) 识别图像中的字符的方法及装置
CN106228168B (zh) 卡片图像反光检测方法和装置
KR20210102180A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체
EP3163509A1 (en) Method for region extraction, method for model training, and devices thereof
EP3188078B1 (en) Method and device for fingerprint identification
US20150332439A1 (en) Methods and devices for hiding privacy information
CN106296665B (zh) 卡片图像模糊检测方法和装置
CN105528600A (zh) 区域识别方法及装置
CN107527059A (zh) 文字识别方法、装置及终端
CN109344832A (zh) 图像处理方法及装置、电子设备和存储介质
CN106682736A (zh) 图像识别方法及装置
CN105426878B (zh) 人脸聚类方法及装置
CN107742120A (zh) 银行卡卡号的识别方法及装置
CN107480665A (zh) 文字检测方法、装置及计算机可读存储介质
CN105335714B (zh) 照片处理方法、装置和设备
CN105678242A (zh) 手持证件模式下的对焦方法和装置
CN111062401A (zh) 堆叠物体的识别方法及装置、电子设备和存储介质
CN110276418A (zh) 基于图片的字体识别方法、装置、电子设备及存储介质
CN104662889A (zh) 用于在便携式终端中进行拍摄的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant