CN105095860A - 字符分割方法和装置 - Google Patents

字符分割方法和装置 Download PDF

Info

Publication number
CN105095860A
CN105095860A CN201510382075.5A CN201510382075A CN105095860A CN 105095860 A CN105095860 A CN 105095860A CN 201510382075 A CN201510382075 A CN 201510382075A CN 105095860 A CN105095860 A CN 105095860A
Authority
CN
China
Prior art keywords
initial position
character
character frame
default template
score value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510382075.5A
Other languages
English (en)
Other versions
CN105095860B (zh
Inventor
王百超
龙飞
秦秋平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Technology Co Ltd
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510382075.5A priority Critical patent/CN105095860B/zh
Publication of CN105095860A publication Critical patent/CN105095860A/zh
Application granted granted Critical
Publication of CN105095860B publication Critical patent/CN105095860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • G06V30/2253Recognition of characters printed with magnetic ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本公开是关于一种字符分割方法和装置,属于字符识别领域。方法包括:提取原始图像的字符区域,获取多种预设模板的特征向量,对于每种预设模板,选取多个初始位置,计算每个初始位置与预设模板的匹配分值,选取与预设模板的匹配分值最大的初始位置,作为优选初始位置;将优选初始位置与预设模板的匹配分值作为预设模板的指定匹配分值,将指定匹配分值与特征向量的维数之间的商作为优选匹配分值;选取优选匹配分值最大的预设模板,作为优选预设模板;根据优选预设模板的特征向量和优选预设模板对应的优选初始位置进行分割。本公开通过找出与字符框集合最为匹配的优选预设模板,提高了字符分割的准确率,进行字符识别时提高了识别准确率。

Description

字符分割方法和装置
技术领域
本公开是关于字符识别领域,具体来说是关于一种字符分割方法和装置。
背景技术
人们在日常生活中要处理大量的字符,如纸上的文字、车牌上的号码等,为了提高字符的处理效率,可以获取目标物的图像,对该图像中目标物上的字符串进行分割,并采用字符识别技术,将分割得到的每个字符翻译成计算机能够识别的文字,由计算机对翻译成的文字进行处理。
在分割过程中,可以先获取包含字符串的原始图像,对该原始图像进行二值化处理,得到二值化图像,将二值化图像中各个像素的灰度值按照垂直方向进行累加,得到投影图。由于该二值化图像中,任两个相邻字符之间的像素的灰度值通常为0,而字符上像素的灰度值通常为1,则投影图会在任两个相邻字符之间的位置形成波谷,在任一字符上的位置形成波峰,那么,根据该投影图上波谷的位置进行分割,即可将该字符串中的多个字符分割开。
发明内容
为了解决相关技术中存在的问题,本公开提供了一种字符分割方法和装置。所述技术方案如下:
根据本公开实施例的第一方面,提供了一种字符分割方法,所述方法包括:
提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
对于每种预设模板,
从所述字符区域中,选取多个初始位置;
对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
在另一实施例中,所述提取原始图像的字符区域,包括:
对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;
根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;
根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;
对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;
根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
在另一实施例中,所述从所述字符区域中,选取多个初始位置,包括:
以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置,包括:
从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
在另一实施例中,所述从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
执行计算每个全局初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置的步骤。
在另一实施例中,所述从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
执行计算每个第二局部初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置的步骤。
在另一实施例中,所述根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,包括:
以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;
根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;
将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;
对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
在另一实施例中,所述根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割,包括:
从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;
按照提取出的窗口的位置,对所述字符框集合进行分割。
根据本公开实施例的第二方面,提供了一种字符分割装置,所述装置包括:
提取模块,用于提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取模块,用于获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
初始选取模块,用于对于每种预设模板,从所述字符区域中,选取多个初始位置;
计算模块,用于对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
匹配选取模块,用于从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
确定模块,用于将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
模板选取模块,用于从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
分割模块,用于根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
在另一实施例中,所述提取模块用于对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
在另一实施例中,所述初始选取模块还用于以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述计算模块还用于计算每个第一局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
在另一实施例中,所述初始选取模块还用于以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
所述计算模块还用于计算每个全局初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置。
在另一实施例中,所述初始选取模块还用于以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
所述计算模块还用于计算每个第二局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置。
在另一实施例中,所述计算模块用于以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
在另一实施例中,所述分割模块还用于从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;按照提取出的窗口的位置,对所述字符框集合进行分割。
根据本公开实施例的第三方面,提供了一种字符分割装装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
对于每种预设模板,
从所述字符区域中,选取多个初始位置;
对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
本公开的实施例提供的技术方案可以包括以下有益效果:
本实施例提供的方法和装置,通过在提取到原始图像的字符框集合时,并未直接按照字符框集合中字符框的位置进行分割,而是获取多种预设模板的特征向量,根据该字符框集合中每个字符框的位置,找出与每种预设模板最匹配的优选初始位置及相应的优选匹配分值,根据确定的多个优选匹配分值,找出与该字符框集合最为匹配的优选预设模板,从而确定该字符框集合中字符框的分布方式,则根据该优选预设模板对字符框集合进行分割时,能够提高字符分割的准确率,对分割后的字符进行字符识别时,能够提高识别准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种字符分割方法的流程图;
图2是根据一示例性实施例示出的一种字符分割方法的流程图;
图3A是根据一示例性实施例示出的第一直线和字符框集合的示意图;
图3B是根据一示例性实施例示出的第二直线和字符框集合的示意图;
图3C是根据一示例性实施例示出的一种字符区域的示意图;
图3D是根据一示例性实施例示出的另一种字符区域的示意图;
图3E是根据一示例性实施例示出的另一种字符区域的示意图;
图3F是根据一示例性实施例示出的另一种字符区域的示意图;
图3G是根据一示例性实施例示出的一种窗口示意图;
图4是根据一示例性实施例示出的一种字符分割装置的框图;
图5是根据一示例性实施例示出的一种用于字符分割装置的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本公开做进一步详细说明。在此,本公开的示意性实施方式及其说明用于解释本公开,但并不作为对本公开的限定。
本公开实施例提供一种字符分割方法和装置,以下结合附图对本公开进行详细说明。
图1是根据一示例性实施例示出的一种字符分割方法的流程图,如图1所示,字符分割方法用于处理装置中,包括以下步骤:
在步骤101中,提取原始图像的字符区域,该字符区域内包括字符框集合,该字符框集合包括多个尺寸相同的字符框。
在步骤102中,获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式。
在步骤103中,对于每种预设模板,从该字符区域中,选取多个初始位置,对于选取的每个初始位置,根据该字符框集合中每个字符框与该初始位置之间的距离和该预设模板的特征向量,计算该初始位置与该预设模板的匹配分值,从该多个初始位置中,选取与该预设模板的匹配分值最大的初始位置,作为优选初始位置。
其中,该匹配分值用于表示在该字符框集合中,在该初始位置之后的字符框的分布方式与该预设模板之间的匹配程度。
在步骤104中,将该优选初始位置与该预设模板的匹配分值作为该预设模板的指定匹配分值,将该指定匹配分值与该预设模板的特征向量的维数之间的商作为该预设模板的优选匹配分值。
在步骤105中,从该多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板。
在步骤106中,根据该优选预设模板的特征向量和该优选预设模板对应的优选初始位置,对该字符框集合进行分割。
本实施例提供的方法,通过在提取到原始图像的字符框集合时,并未直接按照字符框集合中字符框的位置进行分割,而是获取多种预设模板的特征向量,根据该字符框集合中每个字符框的位置,找出与每种预设模板最匹配的优选初始位置及相应的优选匹配分值,根据确定的多个优选匹配分值,找出与该字符框集合最为匹配的优选预设模板,从而根据该优选预设模板,确定该字符框集合中字符框的分布方式,根据该优选预设模板对字符框集合进行分割时,能够提高字符分割的准确率,对分割后的字符进行字符识别时,能够提高识别准确率。
在另一实施例中,该提取原始图像的字符区域,包括:
对该原始图像进行检测,得到第一字符框集合,该第一字符框集合中包括多个字符框;
根据该第一字符框集合中每个字符框的尺寸,对该第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得该第二字符框集合中多个字符框的尺寸相同;
根据该第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将该第二字符框集合中,该指定坐标点位于该第一直线上的字符框组成第三字符框集合;
对该原始图像进行旋转变换,得到第一图像,使得在该第一图像中,由该第一直线旋转后形成的第二直线位于水平方向;
根据该第二直线在该第一图像中的位置以及由该第三字符框集合旋转后形成的第四字符框集合在该第一图像中的位置,从该第一图像中,提取该字符区域,使得该字符区域包括该第四字符框集合。
在另一实施例中,该从该字符区域中,选取多个初始位置,包括:
以第一预设阈值为步长,从该字符区域中,选取多个第一局部初始位置,该第一预设阈值小于该字符框集合中字符框的宽度;
该从该多个初始位置中,选取与该预设模板的匹配分值最大的初始位置,作为优选初始位置,包括:
从该多个第一局部初始位置中,选取与该预设模板的匹配分值最大的第一局部初始位置,作为该优选初始位置。
在另一实施例中,该从该多个第一局部初始位置中,选取与该预设模板的匹配分值最大的第一局部初始位置之后,该方法还包括:
以该与该预设模板的匹配分值最大的第一局部初始位置为起点、以该字符框集合中字符框的宽度为步长,从该字符区域中,选取多个全局初始位置;
执行计算每个全局初始位置与该预设模板的匹配分值的步骤;
执行从该多个全局初始位置中,选取与该预设模板的匹配分值最大的全局初始位置,作为该优选初始位置的步骤。
在另一实施例中,该从该多个全局初始位置中,选取与该预设模板的匹配分值最大的全局初始位置之后,该方法还包括:
以该与该预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从该字符区域中,选取多个第二局部初始位置,该第二预设阈值小于该第一预设阈值;
执行计算每个第二局部初始位置与该预设模板的匹配分值的步骤;
执行从该多个第二局部初始位置中,选取与该预设模板的匹配分值最大的第二局部初始位置,作为该优选初始位置的步骤。
在另一实施例中,该根据该字符框集合中每个字符框与该初始位置之间的距离和该预设模板的特征向量,计算该初始位置与该预设模板的匹配分值,包括:
以该初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与该字符框集合中字符框的宽度相等,所创建窗口的数目与该预设模板的特征向量的维数相同;
根据该字符框集合中每个字符框与该初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;
将该多个窗口中每个窗口内的字符框的个数组成字符分布向量;
对该预设模板的特征向量与该字符分布向量进行点乘运算,得到该初始位置与该预设模板的匹配分值。
在另一实施例中,该根据该优选预设模板的特征向量和该优选预设模板对应的优选初始位置,对该字符框集合进行分割,包括:
从以该优选预设模板对应的优选初始位置为起点的多个窗口中,提取与该优选预设模板的特征向量中的指定元素对应的窗口,该指定元素是指该特征向量中用于表示字符的元素;
按照提取出的窗口的位置,对该字符框集合进行分割。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种字符分割方法的流程图,如图2所示,字符分割方法用于处理装置中,包括以下步骤:
在步骤201中,处理装置提取原始图像的字符区域,该字符区域内包括字符框集合,该字符框集合包括多个尺寸相同的字符框。
其中,该原始图像中包括字符串,该字符串中包括多个字符,这些字符可以包括数字、汉字、英文单词等,该原始图像可以为银行卡图像、名片图像等,该原始图像中的字符可以为银行卡上的数字、名片上的数字或者名片上的字等,本实施例对此不做限定。该处理装置用于对原始图像中的字符串进行分割,分割出的字符可以进行字符识别,该处理装置可以为计算机或者服务器等,本实施例对此也不做限定。
由于该原始图像中真实的字符会有一定角度的旋转,容易对后续的分割过程和识别过程造成影响,因此,在本实施例中,为了便于分割,可以对字符框进行检测,以消除字符旋转的影响。
该处理装置可以对该原始图像进行字符检测,提取该原始图像中的字符区域,该字符区域至少包括字符框集合,且该字符框集合包括多个尺寸相同的字符框,可以认为在每个字符框内分布有一个字符,则该处理装置可以根据该字符框集合中的字符框,对该原始图像上的字符串进行分割。
例如,该步骤201可以包括以下步骤(1)至(5):
(1)该处理装置对该原始图像进行检测,得到第一字符框集合。
该处理装置可以采用预设特征提取算法,提取该原始图像的特征,并将该原始图像的特征输入预设分类器,根据该预设分类器,对该原始图像的特征进行分类,得到该原始图像中的字符框集合,作为第一字符框集合,该第一字符框集合中包括多个字符框。该处理装置根据该第一字符框集合,可以获取到每个字符框的位置和尺寸。
其中,该预设特征提取算法可以为HOG(HistogramofOrientedGradient,方向梯度直方图)或者其他特征提取算法,该预设分类器可以为Adaboost(自适应增强)分类器、SVM(SupportVectorMachine,支持向量机)分类器或者其他分类器,该预设分类器可以通过对多个样本字符的特征进行训练得到。另外,该处理装置还可以采用基于模板进行字符检测的方法,获取该第一字符框集合。本实施例对此均不做限定。
(2)该处理装置根据该第一字符框集合中每个字符框的尺寸,对该第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得该第二字符框集合中多个字符框的尺寸相同。
对该原始图像进行检测时,可能会存在误检的情况,这会导致检测得到的第一字符框集合中,每个字符框的尺寸有大有小,则为了便于后续对该原始图像的字符区域进行分割,该处理装置可以对该第一字符框集合中的多个字符框进行过滤,使得剩余的多个字符框的尺寸相同。
考虑到在该原始图像中,尺寸相同的字符可以看作同一类字符,且每类字符中包含的字符数目越多,表示这类字符在该原始图像中展示的信息越多,这类字符越重要,则可以认为出现次数最多的尺寸所对应的字符即为该原始图像中需要识别的字符。为此,该处理装置可以确定每种尺寸在该第一字符框集合中出现的次数,并确定出现次数最多的尺寸,仅保留该出现次数最多的尺寸所对应的字符框,而将其他尺寸的字符框过滤掉,即将出现最多的尺寸所对应的字符框组成第二字符框集合,则该第二字符框集合中多个字符框的尺寸相同。
(3)该处理装置根据该第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将该第二字符框集合中,该指定坐标点位于该第一直线上的字符框组成第三字符框集合。
其中,该处理装置可以采用RANSAC(RANdomSAmpleConsensus,随机抽样一致)的方式进行直线拟合,或者采用其他拟合方式进行直线拟合,本实施例对此不做限定。
该处理装置可以将该第二字符框集合中每个字符框的指定位置上的点作为指定坐标点,则根据每个字符框的指定坐标点的位置,可以进行直线拟合,得到第一直线,那么,大多数字符框的指定坐标点位于该第一直线上,而其他字符框的指定坐标点不在该第一直线上。该处理装置可以将指定坐标点不在该第一直线上的字符框过滤掉,将剩余的指定坐标点位于该第一直线上的字符框组成第三字符框集合。其中,该指定坐标点可以为字符框左上角的点、右上角的点、左下角的点或者其他位置上的点,本实施例对此不做限定。
参见图3A,在该原始图像中,该第二字符框集合中包括5个字符框,则将每个字符框上左上角的点作为指定坐标点,根据每个字符框的指定坐标点的位置,拟合出一条直线(第一直线),如图3A所示,字符框1和字符框5的指定坐标点不在该直线上,则将字符框1和字符框5过滤掉,将字符框2、字符框3和字符框4组成第三字符框集合。
(4)该处理装置对该原始图像进行旋转变换,得到第一图像,使得在该第一图像中,由该第一直线旋转后形成的第二直线位于水平方向。
在该原始图像中拟合出该第一直线后,该第一直线可能位于水平方向,也可能不位于水平方向,则为了便于以该第一直线为依据提取出字符区域,当该第一直线不位于水平方向时,该处理装置可以对该原始图像进行旋转变换,得到新的第一图像,使得在该第一图像中,由该第一直线旋转后形成的第二直线位于水平方向。且,该第三字符框集合随着该原始图像的旋转而旋转,在该第一图像中形成了第四字符框集合。
参见图3A,拟合出的直线不位于水平方向,则对该原始图像进行旋转,使得旋转后的直线位于水平方向上,如图3B所示。
(5)该处理装置根据该第二直线在该第一图像中的位置以及由该第三字符框集合旋转后形成的第四字符框集合在该第一图像中的位置,从该第一图像中,提取该字符区域,使得该字符区域包括该第四字符框集合。
该第一直线旋转至水平方向时,在该第一图像中形成了第二直线,且该第三字符框集合随着该原始图像的旋转而旋转,在该第一图像中形成了第四字符框集合,则可以根据该第二直线和该第四字符框集合在该第一图像中的位置,提取字符区域。
由于该第二直线位于水平方向,且该第四字符框集合中每个字符框的高度相同,则每个字符框均具有相同的纵坐标,该处理装置可以根据该第二直线的纵坐标和每个字符框的纵坐标,提取字符区域。
参见图3B,假设该第二直线的纵坐标为y0,每个字符框的高度为h,则可以认为每个字符框的纵坐标为y0+h,该处理装置可以提取位于直线y=y0与直线y=y0+h之间的区域,作为该字符区域。
另外,该处理装置还可以根据该第二直线的横坐标和每个字符框的横坐标,提取字符区域。参见图3C,假设该第二直线的两个端点的横坐标分别为x1和x2,则该处理装置可以提取位于x=x1与x=x2之间的区域,作为字符区域。或者,参见图3D,为了保证该第四字符框集合中的每个字符框均在提取出的字符区域中,该处理装置可以设定预设宽度w,提取位于x=x1-w与x=x2+w之间的区域,作为字符区域。
又如,假设该第四字符框集合中第一个字符框的最左侧坐标点的横坐标为x3,该第四字符框集合中最后一个字符框的最右侧坐标点的横坐标为x4,则参见图3E,该处理装置可以提取位于x=x3与x=x4之间的区域,作为字符区域。或者,参见图3F,为了保证该第四字符框集合中的每个字符框均在提取出的字符区域中,该处理装置可以设定预设宽度w,提取位于x=x3-w与x=x4+w之间的区域,作为字符区域。其中,该预设宽度w可以由该处理装置根据该第二直线的长度或者该第四字符框集合所在区域的宽度确定,本实施例对此不做限定。
该处理装置可以先在纵向方向上进行分割,再在横向方式上进行分割,得到该字符区域,也可以先在横向方向上进行分割,再在纵向方向上进行分割,得到该字符区域,本实施例对此不做限定。
需要说明的是,上述步骤(4)和(5)为可选步骤,该处理装置可以不执行该步骤(4)和(5),不对该原始图像进行旋转,而是根据该第一直线和该第三字符框集合在该原始图像中的位置,提取字符区域,或者,该第一直线在原始图像中位于水平方向时,该处理装置可以不执行该步骤(4)和(5),本实施例对此不做限定。
在步骤202中,处理装置获取多种预设模板的特征向量,对于每种预设模板,分别执行下述步骤203-206。
在实际应用中,不同的目标物上字符的分布方式不同,例如,身份证件上身份证号码的分布方式为连续的18个字符,而银行卡上的卡号的分布方式为16个字符,其中每隔4个字符有一个空格。则在本实施例中,在对字符区域进行分割时,为了提高准确率,可以在分割之前先确定该字符区域所匹配的字符分布方式,再根据匹配的字符分布方式进行分割。
为了确定该字符区域中字符的分布方式,该处理装置可以获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式,不同模板的特征向量不同。
例如,模板1的分布方式为“XXXX-XXXX”,X表示字符,-表示空格,则以数字1表示字符,以数字-1表示非字符,该模板1的特征向量为[-1,1,1,1,1,-1,1,1,1,1,-1],该特征向量中的第一个元素-1和最后一个元素-1表示模板1对应的字符串的前后区域必然为非字符区域,该特征向量中其他9个元素分别与该模板1中的每个分布位置对应。
该处理装置获取到每种预设模板的特征向量后,可以对每种预设模板,执行下述步骤203-206,以计算出每种预设模板的优选匹配分值,以优选匹配分值来表示该字符区域中的字符框集合与预设模板之间的匹配程度。
在步骤203中,处理装置以第一预设阈值为步长,从该字符区域中,选取多个第一局部初始位置,对于选取的每个第一局部初始位置,根据该字符框集合中每个字符框与该第一局部初始位置之间的距离和该预设模板的特征向量,计算该第一局部初始位置与该预设模板的匹配分值,计算出该多个第一局部初始位置与该预设模板的匹配分值后,从该多个第一局部初始位置中,选取与该预设模板的匹配分值最大的第一局部初始位置。
对于当前待匹配的预设模板来说,为了在该字符框集合中找到与该预设模板最为匹配的初始位置,该处理装置可以在该字符区域中,选取多个初始位置,则对于选取的每个初始位置,根据该字符框集合中每个字符框与该初始位置之间的距离和该预设模板的特征向量,计算该初始位置与该预设模板的匹配分值。
其中,该匹配分值用于表示在该字符区域中的字符框集合中,在该初始位置之后的字符框的分布方式与该预设模板之间的匹配程度,该匹配分值越大,表示以该初始位置为起点时,该字符框集合与该预设模板越匹配。且该初始位置可以为该字符区域中的固定位置,也可以在该字符区域中随机选取,只要以选取的初始位置为起点的区域与该字符区域中的真实字符串所在区域相交即可。
对于选取的任一初始位置,计算该初始位置与该预设模板的匹配分值可以包括以下步骤203a至203c:
203a、以该初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与该字符框集合中字符框的宽度相等,所创建窗口的数目与该预设模板的特征向量的维数相同。
该处理装置可以将该初始位置作为起点,创建多个连续的窗口,每个窗口的宽度均与该字符框集合中字符框的宽度相等。将字符框集合中每个字符框的宽度作为指定宽度,将该预设模板的特征向量的维数作为指定数目,则该处理装置以该初始位置作为第一个窗口的左起点,每隔该指定宽度,创建一个窗口,直至所创建窗口的数目与该指定数目相等时停止。所创建的每个窗口均与该特征向量中的一个元素对应,可以用于表示该元素所对应的位置。
为了判断该字符框集合中的字符框与该预设模板在横向方向上的匹配程度,该处理装置创建了多个窗口,并保证每个窗口的宽度均与该字符框集合中字符框的宽度相等。至于每个窗口的高度,可以与该字符框集合中字符框的高度相等,也可以大于该字符框集合中字符框的高度,或者小于该字符框集合中字符框的高度,本实施例对此不做限定。
203b、根据该字符框集合中每个字符框与该初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口,将该多个窗口中每个窗口内的字符框的个数组成字符分布向量。
在实际应用中,当以该初始位置为起点创建多个窗口时,该字符框集合中的每个字符框会与一个窗口或者两个窗口相交,则该处理装置可以根据该字符框集合中每个字符框与该初始位置之间的距离以及每个窗口的位置,确定每个字符框相交的窗口,并确定每个字符框所在的窗口,从而获取每个窗口内的字符框个数。
对于一个字符框,当该字符框同时与第一窗口和第二窗口相交时,可以确定该字符框同时位于第一窗口和第二窗口中,或者,还可以分别确定该字符框与两个窗口的相交宽度,当该字符框与第一窗口的相交宽度大于该字符框与该第二窗口的相交宽度时,确定该字符框位于第一窗口中,本实施例对此不做限定。
例如,对于每个字符框,该处理装置可以获取该字符框左边界的横坐标与该初始位置之间的距离,计算该距离与字符框的宽度之间的商,根据计算结果,确定该字符框所在的窗口。例如,当某一字符框的计算结果为3.4时,表示该字符框的左边界位于第4个窗口中,则该字符框与第4个窗口和第5个窗口相交,则可以确定该字符框同时位于第4个窗口和第5个窗口,或者,该字符框的左边界与第4个窗口的左边界仅距离0.4倍的字符框宽度,则可以确定该字符框位于第4个窗口中。
该处理装置确定每个窗口内字符框的个数后,可以将每个窗口内的字符框的个数组成字符分布向量,以该字符分布向量表示该多个字符框的分布情况。
参见图3G,该字符框集合中包括四个字符框:字符框A、字符框B、字符框C和字符框D,该预设模板的特征向量维数为6,将字符框A的左边界作为起始位置,创建6个窗口,每个窗口的宽度与字符框的宽度相等,4个字符框与6个窗口之间的相对位置如图3G所示,则可以确定字符框A位于窗口1中,字符框B位于窗口2中,字符框C位于窗口4中,字符框D位于窗口5中,则从窗口1到窗口6,每个窗口中字符框的个数依次为1、1、0、1、1、0,则该字符分布向量为[1,1,0,1,1,0]。
203c、对该预设模板的特征向量与该字符分布向量进行点乘运算,得到该初始位置与该预设模板的匹配分值。
为了确定该字符框集合与该预设模板的匹配程度,该处理装置可以对该预设模板的特征向量与该字符分布向量进行点乘运算,将计算出的结果作为该初始位置与该预设模板的匹配分值。也即是应用以下公式,计算该初始位置与该预设模板的匹配分值:
v _ i ( x , y ) = Σ k = 1 n P i ( k ) * a ( k ) ;
其中,v_i(x,y)表示初始位置(x,y)与预设模板i的匹配分值,n表示该预设模板i的特征向量的维数,Pi(k)表示该预设模板i的特征向量中的第k个元素,a(k)表示该字符分布向量中第k个元素。
基于步骤203b的举例,该字符分布向量为[1,1,0,1,1,0],而该特征向量为[-1,1,-1,1,1,-1],则该初始位置与该预设模板的匹配分值为-1+1+0+1+1+0=2。
另外,该处理装置在选取初始位置时,可以按照步长进行搜索,该步长越小,匹配的精确度越高,计算量越大,而该步长越大,匹配的精确度越低,计算量越小,则该处理装置可以根据字符框的宽度确定步长,本实施例对该步长的具体数值不做限定。
在本实施例中,为了提高精确度,该处理装置可以先以该第一预设阈值为步长,该第一阈值小于该字符框集合中字符框的宽度,根据该第一预设阈值,选取出多个第一局部初始位置,对于选取的每个第一局部初始位置,根据该字符框集合中每个字符框与该第一局部初始位置之间的距离和该预设模板的特征向量,计算该第一局部初始位置与该预设模板的匹配分值,计算出该多个第一局部初始位置与该预设模板的匹配分值后,从该多个第一局部初始位置中,选取与该预设模板的匹配分值最大的第一局部初始位置。此时,该处理装置可以将选取的第一局部初始位置作为优选初始位置,该优选初始位置是指与该预设模板最为匹配的初始位置。
另外,由于该第一预设阈值较小,为了防止当前选取的初始位置仅是局部区域的最优初始位置,而不是该字符区域的最优初始位置,该处理装置在选取与该预设模板的匹配分值最大的第一局部初始位置之后,可以继续执行下述步骤204,找到全局最优的初始位置。
在步骤204中,处理装置以与该预设模板的匹配分值最大的第一局部初始位置为起点、以该字符框集合中字符框的宽度为步长,从该字符区域中,选取多个全局初始位置,对于选取的每个全局初始位置,根据该字符框集合中每个字符框与该全局初始位置之间的距离和该预设模板的特征向量,计算该全局初始位置与该预设模板的匹配分值,计算出该多个全局初始位置与该预设模板的匹配分值后,从该多个全局初始位置中,选取与该预设模板的匹配分值最大的全局初始位置。
该处理装置从该多个第一局部初始位置中,选取与该预设模板的匹配分值最大的第一局部初始位置时,以该第一局部初始位置作为起点,以该字符框集合中字符框的宽度为步长,从该字符区域中,选取多个全局初始位置,再对每个全局初始位置进行计算,计算过程与上述步骤203a-203c类似。计算出该多个全局初始位置与该预设模板的匹配分值后,可以从该多个全局初始位置中,选取与该预设模板的匹配分值最大的全局初始位置。此时,该处理装置可以将选取的全局初始位置作为优选初始位置。
另外,由于该字符框集合中字符框的宽度较大,以该字符框集合中字符框的宽度为步长时精确度不高,则为了提高精确度,该处理装置选取与该预设模板的匹配分值最大的全局初始位置之后,还可以继续执行步骤205,在该匹配分值最大的全局初始位置附近,选取出更为匹配的第二局部初始位置。
在步骤205中,处理装置以与该预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从该字符区域中,选取多个第二局部初始位置,对于选取的每个第二局部初始位置,根据该字符框集合中每个字符框与该第二局部初始位置之间的距离和该预设模板的特征向量,计算该多个第二局部初始位置与该预设模板的匹配分值,从该多个第二局部初始位置中,选取与该预设模板的匹配分值最大的第二局部初始位置,作为优选初始位置。
该处理装置选取与该预设模板的匹配分值最大的全局初始位置之后,以与该预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从该字符区域中,选取多个第二局部初始位置,再对每个第二局部初始位置进行计算,计算过程与上述步骤203a-203c类似。计算出该多个第二局部初始位置与该预设模板的匹配分值,从该多个第二局部初始位置中,选取与该预设模板的匹配分值最大的第二局部初始位置,作为优选初始位置。
其中,该第二预设阈值小于该第一预设阈值,该第二预设阈值可以根据该处理装置对精确度的需求确定,本实施例对此不做限定。通过在找到全局最优初始位置后,以较小的第二预设阈值为步长,在该全局最优初始位置的附近进行微调,得到最终的优选初始位置。本实施例采用不同步长交替搜索的方式来选取初始位置,既能够避免陷入局部最优,也能够提高匹配精确度,而且降低了算法的复杂度。
需要说明的是,本实施例在每次选取最优初始位置时,仅以先选取多个初始位置,再计算每个初始位置与该预设模板的匹配分值为例进行说明,而在实际应用中,也可以每选取任一初始位置后,计算该初始位置与该预设模板的匹配分值,再选取下一个初始位置,计算该下一个初始位置与该预设模板的匹配分值,以此类推,本实施例对此不做限定。
在步骤206中,处理装置将该优选初始位置与该预设模板的匹配分值作为该预设模板的指定匹配分值,将该指定匹配分值与该预设模板的特征向量的维数之间的商作为该预设模板的优选匹配分值。
在多个初始位置中,该处理装置选取出与该预设模板的匹配分值最大的优选初始位置,并将该该优选初始位置与该预设模板的匹配分值作为指定匹配分值,该指定匹配分值可以用于表示以该优选初始位置为初始位置时,该字符框集合与该预设模板之间的匹配程度。
对于多种预设模板来说,预设模板的特征向量的维数不同,该维数会对该预设模板的匹配分值造成影响,则为了在同一标准上对不同的预设模板进行比较,该处理装置可以将每种预设模板的指定匹配分值与对应的特征向量的维数之间的商作为对应预设模板的优选匹配分值,此时,该处理装置可以对每种预设模板的优选匹配分值进行比较,优选匹配分值越大,表示该字符框集合与该预设模板越匹配。
在步骤207中,处理装置从该多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板,根据该优选预设模板的特征向量和该优选预设模板对应的优选初始位置,对该字符框集合进行分割。
该处理装置可以从多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板,获取该优选预设模板对应的优选初始位置,则可以认为该优选初始位置即为该字符框集合中字符框的起始位置,且该优选预设模板中规定的字符分布方式即为该字符框集合中的字符分布方式,则该处理装置可以根据该优选预设模板的特征向量和该优选预设模板对应的优选初始位置,对该字符框集合进行分割。
该处理装置可以从以该优选预设模板对应的优选初始位置为起点的多个窗口中,提取与该优选预设模板的特征向量中的指定元素对应的窗口,该指定元素是指该特征向量中用于表示字符的元素,按照提取出的窗口的位置,对该字符框集合进行分割。
例如,该优选预设模板的特征向量为[-1,1,-1,1,1,-1],则该处理装置获取以该优选初始位置为起点的多个窗口,并提取第2个窗口、第4个窗口和第5个窗口,这三个窗口中的字符框中包括字符,则按照这三个窗口的位置对该字符框集合进行分割。
相关技术中,获取原始图像的投影图,投影图会在任两个相邻字符之间的位置形成波谷,在任一字符上的位置形成波峰,则根据该投影图上波谷的位置,对原始图像进行分割。但原始图像通常会有噪声,容易造成字符的断裂或者交叠等情况,进而导致投影得到的投影图中波谷不明显,根据波谷的位置进行分割时,会影响字符分割的准确性,最终影响字符的识别正确率。
而本实施例中,在进行分割的同时,根据该字符框集合中每个字符框的位置,找出与每种预设模板最匹配的优选初始位置及相应的优选匹配分值,从而确定与该字符框集合最为匹配的优选预设模板,确定该字符框集合中字符框的分布方式,则根据该优选预设模板对字符框集合进行分割时,能够提高字符分割的准确率,对分割后的字符进行字符识别时,能够提高识别准确率。该方法适用于有严重噪声干扰的情况,避免了噪声的影响,保证了字符分割和字符识别的准确性。
本实施例提供的方法,通过在提取到原始图像的字符框集合时,并未直接按照字符框集合中字符框的位置进行分割,而是获取多种预设模板的特征向量,根据该字符框集合中每个字符框的位置,找出与每种预设模板最匹配的优选初始位置及相应的优选匹配分值,根据确定的多个优选匹配分值,找出与该字符框集合最为匹配的优选预设模板,从而根据该优选预设模板,确定该字符框集合中字符框的分布方式,根据该优选预设模板对字符框集合进行分割时,适用于有严重噪声干扰的情况,避免了噪声的影响,可以精确确定该字符区域中字符串的位置和其中每个字符的位置,能够提高字符分割的准确率,对分割后的字符进行字符识别时,能够提高识别准确率。
图4是根据一示例性实施例示出的一种字符分割装置的框图。参见图4,该装置包括提取模块401,获取模块402,初始选取模块403,计算模块404,匹配选取模块405,确定模块406,模板选取模块407和分割模块408。
提取模块401,用于提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取模块402,用于获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
初始选取模块403,用于对于每种预设模板,从所述字符区域中,选取多个初始位置;
计算模块404,用于对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
匹配选取模块405,用于从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
确定模块406,用于将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
模板选取模块407,用于从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
分割模块408,用于根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
本实施例提供的装置,通过在提取到原始图像的字符框集合时,并未直接按照字符框集合中字符框的位置进行分割,而是获取多种预设模板的特征向量,根据该字符框集合中每个字符框的位置,找出与每种预设模板最匹配的优选初始位置及相应的优选匹配分值,根据确定的多个优选匹配分值,找出与该字符框集合最为匹配的优选预设模板,从而根据该优选预设模板,确定该字符框集合中字符框的分布方式,根据该优选预设模板对字符框集合进行分割时,能够提高字符分割的准确率,对分割后的字符进行字符识别时,能够提高识别准确率。
在另一实施例中,所述提取模块401用于对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
在另一实施例中,所述初始选取模块403还用于以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述计算模块404还用于计算每个第一局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块405还用于从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
在另一实施例中,所述初始选取模块403还用于以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
所述计算模块404还用于计算每个全局初始位置与所述预设模板的匹配分值;
所述匹配选取模块405还用于从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置。
在另一实施例中,所述初始选取模块403还用于以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
所述计算模块404还用于计算每个第二局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块405还用于从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置。
在另一实施例中,所述计算模块404用于以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
在另一实施例中,所述分割模块408还用于从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;按照提取出的窗口的位置,对所述字符框集合进行分割。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是:上述实施例提供的字符分割装置在对字符进行分割时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将处理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的字符分割装置与字符分割方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5是根据一示例性实施例示出的一种用于字符分割的装置500的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到装置500的打开/关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述字符分割方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理装置的处理器执行时,使得处理装置能够执行一种字符分割方法,所述方法包括:
提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
对于每种预设模板,
从所述字符区域中,选取多个初始位置;
对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
在另一实施例中,所述提取原始图像的字符区域,包括:
对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;
根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;
根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;
对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;
根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
在另一实施例中,所述从所述字符区域中,选取多个初始位置,包括:
以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置,包括:
从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
在另一实施例中,所述从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
执行计算每个全局初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置的步骤。
在另一实施例中,所述从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
执行计算每个第二局部初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置的步骤。
在另一实施例中,所述根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,包括:
以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;
根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;
将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;
对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
在另一实施例中,所述根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割,包括:
从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;
按照提取出的窗口的位置,对所述字符框集合进行分割。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种字符分割方法,其特征在于,所述方法包括:
提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
对于每种预设模板,
从所述字符区域中,选取多个初始位置;
对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
2.根据权利要求1所述的方法,其特征在于,所述提取原始图像的字符区域,包括:
对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;
根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;
根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;
对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;
根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
3.根据权利要求1所述的方法,其特征在于,所述从所述字符区域中,选取多个初始位置,包括:
以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置,包括:
从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
4.根据权利要求3所述的方法,其特征在于,所述从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
执行计算每个全局初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置的步骤。
5.根据权利要求4所述的方法,其特征在于,所述从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置之后,所述方法还包括:
以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
执行计算每个第二局部初始位置与所述预设模板的匹配分值的步骤;
执行从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置的步骤。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,包括:
以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;
根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;
将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;
对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
7.根据权利要求6所述的方法,其特征在于,所述根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割,包括:
从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;
按照提取出的窗口的位置,对所述字符框集合进行分割。
8.一种字符分割装置,其特征在于,所述装置包括:
提取模块,用于提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取模块,用于获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
初始选取模块,用于对于每种预设模板,从所述字符区域中,选取多个初始位置;
计算模块,用于对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
匹配选取模块,用于从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
确定模块,用于将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
模板选取模块,用于从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
分割模块,用于根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
9.根据权利要求8所述的装置,其特征在于,所述提取模块用于对所述原始图像进行检测,得到第一字符框集合,所述第一字符框集合中包括多个字符框;根据所述第一字符框集合中每个字符框的尺寸,对所述第一字符框集合中的多个字符框进行过滤,得到第二字符框集合,使得所述第二字符框集合中多个字符框的尺寸相同;根据所述第二字符框集合中每个字符框的指定坐标点的位置,进行直线拟合,得到第一直线,并将所述第二字符框集合中,所述指定坐标点位于所述第一直线上的字符框组成第三字符框集合;对所述原始图像进行旋转变换,得到第一图像,使得在所述第一图像中,由所述第一直线旋转后形成的第二直线位于水平方向;根据所述第二直线在所述第一图像中的位置以及由所述第三字符框集合旋转后形成的第四字符框集合在所述第一图像中的位置,从所述第一图像中,提取所述字符区域,使得所述字符区域包括所述第四字符框集合。
10.根据权利要求8所述的装置,其特征在于,所述初始选取模块还用于以第一预设阈值为步长,从所述字符区域中,选取多个第一局部初始位置,所述第一预设阈值小于所述字符框集合中字符框的宽度;
所述计算模块还用于计算每个第一局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个第一局部初始位置中,选取与所述预设模板的匹配分值最大的第一局部初始位置,作为所述优选初始位置。
11.根据权利要求10所述的装置,其特征在于,所述初始选取模块还用于以所述与所述预设模板的匹配分值最大的第一局部初始位置为起点、以所述字符框集合中字符框的宽度为步长,从所述字符区域中,选取多个全局初始位置;
所述计算模块还用于计算每个全局初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个全局初始位置中,选取与所述预设模板的匹配分值最大的全局初始位置,作为所述优选初始位置。
12.根据权利要求11所述的装置,其特征在于,所述初始选取模块还用于以所述与所述预设模板的匹配分值最大的全局初始位置为起点、以第二预设阈值为步长,从所述字符区域中,选取多个第二局部初始位置,所述第二预设阈值小于所述第一预设阈值;
所述计算模块还用于计算每个第二局部初始位置与所述预设模板的匹配分值;
所述匹配选取模块还用于从所述多个第二局部初始位置中,选取与所述预设模板的匹配分值最大的第二局部初始位置,作为所述优选初始位置。
13.根据权利要求8-12任一项所述的装置,其特征在于,所述计算模块用于以所述初始位置为起点,创建多个连续的窗口,每个窗口的宽度均与所述字符框集合中字符框的宽度相等,所创建窗口的数目与所述预设模板的特征向量的维数相同;根据所述字符框集合中每个字符框与所述初始位置之间的距离以及每个窗口的位置,确定每个字符框所在的窗口;将所述多个窗口中每个窗口内的字符框的个数组成字符分布向量;对所述预设模板的特征向量与所述字符分布向量进行点乘运算,得到所述初始位置与所述预设模板的匹配分值。
14.根据权利要求13所述的装置,其特征在于,所述分割模块还用于从以所述优选预设模板对应的优选初始位置为起点的多个窗口中,提取与所述优选预设模板的特征向量中的指定元素对应的窗口,所述指定元素是指所述特征向量中用于表示字符的元素;按照提取出的窗口的位置,对所述字符框集合进行分割。
15.一种字符分割装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
提取原始图像的字符区域,所述字符区域内包括字符框集合,所述字符框集合包括多个尺寸相同的字符框;
获取多种预设模板的特征向量,每种预设模板的特征向量用于确定对应的字符分布方式;
对于每种预设模板,
从所述字符区域中,选取多个初始位置;
对于选取的每个初始位置,根据所述字符框集合中每个字符框与所述初始位置之间的距离和所述预设模板的特征向量,计算所述初始位置与所述预设模板的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式与所述预设模板之间的匹配程度;
从所述多个初始位置中,选取与所述预设模板的匹配分值最大的初始位置,作为优选初始位置;
将所述优选初始位置与所述预设模板的匹配分值作为所述预设模板的指定匹配分值,将所述指定匹配分值与所述预设模板的特征向量的维数之间的商作为所述预设模板的优选匹配分值;
从所述多种预设模板中,选取优选匹配分值最大的预设模板,作为优选预设模板;
根据所述优选预设模板的特征向量和所述优选预设模板对应的优选初始位置,对所述字符框集合进行分割。
CN201510382075.5A 2015-06-30 2015-06-30 字符分割方法和装置 Active CN105095860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510382075.5A CN105095860B (zh) 2015-06-30 2015-06-30 字符分割方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510382075.5A CN105095860B (zh) 2015-06-30 2015-06-30 字符分割方法和装置

Publications (2)

Publication Number Publication Date
CN105095860A true CN105095860A (zh) 2015-11-25
CN105095860B CN105095860B (zh) 2018-05-29

Family

ID=54576249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510382075.5A Active CN105095860B (zh) 2015-06-30 2015-06-30 字符分割方法和装置

Country Status (1)

Country Link
CN (1) CN105095860B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022346A (zh) * 2016-05-24 2016-10-12 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106886996A (zh) * 2017-02-10 2017-06-23 九次方大数据信息集团有限公司 基于数学运算验证码图像的分割方法和装置
CN108460003A (zh) * 2018-02-02 2018-08-28 广州视源电子科技股份有限公司 文本数据的处理方法和装置
CN109598271A (zh) * 2018-12-10 2019-04-09 北京奇艺世纪科技有限公司 一种字符分割方法及装置
CN110490190A (zh) * 2019-07-04 2019-11-22 贝壳技术有限公司 一种结构化图像文字识别方法及系统
CN110705552A (zh) * 2019-10-11 2020-01-17 沈阳民航东北凯亚有限公司 行李托盘识别方法及装置
CN111831869A (zh) * 2020-06-30 2020-10-27 深圳价值在线信息科技股份有限公司 一种字符串的查重方法、装置、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法
CN104715252A (zh) * 2015-03-12 2015-06-17 电子科技大学 一种动态模板结合像素点的车牌字符分割方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
CN104715252A (zh) * 2015-03-12 2015-06-17 电子科技大学 一种动态模板结合像素点的车牌字符分割方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022346A (zh) * 2016-05-24 2016-10-12 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106022346B (zh) * 2016-05-24 2019-06-07 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106886996A (zh) * 2017-02-10 2017-06-23 九次方大数据信息集团有限公司 基于数学运算验证码图像的分割方法和装置
CN108460003A (zh) * 2018-02-02 2018-08-28 广州视源电子科技股份有限公司 文本数据的处理方法和装置
CN109598271A (zh) * 2018-12-10 2019-04-09 北京奇艺世纪科技有限公司 一种字符分割方法及装置
CN110490190A (zh) * 2019-07-04 2019-11-22 贝壳技术有限公司 一种结构化图像文字识别方法及系统
CN110490190B (zh) * 2019-07-04 2021-10-26 贝壳技术有限公司 一种结构化图像文字识别方法及系统
CN110705552A (zh) * 2019-10-11 2020-01-17 沈阳民航东北凯亚有限公司 行李托盘识别方法及装置
CN110705552B (zh) * 2019-10-11 2022-05-06 沈阳民航东北凯亚有限公司 行李托盘识别方法及装置
CN111831869A (zh) * 2020-06-30 2020-10-27 深圳价值在线信息科技股份有限公司 一种字符串的查重方法、装置、终端设备及存储介质
CN111831869B (zh) * 2020-06-30 2023-11-03 深圳价值在线信息科技股份有限公司 一种字符串的查重方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN105095860B (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN105095860A (zh) 字符分割方法和装置
CN105069786B (zh) 直线检测方法及装置
CN105528606A (zh) 区域识别方法及装置
CN105095881A (zh) 人脸识别方法、装置及终端
CN105528602A (zh) 区域识别方法及装置
CN105528600A (zh) 区域识别方法及装置
CN105426818A (zh) 区域提取方法及装置
CN105139415A (zh) 图像前后景分割方法、装置及终端
CN106295638A (zh) 证件图像倾斜校正方法和装置
CN105335754A (zh) 文字识别方法及装置
CN105488511A (zh) 图像的识别方法及装置
CN105469356A (zh) 人脸图像处理方法及装置
CN107832741A (zh) 人脸特征点定位的方法、装置及计算机可读存储介质
CN105550633A (zh) 区域识别方法及装置
CN105354560A (zh) 指纹识别方法及装置
CN105139378A (zh) 卡片边界检测方法及装置
CN105335713A (zh) 指纹识别方法及装置
CN104238912A (zh) 应用控制方法及装置
CN104239879A (zh) 分割字符的方法及装置
CN104504684A (zh) 边缘提取方法和装置
CN105046231A (zh) 人脸检测方法和装置
CN106228556A (zh) 图像质量分析方法和装置
CN105046260A (zh) 图像预处理方法及装置
CN105574512A (zh) 图像处理的方法和装置
CN104484871A (zh) 边缘提取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant