CN106874909B - 一种图像字符的识别方法及其装置 - Google Patents

一种图像字符的识别方法及其装置 Download PDF

Info

Publication number
CN106874909B
CN106874909B CN201710037106.2A CN201710037106A CN106874909B CN 106874909 B CN106874909 B CN 106874909B CN 201710037106 A CN201710037106 A CN 201710037106A CN 106874909 B CN106874909 B CN 106874909B
Authority
CN
China
Prior art keywords
character
image
binaryzation
boundary
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710037106.2A
Other languages
English (en)
Other versions
CN106874909A (zh
Inventor
曹婧蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN201710037106.2A priority Critical patent/CN106874909B/zh
Publication of CN106874909A publication Critical patent/CN106874909A/zh
Application granted granted Critical
Publication of CN106874909B publication Critical patent/CN106874909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明适用于图像处理领域,提供了图像字符的识别方法及装置,方法包括:通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将字符区域图像进行二值化处理,获得字符区域图像对应的二值化字符区域图像;根据二值化字符区域图像以及预设的字符边界确定算法,确定二值化字符区域图像中各字符的第一边界位置信息;根据每个字符的第一边界位置信息,对二值化字符区域图像进行字符分割操作,得到多个字符子图像;将多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定多个字符子图像各自对应的字符信息。本发明通过将包含多字符图像分割为单字符图像,再进行字符识别,解决现有字符识别技术,识别准确率低的问题。

Description

一种图像字符的识别方法及其装置
技术领域
本发明属于图像处理技术领域,尤其涉及一种图像字符的识别方法及其装置。
背景技术
随着图像处理技术的发展,用户经常需要对图像中包含的字符信息进行提取以及识别,例如在纸币真伪识别时,需要提取纸币对应的冠字号信息。然而现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低。
发明内容
本发明实施例的目的在于提供一种图像字符的识别方法及其装置,旨在解决现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低的问题。
第一方面,本发明实施例提供一种图像字符的识别方法,所述图像字符的识别方法包括:
通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;
将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;
根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;
根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;
将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。
第二方面,本发明实施例提供一种图像字符的识别装置,所述图像字符的识别装置包括:
字符区域图像获取单元,用于通过预设的字符区域提取算法,获取图像数据中包含字符图像的字符区域图像;
二值化处理单元,用于通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;
第一边界位置信息确定单元,用于根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;
第一字符分割单元,用于根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;
字符识别单元,用于将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。
实施本发明实施例提供的一种图像字符的识别方法及其装置具有以下有益效果:
本发明实施例通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息,从而可以将包含多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别该单字符图像对应的字符信息。由于在需要识别包含多字符的图像数据时,在识别过程中字符之间容易产生干扰,引入不必要的环境噪声,继而降低识别的准确率。而通过字符分割算法预先对多字符区域图像进行字符分割操作,则可消除在识别过程中字符间干扰的情况,从而提高图像字符的识别效果以及准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像字符的识别方法的流程图;
图2是本发明另一实施例提供的一种图像字符的识别方法的流程图;
图3是本发明实施例提供的一种图像字符的识别装置的结构框图;
图4是本发明另一实施例提供的一种图像字符的识别装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例将包含的多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别单字符图像对应的字符信息,从而解决现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低的问题。
在本发明实施例中,流程的执行主体为图像字符的识别装置。所述图像字符的识别装置可单独作为一设备进行使用,或将本发明实施例提供的装置作为另一设备的功能模块,与该设备的其他功能模块配合使用。具体地,所述图像字符的识别装置可为纸币冠字号字符识别装置,用于识别纸币冠字号区域的字符信息。所述图像为纸币图像,所述字符区域图像为冠字号区域图像,所述字符信息为冠字号信息。图1示出了本发明实施例提供的图像字符的识别方法的实现流程图,详述如下:
在S101中,通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像。
在本实施例中,图像字符的识别装置预先获取了待识别的图像数据,其中所述待识别的图像数据可以为彩色图像、灰度图像以及二值化图像。
在本实施例中,图像字符的识别装置包含字符区域提取算法,该字符区域提取算法用于识别该图像数据中包含的字符区域图像,且字符区域图像的数量可以为多个。由于对于一个图像数据,其包含的字符信息并不一定集中于某一个区域,可能分布于该图像数据中的多个位置,因此,通过字符区域提取算法获取的字符区域图像,数量并不一定为一个。
可选地,在本实施例中,获取的字符区域图像的面积大小相同,即利用预设的窗口执行字符区域图像的获取操作。为了便于后期对字符区域图像中的字符信息进行识别,可统一字符区域图像的尺寸规格。
可选地,在本实施例中,将获取的字符区域图像进行翻转操作,使其面向为正面正方向。由于获取待识别的图像数据时,该图像并非处于正面正方向,因此获取的字符区域图像对应的面向信息也并不一定为正面正方向,为了便于字符识别操作,将会对所有获取的字符区域图像进行翻转操作,使其面向统一。
在S102中,将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像。
在本实施例中,为了便于图像字符的识别装置进行字符识别,将获取得到的字符区域图像进行二值化处理,其中二值化处理的阈值可为装置默认的阈值或根据用户的实际需求进行设置。
在本实施例中,若所述字符区域图像原图像格式即为二值化图像,也将该字符区域图像进行二值化处理,以便于进一步去除环境噪声,继而提高识别的准确率。
在S103中,根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息。
在本实施例中,第一边界位置信息包括但不限于:上下边界的位置信息以及左右边界的位置信息,通过上述四个边界信息可封闭确定单一字符的位置区域。
可选地,在本实施例中,若二值化字符区域图像中的某些字符,由于印刷时纸张偏转或打印机错误等原因,产生一定角度的偏转,因而若直接通过上下左右四个边界对该字符进行定位将产生较大误差。因此可通过对二值化字符区域图像以预设的角度间隔进行旋转,直至该字符正置后,再确定其边界位置信息。
在本实施例中,预设的字符边界确定算法用于确定二值化字符区域图像中各字符的边界,举例性地,该字符区域图像为冠字号区域图像,冠字号区域图像中包含由多个字符顺次排列的冠字号,则通过字符边界确定算法,可确定冠字号内各字母或数字对应的边界位置信息。
在S104中,根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像。
在本实施例中,由于S103中以确定各字符对应的第一边界位置信息,根据该第一边界位置信息,则可将二值化字符区域图像中各字符进行分割操作,从而获得多个字符子图像。
在本实施例中,该字符子图像具体为包含一个字符的图像数据,字符包括但不限于:数字、字母、汉子、标号等。
在S105中,将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。
在本实施例中,图像字符的识别装置存储器中包含各个字符的标准模板,即上述的预设的字符模板。举例性地,所述预设的字符模板包括数字字符模板,其中数字字符模板包括:数字0至9十个数字字符模板。
在本实施例中,将字符子图像分别与预设的字符模板进行匹配,当某一字符模板与该字符子图像匹配成功,则确定该字符模板对应的字符信息为该字符子图像对应的字符信息。举例性地,字符子图像与数字5的字符模板匹配成功,则表示该字符子图像的对应的字符为“5”。
在本实施例中,若所述字符子图像与任一字符模板均不匹配,则判断该字符子图像为噪声信息,不表示任何含义。
以上可以看出,本发明实施例提供的一种图像字符的识别方法通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息,从而可以将包含多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别该单字符图像对应的字符信息。由于在需要识别包含多字符的图像数据时,在识别过程中字符之间容易产生干扰,引入不必要的环境噪声,继而降低识别的准确率。而通过字符分割算法预先对多字符区域图像进行字符分割操作,则可消除在识别过程中字符间干扰的情况,从而提高图像字符的识别效果以及准确率。另一方面,与多字符图像识别技术相比,字符分割技术以及单字符识别技术的运算量较少,因而可提高多字符图像的识别速率。
图2示出了本发明另一实施例提供的一种图像字符的识别方法的流程图。参见图2所述,相对于上一实施例,本实施例提供的一种图像字符的识别方法包括以下步骤,详述如下:
在S201中,通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像。
由于S201与上一实施例中的步骤S101相同,具体请参阅上一实施例中步骤S101的相关描述,此处不再赘述。
在S202中,将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像。
由于S202与上一实施例中的步骤S102相同,具体请参阅上一实施例中步骤S102的相关描述,此处不再赘述。
进一步地,作为本发明的另一实施例,所述根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息具体包括:
在S203中,根据预设的滑动窗口覆盖算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符上下边界对应的行坐标信息。
在本实施例中,预设的滑动窗口覆盖算法具体为:令预设的滑动窗口在所述二值化字符区域图像中按预设的方向进行移动,分别统计每次所述滑动窗口覆盖区域图像的白色像素点数,直到所述滑动窗口遍历所述二值化字符区域图像;将多个所述白色像素点数进行比较,确定白色像素点数最多对应的滑动窗口,读取所述白色像素点最多对应的滑动窗口的位置坐标信息。
在本实施例中,由于二值化字符区域图像经过二值化处理,因此二值化字符区域图像中像素点只存在两种情况,即白色像素点以及黑色像素点。而不考虑噪声影响的情况下,背景部分均以黑色像素点表示,字符部分以白色像素点表示。
在本实施例中,滑动窗口的高度与字符的高度一致,其宽度与二值化字符区域图像的宽度一致。举例性地,若二值化字符区域图像中的字符高度均为25个像素点,则滑动窗口的高度将设置为25个像素点;该二值化字符区域图像的宽度为200个像素点,则滑动窗口的宽度将设置为200个像素点。
在本实施例中,预设的方向具体为二值化字符区域图像的高度方向。滑动窗口在二值化字符区域图像的高度方向上往复移动,直到遍历该二值化字符区域图像。
在本实施例中,通过该滑动窗口遍历该二值化字符区域图像,统计其覆盖图像中包含的白色像素点数,则可得知该滑动窗口中包含的字符数量。由于滑动窗口的高度与字符的高度一致,当白色像素点数最多时,则表明对应的滑动窗口覆盖的图像区域包含了最多的字符信息,此时可确定该时刻滑动窗口的上下边界与二值化字符图像中各字符的上下边界重合。因此,该当白色像素点数最多时对应的滑动窗口的上下边界的位置坐标信息,即为二值化字符区域图像中各字符上下边界对应的行坐标信息。
在S204中,根据预设的列和卷积算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符左右边界对应的列坐标信息。
在本实施例中,预设的列和卷积算法具体为:分别统计所述二值化字符区域图像中各列的像素点的像素值之和,以及预设的模板遍历通过所述二值化字符区域图像时,各列像素点的像素值之和,得到字符图像列和数组以及模板列和数组;将所述字符图像列和数组以及模板列和数组进行卷积运算。
在本实施例中,如S203步骤中所述,背景部分以黑色像素点表示,字符部分以白色像素点表示,而黑色像素点值均为0,而白色像素点值为255。因此,在不考虑噪声因素的情况下,若二值化字符区域图像中某一列不包含字符的像素点,则该列的像素点值之和为0,同理,当包含字符的像素点时,则该列的像素点值之和比不为0。因此,将字符图像列和数组以及模板列和数组进行卷积运算,当卷积值小于预设阈值时,则表明该卷积值对应的列只包含黑色像素点,为边界区域。
在本实施例中,选取卷积值小于预设阈值对应的列位置信息作为字符左右边界对应的列坐标信息。
可选地,在本实施例中,当获取了所有字符的左右边界对应的列坐标信息后,判断最左侧边界位置的左侧区域以及最右侧边界位置的右侧区域,其白色像素点数是否小于预设阈值,若是,则表明边界外的区域不包含其他字符;反之,则表明边界外还包含字符信息,则重新确定各字符左右边界对应的列坐标信息。
在S205中,通过所述行坐标信息以及列坐标信息,确定所述二值化字符区域图像中各字符的第一边界位置信息。
在本实施例中,通过所有的行坐标信息以及所有的列坐标信息,可封闭确定各字符的位置区域。
在本发明实施例中,通过滑动窗口覆盖算法以及列和卷积算法确定二值化字符区域图像的第一边界位置信息。由于滑动窗口覆盖算法以及列和卷积算法进行边界确定,鲁棒性好,提高分割的准确率。另一方面,用户可根据对于精确度的不同要求,设置预设的比较阈值,操作难度小。
在S206中,根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像。
由于S206与上一实施例中的步骤S104相同,具体请参阅上一实施例中步骤S104的相关描述,此处不再赘述。
进一步地,作为本发明的另一实施例,所述根据每个所述字符的边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像之后还包括:
在S207中,根据预设的边界连续识别算法以及所述字符子图像,判断所述字符子图像的边界是否连续。
在本实施例中,通过字符分割操作得到的字符子图像,有可能出现一个字符被切分的情况。因此,可通过检测边界是否连续来判断是否出现字符被切分到两个字符子图像的情况。
在本实施例中,预设的边界连续识别算法可以为判断边界的像素点值是否一致,或者判断边界的行像素点值之和以及列像素点值之和是否小于预设阈值,或者判断边界的白色像素点数是否小于预设阈值。
在本实施例中,若所述字符子图像的边界连续,则执行S211以及S212步骤,进行字符识别操作。
在S208中,若所述字符子图像的边界不连续,则通过预设的二值化优化算法对所述二值化字符区域图像进行处理,获得二次二值化字符区域图像。
在本实施例中,由于已判断存在字符子图像的边界不连续,即表明可能存在字符区域图像被错误分割,此时,需要对字符区域图像重新进行字符边界定位操作并分割。
在本实施例中,造成错误分割的原因可能由于二值化处理不当,而引入过多的噪点,或将字符信息误判为背景信息。因此,需要通过二值化优化算法,对二值化字符区域图像进行二值化优化处理。
在本实施例中,所述二值化优化算法可进行多次迭代操作,即将该二值化字符区域图像进过多次的二值化优化算法处理后,获得优选的二次二值化字符区域图像,以便于字符区域图像中的字符信息更为突出、明显显示。
在S209中,根据预设的字符位置定位算法确定所述二次二值化字符区域图像中各字符的第二边界位置信息。
在本实施例中,由于已判断第一边界位置信息的字符边界识别不准确,因此需要重新确定各字符的边界信息。
在本实施例中,通过预设的字符位置定位算法进一步确定二次二值化字符区域图像中个字符的第二边界位置信息,其中该预设的字符位置定位算法可为图1所示的S103步骤中的字符边界确定算法,或者为图2所述的S203-S205步骤记载的边界确定算法。
进一步地,作为本发明的另一实施例,所述根据预设的字符位置定位算法确定所述二次二值化字符区域图像中各字符的第二边界位置信息具体包括:
在S2091中,根据所述二次二值化字符区域图像包含的像素点的像素点值,分别计算所述二次二值化字符区域图像各行以及各列包含的像素点的像素点值之和,得到行像素点值数组以及列像素点值数组。
在本实施例中,由于将二次二值化字符区域图像中各行包含的像素点的像素点值进行相加,获得对应的行像素点值数组。同样地,将二次二值化字符区域图像中各列包含的像素点的像素点值进行相加,获得对应的列像素点值数组。
在本实施例中,由于背景部分以黑色像素点表示,其像素点值为0,若不考虑噪声因素,对于只包含背景部分的行或列,其对应的像素点值之和将为0,若包含字符信息的行以及列,其像素点值将比不为0。
在S2092中,通过所述行像素点值数组以及列像素点值数组,确定所述二次二值化字符区域图像各字符的第二边界位置信息。
在本实施例中,由于行像素点值数组中各行对应的像素值的大小,可确定字符的上下边界信息,列像素点值数组中各列对应的像素值的大小,可确定字符的左右边界信息,因此通过两个数组,可确定各字符的第二边界位置信息。
举例性地,二次二值化字符子图像中的某一字符边界位置信息为x[5,13]以及y[6,20],其中数组x表示字符的列边界信息,数组y表示字符的行边界信息。且定义白色像素点的像素点值为1,黑色像素点的像素点值为0,边界触发阈值为3。通过计算该二次二值化字符子图像的各行及各列包含的像素点的像素点值之和,得到行像素点值数组为y’[0,0,0,1,0,0,8,6,6,10,12,5,6,8,7,10,8,8,6,0,…,0],得到的列像素点值数组为x’[0,1,0,0,0,9,9,9,8,5,6,12,0,0…,0]。可见,在行像素点值素组中,y’[7]=8,且y’[7]之前行像素点值之和均小于边界触发阈值,当y’[7]至y’[19]间的值均大于边界触发阈值,因此可确定,第6行为该字符的下边界,同理可知,第20行为该字符的上边界。通过相同的判定方法,可以获知字符的左右边界的位置信息。
在本发明实施例中,由于字符区域图像已通过二次二值化算法进行处理,基本消除了环境噪点并加深了字符图像的轮廓信息,因而可通过计算各行、各列像素点的像素点值之和去确认各字符的边界信息,从而减少了确定边界的运算量,提高字符边界识别速率。
在S210中,根据所述第二边界位置信息,对所述二次二值化字符区域图像进行字符分割操作,得到多个优化字符子图像。
在本发明实施例中,对分割后的字符子图像的边界的连续性进行识别校验,当出现断裂的字符子图像时,执行图像优化处理并再次确认边界,重新进行切割操作,从而提高了图像字符的识别装置的识别准确率。若使用断裂的字符子图像进行字符识别,将有可能出现错误识别的情况,因此在进行字符识别前就进行边界连续性校验操作,减少不必要的字符识别操作。
进一步地,作为本发明的另一实施例,所述将所述多个字符子图像与分别预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息具体为:
在S211中,通过预设的夹角余弦算法分别计算字符子图像与各个预设的字符模板的相似度。
在本实施例中,将分割后得到的字符子图像与预设的字符模板,通过夹角余弦算法计算两者的相似度,其中该字符子图像包括由步骤S104或步骤S206中获得的字符子图像,也包括由步骤S210获得优化字符子图像。
在本实施例中,根据字符子图像以及预设的字符模板,建立两个向量矩阵根据余弦定理计算两向量的夹角余弦值,将该夹角余弦值作为两者的相似度。
在S212中,当所述相似度大于预设阈值,则将所述相似度对应的字符模板对应的字符信息识别为所述字符子图像对应的字符信息。
在本实施例中,由于通过夹角余弦计算的相似度的范围为[-1,1],当两者的相似度愈趋近于数值1,则表示两者相似度越大。因此,设定一预设阈值,当该相似度大于该阈值时,则表示两者匹配成功,该字符模板对应的字符信息为该字符子图像对应的字符信息。
举例性地,设置预设阈值为0.88,当某字符子图像与字母“A”的字符模板,经过预设的夹角余弦算法计算得到的相似度为0.92,则表示该字符子图像对应的字符信息为“A”。
在本发明实施例中,通过夹角余弦算法计算两个图像的相似度,从而确定该字符子图像对应的字符信息,计算量少。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图3示出了本发明实施例提供的图像字符的识别装置的结构框图,该图像字符的识别装置包括的各单元执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。
参见图3,该图像字符的识别包括:
字符区域图像获取单元31,用于通过预设的字符区域提取算法,获取图像数据中包含字符图像的字符区域图像;
二值化处理单元32,用于通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;
第一边界位置信息确定单元33,用于根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;
第一字符分割单元34,用于根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;
字符识别单元35,用于将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。
可选地,参见图4所示,在另一实施例中,该实施例中的图像字符的识别用于运行图2对应的实施例中的各步骤,详述如下:
字符区域图像获取单元401,用于通过预设的字符区域提取算法,获取图像数据中包含字符图像的字符区域图像;
二值化处理单元402,用于通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;
可选地,所述第一边界位置信息确定单元具体包括:
上下边界确定单元403,用于根据预设的滑动窗口覆盖算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符上下边界对应的行坐标信息;
左右边界确定单元404,用于根据预设的列和卷积算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符左右边界对应的列坐标信息;
坐标信息边界确定单元405,用于通过所述行坐标信息以及列坐标信息,确定所述二值化字符区域图像中各字符的第一边界位置信息。
第一字符分割单元406,用于根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像。
可选地,所述图像字符的识别装置还包括:
边界连续识别单元407,用于根据预设的边界连续识别算法以及所述字符子图像,判断所述字符子图像的边界是否连续;
二次二值化处理单元408,用于若所述字符子图像的边界不连续,则通过预设的二值化优化算法对所述二值化字符区域图像进行处理,获得二次二值化字符区域图像;
第二边界位置信息确定单元409,用于根据预设的字符位置定位算法确定所述二次二值化字符区域图像各字符的第二边界位置信息;
可选地,所述第二边界位置信息确定单元具体包括:
像素点值统计单元4091,用于根据所述二次二值化字符区域图像包含的像素点的像素点值,分别计算所述二次二值化字符区域图像各行以及各列包含的像素点的像素点值之和,得到行像素点值数组以及列像素点值数组;
像素点值边界确定单元4092,用于通过所述行像素点值数组以及列像素点值数组,确定所述二次二值化字符区域图像各字符的第二边界位置信息。
第二字符分割单元410,用于根据所述第二边界位置信息,对所述二次二值化字符区域图像进行字符分割操作,得到多个优化字符子图像。
可选地,所述字符识别单元具体包括:
夹角余弦计算单元411,用于通过预设的夹角余弦算法分别计算字符子图像与各个预设的字符模板的相似度;
字符信息确定单元412,用于当所述相似度大于预设阈值,则将定所述相似度对应的字符模板对应的字符信息识别为所述字符子图像对应的字符信息。
因此,本发明实施例提供的图像字符的识别装置同样可以将包含多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别该单字符图像对应的字符信息。由于在需要识别包含多字符的图像数据时,在识别过程中字符之间容易产生干扰,引入不必要的环境噪声,继而降低识别的准确率。而通过字符分割算法预先对多字符区域图像进行字符分割操作,则可消除在识别过程中字符间干扰的情况,从而提高图像字符的识别效果以及准确率。另一方面,与多字符图像识别技术相比,字符分割技术以及单字符识别技术的运算量较少,因而可提高多字符图像的识别速率。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种图像字符的识别方法,其特征在于,所述图像字符的识别方法包括:
通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;所述图像数据为纸币图像数据;
将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;
根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;
根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;
将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息;
所述根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息具体包括:
根据预设的滑动窗口覆盖算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符上下边界对应的行坐标信息;所述滑动窗口覆盖算法具体为:统计每次所述滑动窗口覆盖区域图像的白色像素点数;所述滑动窗口的高度与字符的高度一致,所述滑动窗口的宽度与二值化字符区域图像的宽度一致;
根据预设的列和卷积算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符左右边界对应的列坐标信息;所述列和卷积算法具体为:统计所述二值化字符区域图像中各列的像素点的像素值之和;
通过所述行坐标信息以及列坐标信息,确定所述二值化字符区域图像中各字符的第一边界位置信息。
2.根据权利要求1所述的图像字符的识别方法,其特征在于,所述根据每个所述字符的边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像之后还包括:
根据预设的边界连续识别算法以及所述字符子图像,判断所述字符子图像的边界是否连续;
若所述字符子图像的边界不连续,则通过预设的二值化优化算法对所述二值化字符区域图像进行处理,获得二次二值化字符区域图像;
根据预设的字符位置定位算法确定所述二次二值化字符区域图像中各字符的第二边界位置信息;
根据所述第二边界位置信息,对所述二次二值化字符区域图像进行字符分割操作,得到多个优化字符子图像。
3.根据权利要求2所述的图像字符的识别方法,其特征在于,所述根据预设的字符位置定位算法确定所述二次二值化字符区域图像各字符的第二边界位置信息具体为:
根据所述二次二值化字符区域图像包含的像素点的像素点值,分别计算所述二次二值化字符区域图像各行以及各列包含的像素点的像素点值之和,得到行像素点值数组以及列像素点值数组;
通过所述行像素点值数组以及列像素点值数组,确定所述二次二值化字符区域图像各字符的第二边界位置信息。
4.根据权利要求1所述的图像字符的识别方法,其特征在于,所述将所述多个字符子图像与分别预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息具体为:
通过预设的夹角余弦算法分别计算字符子图像与各个预设的字符模板的相似度;
当所述相似度大于预设阈值,则将所述相似度对应的字符模板对应的字符信息识别为所述字符子图像对应的字符信息。
5.一种图像字符的识别装置,其特征在于,所述图像字符的识别装置包括:
字符区域图像获取单元,用于通过预设的字符区域提取算法,获取图像数据中包含字符图像的字符区域图像;所述图像数据为纸币图像数据;
二值化处理单元,用于通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;
第一边界位置信息确定单元,用于根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;
第一字符分割单元,用于根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;
字符识别单元,用于将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息;
所述第一边界位置信息确定单元具体包括:
上下边界确定单元,用于根据预设的滑动窗口覆盖算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符上下边界对应的行坐标信息;所述滑动窗口覆盖算法具体为:统计每次所述滑动窗口覆盖区域图像的白色像素点数;所述滑动窗口的高度与字符的高度一致,所述滑动窗口的宽度与二值化字符区域图像的宽度一致;
左右边界确定单元,用于根据预设的列和卷积算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符左右边界对应的列坐标信息;所述列和卷积算法具体为:统计所述二值化字符区域图像中各列的像素点的像素值之和;
坐标信息边界确定单元,用于通过所述行坐标信息以及列坐标信息,确定所述二值化字符区域图像中各字符的第一边界位置信息。
6.根据权利要求5所述的图像字符的识别装置,其特征在于,所述图像字符的识别装置还包括:
边界连续识别单元,用于根据预设的边界连续识别算法以及所述字符子图像,判断所述字符子图像的边界是否连续;
二次二值化处理单元,用于若所述字符子图像的边界不连续,则通过预设的二值化优化算法对所述二值化字符区域图像进行处理,获得二次二值化字符区域图像;
第二边界位置信息确定单元,用于根据预设的字符位置定位算法确定所述二次二值化字符区域图像各字符的第二边界位置信息;
第二字符分割单元,用于根据所述第二边界位置信息,对所述二次二值化字符区域图像进行字符分割操作,得到多个优化字符子图像。
7.根据权利要求6所述的图像字符的识别装置,其特征在于,所述第二边界位置信息确定单元具体包括:
像素点值统计单元,用于根据所述二次二值化字符区域图像包含的像素点的像素点值,分别计算所述二次二值化字符区域图像各行以及各列包含的像素点的像素点值之和,得到行像素点值数组以及列像素点值数组;
像素点值边界确定单元,用于通过所述行像素点值数组以及列像素点值数组,确定所述二次二值化字符区域图像各字符的第二边界位置信息。
8.根据权利要求5所述的图像字符的识别装置,其特征在于,所述字符识别单元具体包括:
夹角余弦计算单元,用于通过预设的夹角余弦算法分别计算字符子图像与各个预设的字符模板的相似度;
字符信息确定单元,用于当所述相似度大于预设阈值,则将定所述相似度对应的字符模板对应的字符信息识别为所述字符子图像对应的字符信息。
CN201710037106.2A 2017-01-18 2017-01-18 一种图像字符的识别方法及其装置 Active CN106874909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710037106.2A CN106874909B (zh) 2017-01-18 2017-01-18 一种图像字符的识别方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710037106.2A CN106874909B (zh) 2017-01-18 2017-01-18 一种图像字符的识别方法及其装置

Publications (2)

Publication Number Publication Date
CN106874909A CN106874909A (zh) 2017-06-20
CN106874909B true CN106874909B (zh) 2019-10-11

Family

ID=59158686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710037106.2A Active CN106874909B (zh) 2017-01-18 2017-01-18 一种图像字符的识别方法及其装置

Country Status (1)

Country Link
CN (1) CN106874909B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358718B (zh) * 2017-07-10 2019-09-20 深圳怡化电脑股份有限公司 一种冠字号识别方法、装置、设备及存储介质
CN107437294B (zh) * 2017-08-01 2020-05-01 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
CN107506767B (zh) * 2017-09-22 2021-04-30 江苏海事职业技术学院 一种图片内数字粘连识别的方法和装置
CN108460003B (zh) * 2018-02-02 2021-12-03 广州视源电子科技股份有限公司 文本数据的处理方法和装置
CN108765691A (zh) * 2018-04-08 2018-11-06 深圳怡化电脑股份有限公司 检测脱墨纸币的方法、装置及电子设备
CN108717744B (zh) * 2018-04-27 2020-08-18 深圳怡化电脑股份有限公司 识别金融单据上的印章序号的方法、装置及终端设备
CN108664626A (zh) * 2018-05-14 2018-10-16 北京奇艺世纪科技有限公司 一种标题一致性检测方法、装置及电子设备
CN110633457B (zh) * 2018-06-22 2023-05-26 广州金山移动科技有限公司 一种内容替换方法、装置、电子设备及可读存储介质
CN110942074B (zh) * 2018-09-25 2024-04-09 京东科技控股股份有限公司 字符切分识别方法、装置、电子设备、存储介质
CN111079735B (zh) * 2018-10-22 2023-12-22 莱芜钢铁集团电子有限公司 一种铸坯端面字符识别方法及装置
CN110705442B (zh) * 2019-09-27 2023-07-18 集美大学 一种试卷答案自动获取方法、终端设备及存储介质
CN111091128B (zh) * 2019-12-18 2023-09-22 北京数衍科技有限公司 字符图片分类方法、装置和电子设备
CN112016565B (zh) * 2020-10-27 2021-06-04 恒银金融科技股份有限公司 一种金融票据的账号处模糊数字的分割方法
CN113822288B (zh) * 2021-11-24 2022-02-15 广东电网有限责任公司湛江供电局 一种二次线电缆白头快速核对方法及系统
CN114187596A (zh) * 2022-02-15 2022-03-15 成都爱旗科技有限公司 一种芯片表面字符检测系统
CN114445814B (zh) * 2022-04-06 2022-07-08 深圳市华汉伟业科技有限公司 一种字符区域提取方法、计算机可读存储介质
CN115578734B (zh) * 2022-09-23 2023-06-13 神州数码系统集成服务有限公司 一种基于金字塔特征的单一字符图像匹配识别方法
CN117456542B (zh) * 2023-12-26 2024-04-26 苏州镁伽科技有限公司 图像匹配方法、装置、电子设备及存储介质
CN117710987A (zh) * 2024-02-06 2024-03-15 武汉卓目科技有限公司 冠字号分割方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142168A (zh) * 2011-01-14 2011-08-03 哈尔滨工业大学 纸币清分机高速高分辨率号码采集装置及其识别方法
CN102779275A (zh) * 2012-07-04 2012-11-14 广州广电运通金融电子股份有限公司 一种纸类字符识别方法及相关装置
CN102945368A (zh) * 2012-10-17 2013-02-27 西安理工大学 啤酒瓶盖激光字符的定位识别方法
CN104239909A (zh) * 2014-08-11 2014-12-24 北京捷通华声语音技术有限公司 一种图像的识别方法和装置
CN104318238A (zh) * 2014-11-10 2015-01-28 广州御银科技股份有限公司 一种验钞模块中对扫描的钞票图提取冠字号的方法
CN106056751A (zh) * 2016-05-20 2016-10-26 聚龙股份有限公司 冠字号码的识别方法及系统
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142168A (zh) * 2011-01-14 2011-08-03 哈尔滨工业大学 纸币清分机高速高分辨率号码采集装置及其识别方法
CN102779275A (zh) * 2012-07-04 2012-11-14 广州广电运通金融电子股份有限公司 一种纸类字符识别方法及相关装置
CN102945368A (zh) * 2012-10-17 2013-02-27 西安理工大学 啤酒瓶盖激光字符的定位识别方法
CN104239909A (zh) * 2014-08-11 2014-12-24 北京捷通华声语音技术有限公司 一种图像的识别方法和装置
CN104318238A (zh) * 2014-11-10 2015-01-28 广州御银科技股份有限公司 一种验钞模块中对扫描的钞票图提取冠字号的方法
CN106056751A (zh) * 2016-05-20 2016-10-26 聚龙股份有限公司 冠字号码的识别方法及系统
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法

Also Published As

Publication number Publication date
CN106874909A (zh) 2017-06-20

Similar Documents

Publication Publication Date Title
CN106874909B (zh) 一种图像字符的识别方法及其装置
CN109766885B (zh) 一种文字检测方法、装置、电子设备及存储介质
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
CN108491848B (zh) 基于深度信息的图像显著性检测方法和装置
KR20140010164A (ko) 객체에서 텍스트 정보를 인식하기 위한 시스템 및 방법
US20160284089A1 (en) Apparatus and method for automatically registering landmarks in three-dimensional medical image
CN111178355B (zh) 印章识别方法、装置和存储介质
CN112418216A (zh) 一种复杂自然场景图像中的文字检测方法
CN112070658A (zh) 一种基于深度学习的汉字字体风格迁移方法
CN109189970A (zh) 图片相似度比对方法和装置
CN108830780A (zh) 图像处理方法及装置、电子设备、存储介质
CN107545223B (zh) 图像识别方法及电子设备
CN109740040B (zh) 验证码识别方法、装置、存储介质和计算机设备
US20210124976A1 (en) Apparatus and method for calculating similarity of images
CN116311214B (zh) 车牌识别方法和装置
CN111401099A (zh) 文本识别方法、装置以及存储介质
CN107038445A (zh) 一种针对中文字符验证码的二值化和分割方法
CN109740674A (zh) 一种图像处理方法、装置、设备和存储介质
CN110363190A (zh) 一种文字识别方法、装置及设备
CN112966685A (zh) 用于场景文本识别的攻击网络训练方法、装置及相关设备
Nasri et al. A novel approach for dynamic hand gesture recognition using contour-based similarity images
Kim et al. Robust facial landmark extraction scheme using multiple convolutional neural networks
CN108921006B (zh) 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
US9684844B1 (en) Method and apparatus for normalizing character included in an image
CN105740878A (zh) 地理信息系统的符号识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant