CN111814795A - 字符分割方法、装置及计算机可读存储介质 - Google Patents

字符分割方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111814795A
CN111814795A CN202010503803.4A CN202010503803A CN111814795A CN 111814795 A CN111814795 A CN 111814795A CN 202010503803 A CN202010503803 A CN 202010503803A CN 111814795 A CN111814795 A CN 111814795A
Authority
CN
China
Prior art keywords
character image
pixels
boundary
character
projection size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010503803.4A
Other languages
English (en)
Inventor
翟新刚
张涛
张楠赓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canaan Bright Sight Co Ltd
Original Assignee
Canaan Creative Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canaan Creative Co Ltd filed Critical Canaan Creative Co Ltd
Priority to CN202010503803.4A priority Critical patent/CN111814795A/zh
Publication of CN111814795A publication Critical patent/CN111814795A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种字符分割方法,装置及其计算机可读存储介质,该方法包括:获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。利用上述方法,能够获得更好的字符分割效果,进而使得字符识别正确率更高。

Description

字符分割方法、装置及计算机可读存储介质
技术领域
本发明属于图像识别技术领域,具体涉及一种字符分割方法、装置及其计算机可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着智能化系统的日益发展和完善,远程抄表技术的兴起解决了人工抄表统计工作的困难,成为为现代化管理系统的重要组成部分。具有无线抄表功能的计量表如水表、电表、燃气表等已开始在住宅区、高档园区逐渐使用。
虽然深度学习在很多场景下已经有了很好的应用,但是在某些场景下由于数据集数量以及质量的原因,解决方案并不够鲁棒。例如在处理黑底白字型机械水表的字符样本采集的时候,可以选用如图1所示水表样式中的字符,该字符黑底完整且无多余,且字符在分割框中处于居中的位置。然而,在实际情况中有很大情况会出现不同于训练集的水表样式,例如,如图2所示,在读数区域中有多余黑底出现,这直接影响了字符的分割效果不好,进而影响字符的识别精度。
发明内容
针对上述现有技术中的问题,提出了一种字符分割方法、装置及计算机可读存储介质,利用这种方法和装置及计算机可读存储介质,能够解决上述问题。
本发明提供了以下方案。
第一方面,提供了一种字符分割方法,包括:获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
在一种可能的实施方式中,根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界,还包括:确定单字符图像的中心位置,并根据单字符图像的宽度与第一预设系数确定第一阈值;在单字符图像中从中心位置向上遍历每一行像素的第一投影尺寸,以及从中心位置向下遍历每一行像素的第二投影尺寸;通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界。
在一种可能的实施方式中,通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界,还包括:其中,若从中心位置向上遍历到的第N行像素的第一投影尺寸超过第一阈值,且从中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过第一阈值,则根据第N行像素确定单字符图像的上边界;和/或,其中,若从中心位置向下遍历到的第M行像素的第一投影尺寸超过第一阈值,且从中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过第一阈值,则根据第M行像素确定单字符图像的下边界。
在一种可能的实施方式中,根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界,包括:确定单字符图像的中心位置,并根据单字符图像的高度与第二预设系数确定第二阈值;在单字符图像中从中心位置向左遍历每一列像素的第三投影尺寸,以及从中心位置向右遍历每一列像素的第四投影尺寸;通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界。
在一种可能的实施方式中,通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界,包括:其中,若从中心位置向左遍历到的第P列像素的第三投影尺寸超过第二阈值,且从中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过第二阈值,则根据第P列像素确定单字符图像的左边界;和/或,其中,若从中心位置向右遍历到的第Q列像素的第四投影尺寸超过第二阈值,且从中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过第二阈值,则根据第Q列像素确定单字符图像的右边界。
在一种可能的实施方式中,方法还包括:确定单字符图像的中心位置,并根据单字符图像的高度与第三预设系数确定第三阈值;在单字符图像中从中心位置向左遍历每一列像素的垂直投影尺寸,以及从中心位置向右遍历每一列像素的垂直投影尺寸;其中,若从中心位置向左遍历到的第X列像素的垂直投影尺寸未超过第三阈值,且从中心位置向左遍历到的第X+1列像素的垂直投影尺寸超过第三阈值,则根据第X列像素确定单字符图像的字符左边界;和/或,其中,若从中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过第三阈值,且从中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过第二阈值,则根据第Y列像素确定单字符图像的字符右边界;以及,根据单字符图像的字符左边界和字符右边界对目标单字符图像的背景区域进行左右平分。
第二方面,提供一种字符分割装置,包括:第一分割单元,用于获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;上下边界单元,用于根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;左右边界单元,用于根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;第二分割单元,用于根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
在一种可能的实施方式中,上下边界单元,还用于:确定单字符图像的中心位置,并根据单字符图像的宽度与第一预设系数确定第一阈值;在单字符图像中从中心位置向上遍历每一行像素的第一投影尺寸,以及从中心位置向下遍历每一行像素的第二投影尺寸;通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界。
在一种可能的实施方式中,上下边界单元,还用于:其中,若从中心位置向上遍历到的第N行像素的第一投影尺寸超过第一阈值,且从中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过第一阈值,则根据第N行像素确定单字符图像的上边界;和/或,其中,若从中心位置向下遍历到的第M行像素的第一投影尺寸超过第一阈值,且从中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过第一阈值,则根据第M行像素确定单字符图像的下边界。
在一种可能的实施方式中,左右边界单元,还用于:确定单字符图像的中心位置,并根据单字符图像的高度与第二预设系数确定第二阈值;在单字符图像中从中心位置向左遍历每一列像素的第三投影尺寸,以及从中心位置向右遍历每一列像素的第四投影尺寸;通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界。
在一种可能的实施方式中,左右边界单元,还用于:其中,若从中心位置向左遍历到的第P列像素的第三投影尺寸超过第二阈值,且从中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过第二阈值,则根据第P列像素确定单字符图像的左边界;和/或,其中,若从中心位置向右遍历到的第Q列像素的第四投影尺寸超过第二阈值,且从中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过第二阈值,则根据第Q列像素确定单字符图像的右边界。
在一种可能的实施方式中,装置还包括左右平分单元,用于:确定单字符图像的中心位置,并根据单字符图像的高度与第三预设系数确定第三阈值;在单字符图像中从中心位置向左遍历每一列像素的垂直投影尺寸,以及从中心位置向右遍历每一列像素的垂直投影尺寸;其中,若从中心位置向左遍历到的第 X列像素的垂直投影尺寸未超过第三阈值,且从中心位置向左遍历到的第X+1 列像素的垂直投影尺寸超过第三阈值,则根据第X列像素确定单字符图像的字符左边界;和/或,其中,若从中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过第三阈值,且从中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过第二阈值,则根据第Y列像素确定单字符图像的字符右边界;以及,根据单字符图像的字符左边界和字符右边界对目标单字符图像的背景区域进行左右平分。
第三方面,提供一种字符分割装置,其特征在于,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被多核处理器执行时,使得多核处理器执行如第一方面中任一项的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本发明通过对测试集数据进行字符分割预处理,将待识别的字符图像中多余的色块去除,改善字符分割的效果,使得测试集与训练集有相似的分布,进而提高字符的识别准确率。
应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举说明本发明的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1示出了现有技术的黑底白字型机械水表的字符样本的示意图;
图2示出了根据本发明实施例的多字符图像的示意图;
图3示出了根据本发明实施例的字符分割方法的流程示意图;
图4a示出了对图2进行二值化处理后得到的二值图像,图4b示出了对图 4a进行第一字符分割后得到的单字符图像;图4c示出了对图4a进行第二字符分割后得到的目标单字符图像;
图5a示出了进行左右平分之前的单字符图像,图5b示出了左右平分之后的单字符图像;
图6示出了根据本发明实施例的字符分割装置的结构示意图;
图7示出了根据本发明实施例的另一字符分割装置的结构示意图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本发明中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图3为根据本申请一实施例的字符分割方法300的流程示意图,该字符分割方法300用于对多字符图像进行分割。在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备,更具体地可以是与这些设备中的摄像头关联的功能模块;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
图3中的流程可以包括以下步骤301~步骤304。
步骤301:获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;
步骤302:根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;
步骤303:根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;
步骤304:根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
例如,在图2中示出了多字符图像的一个示例,该多字符图像可以是灰度图,用于指示诸如生活中常见的水表、燃气表的字轮型计量表的读数。可以理解,由于对多字符图像进行整体识别需要的运算量很大,效率很低且费时费力,因此需要进行字符分割处理,将多字符识别任务分解为单字符识别任务以提升了识别效率。本实施例中,将双半字符图像也视为单字符图像。
如图4a和图4b所示,在步骤301中,进一步对图2中的多字符图像执行二值化处理和第一字符分割,得到多个单字符图像。可以理解,本实施例中将双半字符图像也视为单字符图像。其中,在图4a中示出了对图2进行二值化处理后得到的二值图像,二值化处理指的是将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值图像(Binary Image),二值图像是指图像上的每一个像素只有两种可能值的图像状态,通常可以用黑白、B&W、单色图像表示二值图像。在本实施例中,二值化处理所采用的预设二值阈值具体可以根据经验而预先设定。其中,第一字符分割处理是指将上述二值图像中对应于不同字符的图像区域相互切分开,在图4b中示出了对图4a的二值图像进行第一字符分割得到的各单字符图像(每个方框对应一个单字符图像),例如,通过竖直投影法和水平投影法得到各个单字符在水平方向和在竖直方向的范围,进而根据该范围对该多字符图像进行第一字符分割,得到多个单字符图像。
接下来,遍历每个单字符,在步骤302中,根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界。其中,水平投影尺寸可以理解为每一行黑色像素点的个数(二值化的图像),通过比较每一行像素的水平投影尺寸确定每个单字符的上下边界。进一步,在步骤303 中,根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;其中,垂直投影尺寸可以理解为每一列黑色像素点的个数,通过比较每一列像素的垂直投影尺寸来确定左右边界。
如图4c,在遍历得到每个单字符的上下、左右边界之后,在步骤304中,根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像(每个方框对应一个目标单字符图像)。可以看出,目标单字符图像的分割效果更好,鲁棒性更高。
基于图3的字符分割方法,本申请的一些实施例还提供了该字符分割方法的一些具体实施方案,以及扩展方案,下面进行说明。
在一些可能的实施方式中,步骤302还可以包括:确定单字符图像的中心位置,并根据单字符图像的宽度与第一预设系数确定第一阈值;在单字符图像中从中心位置向上遍历每一行像素的第一投影尺寸,以及从中心位置向下遍历每一行像素的第二投影尺寸;通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界。
在本实施例中,第一投影尺寸和第一投影尺寸均为水平投影尺寸。根据单字符图像的宽度与第一预设系数确定第一阈值,再通过将单字符图像的中心位置以上的每一行像素的第一投影尺寸和第一阈值进行比较得到单字符图像的上边界,将单字符图像的中心位置以下的每一行像素的第二投影尺寸和第一阈值进行比较得到单字符图像的下边界。这样根据各个单字符自身的宽度来设置第一阈值,能够提高上下边界的准确度。
在一些可能的实施方式中,步骤303还可以包括:确定单字符图像的中心位置,并根据单字符图像的高度与第一预设系数确定第二阈值;在单字符图像中从中心位置向左遍历每一列像素的第三投影尺寸,以及从中心位置向右遍历每一列像素的第四投影尺寸;通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界。
在本实施例中,第三投影尺寸和第四投影尺寸均为垂直投影尺寸。根据单字符图像的高度与第一预设系数确定第二阈值,再通过将单字符图像的中心位置以左的每一列像素的第三投影尺寸和第二阈值进行比较得到单字符图像的左边界,将单字符图像的中心位置以右的每一列像素的第四投影尺寸和第二阈值进行比较得到单字符图像的右边界。这样根据各个单字符自身的高度来设置第二阈值,能够提高左右边界的准确度。
在一些可能的实施方式中,上述通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界,具体可以包括:
其中,若从中心位置向上遍历到的第N行像素的第一投影尺寸超过第一阈值,且从中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过第一阈值,则根据第N行像素确定单字符图像的上边界;和/或,
其中,若从中心位置向下遍历到的第M行像素的第一投影尺寸超过第一阈值,且从中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过第一阈值,则根据第M行像素确定单字符图像的下边界。
在本实施例中,例如,第一预设系数为T1=0.5,单字符的宽度W,若从中心位置向上遍历到的第N行像素的第一投影尺寸大于第一阈值T1*W,向上遍历到的第N+1行像素的第一投影尺寸小于或等于第一阈值T1*W时,确定若从中心位置向上遍历到的第N行像素为该单字符图像的上边界,利用类似的方法确定该单字符图像的下边界。
在一些可能的实施方式中,上述通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界,包括:
其中,若从中心位置向左遍历到的第P列像素的第三投影尺寸超过第二阈值,且从中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过第二阈值,则根据第P列像素确定单字符图像的左边界;和/或,
其中,若从中心位置向右遍历到的第Q列像素的第四投影尺寸超过第二阈值,且从中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过第二阈值,则根据第Q列像素确定单字符图像的右边界。
在本实施例中,例如,第二预设系数为T2=0.5,单字符的高度H,若从中心位置向左遍历到的第P列像素的第三投影尺寸大于第二阈值T2*H,向左遍历到的第P+1列像素的第三投影尺寸小于或等于第一阈值T2*H时,确定从中心位置向左遍历到的第P列像素为该单字符图像的左边界,利用类似的方法确定该单字符图像的右边界。
此外,如图2,其最左侧的第一个字符存在字符偏右的问题,而最右侧的最后一个字符存在字符偏左的问题,这同样会造成识别成功率降低。
在一些可能的实施方式中,为了解决上述字符偏左或偏右的问题,在步骤 304之后,方法还包括:确定单字符图像的中心位置,并根据单字符图像的高度与第三预设系数确定第三阈值;其中,第三阈值用于确定字符的边界而非单字符图像的边界,第三预设系数可以大于第二预设系数,例如,在本实施例中第三预设系数可以为T3=0.95,第三阈值可以为0.95H。在单字符图像中从中心位置向左遍历每一列像素的垂直投影尺寸,以及从中心位置向右遍历每一列像素的垂直投影尺寸;其中,若从中心位置向左遍历到的第X列像素的垂直投影尺寸未超过0.95H,且从中心位置向左遍历到的第X+1列像素的垂直投影尺寸超过0.95H,则根据第X列像素确定单字符图像的字符左边界;和/或,若从中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过0.95H,且从中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过0.95H,则根据第Y列像素确定单字符图像的字符右边界;以及,根据单字符图像的字符左边界和字符右边界对目标单字符图像的背景区域进行左右平分。如图5a和图5b所示,其中,通过上述步骤确定图4a中单字符图像中“0”的字符左右边界之后,将图5a 中的字符左侧的背景区域与字符右侧的背景区域进行左右平分,得到图5b中的单字符图像,由此,字符更偏向于位于整个背景的中央部分,使得字符的识别结果准确率更高。
图6为根据本申请一实施例的一种字符分割装置的示意图,用于执行如图 3所示出的分割方法,该装置包括:
第一分割单元601,用于获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;
上下边界单元602,用于根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;
左右边界单元603,用于根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;
第二分割单元604,用于根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
在一种可能的实施方式中,上下边界单元,还用于:确定单字符图像的中心位置,并根据单字符图像的宽度与第一预设系数确定第一阈值;在单字符图像中从中心位置向上遍历每一行像素的第一投影尺寸,以及从中心位置向下遍历每一行像素的第二投影尺寸;通过比较遍历到的第一投影尺寸、第二投影尺寸与第一阈值确定单字符图像的上边界和下边界。
在一种可能的实施方式中,上下边界单元,还用于:其中,若从中心位置向上遍历到的第N行像素的第一投影尺寸超过第一阈值,且从中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过第一阈值,则根据第N行像素确定单字符图像的上边界;和/或,其中,若从中心位置向下遍历到的第M行像素的第一投影尺寸超过第一阈值,且从中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过第一阈值,则根据第M行像素确定单字符图像的下边界。
在一种可能的实施方式中,左右边界单元,还用于:确定单字符图像的中心位置,并根据单字符图像的高度与第二预设系数确定第二阈值;在单字符图像中从中心位置向左遍历每一列像素的第三投影尺寸,以及从中心位置向右遍历每一列像素的第四投影尺寸;通过比较遍历到的第三投影尺寸、第四投影尺寸与第二阈值确定单字符图像的左边界和右边界。
在一种可能的实施方式中,左右边界单元,还用于:其中,若从中心位置向左遍历到的第P列像素的第三投影尺寸超过第二阈值,且从中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过第二阈值,则根据第P列像素确定单字符图像的左边界;和/或,其中,若从中心位置向右遍历到的第Q列像素的第四投影尺寸超过第二阈值,且从中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过第二阈值,则根据第Q列像素确定单字符图像的右边界。
在一种可能的实施方式中,装置还包括左右平分单元,用于:确定单字符图像的中心位置,并根据单字符图像的高度与第三预设系数确定第三阈值;在单字符图像中从中心位置向左遍历每一列像素的垂直投影尺寸,以及从中心位置向右遍历每一列像素的垂直投影尺寸;其中,若从中心位置向左遍历到的第X列像素的垂直投影尺寸未超过第三阈值,且从中心位置向左遍历到的第X+1 列像素的垂直投影尺寸超过第三阈值,则根据第X列像素确定单字符图像的字符左边界;和/或,其中,若从中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过第三阈值,且从中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过第二阈值,则根据第Y列像素确定单字符图像的字符右边界;以及,根据单字符图像的字符左边界和字符右边界对目标单字符图像的背景区域进行左右平分。
图7为根据本申请一实施例的一种字符分割装置的示意图,用于执行如图 3所示出的分割方法,该装置包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:获取多字符图像,对多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;根据单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定单字符图像的上边界和下边界;根据单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定单字符图像的左边界和右边界;根据单字符图像的上边界、下边界、左边界和右边界对多字符图像进行第二字符分割,得到多个目标单字符图像。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被多核处理器执行时,使得多核处理器执行如第一方面中任一项的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本发明通过对测试集数据进行字符分割预处理,将待识别的字符图像中多余的色块去除,改善字符分割的效果,使得测试集与训练集有相似的分布,进而提高字符的识别准确率。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/ 或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM) 和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (14)

1.一种字符分割方法,其特征在于,包括:
获取多字符图像,对所述多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;
根据所述单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定所述单字符图像的上边界和下边界;
根据所述单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定所述单字符图像的左边界和右边界;
根据所述单字符图像的所述上边界、所述下边界、所述左边界和所述右边界对所述多字符图像进行第二字符分割,得到多个目标单字符图像。
2.根据权利要求1所述的字符分割方法,其特征在于,根据所述单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定所述单字符图像的上边界和下边界,还包括:
确定所述单字符图像的中心位置,并根据所述单字符图像的宽度与所述第一预设系数确定第一阈值;
在所述单字符图像中从所述中心位置向上遍历每一行像素的第一投影尺寸,以及从所述中心位置向下遍历每一行像素的第二投影尺寸;
通过比较遍历到的所述第一投影尺寸、所述第二投影尺寸与所述第一阈值确定所述单字符图像的上边界和下边界。
3.根据权利要求2所述的字符分割方法,其特征在于,通过比较遍历到的所述第一投影尺寸、所述第二投影尺寸与所述第一阈值确定所述单字符图像的上边界和下边界,还包括:
其中,若从所述中心位置向上遍历到的第N行像素的第一投影尺寸超过所述第一阈值,且从所述中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过所述第一阈值,则根据所述第N行像素确定所述单字符图像的所述上边界;和/或,
其中,若从所述中心位置向下遍历到的第M行像素的第一投影尺寸超过所述第一阈值,且从所述中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过所述第一阈值,则根据所述第M行像素确定所述单字符图像的所述下边界。
4.根据权利要求1所述的字符分割方法,其特征在于,根据所述单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定所述单字符图像的左边界和右边界,包括:
确定所述单字符图像的中心位置,并根据所述单字符图像的高度与所述第二预设系数确定第二阈值;
在所述单字符图像中从所述中心位置向左遍历每一列像素的第三投影尺寸,以及从所述中心位置向右遍历每一列像素的第四投影尺寸;
通过比较遍历到的所述第三投影尺寸、所述第四投影尺寸与所述第二阈值确定所述单字符图像的左边界和右边界。
5.根据权利要求4所述的字符分割方法,其特征在于,通过比较遍历到的所述第三投影尺寸、所述第四投影尺寸与所述第二阈值确定所述单字符图像的左边界和右边界,包括:
其中,若从所述中心位置向左遍历到的第P列像素的第三投影尺寸超过所述第二阈值,且从所述中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过所述第二阈值,则根据所述第P列像素确定所述单字符图像的所述左边界;和/或,
其中,若从所述中心位置向右遍历到的第Q列像素的第四投影尺寸超过所述第二阈值,且从所述中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过所述第二阈值,则根据所述第Q列像素确定所述单字符图像的所述右边界。
6.如权利要求1所述的字符分割方法,其特征在于,所述方法还包括:
确定所述单字符图像的中心位置,并根据所述单字符图像的高度与第三预设系数确定第三阈值;
在所述单字符图像中从所述中心位置向左遍历每一列像素的垂直投影尺寸,以及从所述中心位置向右遍历每一列像素的垂直投影尺寸;
其中,若从所述中心位置向左遍历到的第X列像素的垂直投影尺寸未超过所述第三阈值,且从所述中心位置向左遍历到的第X+1列像素的垂直投影尺寸超过所述第三阈值,则根据所述第X列像素确定所述单字符图像的字符左边界;和/或,
其中,若从所述中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过所述第三阈值,且从所述中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过所述第二阈值,则根据所述第Y列像素确定所述单字符图像的字符右边界;以及,
根据所述单字符图像的所述字符左边界和所述字符右边界对所述目标单字符图像的背景区域进行左右平分。
7.一种字符分割装置,其特征在于,包括:
第一分割单元,用于获取多字符图像,对所述多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;
上下边界单元,用于根据所述单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定所述单字符图像的上边界和下边界;
左右边界单元,用于根据所述单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定所述单字符图像的左边界和右边界;
第二分割单元,用于根据所述单字符图像的所述上边界、所述下边界、所述左边界和所述右边界对所述多字符图像进行第二字符分割,得到多个目标单字符图像。
8.根据权利要求7所述的字符分割装置,其特征在于,所述上下边界单元,还用于:
确定所述单字符图像的中心位置,并根据所述单字符图像的宽度与所述第一预设系数确定第一阈值;
在所述单字符图像中从所述中心位置向上遍历每一行像素的第一投影尺寸,以及从所述中心位置向下遍历每一行像素的第二投影尺寸;
通过比较遍历到的所述第一投影尺寸、所述第二投影尺寸与所述第一阈值确定所述单字符图像的上边界和下边界。
9.根据权利要求8所述的字符分割装置,其特征在于,所述上下边界单元,还用于:
其中,若从所述中心位置向上遍历到的第N行像素的第一投影尺寸超过所述第一阈值,且从所述中心位置向上遍历到的第N+1行像素的第一投影尺寸未超过所述第一阈值,则根据所述第N行像素确定所述单字符图像的所述上边界;和/或,
其中,若从所述中心位置向下遍历到的第M行像素的第一投影尺寸超过所述第一阈值,且从所述中心位置向下遍历到的第M+1行像素的第一投影尺寸未超过所述第一阈值,则根据所述第M行像素确定所述单字符图像的所述下边界。
10.根据权利要求7所述的字符分割装置,其特征在于,所述左右边界单元,还用于:
确定所述单字符图像的中心位置,并根据所述单字符图像的高度与所述第二预设系数确定第二阈值;
在所述单字符图像中从所述中心位置向左遍历每一列像素的第三投影尺寸,以及从所述中心位置向右遍历每一列像素的第四投影尺寸;
通过比较遍历到的所述第三投影尺寸、所述第四投影尺寸与所述第二阈值确定所述单字符图像的左边界和右边界。
11.根据权利要求10所述的字符分割装置,其特征在于,所述左右边界单元,还用于:
其中,若从所述中心位置向左遍历到的第P列像素的第三投影尺寸超过所述第二阈值,且从所述中心位置向左遍历到的第P+1列像素的第三投影尺寸未超过所述第二阈值,则根据所述第P列像素确定所述单字符图像的所述左边界;和/或,
其中,若从所述中心位置向右遍历到的第Q列像素的第四投影尺寸超过所述第二阈值,且从所述中心位置向右遍历到的第Q+1列像素的第四投影尺寸未超过所述第二阈值,则根据所述第Q列像素确定所述单字符图像的所述右边界。
12.如权利要求7所述的字符分割装置,其特征在于,所述装置还包括左右平分单元,用于:
确定所述单字符图像的中心位置,并根据所述单字符图像的高度与第三预设系数确定第三阈值;
在所述单字符图像中从所述中心位置向左遍历每一列像素的垂直投影尺寸,以及从所述中心位置向右遍历每一列像素的垂直投影尺寸;
其中,若从所述中心位置向左遍历到的第X列像素的垂直投影尺寸未超过所述第三阈值,且从所述中心位置向左遍历到的第X+1列像素的垂直投影尺寸超过所述第三阈值,则根据所述第X列像素确定所述单字符图像的字符左边界;和/或,
其中,若从所述中心位置向右遍历到的第Y列像素的垂直投影尺寸未超过所述第三阈值,且从所述中心位置向右遍历到的第Y+1列像素的垂直投影尺寸超过所述第二阈值,则根据所述第Y列像素确定所述单字符图像的字符右边界;以及,
根据所述单字符图像的所述字符左边界和所述字符右边界对所述目标单字符图像的背景区域进行左右平分。
13.一种字符分割装置,其特征在于,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:获取多字符图像,对所述多字符图像执行二值化处理和第一字符分割,得到多个单字符图像;
根据所述单字符图像的每一行像素的水平投影尺寸以及第一预设系数确定所述单字符图像的上边界和下边界;
根据所述单字符图像的每一列像素的垂直投影尺寸以及第二预设系数确定所述单字符图像的左边界和右边界;
根据所述单字符图像的所述上边界、所述下边界、所述左边界和所述右边界对所述多字符图像进行第二字符分割,得到多个目标单字符图像。
14.一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如权利要求1-6中任一项所述的方法。
CN202010503803.4A 2020-06-05 2020-06-05 字符分割方法、装置及计算机可读存储介质 Pending CN111814795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010503803.4A CN111814795A (zh) 2020-06-05 2020-06-05 字符分割方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010503803.4A CN111814795A (zh) 2020-06-05 2020-06-05 字符分割方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111814795A true CN111814795A (zh) 2020-10-23

Family

ID=72848250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010503803.4A Pending CN111814795A (zh) 2020-06-05 2020-06-05 字符分割方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111814795A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421256A (zh) * 2021-07-22 2021-09-21 凌云光技术股份有限公司 一种点阵文本行字符投影分割方法及装置
CN115050015A (zh) * 2022-08-15 2022-09-13 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218605A (zh) * 2013-04-09 2013-07-24 东南大学 一种基于积分投影与边缘检测的快速人眼定位方法
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN110991437A (zh) * 2019-11-28 2020-04-10 北京嘉楠捷思信息技术有限公司 字符识别方法及其装置、字符识别模型的训练方法及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218605A (zh) * 2013-04-09 2013-07-24 东南大学 一种基于积分投影与边缘检测的快速人眼定位方法
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN110991437A (zh) * 2019-11-28 2020-04-10 北京嘉楠捷思信息技术有限公司 字符识别方法及其装置、字符识别模型的训练方法及其装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张玉姣, 史忠科: "基于连通体检测及投影法的牌照字符切分", 小型微型计算机系统, no. 04 *
李珺等: "车辆牌照自动识别中的一种新算法", 兰州交通大学学报(自然科学版), no. 03, pages 1 - 2 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421256A (zh) * 2021-07-22 2021-09-21 凌云光技术股份有限公司 一种点阵文本行字符投影分割方法及装置
CN113421256B (zh) * 2021-07-22 2024-05-24 凌云光技术股份有限公司 一种点阵文本行字符投影分割方法及装置
CN115050015A (zh) * 2022-08-15 2022-09-13 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法
CN115050015B (zh) * 2022-08-15 2023-09-12 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Similar Documents

Publication Publication Date Title
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
JP2021532459A (ja) 標的細胞標識方法、装置、記憶媒体及び端末デバイス
US9892114B2 (en) Methods and systems for efficient automated symbol recognition
CN111814795A (zh) 字符分割方法、装置及计算机可读存储介质
CN110599453A (zh) 一种基于图像融合的面板缺陷检测方法、装置及设备终端
CN112634201B (zh) 目标检测方法、装置和电子设备
CN110991437B (zh) 字符识别方法及其装置、字符识别模型的训练方法及其装置
CN112950554A (zh) 一种基于肺分割的肺叶分割优化方法及系统
CN107292002B (zh) 一种数字岩心重构的方法及装置
CN111144270B (zh) 基于神经网络的手写文本工整度的评测方法与评测装置
CN115439718A (zh) 一种结合监督学习和特征匹配技术的工业检测方法、系统、存储介质
CN114241388A (zh) 基于时空记忆信息的视频实例分割方法和分割装置
CN114529773A (zh) 基于结构单元的表格识别方法、系统、终端及介质
CN108460385A (zh) 一种文本图像分割方法与装置
CN114565803A (zh) 用于提取难样本的方法、装置及机械设备
CN111597845A (zh) 一种二维码检测方法、装置、设备及可读存储介质
CN115019310B (zh) 图文识别方法及设备
CN116994721A (zh) 一种数字病理切片图的快速处理系统
CN115775220A (zh) 使用多个机器学习程序检测图像中的异常的方法和系统
CN114863438A (zh) 用于识别曲线的方法及系统
CN115100402A (zh) 小样本分割模型、小目标检测方法、系统、介质及设备
CN116092105B (zh) 表格结构的解析方法和装置
CN113099217B (zh) 一种视频帧连续性检测方法、装置、设备及存储介质
CN115861549B (zh) 一种自动替换实景三维数据中树木模型的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201211

Address after: Room 206, 2 / F, building C, phase I, Zhongguancun Software Park, No. 8, Dongbei Wangxi Road, Haidian District, Beijing 100094

Applicant after: Canaan Bright Sight Co.,Ltd.

Address before: Room 101, block C, building 27, phase I, Zhongguancun Software Park, No. 8, Dongbei Wangxi Road, Haidian District, Beijing 100094

Applicant before: Canaan Creative Co.,Ltd.

TA01 Transfer of patent application right