CN113421256A - 一种点阵文本行字符投影分割方法及装置 - Google Patents

一种点阵文本行字符投影分割方法及装置 Download PDF

Info

Publication number
CN113421256A
CN113421256A CN202110829955.8A CN202110829955A CN113421256A CN 113421256 A CN113421256 A CN 113421256A CN 202110829955 A CN202110829955 A CN 202110829955A CN 113421256 A CN113421256 A CN 113421256A
Authority
CN
China
Prior art keywords
segmentation
image
segmented
character
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110829955.8A
Other languages
English (en)
Other versions
CN113421256B (zh
Inventor
王博帝
姚毅
杨艺
全煜鸣
金刚
彭斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lingyun Shixun Technology Co ltd
Luster LightTech Co Ltd
Original Assignee
Shenzhen Lingyun Shixun Technology Co ltd
Luster LightTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Lingyun Shixun Technology Co ltd, Luster LightTech Co Ltd filed Critical Shenzhen Lingyun Shixun Technology Co ltd
Priority to CN202110829955.8A priority Critical patent/CN113421256B/zh
Publication of CN113421256A publication Critical patent/CN113421256A/zh
Application granted granted Critical
Publication of CN113421256B publication Critical patent/CN113421256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Character Input (AREA)

Abstract

本申请提供一种点阵文本行字符投影分割方法及装置。所述方法包括:获取待分割点阵文本行图像;对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。通过本申请提供的字符投影分割方法,首先对待分割点阵文本行图像进行二值化处理,然后提取点阵文本行的特征数据,最后根据所述特征数据进行单字符分割,从而实现对点阵文本行字符的分割。

Description

一种点阵文本行字符投影分割方法及装置
技术领域
本申请涉及图像识别技术领域,尤其涉及一种点阵文本行字符投影分割方法及装置。
背景技术
应用机器视觉代替人眼,高效识别图像中的文本已经成为自动化生产的重要组成部分。其中,字符识别(optical character recognise,OCR)技术可以对纸上的印刷及打印文字字符进行识别,将识别结果以文本方式存储在计算机器中。通过字符识别可将书面上不可编辑的文档及图片转换为可编辑内容。在对图像中的文本进行识别时,在水平方向上找到文本行后,需要将整行文本逐字分割,得到单字符图像,以便后续识别。
通常可以采用投影分割法对文本行进行字符分割,但是,现有的投影分割法只适用于连续字体文本行的字符分割。这是由于连续字体的轮廓是由连续实点构成,连续字体直线轮廓明显,字符之间的间隙清晰。但是,对于点阵字体文本行而言,点阵字体是以每个点的虚实来表示字符的轮廓,点阵字体轮廓离散,字符之间的间隙不够明确,难以靠间隙分割字符。因此,现有的文本行字符投影方法无法应用于点阵字体文本行。
发明内容
本申请提供了一种点阵文本行字符投影分割方法及装置。以解决现有的文本行字符投影方法无法应用于点阵字体文本行的问题。
第一方面,本申请提供一种点阵文本行字符投影分割方法,包括:
获取待分割点阵文本行图像;
对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;
根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;
根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
结合第一方面,在一种可能的实现方式中,所述根据所述特征数据进行单字符分割包括:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
结合第一方面,在一种可能的实现方式中,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割包括:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
结合第一方面,在一种可能的实现方式中,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割包括:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
第二方面,本申请还提供一种点阵文本行字符投影分割装置,包括:
获取模块,用于获取待分割点阵文本行图像;
二值化模块,用于对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;
提取模块,用于根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;
分割模块,用于根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
结合第二方面,在一种可能的实现方式中,所述分割模块还用于:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
结合第二方面,在一种可能的实现方式中,所述分割模块还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
结合第二方面,在一种可能的实现方式中,所述分割模块还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
由以上技术方案可知,本申请提供一种点阵文本行字符投影分割方法及装置。所述方法包括:获取待分割点阵文本行图像;对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。通过本申请提供的字符投影分割方法,首先对待分割点阵文本行图像进行二值化处理,然后提取点阵文本行的特征数据,最后根据所述特征数据进行单字符分割,从而实现对点阵文本行字符的分割。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种连续字体的示意图;
图2为本申请实施例提供的一种点阵字体的示意图;
图3为本申请实施例提供的一种点阵文本行字符投影分割方法的流程图;
图4为本申请实施例提供的待分割点阵文本行图像;
图5为本申请实施例提供的二值化图像;
图6为本申请实施例提供的一种根据所述特征数据进行单字符分割方法的流程图;
图7为本申请实施例提供的投影直方图;
图8为本申请实施例提供的波动性抑制后投影直方图;
图9为本申请实施例提供的第一分割图像;
图10为本申请实施例提供的第二分割图像;
图11为本申请实施例提供的分割后点阵单字符图像;
图12为本申请实施例提供的一种点阵文本行字符投影分割装置。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。
应用机器视觉代替人眼,高效识别图像中的文本已经成为自动化生产的重要组成部分。其中,字符识别(optical character recognise,OCR)技术可以对纸上的印刷及打印文字字符进行识别,将识别结果以文本方式存储在计算机器中。通过字符识别可将书面上不可编辑的文档及图片转换为可编辑内容。在对图像中的文本进行识别时,在水平方向上找到文本行后,需要将整行文本逐字分割,得到单字符图像,以便后续识别。
通常可以采用投影分割法对文本行进行字符分割,但是,现有的投影分割法只适用于连续字体文本行的字符分割。图1是本申请实施例提供的一种连续字体的示意图,如图1所示,由于连续字体的轮廓是由连续实点构成,连续字体直线轮廓明显,字符之间的间隙清晰。因此,可以采用投影分割法进行字符分割。但是,对于点阵字体文本行而言,图2是本申请实施例提供的一种点阵字体的示意图,由图2可见,点阵字体是以每个点的虚实来表示字符的轮廓,点阵字体轮廓离散,字符之间的间隙不够明确,难以靠间隙分割字符。因此,现有的文本行字符投影方法无法应用于点阵字体文本行。
本申请提供一种点阵文本行字符投影分割方法及装置。以解决现有的文本行字符投影方法无法应用于点阵字体文本行的问题。
第一方面,本申请提供一种点阵文本行字符投影分割方法,图3为本申请实施例提供的一种点阵文本行字符投影分割方法的流程图,如图3所示,所述方法包括以下步骤:
S100:获取待分割点阵文本行图像。
在本实施例中,所述待分割点阵文本行图像中包括点阵字体文本行。在对图像中的文本进行识别时,为了提高图像字符识别的准确性,需要对点阵字体文本行进行字符分割。图4是本申请实施例提供的待分割点阵文本行图像,如图4所示,点阵字体文本行内容包括“Lot:DNO1696”。在进行文本识别时,需要进行字符分割,即需要将点阵字体文本行中的字符“L”“o”“t”“:”“D”“N”“O”“1”“6”“9”“6”依次分割出来。
所述待分割点阵字体文本行图像的格式可以是:JPEG(Joint PhotographicExpert Group,联合照片专家组)格式、PNG(Portable Network Graphics,便携式网络图形)格式以及BMP(BitMaP,位图)等格式,本申请对获取的待分割点阵字体文本行图像格式以及获取方法不做具体限定。
S200:对所述待分割点阵文本行图像进行二值化处理,得到二值化图像。
在本实施例中,首先对所述待分割点阵文本行图像进行二值化处理。示例地,二值化处理就是将点阵字体文本行图像上的像素点的灰度值设置为0或255,也就是将整个点阵字体文本行图像呈现出明显的黑白效果的过程。图像的二值化处理有利于点阵字体文本行图像的进一步处理,使点阵字体文本行图像变得简单,而且数据量减小,能凸显出目标的轮廓。图5是本申请实施例提供的一种二值化图像,如图5所示,二值化图像中点阵字体文本行内容“Lot:DNO1696”变为白色,背景颜色变为黑色。本申请提供的方法通过二值化处理,可以初步滤除除了点阵字体文本行外的无关背景干扰,增加下一步数据处理的置信度,以提高字符分割的准确性。
S300:根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度。
在本实施例中,根据所述待分割点阵文本行图像和所述二值化图像提取特征点方位、特征点特征强度及梯度变化程度。其中,所述特征点强度包括特征点的灰度信息等,所述特征点方位包括特征点位于所述待分割点阵字体文本行图像的位置,例如,特征点在所述待分割点阵字体文本行图像上的X、Y坐标值。所述梯度变化程度可以反应所述待分割点阵文本行图像中某一像素沿一个方向的变化率。所述特征点方位、所述特征点特征强度及所述梯度变化程度均可以反应出所述待分割点阵文本行图像的特征属性信息,可用于分割点阵文本行字符。
S400:根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
在一种可能的实现方式中,请参阅图6,图6为本申请实施例提供的一种根据所述特征数据进行单字符分割方法的流程图,在步骤S400中,所述根据所述特征数据进行单字符分割还包括步骤S410-S460:
S410:根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图。
请参阅图7,图7是本申请实施例提供的投影直方图,在本实施例中,投影直方图的横坐标表示所述特征点方位,投影直方图的纵坐标表示所述特征点强度与所述梯度变化程度的加权和。具体的,所述特征点强度和所述梯度变化程度的加权系数根据实际需求进行设置,本申请不做具体限定。所述投影直方图可以表示所述待分割点阵字体文本行图像中特征点特征强度及梯度变化程度与方位之间的关系,以便于对点阵文本行中的字符进行分割。
S420:对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图。
在本实施例中,对所述投影直方图进行形态学处理,进行投影直方图的离散性抑制,缓解由点阵字体离散性导致的特征强度波动,去除干扰的噪声点,得到更为平滑的投影直方图。图8是本申请实施例提供的波动性抑制后投影直方图,如图8所示,经过波动性抑制处理后的投影直方图中曲线更加平滑,两个字符之间的间隙逐渐明确,更有利于准确的进行字符分割。
示例的,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行波动性抑制处理包括:对所述投影直方图进行均值滤波。
可选的,通过调节对投影直方图的波动性抑制程度,可以使本申请提供的字符投影分割方法直接应用于连续字体文本行的字符分割,甚至可以在连续字体出现断裂时将其视作点阵字体处理。具体的,可以通过调节对所述投影直方图形态学处理的参数,例如,形态学处理的结构元素,点阵字体可以用大结构元素,连续字体可以用小结构元素;形态学处理也可以多次迭代,点阵字体可以执行多次形态学处理,连续字体可以只执行一次形态学处理。因此,本申请提供的字符投影分割方法应用更加广泛。
S430:根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像。
在一种可能的实现方式中,步骤S430,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割包括:根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
在本实施例中,三个阈值分别包括:字符筛选阈值、干扰强度阈值和干扰宽度阈值,上述三个阈值均根据所述抑制后投影直方图而确定。其中,所述字符筛选阈值用于建立单字符的初始化分割,分割出每个字符的左右边界。所述干扰强度阈值用于剔除特征强度较弱的单字符,所述干扰宽度阈值用于剔除分割区域较小的无关干扰。通过三阈值分割法可以实现对所述待分割点阵文本行图像进行字符初始分割,获得到第一分割图像,所述第一分割图像为三阈值初始分割后的图像。本申请实施例中通过字符筛选阈值、干扰强度阈值和干扰宽度阈值进行字符初始分割可以提高点阵文本行图像中字符分割的效果和质量。
在另一种可能的实现方式中,步骤S430,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割还可以包括:根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
与上述实施例中选择干扰宽度阈值不同,在本实施例中,三个阈值分别包括:字符筛选阈值、干扰强度阈值和干扰面积阈值,上述三个阈值均根据所述抑制后投影直方图而确定。其中,所述字符筛选阈值用于建立单字符的初始化分割,分割出每个字符的左右边界。所述干扰强度阈值用于剔除特征强度较弱的单字符,所述干扰面积阈值从字符的宽和高两个维度对字符区域是否为干扰做判断。根据三阈值分割时,选择干扰面积阈值可以进一步提高点阵文本行图像中字符分割的效果和质量。
S440:获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比。
在本实施例中,所述第一分割图像中欠分割字符区域即为经过所述三阈值分割后,存在未分割字符的区域。图9为本申请实施例提供的第一分割图像,如图9所示,经过三阈值分割之后,仍存在未分割字符区域,例如“DNO”和“96”区域,仍需要继续进行强制分割。所述强制分割阈值包括字符宽高比,所述字符宽高比根据欠分割字符区域的实际情况以及字符分割精度要求等情况进行确定,本申请对字符宽高比不做具体限定。所述强制分割阈值用于对所述第一分割图像中欠分割字符区域进行强制分割。
S450:根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像。
在本实施例中,首先通过所述字符宽高比将不满足所述字符宽高比的欠分割字符区域的局部低值强制降低,获得强制分割图像,然后再次对所述强制分割图像再次进行三阈值分割,得到第二分割图像,从而可以实现将所述欠分割字符区域中未分割的字符进行强制分割。其中,所述第二分割图像即为点阵文本行图像中欠分割字符区域字符强制分割后的图像。图10为本申请实施例提供的第二分割图像,如图10所示,经过强制分割以及再次三阈值分割之后,已经将点阵文本行中每个字符在左右宽度上进行了准确的分割。本申请通过设置字符宽高比对所述欠分割字符区域进行强制分割,可以提升投影分割方法在图像欠分割场景下的鲁棒性。
示例的,将其中不满足所述字符宽高比的欠分割字符区域的局部低值强制降低,可以将局部低值调整至0,具体的局部低值强制降低的数值根据实际需求确定,本申请不做具体限定。
S460:对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
在本实施例中,对所述第二分割图像应用形态学处理进行进一步精细分割,具体的,通过连通点阵字符的断裂特征,并根据字符的点阵特征分布,以每个字符的最小外接矩形作为该字符区域的精细化分割结果,从而获得所述分割后点阵单字符图像,实现点阵文本行字符投影分割。图11为本申请实施例提供的分割后点阵单字符图像,如图11所示,通过形态学精细分割已经将点阵字体文本行中的字符“L”“o”“t”“:”“D”“N”“O”“1”“6”“9”“6”准确的分割出来。
第二方面,本申请还提供一种点阵文本行字符投影分割装置,图12是本申请实施例提供的一种点阵文本行字符投影分割装置,如图12所示,所述装置包括:
获取模块11,用于获取待分割点阵文本行图像;
二值化模块12,用于对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;
提取模块13,用于根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;
分割模块14,用于根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
在一种可能的实现方式中,所述分割模块14还用于:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
在一种可能的实现方式中,所述分割模块14还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
在一种可能的实现方式中,所述分割模块14还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
由以上技术方案可知,本申请提供一种点阵文本行字符投影分割方法及装置。所述方法包括:获取待分割点阵文本行图像;对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。通过本申请提供的字符投影分割方法,首先对待分割点阵文本行图像进行二值化处理,然后提取点阵文本行的特征数据,最后根据所述特征数据进行单字符分割,从而实现对点阵文本行字符的分割。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

Claims (12)

1.一种点阵文本行字符投影分割方法,其特征在于,包括:
获取待分割点阵文本行图像;
对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;
根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;
根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
2.根据权利要求1所述的点阵文本行字符投影分割方法,其特征在于,所述根据所述特征数据进行单字符分割包括:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
3.根据权利要求2所述的点阵文本行字符投影分割方法,其特征在于,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割包括:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
4.根据权利要求2所述的点阵文本行字符投影分割方法,其特征在于,所述根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割包括:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
5.根据权利要求1所述的点阵文本行字符投影分割方法,其特征在于,所述根据所述特征数据进行单字符分割包括:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
6.根据权利要求1所述的点阵文本行字符投影分割方法,其特征在于,所述根据所述特征数据进行单字符分割包括:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
7.一种点阵文本行字符投影分割装置,其特征在于,包括:
获取模块,用于获取待分割点阵文本行图像;
二值化模块,用于对所述待分割点阵文本行图像进行二值化处理,得到二值化图像;
提取模块,用于根据所述待分割点阵文本行图像和所述二值化图像提取点阵文本行的特征数据,所述特征数据包括:特征点方位、特征点特征强度及梯度变化程度;
分割模块,用于根据所述特征数据进行单字符分割,获得分割后点阵单字符图像。
8.根据权利要求7所述的点阵文本行字符投影分割装置,其特征在于,所述分割模块还用于:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图对所述待分割点阵文本行图像进行三阈值分割,得到第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
9.根据权利要求8所述的点阵文本行字符投影分割装置,其特征在于,所述分割模块还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
10.根据权利要求8所述的点阵文本行字符投影分割装置,其特征在于,所述分割模块还用于:
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像。
11.根据权利要求7所述的点阵文本行字符投影分割装置,其特征在于,所述分割模块还用于:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰宽度阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰宽度阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
12.根据权利要求7所述的点阵文本行字符投影分割装置,其特征在于,所述分割模块还用于:
根据所述特征点方位、所述特征点特征强度及所述梯度变化程度生成投影直方图;
对所述投影直方图进行波动性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图获取字符筛选阈值、干扰强度阈值和干扰面积阈值;
根据所述字符筛选阈值、所述干扰强度阈值和所述干扰面积阈值对所述待分割点阵文本行图像进行分割,得到所述第一分割图像;
获取所述第一分割图像中欠分割字符区域和强制分割阈值,所述强制分割阈值包括字符宽高比;
根据所述字符宽高比对所述欠分割字符区域进行强制分割,得到强制分割图像,对所述强制分割图像再次进行三阈值分割,得到第二分割图像;
对所述第二分割图像进行形态学精细分割,获得所述分割后点阵单字符图像。
CN202110829955.8A 2021-07-22 2021-07-22 一种点阵文本行字符投影分割方法及装置 Active CN113421256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110829955.8A CN113421256B (zh) 2021-07-22 2021-07-22 一种点阵文本行字符投影分割方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110829955.8A CN113421256B (zh) 2021-07-22 2021-07-22 一种点阵文本行字符投影分割方法及装置

Publications (2)

Publication Number Publication Date
CN113421256A true CN113421256A (zh) 2021-09-21
CN113421256B CN113421256B (zh) 2024-05-24

Family

ID=77719399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110829955.8A Active CN113421256B (zh) 2021-07-22 2021-07-22 一种点阵文本行字符投影分割方法及装置

Country Status (1)

Country Link
CN (1) CN113421256B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082923A (zh) * 2022-08-24 2022-09-20 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231602A (ja) * 1999-02-12 2000-08-22 Oki Electric Ind Co Ltd 特徴抽出装置
JP2006222572A (ja) * 2005-02-08 2006-08-24 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
CN102870399A (zh) * 2010-05-10 2013-01-09 微软公司 在ocr过程中将词语位图分割为单个字符或字形
CN104268538A (zh) * 2014-10-13 2015-01-07 江南大学 一种易拉罐点阵喷码字符在线视觉检测方法
CN105242895A (zh) * 2015-09-24 2016-01-13 深圳市冠旭电子有限公司 一种点阵文字显示方法及装置
CN106156773A (zh) * 2016-06-27 2016-11-23 湖南大学 一种文本图像的分割方法及装置
US20180286023A1 (en) * 2017-03-30 2018-10-04 Adobe Systems Incorporated Digital Image Processing through use of an Image Repository
CN109543770A (zh) * 2018-11-30 2019-03-29 合肥泰禾光电科技股份有限公司 点阵字符识别方法及装置
CN111046872A (zh) * 2019-12-12 2020-04-21 深圳市杰恩世智能科技有限公司 一种光学字符识别方法
CN111814795A (zh) * 2020-06-05 2020-10-23 北京嘉楠捷思信息技术有限公司 字符分割方法、装置及计算机可读存储介质
WO2021042562A1 (zh) * 2019-09-06 2021-03-11 平安科技(深圳)有限公司 基于手写签名的用户身份识别方法、装置及终端设备
CN112633289A (zh) * 2020-12-30 2021-04-09 凌云光技术股份有限公司 一种粘连字符分割方法和系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231602A (ja) * 1999-02-12 2000-08-22 Oki Electric Ind Co Ltd 特徴抽出装置
JP2006222572A (ja) * 2005-02-08 2006-08-24 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
CN102870399A (zh) * 2010-05-10 2013-01-09 微软公司 在ocr过程中将词语位图分割为单个字符或字形
CN104268538A (zh) * 2014-10-13 2015-01-07 江南大学 一种易拉罐点阵喷码字符在线视觉检测方法
CN105242895A (zh) * 2015-09-24 2016-01-13 深圳市冠旭电子有限公司 一种点阵文字显示方法及装置
CN106156773A (zh) * 2016-06-27 2016-11-23 湖南大学 一种文本图像的分割方法及装置
US20180286023A1 (en) * 2017-03-30 2018-10-04 Adobe Systems Incorporated Digital Image Processing through use of an Image Repository
CN109543770A (zh) * 2018-11-30 2019-03-29 合肥泰禾光电科技股份有限公司 点阵字符识别方法及装置
WO2021042562A1 (zh) * 2019-09-06 2021-03-11 平安科技(深圳)有限公司 基于手写签名的用户身份识别方法、装置及终端设备
CN111046872A (zh) * 2019-12-12 2020-04-21 深圳市杰恩世智能科技有限公司 一种光学字符识别方法
CN111814795A (zh) * 2020-06-05 2020-10-23 北京嘉楠捷思信息技术有限公司 字符分割方法、装置及计算机可读存储介质
CN112633289A (zh) * 2020-12-30 2021-04-09 凌云光技术股份有限公司 一种粘连字符分割方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆铖;何东健;何晓;: "基于扫描线和特征筛选的车牌定位快速算法", 计算机工程与设计, no. 19 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115082923A (zh) * 2022-08-24 2022-09-20 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法
CN115082923B (zh) * 2022-08-24 2022-11-08 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法

Also Published As

Publication number Publication date
CN113421256B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
Karthick et al. Steps involved in text recognition and recent research in OCR; a study
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
EP1282076B1 (en) Self-adaptive binarization of digital images
EP3401842B1 (en) Text image processing method and apparatus
US8391602B2 (en) Character recognition
EP0949579A2 (en) Multiple size reductions for image segmentation
CN112686265A (zh) 一种基于层级轮廓提取的象形文字分割方法
CN113421256B (zh) 一种点阵文本行字符投影分割方法及装置
US7130085B2 (en) Half-tone dot elimination method and system thereof
Bataineh et al. Generating an arabic calligraphy text blocks for global texture analysis
Strouthopoulos et al. PLA using RLSA and a neural network
Ozawa et al. A character image enhancement method from characters with various background images
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
CN113421257B (zh) 一种点阵字体文本行旋转校正方法及装置
Polyakova et al. Combined method for scanned documents images segmentation using sequential extraction of regions
Murguia Document segmentation using texture variance and low resolution images
CN110298350B (zh) 一种高效的印刷体维吾尔文单词分割算法
Priya et al. A wavelet based method for text segmentation in color images
NarayananV et al. SEGMENTATION OF CHARACTERS IN HISTORIC DOCUMENTS BASED ON SCALE SPACE TECHNIQUE
Hirano et al. Text and layout information extraction from document files of various formats based on the analysis of page description language
Goto et al. Character pattern extraction based on local multilevel thresholding and region growing
Sahle Segmentation of Real Life Amharic Documents for Improving Recognition
CN117877037A (zh) 一种ocr单字符定位识别方法、系统及计算机存储介质
CN115777103A (zh) 用于改进表处理的方法、计算机系统和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant