CN111695557B - 一种图像处理方法及装置 - Google Patents
一种图像处理方法及装置 Download PDFInfo
- Publication number
- CN111695557B CN111695557B CN201910818806.4A CN201910818806A CN111695557B CN 111695557 B CN111695557 B CN 111695557B CN 201910818806 A CN201910818806 A CN 201910818806A CN 111695557 B CN111695557 B CN 111695557B
- Authority
- CN
- China
- Prior art keywords
- pixel
- image
- value
- pixel point
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012512 characterization method Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本申请实施例提供了一种图像处理方法及装置,涉及图像处理技术领域,其中,上述方法包括:提取待处理字符图像的图像内容中的边缘信息,得到第一图像;去除第一图像中的直线,得到第二图像;针对第二图像中的每一第一像素点,确定包含第一像素点的局部图像区域,计算局部图像区域的表征值,并在表征值小于第一预设阈值的情况下,设置第一像素点为非边缘点,得到第三图像,第三图像作为对待处理字符图像进行图像处理的结果。应用本申请实施例提供的方案进行图像处理,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续进行OCR时所识别出字符的准确率。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像处理方法及装置。
背景技术
在人工智能高速发展的今天,OCR(Optical Character Recognition,光学字符识别)的应用越来越广泛。应用OCR处理图像时,首先需要定位出图像中字符所在的区域,而在图像中最小的信息单位为像素点,所以需要定位出图像中属于字符的像素点,然后在定位结果的基础上执行OCR识别字符。
现有技术中,一般采用SWT(Stationary Wavelet Transform,平稳小波变换)算法定位图像中属于字符的像素点。但是由于字符包含各种各样的笔画,而SWT算法是基于像素点对应的边缘梯度实现的,边缘梯度对一些笔画的表征性较弱,从而导致定位出的属于字符的像素点存在误差,也就使得定位出的字符所在区域准确率低,使得后续进行OCR时所识别出字符的准确率低。
发明内容
本申请实施例的目的在于提供一种图像处理方法及装置,以提高所定位出属于字符的像素点的准确率。具体技术方案如下:
第一方面,本申请实施例提供了一种图像处理方法,所述方法包括:
提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
去除所述第一图像中的直线,得到第二图像;
针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域,计算所述局部图像区域的表征值,其中,所述表征值用于表征所述局部图像区域内边缘点在所述局部图像区域的所有像素点中所占的比例,并在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,所述第三图像作为对所述待处理字符图像进行图像处理的结果。
第二方面,本申请实施例提供了一种图像处理装置,所述装置包括:
边缘提取模块,用于提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
直线去除模块,用于去除所述第一图像中的直线,得到第二图像;
第三图像获得模块,用于针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域,计算所述局部图像区域的表征值,其中,所述表征值用于表征所述局部图像区域内边缘点在所述局部图像区域的所有像素点中所占的比例,并在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,所述第三图像作为对所述待处理字符图像进行图像处理的结果。
第三方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述第一方面所述的方法步骤。
第四方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现上述第一方面所述的方法步骤。
由以上可见,应用本申请实施例提供的方案进行图像处理时,提取待处理字符图像的图像内容中的边缘信息得到第一图像后,去除第一图像中的直线得到第二图像,然后针对第二图像中的每一第一像素点,确定包含第一像素点的局部图像区域,计算上述局部图像区域的表征值,按照上述表征值与第一预设阈值之间的关系,确定第一像素点是否为非边缘点,从而得到第三图像,也就得到了对待处理字符图像进行图像处理的结果。由于上述表征值表示了局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相邻近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性能够对第二图像中各个第一像素点是否为边缘点进行纠正。又由于在定位图像中属于字符的像素点时,属于字符的像素点为边缘点,因此应用本申请实施例提供的方案能够定位出图像中属于字符的像素点。
除此之外,上述表征值表示的是局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,是统计值,说明本申请实施例提供的方案是通过对图像中局部区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。另外,对于字符中包含的任何笔画而言,其中的像素点均会在图像的局部区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本申请实施例提供的一种图像处理方法的流程示意图;
图1b为本申请实施例提供的另一种图像处理方法的流程示意图;
图2a为本申请实施例提供的一种待处理字符图像的示意图;
图2b为本申请实施例提供的一种第一图像的示意图;
图2c为本申请实施例提供的一种第二图像的示意图;
图2d为本申请实施例提供的一种第三图像的示意图;
图3为本申请实施例提供的一种像素点分布示意图;
图4为本申请实施例提供的一种矩形区域示意图;
图5为本申请实施例提供的一种第五图像的示意图;
图6为本申请实施例提供的一种图像处理装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
由于现有技术中存在定位图像中属于字符的像素点时效率低,也就是,图像处理效率低的问题,为解决这一问题,本申请实施例提供了一种图像处理方法及装置。
本申请的一个实施例中,提供了一种图像处理方法,该方法包括:
提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
去除第一图像中的直线,得到第二图像;
针对第二图像中的每一第一像素点,确定包含第一像素点的局部图像区域,计算局部图像区域的表征值,其中,上述表征值用于表征局部图像区域的边缘点在局部图像区域的所有像素点中所占的比例,并在上述表征值小于第一预设阈值的情况下,设置第一像素点为非边缘点,得到第三图像,作为对待处理字符图像进行图像处理的结果。
由于上述表征值表示了局部图像区域内边缘点所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性,能够对第二图像中各个第一像素点是否为边缘点进行纠正。
又由于属于字符的像素点为边缘点,因此应用本实施例提供的方案能够定位出图像中属于字符的像素点。除此之外,上述表征值表示的是局部图像区域内边缘点所占的比例,是统计值,说明本实施例提供的方案是通过对图像中局部图像区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。
另外,对于字符中包含的任何笔画而言,笔画包含的像素点均会在图像的局部图像区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
下面通过具体实施例对本申请实施例提供的图像处理方法及装置分别进行详细说明。
参见图1a,图1a为本申请实施例提供的一种图像处理方法的流程示意图。上述图像处理方法包括如下S101-S103,可应用于电子设备。
S101:提取待处理字符图像的图像内容中的边缘信息,得到第一图像。
从图像内容的角度,上述待处理字符图像是包含字符的图像。例如,上述待处理字符图像可以是包含中文字符、日文字符、韩文字符等方块型字符的图像,还可以是包含英文字符、法文字符等字母型字符的图像。
本申请仅仅以上述为例进行说明,并不对待处理字符图像的图像内容进行限定。
从图像色彩的角度,上述待处理字符图像可以是灰度图像,也可以是彩色图像。
在上述待处理字符图像是灰度图像的情况下,可以直接提取上述待处理字符图像的图像内容中的边缘信息,得到第一图像。
在上述待处理字符图像是彩色图像的情况下,可以先获得上述待处理字符图像对应的灰度图像,然后提取所获得的灰度图像的图像内容中的边缘信息,得到第一图像。
以上述待处理字符图像为GRB(red green blue,红绿蓝)图像为例,可以将RGB图像转化为YUV图像,然后将YUV图像中的Y分量对应的图像作为上述RGB图像对应的灰度图像。其中,上述Y是指Luma(亮度),U是指Chrominance(色度),V是指Chroma(饱和度)。
另外,还可以针对每一像素点,将R、G、B分量的取值设置为相同灰度值,从而获得RGB图像对应的灰度图像。具体的,上述相同灰度值可以通过对R分量、G分量和B分量执行最大值法、平均值法等算法计算得到。
其中,最大值法是指将一个像素点的R、G、B分量的取值中最大值作为上述相同灰度值。平均值法是指将R、G、B三个分量取值的平均值作为上述相同灰度值。
参见图2a和图2b,图2a示出了一种待处理字符图像,图2b示出了一种第一图像。提取图2a所示的待处理字符图像的图像内容中边缘信息得到图2b所示的第一图像。
S102:去除第一图像中的直线,得到第二图像。
可以认为图像中像素值相同或者相近、相邻排列、且数量大于预设数量的像素点形成直线。上述相邻排列的像素点所形成的直线可以是水平直线,可以是竖直直线,还可以是倾斜的直线。本申请并不对此进行限定。
具体的,上述形成直线的像素点本申请实施例称为直线像素点。
本申请的一个实施例中,可以去除第一图像中的水平直线和/或竖直直线。去除直线的过程将在后续描述。
参见图2c,图2c示出了一种第二图像。该第二图像为去除图2b所示的第一图像中水平直线和竖直直线后得到的图像。
S103:针对第二图像中的每一第一像素点,确定包含第一像素点的局部图像区域,计算上述局部图像区域的表征值,并在上述表征值小于第一预设阈值的情况下,设置第一像素点为非边缘点,得到第三图像,第三图像作为对待处理字符图像进行图像处理的结果。
其中,上述表征值,用于表征上述局部图像区域内边缘点在上述局部图像区域的所有像素点中所占的比例。
对于一个第一像素点而言,上述局部图像区域可以为:以第一像素点为圆心、且以预设像素数量个像素点为半径的圆形区域。例如,上述预设像素数量个像素点可以为3个像素点、4个像素点、5个像素点、6个像素点、7个像素点等。应当理解,上述预设像素数量个像素点可以依据实际情况具体设置。
上述第一预设阈值为(0,1)区间内的数值,例如,第一预设阈值的取值可以为0.4、0.5等。
由于第一图像是提取待处理字符图像的图像内容中的边缘信息得到的,所以第一图像中的像素点可以被划分为两类:边缘点和非边缘点。又由于第二图像是基于第一图像得到的,因此,第二图像中的像素点也可以被划分为边缘点和非边缘点两类。受边缘提取算法以及直线去除方式等因素的影响,上述第二图像中的边缘点和非边缘点可能会存在误差,因此需要对第二图像中每一像素点是否为边缘点的结果进行纠正。又由于图像中像素点之间存在空间相关性,也就是,位置相近的像素点同为边缘点或者是同为非边缘点的概率较高,所以,对于每一第一像素点而言,可以依据其对应的局部图像区域内各个像素点是否为边缘点的情况,对第一像素点是否为边缘点进行纠正。
参见图2d,图2d示出了一种第三图像。该第三图像为对图2c所示的第二图像进行纠正处理得到的第三图像。
本申请的一个实施例中,可以以迭代的方式执行上述S103,也就是,在执行完一次上述S103得到第三图像后,再以所得到的第三图像为新的第二图像,再次执行上述S103。
一种方式中,可以预先设定迭代次数,当执行上述S103的次数达到上述迭代次数的情况下,结束迭代过程,并将最后一次执行S103得到的第三图像作为最终的第三图像。
另一种方式中,在每次执行上述S103得到第三图像后,还可以判断所得到的第三图像是否与本次执行S103时的第二图像是否相同,若相同,则结束迭代过程,并将最后一次执行S103得到的第三图像作为最终的第三图像。
具体的,当上述第三图像、本次执行S103时的第二图像中相同位置像素点的像素值均相同时,认为第三图像与本次执行S103时的第二图像相同。也就说明,本次执行S103时的第二图像中各个第一像素点的表征值均不小于第一预设阈值。
由以上可见,应用本实施例提供的方案进行图像处理时,由于上述表征值表示了局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相邻近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性能够对第二图像中各个第一像素点是否为边缘点进行纠正。
又由于提取包含字符的待处理字符图像的图像内容中的边缘信息时,属于字符的像素点会作为边缘点被提取出来,也就是,属于字符的像素点为边缘点,因此应用本实施例提供的方案能够定位出图像中属于字符的像素点。
除此之外,上述表征值表示的是局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,是统计值,说明本实施例提供的方案是通过对图像中局部图像区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。另外,对于字符中包含的任何笔画而言,笔画所包含的像素点均会在图像的局部图像区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
再者,发明人在实现本申请实施例的过程中,经实验发现,基于上述表征值检测位于低曲率直线上的边缘点有较好的效果。而方块型字符中笔画的曲率较低,所以应用本实施例提供的方案进行对包含方块型字符的图像进行图像处理,所定位出属于字符的像素点的准确率更高。
下面再通过具体实施例对上述图1a所示实施例中各个步骤进行详细说明。
本申请的一个实施例中,上述S103可以按照以下两种情况进行像素点统计,得到第一统计值和第二统计值,并计算上述第二统计值与第一统计值之间的比值,作为表征值。为方便描述,局部图像区域内的像素点被称为第二像素点。
其中,上述第一统计值为:表征上述局部图像区域内各个第二像素点与第一像素点位置关系的统计值。也就是,上述第一统计值是表征上述局部图像区域内各个第二像素点与第一像素点是否位于同一排的情况的统计值。
上述第二统计值为:表征上述局部图像区域内边缘点数量的统计值。
第一种情况,在第二像素点与第一像素点位于同一排的情况下,将第一统计值增加第一值,若第二像素点为边缘点,将第二统计值增加上述第一值。
另外,若第二像素点不为边缘点,则第二统计值不变。
具体的,对于每一第二像素点而言,可以设置第一统计值和第二统计值的初始值均为0。
像素点是图像的最小信息单位,且像素点在图像中是呈行、列的形式排布的,因此,位于同一排的像素点可以是位于同一像素行的像素点,也可以是位于同一像素列的像素点。
基于上述情况,第二像素点与第一像素点位于同一排可以理解为:第二像素点与第一像素点位于同一像素行,或者第二像素点与第一像素点位于同一像素列。
上述第一值可以是预先设定的。例如,上述第一值的取值可以为2、3等。
本申请的一个实施例中,在判断第二像素点是否为边缘点时,可以通过判断第二像素点的像素值是否为预先设定的表示边缘点的像素值实现。其中,上述预先设定的表示边缘点的像素值可以为0、255等。
本申请的另一个实施例中,在判断第二像素点是否为边缘点时,还可以通过判断第二像素点的像素值是否位于预先设定的表示边缘点的像素值范围实现。其中,上述预先设定的表示边缘点的像素值范围可以是[0,254]、[0,128]等。
第二种情况,在第二像素点与第一像素点不位于同一排的情况下,将第一统计值增加第二值,若第二像素点为边缘点,将第二统计值增加上述第二值。
另外,若第二像素点不为边缘点,则第二统计值不变。
由于两个像素点位于同一排可以是指两个像素点位于同一像素行,也可以是两个像素点位于同一像素列,所以,第二像素点与第一像素点不位于同一排可以理解为:第二像素点与第一像素点不位于同一像素行,也不位于同一像素列。
其中,上述第二值可以小于第一值。上述第二值可以是预先设定的。例如,在第一值的取值为2的情况下,第二值的取值可以为1。另外,上述第二值还可以大于第一值。例如,在上述第一值的取值为1的情况下,上述第二值的取值可以为2。
由于本实施例提供的方案中第二值与第一值不同,所以第一统计和第二统计值能够反映与第一像素点位于同一排的第二像素点的情况、以及与第一像素点不位于同一排的第二像素点的情况。对于待处理字符图像中包括字符的情况,尤其是所包括的字符为中文字符、日文字符、韩文字符等方块型字符的情况,这些字符中存在较多呈水平方向或者竖直方向的笔画,也就是,存在较多像素点位于同一排的笔画,且这些笔画上的像素点均为边缘点。又由于本实施例中上述表征值是基于像素点是否位于同一排统计得到的,所以,针对于待处理字符图像中包括方块型字符的情况,应用本实施例提供的方案计算出的表征值更加能够表征局部图像区域内边缘点所占的比例。
本申请的一个实施例中,可以按照以下步骤A-步骤F设置第一图像中每一第三像素点的像素值,得到上述第一图像。为方便描述,本申请实施例将待处理字符图像中与第三像素点位置相同的像素点,称之为第四像素点。
步骤A:计算第四像素点与第一相邻像素点之间的像素值差的第一绝对值。
具体的,计算第四像素点与第一相邻像素点之间的像素值差的第一绝对值时,可以获得第四像素点的像素值,记为Value1,获得第一相邻像素点的像素值,记为Value2,第一绝对值=|Value1-Value2|。
其中,第一相邻像素点为:待处理字符图像中第一方向上与第四像素点相邻的像素点。
具体的,上述第一方向可以为水平方向,也可以为竖直方向。
在上述第一方向为水平方向的情况下,第一相邻像素点可以为待处理字符图像中沿水平方向向左与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第一相邻像素点的坐标为(x-1,y)。第一相邻像素点还可以为待处理字符图像中沿水平方向向右与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第一相邻像素点的坐标为(x+1,y)。
在上述第一像素单元方向为竖直方向的情况下,第一相邻像素点可以为待处理字符图像中沿竖直方向向上与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第一相邻像素点的坐标为(x,y-1)。第一相邻像素点还可以为待处理字符图像中沿竖直方向向下与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第一相邻像素点的坐标为(x,y+1)。
步骤B:若第一绝对值小于第二预设阈值,确定第三像素点的假设像素值为表征非边缘点的像素值。
具体的,上述第二预设阈值可以依照具体应用场景中对图像内容变化的敏感性确定。上述第二预设阈值的取值越小,对图像内容变化的敏感性越高,上述第二预设阈值的取值越大,对图像内容变化的敏感性越低。发明人在实现本申请实施例所提供方案的过程中发现,对于OCR这一应用场景而言,上述第二预设阈值不宜设置的太小,例如,可以设置上述第二预设阈值的取值为50、60等,这样可以有效去除图像中的渐变色区域。
上述表征非边缘点的像素值可以是预先设定的数值,例如,上述像素值可以为255等。
本申请的一个实施例中,还可以预先设定表征非边缘点的像素值范围,这种情况下,上述表征非边缘点的像素值可以为上述像素值范围内的一个数值。
例如,上述像素值范围可以为[129,255]等。
步骤C:若第一绝对值不小于第二预设阈值,选择第四像素点的像素值与第一相邻像素点的像素值中的最小值为上述假设像素值。
本申请的一个实施例中,有些情况下第四像素点不存在第一相邻像素点,这种情况下,可以设置第三像素点的假设像素值为上述表征非边缘点的像素值。
例如,在沿水平方向向左确定第一相邻像素点时,由于待处理字符图像内第一个像素列中各第四像素点是待处理字符图像中最左侧的像素点,所以第一个像素列中各第四像素点不存在沿水平方向向左相邻的像素点,所以,不存在第一相邻像素点。
步骤D:计算第四像素点与第二相邻像素点之间的像素值差的第二绝对值。
具体的,计算第四像素点与第二相邻像素点之间的第二绝对值时,可以获得第四像素点的像素值,记为Value1,获得第二相邻像素点的像素值,记为Value3,第二绝对值=|Value1-Value3|。
其中,第二相邻像素点为:待处理字符图像中在第二方向上与第四像素点相邻的像素点。
与上述第一方向类似,上述第二方向可以水平方向,还可以是竖直方向。
另外,第二方向为与第一方向不同的方向。例如,在第一方向为水平方向的情况下,第二方向为竖直方向。在第一方向为竖直方向的情况下,第二方向为水平方向。
在上述第二方向为水平方向的情况下,第二相邻像素点可以为待处理字符图像中沿水平方向向左与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第二相邻像素点的坐标为(x-1,y)。第二相邻像素点还可以为待处理字符图像中沿水平方向向右与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第一相邻像素点的坐标为(x+1,y)。
在上述第二像素单元方向为竖直方向的情况下,第二相邻像素点可以为待处理字符图像中沿竖直方向向上与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第二相邻像素点的坐标为(x,y-1)。第二相邻像素点还可以为待处理字符图像中沿竖直方向向下与第四像素点相邻的像素点。例如,第四像素的坐标为(x,y)时,第二相邻像素点的坐标为(x,y+1)。
步骤E:若第二绝对值小于第三预设阈值,设置第三像素点的像素值为上述假设像素值。
其中,本步骤中上述假设像素值为上述步骤B或者步骤C得到的假设像素值。
步骤F:若第二绝对值不小于第三预设阈值,设置第三像素点的像素值为第四像素点的像素值、第二相邻像素点的像素值和上述假设像素值中的最小值。
本申请的一个实施例中,有些情况下第四像素点不存在第二相邻像素点,这种情况下,可以设置第三像素点的像素值为上述假设像素值。其中,上述假设像素值为上述步骤B或者步骤C得到的假设像素值。
例如,在沿竖直方向向下确定第二相邻像素点时,由于待处理字符图像内最后一个像素行中各第四像素点是待处理字符图像中最下面的像素点,所以最后一个像素行中各第四像素点不存在沿竖直方向向下相邻的像素点,所以,不存在第二相邻像素点。
根据本申请实施例提供的方案,若将像素点的像素值设置为表征非边缘点的像素值,则说明这一像素点不是边缘点,相应的,若像素点的像素值未被设置为表征非边缘点的像素值,则说明这一像素点是边缘点。鉴于上述情况,逐一设置待处理字符图像中每一像素点的像素值后,也就完成了对待处理字符图像的边缘提取,获得了第一图像。
也就是,上述步骤A-F实现了上述S101中所提及的提取待处理字符图像的图像内容中的边缘信息,从而得到了第一图像。
下面通过具体实例对上述步骤A-F进行说明。
步骤A:假设,第四像素点的像素值P1=100,第一相邻像素点的像素值P2=50,则第一绝对值P3=|P1-P2|=|100-50|=50。
步骤B:假设第二预设阈值Th1=80,表征非边缘点的像素值为P5=40,由于P3=50,小于Th1,则确定第三像素点的假设像素值P4=P5=40。
由于P3小于Th1,不满足P3不小于Th1的条件,因此不执行上述步骤C。
步骤D:假设,第二相邻像素点的像素值P6=20,则第二绝对值P7=|P1-P6|=|100-20|=80。
假设第三预设阈值Th2为50,P7大于Th2,不满足P7小于Th2的条件,因此不执行上述步骤E。
步骤F:由于P7=80,大于Th2,则设置第三像素点的像素值为P1、P6和P4中的最小值,100、20、40中的最小值为20,所以,设置第三像素点的像素值为20。
本申请的一个实施例中,上述S102通过以下步骤G-步骤H实现去除第一图像中的直线。
步骤G:针对第一图像的每一第一排像素点,将第一排像素点中满足以下关系式的像素点确定为直线像素点:
G1<G2且G1<Th
其中,Th表示判断直线像素点的像素值阈值,G1表示像素点的像素值,G2表示像素点所对应参照点的像素值,第一排像素点中每一像素点所对应的参照点与该像素点间隔第二预设数量个像素点、且上述参照点位于第一直线,上述第一直线与第一排像素点所在的直线垂直。
为便于进行概念区分,本实施例中将上述第一图像中的位于每一排的像素点称为第一排像素点。
由于上述第一排像素点可以是像素行,也可以是像素列,因为本步骤中不仅需要针对第一图像中的每一像素行进行处理,还需要针对第一图像中的每一像素列进行处理。
具体的,上述判断直线像素点的阈值可以由开发人员按照经验值设定。上述判断直线像素点的阈值还可以通过对第一图像中像素点的像素值进行分析得到,例如,将第一图像中像素点数量最多的像素值确定为上述判断直线像素点的像素值阈值等。
除此之外,还可以通过OSTU(最大类间方差)算法获得上述判断直线像素点的阈值。
上述第二预设数量可以为1、2、3等等。
在当前处理处理的第一排像素点为像素行的情况下,第一排像素点所在的直线为水平直线,与水平直线垂直的直线为竖直直线,也就是,上述第一直线为竖直直线。这种情况下,对于当前处理的第一排像素点中的一个像素点而言,所对应的参照点沿竖直方向向上或者向下与该像素点间隔第二预设数量个像素点,可见上述参照点位于上述第一直线上。参见图3,示出了一种像素点分布示意图,图中黑点表示像素点。假设,当前处理的第一排像素点中一个像素点的坐标为(x,y),上述第二预设数量为1,所以,这种情况下该像素点的参照点的坐标可以为(x,y+2),或者(x,y-2)。
在当前处理处理的第一排像素点为像素列的情况下,第一排像素点所在的直线为竖直直线,与竖直直线垂直的直线为水平直线,也就是,上述第一直线为水平直线。这种情况下,对于当前处理的第一排像素点中的一个像素点而言,所对应的参照点沿水平方向向左或者向右与该像素点间隔第二预设数量个像素点,可见上述参照点位于上述第一直线上。参见图3,在当前处理的第一排像素点中一个像素点的坐标为(x,y)的情况下,上述第二预设数量为1时,该像素点的参照点的坐标可以为(x+2,y),或者(x-2,y)。
步骤H:如果第一排像素点中连续存在直线像素点、且连续存在的直线像素点的数量不小于第一预设数量,则设置上述连续存在的直线像素点为非边缘点,得到第二图像。
例如,上述第一预设数量可以是50、60等。
另外,发明人在实现本申请实施例所提供方案的过程中,考虑到图像中字符的每一笔画可能不仅仅位于一个像素行或者一个像素列,而是位于多个像素行或者像素列,基于此,本申请的一个实施例中,可以以迭代的方式执行上述步骤G、H,也就是,在执行完一次上述步骤G、H得到第二图像后,再以所得到的第二图像为新的第一图像,再次执行上述步骤G、H。
在一个实施例中,可以预先设定迭代次数,当执行上述步骤G、H的次数达到上述迭代次数的情况下,结束迭代过程,并将最后一次执行步骤G、H得到的第二图像作为最终的第二图像。
在另一个实施例中,在每次执行上述步骤G、H得到第二图像后,还可以判断所得到的第二图像是否与本次执行步骤G、H时的第一图像相同,若相同,则结束迭代过程,并将最后一次执行步骤G、H得到的第二图像作为最终的第二图像。
具体的,当上述第二图像、本次执行步骤G、H时的第一图像中相同位置像素点的像素值均相同时,认为第二图像与本次执行步骤G、H时的第一图像相同。也就说明,本次执行步骤G、H时,第一图像内第一排像素点中连续存在的直线像素点的数量均小于第一预设数量。
例如,图2c所示的第二图像为多次执行上述步骤G、H得到的第二图像。
本申请的一个实施例中,参见图1b,提供了另一种图像处理方法的流程示意图,与前述图1a所示实施例相比,本实施例中,在上述S103得到第三图像之后,还可以以下S104-S107。
S104:去除第三图像中的噪声,得到第四图像。
具体的,可以采用椒盐去噪方式去除上述第三图像中的噪声,当然,也可以采用现有技术的其他去噪方式去除上述第三图像中的噪声,这里不再赘述。
S105:确定第四图像中各个边缘点所属的边缘点簇。
由于图像中的图像内容(例如字符)具有连续性,且属于一个字符的像素点在图像的局部区域集中呈现,也就是,成簇呈现。具体的,确定第四图像中各个边缘点所属的边缘点簇时,可以采用现有技术中的任何分簇方式实现,本申请并不对此进行限定。例如,上述分簇算法可以是LEACH分簇算法、HEED分簇算法等。
S106:针对每一边缘点簇,获得包含边缘点簇中各个像素点的矩形区域。
基于上述情况,对于上述每一边缘点簇而言,包含边缘点簇中各个像素点的矩形区域可能是图像中字符所在区域。本申请的一种实现方式中,上述包含边缘点簇中各个像素点的矩形区域可以是包含边缘点簇中所有像素点的最小矩形区域。
参见图4,图4中左下角示出了部分矩形区域。需要说明的是,图4中仅仅作为示意示出了第三图像中的部分矩形区域,并非全部矩形区域。
S107:从所获得的矩形区域中,选择宽度小于预设宽度或者高度小于预设高度的矩形区域,将所选择矩形区域内的像素点确定为非边缘点,得到第五图像。
本申请的一个实施例中,在获得了分别包含各个边缘点簇中像素点的矩形区域后,还可以判断各个矩形区域之间的距离,若两个矩形区域之间的距离小于预设的距离阈值,例如,1个像素点,则可以将两个矩形区域合并为一个矩形区域。
本申请的一个实施例中,上述预设宽度和预设高度可以根据大多数字符的宽度和高度设定的。这样,当一个矩形区域的宽度小于上述预设宽度、或者高度小于上述预设高度时,说明这一矩形在宽度或者高度上不符合大多数字符宽度或者高度的要求,进而可以认为这样的矩形区域不是真正的字符所在区域,所以可以将其排除掉。
由于图像中属于字符的像素点在经过上述S101-S103的处理后表现为边缘点,所以去除第三图像中的噪声得到第四图像,且对第四图像中的边缘点进行分簇处理后,能够较好的选择出第四图像中字符所在的区域,从而能够更好地去除第四图像中不属于字符的内容。
本申请的一个实施例中,在得到上述第五图像之后,还可以针对第五图像中每一第五像素点,在第五像素点的像素值小于第六像素点的像素值时,设置第五像素点的像素值为第六像素点的像素值。在第五像素点的像素值不小于第六像素点的像素值时,保持第五像素点的像素值不变。
其中,第六像素点为:第六图像中位置与第五像素点相同的像素点。第六图像为:第二图像或者待处理字符图像对应的灰度图像。
参见图5,图5示出了一种第五图像。该第五图像为结合图2c所示的第二图像设置第五像素点的像素值后得到的第五图像。
由于经过上述实施例提供的方案得到的第五图像中可能会存在边缘点损失,而上述第二图像或者待处理字符图像对应的灰度图像中包含的信息较为丰富,所以,结合第二图像或者待处理字符图像对应的灰度图像对第五图像的像素值重新进行设定后,能够使得损失的边缘点得到补救。
与上述图像处理方法相对应,本申请实施例还提供了一种图像处理装置。
图6为本申请实施例提供的一种图像处理装置的结构示意图,该装置包括:
边缘提取模块601,用于提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
直线去除模块602,用于去除所述第一图像中的直线,得到第二图像;
第三图像获得模块603,用于针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域,计算所述局部图像区域的表征值,其中,所述表征值用于表征所述局部图像区域内边缘点在所述局部图像区域的所有像素点中所占的比例,并在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,所述第三图像作为对所述待处理字符图像进行图像处理的结果。
本申请的一个实施例中,所述第三图像获得模块603,包括:
局部区域确定子模块,用于针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域;
表征值计算子模块,用于针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点位于同一排的情况下,将第一统计值增加第一值,若第二像素点为边缘点,将第二统计值增加所述第一值,其中,所述第一统计值为:表征所述局部图像区域内各个第二像素点与第一像素点位置关系的统计值,所述第二统计值为:表征所述局部图像区域内边缘点数量的统计值;针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点不位于同一排的情况下,将所述第一统计值增加第二值,若第二像素点为边缘点,将所述第二统计值增加所述第二值;其中,所述第二值不等于所述第一值;计算所述第二统计值与第一统计值的比值,作为表征值;
图像获得子模块,用于在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,作为对所述待处理字符图像进行图像处理的结果。
本申请的一个实施例中,所述边缘提取模块601,具体用于按照以下方式设置第一图像中每一第三像素点的像素值,得到所述第一图像:
计算第四像素点与第一相邻像素点之间的像素值差的第一绝对值,其中,所述第四像素点为:待处理字符图像中与第三像素点位置相同的像素点,所述第一相邻像素点为:待处理字符图像中在第一方向上与第四像素点相邻的像素点;
若所述第一绝对值小于第二预设阈值,确定第三像素点的假设像素值为表征非边缘点的像素值;
若所述第一绝对值不小于第二预设阈值,选择第四像素点的像素值与第一相邻像素点的像素值中的最小值为所述假设像素值;
计算第四像素点与第二相邻像素点之间的像素值差的第二绝对值,其中,所述第二相邻像素点为:待处理字符图像中在第二方向上与第四像素点相邻的像素点;
若所述第二绝对值小于第三预设阈值,设置第三像素点的像素值为所述假设像素值;
若所述第二绝对值不小于第三预设阈值,设置第三像素点的像素值为第四像素点的像素值、第二相邻像素点的像素值和所述假设像素值中的最小值。
本申请的一个实施例中,所述直线去除模块602,具体用于:
针对所述第一图像的每一第一排像素点,将第一排像素点中满足以下关系式的像素点确定为直线像素点:
G1<G2且G1<Th
其中,Th表示判断直线像素点的像素值阈值,G1表示像素点的像素值,G2表示像素点所对应参照点的像素值,所述第一排像素点中每一像素点所对应的参照点与该像素点间隔第二预设数量个像素点、且所述参照点位于第一直线,所述第一直线与第一排像素点所在的直线垂直;
如果第一排像素点中连续存在直线像素点、且连续存在的直线像素点的数量不小于第一预设数量,则设置所述连续存在的直线像素点为非边缘点,得到第二图像。
本申请的一个实施例中,上述图像处理装置还可以包括:
噪声去除模块,用于去除所述第三图像中的噪声,得到第四图像;
簇确定模块,用于确定所述第四图像中各个边缘点所属的边缘点簇;
区域获得模块,用于针对每一边缘点簇,获得包含所述边缘点簇中各个像素点的矩形区域;
区域选择模块,用于从所获得的矩形区域中,选择宽度小于预设宽度或者高度小于预设高度的矩形区域;
第五图像获得模块,用于将所选择矩形区域内的像素点确定为非边缘点,得到第五图像。
本申请的一个实施例中,上述图像处理装置还可以包括:
像素值设置模块,用于针对所述第五图像中每一第五像素点,在第五像素点的像素值小于第六像素点的像素值时,设置第五像素点的像素值为第六像素点的像素值,其中,第六像素点为:第六图像中位置与第五像素点相同的像素点,所述第六图像为:所述第二图像或者所述待处理字符图像对应的灰度图像。
由以上可见,应用上述各个实施例提供的方案进行图像处理时,由于上述表征值表示了局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相邻近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性能够对第二图像中各个第一像素点是否为边缘点进行纠正。又由于在定位图像中属于字符的像素点时,属于字符的像素点为边缘点,因此应用上述各个实施例提供的方案能够定位出图像中属于字符的像素点。除此之外,上述表征值表示的是局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,是统计值,说明本申请实施例提供的方案是通过对图像中局部区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。另外,对于字符中包含的任何笔画而言,其中的像素点均会在图像的局部区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
与上述图像处理方法相对应,本申请实施例还提供了一种电子设备。
图7为本申请实施例提供的一种电子设备的结构示意图,该电子设备包括:处理器701和机器可读存储介质702,所述机器可读存储介质702存储有能够被所述处理器701执行的机器可执行指令,所述处理器701被所述机器可执行指令促使:实现本申请实施例所述的图像处理方法步骤。
需要说明的是,上述处理器701被机器可执行指令促使实现的图像处理方法的其他实施例,与前述方法实施例部分提及的实施例相同,这里不再赘述。
如图7所示,上述电子设备还可以包括通信总线703,处理器701、机器可读存储介质702通过通信总线703完成相互间的通信,可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线703可以分为地址总线、数据总线、控制总线等。
上述通信总线703除了可以连接有上述处理器701、机器可读存储介质702外,还可以连接有收发器704等器件。
机器可读存储介质702可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。另外,机器可读存储介质702还可以是至少一个位于远离前述处理器的存储装置。
处理器701可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由以上可见,应用上述各个实施例提供的电子设备进行图像处理时,由于上述表征值表示了局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相邻近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性能够对第二图像中各个第一像素点是否为边缘点进行纠正。又由于在定位图像中属于字符的像素点时,属于字符的像素点为边缘点,因此应用本实施例提供的方案能够定位出图像中属于字符的像素点。除此之外,上述表征值表示的是局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,是统计值,说明本申请实施例提供的方案是通过对图像中局部区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。另外,对于字符中包含的任何笔画而言,其中的像素点均会在图像的局部区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
与上述图像处理方法相对应,本申请实施例还提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的图像处理方法步骤。
需要说明的是,上述机器可执行指令促使处理器实现的图像处理方法的其他实施例,与前述方法实施例部分提及的实施例相同,这里不再赘述。
由以上可见,执行本实施例提供的机器可读存储介质存储有机器可执行指令进行图像处理时,由于上述表征值表示了局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,也就是,上述表征值反映了局部图像区域内边缘点的多少,且图像中像素点之间具有空间相关性,也就是,位置相邻近的像素点同为边缘点或者是同为非边缘点的概率较高,因此,在得知了局部图像区域内边缘点多少的情况下,结合图像本身所具有的上述空间相关性能够对第二图像中各个第一像素点是否为边缘点进行纠正。又由于在定位图像中属于字符的像素点时,属于字符的像素点为边缘点,因此应用本实施例提供的方案能够定位出图像中属于字符的像素点。除此之外,上述表征值表示的是局部图像区域内边缘点在局部图像区域的所有像素点中所占的比例,是统计值,说明本申请实施例提供的方案是通过对图像中局部区域内的像素点进行统计的方式进行边缘点与非边缘点区分的,也就是通过像素点统计的方式对属于字符的像素点和不属于字符的像素点进行区分。另外,对于字符中包含的任何笔画而言,其中的像素点均会在图像的局部区域存在空间相关性。因此,在通过像素点统计的方式区分了属于字符的像素点和不属于字符的像素点的情况下,再结合上图像本身所具有的上述空间相关性,能够提高所定位出属于字符的像素点的准确率,从而能够提高定位出字符所在区域的准确率,提高后续执行OCR时所识别出字符的准确率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和机器可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (12)
1.一种图像处理方法,其特征在于,所述方法包括:
提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
去除所述第一图像中的直线,得到第二图像;
针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域,计算所述局部图像区域的表征值,其中,所述表征值用于表征所述局部图像区域内边缘点在所述局部图像区域的所有像素点中所占的比例,并在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,所述第三图像作为对所述待处理字符图像进行图像处理的结果;
所述计算所述局部图像区域的表征值,包括:
针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点位于同一排的情况下,将第一统计值增加第一值,若第二像素点为边缘点,将第二统计值增加所述第一值,其中,所述第一统计值为:表征所述局部图像区域内各个第二像素点与第一像素点位置关系的统计值,所述第二统计值为:表征所述局部图像区域内边缘点数量的统计值;
针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点不位于同一排的情况下,将所述第一统计值增加第二值,若第二像素点为边缘点,将所述第二统计值增加所述第二值;其中,所述第二值不等于所述第一值;
计算所述第二统计值与第一统计值的比值,作为表征值。
2.根据权利要求1所述的方法,其特征在于,按照以下方式设置第一图像中每一第三像素点的像素值,得到所述第一图像:
计算第四像素点与第一相邻像素点之间的像素值差的第一绝对值,其中,所述第四像素点为:待处理字符图像中与第三像素点位置相同的像素点,所述第一相邻像素点为:待处理字符图像中在第一方向上与第四像素点相邻的像素点;
若所述第一绝对值小于第二预设阈值,确定第三像素点的假设像素值为表征非边缘点的像素值;
若所述第一绝对值不小于第二预设阈值,选择第四像素点的像素值与第一相邻像素点的像素值中的最小值为所述假设像素值;
计算第四像素点与第二相邻像素点之间的像素值差的第二绝对值,其中,所述第二相邻像素点为:待处理字符图像中在第二方向上与第四像素点相邻的像素点;
若所述第二绝对值差小于第三预设阈值,设置第三像素点的像素值为所述假设像素值;
若所述第二绝对值差不小于第三预设阈值,设置第三像素点的像素值为第四像素点的像素值、第二相邻像素点的像素值和所述假设像素值中的最小值。
3.根据权利要求1所述的方法,其特征在于,所述去除所述第一图像中的直线,得到第二图像,包括:
针对所述第一图像的每一第一排像素点,将第一排像素点中满足以下关系式的像素点确定为直线像素点:
G1<G2且G1<Th
其中,Th表示判断直线像素点的像素值阈值,G1表示像素点的像素值,G2表示像素点所对应参照点的像素值,所述第一排像素点中每一像素点所对应的参照点与该像素点间隔第二预设数量个像素点、且所述参照点位于第一直线,所述第一直线与第一排像素点所在的直线垂直;
如果第一排像素点中连续存在直线像素点、且连续存在的直线像素点的数量不小于第一预设数量,则设置所述连续存在的直线像素点为非边缘点,得到第二图像。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
去除所述第三图像中的噪声,得到第四图像;
确定所述第四图像中各个边缘点所属的边缘点簇;
针对每一边缘点簇,获得包含所述边缘点簇中各个像素点的矩形区域;
从所获得的矩形区域中,选择宽度小于预设宽度或者高度小于预设高度的矩形区域;
将所选择矩形区域内的像素点确定为非边缘点,得到第五图像。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
针对所述第五图像中每一第五像素点,在第五像素点的像素值小于第六像素点的像素值时,设置第五像素点的像素值为第六像素点的像素值,其中,第六像素点为:第六图像中位置与第五像素点相同的像素点,所述第六图像为:所述第二图像或者所述待处理字符图像对应的灰度图像。
6.一种图像处理装置,其特征在于,所述装置包括:
边缘提取模块,用于提取待处理字符图像的图像内容中的边缘信息,得到第一图像;
直线去除模块,用于去除所述第一图像中的直线,得到第二图像;
第三图像获得模块,用于针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域,计算所述局部图像区域的表征值,其中,所述表征值用于表征所述局部图像区域内边缘点在所述局部图像区域的所有像素点中所占的比例,并在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,所述第三图像作为对所述待处理字符图像进行图像处理的结果;
所述第三图像获得模块,包括:
局部区域确定子模块,用于针对所述第二图像中的每一第一像素点,确定包含所述第一像素点的局部图像区域;
表征值计算子模块,用于针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点位于同一排的情况下,将第一统计值增加第一值,若第二像素点为边缘点,将第二统计值增加所述第一值,其中,所述第一统计值为:表征所述局部图像区域内各个第二像素点与第一像素点位置关系的统计值,所述第二统计值为:表征所述局部图像区域内边缘点数量的统计值;针对所述局部图像区域内的每一第二像素点,在第二像素点与第一像素点不位于同一排的情况下,将所述第一统计值增加第二值,若第二像素点为边缘点,将所述第二统计值增加所述第二值;其中,所述第二值不等于所述第一值;计算所述第二统计值与第一统计值的比值,作为表征值;
图像获得子模块,用于在所述表征值小于第一预设阈值的情况下,设置所述第一像素点为非边缘点,得到第三图像,作为对所述待处理字符图像进行图像处理的结果。
7.根据权利要求6所述的装置,其特征在于,所述边缘提取模块,具体用于按照以下方式设置第一图像中每一第三像素点的像素值,得到所述第一图像:
计算第四像素点与第一相邻像素点之间的像素值差的第一绝对值,其中,所述第四像素点为:待处理字符图像中与第三像素点位置相同的像素点,所述第一相邻像素点为:待处理字符图像中在第一方向上与第四像素点相邻的像素点;
若所述第一绝对值小于第二预设阈值,确定第三像素点的假设像素值为表征非边缘点的像素值;
若所述第一绝对值不小于第二预设阈值,选择第四像素点的像素值与第一相邻像素点的像素值中的最小值为所述假设像素值;
计算第四像素点与第二相邻像素点之间的像素值差的第二绝对值,其中,所述第二相邻像素点为:待处理字符图像中在第二方向上与第四像素点相邻的像素点;
若所述第二绝对值小于第三预设阈值,设置第三像素点的像素值为所述假设像素值;
若所述第二绝对值不小于第三预设阈值,设置第三像素点的像素值为第四像素点的像素值、第二相邻像素点的像素值和所述假设像素值中的最小值。
8.根据权利要求6所述的装置,其特征在于,所述直线去除模块,具体用于:
针对所述第一图像的每一第一排像素点,将第一排像素点中满足以下关系式的像素点确定为直线像素点:
G1<G2且G1<Th
其中,Th表示判断直线像素点的像素值阈值,G1表示像素点的像素值,G2表示像素点所对应参照点的像素值,所述第一排像素点中每一像素点所对应的参照点与该像素点间隔第二预设数量个像素点、且所述参照点位于第一直线,所述第一直线与第一排像素点所在的直线垂直;
如果第一排像素点中连续存在直线像素点、且连续存在的直线像素点的数量不小于第一预设数量,则设置所述连续存在的直线像素点为非边缘点,得到第二图像。
9.根据权利要求6-8中任一项所述的装置,其特征在于,所述装置还包括:
噪声去除模块,用于去除所述第三图像中的噪声,得到第四图像;
簇确定模块,用于确定所述第四图像中各个边缘点所属的边缘点簇;
区域获得模块,用于针对每一边缘点簇,获得包含所述边缘点簇中各个像素点的矩形区域;
区域选择模块,用于从所获得的矩形区域中,选择宽度小于预设宽度或者高度小于预设高度的矩形区域;
第五图像获得模块,用于将所选择矩形区域内的像素点确定为非边缘点,得到第五图像。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
像素值设置模块,用于针对所述第五图像中每一第五像素点,在第五像素点的像素值小于第六像素点的像素值时,设置第五像素点的像素值为第六像素点的像素值,其中,第六像素点为:第六图像中位置与第五像素点相同的像素点,所述第六图像为:所述第二图像或者所述待处理字符图像对应的灰度图像。
11.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-5任一所述的方法步骤。
12.一种机器可读存储介质,其特征在于,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现权利要求1-5任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818806.4A CN111695557B (zh) | 2019-08-30 | 2019-08-30 | 一种图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818806.4A CN111695557B (zh) | 2019-08-30 | 2019-08-30 | 一种图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111695557A CN111695557A (zh) | 2020-09-22 |
CN111695557B true CN111695557B (zh) | 2024-04-26 |
Family
ID=72476067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910818806.4A Active CN111695557B (zh) | 2019-08-30 | 2019-08-30 | 一种图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695557B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115147856B (zh) * | 2022-07-08 | 2023-04-28 | 上海弘玑信息技术有限公司 | 一种表格信息提取的方法及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018166276A1 (zh) * | 2017-03-15 | 2018-09-20 | 北京京东尚科信息技术有限公司 | 文字区域定位方法和装置、计算机可读存储介质 |
CN109308478A (zh) * | 2018-09-26 | 2019-02-05 | 新华三信息安全技术有限公司 | 一种字符识别方法及装置 |
-
2019
- 2019-08-30 CN CN201910818806.4A patent/CN111695557B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018166276A1 (zh) * | 2017-03-15 | 2018-09-20 | 北京京东尚科信息技术有限公司 | 文字区域定位方法和装置、计算机可读存储介质 |
CN109308478A (zh) * | 2018-09-26 | 2019-02-05 | 新华三信息安全技术有限公司 | 一种字符识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
文档处理中背景字符的去除;张重阳;杨静宇;李伟;孙明明;;计算机科学(08);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111695557A (zh) | 2020-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
CN107609546B (zh) | 一种文字标题识别方法及装置 | |
CN108830133B (zh) | 合同影像图片的识别方法、电子装置及可读存储介质 | |
CN107590447A (zh) | 一种文字标题识别方法及装置 | |
CN110647882A (zh) | 图像校正方法、装置、设备及存储介质 | |
CN106295644B (zh) | 符号识别方法及装置 | |
CN110276769B (zh) | 一种视频画中画架构中直播内容定位方法 | |
US8538191B2 (en) | Image correction apparatus and method for eliminating lighting component | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
JP2018120445A (ja) | 車番認識装置 | |
CN106682670B (zh) | 一种台标识别方法及系统 | |
CN111695557B (zh) | 一种图像处理方法及装置 | |
CN109377475B (zh) | 24色卡视频关键帧自动定位与色差时序变化分析方法 | |
CN108305284B (zh) | 一种文字笔画宽度的确定方法及装置 | |
CN112215781B (zh) | 一种改进的局部二值化方法 | |
CN110059695B (zh) | 一种基于垂直投影的字符分割方法及终端 | |
CN110334606B (zh) | 画中画定位方法及装置 | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
CN108510636B (zh) | 图像分割方法、图像分割装置及终端设备 | |
CN110633705A (zh) | 一种低照度成像车牌识别方法及装置 | |
CN111695374A (zh) | 监控视角中斑马线区域的分割方法、系统、介质及设备 | |
CN113840135B (zh) | 色偏检测方法、装置、设备及存储介质 | |
CN114219760A (zh) | 仪表的读数识别方法、装置及电子设备 | |
CN112070081A (zh) | 一种基于高清视频的智能化车牌识别方法 | |
CN113569859A (zh) | 一种图像处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |