CN106934814B - 一种基于图像的背景信息识别方法及装置 - Google Patents
一种基于图像的背景信息识别方法及装置 Download PDFInfo
- Publication number
- CN106934814B CN106934814B CN201511030772.0A CN201511030772A CN106934814B CN 106934814 B CN106934814 B CN 106934814B CN 201511030772 A CN201511030772 A CN 201511030772A CN 106934814 B CN106934814 B CN 106934814B
- Authority
- CN
- China
- Prior art keywords
- pixel
- pixel point
- image
- point
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种基于图像的背景信息识别方法及装置,所述方法包括:获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值,第一像素值用于指示像素点为字符信息或者背景信息,第二像素值用于指示像素点为字符信息;确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,像素点、前一个像素点以及后一个像素点位于同一行或者同一列;判断像素点是否为图像边缘;当像素点不是图像边缘时,将与像素点相邻的其他像素点识别为背景信息。采用本发明实施例,可有效识别背景信息。
Description
技术领域
本发明涉及图像技术领域,尤其涉及一种基于图像的背景信息识别方法及装置。
背景技术
数字图像处理(Digital Image Processing)指的是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。灰度阈值分割方法是一种最常用的并行区域技术,灰度阈值分割方法实际上是输入图像f到输出图像g的如下变换:
其中,T为阈值,对于物体的图像元素g(i,j)=1,对于背景的图像元素g(i,j)=0。由此可见,灰度阈值分割方法的关键是确定阈值,将阈值与像素点的灰度值逐个进行比较,而且像素分割可对各像素并行地进行,分割的结果直接给出图像区域。在许多情况下,物体和背景的对比度在图像中的各处不是一样的,这时很难用一个统一的阈值将物体与背景分开,无法有效识别背景信息。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于图像的背景信息识别方法及装置,可有效识别背景信息。
为了解决上述技术问题,本发明实施例提供了一种基于图像的背景信息识别方法,包括:
获取二值化图像,所述二值化图像中各个像素点的像素值为第一像素值或者第二像素值,所述第一像素值用于指示所述像素点为字符信息或者背景信息,所述第二像素值用于指示所述像素点为字符信息;
确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值,所述像素点、前一个像素点以及后一个像素点位于同一行或者同一列;
判断所述像素点是否为图像边缘;
当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息。
相应地,本发明实施例还提供了一种基于图像的背景信息识别装置,包括:
图像获取单元,用于获取二值化图像,所述二值化图像中各个像素点的像素值为第一像素值或者第二像素值,所述第一像素值用于指示所述像素点为字符信息或者背景信息,所述第二像素值用于指示所述像素点为字符信息;
像素值确定单元,用于确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值,所述像素点、前一个像素点以及后一个像素点位于同一行或者同一列;
像素点判断单元,用于判断所述像素点是否为图像边缘;
背景信息识别单元,用于当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息。
实施本发明实施例,通过获取二值化图像,确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,判断像素点是否为图像边缘,当像素点不是图像边缘时,将与像素点相邻的其他像素点识别为背景信息,可有效识别背景信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中提供的一种基于图像的背景信息识别方法的流程示意图;
图2A是本发明实施例中提供的一种图像边缘信息的界面示意图;
图2B是本发明实施例中提供的一种二值化图像的界面示意图;
图2C是本发明实施例中提供的一种像素点阵列的界面示意图;
图3是本发明实施例中提供的一种基于图像的背景信息识别装置的结构示意图;
图4是本发明实施例中提供的一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
上述颜值获取方法可以运行在平板电脑、手机、个人计算机(Personal Computer,PC)、笔记本电脑或网络电视等终端中。
请参见图1,图1是本发明实施例中的一种颜值获取方法的流程示意图,如图所示本发明实施例中的颜值获取方法可以包括:
S101,获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值。
终端可以获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值。其中,第一像素值可以用于指示该像素点为字符信息或者背景信息,第二像素值可以用于指示该像素点为字符信息。以图2B所示的二值化图像的界面示意图为例,该二值化图像中背景区域为黑色,字符区域大部分为白色,少部分为黑色,即背景区域中的像素点的像素值为0,字符区域中的像素点的像素值为0或者255,也就是说,像素值为0的像素点可以是背景信息或者字符信息,像素值为255的像素点为字符信息,则终端通过判断像素点的像素值为0或者255的方式无法识别该像素点为背景信息或者字符信息,对此,通过确定像素点、与该像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,且该像素点不是图像边缘的方式,可以识别与该像素点相邻的其他像素点为背景信息。
第一像素值可以为0,第二像素值可以为255,背景区域中的像素点的像素值为0,该二值化图像中字符区域包括黑色和白色,字符区域中的像素点的像素值为0或者255。
在可选实施例中,如果当前需要进行背景信息识别的图像为二值化图像,终端可以直接获取该二值化图像。其中,数字图像可以用m*n的矩阵表示,形成m*n个网格,各个网格代表一个像素点,各个像素点和像素值一一对应。二值化图像中各个像素点的像素值为第一像素值或者第二像素值,例如二值化图像包括背景区域和字符区域,背景区域中各个像素点的像素值可以为第一像素值,示例性的,第一像素值可以为0,即背景区域为黑色,字符区域中各个像素点的像素值可以为第一像素值或者第二像素值,示例性的,第二像素值可以为255,即字符区域大部分为白色,未被白色填充的部分为黑色。字符区域中的字符信息可以包括物体、文字或者人物等。
在可选实施例中,如果当前需要进行背景信息识别的图像不是二值化图像,终端可以对当前需要进行背景信息识别的图像进行边缘检测,得到图像边缘信息,对图像边缘信息进行形态学图像处理,得到二值化图像。其中,边缘检测是通过预设算法提取图像中字符与背景之间的交界线,预设算法可以包括:罗伯茨(Roberts)算子,Prewitt算子(是一种一阶微分算子,利用像素点上下、左右邻点的灰度差,在边缘处达到极值检测边缘),索贝尔(Sobel)算子,Marr-Hildreth算子(是一种二阶微分算子),Canny算子(是一种二阶微分算子)或者拉普拉斯(Laplace)算子等。图像边缘信息可以为图像中亮度发生急剧变化的区域边界。形态学图像处理可以为膨胀运算,即填充像素值为第二像素值的像素点所处的网格)。以图2B所示的二值化图像的界面示意图为例,传统的膨胀运算无法填充字符区域的所有部分,则背景区域为黑色,字符区域的大部分为白色,少量未被填充的部分为黑色,即通过膨胀运算得到的二值化图像中字符区域的像素点的像素值可以包括第一像素值或者第二像素值,背景区域的像素点的像素值为第一像素值。
具体实现中,终端可以对当前需要进行背景信息识别的图像进行图像缩放,例如将当前需要进行背景信息识别的图像的宽度和高度分别缩小1/2。终端还可以对图像缩放后的图像进行边缘检测,得到图像边缘信息,图像边缘信息可以如图2A所示,通过对图像进行边缘检测,可滤除图像中因颜色信息产生的边缘分布。终端得到图像边缘信息之后,可以对图像边缘信息进行形态学图像处理,得到二值化图像,以图2B所示的二值化图像为例,背景区域为图像中占据大多数的黑色区域,字符区域通过形态学图像处理被白色填充。本发明实施例中,终端对图像缩放后的图像进行边缘检测以及形态学图像处理,可提高图像处理速度。
S102,确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,像素点、前一个像素点以及后一个像素点位于同一行或者同一列。
终端获取到二值化图像之后,可以判断二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值是否均为第一像素值,当该像素点、与该像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值时,终端可以进一步执行步骤S103。其中,该像素点、前一个像素点以及后一个像素点位于同一行或者同一列。当像素点、前一个像素点以及后一个像素点位于同一行时,前一个像素点可以位于该像素点的左侧且与该像素点相邻,后一个像素点可以位于该像素点的右侧且与该像素点相邻。当像素点、前一个像素点以及后一个像素点位于同一列时,前一个像素点可以位于该像素点的上方且与该像素点相邻,后一个像素点可以位于该像素点的下方且与该像素点相邻。
在可选实施例中,终端可以在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数,进而终端可以判断位于第一行的n个像素点的像素值是否均为第一像素值,当位于第一行的n个像素点的像素值均为第一像素值时,终端可以进一步判断位于第一行第m列的像素点是否为图像边缘,2≤m≤n-1。以图2C所示的像素点阵列的界面示意图为例,n为3,即像素点阵列为3*3矩阵,终端可以判断位于第一行的三个像素点的像素值是否均为第一像素值,当位于第一行的三个像素点的像素值均为第一像素值时,终端可以判断位于第一行第二列的像素点是否为图像边缘。又如,像素点阵列为4*4矩阵,当位于第一行的四个像素点的像素值均为第一像素值时,终端可以判断位于第一行第二列的像素点是否为图像边缘,终端还可以判断位于第一行第三列的像素点是否为图像边缘。
需要说明的是,终端可以获取二值化图像中像素点的行数和列数,在行数和列数中选取最小值,并确定n小于该最小值。可选的,3≤n≤5。
在可选实施例中,终端可以在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数,进而终端可以判断位于第n行的n个像素点的像素值是否均为第一像素值,当位于第n行的n个像素点的像素值均为第一像素值时,终端可以进一步判断位于第n行第m列的像素点是否为图像边缘,2≤m≤n-1。以图2C所示的像素点阵列的界面示意图为例,n为3,即像素点阵列为3*3矩阵,终端可以判断位于第三行的三个像素点的像素值是否均为第一像素值,当位于第三行的三个像素点的像素值均为第一像素值时,终端可以判断位于第三行第二列的像素点是否为图像边缘。又如,像素点阵列为4*4矩阵,当位于第四行的四个像素点的像素值均为第一像素值时,终端可以判断位于第四行第二列的像素点是否为图像边缘,终端还可以判断位于第四行第三列的像素点是否为图像边缘。
在可选实施例中,终端可以在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数,进而终端可以判断位于第一列的n个像素点的像素值是否均为第一像素值,当位于第一列的n个像素点的像素值均为第一像素值时,终端可以进一步判断位于第m行第一列的像素点是否为图像边缘,2≤m≤n-1。以图2C所示的像素点阵列的界面示意图为例,n为3,即像素点阵列为3*3矩阵,终端可以判断位于第一列的三个像素点的像素值是否均为第一像素值,当位于第一列的三个像素点的像素值均为第一像素值时,终端可以判断位于第二行第一列的像素点是否为图像边缘。又如,像素点阵列为4*4矩阵,当位于第一列的四个像素点的像素值均为第一像素值时,终端可以判断位于第二行第一列的像素点是否为图像边缘,终端还可以判断位于第三行第一列的像素点是否为图像边缘。
在可选实施例中,终端可以在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数,进而终端可以判断位于第n列的n个像素点的像素值是否均为第一像素值,当位于第n列的n个像素点的像素值均为第一像素值时,终端可以进一步判断位于第m行第n列的像素点是否为图像边缘,2≤m≤n-1。以图2C所示的像素点阵列的界面示意图为例,n为3,即像素点阵列为3*3矩阵,终端可以判断位于第三列的三个像素点的像素值是否均为第一像素值,当位于第三列的三个像素点的像素值均为第一像素值时,终端可以判断位于第二行第三列的像素点是否为图像边缘。又如,像素点阵列为4*4矩阵,当位于第四列的四个像素点的像素值均为第一像素值时,终端可以判断位于第二行第四列的像素点是否为图像边缘,终端还可以判断位于第三行第四列的像素点是否为图像边缘。
以图2C所示的像素点阵列的界面示意图为例,终端可以在图像中确定像素点阵列,该像素点阵列的各个像素点的坐标分别为(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、(3,2)以及(3,3),当位于(1,1)、(1,2)以及(1,3)的像素点的像素值均为第一像素值时,终端可以判断位于(1,2)的像素点是否为图像边缘。当位于(3,1)、(3,2)以及(3,3)的像素点的像素值均为第一像素值时,终端可以判断位于(3,2)的像素点是否为图像边缘。当位于(1,1)、(2,1)以及(3,1)的像素点的像素值均为第一像素值时,终端可以判断位于(2,1)的像素点是否为图像边缘。当位于(1,3)、(2,3)以及(3,3)的像素点的像素值均为第一像素值时,终端可以判断位于(2,3)的像素点是否为图像边缘。
S103,判断像素点是否为图像边缘。
终端确定二值化图像中的像素点、前一个像素点以及后一个像素点的像素值均为第一像素值之后,可以判断该像素点是否为图像边缘,当该像素点不是图像边缘时,终端可以将与该像素点相邻的其他像素点识别为背景信息;当该像素点是图像边缘时,终端可以再次执行步骤S102。其中,其他像素点为与该像素点相邻的所有像素点中除前一个像素点以及后一个像素点以外的像素点。以图2C所示像素点阵列的界面示意图为例,与位于(1,2)的像素点相邻的像素点分别位于(1,1)、(1,3)、(2,2)以及A中,前一个像素点位于(1,1)中,后一个像素点位于(1,3)中,则其他像素点位于(2,2)或者A中。
在可选实施例中,终端可以判断与该像素点相邻的所有像素点的像素值是否均为第一像素值,当与该像素点相邻的所有像素点的像素值均为第一像素值时,确定该像素点不是图像边缘。当存在至少一个与该像素点相邻的像素点的像素值为第二像素值时,确定该像素点是图像边缘。
以图2C所示的像素点阵列的界面示意图为例,终端确定位于(1,1)、(1,2)以及(1,3)的像素点的像素值均为第一像素值之后,可以判断像素点A以及位于(2,2)的像素点的像素值是否为第一像素值,当像素点A以及位于(2,2)的像素点的像素值均为第一像素值时,终端可以确定位于(1,2)的像素点不是图像边缘。同理,终端确定位于(3,1)、(3,2)以及(3,3)的像素点的像素值均为第一像素值之后,可以判断像素点C以及位于(2,2)的像素点的像素值是否为第一像素值,当像素点C以及位于(2,2)的像素点的像素值均为第一像素值时,终端可以确定位于(3,2)的像素点不是图像边缘。终端确定位于(1,1)、(2,1)以及(3,1)的像素点的像素值均为第一像素值之后,可以判断像素点B以及位于(2,2)的像素点的像素值是否为第一像素值,当像素点B以及位于(2,2)的像素点的像素值均为第一像素值时,终端可以确定位于(2,1)的像素点不是图像边缘。终端确定位于(1,3)、(2,3)以及(3,3)的像素点的像素值均为第一像素值之后,可以判断像素点D以及位于(2,2)的像素点的像素值是否为第一像素值,当像素点D以及位于(2,2)的像素点的像素值均为第一像素值时,终端可以确定位于(2,3)的像素点不是图像边缘。
又如,像素点阵列为4*4矩阵时,终端可以确定与位于第一行第二列的像素点相邻的四个像素点,当上述四个像素点的像素值均为第一像素值时,终端可以确定位于第一行第二列的像素点不是图像边缘。
S104,将与像素点相邻的其他像素点识别为背景信息。
终端确定该像素点不是图像边缘之后,可以将与该像素点相邻的其他像素点识别为背景信息。具体实现中,终端可以获取背景信息的坐标,并获取当前需要进行背景信息识别的图像的RGB颜色直方图,根据RGB颜色直方图获取背景信息的颜色,进而对当前需要进行背景信息识别的图像中的字符和背景进行图像分割。进一步的,如果二值化图像是当前需要进行背景信息识别的图像进行图像缩放之后得到的。则终端可以根据获取到的背景信息的坐标和缩放比例得到当前需要进行背景信息识别的图像中背景信息的坐标,根据RGB颜色直方图获取背景信息的颜色,进而对当前需要进行背景信息识别的图像中的字符和背景进行图像分割。
在可选实施例中,终端确定位于第一行第m列的像素点不是图像边缘之后,可以将位于第一行的前一行且第m列的像素点识别为背景信息。以图2C所示的像素点阵列的界面示意图为例,当位于第一行第二列的像素点不是图像边缘时,终端可以将位于第一行的前一行且第二列的像素点识别为背景信息。又如,像素点阵列为4*4矩阵,当位于第一行第二列的像素点不是图像边缘时,终端可以将位于第一行的前一行且第二列的像素点识别为背景信息;当位于第一行第三列的像素点不是图像边缘时,终端可以将位于第一行的前一行且第三列的像素点识别为背景信息。
在可选实施例中,终端确定位于第n行第m列的像素点不是图像边缘之后,可以将位于第n行的后一行且第m列的像素点识别为背景信息。以图2C所示的像素点阵列的界面示意图为例,当位于第三行第二列的像素点不是图像边缘时,终端可以将位于第三行的后一行且第二列的像素点识别为背景信息。又如,像素点阵列为4*4矩阵,当位于第四行第二列的像素点不是图像边缘时,终端可以将位于第四行的后一行且第二列的像素点识别为背景信息;当位于第四行第三列的像素点不是图像边缘时,终端可以将位于第四行的后一行且第三列的像素点识别为背景信息。
在可选实施例中,终端确定位于第m行第一列的像素点不是图像边缘之后,可以将位于第m行且第一列的前一列的像素点识别为背景信息。以图2C所示的像素点阵列的界面示意图为例,当位于第二行第一列的像素点不是图像边缘时,终端可以将位于第二行且第一列的前一列的像素点识别为背景信息。又如,像素点阵列为4*4矩阵,当位于第二行第一列的像素点不是图像边缘时,终端可以将位于第二行且第一列的前一列的像素点识别为背景信息;当位于第三行第一列的像素点不是图像边缘时,终端可以将位于第三行且第一列的前一列的像素点识别为背景信息。
在可选实施例中,终端确定位于第m行第n列的像素点不是图像边缘之后,可以将位于第m行且第n列的后一列的像素点识别为背景信息。以图2C所示的像素点阵列的界面示意图为例,当位于第二行第三列的像素点不是图像边缘时,终端可以将位于第二行且第三列的后一列的像素点识别为背景信息。又如,像素点阵列为4*4矩阵,当位于第二行第四列的像素点不是图像边缘时,终端可以将位于第二行且第四列的后一列的像素点识别为背景信息;当位于第三行第四列的像素点不是图像边缘时,终端可以将位于第三行且第四列的后一列的像素点识别为背景信息。
以图2C所示的像素点阵列的界面示意图为例,终端确定位于(1,2)的像素点不是图像边缘之后,可以将像素点A识别为背景信息。终端确定位于(3,2)的像素点不是图像边缘之后,可以将像素点C识别为背景信息。终端确定位于(2,1)的像素点不是图像边缘之后,可以将像素点B识别为背景信息。终端确定位于(2,3)的像素点不是图像边缘之后,可以将像素点D识别为背景信息。
本发明实施例中,获取二值化图像,确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,判断像素点是否为图像边缘,当像素点不是图像边缘时,将与像素点相邻的其他像素点识别为背景信息,可有效识别背景信息。
请参见图3,图3是本发明实施例中提供的一种基于图像的背景信息识别装置的结构示意图,本发明实施例中的基于图像的背景信息识别装置可以包括平板电脑、手机、个人计算机、笔记本电脑、车载设备、网络电视等终端,如图所示本实施例中的基于图像的背景信息识别装置至少可以包括图像获取单元301、像素值确定单元302、像素点判断单元303以及背景信息识别单元304,其中:
图像获取单元301,用于获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值,第一像素值用于指示像素点为字符信息或者背景信息,第二像素值用于指示像素点为字符信息。
像素值确定单元302,用于确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,像素点、前一个像素点以及后一个像素点位于同一行或者同一列。
像素点判断单元303,用于判断像素点是否为图像边缘。
背景信息识别单元304,用于当像素点不是图像边缘时,将与像素点相邻的其他像素点识别为背景信息。
在可选实施例中,像素点判断单元303,具体用于:
判断与像素点相邻的所有像素点的像素值是否均为第一像素值。
当与像素点相邻的所有像素点的像素值均为第一像素值时,确定像素点不是图像边缘。
当存在至少一个与像素点相邻的像素点的像素值为第二像素值时,确定像素点是图像边缘。
在可选实施例中,像素值确定单元302,具体用于:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第一行的n个像素点的像素值均为第一像素值。
背景信息识别单元304,用于当位于第一行第m列的像素点不是图像边缘时,将位于所述第一行的前一行且第m列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,像素值确定单元302,具体用于:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第n行的n个像素点的像素值均为所述第一像素值。
背景信息识别单元304,用于当位于第n行第m列的像素点不是图像边缘时,将位于所述第n行的后一行且第m列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,像素值确定单元302,具体用于:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第一列的n个像素点的像素值均为第一像素值。
背景信息识别单元304,用于当位于第m行第一列的像素点不是图像边缘时,将位于第m行且所述第一列的前一列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,像素值确定单元302,具体用于:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第n列的n个像素点的像素值均为第一像素值。
背景信息识别单元304,用于当位于第m行第n列的像素点不是图像边缘时,将位于第m行且所述第n列的后一列的像素点识别为背景信息。
在可选实施例中,图像获取单元301,具体用于:
对当前需要进行背景信息识别的图像进行边缘检测,得到图像边缘信息。
对图像边缘信息进行形态学图像处理,得到二值化图像。
本发明实施例中,图像获取单元301获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值,像素值确定单元302确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,像素点、前一个像素点以及后一个像素点位于同一行或者同一列,当像素点判断单元303判断像素点不是图像边缘时,背景信息识别单元304将与像素点相邻的其他像素点识别为背景信息,可有效识别背景信息。
请参见图4,图4为本发明实施例提供的一种终端的结构示意图,本发明实施例提供的终端可以用于实施上述图1所示的本发明实施例实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1所示的本发明实施例。
如图4所示,该终端包括:至少一个处理器401,例如CPU,至少一个输入装置403,至少一个输出装置404,存储器405,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,输入装置403具体可以为网络接口,用于与外部网络进行通信。其中,输出装置404具体可以为显示屏,用于显示图像。其中,存储器405可能包含高速RAM存储器,也可能还包括非不稳定的存储器,例如至少一个磁盘存储器,具体用于存储二值化图像。存储器405可选的可以包含至少一个位于远离前述处理器401的存储装置。处理器401可以结合图3所示的基于图像的背景信息识别装置。存储器405中存储一组程序代码,且处理器401调用存储器405中存储的程序代码,用于执行以下操作:
获取二值化图像,二值化图像中各个像素点的像素值为第一像素值或者第二像素值,第一像素值用于指示像素点为字符信息或者背景信息,第二像素值用于指示像素点为字符信息。
确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,像素点、前一个像素点以及后一个像素点位于同一行或者同一列。
判断像素点是否为图像边缘。
当像素点不是图像边缘时,将与像素点相邻的其他像素点识别为背景信息。
在可选实施例中,处理器401判断像素点是否为图像边缘,具体可以为:
判断与像素点相邻的所有像素点的像素值是否均为第一像素值。
当与像素点相邻的所有像素点的像素值均为第一像素值时,确定像素点不是图像边缘。
当存在至少一个与像素点相邻的像素点的像素值为第二像素值时,确定像素点是图像边缘。
在可选实施例中,处理器401确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,具体可以为:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第一行的n个像素点的像素值均为第一像素值。
进一步的,当像素点不是图像边缘时,处理器401将与像素点相邻的其他像素点识别为背景信息,具体可以为:
当位于第一行第m列的像素点不是图像边缘时,将位于第一行的前一行且第m列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,处理器401确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,具体可以为:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第n行的n个像素点的像素值均为第一像素值。
进一步的,当像素点不是图像边缘时,处理器401将与像素点相邻的其他像素点识别为背景信息,具体可以为:
当位于第n行第m列的像素点不是图像边缘时,将位于第n行的后一行且第m列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,处理器401确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,具体可以为:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第一列的n个像素点的像素值均为第一像素值。
进一步的,当像素点不是图像边缘时,处理器401将与像素点相邻的其他像素点识别为背景信息,具体可以为:
当位于第m行第一列的像素点不是图像边缘时,将位于第m行且第一列的前一列的像素点识别为背景信息,2≤m≤n-1。
在可选实施例中,处理器401确定二值化图像中的像素点、与像素点相邻的前一个像素点以及后一个像素点的像素值均为第一像素值,具体可以为:
在二值化图像中确定像素点阵列,像素点阵列为n*n矩阵,n为大于2的正整数。
确定位于第n列的n个像素点的像素值均为第一像素值。
进一步的,当像素点不是图像边缘时,处理器401将与像素点相邻的其他像素点识别为背景信息,具体可以为:
当位于第m行第n列的像素点不是图像边缘时,将位于第m行且第n列的后一列的像素点识别为背景信息。
在可选实施例中,处理器401获取二值化图像,具体可以为:
对当前需要进行背景信息识别的图像进行边缘检测,得到图像边缘信息。
对图像边缘信息进行形态学图像处理,得到二值化图像。
具体的,本发明实施例中介绍的终端可以用以实施本发明结合图1介绍的方法实施例中的部分或全部流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (16)
1.一种基于图像的背景信息识别方法,其特征在于,包括:
获取二值化图像,所述二值化图像中各个像素点的像素值为第一像素值或者第二像素值,所述第一像素值用于指示所述像素点为字符信息或者背景信息,所述第二像素值用于指示所述像素点为字符信息;
当所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘,所述像素点、前一个像素点以及后一个像素点位于同一行或者同一列;
当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息。
2.根据权利要求1所述方法,其特征在于,所述判断所述像素点是否为图像边缘,包括:
判断与所述像素点相邻的所有像素点的像素值是否均为所述第一像素值;
当与所述像素点相邻的所有像素点的像素值均为所述第一像素值时,确定所述像素点不是图像边缘;
当存在至少一个与所述像素点相邻的像素点的像素值为所述第二像素值时,确定所述像素点是图像边缘。
3.根据权利要求1所述方法,其特征在于,所述当所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘之前,还包括:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第一行的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息,包括:
当位于第一行第m列的像素点不是图像边缘时,将位于所述第一行的前一行且第m列的像素点识别为背景信息,2≤m≤n-1。
4.根据权利要求1所述方法,其特征在于,所述当所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘之前,还包括:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第n行的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息,包括:
当位于第n行第m列的像素点不是图像边缘时,将位于所述第n行的后一行且第m列的像素点识别为背景信息,2≤m≤n-1。
5.根据权利要求1所述方法,其特征在于,所述当所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘之前,还包括:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第一列的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息,包括:
当位于第m行第一列的像素点不是图像边缘时,将位于第m行且所述第一列的前一列的像素点识别为背景信息,2≤m≤n-1。
6.根据权利要求1所述方法,其特征在于,所述当所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘之前,还包括:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第n列的n个像素点的像素值均为所述第一像素值,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息,包括:
当位于第m行第n列的像素点不是图像边缘时,将位于第m行且所述第n列的后一列的像素点识别为背景信息。
7.根据权利要求1~6任一项所述方法,其特征在于,所述获取二值化图像,包括:
对当前需要进行背景信息识别的图像进行边缘检测,得到图像边缘信息;
对所述图像边缘信息进行形态学图像处理,得到所述二值化图像。
8.一种基于图像的背景信息识别装置,其特征在于,包括:
图像获取单元,用于获取二值化图像,所述二值化图像中各个像素点的像素值为第一像素值或者第二像素值,所述第一像素值用于指示所述像素点为字符信息或者背景信息,所述第二像素值用于指示所述像素点为字符信息;
像素点判断单元,用于当像素值确定单元确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值时,判断所述像素点是否为图像边缘,所述像素点、前一个像素点以及后一个像素点位于同一行或者同一列;
背景信息识别单元,用于当所述像素点不是图像边缘时,将与所述像素点相邻的其他像素点识别为背景信息。
9.根据权利要求8所述装置,其特征在于,所述像素点判断单元,具体用于:
判断与所述像素点相邻的所有像素点的像素值是否均为所述第一像素值;
当与所述像素点相邻的所有像素点的像素值均为所述第一像素值时,确定所述像素点不是图像边缘;
当存在至少一个与所述像素点相邻的像素点的像素值为所述第二像素值时,确定所述像素点是图像边缘。
10.根据权利要求8所述装置,其特征在于,所述像素值确定单元,具体用于:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第一行的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述背景信息识别单元,用于当位于第一行第m列的像素点不是图像边缘时,将位于所述第一行的前一行且第m列的像素点识别为背景信息,2≤m≤n-1。
11.根据权利要求8所述装置,其特征在于,所述像素值确定单元,具体用于:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第n行的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述背景信息识别单元,用于当位于第n行第m列的像素点不是图像边缘时,将位于所述第n行的后一行且第m列的像素点识别为背景信息,2≤m≤n-1。
12.根据权利要求8所述装置,其特征在于,所述像素值确定单元,具体用于:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第一列的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述背景信息识别单元,用于当位于第m行第一列的像素点不是图像边缘时,将位于第m行且所述第一列的前一列的像素点识别为背景信息,2≤m≤n-1。
13.根据权利要求8所述装置,其特征在于,所述像素值确定单元,具体用于:
在所述二值化图像中确定像素点阵列,所述像素点阵列为n*n矩阵,n为大于2的正整数;
当位于第n列的n个像素点的像素值均为所述第一像素值时,确定所述二值化图像中的像素点、与所述像素点相邻的前一个像素点以及后一个像素点的像素值均为所述第一像素值;
所述背景信息识别单元,用于当位于第m行第n列的像素点不是图像边缘时,将位于第m行且所述第n列的后一列的像素点识别为背景信息。
14.根据权利要求8~13任一项所述装置,其特征在于,所述图像获取单元,具体用于:
对当前需要进行背景信息识别的图像进行边缘检测,得到图像边缘信息;
对所述图像边缘信息进行形态学图像处理,得到所述二值化图像。
15.一种终端,其特征在于,所述终端包括:
存储器,用于存储程序代码;
处理器,用于调用所述存储器中存储的所述程序代码,执行如权利要求1至7任一项所述的基于图像的背景信息识别方法。
16.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被终端执行时使所述终端执行如权利要求1至7任一项所述的基于图像的背景信息识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511030772.0A CN106934814B (zh) | 2015-12-31 | 2015-12-31 | 一种基于图像的背景信息识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511030772.0A CN106934814B (zh) | 2015-12-31 | 2015-12-31 | 一种基于图像的背景信息识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106934814A CN106934814A (zh) | 2017-07-07 |
CN106934814B true CN106934814B (zh) | 2020-08-14 |
Family
ID=59444070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511030772.0A Active CN106934814B (zh) | 2015-12-31 | 2015-12-31 | 一种基于图像的背景信息识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106934814B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113625923A (zh) * | 2020-05-06 | 2021-11-09 | 上海达龙信息科技有限公司 | 基于远程云桌面的鼠标处理方法、装置、存储介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853333A (zh) * | 2010-05-26 | 2010-10-06 | 中国科学院遥感应用研究所 | 医疗机器人导航定位图像中的标记拾取方法 |
CN102930277A (zh) * | 2012-09-19 | 2013-02-13 | 上海珍岛信息技术有限公司 | 一种基于识别反馈的字符图像验证码识别方法 |
CN104361312A (zh) * | 2014-10-16 | 2015-02-18 | 北京捷通华声语音技术有限公司 | 一种对图像进行字符识别的方法和装置 |
CN105006002A (zh) * | 2015-08-31 | 2015-10-28 | 北京华拓金融服务外包有限公司 | 自动图像抠图方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6098298B2 (ja) * | 2013-03-29 | 2017-03-22 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
-
2015
- 2015-12-31 CN CN201511030772.0A patent/CN106934814B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853333A (zh) * | 2010-05-26 | 2010-10-06 | 中国科学院遥感应用研究所 | 医疗机器人导航定位图像中的标记拾取方法 |
CN102930277A (zh) * | 2012-09-19 | 2013-02-13 | 上海珍岛信息技术有限公司 | 一种基于识别反馈的字符图像验证码识别方法 |
CN104361312A (zh) * | 2014-10-16 | 2015-02-18 | 北京捷通华声语音技术有限公司 | 一种对图像进行字符识别的方法和装置 |
CN105006002A (zh) * | 2015-08-31 | 2015-10-28 | 北京华拓金融服务外包有限公司 | 自动图像抠图方法和装置 |
Non-Patent Citations (2)
Title |
---|
APPLICATION OF FLOYD-WARSHALL LABELLING TECHNIQUE: IDENTIFICATION OF CONNECTED PIXEL COMPONENTS IN BINARY IMAGE;Hyunkyung Shin等;《Korean Journal of Mathematics》;20060630;第14卷(第5期);47-55 * |
字符识别中毛刺的去除方法;安然等;《计算机技术与发展》;20070910;第17卷(第9期);136-138 * |
Also Published As
Publication number | Publication date |
---|---|
CN106934814A (zh) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5972468B2 (ja) | 画像からのラベルの検出 | |
JP5701182B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
CN110189349B (zh) | 图像处理方法及装置 | |
WO2019085971A1 (zh) | 图像中定位文本的方法、装置、电子设备和存储介质 | |
CN109446061B (zh) | 一种页面检测方法、计算机可读存储介质及终端设备 | |
CN110399842B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
CN108737875B (zh) | 图像处理方法及装置 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
CN110991310A (zh) | 人像检测方法、装置、电子设备及计算机可读介质 | |
CN111461070B (zh) | 文本识别方法、装置、电子设备及存储介质 | |
CN111027545A (zh) | 卡证图片标志检测方法、装置、计算机设备及存储介质 | |
EP3014528B1 (en) | Determining barcode locations in documents | |
CN113221601A (zh) | 字符识别方法、装置及计算机可读存储介质 | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN111767924B (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN112070708B (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN110147765B (zh) | 一种图像处理方法及装置 | |
CN106934814B (zh) | 一种基于图像的背景信息识别方法及装置 | |
US8705134B2 (en) | Method of processing an image to clarify text in the image | |
KR101473713B1 (ko) | 문자 인식 장치 및 방법 | |
CN111008987A (zh) | 基于灰色背景中边缘图像提取方法、装置及可读存储介质 | |
CN113221742B (zh) | 视频分屏线确定方法、装置、电子设备、介质和程序产品 | |
EP2919149A2 (en) | Image processing apparatus and image processing method | |
CN110062151B (zh) | 平滑图像生成装置、异常判定装置、平滑图像生成方法 | |
CN112150433A (zh) | 电路板晶须物质的检测方法、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |