CN111160209B - 一种文本图像中噪声线段消除方法及装置 - Google Patents
一种文本图像中噪声线段消除方法及装置 Download PDFInfo
- Publication number
- CN111160209B CN111160209B CN201911348854.8A CN201911348854A CN111160209B CN 111160209 B CN111160209 B CN 111160209B CN 201911348854 A CN201911348854 A CN 201911348854A CN 111160209 B CN111160209 B CN 111160209B
- Authority
- CN
- China
- Prior art keywords
- line segment
- detected
- pixel
- pixel points
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000008030 elimination Effects 0.000 claims abstract description 21
- 238000003379 elimination reaction Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
本发明实施例提供一种文本图像中噪声线段消除方法及装置。所述方法包括在文本图像上筛选出小于灰度阈值的待测像素点;将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;根据各待测像素点间的连接关系,得到长度超过预设线段长度阈值的噪声线段;根据噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作,本发明实施例通过文本图像的灰度阈值确定待测像素点,并与满足预设连接条件的相邻待测像素点进行连接,以得到噪声线段,再利用对应的线段外像素点的灰度值,对线段内像素点的灰度值执行消除操作,从而能够简单快速得在所述文本图像中消除所述噪声线段对于文字识别的影响,提高识别效率。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种文本图像中噪声线段消除方法及装置。
背景技术
文本图像光学字符识别(Optical Character Recognition,OCR)识别技术是图像识别领域中一个重要且广泛应用的分支,在很多实际常用中都有应用,如票据识别、车牌识别、证件识别、手写识别等,OCR识别技术可以通过技术手段降低人工录入成本。OCR识别技术主要包括文字定位和文字识别两个部分。
在一些实际场景中,如打印的票据,学生作答的作文中等,常会有一些文字压线的现象,这种压线现象给文本定位和识别都带来了困难,降低了它们的准确率。
发明内容
由于现有方法存在上述问题,本发明实施例提供一种文本图像中噪声线段消除方法及装置。
第一方面,本发明实施例提供了一种文本图像中噪声线段消除方法,包括:
在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
进一步地,所述在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点,具体包括:
根据所述文本图像上各像素点的灰度值,得到所述文本图像的平均灰度值;
将灰度值小于所述平均灰度值的像素点,作为待测像素点。
进一步地,所述根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接,具体包括:
若所述待测像素点在所述X轴方向侧存在至少一个相邻待测像素点,根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,并进行比较;
若最小的惩罚因子小于预设的惩罚阈值,则将所述待测像素点与所述最小的惩罚因子对应的相邻待测像素点进行连接。
进一步地,所述根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,具体包括:
若所述待测像素点到相邻待测像素点的方向与所述X轴方向一致,则所述惩罚因子等于所述待测像素点与相邻待测像素点的灰度值的差值;
若所述待测像素点到相邻待测像素点的方向与所述X轴方向不一致,则所述惩罚因子等于所述灰度值的差值与预设惩罚系数的乘积。
进一步地,所述根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段,具体包括:
将存在连接关系的待测像素点归入同一像素点集合;
根据预设的合并条件,对所有的像素点集合执行合并操作;其中,所述合并条件为任意两个像素点集合的间距距离小于预设距离阈值;
在执行完合并操作后,若任一像素点集合对应的线段图像在所述X轴方向上长度超过所述预设线段长度阈值,则将所述线段图像判定为噪声线段。
进一步地,所述根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作,具体包括:
计算所述线段内像素点对应的噪声线段的线段宽度;
分别获取在所述噪声线段上方和下方的线段宽度范围内的线段外像素点;
计算获取到的线段外像素点的平均灰度值,用于替换所述线段内像素点的灰度值。
进一步地,在得到所述噪声线段后,所述文本图像中噪声线段消除方法,还包括:
若所述线段内像素点对应的噪声线段的线段宽度超过预设的宽度阈值,或者所述线段内像素点对应的噪声线段的中心像素点的Y轴坐标超过预设的Y轴坐标范围,则保留所述线段内像素点的灰度值。
第二方面,本发明实施例提供了一种文本图像中噪声线段消除装置,包括:
像素点筛选模块,用于在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
像素点遍历模块,用于根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
线段识别模块,用于根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
线段消除模块,用于根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
第三方面,本发明实施例还提供了一种电子设备,包括:
处理器、存储器、通信接口和通信总线;其中,
所述处理器、存储器、通信接口通过所述通信总线完成相互间的通信;
所述通信接口用于该电子设备的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的计算机程序指令,所述处理器调用所述程序指令能够执行如下方法:
在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:
在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
本发明实施例提供的文本图像中噪声线段消除方法及装置,通过文本图像的灰度阈值确定所有待测像素点,并遍历各待测像素点与满足预设连接条件的相邻待测像素点进行连接,以得到超过预设线段长度阈值的噪声线段,再利用对应的线段外像素点的灰度值,对线段内像素点的灰度值执行消除操作,从而能够简单快速得在所述文本图像中消除所述噪声线段对于文字识别的影响,提高识别效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的文本图像中噪声线段消除方法流程图;
图2为本发明实施例的另一文本图像中噪声线段消除方法流程图;
图3为本发明实施例的又一文本图像中噪声线段消除方法流程图;
图4为本发明实施例的文本图像中噪声线段消除装置结构示意图;
图5示例了一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例的文本图像中噪声线段消除方法流程图,如图1所示,所述方法包括:
步骤S01、在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点。
由于文本图像中可能存在表格线或下划线等噪声线段,从而影响了对于文字的识别,本发明实施例将基于像素级别,从所述文本图像中识别出所有位于所述噪声线段内的线段内像素点,再利用噪声线段周边线段外像素点将这些线段内像素点进行消除,从而在所述文本图像中消除所述噪声线段,并尽可能得保留文字部分的像素点。
先将RGB三通道的文本图像转换为灰度图像,从而得到所述文本图像上每个像素点的灰度值,并与预设的灰度阈值进行比较,若所述像素点的灰度值小于所述灰度阈值,则将所述像素点标记为待测像素点。所述灰度值为[0,255]的整数,其中,0表示所述文本图像中的最黑点,255表示所述图像中的最白的点。
进一步地,所述步骤S01具体包括:
步骤S011、根据所述文本图像上各像素点的灰度值,得到所述文本图像的平均灰度值。
步骤S012、将灰度值小于所述平均灰度值的像素点,作为待测像素点。
所述灰度阈值可根据实际的情况进行设定,本发明实施例仅给出了其中的一种举例说明。
根据所述文本图像上每个像素点的灰度值,进行加权平均计算,得到所述文本图像的平均灰度值mean_val,将所述平均灰度值设为所述灰度阈值。
从而,将所有灰度值小于所述平均灰度值的像素点标记为所述待测像素点。
由于文本图像中存在大量的空白像素点,则所述平均灰度值将会大于存在文字或噪声线段的像素点的灰度值。因此,得到的待测像素点将包括文字的像素点和噪声线段内的线段内像素点。
步骤S02、根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向。
将根据噪声线段沿伸方向可分为横向线段和竖向线段,其中,所述横向线段的沿伸方向为从左往右,而竖向线段的沿伸方向为从上往下。在对噪声线段进行识别的过程中,需要分别对横向线段和竖向线段进行识别和消除操作。因此,开始时,先确定本次识别的噪声线段的沿伸方向,将所述沿伸方向作为XY直角坐标系的X轴方向,从而确定了所述文本图像中每个像素点的XY轴坐标。为了简便起见,在下面的实施例中均以横向线段为例进行举例说明,则每i行第j列的像素点的XY轴坐标为(j,i),其中对应的灰度值为g(j,i)。
根据所述X轴方向,依次遍历所有的待测像素点,即对于每一行的像素点而言,从左到右依次遍历所有的待测像素点。
当遍历到某一待测像素点,先判断在所述某一待测像素点的X轴方向上的相邻像素点是否也同样为待测像素点,例如,对于待测像素点(j,i),判断像素点(j+1,i)是否为通过灰度值筛选得到的待测像素点。若是,则判定所述某一待测像素点存在相邻待测像素点;若不是,则遍历到下一个待测像素点。
在判定存在相邻待测像素点时,进一步根据预设连接条件,来判断所述待测像素点与所述相邻待测像素点间是否满足所述连接条件:若满足,则将所述待测像素点与所述相邻待测像素点进行连接,从而相当于在所述文本图像上得到一个线段;若不满足,则遍历到下一个的待测像素点。
步骤S03、根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段。
在根据所述连接条件,遍历完所有待测像素点后,可以得到各待测像素点间的连接关系。在所述文本图像上计算由各待测像素点连接得到的线段图像在所述X轴方向上的长度。若计算得到的X轴方向上的长度超过了所述预设的线段长度阈值,则可判定对应的线段图像为噪声线段。
步骤S04、根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
在确定噪声线段后,需要对所述噪声线段内的各线段内像素点执行预设的消除操作。根据位于相同X轴坐标的噪声线段外的线段外像素点的灰度值,对所述线段内像素点的灰度值进行替换,从而使该线段内像素点融入到对应的线段外像素点中,从而达到将所述线段内像素点消除的目的。具体的过程可以根据实际的需要进行设定,例如,可以在所述线段内像素点的X轴坐标上,用最接近该线段内像素点的线段外像素点的灰度值,替换该线段内像素点的灰度值。
在对噪声线段内的所有线段内像素点执行所述消除操作后,使得所述噪声线段融合到所述文本图像的背景中。
本发明实施例通过文本图像的灰度阈值确定所有待测像素点,并遍历各待测像素点与满足预设连接条件的相邻待测像素点进行连接,以得到超过预设线段长度阈值的噪声线段,再利用对应的线段外像素点的灰度值,对线段内像素点的灰度值执行消除操作,从而能够简单快速得在所述文本图像中消除所述噪声线段对于文字识别的影响,提高识别效率。
基于上述实施例,进一步地,所述步骤S02具体包括:
步骤S021、若所述待测像素点在所述X轴方向侧存在至少一个相邻待测像素点,根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,并进行比较。
由上述实施例可知,在遍历待测像素点,先判断在待测像素点(j,i)的X轴方向侧上的相邻像素点(j+1,i)是否为待测像素点。可见,上述的判断机制仅能找到很标准的直线,而对于存在倾斜或手画,而使噪声线段产生弯曲的直线并不能检测到。因此,在对待测像素点(j,i)进行是否存在相邻待测像素点的判断时,需要分别对(j+1,i-1)、(j+1,i)和(j+1,i+1)这三个与待测像素点距离为1个像素的相邻像素点均进行判断。
若上述三个相邻像素点中存在至少一个待测像素点,则判定所述待测像素点存在至少一个相邻待测像素点。然后,根据所述待测像素点的灰度值和相邻待测像素点的灰度值,计算两者的灰度值的差值,再根据所述灰度值的差值计算相邻待测像素点对应的惩罚因子。
进一步地,所述根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,具体包括:
若所述待测像素点到相邻待测像素点的方向与所述X轴方向一致,则所述惩罚因子等于所述待测像素点与相邻待测像素点的灰度值的差值;
若所述待测像素点到相邻待测像素点的方向与所述X轴方向不一致,则所述惩罚因子等于所述灰度值的差值与预设惩罚系数的乘积。
根据所述待测像素点到相邻待测像素点的方向与所述X轴方向的对应关系,即若两者相一致,即所述相邻待测像素点为(j+1,i),则所述惩罚因子=abs(g(j,i)-g(j+1,i))。而若两者不一致,即所述相邻待测像素点为(j+1,i-1)或(j+1,i+1),则对应的惩罚因子=a×abs(g(j,i)-g(j+1,i-1))或者惩罚因子=a×abs(g(j,i)-g(j+1,i+1)),其中,所述a为预设的惩罚系数,例如1.2。从而,以保证在对应的灰度值的差值相同的情况下,相邻待测像素点(j+1,i),更容易被选中。
步骤S022、若最小的惩罚因子小于预设的惩罚阈值,则将所述待测像素点与所述最小的惩罚因子对应的相邻待测像素点进行连接。
将得到的各相邻待测像素点的惩罚因子进行比较,选择与最小的惩罚因子对应的相邻待测像素点。并判断该相邻待测像素点是否满足预设选择条件,即所述最小的惩罚因子是否超过预设的惩罚阈值,若超过,则将与所述最小的惩罚因子对应相邻待测像素点与遍历到的待测像素点进行连接。
本发明实施例通过在遍历到待测像素点时,对X轴方向侧的三个相邻像素点均进行判断并计算对应的惩罚因子,若最小的惩罚因子小于预设的惩罚阈值,则将最小的惩罚因子对应的相邻待测像素点与所述待测像素点进行连接,从而能够更灵活得对不同状态的噪声线段进行识别并进行消除,提高文字识别的效率。
图2为本发明实施例的另一文本图像中噪声线段消除方法流程图,如图3所示,所述步骤S03具体包括:
步骤S031、将存在连接关系的待测像素点归入同一像素点集合;
步骤S032、根据预设的合并条件,对所有的像素点集合执行合并操作;其中,所述合并条件为任意两个像素点集合的间距距离小于预设距离阈值;
步骤S033、在执行完合并操作后,若任一像素点集合对应的线段图像在所述X轴方向上长度超过所述预设线段长度阈值,则将所述线段图像判定为噪声线段。
将遍历完成的所有待测像素点进行划分,将存在相互连接关系的待测像素点归入到同一个像素点集合中,每个像素点集合中包括的待测像素点均位于同一线段内。
若得到了多个像素点集合,则在所有的像素点集合进行合并操作。所述合并操作为判断是否存在满足预设合并条件的任意两个像素点集合,若存在,则将满足合并条件的两个像素点集合进行合并,直到剩余的像素点集合均不满足所述合并条件为止。具体地:
分别计算所有像素点集合两两之间的间隔距离,即像素点集合对应的线段在文本图像上的间隔距离,所述间隔距离D(C1,C2)为所述像素点集合C1,C2中距离最接近的两个待测像素点p1,p2间的距离,公式表示为:D(C1,C2)=min(p1,p2);其中p1为像素点集合C1中的待测像素点、p2为像素点集合C2中的待测像素点。由于本发明实施例中采用的是基于像素级别的噪声线段消除方法,因此,在下面的实施例中所有的距离均以像素为单位。
若任意两个像素点集合对应的间隔距离小于预设的距离阈值thresD,例如,thresD=5个像素,则将所述任意两个像素点集合进行合并。例如,若D(C1,C2)<thresD,则将所述像素点集合C1,C2合并为像素点集合C。
为了确保经过合并操作后剩余的像素点集合对应的图像为噪声线段而非文字,需要计算完全合并操作后,各像素点集合C对应的图像的X轴长度W(C),所述X轴长度具体通过计算合并后的像素点集合中各待测像素点的X轴坐标最小值与X轴坐标最大值的差值得到:W(C)=max{px(ci)|ci为像素点集合C中的任意待测像点}-min{px(cj)|cj为像素点集合C中的任意待测像点},其中,所述px()为X轴坐标。
若X轴长度W(C)大于预设的线段长度阈值,则可判定所述像素点集合C对应的图像为噪声线段。所述线段长度阈值可以根据实际文本图像在X轴方向的图像长度img_width来进行设定,例如,所述线段长度阈值可设置为0.3*img_width。即当所述W(C)>0.3*img_width时,所述像素集合点C中所有待测像素点组成的图像为噪声线段。
本发明实施例通过将存在连接关系的待测像素点划分到像素点集合,并执行预设的合并操作,以得长度超过预设线段长度阈值的噪声线段,从而对噪声线段的识别更加准确。
图3为本发明实施例的又一文本图像中噪声线段消除方法流程图,如图3所示,所述步骤S04具体包括:
步骤S041、计算所述线段内像素点对应的噪声线段的线段宽度;
步骤S042、分别获取在所述噪声线段上方和下方的线段宽度范围内的线段外像素点;
步骤S043、计算获取到的线段外像素点的平均灰度值,用于替换所述线段内像素点的灰度值。
在对所述线段内像素点执行消除操作时,先计算所述线段内像素点所在X轴坐标对应的噪声线段的线段宽度sw,例如,所述噪声线段在所述X轴坐标j对应的线段内像素点包括(j,i-2)、(j,i-1)、(j,i)、(j,i+1),则所述线段宽度sw=4个像素。
分别在所述噪声线段上方的线段宽度sw范围内获取线段外像素点(j,i+2)、(j,i+3)、(j,i+4)、(j,i+5),同时在所述噪声线段下方的线段宽度sw范围内获取线段外像素点(j,i-6)、(j,i-5)、(j,i-4)、(j,i-3)。
根据获取到的线段外像素点的灰度值,计算平均灰度值,用该平均灰度值来替换所述X轴坐标所在列对应的各线段内像素点的灰度值。
本发明实施例通过计算各线段内像素点对应的线段宽度,以获取噪声线段上方和下方在所述线段宽度范围内的线段外像素点,再根据获取到的线段外像素点的平均灰度值替换对应线段内像素点的灰度值,从而可以更加合理得对噪声线段进行消除,提高识别效率。
基于上述实施例,进一步地,所述文本图像中噪声线段消除方法,还包括:
若所述线段内像素点对应的噪声线段的线段宽度超过预设的宽度阈值,或者所述线段内像素点对应的噪声线段的中心像素点的Y轴坐标超过预设的Y轴坐标范围,则保留所述线段内像素点的灰度值。
由于文本图像中存在噪声线段跨越文字的现象,在经过前期的待测像素点连接以及像素点集合的合并操作后,跨越噪声线段的文字的部分文字像素点也将被合并到像素点集合中作为线段内像素点,为此,需要从线段内像素点中识别出这些文字像素点,从而保留所述文字像素点的灰度值。
具体的识别方法有很多,本发明实施例仅给出了其中的两种举例说明:
其一,可以通过计算线段内像素点对应的线段宽度,并与预设的宽度阈值进行比较,若所述线段宽度超过了所述宽度阈值,则判定所述线段内像素点为文字像素点,无需进行消除操作。其中,所述宽度阈值可以根据所述噪声线段的平均宽度来进行设置,例如,将所述宽度阈值设置为所述平均宽度的2倍或3倍。即当噪声线段在某一X轴坐标所在列的线段宽度远大于所述噪声线段的平均宽度,则将、在所述某一X轴坐标所在列的所有线段内像素点判定为文字像素点,保留其灰度值。
其二,计算所述噪声线段在各X轴坐标所在列的中心像素点,若所述线段内像素点对应的中心像素点,与相邻中心像素点的Y轴坐标的值相差较大,例如,与相邻中心像素点的Y轴坐标的差值超过5个像素,则判定所述线段内像素点为文字像素点,无需要进行消除操作。同时,对该线段内像素点对应的中心像素点的Y轴坐标进行校准,与相邻中心像素点保持相对一致。即当获取各X轴坐标上的中心像素点后,若某一X轴坐标所在列的中心像素点与相邻的中心像素点的距离超过预设阈值,则将所述某一X轴坐标上的所有线段内像素点判定为文字像素点,保留其灰度值。
本发明实施例通过从所述线段内像素点中识别出文字像素点,以保留所述文字像素点的灰度值,从而使在对噪声线段进行消除时不影响文字图像,提高了对文本图像的识别效率。
图4为本发明实施例的文本图像中噪声线段消除装置结构示意图,如图4所示,所述装置包括:像素点筛选模块10、像素点遍历模块11、线段识别模块12和线段消除模块13;其中,
所述像素点筛选模块10用于在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;所述像素点遍历模块11用于根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;所述线段识别模块12用于根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;所述线段消除模块13用于根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。具体地:
像素点筛选模块10先将RGB三通道的文本图像转换为灰度图像,从而得到所述文本图像上每个像素点的灰度值,并与预设的灰度阈值进行比较,若所述像素点的灰度值小于所述灰度阈值,则将所述像素点标记为待测像素点。
进一步地,所述像素点筛选模块10具体用于:根据所述文本图像上各像素点的灰度值,得到所述文本图像的平均灰度值;将灰度值小于所述平均灰度值的像素点,作为待测像素点。
所述灰度阈值可根据实际的情况进行设定,本发明实施例仅给出了其中的一种举例说明。
像素点筛选模块10根据所述文本图像上每个像素点的灰度值,进行加权平均计算,得到所述文本图像的平均灰度值mean_val,将所述平均灰度值设为所述灰度阈值。
从而,像素点筛选模块10将所有灰度值小于所述平均灰度值的像素点标记为所述待测像素点。
由于文本图像中存在大量的空白像素点,则所述平均灰度值将会大于存在文字或噪声线段的像素点的灰度值。因此,得到的待测像素点将包括文字的像素点和噪声线段内的线段内像素点。
像素点遍历模块11将根据噪声线段沿伸方向可分为横向线段和竖向线段,其中,所述横向线段的沿伸方向为从左往右,而竖向线段的沿伸方向为从上往下。在对噪声线段进行识别的过程中,像素点遍历模块11需要分别对横向线段和竖向线段进行识别和消除操作。因此,开始时,先确定本次识别的噪声线段的沿伸方向,将所述沿伸方向作为XY直角坐标系的X轴方向,从而确定了所述文本图像中每个像素点的XY轴坐标。为了简便起见,在下面的实施例中均以横向线段为例进行举例说明,则每i行第j列的像素点的XY轴坐标为(j,i),其中对应的灰度值为g(j,i)。
根据所述X轴方向,像素点遍历模块11依次遍历所有的待测像素点,即对于每一行的像素点而言,从左到右依次遍历所有的待测像素点。
当像素点遍历模块11遍历到某一待测像素点,先判断在所述某一待测像素点的X轴方向上的相邻像素点是否也同样为待测像素点,例如,对于待测像素点(j,i),判断像素点(j+1,i)是否为通过灰度值筛选得到的待测像素点。若是,则判定所述某一待测像素点存在相邻待测像素点;若不是,则遍历到下一个待测像素点。
在判定存在相邻待测像素点时,像素点遍历模块11进一步根据预设连接条件,来判断所述待测像素点与所述相邻待测像素点间是否满足所述连接条件:若满足,则将所述待测像素点与所述相邻待测像素点进行连接,从而相当于在所述文本图像上得到一个线段;若不满足,则遍历到下一个的待测像素点。
在根据所述连接条件,像素点遍历模块11遍历完所有待测像素点后,线段识别模块12可以得到各待测像素点间的连接关系。线段识别模块12在所述文本图像上计算由各待测像素点连接得到的线段图像在所述X轴方向上的长度。若计算得到的X轴方向上的长度超过了所述预设的线段长度阈值,则线段识别模块12可判定对应的线段图像为噪声线段。
在确定噪声线段后,线段消除模块13需要对所述噪声线段内的各线段内像素点执行预设的消除操作。根据位于相同X轴坐标的噪声线段外的线段外像素点的灰度值,线段消除模块13对所述线段内像素点的灰度值进行替换,从而使该线段内像素点融入到对应的线段外像素点中,从而达到将所述线段内像素点消除的目的。具体的过程可以根据实际的需要进行设定,例如,可以在所述线段内像素点的X轴坐标上,用最接近该线段内像素点的线段外像素点的灰度值,替换该线段内像素点的灰度值。
线段消除模块13在对噪声线段内的所有线段内像素点执行所述消除操作后,使得所述噪声线段融合到所述文本图像的背景中。
本发明实施例提供的装置用于执行上述方法,其功能具体参考上述方法实施例,其具体方法流程在此处不再赘述。
本发明实施例通过文本图像的灰度阈值确定所有待测像素点,并遍历各待测像素点与满足预设连接条件的相邻待测像素点进行连接,以得到超过预设线段长度阈值的噪声线段,再利用对应的线段外像素点的灰度值,对线段内像素点的灰度值执行消除操作,从而能够简单快速得在所述文本图像中消除所述噪声线段对于文字识别的影响,提高识别效率。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)501、通信接口(Communications Interface)503、存储器(memory)502和通信总线504,其中,处理器501,通信接口503,存储器502通过通信总线504完成相互间的通信。处理器501可以调用存储器502中的逻辑指令,以执行上述方法。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法。
进一步地,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。
本领域普通技术人员可以理解:此外,上述的存储器502中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种文本图像中噪声线段消除方法,其特征在于,包括:
在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同;
所述根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接,具体包括:
若所述待测像素点在所述X轴方向侧存在至少一个相邻待测像素点,根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,并进行比较;
若最小的惩罚因子小于预设的惩罚阈值,则将所述待测像素点与所述最小的惩罚因子对应的相邻待测像素点进行连接。
2.根据权利要求1所述的文本图像中噪声线段消除方法,其特征在于,所述在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点,具体包括:
根据所述文本图像上各像素点的灰度值,得到所述文本图像的平均灰度值;
将灰度值小于所述平均灰度值的像素点,作为待测像素点。
3.根据权利要求1所述的文本图像中噪声线段消除方法,其特征在于,所述根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,具体包括:
若所述待测像素点到相邻待测像素点的方向与所述X轴方向一致,则所述惩罚因子等于所述待测像素点与相邻待测像素点的灰度值的差值;
若所述待测像素点到相邻待测像素点的方向与所述X轴方向不一致,则所述惩罚因子等于所述灰度值的差值与预设惩罚系数的乘积。
4.根据权利要求1所述的文本图像中噪声线段消除方法,其特征在于,所述根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段,具体包括:
将存在连接关系的待测像素点归入同一像素点集合;
根据预设的合并条件,对所有的像素点集合执行合并操作;其中,所述合并条件为任意两个像素点集合的间距距离小于预设距离阈值;
在执行完合并操作后,若任一像素点集合对应的线段图像在所述X轴方向上长度超过所述预设线段长度阈值,则将所述线段图像判定为噪声线段。
5.根据权利要求1所述的文本图像中噪声线段消除方法,其特征在于,所述根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作,具体包括:
计算所述线段内像素点对应的噪声线段的线段宽度;
分别获取在所述噪声线段上方和下方的线段宽度范围内的线段外像素点;
计算获取到的线段外像素点的平均灰度值,用于替换所述线段内像素点的灰度值。
6.根据权利要求1所述的文本图像中噪声线段消除方法,其特征在于,在得到所述噪声线段后,所述文本图像中噪声线段消除方法,还包括:
若所述线段内像素点对应的噪声线段的线段宽度超过预设的宽度阈值,或者所述线段内像素点对应的噪声线段的中心像素点的Y轴坐标超过预设的Y轴坐标范围,则保留所述线段内像素点的灰度值。
7.一种文本图像中噪声线段消除装置,其特征在于,包括:
像素点筛选模块,用于在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
像素点遍历模块,用于根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
线段识别模块,用于根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
线段消除模块,用于根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同;
所述像素点遍历模块具体用于:
若所述待测像素点在所述X轴方向侧存在至少一个相邻待测像素点,根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,并进行比较;
若最小的惩罚因子小于预设的惩罚阈值,则将所述待测像素点与所述最小的惩罚因子对应的相邻待测像素点进行连接。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的文本图像中噪声线段消除方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述的文本图像中噪声线段消除方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348854.8A CN111160209B (zh) | 2019-12-24 | 2019-12-24 | 一种文本图像中噪声线段消除方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348854.8A CN111160209B (zh) | 2019-12-24 | 2019-12-24 | 一种文本图像中噪声线段消除方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111160209A CN111160209A (zh) | 2020-05-15 |
CN111160209B true CN111160209B (zh) | 2023-07-25 |
Family
ID=70557874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911348854.8A Active CN111160209B (zh) | 2019-12-24 | 2019-12-24 | 一种文本图像中噪声线段消除方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160209B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860315A (zh) * | 2020-07-20 | 2020-10-30 | 中国建设银行股份有限公司 | 一种表格线的检测方法、装置、设备及存储介质 |
CN113159058B (zh) * | 2021-05-27 | 2022-11-11 | 中国工商银行股份有限公司 | 一种图像噪声点的识别方法及装置 |
CN116228589B (zh) * | 2023-03-22 | 2023-08-29 | 新创碳谷集团有限公司 | 一种视觉检测相机噪声点消除方法、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5129012A (en) * | 1989-03-25 | 1992-07-07 | Sony Corporation | Detecting line segments and predetermined patterns in an optically scanned document |
JP2008052468A (ja) * | 2006-08-24 | 2008-03-06 | Kobe Steel Ltd | 細線除去処理装置,細線除去処理方法,文字認識処理装置及び文字認識処理方法 |
CN105117680A (zh) * | 2015-05-04 | 2015-12-02 | 小米科技有限责任公司 | 一种识别信息卡的信息的方法和装置 |
CN108805126A (zh) * | 2017-04-28 | 2018-11-13 | 上海斯睿德信息技术有限公司 | 一种文本图像的长干扰线去除方法 |
CN110147765A (zh) * | 2019-05-21 | 2019-08-20 | 新华三信息安全技术有限公司 | 一种图像处理方法及装置 |
-
2019
- 2019-12-24 CN CN201911348854.8A patent/CN111160209B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5129012A (en) * | 1989-03-25 | 1992-07-07 | Sony Corporation | Detecting line segments and predetermined patterns in an optically scanned document |
JP2008052468A (ja) * | 2006-08-24 | 2008-03-06 | Kobe Steel Ltd | 細線除去処理装置,細線除去処理方法,文字認識処理装置及び文字認識処理方法 |
CN105117680A (zh) * | 2015-05-04 | 2015-12-02 | 小米科技有限责任公司 | 一种识别信息卡的信息的方法和装置 |
CN108805126A (zh) * | 2017-04-28 | 2018-11-13 | 上海斯睿德信息技术有限公司 | 一种文本图像的长干扰线去除方法 |
CN110147765A (zh) * | 2019-05-21 | 2019-08-20 | 新华三信息安全技术有限公司 | 一种图像处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111160209A (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111160209B (zh) | 一种文本图像中噪声线段消除方法及装置 | |
CN109426801B (zh) | 一种车道线实例检测方法和装置 | |
CN104376318B (zh) | 在保留交叉字符笔划的同时去除文档图像中的下划线和表格线 | |
CN108182383B (zh) | 一种车窗检测的方法及设备 | |
CN108108734B (zh) | 一种车牌识别方法及装置 | |
CN105184292A (zh) | 自然场景图像中手写体数学公式结构分析与识别方法 | |
JP2007213359A (ja) | 二次元コード検出システムおよび二次元コード検出プログラム | |
CN111582000B (zh) | 一种条形码定位方法、装置及相关设备 | |
US20150206033A1 (en) | Method of identifying pattern training need during verification of recognized text | |
CN113780183B (zh) | 一种共享车辆的规范停车确定方法、装置及计算机设备 | |
CN108229466B (zh) | 一种车牌识别方法及装置 | |
CN114387591A (zh) | 车牌识别方法、系统、设备及存储介质 | |
CN111989692A (zh) | 表单识别方法、表格提取方法及相关装置 | |
CN114913555B (zh) | 指纹特征点获取方法、装置、电子设备及存储介质 | |
CN115082888A (zh) | 一种车道线检测方法和装置 | |
CN114283190A (zh) | 梁线拼接方法、装置、设备及存储介质 | |
CN111199240A (zh) | 银行卡识别模型的训练方法、银行卡识别方法以及装置 | |
CN114299406B (zh) | 基于无人机航拍的光纤电缆线路巡检方法 | |
CN115619813A (zh) | Sem图像前景提取方法、装置、计算机设备及存储介质 | |
CN115438682A (zh) | 用于确定解码方向的方法、装置及解码设备 | |
CN111402281B (zh) | 一种书籍边缘检测方法及装置 | |
JP3096481B2 (ja) | 帳票類の種類判別方法 | |
CN110706263A (zh) | 一种图像处理方法、装置、设备和计算机可读存储介质 | |
CN115310505A (zh) | 一种用于互感器二次回路接线端子的自动识别方法及系统 | |
CN107330470B (zh) | 识别图片的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |