CN110097046A - 一种文字检测方法及装置、设备和计算机可读存储介质 - Google Patents
一种文字检测方法及装置、设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN110097046A CN110097046A CN201910180720.3A CN201910180720A CN110097046A CN 110097046 A CN110097046 A CN 110097046A CN 201910180720 A CN201910180720 A CN 201910180720A CN 110097046 A CN110097046 A CN 110097046A
- Authority
- CN
- China
- Prior art keywords
- image
- binary image
- gray
- pixel
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 124
- 230000006740 morphological transformation Effects 0.000 claims abstract description 48
- 230000003628 erosive effect Effects 0.000 claims description 28
- 230000003044 adaptive effect Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 24
- 230000010339 dilation Effects 0.000 claims description 22
- 238000005260 corrosion Methods 0.000 claims description 18
- 230000007797 corrosion Effects 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种文字检测方法及装置,该方法包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。利用该方法,能够提高文字检测速度、提高文字检测准确性、改善用户体验。还公开了相应的设备和计算机可读存储介质。
Description
技术领域
本申请涉及文字检测技术领域,尤其涉及一种文字检测方法及装置、设备和计算机可读存储介质。
背景技术
目前,在很多应用领域中存在文字检测需求,而且希望文字检测既快速又准确,而且文字检测设备的功耗又低。现有技术中的文字检测技术主要包括:基于传统计算机视觉的文字检测,以及基于人工智能的深度学习文字检测。但是,在实际应用中,基于传统计算机视觉的文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低;而基于人工智能的深度学习文字检测方式虽然大部分情况下文字检测和识别的准确率较高,但是其运行对硬件资源要求高、运行速度较慢、功耗高,而且文字检测设备需要有图像处理单元(GPU)的支持,然而诸如手机、智能眼镜等便携式电子设备上的硬件资源有限且电池容量有限,使得深度学习文字检测在便携式电子设备上运行的难度较大,用户体验很差。
因此,需要一种运行速度快、功耗低、准确率高的文字检测方式,其尤适合于在便携式电子设备上运行。
发明内容
本申请实施例提供一种用于文字检测方法和装置、设备和计算机可读存储介质,用以解决现有技术中的如下技术问题:现有文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低,或者对硬件资源要求高、运行速度较慢、功耗高。
本申请实施例采用下述技术方案:
一种文字检测方法,包括:
获取待检测图像,并将待检测图像转换为灰度图;
将灰度图通过二值化转换成二值图像;
对二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。在本发明中,经二值化转换所得的二值图像中表示有文字部分的颜色可以预先设定,例如使用二值图像中具有灰度极大值的像素区域表示有文字部分,或者反之,使用二值图像中具有灰度极小值的像素区域表示有文字部分。
优选地,将灰度图通过二值化转换成二值图像可以包括:
对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。
优选地,在对所述二值图像进行形态变换之前,所述方法还包括对所述二值图像进行颜色反转操作,并且对所述二值图像进行形态变换可以包括:对所述二值图像依次进行膨胀操作和腐蚀操作,这里先进行膨胀操作后进行腐蚀操作有助于使得二值图像中表示有文字部分的颜色区域尽可能地接合在一起。
优选地,对所述二值图像进行形态变换可以包括:对所述二值图像依次进行腐蚀操作和膨胀操作,这有助于使得二值图像中表示有文字部分的颜色区域尽可能地接合在一起。
优选地,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还可以包括:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声。或者,所述方法还可以包括:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
优选地,在对所述二值图像进行腐蚀操作之前,所述方法还可以包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。或者,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。
优选地,在获取所述轮廓之后,在将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还可以包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。
优选地,所述方法还可以包括:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。例如,考虑到书本、报纸等纸张印刷品的文字背景主要为白色、黄色等,所以可以通过保留这些背景颜色内的所述轮廓而去除其它位置的轮廓来进一步去除干扰区域而更加精确地定位用户期望的目标文字检测区域。
优选地,所述方法还可以包括:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
优选地,按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
优选地,通过二值化转换得到的二值图像可以为黑白图像,该黑白图像中的黑色区域可以表示有文字部分的颜色区域。当然,在所得黑白图像中为白色区域表示有文字部分的颜色区域的情况下,只要将该黑白图像进行颜色反转操作后,本发明的各种技术方案对其同样适用。
另外,还提供了一种文字检测装置,包括:
图像获取模块,用于获取待检测图像;
图像处理模块,其用于将所述待检测图像转换为灰度图,将所述灰度图通过二值化转换成二值图像,并且对所述二值图像进行形态变换;
确定模块,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
优选地,将所述灰度图通过二值化转换成二值图像可以包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。
优选地,所述图像处理模块在对所述二值图像进行形态变换之前,还用于对所述二值图像进行颜色反转操作,并且对所述二值图像进行形态变换可以包括:对所述二值图像依次进行膨胀操作和腐蚀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。
优选地,对所述二值图像进行形态变换也可以包括:对所述二值图像依次进行腐蚀操作和膨胀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。
优选地,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,图像处理模块还可以用于:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声。或者所述图像处理模块还用于:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
优选地,在对所述二值图像进行腐蚀操作之前,图像处理模块还可以用于:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。或者,在对所述二值图像进行腐蚀操作之前,所述图像处理模块还用于:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。
可选地,在获取所述轮廓之后,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,确定模块还可以用于:去除所述轮廓中符合预设条件的至少一个所述轮廓。
可选地,确定模块还可以用于:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。
可选地,确定模块还可以用于:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
优选地,按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
优选地,通过二值化转换得到的所述二值图像为黑白图像,所述黑白图像中的黑色区域表示所述有文字部分的颜色区域。当然,在所得黑白图像中为白色区域表示有文字部分的颜色区域的情况下,只要将该黑白图像进行颜色反转操作后,本发明的各种技术方案对其同样适用。
此外,还提供了一种用于文字检测的设备,其包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
此外,还提供了一种用于文字检测的非易失性计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令设置为在由处理器运行时执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过将获取的图片转换成二值图像,能够显著降低需要处理的图像数据量,从而提高文字检测速度并降低功耗;通过对图像进行腐蚀操作(针对白色表示文字而黑色表示背景的情况)或者进行膨胀操作(针对黑色表示文字而白色表示背景的情况),能够去除二值图像中的干扰噪点,提高文字检测准确性;通过对二值图像进行形态变换(例如开运算或者闭运算),能够将二值图像中表示有文字部分的颜色区域尽可能地连在一起,有利于确定目标文字检测区域。此外,通过对确定出的文字区域轮廓进行筛选,能够进一步减少背景干扰,提高文字检测准确性。而且,结合版面分析,能够准确定位用户感兴趣的目标文字检测区域,改善用户体验。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为根据本申请一实施例的文字检测方法的流程示意图;
图2为根据一示例,将获取的待检测图像转换成灰度图的示意图;
图3为根据该示例,将灰度图转换成二值图像的示意图;
图4为根据该示例,将二值图像降噪后的示意图;
图5为根据该示例,对二值图像进行形态变换和颜色反转操作的示意图;
图6为根据该示例,将与确定出的文字检测区域对应的方框应用到待检测图像上的示意图;
图7为示出根据本申请一实施例的版面分析过程示意图;
图8为根据本申请一实施例的文字检测装置的示意图;
图9为根据本申请一实施例的文字检测设备的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面对本申请的方案进行详细说明。
图1为根据本申请一实施例的文字检测方法的流程示意图。在该流程中,从设备角度而言,执行主体可以是一个或者多个便携式电子设备,例如智能手机、智能眼睛等,更具体地可以是与这些设备中的摄像头关联的功能模块;从程序角度而言,执行主体相应地可以是搭载于这些便携式电子设备上的程序,例如语言翻译应用、文字识别应用、文字播报应用等。
图1中的流程可以包括以下步骤S101-S104。
S101:获取待检测图像,并将待检测图像转换为灰度图。
如图2中所示,示出了将获取的待检测图像转换成灰度图的示例。待检测图像可以通过各种方式获取,例如通过摄像头拍摄获取,可以通过拍照获取或者通过录像获取,当然待检测图像也可以有其它来源,例如来自其它设备,或者也可以是现成的图像,本发明对此不进行限制。此外,将待检测图像转换成灰度图时可以采用任何现有的方式,本发明对此也不进行限制。
S102:将灰度图通过二值化转换成二值图像。
如图3所示,示出了将得到的灰度图转换成二值图像的示例。灰度图可以通过二值化而转换成二值图像,其中将灰度值大于预设灰度阈值的像素的灰度值设为灰度极大值(例如255),而把灰度值小于该预设灰度阈值的像素的灰度值设为灰度极小值(例如0),从而实现二值化。对灰度图的二值化使图像中数据量大为减少,从而能凸显出目标的轮廓。
这里的二值化可以是通常二值化,其中采用单个预设灰度阈值来重新设定每个像素的灰度值。或者,也可以采用自适应二值化(Adaptive Threshold),在该自适应二值化方式中,与图像中每个像素点进行比对的灰度阈值是不同的,例如,对于灰度图中的每个像素,计算出以该像素为中心的像素块(例如9×9的像素块)的平均像素灰度值并将该平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与自适应比较灰度阈值比较,如果该像素的灰度值大于自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到二值图像。
S103:对二值图像进行形态变换。
如图5所示,其示出对二值图像进行形态变换和颜色反转操作后的示例。这里的颜色反转操作是为了从二值图像得到黑底白字的二值图像,通过图像形态变换,可以消除图像中的噪声,以及在图像中连接相邻的元素,从而使得图像中有文字的区域连在一起,成为一个个基本长方形的条状,这样方便后续找出有文字区域的轮廓。
这里的形态变换主要包括腐蚀操作和膨胀操作,以及由其组成的开运算(先腐蚀后膨胀)和闭运算(先膨胀后腐蚀)。腐蚀和膨胀是对图像中具有灰度极大值的像素部分而言的,即高亮部分(而不是黑色部分),其中膨胀是将图像中的高亮部分进行膨胀,使其领域扩张,从而使得处理后的图拥有比原图更大的高亮区域;而腐蚀是将图像中的高亮部分腐蚀掉,使其领域缩减,从而处理后的图拥有比原图更小的高亮区域。
例如,膨胀操作可以包括如下:定义一个卷积核,该卷积核可以是任何形状和大小,且拥有一个单独定义的参考点,即锚点(Anchorpoint),卷积核通常可以为带参考点的正方形或者圆盘,可将该卷积核称为模板或掩膜;将卷积核与二值图像进行卷积,计算卷积核覆盖区域的像素点灰度最大值;将这个灰度最大值赋值给参考点指定的像素,因此,二值图像中的高亮区域逐渐增长。相反,腐蚀操作是将卷积核与二值图像进行卷积时,计算卷积核覆盖区域的像素点灰度最小值,将这个灰度最小值赋值给参考点指定的像素,因此,二值图像中的高亮区域逐渐减小。
在该步骤S103中的形态变换之前,可以对二值化转换所得二值图像进行颜色反转操作,变为黑底白字的二值图像,此时,步骤S103中的形态变换可以是依次进行膨胀操作和腐蚀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。在这里,在对从灰度图转换所得的二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还可以包括:对二值图像进行腐蚀操作以去除该二值图像中的噪声,图4中示出了采用腐蚀操作去除噪点后的二值图像的示例。该腐蚀操作例如可以采用2×2像素块的卷积核,当然本发明对此不作限制。当然,根据腐蚀操作和膨胀操作彼此的特性,去除二值图像中的噪声的方式也可以包括:在对二值化转换所得二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
或者,该步骤S103中的形态变换可以是:对二值化转换所得二值图像依次进行腐蚀操作和膨胀操作,例如得到白底黑字的二值图像,使得有助于二值图像中表示有文字部分(例如黑色部分)的颜色区域尽可能地接合在一起。在这里,在对从灰度图转换所得的二值图像进行腐蚀操作之前,所述方法还可以包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声;或者在对所述二值图像进行腐蚀操作之前,所述方法还可以包括:对二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声,以及进行颜色反转操作,以便于后续的开运算。
S104:从经过形态变换后的二值图像中获取表示有文字部分的颜色区域的轮廓,将原待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。在本发明中,经二值化转换所得的二值图像中表示有文字部分的颜色可以预先设定,例如使用二值图像中具有灰度极大值的像素区域表示有文字部分,或者反之,使用二值图像中具有灰度极小值的像素区域表示有文字部分。本实施例中以默认灰度极小值的像素区域表示有文字部分为例进行说明,当然,针对灰度极大值的像素区域表示有文字部分的情况,只有利用颜色反转操作,本发明技术方案对其同样适用,在此不再赘述。
在经过步骤S101-S103的处理以及颜色反转操作后,所得的二值图像为黑底白字的二值图像,如图5所示,其中也去除了噪点,而且表示有文字部分的白色区域也经过了优化而聚合。在此基础上,可以获取图像中的各个白色部分的轮廓,将做些轮廓作为掩模或者模板,应用到原待检测图像中,就可以得出文字检测区域,即,原待检测图像中的、与所述轮廓对应的区域为文字检测区域。
在实际操作中,可以针对图像中的每个白色部分,画出每个白色部分的最小外切矩形,利用这些矩形从原待检测图像中框出文字检测区域,如图6中的示例所示,其中书本页面上的文字均已被准确检测出并且用矩形框出来,以便于后续进行目标文字识别。在图6的示例中,除了书本页面,在背景中还部分的矩形,这些矩形并非与目标文字相关联,可以通过后续描述的版面分析来去除。
通过图1所示的方法,能够显著降低要进行处理的图像数据量,去除图像中针对文字检测的噪声,通过形态变换对文字部分对应的图像区域进行了优化,准确得出图像中的目标文字区域。
基于图1所示的方法,本申请的一些实施例还提供了该方法的一些具体实施方案以及扩展方案,下面进行说明。
在获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓之后,在将待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还可以包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。这是为了去除明显不属于文字部分的轮廓,从而进一步提高文字检测区域的检测准确性。
该预设条件可以根据需要以及文字大小及排版规律进行设置。例如,考虑到一般可读文字不会太小,而且用户获取待检测图像时通常会将目标文字区域置于图像中部,以及文字一般横向书写等规律,预设条件可以包括如下中的至少一项:轮廓内部面积包含少于500个像素;轮廓的外切最小矩形的长度小于20个像素(即太窄的轮廓);轮廓的外切最小矩形的宽度小于10个像素(即太扁的轮廓);轮廓位于待检测图像的边缘(即,不在图像中部的轮廓);轮廓的椭圆离心率小于0.95(即在横向方向上并非长条形的轮廓);以及轮廓的外切最小矩形的长边与横向方向所成角度大于45度(即偏离横向方向太多的轮廓),可以将满足至少一项该预设条件的轮廓去除。通过这些条件,能够将最终二值图像的白色区域中过小的白色区域、边缘白色区域、太短的或太扁的白色区域(这些区域不会是包含文字的区域)等去除。当然,本领域技术人员也可以根据具体的应用,采用其它预设条件,本发明对此不做限制。
此外,考虑到一般书本的文字背景颜色(例如纸张颜色)都是以白色、黄白色等为主,所述方法还可以包括:在所获得的轮廓中保留与待检测图像中被白黄颜色包围的位置内的轮廓。即,如果某一轮廓所对应的、待检测图像中的位置处周围的颜色并非白黄颜色,则认为该轮廓对应的待检测图像中的该位置处不是文字区域,所以可以将该轮廓去除。
另外,考虑到书本的文字阅读品会按照一定规律排版且逐行排列,而且用户在获取待检测图像时也会将目标文字区域置于图片中部,所以本发明的方法还可以包括:按照文字版面分布规则对所获得的轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
例如,如图7所示,其中示出根据本申请一实施例的版面分析过程示意图。通过对所得的矩形框进行聚类分析,能够得到如图中三个虚线框701、702、703所示的三组矩形框,其中虚线框701所示的一组矩形框位于图像中部而且包含最多的矩形框,而其它两组矩形框702和703并非位于图像中部区域,因此可以判断虚线框701所示的一组矩形框为用户感兴趣的文字区域,可以对该区域进行文字检测、识别和播报。因此,根据书页版面分析,可以认为不感兴趣的区域并不在待检测图像的中间,或者不属于待检测图像中文字最多的区域。
而且,如图7所示,根据图中文字行宽和文字角度可以看出,图中右侧的页面(虚线框702所示)宽度只有左侧页面(虚线框701所示)宽度的一半,另外,左右侧的文字中的空白区域也可以理解为图中的书籍是分为两页的,这些都有助于准确找出感兴趣的文字检测区域。当然,本发明的版面分析规则不限于此,本领域技术人员会根据具体的应用采用相应的版面分析规则,本发明对此不做限制。
优选地,按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
需要说明的是,上面列举的一些具体示例反映了本申请方案的思想,但是并非是唯一实施形式,基于本申请方案的思想,能够得到更多的类似示例。
基于同样的思路,本申请的一些实施例还提供了上述方法对应的文字检测装置、设备和非易失性计算机存储介质。
图8为根据本申请一实施例的文字检测装置的示意图,该装置包括:
图像获取模块801,用于获取待检测图像;
图像处理模块802,其用于将待检测图像转换为灰度图,将灰度图通过二值化转换成二值图像,并且对二值图像进行形态变换;
确定模块803,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将待检测图像中的、与获取的轮廓对应的区域确定为文字检测区域。
将灰度图通过二值化转换成二值图像可以具体包括:对于灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将该平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与自适应比较灰度阈值比较,如果该像素的灰度值大于自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到二值图像。
所述图像处理模块802在对所述二值图像进行形态变换之前,还用于对所述二值图像进行颜色反转操作,并且对二值图像进行形态变换可以具体包括:对二值图像依次进行膨胀操作和腐蚀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。此外,在对二值图像进行颜色反转操作之后、进行膨胀操作之前,图像处理模块802还可以对二值图像进行腐蚀操作以去除二值图像中的噪声。或者,图像处理模块802还可以用于:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
在另一变型中,对二值图像进行形态变换还可以具体包括:对二值图像依次进行腐蚀操作和膨胀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。此外,在对二值图像进行腐蚀操作之前,图像处理模块802还可以对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。或者,在对所述二值图像进行腐蚀操作之前,所述图像处理模块802还可以用于:对二值图像依次进行颜色反转操作、腐蚀操作以去除二值图像中的噪声、以及颜色反转操作。
在获取所述轮廓之后,将对待检测图像中的、与所获取轮廓对应的区域确定为文字检测区域之前,确定模块803还可以用于:去除所获取轮廓中符合预设条件的轮廓。该预设条件例如包括如下中的至少一项:轮廓内部面积包含少于500个像素;轮廓的外切最小矩形的长度小于20个像素;轮廓的外切最小矩形的宽度小于10个像素;轮廓位于待检测图像的边缘;轮廓的椭圆离心率小于0.95;以及轮廓的外切最小矩形的长边与横向方向所成角度大于45度。
确定模块803还可以用于:在所有轮廓中保留与待检测图像中被白黄颜色包围的位置内的轮廓。
确定模块803还可以用于:按照文字版面分布规则对轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
按照文字版面分布规则对轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域可以包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
图9为根据本申请一实施例的文字检测设备的示意图,该设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
根据本申请的一些实施例,提供了与以上所述文字检测方法对应的用于文字检测的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (24)
1.一种文字检测方法,其特征在于,包括:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
2.如权利要求1所述的文字检测方法,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:
对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。
3.如权利要求1或2所述的文字检测方法,其特征在于,在对所述二值图像进行形态变换之前,所述方法还包括对所述二值图像进行颜色反转操作,并且所述对所述二值图像进行形态变换包括:
对所述二值图像依次进行膨胀操作和腐蚀操作。
4.如权利要求1或2所述的文字检测方法,其特征在于,所述对所述二值图像进行形态变换包括:
对所述二值图像依次进行腐蚀操作和膨胀操作。
5.如权利要求3所述的文字检测方法,其特征在于,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还包括:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声;
或者,其特征在于,所述方法还包括:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
6.如权利要求4所述的文字检测方法,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声;
或者,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。
7.如权利要求1-6中任一项所述的文字检测方法,其特征在于,在获取所述轮廓之后,在将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。
8.根据权利要求1-7中任一项所述的文字检测方法,其特征在于,还包括:
在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。
9.根据权利要求1-8中任一项所述的文字检测方法,其特征在于,还包括:
按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
10.根据权利要求9所述的文字检测方法,其特征在于,所述按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
11.根据权利要求1-3和5中任一项所述的文字检测方法,其特征在于,通过二值化转换得到的所述二值图像为黑白图像,所述黑白图像中的黑色区域表示所述有文字部分的颜色区域。
12.一种文字检测装置,其特征在于,包括:
图像获取模块,用于获取待检测图像;
图像处理模块,其用于将所述待检测图像转换为灰度图,将所述灰度图通过二值化转换成二值图像,并且对所述二值图像进行形态变换;
确定模块,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
13.如权利要求12所述的文字检测装置,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:
对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。
14.如权利要求12或13所述的文字检测装置,其特征在于,所述图像处理模块在对所述二值图像进行形态变换之前,还用于对所述二值图像进行颜色反转操作,并且所述对所述二值图像进行形态变换包括:
对所述二值图像依次进行膨胀操作和腐蚀操作。
15.如权利要求12或13所述的文字检测装置,其特征在于,所述对所述二值图像进行形态变换包括:
对所述二值图像依次进行腐蚀操作和膨胀操作。
16.如权利要求14所述的文字检测装置,其特征在于,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述图像处理模块还用于:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声;
或者,其特征在于,所述图像处理模块还用于:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。
17.如权利要求15所述的文字检测装置,其特征在于,在对所述二值图像进行腐蚀操作之前,所述图像处理模块还用于:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声;
或者,其特征在于,在对所述二值图像进行腐蚀操作之前,所述图像处理模块还用于:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。
18.如权利要求12-17中任一项所述的文字检测装置,其特征在于,在获取所述轮廓之后,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述确定模块还用于:去除所述轮廓中符合预设条件的至少一个所述轮廓。
19.根据权利要求12-18中任一项所述的文字检测装置,其特征在于,所述确定模块还用于:
在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。
20.根据权利要求12-19中任一项所述的文字检测装置,其特征在于,所述确定模块还用于:
按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。
21.根据权利要求20所述的文字检测装置,其特征在于,所述按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。
22.根据权利要求12-14和16中任一项所述的文字检测方法,其特征在于,通过二值化转换得到的所述二值图像为黑白图像,所述黑白图像中的黑色区域表示所述有文字部分的颜色区域。
23.一种用于文字检测的设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
24.一种用于文字检测的非易失性计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为在由处理器运行时执行:
获取待检测图像,并将所述待检测图像转换为灰度图;
将所述灰度图通过二值化转换成二值图像;
对所述二值图像进行形态变换;
获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910180720.3A CN110097046A (zh) | 2019-03-11 | 2019-03-11 | 一种文字检测方法及装置、设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910180720.3A CN110097046A (zh) | 2019-03-11 | 2019-03-11 | 一种文字检测方法及装置、设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110097046A true CN110097046A (zh) | 2019-08-06 |
Family
ID=67443942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910180720.3A Pending CN110097046A (zh) | 2019-03-11 | 2019-03-11 | 一种文字检测方法及装置、设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110097046A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111060527A (zh) * | 2019-12-30 | 2020-04-24 | 歌尔股份有限公司 | 一种字符缺陷检测方法及装置 |
CN111083878A (zh) * | 2020-01-17 | 2020-04-28 | 广州兴森快捷电路科技有限公司 | 阻焊层间隙填充方法、装置、设备及存储介质 |
CN111340024A (zh) * | 2020-02-27 | 2020-06-26 | 深圳市赤狐软件技术有限公司 | 一种电子单据管理方法、装置、计算机设备及存储介质 |
CN111444903A (zh) * | 2020-03-23 | 2020-07-24 | 西安交通大学 | 漫画气泡内文字定位方法、装置、设备及可读存储介质 |
CN111476800A (zh) * | 2020-03-31 | 2020-07-31 | 万翼科技有限公司 | 一种基于形态学操作的文字区域检测方法及装置 |
CN111476243A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 影像文字识别方法及装置 |
CN111640094A (zh) * | 2020-05-21 | 2020-09-08 | 上海威侃电子材料有限公司 | 检测图像边缘差异消除方法及装置 |
CN111814673A (zh) * | 2020-07-08 | 2020-10-23 | 重庆农村商业银行股份有限公司 | 一种修正文本检测边界框的方法、装置、设备及存储介质 |
CN111898605A (zh) * | 2020-08-28 | 2020-11-06 | 四川长虹网络科技有限责任公司 | 基于图像ocr识别的机顶盒信息检测方法及系统 |
CN112287933A (zh) * | 2019-12-20 | 2021-01-29 | 中北大学 | 一种汽车轮毂x射线图像文字干扰的去除方法及系统 |
CN112418204A (zh) * | 2020-11-18 | 2021-02-26 | 杭州未名信科科技有限公司 | 基于纸质文档的文本识别方法、系统及计算机介质 |
CN112652004A (zh) * | 2020-12-31 | 2021-04-13 | 珠海格力电器股份有限公司 | 一种图像处理方法、装置、设备及介质 |
CN112750162A (zh) * | 2020-12-29 | 2021-05-04 | 北京电子工程总体研究所 | 一种目标识别定位方法和装置 |
CN112785508A (zh) * | 2019-11-11 | 2021-05-11 | 珠海金山办公软件有限公司 | 一种电子文档图片去噪的方法和装置 |
CN113033563A (zh) * | 2019-12-25 | 2021-06-25 | 北京世纪好未来教育科技有限公司 | 文本分割方法、装置、电子设备及存储介质 |
CN113205633A (zh) * | 2020-01-16 | 2021-08-03 | 深圳怡化电脑股份有限公司 | 票据红蓝纤维的检测方法、装置、电子设备和存储介质 |
CN113486892A (zh) * | 2021-07-02 | 2021-10-08 | 东北大学 | 基于智能手机图像识别的生产信息采集方法及系统 |
CN113553523A (zh) * | 2021-06-10 | 2021-10-26 | 北京达佳互联信息技术有限公司 | 骨架屏页面的生成方法、装置、电子设备、介质及产品 |
CN113610866A (zh) * | 2021-07-28 | 2021-11-05 | 上海墨说科教设备有限公司 | 练字图像的裁剪方法、装置、设备和存储介质 |
CN113642514A (zh) * | 2021-08-30 | 2021-11-12 | Oppo广东移动通信有限公司 | 版面分析方法及装置、计算机可读介质、电子设备 |
CN114387254A (zh) * | 2022-01-12 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 一种文档质量分析方法、装置、计算机设备及存储介质 |
CN116473501A (zh) * | 2023-04-28 | 2023-07-25 | 北京云柿信息技术有限公司 | 一种插片式主观验光结果自动记录方法、装置及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1006476A2 (en) * | 1998-11-18 | 2000-06-07 | Ncr International Inc. | Method of enhancing characters in an original binary image of a document |
CN100454963C (zh) * | 2005-08-31 | 2009-01-21 | 夏普株式会社 | 图像处理装置和方法、图像形成装置、图像读取装置 |
CN101576956A (zh) * | 2009-05-11 | 2009-11-11 | 天津普达软件技术有限公司 | 基于机器视觉的在线字符检测方法和系统 |
CN106096592A (zh) * | 2016-07-22 | 2016-11-09 | 浙江大学 | 一种数字图书的版面分析方法 |
CN109241975A (zh) * | 2018-08-27 | 2019-01-18 | 电子科技大学 | 一种基于字符中心点定位的车牌字符分割方法 |
-
2019
- 2019-03-11 CN CN201910180720.3A patent/CN110097046A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1006476A2 (en) * | 1998-11-18 | 2000-06-07 | Ncr International Inc. | Method of enhancing characters in an original binary image of a document |
CN100454963C (zh) * | 2005-08-31 | 2009-01-21 | 夏普株式会社 | 图像处理装置和方法、图像形成装置、图像读取装置 |
CN101576956A (zh) * | 2009-05-11 | 2009-11-11 | 天津普达软件技术有限公司 | 基于机器视觉的在线字符检测方法和系统 |
CN106096592A (zh) * | 2016-07-22 | 2016-11-09 | 浙江大学 | 一种数字图书的版面分析方法 |
CN109241975A (zh) * | 2018-08-27 | 2019-01-18 | 电子科技大学 | 一种基于字符中心点定位的车牌字符分割方法 |
Non-Patent Citations (4)
Title |
---|
__MARS: "iOS开发基于OpenCV处理实现身份证号码识别", 《HTTPS://WWW.JIANSHU.COM/P/1E71EEDC440F》 * |
刘积仁 等: "《计算机软件国家工程研究中心 1996研究论文集》", 31 August 1997, 沈阳:东北大学出版社 * |
杨宗卫的爸爸: "Opencv实战 文字区域的提取", 《CSDN》 * |
胡辉 等: "自然场景文本信息提取关键技术探究", 《信息工程》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785508A (zh) * | 2019-11-11 | 2021-05-11 | 珠海金山办公软件有限公司 | 一种电子文档图片去噪的方法和装置 |
CN112287933A (zh) * | 2019-12-20 | 2021-01-29 | 中北大学 | 一种汽车轮毂x射线图像文字干扰的去除方法及系统 |
CN113033563A (zh) * | 2019-12-25 | 2021-06-25 | 北京世纪好未来教育科技有限公司 | 文本分割方法、装置、电子设备及存储介质 |
CN111060527A (zh) * | 2019-12-30 | 2020-04-24 | 歌尔股份有限公司 | 一种字符缺陷检测方法及装置 |
US12002198B2 (en) | 2019-12-30 | 2024-06-04 | Goertek Inc. | Character defect detection method and device |
CN113205633A (zh) * | 2020-01-16 | 2021-08-03 | 深圳怡化电脑股份有限公司 | 票据红蓝纤维的检测方法、装置、电子设备和存储介质 |
CN111083878A (zh) * | 2020-01-17 | 2020-04-28 | 广州兴森快捷电路科技有限公司 | 阻焊层间隙填充方法、装置、设备及存储介质 |
CN111083878B (zh) * | 2020-01-17 | 2024-03-01 | 广州兴森快捷电路科技有限公司 | 阻焊层间隙填充方法、装置、设备及存储介质 |
CN111340024A (zh) * | 2020-02-27 | 2020-06-26 | 深圳市赤狐软件技术有限公司 | 一种电子单据管理方法、装置、计算机设备及存储介质 |
CN111444903A (zh) * | 2020-03-23 | 2020-07-24 | 西安交通大学 | 漫画气泡内文字定位方法、装置、设备及可读存储介质 |
CN111476800A (zh) * | 2020-03-31 | 2020-07-31 | 万翼科技有限公司 | 一种基于形态学操作的文字区域检测方法及装置 |
CN111476243A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 影像文字识别方法及装置 |
CN111640094A (zh) * | 2020-05-21 | 2020-09-08 | 上海威侃电子材料有限公司 | 检测图像边缘差异消除方法及装置 |
CN111814673A (zh) * | 2020-07-08 | 2020-10-23 | 重庆农村商业银行股份有限公司 | 一种修正文本检测边界框的方法、装置、设备及存储介质 |
CN111814673B (zh) * | 2020-07-08 | 2023-05-26 | 重庆农村商业银行股份有限公司 | 一种修正文本检测边界框的方法、装置、设备及存储介质 |
CN111898605A (zh) * | 2020-08-28 | 2020-11-06 | 四川长虹网络科技有限责任公司 | 基于图像ocr识别的机顶盒信息检测方法及系统 |
CN112418204A (zh) * | 2020-11-18 | 2021-02-26 | 杭州未名信科科技有限公司 | 基于纸质文档的文本识别方法、系统及计算机介质 |
CN112750162A (zh) * | 2020-12-29 | 2021-05-04 | 北京电子工程总体研究所 | 一种目标识别定位方法和装置 |
CN112652004A (zh) * | 2020-12-31 | 2021-04-13 | 珠海格力电器股份有限公司 | 一种图像处理方法、装置、设备及介质 |
CN112652004B (zh) * | 2020-12-31 | 2024-04-05 | 珠海格力电器股份有限公司 | 一种图像处理方法、装置、设备及介质 |
CN113553523A (zh) * | 2021-06-10 | 2021-10-26 | 北京达佳互联信息技术有限公司 | 骨架屏页面的生成方法、装置、电子设备、介质及产品 |
CN113486892B (zh) * | 2021-07-02 | 2023-11-28 | 东北大学 | 基于智能手机图像识别的生产信息采集方法及系统 |
CN113486892A (zh) * | 2021-07-02 | 2021-10-08 | 东北大学 | 基于智能手机图像识别的生产信息采集方法及系统 |
CN113610866A (zh) * | 2021-07-28 | 2021-11-05 | 上海墨说科教设备有限公司 | 练字图像的裁剪方法、装置、设备和存储介质 |
CN113610866B (zh) * | 2021-07-28 | 2024-04-23 | 上海墨说科教设备有限公司 | 练字图像的裁剪方法、装置、设备和存储介质 |
CN113642514A (zh) * | 2021-08-30 | 2021-11-12 | Oppo广东移动通信有限公司 | 版面分析方法及装置、计算机可读介质、电子设备 |
CN114387254A (zh) * | 2022-01-12 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 一种文档质量分析方法、装置、计算机设备及存储介质 |
CN116473501A (zh) * | 2023-04-28 | 2023-07-25 | 北京云柿信息技术有限公司 | 一种插片式主观验光结果自动记录方法、装置及系统 |
CN116473501B (zh) * | 2023-04-28 | 2023-12-05 | 北京云柿信息技术有限公司 | 一种插片式主观验光结果自动记录方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097046A (zh) | 一种文字检测方法及装置、设备和计算机可读存储介质 | |
CN109670500B (zh) | 一种文字区域获取方法、装置、存储介质及终端设备 | |
EP3309703B1 (en) | Method and system for decoding qr code based on weighted average grey method | |
CN112789623B (zh) | 文本检测方法、装置及存储介质 | |
CN113486828B (zh) | 图像处理方法、装置、设备和存储介质 | |
CN111178355B (zh) | 印章识别方法、装置和存储介质 | |
CN112418216A (zh) | 一种复杂自然场景图像中的文字检测方法 | |
CN109344824B (zh) | 一种文本行区域检测方法、装置、介质和电子设备 | |
CN110443235B (zh) | 一种智能纸质试卷总分识别方法及系统 | |
CN113591746B (zh) | 一种文档表格结构检测方法及装置 | |
CN112348028A (zh) | 一种场景文本检测方法、批改方法、装置、电子设备及介质 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN115761225A (zh) | 一种基于神经网络可解释性的图像标注方法 | |
CN116612280A (zh) | 车辆分割方法、装置、计算机设备和计算机可读存储介质 | |
CN116597466A (zh) | 一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统 | |
CN111274863A (zh) | 一种基于文本山峰概率密度的文本预测方法 | |
CN110533020B (zh) | 一种文字信息的识别方法、装置及存储介质 | |
EP4075381B1 (en) | Image processing method and system | |
CN116798041A (zh) | 图像识别方法、装置和电子设备 | |
CN109145918B (zh) | 图像分割标注方法及设备 | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN112837329B (zh) | 一种藏文古籍文档图像二值化方法及系统 | |
CN114648751A (zh) | 一种处理视频字幕的方法、装置、终端及存储介质 | |
CN114267035A (zh) | 一种文档图像处理方法、系统、电子设备及可读介质 | |
CN114399782A (zh) | 文本图像处理方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190806 |