CN103093228A - 一种在自然场景图像中基于连通域的中文检测方法 - Google Patents

一种在自然场景图像中基于连通域的中文检测方法 Download PDF

Info

Publication number
CN103093228A
CN103093228A CN2013100178048A CN201310017804A CN103093228A CN 103093228 A CN103093228 A CN 103093228A CN 2013100178048 A CN2013100178048 A CN 2013100178048A CN 201310017804 A CN201310017804 A CN 201310017804A CN 103093228 A CN103093228 A CN 103093228A
Authority
CN
China
Prior art keywords
chinese
connected domain
stroke width
pixel
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100178048A
Other languages
English (en)
Other versions
CN103093228B (zh
Inventor
周异
陈凯
徐奕
徐勇
陈庆明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD
Xiamen Shang Ji Network Technology Co., Ltd.
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201310017804.8A priority Critical patent/CN103093228B/zh
Publication of CN103093228A publication Critical patent/CN103093228A/zh
Application granted granted Critical
Publication of CN103093228B publication Critical patent/CN103093228B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明公开一种在自然场景图像中基于连通域的中文检测方法,该方法首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理;笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度,在这一步中进行图像像素的连通域标定;在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。本发明方法以中文的复杂结构为出发点,在中文检测方面具有更好的针对性,因此具有更高的主动性和精确性。

Description

一种在自然场景图像中基于连通域的中文检测方法
技术领域
本发明涉及一种文本定位领域,具体地说,涉及的是一种在自然场景图像中基于连通域的中文检测方法。
背景技术
文本是计算机视觉的许多应用中的一项重要特征。图像中的文本存有很多有用的信息,对视觉内容理解和获取至关重要。文本提取的主要目的是将文本图像转化为符号形式,从而利于修改、检索、利用及传输。文本定位是文本提取的一个重要步骤。
文本定位是对图像中文本位置的精确定位。基于连通域的文本定位方法首先将图像表示为一个个的连通域,然后从结构分析出发,通过合并方法将文本行标示,输出结果。
传统的合并方法在处理一些结构复杂的汉字时效果不甚理想。外语如最常见的英语单词字符之间一般水平排列。对于中文文字,情况更加复杂。本发明提出的基于连通域的中文合并方法,效果很好。
中国专利申请号为200710064388.1、公开号为101266654的发明专利,该发明公开基于连通分量和支持向量机的图像中文本定位的方法和装置。该发明的主要创新是利用支持向量机的学习方法来提高字符连通分量判决的准确性。但因为中文字数很多,该方法需要大量标注的正负样本来学习,工作量较大,而且并没有显示对结构复杂的文字连通域合并有效的解决方法。
发明内容
本发明的目的在于针对目前图像文本定位上的定位不甚理想的情况,提出一种基于连通域的中文检测方法,该方法抓住文字笔画宽度一致的特征,利用Canny和梯度信息提取笔画宽度,形态学获取连通区域,并利用文字的结构信息来进行连通区域的合并,提高对上中下、左中右等复杂结构的汉字的检测,同时实现文字区域定位和分割,方法简单有效。这种方法以中文的复杂结构为出发点,在中文检测方面具有更好的针对性,因此具有更高的主动性和精确性。
为实现上述目的,本发明所述的基于连通域的中文检测的方法,包括以下步骤:
第一步,进行输入图像处理,首先获取自然场景图像,将自然场景图像进行笔划宽度变换等预处理。
第二步,笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度。在这一步中将进行图像像素的连通域标定。
第三步,在获得连通分量之后,提取连通分量的各种特征,这些特征组合必须能够很好的表达连通分量。
第四步,得到连通分量的各种特征之后,从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。
上述第一步中,需要对原始图像进行笔画宽度变换,具体过程如下:
(1)在进行笔划宽度变换之前,首先将彩色图转化为灰度图,并进行二值化处理;
(2)利用Canny边缘检测算子提取图像存在的边缘信息。
(3)获取(2)中边缘像素的梯度方向,梯度方向的获取用原始图像和Sobel算子作卷积得到;
(4)笔划宽度赋值,将梯度方向相反的边缘像素对之间的像素赋值,大小为该像素对之间的距离;
(5)形态学滤波:采用膨胀再腐蚀的运算来连接邻近的区域,再用腐蚀的方法去除一些直线。
上述第二步中,如图3所示,利用修改后顺序区域标定方法进行连通域标定,具体过程如下:
(1)考察邻近像素“相邻”关系,如果相邻两个像素值比值在区间1/3和3之间,则认为其“相邻”,图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记;
(2)标记传递:如果当前的像素是一个前景像素,则将被赋予一个新的区域标号,或者如果该邻域中之前检查过的邻近节点是一个前景像素,则该像素的标号与其邻近节点的标号一致;
(3)解决标号冲突:一旦所有属于同一区域的不同标记被确定下来,该区域中所有像素的标记安然无恙被更新为同一个值。
(4)结束标定,输出结果;
上述第三步中,利用获得的连通域(值大小相同的像素属于同一个连通域),提取连通域的各种特征,具体特征如下:
(1)字符笔划宽度方差与背景的对比度;
(2)字符的长宽比;
(3)笔划宽度和连通域尺寸比值;
(4)连通域尺寸和连通域面积比值。
上述第四步中,利用步骤3得到的连通域特征,顺序执行字内合并方法和字间合并方法,具体过程如下:
(1)字内合并方法合并条件:
每一个连通域被认为是一个可能的“简单”的汉字。通常一个汉字包含至少两个“简单”的汉字。如果两个“简单”的汉字相邻并且满足定义的限制条件,执行字内合并方法,将两个“简单”的汉字是否合并为一个汉字。所述限制条件如下:
1)两个连通域的平均笔划宽度比值必须在1/2和2之间。
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于平均笔划宽度的3.5倍,y坐标差值不大于平均笔划宽度的7倍。
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于平均笔划宽度的3.5倍,x坐标差值不大于平均笔划宽度的7倍。
(2)字间合并方法合并条件:
1)属于一个文本行里的汉字的平均笔划宽度比值应该在0.8和1.25之间。
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于两个连通域之间最高的高度值的0.5倍。
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于两个连通域之间最宽的宽度值的3倍。
(3)首先执行字内合并,过程如下:
1)遍历所有连通域,如果两个连通域满足字内合并条件,合并,形成一个连通域对;
2)遍历所有连通域对,如果两个连通域对共有一个连通域,各并成一个新的连通域组,去除原来的连通域对。
3)将2)中得到的连通域组更新位新的连通域。
(4)执行字间合并,各并条件如(2)所示,合并过程与字内合并相同。
(5)得到字间合并的连通域,以矩形框限定输出。
与现有技术相比,本发明具有如下的有益效果:
本发明与传统的中文检测方法有所区别,利用笔划宽度变换得到可能的宽度信息,然后利用修改的顺序区域标定方法将连通域标示,再利用中文合并方法检测图像中的中文文本。传统的合并方法在处理一些结构复杂的汉字时效果不甚理想,比如最常见的英语单词字符之间一般水平排列,而对于中文文字,情况则非常复杂。一个汉字可能由更多的部首组成,位置关系不仅有左中右水平排列,还有上中下垂直排列,本发明的合并方法在处理复杂中文字合并时具有更高的准确性。综上,本发明基于连通域的中文检测方法相比于传统的文本检测等方法,拥有更高的主动性和精确性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明的流程图。
图2是本发明一实施例笔画宽度变换的流程图。
图3是本发明一实施例修改后的顺序区域标定的流程图。
图4是本发明一实施例中文合并方法的效果图,其中:(a)寻找相邻的连通域。(b)字间合并算过程及结果。(c)两个相邻的汉字合并成一个文本行,找到两个文本行和一个汉字。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本实施例提供一种基于连通域的中文检测方法,流程可以分为以下几个步骤:
步骤1:得到输入图像,执行预处理;
步骤2:对图像进行连通域标定;
步骤3:针对每一个连通域,提取连通域特征信息;
步骤4:根据得到的连通域特征信息,将连通域合并,执行字内合并过程;
步骤5:执行字间合并过程;
步骤6:得到检测出的中文文本行,检测结束。
步骤1的过程如图2所示,需要注意的是,笔划宽度变换只是预处理的一种可能方式,也可以采取其它方式得到连通域信息。笔划宽度的思路如下:首先对输入图像进行边缘检测,得到边缘信息;然后从每一个边缘像素出发,找到与之梯度方向大致相反的边缘像素点,形成一个边缘点对;计算边缘点对的距离,将该值赋于边缘点对之间所有的像素点。则经过笔划宽度变换的输出图像像素点代表可能的笔划宽度。利用笔划宽度信息可以获取可能的文本信息,因为笔划宽度一致的连通域很有可能是文本区域。具体过程如下:
(1)将彩色图转化为灰度图;
(2)利用Canny算子进行边缘检测;
(3)提取边缘像素的梯度信息;
(4)从边缘像素出发,找到梯度方向相反的边缘像素点;
(5)将(4)中找到的边缘像素对之间的边缘像素赋值,大小为两者之间的距离。
步骤2的过程如图2所示。连通域标定过程使用的是修改后的顺序区域标定方法。主要修改的是其中的关联规则,即经过笔划宽度变换之后,若邻接的像素值大小比值在1/3和3之间,则视为“相邻”。修改后的顺序区域标定方法具体过程如下:
(1)考察邻近像素“相邻”关系,如果相邻两个像素值比值在区间1/3和3之间,则认为其“相邻”,图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记;
(2)标记传递:如果当前的像素是一个前景像素,则将被赋予一个新的区域标号,或者如果该邻域中之前检查过的邻近节点是一个前景像素,则该像素的标号与其邻近节点的标号一致;
(3)解决标号冲突:一旦所有属于同一区域的不同标记被确定下来,该区域中所有像素的标记安然无恙被更新为同一个值。
(4)结束标定,输出结果;
步骤3所使用的连通域特征信息用于判断两个连通域是否属于同一个字,或者属于同一个文本行。作此判断的依据条件有4个:
(1)字符笔划宽度方差与背景之间的对比度。
(2)字符的长宽比。
(3)笔划宽度和连通域尺寸比值。
(4)连通域尺寸和连通域面积比值。
步骤4和步骤5是最关键的部分,如图4所示。在提取到连通域信息之后,可以通过连通域信息判断连通域是否是文本区域。具体过程如下:
(1)字内合并方法合并条件:
1)两个连通域的平均笔划宽度比值必须在1/2和2之间。
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于平均笔划宽度的3.5倍,y坐标差值不大于平均笔划宽度的7倍。
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于平均笔划宽度的3.5倍,x坐标差值不大于平均笔划宽度的7倍。
(2)字间合并方法合并条件:
1)属于一个文本行里的汉字的平均笔划宽度比值应该在0.8和1.25之间。
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于两个连通域之间最高的高度值的0.5倍。
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于两个连通域之间最宽的宽度值的3倍。
(3)首先执行字内合并,过程如下:
1)遍历所有连通域,如果两个连通域满足字内合并条件,合并,形成一个连通域对;
2)遍历所有连通域对,如果两个连通域对共有一个连通域,各并成一个新的连通域组,去除原来的连通域对。
3)将2)中得到的连通域组更新位新的连通域。
(4)执行字间合并,各并条件如(2)所示,合并过程与字内合并相同。
(5)得到字间合并的连通域,以矩形框限定输出。
常用的文字连通区域合并方法在处理一些结构复杂的汉字时效果不甚理想,如上中下和左中右等复杂的结构,这些子连通区域是属于一个汉字还是多个汉字很难判断。本发明提出的方法抓住文字笔画宽度一致的特征,利用Canny和梯度信息提取笔画宽度以及形态学获取连通区域,并利用文字的结构信息来进行连通区域的合并,提高对上中下、左中右等复杂结构的汉字的检测,同时实现文字区域定位和分割,方法简单有效,而且对复杂背景图像文字检测有非常好的效果。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (6)

1.一种在自然场景图像中基于连通域的中文检测方法,其特征在于包括以下具体步骤:
第一步,进行输入图像处理,首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理;
第二步,笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度,在这一步中进行图像像素的连通域标定;
第三步,在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;
第四步,得到连通分量的各种特征之后,从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。
2.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第一步所述的笔划宽度变换,具体过程如下:
(1)在进行笔划宽度变换之前,首先将彩色图转化为灰度图,并进行二值化处理;
(2)利用Canny边缘检测算子提取图像存在的边缘信息;
(3)获取(2)中边缘像素的梯度方向,梯度方向的获取用原始图像和Sobel算子作卷积得到;
(4)笔划宽度赋值,将梯度方向相反的边缘像素对之间的像素赋值,大小为该像素对之间的距离;
(5)形态学滤波:采用膨胀再腐蚀的运算来连接邻近的区域,再用腐蚀的方法去除一些直线。
3.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第二步中,所述图像像素的连通域标定利用修改后顺序区域标定方法,具体过程如下:
(1)如果相邻两个像素值比值在区间1/3和3之间,则认为其“相邻”,图像由左至右下进行遍历并顺序地在标记图上相应像素赋以标记;
(2)标记传递:如果当前的像素是一个前景像素,则将被赋予一个新的区域标号,或者如果该邻域中之前检查过的邻近节点是一个前景像素,则该像素的标号与其邻近节点的标号一致;
(3)解决标号冲突:一旦所有属于同一区域的不同标记被确定下来,该区域中所有像素的标记安然无恙被更新为同一个值;
(4)结束标定,输出结果。
4.根据权利要求1所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第三步中,所述提取连通分量的各种特征具体如下:
(1)字符笔划宽度方差与背景之间的对比度;
(2)字符的长宽比;
(3)笔划宽度和连通域尺寸比值;
(4)连通域尺寸和连通域面积比值。
5.根据权利要求1-4任一项所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第四步中,所述字内合并方法是指:每一个连通域被认为是一个可能的“简单”的汉字,通常一个汉字包含至少两个“简单”的汉字,如果两个“简单”的汉字相邻并且满足定义的限制条件,执行字内合并方法,将两个“简单”的汉字是否合并为一个汉字,所述限制条件如下:
1)两个连通域的平均笔划宽度比值在1/2和2之间;
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于平均笔划宽度的3.5倍,y坐标差值不大于平均笔划宽度的7倍;
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于平均笔划宽度的3.5倍,x坐标差值不大于平均笔划宽度的7倍。
6.根据权利要求1-4任一项所述的在自然场景图像中基于连通域的中文检测方法,其特征在于第四步中,所述字间合并方法用来检测文本行,在执行完字内合并方法之后,接着执行字间合并方法,将连通域合并以形成文本行,字间合并方法限制条件如下:
1)属于一个文本行里的汉字的平均笔划宽度比值该在0.8和1.25之间;
2)两个汉字的连通域外接矩形的中心点x坐标差值不大于两个连通域之间最高的高度值的0.5倍;
3)两个汉字的连通域外接矩形的中心点y坐标差值不大于两个连通域之间最宽的宽度值的3倍。
CN201310017804.8A 2013-01-17 2013-01-17 一种在自然场景图像中基于连通域的中文检测方法 Active CN103093228B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310017804.8A CN103093228B (zh) 2013-01-17 2013-01-17 一种在自然场景图像中基于连通域的中文检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310017804.8A CN103093228B (zh) 2013-01-17 2013-01-17 一种在自然场景图像中基于连通域的中文检测方法

Publications (2)

Publication Number Publication Date
CN103093228A true CN103093228A (zh) 2013-05-08
CN103093228B CN103093228B (zh) 2015-12-09

Family

ID=48205776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310017804.8A Active CN103093228B (zh) 2013-01-17 2013-01-17 一种在自然场景图像中基于连通域的中文检测方法

Country Status (1)

Country Link
CN (1) CN103093228B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413132A (zh) * 2013-06-24 2013-11-27 西安交通大学 一种渐进层次认知的场景图像文本检测方法
CN103871049A (zh) * 2014-01-08 2014-06-18 香港应用科技研究院有限公司 非均匀背景光下的边缘检测方法
CN103888749A (zh) * 2014-04-03 2014-06-25 清华大学深圳研究生院 一种双目视频转换多目视频的方法
CN104182744A (zh) * 2013-05-24 2014-12-03 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
CN104657972A (zh) * 2013-11-25 2015-05-27 北京大学 一种图像块的模糊度判断方法及系统
CN104794479A (zh) * 2014-01-20 2015-07-22 北京大学 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN105469047A (zh) * 2015-11-23 2016-04-06 上海交通大学 基于无监督学习深度学习网络的中文检测方法及系统
CN105844207A (zh) * 2015-01-15 2016-08-10 富士通株式会社 文本行提取方法和文本行提取设备
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN106446920A (zh) * 2016-09-05 2017-02-22 电子科技大学 一种基于梯度幅度约束的笔画宽度变换方法
CN106845474A (zh) * 2015-12-07 2017-06-13 富士通株式会社 图像处理装置和方法
CN107437084A (zh) * 2017-07-24 2017-12-05 南京晓庄学院 一种脱机手写体文本识别的字符重心定位方法
CN107622271A (zh) * 2016-07-15 2018-01-23 科大讯飞股份有限公司 手写文本行提取方法及系统
CN107784316A (zh) * 2016-08-26 2018-03-09 阿里巴巴集团控股有限公司 一种图像识别方法、装置、系统和计算设备
CN107977593A (zh) * 2016-10-21 2018-05-01 富士通株式会社 图像处理装置和图像处理方法
CN109558876A (zh) * 2018-11-20 2019-04-02 浙江口碑网络技术有限公司 字符识别处理方法及装置
CN109816847A (zh) * 2018-12-20 2019-05-28 深圳怡化电脑股份有限公司 一种判断手写字迹涂改的方法、装置及终端设备
CN109816645A (zh) * 2019-01-18 2019-05-28 创新奇智(广州)科技有限公司 一种钢卷松卷的自动检测方法
CN110135426A (zh) * 2018-02-09 2019-08-16 北京世纪好未来教育科技有限公司 样本标注方法及计算机存储介质
CN110188622A (zh) * 2019-05-09 2019-08-30 新华三信息安全技术有限公司 一种文字定位方法、装置及电子设备
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN110944237A (zh) * 2019-12-12 2020-03-31 成都极米科技股份有限公司 一种字幕区域定位方法、装置和电子设备
CN112016546A (zh) * 2020-08-14 2020-12-01 中国银联股份有限公司 一种文本区域的定位方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593276A (zh) * 2008-05-29 2009-12-02 汉王科技股份有限公司 一种视频ocr图文分离方法及系统
CN101593278A (zh) * 2008-05-27 2009-12-02 佳能株式会社 文档图像的语言判别方法和系统
WO2011007586A1 (en) * 2009-07-13 2011-01-20 Sharp Kabushiki Kaisha Methods and systems for reducing compression artifacts
CN102163284A (zh) * 2011-04-11 2011-08-24 西安电子科技大学 面向中文环境的复杂场景文本定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593278A (zh) * 2008-05-27 2009-12-02 佳能株式会社 文档图像的语言判别方法和系统
CN101593276A (zh) * 2008-05-29 2009-12-02 汉王科技股份有限公司 一种视频ocr图文分离方法及系统
WO2011007586A1 (en) * 2009-07-13 2011-01-20 Sharp Kabushiki Kaisha Methods and systems for reducing compression artifacts
CN102163284A (zh) * 2011-04-11 2011-08-24 西安电子科技大学 面向中文环境的复杂场景文本定位方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182744A (zh) * 2013-05-24 2014-12-03 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
CN104182744B (zh) * 2013-05-24 2018-09-04 佳能株式会社 文本检测方法和装置以及文本信息提取方法和系统
CN103413132A (zh) * 2013-06-24 2013-11-27 西安交通大学 一种渐进层次认知的场景图像文本检测方法
CN103413132B (zh) * 2013-06-24 2016-11-09 西安交通大学 一种渐进层次认知的场景图像文本检测方法
CN104657972A (zh) * 2013-11-25 2015-05-27 北京大学 一种图像块的模糊度判断方法及系统
CN103871049B (zh) * 2014-01-08 2017-01-18 香港应用科技研究院有限公司 非均匀背景光下的边缘检测方法
CN103871049A (zh) * 2014-01-08 2014-06-18 香港应用科技研究院有限公司 非均匀背景光下的边缘检测方法
CN104794479A (zh) * 2014-01-20 2015-07-22 北京大学 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN104794479B (zh) * 2014-01-20 2018-06-29 北京大学 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN103888749A (zh) * 2014-04-03 2014-06-25 清华大学深圳研究生院 一种双目视频转换多目视频的方法
CN103888749B (zh) * 2014-04-03 2016-07-27 清华大学深圳研究生院 一种双目视频转换多目视频的方法
CN105844207B (zh) * 2015-01-15 2019-03-29 富士通株式会社 文本行提取方法和文本行提取设备
CN105844207A (zh) * 2015-01-15 2016-08-10 富士通株式会社 文本行提取方法和文本行提取设备
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN105469047B (zh) * 2015-11-23 2019-02-22 上海交通大学 基于无监督学习深度学习网络的中文检测方法及系统
CN105469047A (zh) * 2015-11-23 2016-04-06 上海交通大学 基于无监督学习深度学习网络的中文检测方法及系统
CN106845474A (zh) * 2015-12-07 2017-06-13 富士通株式会社 图像处理装置和方法
CN106845474B (zh) * 2015-12-07 2020-05-08 富士通株式会社 图像处理装置和方法
CN107622271B (zh) * 2016-07-15 2020-07-14 科大讯飞股份有限公司 手写文本行提取方法及系统
CN107622271A (zh) * 2016-07-15 2018-01-23 科大讯飞股份有限公司 手写文本行提取方法及系统
CN107784316A (zh) * 2016-08-26 2018-03-09 阿里巴巴集团控股有限公司 一种图像识别方法、装置、系统和计算设备
CN106446920A (zh) * 2016-09-05 2017-02-22 电子科技大学 一种基于梯度幅度约束的笔画宽度变换方法
CN106446920B (zh) * 2016-09-05 2019-10-01 电子科技大学 一种基于梯度幅度约束的笔画宽度变换方法
CN107977593A (zh) * 2016-10-21 2018-05-01 富士通株式会社 图像处理装置和图像处理方法
CN107437084B (zh) * 2017-07-24 2020-12-08 南京晓庄学院 一种脱机手写体文本识别的字符重心定位方法
CN107437084A (zh) * 2017-07-24 2017-12-05 南京晓庄学院 一种脱机手写体文本识别的字符重心定位方法
CN110135426A (zh) * 2018-02-09 2019-08-16 北京世纪好未来教育科技有限公司 样本标注方法及计算机存储介质
CN110569835B (zh) * 2018-06-06 2024-03-05 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN109558876A (zh) * 2018-11-20 2019-04-02 浙江口碑网络技术有限公司 字符识别处理方法及装置
CN109816847A (zh) * 2018-12-20 2019-05-28 深圳怡化电脑股份有限公司 一种判断手写字迹涂改的方法、装置及终端设备
CN109816645B (zh) * 2019-01-18 2020-11-17 创新奇智(广州)科技有限公司 一种钢卷松卷的自动检测方法
CN109816645A (zh) * 2019-01-18 2019-05-28 创新奇智(广州)科技有限公司 一种钢卷松卷的自动检测方法
CN110188622A (zh) * 2019-05-09 2019-08-30 新华三信息安全技术有限公司 一种文字定位方法、装置及电子设备
CN110188622B (zh) * 2019-05-09 2021-08-06 新华三信息安全技术有限公司 一种文字定位方法、装置及电子设备
CN110944237A (zh) * 2019-12-12 2020-03-31 成都极米科技股份有限公司 一种字幕区域定位方法、装置和电子设备
CN110944237B (zh) * 2019-12-12 2022-02-01 成都极米科技股份有限公司 一种字幕区域定位方法、装置和电子设备
CN112016546A (zh) * 2020-08-14 2020-12-01 中国银联股份有限公司 一种文本区域的定位方法及装置
WO2022033095A1 (zh) * 2020-08-14 2022-02-17 中国银联股份有限公司 一种文本区域的定位方法及装置

Also Published As

Publication number Publication date
CN103093228B (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN103093228A (zh) 一种在自然场景图像中基于连通域的中文检测方法
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN104182750A (zh) 一种在自然场景图像中基于极值连通域的中文检测方法
TWI744283B (zh) 一種單詞的分割方法和裝置
TWI631514B (zh) Method and system for marking recognition based on mobile terminal
US10643094B2 (en) Method for line and word segmentation for handwritten text images
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN103336961B (zh) 一种交互式的自然场景文本检测方法
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
CN108830270B (zh) 对满文单词正确分割各识别的满文单词中轴线的定位方法
CN112418216A (zh) 一种复杂自然场景图像中的文字检测方法
CN104156941A (zh) 一种确定图像上几何轮廓区域的方法及系统
CN112507876A (zh) 一种基于语义分割的有线表格图片解析方法和装置
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法
US9965678B2 (en) Method for recognizing table and flowchart in document images
Ayesh et al. A robust line segmentation algorithm for Arabic printed text with diacritics
CN106295627A (zh) 用于识别文字牛皮癣图片的方法及装置
CN204537126U (zh) 一种图像文本识别翻译眼镜
Liu et al. Stroke filter for text localization in video images
CN113673506A (zh) 一种基于多尺度特征金字塔的场景文本检测方法及系统
Feild et al. Scene text recognition with bilateral regression
Sambyal et al. Feature based text extraction system using connected component method
Chavre et al. Scene text extraction using stroke width transform for tourist translator on android platform
Seeri et al. A novel approach for Kannada text extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181009

Address after: 211299 No. 368 zhe Ning Road, zhe Tang Town, Lishui Economic Development Zone, Nanjing, Jiangsu

Patentee after: Nanjing Ji Yun Information technology company limited

Address before: 200240 No. 800, Dongchuan Road, Shanghai, Minhang District

Patentee before: Shanghai Jiao Tong University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190104

Address after: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Patentee after: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD

Address before: 211299 No. 368 zhe Ning Road, zhe Tang Town, Lishui Economic Development Zone, Nanjing, Jiangsu

Patentee before: Nanjing Ji Yun Information technology company limited

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190814

Address after: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Co-patentee after: Xiamen Shang Ji Network Technology Co., Ltd.

Patentee after: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD

Address before: 201100 Shanghai Minhang District, Jianchuan Road 951 Building 5 1 Floor

Patentee before: SHANGHAI SHENYOU INTELLIGENT TECHNOLOGY CO., LTD