CN106845475A - 基于连通域的自然场景文字检测方法 - Google Patents

基于连通域的自然场景文字检测方法 Download PDF

Info

Publication number
CN106845475A
CN106845475A CN201611157997.7A CN201611157997A CN106845475A CN 106845475 A CN106845475 A CN 106845475A CN 201611157997 A CN201611157997 A CN 201611157997A CN 106845475 A CN106845475 A CN 106845475A
Authority
CN
China
Prior art keywords
region
character candidates
character
image
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611157997.7A
Other languages
English (en)
Inventor
冯冬竹
余航
郑毓
杨旭坤
何晓川
刘清华
许录平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201611157997.7A priority Critical patent/CN106845475A/zh
Publication of CN106845475A publication Critical patent/CN106845475A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种基于连通域的自然场景文字检测的方法,主要解决现有的文字检测方法准确率低的问题。其实现步骤是:1)对输入的原始图像进行灰度变换得到灰度图像IG;2)从IG中提取字符候选区域,得到字符候选区域图像Im;3)过滤掉Im中一些不含有字符的候选区域,得到初步过滤后的图像I1;4)过滤掉I1中一些不含有字符的候选区域,得到最终的图像I2;5)将I2中剩余的字符候选区域合并为文本行区域;6)将文本行区域依次输入到卷积神经网络文字检测器中,过滤掉不含有文字的文本行区域,得到最终含有文字的文本行区域。本发明通过多次过滤掉不含有文字的候选区域,提高了文字检测的准确率,可用于自动提取图像中的文字。

Description

基于连通域的自然场景文字检测方法
技术领域
本发明属于计算机视觉技术领域,具体涉及自然场景图像文字检测方法,可用于自动提取图像中的文字。
背景技术
随着移动互联网的飞速发展及智能手机等移动电子设备的普及,自然场景图像的获取和传输变得越来越便捷。自然场景图像中的文字包含了丰富的信息,人们期待计算机能代替人类自动地检测并提取图像的文字信息,并将这项技术走向产业化发展,投向日常的生产和生活中,如将文字识别技术应用于无人驾驶汽车、盲人导航、工业自动化、互联网信息挖掘、电商打假、品牌曝光率调研等领域。
与传统的光学字符识别不同,自然场景中的文字信息提取难点在于待检测和识别的文字处于复杂的自然场景中,如真实的街道和商场场景等,因此图像具有复杂性和多变性的特点,且存在噪声、模糊以及角度倾斜、文字字体多变等问题。近年来,面向自然场景的文字识别研究虽然取得了一定的成果,但是与实际应用要求还存在较大的差距。因此,面向自然场景的文字识别方法的研究不仅具有重要的理论研究意义,而且具有广阔的应用前景。
自然场景文字识别主要包含了两个子问题:文字检测和字符识别。其中最受关注的是文字检测问题。文字检测是指对图像中是否存在文字信息进行确认,若存在文字信息则需要对文字进行定位及分割。因此,如何准确的提取出文字区域对自然场景文字识别有重要的意义。
目前,在提取文字区域方法中,最常用的是最大极值稳定区域算子MSER。MSER是一种经典的连通区域检测算子。MSER算子具有非常强的鲁棒性,可以检测到低质量的文字,例如低对比度、低分辨率和模糊退化。同时因为在自然场景中有很多类似文字的场景元素的存在,如门窗、栏杆、树叶网孔、灯柱等,而且这些非文字元素在形状和颜色上与文字非常的相似,所以检测到了许多不是文字的MSER连通区域,导致文字检测的准确率下降。这是基于最大极值稳定区域进行文字定位的最主要挑战之一。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于连通域的自然场景图像文字检测的方法,以保证检测速度,提高文字检测的准确率。
本发明的思路是:直接对自然场景图像进行灰度变换,利用连通域检测算子MSER提取字符候选区域,根据字符的基本几何特性以及笔画宽度特性来滤掉一些非字符区域,将剩余字符区域合并为文本行后,依次输入到训练好的卷积神经网络CNN字符检测器中进行检测,过滤掉没有字符的区域,得到最终的文字区域。其技术方案包括如下步骤:
1)输入原始图像I,并对其进行灰度变换得到灰度图像IG
2)对灰度图像IG,利用最大稳定极值区域算子MSER提取字符候选区域,得到字符候选区域图像Im
3)根据字符区域的基本几何特性过滤掉Im中一些不含有字符的候选区域,得到初步过滤后的字符候选区域图像I1
3a)计算Im每一个字符候选区域的外接矩形边界框;
3b)计算每个外接矩形边界框的长宽比,将长宽比大于10的字符候选区域去除;
3c)计算剩余字符候选区域的欧拉数,将欧拉数小于-4的字符候选区域去除;
3d)计算与剩余字符候选区域具有相同标准二阶中心矩的椭圆离心率,将离心率大于0.995的候选区域去除;
3e)计算剩余字符候选区域的固靠性程度值,将该值小于0.3的候选区域去除,得到初步过滤后的字符候选区域图像I1
4)根据字符笔画宽度特性进一步过滤掉I1中一些不含有字符的候选区域,得到最终的过滤后字符区域候选图像I2
4a)分别计算出I1中每个字符候选区域的笔画宽度均值和笔画宽度标准偏差;
4b)计算出笔画宽度均值与标准偏差的比值,将比值大于0.5的字符候选区域去掉,得到再次过滤后字符候选区域图像I2
5)将I2中剩余的字符候选区域合并为文本行区域;
5a)将I2中剩余的字符候选区域用边界框标定;
5b)分别计算每一对相邻的边界框的重叠区域面积值Sr和这两个重叠区域的总面积值Sa,获得这两个面积的比值;
5c)依次将比值为非零的字符候选区域进行连接,合并成文本行区域;
6)将文本行区域依次输入到卷积神经网络CNN文字检测器中,去除掉不含有文字的文本行区域,得到最终含有文字的文本行区域。
本发明由于对输入的自然场景图像进行灰度变换后,利用最大极值稳定区域算子MSER提取字符候选区域,并通过所述的三个步骤过滤掉不含有文字的候选区域,从而准确的检测出自然场景图像中的文字。与现有的技术相比,在保证检测速度的同时,极大的提高了文字检测的准确率。
附图说明
图1是本发明的实现流程图;
图2是用本发明对谷歌街景图像库中的自然场景图像进行文字检测的结果图;
图3是用本发明对谷歌街景图像库中的字体倾斜的图像进行文字检测的结果图;
图4是用本发明对ICDAR 2011图像库中的含有商店标题的图像进行文字检测的结果图;
图5是用本发明对ICDAR 2011图像库中的有遮挡的图像进行文字检测的结果图。
具体实施方式
参照图1,本发明基于连通域的自然场景图像文字检测的方法,包括如下步骤:
步骤1:获取灰度图像IG
输入原始图像I,对原始图像进行灰度变换,得到该图像的灰度图像IG
步骤2:获取字符候选区域图像Im
利用连通区域检测算子MSER对灰度图像IG进行区域检测,得到包含有文字和非文的连通区域,将这些连通区域作为字符候选区域,并将这些字符候选区域在图像IG上以彩色形式显示出来,得到字符候选区域图像Im
步骤3:过滤掉字符候选区域图像Im中一些不含有文字的候选区域,得到初步过滤后的字符候选区域图像I1
3a)依次计算字符候选区域图像Im中每个字符候选区域的最上边的像素点坐标(xu,yu)、最下边的像素点坐标(xd,yd)、最右边的像素点坐标(xr,yr)、最左边的像素点坐标(xl,yl),其中xu、xd、xr、xl分别代表最上边、最下边、最右边、最左边的像素点横坐标,yu、yd、yr、yl分别代表最上边、最下边、最右边、最左边的像素点纵坐标;
3b)根据如下公式计算出每个候选区域的中心坐标(xc,yc):
xc=(xr+xl)/2
yc=(yu+yd)/2
其中xc代表区域中心的横坐标,yc代表区域中心的纵坐标;
3c)计算每个字符候选区域对应的外接矩形的宽w和长l:
w=xr-xl,l=yu-yd
3d)依次以点(xc,yc)为中心绘制宽为w,长为l的矩形边界框;
3e)计算w和l的比值,将比值大于10的字符候选区域去除;
3f)依次统计剩余的每个字符候选区域的连接体数C和孔洞数H;
3g)计算候选区域欧拉数的值E:E=C-H;
3h)将E小于-4的字符候选区域去除;
3I)计算与剩余字符候选区域具有相同标准二阶中心矩的椭圆离心率e,即通过调用Matlab中的regionprops函数求解得到椭圆离心率e:
e=regionprops(L,'eccentricity')
其中,e代表离心率的值,L代表待检测的字符候选区域,eccentricity代表离心率参数;
3J)将e大于0.995的字符候选区域去除;
3k)计算剩余字符候选区域的固靠性程度值s,即通过调用Matlab中的regionprops函数求解得到固靠性程度值s:
s=regionprops(L,'solidity')
其中,s代表固靠性程度值,L代表待检测的字符候选区域,solidity代表固靠性程度值参数。
3l)将s小于0.3的候选区域去除,得到初步过滤后的字符候选区域图像I1
步骤4:对初步过滤后的字符候选区域图像I1中的不含有文字的候选区域进一步过滤,得到最终过滤后的字符区域候选图像I2
4a)通过调用Matlab中的距离变换bwdist函数求得初步过滤后的字符候选区域图像I1中的每个字符候选区域的笔画宽度矩阵S:
S=bwdist(L)
其中L代表待检测的字符候选区域;
4b)通过调用Matlab中的mean函数求得S对应的笔画宽度均值Y:
Y=mean(S)
4c)通过调用Matlab中的std函数求得S对应的笔画宽度方差δ:δ=std(S);
4d)计算Y与δ的比值,将比值大于0.5的字符候选区域去掉,得到最终过滤后字符候选区域图像I2
步骤5:将剩余的字符候选区域合并为文本行区域。
5a)将I2中剩余的字符候选区域用边界框标定;
5b)分别计算每一对相邻的边界框的重叠区域面积值Sr和这两个重叠区域的总面积值Sa,获得这两个面积的比值;
5c)依次将比值为非零的字符候选区域进行连接,合并成文本行区域。
步骤6:将文本行区域依次输入到卷积神经网络CNN文字检测器中,过滤掉不含有文字的文本行区域,得到最终含有文字的文本行区域。
本发明的效果可通过以下仿真实验进一步说明:
1、仿真实验条件
本发明的仿真在windows 7,CPU Intel(R)core(TM)i5-2400,基本频率3.20GHz,软件平台为Matlab 2015b运行。
仿真实验数据来自谷歌街景图像库和ICDAR 2011图像库。
2、仿真内容与结果
仿真一,用本发明对谷歌街景图像库中的自然场景图像进行文字检测,结果如图2。
从图2可以看出,本发明能够准确的检测出自然场景图像中的文字。
仿真二,用本发明对谷歌街景图像库中的字体倾斜的图像进行文字检测,结果如图3。
从图3可以看出,在拍摄角度倾斜的情况下,本发明能够准确的检测出字体倾斜的图像中的文字。
仿真三,用本发明对ICDAR 2011图像库中的含有商店标题的图像进行文字检测,结果如图4。
从图4可以看出,本发明能够准确的检测出含有商店标题的图像中的文字。
仿真四,用本发明对ICDAR 2011图像库中的有遮挡的图像进行文字检测,结果如图5。
从图5可以看出,在有遮挡的情况下,本发明能够准确的检测出有遮挡的图像中的文字。

Claims (6)

1.一种基于连通域的自然场景文本检测方法,包括:
1)输入原始图像I,并对其进行灰度变换得到灰度图像IG
2)对灰度图像IG,利用最大稳定极值区域算子MSER提取字符候选区域,得到字符候选区域图像Im
3)根据字符区域的基本几何特性过滤掉Im中一些不含有字符的候选区域,得到初步过滤后的字符候选区域图像I1
3a)计算Im每一个字符候选区域的外接矩形边界框;
3b)计算每个外接矩形边界框的长宽比,将长宽比大于10的字符候选区域去除;
3c)计算剩余字符候选区域的欧拉数,将欧拉数小于-4的字符候选区域去除;
3d)计算与剩余字符候选区域具有相同标准二阶中心矩的椭圆离心率,将离心率大于0.995的候选区域去除;
3e)计算剩余字符候选区域的固靠性程度值,将该值小于0.3的候选区域去除,得到初步过滤后的字符候选区域图像I1
4)根据字符笔画宽度特性进一步过滤掉I1中一些不含有字符的候选区域,得到最终的过滤后字符区域候选图像I2
4a)分别计算出I1中每个字符候选区域的笔画宽度均值和笔画宽度标准偏差;
4b)计算出笔画宽度均值与标准偏差的比值,将比值大于0.5的字符候选区域去掉,得到再次过滤后字符候选区域图像I2
5)将I2中剩余的字符候选区域合并为文本行区域;
5a)将I2中剩余的字符候选区域用边界框标定;
5b)分别计算每一对相邻的边界框的重叠区域面积值Sr和这两个重叠区域的总面积值Sa,获得这两个面积的比值;
5c)依次将比值为非零的字符候选区域进行连接,合并成文本行区域;
6)将文本行区域依次输入到卷积神经网络CNN文字检测器中,去除掉不含有文字的文本行区域,得到最终含有文字的文本行区域。
2.根据权利要求1所述的方法,其中步骤3a)中计算Im每一个字符候选区域的外接矩形边界框,按如下步骤进行:
3a1)依次计算每个字符候选区域的最上边的像素点坐标(xu,yu)、最下边的像素点坐标(xd,yd)、最右边的像素点坐标(xr,yr)、最左边的像素点坐标(xl,yl),其中xu、xd、xr、xl分别代表最上边、最下边、最右边、最左边的像素点横坐标,yu、yd、yr、yl分别代表最上边、最下边、最右边、最左边的像素点纵坐标;
3a2)根据如下公式计算出每个候选区域的中心坐标(xc,yc):
xc=(xr+xl)/2
yc=(yu+yd)/2
其中xc代表区域中心的横坐标,yc代表区域中心的纵坐标;
3a3)计算每个字符候选区域对应的外接矩形的宽w和长l:
w=xr-xl,l=yu-yd
3a4)依次以点(xc,yc)为中心绘制宽为w,长为l的矩形边界框。
3.根据权利要求1所述的方法,其中步骤3c)中计算剩余字符候选区域的欧拉数,按如下步骤进行:
3c1)依次统计出每个字符候选区域的连接体数C和孔洞数H;
3c2)连接体数C和孔洞数H,计算候选区域欧拉数的值E:E=C-H。
4.根据权利要求1所述的方法,其中步骤3d)中计算与剩余字符候选区域具有相同标准二阶中心矩的椭圆离心率,通过调用Matlab中的regionprops函数求解得到,该函数形式如下:
e=regionprops(L,'eccentricity')
其中,e代表离心率的值,L代表待检测的字符候选区域,eccentricity代表离心率参数。
5.根据权利要求1所述的方法,其中步骤3e)中计算剩余字符候选区域的固靠性程度值,通过调用Matlab中的regionprops函数求解得到,该函数形式如下:
s=regionprops(L,'solidity')
其中,s代表固靠性程度值,L代表待检测的字符候选区域,solidity代表固靠性程度值参数。
6.根据权利要求1所述的方法,其中步骤4a)中分别计算出I1中每个字符候选区域的笔画宽度均值和笔画宽度标准偏差,按如下步骤进行:
4a1)通过调用Matlab中的距离变换bwdist函数求得每个候选文字区域的笔画宽度矩阵S:
S=bwdist(L)
其中L代表待检测的字符候选区域;
4a2)通过调用Matlab中的mean函数求得S对应的笔画宽度均值Y:
Y=mean(S)
4a3)通过调用Matlab中的std函数求得S对应的笔画宽度方差δ:δ=std(S)。
CN201611157997.7A 2016-12-15 2016-12-15 基于连通域的自然场景文字检测方法 Pending CN106845475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611157997.7A CN106845475A (zh) 2016-12-15 2016-12-15 基于连通域的自然场景文字检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611157997.7A CN106845475A (zh) 2016-12-15 2016-12-15 基于连通域的自然场景文字检测方法

Publications (1)

Publication Number Publication Date
CN106845475A true CN106845475A (zh) 2017-06-13

Family

ID=59140929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611157997.7A Pending CN106845475A (zh) 2016-12-15 2016-12-15 基于连通域的自然场景文字检测方法

Country Status (1)

Country Link
CN (1) CN106845475A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644391A (zh) * 2017-09-18 2018-01-30 北京邮电大学 一种用于打印文档溯源的数字水印处理方法及装置
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN108304835A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 文字检测方法和装置
CN108564084A (zh) * 2018-05-08 2018-09-21 北京市商汤科技开发有限公司 文字检测方法、装置、终端及存储介质
CN108898138A (zh) * 2018-05-30 2018-11-27 西安理工大学 基于深度学习的场景文本识别方法
WO2019095092A1 (en) * 2017-11-14 2019-05-23 Symbol Technologies, Llc Methods and apparatus for detecting and recognizing graphical character representations in image data using symmetrically-located blank areas
CN109800758A (zh) * 2019-01-11 2019-05-24 北京信息科技大学 一种极大值区域检测的自然场景文字检测方法
CN109876416A (zh) * 2019-03-26 2019-06-14 浙江大学 一种基于图像信息的跳绳计数方法
CN110345954A (zh) * 2018-04-03 2019-10-18 奥迪股份公司 导航系统和方法
CN110443252A (zh) * 2019-08-16 2019-11-12 广东工业大学 一种文字检测方法、装置及设备
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN111611933A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 文档图像的信息提取方法及系统
CN112766266A (zh) * 2021-01-29 2021-05-07 云从科技集团股份有限公司 基于分阶段概率统计的文本方向矫正方法、系统及装置
CN115937843A (zh) * 2023-01-09 2023-04-07 苏州浪潮智能科技有限公司 图像的文本检测方法、装置、存储介质和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542268A (zh) * 2011-12-29 2012-07-04 中国科学院自动化研究所 用于视频中文本区域检测与定位的方法
CN104050471A (zh) * 2014-05-27 2014-09-17 华中科技大学 一种自然场景文字检测方法及系统
CN104408449A (zh) * 2014-10-27 2015-03-11 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542268A (zh) * 2011-12-29 2012-07-04 中国科学院自动化研究所 用于视频中文本区域检测与定位的方法
CN104050471A (zh) * 2014-05-27 2014-09-17 华中科技大学 一种自然场景文字检测方法及系统
CN104408449A (zh) * 2014-10-27 2015-03-11 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
CN104700092A (zh) * 2015-03-26 2015-06-10 南京理工大学 一种基于模板和特征匹配相结合的小字符数字识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUIZHONG CHEN等: "ROBUST TEXT DETECTION IN NATURAL IMAGES WITH EDGE-ENHANCED MAXIMALLY STABLE EXTREMAL REGIONS", 《2011 18TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
孙雷: "自然场景图像中的文字检测", 《中国博士学位论文全文数据库 信息科技辑》 *
尹占辉: "场景图像文本区域定位方法研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN107644391A (zh) * 2017-09-18 2018-01-30 北京邮电大学 一种用于打印文档溯源的数字水印处理方法及装置
CN107644391B (zh) * 2017-09-18 2019-11-26 北京邮电大学 一种用于打印文档溯源的数字水印处理方法及装置
WO2019095092A1 (en) * 2017-11-14 2019-05-23 Symbol Technologies, Llc Methods and apparatus for detecting and recognizing graphical character representations in image data using symmetrically-located blank areas
US11074472B2 (en) 2017-11-14 2021-07-27 Symbol Technologies, Llc Methods and apparatus for detecting and recognizing graphical character representations in image data using symmetrically-located blank areas
CN108304835A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 文字检测方法和装置
US10762376B2 (en) 2018-01-30 2020-09-01 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for detecting text
CN110345954A (zh) * 2018-04-03 2019-10-18 奥迪股份公司 导航系统和方法
CN108564084A (zh) * 2018-05-08 2018-09-21 北京市商汤科技开发有限公司 文字检测方法、装置、终端及存储介质
CN108898138A (zh) * 2018-05-30 2018-11-27 西安理工大学 基于深度学习的场景文本识别方法
CN110569835A (zh) * 2018-06-06 2019-12-13 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN110569835B (zh) * 2018-06-06 2024-03-05 北京搜狗科技发展有限公司 一种图像识别方法、装置和电子设备
CN109800758A (zh) * 2019-01-11 2019-05-24 北京信息科技大学 一种极大值区域检测的自然场景文字检测方法
CN109876416A (zh) * 2019-03-26 2019-06-14 浙江大学 一种基于图像信息的跳绳计数方法
CN110443252A (zh) * 2019-08-16 2019-11-12 广东工业大学 一种文字检测方法、装置及设备
CN111611933A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 文档图像的信息提取方法及系统
CN111611933B (zh) * 2020-05-22 2023-07-14 中国科学院自动化研究所 文档图像的信息提取方法及系统
CN112766266A (zh) * 2021-01-29 2021-05-07 云从科技集团股份有限公司 基于分阶段概率统计的文本方向矫正方法、系统及装置
CN115937843A (zh) * 2023-01-09 2023-04-07 苏州浪潮智能科技有限公司 图像的文本检测方法、装置、存储介质和电子设备
CN115937843B (zh) * 2023-01-09 2023-05-26 苏州浪潮智能科技有限公司 图像的文本检测方法、装置、存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN106845475A (zh) 基于连通域的自然场景文字检测方法
CN104182750B (zh) 一种在自然场景图像中基于极值连通域的中文检测方法
CN106097444B (zh) 高精地图生成方法和装置
CN106156768B (zh) 基于视觉的机动车行驶证检测方法
CN104050471B (zh) 一种自然场景文字检测方法及系统
CN104077577A (zh) 一种基于卷积神经网络的商标检测方法
WO2018145470A1 (zh) 一种图像检测方法和装置
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
CN105205488B (zh) 基于Harris角点和笔画宽度的文字区域检测方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN106446952A (zh) 一种乐谱图像识别方法及装置
CN112907598B (zh) 一种基于注意力cnn文档证件类图像篡改检测方法
CN105608454A (zh) 基于文字结构部件检测神经网络的文字检测方法及系统
CN110032932B (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN106951928A (zh) 一种甲状腺乳头状癌的超声图像识别方法及装置
CN108765349A (zh) 一种带有水印的图像修复方法及系统
CN107832762A (zh) 一种基于多特征融合的车牌定位与识别方法
CN104156941A (zh) 一种确定图像上几何轮廓区域的方法及系统
CN103198479A (zh) 基于语义信息分类的sar图像分割方法
CN106682665A (zh) 一种基于计算机视觉的七段式数显仪表数字识别方法
CN106447673A (zh) 一种非均匀光照条件下的芯片引脚提取方法
CN110866900A (zh) 水体颜色识别方法及装置
CN111680690A (zh) 一种文字识别方法及装置
CN104331708B (zh) 一种人行横道线自动检测分析方法及系统
CN107368826A (zh) 用于文本检测的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170613

WD01 Invention patent application deemed withdrawn after publication