CN103020618A - 视频图像文字的检测方法及系统 - Google Patents

视频图像文字的检测方法及系统 Download PDF

Info

Publication number
CN103020618A
CN103020618A CN2011104280915A CN201110428091A CN103020618A CN 103020618 A CN103020618 A CN 103020618A CN 2011104280915 A CN2011104280915 A CN 2011104280915A CN 201110428091 A CN201110428091 A CN 201110428091A CN 103020618 A CN103020618 A CN 103020618A
Authority
CN
China
Prior art keywords
video image
character
zone
literal
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104280915A
Other languages
English (en)
Other versions
CN103020618B (zh
Inventor
苏鹏宇
徐洪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jetsen Technology Co., Ltd.
Original Assignee
BEIJING JETSEN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING JETSEN TECHNOLOGY Co Ltd filed Critical BEIJING JETSEN TECHNOLOGY Co Ltd
Priority to CN201110428091.5A priority Critical patent/CN103020618B/zh
Publication of CN103020618A publication Critical patent/CN103020618A/zh
Application granted granted Critical
Publication of CN103020618B publication Critical patent/CN103020618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频图像文字的检测方法及系统,涉及图像文字检测技术领域,所述方法包括步骤:视频图像文字区域粗定位和视频图像文字区域定位验证,具体步骤为:步骤A,视频图像文字区域粗定位:计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;步骤B:视频图像文字区域定位验证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否有文字,剔除未检测文字的候选文字区域。本发明能够提高视频图像文字检测的准确性和查全率。

Description

视频图像文字的检测方法及系统
技术领域
本发明涉及图像文字检测技术领域,尤其涉及一种视频图像文字的检测方法及系统。
背景技术
随着数字化网络化的发展,数字图像和视频越来愈多,图片或视频中文字能够提供直接的高层语义信息,因此开发视频图像文字检测技术,有助于理解和管理视频图像等。比如检测和分析图片中文字内容,有助于为不良内容图片过滤和监控提供有效的特征,新闻视频中的标题通常标示新闻的时间地点人物,对于新闻内容分析和检索提供支撑,体育比赛视频中,比赛出现的比分,运动员号码对于自动视频内容分析,精彩体育瞬间检测具有重要作用。在自然场景中图像文字同样包含重要信息,如交通指示牌内容分析,可以帮助外国游客理解中国交通规则,帮助盲人在街道无障碍行走(文字转为语音)。因此图片中的文字检索一直以来都是一个非常有意义的工作,同时也是一具有挑战性的工作。
对于文字的检测方法的研究,学者们也提出了不少各种各样的方法,主要即针对本检测对象文字的某些特征进行提取,大致分为三类方法:基于边缘特征的方法,基于连通成分颜色特征的方法,和基于纹理特征的文字检索。
直接的观察,文字区域一般具有较强的边缘特征,卡内基梅隆大学smith等人在“video skimming for quike browsing based on audio andimage characterization”一文中将视频中文字区域定义为水平的包含大量边缘的矩形结构,通过这种边缘特征检测文字,这种方法比较直观,对于检测和背景具有较大对比度的文字行具有较好的检测效果。T.sato等人在“video ocr for digital news archives”一文中采用和smith类似的边缘特征和结构限制方法检测视频中的标题文字。浙江大学的张引,潘云鹤等人在“复杂背景下文本提取的彩色边缘检测算子设计”一文中提出了一种十分有效的边缘检测算子用于检测视频文本,其边缘检测在彩色图像上进行,使用全局直方图分析的方法确定边缘检测阈值。基于边缘的方法通常利用边缘算子检测图像边缘,然后通过一些经验或者启发式的规则给出文字候选区域。这种方法保证较高查全率同时也会有较多的误检。
基于颜色连通的方法,考虑到图像中文字区域的连通和颜色一直性,一般利用图像分割或者颜色聚类的方法将颜色相同的文字从背景中分割出来,再通过启发式规则过滤文字区域。学者Jain和Yu提出的方法“automatic text location in images and video frames”一文基于颜色连接成份分析是一种经典的文字检测算法,在其算法中,利用聚类算法将图像首先分解许多值,颜色相同的成分经过空间连接分析形成区域,然后定义一些判定文字非文字的准则。这种方法对于同行文字出现不同颜色时,效果并不好。
基于纹理的方法,现在研究也比较多,有学者使用小波系数的均值,二阶和三阶中心矩作为纹理特征,在神经网络的框架内进行文字块的检测,对于检测到的图像块,小的和孤立的块被删除,大并且密集的文字块被连接成文字区域。中科院自动化所Yan等人的方法“automatic text detection in video frames based on bootstrap artificialneural network and CED”基于小波系数提取纹理特征,然后使用Bootstrap神经网络分类文字非文字。这类方法在背景复杂时,直接使用纹理特征往往不能得出较好的分类效果。
由于视频中图像的文字大小不一,视频文字行长短不一、字体颜色多种多样,文字图像对比度低等原因,传统的方法存在文字检测的准确性和查全率低等缺陷。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:提供一种视频图像文字的检测方法及系统,其能够提高视频图像文字检测的准确性和查全率。
(二)技术方案
为解决上述问题,本发明提供了一种视频图像文字的检测方法,包括步骤:视频图像文字区域粗定位和视频图像文字区域定位验证,具体步骤为:
步骤A,视频图像文字区域粗定位:计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
步骤B,视频图像文字区域定位验证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否有文字,剔除未检测文字的候选文字区域。
优选地,所述计算视频图像的高斯金字塔多尺度图像,具体步骤包括:计算Iσ(x,y)在x和y方向的梯度Ix和Iy,计算图像两个方向梯度的乘积,使用高斯函数φ对
Figure BDA0000122159030000031
Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R=det(M)-α(trace(M)),α∈(0.04,0.06),并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,局部极大值点即为图像的角点,其中,
M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ .
优选地,采用阈值分割方法分割出图像文字区域,具体步骤包括:根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
优选地,所述连通域分析,具体包括:采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,从而获得文字区域的位置。
优选地,所述文字行分割,具体包括:先对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
一种利用前述方法进行视频图像文字检测的系统,包括:粗定位单元和定位验证单元,
所述粗定位单元包括:
分割模块,用于计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域;
合并模块,用于利用数学形态学中膨胀、腐蚀技术合并文字区域;
定位模块,用于通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
所述定位验证单元包括:
训练模块,用于采用harr特征训练adaboost分类器;
判断剔除模块,用于利用adaboost分类器检测候选文字区域内是否有文字,并剔除未检测文字的候选文字区域。
优选地,所述分割模块包括多尺度图像计算模块,用于通过计算Iσ(x,y)在x和y方向的梯度Ix和Iy,及图像两个方向梯度的乘积Ixy,使用高斯函数φ对
Figure BDA0000122159030000041
Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R,并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,得到局部极大值点即为图像的角点,其中,
M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ .
优选地,所述分割模块还包括阈值分割模块,用于根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
优选地,所述定位模块包括连通域分析模块,用于采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,以获得文字区域的位置。
优选地,所述定位模块包括文字行分割模块,用于对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,并根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
(三)有益效果
本发明采用两级文本行提取办法,第一级主要进行文本行的粗提取,这一级利用文本字体区域角点密度比较大的特征提取文本字体,可保证文本的查全率,尽量保证能够查找到较多的文本字。在第二级阶段,采用基于adaboost分类器的方法,验证文字和非文字区域,可保证文字行检测的正确率。因而,本发明能够提高视频图像文字检测的准确性和查全率。
附图说明
图1为本发明实施方式中所述视频图像文字的检测方法的流程图;
图2为本发明实施方式中所述进行视频图像文字检测的系统的结构图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明提供了一种视频图像文字的检测方法,包括步骤:视频图像文字区域粗定位和视频图像文字区域定位验证,具体步骤为:
步骤A,视频图像文字区域粗定位:计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
本步骤中,所述计算视频图像的高斯金字塔多尺度图像,具体步骤包括:计算Iσ(x,y)在x和y方向的梯度Ix和Iy,计算图像两个方向梯度的乘积,使用高斯函数
Figure BDA0000122159030000061
其中,X=(x,y)T∈R2
Figure BDA0000122159030000062
Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R,并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,局部极大值点即为图像的角点,其中, M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ . 此步骤中可先对视频图像进行预处理获取增强图片。
采用阈值分割方法分割出图像文字区域,具体步骤包括:根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
定义如下:
Figure BDA0000122159030000064
density ( i , j ) = Σ m = - 2 2 Σ n = - 10 10 corner ( i + m , j + n )
由于在进行角点计算时,角点为单个孤立的像素点,为了增加鲁棒性,在计算corner时,选择角点所在的3x3区域,其中,corner为角点分布图,density为角点密度图,m,n为角点领域窗口长宽,汉字一般书写以行为方向,因此我们也特意考虑在计算角点区域密度时,区域的选择m(行方向)较小而n(列方向)较大。
然后,根据角点密度图对图像进行分割,得到二值图像,定义如下:
bw σ ( i , j ) = 1 density ( i , j ) > T 0 else T ∈ [ 1,5 ]
由汉字的书写特点,在当前像素点的10x10领域内当角点的密度大于某一给定值T时,认为是文字区域,T一般选择2。
分别计算每个尺度下角点密度bwσ图像,将其按照尺度对应到和原始图像大小相同的图像BW,对应关系如下
BW ( i , j ) = ∪ σ bw σ ( i , j ) .
所述连通域分析,具体包括:采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,从而获得文字区域的位置。
假设连通区域是由一系列点集组成,表示为:
Graph={(x,y)|(x1,y1),(x2,y2)…(xn,yn)}
那么连通图起始位置(xs,ys)和终止位置分别为(xe,ye):
xs=min({xi|i=1,2,3,…n})
ys=min({yi|i=1,2,3,…n})
(xs,ys)∈Graph
xe=max({xi|i=1,2,3,…n})
ye=max({yi|i=1,2,3,…n})
(xe,ye)∈Graph
长和宽分别为:
width=xe-xs
height=ye-ys
所述文字行分割,具体包括:先对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
所述的剔除规则分析:考虑到视频中文字的一些,通常规则,采用如下的方法去除一些非文字区域:
1、图像中的文字区域一般出现在距离图像边界20个像素以内的范围;
2、图像中的文字除非特别需求,一般文字的高会大于5个像素,而且太小的文字对于ocr识别来说也是难点;
3、其他一些引用场景比如新闻等,一般文字会出现在屏幕下方1/3处。通过这些规则来剔除一些非满足要求的文字区域。
步骤B,视频图像文字区域定位验证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否有文字,剔除未检测文字的候选文字区域。
所述采用harr特征训练adaboost分类器,具体包括:给定弱学习算法以及训练样本集,在训练集的不同子集上多次调用弱学习算法训练出不同的弱分类器,并按照加权投票的方式,融合多个弱分类器得到学习结果。
1、Harr特征的选择
Harr特征能够很好的反映出图像局部灰度的变化,而且根据“Robust Real-time Object Detection”一文中所述的方法利用积分图像快速计算harr特征。常用的harr特征有以下几种,边缘、线性和中心特征。
考虑到汉字在文本行中的分布,如汉字一般在文字候选图像中行出现,且汉字本身的结构特点,可另添加两个特征命名形状特征。
2、正负样本挑选
通过手工挑选裁剪文字,包含数字、中文,以及一些文字行,并将图像缩放赴澳20*20大小,负样本为挑选的一些非文字图像。
3、adaboost算法
给定训练样本集{(x1 y1)}{(x2 y2)}…{(xn yn)},其中yi=1,0分别对应正样本和负样本.初始化样本权重(设wi,t)为第t轮第i个样本的误差权重),当yi=1时,wi,t=1/(2ρ).当yi=0时,wi,t=1/(2β),其中,ρ,β分别为正负样本数目。t=1,2,...,T(经过T轮迭代)
a、权重归一化: w i , t = w i , t / Σ j w j , t ,
b、针对每一个特征k,训练一个弱分类器hk,也即确定弱分类器阈值θk和偏置pk,使得当前特征分类器k的分类误差 ϵ k = Σ i w i , t ( | h k ( x i - y i ) | ) 达到最小。
c、从2)所计算的一类特征k中选择一个分类误差最小的特征ht
d、更新每个样本对应的权重。
Figure BDA0000122159030000092
其中ei的计算方法为当第i个样本被正确分类,则ei=0,否则ei=1,κt=εt/(1-εt)。
迭代T次后形成最后的强分类器
Figure BDA0000122159030000093
如图2所示,一种利用前述方法进行视频图像文字检测的系统,包括:粗定位单元1和定位验证单元2,
所述粗定位单元1包括:
分割模块3,用于计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域;
合并模块4,用于利用数学形态学中膨胀、腐蚀技术合并文字区域;
定位模块5,用于通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
所述定位验证单元2包括:
训练模块6,用于采用harr特征训练adaboost分类器;
判断剔除模块7,用于利用adaboost分类器检测候选文字区域内是否有文字,并剔除未检测文字的候选文字区域。
所述分割模块3包括多尺度图像计算模块8,用于通过计算Iσ(x,y)在x和y方向的梯度Ix和Iy,及图像两个方向梯度的乘积Ixy,使用高斯函数φ对Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R,并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,得到局部极大值点即为图像的角点,其中,
M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ .
所述分割模块3还包括阈值分割模块9,用于根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
所述定位模块5包括连通域分析模块10,用于采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,以获得文字区域的位置。
所述定位模块5包括文字行分割模块11,用于对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,并根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (10)

1.一种视频图像文字的检测方法,其特征在于,包括步骤:视频图像文字区域粗定位和视频图像文字区域定位验证,具体步骤为:
步骤A,视频图像文字区域粗定位:计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
步骤B,视频图像文字区域定位验证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否有文字,剔除未检测文字的候选文字区域。
2.如权利要求1所述的视频图像文字的检测方法,其特征在于,所述计算视频图像的高斯金字塔多尺度图像,具体步骤包括:计算Iσ(x,y)在x和y方向的梯度Ix和Iy,计算图像两个方向梯度的乘积,使用高斯函数φ对
Figure FDA0000122159020000011
Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R,并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,局部极大值点即为图像的角点,其中,
M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ .
3.如权利要求1所述的视频图像文字的检测方法,其特征在于,采用阈值分割方法分割出图像文字区域,具体步骤包括:根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
4.如权利要求1所述的视频图像文字的检测方法,其特征在于,所述连通域分析,具体包括:采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,从而获得文字区域的位置。
5.如权利要求1所述的视频图像文字的检测方法,其特征在于,所述文字行分割,具体包括:先对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
6.一种利用权利要求1-5中任一项所述方法进行视频图像文字检测的系统,其特征在于,包括:粗定位单元(1)和定位验证单元(2),
所述粗定位单元(1)包括:
分割模块(3),用于计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分割出图像文字区域;
合并模块(4),用于利用数学形态学中膨胀、腐蚀技术合并文字区域;
定位模块(5),用于通过连通域分析、文字行分割和剔除规则分析定位候选文字区域;
所述定位验证单元(2)包括:
训练模块(6),用于采用harr特征训练adaboost分类器;
判断剔除模块(7),用于利用adaboost分类器检测候选文字区域内是否有文字,并剔除未检测文字的候选文字区域。
7.如权利要求6所述的进行视频图像文字检测的系统,其特征在于,所述分割模块(3)包括多尺度图像计算模块(8),用于通过计算Iσ(x,y)在x和y方向的梯度Ix和Iy,及图像两个方向梯度的乘积Ixy,使用高斯函数φ对
Figure FDA0000122159020000021
Ixy进行高斯加权,生成矩阵M,计算每个像素对应的harris值R,并对小于预定阈值的R置为0,在5x5的领域内进行非极大值抑制,得到局部极大值点即为图像的角点,其中,
M = I x 2 ⊗ φ I x , y ⊗ φ I x , y ⊗ φ I y 2 ⊗ φ .
8.如权利要求6所述的进行视频图像文字检测的系统,其特征在于,所述分割模块(3)还包括阈值分割模块(9),用于根据角点分布,对具有角点特征的领域进行密度估计,分割出角点密度图大于预定值的区域作为图像文字区域。
9.如权利要求6所述的进行视频图像文字检测的系统,其特征在于,所述定位模块(5)包括连通域分析模块(10),用于采用种子填充的方法获得8连通图像,并计算连通图像的长和宽以及起始位置,以获得文字区域的位置。
10.如权利要求6所述的进行视频图像文字检测的系统,其特征在于,所述定位模块(5)包括文字行分割模块(11),用于对候选文字矩形框区域进行二值化处理,将文字行区域水平投影,并根据文字行与文字行之间在水平投影方向产生的波峰和波谷进行文字行切割。
CN201110428091.5A 2011-12-19 2011-12-19 视频图像文字的检测方法及系统 Active CN103020618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110428091.5A CN103020618B (zh) 2011-12-19 2011-12-19 视频图像文字的检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110428091.5A CN103020618B (zh) 2011-12-19 2011-12-19 视频图像文字的检测方法及系统

Publications (2)

Publication Number Publication Date
CN103020618A true CN103020618A (zh) 2013-04-03
CN103020618B CN103020618B (zh) 2016-03-16

Family

ID=47969209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110428091.5A Active CN103020618B (zh) 2011-12-19 2011-12-19 视频图像文字的检测方法及系统

Country Status (1)

Country Link
CN (1) CN103020618B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268481A (zh) * 2013-05-29 2013-08-28 焦点科技股份有限公司 一种复杂背景图像中的文本提取方法
CN104751412A (zh) * 2015-04-23 2015-07-01 重庆信科设计有限公司 一种基于仿射不变特征的图像拼接方法
CN105205488A (zh) * 2015-07-13 2015-12-30 西北工业大学 基于Harris角点和笔画宽度的文字区域检测方法
CN106156691A (zh) * 2015-03-25 2016-11-23 中测高科(北京)测绘工程技术有限责任公司 复杂背景图像的处理方法及其装置
CN106355172A (zh) * 2016-08-11 2017-01-25 无锡天脉聚源传媒科技有限公司 一种字符识别方法及装置
CN106599937A (zh) * 2016-12-29 2017-04-26 池州职业技术学院 一种不良图片过滤装置
CN107302718A (zh) * 2017-08-17 2017-10-27 河南科技大学 一种基于角点检测的视频字幕区域定位方法
CN107920272A (zh) * 2017-11-14 2018-04-17 维沃移动通信有限公司 一种弹幕筛选方法、装置及移动终端
CN108319958A (zh) * 2018-03-16 2018-07-24 福州大学 一种基于特征融合匹配的行驶证检测和识别方法
CN109255356A (zh) * 2018-07-24 2019-01-22 阿里巴巴集团控股有限公司 一种文字识别方法、装置及计算机可读存储介质
CN109583443A (zh) * 2018-11-15 2019-04-05 四川长虹电器股份有限公司 一种基于文字识别的视频内容判断方法
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109785353A (zh) * 2019-01-15 2019-05-21 佛山市顺德区中山大学研究院 一种二维码的二次遍历二值化方法、装置和存储介质
CN110532537A (zh) * 2019-08-19 2019-12-03 温州大学 一种基于二分阈值法和投影法多阶段切割文字的方法
CN111914843A (zh) * 2020-08-20 2020-11-10 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 文字检测方法、系统、设备及存储介质
CN112487943A (zh) * 2020-11-25 2021-03-12 北京有竹居网络技术有限公司 关键帧去重的方法、装置和电子设备
CN113095327A (zh) * 2021-03-16 2021-07-09 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PAUL VIOLA等: "Robust Real-time Object Detection", 《SECOND INTERNATIONAL WORKSHOP ON STATISTICAL AND COMPUTATIONAL THEORIES OF VISION – MODELING, LEARNING, COMPUTING, AND SAMPLING》, 13 July 2001 (2001-07-13) *
廖佳: "网络图片中文本区域的定位技术研究", 《万方学位论文数据库》, 3 August 2011 (2011-08-03) *
陈森: "自然场景图像中的文本定位方法及应用研究", 《中国优秀硕士学位论文全文数据库》, no. 12, 15 December 2011 (2011-12-15) *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268481B (zh) * 2013-05-29 2016-06-29 焦点科技股份有限公司 一种复杂背景图像中的文本提取方法
CN103268481A (zh) * 2013-05-29 2013-08-28 焦点科技股份有限公司 一种复杂背景图像中的文本提取方法
CN106156691A (zh) * 2015-03-25 2016-11-23 中测高科(北京)测绘工程技术有限责任公司 复杂背景图像的处理方法及其装置
CN104751412A (zh) * 2015-04-23 2015-07-01 重庆信科设计有限公司 一种基于仿射不变特征的图像拼接方法
CN104751412B (zh) * 2015-04-23 2018-01-30 重庆信科设计有限公司 一种基于仿射不变特征的图像拼接方法
CN105205488A (zh) * 2015-07-13 2015-12-30 西北工业大学 基于Harris角点和笔画宽度的文字区域检测方法
CN105205488B (zh) * 2015-07-13 2018-07-24 西北工业大学 基于Harris角点和笔画宽度的文字区域检测方法
CN106355172A (zh) * 2016-08-11 2017-01-25 无锡天脉聚源传媒科技有限公司 一种字符识别方法及装置
CN106599937A (zh) * 2016-12-29 2017-04-26 池州职业技术学院 一种不良图片过滤装置
CN107302718B (zh) * 2017-08-17 2019-12-10 河南科技大学 一种基于角点检测的视频字幕区域定位方法
CN107302718A (zh) * 2017-08-17 2017-10-27 河南科技大学 一种基于角点检测的视频字幕区域定位方法
CN107920272B (zh) * 2017-11-14 2020-03-10 维沃移动通信有限公司 一种弹幕筛选方法、装置及移动终端
CN107920272A (zh) * 2017-11-14 2018-04-17 维沃移动通信有限公司 一种弹幕筛选方法、装置及移动终端
CN108319958A (zh) * 2018-03-16 2018-07-24 福州大学 一种基于特征融合匹配的行驶证检测和识别方法
CN109255356B (zh) * 2018-07-24 2022-02-01 创新先进技术有限公司 一种文字识别方法、装置及计算机可读存储介质
CN109255356A (zh) * 2018-07-24 2019-01-22 阿里巴巴集团控股有限公司 一种文字识别方法、装置及计算机可读存储介质
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109583443A (zh) * 2018-11-15 2019-04-05 四川长虹电器股份有限公司 一种基于文字识别的视频内容判断方法
CN109583443B (zh) * 2018-11-15 2022-10-18 四川长虹电器股份有限公司 一种基于文字识别的视频内容判断方法
CN109785353A (zh) * 2019-01-15 2019-05-21 佛山市顺德区中山大学研究院 一种二维码的二次遍历二值化方法、装置和存储介质
CN110532537A (zh) * 2019-08-19 2019-12-03 温州大学 一种基于二分阈值法和投影法多阶段切割文字的方法
CN111914843A (zh) * 2020-08-20 2020-11-10 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 文字检测方法、系统、设备及存储介质
CN112487943A (zh) * 2020-11-25 2021-03-12 北京有竹居网络技术有限公司 关键帧去重的方法、装置和电子设备
CN113095327A (zh) * 2021-03-16 2021-07-09 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质
CN113095327B (zh) * 2021-03-16 2022-10-14 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质

Also Published As

Publication number Publication date
CN103020618B (zh) 2016-03-16

Similar Documents

Publication Publication Date Title
CN103020618B (zh) 视频图像文字的检测方法及系统
US10255691B2 (en) Method and system of detecting and recognizing a vehicle logo based on selective search
CN102915438B (zh) 一种视频字幕的提取方法及装置
CN104392205B (zh) 一种非正常车牌的识别方法和系统
CN106056071B (zh) 一种驾驶员打电话行为的检测方法及装置
CN101661559B (zh) 一种数字图像训练和检测方法
CN106650731B (zh) 一种鲁棒的车牌、车标识别方法
CN102073841B (zh) 一种不良视频检测方法及装置
CN102750535B (zh) 自动提取图像前景的方法和系统
CN102081731B (zh) 一种从图像中提取文本的方法和装置
CN103679168A (zh) 文字区域检测方法及装置
CN102034107B (zh) 基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法
JP2003515230A (ja) ビデオストリームの分類可能な記号の分離方法及びシステム
CN104268528A (zh) 一种人群聚集区域检测方法和装置
CN102902967A (zh) 基于人眼结构分类的虹膜和瞳孔的定位方法
CN102682287A (zh) 基于显著度信息的行人检测方法
CN102289686A (zh) 一种基于迁移学习的运动目标分类识别方法
CN103824081A (zh) 一种室外恶劣光照条件下的快速鲁棒交通标志检测方法
CN102867188A (zh) 一种基于级联结构的会场内座位状态检测方法
Kim et al. Effective traffic lights recognition method for real time driving assistance systemin the daytime
CN102332097B (zh) 一种基于图割的复杂背景文本图像分割方法
CN103186790A (zh) 对象检测系统和方法
CN103336961A (zh) 一种交互式的自然场景文本检测方法
CN104182722A (zh) 文本检测方法和装置以及文本信息提取方法和系统
CN109858570A (zh) 图像分类方法及系统、计算机设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BEIJING JETSEN CENTURY DIGITAL TECHNOLOGY CO., LTD

Free format text: FORMER OWNER: BEIJING JETSEN TECHNOLOGY CO., LTD.

Effective date: 20130814

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100191 HAIDIAN, BEIJING TO: 102211 CHANGPING, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20130814

Address after: 102211 Beijing city Changping District Baishan Town Street Village No. 9 half

Applicant after: Beijing Jetsen Technology Co., Ltd.

Address before: 100191, Haidian District, Zhichun Road, Beijing, No. 1, International Building, seven

Applicant before: Beijing Jetsen Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant