CN101464949A - 体育视频中数字时钟的识别方法 - Google Patents

体育视频中数字时钟的识别方法 Download PDF

Info

Publication number
CN101464949A
CN101464949A CNA2009100771075A CN200910077107A CN101464949A CN 101464949 A CN101464949 A CN 101464949A CN A2009100771075 A CNA2009100771075 A CN A2009100771075A CN 200910077107 A CN200910077107 A CN 200910077107A CN 101464949 A CN101464949 A CN 101464949A
Authority
CN
China
Prior art keywords
numeral
scoreboard
candidate
clock
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009100771075A
Other languages
English (en)
Inventor
部凡
孙立峰
杨士强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CNA2009100771075A priority Critical patent/CN101464949A/zh
Publication of CN101464949A publication Critical patent/CN101464949A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明体育视频中数字时钟的识别方法,属于信息识别技术领域,该方法包括对计分牌定位,对计分牌上的时钟数字进行建模,根据建立的时钟数字模板对体育比赛时间进行识别,具体包括:用时间窗对待识别的体育视频进行扫描,查找候选计分牌;对候选记分牌图像进行预处理后,在候选记分牌图像上寻找“秒”时钟数字、“十秒”数字、“分”数字和“十分”数字四个位置,提取“秒”数字的0-9十个数字模板并保存;数字模板进行识别,得到比赛时间序列;本发明具有实现简单、应用范围广的特点,并能满足识别的效率和精确性两个方面的要求。

Description

体育视频中数字时钟的识别方法
技术领域
本发明属于信息识别技术领域,涉及一种在视频中定位及识别数字时钟的方法,尤其涉及一种不采用OCR文字识别,直接通过对体育视频中时钟数字进行分析、建模和识别的方法的设计。
背景技术
在体育视频的分析领域中,精确的事件检测和场景分割是非常具有挑战性的研究课题。体育视频分析和其他视频处理类似,有着底层特征与高级语义之间存在的语义间隔,同时体育比赛有着特定的结构与规则,在体育比赛广播中所采用的后期编辑方法,也有助于对视频的分析与理解。
体育比赛视频叠加层上的比赛时间信息,配合其他网络文字信息,可以实现精彩事件的定位等应用。因此高效而精确的提取体育视频中的比赛时间信息,对于体育视频整体分析和检索的正确性,具有至关重要的作用。
体育节目有很强的时间性,如果不能实时处理并得到分析结果,就有可能失去应用价值。目前已有的方法往往不能在识别的效率和精确性两个方面,达到实际应用的要求:
1.OCR文字识别
直接获取屏幕上的文字图像,利用已有的OCR技术来进行识别比赛时间,是一种很成熟的方法。
不过,这种算法不能自动对于类似记分牌上的比赛数字时钟进行定位。即使能够非常精确的找到并提取出视频中的文字信息,OCR识别的正确率,很大程度上依赖于提取图像的质量,而具体应用中,非常细小的叠加层文字,加上有些叠加层的半透明背景带来的干扰,更会使OCR识别的性能和效率大大降低。还有,需要对文字进行事先训练也是OCR算法的一大弊病。
2.TNPS算法
Yiqun LI的TNPS算法是一种专门读取体育视频时钟信息的算法,这种算法利用比赛时钟数字在视频时域上的周期性,有效地把一个模式识别问题,转化为一个模式变化的检测问题,能够准确而高效的识别体育比赛的数字时钟。
然而,Yiqun LI的方法强烈的依赖于以下两个条件:
A.体育比赛视频中的计分牌不能是透明或半透明的;
B.体育比赛视频中的计分牌必须在比赛开始后的1分钟之内就出现在屏幕上,并且从此以后再也不能消失。
这是两个非常强的假设,事实上,目前大部分电视台制作的体育比赛都采用半透明的计分牌,并且计分牌在正常比赛中时而出现,时而消失。因此,单纯的TNPS算法在实际应用中有着较大的限制。
一个实用的体育视频分析系统应该满足有效和高效两个能力。实时性要求我们采用更有效的特征和更高效的算法。
发明内容
本发明的目的是为克服已有技术的不足之处,提出了一种体育视频中数字时钟的识别方法,具有实现简单、应用范围广的特点,并能满足识别的效率和精确性两个方面的要求。
本发明的原理是通过对视频中的连续关键帧画面进行统计,算出可能是记分牌叠加层的候选;根据视频中连续相邻帧在时钟数字区域的相似性和周期性,在记分牌候选上定位组成时钟的四个数字;再根据时钟数字之间的模式变化关系,对0-9十个数字逐个建模;利用这些数字模板和屏幕上时钟数字的位置,对4个时钟数字逐个识别;最后,连续识别时间轴上多帧图像的时钟,对他们的结果进行孤立点删除校验,以提高识别的正确率。
本发明的特点和优势
本发明针对体育视频,提出了通用性较强的记分牌定位方法法,以及数字时钟定位、建模和识别方法。主要的优势如下:
(1)这是一个不需要事先进行机器学习的轻量级算法,可以在比赛直播的过程中实时运行。
(2)对于不同颜色字体字号的数字时钟以及不同情况的背景环境都非常鲁棒,尤其对于下面几种叠加层识别的难点上,体现出明显的优势
i.    体育比赛视频的记分牌叠加层时隐时现;
ii.   体育比赛视频的记分牌叠加层背景透明;
iii.  体育比赛视频本身由于压缩导致一些关键帧画面模糊。
本发明针对足球视频进行了实验,在经过孤立点去除校验之后,本发明的方法对足球视频可以达到100%的正确率。
附图说明
图1为本发明的方法总体流程框图。
图2为本发明的方法的识别结果校验点散图。
具体实施方式
本发明提出的一种体育视频中数字时钟的识别方法,如图1所示,该方法包括对计分牌定位,对计分牌上的时钟数字进行建模,根据建立的时钟数字模板对体育比赛时间进行识别,包括以下步骤:
(1)在视频时间轴上定义一个长度为10秒以上的滑动时间窗口,该时间窗口的滑动步长为1秒;
(2)用所述的时间窗,按照1帧/秒的采样率从待识别的体育视频的开始端进行扫描,在该时间窗的滑动过程中,对每一个时间窗口内的视频进行统计分析、查找候选计分牌;如果找到候选记分牌,进入步骤(3)对候选记分牌进行分析;如果无法找到候选记分牌,则将时间窗延时间轴移动1秒,继续扫描视频,直到找到候选记分牌;
(3)逐帧对候选记分牌图像进行预处理,然后在候选记分牌图像上寻找“秒”时钟数字,如果找到“秒”时钟数字,则将当前的候选记分牌标定为最终的记分牌,并记录该记分牌上“秒”时钟数字的位置,进入步骤(4),反之,回到步骤(2),查找下一个候选记分牌;
(4)根据数字时钟中“十秒”数字、“分”数字和“十分”数字与“秒”的位置关系,从所述“秒”数字的位置向左,标定3个和“秒”数字区域大小基本一致,且位置连续并排的区域,将该三个区域分别记录为“十秒”数字、“分”数字和“十分”数字的位置,将已确定的4个时钟数字的位置进行保存(以便后面的比赛时钟识别);
(5)根据“十秒”数字与“秒”数字的变化对应关系,提取“秒”数字的0-9十个数字模板并保存;
(6)对视频连续多个带有记分牌标记的图像帧,利用四个时钟数字的位置和0-9十个数字模板,通过逐个匹配的方式进行识别,得到比赛时间序列;
(7)对步骤(6)得到的比赛时间序列,使用孤立点删除的方法进行校验,去掉错误的识别结果,得到最终的比赛时间序列。
上述步骤(2)中对每一个时间窗口内的视频进行统计分析、查找候选计分牌,具体包括以下步骤:
(21)按照1帧/秒的采样率,在时间窗口内对待识别的体育视频进行重采样(如果在高性能计算机上,为了检测的准确性,也可以适当提高采样率),得到关键帧图像序列;
(22)根据体育比赛视视频中记分牌位置的常识,对得到的图像序列中每个图像的记分牌区域(例如:足球视频的记分牌都出现在左上角或右上角,其他体育比赛可能又有所不同,可以作相应调整)按照公式[1],逐像素计算得到强度方差图;
I ‾ ( x , y ) = 1 T Σ t = 1 T I t ( x , y )
σ 2 ( x , y ) = 1 T Σ t = 1 T ( I t ( x , y ) - I ‾ ( x , y ) ) 2 - - - [ 1 ]
上式中:I(x,y)表示图像上的坐标(x,y)处像素的强度,I(x,y)表示图像上的坐标(x,y)处像素的强度在T时间内的平均值,T表示图像序列的时间跨度,σ2(x,y)表示图像上的坐标(x,y)处像素的方差;
(23)对得到的强度方差图采用动态阈值的方法进行二值化过滤,得到该方差图对应的二值图像;该动态阈值为方差图中每个像素周围某个区域内所有像素的平均值。如公式[2]所示:
T = 1 W × H Σ x = 1 W Σ y = 1 H σ 2 ( x , y ) - - - [ 2 ]
上式中σ2(x,y)表示图像上的坐标(x,y)处像素的方差,W和H像素邻域的宽度和高度,T表示计算出的动态阈值;
(24)对该二值图像进行形态学处理后做连通域分析(CCA),找到所有的连通域;
(25)利用体育比赛的有关常规知识对得到的连通域进行过滤(即面积太小,如几个或几十像素的连通域根本不可能容纳任何看得清的信息,因此不可能是计分牌;而长宽比过于悬殊的连通域,位置不在屏幕角落的连通域,也被剔出掉),将得到的连通域进行标记,并记录该连通域的位置和在时间轴上的跨度,作为候选计分牌。
上述步骤(3)中逐帧对候选记分牌图像进行预处理,然后在候选记分牌上寻找“秒”时钟数字,具体包括以下步骤:
(31)1使用动态阈值T,对记分牌图像进行二值化处理,得到二值化图像;
(32)对得到的二值图像进行连通域分析(CCA),得到一系列有可能是“秒”时钟数字的区域(ROI区域);
(33)如果同样大小、同样位置的ROI区域,出现在连续多帧中(一般不少于150帧),则把该ROI区域标记为一个候选时钟数字(在该步骤中,为了可以兼容一些由于压缩产生的图像模糊和跳帧现象,1到2个像素的偏移,或1到2帧的空缺,也可以认为连续多帧);
(34)利用体育比赛记分牌的常识,对该候选时钟数字作进一步的过滤(面积太大或太小的区域要过滤掉;长宽比太大或太小的区域也不可能是数字,要过滤掉;如果一个侯选区域,和它具有相同位置纵坐标,也具有连续横坐标间隔的其他候选连通域少于3个,那么它本身也不可能是时钟数字,也要过滤掉);
(35)用公式[3]计算过滤后得到的每一个候选时钟数字的时域相邻帧图案模式相似性(TNPS)序列值:
S ( n ) = Σ ( x , y ) ∈ I B n - 1 ( x , y ) ⊗ B n ( x , y ) - - - [ 3 ]
式中Bn(x,y)是视频第n个采样帧经过处理得到的二值图像中,坐标位置在(x,y)处的值,I代表要考察的有可能是时钟数字的ROI区域;
Figure A200910077107D0008094901QIETU
是异或符号(当a和b的值相同的时候,a
Figure A200910077107D0008094901QIETU
b的值为0,当a和b的值不同的时候,a
Figure A200910077107D0008094901QIETU
b的值为1);
(36)当所有候选时钟数字中的某个候选时钟数字的TNPS值每隔1秒或间断的每隔1秒周期性地出现极大值,则将该候选时钟数字标记为“秒”数字(对于不同类型比赛,TNPS周期性条件会有所不同:对于比赛时间永远不停的体育比赛,例如足球比赛,TNPS值连续每隔1秒周期性出现极大值;对于其它比赛,例如篮球,比赛时钟有时会停止,TNPS值有间断的每隔1秒周期性出现极大值)。
上述步骤(5)提取“秒”数字的0-9十个数字作为模板包括如下步骤:
(51)在记分牌存在时域内,计算“十秒”时钟数字区域连续250帧的TNPS值,把TNPS取得最大值的那一帧,确定为“十秒”数字变化帧;
(52)以该“十秒”数字变化帧在视频中的位置为起点,提取其后连续250帧“秒”数字位置的二值图案,作为0-9是个数字的模板,其中第1-25帧为数字1的模板,第26-50帧为数字2的模板,以此类推,得到的0-9每个数字的25个模板;
(53)采用叠加求平均值的方法,把每个数字的25个模板合并为1个,得到“秒”数字的0-9十个数字模板。
上述步骤(6)具体包括如下步骤:
(61)对“秒”时钟数字位置的图像用动态阈值的方法进行二值化;
(62)用十个数字模板的二值图像,逐个和“秒”时钟数字二值图像进行匹配,得到的10个匹配值S(0)、S(1)、S(2)、S(3)……S(9),匹配算法采用公式[4]:
S ( i ) = Max ( Σ ( x , y ) ∈ I T i ( x , y ) ⊕ D ( x , y ) ) - - - [ 4 ]
式中,Ti(x,y)数字i模板二值图像在坐标(x,y)位置的值,D(x,y)带识别区域二值图像在坐标(x,y)位置的值,
Figure A200910077107D00092
是异或符号;
(63)从上述10个匹配值中,找到一个最小的S(t),其对应的数字t就是当前帧“秒”时钟数字的取值;
(64)对“十秒”“分”和“十分”位置的图像,进行(61)-(63)的匹配操作,得到当前帧的完整比赛时间。
上述步骤(7)使用孤立点删除的方法进行校验,包括如下步骤:
(71)将步骤(6)得到的连续帧识别结果序列,分别用公式[5]转化为秒:
T=(m×10+n)×60+s×10+t              [5]
式中,m、n、s和t分别代表“十分”“分”“十秒”和“秒”数字的值,T是计算出的转化为秒的结果;
(72)画一个比赛时间识别结果T相对视频帧序号的散点图,如图2;
(73)从图2中可以看出大部分识别结果呈一条缓慢上升的台阶线,每25帧上一个步长为1秒的台阶(例如1-25帧的识别结果是801,26-50帧的识别结果是802)。将脱离了这条台阶线的孤立点作为误差(由于关键帧图像模糊造成的)去除掉。

Claims (5)

1、一种体育视频中数字时钟的识别方法,其特征在于,该方法包括对计分牌定位,对计分牌上的时钟数字进行建模,根据建立的时钟数字模板对体育比赛时间进行识别,具体包括以下步骤:
(1)在视频时间轴上定义一个长度为10秒以上的滑动时间窗口,该时间窗口的滑动步长为1秒;
(2)用所述的时间窗,按照1帧/秒的采样率从待识别的体育视频的开始端进行扫描,在该时间窗的滑动过程中,对每一个时间窗口内的视频进行统计分析、查找候选计分牌;如果找到候选记分牌,进入步骤(3)对候选记分牌进行分析;如果无法找到候选记分牌,则将时间窗延时间轴移动1秒,继续扫描视频,直到找到候选记分牌;
(3)逐帧对候选记分牌图像进行预处理,然后在候选记分牌图像上寻找“秒”时钟数字,如果找到“秒”时钟数字,则将当前的候选记分牌标定为最终的记分牌,并记录该记分牌上“秒”时钟数字的位置,进入步骤(4),反之,回到步骤(2),查找下一个候选记分牌;
(4)根据数字时钟中“十秒”数字、“分”数字和“十分”数字与“秒”的位置关系,从所述“秒”数字的位置向左,标定3个和“秒”数字区域大小基本一致,且位置连续并排的区域,将该三个区域分别记录为“十秒”数字、“分”数字和“十分”数字的位置,将已确定的4个时钟数字的位置进行保存;
(5)根据“十秒”数字与“秒”数字的变化对应关系,提取“秒”数字的0-9十个数字模板并保存;
(6)对视频连续多个带有记分牌标记的图像帧,利用四个时钟数字的位置和0-9十个数字模板,通过逐个匹配的方式进行识别,得到比赛时间序列;
(7)对步骤(6)得到的比赛时间序列,使用孤立点删除的方法进行校验,去掉错误的识别结果,得到最终的比赛时间序列。
2、如权利要求1所述方法,其特征在于,所述步骤(2)中对每一个时间窗口内的视频进行统计分析、查找候选计分牌,具体包括以下步骤:
(21)按照1帧/秒的采样率,在时间窗口内对待识别的体育视频进行重采样,得到关键帧图像序列;
根据体育比赛视视频中记分牌位置的常识,对得到的图像序列中每个图像的记分牌区域,逐像素计算得到强度方差图;对得到的强度方差图采用动态阈值的方法进行二值化过滤,得到该方差图对应的二值图像;该动态阈值为方差图中每个像素周围某个区域内所有像素的平均值;
(22)对该二值图像进行形态学处理后做连通域分析,找到所有的连通域;
(23)利用体育比赛的有关常规知识对得到的连通域进行过滤,将得到的连通域进行标记,并记录该连通域的位置和在时间轴上的跨度,作为候选计分牌。
3、如权利要求1所述方法,其特征在于,所述步骤(3)中逐帧对候选记分牌图像进行预处理,然后在候选记分牌上寻找“秒”时钟数字,具体包括以下步骤:
(31)采用动态阈值的方法,对记分牌图像进行二值化处理,得到二值化图像;
(32)对得到的二值图像进行连通域分析,得到一系列有可能是“秒”时钟数字的区域ROI;
(33)如果同样大小、同样位置的ROI区域,出现在连续多帧中(一般不少于150帧),则把该ROI区域标记为一个候选时钟数字;
(34)利用体育比赛记分牌的常识,对该候选时钟数字作进一步的过滤;
(35)计算过滤后得到的每一个候选时钟数字的时域相邻帧图案模式相似性TNPS序列值;
(36)当所有候选时钟数字中的某个候选时钟数字的TNPS值每隔1秒或间断的每隔1秒周期性地出现极大值,则将该候选时钟数字标记为“秒”数字。
4、如权利要求1所述方法,其特征在于,所述步骤(5)提取“秒”数字的0-9十个数字作为模板包括如下步骤:
(51)在记分牌存在时域内,计算“十秒”时钟数字区域连续250帧的时域相邻帧图案模式相似性TNPS序列值,把TNPS值取得最大值的那一帧,确定为“十秒”数字变化帧;
(52)以该“十秒”数字变化帧在视频中的位置为起点,提取其后连续250帧“秒”数字位置的二值图案,作为0-9是个数字的模板,其中第1-25帧为数字1的模板,第26-50帧为数字2的模板,以此类推,得到的0-9每个数字的25个模板;
(53)采用叠加求平均值的方法,把每个数字的25个模板合并为1个,得到“秒”数字的0-9十个数字模板。
5、如权利要求1所述方法,其特征在于,所述步骤(6)具体包括如下步骤:
(61)对“秒”时钟数字位置的图像用动态阈值的方法进行二值化;
(62)用十个数字模板的二值图像,逐个和“秒”时钟数字二值图像进行匹配,得到的10个匹配值;
(63)从上述10个匹配值中,找到一个最小的值,其对应的数字就是当前帧“秒”时钟数字的取值;
(64)对“十秒”“分”和“十分”位置的图像,进行(61)-(63)的匹配操作,得到当前帧的完整比赛时间。
CNA2009100771075A 2009-01-16 2009-01-16 体育视频中数字时钟的识别方法 Pending CN101464949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2009100771075A CN101464949A (zh) 2009-01-16 2009-01-16 体育视频中数字时钟的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2009100771075A CN101464949A (zh) 2009-01-16 2009-01-16 体育视频中数字时钟的识别方法

Publications (1)

Publication Number Publication Date
CN101464949A true CN101464949A (zh) 2009-06-24

Family

ID=40805521

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2009100771075A Pending CN101464949A (zh) 2009-01-16 2009-01-16 体育视频中数字时钟的识别方法

Country Status (1)

Country Link
CN (1) CN101464949A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065152A (zh) * 2012-12-10 2013-04-24 华中师范大学 一种视频中数字时钟的识别方法
CN104657721A (zh) * 2015-03-09 2015-05-27 上海依图网络科技有限公司 一种基于自适应模板的视频osd时间识别方法
CN105844231A (zh) * 2016-03-21 2016-08-10 西安银石科技发展有限责任公司 一种货检作业过程车号识别控制方法
CN117132925A (zh) * 2023-10-26 2023-11-28 成都索贝数码科技股份有限公司 一种体育赛事的智能场记方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065152A (zh) * 2012-12-10 2013-04-24 华中师范大学 一种视频中数字时钟的识别方法
CN103065152B (zh) * 2012-12-10 2015-11-18 华中师范大学 一种视频中数字时钟的识别方法
CN104657721A (zh) * 2015-03-09 2015-05-27 上海依图网络科技有限公司 一种基于自适应模板的视频osd时间识别方法
CN104657721B (zh) * 2015-03-09 2018-09-25 上海依图网络科技有限公司 一种基于自适应模板的视频osd时间识别方法
CN105844231A (zh) * 2016-03-21 2016-08-10 西安银石科技发展有限责任公司 一种货检作业过程车号识别控制方法
CN117132925A (zh) * 2023-10-26 2023-11-28 成都索贝数码科技股份有限公司 一种体育赛事的智能场记方法及装置
CN117132925B (zh) * 2023-10-26 2024-02-06 成都索贝数码科技股份有限公司 一种体育赛事的智能场记方法及装置

Similar Documents

Publication Publication Date Title
CN111382704B (zh) 基于深度学习的车辆压线违章判断方法、装置及存储介质
CN111274865A (zh) 一种基于全卷积神经网络的遥感图像云检测方法及装置
CN106682108A (zh) 一种基于多模态卷积神经网络的视频检索方法
CN108710865A (zh) 一种基于神经网络的司机异常行为检测方法
CN100594511C (zh) 圆形印章的印鉴图像检索方法
CN101448100A (zh) 一种快速准确的视频字幕提取方法
CN106778757A (zh) 基于文本显著性的场景文本检测方法
CN103870803A (zh) 一种基于粗定位与精定位融合的车牌识别方法和系统
CN101510260B (zh) 字幕存在时间确定装置和方法
CN104244073A (zh) 一种视频中滚动字幕的自动检测和识别方法
CN104063883A (zh) 一种基于对象和关键帧相结合的监控视频摘要生成方法
CN101789011A (zh) 相似视频片段的检测
CN101593277A (zh) 一种复杂彩色图像中文本区域自动定位方法及装置
CN109711256B (zh) 一种低空复杂背景无人机目标检测方法
CN110163109B (zh) 一种车道线标注方法及装置
CN104036243A (zh) 一种基于光流信息的行为识别方法
CN108509950B (zh) 基于概率特征加权融合的铁路接触网支柱号牌检测识别法
CN106845513A (zh) 基于条件随机森林的人手检测器及方法
CN112907598A (zh) 一种基于注意力cnn文档证件类图像篡改检测方法
CN104778238A (zh) 一种视频显著性的分析方法及装置
CN101867729B (zh) 基于人物特征的新闻视频正式独白镜头的检测方法
CN101464949A (zh) 体育视频中数字时钟的识别方法
CN108491828B (zh) 一种基于层次的成对相似性PVAnet的停车位检测系统及方法
CN103077380A (zh) 一种基于视频的人数统计方法及装置
CN101827224B (zh) 一种新闻视频中主播镜头的检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090624