CN100568282C - 一种自动分割和分类体育视频镜头的方法和装置 - Google Patents

一种自动分割和分类体育视频镜头的方法和装置 Download PDF

Info

Publication number
CN100568282C
CN100568282C CNB2006101715242A CN200610171524A CN100568282C CN 100568282 C CN100568282 C CN 100568282C CN B2006101715242 A CNB2006101715242 A CN B2006101715242A CN 200610171524 A CN200610171524 A CN 200610171524A CN 100568282 C CN100568282 C CN 100568282C
Authority
CN
China
Prior art keywords
dtri
camera lens
model
frame
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006101715242A
Other languages
English (en)
Other versions
CN101211460A (zh
Inventor
杨颖�
林守勋
张勇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Lianzhou Electronic Technology Co Ltd
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB2006101715242A priority Critical patent/CN100568282C/zh
Publication of CN101211460A publication Critical patent/CN101211460A/zh
Application granted granted Critical
Publication of CN100568282C publication Critical patent/CN100568282C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

本发明提出一种体育视频镜头自动分割和分类的方法。该方法将体育视频流分成连续的镜头采样单元(SSU),则不同的镜头对应于不同的SSU时序序列,用隐马尔可夫模型为不同的SSU序列建模,就得到不同镜头的隐马尔可夫模型。在此基础上,将所有可能的镜头模型组合串接起来就形成了镜头网络。对于镜头网络中的每条路径即一个镜头模型序列,计算其log概率,将概率最大的作为最佳路径,则该最佳路径上的所有镜头模型即为最终的分类结果,而相应的SSU序列的起始和终止SSU即为镜头的边界,从而实现了对体育视频镜头的分割。

Description

一种自动分割和分类体育视频镜头的方法和装置
技术领域
本发明涉及视频镜头分割方法及其装置,特别是涉及一种对于体育视频镜头自动分割和分类的方法和装置。
背景技术
在体育视频中,镜头是体育视频的基本结构单元,体育视频镜头通常指的是由单一相机视角拍摄所形成一组连续的图像帧。不同类型的体育视频镜头表现了不同的语义内容,如远景镜头通常反映的是比赛的全局情况,而中景镜头通常是对比赛队员的动作跟踪,而特写镜头通常是对队员和裁判的近距离特写,一般出现在比赛的暂停阶段。体育视频的镜头分割可以采用一般视频的分割方法,通过相邻帧的相似程度得到镜头的边界,但是现有方法没有考虑体育视频镜头的特殊性,即运动快,结构具有重复性等特点,因此镜头分割结果并不准确。对于体育视频镜头分类,现有的一些方法主要采用领域知识和特定的规则,如根据草色比例和人员大小对足球视频镜头分割和分类,这些方法能够对特定的体育视频取得很好的效果,但是不具有通用性,不用的体育视频要根据各自的特点推导出不同的分类规则。
另一方面,体育视频的类型众多,但是大致可以分成远景、中景和特写三种镜头类型。体育视频镜头分割和分类的目的就是从体育视频中将这三类镜头分割出来并标注其镜头类型,从而为体育视频建立结构化的索引。但是鉴于不同的体育视频的镜头具有不同的表现形式,要求所选取的镜头特征既能代表不同镜头类型的特点,又具有通用性以便能够适用在不同的体育视频上。
发明内容
本发明的目的是提供一种通用的体育视频镜头分割和分类方法,能够自动的对体育视频镜头进行分割和分类,从而为体育视频建立结构索引,进一步的用于体育视频的语义内容分析。
为此,本发明选取了颜色和运动两个特征作为通用的镜头特征,通过提取颜色和运动信息的差分得到更为精准的镜头特征。由于镜头是由一组连续的视频帧构成,也就是一段时序信号流,因此对体育视频镜头进行分割和分类需要建立合适的时序模型来模拟镜头中的时序信号的转换。而隐马尔可夫模型能够很好的解释时序信号的变化,本发明采用隐马尔可夫模型为每种镜头类型建模。而一段体育视频可以看作是不同类型镜头之间的连接和转换,所以对于一段未知的体育视频流,镜头分割和分类任务可以看成找到一条最佳的镜头模型连接和转换序列。为此,本发明构造了一种镜头网络,它包括所有可能的镜头模型序列,其中网络中的每条路径对应一种镜头模型序列,找到最佳的路径也就找到了最佳的镜头分割和分类结果。实现了镜头分割和分类的同时进行,提高了镜头分割和分类的处理速度。
根据本发明的第一方面,提供了一种体育视频镜头自动分割和分类的方法,该方法包括下列步骤:1)将一个镜头分成多个镜头采样单元(Shot Sample Unit-SSU)的序列;2)根据每个SSU中的视频帧计算每个SSU的颜色相关特征和运动相关特征,其中每个镜头采样单元的颜色相关特征和运动相关特征是该镜头采样单元内所有图象帧的相应特征的平均;3)根据HMM(隐马尔可夫模型)镜头模型通过所有可能的镜头模型组合序列连接起来形成的镜头网络计算每个镜头隐马尔可夫模型的对数输出概率,其中采用Viterbi方法对所述镜头网络中的每个模型组合序列进行识别,所述模型组合序列上的每个镜头模型都会得到一个对数输出概率;4)选取对数输出概率之和最大的模型组合序列,其中,该对数输出概率之和最大的模型序列中的各个模型的状态序列与相应的SSU序列对应。
根据本发明的第二方面,提供了一种体育视频镜头自动分割和分类的装置,包括下列部件:1)将一个镜头分成多个镜头采样单元(SSU)的序列的部件;2)根据每个SSU中的视频帧计算每个SSU的颜色相关特征和运动相关特征的部件,其中每个镜头采样单元的颜色相关特征和运动相关特征是该镜头采样单元内所有图象帧的相应特征的平均;3)计算对数输出概率的部件,其用于根据隐马尔可夫模型镜头模型通过所有可能的镜头模型组合序列连接起来形成的镜头网络计算每个镜头隐马尔可夫模型的对数输出概率,其中采用Viterbi方法对所述镜头网络中的每个模型组合序列进行识别,所述模型组合序列上的每个镜头模型都会得到一个对数输出概率;4)选取对数输出概率之和最大的模型组合序列的部件,其中,该对数输出概率之和最大的模型序列中的各个模型的状态序列与相应的SSU序列对应。
本发明的优点在于:
1、将每类镜头分成连续的SSU序列,更好的反映了镜头的边界和时序特征;
2、采用隐马尔可夫模型为每类镜头建模,能够更好的模拟镜头中的SSU序列的变化;
3、采用颜色和运动相关的信息,易于特征计算和提取;
4、建立镜头网络来识别体育视频流实现了镜头的自动分割和分类。
附图说明
图1示意三类镜头模型,(a)为远景镜头,(b)为中景镜头,(c)为特写镜头;
图2表示镜头采样单元(SSU)序列;
图3表示从左向右无跳转的5状态隐马尔可夫模型;
图4示意一个镜头网络。
具体实施方式
体育视频都可以分为以下三类镜头,即远景镜头,中景镜头和特写镜头,如图1所示。本发明的目的就是自动分割和分类体育视频中的这三类镜头。下面结合附图对本发明作进一步的描述。
本发明的方案主要包括以下步骤:首先将视频分SSU序列,从每个SSU中提取颜色和运动特征,在特征提取的基础上,然后采用隐马尔可夫模型训练数据生成每类镜头的隐马尔可夫模型,将所有可能的镜头模型序列连接成镜头网络,从镜头网络中计算对数概率(log概率)最大的路径,得到最终的镜头分割和分类结果。下面对各步骤进行详细的说明:
1、镜头采样单元(SSU)设定和特征提取
为了对镜头进行准确和快速的分割,首先将镜头分成一个SSU序列,其中所述SSU之间可以相互重叠,也可以不重叠,如图2所示。由于通常一个镜头的持续时间是1到120秒,则每个SSU的长度应该应小于镜头的长度,这里设为25帧,以提高特征提取的速度,采样间隔为10帧。则不同的镜头表现为不同的SSU序列。对于每个SSU,其特征其所包含的图像帧的特征的平均值。则提取SSU的特征就转化为提取每帧图像的特征。对于每个图像帧,我们提取两类特征,包括颜色相关特征和运动相关特征。
●颜色特征提取
三类镜头之间的最大差别是其颜色的变化,如在远景中场地的区域占的面积较大而在特写镜头中几乎没有任何场地信息。由于LUV空间最符合人的视觉感知,我们采用LUV空间的各个分量最为三个颜色类特征,即L,U,V分量。而对于每图像帧的L,U,V特征用表示,如下公式计算:
Figure C20061017152400091
其中L(x,y),U(x,y),V(x,y)为(x,y)点像素的L,U,V分量,而Lf,Uf,Vf为一帧图像的三个基本颜色特征。在此基础上得到他们的一阶二阶差分信息,如下所示:
▿ L f = L f - L f - 1 ▿ U f = U f - U f - 1 ▿ V f = V f - V f - 1 ▿ 2 L f = ▿ L f - ▿ L f - 1 ▿ 2 U f = ▿ U f - ▿ U f - 1 ▿ 2 V f = ▿ V f - ▿ V f - 1 - - - ( 2 )
其中
Figure C20061017152400094
Figure C20061017152400095
(k=1,2)是基本颜色特征的第k阶差分信息。这样一共得到9个颜色相关的特征。
●运动特征提取
本发明一共提取了三类运动特征,分别是帧差运动信息Df,如下所示:
Figure C20061017152400096
其中H(f,i)表示第f帧中颜色为i的像素数目。
另一个运动相关的特征是基于块的运动补偿帧差Cf,如下所示:
C f = Σ B f ( x , y ) ∈ G f ( 1 W B Σ i = 0 255 [ H f ( B f ( x , y ) , i ) - H f - 1 ( B f - 1 * ( u * , v * ) , i ) ] 2 ) - - - ( 4 )
Cf计算的主要思想是,将整个帧分成16*16的均匀宏块,然后在该帧的前一帧中查找与每一宏块最为匹配的小块,求出他们的帧差总和。其中Bf(x,y)为位置在(x,y)点的宏块,Bf-1 *(u*,v*)f-1为前一帧中最匹配的宏块,而Gf为第f帧中所有小块的数目。WB为每个小块的大小。
同时,宏块的运动向量也反映了帧的运动大小,用Mf表示宏块的运动强度,则其计算公式为:
M f = Σ B f ( x , y ) ∈ G f [ ( x - u * ) 2 + ( y - v * ) 2 ] 1 / 2 - - - ( 5 )
其中(u*,v*)即为与Bf(x,y)最匹配的块Bf-1 *(u*,v*)在帧f-1中的位置。
同样,在这三个基本运动特征的基础上又得到了一阶和二阶运动差分信息。
▿ D f = D f - D f - 1 ▿ C f = C f - C f - 1 ▿ M f = M f - M f - 1 ▿ 2 D f = ▿ D f - ▿ D f - 1 ▿ 2 C f = ▿ C f - ▿ C f - 1 ▿ 2 M f = ▿ M f - ▿ M f - 1 - - - ( 6 )
同样
Figure C20061017152400105
(k=1,2)是基本运动特征的第k阶差分信息。这样连上9个颜色相关特征,一共有18个特征。
根据本发明的思想,在提取一帧的图像有关的特征时,可以使用其中的6个特征,即一帧图像的三个基本颜色特征Lf,Uf,Vf,和三类运动特征,即帧差运动信息Df,运动补偿帧差Cf和宏块运动强度Mf;或者使用其中的12个特征,即还包括上述特征的1阶差分信息;或者使用全部18个特征,即还包括上述特征的2阶差分信息。也就是说,对于本发明来说,每一帧的图象可以取6维,也可以取12维,或者18维。对于一个SSU,其特征为这些其内所有图像帧的相应特征的平均。
2、建立基于隐马尔可夫模型(HMM)的镜头模型和镜头网络
由于HMM是处理时序信号的强有力工具,从而用HMM来模拟镜头内部的SSU变化更为合适。由于我们要检测三类镜头,则一共需要建立三个HMM镜头模型。本发明所要分类的三类镜头采用相同的HMM模型,模型的拓扑结构为从左到右无跳转结构,如图3所示。该模型共有5个状态,中间三个状态为输出状态,起始状态只能跳转到下一个状态,最后一个终止状态不能跳转到任何状态。
由于镜头的颜色和运动变化很多,所以对于HMM的输出采用连续输出,采用混合高斯模型作为输出,混合高斯的分量越多,则对镜头的特征拟和的越好。在本步骤中采用4个分量的混合高斯模型。实验证明能够很好的拟和镜头的特征,同时计算效率也很高。
在建立了初始的HMM原型后,就可以用训练数据对这三类镜头模型进行训练。用每种类型的训练数据分别训练相应的镜头HMM模型就得到三类镜头模型。
体育视频流的镜头分割和分类任务可以看成是得到一个镜头模型序列,同时能够知道各个镜头模型的起始和终止位置。则此任务可以看成是在所有的镜头模型序列中找到一个最佳的模型序列。为此,我们将所有可能的模型序列串接成一个镜头网络,如图4所示。镜头网络中的每条路径就是一个模型序列,即每条路径上的各个节点都是一个HMM镜头模型。对于每条路径,采用Viterbi算法对其进行识别,路径上的每个模型都会得到一个对数(log)输出概率。输出概率越大表明该模型输出对应观测特征的概率越大。将路径上所有的对数概率加在一起,选取其中对数概率和最大的作为最佳路径,也就是最佳模型序列。则最佳路径上的模型就是镜头分类的结果。而其中各个模型对应的状态序列与相应的SSU序列一一对应,各个SSU序列的起始和终止位置就是镜头的边界,从而实现了镜头的自动分割。
本发明对镜头分割的同时进行镜头分类,是一种高效快速的镜头分割和分类方法,同时其训练测试所用的特征不依赖于体育视频的类型,适合各种体育运动,所以是一种通用的体育视频镜头分割和分类办法。通过本方法所得到的镜头类型具有完整的语义信息,是对体育视频的一种结构化,可以在此基础上进一步的进行体育视频的内容分析和语义事件理解。
以下是对两种截然不同的体育视频——足球视频和羽毛球视频的镜头分割和分类的实验结果,所选用的16场足球视频全部来自2006年的世界杯比赛,10场比赛用来做训练集,其余6场用作测试集,所选用9场羽毛球比赛来自2005年的羽毛球世界锦标赛,其中5场比赛用作训练集,4场比赛用作测试集。最终的镜头分割和分类的的召回率在80%以上,准确率在70%以上,如下表所示:
表1 羽毛球视频的测试结果
表1 足球视频的测试结果
Figure C20061017152400121
根据本发明的构思,其既可以采用软件编程的方法实现上述发明目的,实现体育视频流镜头的自动分割和分类,也可以采用硬件产品的形式实现。同时还要认识到,在不背离本发明的实质和超出本发明范围的前提下,对于本领域的普通技术人员来说,本发明还可以用许多其他具体的形式实施。因此,说明书中所给出的示例是解释性的,而不应该看作是对本发明的限制;本发明也不局限于在这里给出的细节,可以在附后的权利要求的范围内改变。

Claims (16)

1、一种体育视频镜头自动分割和分类的方法,包括下列步骤:
1)将一个镜头分成多个镜头采样单元的序列;
2)根据每个镜头采样单元中的视频帧计算每个镜头采样单元的颜色相关特征和运动相关特征,其中每个镜头采样单元的颜色相关特征和运动相关特征是该镜头采样单元内所有图象帧的相应特征的平均;
3)根据隐马尔可夫模型镜头模型通过所有可能的镜头模型组合序列连接起来形成的镜头网络计算每个镜头隐马尔可夫模型的对数输出概率,其中采用Viterbi方法对所述镜头网络中的每个模型组合序列进行识别,所述模型组合序列上的每个镜头模型都会得到一个对数输出概率;
4)选取对数输出概率之和最大的模型组合序列,其中,所述对数输出概率之和最大的模型序列中的各个模型的状态序列与相应的镜头采样单元序列对应。
2、根据权利要求1的方法,其中每个图像帧的颜色相关特征包括了L、U和V分量,即三个基本颜色特征Lf,Uf,Vf;运动相关特征包括帧差运动信息Df,运动补偿帧差Cf和宏块的运动强度Mf,它们是分别利用下列公式计算的:
Figure C2006101715240002C1
其中L(x,y),U(x,y),V(x,y)为(x,y)点像素的L,U,V分量;
D f = Σ i = 0 255 ( H ( f , i ) - H ( f - 1 , i ) ) 2 /帧f中的像素数目
其中H(f,i)表示第f帧中颜色为i的像素数目;
C f = Σ B f ( x , y ) ∈ G f ( 1 W B Σ i = 0 255 [ H f ( B f ( x , y ) , i ) - H f - 1 ( B f - 1 * ( u * , v * ) , i ) ] 2 )
其中Bf(x,y)为位置在(x,y)点的宏块,Bf-1 *(u*,v*)为前一帧中最匹配的宏块,而Gf为第f帧中所有宏块的数目,WB为每个宏块的大小;
M f = Σ B f ( x , y ) ∈ G f [ ( x - u * ) 2 + ( y - v * ) 2 ] 1 / 2
其中(u*,v*)即为与Bf(x,y)最匹配的块Bf-1 *(u*,v*)在帧f-1中的位置。
3、根据权利要求2的方法,其中每个图像帧的颜色相关特征还包括了上述颜色相关特征的1阶差分信息:
▿ L f = L f - L f - 1 ▿ U f = U f - U f - 1 ▿ V f = V f - V f - 1
每个图像帧的运动相关特征还包括了上述运动相关特征的1阶差分信息:
▿ D f = D f - D f - 1 ▿ C f = C f - C f - 1 ▿ M f = M f - M f - 1 ,
4、根据权利要求3的方法,其中每个图像帧的颜色相关特征还包括了Lf,Uf,Vf的2阶差分信息:
▿ 2 L f = ▿ L f - ▿ L f - 1 ▿ 2 U f = ▿ U f - ▿ U f - 1 ▿ 2 V f = ▿ V f - ▿ V f - 1
每个图像帧的运动相关特征还包括了Df,Cf,Mf的2阶差分信息:
▿ 2 D f = ▿ D f - ▿ D f - 1 ▿ 2 C f = ▿ C f - ▿ C f - 1 ▿ 2 M f = ▿ M f - ▿ M f - 1
5、根据权利要求1-4之一的方法,其中隐马尔可夫模型镜头模型是利用上述颜色相关特征和运动相关特征作为训练数据进行训练后得到的镜头模型。
6、根据权利要求1-4之一的方法,其中隐马尔可夫模型镜头模型包括远景、中景和特写镜头模型。
7、根据权利要求1-4之一的方法,其中镜头采样单元分成相互重叠。
8、根据权利要求7的方法,其中每个镜头采样单元为25帧,采样间隔是10帧。
9、一种体育视频镜头自动分割和分类的装置,包括下列部件:
1)将一个镜头分成多个镜头采样单元的序列的部件;
2)根据每个镜头采样单元中的视频帧计算每个镜头采样单元的颜色相关特征和运动相关特征的部件,其中每个镜头采样单元的颜色相关特征和运动相关特征是该镜头采样单元内所有图象帧的相应特征的平均;
3)计算对数输出概率的部件,其用于根据隐马尔可夫模型镜头模型通过所有可能的镜头模型组合序列连接起来形成的镜头网络计算每个镜头隐马尔可夫模型的对数输出概率,其中采用Viterbi方法对所述镜头网络中的每个模型组合序列进行识别,所述模型组合序列上的每个镜头模型都会得到一个对数输出概率;
4)选取对数输出概率之和最大的模型组合序列的部件,其中,所述对数输出概率之和最大的模型序列中的各个模型的状态序列与相应的镜头采样单元序列对应。
10、根据权利要求9的装置,其中每个图像帧的颜色相关特征包括了L、U和V分量,即三个基本颜色特征Lf,Uf,Vf;运动相关特征包括帧差运动信息Df,运动补偿帧差Cf和宏块的运动强度Mf,它们是分别利用下列公式计算的:
Figure C2006101715240004C1
其中L(x,y),U(x,y),V(x,y)为(x,y)点像素的L,U,V分量;
D f = Σ i = 0 255 ( H ( f , i ) - H ( f - 1 , i ) ) 2 /帧f中的像素数目
其中H(f,i)表示第f帧中颜色为i的像素数目;
C f = Σ B f ( x , y ) ∈ G f ( 1 W B Σ i = 0 255 [ H f ( B f ( x , y ) , i ) - H f - 1 ( B f - 1 * ( u * , v * ) , i ) ] 2 )
其中Bf(x,y)为位置在(x,y)点的宏块,Bf-1 *(u*,v*)为前一帧中最匹配的宏块,而Gf为第f帧中所有宏块的数目,WB为每个宏块的大小;
M f = Σ B f ( x , y ) ∈ G f [ ( x - u * ) 2 + ( y - v * ) 2 ] 1 / 2
其中(u*,v*)即为与Bf(x,y)最匹配的块Bf-1 *(u*,v*)在帧f-1中的位置。
11、根据权利要求10的装置,其中每个图像帧的颜色相关特征还包括了上述颜色相关特征的1阶差分信息:
▿ L f = L f - L f - 1 ▿ U f = U f - U f - 1 ▿ V f = V f - V f - 1
每个图像帧的运动相关特征还包括了上述运动相关特征的1阶差分信息:
▿ D f = D f - D f - 1 ▿ C f = C f - C f - 1 ▿ M f = M f - M f - 1 ,
12、根据权利要求11的装置,其中每个图像帧的颜色相关特征还包括了Lf,Uf,Vf的2阶差分信息:
▿ 2 L f = ▿ L f - ▿ L f - 1 ▿ 2 U f = ▿ U f - ▿ U f - 1 ▿ 2 V f = ▿ V f - ▿ V f - 1
每个图像帧的运动相关特征还包括了Df,Cf,Mf的2阶差分信息:
▿ 2 D f = ▿ D f - ▿ D f - 1 ▿ 2 C f = ▿ C f - ▿ C f - 1 ▿ 2 M f = ▿ M f - ▿ M f - 1
13、根据权利要求9-12之一的装置,其中隐马尔可夫模型镜头模型是利用上述颜色相关特征和运动相关特征作为训练数据进行训练后得到的镜头模型。
14、根据权利要求9-12之一的装置,其中隐马尔可夫模型镜头模型包括远景、中景和特写镜头模型。
15、根据权利要求9-12之一的装置,其中镜头采样单元分成相互重叠。
16、根据权利要求15的装置,其中每个镜头采样单元为25帧,采样间隔是10帧。
CNB2006101715242A 2006-12-30 2006-12-30 一种自动分割和分类体育视频镜头的方法和装置 Expired - Fee Related CN100568282C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101715242A CN100568282C (zh) 2006-12-30 2006-12-30 一种自动分割和分类体育视频镜头的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101715242A CN100568282C (zh) 2006-12-30 2006-12-30 一种自动分割和分类体育视频镜头的方法和装置

Publications (2)

Publication Number Publication Date
CN101211460A CN101211460A (zh) 2008-07-02
CN100568282C true CN100568282C (zh) 2009-12-09

Family

ID=39611466

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101715242A Expired - Fee Related CN100568282C (zh) 2006-12-30 2006-12-30 一种自动分割和分类体育视频镜头的方法和装置

Country Status (1)

Country Link
CN (1) CN100568282C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604376B (zh) * 2008-10-11 2011-11-16 大连大学 基于hmm-svm混合模型的人脸识别方法
CN103077236B (zh) * 2013-01-09 2015-11-18 公安部第三研究所 便携式设备实现视频知识采集与标注功能的系统及方法
CN104091326A (zh) * 2014-06-16 2014-10-08 小米科技有限责任公司 图标分割方法和装置
CN108270946A (zh) * 2016-12-30 2018-07-10 央视国际网络无锡有限公司 一种基于特征向量库的计算机辅助视频剪辑装置
CN107241645B (zh) * 2017-06-09 2020-07-24 成都索贝数码科技股份有限公司 一种通过对视频的字幕识别自动提取进球精彩瞬间的方法
CN108810620B (zh) * 2018-07-18 2021-08-17 腾讯科技(深圳)有限公司 识别视频中的关键时间点的方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710562A (zh) * 2005-07-18 2005-12-21 北大方正集团有限公司 集成颜色和运动特征进行镜头检索的方法
CN1851710A (zh) * 2006-05-25 2006-10-25 浙江大学 嵌入式多媒体基于关键帧的视频检索的实现方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1710562A (zh) * 2005-07-18 2005-12-21 北大方正集团有限公司 集成颜色和运动特征进行镜头检索的方法
CN1851710A (zh) * 2006-05-25 2006-10-25 浙江大学 嵌入式多媒体基于关键帧的视频检索的实现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于隐马尔科夫模型的足球视频典型事件检测. 马超.中国优秀硕士学位论文全文数据库,中国学术期刊(光盘版)电子期刊. 2005 *

Also Published As

Publication number Publication date
CN101211460A (zh) 2008-07-02

Similar Documents

Publication Publication Date Title
Parmar et al. What and how well you performed? a multitask learning approach to action quality assessment
Yuan et al. Temporal action localization by structured maximal sums
Materzynska et al. The jester dataset: A large-scale video dataset of human gestures
CN100568282C (zh) 一种自动分割和分类体育视频镜头的方法和装置
Bloom et al. G3D: A gaming action dataset and real time action recognition evaluation framework
Yang et al. Dynamic hand gesture recognition using hidden Markov models
Khan et al. Deep cnn based data-driven recognition of cricket batting shots
CN109101896A (zh) 一种基于时空融合特征和注意力机制的视频行为识别方法
CN109919981A (zh) 一种基于卡尔曼滤波辅助的多特征融合的多目标跟踪方法
Ghosh et al. Towards structured analysis of broadcast badminton videos
CN110110649A (zh) 基于速度方向的可选择性人脸检测方法
CN105701460A (zh) 一种基于视频的篮球进球检测方法和装置
CN110298231A (zh) 一种用于篮球比赛视频进球判定的方法及系统
CN106203503A (zh) 一种基于骨骼序列的动作识别方法
CN105959723B (zh) 一种基于机器视觉和语音信号处理相结合的假唱检测方法
CN109341703A (zh) 一种全周期采用CNNs特征检测的视觉SLAM算法
Yan et al. Automatic annotation of tennis games: An integration of audio, vision, and learning
CN109045664B (zh) 基于深度学习的跳水打分方法、服务器及系统
Khan et al. Learning deep C3D features for soccer video event detection
Vantigodi et al. Real-time human action recognition from motion capture data
CN105912991A (zh) 基于3d点云与关键骨骼节点的行为识别
Khalid et al. Multi-modal three-stream network for action recognition
CN106204633A (zh) 一种基于计算机视觉的学生跟踪方法和装置
Wang et al. Fast and accurate action detection in videos with motion-centric attention model
CN110309786A (zh) 一种基于深度视频的哺乳母猪姿态转换识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: DONGGUAN LIANZHOU ELECTRONIC TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: INSTITUTE OF COMPUTING TECHNOLOGY, CHINESE ACADEMY OF SCIENCES

Effective date: 20130125

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100080 HAIDIAN, BEIJING TO: 523000 DONGGUAN, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130125

Address after: 523000 Yuquan Industrial Zone, Fenggang Town, Guangdong, Dongguan

Patentee after: Dongguan Lianzhou Electronic Technology Co., Ltd.

Address before: 100080 Haidian District, Zhongguancun Academy of Sciences, South Road, No. 6, No.

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091209

Termination date: 20151230

EXPY Termination of patent right or utility model