CN101867729B - 基于人物特征的新闻视频正式独白镜头的检测方法 - Google Patents

基于人物特征的新闻视频正式独白镜头的检测方法 Download PDF

Info

Publication number
CN101867729B
CN101867729B CN2010101949326A CN201010194932A CN101867729B CN 101867729 B CN101867729 B CN 101867729B CN 2010101949326 A CN2010101949326 A CN 2010101949326A CN 201010194932 A CN201010194932 A CN 201010194932A CN 101867729 B CN101867729 B CN 101867729B
Authority
CN
China
Prior art keywords
camera lens
people
formal
monologue
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010101949326A
Other languages
English (en)
Other versions
CN101867729A (zh
Inventor
丁晓伟
屈正阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN2010101949326A priority Critical patent/CN101867729B/zh
Publication of CN101867729A publication Critical patent/CN101867729A/zh
Application granted granted Critical
Publication of CN101867729B publication Critical patent/CN101867729B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

一种视频处理技术领域的基于人物特征的新闻视频正式独白镜头的检测方法,本发明将新闻视频分为若干镜头,先去除持续时间过短的镜头,又去除没有人脸及人脸位置和大小不符合要求的镜头,再淘汰运动剧烈的镜头,接着提取人的上半身区域的BOW特征,最后利用支持向量机进行分类判断。本发明检测的时间大大减少,但检测的准确率却大大提高,高达86%,从而能有效解决网络浏览和检索的实时性和准确性的要求。

Description

基于人物特征的新闻视频正式独白镜头的检测方法
技术领域
本发明涉及的是一种视频处理技术领域的检测方法,具体是一种基于人物特征的新闻视频正式独白镜头的检测方法。
背景技术
随着互联网的迅速发展,各类多媒体应用不断涌现,如今网络视频已成为人们现在获取信息和娱乐的主要来源之一。这些视频中包含了大量有用的信息。然而,由于这些视频是无序地分布在世界各地,视频中包含的信息无法被有效地访问和利用。这就要求有一种能够快速而且准确地查找访问这些视频的技术,视频分类技术就能很好的解决这一难题。在新闻类视频中,“正式独白”镜头具有很大的信息量并且包含关键信息,此类镜头在智能新闻浏览和政治类新闻视频检索中扮演重要角色,因此检索出此类镜头具有很高的实用价值。
目前,常见的“正式独白”镜头中首先包含一位身着正装,正对摄像机的主讲人以及若干个无关人员。其次,画面的背景是静止的。再次,画面下方有电视台打出的新闻标题栏,整个镜头持续时间较长。
经过对现有技术的检索发现,中国专利公开号CN101316327,公开日2008-12-3,记载了一种“一种多模态融合的采访镜头检测方法”,该技术分别对原始视频中的视频流和音频流进行检测,对视频中的帧进行人脸检测,对音频流进行人声检测,融合检测结果最后判断是否是采访镜头;中国专利公开号CN1825936,公开日2006-08-30,记载了一种“基于语音分类识别的新闻视频检索方法”,该技术首先分割出标准语音的所有语音片断,然后运用语音识别系统,对分割出的标准语音进行识别。实现从文本到视频的新闻检索。上述两种技术都涉及视频的分类方法,但仍然存在以下缺陷:在对视频的分类方法中仅仅采用语音识别或者简单的视频特征匹配,对于视频内容的检测和分类准确率较低,且计算量过大。
发明内容
本发明的目的在于克服现有技术的上述不足,提供一种基于人物特征的新闻视频正式独白镜头的检测方法。本发明先去除持续时间过短的镜头,又去除没有人脸及人脸位置和大小不符合要求的镜头,再淘汰运动剧烈的镜头,接着提取人的上半身区域的BOW(Bag OfWords,词袋)特征,最后利用支持向量机进行分类判断,从而使得本发明检测新闻视频正式独白镜头的准确率大大提高,但是计算量却明显减少,提高了检索的效率。
本发明是通过以下技术方案实现的,本发明包括以下步骤:
第一步,输入一段新闻视频,对每帧图像按照顺序进行阿拉伯数字编号,使用镜头切变检测将视频分为若干镜头,去除其中持续时间小于阈值T1的镜头,并提取剩余的每个镜头的关键帧。
所述的镜头切变检测,是:根据下面的公式得到新闻视频中相邻的两帧的帧差异值,当相邻两帧的帧差异值大于阈值T2时,则这两帧分别作为一个镜头的最后一帧和另一个镜头的第一帧,具体公式为:
z ( k , k + l ) = 1 MN Σ x = 1 M Σ y = 1 N | I k ( x , y ) - I k + l ( x , y ) | ,
其中:M和N分别是帧的水平和垂直方向的总的像素数,x和y分别是帧的水平和垂直方向的像素数,Ik(x,y)和Ik+l(x,y)分别是第k帧和第k+l帧在(x,y)处的亮度值。
所述的阈值T2的取值范围是:65≤T2≤85。
所述的阈值T1的取值范围是:2s≤T1≤4s。
所述的关键帧是中间帧。
第二步,对关键帧进行人脸检测,并给检测到的人脸添加一个与人脸外切的方框,得到所有包括人脸的镜头,以画面右下角像素点为原点建立直角坐标系,得到包括人脸的镜头中每个人脸的位置信息。
所述的人脸检测是使用OpenCV的Haar分类器实现的。
第三步,选取包括人脸的镜头中距离该镜头中心最近的人脸,得到该人脸所在的方框在图像中的面积,当该方框面积与其所在整幅图像面积的比值大于阈值T3时,该包括人脸的镜头就是候选镜头。
所述的阈值T3的取值范围是:0.015≤T3≤0.025。
第四步,对候选镜头进行运动检测,得到每个候选镜头的运动强度,去除其中运动强度大于阈值T4的候选镜头。
所述的运动检测,是指:
M k = 1 T Σ i = b k e k M i k · En i k ,
其中: En i k = - Σ j = 1 n p i k ( j ) log ( p i k ( j ) ) ,
M i k = Σ u = 1 , v = 1 u = G , v = H | I i k ( u , v ) | ,
Mk是第k个镜头的运动强度,
Figure GDA0000022159220000034
是第k个镜头中编号为i的帧图像的运动强度,是第k个镜头中编号为i的帧图像的运动方向的熵值,T为归一化常数,bk是第k个镜头的第一帧的编号,ek是第k个镜头的最后一帧的编号,
Figure GDA0000022159220000036
(j)是第k个镜头中编号为i的帧图像的运动相位的分布概率,n是相位直方图的量化等级,
Figure GDA0000022159220000037
(u,v)是第k个镜头中编号为i的帧图像分辨率为(u,v)的像素点的运动矢量的幅值,G和H分别是图像序列的水平和垂直分辨率。
所述的阈值T4的取值范围是:0.25≤T4≤0.35。
第五步,对剩余的候选镜头中距离镜头中心最近的人的上半身区域进行BOW特征提取,得到剩余的候选镜头中距离镜头中心最近的人的上半身区域的BOW特征。
所述的人的上半身区域,具体是:以人物两肩为上边界、左右上臂为左右边界、电视台文字标题上边缘为下边界的矩形区域。
所述的BOW特征提取,具体是:
1)建立新闻视频正式独白镜头训练库,提取其中关键帧的距离镜头中心最近的人的上半身区域的SIFT特征,同时提取剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征;
2)使用K-means聚类方法将训练库的SIFT特征进行聚类,得到若干维聚类中心;
3)将得到的剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征与聚类中心进行比较,从而得到剩余的候选镜头中距离镜头中心最近的人的上半身区域的BOW特征。
第六步,构建训练库,采用支持向量机对第五步得到的BOW特征进行判断处理,得到输入新闻视频中的正式独白镜头。
所述的构建训练库,具体是:人工选择若干新闻视频中的正式独白镜头和非正式独白镜头,其中:正式独白镜头包括男性正式独白上半身图片和女性正式独白上半身图片,非正式独白镜头包括无关图片和人物上半身图片。
所述的判断处理,具体是:提取训练库中正式独白镜头中人物上半身图像的BOW特征,利用该BOW特征训练分类器,并将第五步得到的BOW特征输入分类器,当第五步得到的BOW特征被分类器预测为是时,则该BOW特征所对应的镜头就是新闻视频中的正式独白镜头。
与现有技术相比,本发明的有益效果是:在不影响检测效果的前提下先使用运算简单的步骤过滤掉不合格的镜头,使后面运算量大的步骤有尽可能少的候选镜头,从而大大减少了计算时间,提高了检索的效率;通过技术已经非常成熟的人脸识别技术准确识别出正面上半身躯干的位置并提取BOW特征,将人物特征在检测中充分合理利用,使背景等其它变化多样的干扰信息不再干扰检测结果,从而大大提高了检测的准确率。
附图说明
图1是实施例得到的四个包含人脸的镜头;
其中:(a)、(b)、(c)和(d)分别是实施例得到的包含人脸的镜头。
图2是图1中距离镜头中心最近的人的上半身区域;
其中:(a)是图1(a)中距离镜头中心最近的人的上半身区域;(b)是图1(b)中距离镜头中心最近的人的上半身区域;(c)是图1(c)中距离镜头中心最近的人的上半身区域;(d)是是图1(d)中距离镜头中心最近的人的上半身区域。
图3是实施例建立的训练库中的若干图像;
其中:左侧两列图像中距离镜头中心最近的人物的上半身区域图像是负样本图像;右侧两列图像中距离镜头中心最近的人物的上半身区域图像是正样本图像。
具体实施方式
下面结合附图对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
本实施例包括以下步骤:
第一步,输入一段新闻视频,对每帧图像按照顺序进行阿拉伯数字编号,使用镜头切变检测将视频分为若干镜头,去除其中持续时间小于阈值T1的镜头,并提取剩余的每个镜头的中间帧。
所述的镜头切变检测,是:根据下面的公式得到新闻视频中相邻的两帧的帧差异值,当相邻两帧的帧差异值大于阈值T2时,则这两帧分别作为一个镜头的最后一帧和另一个镜头的第一帧,具体公式为:
z ( k , k + l ) = 1 MN Σ x = 1 M Σ y = 1 N | I k ( x , y ) - I k + l ( x , y ) | ,
其中:M和N分别是帧的水平和垂直方向的总的像素数,x和y分别是帧的水平和垂直方向的像素数,Ik(x,y)和Ik+l(x,y)分别是第k帧和第k+l帧在(x,y)处的亮度值。
本实施例中T2=75,T1=3s。
第二步,对关键帧进行人脸检测,并给检测到的人脸添加一个与人脸外切的方框,得到所有包括人脸的镜头,以画面右下角像素点为原点建立直角坐标系,得到包括人脸的镜头中每个人脸的位置信息。
所述的人脸检测是使用OpenCV的Haar分类器实现的,具体是:
a)使用CvHaarClassifierCascade数据类型载入训练文件,人脸检测的训练文件采用OpenCV自带的haarcascade frontalface alt2.xml(这个训练文件是OpenCV检测正面人脸效果最佳的一个);
b)调用cvLoadImage载入需要检测的关键帧,并转化为灰度模式(用于人脸识别);
c)调用cvHaarDetectObjects函数自动检测所有人脸对象,并将检测到的对象转换成“矩形”数据类型,即可得到人脸的位置和大小。
经过本步骤的处理后,去除了不含人脸的镜头,这些镜头不可能是正式独白的镜头,因此大量无关镜头被过滤。
第三步,选取包括人脸的镜头中距离该镜头中心最近的人脸,得到该人脸所在的方框在图像中的面积,当该方框面积与其所在整幅图像面积的比值大于阈值T3时,该包括人脸的镜头就是候选镜头。
本实施例中T3=0.02。
本实施例得到的包括人脸的镜头如图1(a)、图1(b)、图1(c)和图1(d)所示,其中的方框表示的是距离该镜头中心最近的人脸。
第四步,对候选镜头进行运动检测,得到每个候选镜头的运动强度,去除其中运动强度大于阈值T4的候选镜头。
所述的运动检测,是指:
M k = 1 T Σ i = b k e k M i k · En i k ,
其中: En i k = - Σ j = 1 n p i k ( j ) log ( p i k ( j ) ) ,
M i k = Σ u = 1 , v = 1 u = G , v = H | I i k ( u , v ) | ,
Mk是第k个镜头的运动强度,
Figure GDA0000022159220000064
是第k个镜头中编号为i的帧图像的运动强度,
Figure GDA0000022159220000065
是第k个镜头中编号为i的帧图像的运动方向的熵值,T为归一化常数,bk是第k个镜头的第一帧的编号,ek是第k个镜头的最后一帧的编号,(j)是第k个镜头中编号为i的帧图像的运动相位的分布概率,n是相位直方图的量化等级,
Figure GDA0000022159220000067
(u,v)是第k个镜头中编号为i的帧图像分辨率为(u,v)的像素点的运动矢量的幅值,G和H分别是图像序列的水平和垂直分辨率。
本实施例中T4=0.3。
第五步,对剩余的候选镜头关键帧中距离镜头中心最近的人的上半身区域进行BOW特征提取,得到剩余的候选镜头关键帧中距离镜头中心最近的人的上半身区域的BOW特征。
所述的人的上半身区域,具体是:以人物两肩为上边界、左右上臂为左右边界、电视台文字标题上边缘为下边界的矩形区域。
本实施例得到的距离镜头中心最近的人的上半身区域如图2所述,其中:图2(a)是图1(a)中距离镜头中心最近的人的上半身区域;图2(b)是图1(b)中距离镜头中心最近的人的上半身区域;图2(c)是图1(c)中距离镜头中心最近的人的上半身区域;图2(d)是图1(d)中距离镜头中心最近的人的上半身区域。
本实施例中利用人脸宽度与肩宽为1∶3的关系来确定人的上半身区域的宽度,人的上半身区域的上边缘与人脸的下边缘重合,上半身区域的下边缘与新闻文字标题栏的上边缘重合(标准新闻视频标题栏高度占画面总高度的20%以内)。
所述的BOW特征提取,具体是:
1)建立新闻视频正式独白镜头训练库,提取其中关键帧的距离镜头中心最近的人的上半身区域的SIFT特征,同时提取剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征,每个SIFT特征用128维向量表示,
2)使用K-means聚类方法将训练库的SIFT特征进行聚类,得到200维聚类中心;
3)将得到的剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征与聚类中心进行比较,从而得到剩余的候选镜头中距离镜头中心最近的人的上半身区域的BOW特征。
第六步,构建训练库,采用支持向量机对第五步得到的BOW特征进行判断处理,得到输入新闻视频中的正式独白镜头。
所述的构建训练库,具体是:人工选择新闻视频中的1000个正式独白镜头(正样本)和3000个非正式独白镜头(负样本),其中:正式独白镜头包括900张男性正式独白上半身图片和100个女性正式独白上半身图片,非正式独白镜头包括无关图片和人物上半身图片。
本实施例建立的训练库的若干图像如图3所示,其中:左侧两列图像中距离镜头中心最近的人物的上半身区域图像是负样本图像;右侧两列图像中距离镜头中心最近的人物的上半身区域图像是正样本图像。
为了提高检测准确率,本实施例定期向训练库中添加若干新出现的正式独白镜头中距离镜头中心最近的人的上半身区域的特征数据。
所述的判断处理,具体是:提取训练库中正式独白镜头中人物上半身图像的BOW特征,利用该BOW特征训练分类器,并将第五步得到的BOW特征输入分类器,当第五步得到的BOW特征被分类器预测为是时,则该BOW特征所对应的镜头就是新闻视频中的正式独白镜头。
本实施例使用libsvm中的easy.py全自动判断脚本进行分类器训练和分类器决策,脚本采用交叉验证方法自动选取最佳支持向量机参数。
经检测得到,图1所示的四个镜头中,图1(b)、图1(c)和图1(d)都是正式独白镜头。
经多次实验证明,本实施例检测新闻视频正式独白镜头的准确率高达86%。

Claims (10)

1.一种基于人物特征的新闻视频正式独白镜头的检测方法,其特征在于,包括以下步骤:
第一步,输入一段新闻视频,对每帧图像按照顺序进行阿拉伯数字编号,使用镜头切变检测将视频分为若干镜头,去除其中持续时间小于阈值T1的镜头,并提取剩余的每个镜头的关键帧;
第二步,对关键帧进行人脸检测,并给检测到的人脸添加一个与人脸外切的方框,得到所有包括人脸的镜头,以画面右下角像素点为原点建立直角坐标系,得到包括人脸的镜头中每个人脸的位置信息;
第三步,选取包括人脸的镜头中距离该镜头中心最近的人脸,得到该人脸所在的方框在图像中的面积,当该方框面积与其所在整幅图像面积的比值大于阈值T3时,该包括人脸的镜头就是候选镜头;
第四步,对候选镜头进行运动检测,得到每个候选镜头的运动强度,去除其中运动强度大于阈值T4的候选镜头;
第五步,对剩余的候选镜头中距离镜头中心最近的人的上半身区域进行BOW特征提取,得到剩余的候选镜头中距离镜头中心最近的人的上半身区域的BOW特征;
第六步,构建训练库,采用支持向量机对第五步得到的BOW特征进行判断处理,得到输入新闻视频中的正式独白镜头。
2.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第一步中所述的镜头切变检测,是指:根据下面的公式得到新闻视频中相邻的两帧的帧差异值,当相邻两帧的帧差异值大于阈值T2时,则这两帧分别作为一个镜头的最后一帧和另一个镜头的第一帧,具体公式为:
Figure FDA0000022159210000011
其中:M和N分别是帧的水平和垂直方向的总的像素数,x和y分别是帧的水平和垂直方向的像素数,Ik(x,y)和Ik+l(x,y)分别是第k帧和第k+l帧在(x,y)处的亮度值。 
3.根据权利要求2所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,所述的阈值T2的取值范围是:65≤T2≤85。
4.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第一步中所述的阈值T1的取值范围是:2s≤T1≤4s。
5.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第三步中所述的阈值T3的取值范围是:0.015≤T3≤0.025。
6.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第四步中所述的运动检测,是指:
Figure FDA0000022159210000021
其中:
Figure FDA0000022159210000023
Mk是第k个镜头的运动强度, 
Figure FDA0000022159210000024
是第k个镜头中编号为i的帧图像的运动强度, 
Figure FDA0000022159210000025
是第k个镜头中编号为i的帧图像的运动方向的熵值,T为归一化常数,bk是第k个镜头的第一帧的编号,ek是第k个镜头的最后一帧的编号, 
Figure FDA0000022159210000026
是第k个镜头中编号为i的帧图像的运动相位的分布概率,n是相位直方图的量化等级, 
Figure FDA0000022159210000027
是第k个镜头中编号为i的帧图像分辨率为(u,v)的像素点的运动矢量的幅值,G和H分别是图像序列的水平和垂直分辨率。
7.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第四步中所述的阈值T4的取值范围是:0.25≤T4≤0.35。
8.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是, 第五步中所述的人的上半身区域,是指:以人物两肩为上边界、左右上臂为左右边界、电视台文字标题上边缘为下边界的矩形区域。
9.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第五步中所述的BOW特征提取,是指:
1)建立新闻视频正式独白镜头训练库,提取其中关键帧的距离镜头中心最近的人的上半身区域的SIFT特征,同时提取剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征;
2)使用K-means聚类方法将训练库的SIFT特征进行聚类,得到若干维聚类中心;
3)将得到的剩余的候选镜头中距离镜头中心最近的人的上半身区域的SIFT特征与聚类中心进行比较,从而得到剩余的候选镜头中距离镜头中心最近的人的上半身区域的BOW特征。
10.根据权利要求1所述的基于人物特征的新闻视频正式独白镜头的检测方法,其特征是,第六步中所述的判断处理,具体是:提取训练库中正式独白镜头中人物上半身图像的BOW特征,利用该BOW特征训练分类器,并将第五步得到的BOW特征输入分类器,当第五步得到的BOW特征被分类器预测为是时,则该BOW特征所对应的镜头就是新闻视频中的正式独白镜头。 
CN2010101949326A 2010-06-08 2010-06-08 基于人物特征的新闻视频正式独白镜头的检测方法 Expired - Fee Related CN101867729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101949326A CN101867729B (zh) 2010-06-08 2010-06-08 基于人物特征的新闻视频正式独白镜头的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101949326A CN101867729B (zh) 2010-06-08 2010-06-08 基于人物特征的新闻视频正式独白镜头的检测方法

Publications (2)

Publication Number Publication Date
CN101867729A CN101867729A (zh) 2010-10-20
CN101867729B true CN101867729B (zh) 2011-09-28

Family

ID=42959267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101949326A Expired - Fee Related CN101867729B (zh) 2010-06-08 2010-06-08 基于人物特征的新闻视频正式独白镜头的检测方法

Country Status (1)

Country Link
CN (1) CN101867729B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098449B (zh) * 2010-12-06 2016-08-03 北京邮电大学 一种利用标志检测进行电视节目内部自动分割的方法
CN106658169B (zh) * 2016-12-18 2019-06-07 北京工业大学 一种基于深度学习多层次分割新闻视频的通用方法
CN108875470B (zh) * 2017-06-19 2021-06-22 北京旷视科技有限公司 对访客进行登记的方法、装置及计算机存储介质
CN108551584B (zh) * 2018-05-17 2021-03-16 北京奇艺世纪科技有限公司 一种新闻分割的方法及装置
CN110363066A (zh) * 2019-05-23 2019-10-22 闽南师范大学 利用物联网和led混光技术的情绪自动识别调整方法
CN116912596B (zh) * 2023-08-04 2024-03-22 无锡学院 一种多源数据归一化处理与融合的方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763899B1 (ko) * 2004-02-20 2007-10-05 삼성전자주식회사 앵커 샷 검출 방법 및 장치
CN101026695A (zh) * 2006-02-21 2007-08-29 广州市纽帝亚资讯科技有限公司 基于新闻视频结构特征的口播帧自动提取方法与系统
CN100545856C (zh) * 2006-10-11 2009-09-30 北京新岸线网络技术有限公司 视频内容分析系统

Also Published As

Publication number Publication date
CN101867729A (zh) 2010-10-20

Similar Documents

Publication Publication Date Title
CN101867729B (zh) 基于人物特征的新闻视频正式独白镜头的检测方法
US20190188528A1 (en) Text detection method and apparatus, and storage medium
CN102163284B (zh) 面向中文环境的复杂场景文本定位方法
CN100527156C (zh) 一种图片文字检测的方法
CN105516802B (zh) 多特征融合的新闻视频摘要提取方法
CN114067143B (zh) 一种基于双子网络的车辆重识别方法
CN104244073B (zh) 一种视频中滚动字幕的自动检测和识别方法
CN104063883A (zh) 一种基于对象和关键帧相结合的监控视频摘要生成方法
CN101551852B (zh) 训练系统、训练方法和检测方法
CN102332096A (zh) 一种视频字幕文本提取和识别的方法
CN105488519B (zh) 一种基于视频尺度信息的视频分类方法
CN103679168A (zh) 文字区域检测方法及装置
CN101266654A (zh) 基于连通分量和支持向量机的图像文本定位方法和装置
CN102930287A (zh) 一种针对俯视行人的检测计数系统及方法
CN109961037A (zh) 一种考场视频监控异常行为特征识别方法
Yang et al. Spatiotemporal trident networks: detection and localization of object removal tampering in video passive forensics
CN104036243A (zh) 一种基于光流信息的行为识别方法
CN101365072A (zh) 字幕区域提取装置和方法
CN102915433A (zh) 基于字符组合的车牌定位和识别方法
CN103020606A (zh) 一种基于时空上下文信息的行人检测方法
CN103699895A (zh) 一种视频中文字的检测与提取方法
CN104463232A (zh) 一种基于hog特征和颜色直方图特征的密度人群计数的方法
CN106709438A (zh) 一种基于视频会议的人数统计方法
CN114187664B (zh) 一种基于人工智能的跳绳计数系统
CN108363771B (zh) 一种面向公安侦查应用的图像检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110928

Termination date: 20140608

EXPY Termination of patent right or utility model