CN109410198A - 一种时序动作检测方法、装置及设备 - Google Patents

一种时序动作检测方法、装置及设备 Download PDF

Info

Publication number
CN109410198A
CN109410198A CN201811252180.7A CN201811252180A CN109410198A CN 109410198 A CN109410198 A CN 109410198A CN 201811252180 A CN201811252180 A CN 201811252180A CN 109410198 A CN109410198 A CN 109410198A
Authority
CN
China
Prior art keywords
video
sets
video frame
value
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811252180.7A
Other languages
English (en)
Other versions
CN109410198B (zh
Inventor
刘洁
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201811252180.7A priority Critical patent/CN109410198B/zh
Publication of CN109410198A publication Critical patent/CN109410198A/zh
Application granted granted Critical
Publication of CN109410198B publication Critical patent/CN109410198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供了一种时序动作检测方法、装置及设备,该方法包括:通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;对计算得到的时序关系值进行求和得到和值;在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。应用本发明实施例提供的各个方案能够检测视频中物体所产生动作。

Description

一种时序动作检测方法、装置及设备
技术领域
本发明涉及视频处理技术领域,特别是涉及一种时序动作检测方法、装置及设备。
背景技术
时序动作检测是指检测视频中物体产生的动作。时序动作检测是一个在计算机视觉中具有挑战性的课题,同时也具有广阔的应用前景。比如,在视频监控中,需要对监控场景的监控视频进行时序动作检测,进而检测出监控场景中物体的动作,当发现监控场景中的物体产生异常动作时,发出警报。可见,对视频进行时序动作检测,进而检测出视频中物体产生的动作具有重要的意义。
发明内容
本发明实施例的目的在于提供一种时序动作检测方法、装置及设备,以实现检测视频中物体所产生动作。具体技术方案如下:
本发明实施的一方面,提供了一种时序动作检测方法,所述方法包括:
通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
对计算得到的时序关系值进行求和得到和值;
在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
可选的,所述从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值的步骤,包括:
设置第一数量为预设的视频帧数量初始值;
从所述视频片段包含的视频帧中选取所述第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
将所述第一数量累加预设的视频帧数量变化步长;
从所述视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
在已得到视频帧集合的数量未达到所述第一预设值的情况下,判断累加后第一数量是否达到第二预设值;
若为否,返回执行所述将所述第一数量累加预设的视频帧数量变化步长的步骤;
若为是,返回执行所述设置第一数量为预设的视频帧数量初始值的步骤。
可选的,所述对计算得到的时序关系的值进行求和得到和值的步骤,包括:
获取所得到的各个视频帧集合的权值,其中,包含视频帧数量相同的视频帧集合的权值相同;
使用所获得的权值,对计算得到的时序关系值进行加权求和得到所述和值。
可选的,视频帧集合的权值是根据视频帧集合所包含的视频帧数量确定的,其中,包含的视频帧数量越多的视频帧集合的权值越大。
可选的,利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
本发明实施的又一方面,还提供了一种时序动作检测装置,所述装置包括:
确定模块,用于通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
选取模块,用于从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
求和模块,用于对计算得到的时序关系值进行求和得到和值;
获得模块,用于在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
可选的,所述选取模块,包括:
设置子模块,用于设置第一数量为预设的视频帧数量初始值;
第一选取子模块,用于从所述视频片段包含的视频帧中选取所述第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
累加子模块,用于将所述第一数量累加预设的视频帧数量变化步长;
第二选取子模块,用于从所述视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
判断子模块,用于在已得到视频帧集合的数量未达到所述第一预设值的情况下,判断累加后第一数量是否达到第二预设值,在判断结果为否时触发累加子模块,在判断结果为是触发设置子模块。
可选的,所述求和模块,包括:
获取子模块,用于获取所得到的各个视频帧集合的权值,其中,包含视频帧数量相同的视频帧集合的权值相同;
求和子模块,用于使用所获得的权值,对计算得到的时序关系值进行加权求和得到所述和值。
可选的,视频帧集合的权值是根据视频帧集合所包含的视频帧数量确定的,其中,包含的视频帧数量越多的视频帧集合的权值越大。
可选的,利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,执行上述任一所述的时序动作检测方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的时序动作检测方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的时序动作检测方法。
本发明实施例提供的时序动作检测方法、装置及设备,可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的各个方案能够检测视频中物体所产生动作。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种时序动作检测方法的流程示意图;
图2为本发明实施例提供的一种时序动作检测装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
参见图1,示出了本发明实施例提供的一种时序动作检测方法的流程示意图,该方法包括:
S100,通过遍历视频中包含的视频帧,确定视频中记录有物体所产生动作的视频片段。
上述物体可以为出现在视频中的人物、动物等。
上述物体所产生的动作也就是物体在进行某一项活动时而产生的相应地动作,比如,人在进行踢球活动时产生的踢球地动作。
具体的,可以按照播放顺序遍历视频包含的视频帧,在遍历每一视频帧的过程中分析视频帧中是否记录有物体产生动作的内容,这样在遍历视频中的视频帧后,可以确定出记录有物体所产生动作的视频帧,然后将物体产生动作的并连续的视频帧确定为视频片段。
而由于动作识别本身就是一个多分类问题,所以可以利用交叉熵损失函数来评判用于确定视频中记录有物体所产生动作的视频片段的检测模型的检测效果,从而能够根据得到的检测效果对检测模型进行优化。具体的,利用预先裁剪好的包含物体产生动作的视频片段对检测模型进行训练,得到各个视频片段对应的交叉熵损失,并利用得到的交叉熵损失来对检测模型进行优化,直到得到的检测效果符合预期时,也就得到了最终的检测模型。相应地,在得到检测模型并利用检测模型确定视频中记录有物体所产生动作的视频片段时,可以利用检测模型确定该视频中交叉熵损失大于设定阈值的连续的视频帧作为产生动作的视频片段。
S110,从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,时序关系值表示视频帧之间在时间域的变化程度。
第一预设值可以根据对时序动作检测结果的准确性的需求来确定,所选取的视频帧集合越多,最终对计算得到的时序关系值进行求和得到和值的置信度越高。
时序关系值也就是表示视频帧之间在时间域的像素点的变化情况,相应地也就需要一个视频帧集合中包含的视频帧中则不能有重复的视频帧。
具体的,可以利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
S120,对计算得到的时序关系值进行求和得到和值。
一种实现方式中,可以将计算得到时序关系值直接相加得到和值;另一种实现方式中,预先为视频帧集合分配权值并且包含视频帧数量相同的视频帧集合的权值相同,相应地,在计算得到的时序关系值进行求和得到和值的过程中,则需要将计算得到的各个时序关系值乘以对应的权值之后在相加得到和值。
一种实现方式中,在为视频帧集合分配权值时,可以根据包含视频帧数量相同的视频帧集合的个数确定视频帧集合的权值,包含视频帧数量相同的视频帧集合的个数越多则视频帧集合的权值越大;
还可以根据视频帧集合所包含的视频帧数量确定的视频帧集合的权值,包含的视频帧数量越多的视频帧集合的权值越大。由于视频帧集合中包含的视频帧的数量越多,计算得到的时序关系值所能表示的视频片段中视频帧之间在时间域变化程度的情况越全面,因此,加大包含的视频帧数量多的视频帧集合的权值能够提高时序动作检测结果的准确性。
S130,在预先建立的动作识别数据库中查找与和值相匹配的动作,获得时序动作检测结果。
动作识别数据库中存储有多个视频片段,而每个视频片段中记录物体所产生的一种动作,并且每个视频片段对应有预先计算好的视频帧之间的时序关系值,因此,在获得动作检测结果时,可以在动作数据库中找到与和值的差值在预设范围内的时序关系值,然后将与所找到的时序关系值对应的视频片段中记录的物体产生的动作作为检测结果。
本发明实施例一种实现方式中,上述gθ和hΦ可以利用MLP(Multi-LayerPerceptron,多层感知器)来确定。
本发明实施例一种实现方式中,上述从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值时,一种实现方式中,可以从视频片段包含的视频帧中随机选取视频帧得到一个视频帧集合,直至选取第一预设值个视频帧集合后,计算每个视频帧集合中视频帧之间的时序关系值;。
另一种实现方式中,可以包括以下步骤:
步骤一,设置第一数量为预设的视频帧数量初始值;
步骤二,从视频片段包含的视频帧中选取第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
步骤三,将第一数量累加预设的视频帧数量变化步长;
步骤四,从视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
步骤五,在已得到视频帧集合的数量未达到第一预设值的情况下,判断累加后第一数量是否达到第二预设值,在判断结果为否时返回步骤三,在判断结果为是时返回步骤一;
在从视频片段包含的视频帧中选取第一数量帧视频帧得到一个视频帧集合的过程中,如果已得到视频帧集合的数量达到第一预设值则结束选取。
第一数量也就是从视频片段包含的视频帧中选取视频帧的数量。
视频帧数量初始值和第二预设值可以根据对时序动作检测结果的准确性的需求来确定,视频帧数量初始值越小且第二预设值越大,视频帧集合中包含视频帧的数量情况越丰富,最终对计算得到的时序关系值进行求和得到和值的置信度越高。
视频帧数量变化步长可以根据对时序动作检测结果的准确性的需求来确定,视频帧数量变化步长越小,视频帧集合中包含视频帧的数量情况越丰富,最终对计算得到的时序关系值进行求和得到和值的置信度越高。
以下以一具体实施例对上述第二种实现方式中从视频片段包含的视频帧中选取第一预设值个视频帧集合并计算所得到的视频帧集合中视频帧之间的时序关系值的过程进行说明:
设定第一预设值为15,视频帧数量初始值为2,视频帧数量变化步长为1,第二预设值为9;
从视频片段包含的视频帧中选取2帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
得到视频帧集合的数量为1小于15,并且2+1=3小于9,从视频片段包含的视频帧中选取3帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
得到视频帧集合的数量为2小于15,并且3+1=4小于9,从视频片段包含的视频帧中选取4帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
直至得到视频帧集合的数量为7时,也就是从视频片段包含的视频帧中选取8帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值之后,此时,7小于15,但是8+1=9也就是达到了第二预设值9,此时,设置第一数量为2,
继续从视频片段包含的视频帧中选取2帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
得到视频帧集合的数量为8小于15,并且2+1=3小于9,从视频片段包含的视频帧中选取3帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
直至得到视频帧集合的数量为14时,也就是再次从视频片段包含的视频帧中选取8帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值之后,此时,14小于15,但是8+1=9也就是达到第二预设值9,此时,设置第一数量为2,
继续从视频片段包含的视频帧中选取2帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
此时得到的视频帧的数量为15,结束选取。
本发明实施例提供的各个方案中,时序动作检测方法可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的方案进行时序动作检测时,能够检测视频中物体所产生动作。
参见图2,示出了本发明实施例提的一种时序动作检测装置的结构示意图,该装置包括:
确定模块200,用于通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
选取模块210,用于从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
求和模块220,用于对计算得到的时序关系值进行求和得到和值;
获得模块230,用于在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
本发明实施例一种实现方式中,所述选取模块210,包括:
设置子模块,用于设置第一数量为预设的视频帧数量初始值;
第一选取子模块,用于从所述视频片段包含的视频帧中选取所述第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
累加子模块,用于将所述第一数量累加预设的视频帧数量变化步长;
第二选取子模块,用于从所述视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
判断子模块,用于在已得到视频帧集合的数量未达到所述第一预设值的情况下,判断累加后第一数量是否达到第二预设值,在判断结果为否时触发累加子模块,在判断结果为是触发设置子模块。
本发明实施例一种实现方式中,所述求和模块220,包括:
获取子模块,用于获取所得到的各个视频帧集合的权值,其中,包含视频帧数量相同的视频帧集合的权值相同;
求和子模块,用于使用所获得的权值,对计算得到的时序关系值进行加权求和得到所述和值。
本发明实施例一种实现方式中,每个视频帧集合的权值是根据视频帧集合所包含的视频帧数量确定的,其中,包含的视频帧数量越多的视频帧集合的权值越大。
本发明实施例一种实现方式中,利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
本发明实施例提供的各个方案中,时序动作检测装置可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的方案进行时序动作检测时,能够检测视频中物体所产生动作。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器001、通信接口002、存储器003和通信总线004,其中,处理器001,通信接口002,存储器003通过通信总线004完成相互间的通信,
存储器003,用于存放计算机程序;
处理器001,用于执行存储器003上所存放的程序时,实现本发明实施例提供的时序动作检测方法。
具体的,上述时序动作检测方法包括:
通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
对计算得到的时序关系值进行求和得到和值;
在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
需要说明的是,上述处理器001执行存储器003上所存放的程序实现时序动作检测方法的其他实施例,与前述方法实施例部分提供的实施例相同,这里不再赘述。
本发明实施例提供的各个方案中,电子设备可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的方案进行时序动作检测时,能够检测视频中物体所产生动作。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral PomponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Ne twork Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Applica tion SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,实现本发明实施例提供的时序动作检测方法。
具体的,上述时序动作检测方法包括:
通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
对计算得到的时序关系值进行求和得到和值;
在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
需要说明的是,通过上述计算机可读存储介质实现时序动作检测方法的其他实施例,与前述方法实施例部分提供的实施例相同,这里不再赘述。
本发明实施例提供的各个方案中,计算机可读存储介质可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的方案进行时序动作检测时,能够检测视频中物体所产生动作。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,实现本发明实施例提供的时序动作检测方法。
具体的,上述时序动作检测方法包括:
通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
对计算得到的时序关系值进行求和得到和值;
在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
需要说明的是,通过上述计算机程序产品实现时序动作检测方法的其他实施例,与前述方法实施例部分提供的实施例相同,这里不再赘述。
本发明实施例提供的各个方案中,计算机程序产品可以通过遍历视频中包含的视频帧,来确定视频中记录有物体所产生动作的视频片段;从视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值;对计算得到的时序关系值进行求和得到和值后,在预先建立的动作识别数据库中查找与和值相匹配的动作,从而获得时序动作检测结果。应用本发明实施例提供的方案进行时序动作检测时,能够检测视频中物体所产生动作。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种时序动作检测方法,其特征在于,所述方法包括:
通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
对计算得到的时序关系值进行求和得到和值;
在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
2.如权利要求1所述的方法,其特征在于,所述从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值的步骤,包括:
设置第一数量为预设的视频帧数量初始值;
从所述视频片段包含的视频帧中选取所述第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
将所述第一数量累加预设的视频帧数量变化步长;
从所述视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
在已得到视频帧集合的数量未达到所述第一预设值的情况下,判断累加后第一数量是否达到第二预设值;
若为否,返回执行所述将所述第一数量累加预设的视频帧数量变化步长的步骤;
若为是,返回执行所述设置第一数量为预设的视频帧数量初始值的步骤。
3.如权利要求1所述的方法,其特征在于,所述对计算得到的时序关系的值进行求和得到和值的步骤,包括:
获取所得到的各个视频帧集合的权值,其中,包含视频帧数量相同的视频帧集合的权值相同;
使用所获得的权值,对计算得到的时序关系值进行加权求和得到所述和值。
4.如权利要求3所述的方法,其特征在于,视频帧集合的权值是根据视频帧集合所包含的视频帧数量确定的,其中,包含的视频帧数量越多的视频帧集合的权值越大。
5.如权利要求1-4任一项所述的方法,其特征在于,利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
6.一种时序动作检测装置,其特征在于,所述装置包括:
确定模块,用于通过遍历视频中包含的视频帧,确定所述视频中记录有物体所产生动作的视频片段;
选取模块,用于从所述视频片段包含的视频帧中选取第一预设值个视频帧集合,并计算每个视频帧集合中视频帧之间的时序关系值,其中,每个视频帧集合包括至少两帧视频帧,所述时序关系值表示视频帧之间在时间域的变化程度;
求和模块,用于对计算得到的时序关系值进行求和得到和值;
获得模块,用于在预先建立的动作识别数据库中查找与所述和值相匹配的动作,获得时序动作检测结果。
7.如权利要求6所述的装置,其特征在于,所述选取模块,包括:
设置子模块,用于设置第一数量为预设的视频帧数量初始值;
第一选取子模块,用于从所述视频片段包含的视频帧中选取所述第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
累加子模块,用于将所述第一数量累加预设的视频帧数量变化步长;
第二选取子模块,用于从所述视频片段包含的视频帧中选取累加后第一数量帧视频帧得到一个视频帧集合,并计算所得到的视频帧集合中视频帧之间的时序关系值;
判断子模块,用于在已得到视频帧集合的数量未达到所述第一预设值的情况下,判断累加后第一数量是否达到第二预设值,在判断结果为否时触发累加子模块,在判断结果为是触发设置子模块。
8.如权利要求6所述的装置,其特征在于,所述求和模块,包括:
获取子模块,用于获取所得到的各个视频帧集合的权值,其中,包含视频帧数量相同的视频帧集合的权值相同;
求和子模块,用于使用所获得的权值,对计算得到的时序关系值进行加权求和得到所述和值。
9.如权利要求8所述的装置,其特征在于,视频帧集合的权值是根据视频帧集合所包含的视频帧数量确定的,其中,包含的视频帧数量越多的视频帧集合的权值越大。
10.如权利要求6-9任一项所述的装置,其特征在于,利用以下公式计算每组视频帧集合中视频帧之间的时序关系值:
其中,Tn(V)表示视频帧之间的时序关系值,i、j……n表示视频帧集合中的视频帧在所述视频中的帧号,fi、fj、fn分别表示帧号为i、j、n的视频帧的时间特征,gθ表示预设的关系矩阵,hΦ表示用于对视频帧间的时序关系进行融合的函数。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
CN201811252180.7A 2018-10-25 2018-10-25 一种时序动作检测方法、装置及设备 Active CN109410198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811252180.7A CN109410198B (zh) 2018-10-25 2018-10-25 一种时序动作检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811252180.7A CN109410198B (zh) 2018-10-25 2018-10-25 一种时序动作检测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109410198A true CN109410198A (zh) 2019-03-01
CN109410198B CN109410198B (zh) 2022-04-22

Family

ID=65469880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811252180.7A Active CN109410198B (zh) 2018-10-25 2018-10-25 一种时序动作检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109410198B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097008A (zh) * 2019-04-30 2019-08-06 苏州大学 一种人体动作识别方法
CN110119757A (zh) * 2019-03-28 2019-08-13 北京奇艺世纪科技有限公司 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质
CN110838353A (zh) * 2019-10-11 2020-02-25 科大讯飞(苏州)科技有限公司 动作匹配方法及相关产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108241849A (zh) * 2017-08-28 2018-07-03 北方工业大学 基于视频的人体交互动作识别方法
WO2018130890A1 (en) * 2017-01-11 2018-07-19 International Business Machines Corporation Learning apparatus and method for bidirectional learning of predictive model based on data sequence
CN108307113A (zh) * 2018-01-26 2018-07-20 北京图森未来科技有限公司 图像采集方法、图像采集控制方法及相关装置
CN108416013A (zh) * 2018-03-02 2018-08-17 北京奇艺世纪科技有限公司 视频匹配、检索、分类和推荐方法、装置及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018130890A1 (en) * 2017-01-11 2018-07-19 International Business Machines Corporation Learning apparatus and method for bidirectional learning of predictive model based on data sequence
CN108241849A (zh) * 2017-08-28 2018-07-03 北方工业大学 基于视频的人体交互动作识别方法
CN108307113A (zh) * 2018-01-26 2018-07-20 北京图森未来科技有限公司 图像采集方法、图像采集控制方法及相关装置
CN108416013A (zh) * 2018-03-02 2018-08-17 北京奇艺世纪科技有限公司 视频匹配、检索、分类和推荐方法、装置及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119757A (zh) * 2019-03-28 2019-08-13 北京奇艺世纪科技有限公司 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质
CN110119757B (zh) * 2019-03-28 2021-05-25 北京奇艺世纪科技有限公司 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质
CN110097008A (zh) * 2019-04-30 2019-08-06 苏州大学 一种人体动作识别方法
CN110838353A (zh) * 2019-10-11 2020-02-25 科大讯飞(苏州)科技有限公司 动作匹配方法及相关产品
CN110838353B (zh) * 2019-10-11 2023-11-21 科大讯飞(苏州)科技有限公司 动作匹配方法及相关产品

Also Published As

Publication number Publication date
CN109410198B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN111815415B (zh) 一种商品推荐方法、系统及设备
CN104123332B (zh) 搜索结果的显示方法及装置
CN105022801B (zh) 一种热门视频挖掘方法和装置
US10270881B2 (en) Real-world user profiles via the internet of things
CN109410198A (zh) 一种时序动作检测方法、装置及设备
US7660792B2 (en) System and method for spam identification
US9292615B2 (en) Method and a system for analysing impact of changes to content of a website
CN106651901A (zh) 对象跟踪方法和设备
Mirzadeh et al. Feature selection methods for conversational recommender systems
US20160277800A1 (en) Providing service based on user operation behavior
US20200192930A1 (en) Method and device for assessing quality of multimedia resource
CN103744916A (zh) 一种用于确定目标视频的分享热度信息的方法与设备
CN109493592A (zh) 路径推荐方法及装置
Atzmueller Detecting community patterns capturing exceptional link trails
CN109672936A (zh) 一种视频评估集的确定方法、装置及电子设备
Guo et al. A nonparametric model for event discovery in the geospatial-temporal space
CN105574030A (zh) 一种信息搜索方法及装置
CN109740621A (zh) 一种视频分类方法、装置及设备
CN109508417A (zh) 推荐对象的方法、装置、电子设备及可读存储介质
CN107911447A (zh) 业务系统扩容方法及装置
CN109886300A (zh) 一种用户聚类方法、装置及设备
CN108830636A (zh) 一种活跃用户的询量方法和装置
US9171086B1 (en) Website duration performance based on category durations
KR101620659B1 (ko) 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법
CN110196920A (zh) 文本数据的处理方法和装置、以及存储介质和电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant