CN104112112A

CN104112112A - 识别动作的方法及其装置

Info

Publication number: CN104112112A
Application number: CN201310137272.1A
Authority: CN
Inventors: 廉士国; 宋星光; 胡伟
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2013-04-19
Filing date: 2013-04-19
Publication date: 2014-10-22

Abstract

本发明公开了一种识别动作的方法及其装置。该方法包括：根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；获取包括该当前视频帧的动作视频帧序列；识别该动作视频帧序列中的目标动作。根据本发明实施例的识别动作的方法及其装置，通过视觉传感器和动作传感器共同识别动作，且由动作传感器检测到触发动作来启动动作识别过程，从而能够为动作识别提供更为精确的背景和前景确定机会，提高对动作识别的识别能力和识别精度；此外，由于只有在动作传感器检测到触发动作时，动作识别设备才会启动动作识别过程，从而能够降低由于一直进行动作识别而造成的资源消耗，提高用户体验。

Description

识别动作的方法及其装置

技术领域

本发明实施例涉及人机交互领域，并且更具体地，涉及识别动作的方法及其装置。

背景技术

现有技术中，移动终端一般采用摄像头等视觉方法来识别空间动作，例如，空间手势，然而，基于视觉的方法计算复杂度高，由于没有基准画面，所以很难区分背景和前景，人手与人脸可能重合难辨，因此识别准确度较低。此外，移动终端(包括视觉摄像头)可能经常移动，会给视觉识别带来很大困难。如果移动终端长期保持待机识别状态，会极大地耗费其能量消耗，用户体验较差。

发明内容

本发明实施例提供了一种识别动作的方法及其装置，能够提高动作识别能力和识别精度。

第一方面，提供了一种识别动作的方法，包括：根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；获取包括该当前视频帧的动作视频帧序列；识别该动作视频帧序列中的目标动作。

结合第一方面，在第一种可能的实现方式中，该识别该动作视频帧序列中的目标动作，包括：获取M个静态视频帧，该M个静态视频帧与该动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；根据该M个静态视频帧，确定该动作视频帧序列的目标背景帧；根据该目标背景帧，识别该动作视频帧序列中的目标动作。

结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，该根据该M个静态视频帧，确定该动作视频帧序列的目标背景帧，包括：确定该M个静态视频帧的设备运动信息，该静态视频帧的设备运动信息用于表示动作识别设备在采集该静态视频帧时的运动状态；根据该M个静态视频帧的设备运动信息，确定该目标背景帧。

结合第一方面的第二种可能的实现方式，在第三种可能的实现方式中，该根据该M个静态视频帧的设备运动信息，确定该目标背景帧，包括：根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，该M个静态视频帧包括该第一静态视频帧和该第二静态视频帧，该第一静态视频帧和该第二静态视频帧构成第一相邻帧；当该第一设备相对运动值大于零且小于第一运动补偿阈值时，对该第一静态视频帧和该第二静态视频帧中的其中一帧进行运动补偿；根据该运动补偿后的该第一相邻帧，确定该第一相邻帧的帧差；根据该第一相邻帧的帧差，确定该目标背景帧。

结合第一方面或结合第一方面的第一种至第三种可能的实现方式中的任一种可能的实现方式，在第四种可能的实现方式中，该识别该动作视频帧序列中的目标动作，包括：确定该动作视频帧序列中的视频帧的设备运动信息，该视频帧的设备运动信息用于表示动作识别设备在采集该视频帧时的运动状态；根据该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作。

结合第一方面的第四种可能的实现方式，在第五种可能的实现方式中，该根据该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作，包括：根据该动作视频帧序列包括的第一视频帧的设备运动信息和该目标背景帧的设备运动信息，确定第二设备相对运动值；当该第二设备相对运动值大于第二运动补偿阈值时，对该第一视频帧和该目标背景帧中的其中一帧进行运动补偿；根据该其中一帧进行运动补偿后的该第一视频帧和该目标背景帧，确定该第一视频帧中的前景信息；根据该第一视频帧中的前景信息，识别该目标动作。

第二方面，提供了一种动作识别设备，包括：确定模块，用于根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；获取模块，用于获取包括该确定模块确定包括动作的该当前视频帧的动作视频帧序列；识别模块，用于识别该获取模块获取的该动作视频帧序列中的目标动作。

结合第二方面，在第一种可能的实现方式中，该识别模块包括：获取单元，用于获取M个静态视频帧，该M个静态视频帧与该动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；第一确定单元，用于根据该获取单元获取的该M个静态视频帧，确定该动作视频帧序列的目标背景帧；第一识别单元，用于根据该第一确定单元确定的该目标背景帧，识别该动作视频帧序列中的目标动作。

结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，该第一确定单元具体用于确定该M个静态视频帧的设备运动信息，该静态视频帧的设备运动信息用于表示动作识别设备在采集该静态视频帧时的运动状态，以及根据该M个静态视频帧的设备运动信息，确定该目标背景帧。

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，该第一确定单元包括：第一确定子单元，用于根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，该M个静态视频帧包括该第一静态视频帧和该第二静态视频帧，该第一静态视频帧和该第二静态视频帧构成第一相邻帧；运动补偿子单元，用于当该第一确定子单元确定的该第一设备相对运动值大于零且小于第一运动补偿阈值时，对该第一静态视频帧和该第二静态视频帧中的其中一帧进行运动补偿；第二确定子单元，用于根据该运动补偿子单元进行运动补偿后的该第一相邻帧，确定该第一相邻帧的帧差；第三确定子单元，用于根据该第二确定子单元确定的该第一相邻帧的帧差，确定该目标背景帧。

结合第二方面或结合第二方面的第一种至第三种可能的实现方式中的任一种可能的实现方式，在第四种可能的实现方式中，该识别模块还包括：第二确定单元，用于确定该动作视频帧序列中的视频帧的设备运动信息，该视频帧的设备运动信息用于表示动作识别设备在采集该视频帧时的运动状态；第二识别单元，用于根据该第二确定单元确定的该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作。

结合第二方面的第四种可能的实现方式，在第五种可能的实现方式中，该第二识别单元包括：第一确定子单元，用于根据该动作视频帧序列包括的第一视频帧的设备运动信息和该目标背景帧的设备运动信息，确定第二设备相对运动值；运动补偿子单元，用于当该第一确定子单元确定的该第二设备相对运动值大于第二运动补偿阈值时，对该第一视频帧和该目标背景帧中的其中一帧进行运动补偿；第二确定子单元，用于根据该运动补偿子单元对其中一帧进行运动补偿后的该第一视频帧和该目标背景帧，确定该第一视频帧中的前景信息；识别子单元，用于根据该第二确定子单元确定的该第一视频帧中的前景信息，识别该目标动作。

基于上述技术方案，根据本发明实施例的识别动作的方法及其装置，通过视觉传感器和动作传感器共同识别动作，且由动作传感器检测到触发动作来启动动作识别过程，从而能够为动作识别提供更为精确的背景和前景确定机会，提高对动作识别的识别能力和识别精度；此外，由于只有在动作传感器检测到触发动作时，动作识别设备才会启动动作识别过程，从而能够降低由于一直进行动作识别而造成的资源消耗，提高用户体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的识别动作的方法的示意性流程图。

图2是本发明实施例的识别动作的方法的另一示意性流程图。

图3是本发明实施例的识别动作的方法的再一示意性流程图。

图4是本发明实施例的识别动作的方法的再一示意性流程图。

图5是本发明实施例的识别动作的方法的再一示意性流程图。

图6是本发明实施例的识别动作的方法的再一示意性流程图。

图7是本发明另一实施例的识别动作的方法的示意性流程图。

图8是根据本发明实施例的动作识别设备的示意性框图。

图9是根据本发明实施例的动作识别设备的识别模块的示意性框图。

图10是根据本发明实施例的动作识别设备的识别模块的第一确定单元的示意性框图。

图11是根据本发明实施例的动作识别设备的识别模块的另一示意性框图。

图12是根据本发明实施例的动作识别设备的识别模块的第二识别单元的示意性框图。

图13是根据本发明另一实施例的动作识别设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

应理解，本发明实施例的技术方案可以应用于各种基于硬件设备的动作识别，例如，对设备（包括屏幕）前手势动作的检测和识别，对设备（包括屏幕）后手势动作的检测和识别，对手持物体（如普通笔）在设备前移动的物体运动动作的识别等。具体的应用场景包括操控TV的手势识别、操控PC的手势识别、操控移动终端的手势识别等，但本发明实施例不限于此。

本发明实施例的核心思想是利用动作识别设备中的动作传感器和视觉传感器共同完成动作识别。该视觉传感器用于采集视觉画面，该动作传感器用于检测在动作检测区域内是否有动作发生，例如，手经过动作识别设备的屏幕上方，手的滑动、手的抓取动作、手持物体的移动，等等，该动作识别设备只有在该动作传感器在某一时间点检测到有动作发生时，才启动动作识别，从而能够提供准确的背景和前景，提高动作识别精度。其中，该视觉传感器可以是普通摄像头、或红外摄像头、或深度摄像头，等等；该动作传感器可以为下列传感器中的一种或多种：红外感应传感器、超声距离传感器、电磁场感应传感器和光线传感器，等等，但本发明实施例不限于此。

图1是本发明实施例的识别动作的方法100的示意性流程图，该方法可以由动作识别设备来执行，例如，移动终端，等等。如图1所示，该方法100包括：

S110，根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；

S120，获取包括该当前视频帧的动作视频帧序列；

S130，识别该动作视频帧序列中的目标动作。

因此，根据本发明实施例的识别动作的方法，通过视觉传感器和动作传感器共同识别动作，且由动作传感器检测到触发动作来启动动作识别过程，从而能够为动作识别提供更为精确的背景和前景确定机会，提高对动作识别的识别能力和识别精度；此外，由于只有在动作传感器检测到触发动作时，动作识别设备才会启动动作识别过程，从而能够降低由于一直进行动作识别而造成的资源消耗，提高用户体验。

应理解，本发明实施例的视频帧是指由视觉传感器在某一时刻采集到的视觉画面，这里可以将该视觉传感器在当前时刻采集到的视觉画面称为当前视频帧，具体地，该当前视频帧可以是由普通摄像头在当前时刻采集到的一个视觉画面，也可以是双目等立体摄像头在当前时刻采集到的不同角度的多个视觉画面，即当前时刻采集到的多个视频帧，还可以是由深度摄像头（例如体感设备Kinect等）采集到的带有深度信息的视觉画面，或带有深度信息的视觉画面与普通视觉画面的组合，但本发明实施例不限于此。

在S110中，动作传感器实时检测在动作检测区域内是否有动作发生，同时，该视觉传感器可以实时采集视频帧，动作识别设备可以将动作传感器在某一时刻的检测结果对应到视觉传感器在该时刻采集到的视频帧，从而确定该视频帧中是否包括动作。可选地，该视觉传感器也可以只有在该动作传感器检测到有动作发生时，才开始在预设时间段内采集视频帧，并确定其在当前时刻采集的视频帧，即当前视频帧中包括动作，但本发明实施例不限于此。

为了便于描述，本发明实施例中将包括动作的视频帧称为动作视频帧，而将不包括动作的视频帧称为静态视频帧。应理解，静态视频帧是指在该视频帧被采集的时刻，动作传感器未在动作检测区域检测到动作的发生，本发明实施例不限于此。

可选地，动作识别设备还可以将视觉传感器采集到的视频帧缓存，并且根据动作传感器的检测结果，为每个视频帧设置动作标识，该动作标识用于标识该视频帧中是否包括动作，即标识该视频帧为动作视频帧还是静态视频帧。具体地，该动作识别设备可以将动作视频帧的动作标识设置为1，并将静态视频帧的动作标识设备设置为0；可选地，该动作识别设备也可以将动作视频帧的动作标识设置为0，而将静态视频帧的动作标识设置为1；可选地，该动作识别设备还可以采用其它标准设置视频帧的动作标识，本发明实施例不限于此。

可选地，作为另一实施例，该动作识别设备也可以只为部分视频帧设置动作标识，例如，只为连续的动作视频帧序列和连续的静态视频帧序列之间的转换帧设置动作标识，例如，假设视频帧1～5为静态视频帧，视频帧6～15为动作视频帧，视频帧16～30为静态视频帧，则该动作识别设备可以为视频帧5设置动作标识0，为视频帧6设置动作标识1，为视频帧15设置动作标识1，为视频帧16设置动作标识0；可选地，该动作识别设备也可以为视频帧1设置动作标识0，为视频帧6设置动作标识1，为视频帧16设置动作标识0，等等，本发明实施例不限于此。所有能够确定每个视频帧为静态视频帧还是动作视频帧的动作标识的设置方法，都在本发明实施例的保护范围之内。

在S120中，该动作识别设备获取包括该当前视频帧在内的动作视频帧序列。具体地，该动作识别设备可以从当前视频帧开始，连续获取下一视频帧，直到下一视频帧为静态视频帧为止，这些动作视频帧构成动作视频帧序列；可选地，该动作识别设备也可以从当前视频帧开始，在预设时间内以一预设步长采集若干个视频帧构成动作视频帧序列，其中，该预设步长可以为1或大于1的预设整数；可选地，该动作识别设备还可以从当前视频帧开始，以一预设步长采集预设个数的视频帧构成动作视频帧序列，其中，该预设步长可以为1或大于1的预设整数；可选地，该动作识别设备还可以从该当前视频帧的前几帧中的某一帧作为该动作视频帧序列的起始帧，使用上述方式中的任一种方式获取该动作视频帧序列，但本发明实施例不限于此。

在S130中，该动作识别设备可以通过多种方式确定该动作视频帧序列中的目标动作。可选地，该动作识别设备可以确定该动作视频帧序列的目标背景帧，并根据该目标背景帧确定该动作视频帧序列中的视频帧的前景信息，进而根据该动作视频帧序列中的视频帧的前景信息，识别该目标动作；可选地，该动作识别设备也可以采用其它方法识别该目标动作，本发明实施例不限于此。

可选地，如图2所示，130，识别该动作视频帧序列中的目标动作，包括：

S131，获取M个静态视频帧，该M个静态视频帧与该动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；

S132，根据该M个静态视频帧，确定该动作视频帧序列的目标背景帧；

S133，根据该目标背景帧，识别该动作视频帧序列中的目标动作。

其中，在S131中，该M个静态视频帧可以是连续采集的静态视频帧，也可以是以一定步长采集的静态视频帧。该M个静态视频帧可以是采集于该动作视频帧序列之前或之后的静态视频帧，一种优选方式为采用在该动作视频帧序列之前采集的且与该动作视频帧序列相邻的M个静态视频帧，来确定该目标背景帧，由于该优选方式中确定的目标背景帧与该动作视频帧序列的背景更接近，因此可以提高动作识别的精度，但本发明实施例不限于此。

在S132中，该动作识别设备可以通过多种方式确定该目标背景帧。可选地，该动作识别设备可以确定该M个静态视频帧构成的（M-1）个相邻帧的帧差；并根据该（M-1）个相邻帧的帧差，从该M个静态视频帧中确定L个候选背景帧，其中，L为大于二的整数且L小于M；最后，根据该L个候选背景帧，确定该目标背景帧，但本发明实施例不限于此。其中，相邻帧为该M个静态视频帧中采集时间最接近的两个视频帧，该动作识别设备可以确定该（M-1）个相邻帧中的每个相邻帧的帧差，其中，该相邻帧的帧差可以是该相邻两帧的对应像素点的像素差的平均值，也可以是该相邻两帧的对应像素点的像素差的平方的平均值，但本发明实施例不限于此。

可选地，该L个候选背景帧的确定条件可以是该L个候选背景帧构成的每个相邻帧的帧差不超过第二预设阈值，该第二预设阈值与视觉传感器本身的稳定性及其在采集视频帧的过程中的相对运动情况有关。对于某些视觉传感器，其在连续采集视频帧时采集到的相邻帧的对应图像像素可能会有细微差别，尤其在该视觉传感器在采集该相邻帧的过程中有相对运动的情况下，该第二预设阈值可以设定为接近零的正数，但本发明实施例不限于此。

可选地，该动作识别设备还可以根据该L个候选背景帧，利用多种方法确定该目标背景帧。可选地，该动作识别设备可以选取该L个候选背景帧中的其中一个候选背景帧作为目标背景帧，也可以通过对该L个候选背景帧进行处理来确定该目标背景帧，例如，对该L个候选背景帧的对应像素点取平均值，但本发明实施例不限于此。

在S133中，该动作识别设备可以基于该动作视频帧序列中的视频帧的前景信息，采用多种方法识别该目标动作，例如，采用梯度方向直方图(Histogram of Oriented Gradients,简称为“HoG”)进行特征提取，以及采用支持向量基(Support Vector Machine，简称为“SVM”)进行训练和分类，来识别该动作视频帧序列中的目标动作，但本发明实施例不限于此。

可选地，作为另一实施例，为了避免由于动作识别设备在采集视频帧的过程中发生相对移动而造成的动作识别能力和精度的下降，该动作识别设备还可以利用设备运动传感器来检测该动作识别设备的运动信息，并在动作识别过程中根据该动作识别设备的相对运动情况来进行动作识别。相应地，如图3所示，S132中，根据该M个静态视频帧，确定该动作视频帧序列的目标背景帧，包括：

S132a，确定该M个静态视频帧的设备运动信息，该静态视频帧的设备运动信息用于表示动作识别设备在采集该静态视频帧时的运动状态；

S132b，根据该M个静态视频帧的设备运动信息，确定该目标背景帧。

具体地，该设备运动传感器可以在该视觉传感器采集视频帧的同时实时检测该动作识别设备的运动，并将检测到的该动作识别设备在某一时刻的运动信息对应到该时刻采集的视频帧上，作为该视频帧的设备运动信息进行缓存。其中，该设备运动传感器可以是加速度传感器，或陀螺仪，等等。该设备运动信息可以包括该设备在三维空间上的移位、该设备的旋转参数，等等。例如，该设备运动信息包括由加速度传感器检测到的该动作识别设备在采集视频帧时的加速度参数（ax,ay,az），其中，ax为该动作识别设备在x方向上的加速度数值,ay为在y方向上的加速度数值,az为在z方向上的加速度数值；或包括陀螺仪检测到的该动作识别设备在采集视频帧时的坐标参数（rx,ry,rz），其中，rx为该动作识别设备在x方向上的陀螺仪数值,ry为在y方向上的陀螺仪数值,rz为在z方向上的陀螺仪数值；或包括二者的结合，但本发明实施例不限于此。

可选地，该动作识别设备可以在一开始确定目标背景帧的时候就把该M个静态视频帧的设备运动信息考虑在内；可选地，作为另一实施例，该动作识别设备也可以只有当该M个静态视频帧中无法选取连续L个背景候选帧时，才将该M个静态视频帧的设备运动信息纳入考虑范围，即该M个静态视频帧构成的（M-1）个相邻帧中不存在连续（L-1）个相邻帧的帧差不超过第二预设阈值的情况下，才根据该M个静态视频帧的设备运动信息，确定该候选背景帧，但本发明实施例不限于此。

该动作识别设备可以根据该M个静态视频帧的设备运动信息，通过多种方式确定该目标背景帧。可选地，如图4所示，S132b，根据该M个静态视频帧的设备运动信息，确定该目标背景帧，包括：

S132b1，根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，该M个静态视频帧包括该第一静态视频帧和该第二静态视频帧，该第一静态视频帧和该第二静态视频帧构成第一相邻帧；

S132b2，当该第一设备相对运动值大于零且小于第一运动补偿阈值时，对该第一静态视频帧和该第二静态视频帧中的其中一帧进行运动补偿；

S132b3，根据该运动补偿后的该第一相邻帧，确定该第一相邻帧的帧差；

S132b4，根据该第一相邻帧的帧差，确定该目标背景帧。

其中，该第一静态视频帧和该第二静态视频帧可以是该M个静态视频帧中包括的任意相邻帧，该动作识别设备可以通过S132b1、S132b2、S132b3和S132b4这一流程确定该M个静态视频帧构成的（M-1）个相邻帧的帧差。具体地，在S132b1中，该动作识别设备可以对该第一静态视频帧和第二静态视频帧的设备运动信息进行处理，来确定该动作识别设备在采集该第一静态视频帧和该第二静态视频帧之间的相对运动情况，以该设备运动传感器为陀螺仪为例，该第一静态视频帧的设备运动信息为（rx1,ry1,rz1），该第一静态视频帧的设备运动信息为（rx2,ry2,rz2），该第一设备相对运动值R12可以由下式确定：R12=||(rx2,ry2,rz2)–(rx1,ry1,rz1)||，其中“||||”为距离计算函数，且不限于采用绝对值距离、均方距离等。例如，R12=|rx2-rx1|+|ry2–ry1|+|rz2–rz1|，或R12=(rx2-rx1)²+(ry2–ry1)²+(rz2–rz1)²，等等，但本发明实施例不限于此。

可选地，当该第一设备相对运动值为0时，表示该动作识别设备在采集该第一静态视频帧和采集该第二静态视频帧之间未发生相对运动，则该动作识别设备可以直接确定该第一静态视频帧和该第二视频帧的帧差；可选地，当该第一设备相对运动值大于零且小于第一补偿阈值时，该动作识别设备可以根据该相对运动值对该第一静态视频帧或该第二静态视频帧进行运动补偿，使得在确定帧差时采用的该第一静态视频帧和该第二静态视频帧的对应像素点为实际上对应的像素点，并根据该第二静态视频帧和经过运动补偿后的该第一静态视频帧，或根据该第一静态视频帧和经过运动补偿后的第二静态视频帧，来确定该第一静态视频帧和该第二静态视频帧的帧差，从而提高动作预测的能力和精度；可选地，当该第一设备相对运动值大于该第一补偿阈值时，该动作识别设备可以确定其在采集该第一静态视频帧和该第二静态视频帧的过程中相对运动太剧烈，并认为该第一静态视频帧和该第二静态视频帧并不适合用作候选背景帧，因此将其舍弃，并进一步从该M个静态视频帧的其它静态视频帧中选取该候选背景帧；或认为该M个静态视频帧不适合用于确定目标背景帧，并再次选取M个静态视频帧重复上述操作。其中，该第一运动补偿阈值可以根据设备运动传感器的敏感程度来确定，但本发明实施例不限于此。

可选地，作为另一实施例，该动作识别设备也可以在识别该目标动作时考虑该动作视频帧序列中的视频帧的设备运动信息。相应地，如图5所示，S130或S133中的识别该动作视频帧序列中的目标动作，包括：

S133a，确定该动作视频帧序列中的视频帧的设备运动信息；

S133b，根据该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作。

可选地，作为另一实施例，如图6所示，S133b，根据该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作，包括：

S133b1，根据该动作视频帧序列包括的第一视频帧的设备运动信息和该目标背景帧的设备运动信息，确定第二设备相对运动值；

S133b2，当该第二设备相对运动值大于第二运动补偿阈值时，对该第一视频帧和该目标背景帧中的其中一帧进行运动补偿；

S133b3，根据该其中一帧进行运动补偿后的该第一视频帧和该目标背景帧，确定该第一视频帧中的前景信息；

S133b4，根据该第一视频帧中的前景信息，识别该目标动作。

其中，该第一视频帧可以是该动作视频帧序列中包括的任意视频帧，该动作识别设备可以通过S133b1、S133b2、S133b3和S133b4这一流程确定该动作视频帧序列中的每个视频帧的前景信息。具体地，在S133b1中，该动作识别设备可以根据该第一视频帧的设备运动信息，确定该动作识别设备在采集该目标背景帧和该第一视频帧之间的相对运动情况，以该设备运动传感器为陀螺仪为例，该第一视频帧的设备运动信息为（rx1,ry1,rz1），该目标背景帧的设备运动信息为（rx0,ry0,rz0），该第二设备相对运动值R1可以由下式确定：R1=||(rx1,ry1,rz1)–(rx0,ry0,rz0)||，其中“||||”为距离计算函数，且不限于采用绝对值距离、均方距离等。例如，R1=|rx1–rx0|+|ry1–ry0|+|rz1–rz0|，或R1=(rx1–rx0)²+(ry1–ry0)²+(rz1–rz0)²，等等，但本发明实施例不限于此。

其中，该第二运动补偿阈值可以根据设备运动传感器的敏感程度来确定，一般地，该第二运动补偿阈值可以是大于或等于零的小数，但本发明实施例不限于此。可选地，如果该设备运动传感器很敏感，微小的设备运动都能在该设备运动传感器采集到的参数中体现。那么当该第二设备相对运动值小于第二补偿阈值时，表示该动作识别设备在采集该目标背景帧和采集该第一视频帧之间未发生明显相对运动，则该动作识别设备可以直接确定该第一视频帧的前景信息，例如，将该第一视频帧中的任一像素点的像素减去在该目标背景帧中与该任一像素点对应的像素点的像素；可选地，当该第二设备相对运动值大于该第二补偿阈值时，该动作识别设备可以根据该相对运动程度对该第一视频帧或该目标背景帧进行运动补偿，使得在确定前景信息时采用的该第一视频帧和该目标背景帧的对应像素点为实际上对应的像素点，并根据该第一静态视频帧和经过运动补偿后的该目标背景帧，或根据该目标背景帧和经过运动补偿后的第一视频帧，来确定该第一视频帧的前景信息，从而提高动作预测的能力和精度，但本发明实施例不限于此。

可选地，该动作识别设备还可以设置第三运动补偿阈值，并且只有当该第二设备相对运动值大于该第二运动补偿阈值且小于该第三运动补偿阈值时，才对该第一视频帧或该目标背景帧进行运动补偿；而当该第二设备相对运动值大于该第三运动补偿阈值时，将该第一视频帧丢弃。其中，该第三运动补偿阈值可以大于该第一补偿阈值，也可以与该第一补偿阈值相等，但本发明实施例不限于此。

可选地，该设备识别设备还可以进一步通过边界连通、图像腐蚀等操作来完善该动作视频帧序列中的一个或多个动作视频帧的前景信息，本发明实施例不限于此。

因此，根据本发明实施例的识别动作的方法，通过视觉传感器和动作传感器共同识别动作，且由动作传感器检测到触发动作来启动动作识别过程，从而能够为动作识别提供更为精确的背景和前景确定机会，提高对动作识别的识别能力和识别精度；此外，由于只有在动作传感器检测到触发动作时，动作识别设备才会启动动作识别过程，从而能够降低由于一直进行动作识别而造成的资源消耗，提高用户体验。进一步地，本发明实施例通过设备运动传感器检测设备在采集视频帧的过程中的运动信息，从而能够降低由于设备运动而造成的运动识别的识别误差，提高动作识别的精度和稳定性。

下面将结合具体例子对本发明实施例提供的识别动作的方法做更详细的说明。图7是本发明实施例的确定目标背景帧的方法200的示意性流程图。在本实施例中，动作识别设备将视觉传感器实时采集到的视频帧缓存，并为视频帧设置动作标识和设备运动参数，其中，将没有动作发生的视频帧的动作标识设置为F0，而有动作发生的视频帧的动作标识设置为F1。假设该动作识别设备已经获取了动作视频帧序列。如图7所示，该方法200包括：

S210，该动作识别设备获取M个静态视频帧；

其中，M可以为大于2的预设整数，该M个静态视频帧的动作标识均为F0，且该M个静态视频帧的采集时间可以与该动作视频帧序列的采集时间不超过第一预设阈值。

S220，该动作识别设备分别确定该M个静态视频帧构成的（M-1）个相邻帧的帧差；

S230，该动作识别设备确定该（M-1）个相邻帧中是否存在连续（L-1）个相邻帧的帧差低于第二预设阈值；

其中，该L可以为大于2且小于M的预设整数，当存在（L-1）个相邻帧的帧差低于第二预设阈值时，该动作识别设备执行S280，该确定目标背景帧的方法200结束；否则，该动作识别设备执行S240。

S240，该动作识别设备分别确定该（M-1）个相邻帧的设备相对运动值；

S250，该动作识别设备确定该（M-1）个相邻帧中的第i个相邻帧的设备相对运动值是否超过第一运动补偿阈值，i=1,2,…,(M-1)；

当该第i个相邻帧的设备相对运动值超过该第一补偿阈值时，该动作识别设备执行S290，并且该动作识别设备可以另外选取M个静态视频帧重复上述流程；否则，该动作识别设备执行S260。

S260，对该第i个相邻帧进行运动补偿，并确定该运动补偿后的第i个相邻帧的帧差；

该动作识别设备分别对该（M-1）个相邻帧分别重复步骤S250和S260，从而获取经过运动补偿后的（M-1）个相邻帧。

S270，该动作识别设备确定该运动补偿后的（M-1）个相邻帧中是否存在连续（L-1）个相邻帧的帧差低于第二预设阈值；

当存在（L-1）个相邻帧的帧差低于第二预设阈值时，该动作识别设备执行S280，该确定目标背景帧的方法200结束；否则，该动作识别设备执行S290。

S280，该动作识别设备确定L个候选背景帧，并根据该L个候选背景帧确定目标背景帧；

S290，该动作识别设备确定该M个静态视频帧中无合适的目标背景帧。

因此，根据本发明实施例的识别动作的方法，通过视觉传感器和动作传感器共同识别动作，且只有在动作传感器检测到视频帧中存在动作时，视觉传感器才会启动动作识别，从而能够降低由视觉传感器一直进行动作识别而造成的资源消耗，并且由于动作传感器获得了动作发生的时间点，因此能够为动作识别提供更为精确的背景和前景确定机会，从而提高对动作识别的识别能力和识别精度，提高了用户体验。进一步地，本发明实施例通过设备运动传感器检测设备在采集视频帧的过程中的运动信息，从而能够降低由于设备运动而造成的运动识别的识别误差，提高动作识别的精度和稳定性。

应注意，图7的这个例子是为了帮助本领域技术人员更好地理解本发明实施例，而非要限制本发明实施例的范围。本领域技术人员根据所给出的图7的例子，显然可以进行各种等价的修改或变化，这样的修改或变化也落入本发明实施例的范围内。

应理解，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上文中结合图1至图7，详细描述了根据本发明实施例的识别动作的方法，下面将结合图8至图13，描述根据本发明实施例的动作识别设备。

图8示出了根据本发明实施例的动作识别设备300的示意性框图，如图8所示，该动作识别设备300包括：

确定模块310，用于根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；

获取模块320，用于获取包括该确定模块310确定包括动作的该当前视频帧的动作视频帧序列；

识别模块330，用于识别该获取模块320获取的该动作视频帧序列中的目标动作。

因此，根据本发明实施例的动作识别设备，通过视觉传感器和动作传感器共同识别动作，且由动作传感器检测到触发动作来启动动作识别过程，从而能够为动作识别提供更为精确的背景和前景确定机会，提高对动作识别的识别能力和识别精度；此外，由于只有在动作传感器检测到触发动作时，动作识别设备才会启动动作识别过程，从而能够降低由于一直进行动作识别而造成的资源消耗，提高用户体验。

可选地，如图9所示，该识别模块330包括：

获取单元331，用于获取M个静态视频帧，该M个静态视频帧与该动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；

第一确定单元332，用于根据该获取单元331获取的该M个静态视频帧，确定该动作视频帧序列的目标背景帧；

第一识别单元333，用于根据该第一确定单元332确定的该目标背景帧，识别该动作视频帧序列中的目标动作。

可选地，作为另一实施例，该第一确定单元332具体用于确定该M个静态视频帧的设备运动信息，该静态视频帧的设备运动信息用于表示动作识别设备在采集该静态视频帧时的运动状态，以及根据该M个静态视频帧的设备运动信息，确定该目标背景帧。

可选地，作为另一实施例，如图10所示，该第一确定单元332包括：

第一确定子单元332a，用于根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，该M个静态视频帧包括该第一静态视频帧和该第二静态视频帧，该第一静态视频帧和该第二静态视频帧构成第一相邻帧；

运动补偿子单元332b，用于当该第一确定子单元332a确定的该第一设备相对运动值大于零且小于第一运动补偿阈值时，对该第一静态视频帧和该第二静态视频帧中的其中一帧进行运动补偿；

第二确定子单元332c，用于根据该运动补偿子单元332b进行运动补偿后的该第一相邻帧，确定该第一相邻帧的帧差；

第三确定子单元332d，用于根据该第二确定子单元332c确定的该第一相邻帧的帧差，确定该目标背景帧。

可选地，作为另一实施例，如图11所示，该识别模块330还包括：

第二确定单元334，用于确定该动作视频帧序列中的视频帧的设备运动信息，该视频帧的设备运动信息用于表示动作识别设备在采集该视频帧时的运动状态；

第二识别单元335，用于根据该第二确定单元334确定的该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作。

可选地，作为另一实施例，该第二识别单元335还用于根据该第二确定单元334确定的该动作视频帧序列中的视频帧的设备运动信息和该第一确定单元332确定的该目标背景帧，识别该目标动作。

可选地，作为另一实施例，如图12所示，该第二识别单元335包括：

第一确定子单元335a，用于根据该动作视频帧序列包括的第一视频帧的设备运动信息和该目标背景帧的设备运动信息，确定第二设备相对运动值；

运动补偿子单元335b，用于当该第一确定子单元335a确定的该第二设备相对运动值大于第二运动补偿阈值时，对该第一视频帧和该目标背景帧中的其中一帧进行运动补偿；

第二确定子单元335c，用于根据该运动补偿子单元335b对其中一帧进行运动补偿后的该第一视频帧和该目标背景帧，确定该第一视频帧中的前景信息；

识别子单元335d，用于根据该第二确定子单元335c确定的该第一视频帧中的前景信息，识别该目标动作。

根据本发明实施例的动作识别设备300可对应于根据本发明实施例的识别动作中的动作识别设备，并且动作识别设备300中的各个模块的上述和其它操作和/或功能分别为了实现图1至图7中的各个方法的相应流程，为了简洁，在此不再赘述。

因此，根据本发明实施例的动作识别设备，通过视觉传感器和动作传感器共同识别动作，且只有在动作传感器检测到视频帧中存在动作时，视觉传感器才会启动动作识别，从而能够降低由视觉传感器一直进行动作识别而造成的资源消耗，并且由于动作传感器获得了动作发生的时间点，因此能够为动作识别提供更为精确的背景和前景确定机会，从而提高对动作识别的识别能力和识别精度，提高了用户体验。进一步地，本发明实施例通过设备运动传感器检测设备在采集视频帧的过程中的运动信息，从而能够降低由于设备运动而造成的运动识别的识别误差，提高动作识别的精度和稳定性。

图13示出了根据本发明另一实施例的动作识别设备400的示意性框图，如图13所示，该动作识别设备300包括：处理器410、存储器420、视觉传感器430、动作传感器440和总线系统450。该视觉传感器430用于采集视觉画面，该动作传感器440用于检测在动作检测区域内是否有动作发生。其中，处理器410、存储器420、视觉传感器430和动作传感器440通过总线系统450相连，该存储器420用于存储指令，该处理器410通过该总线系统450，调用该存储器420中存储的该指令，用于：根据动作传感器440检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；获取包括该当前视频帧的动作视频帧序列；以及识别该动作视频帧序列中的目标动作。

应理解，在本发明实施例中，该处理器410可以是中央处理单元（CentralProcessing Unit，简称为“CPU”），该处理器410还可以是其他通用处理器、数字信号处理器（DSP）、专用集成电路（ASIC）、现成可编程门阵列（FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器420可以包括只读存储器和随机存取存储器，并向处理器410提供指令和数据。存储器420的一部分还可以包括非易失性随机存取存储器。例如，存储器420还可以存储设备类型的信息。

该视觉传感器430可以是普通摄像头、或红外摄像头、或深度摄像头，等等；该动作传感器440可以为下列传感器中的一种或多种：红外感应传感器、超声距离传感器、电磁场感应传感器和光线传感器，等等，但本发明实施例不限于此。

该总线系统450除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线系统450。

在实现过程中，上述方法的各步骤可以通过处理器410中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器420，处理器410读取存储器420中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

可选地，该处理器410具体用于获取M个静态视频帧，该M个静态视频帧与该动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；根据该M个静态视频帧，确定该动作视频帧序列的目标背景帧；以及根据该目标背景帧，识别该动作视频帧序列中的目标动作。

可选地，作为另一实施例，如图13所示，该动作识别设备400还包括设备运动传感器460，该设备运动传感器460用于检测该动作识别设备在采集视频帧的过程中的运动状态，其可以是加速度传感器，或陀螺仪，等等，但本发明实施例不限于此。

相应地，该处理器410具体用于确定该M个静态视频帧的设备运动信息，该静态视频帧的设备运动信息用于表示动作识别设备在采集该静态视频帧时的运动状态，以及根据该M个静态视频帧的设备运动信息，确定该目标背景帧。

可选地，作为另一实施例，该处理器410具体用于确定根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，该M个静态视频帧包括该第一静态视频帧和该第二静态视频帧，该第一静态视频帧和该第二静态视频帧构成第一相邻帧；当该第一设备相对运动值大于零且小于第一运动补偿阈值时，对该第一静态视频帧和该第二静态视频帧中的其中一帧进行运动补偿；根据该第一相邻帧，确定该第一相邻帧的帧差；以及根据该第一相邻帧的帧差，确定该目标背景帧。

可选地，作为另一实施例，该处理器410还用于确定该动作视频帧序列中的视频帧的设备运动信息，该视频帧的设备运动信息用于表示动作识别设备在采集该视频帧时的运动状态；以及根据该动作视频帧序列中的视频帧的设备运动信息，识别该目标动作。

可选地，作为另一实施例，该处理器410具体用于根据该动作视频帧序列包括的第一视频帧的设备运动信息和该目标背景帧的设备运动信息，确定第二设备相对运动值；当该第二设备相对运动值大于第二运动补偿阈值时，对该第一视频帧和该目标背景帧中的其中一帧进行运动补偿；根据该对其中一帧进行运动补偿后的该第一视频帧和该目标背景帧，确定该第一视频帧中的前景信息；以及根据该第一视频帧中的前景信息，识别该目标动作。

根据本发明实施例的动作识别设备400可对应于根据本发明实施例的识别动作中的动作识别设备，并且动作识别设备400中的各个模块的上述和其它操作和/或功能分别为了实现图1至图7中的各个方法的相应流程，为了简洁，在此不再赘述。

应理解，在本发明实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例中描述的各方法步骤和单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-OnlyMemory，简称为“ROM”）、随机存取存储器（Random Access Memory，简称为“RAM”）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种识别动作的方法，其特征在于，包括：

根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；

获取包括所述当前视频帧的动作视频帧序列；

识别所述动作视频帧序列中的目标动作。

2.根据权利要求1所述的方法，其特征在于，所述识别所述动作视频帧序列中的目标动作，包括：

获取M个静态视频帧，所述M个静态视频帧与所述动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；

根据所述M个静态视频帧，确定所述动作视频帧序列的目标背景帧；

根据所述目标背景帧，识别所述动作视频帧序列中的目标动作。

3.根据权利要求2所述的方法，其特征在于，所述根据所述M个静态视频帧，确定所述动作视频帧序列的目标背景帧，包括：

确定所述M个静态视频帧的设备运动信息，所述静态视频帧的设备运动信息用于表示动作识别设备在采集所述静态视频帧时的运动状态；

根据所述M个静态视频帧的设备运动信息，确定所述目标背景帧。

4.根据权利要求3所述的方法，其特征在于，所述根据所述M个静态视频帧的设备运动信息，确定所述目标背景帧，包括：

根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，所述M个静态视频帧包括所述第一静态视频帧和所述第二静态视频帧，所述第一静态视频帧和所述第二静态视频帧构成第一相邻帧；

当所述第一设备相对运动值大于零且小于第一运动补偿阈值时，对所述第一静态视频帧和所述第二静态视频帧中的其中一帧进行运动补偿；

根据所述运动补偿后的所述第一相邻帧，确定所述第一相邻帧的帧差；

根据所述第一相邻帧的帧差，确定所述目标背景帧。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述识别所述动作视频帧序列中的目标动作，包括：

确定所述动作视频帧序列中的视频帧的设备运动信息，所述视频帧的设备运动信息用于表示动作识别设备在采集所述视频帧时的运动状态；

根据所述动作视频帧序列中的视频帧的设备运动信息，识别所述目标动作。

6.根据权利要求5所述的方法，其特征在于，所述根据所述动作视频帧序列中的视频帧的设备运动信息，识别所述目标动作，包括：

根据所述动作视频帧序列包括的第一视频帧的设备运动信息和所述目标背景帧的设备运动信息，确定第二设备相对运动值；

当所述第二设备相对运动值大于第二运动补偿阈值时，对所述第一视频帧和所述目标背景帧中的其中一帧进行运动补偿；

根据所述其中一帧进行运动补偿后的所述第一视频帧和所述目标背景帧，确定所述第一视频帧中的前景信息；

根据所述第一视频帧中的前景信息，识别所述目标动作。

7.一种动作识别设备，其特征在于，包括：

确定模块，用于根据动作传感器检测到动作的发生，确定视觉传感器采集到的当前视频帧中包括动作；

获取模块，用于获取包括所述确定模块确定包括动作的所述当前视频帧的动作视频帧序列；

识别模块，用于识别所述获取模块获取的所述动作视频帧序列中的目标动作。

8.根据权利要求7所述的动作识别设备，其特征在于，所述识别模块包括：

获取单元，用于获取M个静态视频帧，所述M个静态视频帧与所述动作视频帧序列的间隔采集时间不超过第一预设阈值，M为大于一的整数；

第一确定单元，用于根据所述获取单元获取的所述M个静态视频帧，确定所述动作视频帧序列的目标背景帧；

第一识别单元，用于根据所述第一确定单元确定的所述目标背景帧，识别所述动作视频帧序列中的目标动作。

9.根据权利要求8所述的动作识别设备，其特征在于，所述第一确定单元具体用于确定所述M个静态视频帧的设备运动信息，所述静态视频帧的设备运动信息用于表示动作识别设备在采集所述静态视频帧时的运动状态，以及根据所述M个静态视频帧的设备运动信息，确定所述目标背景帧。

10.根据权利要求9所述的动作识别设备，其特征在于，所述第一确定单元包括：

第一确定子单元，用于根据第一静态视频帧的设备运动信息和第二静态视频帧的设备运动信息，确定第一设备相对运动值，所述M个静态视频帧包括所述第一静态视频帧和所述第二静态视频帧，所述第一静态视频帧和所述第二静态视频帧构成第一相邻帧；

运动补偿子单元，用于当所述第一确定子单元确定的所述第一设备相对运动值大于零且小于第一运动补偿阈值时，对所述第一静态视频帧和所述第二静态视频帧中的其中一帧进行运动补偿；

第二确定子单元，用于根据所述运动补偿子单元进行运动补偿后的所述第一相邻帧，确定所述第一相邻帧的帧差；

第三确定子单元，用于根据所述第二确定子单元确定的所述第一相邻帧的帧差，确定所述目标背景帧。

11.根据权利要求7至10中任一项所述的动作识别设备，其特征在于，所述识别模块还包括：

第二确定单元，用于确定所述动作视频帧序列中的视频帧的设备运动信息，所述视频帧的设备运动信息用于表示动作识别设备在采集所述视频帧时的运动状态；

第二识别单元，用于根据所述第二确定单元确定的所述动作视频帧序列中的视频帧的设备运动信息，识别所述目标动作。

12.根据权利要求11所述的动作识别设备，其特征在于，所述第二识别单元包括：

第一确定子单元，用于根据所述动作视频帧序列包括的第一视频帧的设备运动信息和所述目标背景帧的设备运动信息，确定第二设备相对运动值；

运动补偿子单元，用于当所述第一确定子单元确定的所述第二设备相对运动值大于第二运动补偿阈值时，对所述第一视频帧和所述目标背景帧中的其中一帧进行运动补偿；

第二确定子单元，用于根据所述运动补偿子单元对其中一帧进行运动补偿后的所述第一视频帧和所述目标背景帧，确定所述第一视频帧中的前景信息；

识别子单元，用于根据所述第二确定子单元确定的所述第一视频帧中的前景信息，识别所述目标动作。