WO2018187939A1

WO2018187939A1 - 三维图像的识别方法和终端

Info

Publication number: WO2018187939A1
Application number: PCT/CN2017/080104
Authority: WO
Inventors: 谢俊
Original assignee: 深圳市柔宇科技有限公司
Priority date: 2017-04-11
Filing date: 2017-04-11
Publication date: 2018-10-18
Also published as: CN108475341B; CN108475341A

Abstract

本申请实施例公开了一种三维图像的识别方法和终端，该方法包括：在视频文件中的一帧图像的图像区域内确定第一区域；在所述第一区域内进行图像相似度比对，得到第一比对结果；在所述图像区域内进行图像相似度比对，得到第二比对结果；根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。本申请实施例能够提高对三维图像的识别精准度。

Description

三维图像的识别方法和终端

技术领域

本申请涉及图像识别技术领域，具体涉及一种三维图像的识别方法和终端。

背景技术

随着虚拟现实(Virtual Reality，VR)技术的发展，VR设备为用户提供了更直观的人机交互体验。例如，VR设备可以是VR头戴式显示设备(简称VR头显)。VR设备通过播放三维(three-dimentional，3D)视频文件，使用户观看到的视频图像更加立体现实，提升用户体验度。同时，VR设备也可以兼容播放二维视频文件。三维视频文件中的每帧图像是由两个相似的图像合成的，其原理是两个图像分别提供给两个眼睛，根据光线角度变化，能够使两个眼睛观察到的图像合成一个立体图像。由于三维视频图像和二维视频图像不同，为了使用户获取更好的感官体验，VR设备在获取到视频文件时，需要检测该视频文件是三维视频文件或是二维视频文件。针对不同维度的视频文件，VR会提供不同的播放方式。

其中，在传统方式中，可以通过将视频文件中的图像中的每个部分进行相似度比对，如将图像中的左半部分和右半部分进行相似度比对，或者，将图像中的上半部分或下半部分进行相似度比对，如果比对出相似度高，则可确定该图像为三维图像，该图像所属的视频文件为三维视频文件。然而，利用传统方式来识别三维图像方式的误判概率大，如果图像中包括的无效像素较多，传统方式下容易将非三维图像确定为三维图像。因此，这种方式对三维图像的识别的精确度低。

发明内容

本申请实施例公开了一种三维图像的识别方法和终端，能够提高对三维图像的识别精准度。

第一方面，本申请实施例公开了一种三维图像的识别方法，包括：

在视频文件中的一帧图像的图像区域内确定第一区域；

在所述第一区域内进行图像相似度比对，得到第一比对结果；

在所述图像区域内进行图像相似度比对，得到第二比对结果；

根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。

第二方面，本申请实施例公开了一种终端，包括功能单元，所述功能单元用于执行第一方面所示方法的部分或全部步骤。

第三方面，本申请实施例公开了一种终端，该终端包括包括处理器、存储器；所述存储器存储有可执行程序代码；所述处理器被配置为支持该终端执行第一方面提供的方法中相应的功能。存储器用于保存该终端必要的程序指令和数据。

第四方面，本申请实施例公开一种计算机存储介质，用于储存为上述第三方面提供的终端所用的计算机软件指令，其包含用于执行第一方面中方法所设计的程序。

本申请实施例中，在视频文件中的一帧图像的图像区域内确定第一区域后，可以在第一区域进行图像相似度比对，得到第一比对结果；也可以在图像区域内进行图像相似度比对，得到第二比对结果。从而，能够根据第一比对结果和第二比对结果，识别图像。上述方法能够更加准确的识别图像是否为三维图像。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例公开的一种三维图像的识别方法的流程示意图；

图2A至图2C是本申请实施例公开的一些图像的中间区域的确定方式示意图；

图3是本申请实施例公开的一种图像相似度比对方法的流程示意图；

图4是本申请实施例公开的一种图像的中间区域划分的小区域的示意图；

图5A至图5B是本申请实施例公开的一些三维图像的示意图；

图6A至图6E是本申请实施例公开的一些大区域和小区域的位置关系示意图；

图7是本申请实施例公开的一种终端的单元示意图；

图8是本申请实施例公开的一种终端的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。首先对本申请方法实施例进行描述。

请参阅图1，图1是本申请实施例公开的一种三维图像的识别方法的流程示意图。如图1所示，该方法至少包括以下步骤。

步骤S101，在视频文件中的一帧图像的图像区域内确定第一区域。

在一些可能的实现方式中，当终端获取到视频文件后，可从视频文件中截取若干帧图像。并识别每一帧图像是否为三维图像，如果确定若干帧图像中三维图像的数量达到预设阈值，则可确定该视频文件为三维视频文件，进而通过与三维视频文件匹配的播放方式对该视频文件进行播放。

在一些可能的实现方式中，在识别一帧图像是否为三维图像之前，可以对该图像进行处理，可以将其转换为灰度图像，其中，每个像素对应一个灰度值，该灰度值也可表示为像素值。并将该图像缩小，同时，将其缩小成尺寸为128×128个像素的图像。128×128分别表示图像的宽度和高度，本申请中，以像素作为图像尺寸的单位。需要说明的是，上述尺寸仅是举例性的，本申请对缩小后的图像尺寸不作具体限定，并对图像转换灰度和缩小处理的步骤的先后顺序不作具体限定。

在此，可以为处理后的图像确定一个单元区域，该单元区域是处理后的图像上的最小图像区域。例如，确定图像上的单元区域是包括8×8个像素的区域。则可以确定一个尺寸为128×128的图像包括了16×16个单元区域。需要说明的是，单元区域可以根据图像尺寸确定，单元区域不要求宽度像素数量和高度像素数量相同。例如，如果图像的宽度像素数量和长度像素数量不同，则单元区域的宽度像素数量和长度像素数量不同。

本申请实施例中，可以通过以下方式中的至少一种来确定图像的第一区域，在此，图像的第一区域是指图像区域中不包括无效像素的区域，无效像素是指影响图像区域的像素平均值的准确性的像素，例如，图5A中，图像区域中上下边框区域包括的黑色像素即为无效像素。

1、可以确定图像的中间区域即为图像的第一区域。其中，图像的中间区域的中心点与图像的中心点重合。图像的中间区域的长度和宽度可以是预定义的，也可以是根据图像中的目标对象的大小确定的，在此不作限定。以图像的尺寸为128×128为例，此时图像为正方形，则图像的中间区域也为正方形，例如，可以预定义图像的中间区域包括12×12个单元区域。在上述方式下确定图像的中间区域与图像区域的位置关系的示意图可以参见图2A，图2A举例性的示出了一种图像区域和中间区域的位置关系。

2、还可以首先确定图像的第二区域是否有效，进而确定图像的第一区域。具体实现中，可以预定义图像的第二区域。例如，第二区域为边框区域。预定义图像的第二区域可以参见图2B，图2B举例性的示出了一种第二区域与图像区域的位置关系。或者，也可以根据图像中的目标对象的大小和位置确定第二区域，在第二区域内不包括图像中的全部目标对象。本申请实施例所描述的目标对象是指图像中具备一定特征的图形元素，该图形元素能够具体代表一种物体，例如图形元素代表云、花、人像等。

确定图像的第二区域是否有效可以通过第二区域包括的单元区域的像素标识确定。其中，单元区域的像素标识是基于单元区域的像素平均值和图像的像素平均值确定的，这里所说的像素平均值也可理解为像素灰度平均值。具体实现中，计算出单元区域的像素平均值，在此，可以将图像区域的像素平均值作为参考值，也可以将图像区域中的部分区域的像素平均值作为参考值，例如，将图像区域划分为若干个区域，每个区域的大小相同，则将单元区域所属区域的像素平均值作为参考值。如果单元区域的像素平均值大于参考值，则可以设置该单元区域的像素标识为1；如果单元区域的像素平均值小于参考值，则可以设置该单元区域的像素标识为0。

可以通过上述方式，确定第二区域内的单元区域的像素标识，并根据第二区域内的单元区域的像素标识，通过以下方式确定第二区域是否满足无效条件：

(1)第二区域中存在连续的多个单元区域的像素标识相同，且连续的单元区域的区域数量达到第一阈值。

在一些可能的实现方式中，可以按照预设路线依次检测单元区域的像素标识，如果按照预设路线依次检测单元区域的像素标识时，检测到连续多个单元区域的像素标识相同。连续多个单元区域也可以理解为多个单元区域的所在位置的坐标值连续，这里，坐标值连续可以包括x坐标值连续和/或y坐标值连续。如果连续检测的像素标识相同的单元区域的区域数量达到第一阈值，则可确定第二区域满足无效条件。

(2)第二区域中像素标识相同的多个单元区域的区域数量占第二区域中全部单元区域的区域数据的比值达到第二阈值。

在一些可能的实现方式中，也可以统计第二区域中全部单元区域中像素标识相同的单元区域的数量占比。例如，在第二区域中像素标识为1或0的单元区域的区域数量占全部单元区域的区域数量的比值达到第二阈值，则确定该第二区域满足无效条件，即第二区域中仅包括图像中的无效信息。第二阈值可以是99％，99.5％等，在此对第二阈值的取值不做具体限定。

通过上述方式，如果第二区域满足无效条件，则在图像的非第二区域内确定图像的中间区域。具体实现中，如果非第二区域的尺寸不满足预定义的中间区域的尺寸，例如，非第二区域的尺寸大于预定义的中间区域的尺寸，则可以从非第二区域中裁剪出满足预定义尺寸的中间区域。

3、还可以通过确定图像中的目标对象的大小和所在位置，来确定图像的第一区域。

在一些可能的实现方式中，可以通过确定图像中的目标对象的大小和所在位置，来确定图像的第一区域。其中，确定的第一区域可以包括图像中全部的目标对象，也可以包括图像中部分目标对象，例如，根据目标对象的重要标识，确定中间区域所要包括的目标对象。可以根据目标对象的大小来确定中间区域的尺寸。图2C举例性的示出了一种图像区域和中间区域的位置关系。如图2C所示，中间区域是基于图像中包括的目标对象确定的。

需要说明的是，通过方式2或方式3确认出的第一区域的中心点不一定要与图像区域的中心点重合。在此，本申请实施例不做具体限定。

步骤S102，在所述第一区域内进行图像相似度比对，得到第一比对结果。

步骤S103，在所述图像区域内进行图像相似度比对，得到第二比对结果。

步骤S104，根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。

需要说明的是，本申请实施例中对步骤S102和步骤S103的执行顺序不作限定。步骤S102也可以在步骤S103后执行，或者与步骤S103并行执行。

在一些可能的实现方式中，在第一区域进行图像相似度比对的实现方式可以与在图像区域进行图像相似度比对的实现方式相同，也可以不同。

在一些可能的实现方式中，可以根据第一比对结果和第二比对结果是否一致，来识别图像是否为三维图像。如果第一比对结果和第二比对结果一致，则根据其中一个比对结果，来识别图像是否为三维图像。如果第一比对结果和第二比对结果不一致，能够识别出该图像不是三维图像，进而避免了无效像素对图像识别的影响。

下面通过以下方法实施例来介绍在第一区域进行图像相似度比对的实现方式。

请参阅图3，图3是本申请实施例提供的一种图像相似度比对方法的流程示意图。如图3所示，该方法包括以下步骤。

步骤S301，将第一区域划分为至少四个小区域。

步骤S302，将所述图像的中间区域所包括的至少四个小区域中的第一小区域和相邻小区域进行图像相似度比对，得到第一比对结果。

在一些可能的实现方式中，可以将图像的中间区域划分为至少四个小区域。本申请实施例以将图像的中间区域划分为四个小区域为例，来说明图像相似度比对的方式，对于将图像的中间区域划分为四个以上小区域的情况，实施图像相似度比对的方式相同。这里所说的小区域也可以理解为是第一区域的子区域。在下面描述中，图像区域的子区域可以表述为大区域。为了实现图像比对，划分的四个小区域的尺寸相同。

其中，四个小区域和中间区域的关系可参见图4所示。并为每个小区域设置一个区域标识，四个小区域依次被标识为区域A，区域B，区域C和区域D。假设中间区域包括12×12个单元区域，则区域A至区域D分别包括6×6个单元区域。

当确定中间区域的四个小区域后，则可以进行图像相似度比对。本申请实施例所描述的与第一小区域的相邻小区域是指与第一小区域共享区域边界的小区域。假设第一小区域为区域A，则区域A的相邻小区域是指区域B或区域C。区域A可以分别与区域B和区域C进行图像相似度比对。对于区域A和区域B以及区域A和区域C的图像相似度比对顺序，本申请实施例不做具体限定。

以区域A和区域B进行图像相似度比对为例，分别确定区域A和区域B包括的单元区域的像素标识，在此，需要说明的是，区域A中包括的一个单元区域的像素标识，可以是基于该单元区域的像素平均值和中间区域的像素平均值确定的，也可以是基于该单元区域的像素平均值和区域A的像素平均值确定的；对于区域A中单元区域的像素标识的确定方式对应作用于区域B、C、D中的单元区域。在确定出区域A和区域B包括的单元区域的像素标识后，可比对对应的单元区域的像素标识，区域A中的单元区域与区域B中的单元区域的对应关系是基于单元区域在小区域中的位置确定的。如图4所示，区域A中的单元区域A1和区域B中的单元区域B1成对应关系，他们都在所属区域的左上角。在比对区域A和区域B中的对应的单元区域的像素标识时，如果区域A中的一个单元区域和区域B中的对应单元区域的像素标识不相同，则将该单元区域添加至第一单元区域集合。在此，将统计的区域A中的第一单元区域集合中的单元区域的数量标识为q1。

通过上述方式，也可以比对区域A和区域C中的对应的单元区域的像素标识。在比对区域A和区域C中的对应的单元区域的像素标识时，如果区域A中的一个单元和区域C中的对应单元区域的像素标识不相同，则将该单元区域添加至第二单元区域集合。在此，将统计的区域A中的第二单元区域结合中的单元区域的数量标识为q2。

为q1设置第三阈值，并为q2设置第四阈值。其中，第三阈值和第四阈值可以相同，也可以不同。第三阈值和第四阈值是基于小区域所包括的单元区域的数量确定的。可以根据q1和q2以及对应的阈值确定中间区域的图像相似度比对结果。比对结果包括：q1大于第三阈值且q2大于第四阈值；q1大于第三阈值，q2不大于第四阈值；q1不大于第三阈值，q2大于第四阈值；q1不大于第三阈值，q2不大于第四阈值。

在一些可能的实现方式中，如果比对结果为q1大于第三阈值且q2大于第四阈值，则表示区域A既不与区域B相似，也不予区域C相似，则可根据比对结果识别该图像不是三维图像。如果比对结果为q1大于第三阈值，q2不大于第四阈值，表示区域A和区域C相似，则可根据比对结果识别该图像为上下三维图像，上下三维图像的一种表示示意图可参见图5A。如果比对结果为q1不大于第三阈值，q2大于第四阈值，表示区域A和区域B相似，则可根据比对结果识别该图像为左右三维图像，左右三维图像的一种表示示意图可参见图5B所示。如果比对结果为q1不大于第三阈值，q2不大于第四阈值，表示区域A既与区域B相似，也与区域C相似，则无法识别该图像是否为三维图像。

需要说明的是，在步骤S302中，可以实现将中间区域中的每个小区域依次与其相邻的小区域进行图像相似度比对，可以得到四组比对结果，或者，也可以将中间区域中的两个小区域或三个小区域依次与其相邻的小区域进行图像相似度比对，得到两组或三组比对结果。可以综合步骤S302中得到的至少二组比对结果，对该图像进行识别。

需要说明的是，如果根据比对结果无法识别该图像是否为三维图像，还可以在视频文件中获取另一帧图像进行识别。

在一些可能的实现方式中，图像区域内的图像相似度比对方法可以参见上述第一区域内的图像相似度的比对方法。具体的，可以将图像区域划分出四个大区域，并将四个大区域中的第一大区域和相邻大区域进行图像相似度比对。

在此结合图6A至图6E介绍大区域和中间区域的小区域的关系。将图像区域划分出四个大区域，这四个大区域的区域标识分别为区域A’，区域B’，区域C’，区域D’。中间区域划分出四个小区域，这四个小区域的区域标识分别为区域A，区域B，区域C，区域D。

如图6A所示，中间区域的中心点和图像区域的中心点重合，此时，小区域包括的单元区域的集合是对应大区域包括的单元区域的集合的子集。如图6B-6C所示，中间区域的中心点在图像区域的中心点的左侧或右侧；如图6D-6E所示，中间区域的中心点在图像区域的中西点的上侧或下侧。当然，大区域和小区域的位置关系还可以为其他关系，在此不作穷举。

下面结合上述方法实施例及系统实施例，对本申请实施例中的装置实施例进行详细说明。

请参阅图7，图7是本申请实施例公开的一种终端的单元组成图。该终端可包括第一确定单元701、第一比对单元702、第二比对单元703和识别单元704。

其中，第一确定单元701，用于在视频文件中的一帧图像的图像区域内确定第一区域；

第一比对单元702，用于在所述第一区域内进行图像相似度比对，得到第一比对结果；

第二比对单元703，用于在所述图像区域内进行图像相似度比对，得到第二比对结果；

识别单元704，用于根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。

可选的，所述第一比对单元702包括：

第二确定单元，用于确定所述第一区域内的单元区域的像素标识；

统计单元，用于分别统计所述第一区域中的第一子区域与第二子区域中像素标识不一致的单元区域的第一数量，以及所述第一子区域与第三子区域中像素标识不一致的第二数量，所述第一子区域与所述第二子区域和所述第三子区域分别相邻；

结果单元，用于根据所述第一数量和所述第二数量，得到第一比对结果。

可选的，所述第二确定单元用于：

根据所述第一区域内的单元区域的像素平均值和所述第一区域的像素平均值，确定所述单元区域的像素标识；或者，

根据所述第一区域内的单元区域的像素平均值和所述单元区域所属的子区域的像素平均值，确定所述单元区域的像素标识。

可选的，所述第一确定单元701用于：

检测所述图像区域中的第二区域是否满足无效条件；

如果所述第二区域满足无效条件，从所述图像区域内的非第二区域中确定第一区域。

可选的，所述无效条件包括：

所述第二区域中存在连续的多个单元区域的像素标识相同，且所述连续的单元区域的区域数量达到第一阈值；或者，

所述第二区域中像素标识相同的多个单元区域的区域数量占所述第二区域中全部单元区域的区域数量的比值达到第二阈值。

可选的，所述第一确定单元701用于：

在视频文件中的一帧图像的图像区域内，确定包括所述图像中的目标对象的区域为第一区域。

参照以上实施例，终端是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit，ASIC)，执行一个或多个软件或固件程序的处理器和存储器，集成逻辑电路，和/或其他可以提供上述功能的器件。

在一个实施例中，本领域的技术人员可以想到图8所示的终端可以采用以下图9所示的形式。本申请实施例中所描述的终端可以包括手机、平板电脑、VR终端等能够支持播放三维视频文件的终端。这里，VR终端可以是指VR穿戴设备，例如VR头戴式显示设备等。

如图8所示，终端可以图8中的结构来实现，终端可包括处理器801、存储器802和显示屏803，处理器801、存储器802与显示屏803耦合。显示屏803能够支持播放三维视频文件和二维视频文件。显示屏804可以采用柔性材料制作。

本申请实施例中，处理器801可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。处理器801还可用于执行图1或图6方法实施例中的方法，也可用于执行图8所示装置中功能单元的功能。

具体的，处理器801调用存储器802中存储的可执行程序代码，执行如下步骤：

在视频文件中的一帧图像的图像区域内确定第一区域；

可选的，所述处理器在所述第一区域内进行图像相似度比对，得到第一比对结果包括：

确定所述第一区域内的单元区域的像素标识；

分别统计所述第一区域中的第一子区域与第二子区域中像素标识不一致的单元区域的第一数量，以及所述第一子区域与第三子区域中像素标识不一致的第二数量，所述第一子区域与所述第二子区域和所述第三子区域分别相邻；

根据所述第一数量和所述第二数量，得到第一比对结果。

可选的，所述处理器确定所述第一区域内的单元区域的像素标识，包括：

可选的，所述处理器在视频文件中的一帧图像的图像区域内确定第一区域，包括：

检测所述图像区域中的第二区域是否满足无效条件；

可选的，所述无效条件包括：

在视频文件中的一帧图像的图像区域内，确定包括所述图像中的目标对象的区域为第一区域

存储器802可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器802可以是独立存在，通过总线与处理器801相连接。存储器802也可以和处理器801集成在一起。

本申请实施例中，通过确定视频文件中的一帧图像的中间区域，并将该图像的中间区域所包括的至少四个小区域中的第一小区域和相邻小区域进行图像相似度比对，以得到第一比对结果，能够根据该比对结果识别出图像是否为三维图像。通过上述方式，能够避免图像中的无效区域对图像相似度比对产生的影响，进而提升三维图像识别的精准度。

本申请实施例还提供了一种计算机存储介质，用于储存为上述终端所用的计算机软件指令，其包含用于执行上述方法实施例所涉及的计算机程序。

尽管在此结合各实施例对本申请进行了描述，然而，在实施所要求保护的本申请过程中，本领域技术人员通过查看附图、公开内容、以及所附权利要求书，可理解并实现公开实施例的其他变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

本领域技术人员应明白，本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中，与其它硬件一起提供或作为硬件的一部分，也可以采用其他分布形式，如通过Internet或其它有线或无线电信系统。

本申请是参照本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种三维图像的识别方法，其特征在于，包括：

在视频文件中的一帧图像的图像区域内确定第一区域；

在所述第一区域内进行图像相似度比对，得到第一比对结果；

在所述图像区域内进行图像相似度比对，得到第二比对结果；

根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。
如权利要求1所述方法，其特征在于，所述在所述第一区域内进行图像相似度比对，得到第一比对结果，包括：

确定所述第一区域内的单元区域的像素标识；

分别统计所述第一区域中的第一子区域与第二子区域中像素标识不一致的单元区域的第一数量，以及所述第一子区域与第三子区域中像素标识不一致的第二数量，所述第一子区域与所述第二子区域和所述第三子区域分别相邻；

根据所述第一数量和所述第二数量，得到第一比对结果。
如权利要求2所述方法，其特征在于，所述确定所述第一区域内的单元区域的像素标识，包括：

根据所述第一区域内的单元区域的像素平均值和所述第一区域的像素平均值，确定所述单元区域的像素标识；或者，

根据所述第一区域内的单元区域的像素平均值和所述单元区域所属的子区域的像素平均值，确定所述单元区域的像素标识。
如权利要求1-3任一项所述方法，其特征在于，所述在视频文件中的一帧图像的图像区域内确定第一区域，包括：

检测所述图像区域中的第二区域是否满足无效条件；

如果所述第二区域满足无效条件，从所述图像区域内的非第二区域中确定第一区域。
如权利要求4所述方法，其特征在于，所述无效条件包括：

所述第二区域中存在连续的多个单元区域的像素标识相同，且所述连续的单元区域的区域数量达到第一阈值；或者，

所述第二区域中像素标识相同的多个单元区域的区域数量占所述第二区域中全部单元区域的区域数量的比值达到第二阈值。
如权利要求1-3任一项所述方法，其特征在于，所述在视频文件中的一帧图像的图像区域内确定第一区域，包括：

在视频文件中的一帧图像的图像区域内，确定包括所述图像中的目标对象的区域为第一区域。
一种终端，其特征在于，包括：

第一确定单元，用于在视频文件中的一帧图像的图像区域内确定第一区域；

第一比对单元，用于在所述第一区域内进行图像相似度比对，得到第一比对结果；

第二比对单元，用于在所述图像区域内进行图像相似度比对，得到第二比对结果；

识别单元，用于根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。
如权利要求7所述终端，其特征在于，所述第一比对单元包括：

第二确定单元，用于确定所述第一区域内的单元区域的像素标识；

统计单元，用于分别统计所述第一区域中的第一子区域与第二子区域中像素标识不一致的单元区域的第一数量，以及所述第一子区域与第三子区域中像素标识不一致的第二数量，所述第一子区域与所述第二子区域和所述第三子区域分别相邻；

结果单元，用于根据所述第一数量和所述第二数量，得到第一比对结果。
如权利要求8所述终端，其特征在于，所述第二确定单元用于：

根据所述第一区域内的单元区域的像素平均值和所述第一区域的像素平均值，确定所述单元区域的像素标识；或者，

根据所述第一区域内的单元区域的像素平均值和所述单元区域所属的子区域的像素平均值，确定所述单元区域的像素标识。
如权利要求7-9任一项所述终端，其特征在于，所述第一确定单元用于：

检测所述图像区域中的第二区域是否满足无效条件；

如果所述第二区域满足无效条件，从所述图像区域内的非第二区域中确定第一区域。
如权利要求10所述终端，其特征在于，所述无效条件包括：

所述第二区域中存在连续的多个单元区域的像素标识相同，且所述连续的单元区域的区域数量达到第一阈值；或者，

所述第二区域中像素标识相同的多个单元区域的区域数量占所述第二区域中全部单元区域的区域数量的比值达到第二阈值。
如权利要求7-9任一项所述终端，其特征在于，所述第一确定单元用于：

在视频文件中的一帧图像的图像区域内，确定包括所述图像中的目标对象的区域为第一区域。
一种终端，其特征在于，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如下步骤：

在视频文件中的一帧图像的图像区域内确定第一区域；

在所述第一区域内进行图像相似度比对，得到第一比对结果；

在所述图像区域内进行图像相似度比对，得到第二比对结果；

根据所述第一比对结果和所述第二比对结果，识别所述图像，如果所述第一比对结果和所述第二比对结果不一致，识别所述图像不是三维图像。
如权利要求13所述终端，其特征在于，所述处理器在所述第一区域内进行图像相似度比对，得到第一比对结果包括：

确定所述第一区域内的单元区域的像素标识；

分别统计所述第一区域中的第一子区域与第二子区域中像素标识不一致的单元区域的第一数量，以及所述第一子区域与第三子区域中像素标识不一致的第二数量，所述第一子区域与所述第二子区域和所述第三子区域分别相邻；

根据所述第一数量和所述第二数量，得到第一比对结果。
如权利要求14所述终端，其特征在于，所述处理器确定所述第一区域内的单元区域的像素标识，包括：

根据所述第一区域内的单元区域的像素平均值和所述第一区域的像素平均值，确定所述单元区域的像素标识；或者，

根据所述第一区域内的单元区域的像素平均值和所述单元区域所属的子区域的像素平均值，确定所述单元区域的像素标识。
如权利要求13-15任一项所述终端，其特征在于，所述处理器在视频文件中的一帧图像的图像区域内确定第一区域，包括：

检测所述图像区域中的第二区域是否满足无效条件；

如果所述第二区域满足无效条件，从所述图像区域内的非第二区域中确定第一区域。
如权利要求16所述终端，其特征在于，所述无效条件包括：

所述第二区域中存在连续的多个单元区域的像素标识相同，且所述连续的单元区域的区域数量达到第一阈值；或者，

所述第二区域中像素标识相同的多个单元区域的区域数量占所述第二区域中全部单元区域的区域数量的比值达到第二阈值。
如权利要求13-15任一项所述终端，其特征在于，所述处理器在视频文件中的一帧图像的图像区域内确定第一区域，包括：

在视频文件中的一帧图像的图像区域内，确定包括所述图像中的目标对象的区域为第一区域。