CN110796073A

CN110796073A - 一种无纹理场景视频中对特定目标区域的侦测方法和装置

Info

Publication number: CN110796073A
Application number: CN201911032771.8A
Authority: CN
Inventors: 张睿; 应振根
Original assignee: Quzhou University
Current assignee: Quzhou University
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2020-02-14
Anticipated expiration: 2039-10-28
Also published as: CN110796073B

Abstract

本发明提供了一种无纹理场景视频中对特定目标区域的侦测方法和装置，该方法和装置综合利用无纹理视频中的颜色、轮廓和动态性等不同时空信息构建视频场景区域类型描述器，以此对特定目标区域进行侦测和确定，该视频场景区域类型描述器各个信息通道上的特征提取和计算方法简单高效、实时性好，视频样本学习效率高，并可实现实时在线训练；此外，该方法和装置在计算视频场景区域类型描述器各通道的类型值时，还引入了并行计算的方法，显著地提高了方法的整体运算效率，从而克服了现有方法实施在无纹理视频中对特定目标区域检测时运算效率低、实时性差，甚至会失效性的问题。

Description

一种无纹理场景视频中对特定目标区域的侦测方法和装置

技术领域

本发明涉及视频的技术领域，特别涉及一种无纹理场景视频中对特定目标区域的侦测方法和装置。

背景技术

随着视觉移动机器人、无人驾驶、无人机等技术的蓬勃发展，基于视觉的场景分析技术的重要性日益凸显。特定目标区域的检测和辨识是基于视觉的场景分析中的一项关键技术，因为对特定目标区域(如常见障碍物)检测和辨识结果的好坏，将直接影响移动机器人、无人驾驶、无人机等设备的运行模式与运行安全性。

由于无人驾驶、无人机等设备通常运行在较高的速度下，因此对运行中产生的实时视频数据的分析与处理效率要求较高。现有的面向自然场景视频的特定目标区域检测方法存在以下一些缺陷：第一、现有方法不适用于无纹理视频的分析，现有的部分方法需要依赖视频场景中的纹理信息进行分析，但是现实世界的场景类型变化多样，许多场景几乎不存在任何纹理特征被提取利用；第二、现有方法对视频特征的提取和处理完全是基于如深度学习等高运算复杂度的机器学习方法，计算耗时较长，其实时性不够好；第三、大多数基于机器学习的方法依赖于有较大样本数量的有监督学习训练过程，训练过程非常耗时，无法进行实时的在线训练；第四、现有的某些方法没有充分利用视频中的场景动态信息。

发明内容

针对现有技术存在的缺陷，本发明提供一种无纹理场景视频中对特定目标区域的侦测方法和装置，该方法和装置综合利用无纹理视频中的颜色、轮廓和动态性等不同时空信息构建视频场景区域类型描述器，以此对特定目标区域进行侦测和确定，该视频场景区域类型描述器各个信息通道上的特征提取和计算方法简单高效、实时性好，视频样本学习效率高，并可实现实时在线训练；此外，该方法和装置在计算视频场景区域类型描述器各通道的类型值时，还引入了并行计算的方法，显著地提高了方法的整体运算效率，从而克服了现有方法实施在无纹理视频中对特定目标区域检测时运算效率低、实时性差，甚至会失效性的问题。

本发明提供一种无纹理场景视频中对特定目标区域的侦测方法，其特征在于，包括如下步骤：

步骤S1，构建关于无纹理视频中的颜色信息、轮廓信息和动态性信息的三通道的视频场景区域类型描述器；

步骤S2，将包含特定目标区域的视频样本输入至所述视频场景区域类型描述器，以输出获得关于所述特定目标区域的类型向量；

步骤S3，将所述无纹理视频的某一图像帧输入至所述视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量；

步骤S4，获取所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间的匹配度，若所述匹配度大于或者等于预设匹配度阈值，则确定所述每一图像帧当前的场景区域为所述特定目标区域；

进一步，在所述步骤S1中，构建关于无纹理视频中的颜色信息、轮廓信息和动态性信息的三通道的视频场景区域类型描述器具体包括，

步骤S101，构建关于所述无纹理视频中的颜色信息通道，具体为，

S101A，将所述无纹理视频的某一图像帧进行从RGB颜色空间到HSI颜色空间的转换处理，其中，色调H的取值范围为[0°，360°]，饱和度S和强度I的取值范围均为[0，1]；

S101B，将所述色调H对应的域值划分为如下6个子集：H₁＝[30°，90°)、H₂＝[90°，150°)、H₃＝[150°，210°)、H₄＝[210°，270°)、H₅＝[270°，330°)和H₆＝[330°，360°]∪[0°，30°)，以将所述某一图像帧对应的像素点进行关于所述6个子集的分类处理；

S101C，根据所述分类处理的结果，将所述某一图像帧的每一个像素点进行归一化与量化处理，以获得每一个像素点对应的颜色类型值H(i,j)|_t，其中，所述颜色类型值H(i,j)|_t的计算结果如下式(1)

在所述式(1)中，H(i,j)|_t表示所述某一图像帧在坐标(i，j)处的像素点的颜色类型值；

步骤S102，构建关于所述无纹理视频中的轮廓信息通道，具体为，

S102A，通过Hough变换算法计算所述无纹理视频的某一图像帧的图像轮廓，以得到所述某一图像帧内坐标(i，j)处的像素点的第一轮廓特征值s_hough(i,j)|_t，其中，所述第一轮廓特征值s_hough(i,j)|_t满足下面式(2)

S102B，通过Canny算子计算所述无纹理视频的某一图像帧的图像轮廓，以得到所述某一图像帧内坐标(i，j)处的像素点的第二轮廓特征值s_canny(i，j)︱t，其中，所述第二轮廓特征值s_canny(i，j)︱t满足下面式(3)

S102C，通过Isotropic Sobel算子计算所述无纹理视频的某一图像帧的图像轮廓，以得到所述某一图像帧内坐标(i，j)处的像素点的第三轮廓特征值s_sobel(i,j)|_t，其中，所述第三轮廓特征值s_sobel(i,j)|_t满足下面式(4)

S102D，根据下面式(5)，对所述第一轮廓特征值s_hough(i,j)|_t、所述第二轮廓特征值s_canny(i，j)︱t和所述第三轮廓特征值s_sobel(i,j)|_t进行求交集运算处理，以得到所述轮廓类型值S(i,j)|_t，

步骤S103，构建关于所述无纹理视频中的动态性信息通道，具体为，

S103A，基于HSI颜色空间的亮度I通道，构建关于所述无纹理视频的某一图像帧在亮度I通道中每一个像素点的混合高斯背景模型GMM；

S103B，在所述亮度I通道上，统计每一个像素点对应的显著性强度值变化的次数，其中，所述显著性强度值变化是指像素点的强度值变化幅度超出其对应的混合高斯背景模型GMM所限定的强度值正常变化范围；

S103C，在所述亮度I通道上，根据下面式(6)，获取每一个像素点的近期动态特征值

在上述式(6)中，

为所述无纹理视频在所述亮度I通道上从图像帧k到另一图像帧t之间的时间中处于坐标(i，j)处的像素点对应的显著性强度变化的次数，D(i，j)为在所述亮度I通道上从图像帧k到另一图像帧t之间的时间中处于坐标(i，j)处的像素点对应的显著性强度变化的频率，即D(i，j)为在所述亮度I通道上处于坐标(i，j)处的像素点对应的近期动态特征值，并且满足100≤t-k≤20000；

S103D，根据下面式(7)，对所述近期动态特征值D(i，j)进行量化处理，以得到所述动态性类型值D(i,j)|_t

步骤S104，将所述颜色类型值、所述轮廓类型值和所述动态性类型值进行串联，以构建得到所述视频场景区域类型描述器；

进一步，在所述步骤S2中，将包含特定目标区域的视频样本输入至所述视频场景区域类型描述器，以输出获得关于所述特定目标区域的类型向量具体包括，

步骤S201，选取一有且仅有一个典型的特定目标区域的视频样本；

步骤S202，将所述视频样本以逐帧图像的方式输入所述视频场景区域类型描述器，对每一帧图像的特定目标区域中的各个像素点逐一计算得到其对应的类型向量，在对所有像素点的类型向量进行平均向量计算处理，并将所述平均向量计算处理得到的平均向量作为对应帧图像中特定目标区域的类型向量；

进一步，在所述步骤S3中，将所述无纹理视频的某一图像帧输入至所述视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量具体包括，

步骤S301，将所述无纹理视频的某一图像帧输入至所述视频场景区域类型描述器后，所述视频场景区域类型描述器基于并行计算模式，同步地计算得到所述无纹理视频的某一图像帧中每一个像素点的颜色类型值、轮廓类型值和动态性类型值；

步骤S302，将每一个像素点的颜色类型值、轮廓类型值和动态性类型值串联组合成相应的类型向量，同时将具有相同类型向量的像素点归为同一个场景区域，以此分割获得若干场景区域，并且每一个场景区域具有相同且唯一的类型向量；

进一步，在所述步骤S4中，获取所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间的匹配度，若所述匹配度大于或者等于预设匹配度阈值，则确定所述每一图像帧当前的场景区域为所述特定目标区域具体包括，

步骤S401，根据下式(8)，计算所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间的匹配度M

在上述式(8)中，H(i,j)|_t、S(i,j)|_t、D(i,j)|_t分别为所述无纹理视频的某一图像帧中场景区域的颜色类型值、轮廓类型值和动态性类型值，H(i,j)′、S(i,j)′、D(i,j)′分别为所述视频样本中特定目标区域的类型向量对应的颜色类型值、轮廓类型值和动态性类型值，所述匹配度M的取值范围是[0％，100％]，当所述匹配度M＝100％时，表示所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间完全匹配；

步骤S402，将所述预设匹配度阈值设为85％，若所述匹配度M大于或者等于85％，则确定所述某一图像帧当前的场景区域为所述特定目标区。

本发明还提供一种无纹理场景视频中对特定目标区域的侦测装置，其特征在于，所述装置包括：

视频场景区域类型描述器构建模块，其用于构建关于无纹理视频中的颜色信息、轮廓信息和动态性信息的三通道的视频场景区域类型描述器；

类型向量获取模块，其用于将包含特定目标区域的视频样本输入至所述视频场景区域类型描述器，以输出获得关于所述特定目标区域的类型向量；

场景区域分割模块，其用于将所述无纹理视频的某一图像帧输入至所述视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量；

匹配度计算模块，其用于获取所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间的匹配度；

匹配确定模块，其用于根据所述匹配度与预设匹配度阈值之间的关系，确定所述某一图像帧当前的场景区域是否为所述特定目标区域；

进一步，所述视频场景区域类型描述器构建模块包括颜色信息通道构建子模块、轮廓信息通道构建子模块、动态性信息通道构建子模块和串联构建子模块；其中，

所述颜色信息通道构建子模块用于构建关于所述无纹理视频中的颜色信息通道，具体为，

所述轮廓信息通道构建子模块用于构建关于所述无纹理视频中的轮廓信息通道，具体为，

所述动态性信息通道构建子模块用于构建关于所述无纹理视频中的动态性信息通道，具体为，

在上述式(6)中，

所述串联构建子模块用于将所述颜色类型值、所述轮廓类型值和所述动态性类型值进行串联，以构建得到所述视频场景区域类型描述器；

进一步，所述类型向量获取模块包括视频样本选取子模块和类型向量计算子模块；其中，

所述视频样本选取子模块用于选取一有且仅有一个典型的特定目标区域的视频样本；

所述类型向量计算子模块用于将所述视频样本以逐帧图像的方式输入所述视频场景区域类型描述器，对每一帧图像的特定目标区域中的各个像素点逐一计算得到其对应的类型向量，在对所有像素点的类型向量进行平均向量计算处理，并将所述平均向量计算处理得到的平均向量作为对应帧图像中特定目标区域的类型向量；

进一步，所述场景区域分割模块包括实时类型值计算子模块和分割处理子模块；其中，

所述实时类型值计算子模块用于将所述无纹理视频的某一图像帧输入至所述视频场景区域类型描述器后，所述视频场景区域类型描述器基于并行计算模式，同步地计算得到所述无纹理视频的某一图像帧中每一个像素点的颜色类型值、轮廓类型值和动态性类型值；

所述分割处理子模块用于将每一个像素点的颜色类型值、轮廓类型值和动态性类型值串联组合成相应的类型向量，同时将具有相同类型向量的像素点归为同一个场景区域，以此分割获得若干场景区域，并且每一个场景区域具有相同且唯一的类型向量；

进一步，所述匹配度计算模块获取所述匹配度具体为，

根据下式(8)，计算所述每一个场景区域具有的类型向量与所述特定目标区域的类型向量之间的匹配度M

所述匹配确定模块确定所述某一图像帧当前的场景区域是否为所述特定目标区域具体为，

将所述预设匹配度阈值设为85％，若所述匹配度M大于或者等于85％，则确定所述某一图像帧当前的场景区域为所述特定目标区。

相比于现有技术，该无纹理场景视频中对特定目标区域的侦测方法和装置综合利用无纹理视频中的颜色、轮廓和动态性等不同时空信息构建视频场景区域类型描述器，以此对特定目标区域进行侦测和确定，该视频场景区域类型描述器各个信息通道上的特征提取和计算方法简单高效、实时性好，视频样本学习效率高，并可实现实时在线训练；此外，该方法和装置在计算视频场景区域类型描述器各通道的类型值时，还引入了并行计算的方法，显著地提高了方法的整体运算效率，从而克服了现有方法实施在无纹理视频中对特定目标区域检测时运算效率低、实时性差，甚至会失效性的问题。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种无纹理场景视频中对特定目标区域的侦测方法的流程示意图。

图2为本发明提供的一种无纹理场景视频中对特定目标区域的侦测方法中HSI颜色空间的模型示意图。

图3为本发明提供的一种无纹理场景视频中对特定目标区域的侦测方法中场景视频的示意图。

图4为本发明提供的一种无纹理场景视频中对特定目标区域的侦测装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的一种无纹理场景视频中对特定目标区域的侦测方法的流程示意图。该无纹理场景视频中对特定目标区域的侦测方法包括如下步骤：

步骤S2，将包含特定目标区域的视频样本输入至该视频场景区域类型描述器，以输出获得关于该特定目标区域的类型向量；

步骤S3，将该无纹理视频的某一图像帧输入至该视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量；

步骤S4，获取该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间的匹配度，若该匹配度大于或者等于预设匹配度阈值，则确定该每一图像帧当前的场景区域为该特定目标区域。

优选地，在该步骤S1中，构建关于无纹理视频中的颜色信息、轮廓信息和动态性信息的三通道的视频场景区域类型描述器具体包括，

步骤S101，构建关于该无纹理视频中的颜色信息通道，具体为，

S101A，将该无纹理视频的某一图像帧进行从RGB颜色空间到HSI颜色空间的转换处理，在RGB颜色空间中，R表示红色、G表示绿色、B表示蓝色，在HSI颜色空间中，H表示色调、S表示饱和度、I表示强度，其中，色调H的取值范围为[0°，360°]，饱和度S和强度I的取值范围均为[0，1]；

S101B，将该色调H对应的域值划分为如下6个子集：H₁＝[30°，90°)、H₂＝[90°，150°)、H₃＝[150°，210°)、H₄＝[210°，270°)、H₅＝[270°，330°)和H₆＝[330°，360°]∪[0°，30°)，以将该某一图像帧对应的像素点进行关于该6个子集的分类处理，其中，H₁代表红色色调区域、H₂品红色色调区域、H₃蓝色色调区域、H₄青色色调区域、H₅绿色色调区域、H₆黄色色调区域，相应地，该6个子集对应的颜色空间分布模型对应于图2所示的HSI颜色空间的模型示意图；

S101C，根据该分类处理的结果，将该某一图像帧的每一个像素点进行归一化与量化处理，以获得每一个像素点对应的颜色类型值H(i,j)|_t，其中，该颜色类型值H(i,j)|_t的计算结果如下式(1)

在该式(1)中，H(i,j)|_t表示该某一图像帧在坐标(i，j)处的像素点的颜色类型值；

步骤S102，构建关于该无纹理视频中的轮廓信息通道，具体为，

S102A，通过Hough变换算法计算该无纹理视频的某一图像帧的图像轮廓，以得到该某一图像帧内坐标(i，j)处的像素点的第一轮廓特征值s_hough(i,j)|_t，其中，该第一轮廓特征值s_hough(i,j)|_t满足下面式(2)

S102B，通过Canny算子计算该无纹理视频的某一图像帧的图像轮廓，以得到该某一图像帧内坐标(i，j)处的像素点的第二轮廓特征值s_canny(i，j)︱t，其中，该第二轮廓特征值s_canny(i，j)︱t满足下面式(3)

S102C，通过Isotropic Sobel算子计算该无纹理视频的某一图像帧的图像轮廓，以得到该某一图像帧内坐标(i，j)处的像素点的第三轮廓特征值s_sobel(i,j)|_t，其中，该第三轮廓特征值s_sobel(i,j)|_t满足下面式(4)

S102D，根据下面式(5)，对该第一轮廓特征值s_hough(i,j)|_t、该第二轮廓特征值s_canny(i，j)︱t和该第三轮廓特征值s_sobel(i,j)|_t进行求交集运算处理，以得到该轮廓类型值S(i,j)|_t，

步骤S103，构建关于该无纹理视频中的动态性信息通道，具体为，

S103A，基于HSI颜色空间的亮度I通道，构建关于该无纹理视频的某一图像帧在亮度I通道中每一个像素点的混合高斯背景模型GMM；

S103B，在该亮度I通道上，统计每一个像素点对应的显著性强度值变化的次数，其中，该显著性强度值变化是指像素点的强度值变化幅度超出其对应的混合高斯背景模型GMM所限定的强度值正常变化范围；

S103C，在该亮度I通道上，根据下面式(6)，获取每一个像素点的近期动态特征值

在上述式(6)中，

为该无纹理视频在该亮度I通道上从图像帧k到另一图像帧t之间的时间中处于坐标(i，j)处的像素点对应的显著性强度变化的次数，D(i，j)为在该亮度I通道上从图像帧k到另一图像帧t之间的时间中处于坐标(i，j)处的像素点对应的显著性强度变化的频率，即D(i，j)为在该亮度I通道上处于坐标(i，j)处的像素点对应的近期动态特征值，并且满足100≤t-k≤20000；

S103D，根据下面式(7)，对该近期动态特征值D(i，j)进行量化处理，以得到该动态性类型值D(i,j)|_t

步骤S104，将该颜色类型值、该轮廓类型值和该动态性类型值进行串联，以构建得到该视频场景区域类型描述器。

优选地，在该步骤S2中，将包含特定目标区域的视频样本输入至该视频场景区域类型描述器，以输出获得关于该特定目标区域的类型向量具体包括，

步骤S202，将该视频样本以逐帧图像的方式输入该视频场景区域类型描述器，对每一帧图像的特定目标区域中的各个像素点逐一计算得到其对应的类型向量，在对所有像素点的类型向量进行平均向量计算处理，并将该平均向量计算处理得到的平均向量作为对应帧图像中特定目标区域的类型向量。

优选地，在该步骤S3中，将该无纹理视频的某一图像帧输入至该视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量具体包括，

步骤S301，将该无纹理视频的某一图像帧输入至该视频场景区域类型描述器后，该视频场景区域类型描述器基于并行计算模式，同步地计算得到该无纹理视频的某一图像帧中每一个像素点的颜色类型值、轮廓类型值和动态性类型值；

步骤S302，将每一个像素点的颜色类型值、轮廓类型值和动态性类型值串联组合成相应的类型向量，同时将具有相同类型向量的像素点归为同一个场景区域，以此分割获得若干场景区域，并且每一个场景区域具有相同且唯一的类型向量。

优选地，在该步骤S4中，获取该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间的匹配度，若该匹配度大于或者等于预设匹配度阈值，则确定该每一图像帧当前的场景区域为该特定目标区域具体包括，

步骤S401，根据下式(8)，计算该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间的匹配度M

在上述式(8)中，H(i,j)|_t、S(i,j)|_t、D(i,j)|_t分别为该无纹理视频的某一图像帧中场景区域的颜色类型值、轮廓类型值和动态性类型值，H(i,j)′、S(i,j)′、D(i,j)′分别为该视频样本中特定目标区域的类型向量对应的颜色类型值、轮廓类型值和动态性类型值，该匹配度M的取值范围是[0％，100％]，当该匹配度M＝100％时，表示该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间完全匹配；

步骤S402，将该预设匹配度阈值设为85％，若该匹配度M大于或者等于85％，则确定该某一图像帧当前的场景区域为该特定目标区。

具体如图3所示的场景视频，该场景视频的帧率为25帧/秒，时长为15分钟的幼儿园场景的高清视频，其时间跨度长，场景内容复杂，场景纹理和轮扣信息丰富多样，，但是缺少纹理信息，该无纹理场景视频中对特定目标区域的侦测方法能够显著地提高其整体运算效率，从而提高对视频复杂场景区域分割的有效性、正确性和运算效率。

参阅图4，为本发明实施例提供的一种无纹理场景视频中对特定目标区域的侦测装置的结构示意图。该无纹理场景视频中对特定目标区域的侦测装置包括：

类型向量获取模块，其用于将包含特定目标区域的视频样本输入至该视频场景区域类型描述器，以输出获得关于该特定目标区域的类型向量；

场景区域分割模块，其用于将该无纹理视频的某一图像帧输入至该视频场景区域类型描述器，以分割获得若干场景区域，其中，每一个场景区域分别具有相应的类型向量；

匹配度计算模块，其用于获取该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间的匹配度；

匹配确定模块，其用于根据该匹配度与预设匹配度阈值之间的关系，确定该某一图像帧当前的场景区域是否为该特定目标区域。

优选地，该视频场景区域类型描述器构建模块包括颜色信息通道构建子模块、轮廓信息通道构建子模块、动态性信息通道构建子模块和串联构建子模块；其中，

该颜色信息通道构建子模块用于构建关于该无纹理视频中的颜色信息通道，具体为，

S101A，将该无纹理视频的某一图像帧进行从RGB颜色空间到HSI颜色空间的转换处理，其中，色调H的取值范围为[0°，360°]，饱和度S和强度I的取值范围均为[0，1]；

S101B，将该色调H对应的域值划分为如下6个子集：H₁＝[30°，90°)、H₂＝[90°，150°)、H₃＝[150°，210°)、H₄＝[210°，270°)、H₅＝[270°，330°)和H₆＝[330°，360°]∪[0°，30°)，以将该某一图像帧对应的像素点进行关于该6个子集的分类处理；

该轮廓信息通道构建子模块用于构建关于该无纹理视频中的轮廓信息通道，具体为，

该动态性信息通道构建子模块用于构建关于该无纹理视频中的动态性信息通道，具体为，

在上述式(6)中，

该串联构建子模块用于将该颜色类型值、该轮廓类型值和该动态性类型值进行串联，以构建得到该视频场景区域类型描述器。

优选地，该类型向量获取模块包括视频样本选取子模块和类型向量计算子模块；其中，

该视频样本选取子模块用于选取一有且仅有一个典型的特定目标区域的视频样本；

该类型向量计算子模块用于将该视频样本以逐帧图像的方式输入该视频场景区域类型描述器，对每一帧图像的特定目标区域中的各个像素点逐一计算得到其对应的类型向量，在对所有像素点的类型向量进行平均向量计算处理，并将该平均向量计算处理得到的平均向量作为对应帧图像中特定目标区域的类型向量。

优选地，该场景区域分割模块包括实时类型值计算子模块和分割处理子模块；其中，

该实时类型值计算子模块用于将该无纹理视频的某一图像帧输入至该视频场景区域类型描述器后，该视频场景区域类型描述器基于并行计算模式，同步地计算得到该无纹理视频的某一图像帧中每一个像素点的颜色类型值、轮廓类型值和动态性类型值；

该分割处理子模块用于将每一个像素点的颜色类型值、轮廓类型值和动态性类型值串联组合成相应的类型向量，同时将具有相同类型向量的像素点归为同一个场景区域，以此分割获得若干场景区域，并且每一个场景区域具有相同且唯一的类型向量。

优选地，该匹配度计算模块获取该匹配度具体为，

根据下式(8)，计算该每一个场景区域具有的类型向量与该特定目标区域的类型向量之间的匹配度M

该匹配确定模块确定该某一图像帧当前的场景区域是否为该特定目标区域具体为，

将该预设匹配度阈值设为85％，若该匹配度M大于或者等于85％，则确定该某一图像帧当前的场景区域为该特定目标区。

从上述实施例的内容可知，该无纹理场景视频中对特定目标区域的侦测方法和装置综合利用无纹理视频中的颜色、轮廓和动态性等不同时空信息构建视频场景区域类型描述器，以此对特定目标区域进行侦测和确定，该视频场景区域类型描述器各个信息通道上的特征提取和计算方法简单高效、实时性好，视频样本学习效率高，并可实现实时在线训练；此外，该方法和装置在计算视频场景区域类型描述器各通道的类型值时，还引入了并行计算的方法，显著地提高了方法的整体运算效率，从而克服了现有方法实施在无纹理视频中对特定目标区域检测时运算效率低、实时性差，甚至会失效性的问题。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。