CN106874855A

CN106874855A - 头肩区域定位方法及装置

Info

Publication number: CN106874855A
Application number: CN201710038748.4A
Authority: CN
Inventors: 谢波; 蒲津; 王宏宾; 张如高
Original assignee: Bocom Intelligent Information Technology Co Ltd Beijing Haidian Branch
Current assignee: Bocom Intelligent Information Technology Co Ltd Beijing Haidian Branch
Priority date: 2017-01-19
Filing date: 2017-01-19
Publication date: 2017-06-20

Abstract

本发明提供了一种头肩区域定位方法及装置，该方法包括：获取驾驶室内的视频图像，将该视频图像输入至头肩检测模型，通过该头肩检测模型的输出定位所述视频图像中的头肩区域，其中，该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。通过本发明解决了现有技术中由于环境光线明暗等客观条件的影响，头肩区域定位存在项目检测率低和检测精度低的问题，实现了精准有效地定位头肩区域，有更好的鲁棒性。

Description

头肩区域定位方法及装置

技术领域

本发明涉及智能交通技术领域，具体涉及一种头肩区域定位方法及装置。

背景技术

智能交通系统是未来交通系统的发展方向，也是目前世界交通运输领域的前沿研究课题。当前大多数车内装有记录行驶状况的前置摄像头，该摄像头可以对驾驶员所在整体区域进行图像采集,在不影响驾驶员驾驶安全的前提下，可以很清晰的拍摄到驾驶员的行为状态。利用对驾驶员头肩区域进行定位，可以得到驾驶员精确的驾驶状态，对其行为进行监视，保障安全驾驶。但是由于环境光线明暗等客观条件的影响，头肩区域定位存在项目检测率低和检测精度低的问题。

发明内容

有鉴于此，本发明实施例提供了一种头肩区域定位方法及装置，以解决现有技术中由于环境光线明暗等客观条件的影响，头肩区域定位存在项目检测率低和检测精度低的问题。

为此，本发明实施例提供了如下技术方案：

本发明实施例提供了一种头肩区域定位方法，包括：获取驾驶室内的视频图像；将所述视频图像输入至头肩检测模型，通过所述头肩检测模型的输出定位所述视频图像中的头肩区域；其中，所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。

可选地，所述头肩训练集包括以下至少之一的参数：所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。

可选地，所述获取驾驶室内的视频图像之后，所述方法还包括：通过高斯滤波对所述视频图像进行平滑处理。

可选地，所述获取驾驶室内的视频图像之后，所述方法还包括：将所述视频图像输入至人体肤色模型，通过所述人体肤色模型对所述视频图像进行增强处理。

本发明实施例还提供了一种头肩区域定位装置，包括：获取模块，用于获取驾驶室内的视频图像；输出模块，用于将所述视频图像输入至头肩检测模型，通过所述头肩检测模型的输出定位所述视频图像中的头肩区域；其中，所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。

可选地，所述头肩训练集包括以下至少之一的参数：人脸区域的LUV、人脸区域的梯度幅值及方向、所述人脸区域下方预定区域的肩部区域；其中，所述人脸区域包括人脸五官信息和人脸面部区域。

可选地，所述装置还包括：第一处理模块，用于在所述获取模块获取驾驶室内的视频图像之后，通过高斯滤波对所述视频图像进行平滑处理。

可选地，所述装置还包括：第二处理模块，用于在所述获取模块获取驾驶室内的视频图像之后，将所述视频图像输入至人体肤色模型，通过所述人体肤色模型对所述视频图像进行增强处理。

本发明实施例技术方案，具有如下优点：

本发明实施例提供了一种头肩区域定位方法及装置，在该方法中，获取驾驶室内的视频图像，将该视频图像输入至头肩检测模型，通过该头肩检测模型的输出定位该视频图像中的头肩区域，其中，该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。通过本发明实施例解决了现有技术中由于环境光线明暗等客观条件的影响，头肩区域定位存在项目检测率低和检测精度低的问题，实现了精准有效地定位头肩区域，有更好的鲁棒性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的头肩区域定位方法的流程图；

图2是根据本发明实施例的头肩区域定位装置的结构框图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，还可以是两个元件内部的连通，可以是无线连接，也可以是有线连接。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

实施例1

在本实施例中提供了一种头肩区域定位方法，图1是根据本发明实施例的头肩定位区域的流程图，如图1所示，该流程包括如下步骤：

步骤S101：获取驾驶室内的视频图像。当前大多数车内装有记录行驶状况的前置摄像头，该摄像头可以对驾驶员所在整体区域进行图像采集,在不影响驾驶员驾驶安全的前提下，可以很清晰的拍摄到驾驶员的行为状态；

步骤S102：将该视频图像输入至头肩检测模型，通过该头肩检测模型的输出定位所述视频图像中的头肩区域；其中，该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。引入该头肩检测模型的目的是从做过平滑等预处理的图片中精确定位出驾驶员头肩区域，具体地，采用聚合通道特征ACF算法，根据头肩部位的特征，分别训练分类器，组合成一个头肩检测模型，该模型能精准有效地定位到头肩区域。

通过上述步骤：获取驾驶室内的视频图像，将该视频图像输入至头肩检测模型，通过该头肩检测模型的输出定位所述视频图像中的头肩区域；其中，该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的；解决了现有技术中由于环境光线明暗等客观条件的影响，头肩区域定位存在项目检测率低和检测精度低的问题，实现了精准有效地定位头肩区域，有更好的鲁棒性。

在一个可选实施例中，上述头肩训练集包括以下至少之一的参数：该头肩区域的特征参数、该头肩区域的LUV、该头肩区域的梯度幅值、该头肩区域的梯度方向。其中人脸区域由左眼、右眼、鼻子和嘴巴构成，每个部件有自己独特的特征，并且各部件在人脸上的位置分布相对固定，在位置空间上存在一定的表观约束。定位到某一个可信度较大的部件，即可对其他未定位到的部件进行假设和估计，人脸区域较为显著的是眼睛、鼻子、嘴巴，结合这些人脸部件组合成的头肩聚合特征模型用来检测驾驶员头肩，能够达到项目检测率和检测精度的要求。ACF共包括10个通道特征：LUV颜色通道(3个)、局部归一化的梯度幅值通道(1个)和梯度方向直方图通道(6个)，每隔7层计算一次通道特征，再使用这些层的特征估计中间层的特征，从而能快速计算特征，ACF使用滑动窗口检测方法，在每一个尺度层，以4个像素为步长，对每一个位置提取4个像素为步长，对每一个位置提取32×16×10＝5120维特征，组成特征向量再由分类器分类。

上述步骤S101涉及到获取驾驶室内的视频图像，为了得到清晰的视频图像，在一个可选实施例中，该方法还包括：通过高斯滤波对该视频图像进行平滑处理。具体地，采用3*3高斯加权滤波器扫描图像中的每一个像素，更改其像素值为其本身和其3*3领域内的其他像素值的加权平均值，图像平滑对点状噪声和干扰脉冲具有良好的抑制作用。

上述步骤S101涉及到获取驾驶室内的视频图像，在此步骤之后，该方法还包括：将该视频图像输入至人体肤色模型，通过该人体肤色模型对所述视频图像进行增强处理。具体地，对图像进行高斯滤波处理之后，可以使用人体肤色模型对图像进行增强处理，扫描图像中的每一个像素点，对符合和不符合人体肤色模型的像素点分别进行处理，人体肤色在图像中的像素值处于一定的范围，驾驶舱内驾驶员的脸和手的区域由于符合人体肤色模型，在一定程度上有别于其他的干扰区域，同时由于肩部和头部的位置关系，使得头肩区域能够准确被定位出来。

实施例2

在本实施例中还提供了一种头肩区域定位装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

本施例提供一种头肩区域定位装置，如图2所示，包括获取模块21，用于获取驾驶室内的视频图像；输出模块22，用于将该视频图像输入至头肩检测模型，通过该头肩检测模型的输出定位该视频图像中的头肩区域；其中，该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的，可选地，该头肩训练集包括以下至少之一的参数：该头肩区域的特征参数、该头肩区域的LUV、该头肩区域的梯度幅值、该头肩区域的梯度方向。

在一个可选实施例中，该装置还包括第一处理模块，用于在该获取模块21获取驾驶室内的视频图像之后，通过高斯滤波对该视频图像进行平滑处理。

在一个可选实施例中，该装置还包括第二处理模块，用于在该获取模块21获取驾驶室内的视频图像之后，将该视频图像输入至人体肤色模型，通过该人体肤色模型对该视频图像进行增强处理。

上述各个模块的更进一步的功能描述与上述对应实施例相同，在此不再赘述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种头肩区域定位方法，其特征在于，包括：

获取驾驶室内的视频图像；

将所述视频图像输入至头肩检测模型，通过所述头肩检测模型的输出定位所述视频图像中的头肩区域；其中，所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。

2.根据权利要求1所述的方法，其特征在于，所述头肩训练集包括以下至少之一的参数：所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。

3.根据权利要求1所述的方法，其特征在于，所述获取驾驶室内的视频图像之后，还包括：

通过高斯滤波对所述视频图像进行平滑处理。

4.根据权利要求1至3中任一所述的方法，其特征在于，所述获取驾驶室内的视频图像之后，还包括：

将所述视频图像输入至人体肤色模型，通过所述人体肤色模型对所述视频图像进行增强处理。

5.一种头肩区域定位装置，其特征在于，包括：

获取模块，用于获取驾驶室内的视频图像；

输出模块，用于将所述视频图像输入至头肩检测模型，通过所述头肩检测模型的输出定位所述视频图像中的头肩区域；其中，所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。

6.根据权利要求5所述的装置，其特征在于，所述头肩训练集包括以下至少之一的参数：所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。

7.根据权利要求5所述的装置，其特征在于，所述装置还包括：

第一处理模块，用于在所述获取模块获取驾驶室内的视频图像之后，通过高斯滤波对所述视频图像进行平滑处理。

8.根据权利要求5至7中任一所述的装置，其特征在于，所述装置还包括：

第二处理模块，用于在所述获取模块获取驾驶室内的视频图像之后，将所述视频图像输入至人体肤色模型，通过所述人体肤色模型对所述视频图像进行增强处理。