CN106874855A - 头肩区域定位方法及装置 - Google Patents
头肩区域定位方法及装置 Download PDFInfo
- Publication number
- CN106874855A CN106874855A CN201710038748.4A CN201710038748A CN106874855A CN 106874855 A CN106874855 A CN 106874855A CN 201710038748 A CN201710038748 A CN 201710038748A CN 106874855 A CN106874855 A CN 106874855A
- Authority
- CN
- China
- Prior art keywords
- head
- shoulder
- video image
- driver
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Abstract
本发明提供了一种头肩区域定位方法及装置,该方法包括:获取驾驶室内的视频图像,将该视频图像输入至头肩检测模型,通过该头肩检测模型的输出定位所述视频图像中的头肩区域,其中,该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。通过本发明解决了现有技术中由于环境光线明暗等客观条件的影响,头肩区域定位存在项目检测率低和检测精度低的问题,实现了精准有效地定位头肩区域,有更好的鲁棒性。
Description
技术领域
本发明涉及智能交通技术领域,具体涉及一种头肩区域定位方法及装置。
背景技术
智能交通系统是未来交通系统的发展方向,也是目前世界交通运输领域的前沿研究课题。当前大多数车内装有记录行驶状况的前置摄像头,该摄像头可以对驾驶员所在整体区域进行图像采集,在不影响驾驶员驾驶安全的前提下,可以很清晰的拍摄到驾驶员的行为状态。利用对驾驶员头肩区域进行定位,可以得到驾驶员精确的驾驶状态,对其行为进行监视,保障安全驾驶。但是由于环境光线明暗等客观条件的影响,头肩区域定位存在项目检测率低和检测精度低的问题。
发明内容
有鉴于此,本发明实施例提供了一种头肩区域定位方法及装置,以解决现有技术中由于环境光线明暗等客观条件的影响,头肩区域定位存在项目检测率低和检测精度低的问题。
为此,本发明实施例提供了如下技术方案:
本发明实施例提供了一种头肩区域定位方法,包括:获取驾驶室内的视频图像;将所述视频图像输入至头肩检测模型,通过所述头肩检测模型的输出定位所述视频图像中的头肩区域;其中,所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。
可选地,所述头肩训练集包括以下至少之一的参数:所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。
可选地,所述获取驾驶室内的视频图像之后,所述方法还包括:通过高斯滤波对所述视频图像进行平滑处理。
可选地,所述获取驾驶室内的视频图像之后,所述方法还包括:将所述视频图像输入至人体肤色模型,通过所述人体肤色模型对所述视频图像进行增强处理。
本发明实施例还提供了一种头肩区域定位装置,包括:获取模块,用于获取驾驶室内的视频图像;输出模块,用于将所述视频图像输入至头肩检测模型,通过所述头肩检测模型的输出定位所述视频图像中的头肩区域;其中,所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。
可选地,所述头肩训练集包括以下至少之一的参数:人脸区域的LUV、人脸区域的梯度幅值及方向、所述人脸区域下方预定区域的肩部区域;其中,所述人脸区域包括人脸五官信息和人脸面部区域。
可选地,所述装置还包括:第一处理模块,用于在所述获取模块获取驾驶室内的视频图像之后,通过高斯滤波对所述视频图像进行平滑处理。
可选地,所述装置还包括:第二处理模块,用于在所述获取模块获取驾驶室内的视频图像之后,将所述视频图像输入至人体肤色模型,通过所述人体肤色模型对所述视频图像进行增强处理。
本发明实施例技术方案,具有如下优点:
本发明实施例提供了一种头肩区域定位方法及装置,在该方法中,获取驾驶室内的视频图像,将该视频图像输入至头肩检测模型,通过该头肩检测模型的输出定位该视频图像中的头肩区域,其中,该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。通过本发明实施例解决了现有技术中由于环境光线明暗等客观条件的影响,头肩区域定位存在项目检测率低和检测精度低的问题,实现了精准有效地定位头肩区域,有更好的鲁棒性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的头肩区域定位方法的流程图;
图2是根据本发明实施例的头肩区域定位装置的结构框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
在本实施例中提供了一种头肩区域定位方法,图1是根据本发明实施例的头肩定位区域的流程图,如图1所示,该流程包括如下步骤:
步骤S101:获取驾驶室内的视频图像。当前大多数车内装有记录行驶状况的前置摄像头,该摄像头可以对驾驶员所在整体区域进行图像采集,在不影响驾驶员驾驶安全的前提下,可以很清晰的拍摄到驾驶员的行为状态;
步骤S102:将该视频图像输入至头肩检测模型,通过该头肩检测模型的输出定位所述视频图像中的头肩区域;其中,该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。引入该头肩检测模型的目的是从做过平滑等预处理的图片中精确定位出驾驶员头肩区域,具体地,采用聚合通道特征ACF算法,根据头肩部位的特征,分别训练分类器,组合成一个头肩检测模型,该模型能精准有效地定位到头肩区域。
通过上述步骤:获取驾驶室内的视频图像,将该视频图像输入至头肩检测模型,通过该头肩检测模型的输出定位所述视频图像中的头肩区域;其中,该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的;解决了现有技术中由于环境光线明暗等客观条件的影响,头肩区域定位存在项目检测率低和检测精度低的问题,实现了精准有效地定位头肩区域,有更好的鲁棒性。
在一个可选实施例中,上述头肩训练集包括以下至少之一的参数:该头肩区域的特征参数、该头肩区域的LUV、该头肩区域的梯度幅值、该头肩区域的梯度方向。其中人脸区域由左眼、右眼、鼻子和嘴巴构成,每个部件有自己独特的特征,并且各部件在人脸上的位置分布相对固定,在位置空间上存在一定的表观约束。定位到某一个可信度较大的部件,即可对其他未定位到的部件进行假设和估计,人脸区域较为显著的是眼睛、鼻子、嘴巴,结合这些人脸部件组合成的头肩聚合特征模型用来检测驾驶员头肩,能够达到项目检测率和检测精度的要求。ACF共包括10个通道特征:LUV颜色通道(3个)、局部归一化的梯度幅值通道(1个)和梯度方向直方图通道(6个),每隔7层计算一次通道特征,再使用这些层的特征估计中间层的特征,从而能快速计算特征,ACF使用滑动窗口检测方法,在每一个尺度层,以4个像素为步长,对每一个位置提取4个像素为步长,对每一个位置提取32×16×10=5120维特征,组成特征向量再由分类器分类。
上述步骤S101涉及到获取驾驶室内的视频图像,为了得到清晰的视频图像,在一个可选实施例中,该方法还包括:通过高斯滤波对该视频图像进行平滑处理。具体地,采用3*3高斯加权滤波器扫描图像中的每一个像素,更改其像素值为其本身和其3*3领域内的其他像素值的加权平均值,图像平滑对点状噪声和干扰脉冲具有良好的抑制作用。
上述步骤S101涉及到获取驾驶室内的视频图像,在此步骤之后,该方法还包括:将该视频图像输入至人体肤色模型,通过该人体肤色模型对所述视频图像进行增强处理。具体地,对图像进行高斯滤波处理之后,可以使用人体肤色模型对图像进行增强处理,扫描图像中的每一个像素点,对符合和不符合人体肤色模型的像素点分别进行处理,人体肤色在图像中的像素值处于一定的范围,驾驶舱内驾驶员的脸和手的区域由于符合人体肤色模型,在一定程度上有别于其他的干扰区域,同时由于肩部和头部的位置关系,使得头肩区域能够准确被定位出来。
实施例2
在本实施例中还提供了一种头肩区域定位装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本施例提供一种头肩区域定位装置,如图2所示,包括获取模块21,用于获取驾驶室内的视频图像;输出模块22,用于将该视频图像输入至头肩检测模型,通过该头肩检测模型的输出定位该视频图像中的头肩区域;其中,该头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的,可选地,该头肩训练集包括以下至少之一的参数:该头肩区域的特征参数、该头肩区域的LUV、该头肩区域的梯度幅值、该头肩区域的梯度方向。
在一个可选实施例中,该装置还包括第一处理模块,用于在该获取模块21获取驾驶室内的视频图像之后,通过高斯滤波对该视频图像进行平滑处理。
在一个可选实施例中,该装置还包括第二处理模块,用于在该获取模块21获取驾驶室内的视频图像之后,将该视频图像输入至人体肤色模型,通过该人体肤色模型对该视频图像进行增强处理。
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (8)
1.一种头肩区域定位方法,其特征在于,包括:
获取驾驶室内的视频图像;
将所述视频图像输入至头肩检测模型,通过所述头肩检测模型的输出定位所述视频图像中的头肩区域;其中,所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述头肩训练集包括以下至少之一的参数:所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。
3.根据权利要求1所述的方法,其特征在于,所述获取驾驶室内的视频图像之后,还包括:
通过高斯滤波对所述视频图像进行平滑处理。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述获取驾驶室内的视频图像之后,还包括:
将所述视频图像输入至人体肤色模型,通过所述人体肤色模型对所述视频图像进行增强处理。
5.一种头肩区域定位装置,其特征在于,包括:
获取模块,用于获取驾驶室内的视频图像;
输出模块,用于将所述视频图像输入至头肩检测模型,通过所述头肩检测模型的输出定位所述视频图像中的头肩区域;其中,所述头肩检测模型是通过多个头肩训练集和多个非头肩训练集对分类器进行训练得到的。
6.根据权利要求5所述的装置,其特征在于,所述头肩训练集包括以下至少之一的参数:所述头肩区域的特征参数、所述头肩区域的LUV、所述头肩区域的梯度幅值、所述头肩区域的梯度方向。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于在所述获取模块获取驾驶室内的视频图像之后,通过高斯滤波对所述视频图像进行平滑处理。
8.根据权利要求5至7中任一所述的装置,其特征在于,所述装置还包括:
第二处理模块,用于在所述获取模块获取驾驶室内的视频图像之后,将所述视频图像输入至人体肤色模型,通过所述人体肤色模型对所述视频图像进行增强处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710038748.4A CN106874855A (zh) | 2017-01-19 | 2017-01-19 | 头肩区域定位方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710038748.4A CN106874855A (zh) | 2017-01-19 | 2017-01-19 | 头肩区域定位方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106874855A true CN106874855A (zh) | 2017-06-20 |
Family
ID=59158435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710038748.4A Pending CN106874855A (zh) | 2017-01-19 | 2017-01-19 | 头肩区域定位方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106874855A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563998A (zh) * | 2018-03-16 | 2018-09-21 | 新智认知数据服务有限公司 | 活体识别模型训练方法、活体检测方法及装置 |
CN110186167A (zh) * | 2019-05-31 | 2019-08-30 | 广东美的制冷设备有限公司 | 空调器的控制方法、装置、空调器及存储介质 |
CN112507872A (zh) * | 2020-12-09 | 2021-03-16 | 中科视语(北京)科技有限公司 | 人体头肩区域的定位方法、定位装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117413A (zh) * | 2011-03-01 | 2011-07-06 | 金华就约我吧网络科技有限公司 | 基于多层特征的不良图像自动过滤方法 |
CN105488453A (zh) * | 2015-11-30 | 2016-04-13 | 杭州全实鹰科技有限公司 | 一种基于图像处理的驾驶员未系安全带检测识别方法 |
CN105678268A (zh) * | 2016-01-11 | 2016-06-15 | 华东理工大学 | 一种基于双区域学习的地铁站场景行人计数实现方法 |
-
2017
- 2017-01-19 CN CN201710038748.4A patent/CN106874855A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117413A (zh) * | 2011-03-01 | 2011-07-06 | 金华就约我吧网络科技有限公司 | 基于多层特征的不良图像自动过滤方法 |
CN105488453A (zh) * | 2015-11-30 | 2016-04-13 | 杭州全实鹰科技有限公司 | 一种基于图像处理的驾驶员未系安全带检测识别方法 |
CN105678268A (zh) * | 2016-01-11 | 2016-06-15 | 华东理工大学 | 一种基于双区域学习的地铁站场景行人计数实现方法 |
Non-Patent Citations (1)
Title |
---|
江源远: "基于计算机视觉的车辆前方行人检测算法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563998A (zh) * | 2018-03-16 | 2018-09-21 | 新智认知数据服务有限公司 | 活体识别模型训练方法、活体检测方法及装置 |
CN110186167A (zh) * | 2019-05-31 | 2019-08-30 | 广东美的制冷设备有限公司 | 空调器的控制方法、装置、空调器及存储介质 |
CN112507872A (zh) * | 2020-12-09 | 2021-03-16 | 中科视语(北京)科技有限公司 | 人体头肩区域的定位方法、定位装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106919915B (zh) | 基于adas系统的地图道路标记及道路质量采集装置及方法 | |
CN106373394B (zh) | 一种基于视频和雷达的车辆检测方法及系统 | |
CN109147368A (zh) | 基于车道线的智能驾驶控制方法装置与电子设备 | |
WO2020181685A1 (zh) | 一种基于深度学习的车载视频目标检测方法 | |
CN108875603A (zh) | 基于车道线的智能驾驶控制方法和装置、电子设备 | |
JP2019075116A (ja) | トラッキングネットワークを含むCNN(Convolutional Neural Network)を用いてイメージ上の客体に対応するバウンディングボックスを獲得するための方法及びこれを利用した装置 | |
CN106910217A (zh) | 视觉地图建立方法、计算装置、计算机存储介质和智能车辆 | |
CN107886080A (zh) | 一种泊车位检测方法 | |
CN103714321B (zh) | 基于距离图像和强度图像的驾驶员人脸定位系统 | |
CN107576960A (zh) | 视觉雷达时空信息融合的目标检测方法及系统 | |
CN104616502B (zh) | 基于组合式车路视频网络的车牌识别与定位系统 | |
CN108921089A (zh) | 车道线检测方法、装置和系统及存储介质 | |
CN108038456A (zh) | 一种人脸识别系统中的防欺骗方法 | |
CN106326893A (zh) | 一种基于区域辨别的车辆颜色识别方法 | |
CN107305635A (zh) | 对象识别方法、对象识别装置和分类器训练方法 | |
CN109961013A (zh) | 车道线的识别方法、装置、设备及计算机可读存储介质 | |
CN109074490A (zh) | 通路检测方法、相关装置及计算机可读存储介质 | |
Almagambetov et al. | Mobile standards-based traffic light detection in assistive devices for individuals with color-vision deficiency | |
CN105956527A (zh) | 用于无人驾驶车的障碍物检测结果评估方法和装置 | |
CN105868690A (zh) | 识别驾驶员打手机行为的方法和装置 | |
CN108805016A (zh) | 一种头肩区域检测方法及装置 | |
CN111161160B (zh) | 一种雾天障碍物检测方法、装置、电子设备和存储介质 | |
CN106874855A (zh) | 头肩区域定位方法及装置 | |
CN107315095A (zh) | 基于视频处理的具有光照适应性的多车辆自动测速方法 | |
CN108363953A (zh) | 一种行人检测的方法及双目监控设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170620 |