CN108805016A - 一种头肩区域检测方法及装置 - Google Patents

一种头肩区域检测方法及装置 Download PDF

Info

Publication number
CN108805016A
CN108805016A CN201810391398.4A CN201810391398A CN108805016A CN 108805016 A CN108805016 A CN 108805016A CN 201810391398 A CN201810391398 A CN 201810391398A CN 108805016 A CN108805016 A CN 108805016A
Authority
CN
China
Prior art keywords
image
detected
training
network layer
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810391398.4A
Other languages
English (en)
Other versions
CN108805016B (zh
Inventor
谢波
陈江林
彭莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ennew Digital Technology Co Ltd
Original Assignee
Ennew Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ennew Digital Technology Co Ltd filed Critical Ennew Digital Technology Co Ltd
Priority to CN201810391398.4A priority Critical patent/CN108805016B/zh
Publication of CN108805016A publication Critical patent/CN108805016A/zh
Application granted granted Critical
Publication of CN108805016B publication Critical patent/CN108805016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像检测技术领域,特别涉及一种头肩区域检测方法及装置。该方法为:获取待检测图像;基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,其中,上述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;基于上述检测结果判定所述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。采用上述方法,对待检测原图的特征提取更全面,从而使得候选框生成网络层能够从多尺度特征来进行候选框的生成,保证了对拍摄质量差,图像不清晰的原图像的检测结果的精确性。

Description

一种头肩区域检测方法及装置
技术领域
本发明涉及图像检测技术领域,特别涉及一种头肩区域方法及装置。
背景技术
随着计算机技术、大数据人工智能技术的飞速发展,运用图像检测技术实现安全、高效的管理成为智能交通的主要发展方向。通过检测拍摄到的车辆图像,检测出驾驶员头肩区域,并进一步的通过检测出的驾驶员头肩区域,判断驾驶员驾驶行为,从而有效的监管驾驶员驾驶行为,促使驾驶员有意识的养成安全文明驾车的习惯,最终达到减少由于不安全规范的驾驶行为而造成交通事故发生的几率。
目前,驾驶员头肩区域检测方法是采用传统的图像检测方法来检测的,例如,采用ACF算法或者DPM算法确定驾驶员头肩区域,并需要用人工核准的方法来校准确定出的驾驶员头肩区域,记录驾驶员头肩区域在原图像中的坐标和尺寸信息。
然而,目前的驾驶员头肩区域检测方法仅对采集到的图像质量较好,图像较清晰的原图像的检测效果佳,检测结果准确,而针对采集到的图像质量较差,图像不清晰的原图像的检测效果不佳,检测结果不准确。
发明内容
本发明实施例的目的是提供一种头肩区域检测方法及装置,用以解决现有技术中存在的针对采集到的图像质量较差,图像不清晰的原图像的检测效果不佳,检测结果不准确的问题。
本发明实施例中提供的具体技术方案如下:
第一方面,本发明提供一种头肩区域检测方法,该方法包括:获取待检测图像;基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,其中,上述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;基于上述检测结果判定上述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。
采用本发明提供的头肩区域检测方法,采集待检测图像,并将待检测图像输入包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型中,网络模型的特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能,该特征提取网络层提取出的待检测图像的特征点更全面,经特征融合处理后,使得待检测图像中头肩区域的检测率更高,检测结果更准确,提高了头肩区域检测精度。
可选的,上述特征提取网络层是基于ION网络,C-RELU激活函数和Inception-Resnet网络的特性设计的。
可选的,上述候选框生成网络为RPN网络,用于从上述待检测图像相对应的特征图中提取15-20个锚点,并进行卷积处理;上述目标检测网络为RCNN,采用globel-pooling层对卷积层输出的特征图进行池化处理,以减少过拟合程度。
可选的,在上述获取待检测图像之前,进一步包括:
采用公共数据集对预训练网络进行训练,得到相应的预模型,其中,所述预模型用于初始化所述特征提取网络层的参数;并采用预设的图像样本集合对上述预模型进行训练,得到所述网络模型。
上述可选的方式表征,需要预先采用公共数据集(如,Imagenet数据集)对预训练网络进行训练,得到相应的预模型,然后,再采用预设的图像样本集合对上述预模型进行训练,得到最终训练完成的网络模型,采用公共数据对预训练网络进行训练,能够加快预训练网络的的网络收敛能力,提升预训练网络的泛化能力。
可选的,上述采用公共数据集对预训练网络进行训练,包括:
根据上述特征提取网络层和上述目标检测网络层,生成相应的预训练网络;并采用公共数据集对上述预训练网络进行训练。
上述可选的方式表征,一种具体的采用公共数据集对预训练网络进行训练的方式,首先,需要融合特征提取网络层和目标检测网络层,构成预训练网络;然后,采用公共数据集对上述预训练网络进行训练,相当于为特征提取网络层初始化参数。
可选的,上述采用预设的图像样本集合对预模型进行训练,包括:
依次将上述图像样本集合中的样本图像输入上述预模型;按照预设的第一训练次数,依次针对上述图像样本集合中每一样本图像进行训练,并在确定总训练次数达到第一设定阈值时,按照预设的第二训练次数,依次针对上述图像样本集合中每一样本图像进行训练,其中,预设的第一训练次数等于第二训练次数与常数N之和,N为大于等于1的正整数;直至当前预设的训练次数小于等于N时,按照上述当前预设的训练次数,依次针对上述图像样本集合中每一样本图像进行训练,完成对上述预模型的训练。
上述可选的方式表征,使用多个图像样本对预模型进行训练,并设定相应的训练规则,具体的,在训练初期,采用较大的循环训练次数分别对每一图像样本进行训练,在确定完成指定次数的训练之后,减小循环训练次数,并采用减小后的循环训练次数分别对每一图像样本进行训练,直至循环训练次数满足设定条件时,完成预模型训练,当然,预模型在训练过程中,根据训练结果自适应调整各网络层的参数。
可选的,上述基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,包括:
将上述待检测图像输入上述网络模型中;上述特征提取网络层提取上述待检测图像的特征点,并将包含上述特征点的特征图输入上述候选框生成网络层;上述候选框生成网络层以预设大小的卷积核对上述特征图进行卷积处理,得到相应的多维向量,并生成多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,映射至上述待检测图像上。
上述可选的方式表征,在具体使用已训练完成的网络模型进行头肩区域检测的过程中,采用基于ION网络,C-RELU激活函数和Inception-Resnet网络的特性设计的特征提取网络层提取待检测图像的特征点,并将包含特征点的特征图输入候选框生成网络层,候选框生成网络层以卷积核大小为1×1的卷积核对上述特征图进行卷积先处理,得到相应的多维向量,并生成多个不同尺度的,包含有类别和/或位置信息的候选框,并映射至原图中。基于多尺度、多长宽比生成多个候选框,满足头肩图像多尺度的需求。
可选的,上述基于上述检测结果,确定头肩区域在上述待检测图像中的位置,包括:
根据上述多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,分别计算各候选框中头肩区域与相应候选框的重合度;将头肩区域与相应候选框的重合度大于预设值的候选框的区域位置,作为头肩区域在上述待检测图像中的位置。
上述可选的方式表征,从上述多个候选框中选择出一个实际头肩区域与相应候选框的重合度大于设定值的候选框,并将选择出的候选框的区域位置作为检测出的头肩区域在原图中的区域位置。当然,若满足条件的为两个或以上,则将重合度最大的候选框的区域位置作为检测出的头肩区域在原图中的区域位置。
可选的,上述头肩区域检测方法进一步包括:
在上述待监测图像中标注上述头肩区域的类别和/或位置。
上述可选的方式表征,还可以根据检测结果,采用工具在原图中标注出头肩区域的类别和坐标。
第二方面,本发明提供一种头肩区域检测装置,该装置包括:获取单元,用于获取待检测图像;检测单元,用于基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对所述待检测图像进行检测,得到相应的检测结果,其中,所述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;确定单元,用于基于所述检测结果判定上述待检测图形中存在头肩区域时,确定上述头肩区域在所述待检测图像中的位置。
可选的,上述特征提取网络层是基于ION网络,C-RELU激活函数和Inception-Resnet网络的特性设计的。
可选的,上述候选框生成网络为RPN网络,用于从上述待检测图像相对应的特征图中提取15-20个锚点,并进行卷积处理;上述目标检测网络为RCNN,采用globel-pooling层对卷积层输出的特征图进行池化处理,以减少过拟合程度。
可选的,上述头肩区域检测装置进一步包括:
训练单元,用于采用公共数据集对预训练网络进行训练,得到相应的预模型,其中,所述预模型用于初始化所述特征提取网络层的参数;并采用预设的图像样本集合对上述预模型进行训练,得到所述网络模型。
可选的,在上述采用公共数据集对预训练网络进行训练时,上述训练单元用于:
根据上述特征提取网络层和上述目标检测网络层,生成相应的预训练网络;并采用公共数据集对上述预训练网络进行训练。
可选的,在上述采用预设的图像样本集合对预模型进行训练时,上述训练单元用于:
依次将上述图像样本集合中的样本图像输入上述预模型;按照预设的第一训练次数,依次针对上述图像样本集合中每一样本图像进行训练,并在确定总训练次数达到第一设定阈值时,按照预设的第二训练次数,依次针对上述图像样本集合中每一样本图像进行训练,其中,预设的第一训练次数等于第二训练次数与常数N之和,N为大于等于1的正整数;直至当前预设的训练次数小于等于N时,按照上述当前预设的训练次数,依次针对上述图像样本集合中每一样本图像进行训练,完成对上述预模型的训练。
可选的,在上述基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果时,上述检测单元用于:
将上述待检测图像输入上述网络模型中;上述特征提取网络层提取上述待检测图像的特征点,并将包含上述特征点的特征图输入上述候选框生成网络层;上述候选框生成网络层以预设大小的卷积核对上述特征图进行卷积处理,得到相应的多维向量,并生成多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,映射至上述待检测图像上。
可选的,在上述基于上述检测结果,确定头肩区域在上述待检测图像中的位置时,上述确定单元用于:
根据上述多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,分别计算各候选框中头肩区域与相应候选框的重合度;将头肩区域与相应候选框的重合度大于预设值的候选框的区域位置,作为头肩区域在上述待检测图像中的位置。
可选的,上述头肩区域检测装置进一步包括:
标注单元,用于在上述待监测图像中标注上述头肩区域的类别和/或位置。
第三方面,本发明提供一种计算设备,该计算设备包括:存储器,用于存储程序指令;处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述第一方面中任一项方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述第一方面中任一项方法。
本发明有益效果如下:
综上所述,本发明实施例中,获取待检测图像;基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,其中,上述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;基于上述检测结果判定上述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。
采用上述方法,网络模型中的特征提取网络层网络模型的特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能,在对待检测图像进行特征提取时,特征提取更全面,从而使得候选框生成网络层能够从多尺度特征来进行候选框的生成,保证了对拍摄质量差,图像不清晰的原图像的检测结果的精确性,避免了由于原图像自身拍摄质量不佳而导致检测率不高,检测结果不准确的问题。
附图说明
图1为本发明实施例中,一种头肩区域检测方法的流程示意图;
图2为本发明实施例中,一种网络模型训练方法的流程示意图;
图3为本发明实施例中,网络模型生成的多个候选框的示意图;
图4为本发明实施例中,一种头肩区域检测装置的结构示意图。
具体实施方式
为了便于理解本发明实施例中介绍的技术方案,现给出部分术语的定义:
1、待检测图像,指的是由摄像头直接拍摄得到的原视频帧或图像。实际应用中,由于天气,环境和光照等因素,可能会导致由摄像头直接拍摄得到的原图像的拍摄质量不稳定。
2、头肩区域,指的是摄像头拍摄得到的原视频帧或图像中,车辆驾驶员头部和肩部所在的区域。实际应用中,可根据驾驶员头肩区域判断驾驶员是否存在违规驾驶行为。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先,本发明实施例中术语“和”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
下面将通过具体实施例对本发明的方案进行详细描述,当然,本发明并不限于以下实施例。
参阅图1所示,本发明实施例中,一种头肩区域检测方法的详细流程如下:
步骤100:获取待检测图像。
实际应用中,为了监控车辆行为,记录驾驶员违规驾车行为,现有的道路上,多处设置有摄像头,在车辆经过时,拍摄视频或图像,那么,本发明实施例中,可将道路上摄像头采集到的视频帧或图像作为待检测图像。由于摄像头拍摄到的待检测图像中包含有车辆,那么,为了确定该车辆的驾驶员是否存在违规驾驶行为(如,抽烟,未系安全带等等),就需要从待检测图像中确定驾驶员头肩区域的位置,再根据确定出的驾驶员头肩区域的位置,判断驾驶员是否存在违规驾驶行为。
步骤110:基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,其中,上述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能。
具体的,本发明实施例中,将道路上摄像头拍摄的视频帧或图像作为待检测图像,在获取到待检测图像之后,将待检测图像输入以训练完成的检测网络模型中,并由检测网络模型对该检测图像进行检测,得到相应的检测结果。
本发明实施例中,在执行步骤110时,将上述待检测图像输入上述网络模型中;上述特征提取网络层提取上述待检测图像的特征点,并将包含上述特征点的特征图输入上述候选框生成网络层;上述候选框生成网络层以预设大小的卷积核对上述特征图进行卷积处理,得到相应的多维向量,并生成多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,映射至上述待检测图像上。
例如,假设将待检测图像1输入网络模型中,网络模型中的特征提取网络层提取待检测图像1的特征点,并输出包含上述特征点的与待检测图像1相对应的特征图1,将特征图1作为网络模型中候选框生成网络层的输入,候选框生成网络层以特征图1为基础,基于特征图1中的特征点生成多个不同尺寸的候选框,如,长宽比为1:2,长宽比为1:1和长宽比为2:1的候选框,当然,也可以为其他长宽比的候选框,进一步的,将生成的多个不同尺寸的候选框映射至待检测图像1上。
由上述描述可知,本发明实施例中,需要预先设计相应的检测网络模型,本发明实施例中,检测网络模型至少包括特征提取网络层,候选框生成网络层和目标检测网络层,其中,特征提取网络层用于提取待检测图像中的特征点,候选框生成网络用于生成候选框,目标检测网络,用于从生成的候选框中确定出满足要求的,头肩区域所在的候选框。
进一步的,本发明实施例中,检测网络模型的特征提取网络层是结合融合特征提取模块,原始特征保留模块和模型大小调整模块的特性设计的,当然,本发明实施例中,
融合特征提取模块可以是ION网络和Inception-Resnet网络,原始特征保留模块可以为C-RELU激活函数,模型大小调整模块可以为减小模型大小的depth-wise和point-wise模块,所谓ION网络,即Inside-Outside Net,ION网络也是基于Region Proposal的,在得到候选区域的基础上,为了进一步提高在每一个候选感兴趣区域ROI的预测精度,ION考虑了结合ROI内部的信息和ROI以外的信息,其有两个创新点:一是使用空间递归神经网络(spatial recurrent neural network)把上下文(context)特征结合,而不是只使用ROI内的局部特征,二是将不同卷积层卷积得到的特征连接起来,作为一个多尺度特征用来预测。ION在上、下、左、右四个方向独立地使用RNN,并把它们的输出连接起来组合成一个特征输出,经过两次这样的过程得到的特征作为上下文特征,再与之前的几个卷积层的输出特征连接起来,得到既包括上下文信息,又包括多尺度信息的特征。
检测网络模型的候选框生成网络层(Region Proposal Net,RPN),其输入为特征提取网络层的输出(即待检测图像相对应的特征图),本发明实施例中,用于从所述待检测图像相对应的特征图中提取15-20个锚点,并进行卷积处理,具体的,为了减少计算量,将候选框生成网络层的卷积核大小设定为1×1,对包含有特征点的特征图进行卷积处理,得到相应维度的向量,并输出多个候选框的类别的权值和区域位置信息。
检测网络模型的目标检测网络层可以为RCNN网络,目标检测网络的输入为各候选框在待检测原图中映射之后的卷积层信息,再经过一个卷积层和globel-pooling层,得到检测结果。
实际应用中,为了降低网络训练参数及训练模型的过拟合程度,需要对卷积层输出的特征图进行池化(Pooling)处理。常用的池化方式有最大值池化(Max Pooling)和平均池化(Average Pooling),其中,最大值池化是选择池化窗口中的最大值作为池化后的值,平均池化是将池化区域中的平均值作为池化后的值。本发明实施例中,RCNN网络采用一个卷积层和一个globel-pooling层处理后,输出待检测图像中头肩区域的检测结果。
本发明实施例中,在预训练网络设计完之后,需要对该预训练网络进行训练,具体的,参阅图2所示,本发明实施例中,训练预训练网络的详细流程如下:
步骤200:采用公共数据集对预训练网络进行训练,得到相应的预模型。
具体的,本发明实施例中,在执行步骤200时,根据上述特征提取网络层和上述目标检测网络层,生成相应的预训练网络;并采用公共数据集对上述预训练网络进行训练,得到相应的预模型。
实际应用中,公共数据集为Imagenet数据集,Imagenet数据集是目前深度学习图像领域应用得非常多的一个数据集,关于图像分类、定位、检测等研究工作大多基于此数据集展开。
本发明实施例中,采用Imagenet数据集,针对由特征提取网络层和R-CNN网络构成的预训练网络进行训练,输入为包含若干个标签的训练集,输出为具有分类功能的预模型,该预模型用于后续网络模型整体训练时,初始化网络模型中特征提取网络层的参数,即fine-turned,能够加快网络收敛能力和提升网络泛化能力。
步骤210:采用预设的图像样本集合对上述预模型进行训练,得到上述网络模型。
具体的,本发明实施例中,在执行步骤210时,依次将上述图像样本集合中的样本图像输入上述预模型;按照预设的第一训练次数,依次针对上述图像样本集合中每一样本图像进行训练,并在确定总训练次数达到第一设定阈值时,按照预设的第二训练次数,依次针对上述图像样本集合中每一样本图像进行训练,其中,预设的第一训练次数等于第二训练次数与常数N之和,N为大于等于1的正整数;直至当前预设的训练次数小于等于N时,按照上述当前预设的训练次数,依次针对上述图像样本集合中每一样本图像进行训练,完成对上述预模型的训练。
本发明实施例中,一种较佳的实施方式为,在采用预设的图像样本集合对预模型进行训练时,针对每一图像样本训练20-30次,当迭代次数达到5000-7000次时,学习率递交一个数量级,直至学习率达到设定阈值时,完成对预模型的训练,得到训练完成的网络模型。
例如,假设图像样本集合中包含1000张图像样本,各图像样本的尺寸可以相同,也可以不同,那么,即可将训练规则设置为:第一训练次数为10次,第二训练次数为6,第三训练次数为2,第一设定阈值为10000次,第二设定阈值为20000次,第三设定阈值为30000次,那么,首先,针对每一图像样本分别训练10次;然后,在确定总训练次数达到10000次时,针对每一图像样本分别训练6次;最后,在确定总训练次数达到20000次时,针对每一图像样本分别训练2次,直至训练总次数达到30000次,完成对网络模型的训练。
当然,上述训练方式只是一种具体的实施方式,本发明所采用的训练方式是根据总训练次数的累积,逐渐减少对同一样本的训练次数,是为了保证网络模型能够很好的收敛,本发明实施例中,采用预设的图像样本集合对网络模型进行训练的方式包括但不仅限于以上方式。
步骤120:基于上述检测结果判定所述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。
具体的,本发明实施例中,在执行步骤120时,根据上述多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,分别计算各候选框中头肩区域与相应候选框的重合度;将头肩区域与相应候选框的重合度大于预设值的候选框的区域位置,作为头肩区域在上述待检测图像中的位置。
实际应用中,由于上述多个不同尺寸的候选框包含有类别权值和区域位置信息,那么,即可从类别权值表征为头肩区域的多个候选框中,选择出头肩区域位置最准确的候选框,具体的,可以通过分别计算各候选框中头肩区域与相应候选框的重合度,根据各候选框中头肩区域与相应候选框的重合度确定出头肩区域的具体位置信息。
本发明实施例中,一种较佳的实施方式为,在候选框生成网络层基于特征图生成多个候选框之后,根据候选框包含的类别权值确定头肩区域相对应的若干候选框,并分别计算该若干候选框中每一候选框相对应的头肩区域与相应候选框的重合度,并将头肩区域与相应候选框的重合度大于或等于预设值(例如,设定值为0.8)的候选框的位置信息,确定头肩区域的具体位置。
例如,示例性的,参阅图3所示,假设类别权值表征为头肩区域的候选框为候选框1,候选框2和候选框3,候选框1的长宽比为1:2,候选框2的长宽比为1:1,候选框3的长宽比为2:1,头肩区域如图所示,由此可知,若头肩区域与候选框1的重合比为0.5,头肩区域与候选框2的重合比为0.8,头肩区域与候选框1的重合比为0.5,则可将候选款3的位置信息确定为头肩区域的位置信息。
进一步的,本发明实施例中,在上述待监测图像中标注上述头肩区域的类别和/或位置。
实际应用中,在待检测图像中确定出头肩区域的位置信息后,还可以采用标注工具在待检测图像中标注出头肩区域的类别和坐标信息。
基于上述实施例,参阅图4所示,本发明实施例中,一种头肩区域检测装置,至少包括获取单元40,检测单元41和确定单元42,其中,
获取单元40,用于获取待检测图像;
检测单元41,用于基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对所述待检测图像进行检测,得到相应的检测结果,其中,所述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;
确定单元42,用于基于所述检测结果判定上述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。
可选的,上述特征提取网络层是基于ION网络,C-RELU激活函数和Inception-Resnet网络的特性设计的。
可选的,上述候选框生成网络为RPN网络,用于从上述待检测图像相对应的特征图中提取15-20个锚点,并进行卷积处理;上述目标检测网络为RCNN,采用globel-pooling层对卷积层输出的特征图进行池化处理,以减少过拟合程度。
可选的,上述头肩区域检测装置进一步包括:
训练单元,用于采用公共数据集对预训练网络进行训练,得到相应的预模型,其中,所述预模型用于初始化所述特征提取网络层的参数;并采用预设的图像样本集合对上述预模型进行训练,得到所述网络模型。
可选的,在上述采用公共数据集对预训练网络进行训练时,上述训练单元用于:
根据上述特征提取网络层和上述目标检测网络层,生成相应的预训练网络;并采用公共数据集对上述预训练网络进行训练。
可选的,在上述采用预设的图像样本集合对预模型进行训练时,上述训练单元用于:
依次将上述图像样本集合中的样本图像输入上述预模型;按照预设的第一训练次数,依次针对上述图像样本集合中每一样本图像进行训练,并在确定总训练次数达到第一设定阈值时,按照预设的第二训练次数,依次针对上述图像样本集合中每一样本图像进行训练,其中,预设的第一训练次数等于第二训练次数与常数N之和,N为大于等于1的正整数;直至当前预设的训练次数小于等于N时,按照上述当前预设的训练次数,依次针对上述图像样本集合中每一样本图像进行训练,完成对上述预模型的训练。
可选的,在上述基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果时,上述检测单元41用于:
将上述待检测图像输入上述网络模型中;上述特征提取网络层提取上述待检测图像的特征点,并将包含上述特征点的特征图输入上述候选框生成网络层;上述候选框生成网络层以预设大小的卷积核对上述特征图进行卷积处理,得到相应的多维向量,并生成多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,映射至上述待检测图像上。
可选的,在上述基于上述检测结果,确定头肩区域在上述待检测图像中的位置时,上述确定单元42用于:
根据上述多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,分别计算各候选框中头肩区域与相应候选框的重合度;将头肩区域与相应候选框的重合度大于预设值的候选框的区域位置,作为头肩区域在上述待检测图像中的位置。
可选的,上述头肩区域检测装置进一步包括:
标注单元,用于在上述待监测图像中标注上述头肩区域的类别和/或位置。
综上所述,本发明实施例中,获取待检测图像;基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对上述待检测图像进行检测,得到相应的检测结果,其中,上述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;基于上述检测结果判定上述待检测图形中存在头肩区域时,确定上述头肩区域在上述待检测图像中的位置。
采用上述方法,网络模型中的特征提取网络层网络模型的特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能,在对待检测图像进行特征提取时,特征提取更全面,从而使得候选框生成网络层能够从多尺度特征来进行候选框的生成,保证了对拍摄质量差,图像不清晰的原图像的检测结果的精确性,避免了由于原图像自身拍摄质量不佳而导致检测率不高,检测结果不准确的问题。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种头肩区域检测方法,其特征在于,包括:
获取待检测图像;
基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对所述待检测图像进行检测,得到相应的检测结果,其中,所述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;
基于所述检测结果判定所述待检测图形中存在头肩区域时,确定所述头肩区域在所述待检测图像中的位置。
2.如权利要求1所述的方法,其特征在于,所述特征提取网络层是基于ION网络,C-RELU激活函数和Inception-Resnet网络的特性设计的。
3.如权利要求1所述的方法,其特征在于,所述候选框生成网络为RPN网络,用于从所述待检测图像相对应的特征图中提取15-20个锚点,并进行卷积处理;
所述目标检测网络为RCNN,采用globel-pooling层对卷积层输出的特征图进行池化处理,以减少过拟合程度。
4.如权利要求2所述的方法,其特征在于,在所述获取待检测图像之前,进一步包括:
采用公共数据集对预训练网络进行训练,得到相应的预模型,其中,所述预模型用于初始化所述特征提取网络层的参数;
采用预设的图像样本集合对所述预模型进行训练,得到所述网络模型。
5.如权利要求4所述的方法,其特征在于,所述采用公共数据集对预训练网络进行训练,包括:
根据所述特征提取网络层和所述目标检测网络层,生成相应的预训练网络;并
采用公共数据集对所述预训练网络进行训练。
6.如权利要求5所述的方法,其特征在于,所述采用预设的图像样本集合对所述预模型进行训练,包括:
依次将所述图像样本集合中的样本图像输入所述预模型;
按照预设的第一训练次数,依次针对所述图像样本集合中每一样本图像进行训练,并在确定总训练次数达到第一设定阈值时,按照预设的第二训练次数,依次针对所述图像样本集合中每一样本图像进行训练,其中,预设的第一训练次数等于第二训练次数与常数N之和,N为大于等于1的正整数;
直至当前预设的训练次数小于等于N时,按照所述当前预设的训练次数,依次针对所述图像样本集合中每一样本图像进行训练,完成对所述预模型的训练。
7.如权利要求1-6任一项所述的方法,其特征在于,所述基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对所述待检测图像进行检测,得到相应的检测结果,包括:
将所述待检测图像输入所述网络模型中;
所述特征提取网络层提取所述待检测图像的特征点,并将包含所述特征点的特征图输入所述候选框生成网络层;
所述候选框生成网络层以预设大小的卷积核对所述特征图进行卷积处理,得到相应的多维向量,并生成多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,映射至所述待检测图像上。
8.如权利要求7所述的方法,其特征在于,所述基于所述检测结果,确定头肩区域在所述待检测图像中的位置,包括:
根据所述多个不同尺寸的,包含有类别权值和/或区域位置信息的候选框,分别计算各候选框中头肩区域与相应候选框的重合度;
将头肩区域与相应候选框的重合度大于预设值的候选框的区域位置,作为头肩区域在所述待检测图像中的位置。
9.如权利要求1所述的方法,其特征在于,进一步包括:
在所述待监测图像中标注所述头肩区域的类别和/或位置。
10.一种头肩区域检测装置,其特征在于,包括:
获取单元,用于获取待检测图像;
检测单元,用于基于训练完成的,包含有特征提取网络层,候选框生成网络层和目标检测网络层的网络模型对所述待检测图像进行检测,得到相应的检测结果,其中,所述特征提取网络层具有提取融合特征,保留原始特征信息和调整模型大小的功能;
确定单元,用于基于所述检测结果判定所述待检测图形中存在头肩区域时,确定所述头肩区域在所述待检测图像中的位置。
11.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如权利要求1至9任一项所述的方法。
CN201810391398.4A 2018-04-27 2018-04-27 一种头肩区域检测方法及装置 Active CN108805016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810391398.4A CN108805016B (zh) 2018-04-27 2018-04-27 一种头肩区域检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810391398.4A CN108805016B (zh) 2018-04-27 2018-04-27 一种头肩区域检测方法及装置

Publications (2)

Publication Number Publication Date
CN108805016A true CN108805016A (zh) 2018-11-13
CN108805016B CN108805016B (zh) 2022-02-08

Family

ID=64094003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810391398.4A Active CN108805016B (zh) 2018-04-27 2018-04-27 一种头肩区域检测方法及装置

Country Status (1)

Country Link
CN (1) CN108805016B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902610A (zh) * 2019-02-22 2019-06-18 杭州飞步科技有限公司 交通标志识别方法和装置
CN110084184A (zh) * 2019-04-25 2019-08-02 浙江吉利控股集团有限公司 一种基于图像处理技术的安全带未系探测系统和方法
CN111007734A (zh) * 2019-12-12 2020-04-14 广东美的白色家电技术创新中心有限公司 家用电器的控制方法、家用电器、控制装置及存储装置
CN111062249A (zh) * 2019-11-11 2020-04-24 北京百度网讯科技有限公司 车辆信息获取方法、装置、电子设备及存储介质
CN111191501A (zh) * 2019-11-20 2020-05-22 恒大智慧科技有限公司 智慧景区内游客聚集行为的自动预警方法、设备及介质
CN111353342A (zh) * 2018-12-21 2020-06-30 浙江宇视科技有限公司 肩头识别模型训练方法、装置、人数统计方法、装置
CN111428875A (zh) * 2020-03-11 2020-07-17 北京三快在线科技有限公司 图像识别方法、装置及相应模型训练方法、装置
CN112784244A (zh) * 2019-11-11 2021-05-11 北京君正集成电路股份有限公司 一种利用目标验证提高目标检测整体效率的方法
CN113297910A (zh) * 2021-04-25 2021-08-24 云南电网有限责任公司信息中心 一种配网现场作业安全带识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2924611A1 (en) * 2014-03-28 2015-09-30 Xerox Corporation Extending data-driven detection to the prediction of object part locations
CN105844234A (zh) * 2016-03-21 2016-08-10 商汤集团有限公司 一种基于头肩检测的人数统计的方法及设备
CN106845406A (zh) * 2017-01-20 2017-06-13 深圳英飞拓科技股份有限公司 基于多任务级联卷积神经网络的头肩检测方法及装置
CN106874894A (zh) * 2017-03-28 2017-06-20 电子科技大学 一种基于区域全卷积神经网络的人体目标检测方法
CN107145845A (zh) * 2017-04-26 2017-09-08 中山大学 基于深度学习及多特征点融合的行人检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2924611A1 (en) * 2014-03-28 2015-09-30 Xerox Corporation Extending data-driven detection to the prediction of object part locations
CN105844234A (zh) * 2016-03-21 2016-08-10 商汤集团有限公司 一种基于头肩检测的人数统计的方法及设备
CN106845406A (zh) * 2017-01-20 2017-06-13 深圳英飞拓科技股份有限公司 基于多任务级联卷积神经网络的头肩检测方法及装置
CN106874894A (zh) * 2017-03-28 2017-06-20 电子科技大学 一种基于区域全卷积神经网络的人体目标检测方法
CN107145845A (zh) * 2017-04-26 2017-09-08 中山大学 基于深度学习及多特征点融合的行人检测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353342A (zh) * 2018-12-21 2020-06-30 浙江宇视科技有限公司 肩头识别模型训练方法、装置、人数统计方法、装置
CN111353342B (zh) * 2018-12-21 2023-09-19 浙江宇视科技有限公司 肩头识别模型训练方法、装置、人数统计方法、装置
CN109902610A (zh) * 2019-02-22 2019-06-18 杭州飞步科技有限公司 交通标志识别方法和装置
CN110084184A (zh) * 2019-04-25 2019-08-02 浙江吉利控股集团有限公司 一种基于图像处理技术的安全带未系探测系统和方法
CN110084184B (zh) * 2019-04-25 2021-06-11 浙江吉利控股集团有限公司 一种基于图像处理技术的安全带未系探测系统和方法
CN111062249A (zh) * 2019-11-11 2020-04-24 北京百度网讯科技有限公司 车辆信息获取方法、装置、电子设备及存储介质
CN112784244A (zh) * 2019-11-11 2021-05-11 北京君正集成电路股份有限公司 一种利用目标验证提高目标检测整体效率的方法
CN111191501A (zh) * 2019-11-20 2020-05-22 恒大智慧科技有限公司 智慧景区内游客聚集行为的自动预警方法、设备及介质
CN111007734A (zh) * 2019-12-12 2020-04-14 广东美的白色家电技术创新中心有限公司 家用电器的控制方法、家用电器、控制装置及存储装置
CN111428875A (zh) * 2020-03-11 2020-07-17 北京三快在线科技有限公司 图像识别方法、装置及相应模型训练方法、装置
CN113297910A (zh) * 2021-04-25 2021-08-24 云南电网有限责任公司信息中心 一种配网现场作业安全带识别方法
CN113297910B (zh) * 2021-04-25 2023-04-18 云南电网有限责任公司信息中心 一种配网现场作业安全带识别方法

Also Published As

Publication number Publication date
CN108805016B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN108805016A (zh) 一种头肩区域检测方法及装置
CN104166841B (zh) 一种视频监控网络中指定行人或车辆的快速检测识别方法
US9754192B2 (en) Object detection utilizing geometric information fused with image data
CN106874894A (zh) 一种基于区域全卷积神经网络的人体目标检测方法
CN103390164B (zh) 基于深度图像的对象检测方法及其实现装置
CN109102547A (zh) 基于物体识别深度学习模型的机器人抓取位姿估计方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN110738101A (zh) 行为识别方法、装置及计算机可读存储介质
Šegvić et al. A computer vision assisted geoinformation inventory for traffic infrastructure
CN106295601A (zh) 一种改进的安全带检测方法
CN109214366A (zh) 局部目标重识别方法、装置及系统
CN104794737B (zh) 一种深度信息辅助粒子滤波跟踪方法
CN106934795A (zh) 一种混凝土桥梁裂缝的自动检测方法和预测方法
CN107153819A (zh) 一种排队长度自动检测方法及排队长度控制方法
CN113822247B (zh) 基于航拍影像的违章建筑识别方法及系统
WO2020134102A1 (zh) 物品识别方法、装置、售货系统和存储介质
EP3702957A1 (en) Target detection method and apparatus, and computer device
CN109325456A (zh) 目标识别方法、装置、目标识别设备及存储介质
CN109800682A (zh) 驾驶员属性识别方法及相关产品
CN109506628A (zh) 一种基于深度学习的卡车环境下目标物测距方法
CN107368790B (zh) 行人检测方法、系统、计算机可读存储介质及电子设备
CN107180228A (zh) 一种用于车道线检测的梯度增强转换方法及系统
CN109902576B (zh) 一种头肩图像分类器的训练方法及应用
CN109670517A (zh) 目标检测方法、装置、电子设备和目标检测模型
CN114926747A (zh) 一种基于多特征聚合与交互的遥感图像定向目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant