CN113128479B - 一种学习噪声区域信息的人脸检测方法及装置 - Google Patents

一种学习噪声区域信息的人脸检测方法及装置 Download PDF

Info

Publication number
CN113128479B
CN113128479B CN202110542099.8A CN202110542099A CN113128479B CN 113128479 B CN113128479 B CN 113128479B CN 202110542099 A CN202110542099 A CN 202110542099A CN 113128479 B CN113128479 B CN 113128479B
Authority
CN
China
Prior art keywords
candidate region
loss function
noise
network model
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110542099.8A
Other languages
English (en)
Other versions
CN113128479A (zh
Inventor
桑高丽
卢丽
闫超
胡二建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhongfu Rongtong Technology Co.,Ltd.
Original Assignee
Chengdu Weihu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Weihu Technology Co ltd filed Critical Chengdu Weihu Technology Co ltd
Priority to CN202110542099.8A priority Critical patent/CN113128479B/zh
Publication of CN113128479A publication Critical patent/CN113128479A/zh
Application granted granted Critical
Publication of CN113128479B publication Critical patent/CN113128479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人脸检测技术领域,具体涉及一种学习噪声区域信息的人脸检测方法及装置,包括:搭建深度神经网络模型,提取训练样本的特征图,然后在特征图上生成候选区域,并且每个候选区域需用预测定位信息和预测置信度定义无噪声得分,然后针对每个候选区域用损失函数计算损失值,最后优化损失值,得到优化深度神经网络模型,输入人脸图像即可进行人脸检测;其中,所述的候选区域由设定的锚框在每个特征点上生成。与现有技术相比,本发明通过将人脸检测方法结合预测定位信息和预测置信度相结合计算得到无噪声得分,并将得分作为候选区域的软标签,再融入到损失函数中,使网络模型在训练过程中学习到噪声信息,有效地提高模型的鲁棒性。

Description

一种学习噪声区域信息的人脸检测方法及装置
技术领域
本发明涉及人脸检测领域,具体涉及一种学习噪声区域信息的人脸检测方法及装置。
背景技术
近几年,随着深度学习和计算机算力的快速发展,目标检测技术领域的精度和速度也取得了很大的突破。人脸检测技术是目标检测技术中较为重要的一个研究分支,主要做法是用刚性的边界框包围感兴趣的目标,而且在过去的多年里得到了不断地改进完善。
人脸检测技术通常用一组预先定义面积大小比例的候选框,即锚框,用于将类别判为目标的位置回归至期望的地方。人脸检测技术的目的是完成定位和分类这两个任务,定位任务是使用真实边界框作为“标杆”训练预测位置,而分类任务是指导模型学习区分候选区域类别的能力,但是大量的候选区域中只有少量候选区域与真实边界框有足够地重叠,为了学习到更好的分类器,减弱样本不平衡的影响,衍生出焦点损失函数和难例挖掘算法。除此之外,区别候选区域的类别标签是通过设定阈值判断的,完全凭借经验人为干预,类别标签比较模糊,容易引入噪声影响分类。例如,有时候候选区域为目标的置信度较高,包含大量的语义信息,但因与真实边界框重叠度比较低,按阈值判断分为负样本,这算一种噪声信息,此外,由于矩形框的局限性,目标之间的距离较小时,有时候候选区域会包含多个目标,这就会引入另外一种噪声信息。
综上所述,生成候选区域的类别标签时总会引入不同形式的噪声信息,因此,急需提出一种简单高效的人脸检测方法,自适应地生成候选区域的软标签,充分利用噪声区域的信息加强模型的性能。
发明内容
针对上述问题,本发明的目的在于提供一种学习噪声区域信息的人脸检测方法及装置,本发明采用的技术方案如下:
本发明的第一个目的是提供一种学习噪声区域信息的人脸检测方法,包括以下步骤:
S1、构建深度神经网络模型,所述深度神经网络模型的网络结构从前至后包括:卷积层、批归一化层、激活函数层、第一混合深度可分离卷积模块、最大值池化层、第一倒置残差模块、第二混合深度可分离卷积模块、第二倒置残差卷积模块,所述第二倒置残差卷积模块后接两个并行的卷积层;所述倒置残差模块从前至后由卷积层、批归一化层、激活函数层、深度可分离卷积层、批归一化层、激活函数层、卷积层、批归一化层、特征相加层封装而成;所述混合深度可分离卷积模块从前至后由两个并行的深度可分离卷积层、特征连接层、批归一化层、激活函数层封装而成;
S2、收集任意大小的人脸图像,并预先定义锚框的长宽比和面积大小比,然后分成训练集和测试集;
S3、将训练集输入深度神经网络模型,由深度神经网络模型提取训练集中的人脸图像特征图,然后利用设定的锚框在人脸图像特征图的每个特征点上生成候选区域,并且每个候选区域用预测定位信息和预测置信度定义无噪声得分;最后针对每个候选区域用损失函数计算损失值,并根据制定优化策略衰减损失值,以及设定相关超参数,重复对深度神经网络模型进行训练,直至损失值收敛,得到优化深度神经网络模型。
S4、将人脸图像输入优化深度神经网络模型,输出人脸检测结果。
进一步地,所述无噪声得分反映候选区域包含噪声信息的程度;
所述无噪声得分计算公式如下:
Figure 706233DEST_PATH_IMAGE001
式中:cls表示某候选区域的置信度,reg表示候选区域与真实边界框之间的距离交并比值,
Figure 18397DEST_PATH_IMAGE002
表示某一个候选区域,
Figure 52212DEST_PATH_IMAGE003
Figure 29395DEST_PATH_IMAGE004
分别表示正样本候选区域集合和负样本候选区域集合,
Figure 832266DEST_PATH_IMAGE005
是调节因子,用来调节置信度和距离交并比值在无噪声得分中的占比;所述距离交并比计算公式如下:
Figure 174386DEST_PATH_IMAGE006
Figure 695497DEST_PATH_IMAGE007
其中:b为候选区域B的中心点,
Figure 86158DEST_PATH_IMAGE008
为真实边界框
Figure 9115DEST_PATH_IMAGE009
的中心点,
Figure 522136DEST_PATH_IMAGE010
为欧式距离计算公式,C为候选区域B和
Figure 530543DEST_PATH_IMAGE009
的最小外接矩形的对角线距离;正样本候选区域集合和负样本候选区域集合是通过将所有候选区域按置信度排序之后,选择前N个候选区域为正样本,其余候选区域为负样本,其中N为300。
进一步地,所述深度神经网络模型的损失函数由类别损失函数和定位回归损失函数构成;所述类别损失函数采用改进的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值;所述定位回归损失函数采用改进的平滑L1损失函数,计算候选区域与真实边界框之间的损失值。
进一步地,对每个候选区域用损失函数计算损失值之前,设定一个权重因子,控制重要程度不同的样本对训练损失值的占比,该权重因子计算公式如下:
Figure 849529DEST_PATH_IMAGE011
其中
Figure 892571DEST_PATH_IMAGE012
对定位信息和类别置信度进行归一化,
Figure 310914DEST_PATH_IMAGE013
是调节因子,这两个参数都是为了增加权重因子的方差设定的;将权重因子添加到损失函数中,公式如下所示:
Figure 947563DEST_PATH_IMAGE014
Figure 742344DEST_PATH_IMAGE015
Figure 702210DEST_PATH_IMAGE016
是类别损失函数,采用改进的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值,
Figure 557033DEST_PATH_IMAGE017
为某候选区域的预测概率值,i表示正样本,j表示负样本;
Figure 540033DEST_PATH_IMAGE018
是定位回归损失函数,采用改进的平滑L1损失函数,计算候选区域与真实边界框之间的损失值,
Figure 76187DEST_PATH_IMAGE019
是真实边界框位置,
Figure 562663DEST_PATH_IMAGE020
表示预测的边界框位置;最终获得用于深度神经网络模型训练的完整的损失函数为:
Figure 853968DEST_PATH_IMAGE021
优选地,所述的激活函数层采用抑制最大值为6的修正线性单元层。
优选地,所述的锚框尺寸比例中面积大小为
Figure 386580DEST_PATH_IMAGE022
,单位为mm,尺度比例为
Figure 523163DEST_PATH_IMAGE023
优选地,所述的优化策略是使用自适应矩估计优化器衰减损失值,优化网络训练参数,相关超参数学习率设为0.001、批处理大小设为128、总迭代次数设为200000、L2惩罚权重衰减率设为0.0001。
本发明的第二个目的是提供一种学习噪声区域信息的人脸检测装置,包括:
图像获取单元,用于获取任意大小的人脸图像;
图像特征提取单元,用于利用深度神经网络模型提取训练集中的人脸图像特征图;
候选区域生成单元,用于利用设定的锚框在人脸图像特征图的每个特征点上生成候选区域;
无噪声得分计算单元,用于利用预测定位信息和预测置信度计算每个候选区域的无噪声得分;
候选区域损失值计算单元,用于对每个候选区域用损失函数计算损失值;
网络训练单元,用于对深度神经网络模型进行训练得到优化深度神经网络模型;
人脸检测结果识别单元,用于将人脸图像输入优化深度神经网络模型后输出人脸检测结果。
本发明的第三个目的是提供一种电子设备,包括:存储器,用于存储可执行指令;以及处理器,包括上述学习噪声区域信息的人脸检测装置,用于与所述存储器通信以执行所述可执行指令从而完成上述学习噪声区域信息的人脸检测方法的操作。
与现有技术相比,本发明具有以下有益效果:
本发明通过将人脸检测方法结合预测定位信息和预测置信度相结合计算得到无噪声得分,并将得分作为候选区域的软标签,再融入到损失函数中,使网络模型在训练过程中学习到噪声信息,有效地提高模型的鲁棒性。
附图说明
图1为整体网络结构示意图。
图2为倒置残差模块示意图。
图3为混合深度可分离卷积模块示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步的详细说明。此处所描述的具体实施例仅用于解释本发明,并不用于限定发明。
现在主流的人脸检测算法通常使用一系列候选区域预先规划检测位置的,但是在一张图像中目标的面积占比较小,这会导致采集到的负样本数量大大多于正样本数量,并且候选区域的类别标签都是通过计算比较候选区域与真实边界框之间的交并比值判断正负标签,人为因素较多,这会导致类别标签比较模糊,容易引入噪声影响分类。为了克服这个缺点,如图1至图3所示,本实施例提供一种简单高效的人脸检测方法,利用定位信息和类别置信度自适应地计算出候选区域的软标签,充分利用噪声区域的信息加强模型的性能。
图1为本发明的深度神经网络模型的络结构示意图,从前至后包括:卷积层、批归一化层、激活函数层、第一混合深度可分离卷积模块、最大值池化层、第一倒置残差模块、第二混合深度可分离卷积模块、第二倒置残差卷积模块,所述第二倒置残差卷积模块后接两个并行的卷积层构成两个分支,一个分支用于分类,主要是预测每个候选区域的概率值,另外一个分支用于定位回归,预测候选区域与真实边界框之间的偏移量;如图2所示,所述倒置残差模块从前至后由卷积层、批归一化层、激活函数层、深度可分离卷积层、批归一化层、激活函数层、卷积层、批归一化层、特征相加层封装而成;如图3所示,所述混合深度可分离卷积模块从前至后由两个并行的深度可分离卷积层、特征连接层、批归一化层、激活函数层封装而成。
收集任意大小的人脸图像,并预先定义锚框的长宽比和面积大小比,然后分成训练集和测试集,本实施例中,锚框尺寸比例中面积大小为
Figure 129725DEST_PATH_IMAGE022
,单位为mm,尺度比例为
Figure 541332DEST_PATH_IMAGE023
首先,针对传统的分类分支,候选区域模糊的类别标签会误导模型训练方向,而联合预测定位信息和预测置信度计算得到无噪声得分,无噪声得分能反映候选区域包含噪声信息的程度,该得分越高说明候选区域是目标的概率较高并且与真实边界框重叠度越大,反之,说明候选区域是背景的概率较高并且与真实边界框重叠度越小,可以充分利用噪声信息增强模型分类的能力,是一种软标签。无噪声得分计算公式如下:
Figure 498924DEST_PATH_IMAGE001
公式中cls表示某候选区域的置信度,reg表示候选区域与真实边界框之间的距离交并比值,
Figure 501515DEST_PATH_IMAGE002
表示某一个候选区域,
Figure 228163DEST_PATH_IMAGE003
Figure 595690DEST_PATH_IMAGE004
分别表示正样本候选区域集合和负样本候选区域集合,
Figure 509420DEST_PATH_IMAGE005
是调节因子,用来调节置信度和距离交并比值在无噪声得分中的占比;所述距离交并比计算公式如下:
Figure 191068DEST_PATH_IMAGE006
Figure 772222DEST_PATH_IMAGE007
其中b为候选区域B的中心点,
Figure 310650DEST_PATH_IMAGE008
为真实边界框
Figure 305151DEST_PATH_IMAGE009
的中心点,
Figure 321649DEST_PATH_IMAGE010
为欧式距离计算公式,C为候选区域B和
Figure 22889DEST_PATH_IMAGE009
的最小外接矩形的对角线距离;正样本候选区域集合和负样本候选区域集合是通过将所有候选区域按置信度排序之后,选择前N个候选区域为正样本,其余候选区域为负样本,其中N为300。
与此同时,需设定一个权重因子,控制重要程度不同的样本对训练损失值的占比,该权重因子计算公式如下:
Figure 466639DEST_PATH_IMAGE011
其中
Figure 823803DEST_PATH_IMAGE012
对定位信息和类别置信度进行归一化,
Figure 909570DEST_PATH_IMAGE013
是调节因子,这两个参数都是为了增加权重因子的方差设定的。而且因为正样本候选区域数量较少,能给模型训练提供的梯度变化较小,所以需将权重因子添加到损失函数中,公式如下所示:
Figure 527633DEST_PATH_IMAGE014
Figure 407865DEST_PATH_IMAGE015
Figure 49062DEST_PATH_IMAGE016
是类别损失函数,采用改进之后的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值,
Figure 610624DEST_PATH_IMAGE017
为某候选区域的预测概率值,i表示正样本,j表示负样本。
Figure 20877DEST_PATH_IMAGE018
是定位回归损失函数,采用改进之后的平滑L1损失函数,计算候选区域与真实边界框之间的损失值,
Figure 72009DEST_PATH_IMAGE019
是真实边界框位置,
Figure 466082DEST_PATH_IMAGE020
表示预测的边界框位置。因此,网络训练的完整的损失函数为:
Figure 628073DEST_PATH_IMAGE021
然后,使用自适应矩估计优化器衰减损失值,优化网络训练参数,相关超参数学习率设为0.001、批处理大小设为128、总迭代次数设为200000、L2惩罚权重衰减率设为0.0001,重复对深度神经网络模型进行训练,直至损失值收敛,得到优化深度神经网络模型。
使用时,将人脸图像输入优化深度神经网络模型,即可输出人脸检测结果。
在一些实施例中,本发明还提提供了一种学习噪声区域信息的人脸检测装置,包括:
图像获取单元,用于获取任意大小的人脸图像;
图像特征提取单元,用于利用深度神经网络模型提取训练集中的人脸图像特征图;
候选区域生成单元,用于利用设定的锚框在人脸图像特征图的每个特征点上生成候选区域;
无噪声得分计算单元,用于利用预测定位信息和预测置信度计算每个候选区域的无噪声得分;
候选区域损失值计算单元,用于对每个候选区域用损失函数计算损失值;
网络训练单元,用于对深度神经网络模型进行训练得到优化深度神经网络模型;
人脸检测结果识别单元,用于将人脸图像输入优化深度神经网络模型后输出人脸检测结果。
在一些实施例中,本发明还提了一种电子设备,包括:存储器,用于存储可执行指令;以及处理器,包括上述学习噪声区域信息的人脸检测装置,用于与所述存储器通信以执行所述可执行指令从而完成上述学习噪声区域信息的人脸检测方法的操作。
综上所述,本发明通过将人脸检测方法结合预测定位信息和预测置信度相结合计算得到无噪声得分,并将得分作为候选区域的软标签,再融入到损失函数中,使网络模型在训练过程中学习到噪声信息,有效地提高模型的鲁棒性。
由实验结果可得,本发明提出的方法可以实现端到端训练人脸检测任务,引入无噪声得分的计算,可以提升检测器的性能,大大减少误检、漏检现象。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。

Claims (7)

1.一种学习噪声区域信息的人脸检测方法,其特征在于,包括以下步骤:
S1、构建深度神经网络模型,所述深度神经网络模型的网络结构从前至后包括:卷积层、批标准化层、激活函数层、第一混合深度可分离卷积模块、最大值池化层、第一倒置残差模块、第二混合深度可分离卷积模块、第二倒置残差模块,所述第二倒置残差模块后接两个并行的卷积层;所述第一倒置残差模块和第二倒置残差模块从前至后均由卷积层、批标准化层、激活函数层、深度可分离卷积层、批标准化层、激活函数层、卷积层、批标准化层、特征相加层封装而成;所述混合深度可分离卷积模块从前至后由两个并行的深度可分离卷积层、特征连接层、批标准化层、激活函数层封装而成;
S2、收集任意大小的人脸图像,并预先锚框的长宽比和面积大小比,然后分成训练集和测试集;
S3、将训练集输入深度神经网络模型,由深度神经网络模型提取训练集中的人脸图像特征图,然后利用设定的锚框在人脸图像特征图的每个特征点上生成候选区域,并且每个候选区域用预测定位信息和预测置信度定义无噪声得分;所述无噪声得分反映候选区域包含噪声信息的程度;
所述无噪声得分计算公式如下:
Figure FDA0004131753530000011
式中:cls表示某候选区域的置信度,reg表示候选区域与真实边界框之间的距离交并比值,
Figure FDA0004131753530000012
表示某一个候选区域,B+1和B-1分别表示正样本候选区域集合和负样本候选区域集合,α是调节因子,用来调节置信度和距离交并比值在无噪声得分中的占比;所述距离交并比计算公式如下:
Figure FDA0004131753530000013
Figure FDA0004131753530000021
其中:b为候选区域B的中心点,bgt为真实边界框Bgt的中心点,ρ(·)为欧式距离计算公式,C为候选区域B和Bgt的最小外接矩形的对角线距离;正样本候选区域集合和负样本候选区域集合是通过将所有候选区域按置信度排序之后,选择前N个候选区域为正样本,其余候选区域为负样本,其中N为300;最后针对每个候选区域用损失函数计算损失值,所述深度神经网络模型的损失函数由类别损失函数和定位回归损失函数构成;所述的类别损失函数采用改进的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值;所述的定位回归损失函数采用改进的平滑L1损失函数,计算候选区域与真实边界框之间的损失值;并根据制定优化策略衰减损失值,以及设定相关超参数,重复对深度神经网络模型进行训练,直至损失值收敛,得到优化深度神经网络模型;
S4、将人脸图像输入优化深度神经网络模型,输出人脸检测结果。
2.根据权利要求1所述的学习噪声区域信息的人脸检测方法,其特征在于,对每个候选区域用损失函数计算损失值之前,设定一个权重因子,控制重要程度不同的样本对训练损失值的占比,该权重因子计算公式如下:
r=(α·f(reg)+(1-α)·f(cls))γ
其中f(x)对定位信息和类别置信度进行归一化,γ是调节因子,这两个参数都是为了增加权重因子的方差设定的;将权重因子添加到损失函数中,公式如下所示:
Figure FDA0004131753530000022
Figure FDA0004131753530000031
Lcls是类别损失函数,采用改进的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值,pi为某候选区域的预测概率值,i表示正样本,j表示负样本;Lreg是定位回归损失函数,采用改进的平滑L1损失函数,计算候选区域与真实边界框之间的损失值,t是真实边界框位置,
Figure FDA0004131753530000032
表示预测的边界框位置;最终获得用于深度神经网络模型训练的完整的损失函数为:
L=Lcls+Lreg
3.根据权利要求1所述的学习噪声区域信息的人脸检测方法,其特征在于,所述的激活函数层采用抑制最大值为6的修正线性单元层。
4.根据权利要求1所述的学习噪声区域信息的人脸检测方法,其特征在于,所述的锚框尺寸比例中面积大小为[32×32,64×64,96×96],单位为mm,尺度比例为[0.5,1.2]。
5.根据权利要求1所述的学习噪声区域信息的人脸检测方法,其特征在于,所述的优化策略是使用自适应矩估计优化器衰减损失值,优化网络训练参数,相关超参数学习率设为0.001、批处理大小设为128、总迭代次数设为200000、L2惩罚权重衰减率设为0.0001。
6.一种学习噪声区域信息的人脸检测装置,其特征在于,包括:
图像获取单元,用于获取任意大小的人脸图像;
图像特征提取单元,用于利用深度神经网络模型提取训练集中的人脸图像特征图;
候选区域生成单元,用于利用设定的锚框在人脸图像特征图的每个特征点上生成候选区域;
无噪声得分计算单元,用于利用预测定位信息和预测置信度计算每个候选区域的无噪声得分;所述无噪声得分反映候选区域包含噪声信息的程度;所述无噪声得分计算公式如下:
Figure FDA0004131753530000041
式中:cls表示某候选区域的置信度,reg表示候选区域与真实边界框之间的距离交并比值,
Figure FDA0004131753530000042
表示某一个候选区域,B+1和B-1分别表示正样本候选区域集合和负样本候选区域集合,α是调节因子,用来调节置信度和距离交并比值在无噪声得分中的占比;所述距离交并比计算公式如下:
Figure FDA0004131753530000043
Figure FDA0004131753530000044
其中:b为候选区域B的中心点,bgt为真实边界框Bgt的中心点,ρ(·)为欧式距离计算公式,C为候选区域B和Bgt的最小外接矩形的对角线距离;正样本候选区域集合和负样本候选区域集合是通过将所有候选区域按置信度排序之后,选择前N个候选区域为正样本,其余候选区域为负样本,其中N为300;
候选区域损失值计算单元,用于对每个候选区域用损失函数计算损失值;
网络训练单元,用于对深度神经网络模型进行训练得到优化深度神经网络模型;所述深度神经网络模型的损失函数由类别损失函数和定位回归损失函数构成;所述的类别损失函数采用改进的二元交叉熵损失函数,用于计算无噪声得分与预测概率值之间的损失值;所述的定位回归损失函数采用改进的平滑L1损失函数,计算候选区域与真实边界框之间的损失值;
人脸检测结果识别单元,用于将人脸图像输入优化深度神经网络模型后输出人脸检测结果。
7.一种电子设备,其特征在于,包括:存储器,用于存储可执行指令;以及处理器,包括如权利要求6所述的学习噪声区域信息的人脸检测装置,用于与所述存储器通信以执行所述可执行指令从而完成权利要求1至5任意一项所述学习噪声区域信息的人脸检测方法的操作。
CN202110542099.8A 2021-05-18 2021-05-18 一种学习噪声区域信息的人脸检测方法及装置 Active CN113128479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110542099.8A CN113128479B (zh) 2021-05-18 2021-05-18 一种学习噪声区域信息的人脸检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110542099.8A CN113128479B (zh) 2021-05-18 2021-05-18 一种学习噪声区域信息的人脸检测方法及装置

Publications (2)

Publication Number Publication Date
CN113128479A CN113128479A (zh) 2021-07-16
CN113128479B true CN113128479B (zh) 2023-04-18

Family

ID=76782265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110542099.8A Active CN113128479B (zh) 2021-05-18 2021-05-18 一种学习噪声区域信息的人脸检测方法及装置

Country Status (1)

Country Link
CN (1) CN113128479B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118521964B (zh) * 2024-07-22 2024-10-11 山东捷瑞数字科技股份有限公司 一种基于锚框得分优化的机器人密集检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507996A (zh) * 2021-02-05 2021-03-16 成都东方天呈智能科技有限公司 一种主样本注意力机制的人脸检测方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3467712B1 (en) * 2017-10-06 2023-04-26 Sensing Feeling Limited Methods and systems for processing image data
CN109145898A (zh) * 2018-07-26 2019-01-04 清华大学深圳研究生院 一种基于卷积神经网络和迭代机制的物体检测方法
EP3671530A1 (en) * 2018-12-17 2020-06-24 Koninklijke Philips N.V. Device, system and method for object recognition
CN109753927A (zh) * 2019-01-02 2019-05-14 腾讯科技(深圳)有限公司 一种人脸检测方法和装置
CN110348423A (zh) * 2019-07-19 2019-10-18 西安电子科技大学 一种基于深度学习的实时人脸检测方法
CN112070104A (zh) * 2020-07-10 2020-12-11 国网浙江平阳县供电有限责任公司 主变压器局部放电识别方法
CN111914782A (zh) * 2020-08-10 2020-11-10 河南威虎智能科技有限公司 人脸及其特征点的检测方法、装置、电子设备和存储介质
CN112163520B (zh) * 2020-09-29 2022-02-15 广西科技大学 一种基于改进损失函数的mdssd人脸检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507996A (zh) * 2021-02-05 2021-03-16 成都东方天呈智能科技有限公司 一种主样本注意力机制的人脸检测方法

Also Published As

Publication number Publication date
CN113128479A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN108629288B (zh) 一种手势识别模型训练方法、手势识别方法及系统
CN109858569A (zh) 基于目标检测网络的多标签物体检测方法、系统、装置
CN110084173A (zh) 人头检测方法及装置
CN110796186A (zh) 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN109697469A (zh) 一种基于一致性约束的自学习小样本遥感图像分类方法
CN110796199B (zh) 一种图像处理方法、装置以及电子医疗设备
CN112418330A (zh) 一种基于改进型ssd的小目标物体高精度检测方法
CN111898432A (zh) 一种基于改进YOLOv3算法的行人检测系统及方法
CN113706579A (zh) 一种基于工厂化养殖的对虾多目标跟踪系统及方法
CN118098249B (zh) 基于ipso-chrfa模型的海洋哺乳动物叫声分类方法
CN113672931A (zh) 一种基于预训练的软件漏洞自动检测方法及装置
CN116310718A (zh) 一种基于YOLOv5模型的害虫目标检测方法、系统及设备
CN109697727A (zh) 基于相关滤波和度量学习的目标跟踪方法、系统及存储介质
CN113128479B (zh) 一种学习噪声区域信息的人脸检测方法及装置
CN117975464A (zh) 基于U-Net的电气二次图纸文字信息的识别方法及系统
CN113989655A (zh) 基于自动化深度学习的雷达或声呐图像目标检测与分类方法
CN112053386A (zh) 基于深度卷积特征自适应集成的目标跟踪方法
CN115661542A (zh) 一种基于特征关系迁移的小样本目标检测方法
CN115423091A (zh) 一种条件对抗神经网络训练方法、场景生成方法和系统
Li et al. Research on automatic opening tunnel fire door method by patrol robot in dark environment
CN116150038B (zh) 基于神经元敏感性的白盒测试样本生成方法
CN115862060B (zh) 基于猪脸识别与猪只重识别的猪只唯一化识别方法及系统
Chong et al. YOLOv5 spore detection algorithm for wheat powdery mildew based on attentional feature fusion
CN118429389B (zh) 基于多尺度聚合注意力特征提取网络的目标跟踪方法与系统
CN113408780B (zh) 汽车未来保值率预测方法、系统、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240506

Address after: Room 1304, 13th Floor, Building 2, No. 666, Middle Section of Tianfu Avenue, High tech Zone, Chengdu City, Sichuan Province, 610000

Patentee after: Chengdu Zhongfu Rongtong Technology Co.,Ltd.

Country or region after: China

Address before: No. 2202, 22 / F, building 2, No. 530, middle section of Tianfu Avenue, Chengdu high tech Zone, Wuhou District, Chengdu, Sichuan 610000

Patentee before: Chengdu Weihu Technology Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right