CN110991310B - 人像检测方法、装置、电子设备及计算机可读介质 - Google Patents

人像检测方法、装置、电子设备及计算机可读介质 Download PDF

Info

Publication number
CN110991310B
CN110991310B CN201911188538.9A CN201911188538A CN110991310B CN 110991310 B CN110991310 B CN 110991310B CN 201911188538 A CN201911188538 A CN 201911188538A CN 110991310 B CN110991310 B CN 110991310B
Authority
CN
China
Prior art keywords
image
target
super
detected
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911188538.9A
Other languages
English (en)
Other versions
CN110991310A (zh
Inventor
鲁方波
汪贤
成超
樊鸿飞
蔡媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201911188538.9A priority Critical patent/CN110991310B/zh
Publication of CN110991310A publication Critical patent/CN110991310A/zh
Application granted granted Critical
Publication of CN110991310B publication Critical patent/CN110991310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/164Detection; Localisation; Normalisation using holistic features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种人像检测方法、装置、电子设备及计算机可读介质,涉及图像处理技术领域,该方法包括:获取待检测图像;根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与人脸区域所占的面积相关联;根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像;通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。由于在对待检测图像进行图像超分辨率重建时考虑到了人脸区域所占的面积的影响,因此通过图像超分辨率重建得到的目标检测图像更加有利于人像的准确检测,也即能够提高人像检测的准确度。

Description

人像检测方法、装置、电子设备及计算机可读介质
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种人像检测方法、装置、电子设备及计算机可读介质。
背景技术
随着计算机视觉技术的发展,目标检测技术也愈发成熟,人像检测作为图像分割识别的基础,在很多领域都有着非常重要的应用。比如,交通系统中使用人像检测进行人员计数,人脸识别中使用人像检测确定人脸的区域,人脸修复任务中使用人像检测得到图像中人像区域后,对图像中人像部分进行修复处理,从而提升图像画质。
目前人像检测方案主要分为两类:基于诸如Adaboost多视角分类器的传统人像检测方法和基于深度学习的人像检测方法。然而现有的人像检测方法在实际应用中准确度较低,无法满足实际应用需求。
发明内容
本发明的目的在于提供一种人像检测方法、装置、电子设备及计算机可读介质,以提高人像检测的准确度。
本发明实施例提供了一种人像检测方法,包括:
获取待检测图像;
根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,所述目标超分类型与所述人脸区域所占的面积相关联;
根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像;
通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果;其中,所述人像检测结果用于指示所述待检测图像中的人像。
进一步地,所述根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型,包括:
对所述待检测图像进行人脸检测,得到人脸检测结果;
根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型;其中,不同所述目标超分类型对应的目标上采样因子不同;
所述根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像,包括:
对所述待检测图像进行所述目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像。
进一步地,所述对所述待检测图像进行人脸检测,得到人脸检测结果,包括:
采用快速人脸检测算法对所述待检测图像进行人脸检测,得到人脸检测结果;其中,所述快速人脸检测算法包括Adaboost算法、单阶段无头人脸检测器SSH算法、FaceBoxes算法中的一种或多种。
进一步地,所述根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型,包括:
在所述人脸检测结果为检测到至少一个人脸区域的情况下,根据各个所述人脸区域的尺寸,计算平均人脸面积;
根据所述平均人脸面积所属的目标面积区间,确定所述待检测图像对应的目标超分类型;其中,所述目标超分类型包括低倍超分、中倍超分或高倍超分,所述目标超分类型对应的目标上采样因子与所述目标面积区间的中位数呈负相关。
进一步地,所述根据所述平均人脸面积所属的目标面积区间,确定所述待检测图像对应的目标超分类型,包括:
将所述平均人脸面积分别与预设的第一面积阈值和预设的第二面积阈值进行比较,得到所述平均人脸面积所属的目标面积区间;其中,所述第一面积阈值小于所述第二面积阈值;
在预设的超分类型与面积区间的对应关系中查找所述目标面积区间,得到所述待检测图像对应的目标超分类型。
进一步地,所述根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型,包括:
在所述人脸检测结果为未检测到人脸区域的情况下,确定所述待检测图像对应的目标超分类型为高倍超分。
进一步地,所述对所述待检测图像进行所述目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像,包括:
采用图像超分辨率算法对所述待检测图像进行所述目标上采样因子下的图像超分辨率重建,得到目标检测图像;其中,所述图像超分辨率算法包括基于插值的图像超分辨率算法或基于深度学习的图像超分辨率算法。
进一步地,所述通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果,包括:
采用基于神经网络模型的目标检测算法对所述目标检测图像进行人像检测,得到目标人像的初始区域位置信息;其中,所述目标人像的初始区域位置信息包括在所述目标检测图像中所述目标人像对应的检测框的起点坐标和尺寸;
根据所述目标人像的初始区域位置信息和所述目标超分类型对应的目标上采样因子,确定所述目标人像的目标区域位置信息;
将所述目标人像的目标区域位置信息确定为所述待检测图像的人像检测结果。
进一步地,在所述采用基于神经网络模型的目标检测算法对所述目标检测图像进行人像检测,得到目标人像的初始区域位置信息之前,所述方法还包括:
获取初始训练图像;
根据所述初始训练图像中的人脸区域,确定超分辨率处理的训练超分类型;
根据所述训练超分类型对所述初始训练图像进行图像超分辨率重建,得到目标训练图像;
对所述目标训练图像进行人像标注,得到带有人像标注框的标注图像;
利用所述目标训练图像和所述标注图像对待训练的神经网络模型进行训练,得到训练完成的所述神经网络模型。
本发明实施例还提供了一种人像检测装置,包括:
获取模块,用于获取待检测图像;
确定模块,用于根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,所述目标超分类型与所述人脸区域所占的面积相关联;
重建模块,用于根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像;
检测模块,用于通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果;其中,所述人像检测结果用于指示所述待检测图像中的人像。
本发明实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的人像检测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的人像检测方法。
本发明实施例提供的人像检测方法、装置、电子设备及计算机可读介质中,该方法包括:获取待检测图像;根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与人脸区域所占的面积相关联;根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像;通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。由于在对待检测图像进行图像超分辨率重建时考虑到了人脸区域所占的面积的影响,因此通过图像超分辨率重建得到的目标检测图像更加有利于人像的准确检测,也即基于目标检测图像来确定待检测图像的人像检测结果,能够提高人像检测的准确度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人像检测方法的流程示意图;
图2为本发明实施例提供的另一种人像检测方法的流程示意图;
图3为本发明实施例提供的一种训练目标检测算法的神经网络模型的流程示意图;
图4为本发明实施例提供的一种人像检测装置的结构示意图;
图5为本发明实施例提供的另一种人像检测装置的结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前现有的人像检测方案主要有两类,一类是传统人像检测方法,如基于Adaboost多视角分类器的人像检测方法,该方法对输入视频图像进行前景提取的同时将每帧图像缩放到不同的尺寸,对每个固定尺寸的图像窗口提取像素差特征,并将提取的像素差特征送入Adaboost多视角分类器进行人头检测;该方法由于使用传统算法进行特征提取,因此准确度较低。另一类是基于深度学习的方法,该方法主要利用大量标注数据进行网络训练并学习人像特征,但发明人发现该方法对所有不同大小的人像均采用同一网络进行处理,对于低分辨率、低清晰度或者含有较小人像的图像,在经过神经网络层层卷积后,人像区域特征几乎消失;该方法由于无法有效捕捉该类场景中人像特征,因此在实际应用中准确度较低。基于此,本发明实施例提供的一种人像检测方法、装置、电子设备及计算机可读介质,可以显著提高人像检测的准确度。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种人像检测方法进行详细介绍。
本发明实施例提供了一种人像检测方法,该方法可以由具有图像处理能力的电子设备执行,该电子设备可以但不限于为以下中的任一种:台式电脑、笔记本电脑、平板电脑和智能手机等。
参见图1所示的一种人像检测方法的流程示意图,该方法主要包括以下步骤S102至步骤S108:
步骤S102,获取待检测图像。
上述待检测图像可以是照片,也可以是视频图像;可以是电子设备自身拍摄得到的,也可以是通过数据传输得到的,本发明实施例对此不做限定。本发明实施例提供的方法特别适用于低分辨率或低清晰度或较小人像的待检测图像。
步骤S104,根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与该人脸区域所占的面积相关联。
超分类型可以通过超分倍数(超分辨率的放大倍数,也可表示为上采样因子)来划分,例如超分类型可以包括低倍超分(上采样因子最小)、中倍超分和高倍超分(上采样因子最大),其中,不同的超分类型对应不同的上采样因子,低倍超分对应的上采样因子小于中倍超分对应的上采样因子,中倍超分对应的上采样因子小于高倍超分对应的上采样因子。本实施例中,待检测图像对应的目标超分类型与待检测图像中的人脸区域所占的面积相关联,使得后续得到的目标检测图像的分辨率与人脸区域所占的面积相适配,以提高最终人像检测的准确度。例如,人脸区域所占的面积较小时,目标超分类型可以为高倍超分,这样可以便于较小人像的准确检测;又如,人脸区域所占的面积较大时,目标超分类型可以为低倍超分,这样在保证人像检测的准确度的情况下,可以节约计算资源。
步骤S106,根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像。
图像超分辨率重建采用图像超分辨率技术,图像超分辨率技术指由一幅低分辨率图像或图像序列恢复出高分辨率图像,使得目标检测图像的分辨率高于待检测图像的分辨率(在目标检测图像的分辨率下更加有利于人像的准确检测),且目标检测图像的清晰度高于待检测图像的清晰度。
步骤S108,通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。
可以通过现有的目标检测算法对目标检测图像进行人像检测,确定目标检测图像中人像的区域位置信息,进而确定待检测图像中人像的区域位置信息,也即确定待检测图像的人像检测结果。在本发明实施例中,人像检测结果指示的人像包括人脸,还包括头部,例如人脸模糊的头部、未露出人脸的头部。换言之,通过本发明实施例可以对人脸模糊或者未露出人脸的人像进行有效的检测。
本发明实施例中,获取待检测图像;根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与人脸区域所占的面积相关联;根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像;通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。由于在对待检测图像进行图像超分辨率重建时考虑到了人脸区域所占的面积的影响,因此通过图像超分辨率重建得到的目标检测图像更加有利于人像的准确检测,也即基于目标检测图像来确定待检测图像的人像检测结果,能够提高人像检测的准确度。
为了便于理解,本发明实施例还提供了一种人像检测方法的具体实现过程。参见图2所示的另一种人像检测方法的流程示意图,该方法包括以下步骤:
步骤S202,获取待检测图像。
步骤S204,对待检测图像进行人脸检测,得到人脸检测结果。
可选地,可以采用快速人脸检测算法对待检测图像进行人脸检测,得到人脸检测结果;其中,快速人脸检测算法包括Adaboost算法、SSH(Single Stage Headless FaceDetector,单阶段无头人脸检测器)算法、FaceBoxes算法中的一种或多种。
具体地,上述人脸检测结果包括检测到至少一个人脸区域,或者未检测到人脸区域。在一种可能的实现方式中,人脸区域由矩形检测框标示,所检测的人脸区域集合可以记为FACE_REGION,第n个人脸区域可以表示为regionn,则:
regionn=(xn,yn,wn,hn)
FACE_REGION={region1,region2,…,regionm}
其中,m表示人脸区域的数目;xn,yn,wn,hn分别表示第n个人脸区域的x坐标、y坐标、宽度和高度;(xn,yn)表示人脸区域的起点坐标,例如矩形检测框左上角的坐标。
步骤S206,根据上述人脸检测结果,确定待检测图像对应的目标超分类型;其中,不同目标超分类型对应的目标上采样因子不同。
如果上述人脸检测结果为检测到至少一个人脸区域,则步骤S206的过程可以如下:根据各个人脸区域的尺寸(例如面积,或者长和宽),计算平均人脸面积;根据平均人脸面积所属的目标面积区间,确定待检测图像对应的目标超分类型;其中,目标超分类型包括低倍超分、中倍超分或高倍超分,目标超分类型对应的目标上采样因子与目标面积区间的中位数呈负相关。如果上述人脸检测结果为未检测到人脸区域,则步骤S206的过程可以如下:在人脸检测结果为未检测到人脸区域的情况下,确定待检测图像对应的目标超分类型为高倍超分。其中,不同目标超分类型对应的目标上采样因子可以根据实际需求设置,高倍超分对应的目标上采样因子通常设置的较大,例如为4,这样能够实现较高倍数的图像超分辨率重建,便于提高后续人像检测的准确度;低倍超分对应的目标上采样因子通常设置的较小,例如为1(待检测图像的分辨率足以满足人像检测的准确度要求),这样可以节约计算资源;中倍超分对应的目标上采样因子通常设置的比较适中,例如为2。
在一些可能的实施例中,上述根据平均人脸面积所属的目标面积区间,确定待检测图像对应的目标超分类型,可以通过以下过程实现:将上述平均人脸面积分别与预设的第一面积阈值和预设的第二面积阈值进行比较,得到平均人脸面积所属的目标面积区间;其中,第一面积阈值小于第二面积阈值;在预设的超分类型与面积区间的对应关系中查找该目标面积区间,得到待检测图像对应的目标超分类型。具体地,第一面积阈值和第二面积阈值均可以根据实际需求设置,例如第一面积阈值为15,第二面积阈值为30。
显然第一面积阈值和第二面积阈值可以将面积分为以下三个面积区间:第一面积区间-大于0且小于或等于第一面积阈值;第二面积区间-大于第一面积阈值且小于或等于第二面积阈值;第三面积区间-大于第二面积阈值。执行上述方法的电子设备中存储有超分类型与面积区间的对应关系,例如,高倍超分对应第一面积区间,中倍超分对应第二面积区间,低倍超分对应第三面积区间。基于此,在一种可能的实现方式中,如果目标面积区间为第一面积区间,则待检测图像对应的目标超分类型为高倍超分;如果目标面积区间为第二面积区间,则待检测图像对应的目标超分类型为中倍超分;如果目标面积区间为第三面积区间,则待检测图像对应的目标超分类型为低倍超分。
这样,平均人脸面积越小(未检测到人脸区域时的平均人脸面积相当于为0),目标超分类型对应的目标上采样因子越大,也即超分倍数越大,使得该方法特别适合于对包含较小人像的图像进行人像检测。
步骤S208,对待检测图像进行目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像。
可选地,可以采用图像超分辨率算法对上述待检测图像进行目标上采样因子下的图像超分辨率重建,得到目标检测图像;其中,图像超分辨率算法包括基于插值的图像超分辨率算法或基于深度学习的图像超分辨率算法,基于插值的图像超分辨率算法可以但不限于采用最近邻插值或双线性插值。
如果上述图像超分辨率算法选择基于深度学习的图像超分辨率算法,则需要提前对其神经网络模型进行训练,通过学习低分辨率图像和高分辨率图像之间的关系,当输入一张新的低分辨率图像时,则可以对图像完成低分辨率到高分辨率的操作。由于图像超分辨率算法除了可以放大图像外,还可以对图像细节进行修复,因此超分后的图像质量更高,因而更加有利于后续的人像检测。
步骤S210,采用基于神经网络模型的目标检测算法对上述目标检测图像进行人像检测,得到目标人像的初始区域位置信息。
其中,上述基于神经网络模型的目标检测算法可以包括PyramidBox算法或S3FD(Single Shot Scale-invariant Face Detector,单阶段尺度不变人脸检测器)算法,目标人像的初始区域位置信息包括在目标检测图像中目标人像(头部)对应的检测框的起点坐标和尺寸。例如,初始区域位置信息包括矩形检测框的起点坐标、宽度和高度。目标人像可以为一个或多个,如果目标人像为多个,则通过对目标检测图像进行人像检测,可以得到每个目标人像的初始区域位置信息。
步骤S212,根据目标人像的初始区域位置信息和目标超分类型对应的目标上采样因子,确定目标人像的目标区域位置信息。
由于目标检测图像是对待检测图像进行超分放大后的图像,目标人像也得到了相应的放大,因此需要基于超分倍数(目标上采样因子)确定目标人像的实际位置。
具体地,将初始区域位置信息中的各个参数均除以超分倍数,得到最终的目标人像的目标区域位置信息。例如,初始区域位置信息包括目标上采样因子为4,则目标人像的目标区域位置信息可以表示为/>其中,表示第p个目标人像的初始区域位置信息;xp,yp,wp,hp分别表示在目标检测图像中第p个目标人像的x坐标、y坐标、宽度和高度;regionp表示第p个目标人像的目标区域位置信息。
步骤S214,将上述目标人像的目标区域位置信息确定为待检测图像的人像检测结果。
需要说明的是,人脸检测与人像检测都属于目标检测任务,可以使用相同的算法,区别在于二者所检测的区域不同:人像检测的区域为整个头部,人脸检测的区域为脸部。人脸检测与人像检测在训练数据上是不同的,具体为标注框对应的区域不同。
本实施例中,在对待检测图像进行图像超分辨率重建,得到目标检测图像时,先对待检测图像进行了人脸检测,基于得到的人脸检测结果来确定待检测图像对应的目标超分类型,也即选取目标上采样因子时还考虑了人脸检测结果的影响,因此可以显著提升人像检测的准确率,尤其是低分辨率、低清晰度或较小人像的情况。
对于上述步骤S206,在具体实现时,可以根据人脸检测结果计算平均人脸区域大小(即上述的平均人脸面积),其中,若人脸检测结果为未检测到人脸区域,则平均人脸区域大小为0;根据平均人脸区域大小将图像超分类型分为低倍超分、中倍超分和高倍超分,其中低倍超分、中倍超分、高倍超分的超分倍数分别为SR1、SR2、SR3,满足SR1<SR2<SR3;SR倍超分是指超分后图像的宽高是原始图像宽高的SR倍。可选地,SR1=1,SR2=2,SR3=4。
具体实现时,上述步骤S206的具体过程可以如下:先由人脸区域regionn计算得到第n个人脸区域的大小arean=wn*hn,再计算得到平均人脸区域大小AvgArea:
最后根据平均人脸区域大小AvgArea确定超分倍数SR:
其中,T1、T2分别为上述的第一面积阈值和第二面积阈值,满足T1<T2。可选地,T1=15,T2=30。
这样,计算平均人脸区域大小,根据平均人脸区域大小将图像的超分类型划分为低倍超分、中倍超分、高倍超分三种类型,然后根据待检测图像的类型确定超分倍数,可以显著提升人像检测的准确率,尤其是较小人像的情况。
另外,本发明实施例还提供了一种目标检测算法的神经网络模型的训练方法,参见图3所示的一种训练目标检测算法的神经网络模型的流程示意图,通过以下步骤训练得到目标检测算法的神经网络模型:
步骤S302,获取初始训练图像。
上述初始训练图像可以选取包含低分辨率、低清晰或较小人像的图像。
步骤S304,根据初始训练图像中的人脸区域,确定超分辨率处理的训练超分类型。
步骤S306,根据训练超分类型对上述初始训练图像进行图像超分辨率重建,得到目标训练图像。
步骤S308,对目标训练图像进行人像标注,得到带有人像标注框的标注图像。
这里的人像标注框的坐标为初始训练图像中对应人像标注框的坐标的SR倍,其中,SR表示步骤S306中进行图像超分辨率重建时训练超分类型对应的超分倍数(上采样因子)。
步骤S310,利用目标训练图像和标注图像对待训练的神经网络模型进行训练,得到训练完成的神经网络模型。
将目标训练图像和标注图像送入待训练的神经网络模型进行训练,通过神经网络模型的不断迭代训练来学习模型参数,从而后续可以通过训练好的神经网络模型对任意输入图像进行预测,得到人像的位置坐标(区域位置信息)。
对应于上述的人像检测方法,本发明实施例还提供了一种人像检测装置。参见图4所示的一种人像检测装置的结构示意图,该装置包括:
获取模块42,用于获取待检测图像;
确定模块44,用于根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与人脸区域所占的面积相关联;
重建模块46,用于根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像;
检测模块48,用于通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。
本发明实施例中,获取模块42获取待检测图像;确定模块44根据待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,目标超分类型与人脸区域所占的面积相关联;重建模块46根据目标超分类型对待检测图像进行图像超分辨率重建,得到目标检测图像;检测模块48通过对目标检测图像进行人像检测,确定待检测图像的人像检测结果;其中,人像检测结果用于指示待检测图像中的人像。由于在对待检测图像进行图像超分辨率重建时考虑到了人脸区域所占的面积的影响,因此通过图像超分辨率重建得到的目标检测图像更加有利于人像的准确检测,也即基于目标检测图像来确定待检测图像的人像检测结果,能够提高人像检测的准确度。
可选地,上述确定模块44具体用于:对待检测图像进行人脸检测,得到人脸检测结果;根据人脸检测结果,确定待检测图像对应的目标超分类型;其中,不同目标超分类型对应的目标上采样因子不同。上述重建模块46具体用于:对待检测图像进行目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像。
可选地,上述确定模块44还用于:采用快速人脸检测算法对待检测图像进行人脸检测,得到人脸检测结果;其中,快速人脸检测算法包括Adaboost算法、SSH算法、FaceBoxes算法中的一种或多种。
可选地,上述确定模块44还用于:在人脸检测结果为检测到至少一个人脸区域的情况下,根据各个人脸区域的尺寸,计算平均人脸面积;根据平均人脸面积所属的目标面积区间,确定待检测图像对应的目标超分类型;其中,目标超分类型包括低倍超分、中倍超分或高倍超分,目标超分类型对应的目标上采样因子与目标面积区间的中位数呈负相关。
进一步地,上述确定模块44还用于:将平均人脸面积分别与预设的第一面积阈值和预设的第二面积阈值进行比较,得到平均人脸面积所属的目标面积区间;其中,第一面积阈值小于第二面积阈值;在预设的超分类型与面积区间的对应关系中查找目标面积区间,得到待检测图像对应的目标超分类型。
可选地,上述确定模块44还用于:在人脸检测结果为未检测到人脸区域的情况下,确定待检测图像对应的目标超分类型为高倍超分。
可选地,上述重建模块46还用于:采用图像超分辨率算法对待检测图像进行目标上采样因子下的图像超分辨率重建,得到目标检测图像;其中,图像超分辨率算法包括基于插值的图像超分辨率算法或基于深度学习的图像超分辨率算法。
可选地,上述检测模块48具体用于:采用基于神经网络模型的目标检测算法对目标检测图像进行人像检测,得到目标人像的初始区域位置信息;其中,目标人像的初始区域位置信息包括在目标检测图像中目标人像对应的检测框的起点坐标和尺寸;根据目标人像的初始区域位置信息和目标超分类型对应的目标上采样因子,确定目标人像的目标区域位置信息;将目标人像的目标区域位置信息确定为待检测图像的人像检测结果。
可选地,参见图5所示的另一种人像检测装置的结构示意图,在图4的基础上,上述装置还包括训练模块52,训练模块52用于:获取初始训练图像;根据初始训练图像中的人脸区域,确定超分辨率处理的训练超分类型;根据训练超分类型对初始训练图像进行图像超分辨率重建,得到目标训练图像;对目标训练图像进行人像标注,得到带有人像标注框的标注图像;利用目标训练图像和标注图像对待训练的神经网络模型进行训练,得到训练完成的神经网络模型。
本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
参见图6,本发明实施例还提供一种电子设备100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的人像检测方法。该计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
附图中的流程图和框图显示了根据本发明的多个实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种人像检测方法,其特征在于,包括:
获取待检测图像;
根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,所述目标超分类型与所述人脸区域所占的面积相关联,所述人脸区域所占的面积越大,所述目标超分类型对应的上采样因子越小;
根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像;
通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果;其中,所述人像检测结果用于指示所述待检测图像中的人像;
所述根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型,包括:
对所述待检测图像进行人脸检测,得到人脸检测结果;
根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型;其中,不同所述目标超分类型对应的目标上采样因子不同;
所述根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型,包括:
在所述人脸检测结果为检测到至少一个人脸区域的情况下,根据各个所述人脸区域的尺寸,计算平均人脸面积;
根据所述平均人脸面积所属的目标面积区间,确定所述待检测图像对应的目标超分类型;其中,所述目标超分类型包括低倍超分、中倍超分或高倍超分,所述目标超分类型对应的目标上采样因子与所述目标面积区间的中位数呈负相关。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像,包括:
对所述待检测图像进行所述目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像。
3.根据权利要求1所述的方法,其特征在于,所述根据所述平均人脸面积所属的目标面积区间,确定所述待检测图像对应的目标超分类型,包括:
将所述平均人脸面积分别与预设的第一面积阈值和预设的第二面积阈值进行比较,得到所述平均人脸面积所属的目标面积区间;其中,所述第一面积阈值小于所述第二面积阈值;
在预设的超分类型与面积区间的对应关系中查找所述目标面积区间,得到所述待检测图像对应的目标超分类型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型,包括:
在所述人脸检测结果为未检测到人脸区域的情况下,确定所述待检测图像对应的目标超分类型为高倍超分。
5.根据权利要求2所述的方法,其特征在于,所述对所述待检测图像进行所述目标超分类型对应的目标上采样因子下的图像超分辨率重建,得到目标检测图像,包括:
采用图像超分辨率算法对所述待检测图像进行所述目标上采样因子下的图像超分辨率重建,得到目标检测图像;其中,所述图像超分辨率算法包括基于插值的图像超分辨率算法或基于深度学习的图像超分辨率算法。
6.根据权利要求1所述的方法,其特征在于,所述通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果,包括:
采用基于神经网络模型的目标检测算法对所述目标检测图像进行人像检测,得到目标人像的初始区域位置信息;其中,所述目标人像的初始区域位置信息包括在所述目标检测图像中所述目标人像对应的检测框的起点坐标和尺寸;
根据所述目标人像的初始区域位置信息和所述目标超分类型对应的目标上采样因子,确定所述目标人像的目标区域位置信息;
将所述目标人像的目标区域位置信息确定为所述待检测图像的人像检测结果。
7.根据权利要求6所述的方法,其特征在于,在所述采用基于神经网络模型的目标检测算法对所述目标检测图像进行人像检测,得到目标人像的初始区域位置信息之前,所述方法还包括:
获取初始训练图像;
根据所述初始训练图像中的人脸区域,确定超分辨率处理的训练超分类型;
根据所述训练超分类型对所述初始训练图像进行图像超分辨率重建,得到目标训练图像;
对所述目标训练图像进行人像标注,得到带有人像标注框的标注图像;
利用所述目标训练图像和所述标注图像对待训练的神经网络模型进行训练,得到训练完成的所述神经网络模型。
8.一种人像检测装置,其特征在于,包括:
获取模块,用于获取待检测图像;
确定模块,用于根据所述待检测图像中的人脸区域,确定超分辨率处理的目标超分类型;其中,所述目标超分类型与所述人脸区域所占的面积相关联,所述人脸区域所占的面积越大,所述目标超分类型对应的上采样因子越小;
重建模块,用于根据所述目标超分类型对所述待检测图像进行图像超分辨率重建,得到目标检测图像;
检测模块,用于通过对所述目标检测图像进行人像检测,确定所述待检测图像的人像检测结果;其中,所述人像检测结果用于指示所述待检测图像中的人像;
所述确定模块具体用于:对所述待检测图像进行人脸检测,得到人脸检测结果;根据所述人脸检测结果,确定所述待检测图像对应的目标超分类型;其中,不同所述目标超分类型对应的目标上采样因子不同;
所述确定模块还用于:在所述人脸检测结果为检测到至少一个人脸区域的情况下,根据各个所述人脸区域的尺寸,计算平均人脸面积;根据所述平均人脸面积所属的目标面积区间,确定所述待检测图像对应的目标超分类型;其中,所述目标超分类型包括低倍超分、中倍超分或高倍超分,所述目标超分类型对应的目标上采样因子与所述目标面积区间的中位数呈负相关。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-7中任一项所述的方法。
CN201911188538.9A 2019-11-27 2019-11-27 人像检测方法、装置、电子设备及计算机可读介质 Active CN110991310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911188538.9A CN110991310B (zh) 2019-11-27 2019-11-27 人像检测方法、装置、电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911188538.9A CN110991310B (zh) 2019-11-27 2019-11-27 人像检测方法、装置、电子设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN110991310A CN110991310A (zh) 2020-04-10
CN110991310B true CN110991310B (zh) 2023-08-22

Family

ID=70087686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911188538.9A Active CN110991310B (zh) 2019-11-27 2019-11-27 人像检测方法、装置、电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110991310B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598776B (zh) * 2020-04-29 2023-06-30 Oppo广东移动通信有限公司 图像处理方法、图像处理装置、存储介质与电子设备
CN111950527A (zh) * 2020-08-31 2020-11-17 珠海大横琴科技发展有限公司 一种基于yolo v2神经网络的目标检测方法及装置
CN113409192A (zh) * 2021-06-17 2021-09-17 Oppo广东移动通信有限公司 超分辨率芯片、超分辨率算法的更新方法和电子设备
CN115063872A (zh) * 2022-08-15 2022-09-16 北京师范大学 一种表情与肢体识别相结合的客户满意度检测方法及系统
CN117037258B (zh) * 2023-10-09 2024-02-20 苏州元脑智能科技有限公司 面部图像的检测方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354397A (zh) * 2011-09-19 2012-02-15 大连理工大学 基于面部特征器官相似性的人脸图像超分辨率重建方法
CN103678323A (zh) * 2012-09-03 2014-03-26 上海唐里信息技术有限公司 Sns网络中好友推荐方法与系统
CN108304816A (zh) * 2018-02-09 2018-07-20 北京京东金融科技控股有限公司 身份识别方法、装置、存储介质及电子设备
CN109671023A (zh) * 2019-01-24 2019-04-23 江苏大学 一种人脸图像超分辨率二次重建方法
CN110188807A (zh) * 2019-05-21 2019-08-30 重庆大学 基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法
CN110298790A (zh) * 2019-06-28 2019-10-01 北京金山云网络技术有限公司 一种对图像进行超分辨率重建的处理方法及装置
CN110472567A (zh) * 2019-08-14 2019-11-19 旭辉卓越健康信息科技有限公司 一种适用于非配合场景下的人脸识别方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644209A (zh) * 2017-09-21 2018-01-30 百度在线网络技术(北京)有限公司 人脸检测方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354397A (zh) * 2011-09-19 2012-02-15 大连理工大学 基于面部特征器官相似性的人脸图像超分辨率重建方法
CN103678323A (zh) * 2012-09-03 2014-03-26 上海唐里信息技术有限公司 Sns网络中好友推荐方法与系统
CN108304816A (zh) * 2018-02-09 2018-07-20 北京京东金融科技控股有限公司 身份识别方法、装置、存储介质及电子设备
CN109671023A (zh) * 2019-01-24 2019-04-23 江苏大学 一种人脸图像超分辨率二次重建方法
CN110188807A (zh) * 2019-05-21 2019-08-30 重庆大学 基于级联超分辨率网络与改进Faster R-CNN的隧道行人目标检测方法
CN110298790A (zh) * 2019-06-28 2019-10-01 北京金山云网络技术有限公司 一种对图像进行超分辨率重建的处理方法及装置
CN110472567A (zh) * 2019-08-14 2019-11-19 旭辉卓越健康信息科技有限公司 一种适用于非配合场景下的人脸识别方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于组合学习的人脸超分辨率算法;许若波;卢涛;王宇;张彦铎;;计算机应用(03);96-102 *

Also Published As

Publication number Publication date
CN110991310A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110991310B (zh) 人像检测方法、装置、电子设备及计算机可读介质
US10803554B2 (en) Image processing method and device
CN110428366B (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
US10614574B2 (en) Generating image segmentation data using a multi-branch neural network
CN109325954B (zh) 图像分割方法、装置及电子设备
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
CN112446383B (zh) 车牌识别方法及装置、存储介质、终端
CN109117846B (zh) 一种图像处理方法、装置、电子设备和计算机可读介质
CN112329702B (zh) 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质
CN109740589B (zh) 视频模式中的异步对象roi检测方法及系统
CN109816694B (zh) 目标跟踪方法、装置及电子设备
CN103198311A (zh) 基于拍摄的图像来识别字符的方法及装置
CN109729298B (zh) 图像处理方法与图像处理装置
CN114049499A (zh) 用于连续轮廓的目标对象检测方法、设备及存储介质
CN112700460B (zh) 图像分割方法及系统
WO2020043296A1 (en) Device and method for separating a picture into foreground and background using deep learning
CN116612280A (zh) 车辆分割方法、装置、计算机设备和计算机可读存储介质
CN109543487B (zh) 一种基于条码边缘分割的自动感应触发方法及其系统
CN111079624B (zh) 一种样本信息采集的方法、装置、电子设备以及介质
CN113542868A (zh) 视频关键帧选取方法、装置、电子设备、存储介质
CN116311290A (zh) 基于深度学习的手写及打印文本检测方法和装置
CN116258727A (zh) 模型训练方法、装置、电子设备及存储介质
CN113743219B (zh) 运动目标检测方法、装置、电子设备及存储介质
CN113538337B (zh) 检测方法、检测装置及计算机可读存储介质
CN116246298A (zh) 一种空间占用人数统计方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant