CN110674709A - 一种自学习的高精度人脸检测的方法 - Google Patents
一种自学习的高精度人脸检测的方法 Download PDFInfo
- Publication number
- CN110674709A CN110674709A CN201910844887.5A CN201910844887A CN110674709A CN 110674709 A CN110674709 A CN 110674709A CN 201910844887 A CN201910844887 A CN 201910844887A CN 110674709 A CN110674709 A CN 110674709A
- Authority
- CN
- China
- Prior art keywords
- face
- scores
- face detection
- self
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Abstract
本发明公开了人脸检测领域的一种自学习的高精度人脸检测的方法,包括max‑out方法和数据增强方法,所述max‑out方法为通过网络输出代表“不是人脸”的若干得分b和代表“是人脸”的若干得分f,得到多组预测值,通过多组预测值取最大值的方式,获得最优预测值;所述数据增强方法包括以下步骤:S1:首先从训练数据中选取一个人脸,大小为Sface;S2:然后,在所有anchor box中,选取一个和该人脸大小最接近的一个,大小为Sanchor;S3:然后对该anchor box的大小在一定范围内随机,得到Srandom;S4:最后根据Srandom/Sface对所有训练数据进行缩放,提高小的人脸召回率的同时,减少了虚检的产生,通过扩展训练样本分布,有效地提升了深度学习网络的训练效果。
Description
技术领域
本发明涉及人脸检测技术领域,具体为一种自学习的高精度人脸检测的方法。
背景技术
随着深度卷积神经网络的发展,人脸检测技术也取得了很大的进展。但是在小的人脸检测方面,性能还不是很好,影响了整体精度的提升。
目前基于深度学习的人脸检测算法,基本上都是采用基于anchorbox的方式。为了检测小的人脸,需要铺设大量的anchorbox,而实际图片中小的人脸数量又相对较少。训练中与实际人脸匹配的anchorbox称为正样本,没有匹配的anchorbox成为负样本,也就是说,训练中存在正负样本的极端不平衡,这就造成了小的人脸学习非常困难。
另外,为了提升模型对于各种尺度的的泛化能力,一般都会使用大量的数据增强。虽然这些数据增强都有一定的效果,但是还有很大提升空间。
针对这个问题,本发明专利提出一种高精度人脸检测方法。一方面通过max-out方法减轻正负样本平衡问题,另一方面,提出一种新的数据增强方法,扩大训练数据的分布。通过这两种方法,使整体人脸检测性能达到目前世界第一。
发明内容
本发明的目的在于提供一种自学习的高精度人脸检测的方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种自学习的高精度人脸检测的方法,包括max-out方法和数据增强方法,
所述max-out方法为通过网络输出代表“不是人脸”的若干得分b和代表“是人脸”的若干得分f,得到多组预测值,通过多组预测值取最大值的方式,获得最优预测值;
所述数据增强方法包括以下步骤:
S1:首先从训练数据中选取一个人脸,大小为Sface;
S2:然后,在所有anchorbox中,选取一个和该人脸大小最接近的一个,大小为Sanchor;
S3:然后对该anchorbox的大小在一定范围内随机,得到Srandom;
S4:最后根据Srandom/Sface对所有训练数据进行缩放。
优选的,所述得分b为三个,分别为得分b1、得分b2和得分b3,所述得分f也为三个,分别为得分f1、得分f2和得分f3。
优选的,若干所述得分b和得分f的大小为w*h,所述w和h的大小根据输入图片大小得到。
与现有技术相比,本发明的有益效果是:
1、提出一种基于自学习的max-out方法,在提高小的人脸召回率的同时,减少了虚检的产生;
2、提出一种新的数据增强方法,通过扩展训练样本分布,有效地提升了深度学习网络的训练效果;
3、一种高精度的人脸检测方法,整体人脸检测性能达到目前世界第一。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明max-out方法示意图;
图2为本发明数据增强方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
请参阅图1,本发明提供一种技术方案:一种自学习的高精度人脸检测的方法,包括max-out方法,
所述max-out方法为通过网络输出代表“不是人脸”的若干得分b和代表“是人脸”的若干得分f,若干所述得分b和得分f的大小为w*h,所述w和h的大小根据输入图片大小得到,得到多组预测值,通过多组预测值取最大值的方式,获得最优预测值,最终两个得分的预测更加准确。
比如输入图片大小为为512x512,则w和h可能为128x128,意味着存在128x128个候选区域,但是实际图片中人脸可能只有一百量级,甚至更少个人脸。所述得分b为三个,分别为得分b1、得分b2和得分b3,所述得分f也为三个,分别为得分f1、得分f2和得分f3。相对于现有两个得分预测的不准,避免会出现很多的虚检和漏检。
不是组数越多越好,经过实验测试,我们最终采用3组预测值。另外,该方法不需要增加额外的监督信号,完全通过自学习。
实施例二
请参阅图2,一种自学习的高精度人脸检测的方法,包括数据增强方法,所述数据增强方法包括以下步骤:
S1:首先从训练数据中选取一个人脸,大小为Sface;
S2:然后,在所有anchorbox中,选取一个和该人脸大小最接近的一个,大小为Sanchor;
S3:然后对该anchorbox的大小在一定范围内随机,得到Srandom;
S4:最后根据Srandom/Sface对所有训练数据进行缩放。
通过该方法,可以使训练样本的尺度分布得到很好的扩展。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (3)
1.一种自学习的高精度人脸检测的方法,其特征在于:包括max-out方法和数据增强方法,
所述max-out方法为通过网络输出代表“不是人脸”的若干得分b和代表“是人脸”的若干得分f,得到多组预测值,通过多组预测值取最大值的方式,获得最优预测值;
所述数据增强方法包括以下步骤:
S1:首先从训练数据中选取一个人脸,大小为Sface;
S2:然后,在所有anchorbox中,选取一个和该人脸大小最接近的一个,大小为Sanchor;
S3:然后对该anchorbox的大小在一定范围内随机,得到Srandom;
S4:最后根据Srandom/Sface对所有训练数据进行缩放。
2.根据权利要求1所述的一种自学习的高精度人脸检测的方法,其特征在于:所述得分b为三个,分别为得分b1、得分b2和得分b3,所述得分f也为三个,分别为得分f1、得分f2和得分f3。
3.根据权利要求1所述的一种自学习的高精度人脸检测的方法,其特征在于:若干所述得分b和得分f的大小为w*h,所述w和h的大小根据输入图片大小得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910844887.5A CN110674709A (zh) | 2019-09-07 | 2019-09-07 | 一种自学习的高精度人脸检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910844887.5A CN110674709A (zh) | 2019-09-07 | 2019-09-07 | 一种自学习的高精度人脸检测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110674709A true CN110674709A (zh) | 2020-01-10 |
Family
ID=69076658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910844887.5A Pending CN110674709A (zh) | 2019-09-07 | 2019-09-07 | 一种自学习的高精度人脸检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674709A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859190A (zh) * | 2019-01-31 | 2019-06-07 | 北京工业大学 | 一种基于深度学习的目标区域检测方法 |
-
2019
- 2019-09-07 CN CN201910844887.5A patent/CN110674709A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859190A (zh) * | 2019-01-31 | 2019-06-07 | 北京工业大学 | 一种基于深度学习的目标区域检测方法 |
Non-Patent Citations (2)
Title |
---|
XU TANG 等: "PyramidBox: A Context-Assisted Single Shot Face Detector", 《ECCV2018》 * |
王鲁许: "基于卷积神经网络的人脸检测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111127493A (zh) | 基于注意力多尺度特征融合的遥感图像语义分割方法 | |
CN101315663B (zh) | 一种基于区域潜在语义特征的自然场景图像分类方法 | |
CN109816032A (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN108376164B (zh) | 一种潜力主播的展示方法及装置 | |
CN110992238A (zh) | 一种基于双通道网络的数字图像篡改盲检测方法 | |
CN110619313B (zh) | 遥感图像判别性描述生成方法 | |
CN110287942A (zh) | 年龄估计模型的训练方法、年龄估计方法以及对应的装置 | |
CN109446333A (zh) | 一种实现中文文本分类的方法及相关设备 | |
CN108346030A (zh) | 计算机自适应能力测验方法及装置 | |
CN108509827A (zh) | 视频流中异常内容的识别方法及视频流处理系统和方法 | |
CN113435269A (zh) | 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统 | |
CN109686402B (zh) | 基于动态加权相互作用网络中关键蛋白质识别方法 | |
CN110516749A (zh) | 模型训练方法、视频处理方法、装置、介质和计算设备 | |
CN108470061A (zh) | 一种针对视角级文本的情感分类系统 | |
CN109408619B (zh) | 一种面向问答领域动态计算问句与答案相似性的方法 | |
CN109753577A (zh) | 一种搜索人脸的方法及相关装置 | |
CN113642466B (zh) | 活体检测和模型训练方法、设备及介质 | |
CN115798022A (zh) | 一种基于特征提取的人工智能识别方法 | |
CN111062209A (zh) | 自然语言处理模型训练方法和自然语言处理模型 | |
CN110674709A (zh) | 一种自学习的高精度人脸检测的方法 | |
CN110147837A (zh) | 基于特征聚焦的任意方向密集目标检测方法、系统及设备 | |
CN115809327B (zh) | 一种多模融合和话题的实时社交网络谣言检测方法 | |
CN116310386A (zh) | 基于浅层自适应增强上下文的CenterNet小目标检测方法 | |
CN116071467A (zh) | 唇形驱动模型的生成方法、装置、电子设备及存储介质 | |
CN111222327A (zh) | 一种词嵌入表示方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200110 |