CN111144313A - 一种基于多感受野动态结合的人脸检测方法及系统 - Google Patents

一种基于多感受野动态结合的人脸检测方法及系统 Download PDF

Info

Publication number
CN111144313A
CN111144313A CN201911375035.2A CN201911375035A CN111144313A CN 111144313 A CN111144313 A CN 111144313A CN 201911375035 A CN201911375035 A CN 201911375035A CN 111144313 A CN111144313 A CN 111144313A
Authority
CN
China
Prior art keywords
convolution
feature map
characteristic diagram
receptive
face detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911375035.2A
Other languages
English (en)
Inventor
范馨予
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Qizhi (qingdao) Technology Co Ltd
Original Assignee
Innovation Qizhi (qingdao) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Qizhi (qingdao) Technology Co Ltd filed Critical Innovation Qizhi (qingdao) Technology Co Ltd
Priority to CN201911375035.2A priority Critical patent/CN111144313A/zh
Publication of CN111144313A publication Critical patent/CN111144313A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种基于多感受野动态结合的人脸检测方法及系统,涉及人脸检测技术领域,包括:将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图;采用注意力机制更新第四特征图的权重,并根据经权重更新后的第四特征图进行人脸检测。本发明有效提升人脸检测的准确率。

Description

一种基于多感受野动态结合的人脸检测方法及系统
技术领域
本发明涉及人脸检测技术领域,具体涉及一种基于多感受野动态结合的人脸检测方法及系统。
背景技术
人脸检测技术作为人脸识别、性别识别、表情识别等任务的基础,在过去几十年得到了广泛关注以及长足发展。随着计算机硬件性能在近几年得到巨大提升,使得卷积神经网络在人脸检测方面的应用更深入,并对人脸的检测性能有了进一步提高。
现有技术应用卷积神经网络进行人脸检测,在利用多层卷积层特征的时候,仅仅考虑了人脸本身的特征,而忽略了人脸周围的背景(context)信息。
发明内容
本发明的目的在于提供一种基于多感受野动态结合的人脸检测方法及系统。
为达此目的,本发明采用以下技术方案:
提供一种基于多感受野动态结合的人脸检测方法,具体包括:
步骤S1,将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
步骤S2,采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
步骤S3,采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
步骤S4,采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
步骤S5,将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图;
步骤S6,采用注意力机制更新所述第四特征图的权重,并根据经权重更新后的所述第四特征图进行人脸检测。
作为本发明的一种优选方案,所述第一空洞卷积的卷积核为3*3,且所述第一预设次数为1。
作为本发明的一种优选方案,所述第二空洞卷积的卷积核为3*3,且所述第二预设次数为2。
作为本发明的一种优选方案,所述第三空洞卷积的卷积核为3*3,且所述第三预设次数为3。
作为本发明的一种优选方案,所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。
一种基于多感受野动态结合的人脸检测系统,应用以上任意一项所述的基于多感受野动态结合的人脸检测方法,所述基于多感受野动态结合的人脸检测系统具体包括:
特征提取模块,用于将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
第一卷积模块,连接所述特征提取模块,用于采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
第二卷积模块,连接所述特征提取模块,采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
第三卷积模块,连接所述特征提取模块,采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
数据叠加模块,分别连接所述第一卷积模块、所述第二卷积模块和所述第三卷积模块,用于将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图;
权重更新模块,连接所述数据叠加模块,用于采用注意力机制更新所述第四特征图的权重,并根据经权重更新后的所述第四特征图进行人脸检测。
作为本发明的一种优选方案,所述第一空洞卷积的卷积核为3*3,且所述第一预设次数为1。
作为本发明的一种优选方案,所述第二空洞卷积的卷积核为3*3,且所述第二预设次数为2。
作为本发明的一种优选方案,所述第三空洞卷积的卷积核为3*3,且所述第三预设次数为3。
作为本发明的一种优选方案,所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。
本发明的有益效果:
1)结合不同的感受野,引入了人脸周围的背景信息;
2)引入注意机制,去动态结合不同感受野之间的信息;
3)利用动态结合之后的感受野之间的信息去进行人脸检测,有效提升人脸检测的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例所述的一种基于多感受野动态结合的人脸检测方法的流程示意图。
图2是本发明一实施例所述的一种基于多感受野动态结合的人脸检测方法的原理示意图。
图3是本发明一实施例所述的一种基于多感受野动态结合的人脸检测系统的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
基于现有技术中存在的技术问题,本发明提供一种基于多感受野动态结合的人脸检测方法,如图1所示,具体包括:
步骤S1,将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
步骤S2,采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
步骤S3,采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
步骤S4,采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
步骤S5,将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图;
步骤S6,采用注意力机制更新第四特征图的权重,并根据经权重更新后的第四特征图进行人脸检测。
具体地,本实施例中,本发明通过引入不同的感受野,引入大量的背景信息,并通过引入动态注意机制去动态融合背景信息,有效提升人脸检测的准确率。
进一步地,如图2所示,将处理得到的初始特征图分别做一次,两次,三次3x3卷积之后得到不同的感受野,叠加到一起,得到一个新的特征图,引入注意力机制提取特征信息,经过多次实验证明,这种多感受野的结合方式在人脸检测项目中达到的效果最优。
作为本发明的一种优选方案,第一空洞卷积的卷积核为3*3,且第一预设次数为1。
作为本发明的一种优选方案,第二空洞卷积的卷积核为3*3,且第二预设次数为2。
作为本发明的一种优选方案,第三空洞卷积的卷积核为3*3,且第三预设次数为3。
作为本发明的一种优选方案,神经网络模型采用S3FD算法对待检测图像进行特征提取。
一种基于多感受野动态结合的人脸检测系统,应用以上任意一项的基于多感受野动态结合的人脸检测方法,如图3所示,基于多感受野动态结合的人脸检测系统具体包括:
特征提取模块1,用于将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
第一卷积模块2,连接特征提取模块1,用于采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
第二卷积模块3,连接特征提取模块1,采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
第三卷积模块4,连接特征提取模块1,采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
数据叠加模块5,分别连接第一卷积模块2、第二卷积模块3和第三卷积模块4,用于将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图;
权重更新模块6,连接数据叠加模块5,用于采用注意力机制更新第四特征图的权重,并根据经权重更新后的第四特征图进行人脸检测。
作为本发明的一种优选方案,第一空洞卷积的卷积核为3*3,且第一预设次数为1。
作为本发明的一种优选方案,第二空洞卷积的卷积核为3*3,且第二预设次数为2。
作为本发明的一种优选方案,第三空洞卷积的卷积核为3*3,且第三预设次数为3。
作为本发明的一种优选方案,神经网络模型采用S3FD算法对待检测图像进行特征提取。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (10)

1.一种基于多感受野动态结合的人脸检测方法,其特征在于,具体包括:
步骤S1,将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
步骤S2,采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
步骤S3,采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
步骤S4,采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
步骤S5,将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图;
步骤S6,采用注意力机制更新所述第四特征图的权重,并根据经权重更新后的所述第四特征图进行人脸检测。
2.根据权利要求1所述的基于多感受野动态结合的人脸检测方法,其特征在于,所述第一空洞卷积的卷积核为3*3,且所述第一预设次数为1。
3.根据权利要求1所述的基于多感受野动态结合的人脸检测方法,其特征在于,所述第二空洞卷积的卷积核为3*3,且所述第二预设次数为2。
4.根据权利要求1所述的基于多感受野动态结合的人脸检测方法,其特征在于,所述第三空洞卷积的卷积核为3*3,且所述第三预设次数为3。
5.根据权利要求1所述的基于多感受野动态结合的人脸检测方法,其特征在于,所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。
6.一种基于多感受野动态结合的人脸检测系统,其特征在于,应用如权利要求1-5中任意一项所述的基于多感受野动态结合的人脸检测方法,所述基于多感受野动态结合的人脸检测系统具体包括:
特征提取模块,用于将待检测图像输入预先生成的神经网络模型中进行特征提取,得到相应的初始特征图;
第一卷积模块,连接所述特征提取模块,用于采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作,得到具有第一感受野的第一特征图;
第二卷积模块,连接所述特征提取模块,采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作,得到具有第二感受野的第二特征图;
第三卷积模块,连接所述特征提取模块,采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作,得到具有第三感受野的第三特征图;
数据叠加模块,分别连接所述第一卷积模块、所述第二卷积模块和所述第三卷积模块,用于将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图;
权重更新模块,连接所述数据叠加模块,用于采用注意力机制更新所述第四特征图的权重,并根据经权重更新后的所述第四特征图进行人脸检测。
7.根据权利要求6所述的基于多感受野动态结合的人脸检测系统,其特征在于,所述第一空洞卷积的卷积核为3*3,且所述第一预设次数为1。
8.根据权利要求6所述的基于多感受野动态结合的人脸检测系统,其特征在于,所述第二空洞卷积的卷积核为3*3,且所述第二预设次数为2。
9.根据权利要求6所述的基于多感受野动态结合的人脸检测系统,其特征在于,所述第三空洞卷积的卷积核为3*3,且所述第三预设次数为3。
10.根据权利要求6所述的基于多感受野动态结合的人脸检测系统,其特征在于,所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。
CN201911375035.2A 2019-12-27 2019-12-27 一种基于多感受野动态结合的人脸检测方法及系统 Withdrawn CN111144313A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911375035.2A CN111144313A (zh) 2019-12-27 2019-12-27 一种基于多感受野动态结合的人脸检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911375035.2A CN111144313A (zh) 2019-12-27 2019-12-27 一种基于多感受野动态结合的人脸检测方法及系统

Publications (1)

Publication Number Publication Date
CN111144313A true CN111144313A (zh) 2020-05-12

Family

ID=70520920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911375035.2A Withdrawn CN111144313A (zh) 2019-12-27 2019-12-27 一种基于多感受野动态结合的人脸检测方法及系统

Country Status (1)

Country Link
CN (1) CN111144313A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229267A (zh) * 2016-12-29 2018-06-29 北京市商汤科技开发有限公司 对象属性检测、神经网络训练、区域检测方法和装置
CN109241835A (zh) * 2018-07-27 2019-01-18 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质
CN109447053A (zh) * 2019-01-09 2019-03-08 江苏星云网格信息技术有限公司 一种基于双重限制注意力神经网络模型的人脸识别方法
CN109919013A (zh) * 2019-01-28 2019-06-21 浙江英索人工智能科技有限公司 视频图像中基于深度学习的人脸检测方法及装置
CN110163080A (zh) * 2019-04-02 2019-08-23 腾讯科技(深圳)有限公司 人脸关键点检测方法及装置、存储介质和电子设备
CN110348411A (zh) * 2019-07-16 2019-10-18 腾讯科技(深圳)有限公司 一种图像处理方法、装置和设备
CN110414305A (zh) * 2019-04-23 2019-11-05 苏州闪驰数控系统集成有限公司 人工智能卷积神经网络人脸识别系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229267A (zh) * 2016-12-29 2018-06-29 北京市商汤科技开发有限公司 对象属性检测、神经网络训练、区域检测方法和装置
CN109241835A (zh) * 2018-07-27 2019-01-18 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质
CN109447053A (zh) * 2019-01-09 2019-03-08 江苏星云网格信息技术有限公司 一种基于双重限制注意力神经网络模型的人脸识别方法
CN109919013A (zh) * 2019-01-28 2019-06-21 浙江英索人工智能科技有限公司 视频图像中基于深度学习的人脸检测方法及装置
CN110163080A (zh) * 2019-04-02 2019-08-23 腾讯科技(深圳)有限公司 人脸关键点检测方法及装置、存储介质和电子设备
US20210248355A1 (en) * 2019-04-02 2021-08-12 Tencent Technology (Shenzhen) Company Limited Face key point detection method and apparatus, storage medium, and electronic device
CN110414305A (zh) * 2019-04-23 2019-11-05 苏州闪驰数控系统集成有限公司 人工智能卷积神经网络人脸识别系统
CN110348411A (zh) * 2019-07-16 2019-10-18 腾讯科技(深圳)有限公司 一种图像处理方法、装置和设备

Similar Documents

Publication Publication Date Title
TWI704527B (zh) 車輛損傷識別的處理方法、處理裝置、處理設備、客戶端裝置及處理系統
CN110610453B (zh) 一种图像处理方法、装置及计算机可读存储介质
CN108364023A (zh) 基于注意力模型的图像识别方法和系统
CN105849747B (zh) 用于人脸图像识别的方法和系统
CN108229293A (zh) 人脸图像处理方法、装置和电子设备
CN111480169B (zh) 用于模式识别的方法、系统和装置
JP6815707B2 (ja) 顔姿勢検出方法、装置及び記憶媒体
KR102120023B1 (ko) 이미지 생성 방법 및 디바이스
CN105631466B (zh) 图像分类的方法及装置
JP7475772B2 (ja) 画像生成方法、画像生成装置、コンピュータ機器、及びコンピュータプログラム
CN114402369A (zh) 人体姿态的识别方法、装置、存储介质及电子设备
CN109934080A (zh) 脸部表情辨识的方法及装置
CN110738141A (zh) 一种静脉识别的方法、装置、设备及存储介质
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
US20210097377A1 (en) Method and apparatus for image recognition
CN108229313A (zh) 人脸识别方法和装置、电子设备和计算机程序及存储介质
CN108885683B (zh) 用于位姿估计的方法和系统
Manjunatha et al. Deep learning-based technique for image tamper detection
CN110121719A (zh) 用于深度学习的装置、方法和计算机程序产品
Kagirov et al. Method for multimodal recognition of one-handed sign language gestures through 3D convolution and LSTM neural networks
Li et al. Two-person graph convolutional network for skeleton-based human interaction recognition
Li et al. An efficient SMD-PCBA detection based on YOLOv7 network model
CN111144313A (zh) 一种基于多感受野动态结合的人脸检测方法及系统
Su et al. Conditional progressive network for clothing parsing
CN111144310A (zh) 一种基于多层信息融合的人脸检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200512

WW01 Invention patent application withdrawn after publication