CN111241891B - 一种人脸图像切图方法、装置及计算机可读存储介质 - Google Patents
一种人脸图像切图方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111241891B CN111241891B CN201811447377.6A CN201811447377A CN111241891B CN 111241891 B CN111241891 B CN 111241891B CN 201811447377 A CN201811447377 A CN 201811447377A CN 111241891 B CN111241891 B CN 111241891B
- Authority
- CN
- China
- Prior art keywords
- face
- face image
- image
- cutting
- search space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000009466 transformation Effects 0.000 claims abstract description 65
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 27
- 238000006073 displacement reaction Methods 0.000 claims description 22
- 230000004807 localization Effects 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 10
- 230000001815 facial effect Effects 0.000 claims description 6
- 238000003709 image segmentation Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种人脸图像切图方法、装置及计算机可读存储介质,通过设置切图个数,根据切图个数利用预先训练的区域搜索空间变换网络模型对人脸图像进行处理得到人脸切图。本发明通过预先训练好的区域搜索空间变换网络模型对人脸图像进行切图处理,对于不同的人脸图像区域搜索空间变换网络模型会采用不同的切图方式,因此本发明提供切图方法自适应能力强,更有助于提升复杂多变场景下的后续人脸识别准确度,而且不需手工切图,省时省力。
Description
技术领域
本发明实施例涉及图像处理技术领域,具体涉及一种人脸图像切图方法、装置及计算机可读存储介质。
背景技术
深度神经网络的多模型集成方法广泛应用于很多计算机视觉任务,由于不同网络可以有效地从原始图像中提取互补的信息,因此多模型集成可以带来明显的性能提升。
在深度学习时期,最具代表性的DeepID2人脸识别框架为了有效利用人脸不同区域(如眼睛,鼻子)中互补的表观信息,手工定义了200种不同的人脸切图方式,并使用这些不同的切图分别训练了200个CNN模型用于捕获不同人脸区域的信息。最终的人脸识别系统采用贪心的策略选取出最好的25个模型来进行最终的特征融合并带来了大幅的性能提升。
然而,这种人脸识别问题中通用的模型集成方法采用手工的方式选取人脸切图,需要耗费大量的计算复杂度训练上百个模型贪心选取最好的切图组合,费时费力。
发明内容
为了解决现有人脸切图技术费事费力的问题,本发明实施例提供了一种人脸图像切图方法,包括:
设置人脸切图的个数;
将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图。
可选的,所述区域搜索空间变换网络模型包括:本地化网络、网格生成器和采样器;
将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图,包括:
所述本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
所述网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
所述采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
可选的,所述仿射变换参数值包括人脸切图的尺度值、人脸切图在所述人脸图像x轴上的位移值和人脸切图在所述人脸图像y轴上的位移值。
可选的,所述网格生成器根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,/>表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,/>表示人脸切图中第i个像素的y轴坐标。
可选的,将人脸图像输入所述区域搜索空间变换网络模型之前,还包括:
对所述人脸图像进行人脸检测;
对检测到的人脸进行人脸对齐。
第二方面,本发明实施例提供一种人脸图像切图装置,包括:
设置模块,用于设置人脸切图的个数;
输入模块,用于将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
切图生成模块,用于将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图。
可选的,所述切图生成模块包括:
本地化网络单元,用于采用本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
网格生成单元,用于采用网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
采样器单元,用于采用采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
可选的,所述网格生成器单元根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,/>表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,/>表示人脸切图中第i个像素的y轴坐标。
可选的,所述人脸图像切图装置还包括:
人脸检测模块,用于对所述人脸图像进行人脸检测;
人脸对齐模块,用于对检测到的人脸进行人脸对齐。
第三方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使计算机执行第一方面所述人脸图像切图方法的步骤。
相比现有技术,本发明实施例提出的一种人脸图像切图方法,通过设置切图个数,根据切图个数利用预先训练的区域搜索空间变换网络模型对人脸图像进行处理得到人脸切图。本发明通过预先训练好的区域搜索空间变换网络模型对人脸图像进行切图处理,对于不同的人脸图像区域搜索空间变换网络模型会采用不同的切图方式,因此本发明提供切图方法自适应能力强,更有助于提升复杂多变场景下的后续人脸识别准确度,而且不需手工切图,省时省力。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人脸图像切图方法流程图。
图2为本发明实施例提供的一种人脸图像切图装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种人脸图像切图方法流程图,如图1所示,所述方法包括:
S1.设置人脸切图的个数;
具体的个数根据具体情况自行设定。
S2.将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
S3.将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图。
具体的,在本申请实施例中,所述区域搜索空间变换网络模型包括:本地化网络、网格生成器和采样器;
具体的,所述区域搜索空间变化网络模型的具体结构如下表所示:
层 | 步长 | 卷积核大小 | 通道数 |
卷积层 | 1 | 5x5 | 16 |
最大池化层 | 2 | 2x2 | 16 |
卷积层 | 1 | 3x3 | 24 |
最大池化层 | 2 | 2x2 | 24 |
卷积层 | 1 | 3x3 | 32 |
最大池化层 | 2 | 2x2 | 32 |
卷积层 | 1 | 3x3 | 40 |
全连接层 | - | - | 3N |
具体的,在本申请实施例中,将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图,包括:
所述本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
所述网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
所述采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
具体的,在本申请实施例中,所述仿射变换参数值包括人脸切图的尺度值、人脸切图在所述人脸图像的x轴上的位移值和人脸切图在所述人脸图像y轴上的位移值。
所述人脸切图的尺度值表示人脸切图的切图区域对应输入的人脸图像的比例大小,例如,切图区域的长宽均为人脸图像的一半,则尺度值为0.25。
具体的,在本申请实施例中,所述网格生成器根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,/>表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,/>表示人脸切图中第i个像素的y轴坐标。
具体的,在本申请实施例中,区域搜索空间变换网络模型在训练时用感兴趣区域分离损失函数监督区域搜索空间变换网络预测出的每个仿射变换参数。感兴趣区域分离损失函数可在每个人脸切图具有判别力的前提下,使得切图组合中两两切图间的交并比尽可能小。
具体的,所述感兴趣区域分离损失函数如下所示:
式中,Lroi表示感兴趣区域分离损失函数,N表示生成的人脸切图个数,θi表示第i个人脸切图的仿射变换参数,θj表示第j个人脸切图的仿射变换参数,σ表示超参数。
具体的,在本申请实施例中,将人脸图像输入所述区域搜索空间变换网络模型之前,还包括:
对所述人脸图像进行人脸检测;
对检测到的人脸进行人脸对齐。
本发明实施例提供的一种人脸图像切图方法,通过设置切图个数,根据切图个数利用预先训练的区域搜索空间变换网络模型对人脸图像进行处理得到人脸切图。本发明通过预先训练好的区域搜索空间变换网络模型对人脸图像进行切图处理,对于不同的人脸图像区域搜索空间变换网络模型会采用不同的切图方式,因此本发明提供切图方法自适应能力强,更有助于提升复杂多变场景下的后续人脸识别准确度,而且不需手工切图,省时省力。
一个具体的例子:
对某一人脸图像进行切图处理,包括:
对所述人脸图像进行人脸检测和人脸对齐,得到对齐后包含完整人脸的人脸图像;
设定切图个数N;
将所述个数N输入预先训练好的区域搜索空间变换网络模型;
将对齐后的人脸图像输入区域搜索空间变换网络模型;
所述区域搜索空间变换网络模型的本地化网络为6层CNN结构,输出维度为3N,即本地化网络输出3N个预测值,所述3N个预测值分别对应着每张切图的三个仿射变换参数,所述三个仿射变换参数值分别为:人脸切图的尺度值、人脸切图在所述人脸图像的x轴上的位移值和人脸切图在所述人脸图像y轴上的位移值。
所述区域搜索空间变换网络模型的网格生成器根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,/>表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,/>表示人脸切图中第i个像素的y轴坐标;
所述区域搜索空间变换网络模型的采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中,从而得到人脸切图。
基于与本发明人脸图像切图方法相同的发明构思,本发明实施例还提供一种人脸图像切图装置,如图2所示,所述人脸图像切图装置,可以包括:
设置模块,用于设置人脸切图的个数;
输入模块,用于将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
切图生成模块,用于将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图。
具体的,所述切图生成模块可以包括:
本地化网络单元,用于采用本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
网格生成单元,用于采用网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
采样器单元,用于采用采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
具体的,在本申请实施例中,所述网格生成器单元根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,/>表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,/>表示人脸切图中第i个像素的y轴坐标。
具体的,在本申请实施例中,所述人脸图像切图装置还可以包括:
人脸检测模块,用于对所述人脸图像进行人脸检测;
人脸对齐模块,用于对检测到的人脸进行人脸对齐。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明各个实施例所述的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法或者实施例的某些部分所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种人脸图像切图方法,其特征在于,包括:
设置人脸切图的个数;
将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图;其中,所述区域搜索空间变换网络模型包括:本地化网络、网格生成器和采样器;
所述本地化网络和所述网格生成器用于确定所述人脸切图中的每个位置对应所述人脸图像中的坐标位置;
所述采样器用于根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,并将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
2.根据权利要求1所述的人脸图像切图方法,其特征在于,所述区域搜索空间变换网络模型包括:本地化网络、网格生成器和采样器;
将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图,包括:
所述本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
所述网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
所述采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
3.根据权利要求2所述的人脸图像切图方法,其特征在于,所述仿射变换参数值包括人脸切图的尺度值、人脸切图在所述人脸图像x轴上的位移值和人脸切图在所述人脸图像y轴上的位移值。
4.根据权利要求2所述的人脸图像切图方法,其特征在于,所述网格生成器根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,表示人脸切图中第i个像素的y轴坐标。
5.根据权利要求1所述的人脸图像切图方法,其特征在于,将人脸图像输入所述区域搜索空间变换网络模型之前,还包括:
对所述人脸图像进行人脸检测;
对检测到的人脸进行人脸对齐。
6.一种人脸图像切图装置,其特征在于,包括:
设置模块,用于设置人脸切图的个数;
输入模块,用于将所述人脸切图的个数输入预先训练的区域搜索空间变换网络模型;
切图生成模块,用于将人脸图像输入所述区域搜索空间变换网络模型,得到所述人脸图像的人脸切图;其中,所述区域搜索空间变换网络模型包括:本地化网络、网格生成器和采样器;
所述本地化网络和所述网格生成器用于确定所述人脸切图中的每个位置对应所述人脸图像中的坐标位置;
所述采样器用于根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,并将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
7.根据权利要求6所述的人脸图像切图装置,其特征在于,所述切图生成模块包括:
本地化网络单元,用于采用本地化网络将输入的人脸图像进行6个卷积操作,然后全连接回归出3N个仿射变换参数,其中N为人脸切图的个数;
网格生成单元,用于采用网格生成器根据所述仿射变换参数计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置;
采样器单元,用于采用采样器根据与所述人脸切图中每个位置对应的所述人脸图像中的坐标位置,在所述人脸图像中进行采样,将所述人脸图像中与所述坐标位置对应的像素复制到所述人脸切图中。
8.根据权利要求7所述的人脸图像切图装置,其特征在于,所述网格生成器单元根据所述仿射变换参数按下式计算出人脸切图中的每个位置对应所述人脸图像中的坐标位置:
式中,s表示人脸切图的尺度值,tx表示人脸切图在所述人脸图像x轴上的位移值,ty表示人脸切图在所述人脸图像y轴上的位移值,表示所述人脸图像中第i个像素的y轴坐标,表示所述人脸图像中第i个像素的第x轴坐标,/>表示人脸切图中第i个像素的x轴坐标,表示人脸切图中第i个像素的y轴坐标。
9.根据权利要求6所述的人脸图像切图装置,其特征在于,所述人脸图像切图装置还包括:
人脸检测模块,用于对所述人脸图像进行人脸检测;
人脸对齐模块,用于对检测到的人脸进行人脸对齐。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使计算机执行权利要求1-5任一项所述人脸图像切图方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811447377.6A CN111241891B (zh) | 2018-11-29 | 2018-11-29 | 一种人脸图像切图方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811447377.6A CN111241891B (zh) | 2018-11-29 | 2018-11-29 | 一种人脸图像切图方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111241891A CN111241891A (zh) | 2020-06-05 |
CN111241891B true CN111241891B (zh) | 2024-04-30 |
Family
ID=70872530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811447377.6A Active CN111241891B (zh) | 2018-11-29 | 2018-11-29 | 一种人脸图像切图方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241891B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111862987B (zh) | 2020-07-20 | 2021-12-28 | 北京百度网讯科技有限公司 | 语音识别方法和装置 |
CN112541454A (zh) * | 2020-12-21 | 2021-03-23 | 的卢技术有限公司 | 一种用于视线估计的卷积神经网络设计方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739712A (zh) * | 2010-01-25 | 2010-06-16 | 四川大学 | 基于视频的3d人脸表情动画驱动方法 |
JP2011059940A (ja) * | 2009-09-09 | 2011-03-24 | Canon Inc | 顔画像抽出装置、顔画像抽出装置の制御方法、及び制御プログラム |
CN105739963A (zh) * | 2014-12-12 | 2016-07-06 | 博雅网络游戏开发(深圳)有限公司 | 生成网页的方法和装置 |
CN106156749A (zh) * | 2016-07-25 | 2016-11-23 | 福建星网锐捷安防科技有限公司 | 基于选择性搜索的人脸检测方法及装置 |
CN107958444A (zh) * | 2017-12-28 | 2018-04-24 | 江西高创保安服务技术有限公司 | 一种基于深度学习的人脸超分辨率重建方法 |
CN108256479A (zh) * | 2018-01-17 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 人脸跟踪方法和装置 |
CN108460649A (zh) * | 2017-02-22 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种图像识别方法及装置 |
CN108509881A (zh) * | 2018-03-22 | 2018-09-07 | 五邑大学 | 一种无切分的脱机手写汉字文本识别方法 |
-
2018
- 2018-11-29 CN CN201811447377.6A patent/CN111241891B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011059940A (ja) * | 2009-09-09 | 2011-03-24 | Canon Inc | 顔画像抽出装置、顔画像抽出装置の制御方法、及び制御プログラム |
CN101739712A (zh) * | 2010-01-25 | 2010-06-16 | 四川大学 | 基于视频的3d人脸表情动画驱动方法 |
CN105739963A (zh) * | 2014-12-12 | 2016-07-06 | 博雅网络游戏开发(深圳)有限公司 | 生成网页的方法和装置 |
CN106156749A (zh) * | 2016-07-25 | 2016-11-23 | 福建星网锐捷安防科技有限公司 | 基于选择性搜索的人脸检测方法及装置 |
CN108460649A (zh) * | 2017-02-22 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种图像识别方法及装置 |
CN107958444A (zh) * | 2017-12-28 | 2018-04-24 | 江西高创保安服务技术有限公司 | 一种基于深度学习的人脸超分辨率重建方法 |
CN108256479A (zh) * | 2018-01-17 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 人脸跟踪方法和装置 |
CN108509881A (zh) * | 2018-03-22 | 2018-09-07 | 五邑大学 | 一种无切分的脱机手写汉字文本识别方法 |
Non-Patent Citations (1)
Title |
---|
吴素雯 ; 战荫伟 ; .基于选择性搜索和卷积神经网络的人脸检测.计算机应用研究.2017,第34卷(第09期),第2854-2857、2876页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111241891A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009543B (zh) | 一种车牌识别方法及装置 | |
CN111126399B (zh) | 一种图像检测方法、装置、设备及可读存储介质 | |
CN109035292B (zh) | 基于深度学习的运动目标检测方法及装置 | |
CN107992819B (zh) | 一种车辆属性结构化特征的确定方法与装置 | |
CN108305260B (zh) | 一种图像中角点的检测方法、装置及设备 | |
CN109858327B (zh) | 一种基于深度学习的字符分割方法 | |
CN113657409A (zh) | 车辆损失检测方法、装置、电子设备及存储介质 | |
CN111814905A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN112381061B (zh) | 一种面部表情识别方法及系统 | |
CN111241891B (zh) | 一种人脸图像切图方法、装置及计算机可读存储介质 | |
CN111091023A (zh) | 一种车辆检测方法、装置及电子设备 | |
CN111080615A (zh) | 基于卷积神经网络的pcb缺陷检测系统及检测方法 | |
CN112288727A (zh) | 磁环表面缺陷检测方法、装置、电子设备及存储介质 | |
CN112396036A (zh) | 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法 | |
CN111626241A (zh) | 一种人脸检测方法及装置 | |
CN115424017A (zh) | 一种建筑物内外轮廓分割方法、装置及存储介质 | |
CN112991159B (zh) | 人脸光照质量评估方法、系统、服务器与计算机可读介质 | |
CN114842035A (zh) | 基于深度学习的车牌脱敏方法、装置、设备及存储介质 | |
CN113177941B (zh) | 一种钢卷边裂识别方法、系统、介质和终端 | |
CN109726754A (zh) | 一种lcd屏缺陷识别方法及装置 | |
CN113537017A (zh) | 基于级联型回归修正的光学遥感图像飞机检测方法和装置 | |
CN112001336A (zh) | 行人越界报警方法、装置、设备及系统 | |
CN111179287A (zh) | 人像实例分割方法、装置、设备及存储介质 | |
CN116129114A (zh) | 图像处理方法、装置及电子设备 | |
CN113781512A (zh) | 图像边界识别方法、装置、设备、系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |