CN117218231A - 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 - Google Patents
一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117218231A CN117218231A CN202311189850.6A CN202311189850A CN117218231A CN 117218231 A CN117218231 A CN 117218231A CN 202311189850 A CN202311189850 A CN 202311189850A CN 117218231 A CN117218231 A CN 117218231A
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- face
- model
- key points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000010586 diagram Methods 0.000 claims abstract description 62
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims abstract description 23
- 210000001508 eye Anatomy 0.000 claims description 69
- 238000001559 infrared map Methods 0.000 claims description 64
- 210000001331 nose Anatomy 0.000 claims description 28
- 210000000214 mouth Anatomy 0.000 claims description 27
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 210000000887 face Anatomy 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008485 antagonism Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004399 eye closure Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
一种区块式生成人脸IR图模型的训练方法,包括:S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;S2:根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域;S3:所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;S4:根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;S5:对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;S6:对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值。本发明可以根据人脸RGB图生成人脸IR图。
Description
技术领域
本发明涉及人脸识别技术领域,具体地,涉及一种区块式生成人脸IR图模型的训练方法、系统、设备及介质。
背景技术
在人脸识别技术领域,利用尝试学习算法对人脸进行识别成为主流。而利用深度相机同时获得的RGB图像和IR图像同时进行人脸识别,则可以获得更好的识别结果。但是具有相匹配的RGB图像与IR图像的数量是非常少的,并且采集RGB图像及IR图像的成本较高,耗时较长,不具有经济性。
现有的数据库中通常具有大量的人脸RGB图像,但缺乏相应的IR图像,因此通过人脸的RGB图像获得人脸的IR图像成为一种高效的解决方案。同时,由于人脸的高维信息的特征,传统的将RGB图像直接转换为IR图像的方案难以获得现实可行的效果。
某发明公开了一种人脸图像的生成方法和装置,方法包括:获取真实人脸的RGB三通道彩色图像,并根据其生成人脸位置矩形框和人脸关键点坐标;根据两者获取3DMM人脸模型的PCA相貌参数、PCA表情参数以及三维人脸投影到RGB三通道彩色图像的仿射变换矩阵,以重建人脸三维模型;根据RGB三通道彩色图像和重建的人脸三维模型,生成三维重建所得人脸三维点阵中各采样点对应的颜色信息;基于颜色信息、PCA相貌参数、PCA表情参数、光线材质和人脸角度信息,生成四通道RGBA人脸图像和人脸定位点坐标;根据预先采集的标记有人脸位置的一般场景图片和四通道RGBA人脸图像,生成人脸图像。该现有技术可以获得RGB图像对应的IR图像,但是生成的图像过于单一,当使用相应的RGB图像和IR图像训练人脸识别算法时,容错率低,并且没有考虑RGB摄像头与IR摄像头的差异,容易导致实际效果较差。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为此,本发明利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
第一方面,本发明提供一种区块式生成人脸IR图模型的训练方法,其特征在于,包括如下步骤:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
步骤S2:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比;
步骤S3:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;
步骤S4:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
步骤S5:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
步骤S6:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S2包括:
步骤S21:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点;
步骤S22:根据所述人脸关键点获得左眼、右眼、鼻子和嘴巴的范围及所述范围分别对应的所述人脸关键点数量;
步骤S23:根据所述范围对应的所述人脸关键点数量及所述人脸朝向,计算所述人脸朝向镜头时的区域;其中,所述区域面积大小与所述范围对应的所述人脸关键点数量成正比;
步骤S24:根据所述人脸朝向镜头时的区域确定所述样本RGB图和所述样本IR图中的区域。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,还包括:
步骤S25:对左眼、右眼、鼻子和嘴巴对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将对应的所述人脸关键点舍弃;
步骤S26:获得剩余的所述人脸关键点的坐标。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S4包括:
步骤S41:基于IR图判别模型,对每一个所述区域进行判别,得到每个所述区域为真实图像的概率;
步骤S42:根据所述区域的权重值,计算所述目标样本IR图为真实图像的概率;
步骤S43:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,所述区域的权重值由所述人脸关键点的数量及面积共同确定。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S6包括:
步骤S61:根据所述样本IR图、所述目标样本IR图及所述区域为真实图像的概率对所述IR图判别模型进行训练;
步骤S62:基于第二损失函数进行损失计算,得到第二损失值。
可选地,所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S1中还对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差。
第二方面,本发明提供一种区块式生成人脸IR图模型的训练系统,用于实现上述任一项所述的区块式生成人脸IR图模型的训练方法,其特征在于,包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
识别模块,用于识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
第三方面,本发明提供一种区块式生成人脸IR图模型的训练设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述区块式生成人脸IR图模型的训练方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现前述任意一项所述区块式生成人脸IR图模型的训练方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
本发明利用对抗性生成网络生成人脸的IR图,具有更大的自由度,相比于单一的从人脸RGB图生成人脸IR图,能够产生更多的人脸IR图,从而更好地模拟不同IR摄像头硬件差异。
本发明利用样本RGB图和人脸特征进行监督学习,可以在生成目标样本IR图是保持人脸特征信息不变,能够更好地应用于人脸识别模型,并且具有更快的收敛速度,更短的训练时长。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中一种区块式生成人脸IR图模型的训练方法的步骤流程图;
图2为本发明实施例中一种人脸区域划分示意图;
图3为本发明实施例中一种对人脸进行划分的步骤流程图;
图4为本发明实施例中另一种对人脸进行划分的步骤流程图;
图5为本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤流程图;
图6为本发明实施例中一种得到第二损失值的步骤流程图;
图7为本发明实施例中一种区块式生成人脸IR图模型的训练系统的结构示意图;
图8为本发明实施例中一种区块式生成人脸IR图模型的训练设备的结构示意图;以及
图9为本发明实施例中计算机可读存储介质的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供的一种区块式生成人脸IR图模型的训练方法,旨在解决现有技术中存在的问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
本发明利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
图1为本发明实施例中一种区块式生成人脸IR图模型的训练方法的步骤流程图。如图1所示,本发明实施例中一种区块式生成人脸IR图模型的训练方法的步骤包括:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图。
在本步骤中,样本RGB图和样本IR图既可以是视角相同的两张图,也可以是视角不同的两张图。在部分深度相机中,获得的IR图与RGB图具有相同的视角,而在另外的深度相机中,获得的IR图与RGB图则具有不同的视角。本步骤中的样本RGB图和样本IR图只要是同一时刻拍摄获得的同一目标对象的图像即可,其视角既可以相同,又可以不同。样本RGB图与样本IR图是对应的,可以匹配的。
在部分实施例中,还对所述样本RGB图、所述样本IR图和所述目标样本IR图进行背景替换,以消除背景的过拟合。在训练样本图像中,常常因为采集环境的原因,导致背景较为单一,这容易导致模型对于背景过拟合,从而对于背景更换过于敏感。本实施例在进行背景替换时,对样本RGB图和样本IR图同步进行替换,并且替换的背景均是对应的,一个是RGB图下的背景,一个是IR图下的背景,从而使得目标样本IR图中的背景也可以相应地更新。
在部分实施例中,还对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差。在进行随机裁剪时,保持人脸特征的完整性,并且将人脸在图像中位置的偏移限定在预设范围内,比如,人脸位置偏移不超过100像素时,则在100个像素内对样本IR图进行随机裁剪,得到新的样本IR图。需要说明的时,本步骤中随机裁剪的对象是步骤S1中获得的最初的样本IR图,以保证图像的稳定性。预设范围的选取以深度相机的常见参数为参考,通常预设范围在50像素、100像素、150像素、200像素中选取,当然也可以是其他任意数值。本实施例可以更好地模拟IR镜头与RGB镜头获得的IR图与RGB图之前的差异,使得模型最终生成的IR图能够与深度相机实际拍摄到的IR图与RGB图具有更好的一致性。
步骤S2:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比。
在本步骤中,当人脸朝向镜头时,人脸一般呈左右对称型。当人脸不朝向镜头时,可能由于角度的问题,使得识别出的人脸关键点少于人脸朝向镜头时。比如人脸与镜头呈现较大的夹角时,鼻子可能会遮挡左眼或右眼,左眼也可能遮挡右眼。如图2所示,当人脸朝向镜头时,可以很容易地按照人脸关键点数量将人脸划分为四个区域,从而获得四个区域的边界。再将边界投射至样本RGB图和样本IR图,得到四个区域。需要注意的是,人脸区域的划分并不是固定不变的,而是根据关键点的数量、人脸构成而不同,需要单独进行计算的。
步骤S3:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图。
在本步骤中,由于采用人脸关键点和区域进行监督学习,可以使得目标样本IR图也可以保持人脸的面部特征,从而可以很好地保持人脸的面相,尤其对于利用人脸特征进行的人脸识别具有重要意义。将人脸按人脸关键点数量进行划分,还可以使得对人脸的计算更加均衡,使模型更容易聚焦。关键点可以为5点、6点、7点、21点、29点、68点、96点、98点、106点、186点或其他点数标注的任意一种标注点。
步骤S4:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果。
在本步骤中,将样本RGB图、目标样本IR图和样本IR图输入IR图判别模型,使得IR图判别模型对目标样本IR图和样本IR图的真实性进行判别,从而确定目标样本IR图的真实性判定结果。IR图判别模型在进行真实性判定时,计算目标样本IR图为真实的概率,并根据概率是否大于预设值,确定真或假的结果。IR图判别模型在进行判别时,既可以以目标样本IR图为整体进行判别,也可以将目标样本IR图划分为多个子区域进行判别。在以子区域进行判别时,对子区域分别进行判别,并最终综合得到目标样本IR图为真的概率。
步骤S5:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值。
在本步骤中,可以通过预设的第一损失函数和真实性判定结果,对样本IR图以及目标样本IR图进行损失计算,从而得到第一损失值。对抗性生成网络的损失函数为:
第一损失函数是对生成人脸IR图模型的判定,此时固定IR图判别模型的参数,得到第一损失函数:
其中,D为IR图判别模型的参数,G为生成人脸IR图模型的参数,D(X)为样本IR图输入后IR图判别模型的输出,D(G(z))为目标样本IR图输入后IR图判别模型的输出。
步骤S6:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值。
在本步骤中,将样本IR图、目标样本IR图及真实性判定结果输入IR图判别模型进行学习训练,从而更新IR图判别模型的参数。第二损失函数是对IR图判别模型的判定,此时固定生成人脸IR图模型的参数,得到第二损失函数:
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
在本步骤中,重复执行前述步骤,对生成人脸IR图模型和IR图判别模型基于第一损失值和第二损失值持续进行优化调整。其中,对生成人脸IR图模型的优化目标是使得D(x)的值越大越好,而对IR图判别模型的优化目标是使得D(G(z)))越小越好,也即,生成人脸IR图模型会想要IR图判别模型认为在近红外图像生成模型输出的目标样本IR图的真实性为真;而IR图判别模型则会想将生成人脸IR图模型生成的目标样本IR图的真实性判定为假,从而实现对抗训练的目的。当第一损失值在第一预设范围内、第二损失值在第二预设范围内时,认为模型训练达成收敛。
图3为本发明实施例中一种对人脸进行划分的步骤流程图。如图3所示,本发明实施例中一种对人脸进行划分的步骤包括:
步骤S21:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点。
在本步骤中,通过人脸识别算法获得人脸关键点和人脸朝向。本步骤可以采用现有技术中可行的任意一种方法获得。本步骤可以通过样本RGB图的人脸识别算法获得,并通过样本RGB图与样本IR图的对应关系获得样本IR图上的相应信息。
步骤S22:根据所述人脸关键点获得左眼、右眼、鼻子和嘴巴的范围及所述范围分别对应的所述人脸关键点数量。
在本步骤中,根据人脸关键点分布可以确定左眼、右眼、鼻子和嘴巴对应的人脸关键点,从而确定左眼、右眼、鼻子和嘴巴的范围。进而得到左眼、右眼、鼻子和嘴巴对应的人脸关键点数量。左眼、右眼、鼻子和嘴巴的范围是指左眼、右眼、鼻子和嘴巴所在的一块范围,包含对应人脸关键点的最小封闭区域。由于人脸可能存在遮挡、闭眼等问题,导致左眼、右眼、鼻子和嘴巴对应的人脸关键点的数量并不是固定的,需要每次进行判断。
步骤S23:根据所述范围对应的所述人脸关键点数量及所述人脸朝向,计算所述人脸朝向镜头时的区域。
在本步骤中,所述区域面积大小与所述范围对应的所述人脸关键点数量成正比。一个范围对应的人脸关键点数量越多,则该区域越大。比如左眼在部分被遮挡,导致识别出的人脸关键点少于右眼,则右眼所在的区域大于左眼所在的区域,并且右眼区域是左眼区域的n1/n2倍,其中,n1是右眼对应的人脸关键点数量,n2是左眼对应的人脸关键点数量。
步骤S24:根据所述人脸朝向镜头时的区域确定所述样本RGB图和所述样本IR图中的区域。
在本步骤中,将人脸朝向镜头时的边界投射到样本RGB图中,从而得到样本RGB图中的区域。通过样本RGB图与样本IR图的对应关系,得到样本IR图中的区域。
本实施例根据人脸关键点数量及朝向镜头时区域划分,得到样本RGB图和样本IR图中的区域,可以使得人脸关键点的分布与区域大小相匹配,更易训练出有效的生成人脸IR图模型和IR图判别模型。
图4为本发明实施例中另一种对人脸进行划分的步骤流程图。如图4所示,相比于前述实施例,本发明实施例中另一种对人脸进行划分的步骤还包括:
步骤S25:对左眼、右眼、鼻子和嘴巴对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将对应的所述人脸关键点舍弃。
在本步骤中,对左眼、右眼、鼻子和嘴巴分别设置阈值,并且左眼、右眼、鼻子和嘴巴对应的阈值可以不同。如果左眼、右眼、鼻子和嘴巴对应的人脸关键点数量小于阈值,则舍弃该部位对应的人脸关键点。比如,左眼的人脸关键点数量为2,小于阈值4,则舍弃掉左眼的人脸关键点。
步骤S26:获得剩余的所述人脸关键点的坐标。
在本步骤中,将剩余的人脸关键点作为有效的人脸关键点,并获得坐标,进行兵器续计算。
本实施例对于关键点过少的部位直接舍弃,可以使模型对于有效的有脸部分更加敏感,对无效的人脸部分的兼容性更好,能够提高模型的稳定性。
图5为本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤流程图。本实施例对人脸部分单独进行处理。如图5所示,本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤包括:
步骤S41:基于IR图判别模型,对每一个所述区域进行判别,得到每个区域为真实图像的概率。
在本步骤中,利用IR图判别模型对每一个区域进行判别。由于样本RGB图与目标样本RGB图的视角和原因,在部分边缘会存在较大的差异,导致在边缘的区域的内容并不能完全匹配,而这些部分可以通过本实施例进行学习解决,现有技术中将RGB图直接转换为IR图的方案则无法有效解决这类问题。对于边缘差异,通过本实施例的多次优化与迭代,可以使得模型对于视角差异引起的不同具有更好的兼容性。
步骤S42:根据所述区域的权重值,计算所述目标样本IR图为真实图像的概率。
在本步骤中,每个区域具有不同的权重值,具体地说,区域的人脸关键点越多,权重越高,区域的面积越大,权重越高。不同的人脸关键点具有不同的权重值,比如眼部关键点的权重值大于脸部轮廓关键点的权重值。通过对每一个区域为真实的概率的加权平均,求得目标样本IR图为真实图像的概率。
在部分实施例中,区域的权重值由所述人脸关键点的数量及位置共同确定。
步骤S43:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
在本步骤中,概率值的范围为[0,1]。通过设置真实阈值,比如0.5、0.6、0.7或其他任意值,当概率值大于真实阈值时,真实性判定结果为真,否则,真实性判定结果为假。
本实施例通过将目标样本IR图和样本IR图划分为多个区域,并对每个区域进行真实性计算,结合区域的权重值,得到目标样本IR图为真实图像的概率,再与真实阈值比较,得到目标样本IR图的真实性判定结果,结合了人脸的特征,能够更好地适应各类角度、遮挡人脸的判别。
图6为本发明实施例中一种得到第二损失值的步骤流程图。如图6所示,本发明实施例中一种得到第二损失值的步骤包括:
步骤S61:根据所述样本IR图、所述目标样本IR图及所述区域为真实图像的概率对所述IR图判别模型进行训练。
在本步骤中,将样本IR图、目标样本IR图及区域为真实图像的概率对IR图判别模型进行训练。相比于以整个图像的真实概率进行计算,本实施例以区域为对象进行训练,可以在一组图中对多个区域进行训练,能够加快IR图判别模型的训练速度,并且可以使得IR图判别模型对于部分人脸缺失情况具有更好的适应性。
步骤S62:基于第二损失函数进行损失计算,得到第二损失值。
在本步骤中,使用前述实施例中的第二损失函数进行计算。在进行第二损失值计算时,对每个区域单独进行计算,再根据前述实施例中区域的权重值计算加权后的第二损失值。
本实施例将样本IR图、目标样本IR图划分为区域分别进行训练,并计算第二损失值,从而将完整的图像按人脸特征分区域进行训练,可以对人脸的细节具有更好的辨识性,具有更好的效果。
图7为本发明实施例中一种区块式生成人脸IR图模型的训练系统的结构示意图。如图7所示,本发明实施例中一种区块式生成人脸IR图模型的训练系统包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
识别模块,用于识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
具体地说,获取模块获训练样本图像,再由生成模块生成目标样本IR图。识别模块根据人脸特征进行个性化划分,将样本RGB图和目标IR图划分为四个区域。判别模块对生成的目标样本IR图进行判别,得到真实性判定结果。损失模块对生成模型的损失值进行计算,得到第一损失值。判别模型模块用于对IR图判别模型进行训练,并计算IR图判别模型的第二损失值。循环模块用于控制其他模块的循环执行,使生成人脸IR图模型和IR图判别模型收敛。
本实施例利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
本发明实施例中还提供一种区块式生成人脸IR图模型的训练设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的一种区块式生成人脸IR图模型的训练方法的步骤。
如上,本实施例利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图8是本发明实施例中的一种区块式生成人脸IR图模型的训练设备的结构示意图。下面参照图8来描述根据本发明的这种实施方式的电子设备600。图8显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述一种区块式生成人脸IR图模型的训练方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图8中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例中还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的一种区块式生成人脸IR图模型的训练方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述一种区块式生成人脸IR图模型的训练方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,本实施例利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
图9是本发明实施例中的计算机可读存储介质的结构示意图。参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本实施例利用对抗性生成网络生成人脸IR图像,并且根据人脸特征将人脸按左眼、右眼、鼻子和嘴巴分为四个区域,分别进行处理,可以更好地生成人脸IR图像,具有成本低、通用性强、训练速度快的优点。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (10)
1.一种区块式生成人脸IR图模型的训练方法,其特征在于,包括如下步骤:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
步骤S2:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比;
步骤S3:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;
步骤S4:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
步骤S5:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
步骤S6:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
2.根据权利要求1所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S2包括:
步骤S21:识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点;
步骤S22:根据所述人脸关键点获得左眼、右眼、鼻子和嘴巴的范围及所述范围分别对应的所述人脸关键点数量;
步骤S23:根据所述范围对应的所述人脸关键点数量及所述人脸朝向,计算所述人脸朝向镜头时的区域;其中,所述区域面积大小与所述范围对应的所述人脸关键点数量成正比;
步骤S24:根据所述人脸朝向镜头时的区域确定所述样本RGB图和所述样本IR图中的区域。
3.根据权利要求2所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,还包括:
步骤S25:对左眼、右眼、鼻子和嘴巴对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将对应的所述人脸关键点舍弃;
步骤S26:获得剩余的所述人脸关键点的坐标。
4.根据权利要求1所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S4包括:
步骤S41:基于IR图判别模型,对每一个所述区域进行判别,得到每个所述区域为真实图像的概率;
步骤S42:根据所述区域的权重值,计算所述目标样本IR图为真实图像的概率;
步骤S43:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
5.根据权利要求4所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,所述区域的权重值由所述人脸关键点的数量及面积共同确定。
6.根据权利要求4所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S6包括:
步骤S61:根据所述样本IR图、所述目标样本IR图及所述区域为真实图像的概率对所述IR图判别模型进行训练;
步骤S62:基于第二损失函数进行损失计算,得到第二损失值。
7.根据权利要求1所述的一种区块式生成人脸IR图模型的训练方法,其特征在于,步骤S1中还对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差。
8.一种区块式生成人脸IR图模型的训练系统,用于实现权利要求1至7中任一项所述的区块式生成人脸IR图模型的训练方法,其特征在于,包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
识别模块,用于识别所述样本RGB图和所述样本IR图中的人脸朝向及人脸关键点,并根据左眼、右眼、鼻子和嘴巴将人脸分为四个区域,并且四个所述区域在所述人脸朝向镜头时的面积大小与所述区域的人脸关键点数量成正比;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的四个所述区域及所述人脸关键点进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
9.一种区块式生成人脸IR图模型的训练设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述区块式生成人脸IR图模型的训练方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7中任意一项所述区块式生成人脸IR图模型的训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311189850.6A CN117218231A (zh) | 2023-09-15 | 2023-09-15 | 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311189850.6A CN117218231A (zh) | 2023-09-15 | 2023-09-15 | 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117218231A true CN117218231A (zh) | 2023-12-12 |
Family
ID=89034854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311189850.6A Pending CN117218231A (zh) | 2023-09-15 | 2023-09-15 | 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117218231A (zh) |
-
2023
- 2023-09-15 CN CN202311189850.6A patent/CN117218231A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145781B (zh) | 用于处理图像的方法和装置 | |
CN111340008B (zh) | 对抗补丁生成、检测模型训练、对抗补丁防御方法及系统 | |
WO2019223382A1 (zh) | 单目深度估计方法及其装置、设备和存储介质 | |
WO2022156640A1 (zh) | 一种图像的视线矫正方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
WO2022078041A1 (zh) | 遮挡检测模型的训练方法及人脸图像的美化处理方法 | |
CN111723707A (zh) | 一种基于视觉显著性的注视点估计方法及装置 | |
CN112149615A (zh) | 人脸活体检测方法、装置、介质及电子设备 | |
US11335128B2 (en) | Methods and systems for evaluating a face recognition system using a face mountable device | |
CN108229281B (zh) | 神经网络的生成方法和人脸检测方法、装置及电子设备 | |
CN114399424A (zh) | 模型训练方法及相关设备 | |
CN112991208B (zh) | 图像处理方法及装置、计算机可读介质和电子设备 | |
CN116686008A (zh) | 基于机器学习模型的增强的视频稳定 | |
CN117218231A (zh) | 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质 | |
CN116012913A (zh) | 模型训练方法、人脸关键点检测方法、介质及装置 | |
CN115471863A (zh) | 三维姿态的获取方法、模型训练方法和相关设备 | |
CN117218232A (zh) | 一种多人脸的生成人脸ir图模型训练方法、系统、设备及介质 | |
CN117218229A (zh) | 一种生成人脸ir图模型的训练方法、系统、设备及介质 | |
CN115410257A (zh) | 图像保护方法及相关设备 | |
CN114612976A (zh) | 关键点检测方法及装置、计算机可读介质和电子设备 | |
CN117218230A (zh) | 一种关键点引导的生成人脸ir图模型的训练方法、系统、设备及介质 | |
CN108446653B (zh) | 用于处理面部图像的方法和装置 | |
CN112862840A (zh) | 图像分割方法、装置、设备及介质 | |
CN113034675A (zh) | 一种场景模型构建方法、智能终端及计算机可读存储介质 | |
CN114663946B (zh) | 对抗样本生成方法、装置、设备及介质 | |
Sun et al. | Embodied Adversarial Attack: A Dynamic Robust Physical Attack in Autonomous Driving |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |