CN117218229A - 一种生成人脸ir图模型的训练方法、系统、设备及介质 - Google Patents

一种生成人脸ir图模型的训练方法、系统、设备及介质 Download PDF

Info

Publication number
CN117218229A
CN117218229A CN202311189646.4A CN202311189646A CN117218229A CN 117218229 A CN117218229 A CN 117218229A CN 202311189646 A CN202311189646 A CN 202311189646A CN 117218229 A CN117218229 A CN 117218229A
Authority
CN
China
Prior art keywords
image
sample
face
model
diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311189646.4A
Other languages
English (en)
Inventor
段兴
兰兴增
陈晨
林威宇
吴陈涛
汪博
朱力
吕方璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Guangjian Aoshen Technology Co ltd
Zhuhai Hengqin Guangjian Technology Co ltd
Shenzhen Guangjian Technology Co Ltd
Original Assignee
Chongqing Guangjian Aoshen Technology Co ltd
Zhuhai Hengqin Guangjian Technology Co ltd
Shenzhen Guangjian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Guangjian Aoshen Technology Co ltd, Zhuhai Hengqin Guangjian Technology Co ltd, Shenzhen Guangjian Technology Co Ltd filed Critical Chongqing Guangjian Aoshen Technology Co ltd
Priority to CN202311189646.4A priority Critical patent/CN117218229A/zh
Publication of CN117218229A publication Critical patent/CN117218229A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

一种生成人脸IR图模型的训练方法,包括:S1:获取人脸的训练样本图像,S2:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;S3:根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;S4:对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;S5:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值。本发明具有成本低、通用性强、样本多元化的优点。

Description

一种生成人脸IR图模型的训练方法、系统、设备及介质
技术领域
本发明涉及人脸识别技术领域,具体地,涉及一种生成人脸IR图模型的训练方法、系统、设备及介质。
背景技术
在人脸识别技术领域,利用尝试学习算法对人脸进行识别成为主流。而利用深度相机同时获得的RGB图像和IR图像同时进行人脸识别,则可以获得更好的识别结果。但是具有相匹配的RGB图像与IR图像的数量是非常少的,并且采集RGB图像及IR图像的成本较高,耗时较长,不具有经济性。
现有的数据库中通常具有大量的人脸RGB图像,但缺乏相应的IR图像,因此通过人脸的RGB图像像获得人脸的IR图像成为一种高效的解决方案。同时,由于人脸的高维信息的特征,传统的将RGB图像直接转换为IR图像的方案难以获得现实榀行的效果。
某发明公开了一种人脸图像的生成方法和装置,方法包括:获取真实人脸的RGB三通道彩色图像,并根据其生成人脸位置矩形框和面部特征点坐标;根据两者获取3DMM人脸模型的PCA相貌参数、PCA表情参数以及三维人脸投影到RGB三通道彩色图像的仿射变换矩阵,以重建人脸三维模型;根据RGB三通道彩色图像和重建的人脸三维模型,生成三维重建所得人脸三维点阵中各采样点对应的颜色信息;基于颜色信息、PCA相貌参数、PCA表情参数、光线材质和人脸角度信息,生成四通道RGBA人脸图像和人脸定位点坐标;根据预先采集的标记有人脸位置的一般场景图片和四通道RGBA人脸图像,生成人脸图像。该现有技术可以获得RGB图像对应的IR图像,但是没有考虑RGB摄像头与IR摄像头的差异。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为此,本发明利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
第一方面,本发明提供一种生成人脸IR图模型的训练方法,其特征在于,包括如下步骤:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
步骤S2:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;
步骤S3:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
步骤S4:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
步骤S5:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
步骤S6:对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差;
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S2包括:
步骤S21:对所述样本RGB图进行人脸识别,得到面部特征点坐标;
步骤S22:所述生成人脸IR图模型利用所述样本RGB图和所述面部特征点坐标输出目标样本IR图。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,所述步骤S21包括:
步骤S211:对所述样本RGB图进行人脸识别,得到人脸关键点;
步骤S212:对人脸部位对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将所述部位对应的所述人脸关键点舍弃;其中,所述部位包括左眼、右眼、鼻子、嘴巴;
步骤S213:将剩余的所述人脸关键点标记为面部特征点,并获得相应的坐标。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S3包括:
步骤S31:根据所述面部特征点将所述目标样本IR图和所述样本IR图划分为多个子图像;
步骤S32:基于IR图判别模型,对每一个所述子图像进行判别,得到每个子图像为真实图像的概率;
步骤S33:根据所述子图像的权重值,计算所述目标样本IR图为真实图像的概率;
步骤S34:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,所述面部特征点的权重值由所述面部特征点的数量及位置共同确定。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S5包括:
步骤S51:根据所述样本IR图、所述目标样本IR图及所述子图像为真实图像的概率对所述IR图判别模型进行训练;
步骤S52:基于第二损失函数进行损失计算,得到第二损失值。
可选地,所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S1中还对所述样本RGB图、所述样本IR图和所述目标样本IR图进行背景替换,以消除背景的过拟合。
第二方面,本发明提供一种生成人脸IR图模型的训练系统,用于实现上述任一项所述的生成人脸IR图模型的训练方法,其特征在于,包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,用于基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
随机裁剪模块,用于对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
第三方面,本发明提供一种生成人脸IR图模型的训练设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述生成人脸IR图模型的训练方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现前述任意一项所述生成人脸IR图模型的训练方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
本发明利用对抗性生成网络生成人脸的IR图,具有更大的自由度,相比于单一的从人脸RGB图生成人脸IR图,能够产生更多的人脸IR图,从而更好地模拟不同IR摄像头硬件差异。
本发明利用样本RGB图和人脸特征进行监督学习,可以在生成目标样本IR图是保持人脸特征信息不变,能够更好地应用于人脸识别模型,并且具有更快的收敛速度,更短的训练时长。
本发明还在训练时对样本IR图进行随机裁剪,可以更好地模拟IR镜头与RGB镜头获得的IR图与RGB图之前的差异,使得模型最终生成的IR图能够与深度相机实际拍摄到的IR图与RGB图具有更好的一致性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中一种生成人脸IR图模型的训练方法的步骤流程图;
图2为本发明实施例中一种输出目标样本的步骤流程图;
图3为本发明实施例中一种得到面部特征点坐标的步骤流程图;
图4为本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤流程图;
图5为本发明实施例中一种得到第二损失值的步骤流程图;
图6为本发明实施例中一种生成人脸IR图模型的训练系统的结构示意图;
图7为本发明实施例中一种生成人脸IR图模型的训练设备的结构示意图;以及
图8为本发明实施例中计算机可读存储介质的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供的一种生成人脸IR图模型的训练方法,旨在解决现有技术中存在的问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
本发明利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
图1为本发明实施例中一种生成人脸IR图模型的训练方法的步骤流程图。如图1所示,本发明实施例中一种生成人脸IR图模型的训练方法的步骤包括:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图。
在本步骤中,样本RGB图和样本IR图既可以是视角相同的两张图,也可以是视角不同的两张图。在部分深度相机中,获得的IR图与RGB图具有相同的视角,而在另外的深度相机中,获得的IR图与RGB图则具有不同的视角。本步骤中的样本RGB图和样本IR图只要是同一时刻拍摄获得的同一目标对象的图像即可,其视角既可以相同,又可以不同。
在部分实施例中,还对所述样本RGB图、所述样本IR图和所述目标样本IR图进行背景替换,以消除背景的过拟合。在训练样本图像中,常常因为采集环境的原因,导致背景较为单一,这容易导致模型对于背景过拟合,从而对于背景更换过于敏感。本实施例在进行背景替换时,对样本RGB图和样本IR图同步进行替换,并且替换的背景均是对应的,一个是RGB图下的背景,一个是IR图下的背景,从而使得目标样本IR图中的背景也可以相应地更新。
步骤S2:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图。
在本步骤中,生成人脸IR图模型在获得样本RGB图后,对样本RGB图进行识别,获得人脸特征,再将人脸特征与相应的样本RGB图一起进行学习训练,输出目标样本IR图。由于采用人脸特征进行监督学习,可以使得目标样本IR图也可以保持人脸的面部特征,从而可以很好地保持人脸的面相,尤其对于利用人脸特征进行的人脸识别具有重要意义。人脸特征为表征人脸信息的各种维度信息,比如关键点位置、人的表情、光线影响等。人脸特征可以采用人脸的部位,也可以采用关键点进行标识。当人脸特征采用人脸的部位时,人脸特征为左眼、右眼、鼻子、嘴巴、轮廓等。当人脸特征采用关键点进行标识时,关键点可以为5点、6点、7点、21点、29点、68点、96点、98点、106点、186点或其他点数标注的任意一种标注点。
步骤S3:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果。
在本步骤中,将样本RGB图、目标样本IR图和样本IR图输入IR图判别模型,使得IR图判别模型对目标样本IR图和样本IR图的真实性进行判别,从而确定目标样本IR图的真实性判定结果。IR图判别模型在进行真实性判定时,计算目标样本IR图为真实的概率,并根据概率是否大于预设值,确定真或假的结果。IR图判别模型在进行判别时,既可以以目标样本IR图为整体进行判别,也可以将目标样本IR图划分为多个子区域进行判别。在以子区域进行判别时,对子区域分别进行判别,并最终综合得到目标样本IR图为真的概率。
步骤S4:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值。
在本步骤中,可以通过预设的第一损失函数和真实性判定结果,对样本IR图以及目标样本IR图进行损失计算,从而得到第一损失值。对抗性生成网络的损失函数为:
第一损失函数是对生成人脸IR图模型的判定,此时固定IR图判别模型的参数,得到第一损失函数:
其中,D为IR图判别模型的参数,G为生成人脸IR图模型的参数,D(X)为样本IR图输入后IR图判别模型的输出,D(G(z))为目标样本IR图输入后IR图判别模型的输出。
步骤S5:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值。
在本步骤中,将样本IR图、目标样本IR图及真实性判定结果输入IR图判别模型进行学习训练,从而更新IR图判别模型的参数。第二损失函数是对IR图判别模型的判定,此时固定生成人脸IR图模型的参数,得到第二损失函数:
步骤S6:对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差。
在本步骤中,在进行随机裁剪时,保持人脸特征的完整性,并且将人脸在图像中位置的偏移限定在预设范围内,比如,人脸位置偏移不超过100像素时,则在100个像素内对样本IR图进行随机裁剪,得到新的样本IR图。需要说明的时,本步骤中随机裁剪的对象是步骤S1中获得的最初的样本IR图,以保证图像的稳定性。预设范围的选取以深度相机的常见参数为参考,通常预设范围在50像素、100像素、150像素、200像素中选取,当然也可以是其他任意数值。
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
在本步骤中,重复执行前述步骤,对生成人脸IR图模型和IR图判别模型基于第一损失值和第二损失值持续进行优化调整。其中,对生成人脸IR图模型的优化目标是使得D(x)的值越大越好,而对IR图判别模型的优化目标是使得D(G(z)))越小越好,也即,生成人脸IR图模型会想要IR图判别模型认为在近红外图像生成模型输出的目标样本IR图的真实性为真;而IR图判别模型则会想将生成人脸IR图模型生成的目标样本IR图的真实性判定为假,从而实现对抗训练的目的。当第一损失值在第一预设范围内、第二损失值在第二预设范围内时,认为模型训练达成收敛。
图2为本发明实施例中一种输出目标样本的步骤流程图。如图2所示,本发明实施例中一种输出目标样本的步骤包括:
步骤S21:对所述样本RGB图进行人脸识别,得到面部特征点坐标。
在本步骤中,使用不同的人脸识别模型会得到不同的特征点,从而得到不同的特征点坐标。面部特征点坐标既可以是一个点,也可以是以点为中心的一个区域。当面部特征点为点时,可以为前述实施例中的任一种关键点。当面部特征点为以为点中心的区域时,可以是人脸的部位,也可以是以关键点简单向外拓展的区域。
步骤S22:所述生成人脸IR图模型利用所述样本RGB图和所述面部特征点坐标输出目标样本IR图。
在本步骤中,由于采用人脸特征进行监督学习,可以使得目标样本IR图也可以保持人脸的面部特征,从而可以很好地保持人脸的面相,尤其对于利用人脸特征进行的人脸识别具有重要意义。
本实施例利用人脸的面部特征点坐标进行监督学习,从而使得生成的目标样本IR图可以更好地保持人脸的面相,并且所采用的人脸的面部特征点可以根据人脸识别的数据直接获取,不增加额外的计算量,同时由于保持了面部特征点坐标,也使得目标样本IR图对于人脸识别模型更加友好。
图3为本发明实施例中一种得到面部特征点坐标的步骤流程图。如图3所示,本发明实施例中一种得到面部特征点坐标的步骤包括:
步骤S211:对所述样本RGB图进行人脸识别,得到人脸关键点。
在本步骤中,对样本RGB图进行人脸识别,得到多个人脸关键点。人脸关键点可以采用现有技术中的各类人脸识别模型进行识别。
步骤S212:对人脸部位对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将所述部位对应的所述人脸关键点舍弃。
在本步骤中,所述部位包括左眼、右眼、鼻子、嘴巴。按人脸部位的人脸关键点数量对人脸部位的遮挡情况进行判断,当相应部位的人脸关键点数量小于对应的阈值时,舍弃该部位的全部人脸关键点。
步骤S213:将剩余的所述人脸关键点标记为面部特征点,并获得相应的坐标。
在本步骤中,将较完整的人脸部位的关键点标记为面部特征点,仅保留较完整的人脸部位的关键点,使模型面对缺失值不敏感,以提高模型的稳定性。
图4为本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤流程图。如图4所示,本发明实施例中一种得到目标样本IR图的真实性判定结果的步骤包括:
步骤S31:根据所述面部特征点将所述目标样本IR图和所述样本IR图划分为多个子图像。
在本步骤中,对样本IR图和目标样本IR图同时进行操作,并进行同样的划分,以使得划分后的多个子图像依然可以进行对比。在进行划分时,以面部特征点将人脸划分为多个大小不等的子图像,并对每个子图像根据面部特征点和子图像的面积分别赋予不同的权重值。
步骤S32:基于IR图判别模型,对每一个所述子图像进行判别,得到每个子图像为真实图像的概率。
在本步骤中,利用IR图判别模型对每一个子图像进行判别。由于样本RGB图与目标样本RGB图的视角和原因,在部分边缘会存在较大的差异,导致在边缘的子图像的内容并不能完全匹配,而这些部分可以通过本实施例进行学习解决,现有技术中将RGB图直接转换为IR图的方案则无法有效解决这类问题。对于边缘差异,通过本实施例的多次优化与迭代,可以使得模型对于视角差异引起的不同具有更好的兼容性。
步骤S33:根据所述子图像的权重值,计算所述目标样本IR图为真实图像的概率。
在本步骤中,每个子图像具有不同的权重值,具体地说,子图像的面部特征点越多,权重越高,子图像的面积越大,权重越高。不同的面部特征点具有不同的权重值,比如眼部关键点的权重值大于脸部轮廓关键点的权重值。通过对每一个子图像为真实的概率的加权平均,求得目标样本IR图为真实图像的概率。
在部分实施例中,面部特征点的权重值由所述面部特征点的数量及位置共同确定。
步骤S34:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
在本步骤中,概率值的范围为[0,1]。通过设置真实阈值,比如0.5、0.6、0.7或其他任意值,当概率值大于真实阈值时,真实性判定结果为真,否则,真实性判定结果为假。
本实施例通过将目标样本IR图和样本IR图划分为多个子图像,并对每个子图像进行真实性计算,结合子图像的权重值,得到目标样本IR图为真实图像的概率,再与真实阈值比较,得到目标样本IR图的真实性判定结果,结合了人脸的特征,能够更好地适应各类角度、遮挡人脸的判别。
图5为本发明实施例中一种得到第二损失值的步骤流程图。如图5所示,本发明实施例中一种得到第二损失值的步骤包括:
步骤S51:根据所述样本IR图、所述目标样本IR图及所述子图像为真实图像的概率对所述IR图判别模型进行训练。
在本步骤中,将样本IR图、目标样本IR图及子图像为真实图像的概率对IR图判别模型进行训练。相比于以整个图像的真实概率进行计算,本实施例以子图像为对象进行训练,可以在一组图中对多个子图像进行训练,能够加快IR图判别模型的训练速度,并且可以使得IR图判别模型对于部分人脸缺失情况具有更好的适应性。
步骤S52:基于第二损失函数进行损失计算,得到第二损失值。
在本步骤中,使用前述实施例中的第二损失函数进行计算。在进行第二损失值计算时,对每个子图像单独进行计算,再根据前述实施例中子图像的权重值计算加权后的第二损失值。
本实施例将样本IR图、目标样本IR图划分为子图像分别进行训练,并计算第二损失值,从而将完整的图像按人脸特征分区域进行训练,可以对人脸的细节具有更好的辨识性,具有更好的效果。
图6为本发明实施例中一种生成人脸IR图模型的训练系统的结构示意图。如图6所示,本发明实施例中一种生成人脸IR图模型的训练系统包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,用于基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
随机裁剪模块,用于对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
具体地说,获取模块获训练样本图像,再由生成模块生成目标样本IR图。判别模块对生成的目标样本IR图进行判别,得到真实性判定结果。损失模块对生成模型的损失值进行计算,得到第一损失值。判别模型模块用于对IR图判别模型进行训练,并计算IR图判别模型的第二损失值。随机裁剪模块用于对样本IR图进行随机裁剪,以改变样本IR图与样本RGB图的视差。循环模块用于控制其他模块的循环执行,使生成人脸IR图模型和IR图判别模型收敛。
本实施例利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
本发明实施例中还提供一种生成人脸IR图模型的训练设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的一种生成人脸IR图模型的训练方法的步骤。
如上,本实施例利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图7是本发明实施例中的一种生成人脸IR图模型的训练设备的结构示意图。下面参照图7来描述根据本发明的这种实施方式的电子设备600。图7显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述一种生成人脸IR图模型的训练方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例中还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的一种生成人脸IR图模型的训练方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述一种生成人脸IR图模型的训练方法部分中描述的根据本发明各种示例性实施方式的步骤。
如上所示,本实施例利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
图8是本发明实施例中的计算机可读存储介质的结构示意图。参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本实施例利用对抗性生成网络生成人脸IR图像,并且考虑了RGB摄像头与IR摄像头拍摄的差异,可以更好地获得符合要求的人脸IR图像,并且考虑了不同IR摄像头的差异,具有成本低、通用性强、样本多元化的优点。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (10)

1.一种生成人脸IR图模型的训练方法,其特征在于,包括如下步骤:
步骤S1:获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
步骤S2:将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;
步骤S3:基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
步骤S4:基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
步骤S5:根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
步骤S6:对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差;
步骤S7:重复执行步骤S1-S6直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
2.根据权利要求1所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S2包括:
步骤S21:对所述样本RGB图进行人脸识别,得到面部特征点坐标;
步骤S22:所述生成人脸IR图模型利用所述样本RGB图和所述面部特征点坐标输出目标样本IR图。
3.根据权利要求2所述的一种生成人脸IR图模型的训练方法,其特征在于,所述步骤S21包括:
步骤S211:对所述样本RGB图进行人脸识别,得到人脸关键点;
步骤S212:对人脸部位对应的所述人脸关键点数量分别进行计算,如果小于对应的阈值,则将所述部位对应的所述人脸关键点舍弃;其中,所述部位包括左眼、右眼、鼻子、嘴巴;
步骤S213:将剩余的所述人脸关键点标记为面部特征点,并获得相应的坐标。
4.根据权利要求2所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S3包括:
步骤S31:根据所述面部特征点将所述目标样本IR图和所述样本IR图划分为多个子图像;
步骤S32:基于IR图判别模型,对每一个所述子图像进行判别,得到每个子图像为真实图像的概率;
步骤S33:根据所述子图像的权重值,计算所述目标样本IR图为真实图像的概率;
步骤S34:将所述目标样本IR图为真实图像的概率与真实阈值比较,得到所述目标样本IR图的真实性判定结果。
5.根据权利要求4所述的一种生成人脸IR图模型的训练方法,其特征在于,所述面部特征点的权重值由所述面部特征点的数量及位置共同确定。
6.根据权利要求4所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S5包括:
步骤S51:根据所述样本IR图、所述目标样本IR图及所述子图像为真实图像的概率对所述IR图判别模型进行训练;
步骤S52:基于第二损失函数进行损失计算,得到第二损失值。
7.根据权利要求1所述的一种生成人脸IR图模型的训练方法,其特征在于,步骤S1中还对所述样本RGB图、所述样本IR图和所述目标样本IR图进行背景替换,以消除背景的过拟合。
8.一种生成人脸IR图模型的训练系统,用于实现权利要求1至7中任一项所述的生成人脸IR图模型的训练方法,其特征在于,包括:
获取模块,用于获取人脸的训练样本图像,所述训练样本图像包括样本RGB图和所述样本RGB图对应的样本IR图;
生成模块,用于将所述样本RGB图输入至生成人脸IR图模型,所述生成人脸IR图模型利用所述样本RGB图的人脸特征进行监督学习并输出目标样本IR图;
判别模块,用于基于IR图判别模型,根据所述样本RGB图对所述目标样本IR图和所述样本IR图进行判别,得到所述目标样本IR图的真实性判定结果;
损失模块,用于基于第一损失函数和所述真实性判定结果,对所述样本IR图和所述目标样本IR图进行损失计算,得到第一损失值;
判别模型模块,用于根据所述样本IR图、所述目标样本IR图及所述真实性判定结果对所述IR图判别模型进行训练,并基于第二损失函数进行损失计算,得到第二损失值;
随机裁剪模块,用于对所述样本IR图进行随机裁剪,以模拟不同的相机中IR镜头与RGB镜头的视差;
循环模块,用于重复执行前述模块,直至所述第一损失值在第一预设范围内,所述第二损失值在第二预设范围内。
9.一种生成人脸IR图模型的训练设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述生成人脸IR图模型的训练方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7中任意一项所述生成人脸IR图模型的训练方法的步骤。
CN202311189646.4A 2023-09-15 2023-09-15 一种生成人脸ir图模型的训练方法、系统、设备及介质 Pending CN117218229A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311189646.4A CN117218229A (zh) 2023-09-15 2023-09-15 一种生成人脸ir图模型的训练方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311189646.4A CN117218229A (zh) 2023-09-15 2023-09-15 一种生成人脸ir图模型的训练方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN117218229A true CN117218229A (zh) 2023-12-12

Family

ID=89040272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311189646.4A Pending CN117218229A (zh) 2023-09-15 2023-09-15 一种生成人脸ir图模型的训练方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN117218229A (zh)

Similar Documents

Publication Publication Date Title
CN109145759B (zh) 车辆属性识别方法、装置、服务器及存储介质
US10204299B2 (en) Unsupervised matching in fine-grained datasets for single-view object reconstruction
CN108961369B (zh) 生成3d动画的方法和装置
US9058669B2 (en) Incorporating video meta-data in 3D models
CN112639846A (zh) 一种训练深度学习模型的方法和装置
CN111612842B (zh) 生成位姿估计模型的方法和装置
CN108229375B (zh) 用于检测人脸图像的方法和装置
KR20190126857A (ko) 이미지에서 오브젝트 검출 및 표현
CN115050064A (zh) 人脸活体检测方法、装置、设备及介质
CN115661246A (zh) 一种基于自监督学习的姿态估计方法
US11335128B2 (en) Methods and systems for evaluating a face recognition system using a face mountable device
CN112991208B (zh) 图像处理方法及装置、计算机可读介质和电子设备
CN114399424A (zh) 模型训练方法及相关设备
CN117218229A (zh) 一种生成人脸ir图模型的训练方法、系统、设备及介质
CN116012913A (zh) 模型训练方法、人脸关键点检测方法、介质及装置
CN115471863A (zh) 三维姿态的获取方法、模型训练方法和相关设备
CN117218230A (zh) 一种关键点引导的生成人脸ir图模型的训练方法、系统、设备及介质
CN111259859B (zh) 一种基于联合变量图片生成的行人重识别方法
CN117218231A (zh) 一种区块式生成人脸ir图模型的训练方法、系统、设备及介质
CN114202606A (zh) 图像处理方法、电子设置、存储介质及计算机程序产品
CN113034675A (zh) 一种场景模型构建方法、智能终端及计算机可读存储介质
CN115362478A (zh) 用于标记图像之间的空间关系的强化学习模型
CN117218232A (zh) 一种多人脸的生成人脸ir图模型训练方法、系统、设备及介质
CN112862840A (zh) 图像分割方法、装置、设备及介质
CN112463936B (zh) 一种基于三维信息的视觉问答方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination