CN112949855B - 人脸识别模型训练方法、识别方法、装置、设备及介质 - Google Patents
人脸识别模型训练方法、识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112949855B CN112949855B CN202110218671.5A CN202110218671A CN112949855B CN 112949855 B CN112949855 B CN 112949855B CN 202110218671 A CN202110218671 A CN 202110218671A CN 112949855 B CN112949855 B CN 112949855B
- Authority
- CN
- China
- Prior art keywords
- vector
- face
- identity
- face feature
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 65
- 239000013598 vector Substances 0.000 claims abstract description 441
- 230000006870 function Effects 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000017105 transposition Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 230000001502 supplementing effect Effects 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请涉及模型训练技术领域,提供一种人脸识别模型训练方法、识别方法、装置、设备及介质,该方法包括:获取样本数据,样本数据包括人脸图像和人脸图像对应的第一身份向量;将人脸图像输入编码层,得到第一人脸特征向量;将预设向量队列中的历史人脸特征向量和第一人脸特征向量输入向量补偿层,得到第二人脸特征向量;将第一人脸特征向量和第二人脸特征向量输入分类层,得到第二身份向量;根据第一身份向量、第二身份向量、历史人脸特征向量和历史身份向量,确定人脸识别模型是否收敛;若人脸识别模型未收敛,则将第二人脸特征向量和第二身份向量存入预设向量队列,以更新预设向量队列。本方案训练出来的人脸识别模型更加准确。
Description
技术领域
本申请涉及模型训练技术领域,尤其涉及一种人脸识别模型训练方法、识别方法、装置、设备及介质。
背景技术
人脸识别是电子支付、智能手机锁屏、视频监控等多种生物识别认证应用的关键技术。在人脸识别的技术中采用的卷积神经网络(Convolutional Neural Networks, CNN)极大地提高了识别精度。然而,人脸识别的许多难题仍有待解决,例如,研究的主流引入新的目标函数,以最大程度地提高类间的可区分性和类内的紧凑性;他们尝试通过引用身份代表向量来考虑所有身份,该向量是用于身份分类的最后一个完全连接层的权重向量。但是,传统方法仍然难以一次覆盖大量身份,因为这些方法使用的是小批量训练(mini-batch),但由于内存限制使用的身份数量远少于总的身份数量。使用小规模的mini-batch检查数万个身份需要进行多次迭代,这使在全面考虑所有身份的同时在嵌入空间中学习最佳决策边界的任务变得复杂,增加mini-batch的大小可以缓解某些问题,但是通常由于内存限制,此解决方案不切实际,也不能保证提高准确性。
发明内容
本申请的主要目的在于提供一种人脸识别模型训练方法、识别方法、装置、设备及介质,旨在使训练出来的人脸识别模型更加准确。
第一方面,本申请提供一种人脸识别模型训练方法,所述人脸识别模型训练方法用于训练人脸识别模型,所述人脸识别模型包括编码层、分类层和向量补偿层,所述方法包括:
获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
第二方面,本申请还提供一种人脸识别方法,包括:
获取待识别的人脸图像;
将所述人脸图像输入至预设人脸识别模型中,得到所述人脸图像对应的人物的身份信息,其中,所述预设人脸识别模型是通过如权利要求1-6中任一项所述的人脸识别模型训练方法进行训练得到的。
第三方面,本申请还提供一种人脸识别模型训练装置,人脸识别模型包括编码层、分类层和向量补偿层,所述人脸识别模型训练装置包括:获取模块和训练模块,其中:
所述获取模块,用于获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
所述训练模块,用于:
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
第四方面,本申请还提供一种设备,所述设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的人脸识别模型训练方法的步骤或实现上述的人脸识别方法的步骤。
第五方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的人脸识别模型训练方法的步骤或实现上述的人脸识别方法的步骤。
本申请提供一种人脸识别模型训练方法、识别方法、装置、设备及介质,本申请获取样本数据,其中,样本数据包括人脸图像和人脸图像对应的第一身份向量;将人脸图像输入编码层,得到人脸图像对应的第一人脸特征向量;将预设向量队列中的历史人脸特征向量和第一人脸特征向量输入向量补偿层,得到第二人脸特征向量;将第一人脸特征向量和第二人脸特征向量输入分类层,得到人脸图像对应的第二身份向量;根据第一身份向量、第二身份向量、历史人脸特征向量和预设向量队列中与历史人脸特征向量对应的历史身份向量,确定人脸识别模型的目标损失值;根据目标损失值,确定人脸识别模型是否收敛;若人脸识别模型未收敛,则将第二人脸特征向量和第二身份向量存入预设向量队列,以更新预设向量队列;返回执行获取样本数据的步骤,直至人脸识别模型收敛。本方案人脸识别模型通过样本数据和历史人脸特征向量进行联合训练的方式,使训练出来的人脸识别模型更加准确。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种人脸识别模型训练方法的步骤流程示意图;
图2为图1中的人脸识别模型训练方法的子步骤流程示意图;
图3为本申请实施例提供的模型训练模型的一示意图框图;
图4为本申请实施例提供的人脸识别方法的步骤流程示意图;
图5为本申请实施例提供的一种人脸识别模型训练装置的示意性框图;
图6为图5中的人脸识别模型训练装置的子模块的示意性框图;
图7为本申请实施例提供的一种设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种人脸识别模型训练方法、识别方法、装置、设备及介质。其中,该人脸识别模型训练方法可应用于设备中,该设备可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理,该设备还可以是服务器,该服务器可以是单台服务器或者是多个单台服务器组成的服务器集群。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请实施例提供的一种人脸识别模型训练方法的步骤流程示意图。
如图1所示,该人脸识别模型训练方法用于训练人脸识别模型,所述方法应用于设备,所述人脸识别模型包括编码层、分类层和向量补偿层,该方法包括步骤S101至步骤S108。
步骤S101、获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量。
其中,样本数据包括人脸图像和人脸图像对应的第一身份向量。该人脸图像可以是人脸照片,也是可以是视频中的一帧人脸图像,本申请对此不做具体限定。
在一实施例中,获取样本数据,得到包括人脸图像和该人脸图像对应的第一身份向量。需要说明的是,在得到人脸图像之后,可以对该人脸图像进行预处理,例如,该预处理的方式可以是对人脸图像中的模糊区域进行去模糊处理,使人脸图像更加清晰,该去模糊处理的方式可以根据实际情况进行选择,本申请对此不做具体限定,例如,可以通过滤波器对图像进行去模糊处理。当然该预处理的方式也可以是对图像进行补光处理,对人脸图像中图像比较暗的区域进行补光处理,使得后续的模型训练更加准确。
步骤S102、将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量。
其中,该人脸识别模型包括编码层、分类层和向量补偿层,该编码层包括第一预设数量的神经网络,分类层包括第二预设数量的神经网络,向量补偿层包括第三预设数量的神经网络。
其中,该第一预设数量、第二预设数量和第三预设数量可以根据实际情况进行设置,本申请实施例对此不做具体限定,例如,该第一预设数量可以为3,该第二预设数量可以为2,该第三预设数量可以为4,该神经网络可以根据实际进行选择,例如,该神经网络可以为卷积神经网络、循环神经网络或循环卷积神经网络,该循环神经网络包括双向长短时记忆网络。
在一实施例中,将该人脸图像输入所述编码层进行处理,得到所述人脸图像对应的第一人脸特征向量。
步骤S103、将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量。
其中,该向量补偿层包括第三预设数量的神经网络,该第三预设数量可以根据实际情况进行设置,例如,该第三预设数量可以设置为4,该神经网络可以选择为双向长短时记忆网络,则该向量补偿层包括四层双向长短时记忆网络。
其中,该预设向量队列是将历史训练人脸识别模型时生成的人脸特征向量依次排列在向量队列中得到的,历史人脸特性向量的排列方式可以根据实际情况进行选择,本申请对此不做具体限定,例如,该历史人脸特性向量的排列方式是根据识别的时间戳的顺序进行历史人脸特征向量的排列。
在一实施例中,将预设向量队列中的历史人脸特征向量和第一人脸特征向量输入该向量补偿层进行处理,得到第二人脸特征向量。通过向量补偿层对该历史人脸特征向量进行补偿,可以提高模型训练的准确性。
在一实施例中,根据预设向量队列中的历史人脸特征向量和第一人脸特征向量,确定补偿参数;对历史人脸特征向量和补偿参数进行加法运算,确定所述第二人脸特征向量。
具体地,获取补偿函数公式,该补偿函数公式为,其中,/>为补偿函数值,/>为第/>个第一人脸特征向量,/>为第/>个第一人脸特征向量对应的第一身份向量,/>为第/>个历史人脸特征向量,/>为第/>个历史人脸特征向量对应的身份向量,对该公式进行归一化处理,得到目标补偿函数公式为/>,为第/>个第二人脸特征向量,该/>为第/>个历史人脸特征向量,该/>为/>个历史身份向量的期望,该/>为/>个历史身份向量,基于该目标补偿函数公式,并根据该历史人脸特征向量、历史身份向量和历史身份向量的期望,计算出每个历史人脸特征向量对应的第二人脸特征向量。其中,该历史身份向量的期望是根据每个历史身份向量计算出来的,该历史身份向量的期望的计算本申请对此不做具体限定。
步骤S104、将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量。
其中,该分类层包括第二预设数量的神经网络,该第二预设数量可以根据实际情况进行设置,本申请对此不做具体限定,例如,该第二预设数量可以为2,该神经网络可以选择为双向长短时记忆网络,则该分类层为双层双向长短时记忆网络。
在一实施例中,将第一人脸特征向量和所述第二人脸特征向量输入分类层进行处理,得到人脸图像对应的第二身份向量。通过该分类层可以准确的输出第二身份向量,提高了模型训练的准确性。
步骤S105、根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值。
其中,该目标损失值是通过编码层的第一损失函数和分类层的第二损失函数确定的。
在一实施例中,如图2所示,步骤S105包括子步骤S1051至子步骤S1053。
子步骤S1051、基于所述第一损失函数,对所述第一身份向量和所述第二身份向量乘积计算,确定第一损失值。
示例性的,将第一身份向量和第二身份向量带入第一损失函数中,从而计算到第一损失函数值。其中,第一损失函数为,其中,/>为第一损失函数值,/>为第一身份向量,/>为第一参数,该第一预设参数的计算公式为/>,其中,/>为第一参数,/>为第/>个第一身份向量,/>为第/>个第一人脸特征向量对应的第一身份向量,/>为/>个第二身份向量的转置,联立第一损失函数和第一参数的计算公式,并根据第一身份向量和第二身份向量,可以得到第一损失值。
子步骤S1052、基于所述第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值。
在一实施例中,根据第一预设参数计算公式,计算第一身份向量和第二身份向量的第一参数;根据第二预设参数计算公式,计算历史人脸特征向量和预设向量队列中和历史人脸特征向量对应的历史身份向量的第二参数;对所述第一参数和第二参数进行求和运算,确定第二损失值。
示例性的,将历史人脸特征向量和预设向量队列中与历史人脸特征向量对应的历史身份向量代入第二损失函数中,从而可以计算得到第二损失值。其中,该第二损失函数为,该x为第一身份向量,/>为历史人脸特征向量,为第一参数,/>为第二参数,该第二预设参数的计算公式为,该/>第二参数,该/>为第/>个第一人脸特征向量,为第/>个第一人脸特征向量对应的第一身份向量,该/>为/>个历史人脸特征向量对应的历史身份向量的转置,联立第二损失函数、第一预设参数计算公式和第二预设参数计算公式,并根据第一身份向量、第二身份向量、历史人脸特征向量和预设向量队列中和历史人脸特征向量对应的历史身份向量,确定第二损失值。
子步骤S1053、根据所述第一损失值和所述第二损失值,确定目标损失值。
示例性的获取目标损失函数,其中,该目标损失函数为,L为目标损失值,/>为第一权重,/>为第二权重,/>为第一损失值和/>为第二损失值,/>+/>=1;基于该目标损失函数和第一损失值和第二损失值,确定使得该目标损失函数最小的第一权重和第二权重的目标取值,然后根据第一损失值、第二损失值、基于第一权重和第二权重的目标取值,确定人脸识别模型的目标损失值。
步骤S106、根据所述目标损失值,确定所述人脸识别模型是否收敛。
示例性的,确定目标损失值是否小于预设阈值;若确定目标损失值小于预设阈值,则确定人脸识别模型已收敛;若确定目标损失值大于或等于预设阈值,则确定人脸识别模型未收敛。其中,该预设阈值可以根据实际情况进行设置,本申请对此不做具体限定。通过将目标损失值和预设阈值进行比较,可以准确的确定人脸识别模型是否收敛。
步骤S107、若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列。
若该人脸识别模型为收敛,则将该第二人脸特征向量和该第二身份向量存入该预设向量队列,以更新该预设向量队列。该第二人脸特征向量和该第二身份向量进行预设队列的排列方式可以根据实际情况进行排列,本申请对此不做具体限定,例如,根据人脸识别模型训练的时间戳的顺序进行排列,则可以将该第二人脸特征向量和该第二身份向量排列在预设队列的队列末尾。当人脸识别模型未收敛时,将第二人脸特征向量和第二身份向量存入预设向量队列,可以提高模型训练的准确性。
步骤S108、返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
当该人脸识别模型未收敛时,继续执行获取样本数据的步骤,进行人脸识别模型的训练,并更新预设向量队列,直至人脸识别模型收敛。如图3所示,将人脸图像X输入编码层中,得到人脸图像对应的第一人脸特征向量h1;将预设向量队列中的历史人脸特征向量h2和第一人脸特征向量h1输入向量补偿层中,得到第二人脸特征向量h3;将第一人脸特征向量h1和第二人脸特征向量h3输入分类层进行处理,得到人脸图像对应的第二身份向量Y;根据第一身份向量、第二身份向量Y、历史人脸特征向量h1和预设向量队列中与历史人脸特征向量对应的历史身份向量,确定人脸识别模型的目标损失值,进而根据该目标损失值确定是否继续训练人脸识别模型。
上述实施例提供的人脸识别模型训练方法,获取样本数据,其中,样本数据包括人脸图像和人脸图像对应的第一身份向量;将人脸图像输入编码层,得到人脸图像对应的第一人脸特征向量;将预设向量队列中的历史人脸特征向量和第一人脸特征向量输入向量补偿层,得到第二人脸特征向量;将第一人脸特征向量和第二人脸特征向量输入分类层,得到人脸图像对应的第二身份向量;根据第一身份向量、第二身份向量、历史人脸特征向量和预设向量队列中与历史人脸特征向量对应的历史身份向量,确定人脸识别模型的目标损失值;根据目标损失值,确定人脸识别模型是否收敛;若人脸识别模型未收敛,则将第二人脸特征向量和第二身份向量存入预设向量队列,以更新预设向量队列;返回执行获取样本数据的步骤,直至人脸识别模型收敛。本方案人脸识别模型通过样本数据和历史人脸特征向量进行联合训练的方式,使训练出来的人脸识别模型更加准确。
请参照图4,图4为本申请实施例提供的人脸识别方法的步骤流程示意图。
如图4所示,该人脸识别方法包括步骤S201至步骤S202。
步骤S201、获取待识别的人脸图像。
获取待识别的人脸图像,该人脸图像可以是人脸照片,也是可以是视频中的一帧人脸图像,本申请对此不做具体限定。
在一实施例中,在获取到待识别的人脸图像之后,可以对该人脸图像进行预处理,该预处理的方式可以是对人脸图像中的模糊区域进行去模糊处理,使人脸图像更加清晰,该去模糊处理的方式可以根据实际情况进行选择,本申请对此不做具体限定,例如,可以通过滤波器对图像进行去模糊处理。当然该预处理的方式也可以是对图像进行补光处理,对人脸图像中图像比较暗的区域进行补光处理,使得后续的人脸识别更加准确。
步骤S202、将所述人脸图像输入至预设人脸识别模型中,得到所述人脸图像对应的人物的身份信息,其中,所述预设人脸识别模型是通过人脸识别模型训练方法进行训练得到的。
将该人脸图像输入至预设人脸识别模型中,得到人脸图像对应的人物的身份信息。其中,该预设人脸识别模型是通过人脸识别模型训练方法进行训练得到的。通过将该人脸图像输入至预设人脸识别模型中,可以准确的得到人脸图像对应的人物的身份信息。
上述实施例提供的人脸识别模型,获取待识别的人脸图像;然后将人脸图像输入至预设人脸识别模型中,得到人脸图像对应的人物的身份信息,通过将该人脸图像输入至预设人脸识别模型中,可以准确的得到人脸图像对应的人物的身份信息。
请参数图5,图5为本申请实施例提供的一种人脸识别模型训练装置的示意性框图。
如图5所示,人脸识别模型包括编码层、分类层和向量补偿层,所述人脸识别模型训练装置包括:获取模块310和训练模块320,其中:
所述获取模块310,用于获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
所述训练模块320,用于:
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
在一实施例中,如图6所示,训练模块320包括第一确定模块321、第二确定模块322和第三确定模块323,其中:
所述第一确定模块321,用于基于所述第一损失函数,对所述第一身份向量和所述第二身份向量乘积计算,确定第一损失值;
所述第二确定模块322,用于基于所述第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值;
所述第三确定模块323,用于根据所述第一损失值和所述第二损失值,确定目标损失值。
在一实施例中,所述第二确定模块322,还用于:
根据第一预设参数计算公式,计算所述第一身份向量和所述第二身份向量的第一参数;
根据第二预设参数计算公式,计算所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量的第二参数;
对所述第一参数和第二参数进行求和运算,确定所述第二损失值。
在一实施例中,所述训练模块320,还用于:
确定所述目标损失值是否小于预设阈值;
若确定所述目标损失值小于预设阈值,则确定所述人脸识别模型已收敛;
若确定所述目标损失值大于或等于预设阈值,则确定所述人脸识别模型未收敛。
在一实施例中,所述训练模块320,还用于:
根据所述预设向量队列中的历史人脸特征向量和所述第一人脸特征向量,确定,确定补偿参数;
根据所述历史人脸特征向量和所述补偿参数,确定所述第二人脸特征向量。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述人脸识别模型训练装置的具体工作过程,可以参考前述人脸识别模型训练方法实施例中的对应过程或方言识别实施例中的对应过程,在此不再赘述。
请参阅图7,图7为本申请实施例提供的一种设备的结构示意性框图。
如图7所示,该设备包括通过系统总线连接的处理器、存储器和通信接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种人脸识别模型训练方法。
处理器用于提供计算和控制能力,支撑整个设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种人脸识别模型训练方法。
该设备还包括网络接口,该网络接口用于网络通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,该总线比如为I2C(Inter-integrated Circuit)总线,存储器可以是Flash芯片、只读存储器 (ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等,处理器可以是中央处理单元 (Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable GateArray,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
在一个实施例中,所述处理器在实现所述根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值时,用于实现:
基于所述第一损失函数,对所述第一身份向量和所述第二身份向量乘积计算,确定第一损失值;
基于所述第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值;
根据所述第一损失值和所述第二损失值,确定目标损失值。
在一实施例中,所述处理器在实现所述基于所述第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值时,还用于:
根据第一预设参数计算公式,计算所述第一身份向量和所述第二身份向量的第一参数;
根据第二预设参数计算公式,计算所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量的第二参数;
对所述第一参数和第二参数进行求和运算,确定所述第二损失值。
在一个实施例中,所述处理器在实现所述根据所述目标损失值,确定所述人脸识别模型是否收敛时,用于实现:
确定所述目标损失值是否小于预设阈值;
若确定所述目标损失值小于预设阈值,则确定所述人脸识别模型已收敛;
若确定所述目标损失值大于或等于预设阈值,则确定所述人脸识别模型未收敛。
在一个实施例中,所述处理器在实现所述将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量时,用于实现:
根据所述预设向量队列中的历史人脸特征向量和所述第一人脸特征向量,确定,确定补偿参数;
根据所述历史人脸特征向量和所述补偿参数,确定所述第二人脸特征向量。
在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,还用于实现如下步骤:
获取待识别的人脸图像;
将所述人脸图像输入至预设人脸识别模型中,得到所述人脸图像对应的人物的身份信息,其中,所述预设人脸识别模型是通过人脸识别模型训练方法进行训练得到的。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述设备的具体工作过程,可以参考前述人脸识别模型训练方法实施例中的对应过程或参考前述人脸识别方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请人脸识别模型训练方法的各个实施例或人脸识别方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的设备的内部存储单元,例如所述设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种人脸识别模型训练方法,其特征在于,所述人脸识别模型训练方法用于训练人脸识别模型,所述人脸识别模型包括编码层、分类层和向量补偿层,所述方法包括:
获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
基于第一损失函数,对所述第一身份向量和所述第二身份向量乘积计算,确定第一损失值,所述第一损失函数为,其中,/>为第一损失函数值,/>为第一身份向量,/>为第一参数,所述第一参数是基于第一身份向量、第一人脸特征向量对应的第一身份向量和第二身份向量的转置的确定的;
基于第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值,所述第二损失函数为,其中,/>为第一身份向量,/>为历史人脸特征向量,/>为第一参数,/>为第二参数,所述第二参数是基于第一人脸特征向量、第一人脸特征向量对应的第一身份向量和历史人脸特征向量对应的历史身份向量的转置确定的;
根据所述第一损失值和所述第二损失值,确定目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛。
2.如权利要求1所述的人脸识别模型训练方法,其特征在于,所述基于所述第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值,包括:
根据第一预设参数计算公式,计算所述第一身份向量和所述第二身份向量的第一参数,其中,第一预设参数计算公式为,其中,/>为第一参数,/>为第/>个第一身份向量,/>为第/>个第一人脸特征向量对应的第一身份向量,/>为/>个第二身份向量的转置;
根据第二预设参数计算公式,计算所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量的第二参数,其中,第二预设参数的计算公式为为第二参数,/>为第/>个第一人脸特征向量,/>为第/>个第一人脸特征向量对应的第一身份向量,/>为/>个历史人脸特征向量对应的历史身份向量的转置;
对所述第一参数和第二参数进行求和运算,确定所述第二损失值。
3.如权利要求1所述的人脸识别模型训练方法,其特征在于,所述根据所述目标损失值,确定所述人脸识别模型是否收敛,包括:
确定所述目标损失值是否小于预设阈值;
若确定所述目标损失值小于预设阈值,则确定所述人脸识别模型已收敛;
若确定所述目标损失值大于或等于预设阈值,则确定所述人脸识别模型未收敛。
4.如权利要求1-3中任一项所述的人脸识别模型训练方法,其特征在于,所述将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量,包括:
根据所述预设向量队列中的历史人脸特征向量和所述第一人脸特征向量,确定补偿参数;
对所述历史人脸特征向量和所述补偿参数进行加法运算,确定所述第二人脸特征向量。
5.一种人脸识别方法,其特征在于,包括:
获取待识别的人脸图像;
将所述人脸图像输入至预设人脸识别模型中,得到所述人脸图像对应的人物的身份信息,其中,所述预设人脸识别模型是通过如权利要求1-4中任一项所述的人脸识别模型训练方法进行训练得到的。
6.一种人脸识别模型训练装置,其特征在于,人脸识别模型包括编码层、分类层和向量补偿层,所述人脸识别模型训练装置包括:获取模块和训练模块,其中:
所述获取模块,用于获取样本数据,其中,所述样本数据包括人脸图像和所述人脸图像对应的第一身份向量;
所述训练模块,用于:
将所述人脸图像输入所述编码层,得到所述人脸图像对应的第一人脸特征向量;
将预设向量队列中的历史人脸特征向量和所述第一人脸特征向量输入所述向量补偿层,得到第二人脸特征向量;
将所述第一人脸特征向量和所述第二人脸特征向量输入所述分类层,得到所述人脸图像对应的第二身份向量;
根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中与所述历史人脸特征向量对应的历史身份向量,确定所述人脸识别模型的目标损失值;
根据所述目标损失值,确定所述人脸识别模型是否收敛;
若所述人脸识别模型未收敛,则将所述第二人脸特征向量和所述第二身份向量存入所述预设向量队列,以更新所述预设向量队列;
返回执行所述获取样本数据的步骤,直至所述人脸识别模型收敛;
所述训练模块包括第一确定模块、第二确定模块和第三确定模块,其中:
所述第一确定模块,用于基于第一损失函数,对所述第一身份向量和所述第二身份向量乘积计算,确定第一损失值,所述第一损失函数为,其中,/>为第一损失函数值,/>为第一身份向量,/>为第一参数,所述第一参数是基于第一身份向量、第一人脸特征向量对应的第一身份向量和第二身份向量的转置的确定的;
所述第二确定模块,用于基于第二损失函数,并根据所述第一身份向量、所述第二身份向量、所述历史人脸特征向量和预设向量队列中和所述历史人脸特征向量对应的历史身份向量,确定第二损失值,所述第二损失函数为,其中,/>为第一身份向量,/>为历史人脸特征向量,/>为第一参数,/>为第二参数,所述第二参数是基于第一人脸特征向量、第一人脸特征向量对应的第一身份向量和历史人脸特征向量对应的历史身份向量的转置确定的;
所述第三确定模块,用于根据所述第一损失值和所述第二损失值,确定目标损失值。
7.一种电子设备,其特征在于,所述电子设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至4中任一项所述的人脸识别模型训练方法的步骤或实现如权利要求5所述的人脸识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至4中任一项所述的人脸识别模型训练方法的步骤或实现如权利要求5所述的人脸识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110218671.5A CN112949855B (zh) | 2021-02-26 | 2021-02-26 | 人脸识别模型训练方法、识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110218671.5A CN112949855B (zh) | 2021-02-26 | 2021-02-26 | 人脸识别模型训练方法、识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949855A CN112949855A (zh) | 2021-06-11 |
CN112949855B true CN112949855B (zh) | 2023-08-25 |
Family
ID=76246523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110218671.5A Active CN112949855B (zh) | 2021-02-26 | 2021-02-26 | 人脸识别模型训练方法、识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949855B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657467B (zh) * | 2021-07-29 | 2023-04-07 | 北京百度网讯科技有限公司 | 模型预训练方法、装置、电子设备和存储介质 |
CN113963411B (zh) * | 2021-10-26 | 2022-08-16 | 电科智动(深圳)科技有限公司 | 身份识别模型的训练方法、装置、警用滑板车及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018219016A1 (zh) * | 2017-06-02 | 2018-12-06 | 腾讯科技(深圳)有限公司 | 一种人脸检测训练方法、装置及电子设备 |
CN110046551A (zh) * | 2019-03-18 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
-
2021
- 2021-02-26 CN CN202110218671.5A patent/CN112949855B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018219016A1 (zh) * | 2017-06-02 | 2018-12-06 | 腾讯科技(深圳)有限公司 | 一种人脸检测训练方法、装置及电子设备 |
CN110046551A (zh) * | 2019-03-18 | 2019-07-23 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112949855A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229532B (zh) | 图像识别方法、装置和电子设备 | |
US11334773B2 (en) | Task-based image masking | |
US20150242760A1 (en) | Personalized Machine Learning System | |
CN114360520B (zh) | 语音分类模型的训练方法、装置、设备及存储介质 | |
CN109934198B (zh) | 人脸识别方法及装置 | |
CN112990312A (zh) | 模型训练方法、图像识别方法、装置、设备及存储介质 | |
CN110298249A (zh) | 人脸识别方法、装置、终端及存储介质 | |
EP4320606A1 (en) | Personalized biometric anti-spoofing protection using machine learning and enrollment data | |
CN111914908B (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
US12159478B2 (en) | Polar relative distance transformer | |
CN113128478B (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
CN111126573A (zh) | 基于个体学习的模型蒸馏改进方法、设备及存储介质 | |
CN108875487B (zh) | 行人重识别网络的训练及基于其的行人重识别 | |
WO2019191266A1 (en) | Object classification method, apparatus, server, and storage medium | |
CN109840413B (zh) | 一种钓鱼网站检测方法及装置 | |
CN112949855B (zh) | 人脸识别模型训练方法、识别方法、装置、设备及介质 | |
WO2023272594A1 (en) | Image forgery detection via pixel-metadata consistency analysis | |
CN110909784A (zh) | 一种图像识别模型的训练方法、装置及电子设备 | |
CN113282927A (zh) | 恶意代码检测方法、装置、设备及计算机可读存储介质 | |
CN116822651A (zh) | 基于增量学习的大模型参数微调方法、装置、设备及介质 | |
WO2006073081A1 (ja) | 識別用データ学習システム、学習装置、識別装置及び学習方法 | |
CN113535582A (zh) | 接口测试方法、装置、设备及计算机可读存储介质 | |
CN113420699A (zh) | 一种人脸匹配方法、装置及电子设备 | |
CN115034333B (zh) | 联邦学习方法、联邦学习装置及联邦学习系统 | |
CN116524574A (zh) | 一种面部区域识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |