CN115700845A - 人脸识别模型训练方法、人脸识别方法、装置及相关设备 - Google Patents

人脸识别模型训练方法、人脸识别方法、装置及相关设备 Download PDF

Info

Publication number
CN115700845A
CN115700845A CN202211432384.5A CN202211432384A CN115700845A CN 115700845 A CN115700845 A CN 115700845A CN 202211432384 A CN202211432384 A CN 202211432384A CN 115700845 A CN115700845 A CN 115700845A
Authority
CN
China
Prior art keywords
training
student
teacher
layer
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211432384.5A
Other languages
English (en)
Other versions
CN115700845B (zh
Inventor
王栋
刘伟华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Athena Eyes Co Ltd
Original Assignee
Athena Eyes Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Athena Eyes Co Ltd filed Critical Athena Eyes Co Ltd
Priority to CN202211432384.5A priority Critical patent/CN115700845B/zh
Publication of CN115700845A publication Critical patent/CN115700845A/zh
Application granted granted Critical
Publication of CN115700845B publication Critical patent/CN115700845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种人脸识别模型训练方法、人脸识别方法、装置、计算机设备及存储介质,所述方法包括:获取初始训练数据,并作为当前训练数据;逐层选取教师训练层对当前训练数据进行训练,得到教师训练结果;当教师训练层存在辅助分类器时,则对教师训练结果处理得到分类结果;当所有教师训练层训练结束后,逐层选取学生训练层对初始训练数据进行训练,得到学生训练结果;当学生训练层存在辅助分类器时,则对学生训练结果处理得到分类结果;将教师模型的分类结果与学生模型的分类结果进行对比,得到多个对比结果;当且仅当所有对比结果均为教师模型的分类结果与学生模型的分类结果一致,人脸识别模型训练通过,采用本发明提高人脸识别的识别精度。

Description

人脸识别模型训练方法、人脸识别方法、装置及相关设备
技术领域
本发明涉及人脸识别领域,尤其涉及一种人脸识别模型训练方法、人脸识别方法、装置、计算机设备及存储介质。
背景技术
随着互联网数据的积累以及深度学习的发展,人脸识别在各种应用场景落地推广越来越广泛,例如金融支付行业、社保养老金领取等。人脸识别作为一种无卡化去密码化的应用,以其简单快捷,配合度小越来越得到各金融机构的青睐。但是让只有中央处理器支持的设备上进行高精度快速度的人脸特征提取是一个比较棘手的问题。
目前针对这个问题的主要解决方案包括模型剪枝、量化、有效的网络架构设计、知识蒸馏等。但不同技术存在较多问题,蒸馏技术采用大网络训练的模型作为老师,采用小网络(mobilefacenet或者shufflenet)作为学生进行训练,可以将学生网络部署到移动手机或者其它移动式设备上,但是采用知识蒸馏方式训练模型时存在较多问题,收敛速度不够快。训练开始阶段不易收敛,训练结束后使用同一张输入图像进行特征提取后发现老师和学生网络的输出并不通用,从而导致在训练得到的模型的识别精度较低。
因此,现有方式在采用知识蒸馏方式在进行人脸识别模型训练时存在精度较低的问题。
发明内容
本发明实施例提供一种人脸识别模型训练方法、人脸识别方法、装置、计算机设备和存储介质,以提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
为了解决上述技术问题,本申请实施例提供一种人脸识别模型训练方法,包括。
获取初始训练数据,并将所述初始训练数据作为当前训练数据。
逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于所述当前教师训练层,对所述当前训练数据进行训练,得到教师训练结果,并将所述教师训练结果作为下一层教师训练层的当前训练数据。
当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行分类处理,得到所述当前教师训练层对应的分类结果。
当所有所述教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于所述当前学生训练层对所述初始训练数据进行训练,得到学生训练结果,并将所述学生训练结果作为下一层学生训练层的初始训练数据。
当所述当前学生训练层存在所述辅助分类器时,则基于所述辅助分类器,对所述学生训练结果进行分类处理,得到所述当前学生训练层对应的分类结果,其中,所述学生模型的辅助分类器个数与所述教师模型的辅助分类器个数相等。
将所述教师模型的第t个分类结果与所述学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于所述学生模型的辅助分类器个数。
当且仅当所有所述对比结果均为所述教师模型的分类结果与所述学生模型的分类结果一致,人脸识别模型训练通过。
为了解决上述技术问题,本申请实施例提供一种人脸识别方法,包括。
获取待识别图像。
将所述待识别图像输入学生模型中进行人脸识别,得到识别结果。
为了解决上述技术问题,本申请实施例还提供一种人脸识别模型训练装置,包括。
初始训练数据获取模块,用于获取初始训练数据,并将所述初始训练数据作为当前训练数据。
教师训练结果获取模块,用于逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于所述当前教师训练层,对所述当前训练数据进行训练,得到教师训练结果,并将所述教师训练结果作为下一层教师训练层的当前训练数据。
教师训练结果分类模块,用于当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行分类处理,得到所述当前教师训练层对应的分类结果。
学生训练结果获取模块,用于当所有所述教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于所述当前学生训练层对所述初始训练数据进行训练,得到学生训练结果,并将所述学生训练结果作为下一层学生训练层的初始训练数据。
学生训练结果分类模块,用于当所述当前学生训练层存在所述辅助分类器时,则基于所述辅助分类器,对所述学生训练结果进行分类处理,得到所述当前学生训练层对应的分类结果,其中,所述学生模型的辅助分类器个数与所述教师模型的辅助分类器个数相等。
对比模块,用于将所述教师模型的第t个分类结果与所述学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于所述学生模型的辅助分类器个数。
判断模块,用于当且仅当所有所述对比结果均为所述教师模型的分类结果与所述学生模型的分类结果一致,人脸识别模型训练通过。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述人脸识别模型训练方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述人脸识别模型训练方法的步骤。
本发明实施例提供的人脸识别模型训练方法、人脸识别方法、装置、计算机设备及存储介质,通过获取初始训练数据,并将初始训练数据作为当前训练数据;逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于当前教师训练层,对当前训练数据进行训练,得到教师训练结果,并将教师训练结果作为下一层教师训练层的当前训练数据;当当前教师训练层存在辅助分类器时,则基于辅助分类器,对教师训练结果进行分类处理,得到当前教师训练层对应的分类结果;当所有教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于当前学生训练层对初始训练数据进行训练,得到学生训练结果,并将学生训练结果作为下一层学生训练层的初始训练数据;当当前学生训练层存在辅助分类器时,则基于辅助分类器,对学生训练结果进行分类处理,得到当前学生训练层对应的分类结果;将教师模型的第t个分类结果与学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束;当且仅当所有对比结果均为教师模型的分类结果与学生模型的分类结果一致,人脸识别模型训练通过。通过在教师模型和学生模型中间层上都添加了辅助分类器,达到了进一步提高学生模型精度的效果,使得同样数据和硬件的情况下提高了压缩模型的算法精度,提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图。
图2是本申请的人脸识别模型训练方法的一个实施例的流程图。
图3是本申请的人脸识别模型的一示意图。
图4是本申请的人脸识别方法的一个实施例的流程图。
图5是根据本申请的人脸识别模型训练装置的一个实施例的结构示意图。
图6是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture E界面显示perts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureE界面显示perts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的人脸识别模型训练方法由服务器执行,相应地,人脸识别模型训练装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种人脸识别模型训练方法,以该方法应用在图1中的服务端为例进行说明,详述如下。
S201、获取初始训练数据,并将初始训练数据作为当前训练数据。
在步骤S201中,上述初始训练数据是指人脸图像数据。该初始训练数据中的人脸图像数据的数量不限制。
上述初始训练数据的获取方式包括但不限于从监控摄像头拍摄的监控视频中截取图像、手机拍摄。具体地,上述获取初始训练数据的方式根据实际应用场景进行适应性调整。此处不作具体限制。
上述当前训练数据是指采用知识蒸馏方式训练教师模型的当前数据。
此处需要说明的是,知识蒸馏技术是指应用在神经网络中。是一个通用而简单的、不同的模型压缩技术。它使用了教师模型对训练数据的最后分类层softmax的输出(软目标)来替代one-hot的硬目标。同时使用了温度T来控制label的分布。如果T趋近于0,label的分布趋近于one-hot,如果T越大,负样本的标签的值越高。知识蒸馏技术采用大网络训练的模型作为教师,采用小网络(mobilefacenet或者shufflenet)作为学生模型进行训练,可以将学生模型部署到移动手机或者其它移动式设备上。
S202、逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于当前教师训练层,对当前训练数据进行训练,得到教师训练结果,并将教师训练结果作为下一层教师训练层的当前训练数据。
在步骤S202,上述教师模型是指在知识蒸馏中复杂且大的模型。
教师模型包括多个教师训练层,基于所有教师训练层,逐层对当前训练数据进行训练,得到教师训练结果。
上述当前教师训练层是指当前对当前训练数据进行训练的教师训练层。例如,第一层教师训练层对初始训练数据进行训练,得到第一层训练结果;第二层教师训练层对第一层训练结果进行训练,得到第二层训练结果,依次类推。
上述当前训练数据是指在当前教师训练层中需要被训练的数据。例如,当当前教师训练层为第一层教师训练层时,则当前训练数据为初始训练数据,当当前教师训练层为第二层教师训练层时,则当前训练数据为第一层训练结果,依次类推。
此处需要说明的是,上述训练的方法包括但不限于基于cosface的loss训练方法(余弦间隔损失函数)、基于arcface的loss训练方法(加性角度间隔损失函数),其中,基于cosface的loss训练方法是指Cosine空间上的损失函数,将A-Softmax中的θ乘以m,改为了对cos(θ)减去余弦间隔m(additive cosine margin),并对特征向量和权重归一化的方法。基于arcface的loss训练方法在SphereFace基础上改进了对特征向量归一化和加性角度间隔,提高了类间可分性同时加强类内紧度和类间差异,ArcFace中是直接在角度空间θ中最大化分类界限,而CosFace是在余弦空间cos(θ)中最大化分类界限。
本申请优选采用通用的cosface或者arcface的L2loss进行教师模型的训练。
采用知识蒸馏,逐层选取教师模型的所有教师训练层对初始训练数据进行训练,有利于快速训练出教师模型。
S203、当当前教师训练层存在辅助分类器时,则基于辅助分类器,对教师训练结果进行分类处理,得到当前教师训练层对应的分类结果。
在步骤S203中,上述辅助分类器是指在训练层中对训练结果进行分类的分类器。其中,训练层包括教师训练层和学生训练层,训练结果包括教师训练结果和学生训练结果。
此处需要说明的是,辅助分类器后接于当前教师训练层,也就是说,当当前教师训练层训练得到教师训练结果,系统识别出该当前教师训练层后存在辅助分类器,则通过该辅助分类器对该教师训练结果进行分类,得到该教师训练层对应的分类结果。另外,本申请实施例优选采用通用的cosface或者arcface的L2loss辅助分类器进行训练。
上述分类是指针对不同应用场景进行不同分类的处理方法。例如,在通过人脸识别确认人脸身份时,该分类结果为识别该图像对应的人脸的身份是否为预设身份。在通过识别图像是否存在面部时,则该分类结果为存在面部和不存在面部,此处的面部包括但不限于人脸,宠物脸。
通过辅助分类器,对教师训练结果进行分类处理,得到当前教师训练层对应的分类结果,加快了训练的速度,同时通过辅助分类器,提高了对采用知识蒸馏方式的人脸识别模型的人脸识别精度。
S204、当所有教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于当前学生训练层对初始训练数据进行训练,得到学生训练结果,并将学生训练结果作为下一层学生训练层的初始训练数据。
在步骤S204中,上述学生模型是指在知识蒸馏中简单且小的模型。
学生模型包括多个学生训练层,基于所有学生训练层,逐层对学生训练数据进行训练,得到学生训练结果。
上述当前学生训练层是指当前对学生训练数据进行训练的学生训练层。例如,第一层学生训练层对初始训练数据进行训练,得到第一层学生训练结果;第二层学生训练层对第一层学生训练结果进行训练,得到第二层学生训练结果,依次类推。
上述初始训练数据是指在当前学生训练层中需要被训练的数据。例如,当当前学生训练层为第一层学生训练层时,则初始训练数据为初始训练数据,当当前学生训练层为第二层学生训练层时,则初始训练数据为第一层学生训练结果,依次类推。
此处需要说明的是,上述训练的方法包括但不限于基于cosface的loss训练方法(余弦间隔损失函数)、基于arcface的loss训练方法(加性角度间隔损失函数),其中,基于cosface的loss训练方法是指Cosine空间上的损失函数,将A-Softmax中的θ乘以m,改为了对cos(θ)减去余弦间隔m(additive cosine margin),并对特征向量和权重归一化的方法。基于arcface的loss训练方法在SphereFace基础上改进了对特征向量归一化和加性角度间隔,提高了类间可分性同时加强类内紧度和类间差异,ArcFace中是直接在角度空间θ中最大化分类界限,而CosFace是在余弦空间cos(θ)中最大化分类界限。
本申请优选采用通用的cosface或者arcface的L2loss进行学生模型的训练。
采用了L2loss在知识蒸馏上的融合,取得了后台的教师模型和前端的学生模型具有特征提取通用性的要求,并提高了训练出学生模型的速度。
S205、当当前学生训练层存在辅助分类器时,则基于辅助分类器,对学生训练结果进行分类处理,得到当前学生训练层对应的分类结果,其中,学生模型的辅助分类器个数与教师模型的辅助分类器个数相等。
在步骤S205中,上述辅助分类器是指在训练层中对训练结果进行分类的分类器。其中,训练层包括教师训练层和学生训练层,训练结果包括教师训练结果和学生训练结果。
此处需要说明的是,辅助分类器后接于当前学生训练层,也就是说,当当前学生训练层训练得到学生训练结果,系统识别出该当前学生训练层后存在辅助分类器,则通过该辅助分类器对该学生训练结果进行分类,得到该学生训练层对应的分类结果。另外,本申请实施例优选采用通用的cosface或者arcface的L2loss辅助分类器进行训练。
通过辅助分类器,对学生训练结果进行分类处理,得到当前学生训练层对应的分类结果,加快了训练的速度,同时通过辅助分类器,提高了对采用知识蒸馏方式的人脸识别模型的人脸识别精度。
S206、将教师模型的第t个分类结果与学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于学生模型的辅助分类器个数。
在步骤S206中,此处需要说明的是,教师模型的辅助分类器个数与学生模型的辅助分类器个数一致。
教师模型的第一个辅助分类器的分类结果跟学生模型的第一个辅助分类器的分类结果进行对比,教师模型的第二个辅助分类器的分类结果跟学生模型的第二个辅助分类器的分类结果进行对比,依次类推。此处需要注意的是,教师模型与学生模型对应的辅助分类器不一定是在相对应的训练层,也就是说,教师模型第一个辅助分类器可出现在第一层教师训练层后面,学生模型的第一个辅助分类器可出现在第二层训练层后面,此处不做限制。
学生训练层的层数少于教师训练层的层数,辅助分类器在学生模型和教师模型分布是相同数量的。辅助分类器最多为学生训练层的2倍。
通过对比教师模型的分类结果和学生模型的分类结果,可进一步提高学生模型进度的效果,在同样数据和硬件的情况下提高了压缩模型的算法精度。
S207、当且仅当所有对比结果均为教师模型的分类结果与学生模型的分类结果一致,人脸识别模型训练通过。
在步骤S207中,若存在一个对比结果为教师模型的分类结果与学生模型的分类结果不一致,该人脸识别模型训练不通过。
当且仅当所有对比结果均为教师模型的分类结果与学生模型的分类结果一致,人脸识别模型训练通过。
在本实施例中,通过上述步骤,采用了L2loss在知识蒸馏上的融合,取得了后台的教师模型和前端的学生模型具有特征提取通用性的要求,同时在教师模型和学生模型中间层上都添加了辅助分类器,达到了进一步提高学生模型精度的效果,使得同样数据和硬件的情况下提高了压缩模型的算法精度,提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
在本实施例的一些可选的实现方式中,步骤S201之前,人脸识别模型训练方法还包括。
S101、确定教师模型的教师训练层的层数m和学生模型的学生训练层的层数n,其中,n<m。
S102、基于预设辅助分类器数量获取方式和学生训练层的层数n,确定辅助分类器的数量为2i,其中,i≤n。
S103、基于预设的训练层选取方式,从教师模型中选取出i个教师训练层与i个辅助分类器进行一对一连接,从学生模型中选取出i个学生训练层与i个辅助分类器进行一对一连接。
在步骤S101中,如图3所示,确定教师模型的教师训练层的层数m和学生模型的学生训练层的层数n。
其中,教师模型包括m个教师训练层,学生模型包括n个学生训练层,softmax(T=t)为辅助分类器,soft labels为辅助分类器得到的分类结果。结合图3可知,当教师模型训练结束得到i个辅助分类器特征+1个最终分类器特征+1个最终softmax的输出(软目标),学生模型训练结束后得到i个辅助分类器特征+1个最终分类器特征+1个最终softmax的输出,大大加快收敛速度。
在步骤S102中,上述确定辅助分类器的个数的策略包括但不限于硬件资源确定,随机数确定,其中,随机数确定是指在预设范围内随机生成辅助分类器的个数,该预设范围的最大值不超过学生模型中的学生训练层层数。该硬件资源确定是指根据服务器硬件资源确定辅助分类器的个数。例如:对服务器资源进行监测,得到监测结果。当监测结果为服务器资源充足,则确定辅助分类器的数量为2i,其中,i等于学生训练层的层数n。当监测结果为服务器资源不充足,则对服务器资源进行配置计算,并根据计算得到的结果确定辅助分类器的数量为2i,其中,i小于学生训练层的层数n。
此处需要说明的是,确定辅助分类器的个数的策略可根据实际情况具体调整,此处不作具体限制。
对于步骤S103,上述预设的训练层选取方式是指从教师训练层或者学生训练层中选取出训练层与辅助分类器进行连接的方式。
上述预设的训练层选取方式包括但不限于平均间隔连接、随机间隔连接。
上述平均间隔连接是指将学生模型的学生训练层n除以i,得到连接间隔。从教师模型依次选取出与连接间隔成倍数关系的教师训练层,并将教师训练层与一个辅助分类器进行连接,直到教师模型选取出i个教师训练层。从学生模型依次选取出与连接间隔成倍数关系的学生训练层,并将学生训练层与一个辅助分类器进行连接,直到学生模型选取出i个学生训练层。此处需要说明的是,学生模型具有n个学生训练层层,学生模型有i个辅助分类器,将n除以i,可确认间隔多少个层出现一个辅助分类器。
上述随机间隔连接是指对教师模型的m个教师训练层和学生模型的n个学生训练层进行随机数生成处理,得到每一个教师训练层对应的随机数和每一个学生训练层对应的随机数。根据随机数从小到大的顺序或从大到小的顺序,从m个教师训练层选取出i个教师训练层,并将i个辅助分类器与选取出的i个教师训练层进行一对一连接。根据随机数从小到大的顺序或从大到小的顺序,从n个学生训练层选取出i个学生训练层,并将i个辅助分类器与选取出的i个学生训练层进行一对一连接。
此处需要说明的是,选取训练层与辅助分类器进行连接的方式可根据实际情况具体调整,此处不作具体限制。
通过上述步骤,可在教师模型和学生模型中间层上都添加了辅助分类器,达到了进一步提高学生模型精度的效果,使得同样数据和硬件的情况下提高了压缩模型的算法精度,提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
在本实施例的一些可选的实现方式中,步骤S203中,人脸识别模型训练方法还包括。
当当前教师训练层存在辅助分类器时,则基于辅助分类器,对教师训练结果进行特征提取,得到训练特征。
对训练特征依次进行卷积、全连接、池化处理,并对处理得到的特征进行分类处理,得到当前教师训练层对应的分类结果。
具体地,每一个辅助分类器包括特征提取,卷积、全连接、池化、分类功能。
通过上述步骤,可在教师模型和学生模型中间层上都添加了辅助分类器,达到了进一步提高学生模型精度的效果,使得同样数据和硬件的情况下提高了压缩模型的算法精度,提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
请参阅图4,图4示出本发明实施例提供的一种人脸识别方法,该人脸识别方法应用于上述的人脸识别模型训练方法中,人脸识别方法包括。
S301、获取待识别图像。
S302、将待识别图像输入学生模型中进行人脸识别,得到识别结果。
在步骤S301中,上述待识别图像是指待识别人脸图像数据。上述待识别图像的获取方式包括但不限于从监控摄像头拍摄的监控视频中截取图像、手机拍摄。具体地,上述获取初始训练数据的方式根据实际应用场景进行适应性调整。此处不作具体限制。
在步骤S302中,对待识别图像进行人脸识别只需要通过学生模型则可进行人脸识别。
在本实施例中,通过获取待识别图像,并将待识别图像输入学生模型中进行人脸识别,可快速得到识别结果,提高采用知识蒸馏方式的人脸识别模型的人脸识别精度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图5示出与上述实施例人脸识别模型训练方法一一对应的人脸识别模型训练装置的原理框图。如图5所示,该人脸识别模型训练装置包括初始训练数据获取模块41、教师训练结果获取模块42、教师训练结果分类模块43、学生训练结果获取模块44、学生训练结果分类模块45、对比模块46和判断模块47。各功能模块详细说明如下。
初始训练数据获取模块41,用于获取初始训练数据,并将初始训练数据作为当前训练数据。
教师训练结果获取模块42,用于逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于当前教师训练层,对当前训练数据进行训练,得到教师训练结果,并将教师训练结果作为下一层教师训练层的当前训练数据。
教师训练结果分类模块43,用于当当前教师训练层存在辅助分类器时,则基于辅助分类器,对教师训练结果进行分类处理,得到当前教师训练层对应的分类结果。
学生训练结果获取模块44,用于当所有教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于当前学生训练层对初始训练数据进行训练,得到学生训练结果,并将学生训练结果作为下一层学生训练层的初始训练数据。
学生训练结果分类模块45,用于当当前学生训练层存在辅助分类器时,则基于辅助分类器,对学生训练结果进行分类处理,得到当前学生训练层对应的分类结果,其中,学生模型的辅助分类器个数与教师模型的辅助分类器个数相等。
对比模块46,用于将教师模型的第t个分类结果与学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于学生模型的辅助分类器个数。
判断模块47,用于当且仅当所有对比结果均为教师模型的分类结果与学生模型的分类结果一致,人脸识别模型训练通过。
可选地,在初始训练数据获取模块41之前,人脸识别模型训练装置还包括。
层数确定模块,用于确定教师模型的教师训练层的层数m和学生模型的学生训练层的层数n,其中,n<m。
辅助分类器数量确定模块,用于基于预设辅助分类器数量获取方式和学生训练层的层数n,确定辅助分类器的数量为2i,其中,i≤n。
连接模块,用于基于预设的训练层选取方式,从教师模型中选取出i个教师训练层与i个辅助分类器进行一对一连接,从学生模型中选取出i个学生训练层与i个辅助分类器进行一对一连接。
可选地,辅助分类器数量确定模块包括。
监测单元,用于对服务器资源进行监测,得到监测结果。
第一数量确定单元,用于当监测结果为服务器资源充足,则确定辅助分类器的数量为2i,其中,i等于学生训练层的层数n。
第二数量确定单元,用于当监测结果为服务器资源不充足,则对服务器资源进行配置计算,并根据计算得到的结果确定辅助分类器的数量为2i,其中,i小于学生训练层的层数n。
可选地,连接模块包括。
连接间隔获取单元,用于将学生模型的学生训练层n除以i,得到连接间隔。
第一连接单元,用于从教师模型依次选取出与连接间隔成倍数关系的教师训练层,并将教师训练层与一个辅助分类器进行连接,直到教师模型选取出i个教师训练层。
第二连接单元,用于从学生模型依次选取出与连接间隔成倍数关系的学生训练层,并将学生训练层与一个辅助分类器进行连接,直到学生模型选取出i个学生训练层。
可选地,连接模块包括。
随机数生成单元,用于对教师模型的m个教师训练层和学生模型的n个学生训练层进行随机数生成处理,得到每一个教师训练层对应的随机数和每一个学生训练层对应的随机数。
第三连接单元,用于根据随机数从小到大的顺序或从大到小的顺序,从m个教师训练层选取出i个教师训练层,并将i个辅助分类器与选取出的i个教师训练层进行一对一连接。
第四连接单元,用于根据随机数从小到大的顺序或从大到小的顺序,从n个学生训练层选取出i个学生训练层,并将i个辅助分类器与选取出的i个学生训练层进行一对一连接。
可选地,教师训练结果分类模块43包括。
训练特征获取单元,用于当当前教师训练层存在辅助分类器时,则基于辅助分类器,对教师训练结果进行特征提取,得到训练特征。
分类单元,用于对训练特征依次进行卷积、全连接、池化处理,并对处理得到的特征进行分类处理,得到当前教师训练层对应的分类结果。
关于人脸识别模型训练装置的具体限定可以参见上文中对于人脸识别模型训练方法的限定,在此不再赘述。上述人脸识别模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6图6为本实施例计算机设备基本结构框图。
所述计算机设备5包括通过系统总线相互通信连接存储器51、处理器52、网络接口53。需要指出的是,图中仅示出了具有组件连接存储器51、处理器52、网络接口53的计算机设备5,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器51可以是所述计算机设备5的内部存储单元,例如该计算机设备5的硬盘或内存。在另一些实施例中,所述存储器51也可以是所述计算机设备5的外部存储设备,例如该计算机设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器51还可以既包括所述计算机设备5的内部存储单元也包括其外部存储设备。本实施例中,所述存储器51通常用于存储安装于所述计算机设备5的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器52在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制所述计算机设备5的总体操作。本实施例中,所述处理器52用于运行所述存储器51中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口53可包括无线网络接口或有线网络接口,该网络接口53通常用于在所述计算机设备5与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的人脸识别模型训练方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种人脸识别模型训练方法,其特征在于,所述人脸识别模型训练方法包括:
获取初始训练数据,并将所述初始训练数据作为当前训练数据;
逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于所述当前教师训练层,对所述当前训练数据进行训练,得到教师训练结果,并将所述教师训练结果作为下一层教师训练层的当前训练数据;
当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行分类处理,得到所述当前教师训练层对应的分类结果;
当所有所述教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于所述当前学生训练层对所述初始训练数据进行训练,得到学生训练结果,并将所述学生训练结果作为下一层学生训练层的初始训练数据;
当所述当前学生训练层存在所述辅助分类器时,则基于所述辅助分类器,对所述学生训练结果进行分类处理,得到所述当前学生训练层对应的分类结果,其中,所述学生模型的辅助分类器个数与所述教师模型的辅助分类器个数相等;
将所述教师模型的第t个分类结果与所述学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于所述学生模型的辅助分类器个数;
当且仅当所有所述对比结果均为所述教师模型的分类结果与所述学生模型的分类结果一致,人脸识别模型训练通过。
2.如权利要求1所述的人脸识别模型训练方法,其特征在于,在所述获取初始训练数据,并将所述初始训练数据作为当前训练数据之前,所述方法还包括:
确定教师模型的教师训练层的层数m和学生模型的学生训练层的层数n,其中,n<m;
基于预设辅助分类器数量获取方式和所述学生训练层的层数n,确定辅助分类器的数量为2i,其中,i≤n;
基于预设的训练层选取方式,从所述教师模型中选取出i个教师训练层与i个所述辅助分类器进行一对一连接,从所述学生模型中选取出i个学生训练层与i个所述辅助分类器进行一对一连接。
3.如权利要求2所述的人脸识别模型训练方法,其特征在于,所述基于预设辅助分类器数量获取方式和所述学生训练层的层数n,确定辅助分类器的数量为2i的步骤包括:
对服务器资源进行监测,得到监测结果;
当所述监测结果为所述服务器资源充足,则确定辅助分类器的数量为2i,其中,所述i等于所述学生训练层的层数n;
当所述监测结果为所述服务器资源不充足,则对所述服务器资源进行配置计算,并根据计算得到的结果确定所述辅助分类器的数量为2i,其中,所述i小于所述学生训练层的层数n。
4.如权利要求2所述的人脸识别模型训练方法,其特征在于,所述基于预设的训练层选取方式,从所述教师模型中选取出i个教师训练层与i个所述辅助分类器进行一对一连接,从所述学生模型中选取出i个学生训练层与i个所述辅助分类器进行一对一连接的步骤包括:
将所述学生模型的学生训练层n除以i,得到连接间隔;
从所述教师模型依次选取出与所述连接间隔成倍数关系的教师训练层,并将所述教师训练层与一个所述辅助分类器进行连接,直到所述教师模型选取出i个教师训练层;
从所述学生模型依次选取出与所述连接间隔成倍数关系的学生训练层,并将所述学生训练层与一个所述辅助分类器进行连接,直到所述学生模型选取出i个学生训练层。
5.如权利要求2所述的人脸识别模型训练方法,其特征在于,所述基于预设的训练层选取方式,从所述教师模型中选取出i个教师训练层与i个所述辅助分类器进行一对一连接,从所述学生模型中选取出i个学生训练层与i个所述辅助分类器进行一对一连接的步骤包括:
对教师模型的m个教师训练层和学生模型的n个学生训练层进行随机数生成处理,得到每一个所述教师训练层对应的随机数和每一个所述学生训练层对应的随机数;
根据随机数从小到大的顺序或从大到小的顺序,从所述m个教师训练层选取出i个教师训练层,并将i个所述辅助分类器与所述选取出的i个教师训练层进行一对一连接;
根据随机数从小到大的顺序或从大到小的顺序,从所述n个学生训练层选取出i个学生训练层,并将i个所述辅助分类器与所述选取出的i个学生训练层进行一对一连接。
6.如权利要求1任一项所述的人脸识别模型训练方法,其特征在于,所述当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行分类处理,得到所述当前教师训练层对应的分类结果的步骤包括:
当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行特征提取,得到训练特征;
对所述训练特征依次进行卷积、全连接、池化处理,并对处理得到的特征进行分类处理,得到所述当前教师训练层对应的分类结果。
7.一种人脸识别方法,其特征在于,所述人脸识别方法应用于如权利要求1至6任一项所述的人脸识别模型训练方法中,所述人脸识别方法包括:
获取待识别图像;
将所述待识别图像输入学生模型中进行人脸识别,得到识别结果。
8.一种人脸识别模型训练装置,其特征在于,所述人脸识别模型训练装置包括:
初始训练数据获取模块,用于获取初始训练数据,并将所述初始训练数据作为当前训练数据;
教师训练结果获取模块,用于逐层选取教师模型的一个教师训练层作为当前教师训练层,且基于所述当前教师训练层,对所述当前训练数据进行训练,得到教师训练结果,并将所述教师训练结果作为下一层教师训练层的当前训练数据;
教师训练结果分类模块,用于当所述当前教师训练层存在辅助分类器时,则基于所述辅助分类器,对所述教师训练结果进行分类处理,得到所述当前教师训练层对应的分类结果;
学生训练结果获取模块,用于当所有所述教师训练层训练结束后,逐层选取学生模型的一个学生训练层作为当前学生训练层,且基于所述当前学生训练层对所述初始训练数据进行训练,得到学生训练结果,并将所述学生训练结果作为下一层学生训练层的初始训练数据;
学生训练结果分类模块,用于当所述当前学生训练层存在所述辅助分类器时,则基于所述辅助分类器,对所述学生训练结果进行分类处理,得到所述当前学生训练层对应的分类结果,其中,所述学生模型的辅助分类器个数与所述教师模型的辅助分类器个数相等;
对比模块,用于将所述教师模型的第t个分类结果与所述学生模型的第t个分类结果进行对比,得到第t个对比结果,直到所有分类结果对比结束,其中,t不大于所述学生模型的辅助分类器个数;
判断模块,用于当且仅当所有所述对比结果均为所述教师模型的分类结果与所述学生模型的分类结果一致,人脸识别模型训练通过。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的人脸识别模型训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的人脸识别模型训练方法。
CN202211432384.5A 2022-11-15 2022-11-15 人脸识别模型训练方法、人脸识别方法、装置及相关设备 Active CN115700845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211432384.5A CN115700845B (zh) 2022-11-15 2022-11-15 人脸识别模型训练方法、人脸识别方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211432384.5A CN115700845B (zh) 2022-11-15 2022-11-15 人脸识别模型训练方法、人脸识别方法、装置及相关设备

Publications (2)

Publication Number Publication Date
CN115700845A true CN115700845A (zh) 2023-02-07
CN115700845B CN115700845B (zh) 2023-08-11

Family

ID=85121163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211432384.5A Active CN115700845B (zh) 2022-11-15 2022-11-15 人脸识别模型训练方法、人脸识别方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN115700845B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116630724A (zh) * 2023-07-24 2023-08-22 美智纵横科技有限责任公司 数据模型的生成方法和图像处理方法、装置及芯片

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170083829A1 (en) * 2015-09-18 2017-03-23 Samsung Electronics Co., Ltd. Model training method and apparatus, and data recognizing method
WO2022077646A1 (zh) * 2020-10-13 2022-04-21 上海依图网络科技有限公司 一种用于图像处理的学生模型的训练方法及装置
CN114463810A (zh) * 2022-01-17 2022-05-10 北京三快在线科技有限公司 一种人脸识别模型的训练方法和装置
CN114611672A (zh) * 2022-03-16 2022-06-10 腾讯科技(深圳)有限公司 模型训练方法、人脸识别方法及装置
CN115019123A (zh) * 2022-05-20 2022-09-06 中南大学 一种遥感图像场景分类的自蒸馏对比学习方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170083829A1 (en) * 2015-09-18 2017-03-23 Samsung Electronics Co., Ltd. Model training method and apparatus, and data recognizing method
WO2022077646A1 (zh) * 2020-10-13 2022-04-21 上海依图网络科技有限公司 一种用于图像处理的学生模型的训练方法及装置
CN114463810A (zh) * 2022-01-17 2022-05-10 北京三快在线科技有限公司 一种人脸识别模型的训练方法和装置
CN114611672A (zh) * 2022-03-16 2022-06-10 腾讯科技(深圳)有限公司 模型训练方法、人脸识别方法及装置
CN115019123A (zh) * 2022-05-20 2022-09-06 中南大学 一种遥感图像场景分类的自蒸馏对比学习方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116630724A (zh) * 2023-07-24 2023-08-22 美智纵横科技有限责任公司 数据模型的生成方法和图像处理方法、装置及芯片
CN116630724B (zh) * 2023-07-24 2023-10-10 美智纵横科技有限责任公司 数据模型的生成方法和图像处理方法、装置及芯片

Also Published As

Publication number Publication date
CN115700845B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN112685565A (zh) 基于多模态信息融合的文本分类方法、及其相关设备
CN111950723B (zh) 神经网络模型训练方法、图像处理方法、装置及终端设备
CN111476268A (zh) 翻拍识别模型训练、图像识别方法、装置、设备及介质
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN112395390B (zh) 意图识别模型的训练语料生成方法及其相关设备
CN111159358A (zh) 多意图识别训练和使用方法及装置
CN112016502B (zh) 安全带检测方法、装置、计算机设备及存储介质
CN111191207A (zh) 电子文件的控制方法、装置、计算机设备及存储介质
CN111126347A (zh) 人眼状态识别方法、装置、终端及可读存储介质
CN115700845B (zh) 人脸识别模型训练方法、人脸识别方法、装置及相关设备
CN113140012B (zh) 图像处理方法、装置、介质及电子设备
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN113343898B (zh) 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备
CN112434746B (zh) 基于层次化迁移学习的预标注方法及其相关设备
CN103984415A (zh) 一种信息处理方法及电子设备
CN110532448B (zh) 基于神经网络的文档分类方法、装置、设备及存储介质
CN115424335B (zh) 活体识别模型训练方法、活体识别方法及相关设备
CN111709851A (zh) 基于rfid及面部识别的酒店安全入住的方法、装置及设备
CN109933679A (zh) 图像中的对象类型识别方法、装置和设备
CN115222047A (zh) 一种模型训练方法、装置、设备及存储介质
CN112115740B (zh) 用于处理图像的方法和装置
CN112395450A (zh) 图片文字检测方法、装置、计算机设备及存储介质
CN112733645A (zh) 手写签名校验方法、装置、计算机设备及存储介质
CN111582143A (zh) 基于图像识别的学生课堂签到方法、装置及存储介质
CN117542085B (zh) 基于知识蒸馏的园区场景行人检测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 205, Building B1, Huigu Science and Technology Industrial Park, No. 336 Bachelor Road, Bachelor Street, Yuelu District, Changsha City, Hunan Province, 410000

Patentee after: Wisdom Eye Technology Co.,Ltd.

Country or region after: China

Address before: 410205, Changsha high tech Zone, Hunan Province, China

Patentee before: Wisdom Eye Technology Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address