CN114528937A - 模型训练方法、装置、设备及系统 - Google Patents
模型训练方法、装置、设备及系统 Download PDFInfo
- Publication number
- CN114528937A CN114528937A CN202210151523.0A CN202210151523A CN114528937A CN 114528937 A CN114528937 A CN 114528937A CN 202210151523 A CN202210151523 A CN 202210151523A CN 114528937 A CN114528937 A CN 114528937A
- Authority
- CN
- China
- Prior art keywords
- training
- model
- student model
- student
- distillation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 640
- 238000000034 method Methods 0.000 title claims abstract description 151
- 238000004821 distillation Methods 0.000 claims abstract description 340
- 238000012545 processing Methods 0.000 claims abstract description 146
- 230000004927 fusion Effects 0.000 claims abstract description 60
- 238000009825 accumulation Methods 0.000 claims abstract description 51
- 230000006870 function Effects 0.000 claims description 106
- 230000008569 process Effects 0.000 claims description 69
- 238000003860 storage Methods 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 26
- 230000005540 biological transmission Effects 0.000 description 18
- 230000000737 periodic effect Effects 0.000 description 16
- 230000006872 improvement Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本说明书实施例提供了一种模型训练方法、装置、设备及系统,其中方法包括:图像采集设备采集待识别用户的生物特征图像,基于学生模型对生物特征图像进行识别处理,得到识别结果;若根据识别结果确定生物特征图像满足预设的样本累积条件,则将生物特征图像确定为第一目标样本并保存;确定是否满足学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型;其中,学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。
Description
技术领域
本文件涉及计算机技术领域,尤其涉及一种模型训练方法、装置、设备及系统。
背景技术
近年来,生物识别技术在众多领域中得以广泛应用,例如支付领域、考勤领域、门禁认证领域等。当前的生物识别过程中,由于生物特征的采集设备的计算资源有限,不具备识别模型的训练能力且生物特征的识别性能偏低,因此通常是采集设备将采集到的生物特征图像发送给服务端,由服务端进行生物特征识别和图像存储等操作。然而,生物特征图像的跨设备传输往往存在用户隐私泄露的风险。因此,如何在采集设备的计算资源有限的情况下,实现在采集设备侧高效的生物特征识别是当前急需解决的技术问题。
发明内容
本说明书一个或多个实施例提供了一种模型训练方法,应用于图像采集设备。该方法包括采集待识别用户的生物特征图像。基于学生模型对所述生物特征图像进行识别处理,得到识别结果。其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。确定是否满足所述学生模型的自蒸馏训练条件。若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练方法。该方法包括根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练方法。该方法包括基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种模型训练装置,应用于图像采集设备。该装置包括采集模块,采集待识别用户的生物特征图像。该装置还包括识别模块,基于学生模型对所述生物特征图像进行识别处理,得到识别结果。其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。该装置还包括第一确定模块,若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。该装置还包括第二确定模块,确定是否满足所述学生模型的自蒸馏训练条件。该装置还包括训练模块,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练装置。该装置包括训练模块,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。该装置还包括发送模块,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练装置。该装置还包括训练模块,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。该装置还包括发送模块,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。该装置还包括保存模块,生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种模型训练系统。该系统包括服务端和图像采集设备。所述服务端,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。向图像采集设备发送所述学生模型;所述训练样本集中的训练样本包括用户的生物特征。所述图像采集设备,采集待识别用户的生物特征图像;基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果。若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。确定是否满足所述学生模型的自蒸馏训练条件。若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练系统。该系统包括区块链系统和图像采集设备。所述区块链系统,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。向所述图像采集设备发送所述学生模型。以及,生成所述学生模型的训练记录信息并保存至所述区块链系统中。所述训练样本集中的训练样本包括用户的生物特征。所述图像采集设备,采集待识别用户的生物特征图像。基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果。若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。确定是否满足所述学生模型的自蒸馏训练条件。若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练设备。该设备包括处理器。该设备还包括被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器采集待识别用户的生物特征图像。基于学生模型对所述生物特征图像进行识别处理,得到识别结果。其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。确定是否满足所述学生模型的自蒸馏训练条件。若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练设备。该设备包括处理器。该设备还包括被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种模型训练设备。该设备包括处理器。该设备还包括被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时采集待识别用户的生物特征图像。基于学生模型对所述生物特征图像进行识别处理,得到识别结果。其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得。若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存。确定是否满足所述学生模型的自蒸馏训练条件。若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。所述训练样本集中的训练样本包括用户的生物特征。向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理。在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存。以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。生成所述学生模型的训练记录信息并保存至所述区块链系统中。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种模型训练方法的第一种场景示意图;
图2为本说明书一个或多个实施例提供的一种模型训练方法的第一种流程示意图;
图3为本说明书一个或多个实施例提供的一种模型训练方法的第二种流程示意图;
图4为本说明书一个或多个实施例提供的一种模型训练方法的第三种流程示意图;
图5为本说明书一个或多个实施例提供的一种模型训练方法的第四种流程示意图;
图6为本说明书一个或多个实施例提供的一种模型训练方法的第五种流程示意图;
图7为本说明书一个或多个实施例提供的一种模型训练方法的第六种流程示意图;
图8为本说明书一个或多个实施例提供的一种模型训练方法的第二种场景示意图;
图9为本说明书一个或多个实施例提供的一种模型训练方法的第七种流程示意图;
图10为本说明书一个或多个实施例提供的一种模型训练装置的第一种模块组成示意图;
图11为本说明书一个或多个实施例提供的一种模型训练装置的第二种模块组成示意图;
图12为本说明书一个或多个实施例提供的一种模型训练装置的第三种模块组成示意图;
图13为本说明书一个或多个实施例提供的一种模型训练系统的第一种组成示意图;
图14为本说明书一个或多个实施例提供的一种模型训练系统的第二种组成示意图;
图15为本说明书一个或多个实施例提供的一种模型训练设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
图1为本说明书一个或多个实施例提供的模型训练方法的应用场景示意图,如图1所示,该场景包括:图像采集设备和服务端。其中,图像采集设备可以是具有生物特征采集功能的物联网设备,例如智能考勤设备、智能门禁设备、智能摄像头设备等(图1中仅示出智能摄像头设备);图像采集设备还可以是具有生物特征采集功能的终端设备,如手机、平板电脑、台式计算机、便携笔记本式计算机等(图1中仅示出手机)。服务端可以是独立的服务器,如云端服务器、普通的服务器等,服务端也可以是由多个服务器组成的服务器集群。
具体的,服务端根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;其中,训练样本集中的训练样本包括用户的生物特征;服务端将得到的学生模型发送给图像采集设备。图像采集设备接收到服务端发送的学生模型后,将学生模型部署于图像采集设备中,并在采集到待识别用户的生物特征图像时,基于自身部署的学生模型对该生物特征图像进行识别处理,得到识别结果。图像采集设备若根据识别结果确定该生物特征图像满足预设的样本累积条件,则将该生物特征图像确定为第一目标样本并保存。以及,图像采集设备确定是否满足学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。其中,生物特征图像中包括的生物特征可以是人脸、指纹、掌纹、虹膜等中的一个或多个。由此,在服务端基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量也远小于教师模型,具有较快的识别速率,因此,服务端通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行有效的生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
基于上述应用场景架构,本申请一个或多个实施例提供了一种模型训练方法。图2为本说明书一个或多个实施例提供的一种模型训练方法的流程示意图,图2中的方法能够由图1中的图像采集设备执行,如图2所示,该方法包括以下步骤:
步骤S102,采集待识别用户的生物特征图像;
本说明书实施例提供的模型训练方法,可应用于各种需要进行生物特征识别的场景,例如,基于生物特征识别的支付场景,相应的,待识别用户可以是支付的请求用户;又如,基于生物特征识别的考勤场景,相应的,待识别用户可以是待考勤的用户;再如,基于生物特征识别的业务办理场景,相应的,待识别用户可以是业务办理的请求用户等。可以理解的是,对于不同的应用场景,待识别用户可以是不同类型的用户,这里不再一一列举。
步骤S104,基于学生模型对生物特征图像进行识别处理,得到识别结果;其中,学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
具体的,服务端首先根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;其中,训练样本集中的训练样本包括用户的生物特征;服务端将得到的学生模型发送给图像采集设备。图像采集设备在采集到待识别用户的生物特征图像时,将生物特征图像输入学生模型中进行识别处理,得到识别结果。其中,服务端根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理的过程可参见后文的相关描述,重复之处这里不再赘述。
步骤S106,若根据识别结果确定生物特征图像满足预设的样本累积条件,则将生物特征图像确定为第一目标样本并保存;
为了实现在图像采集设备侧的模型训练,从而不断的提升学生模型的生物特征识别性能,实现对学生模型的优化,本说明书实施例中,图像采集设备在确定采集的生物特征图像满足预设的样本累积条件时,将采集的生物特征图像确定为第一目标样本并保存。
步骤S108,确定是否满足学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,确定是否到达预设的自蒸馏训练周期,若到达预设的自蒸馏训练周期,且确定保存的第一目标样本的数量不少于第一预设数量,则确定满足学生模型的自蒸馏训练条件;基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。或者,确定保存的第一目标样本的数量是否到达第二预设数量,若是,则确定满足学生模型的自蒸馏训练条件;基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。其中,自蒸馏训练处理的过程可参见后文的相关描述。
本说明书一个或多个实施例中,在服务端基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型部署在图像采集设备中,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的有效生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
为了不断的提升学生模型的识别准确性,本申请一个或多个实施例中,图像采集设备每次得到识别结果之后,确定识别结果的识别分数,并根据该识别分数确定对应的生物特征图像是否满足预设的样本累计条件。具体的,如图3所示,步骤S104之后还可以包括以下步骤S105-2和步骤S105-4:
步骤S105-2,获取识别结果对应的生物特征图像的第一图像特征和待识别用户的基准生物特征图像的第二图像特征;
具体的,获取在基于学生模型对生物特征图像进行识别处理过程中,学生模型提取的该生物特征图像的第一图像特征;以及从指定的图像库中获取待识别用户的基准生物特征图像的第二图像特征。其中,指定的图像库中包括多个用户的基准生物特征图像。
步骤S105-4,根据第一图像特征和第二图像特征确定识别结果的识别分数;
具体的,计算第一图像特征和第二图像特征之间的余弦相似度;根据预设的识别分数计算方式,基于余弦相似度计算识别结果的识别分数。识别分数越高,表征识别结果的准确性越高。在一种实施方式中,预设的识别分数计算方式可以为P=50+50*<f1,f2>,其中,f1为第一图像特征,f2为第二图像特征,<f1,f2>为第一图像特征与第二图像特征的余弦相似度。需要指出的是,识别分数的计算方式不限为该计算方式,其可以在实际应用中根据需要自行设定。
与步骤S105-2和步骤S105-4对应的,如图3所示,步骤S106可以包括以下步骤S106-2:
步骤S106-2,若确定识别分数位于预设的第一分数区间,则确定生物特征图像满足预设的样本累积条件,将生物特征图像确定为第一目标样本并保存。
在一种实施方式中,可以预先设定分数阈值T,当识别结果的分数大于分数阈值T时,表征识别结果的准确性高,反之表征识别结果的准确性偏低;第一分数区间可是为[T-5,T]。由此,通过累计部分识别结果准确偏低的生物特征图像以及累计部分识别结果准确性高的生物特征图像,并将其作为第一目标样本,从而可基于该第一目标样本对学生模型进行自蒸馏训练处理,而无需从外界获取训练样本,因此能够提升自蒸馏训练的训练效率,以及提升学生模型的准确性。
可以理解的是,由于识别结果表征对应的生物特征图像所对应的用户身份,因此,可以第一目标样本的识别结果确定为其标签数据,且在自蒸馏训练处理过程中,第一目标样本中识别结果准确偏低的部分样本可以作为负样本,第一目标样本中识别结果准确性高的部分样本可以作为正样本。
本说明书一个或多个实施例中,为了提升学生模型的准确性,图像采集设备基于融合指导和一对多指导的自蒸馏训练方式进行自蒸馏训练处理。具体的,如图4所示,步骤S108可以包括以下步骤S108-2和步骤S108-4:
步骤S108-2,确定是否满足所述学生模型的自蒸馏训练条件,若是,则将保存的第一目标样本划分为至少一个训练集;
其中,将保存的第一目标样本划分为至少一个训练集可以包括:按照预设的每个训练集包括的样本数量,将保存的各第一目标样本划分为至少一个训练集。
步骤S108-4,基于训练集和预设的第一损失函数,对学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,第一损失函数包括:多分类损失函数、第一自蒸馏损失函数和第二自蒸馏损失函数;多分类损失函数,用于对学生模型每一层输出的图像特征进行分类处理;第一自蒸馏损失函数,用于采用对学生模型各层的分类结果进行融合所得的融合分类结果,对学生模型的每一层的分类结果进行指导;第二自蒸馏损失函数,用于采用学生模型的最后一层输出的图像特征,对学生模型的除最后一层之外的每一层的学习过程进行指导。
第一损失函数可以表示为:
其中,Ltotal表征总损失;B表征学生模型;li为学生模型的第i层,LB为学生模型的总层数;Lce(fB-li,y)为多分类损失函数,表征对学生模型的第i层输出的图像特征fB-li进行分类处理的结果为y;LKD(pB-li,pB-Ensemble)为第一自蒸馏损失函数,pB-li为学生模型的第i层的分类结果,pB-Ensemble为对学生模型的各层的分类结果进行融合所得的融合分类结果;LKD-mse(Fmap-B-li,Resize(Fmap-B-LB))为第二自蒸馏损失函数,Fmap-B-li为学生模型的第i层输出的图像特征,Resize(Fmap-B-LB)为学生模型的最后一层输出的图像特征。
可选地,当基于第一损失函数确定的损失值到达预设损失值时,停止训练,并将对应的模型确定为更新后的学生模型。或者,当迭代训练的次数到达预设次数时,停止训练,并将对应的模型确定为更新后的学生模型。
在自蒸馏训练过程中,通过采用对各层的分类结果进行融合所得的融合分类结果对每一层的分类结果进行指导,即融合指导;以及采用最后一层输出的图像特征,对除最后一层之外的每一层的学习过程进行指导,即一对多指导;不仅能够提升训练速度,而且能够提升学生模型的模型精度。再者,由图像采集设备进行学生模型的自蒸馏训练,以优化学生模型,而无需服务端对学生模型进行优化,因此服务端无需对多个版本的学生模型进行管理,降低了学生模型的管理成本。
由于图像采集设备在不断的保存新的第一目标样本,因此每经过一次自蒸馏训练处理后,可以将当前自蒸馏训练处理所使用的第一目标样本删除,并在下一次自蒸馏训练处理时,使用累计保存的新的第一目标样本进行训练。
考虑到在学生模型的使用初期,由于其自蒸馏训练的次数偏少,因而性能略低,可能出现识别分数很低的识别结果。或者在学生模型的性能大幅提升后,由于采集的生物特征图像的质量问题或其他因素可能导致出现识别分数很低的识别结果。为了不断的提升学生模型的识别性能,本说明书一个或多个实施例中,在前述累计保存第一目标样本的基础上,还可以累计保存该识别分数很低的识别结果所对应的第二目标样本,该第二目标样本还可以称为难样本。具体的,如图5所示,步骤S105-4之后还可以包括以下步骤S105-6至步骤S105-10:与步骤S105-6至步骤S105-10对应的,步骤S108可以包括以下步骤S108-6至步骤S108-10:
步骤S105-6,若确定识别分数小于预设分数、且重新对待识别用户进行识别处理后识别分数连续小于该预设分数的次数到达预设次数,则将最后一次进行识别处理所采集的生物特征图像确定为第二目标样本并保存;
具体的,若确定识别分数小于预设分数,则重新采集待识别用户的生物特征图像,并基于学生模型对重新采集的生物特征图像进行识别处理,得到识别结果;按照前述方式确定该识别结果的识别分数,并确定该识别分数是否小于预设分数;若是则继续按照该方式重新对待识别用户进行识别处理并得到对应的识别分数。确定识别分数连续小于预设分数的次数是否到达预设次数,若是,则将最后一次进行识别处理所采集的生物特征图像确定为第二目标样本并保存。其中,预设分数可以为T-10,预设次数可以为3次,相应的,将连续进行的3次识别处理中,第3次进行识别处理所采集的生物特征图像确定为第二目标样本并保存。
步骤S105-8,若确定满足预设的标签获取条件,则根据保存的第二目标样本从服务端获取第二目标样本的标签数据;其中,标签数据由教师模型生成。
可选的,若确定第二目标样本的数量到达第三预设数量,则确定满足预设的标签获取条件。或者,若确定到达预设的自蒸馏训练周期,则确定满足预设的标签获取条件。以及,在确定满足标签获取条件时,根据第二目标样本向服务端发送标签数据获取请求。服务端接收到标签数据获取请求时,基于教师模型生成第二目标样本的标签数据,并将标签数据发送给图像采集设备。
步骤S105-10,将标签数据与第二目标样本关联保存,执行步骤S108-6;
步骤S108-6,若确定满足学生模型的自蒸馏训练条件,则确定是否存在第二目标样本和第二目标样本的标签数据,是则执行步骤S108-8,否则执行步骤S108-10;
步骤S108-8,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本、确定的第一目标样本的标签数据、第二目标样本和第二目标样本的标签数据对学生模型进行自蒸馏训练处理,得到更新后的学生模型;
具体的,将携带标签数据的第一目标样本和携带标签数据的第二目标样本确定为待训练样本;将该待训练样本划分为至少一个训练集,基于训练集和预设的第一损失函数,对学生模型进行自蒸馏训练处理,得到更新后的学生模型。
步骤S108-10,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本和确定的第一目标样本的标签数据对学生模型进行自蒸馏训练处理,得到更新后的学生模型。
进一步的,在图像采集设备得到更新后的学生模型之后,方法还包括:基于更新后的学生模型对采集的待识别用户的生物特征图像进行识别处理,得到识别结果。也就是说,图像采集设备每次得到更新后的学生模型后,均将先前部署的学生模型替换为更新后的学生模型,并在采集到待识别用户的生物特征图像之后,基于该更新后的学生模型对生物特征图像进行识别处理,以提升识别的准确性。
进一步的,为了实现图像采集设备侧的生物识别和模型训练,本说明书一个或多个实施例中,步骤S102之前还包括:接收服务端发送的学生模型,将接收到的学生模型部署于图像采集设备中。
本说明书一个或多个实施例中,在服务端基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型部署在图像采集设备中,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供了另一种模型训练方法,图6为本说明书一个或多个实施例提供的另一种模型训练方法的流程示意图,图6中的方法能够由图1中的服务端执行;如图6所示,该方法包括以下步骤:
步骤S202,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;其中,训练样本集中的训练样本包括用户的生物特征;
具体的,将训练样本集划分为多个训练子集;分别将每个训练子集输入教师模型中进行特征提取处理,得到训练子集中每个训练样本对应的第三图像特征;基于训练子集、第三图像特征和预设的第二损失函数,对待训练的学生网络进行蒸馏训练处理,得到学生模型。
更加具体的,服务端按照预设的训练子集包括的样本数量,将训练样本集划分为多个训练子集;分别将每个训练子集输入预先训练的教师模型中进行特征提取处理,得到训练子集中每个训练样本对应的第三图像特征;迭代的将每个训练子集输入到待训练的学生网络中进行训练处理,得到学生网络输出的每个训练样本对应的第四图像特征,基于第三图像特征、第四图像特征和预设第二损失函数计算损失值,根据损失值调节学生网络的参数,直至确定满足预设的停止训练条件,将对应的学生网络确定为学生模型。
其中,第二损失函数包括:多分类损失函数、第一蒸馏损失函数和第二蒸馏损失函数;多分类损失函数,用于对学生网络最后一层输出的第四图像特征进行分类处理;第一蒸馏损失函数,用于表征教师模型输出的第三图像特征与学生网络输出的第四图像特征之间的差异程度;第二蒸馏损失函数,用于采用教师模型最后一层输出的第三图像特征,对学生网络的每个中间层的学习过程进行指导。
第二损失函数可以表示为:
其中,Ltotal表征总损失;A表征教师模型,B表征学生网络;li为学生网络的第i层,LB为学生网络的总层数;Lce(x,y)为多分类损失函数,表征对学生网络最后一层输出的第二图像特征x进行分类处理的分类结果为y;LKD(fA,fB)为第一蒸馏损失函数,fA为教师模型输出的第一图像特征,fB为学生网络输出的第二图像特征;LKD-mse(Fmap-B-li,Resize(Fmap-A-LA))为第二蒸馏损失函数,Fmap-B-1i为学生网络的每个中间层输出的图像特征;Resize(Fmap-A-LA)为教师模型的最后一层输出的第一图像特征。
由此,在蒸馏训练的过程中,可以通过第一蒸馏损失函数约束学生网络输出的第二图像特征与教师模型输出的第一图像特征尽量保持一致。同时,由于教师模型最后一层输出的第一图像特征的信息密度最大,最适合进行蒸馏指导。因此,本说明书中,通过教师模型最后一层输出的第一图像特征对学生网络的每个中间层的学习过程进行指导,即一对多指导;相较于现有的学生模型的训练过程中,采用教师网络的每个中间层输出的图像特征来对应指导学生网络的中间层的学习,即一对一指导;本说明书中的蒸馏训练方式的效果更佳。
进一步的,确定满足预设的停止训练条件可以包括:若确定基于第二损失函数计算的损失值到达预设损失值,则确定满足预设的停止训练条件;或者,若确定每个训练子集的训练次数均到达预设次数,则确定满足预设的停止训练条件。教师模型的训练过程,可参考现有的模型训练过程,对此本说明书中不做具体限定。
步骤S204,向图像采集设备发送学生模型,以使图像采集设备基于学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。
其中,图像采集设备在接收到学生模型之后的处理过程,可参见前文的相关描述,重复之处这里不再赘述。
为了提升图像采集设备中部署的学生模型的性能,本说明书一个或多个实施例中,服务端还可以基于教师模型对学生模型难以识别的生物特征图像进行标签数据的生成处理,从而使图像采集设备基于该生物特征图像及其标签数据对学生模型进行自蒸馏训练处理。具体的,如图7所示,方法还可以包括以下步骤S206至步骤S210:
步骤S206,接收图像采集设备发送的标签数据获取请求;其中,标签数据请求包括待标注标签数据的第二目标样本;
其中,标签数据获取请求中还可以包括每个第二目标样本的样本标识,该样本标识可以是图像采集设备在保存第二目标样本时根据预设方式所确定,样本标识例如为编号等。
步骤S208,基于教师模型生成第二目标样本的标签数据;
具体的,将第二目标样本输入教师模型中进行识别处理,根据识别结果确定第二目标样本的标签数据;其中,标签数据用于表征第二目标样本中的生物特征对应的用户身份。
步骤S210,将标签数据发送给图像采集设备,以使图像采集设备利用第一目标样本、第一目标样本的标签数据、第二目标样本和第二目标样本的标签数据对学生模型进行自蒸馏训练处理。
具体的,将标签数据与对应的第二目标样本的样本标识关联发送给图像采集设备。
本说明书一个或多个实施例中,在服务端基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,服务端通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
考虑到区块链具有不可篡改以及智能合约的自动执行等特性,本说明书一个或多个实施例中,还可以通过区块链系统进行学生模型的训练。图8为本说明书一个或多个实施例提供的另一种模型训练的应用场景示意图,如图8所示,该场景可以包括:区块链系统和图像采集设备。其中,区块链系统包括接入区块链的至少一个区块链节点(图8中仅示出一个)。图像采集设备可以是具有生物特征采集功能的物联网设备,例如智能考勤设备、智能门禁设备、智能摄像头设备等(图8中仅是出智能摄像头设备);图像采集设备还可以是具有生物特征采集功能的终端设备,如手机、平板电脑、台式计算机、便携笔记本式计算机等(图8中仅示出手机)。
具体的,区块链节点基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;其中,训练样本集中的训练样本包括用户的生物特征;区块链节点将学生模型发送给图像采集设备,生成学生模型的训练记录信息并保存至区块链中。图像采集设备接收到区块链节点发送的学生模型后,将学生模型部署于图像采集设备中,并在采集到待识别用户的生物特征图像时,基于自身部署的学生模型对该生物特征图像进行识别处理,得到识别结果。图像采集设备若根据识别结果确定该生物特征图像满足预设的样本累积条件,则将该生物特征图像确定为第一目标样本并保存。以及,图像采集设备确定是否满足学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型。其中,生物特征图像中包括的生物特征可以是人脸、指纹、掌纹、虹膜等中的一个或多个。
基于图8所示的应用场景架构,对应前述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供了另一种模型训练方法。图9为本说明书一个或多个实施例提供的另一种模型训练方法的流程示意图,图9中的方法能够由图8中的区块链系统执行,如图9所示,该方法包括以下步骤:
步骤S302,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;其中,训练样本集中的训练样本包括用户的生物特征;
具体的,在确定满足蒸馏训练条件时(例如,在接收到蒸馏训练指令时),调用区块链系统中部署的智能合约,基于智能合约根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型。其中,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型的过程,可参见前述相关描述,重复之处这里不再赘述。
步骤S304,向图像采集设备发送学生模型,以使图像采集设备基于学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,图像采集设备接收到学生模型之后的操作可参见前文的相关描述,重复之处这里不再赘述。
步骤S306,生成学生模型的训练记录信息并保存至区块链系统中。
具体的,根据学生模型的训练时间、确定的学生模型的版本信息等生成学生模型的训练记录信息并保存至区块链系统中。其中,训练记录信息的具体内容可以在实际应用中根据需要自行设定,对此本说明书中不做具体限定。
本说明书一个或多个实施例中,在区块链系统中基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,区块链系统通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。再者,基于智能合约进行蒸馏训练处理,能够基于智能合约自动执行、无法人为参与等特性,提升蒸馏训练效率以及学生模型的准确性。通过将学生模型的训练记录信息保存至区块链系统中,能够基于区块链的不可篡改等特性对学生模型的蒸馏训练进行追溯处理。
对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种模型训练装置,应用于图像采集设备。图10为本说明书一个或多个实施例提供的一种模型训练装置的模块组成示意图,如图10所示,该装置包括:
采集模块401,采集待识别用户的生物特征图像;
识别模块402,基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
第一确定模块403,若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
第二确定模块404,确定是否满足所述学生模型的自蒸馏训练条件;
自蒸馏训练模块405,若所述第二确定模块的确定结果为是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,所述装置还包括第三确定模块;
所述第三确定模块,获取所述识别结果对应的所述生物特征图像的第一图像特征和所述待识别用户的基准生物特征图像的第二图像特征;根据所述第一图像特征和所述第二图像特征确定所述识别结果的识别分数;
相应的,所述第二确定模块404,若确定所述识别分数位于预设的第一分数区间,则确定所述生物特征图像满足预设的样本累积条件。
可选地,所述自蒸馏训练模块405,将所述第一目标样本划分为至少一个训练集;以及,
基于所述训练集和预设的第一损失函数,对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,所述第一损失函数包括:多分类损失函数、第一自蒸馏损失函数和第二自蒸馏损失函数;所述多分类损失函数,用于对所述学生模型每一层输出的图像特征进行分类处理;所述第一自蒸馏损失函数,用于采用对所述学生模型各层的分类结果进行融合所得的融合分类结果,对所述学生模型的每一层的分类结果进行指导;所述第二自蒸馏损失函数,用于采用所述学生模型的最后一层输出的图像特征,对所述学生模型的除所述最后一层之外的每一层的学习过程进行指导。
本说明书一个或多个实施例提供的模型训练装置,利用学生模型对待识别用户的生物特征图像进行识别处理,并在确定满足学生模型的自蒸馏训练条件时,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型;其中,学生模型由服务端基于教师模型进行蒸馏训练所得。由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型部署于图像采集设备,使得模型训练装置在图像采集设备有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供另一种模型训练装置,应用于服务端。图11为本说明书一个或多个实施例提供的另一种模型训练装置的模块组成示意图,如图11所示,该装置包括:
蒸馏训练模块501,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
发送模块502,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,所述蒸馏训练模块501,将所述训练样本集划分为多个训练子集;以及,
分别将每个所述训练子集输入所述教师模型中进行特征提取处理,得到所述训练子集中每个训练样本对应的第三图像特征;
基于所述训练子集、所述第三图像特征和预设的第二损失函数,对所述待训练的学生网络进行蒸馏训练处理;
其中,所述第二损失函数包括:多分类损失函数、第一蒸馏损失函数和第二蒸馏损失函数;所述多分类损失函数,用于对所述学生网络最后一层输出的第四图像特征进行分类处理;所述第一蒸馏损失函数,用于表征所述教师模型输出的所述第三图像特征与所述学生网络输出的所述第四图像特征之间的差异程度;所述第二蒸馏损失函数,用于采用所述教师模型最后一层输出的所述第三图像特征,对所述学生网络的每个中间层的学习过程进行指导。
本说明书一个或多个实施例提供的模型训练装置,基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供另一种模型训练装置,应用于区块链系统。图12为本说明书一个或多个实施例提供的另一种模型训练装置的模块组成示意图,如图12所示,该装置包括:
蒸馏训练模块601,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
发送模块602,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
保存模块603,生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供的模型训练装置,在区块链系统中基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。再者,基于智能合约进行蒸馏训练处理,能够基于智能合约自动执行、无法人为参与等特性,提升蒸馏训练效率以及学生模型的准确性。通过将学生模型的训练记录信息保存至区块链系统中,能够基于区块链的不可篡改等特性对学生模型的蒸馏训练进行追溯处理。
需要说明的是,本说明书中关于模型训练装置的实施例与本说明书中关于模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的模型训练方法的实施,重复之处不再赘述。
进一步的,对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种模型训练系统。图13为本说明书一个或多个实施例提供的一种模型训练系统的组成示意图,如图13所示,该系统包括:服务端701和图像采集设备702;
所述服务端701,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;向图像采集设备702发送所述学生模型;所述训练样本集中的训练样本包括用户的生物特征;
所述图像采集设备702,采集待识别用户的生物特征图像;基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果;若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;确定是否满足所述学生模型的自蒸馏训练条件;若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供的模型训练系统,在服务端基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,服务端通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
进一步的,对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种模型训练系统。图14为本说明书一个或多个实施例提供的一种模型训练系统的组成示意图,如图14所示,该系统包括:区块链系统801和图像采集设备802;
所述区块链系统801,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;向所述图像采集设备802发送所述学生模型;以及,生成所述学生模型的训练记录信息并保存至所述区块链系统801中;所述训练样本集中的训练样本包括用户的生物特征;
所述图像采集设备802,采集待识别用户的生物特征图像;基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果;若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;确定是否满足所述学生模型的自蒸馏训练条件;若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
本说明书一个或多个实施例提供的模型训练系统,在区块链系统中基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,区块链系统通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。再者,基于智能合约进行蒸馏训练处理,能够基于智能合约自动执行、无法人为参与等特性,提升蒸馏训练效率以及学生模型的准确性。通过将学生模型的训练记录信息保存至区块链系统中,能够基于区块链的不可篡改等特性对学生模型的蒸馏训练进行追溯处理。
需要说明的是,本说明书中关于模型训练系统的实施例与本说明书中关于模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的模型训练方法的实施,重复之处不再赘述。
进一步地,对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供一种模型训练设备,该设备用于执行上述的模型训练方法,图15为本说明书一个或多个实施例提供的一种模型训练设备的结构示意图。
如图15所示,模型训练设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括模型训练设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在模型训练设备上执行存储器902中的一系列计算机可执行指令。模型训练设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906等。
在一个具体的实施例中,模型训练设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对模型训练设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
采集待识别用户的生物特征图像;
基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
确定是否满足所述学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,计算机可执行指令在被执行时,所述基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型,包括:
将所述第一目标样本划分为至少一个训练集;
基于所述训练集和预设的第一损失函数,对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,所述第一损失函数包括:多分类损失函数、第一自蒸馏损失函数和第二自蒸馏损失函数;所述多分类损失函数,用于对所述学生模型每一层输出的图像特征进行分类处理;所述第一自蒸馏损失函数,用于采用对所述学生模型各层的分类结果进行融合所得的融合分类结果,对所述学生模型的每一层的分类结果进行指导;所述第二自蒸馏损失函数,用于采用所述学生模型的最后一层输出的图像特征,对所述学生模型的除所述最后一层之外的每一层的学习过程进行指导。
本说明书一个或多个实施例提供的模型训练设备,利用学生模型对待识别用户的生物特征图像进行识别处理,并在确定满足学生模型的自蒸馏训练条件时,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型;其中,学生模型由服务端基于教师模型进行蒸馏训练所得。由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型部署于模型训练设备,使得模型训练设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
在另一个具体的实施例中,模型训练设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对模型训练设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,计算机可执行指令在被执行时,所述根据获取的训练样本和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,包括:
将所述训练样本集划分为多个训练子集;
分别将每个所述训练子集输入所述教师模型中进行特征提取处理,得到所述训练子集中每个训练样本对应的第三图像特征;
基于所述训练子集、所述第三图像特征和预设的第二损失函数,对所述待训练的学生网络进行蒸馏训练处理;
其中,所述第二损失函数包括:多分类损失函数、第一蒸馏损失函数和第二蒸馏损失函数;所述多分类损失函数,用于对所述学生网络最后一层输出的第四图像特征进行分类处理;所述第一蒸馏损失函数,用于表征所述教师模型输出的所述第三图像特征与所述学生网络输出的所述第四图像特征之间的差异程度;所述第二蒸馏损失函数,用于采用所述教师模型最后一层输出的所述第三图像特征,对所述学生网络的每个中间层的学习过程进行指导。
本说明书一个或多个实施例提供的模型训练设备,基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
在另一个具体的实施例中,模型训练设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对模型训练设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供的模型训练设备,在区块链系统中基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。再者,基于智能合约进行蒸馏训练处理,能够基于智能合约自动执行、无法人为参与等特性,提升蒸馏训练效率以及学生模型的准确性。通过将学生模型的训练记录信息保存至区块链系统中,能够基于区块链的不可篡改等特性对学生模型的蒸馏训练进行追溯处理。
需要说明的是,本说明书中关于模型训练设备的实施例与本说明书中关于模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的模型训练方法的实施,重复之处不再赘述。
进一步地,对应上述描述的模型训练方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令,一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
采集待识别用户的生物特征图像;
基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
确定是否满足所述学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型,包括:
将所述第一目标样本划分为至少一个训练集;
基于所述训练集和预设的第一损失函数,对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,所述第一损失函数包括:多分类损失函数、第一自蒸馏损失函数和第二自蒸馏损失函数;所述多分类损失函数,用于对所述学生模型每一层输出的图像特征进行分类处理;所述第一自蒸馏损失函数,用于采用对所述学生模型各层的分类结果进行融合所得的融合分类结果,对所述学生模型的每一层的分类结果进行指导;所述第二自蒸馏损失函数,用于采用所述学生模型的最后一层输出的图像特征,对所述学生模型的除所述最后一层之外的每一层的学习过程进行指导。
本说明书一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,利用学生模型对待识别用户的生物特征图像进行识别处理,并在确定满足学生模型的自蒸馏训练条件时,利用保存的第一目标样本对学生模型进行自蒸馏训练处理,得到更新后的学生模型;其中,学生模型由服务端基于教师模型进行蒸馏训练所得。由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型部署于图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
在另一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据获取的训练样本和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,包括:
将所述训练样本集划分为多个训练子集;
分别将每个所述训练子集输入所述教师模型中进行特征提取处理,得到所述训练子集中每个训练样本对应的第三图像特征;
基于所述训练子集、所述第三图像特征和预设的第二损失函数,对所述待训练的学生网络进行蒸馏训练处理;
其中,所述第二损失函数包括:多分类损失函数、第一蒸馏损失函数和第二蒸馏损失函数;所述多分类损失函数,用于对所述学生网络最后一层输出的第四图像特征进行分类处理;所述第一蒸馏损失函数,用于表征所述教师模型输出的所述第三图像特征与所述学生网络输出的所述第四图像特征之间的差异程度;所述第二蒸馏损失函数,用于采用所述教师模型最后一层输出的所述第三图像特征,对所述学生网络的每个中间层的学习过程进行指导。
本说明书一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。
在另一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
生成所述学生模型的训练记录信息并保存至所述区块链系统中。
本说明书一个或多个实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,在区块链系统中基于教师模型进行蒸馏训练得到学生模型,而由于学生模型具有与教师模型相近的生物识别性能,但学生模型的结构比教师模型的结构简单,学生模型在识别过程中所需的参数量要远小于教师模型,具有较快的识别速率,因此,通过将学生模型发送给图像采集设备,使得图像采集设备在有限的计算资源的情况下,能够基于该学生模型进行生物识别处理,并基于累计的第一目标样本对学生模型进行自蒸馏训练;不仅实现了图像采集设备侧的生物特征识别,避免了生物特征图像跨设备传输所造成的用户隐私泄露风险;而且实现了图像采集设备侧的周期性模型训练,能够不断的提升学生模型的性能,进而提升图像采集设备侧的生物识别的准确性。再者,基于智能合约进行蒸馏训练处理,能够基于智能合约自动执行、无法人为参与等特性,提升蒸馏训练效率以及学生模型的准确性。通过将学生模型的训练记录信息保存至区块链系统中,能够基于区块链的不可篡改等特性对学生模型的蒸馏训练进行追溯处理。
需要说明的是,本说明书中关于存储介质的实施例与本说明书中关于模型训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的模型训练方法的实施,重复之处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
Claims (22)
1.一种模型训练方法,应用于图像采集设备,包括:
采集待识别用户的生物特征图像;
基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
确定是否满足所述学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
2.根据权利要求1所述的方法,所述基于学生模型对所述生物特征图像进行识别处理,得到识别结果之后,还包括:
获取所述识别结果对应的所述生物特征图像的第一图像特征和所述待识别用户的基准生物特征图像的第二图像特征;
根据所述第一图像特征和所述第二图像特征确定所述识别结果的识别分数;
所述若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,包括:
若确定所述识别分数位于预设的第一分数区间,则确定所述生物特征图像满足预设的样本累积条件。
3.根据权利要求2所述的方法,所述根据所述第一图像特征和所述第二图像特征确定所述识别结果的识别分数,包括:
计算所述第一图像特征和所述第二图像特征之间的余弦相似度;
根据预设的识别分数计算方式,基于所述余弦相似度计算所述识别结果的识别分数。
4.根据权利要求1所述的方法,所述基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型,包括:
将所述第一目标样本划分为至少一个训练集;
基于所述训练集和预设的第一损失函数,对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
其中,所述第一损失函数包括:多分类损失函数、第一自蒸馏损失函数和第二自蒸馏损失函数;所述多分类损失函数,用于对所述学生模型每一层输出的图像特征进行分类处理;所述第一自蒸馏损失函数,用于采用对所述学生模型各层的分类结果进行融合所得的融合分类结果,对所述学生模型的每一层的分类结果进行指导;所述第二自蒸馏损失函数,用于采用所述学生模型的最后一层输出的图像特征,对所述学生模型的除所述最后一层之外的每一层的学习过程进行指导。
5.根据权利要求2所述的方法,所述根据所述第一图像特征和所述第二图像特征确定所述识别结果的识别分数之后,还包括:
若确定所述识别分数小于预设分数、且重新对所述待识别用户进行识别处理后所述识别分数连续小于所述预设分数的次数到达预设次数,则将最后一次进行识别处理所采集的生物特征图像确定为第二目标样本并保存;
若确定满足预设的标签获取条件,则根据保存的所述第二目标样本从所述服务端获取所述第二目标样本的标签数据;其中,所述标签数据由所述教师模型生成;
将所述标签数据与所述第二目标样本关联保存;
所述利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型,包括:
确定是否存在所述第二目标样本和所述标签数据;
若是,则利用保存的所述第一目标样本、确定的所述第一目标样本的标签数据、所述第二目标样本和所述第二目标样本的标签数据对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
6.根据权利要求1所述的方法,所述得到更新后的学生模型之后,还包括:
基于所述更新后的学生模型对采集的待识别用户的生物特征图像进行识别处理,得到识别结果。
7.根据权利要求1所述的方法,所述基于学生模型对采集的待识别用户的生物特征图像进行识别处理之前,还包括:
接收所述服务端发送的所述学生模型;
将所述学生模型部署于所述图像采集设备中。
8.一种模型训练方法,包括:
根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
9.根据权利要求8所述的方法,所述根据获取的训练样本和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,包括:
将所述训练样本集划分为多个训练子集;
分别将每个所述训练子集输入所述教师模型中进行特征提取处理,得到所述训练子集中每个训练样本对应的第三图像特征;
基于所述训练子集、所述第三图像特征和预设的第二损失函数,对所述待训练的学生网络进行蒸馏训练处理;
其中,所述第二损失函数包括:多分类损失函数、第一蒸馏损失函数和第二蒸馏损失函数;所述多分类损失函数,用于对所述学生网络最后一层输出的第四图像特征进行分类处理;所述第一蒸馏损失函数,用于表征所述教师模型输出的所述第三图像特征与所述学生网络输出的所述第四图像特征之间的差异程度;所述第二蒸馏损失函数,用于采用所述教师模型最后一层输出的所述第三图像特征,对所述学生网络的每个中间层的学习过程进行指导。
10.根据权利要求8所述的方法,所述方法还包括:
接收所述图像采集设备发送的标签数据获取请求;所述标签数据请求包括待标注标签数据的第二目标样本;
基于所述教师模型生成所述第二目标样本的标签数据;
将所述标签数据发送给所述图像采集设备,以使所述图像采集设备利用所述第一目标样本、所述第一目标样本的标签数据、所述第二目标样本和所述第二目标样本的标签数据对所述学生模型进行自蒸馏训练处理。
11.一种模型训练方法,包括:
基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
生成所述学生模型的训练记录信息并保存至所述区块链系统中。
12.一种模型训练装置,应用于图像采集设备,包括:
采集模块,采集待识别用户的生物特征图像;
识别模块,基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
第一确定模块,若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
第二确定模块,确定是否满足所述学生模型的自蒸馏训练条件;
自蒸馏训练模块,若所述第二确定模块的确定结果为是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
13.一种模型训练装置,包括:
蒸馏训练模块,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
发送模块,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
14.一种模型训练装置,包括:
蒸馏训练模块,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
发送模块,向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将所述生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
保存模块,生成所述学生模型的训练记录信息并保存至所述区块链系统中。
15.一种模型训练系统,包括:服务端和图像采集设备;
所述服务端,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;向所述图像采集设备发送所述学生模型;所述训练样本集中的训练样本包括用户的生物特征;
所述图像采集设备,采集待识别用户的生物特征图像;基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果;若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;确定是否满足所述学生模型的自蒸馏训练条件;若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
16.一种模型训练系统,包括:区块链系统和图像采集设备;
所述区块链系统,基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;向所述图像采集设备发送所述学生模型;以及,生成所述学生模型的训练记录信息并保存至所述区块链系统中;所述训练样本集中的训练样本包括用户的生物特征;
所述图像采集设备,采集待识别用户的生物特征图像;基于接收到的所述学生模型对对所述生物特征图像进行识别处理,得到识别结果;若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;确定是否满足所述学生模型的自蒸馏训练条件;若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
17.一种模型训练设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
采集待识别用户的生物特征图像;
基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
确定是否满足所述学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
18.一种模型训练设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
19.一种模型训练设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
生成所述学生模型的训练记录信息并保存至所述区块链系统中。
20.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
采集待识别用户的生物特征图像;
基于学生模型对所述生物特征图像进行识别处理,得到识别结果;其中,所述学生模型由服务端基于预先训练的教师模型对待训练的学生网络进行蒸馏训练所得;
若根据所述识别结果确定所述生物特征图像满足预设的样本累积条件,则将所述生物特征图像确定为第一目标样本并保存;
确定是否满足所述学生模型的自蒸馏训练条件,若是,则基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
21.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型。
22.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:
基于区块链系统中的智能合约,根据获取的训练样本集和预先训练的教师模型对待训练的学生网络进行蒸馏训练处理,得到学生模型;所述训练样本集中的训练样本包括用户的生物特征;
向图像采集设备发送所述学生模型,以使所述图像采集设备基于所述学生模型对采集的待识别用户的生物特征图像进行识别处理,在根据识别结果确定所述生物特征图像满足预设的样本累积条件时,将生物特征图像确定为第一目标样本并保存;以及在确定满足所述学生模型的自蒸馏训练条件时,基于融合指导和一对多指导的自蒸馏训练方式,利用保存的所述第一目标样本对所述学生模型进行自蒸馏训练处理,得到更新后的学生模型;
生成所述学生模型的训练记录信息并保存至所述区块链系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210151523.0A CN114528937B (zh) | 2022-02-18 | 2022-02-18 | 模型训练方法、装置、设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210151523.0A CN114528937B (zh) | 2022-02-18 | 2022-02-18 | 模型训练方法、装置、设备及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114528937A true CN114528937A (zh) | 2022-05-24 |
CN114528937B CN114528937B (zh) | 2024-10-15 |
Family
ID=81622138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210151523.0A Active CN114528937B (zh) | 2022-02-18 | 2022-02-18 | 模型训练方法、装置、设备及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528937B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183492A (zh) * | 2020-11-05 | 2021-01-05 | 厦门市美亚柏科信息股份有限公司 | 一种人脸模型精度矫正方法、装置及存储介质 |
WO2021023202A1 (zh) * | 2019-08-07 | 2021-02-11 | 交叉信息核心技术研究院(西安)有限公司 | 一种卷积神经网络的自蒸馏训练方法、设备和可伸缩动态预测方法 |
CN112949786A (zh) * | 2021-05-17 | 2021-06-11 | 腾讯科技(深圳)有限公司 | 数据分类识别方法、装置、设备及可读存储介质 |
CN113344206A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 融合通道与关系特征学习的知识蒸馏方法、装置及设备 |
CN113343898A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备 |
CN113360701A (zh) * | 2021-08-09 | 2021-09-07 | 成都考拉悠然科技有限公司 | 一种基于知识蒸馏的素描图处理方法及其系统 |
CN113378940A (zh) * | 2021-06-15 | 2021-09-10 | 北京市商汤科技开发有限公司 | 神经网络训练方法、装置、计算机设备及存储介质 |
CN113487614A (zh) * | 2021-09-08 | 2021-10-08 | 四川大学 | 胎儿超声标准切面图像识别网络模型的训练方法和装置 |
CN113591978A (zh) * | 2021-07-30 | 2021-11-02 | 山东大学 | 一种基于置信惩罚正则化的自我知识蒸馏的图像分类方法、设备及存储介质 |
-
2022
- 2022-02-18 CN CN202210151523.0A patent/CN114528937B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021023202A1 (zh) * | 2019-08-07 | 2021-02-11 | 交叉信息核心技术研究院(西安)有限公司 | 一种卷积神经网络的自蒸馏训练方法、设备和可伸缩动态预测方法 |
CN112183492A (zh) * | 2020-11-05 | 2021-01-05 | 厦门市美亚柏科信息股份有限公司 | 一种人脸模型精度矫正方法、装置及存储介质 |
CN112949786A (zh) * | 2021-05-17 | 2021-06-11 | 腾讯科技(深圳)有限公司 | 数据分类识别方法、装置、设备及可读存储介质 |
CN113378940A (zh) * | 2021-06-15 | 2021-09-10 | 北京市商汤科技开发有限公司 | 神经网络训练方法、装置、计算机设备及存储介质 |
CN113344206A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 融合通道与关系特征学习的知识蒸馏方法、装置及设备 |
CN113343898A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备 |
CN113591978A (zh) * | 2021-07-30 | 2021-11-02 | 山东大学 | 一种基于置信惩罚正则化的自我知识蒸馏的图像分类方法、设备及存储介质 |
CN113360701A (zh) * | 2021-08-09 | 2021-09-07 | 成都考拉悠然科技有限公司 | 一种基于知识蒸馏的素描图处理方法及其系统 |
CN113487614A (zh) * | 2021-09-08 | 2021-10-08 | 四川大学 | 胎儿超声标准切面图像识别网络模型的训练方法和装置 |
Non-Patent Citations (2)
Title |
---|
HUIKAI SHAO: "Efficient Deep Palmprint Recognition via Distilled Hashing Coding", 《PROCEEDINGS OF THE IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR) WORKSHOPS》, 9 April 2020 (2020-04-09), pages 1 - 10 * |
孙显: "基于知识自蒸馏的轻量化复杂遥感图像精细分类方法", 《指挥与控制学报》, 31 December 2021 (2021-12-31), pages 365 - 373 * |
Also Published As
Publication number | Publication date |
---|---|
CN114528937B (zh) | 2024-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107358157B (zh) | 一种人脸活体检测方法、装置以及电子设备 | |
CN109086961B (zh) | 一种信息风险监测方法及装置 | |
CN106611015B (zh) | 标签的处理方法及装置 | |
CN111930809A (zh) | 数据处理方法、装置及设备 | |
CN108664526A (zh) | 检索的方法和设备 | |
CN115712866B (zh) | 数据处理方法、装置及设备 | |
CN112308113A (zh) | 一种基于半监督的目标识别方法、设备及介质 | |
US11354936B1 (en) | Incremental clustering for face recognition systems | |
CN113516480A (zh) | 一种支付风险识别方法、装置及设备 | |
CN112347512A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111652286A (zh) | 一种基于图嵌入的物体识别方法、设备及介质 | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
CN116186330B (zh) | 一种基于多模态学习的视频去重方法及装置 | |
CN117251761A (zh) | 数据对象分类方法、装置、存储介质及电子装置 | |
CN117113174A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN115545572B (zh) | 一种业务风控的方法、装置、设备及存储介质 | |
CN109146395B (zh) | 一种数据处理的方法、装置及设备 | |
CN114528937B (zh) | 模型训练方法、装置、设备及系统 | |
CN115578796A (zh) | 一种活体检测模型的训练方法、装置、设备及介质 | |
CN114926437A (zh) | 一种图像质量评价方法及装置 | |
CN111143626A (zh) | 团伙识别方法、装置、设备及计算机可读存储介质 | |
CN112307371A (zh) | 小程序子服务识别方法、装置、设备及存储介质 | |
CN116821193B (zh) | 一种基于代理模型近似处理的推理查询优化方法及装置 | |
CN112115952B (zh) | 一种基于全卷积神经网络的图像分类方法、设备及介质 | |
CN111782960B (zh) | 文案推送方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |