CN110188593B

CN110188593B - 提高人脸识别深度网络训练效率和效果的验证集反馈方法

Info

Publication number: CN110188593B
Application number: CN201910287187.0A
Authority: CN
Inventors: 高华; 陈胜勇
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2019-04-11
Filing date: 2019-04-11
Publication date: 2021-05-18
Anticipated expiration: 2039-04-11
Also published as: CN110188593A

Abstract

一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法，包括如下步骤：步骤1：确定人脸识别深度神经网络训练任务、训练数据集和评估标准，将训练数据集按比例分成互不重叠的训练集和验证集；步骤2：初始化模型M₀，确定候选模型参数的个数N；步骤3：在训练集上随机采样生成N个训练集序列；步骤4：分别以M₀为起点，在每个训练数据序列上用反向传播方法更新训练模型；步骤5：在验证集上评估步骤4生成的N个候选模型的效果；步骤6：按照模型的效果赋予每个候选模型概率P_n，结合随机性选择1个候选模型替代模型M₀；步骤7：重复步骤3至步骤6直至训练结束。本发明有效提升深度神经网络训练的效果和效率。

Description

提高人脸识别深度网络训练效率和效果的验证集反馈方法

技术领域

本发明涉及机器学习和人工智能算法领域，尤其是一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法。

背景技术

深度神经网络大幅度提升了机器学习的性能，在目标检测、模式识别、语义分割和自然语言处理等领域取得了极大的成功，成为目前机器学习理论研究和工业应用的一个主流分支。如何提高深度神经网络的训练效率，提升训练的效果，是目前影响深度神经网络发展和应用的关键问题之一。

已有的人脸识别深度神经网络训练通过误差反向传播迭代更新网络模型的参数，是一个开环过程。在线难例挖掘(Online Hard Example Mining，OHFM)方法根据各训练数据实例的损失值，从批量训练数据实例中查找识别困难实例，一方面完全采用困难实例训练模型存在过拟合风险，另一方面训练困难实例与提升训练效果没有必然的因果关系。

发明内容

为了解决现有人脸识别深度神经网络训练过程缺乏闭环控制的问题，本发明提供一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法，根据不同训练数据组合下的模型在验证集上的效果反馈控制训练过程，是一种闭环控制方式。

为实现上述目的，本发明解决其技术问题所采用的技术方案：

一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法，所述方法包括如下步骤：

步骤1：确定人脸识别深度神经网络训练数据集和评估标准，将训练数据集按比例分成互不重叠的两个数据子集：训练集T和验证集V，训练集T用来执行反向传播过程，验证集V用来评估模型的效果；

步骤2：初始化模型M₀，确定候选模型的个数N，在验证集V上评估模型M₀的效果，记为R₀；

步骤3：将训练集T随机打乱N次，保存打乱的训练集{T_n}_{n＝1，...，N}，将每一份打乱的训练集T_n(n＝1，2，...，N)等分成K批次(batch)，记作训练数据序列{T_n，k}_{k＝1，...，K}；

步骤4：将模型M₀复制N份，分别以模型M₀为起点，在每一份训练数据序列{T_n，k}_{k＝1，...，K}上按照反向传播方法更新训练模型，得到N个候选模型{M_n}_{n＝1，...，N}；

步骤5：在验证集V上评估N个模型{M_n}_{n＝1，...，N}的效果，记为{R_n}_{n＝1，...，N}，计算N个模型{M_n}_{n＝1，...，N}的增益，第n个模型的增益记如下：

∈是一个很小的正数；

步骤6：赋予每个候选模型概率P_n：

为每个候选模型设置区间An：

P₀＝0

随机产生[0，1]区间的均匀随机数p，如果p∈A_n则候选模型M_n被选中，用M_n代替初始模型M₀，P_n代替初始模型的评估P₀；

步骤7：重复步骤3至步骤6直至训练结束。

与现有技术相比，本发明的有益效果是：本发明在训练数据集的不同采样序列上更新模型，根据模型在验证集的效果控制训练过程，是一种闭环控制方式，可以有效提升深度神经网络训练的效果，提高训练的效率。

附图说明

图1是本发明一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图1，对本发明实施例中的技术方案进行清楚、完整地描述。

参照图1，一种用于提高人脸识别深度神经网络训练效率和效果的验证集反馈方法，包括如下步骤：

步骤1：收集50000张有ID标注的人脸图像作为训练数据集，按9：1比例分成互不重叠的训练集T(45000张)和验证集V(5000张)，选择ResNet网络结构，设置初始学习率0.01、SGD学习方式、Step＝10000、batch_size＝100等超参数；

步骤2：初始化ResNet模型M₀，在验证集V上评估模型M₀的分类损失R₀，确定候选训练方案的个数N＝10；

步骤3：将训练集T随机打乱10次，保存打乱后的训练集T₁、T₂、...和T₁₀，将每一份打乱的训练集T_n(n＝1，2，...，10)等分成450批(每批100张)，记作训练数据序列{T_n，k}_{k＝1，...，450}；

步骤4：将模型M₀复制10份，分别以模型M₀为起点，在10份训练数据序列{T_n，k}_{k＝1，...，450}(n＝1，2，...，10)上分别按照反向传播方法更新训练模型，得到10个候选模型{M_n}_{n＝1，...，10}；

步骤5：在验证集V上评估10个模型{M_n}_{n＝1，...，N}的分类损失R₁、R₂、...和R₁₀，计算每个候选模型的增益：

赋予每个候选模型概率P_n(n＝1，2，...，10)：

步骤6：为每个候选模型设置区间A_n(n＝1，2，...，10)：

P₀＝0

步骤7：重复步骤3～步骤6直至训练结束。

显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

1.一种提高人脸识别深度网络训练效率和效果的验证集反馈方法，其特征在于，所述方法包括如下步骤：

步骤3：将训练集T随机打乱N次，保存打乱的训练集{T_n}_{n＝1，...，N}，将每一份打乱的训练集T_n等分成K批次，n＝1，2，...，N，记作训练数据序列{T_n，k}_{k＝1，...，K}；

∈是一个很小的正数；

步骤6：赋予每个候选模型概率P_n：

为每个候选模型设置区间A_n：

P₀＝0

步骤7：重复步骤3至步骤6直至训练结束。