CN108182394A

CN108182394A - 卷积神经网络的训练方法、人脸识别方法及装置

Info

Publication number: CN108182394A
Application number: CN201711414491.4A
Authority: CN
Inventors: 郝敬松
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2017-12-22
Filing date: 2017-12-22
Publication date: 2018-06-19
Anticipated expiration: 2037-12-22
Also published as: CN108182394B

Abstract

本发明公开了一种卷积神经网络的训练方法、人脸识别方法及装置，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，根据源域训练样本集合中各样本中的人脸图像的特征向量，确定第一误差，并通过第一误差对卷积神经网络的网络参数进行调整。其中，第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

Description

卷积神经网络的训练方法、人脸识别方法及装置

技术领域

本发明涉及深度学习技术领域，特别涉及一种卷积神经网络的训练方法、人脸识别方法及装置。

背景技术

目前，为了更好地识别人脸图像，越来越多的识别过程需要使用到卷积神经网络(Convolutional Neural Network，CNN)。而为了确保识别结果准确，就需要对CNN进行反复训练。目前，一般采用具有单个阈值的对比损失函数(Contrastive Loss)来对CNN进行训练。然而，由于该对比损失函数仅通过单个阈值来控制样本集合中的负样本对的收敛，以对CNN进行训练，而并未控制样本集合中的正样本对的收敛。由于样本集合中存在大量的易收敛的正样本对，而未对这些正样本对进行监督训练，不但增加了CNN的负担，还阻碍了CNN对其他不易收敛的正样本对的监督学习，使得CNN的训练效率和精确度降低，从而导致CNN的训练结果不太理想。

发明内容

本发明实施例提供一种卷积神经网络的训练方法、人脸识别方法及装置，提高CNN的训练效率和精确度。

因此，本发明实施例提供了一种卷积神经网络的训练方法，包括：

从预设源域人脸图像集合中选取最小块的源域训练样本集合；

将所述源域训练样本集合输入所述卷积神经网络中，获得所述源域训练样本集合中各样本中的人脸图像的特征向量；

根据所述源域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，确定联合监督训练的第一误差；其中，所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

根据所述第一误差对所述卷积神经网络的网络参数进行调整。

可选地，在本发明实施例提供的上述训练方法中，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d_p代表第p个样本对中两张人脸图像的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表所述第一阈值，m₂代表所述第二阈值。

可选地，在本发明实施例提供的上述训练方法中，所述交叉熵损失函数F₂表示为：

其中，I代表样本的总数，J代表类别的总数，i代表大于或等于1且小于或等于I的整数，j代表大于或等于1且小于或等于J的整数，代表预测第i个样本属于第j类的概率，μ{yⁱ＝j}代表当第i个样本属于第j类时取1，否则取0；

所述第一联合训练监督函数F₀₁表示为：

F₀₁＝F₂+αF₁；

其中，α代表权重系数。

可选地，在本发明实施例提供的上述训练方法中，在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之前，还包括：

从预设目标域人脸图像集合中选取最小块的目标域训练样本集合；

将所述目标域训练样本集合输入所述卷积神经网络中，获得所述目标域训练样本集合中各样本中的人脸图像的特征向量；

根据所述目标域训练样本集合中各样本中的人脸图像的特征向量，通过所述第一联合训练监督函数，确定联合监督训练的第二误差；

在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后，还包括：

根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。

相应地，本发明实施例还提供了一种卷积神经网络的训练方法，包括：

分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合；

将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中，获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量；

分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，确定联合监督训练的第三误差与第四误差；其中，所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

根据所述第三误差与所述第四误差，确定目标误差；

根据所述目标误差对所述卷积神经网络的网络参数进行调整。

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d_p代表第p个样本对的两张图像对应的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表所述第一阈值，m₂代表所述第二阈值。

所述第二联合训练监督函数F₀₂表示为：

F₀₂＝F₂+βF₁；

其中，β代表权重系数。

可选地，在本发明实施例提供的上述训练方法中，所述确定目标误差，具体包括：根据如下公式确定所述目标误差f₀；

f₀＝f₃+γf₄；

其中，f₃代表所述第三误差，f₄代表所述第四误差，γ代表权重系数。

相应地，本发明实施例还提供了一种人脸识别方法，包括：

采集人脸图像；

使用卷积神经网络提取人脸图像的特征向量；其中，所述卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到；

使用提取的所述特征向量进行人脸识别。

相应地，本发明实施例还挺了一种卷积神经网络的训练装置，包括：

第一选取单元，用于从预设源域人脸图像集合中选取最小块的源域训练样本集合；

第一控制单元，用于将所述源域训练样本集合输入所述卷积神经网络中，获得所述源域训练样本集合中各样本中的人脸图像的特征向量；

第一监督训练单元，用于根据所述源域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，确定联合监督训练的第一误差；其中，所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

第一调整单元，用于根据所述第一误差对所述卷积神经网络的网络参数进行调整；

第一存储单元，用于存储所述卷积神经网络与所述第一联合训练监督函数。

可选地，在本发明实施例提供的上述训练装置中，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

可选地，在本发明实施例提供的上述训练装置中，所述交叉熵损失函数F₂表示为：

所述第一联合训练监督函数F₀₁表示为：

F₀₁＝F₂+αF₁；

其中，α代表权重系数。

可选地，在本发明实施例提供的上述训练装置中，还包括：

第二选取单元，用于从预设目标域人脸图像集合中选取最小块的目标域训练样本集合；

第二控制单元，用于将所述目标域训练样本集合输入所述卷积神经网络中，获得所述目标域训练样本集合中各样本中的人脸图像的特征向量；

第二监督训练单元，用于根据所述目标域训练样本集合中各样本中的人脸图像的特征向量，通过所述第一联合训练监督函数，确定联合监督训练的第二误差；

第二调整单元，用于在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后，根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。

相应地，本发明实施例还提供了一种卷积神经网络的训练装置，包括：

第三选取单元，用于分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合；

第三控制单元，用于将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中，获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量；

第三监督训练单元，用于分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，确定联合监督训练的第三误差与第四误差；其中，所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

确定单元，用于根据所述第三误差与所述第四误差，确定目标误差；

第三调整单元，用于根据所述目标误差对所述卷积神经网络的网络参数进行调整；

第二存储单元，用于存储所述卷积神经网络与所述第二联合训练监督函数。

所述第二联合训练监督函数F₀₂表示为：

F₀₂＝F₂+βF₁；

其中，β代表权重系数。

可选地，在本发明实施例提供的上述训练装置中，所述确定目标误差，具体包括：根据如下公式确定所述目标误差f₀；

f₀＝f₃+γf₄；

相应地，本发明实施例还提供了一种人脸识别装置，包括：

采集单元，用于采集人脸图像；

提取单元，用于使用卷积神经网络提取人脸图像的特征向量；其中，所述卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到；

识别单元，用于使用提取的所述特征向量进行人脸识别；

目标存储单元，用于存储通过本发明实施例提供的上述任一种训练方法训练得到的所述卷积神经网络。

本发明有益效果如下：

本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定联合监督训练的第一误差，并通过第一误差对卷积神经网络的网络参数进行调整。其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，提高CNN的训练效率和精确度。或者，采用既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，以及采用源域与目标域两域联合训练的方式，提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

附图说明

图1为本发明实施例提供的卷积神经网络的训练方法的流程图之一；

图2为本发明实施例提供的卷积神经网络的训练方法的流程图之二；

图3为本发明实施例提供的人脸识别方法的流程图；

图4为本发明实施例提供的卷积神经网络的训练装置的结构示意图之一；

图5为本发明实施例提供的卷积神经网络的训练装置的结构示意图之二；

图6为本发明实施例提供的卷积神经网络的训练装置的结构示意图之三；

图7为本发明实施例提供的人脸识别装置的结构示意图。

具体实施方式

为了使本发明的目的，技术方案和优点更加清楚，下面结合附图，对本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置的具体实施方式进行详细地说明。应当理解，下面所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。并且在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

CNN是深度学习模型之一。一般，CNN由卷积层(包含非线性激活)和池化层交替组成，以使特征图的尺寸逐渐减小，特征图的层数逐渐增加，然后再以若干层全连接的形式进行连接；最后通过分类器对提取的特征进行分类。CNN的训练方法一般包含数据的正向传播和误差的反向传播两部分。其中，数据的正向传播，一般为：将训练样本输入到CNN中，根据CNN的网络系数和操作形式，逐层计算出训练样本的特征向量并进行分类。误差的反向传播，一般为：根据监督函数生成误差，并反向传播逐层更新CNN的网络参数。

本发明实施例提供一种卷积神经网络的训练方法，如图1所示，可以包括如下步骤：

S101、从预设源域人脸图像集合中选取最小块的源域训练样本集合；

S102、将源域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量；

S103、根据源域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，确定联合监督训练的第一误差；其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

S104、根据第一误差对卷积神经网络的网络参数进行调整。

本发明实施例提供的卷积神经网络的训练方法，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定联合监督训练的第一误差，并通过第一误差对卷积神经网络的网络参数进行调整。其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

一般互联网上有海量的人脸图像资源，许多从互联网上收集而来的人脸图像数据库可以作为源域人脸图像集合被公开使用于CNN的训练中。由于源域人脸图像集合中包括的样本数量较多以及计算机内存的限制，在对CNN进行训练时，不能一次性载入全部图像集合，一般需要对图像集合中的样本进行分批训练，即每次选取最小块(Mini-batch)的样本集合的方式对CNN进行训练。在具体实施时，预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练方法中，从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括：N个样本；其中，N＝k*n，k代表从预设源域人脸图像集合中随机确定的人的数量，即随机选择k个人；n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。

进一步地，在具体实施时，在本发明实施例提供的上述训练方法中，对源域训练样本集合中的图像进行采集，以形成样本对。具体地，从源域训练样本集合中任意选取两个样本进行组合，可以得到个样本对；其中，得到的个样本对可以包括：个正样本对与个负样本对。其中，如果任意选取的两个样本中的人脸图像为同一个人，则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人，则这两个样本组成的样本对为负样本对。

一般，具有两个阈值的对比损失函数F₁’可以表示为：

其中，P代表样本对的总数，p代表大于或等于1且小于或等于P的整数，d代表样本对中两张人脸图像的特征向量的欧式距离，d_p代表第p个样本对中两张人脸图像的特征向量的欧式距离，m₁代表第一阈值，m₂代表第二阈值，y代表第p个样本对的标签。具体地，第p个样本对中的两张人脸图像属于同一人时，y＝1；第p个样本对中的两张人脸图像不属于同一人时，y＝0。∑代表求和符号，其与现有技术中的求和符合的意义相同，在此不作赘述。

在具体实施时，在本发明实施例提供的训练方法中，归一化后的具有两个阈值的对比损失函数F₁可以表示为：

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d代表样本对中两张人脸图像的特征向量的欧式距离，d_p代表第p个样本对中两张人脸图像的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表第一阈值，m₂代表第二阈值。具体地，P＝P₁+P₂。这样在进行训练时，通过采用两个阈值m₁和m₂分别对正样本对和负样本对进行控制，以提高CNN的性能。并且，对于正样本对，仅当d＞m₁时才产生梯度，否则梯度为0；对于负样本对，仅当d＜m₂时才产生梯度，否则梯度为0。

一般采用交叉熵损失函数(Cross-entropy Loss)能够很好地实现不同类别的分类。在具体实施时，在本发明实施例提供的上述训练方法中，交叉熵损失函数F₂可以表示为：

其中，I代表样本的总数，J代表类别的总数，i代表大于或等于1且小于或等于I的整数，j代表大于或等于1且小于或等于J的整数，代表预测第i个样本属于第j类的概率，μ{yⁱ＝j}代表当第i个样本属于第j类时取1，否则取0。∑代表求和符号，其与现有技术中的求和符合的意义相同，在此不作赘述。在实际应用中，采用交叉熵损失函数对网络进行监督学习的具体方法可以与现有技术中的方法相同，在此不作赘述。

进一步地，在具体实施时，在本发明实施例提供的上述训练方法中，第一联合训练监督函数F₀₁可以表示为：F₀₁＝F₂+αF₁；其中，F₁代表归一化后的具有两个阈值的对比损失函数，F₂代表交叉熵损失函数，α代表权重系数。其中，α可以为大于0的实数，并且α可以是在实际训练过程中凭借经验人工选定的实数，以通过α控制F₁与F₂对CNN监督训练的权重。

一般使用互联网上的人脸图像训练的CNN模型在采用安防视频监控环境下得到的监控视频图像进行测试时，往往难以取得很好的效果。这是由于对CNN进行训练的样本集合和测试训练完成的CNN的样本集合取自不同的场景，导致其存在着明显的偏差(例如，互联网中的图像存在化妆、表情、年龄等方面复杂的变化，监控视频图像存在光照、模糊、姿态等方面复杂的变化)。因此，为了提高CNN的性能，可以采用从监控视频中采集的人脸图像对CNN进行训练。在具体实施时，在本发明实施例提供的上述训练方法中，在根据第一误差对卷积神经网络的网络参数进行调整之前，还可以包括：

将目标域训练样本集合输入卷积神经网络中，获得目标域训练样本集合中各样本中的人脸图像的特征向量；

根据目标域训练样本集合中各样本中的人脸图像的特征向量，通过第一联合训练监督函数，确定联合监督训练的第二误差。这样在采用目标域训练样本集合对CNN进行训练时，可以使目标域训练样本集合与源域训练样本集合对应的CNN的网络参数相同，以实现CNN的网络参数共享。

并且，在根据第一误差对卷积神经网络的网络参数进行调整之后，还可以包括：

根据第二误差对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。这样以在采用源域训练样本集合得到的第一误差对CNN进行训练调整后，再采用目标域训练样本集合得到的第二误差对CNN进行训练调整，以提高训练完成的CNN的收敛性能以及在安防视频监控环境下的人脸识别的泛化能力。

在具体实施时，预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练方法中，目标域训练样本集合可以包括M张图像；其中，M=q*m，q代表从预设目标域人脸图像集合中随机确定的人的数量，即随机选择q个人；m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。并且，m张图像包括：确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。

进一步地，在具体实施时，在本发明实施例提供的上述训练方法中，对目标域训练样本集合中的图像进行采集，以形成样本对。具体地，从目标域训练样本集合中选取两个样本进行组合，可以得到q²(m-1)个样本对；其中，两个样本可以包括：1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q²(m-1)个样本对可以包括：q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中，如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人，则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人，则这两个样本组成的样本对为负样本对。

一般损失函数生成的误差通常采用反向传播算法(Back Propagation，BP)进行反向传播，以调整网络参数。在具体实施时，在本发明实施例提供的上述训练方法中，对卷积神经网络的网络参数进行调整，具体可以包括：

通过反向传播算法对卷积神经网络的目标网络参数进行调整。并且，反向传播算法可以与现有技术中的相同，根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同，在此不作赘述。

下面通过具体实施例对本发明实施例提供的训练方法进行详细说明。

实施例一、

本发明实施例提供的卷积神经网络的训练方法，可以包括如下步骤：

(1)、从预设源域人脸图像集合中选取N个图像作为最小块的源域训练样本集合，并对源域训练样本集合中的图像进行采集，形成样本对。

具体地，最小块的源域训练样本集合包括N个图像。从源域训练样本集合中任意选取两个图像进行组合，可以得到个样本对；其中，得到的个样本对可以包括：个正样本对与个负样本对。

(2)、将源域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量。

具体地，采用卷积神经网络提取样本的人脸图像的特征向量的方法可以与现有技术中的相同，在此不作赘述。

(3)、根据源域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，确定联合监督训练的第一误差。

具体地，通过第一联合训练监督函数F₀₁对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练，确定第一误差。其中，通过交叉熵损失函数F₂对N个样本中每个样本的人脸图像的特征向量进行监督训练，通过归一化后的具有两个阈值的对比损失函数F₁对N个样本组成的个样本对进行监督训练，并通过α控制F₁与F₂对CNN监督学习的权重，以得到第一误差。

(4)、从预设目标域人脸图像集合中选取M个图像作为最小块的目标域训练样本集合，并对目标域训练样本集合中的图像进行采集，形成样本对。

具体地，最小块的目标域训练样本集合包括M个图像。从目标域训练样本集合中选取两个样本进行组合，可以得到q²(m-1)个样本对；其中，得到的q²(m-1)个样本对可以包括：q(m-1)个正样本对与q(q-1)(m-1)个负样本对。

(5)、将目标域训练样本集合输入卷积神经网络中，获得目标域训练样本集合中各样本中的人脸图像的特征向量。

(6)、根据目标域训练样本集合中各样本中的人脸图像的特征向量，通过第一联合训练监督函数，确定联合监督训练的第二误差。

具体地，通过第一联合训练监督函数F₀₁对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练，确定第二误差。其中，通过交叉熵损失函数F₂对M个样本中每个样本的人脸图像的特征向量进行监督训练，通过归一化后的具有两个阈值的对比损失函数F₁对M个样本组成的q²(m-1)个样本对进行监督训练，通过α控制F₁与F₂对CNN监督学习的权重，以得到第二误差。

(7)、根据第一误差，通过反向传播算法对卷积神经网络的网络参数进行调整。

(8)、根据第二误差，通过反向传播算法对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。

在实际应用中，步骤(1)～(3)与步骤(4)～(6)的顺序可以互换，或者，也可以同时进行，在此不作限定。

基于同一发明构思，本发明实施例还提供了另一种卷积神经网络的训练方法，如图2所示，可以包括如下步骤：

S201、分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合。即从预设源域人脸图像集合中选取最小块的源域训练样本集合，从预设目标域人脸图像集合中选取最小块的目标域训练样本集合。

S202、将源域训练样本集合与目标域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量。

S203、分别根据源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，确定联合监督训练的第三误差与第四误差；其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较。即根据源域训练样本集合中各样本中的人脸图像的特征向量，通过第二联合训练监督函数，确定第三误差；根据目标域训练样本集合中各样本中的人脸图像的特征向量，通过第二联合训练监督函数，确定第四误差。

S204、根据第三误差与第四误差，确定目标误差。

S205、根据目标误差对卷积神经网络的网络参数进行调整。

本发明实施例提供的卷积神经网络的训练方法，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定第三误差，以及根据目标域训练样本集合中各样本中的人脸图像的特征向量，确定第四误差。再通过第三误差与第四误差确定出的目标误差对卷积神经网络的网络参数进行调整，其中第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，以及采用源域与目标域两域联合训练的方式，从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

在具体实施时，预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练方法中，从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括：N个样本；其中，N＝k*n，k代表从预设源域人脸图像集合中随机确定的人的数量，即随机选择k个人；n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。

在具体实施时，预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练方法中，目标域训练样本集合可以包括M张图像；其中，M＝q*m，q代表从预设目标域人脸图像集合中随机确定的人的数量，即随机选择q个人；m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。并且，m张图像包括：确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d代表样本对中两张人脸图像的特征向量的欧式距离，d_p代表第p个样本对中两张人脸图像的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表第一阈值，m₂代表第二阈值。具体地，P＝P₁+P₂。这样在进行训练时，通过采用两个阈值m₁和m₂分别对正样本对和负样本对进行控制，以提高CNN的性能。并且，对于正样本对，仅当d＞m₁时才产生梯度，否则梯度为0；对于负样本对，仅当d＜m₂时才产生梯度，否则梯度为0。并且，∑代表求和符号，其与现有技术中的求和符合的意义相同，在此不作赘述。

在具体实施时，在本发明实施例提供的上述训练方法中，交叉熵损失函数F₂可以表示为：

进一步地，在具体实施时，在本发明实施例提供的上述训练方法中，第二联合训练监督函数F₀₂可以表示为：F₀₂＝F₂+βF₁；其中，F₁代表归一化后的具有两个阈值的对比损失函数，F₂代表交叉熵损失函数，β代表权重系数。其中，p可以为大于0的实数，并且β可以是在实际训练过程中凭借经验人工选定的实施，以通过β控制F₁与F₂对CNN监督学习的权重。

在具体实施时，在本发明实施例提供的上述训练方法中，确定目标误差，具体包括：根据如下公式确定目标误差f₀；

f₀＝f₃+γf₄；

其中，f₃代表第三误差，f₄代表第四误差，γ代表权重系数。γ可以为大于0的实数，并且γ可以是在实际训练过程中凭借经验人工选定的实数，以通过γ控制f₃与f₄对CNN监督训练的权重。

实施例二、

(1)从预设源域人脸图像集合中选取N个图像作为最小块的源域训练样本集合，并对源域训练样本集合中的图像进行采集，形成样本对。以及，从预设目标域人脸图像集合中选取M个图像作为最小块的目标域训练样本集合，并对目标域训练样本集合中的图像进行采集，形成样本对。

最小块的目标域训练样本集合包括M个图像。从目标域训练样本集合中选取两个样本进行组合，可以得到q²(m-1)个样本对；其中，得到的q²(m-1)个样本对可以包括：q(m-1)个正样本对与q(q-1)(m-1)个负样本对。

(2)将源域训练样本集合与目标域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量。

(3)根据源域训练样本集合中各样本中的人脸图像的特征向量，通过第二联合训练监督函数，确定联合监督训练的第三误差。以及，根据目标域训练样本集合中各样本中的人脸图像的特征向量，通过第二联合训练监督函数，确定联合监督训练的第四误差。

具体地，通过第二联合训练监督函数F₀₂对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练，确定第三误差。其中，通过交叉熵损失函数F₂对N个样本中每个样本的人脸图像的特征向量进行监督训练，通过归一化后的具有两个阈值的对比损失函数F₁对N个样本组成的个样本对进行监督训练，并通过p控制F₁与F₂对CNN监督学习的权重，以得到第三误差。

并且，通过第二联合训练监督函数F₀₂对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练，确定第四误差。其中，通过交叉熵损失函数F₂对M个样本中每个样本的人脸图像的特征向量进行监督训练，通过归一化后的具有两个阈值的对比损失函数F₁对M个样本组成的q²(m-1)个样本对进行监督训练，通过β控制F₁与F₂对CNN监督学习的权重，以得到第四误差。

(4)根据公式f₀＝f₃+γf₄确定目标误差f₀；其中，通过γ控制f₃与f₄对CNN监督训练的权重。

具体地，以F₀₂’代表对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练的第二联合训练监督函数，以F₀₂”代表对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练的第二联合训练监督函数，则目标误差f₀对应的函数可以表示为：F₀＝F₀₂’+γF₀₂”。这样可以通过γ控制F₀₂’与F₀₂”对CNN监督训练的权重，并在采用源域训练样本集合与目标域训练样本集合共同对CNN进行训练时，可以使源域训练样本集合与目标域训练样本集合对应的CNN的网络参数相同，以实现CNN的网络参数共享。

(5)根据目标误差f₀，通过反向传播算法对卷积神经网络的网络参数进行调整。

基于同一发明构思，本发明实施例还提供了一种人脸识别方法，如图3所示，可以包括如下步骤：

S301、采集人脸图像；

S302、使用卷积神经网络提取人脸图像的特征向量；其中，卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到；

S303、使用提取的特征向量进行人脸识别。

本发明实施例提供的人脸识别方法，使用通过本发明实施例提供的上述任一种训练方法训练得到的卷积神经网络提取人脸图像的特征向量，可以提高人脸识别的泛化能力。

在具体实施时，本发明实施例提供的人脸识别方法可以应用于安防视频监控环境下，例如应用于反恐、公共、平安城市等方面。当然，本发明实施例提供的人脸识别方法也可以应用于其他需要进行人脸识别和确认的环境中，在此不作限定。

基于同一发明构思，本发明实施例还提供了一种卷积神经网络的训练装置，如图4所示，可以包括：

第一选取单元401，用于从预设源域人脸图像集合中选取最小块的源域训练样本集合；

第一控制单元402，用于将源域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量；

第一监督训练单元403，用于根据源域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，确定联合监督训练的第一误差；其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

第一调整单元404，用于根据第一误差对卷积神经网络的网络参数进行调整；

第一存储单元405，用于存储卷积神经网络与第一联合训练监督函数。

本发明实施例提供的训练装置，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定联合监督训练的第一误差，并通过第一误差对卷积神经网络的网络参数进行调整。其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

进一步地，为了提高CNN的性能，在具体实施时，在本发明实施例提供的训练装置中，如图5所示，在本发明实施例提供的训练装置包括第一选取单元401、第一控制单元402、第一监督训练单元403、第一调整单元404以及第一存储单元405时，还可以包括：

第二选取单元406，用于从预设目标域人脸图像集合中选取最小块的目标域训练样本集合；

第二控制单元407，用于将目标域训练样本集合输入卷积神经网络中，获得目标域训练样本集合中各样本中的人脸图像的特征向量；

第二监督训练单元408，用于根据目标域训练样本集合中各样本中的人脸图像的特征向量，通过第一联合训练监督函数，确定联合监督训练的第二误差；

第二调整单元409，用于在根据第一误差对卷积神经网络的网络参数进行调整之后，根据第二误差对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。

在具体实施时，预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练装置中，从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括：N个样本；其中，N＝k*n，k代表从预设源域人脸图像集合中随机确定的人的数量，即随机选择k个人；n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。

进一步地，在具体实施时，在本发明实施例提供的上述训练装置中，对源域训练样本集合中的图像进行采集，以形成样本对。具体地，从源域训练样本集合中任意选取两个样本进行组合，可以得到个样本对；其中，得到的个样本对可以包括：个正样本对与个负样本对。其中，如果任意选取的两个样本中的人脸图像为同一个人，则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人，则这两个样本组成的样本对为负样本对。

在具体实施时，预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练装置中，目标域训练样本集合可以包括M张图像；其中，M＝q*m，q代表从预设目标域人脸图像集合中随机确定的人的数量，即随机选择q个人；m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量，即针对每一个人，从预设源域人脸图像集合中随机选择n张人脸图像。并且，m张图像包括：确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。

进一步地，在具体实施时，在本发明实施例提供的上述训练装置中，对目标域训练样本集合中的图像进行采集，以形成样本对。具体地，从目标域训练样本集合中选取两个样本进行组合，可以得到q²(m-1)个样本对；其中，两个样本可以包括：1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q²(m-1)个样本对可以包括：q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中，如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人，则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人，则这两个样本组成的样本对为负样本对。

在具体实施时，在本发明实施例提供的上述训练装置中，第一调整单元具体用于根据第一误差，通过反向传播算法对卷积神经网络的网络参数进行调整。

第二调整单元具体用于在根据第一误差对卷积神经网络的网络参数进行调整之后，根据第二误差，通过反向传播算法对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。

并且，反向传播算法可以与现有技术中的相同，根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同，在此不作赘述。

在具体实施时，在本发明实施例提供的训练装置中，归一化后的具有两个阈值的对比损失函数F₁表示为：

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d_p代表第p个样本对中两张人脸图像的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表第一阈值，m₂代表第二阈值。

进一步地，在具体实施时，在本发明实施例提供的训练装置中，交叉熵损失函数F₂表示为：

第一联合训练监督函数F₀₁表示为：

F₀₁＝F₂+αF₁；

其中，α代表权重系数。

基于同一发明构思，本发明实施例还提供了一种卷积神经网络的训练装置，如图6所示，可以包括：

第三选取单元601，用于分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合；

第三控制单元602，用于将源域训练样本集合与目标域训练样本集合输入卷积神经网络中，获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量；

第三监督训练单元603，用于分别根据源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量，通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，确定联合监督训练的第三误差与第四误差；其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较；

确定单元604，用于根据第三误差与第四误差，确定目标误差；

第三调整单元605，用于根据目标误差对卷积神经网络的网络参数进行调整；

第二存储单元606，用于存储卷积神经网络与第二联合训练监督函数。

本发明实施例提供的训练装置，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定第三误差，以及根据目标域训练样本集合中各样本中的人脸图像的特征向量，确定第四误差。再通过第三误差与第四误差确定出的目标误差对卷积神经网络的网络参数进行调整，其中第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，以及采用源域与目标域两域联合训练的方式，从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时，可以提高人脸识别方法的泛化能力。

在具体实施时，在本发明实施例提供的训练装置中，第三调整单元具体用于根据目标误差，通过反向传播算法对卷积神经网络的网络参数进行调整。并且，反向传播算法可以与现有技术中的相同，根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同，在此不作赘述。

其中，P₁代表正样本对的总数，P₂代表负样本对的总数，p代表大于或等于1且小于或等于P₁+P₂的整数，d_p代表第p个样本对的两张图像对应的特征向量的欧式距离，y代表第p个样本对的标签，m₁代表第一阈值，m₂代表第二阈值。

第二联合训练监督函数F₀₂表示为：

F₀₂＝F₂+βF₁；

其中，β代表权重系数。

进一步地，在具体实施时，在本发明实施例提供的训练装置中，确定目标误差，具体包括：根据如下公式确定目标误差f₀；

f₀＝f₃+γf₄；

其中，f₃代表第三误差，f₄代表第四误差，γ代表权重系数。

基于同一发明构思，本发明实施例还提供了一种人脸识别装置，如图7所示，可以包括：

采集单元701，用于采集人脸图像；

提取单元702，用于使用卷积神经网络提取人脸图像的特征向量；其中，卷积神经网络通过本发明实施例提供的任一种训练方法训练得到；

识别单元703，用于使用提取的特征向量进行人脸识别；

目标存储单元704，用于存储通过本发明实施例提供的任一种训练方法训练得到卷积神经网络。

本发明实施例提供的人脸识别装置，使用通过本发明实施例提供的上述任一种训练方法训练得到的卷积神经网络提取人脸图像的特征向量，可以提高人脸识别的泛化能力。

在具体实施时，本发明实施例提供的人脸识别装置可以应用于安防视频监控环境下，例如应用于反恐、公共、平安城市等方面。当然，本发明实施例提供的人脸识别装置也可以应用于其他需要进行人脸识别和确认的环境中，在此不作限定。

本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置，通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数，以根据源域训练样本集合中各样本中的人脸图像的特征向量，确定联合监督训练的第一误差，并通过第一误差对卷积神经网络的网络参数进行调整。其中，两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较，第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较，这样既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，提高CNN的训练效率和精确度。或者，采用既可以控制负样本对的监督训练，又可以控制正样本对的监督训练，以及采用源域与目标域两域联合训练的方式，提高CNN的训练效率和精确度。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种卷积神经网络的训练方法，其特征在于，包括：

2.如权利要求1所述的训练方法，其特征在于，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

3.如权利要求2所述的训练方法，其特征在于，所述交叉熵损失函数F₂表示为：

所述第一联合训练监督函数F₀₁表示为：

F₀₁＝F₂+αF₁；

其中，α代表权重系数。

4.如权利要求1-3任一项所述的训练方法，其特征在于，在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之前，还包括：

5.一种卷积神经网络的训练方法，其特征在于，包括：

根据所述第三误差与所述第四误差，确定目标误差；

6.如权利要求5所述的训练方法，其特征在于，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

7.如权利要求6所述的训练方法，其特征在于，所述交叉熵损失函数F₂表示为：

所述第二联合训练监督函数F₀₂表示为：

F₀₂＝F₂+βF₁；

其中，β代表权重系数。

8.如权利要求5-7任一项所述的训练方法，其特征在于，所述确定目标误差，具体包括：根据如下公式确定所述目标误差f₀；

f₀＝f₃+γf₄；

9.一种人脸识别方法，其特征在于，包括：

采集人脸图像；

使用卷积神经网络提取人脸图像的特征向量；其中，所述卷积神经网络通过权利要求1-8任一项所述的训练方法训练得到；

使用提取的所述特征向量进行人脸识别。

10.一种卷积神经网络的训练装置，其特征在于，包括：

11.如权利要求10所述的训练装置，其特征在于，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

12.如权利要求11所述的训练装置，其特征在于，所述交叉熵损失函数F₂表示为：

所述第一联合训练监督函数F₀₁表示为：

F₀₁＝F₂+αF₁；

其中，α代表权重系数。

13.如权利要求10-12任一项所述的训练装置，其特征在于，还包括：

14.一种卷积神经网络的训练装置，其特征在于，包括：

15.如权利要求14所述的训练装置，其特征在于，归一化后的具有两个阈值的所述对比损失函数F₁表示为：

16.如权利要求15所述的训练装置，其特征在于，所述交叉熵损失函数F₂表示为：

所述第二联合训练监督函数F₀₂表示为：

F₀₂＝F₂+βF₁；

其中，β代表权重系数。

17.如权利要求14-16任一项所述的训练装置，其特征在于，所述确定目标误差，具体包括：根据如下公式确定所述目标误差f₀；

f₀＝f₃+γf₄；

18.一种人脸识别装置，其特征在于，包括：

采集单元，用于采集人脸图像；

提取单元，用于使用卷积神经网络提取人脸图像的特征向量；其中，所述卷积神经网络通过权利要求1-8任一项所述的训练方法训练得到；

识别单元，用于使用提取的所述特征向量进行人脸识别；

目标存储单元，用于存储通过权利要求1-8任一项所述的训练方法训练得到的所述卷积神经网络。