CN108182394A - 卷积神经网络的训练方法、人脸识别方法及装置 - Google Patents
卷积神经网络的训练方法、人脸识别方法及装置 Download PDFInfo
- Publication number
- CN108182394A CN108182394A CN201711414491.4A CN201711414491A CN108182394A CN 108182394 A CN108182394 A CN 108182394A CN 201711414491 A CN201711414491 A CN 201711414491A CN 108182394 A CN108182394 A CN 108182394A
- Authority
- CN
- China
- Prior art keywords
- training
- sample
- error
- facial image
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种卷积神经网络的训练方法、人脸识别方法及装置,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,根据源域训练样本集合中各样本中的人脸图像的特征向量,确定第一误差,并通过第一误差对卷积神经网络的网络参数进行调整。其中,第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
Description
技术领域
本发明涉及深度学习技术领域,特别涉及一种卷积神经网络的训练方法、人脸识别方法及装置。
背景技术
目前,为了更好地识别人脸图像,越来越多的识别过程需要使用到卷积神经网络(Convolutional Neural Network,CNN)。而为了确保识别结果准确,就需要对CNN进行反复训练。目前,一般采用具有单个阈值的对比损失函数(Contrastive Loss)来对CNN进行训练。然而,由于该对比损失函数仅通过单个阈值来控制样本集合中的负样本对的收敛,以对CNN进行训练,而并未控制样本集合中的正样本对的收敛。由于样本集合中存在大量的易收敛的正样本对,而未对这些正样本对进行监督训练,不但增加了CNN的负担,还阻碍了CNN对其他不易收敛的正样本对的监督学习,使得CNN的训练效率和精确度降低,从而导致CNN的训练结果不太理想。
发明内容
本发明实施例提供一种卷积神经网络的训练方法、人脸识别方法及装置,提高CNN的训练效率和精确度。
因此,本发明实施例提供了一种卷积神经网络的训练方法,包括:
从预设源域人脸图像集合中选取最小块的源域训练样本集合;
将所述源域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量;
根据所述源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
根据所述第一误差对所述卷积神经网络的网络参数进行调整。
可选地,在本发明实施例提供的上述训练方法中,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
可选地,在本发明实施例提供的上述训练方法中,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第一联合训练监督函数F01表示为:
F01=F2+αF1;
其中,α代表权重系数。
可选地,在本发明实施例提供的上述训练方法中,在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之前,还包括:
从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
将所述目标域训练样本集合输入所述卷积神经网络中,获得所述目标域训练样本集合中各样本中的人脸图像的特征向量;
根据所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过所述第一联合训练监督函数,确定联合监督训练的第二误差;
在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后,还包括:
根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
相应地,本发明实施例还提供了一种卷积神经网络的训练方法,包括:
分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合;
将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量;
分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
根据所述第三误差与所述第四误差,确定目标误差;
根据所述目标误差对所述卷积神经网络的网络参数进行调整。
可选地,在本发明实施例提供的上述训练方法中,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对的两张图像对应的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
可选地,在本发明实施例提供的上述训练方法中,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第二联合训练监督函数F02表示为:
F02=F2+βF1;
其中,β代表权重系数。
可选地,在本发明实施例提供的上述训练方法中,所述确定目标误差,具体包括:根据如下公式确定所述目标误差f0;
f0=f3+γf4;
其中,f3代表所述第三误差,f4代表所述第四误差,γ代表权重系数。
相应地,本发明实施例还提供了一种人脸识别方法,包括:
采集人脸图像;
使用卷积神经网络提取人脸图像的特征向量;其中,所述卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到;
使用提取的所述特征向量进行人脸识别。
相应地,本发明实施例还挺了一种卷积神经网络的训练装置,包括:
第一选取单元,用于从预设源域人脸图像集合中选取最小块的源域训练样本集合;
第一控制单元,用于将所述源域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量;
第一监督训练单元,用于根据所述源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
第一调整单元,用于根据所述第一误差对所述卷积神经网络的网络参数进行调整;
第一存储单元,用于存储所述卷积神经网络与所述第一联合训练监督函数。
可选地,在本发明实施例提供的上述训练装置中,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
可选地,在本发明实施例提供的上述训练装置中,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第一联合训练监督函数F01表示为:
F01=F2+αF1;
其中,α代表权重系数。
可选地,在本发明实施例提供的上述训练装置中,还包括:
第二选取单元,用于从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
第二控制单元,用于将所述目标域训练样本集合输入所述卷积神经网络中,获得所述目标域训练样本集合中各样本中的人脸图像的特征向量;
第二监督训练单元,用于根据所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过所述第一联合训练监督函数,确定联合监督训练的第二误差;
第二调整单元,用于在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后,根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
相应地,本发明实施例还提供了一种卷积神经网络的训练装置,包括:
第三选取单元,用于分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合;
第三控制单元,用于将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量;
第三监督训练单元,用于分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
确定单元,用于根据所述第三误差与所述第四误差,确定目标误差;
第三调整单元,用于根据所述目标误差对所述卷积神经网络的网络参数进行调整;
第二存储单元,用于存储所述卷积神经网络与所述第二联合训练监督函数。
可选地,在本发明实施例提供的上述训练装置中,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对的两张图像对应的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
可选地,在本发明实施例提供的上述训练装置中,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第二联合训练监督函数F02表示为:
F02=F2+βF1;
其中,β代表权重系数。
可选地,在本发明实施例提供的上述训练装置中,所述确定目标误差,具体包括:根据如下公式确定所述目标误差f0;
f0=f3+γf4;
其中,f3代表所述第三误差,f4代表所述第四误差,γ代表权重系数。
相应地,本发明实施例还提供了一种人脸识别装置,包括:
采集单元,用于采集人脸图像;
提取单元,用于使用卷积神经网络提取人脸图像的特征向量;其中,所述卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到;
识别单元,用于使用提取的所述特征向量进行人脸识别;
目标存储单元,用于存储通过本发明实施例提供的上述任一种训练方法训练得到的所述卷积神经网络。
本发明有益效果如下:
本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定联合监督训练的第一误差,并通过第一误差对卷积神经网络的网络参数进行调整。其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,提高CNN的训练效率和精确度。或者,采用既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,以及采用源域与目标域两域联合训练的方式,提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
附图说明
图1为本发明实施例提供的卷积神经网络的训练方法的流程图之一;
图2为本发明实施例提供的卷积神经网络的训练方法的流程图之二;
图3为本发明实施例提供的人脸识别方法的流程图;
图4为本发明实施例提供的卷积神经网络的训练装置的结构示意图之一;
图5为本发明实施例提供的卷积神经网络的训练装置的结构示意图之二;
图6为本发明实施例提供的卷积神经网络的训练装置的结构示意图之三;
图7为本发明实施例提供的人脸识别装置的结构示意图。
具体实施方式
为了使本发明的目的,技术方案和优点更加清楚,下面结合附图,对本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置的具体实施方式进行详细地说明。应当理解,下面所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
CNN是深度学习模型之一。一般,CNN由卷积层(包含非线性激活)和池化层交替组成,以使特征图的尺寸逐渐减小,特征图的层数逐渐增加,然后再以若干层全连接的形式进行连接;最后通过分类器对提取的特征进行分类。CNN的训练方法一般包含数据的正向传播和误差的反向传播两部分。其中,数据的正向传播,一般为:将训练样本输入到CNN中,根据CNN的网络系数和操作形式,逐层计算出训练样本的特征向量并进行分类。误差的反向传播,一般为:根据监督函数生成误差,并反向传播逐层更新CNN的网络参数。
本发明实施例提供一种卷积神经网络的训练方法,如图1所示,可以包括如下步骤:
S101、从预设源域人脸图像集合中选取最小块的源域训练样本集合;
S102、将源域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量;
S103、根据源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
S104、根据第一误差对卷积神经网络的网络参数进行调整。
本发明实施例提供的卷积神经网络的训练方法,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定联合监督训练的第一误差,并通过第一误差对卷积神经网络的网络参数进行调整。其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
一般互联网上有海量的人脸图像资源,许多从互联网上收集而来的人脸图像数据库可以作为源域人脸图像集合被公开使用于CNN的训练中。由于源域人脸图像集合中包括的样本数量较多以及计算机内存的限制,在对CNN进行训练时,不能一次性载入全部图像集合,一般需要对图像集合中的样本进行分批训练,即每次选取最小块(Mini-batch)的样本集合的方式对CNN进行训练。在具体实施时,预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练方法中,从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括:N个样本;其中,N=k*n,k代表从预设源域人脸图像集合中随机确定的人的数量,即随机选择k个人;n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,对源域训练样本集合中的图像进行采集,以形成样本对。具体地,从源域训练样本集合中任意选取两个样本进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。其中,如果任意选取的两个样本中的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
一般,具有两个阈值的对比损失函数F1’可以表示为:
其中,P代表样本对的总数,p代表大于或等于1且小于或等于P的整数,d代表样本对中两张人脸图像的特征向量的欧式距离,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,m1代表第一阈值,m2代表第二阈值,y代表第p个样本对的标签。具体地,第p个样本对中的两张人脸图像属于同一人时,y=1;第p个样本对中的两张人脸图像不属于同一人时,y=0。∑代表求和符号,其与现有技术中的求和符合的意义相同,在此不作赘述。
在具体实施时,在本发明实施例提供的训练方法中,归一化后的具有两个阈值的对比损失函数F1可以表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,d代表样本对中两张人脸图像的特征向量的欧式距离,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表第一阈值,m2代表第二阈值。具体地,P=P1+P2。这样在进行训练时,通过采用两个阈值m1和m2分别对正样本对和负样本对进行控制,以提高CNN的性能。并且,对于正样本对,仅当d>m1时才产生梯度,否则梯度为0;对于负样本对,仅当d<m2时才产生梯度,否则梯度为0。
一般采用交叉熵损失函数(Cross-entropy Loss)能够很好地实现不同类别的分类。在具体实施时,在本发明实施例提供的上述训练方法中,交叉熵损失函数F2可以表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0。∑代表求和符号,其与现有技术中的求和符合的意义相同,在此不作赘述。在实际应用中,采用交叉熵损失函数对网络进行监督学习的具体方法可以与现有技术中的方法相同,在此不作赘述。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,第一联合训练监督函数F01可以表示为:F01=F2+αF1;其中,F1代表归一化后的具有两个阈值的对比损失函数,F2代表交叉熵损失函数,α代表权重系数。其中,α可以为大于0的实数,并且α可以是在实际训练过程中凭借经验人工选定的实数,以通过α控制F1与F2对CNN监督训练的权重。
一般使用互联网上的人脸图像训练的CNN模型在采用安防视频监控环境下得到的监控视频图像进行测试时,往往难以取得很好的效果。这是由于对CNN进行训练的样本集合和测试训练完成的CNN的样本集合取自不同的场景,导致其存在着明显的偏差(例如,互联网中的图像存在化妆、表情、年龄等方面复杂的变化,监控视频图像存在光照、模糊、姿态等方面复杂的变化)。因此,为了提高CNN的性能,可以采用从监控视频中采集的人脸图像对CNN进行训练。在具体实施时,在本发明实施例提供的上述训练方法中,在根据第一误差对卷积神经网络的网络参数进行调整之前,还可以包括:
从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
将目标域训练样本集合输入卷积神经网络中,获得目标域训练样本集合中各样本中的人脸图像的特征向量;
根据目标域训练样本集合中各样本中的人脸图像的特征向量,通过第一联合训练监督函数,确定联合监督训练的第二误差。这样在采用目标域训练样本集合对CNN进行训练时,可以使目标域训练样本集合与源域训练样本集合对应的CNN的网络参数相同,以实现CNN的网络参数共享。
并且,在根据第一误差对卷积神经网络的网络参数进行调整之后,还可以包括:
根据第二误差对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。这样以在采用源域训练样本集合得到的第一误差对CNN进行训练调整后,再采用目标域训练样本集合得到的第二误差对CNN进行训练调整,以提高训练完成的CNN的收敛性能以及在安防视频监控环境下的人脸识别的泛化能力。
在具体实施时,预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练方法中,目标域训练样本集合可以包括M张图像;其中,M=q*m,q代表从预设目标域人脸图像集合中随机确定的人的数量,即随机选择q个人;m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。并且,m张图像包括:确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,对目标域训练样本集合中的图像进行采集,以形成样本对。具体地,从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,两个样本可以包括:1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中,如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
一般损失函数生成的误差通常采用反向传播算法(Back Propagation,BP)进行反向传播,以调整网络参数。在具体实施时,在本发明实施例提供的上述训练方法中,对卷积神经网络的网络参数进行调整,具体可以包括:
通过反向传播算法对卷积神经网络的目标网络参数进行调整。并且,反向传播算法可以与现有技术中的相同,根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同,在此不作赘述。
下面通过具体实施例对本发明实施例提供的训练方法进行详细说明。
实施例一、
本发明实施例提供的卷积神经网络的训练方法,可以包括如下步骤:
(1)、从预设源域人脸图像集合中选取N个图像作为最小块的源域训练样本集合,并对源域训练样本集合中的图像进行采集,形成样本对。
具体地,最小块的源域训练样本集合包括N个图像。从源域训练样本集合中任意选取两个图像进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。
(2)、将源域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量。
具体地,采用卷积神经网络提取样本的人脸图像的特征向量的方法可以与现有技术中的相同,在此不作赘述。
(3)、根据源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差。
具体地,通过第一联合训练监督函数F01对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练,确定第一误差。其中,通过交叉熵损失函数F2对N个样本中每个样本的人脸图像的特征向量进行监督训练,通过归一化后的具有两个阈值的对比损失函数F1对N个样本组成的个样本对进行监督训练,并通过α控制F1与F2对CNN监督学习的权重,以得到第一误差。
(4)、从预设目标域人脸图像集合中选取M个图像作为最小块的目标域训练样本集合,并对目标域训练样本集合中的图像进行采集,形成样本对。
具体地,最小块的目标域训练样本集合包括M个图像。从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。
(5)、将目标域训练样本集合输入卷积神经网络中,获得目标域训练样本集合中各样本中的人脸图像的特征向量。
具体地,采用卷积神经网络提取样本的人脸图像的特征向量的方法可以与现有技术中的相同,在此不作赘述。
(6)、根据目标域训练样本集合中各样本中的人脸图像的特征向量,通过第一联合训练监督函数,确定联合监督训练的第二误差。
具体地,通过第一联合训练监督函数F01对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练,确定第二误差。其中,通过交叉熵损失函数F2对M个样本中每个样本的人脸图像的特征向量进行监督训练,通过归一化后的具有两个阈值的对比损失函数F1对M个样本组成的q2(m-1)个样本对进行监督训练,通过α控制F1与F2对CNN监督学习的权重,以得到第二误差。
(7)、根据第一误差,通过反向传播算法对卷积神经网络的网络参数进行调整。
(8)、根据第二误差,通过反向传播算法对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
在实际应用中,步骤(1)~(3)与步骤(4)~(6)的顺序可以互换,或者,也可以同时进行,在此不作限定。
基于同一发明构思,本发明实施例还提供了另一种卷积神经网络的训练方法,如图2所示,可以包括如下步骤:
S201、分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合。即从预设源域人脸图像集合中选取最小块的源域训练样本集合,从预设目标域人脸图像集合中选取最小块的目标域训练样本集合。
S202、将源域训练样本集合与目标域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量。
S203、分别根据源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较。即根据源域训练样本集合中各样本中的人脸图像的特征向量,通过第二联合训练监督函数,确定第三误差;根据目标域训练样本集合中各样本中的人脸图像的特征向量,通过第二联合训练监督函数,确定第四误差。
S204、根据第三误差与第四误差,确定目标误差。
S205、根据目标误差对卷积神经网络的网络参数进行调整。
本发明实施例提供的卷积神经网络的训练方法,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定第三误差,以及根据目标域训练样本集合中各样本中的人脸图像的特征向量,确定第四误差。再通过第三误差与第四误差确定出的目标误差对卷积神经网络的网络参数进行调整,其中第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,以及采用源域与目标域两域联合训练的方式,从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
在具体实施时,预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练方法中,从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括:N个样本;其中,N=k*n,k代表从预设源域人脸图像集合中随机确定的人的数量,即随机选择k个人;n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,对源域训练样本集合中的图像进行采集,以形成样本对。具体地,从源域训练样本集合中任意选取两个样本进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。其中,如果任意选取的两个样本中的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
在具体实施时,预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练方法中,目标域训练样本集合可以包括M张图像;其中,M=q*m,q代表从预设目标域人脸图像集合中随机确定的人的数量,即随机选择q个人;m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。并且,m张图像包括:确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,对目标域训练样本集合中的图像进行采集,以形成样本对。具体地,从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,两个样本可以包括:1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中,如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
一般损失函数生成的误差通常采用反向传播算法(Back Propagation,BP)进行反向传播,以调整网络参数。在具体实施时,在本发明实施例提供的上述训练方法中,对卷积神经网络的网络参数进行调整,具体可以包括:
通过反向传播算法对卷积神经网络的目标网络参数进行调整。并且,反向传播算法可以与现有技术中的相同,根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同,在此不作赘述。
在具体实施时,在本发明实施例提供的训练方法中,归一化后的具有两个阈值的对比损失函数F1可以表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,d代表样本对中两张人脸图像的特征向量的欧式距离,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表第一阈值,m2代表第二阈值。具体地,P=P1+P2。这样在进行训练时,通过采用两个阈值m1和m2分别对正样本对和负样本对进行控制,以提高CNN的性能。并且,对于正样本对,仅当d>m1时才产生梯度,否则梯度为0;对于负样本对,仅当d<m2时才产生梯度,否则梯度为0。并且,∑代表求和符号,其与现有技术中的求和符合的意义相同,在此不作赘述。
在具体实施时,在本发明实施例提供的上述训练方法中,交叉熵损失函数F2可以表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0。∑代表求和符号,其与现有技术中的求和符合的意义相同,在此不作赘述。在实际应用中,采用交叉熵损失函数对网络进行监督学习的具体方法可以与现有技术中的方法相同,在此不作赘述。
进一步地,在具体实施时,在本发明实施例提供的上述训练方法中,第二联合训练监督函数F02可以表示为:F02=F2+βF1;其中,F1代表归一化后的具有两个阈值的对比损失函数,F2代表交叉熵损失函数,β代表权重系数。其中,p可以为大于0的实数,并且β可以是在实际训练过程中凭借经验人工选定的实施,以通过β控制F1与F2对CNN监督学习的权重。
在具体实施时,在本发明实施例提供的上述训练方法中,确定目标误差,具体包括:根据如下公式确定目标误差f0;
f0=f3+γf4;
其中,f3代表第三误差,f4代表第四误差,γ代表权重系数。γ可以为大于0的实数,并且γ可以是在实际训练过程中凭借经验人工选定的实数,以通过γ控制f3与f4对CNN监督训练的权重。
下面通过具体实施例对本发明实施例提供的训练方法进行详细说明。
实施例二、
本发明实施例提供的卷积神经网络的训练方法,可以包括如下步骤:
(1)从预设源域人脸图像集合中选取N个图像作为最小块的源域训练样本集合,并对源域训练样本集合中的图像进行采集,形成样本对。以及,从预设目标域人脸图像集合中选取M个图像作为最小块的目标域训练样本集合,并对目标域训练样本集合中的图像进行采集,形成样本对。
具体地,最小块的源域训练样本集合包括N个图像。从源域训练样本集合中任意选取两个图像进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。
最小块的目标域训练样本集合包括M个图像。从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。
(2)将源域训练样本集合与目标域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量。
具体地,采用卷积神经网络提取样本的人脸图像的特征向量的方法可以与现有技术中的相同,在此不作赘述。
(3)根据源域训练样本集合中各样本中的人脸图像的特征向量,通过第二联合训练监督函数,确定联合监督训练的第三误差。以及,根据目标域训练样本集合中各样本中的人脸图像的特征向量,通过第二联合训练监督函数,确定联合监督训练的第四误差。
具体地,通过第二联合训练监督函数F02对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练,确定第三误差。其中,通过交叉熵损失函数F2对N个样本中每个样本的人脸图像的特征向量进行监督训练,通过归一化后的具有两个阈值的对比损失函数F1对N个样本组成的个样本对进行监督训练,并通过p控制F1与F2对CNN监督学习的权重,以得到第三误差。
并且,通过第二联合训练监督函数F02对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练,确定第四误差。其中,通过交叉熵损失函数F2对M个样本中每个样本的人脸图像的特征向量进行监督训练,通过归一化后的具有两个阈值的对比损失函数F1对M个样本组成的q2(m-1)个样本对进行监督训练,通过β控制F1与F2对CNN监督学习的权重,以得到第四误差。
(4)根据公式f0=f3+γf4确定目标误差f0;其中,通过γ控制f3与f4对CNN监督训练的权重。
具体地,以F02’代表对源域训练样本集合中各样本中的人脸图像的特征向量进行监督训练的第二联合训练监督函数,以F02”代表对目标域训练样本集合中各样本中的人脸图像的特征向量进行监督训练的第二联合训练监督函数,则目标误差f0对应的函数可以表示为:F0=F02’+γF02”。这样可以通过γ控制F02’与F02”对CNN监督训练的权重,并在采用源域训练样本集合与目标域训练样本集合共同对CNN进行训练时,可以使源域训练样本集合与目标域训练样本集合对应的CNN的网络参数相同,以实现CNN的网络参数共享。
(5)根据目标误差f0,通过反向传播算法对卷积神经网络的网络参数进行调整。
基于同一发明构思,本发明实施例还提供了一种人脸识别方法,如图3所示,可以包括如下步骤:
S301、采集人脸图像;
S302、使用卷积神经网络提取人脸图像的特征向量;其中,卷积神经网络通过本发明实施例提供的上述任一种训练方法训练得到;
S303、使用提取的特征向量进行人脸识别。
本发明实施例提供的人脸识别方法,使用通过本发明实施例提供的上述任一种训练方法训练得到的卷积神经网络提取人脸图像的特征向量,可以提高人脸识别的泛化能力。
在具体实施时,本发明实施例提供的人脸识别方法可以应用于安防视频监控环境下,例如应用于反恐、公共、平安城市等方面。当然,本发明实施例提供的人脸识别方法也可以应用于其他需要进行人脸识别和确认的环境中,在此不作限定。
基于同一发明构思,本发明实施例还提供了一种卷积神经网络的训练装置,如图4所示,可以包括:
第一选取单元401,用于从预设源域人脸图像集合中选取最小块的源域训练样本集合;
第一控制单元402,用于将源域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量;
第一监督训练单元403,用于根据源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
第一调整单元404,用于根据第一误差对卷积神经网络的网络参数进行调整;
第一存储单元405,用于存储卷积神经网络与第一联合训练监督函数。
本发明实施例提供的训练装置,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定联合监督训练的第一误差,并通过第一误差对卷积神经网络的网络参数进行调整。其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
进一步地,为了提高CNN的性能,在具体实施时,在本发明实施例提供的训练装置中,如图5所示,在本发明实施例提供的训练装置包括第一选取单元401、第一控制单元402、第一监督训练单元403、第一调整单元404以及第一存储单元405时,还可以包括:
第二选取单元406,用于从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
第二控制单元407,用于将目标域训练样本集合输入卷积神经网络中,获得目标域训练样本集合中各样本中的人脸图像的特征向量;
第二监督训练单元408,用于根据目标域训练样本集合中各样本中的人脸图像的特征向量,通过第一联合训练监督函数,确定联合监督训练的第二误差;
第二调整单元409,用于在根据第一误差对卷积神经网络的网络参数进行调整之后,根据第二误差对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
在具体实施时,预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练装置中,从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括:N个样本;其中,N=k*n,k代表从预设源域人脸图像集合中随机确定的人的数量,即随机选择k个人;n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练装置中,对源域训练样本集合中的图像进行采集,以形成样本对。具体地,从源域训练样本集合中任意选取两个样本进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。其中,如果任意选取的两个样本中的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
在具体实施时,预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练装置中,目标域训练样本集合可以包括M张图像;其中,M=q*m,q代表从预设目标域人脸图像集合中随机确定的人的数量,即随机选择q个人;m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。并且,m张图像包括:确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练装置中,对目标域训练样本集合中的图像进行采集,以形成样本对。具体地,从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,两个样本可以包括:1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中,如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
在具体实施时,在本发明实施例提供的上述训练装置中,第一调整单元具体用于根据第一误差,通过反向传播算法对卷积神经网络的网络参数进行调整。
第二调整单元具体用于在根据第一误差对卷积神经网络的网络参数进行调整之后,根据第二误差,通过反向传播算法对根据第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
并且,反向传播算法可以与现有技术中的相同,根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同,在此不作赘述。
在具体实施时,在本发明实施例提供的训练装置中,归一化后的具有两个阈值的对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表第一阈值,m2代表第二阈值。
进一步地,在具体实施时,在本发明实施例提供的训练装置中,交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
第一联合训练监督函数F01表示为:
F01=F2+αF1;
其中,α代表权重系数。
基于同一发明构思,本发明实施例还提供了一种卷积神经网络的训练装置,如图6所示,可以包括:
第三选取单元601,用于分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合;
第三控制单元602,用于将源域训练样本集合与目标域训练样本集合输入卷积神经网络中,获得源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量;
第三监督训练单元603,用于分别根据源域训练样本集合中各样本中的人脸图像的特征向量与目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
确定单元604,用于根据第三误差与第四误差,确定目标误差;
第三调整单元605,用于根据目标误差对卷积神经网络的网络参数进行调整;
第二存储单元606,用于存储卷积神经网络与第二联合训练监督函数。
本发明实施例提供的训练装置,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定第三误差,以及根据目标域训练样本集合中各样本中的人脸图像的特征向量,确定第四误差。再通过第三误差与第四误差确定出的目标误差对卷积神经网络的网络参数进行调整,其中第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,以及采用源域与目标域两域联合训练的方式,从而可以提高CNN的训练效率和精确度。从而在将训练得到的CNN应用于人脸识别方法中时,可以提高人脸识别方法的泛化能力。
在具体实施时,预设源域人脸图像集合可以为能够从互联网上收集而来的人脸图像数据库。在本发明实施例提供的上述训练装置中,从预设源域人脸图像集合中选取的最小块的源域训练样本集合可以包括:N个样本;其中,N=k*n,k代表从预设源域人脸图像集合中随机确定的人的数量,即随机选择k个人;n代表从预设源域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练装置中,对源域训练样本集合中的图像进行采集,以形成样本对。具体地,从源域训练样本集合中任意选取两个样本进行组合,可以得到个样本对;其中,得到的个样本对可以包括:个正样本对与个负样本对。其中,如果任意选取的两个样本中的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果任意选取的两个样本中的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
在具体实施时,预设目标域人脸图像集合可以为多张证件照片以及从监控视频中采集到的多张人脸图像组成的集合。在本发明实施例提供的上述训练装置中,目标域训练样本集合可以包括M张图像;其中,M=q*m,q代表从预设目标域人脸图像集合中随机确定的人的数量,即随机选择q个人;m代表从预设目标域人脸图像集合中随机选择的同一个人的人脸图像的数量,即针对每一个人,从预设源域人脸图像集合中随机选择n张人脸图像。并且,m张图像包括:确定的一个人的1张证件照片以及从视频中采集的该人的m-1张人脸图像。
进一步地,在具体实施时,在本发明实施例提供的上述训练装置中,对目标域训练样本集合中的图像进行采集,以形成样本对。具体地,从目标域训练样本集合中选取两个样本进行组合,可以得到q2(m-1)个样本对;其中,两个样本可以包括:1张证件照片以及所有从视频中采集的人脸图像中的任意1张人脸图像。得到的q2(m-1)个样本对可以包括:q(m-1)个正样本对与q(q-1)(m-1)个负样本对。其中,如果两个样本中的证件照片与从视频中采集的人脸图像为同一个人,则这两个样本组成的样本对为正样本对。如果两个样本中的证件照片与从视频中采集的人脸图像不为同一个人,则这两个样本组成的样本对为负样本对。
在具体实施时,在本发明实施例提供的训练装置中,第三调整单元具体用于根据目标误差,通过反向传播算法对卷积神经网络的网络参数进行调整。并且,反向传播算法可以与现有技术中的相同,根据误差通过反向传播算法对卷积神经网络的目标网络参数进行调整的方法可以与现有技术中的相同,在此不作赘述。
在具体实施时,在本发明实施例提供的训练装置中,归一化后的具有两个阈值的对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对的两张图像对应的特征向量的欧式距离,y代表第p个样本对的标签,m1代表第一阈值,m2代表第二阈值。
进一步地,在具体实施时,在本发明实施例提供的训练装置中,交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
第二联合训练监督函数F02表示为:
F02=F2+βF1;
其中,β代表权重系数。
进一步地,在具体实施时,在本发明实施例提供的训练装置中,确定目标误差,具体包括:根据如下公式确定目标误差f0;
f0=f3+γf4;
其中,f3代表第三误差,f4代表第四误差,γ代表权重系数。
基于同一发明构思,本发明实施例还提供了一种人脸识别装置,如图7所示,可以包括:
采集单元701,用于采集人脸图像;
提取单元702,用于使用卷积神经网络提取人脸图像的特征向量;其中,卷积神经网络通过本发明实施例提供的任一种训练方法训练得到;
识别单元703,用于使用提取的特征向量进行人脸识别;
目标存储单元704,用于存储通过本发明实施例提供的任一种训练方法训练得到卷积神经网络。
本发明实施例提供的人脸识别装置,使用通过本发明实施例提供的上述任一种训练方法训练得到的卷积神经网络提取人脸图像的特征向量,可以提高人脸识别的泛化能力。
在具体实施时,本发明实施例提供的人脸识别装置可以应用于安防视频监控环境下,例如应用于反恐、公共、平安城市等方面。当然,本发明实施例提供的人脸识别装置也可以应用于其他需要进行人脸识别和确认的环境中,在此不作限定。
本发明实施例提供的卷积神经网络的训练方法、人脸识别方法及装置,通过采用交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,以根据源域训练样本集合中各样本中的人脸图像的特征向量,确定联合监督训练的第一误差,并通过第一误差对卷积神经网络的网络参数进行调整。其中,两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较,这样既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,提高CNN的训练效率和精确度。或者,采用既可以控制负样本对的监督训练,又可以控制正样本对的监督训练,以及采用源域与目标域两域联合训练的方式,提高CNN的训练效率和精确度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (18)
1.一种卷积神经网络的训练方法,其特征在于,包括:
从预设源域人脸图像集合中选取最小块的源域训练样本集合;
将所述源域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量;
根据所述源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
根据所述第一误差对所述卷积神经网络的网络参数进行调整。
2.如权利要求1所述的训练方法,其特征在于,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
3.如权利要求2所述的训练方法,其特征在于,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第一联合训练监督函数F01表示为:
F01=F2+αF1;
其中,α代表权重系数。
4.如权利要求1-3任一项所述的训练方法,其特征在于,在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之前,还包括:
从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
将所述目标域训练样本集合输入所述卷积神经网络中,获得所述目标域训练样本集合中各样本中的人脸图像的特征向量;
根据所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过所述第一联合训练监督函数,确定联合监督训练的第二误差;
在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后,还包括:
根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
5.一种卷积神经网络的训练方法,其特征在于,包括:
分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合;
将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量;
分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
根据所述第三误差与所述第四误差,确定目标误差;
根据所述目标误差对所述卷积神经网络的网络参数进行调整。
6.如权利要求5所述的训练方法,其特征在于,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对的两张图像对应的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
7.如权利要求6所述的训练方法,其特征在于,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第二联合训练监督函数F02表示为:
F02=F2+βF1;
其中,β代表权重系数。
8.如权利要求5-7任一项所述的训练方法,其特征在于,所述确定目标误差,具体包括:根据如下公式确定所述目标误差f0;
f0=f3+γf4;
其中,f3代表所述第三误差,f4代表所述第四误差,γ代表权重系数。
9.一种人脸识别方法,其特征在于,包括:
采集人脸图像;
使用卷积神经网络提取人脸图像的特征向量;其中,所述卷积神经网络通过权利要求1-8任一项所述的训练方法训练得到;
使用提取的所述特征向量进行人脸识别。
10.一种卷积神经网络的训练装置,其特征在于,包括:
第一选取单元,用于从预设源域人脸图像集合中选取最小块的源域训练样本集合;
第一控制单元,用于将所述源域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量;
第一监督训练单元,用于根据所述源域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第一联合训练监督函数,确定联合监督训练的第一误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
第一调整单元,用于根据所述第一误差对所述卷积神经网络的网络参数进行调整;
第一存储单元,用于存储所述卷积神经网络与所述第一联合训练监督函数。
11.如权利要求10所述的训练装置,其特征在于,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对中两张人脸图像的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
12.如权利要求11所述的训练装置,其特征在于,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第一联合训练监督函数F01表示为:
F01=F2+αF1;
其中,α代表权重系数。
13.如权利要求10-12任一项所述的训练装置,其特征在于,还包括:
第二选取单元,用于从预设目标域人脸图像集合中选取最小块的目标域训练样本集合;
第二控制单元,用于将所述目标域训练样本集合输入所述卷积神经网络中,获得所述目标域训练样本集合中各样本中的人脸图像的特征向量;
第二监督训练单元,用于根据所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过所述第一联合训练监督函数,确定联合监督训练的第二误差;
第二调整单元,用于在所述根据所述第一误差对所述卷积神经网络的网络参数进行调整之后,根据所述第二误差对根据所述第一误差调整网络参数后的卷积神经网络的网络参数进行调整。
14.一种卷积神经网络的训练装置,其特征在于,包括:
第三选取单元,用于分别从预设源域人脸图像集合与预设目标域人脸图像集合中选取最小块的源域训练样本集合与目标域训练样本集合;
第三控制单元,用于将所述源域训练样本集合与所述目标域训练样本集合输入所述卷积神经网络中,获得所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量;
第三监督训练单元,用于分别根据所述源域训练样本集合中各样本中的人脸图像的特征向量与所述目标域训练样本集合中各样本中的人脸图像的特征向量,通过交叉熵损失函数与归一化后的具有两个阈值的对比损失函数组成的第二联合训练监督函数,确定联合监督训练的第三误差与第四误差;其中,所述两个阈值中的第一阈值用于与正样本对中两张人脸图像的特征向量的欧式距离进行比较,第二阈值用于与负样本对中两张人脸图像的特征向量的欧式距离进行比较;
确定单元,用于根据所述第三误差与所述第四误差,确定目标误差;
第三调整单元,用于根据所述目标误差对所述卷积神经网络的网络参数进行调整;
第二存储单元,用于存储所述卷积神经网络与所述第二联合训练监督函数。
15.如权利要求14所述的训练装置,其特征在于,归一化后的具有两个阈值的所述对比损失函数F1表示为:
其中,P1代表正样本对的总数,P2代表负样本对的总数,p代表大于或等于1且小于或等于P1+P2的整数,dp代表第p个样本对的两张图像对应的特征向量的欧式距离,y代表第p个样本对的标签,m1代表所述第一阈值,m2代表所述第二阈值。
16.如权利要求15所述的训练装置,其特征在于,所述交叉熵损失函数F2表示为:
其中,I代表样本的总数,J代表类别的总数,i代表大于或等于1且小于或等于I的整数,j代表大于或等于1且小于或等于J的整数,代表预测第i个样本属于第j类的概率,μ{yi=j}代表当第i个样本属于第j类时取1,否则取0;
所述第二联合训练监督函数F02表示为:
F02=F2+βF1;
其中,β代表权重系数。
17.如权利要求14-16任一项所述的训练装置,其特征在于,所述确定目标误差,具体包括:根据如下公式确定所述目标误差f0;
f0=f3+γf4;
其中,f3代表所述第三误差,f4代表所述第四误差,γ代表权重系数。
18.一种人脸识别装置,其特征在于,包括:
采集单元,用于采集人脸图像;
提取单元,用于使用卷积神经网络提取人脸图像的特征向量;其中,所述卷积神经网络通过权利要求1-8任一项所述的训练方法训练得到;
识别单元,用于使用提取的所述特征向量进行人脸识别;
目标存储单元,用于存储通过权利要求1-8任一项所述的训练方法训练得到的所述卷积神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711414491.4A CN108182394B (zh) | 2017-12-22 | 2017-12-22 | 卷积神经网络的训练方法、人脸识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711414491.4A CN108182394B (zh) | 2017-12-22 | 2017-12-22 | 卷积神经网络的训练方法、人脸识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108182394A true CN108182394A (zh) | 2018-06-19 |
CN108182394B CN108182394B (zh) | 2021-02-02 |
Family
ID=62546870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711414491.4A Active CN108182394B (zh) | 2017-12-22 | 2017-12-22 | 卷积神经网络的训练方法、人脸识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182394B (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255322A (zh) * | 2018-09-03 | 2019-01-22 | 北京诚志重科海图科技有限公司 | 一种人脸活体检测方法及装置 |
CN109522844A (zh) * | 2018-11-19 | 2019-03-26 | 燕山大学 | 一种社交亲密度确定方法及系统 |
CN109800710A (zh) * | 2019-01-18 | 2019-05-24 | 北京交通大学 | 行人重识别系统及方法 |
CN110059616A (zh) * | 2019-04-17 | 2019-07-26 | 南京邮电大学 | 基于融合损失函数的行人重识别模型优化方法 |
CN110188829A (zh) * | 2019-05-31 | 2019-08-30 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、目标识别的方法及相关产品 |
CN110288082A (zh) * | 2019-06-05 | 2019-09-27 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110309835A (zh) * | 2019-06-27 | 2019-10-08 | 中国人民解放军战略支援部队信息工程大学 | 一种图像局部特征提取方法及装置 |
CN110602411A (zh) * | 2019-08-07 | 2019-12-20 | 深圳市华付信息技术有限公司 | 一种逆光环境下的人脸图像质量提升方法 |
CN110765943A (zh) * | 2019-10-23 | 2020-02-07 | 深圳市商汤科技有限公司 | 网络训练、识别方法及装置、电子设备和存储介质 |
CN110866136A (zh) * | 2019-11-13 | 2020-03-06 | 幻想动力(上海)文化传播有限公司 | 人脸图像的分堆方法及装置、电子设备、可读存储介质 |
CN111027434A (zh) * | 2018-12-29 | 2020-04-17 | 北京地平线机器人技术研发有限公司 | 一种行人识别模型的训练方法、装置及电子设备 |
WO2020082748A1 (zh) * | 2018-10-25 | 2020-04-30 | 腾讯科技(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
WO2020098121A1 (zh) * | 2018-11-13 | 2020-05-22 | 平安科技(深圳)有限公司 | 快速模型的训练方法、装置、计算机设备及存储介质 |
CN111325223A (zh) * | 2018-12-13 | 2020-06-23 | 中国电信股份有限公司 | 深度学习模型的训练方法、装置和计算机可读存储介质 |
CN111401454A (zh) * | 2020-03-19 | 2020-07-10 | 创新奇智(重庆)科技有限公司 | 一种基于迁移学习的少样本目标识别方法 |
CN111680636A (zh) * | 2020-06-09 | 2020-09-18 | 广州视源电子科技股份有限公司 | 模型训练方法及装置 |
CN111814689A (zh) * | 2020-07-09 | 2020-10-23 | 浙江大华技术股份有限公司 | 火灾识别网络模型的训练方法、火灾识别方法及相关设备 |
CN112613341A (zh) * | 2020-11-25 | 2021-04-06 | 北京迈格威科技有限公司 | 训练方法及装置、指纹识别方法及装置、电子设备 |
CN112926508A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 活体检测模型的训练方法和装置 |
CN113033582A (zh) * | 2019-12-09 | 2021-06-25 | 杭州海康威视数字技术股份有限公司 | 模型训练方法、特征提取方法及装置 |
CN113191478A (zh) * | 2020-01-14 | 2021-07-30 | 阿里巴巴集团控股有限公司 | 神经网络模型的训练方法、装置和系统 |
CN113255575A (zh) * | 2021-06-17 | 2021-08-13 | 深圳市商汤科技有限公司 | 一种神经网络训练方法、装置、计算机设备及存储介质 |
CN113673498A (zh) * | 2021-07-28 | 2021-11-19 | 浙江大华技术股份有限公司 | 目标检测方法、装置、设备和计算机可读存储介质 |
WO2021258482A1 (zh) * | 2020-06-24 | 2021-12-30 | 五邑大学 | 基于迁移与弱监督的美丽预测方法、装置及存储介质 |
US11675876B2 (en) | 2020-10-28 | 2023-06-13 | International Business Machines Corporation | Training robust machine learning models |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198303A (zh) * | 2013-04-12 | 2013-07-10 | 南京邮电大学 | 一种基于人脸图像的性别识别方法 |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
CN105574510A (zh) * | 2015-12-18 | 2016-05-11 | 北京邮电大学 | 一种步态识别方法及装置 |
US9418319B2 (en) * | 2014-11-21 | 2016-08-16 | Adobe Systems Incorporated | Object detection using cascaded convolutional neural networks |
CN106096538A (zh) * | 2016-06-08 | 2016-11-09 | 中国科学院自动化研究所 | 基于定序神经网络模型的人脸识别方法及装置 |
CN106485230A (zh) * | 2016-10-18 | 2017-03-08 | 中国科学院重庆绿色智能技术研究院 | 基于神经网络的人脸检测模型的训练、人脸检测方法及系统 |
CN106529565A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 目标识别模型训练和目标识别方法及装置、计算设备 |
CN106919909A (zh) * | 2017-02-10 | 2017-07-04 | 华中科技大学 | 一种行人重识别的度量学习方法和系统 |
CN107194422A (zh) * | 2017-06-19 | 2017-09-22 | 中国人民解放军国防科学技术大学 | 一种结合正反向实例的卷积神经网络关系分类方法 |
CN107220611A (zh) * | 2017-05-23 | 2017-09-29 | 上海交通大学 | 一种基于深度神经网络的空时特征提取方法 |
CN107291722A (zh) * | 2016-03-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种描述词的分类方法及设备 |
-
2017
- 2017-12-22 CN CN201711414491.4A patent/CN108182394B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198303A (zh) * | 2013-04-12 | 2013-07-10 | 南京邮电大学 | 一种基于人脸图像的性别识别方法 |
US9418319B2 (en) * | 2014-11-21 | 2016-08-16 | Adobe Systems Incorporated | Object detection using cascaded convolutional neural networks |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
CN105574510A (zh) * | 2015-12-18 | 2016-05-11 | 北京邮电大学 | 一种步态识别方法及装置 |
CN107291722A (zh) * | 2016-03-30 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种描述词的分类方法及设备 |
CN106096538A (zh) * | 2016-06-08 | 2016-11-09 | 中国科学院自动化研究所 | 基于定序神经网络模型的人脸识别方法及装置 |
CN106529565A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 目标识别模型训练和目标识别方法及装置、计算设备 |
CN106485230A (zh) * | 2016-10-18 | 2017-03-08 | 中国科学院重庆绿色智能技术研究院 | 基于神经网络的人脸检测模型的训练、人脸检测方法及系统 |
CN106919909A (zh) * | 2017-02-10 | 2017-07-04 | 华中科技大学 | 一种行人重识别的度量学习方法和系统 |
CN107220611A (zh) * | 2017-05-23 | 2017-09-29 | 上海交通大学 | 一种基于深度神经网络的空时特征提取方法 |
CN107194422A (zh) * | 2017-06-19 | 2017-09-22 | 中国人民解放军国防科学技术大学 | 一种结合正反向实例的卷积神经网络关系分类方法 |
Non-Patent Citations (4)
Title |
---|
DE CHENG 等: "Person Re-identification by Multi-Channel Parts-Based CNN with Improved Triplet Loss Function", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
SUN PEI-XIA 等: "Learning discriminative CNN features and similarity metrics for image retrieval", 《 IEEE CONFERENCE PUBLICATION》 * |
孟益民 等: "双阈值二元神经网络模型解的收敛性", 《模糊系统与数学》 * |
聂超: "卷积神经网络在人脸是识别上的研究", 《哈尔滨商业大学学报》 * |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255322A (zh) * | 2018-09-03 | 2019-01-22 | 北京诚志重科海图科技有限公司 | 一种人脸活体检测方法及装置 |
WO2020082748A1 (zh) * | 2018-10-25 | 2020-04-30 | 腾讯科技(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
WO2020098121A1 (zh) * | 2018-11-13 | 2020-05-22 | 平安科技(深圳)有限公司 | 快速模型的训练方法、装置、计算机设备及存储介质 |
CN109522844A (zh) * | 2018-11-19 | 2019-03-26 | 燕山大学 | 一种社交亲密度确定方法及系统 |
CN109522844B (zh) * | 2018-11-19 | 2020-07-24 | 燕山大学 | 一种社交亲密度确定方法及系统 |
CN111325223B (zh) * | 2018-12-13 | 2023-10-24 | 中国电信股份有限公司 | 深度学习模型的训练方法、装置和计算机可读存储介质 |
CN111325223A (zh) * | 2018-12-13 | 2020-06-23 | 中国电信股份有限公司 | 深度学习模型的训练方法、装置和计算机可读存储介质 |
CN111027434B (zh) * | 2018-12-29 | 2023-07-11 | 北京地平线机器人技术研发有限公司 | 一种行人识别模型的训练方法、装置及电子设备 |
CN111027434A (zh) * | 2018-12-29 | 2020-04-17 | 北京地平线机器人技术研发有限公司 | 一种行人识别模型的训练方法、装置及电子设备 |
CN109800710A (zh) * | 2019-01-18 | 2019-05-24 | 北京交通大学 | 行人重识别系统及方法 |
CN109800710B (zh) * | 2019-01-18 | 2021-04-06 | 北京交通大学 | 行人重识别系统及方法 |
CN110059616A (zh) * | 2019-04-17 | 2019-07-26 | 南京邮电大学 | 基于融合损失函数的行人重识别模型优化方法 |
CN110188829B (zh) * | 2019-05-31 | 2022-01-28 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、目标识别的方法及相关产品 |
CN110188829A (zh) * | 2019-05-31 | 2019-08-30 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、目标识别的方法及相关产品 |
CN110288082A (zh) * | 2019-06-05 | 2019-09-27 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110288082B (zh) * | 2019-06-05 | 2022-04-05 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110309835B (zh) * | 2019-06-27 | 2021-10-15 | 中国人民解放军战略支援部队信息工程大学 | 一种图像局部特征提取方法及装置 |
CN110309835A (zh) * | 2019-06-27 | 2019-10-08 | 中国人民解放军战略支援部队信息工程大学 | 一种图像局部特征提取方法及装置 |
CN110602411A (zh) * | 2019-08-07 | 2019-12-20 | 深圳市华付信息技术有限公司 | 一种逆光环境下的人脸图像质量提升方法 |
CN110765943A (zh) * | 2019-10-23 | 2020-02-07 | 深圳市商汤科技有限公司 | 网络训练、识别方法及装置、电子设备和存储介质 |
CN110866136A (zh) * | 2019-11-13 | 2020-03-06 | 幻想动力(上海)文化传播有限公司 | 人脸图像的分堆方法及装置、电子设备、可读存储介质 |
CN110866136B (zh) * | 2019-11-13 | 2022-10-18 | 上海甜里智能科技有限公司 | 人脸图像的分堆方法及装置、电子设备、可读存储介质 |
CN113033582A (zh) * | 2019-12-09 | 2021-06-25 | 杭州海康威视数字技术股份有限公司 | 模型训练方法、特征提取方法及装置 |
CN113033582B (zh) * | 2019-12-09 | 2023-09-26 | 杭州海康威视数字技术股份有限公司 | 模型训练方法、特征提取方法及装置 |
CN113191478A (zh) * | 2020-01-14 | 2021-07-30 | 阿里巴巴集团控股有限公司 | 神经网络模型的训练方法、装置和系统 |
CN111401454A (zh) * | 2020-03-19 | 2020-07-10 | 创新奇智(重庆)科技有限公司 | 一种基于迁移学习的少样本目标识别方法 |
CN111680636B (zh) * | 2020-06-09 | 2024-02-06 | 广州视源电子科技股份有限公司 | 模型训练方法及装置 |
CN111680636A (zh) * | 2020-06-09 | 2020-09-18 | 广州视源电子科技股份有限公司 | 模型训练方法及装置 |
WO2021258482A1 (zh) * | 2020-06-24 | 2021-12-30 | 五邑大学 | 基于迁移与弱监督的美丽预测方法、装置及存储介质 |
US11769319B2 (en) | 2020-06-24 | 2023-09-26 | Wuyi University | Method and device for predicting beauty based on migration and weak supervision, and storage medium |
CN111814689A (zh) * | 2020-07-09 | 2020-10-23 | 浙江大华技术股份有限公司 | 火灾识别网络模型的训练方法、火灾识别方法及相关设备 |
US11675876B2 (en) | 2020-10-28 | 2023-06-13 | International Business Machines Corporation | Training robust machine learning models |
CN112613341A (zh) * | 2020-11-25 | 2021-04-06 | 北京迈格威科技有限公司 | 训练方法及装置、指纹识别方法及装置、电子设备 |
CN112926508B (zh) * | 2021-03-25 | 2022-07-19 | 支付宝(杭州)信息技术有限公司 | 活体检测模型的训练方法和装置 |
CN112926508A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 活体检测模型的训练方法和装置 |
WO2022262209A1 (zh) * | 2021-06-17 | 2022-12-22 | 深圳市商汤科技有限公司 | 一种神经网络训练方法、装置、计算机设备及存储介质 |
CN113255575A (zh) * | 2021-06-17 | 2021-08-13 | 深圳市商汤科技有限公司 | 一种神经网络训练方法、装置、计算机设备及存储介质 |
CN113255575B (zh) * | 2021-06-17 | 2024-03-29 | 深圳市商汤科技有限公司 | 一种神经网络训练方法、装置、计算机设备及存储介质 |
CN113673498A (zh) * | 2021-07-28 | 2021-11-19 | 浙江大华技术股份有限公司 | 目标检测方法、装置、设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108182394B (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182394A (zh) | 卷积神经网络的训练方法、人脸识别方法及装置 | |
Hu et al. | A novel image steganography method via deep convolutional generative adversarial networks | |
CN107766447B (zh) | 一种使用多层注意力网络机制解决视频问答的方法 | |
CN111340214B (zh) | 对抗攻击模型的训练方法及装置 | |
CN105678250B (zh) | 视频中的人脸识别方法和装置 | |
CN113255936B (zh) | 基于模仿学习和注意力机制的深度强化学习策略保护防御方法和装置 | |
CN109902546A (zh) | 人脸识别方法、装置及计算机可读介质 | |
CN107844784A (zh) | 人脸识别方法、装置、计算机设备和可读存储介质 | |
CN106485773B (zh) | 一种用于生成动画数据的方法和装置 | |
CN105518708A (zh) | 用于验证活体人脸的方法、设备和计算机程序产品 | |
CN108121995A (zh) | 用于识别对象的方法和设备 | |
CN106326857A (zh) | 基于人脸图像的性别识别方法及装置 | |
CN104751140A (zh) | 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 | |
Pratama et al. | Face recognition for presence system by using residual networks-50 architecture | |
CN109376699A (zh) | 一种基于卷积神经网络的指纹识别方法 | |
KR102151252B1 (ko) | 시술 예측 솔루션 | |
CN109670623A (zh) | 神经网络预测方法及装置 | |
Zhang et al. | A virtual laboratory system with biometric authentication and remote proctoring based on facial recognition | |
Rabiha et al. | Image processing model based E-Learning for students authentication | |
CN115511670A (zh) | 一种在线教育方法及在线教育平台 | |
CN109523478A (zh) | 图像去网格方法、存储介质 | |
Buonamente et al. | Discriminating and simulating actions with the associative self-organising map | |
Viliunas et al. | Shape-finding in biophilic architecture: application of AI-based tool | |
Kit et al. | A Scoping Review of GAN-Generated Images Detection | |
Tavella et al. | Signs of Language: Embodied Sign Language Fingerspelling Acquisition from Demonstrations for Human-Robot Interaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |