CN109241995B

CN109241995B - 一种基于改进型ArcFace损失函数的图像识别方法

Info

Publication number: CN109241995B
Application number: CN201810866142.4A
Authority: CN
Inventors: 章东平; 陈思瑶
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2021-05-14
Anticipated expiration: 2038-08-01
Also published as: CN109241995A

Abstract

本发明公开了一种基于改进型ArcFace损失函数的图像识别方法，采用基于深度学习的图像识别网络对图像的特征进行提取，将提取的特征用来描述图像的主要信息，采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练，改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界，从而提高图像识别模型识别的准确性。本发明用于模式识别领域。

Description

一种基于改进型ArcFace损失函数的图像识别方法

技术领域

本发明属于深度神经网络提取图像特征的深度学习领域，涉及到神经网络、模式识别等技术，尤其涉及到一种基于改进型ArcFace损失函数的图像识别方法。

背景技术

随着大数据时代的来临和计算能力的大幅提高，图像识别技术正向着高级语义理解方向发展，而基于深度学习的图像识别技术已经成为当今人工智能领域的研究热点。

图像识别技术是通过计算机对图像自动进行处理、分析和理解，以识别各种不同模式的目标和对象的技术。图像识别技术具有广泛的应用，例如，在农业中，可以通过植物的长势、叶子和花的颜色进行判断，给植物进行浇水、施肥、杀虫；在工业中，可以通过图像识别对整个车间的产品进行把控；在医学中，可以通过细胞、骨头的形状进行分析病人的健康状况；在航天中，可以根据卫星图片的实时反馈，进行航天研究；在日常生活中，图像识别技术也非常普及，如车牌识别、指纹识别等；然而，图像识别技术还存在一些困难，由于视点变化、背景复杂、光影变化、遮挡、变形等增加图像识别的难度，造成在基于深度学习的图像识别网络训练过程中图像分类不准确问题，为解决这一问题，ArcFace损失函数被提出，但ArcFace仅从减小类内距离来最大化分类边界。

解决上述问题的关键就是设计一个改进型ArcFace损失函数，在基于深度学习的图像识别网络训练过程中，既减小类内距离又增大类间距离来最大化分类边界，从而提高图像识别模型识别的准确性。

发明内容

本发明克服了现有技术的不足之处，提出了一种基于改进型ArcFace损失函数的图像识别方法，意在利用改进型ArcFace损失函数进行图像识别模型训练，提高现实场景中图像识别的准确性。

本发明为达上述发明目的，采用如下技术方案：

一种基于改进型ArcFace损失函数的图像识别方法，其步骤包括：

步骤(1)：准备图像识别训练数据集、测试数据集；

步骤(2)：构建基于卷积神经网络的图像识别网络结构，所述基于卷积神经网络的图像识别网络包含卷积层，池化层，全连接层，改进型ArcFace损失函数层，其中，两个卷积层与一个池化层构成一个图像识别子结构，图像识别网络由N个串联的子结构，两个全连接层F₁、F₂，一个改进型ArcFace损失函数层构成；

步骤(3)：将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练，训练过程中的损失函数采用改进型ArcFace损失函数，通过不断的对网络进行循环迭代训练使损失函数不断减小，直到完成设定的迭代次数Q，并将图像识别模型进行保存；

进一步地，所述改进型ArcFace损失函数计算公式为：

其中，n表示训练过程中每次迭代输入的训练样本总数，L表示n个样本的损失平均值，y_i表示第i个样本的图像类别标签，

表示全连接层F₂的权重矩阵的第y_i列和全连接层F₁的输出的夹角，θ_j表示全连接层F₂的权重矩阵的第j列和全连接层F₁的输出的夹角，s表示自适应余弦系数(可取s＝64)，C表示总训练样本的类别数，λ表示自适应权重系数(可取λ＝0.5)，m表示决策边缘，由网络训练得到；

步骤(4)：将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取，计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T，如果相似度P大于阈值T，则判断两张图像是同一类图像，否则判断两张图像不是同一类图像，得到图像识别模型的测试结果。

与现有技术相比，本发明的有益效果体现在：

本发明采取一种基于改进型ArcFace损失函数进行图像识别，采用基于深度学习的图像识别网络对图像的特征进行提取，将提取的特征用来描述图像的主要信息，采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练，ArcFace损失函数只是在角度空间通过减小类内距离来最大化分类边界，不能够使不同类别的图像尽可能的划分，而改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界，不仅能够使同一类别的图像更加紧凑，还会使不同类别的图像尽可能的划分，从而提高图像识别模型识别的准确性，本发明适用于图像识别，能够克服采用ArcFace损失函数对基于卷积神经网络进行训练得到的图像识别模型识别不准确问题，提高图像识别的准确性。

附图说明

图1是一种基于改进型ArcFace损失函数的图像识别卷积神经网络结构示意图。

具体实施方式

下面结合附图对本发明作进一步说明。

本实施例中，如图1所示，一种基于改进型ArcFace损失函数的图像识别方法包括如下步骤：

步骤(1)：准备图像识别训练数据集、测试数据集；

步骤(2)：构建基于卷积神经网络的图像识别网络结构，所述基于卷积神经网络的图像识别网络包含卷积层，池化层，全连接层，改进型ArcFace损失函数层，其中，两个卷积层与一个池化层构成一个图像识别子结构，图像识别网络由32个串联的子结构，两个全连接层F₁、F₂，一个改进型ArcFace损失函数层构成；

步骤(3)：将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练，训练过程中的损失函数采用改进型ArcFace损失函数，通过不断的对网络进行循环迭代训练使损失函数不断减小，直到完成设定的迭代次数100,000，并将图像识别模型进行保存；

进一步地，改进型ArcFace损失函数计算公式为：

在训练过程中，设置自适应余弦系数s＝64，自适应权重系数λ＝0.5；

步骤(4)：将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取，计算每两个图像特征向量之间的余弦相似度P，设置图像相似度阈值为T，如果相似度P大于阈值T，设置T＝0.8,则判断两张图像是同一类图像，否则判断两张图像不是同一类图像，得到图像识别模型的测试结果。

Claims

1.一种基于改进型ArcFace损失函数的图像识别方法，其特征在于包括如下步骤：

步骤(1)：准备图像识别训练数据集、测试数据集；

步骤(4)：将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取，计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T，如果相似度P大于阈值T，则判断两张图像是同一类图像，否则判断两张图像不是同一类图像，得到图像识别模型的测试结果；

所述改进型ArcFace损失函数计算公式为：

表示全连接层F₂的权重矩阵的第y_i列和全连接层F₁的输出的夹角，θ_j表示全连接层F₂的权重矩阵的第j列和全连接层F₁的输出的夹角，s表示自适应余弦系数，C表示总训练样本的类别数，λ表示自适应权重系数，m表示决策边缘，由网络训练得到。