CN109241995B - 一种基于改进型ArcFace损失函数的图像识别方法 - Google Patents
一种基于改进型ArcFace损失函数的图像识别方法 Download PDFInfo
- Publication number
- CN109241995B CN109241995B CN201810866142.4A CN201810866142A CN109241995B CN 109241995 B CN109241995 B CN 109241995B CN 201810866142 A CN201810866142 A CN 201810866142A CN 109241995 B CN109241995 B CN 109241995B
- Authority
- CN
- China
- Prior art keywords
- image recognition
- image
- loss function
- improved
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明公开了一种基于改进型ArcFace损失函数的图像识别方法,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。本发明用于模式识别领域。
Description
技术领域
本发明属于深度神经网络提取图像特征的深度学习领域,涉及到神经网络、模式识别等技术,尤其涉及到一种基于改进型ArcFace损失函数的图像识别方法。
背景技术
随着大数据时代的来临和计算能力的大幅提高,图像识别技术正向着高级语义理解方向发展,而基于深度学习的图像识别技术已经成为当今人工智能领域的研究热点。
图像识别技术是通过计算机对图像自动进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术具有广泛的应用,例如,在农业中,可以通过植物的长势、叶子和花的颜色进行判断,给植物进行浇水、施肥、杀虫;在工业中,可以通过图像识别对整个车间的产品进行把控;在医学中,可以通过细胞、骨头的形状进行分析病人的健康状况;在航天中,可以根据卫星图片的实时反馈,进行航天研究;在日常生活中,图像识别技术也非常普及,如车牌识别、指纹识别等;然而,图像识别技术还存在一些困难,由于视点变化、背景复杂、光影变化、遮挡、变形等增加图像识别的难度,造成在基于深度学习的图像识别网络训练过程中图像分类不准确问题,为解决这一问题,ArcFace损失函数被提出,但ArcFace仅从减小类内距离来最大化分类边界。
解决上述问题的关键就是设计一个改进型ArcFace损失函数,在基于深度学习的图像识别网络训练过程中,既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。
发明内容
本发明克服了现有技术的不足之处,提出了一种基于改进型ArcFace损失函数的图像识别方法,意在利用改进型ArcFace损失函数进行图像识别模型训练,提高现实场景中图像识别的准确性。
本发明为达上述发明目的,采用如下技术方案:
一种基于改进型ArcFace损失函数的图像识别方法,其步骤包括:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
进一步地,所述改进型ArcFace损失函数计算公式为:
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。
与现有技术相比,本发明的有益效果体现在:
本发明采取一种基于改进型ArcFace损失函数进行图像识别,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,ArcFace损失函数只是在角度空间通过减小类内距离来最大化分类边界,不能够使不同类别的图像尽可能的划分,而改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,不仅能够使同一类别的图像更加紧凑,还会使不同类别的图像尽可能的划分,从而提高图像识别模型识别的准确性,本发明适用于图像识别,能够克服采用ArcFace损失函数对基于卷积神经网络进行训练得到的图像识别模型识别不准确问题,提高图像识别的准确性。
附图说明
图1是一种基于改进型ArcFace损失函数的图像识别卷积神经网络结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
本实施例中,如图1所示,一种基于改进型ArcFace损失函数的图像识别方法包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由32个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数100,000,并将图像识别模型进行保存;
进一步地,改进型ArcFace损失函数计算公式为:
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
在训练过程中,设置自适应余弦系数s=64,自适应权重系数λ=0.5;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,设置T=0.8,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。
Claims (1)
1.一种基于改进型ArcFace损失函数的图像识别方法,其特征在于包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果;
所述改进型ArcFace损失函数计算公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810866142.4A CN109241995B (zh) | 2018-08-01 | 2018-08-01 | 一种基于改进型ArcFace损失函数的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810866142.4A CN109241995B (zh) | 2018-08-01 | 2018-08-01 | 一种基于改进型ArcFace损失函数的图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241995A CN109241995A (zh) | 2019-01-18 |
CN109241995B true CN109241995B (zh) | 2021-05-14 |
Family
ID=65072644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810866142.4A Active CN109241995B (zh) | 2018-08-01 | 2018-08-01 | 一种基于改进型ArcFace损失函数的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241995B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659573B (zh) * | 2019-08-22 | 2021-03-09 | 北京捷通华声科技股份有限公司 | 一种人脸识别方法、装置、电子设备及存储介质 |
CN110880018B (zh) * | 2019-10-29 | 2023-03-14 | 北京邮电大学 | 一种卷积神经网络目标分类方法 |
CN111639558B (zh) * | 2020-05-15 | 2023-06-20 | 圣点世纪科技股份有限公司 | 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法 |
CN112200159B (zh) * | 2020-12-01 | 2021-02-19 | 四川圣点世纪科技有限公司 | 一种基于改进残差网络的非接触式掌静脉识别方法 |
CN112766399B (zh) * | 2021-01-28 | 2021-09-28 | 电子科技大学 | 一种面向图像识别的自适应神经网络训练方法 |
CN113255694B (zh) * | 2021-05-21 | 2022-11-11 | 北京百度网讯科技有限公司 | 训练图像特征提取模型和提取图像特征的方法、装置 |
CN113378833B (zh) * | 2021-06-25 | 2023-09-01 | 北京百度网讯科技有限公司 | 图像识别模型训练方法、图像识别方法、装置及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145852A (zh) * | 2017-04-28 | 2017-09-08 | 深圳市唯特视科技有限公司 | 一种基于同源余弦损失函数的人物识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100082639A1 (en) * | 2008-09-30 | 2010-04-01 | Microsoft Corporation | Processing maximum likelihood for listwise rankings |
-
2018
- 2018-08-01 CN CN201810866142.4A patent/CN109241995B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145852A (zh) * | 2017-04-28 | 2017-09-08 | 深圳市唯特视科技有限公司 | 一种基于同源余弦损失函数的人物识别方法 |
Non-Patent Citations (2)
Title |
---|
《ArcFace:Additive Angular Margin Loss for Deep Face Recognition》;Jiankang Deng等;《arXiv》;20180123;第1-3节 * |
《TypicFace:Dynamic Margin Cosine Loss for Deep Face Recognition》;Lei Li等;《PRICAI2018》;20180727;第3.2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN109241995A (zh) | 2019-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241995B (zh) | 一种基于改进型ArcFace损失函数的图像识别方法 | |
Zhu et al. | High performance vegetable classification from images based on alexnet deep learning model | |
Zeng et al. | Traffic sign recognition using kernel extreme learning machines with deep perceptual features | |
CN110321967B (zh) | 基于卷积神经网络的图像分类改进方法 | |
CN112446388A (zh) | 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统 | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
US8781218B2 (en) | Receptive field learning for pooled image features | |
CN107330355B (zh) | 一种基于正样本平衡约束的深度行人再标识方法 | |
CN109063719B (zh) | 一种联合结构相似性和类信息的图像分类方法 | |
CN104463209A (zh) | 一种基于bp神经网络的pcb板上数字代码识别方法 | |
CN107341510B (zh) | 基于稀疏正交的双图非负矩阵分解的图像聚类方法 | |
CN108416270B (zh) | 一种基于多属性联合特征的交通标志识别方法 | |
CN112307995A (zh) | 一种基于特征解耦学习的半监督行人重识别方法 | |
Xiao et al. | Enhancing multiscale representations with transformer for remote sensing image semantic segmentation | |
CN104077742B (zh) | 基于Gabor特征的人脸素描合成方法及系统 | |
CN114676769A (zh) | 一种基于视觉Transformer的小样本昆虫图像识别方法 | |
Xu et al. | Weakly supervised facial expression recognition via transferred DAL-CNN and active incremental learning | |
CN113505856B (zh) | 一种高光谱影像无监督自适应分类方法 | |
CN114329031A (zh) | 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法 | |
CN104331717B (zh) | 一种整合特征字典结构与视觉特征编码的图像分类方法 | |
CN105718858B (zh) | 一种基于正负广义最大池化的行人识别方法 | |
Ramakrishnan et al. | Learning domain-specific feature descriptors for document images | |
Liu et al. | Multi-digit Recognition with Convolutional Neural Network and Long Short-term Memory | |
Ashoka et al. | Feature extraction technique for neural network based pattern recognition | |
CN114821631A (zh) | 基于注意力机制与多尺度特征融合的行人特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |