CN109241995B - 一种基于改进型ArcFace损失函数的图像识别方法 - Google Patents

一种基于改进型ArcFace损失函数的图像识别方法 Download PDF

Info

Publication number
CN109241995B
CN109241995B CN201810866142.4A CN201810866142A CN109241995B CN 109241995 B CN109241995 B CN 109241995B CN 201810866142 A CN201810866142 A CN 201810866142A CN 109241995 B CN109241995 B CN 109241995B
Authority
CN
China
Prior art keywords
image recognition
image
loss function
improved
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810866142.4A
Other languages
English (en)
Other versions
CN109241995A (zh
Inventor
章东平
陈思瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201810866142.4A priority Critical patent/CN109241995B/zh
Publication of CN109241995A publication Critical patent/CN109241995A/zh
Application granted granted Critical
Publication of CN109241995B publication Critical patent/CN109241995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明公开了一种基于改进型ArcFace损失函数的图像识别方法,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。本发明用于模式识别领域。

Description

一种基于改进型ArcFace损失函数的图像识别方法
技术领域
本发明属于深度神经网络提取图像特征的深度学习领域,涉及到神经网络、模式识别等技术,尤其涉及到一种基于改进型ArcFace损失函数的图像识别方法。
背景技术
随着大数据时代的来临和计算能力的大幅提高,图像识别技术正向着高级语义理解方向发展,而基于深度学习的图像识别技术已经成为当今人工智能领域的研究热点。
图像识别技术是通过计算机对图像自动进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术具有广泛的应用,例如,在农业中,可以通过植物的长势、叶子和花的颜色进行判断,给植物进行浇水、施肥、杀虫;在工业中,可以通过图像识别对整个车间的产品进行把控;在医学中,可以通过细胞、骨头的形状进行分析病人的健康状况;在航天中,可以根据卫星图片的实时反馈,进行航天研究;在日常生活中,图像识别技术也非常普及,如车牌识别、指纹识别等;然而,图像识别技术还存在一些困难,由于视点变化、背景复杂、光影变化、遮挡、变形等增加图像识别的难度,造成在基于深度学习的图像识别网络训练过程中图像分类不准确问题,为解决这一问题,ArcFace损失函数被提出,但ArcFace仅从减小类内距离来最大化分类边界。
解决上述问题的关键就是设计一个改进型ArcFace损失函数,在基于深度学习的图像识别网络训练过程中,既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。
发明内容
本发明克服了现有技术的不足之处,提出了一种基于改进型ArcFace损失函数的图像识别方法,意在利用改进型ArcFace损失函数进行图像识别模型训练,提高现实场景中图像识别的准确性。
本发明为达上述发明目的,采用如下技术方案:
一种基于改进型ArcFace损失函数的图像识别方法,其步骤包括:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
进一步地,所述改进型ArcFace损失函数计算公式为:
Figure BDA0001750984330000021
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,
Figure BDA0001750984330000022
表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。
与现有技术相比,本发明的有益效果体现在:
本发明采取一种基于改进型ArcFace损失函数进行图像识别,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,ArcFace损失函数只是在角度空间通过减小类内距离来最大化分类边界,不能够使不同类别的图像尽可能的划分,而改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,不仅能够使同一类别的图像更加紧凑,还会使不同类别的图像尽可能的划分,从而提高图像识别模型识别的准确性,本发明适用于图像识别,能够克服采用ArcFace损失函数对基于卷积神经网络进行训练得到的图像识别模型识别不准确问题,提高图像识别的准确性。
附图说明
图1是一种基于改进型ArcFace损失函数的图像识别卷积神经网络结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
本实施例中,如图1所示,一种基于改进型ArcFace损失函数的图像识别方法包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由32个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数100,000,并将图像识别模型进行保存;
进一步地,改进型ArcFace损失函数计算公式为:
Figure BDA0001750984330000031
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,
Figure BDA0001750984330000032
表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
在训练过程中,设置自适应余弦系数s=64,自适应权重系数λ=0.5;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,设置T=0.8,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。

Claims (1)

1.一种基于改进型ArcFace损失函数的图像识别方法,其特征在于包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果;
所述改进型ArcFace损失函数计算公式为:
Figure FDA0002984411200000011
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,
Figure FDA0002984411200000012
表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数,C表示总训练样本的类别数,λ表示自适应权重系数,m表示决策边缘,由网络训练得到。
CN201810866142.4A 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法 Active CN109241995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810866142.4A CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810866142.4A CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Publications (2)

Publication Number Publication Date
CN109241995A CN109241995A (zh) 2019-01-18
CN109241995B true CN109241995B (zh) 2021-05-14

Family

ID=65072644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810866142.4A Active CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Country Status (1)

Country Link
CN (1) CN109241995B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659573B (zh) * 2019-08-22 2021-03-09 北京捷通华声科技股份有限公司 一种人脸识别方法、装置、电子设备及存储介质
CN110880018B (zh) * 2019-10-29 2023-03-14 北京邮电大学 一种卷积神经网络目标分类方法
CN111639558B (zh) * 2020-05-15 2023-06-20 圣点世纪科技股份有限公司 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法
CN112200159B (zh) * 2020-12-01 2021-02-19 四川圣点世纪科技有限公司 一种基于改进残差网络的非接触式掌静脉识别方法
CN112766399B (zh) * 2021-01-28 2021-09-28 电子科技大学 一种面向图像识别的自适应神经网络训练方法
CN113255694B (zh) * 2021-05-21 2022-11-11 北京百度网讯科技有限公司 训练图像特征提取模型和提取图像特征的方法、装置
CN113378833B (zh) * 2021-06-25 2023-09-01 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145852A (zh) * 2017-04-28 2017-09-08 深圳市唯特视科技有限公司 一种基于同源余弦损失函数的人物识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082639A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Processing maximum likelihood for listwise rankings

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145852A (zh) * 2017-04-28 2017-09-08 深圳市唯特视科技有限公司 一种基于同源余弦损失函数的人物识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《ArcFace:Additive Angular Margin Loss for Deep Face Recognition》;Jiankang Deng等;《arXiv》;20180123;第1-3节 *
《TypicFace:Dynamic Margin Cosine Loss for Deep Face Recognition》;Lei Li等;《PRICAI2018》;20180727;第3.2节 *

Also Published As

Publication number Publication date
CN109241995A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN109241995B (zh) 一种基于改进型ArcFace损失函数的图像识别方法
Zhu et al. High performance vegetable classification from images based on alexnet deep learning model
Zeng et al. Traffic sign recognition using kernel extreme learning machines with deep perceptual features
CN110321967B (zh) 基于卷积神经网络的图像分类改进方法
CN112446388A (zh) 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
US8781218B2 (en) Receptive field learning for pooled image features
CN107330355B (zh) 一种基于正样本平衡约束的深度行人再标识方法
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN104463209A (zh) 一种基于bp神经网络的pcb板上数字代码识别方法
CN107341510B (zh) 基于稀疏正交的双图非负矩阵分解的图像聚类方法
CN108416270B (zh) 一种基于多属性联合特征的交通标志识别方法
CN112307995A (zh) 一种基于特征解耦学习的半监督行人重识别方法
Xiao et al. Enhancing multiscale representations with transformer for remote sensing image semantic segmentation
CN104077742B (zh) 基于Gabor特征的人脸素描合成方法及系统
CN114676769A (zh) 一种基于视觉Transformer的小样本昆虫图像识别方法
Xu et al. Weakly supervised facial expression recognition via transferred DAL-CNN and active incremental learning
CN113505856B (zh) 一种高光谱影像无监督自适应分类方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN104331717B (zh) 一种整合特征字典结构与视觉特征编码的图像分类方法
CN105718858B (zh) 一种基于正负广义最大池化的行人识别方法
Ramakrishnan et al. Learning domain-specific feature descriptors for document images
Liu et al. Multi-digit Recognition with Convolutional Neural Network and Long Short-term Memory
Ashoka et al. Feature extraction technique for neural network based pattern recognition
CN114821631A (zh) 基于注意力机制与多尺度特征融合的行人特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant