CN108960342B

CN108960342B - 基于改进Soft-Max损失函数的图像相似度计算方法

Info

Publication number: CN108960342B
Application number: CN201810864947.5A
Authority: CN
Inventors: 章东平; 李建超
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2021-09-14
Anticipated expiration: 2038-08-01
Also published as: CN108960342A

Abstract

本发明公开了一种基于改进型Soft‑Max损失函数的图像相似度计算方法，图像识别网络中的改进型Soft‑Max层的激活函数采用改进型Soft‑Max激活函数，反向传播过程中采用改进型Soft‑Max损失函数更新网络权值，改进型Soft‑Max损失函数与传统的Soft‑Max损失函数相比增加了通过图像识别网络学习得到的决策边缘；在测试阶段用训练好的图像识别模型对两张测试图像提取特征向量，计算得到特征向量之间的余弦相似度，和设置的图像相似度阈值比较，如果大于等于图像相似度阈值则判定两张图像为同一类图像，如果小于图像相似度阈值则判定两张图像为不同类图像。

Description

基于改进Soft-Max损失函数的图像相似度计算方法

技术领域

本发明属于深度神经网络提取图像特征的深度学习领域，涉及到神经网络、模式识别等技术，尤其涉及到一种基于改进型Soft-Max损失函数的图像相似度计算方法。

背景技术

图像识别技术是现今人工智能以及模式识别的研究热点，是一种根据观测到的图像对其中的物体进行类别鉴别的生物识别技术。它在航空航天、医学、工业自动化、机器人、及军事等领域都有广泛的应用。

随着科技的发展，图像识别的应用范围不断扩大，逐渐从公安刑侦领域，推广到工业邻域，如做激光定位切割、定位打标、定位焊接时非常需要图像识别技术的帮助、自动化生产线物品的分类等，也被广泛应用于安防领域。这些应用是用在现实场景过程中所以对于识别准确率有较高要求，但是现代图像识别技术的一个不足就是识别准确率比较低，现实场景中的图像识别效果及准确率明显偏低，在实时场景中的图像常常受到光照、遮挡等影响，造成图像噪声过大，对于抓拍到的图像存在识别准确率比较低的问题。

解决上述问题的关键就是要克服图像识别准确率的问题，本发明根据深度神经网络和改进型Soft-Max损失函数训练图像识别模型，提高现实场景下图像识别准确率。目前,深度学习由于其强大的表征能力,提取的特征相比传统方法手工构造的特征具有更强的鲁棒性,因此被广泛应用于图像识别中。用深度学神经网络和传统的Soft-Max损失函数训练的图像识别模型比传统方法训练的模型在识别准确率上要高很多，但是识别准确率还是有待提高。所以要实现高识别准确率的图像识别要通过更有效的解决方法。

发明内容

本发明克服了现有技术的不足之处，提出了一种基于改进型Soft-Max损失函数的图像相似度计算方法，意在利用改进型Soft-Max损失函数训练出高识别准确率的图像识别模型，提高现实场景中图像识别过程的图像分类正确性。

本发明为达上述发明目的，采用如下技术方案：

一种基于改进型Soft-Max损失函数的图像相似度计算方法，其步骤包括：

步骤(1)：准备图像识别训练数据集和，将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练，所述基于卷积神经网络的图像识别网络中包含卷积层，最大采样层，全连接层，改进型Soft-Max层四种网络层，其中，一个卷积层与一个最大采样层构成一个图像识别子结构，图像识别网络包含N个串联的子结构，图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层，所述图像特征层和图像分类层分别为输出维度是C维和 D维的全连接层，C表示图像特征数，D表示图像类别数，改进型Soft-Max层激活函数为：

其中，σ(x_i)表示在图像识别网络中的改进型Soft-Max层对第i个样本属于正确类别的预测概率值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n表示总训练样本的类别数，m表示决策边缘，由网络训练得到。

步骤(2)：选用改进型Soft-Max损失函数来进行图像识别网络的反向传播更新网络权值，训练得到一个图像识别的模型，所述改进型Soft-Max损失函数计算公式为：

进一步地，图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为：

第i个样本的损失函数对决策边缘m求偏导的公式为：

第i个样本的损失函数对权重w_yi求偏导的公式为：

第i个样本的损失函数对偏置项b_i求偏导的公式为：

第i个样本的损失函数对权重w_j求偏导的公式为：

其中，L_i表示第i个样本的损失值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n表示总训练样本的类别数，λ表示权重系数，m表示决策边缘，由网络训练得到。

步骤(3)：将两张待测试的图像P₁和P₂利用步骤(2)中得到的图像识别模型进行图像特征的提取，分别得到图像特征向量P_f1和P_f2，通过计算得到P_f1和P_f2之间的余弦相似度P_c,设置图像相似度阈值为P_t，如果P_c≥P_t，则判定图像P₁和P₂是同一类图像，如果P_c＜P_t，则判定图像P₁和P₂不是同一类图像，所述图像特征为步骤(1)中的图像特征层的输出。

与现有技术相比，本发明的有益效果体现在：

本发明采取改进型Soft-Max损失函数的图像相似度计算方法，采用基于深度学习的图像识别网络提取图像特征，使得提取到的特征具有更强的图像特征表达能力，能够有效避免传统手工方法提取的特征由于表征能力不足造成的图像识别准确率不高的问题，图像识别网络中的改进型Soft-Max层的激活函数采用改进型Soft-Max激活函数，反向传播过程中采用改进型Soft-Max损失函数更新网络权值，使得图像特征具有更大的类间距离和更小的类内距离，训练得到图像识别模型；在测试阶段用训练好的图像识别模型对两张测试图像提取特征向量，计算得到特征向量之间的余弦相似度，和设置的图像相似度阈值比较，如果大于等于图像相似度阈值则判定两张图像为同一类图像，如果小于图像相似度阈值则判定两张图像为不同类图像；本发明适用于图像识别，能够克服采用基于深度学习的图像识别网络和传统Soft-Max损失函数训练的图像识别模型计算图像相似度存在的识别不准确问题，提高图像识别的准确性。

附图说明

图1是图像识别网络结构示意图。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示为图像识别网络结构示意图，本发明的基于改进型Soft-Max损失函数的图像相似度计算方法主要包括如下步骤：

步骤(1)：准备图像识别训练数据集，训练数据集为开源的图像识别数据库ImageNet 2012,包括1000个类别的1百多万张图像，将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练，所述基于卷积神经网络的图像识别网络中包含卷积层，最大采样层，全连接层，改进型Soft-Max层四种网络层，其中，一个卷积层与一个最大采样层构成一个图像识别子结构，图像识别网络包含N＝34个串联的子结构，图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层，所述图像特征层和图像分类层分别为输出维度是512维和1000维的全连接层，512表示图像特征数，1000表示图像类别数，改进型Soft-Max层激活函数为：

其中，σ(x_i)表示在图像识别网络中改进型Soft-Max层对第i个样本属于正确类别的预测概率值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n＝1000表示总训练样本的类别数，m表示决策边缘，由网络训练得到。

第i个样本的损失函数对决策边缘m求偏导的公式为：

第i个样本的损失函数对权重w_yi求偏导的公式为：

第i个样本的损失函数对偏置项b_i求偏导的公式为：

第i个样本的损失函数对权重w_j求偏导的公式为：

其中，L_i表示第i个样本的损失值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n＝1000表示总训练样本的类别数，λ表示权重系数，取λ＝0.5，m表示决策边缘，由网络训练得到。

步骤(3)：将两张待测试的图像P₁和P₂利用步骤(2)中得到的图像识别模型进行图像特征的提取，分别得到图像特征向量P_f1和P_f2，通过计算得到P_f1和 P_f2之间的余弦相似度P_c,设置图像相似度阈值为P_t＝0.8，如果P_c≥0.8，则判定图像P₁和P₂是同一类图像，如果P_c＜0.8，则判定图像P₁和P₂不是同一类图像，所述图像特征为步骤(1)中的图像特征层的输出。

Claims

1.一种基于改进型Soft-Max损失函数的图像相似度计算方法，其特征在于按照如下步骤进行：

步骤(1)：准备图像识别训练数据集，将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练，所述基于卷积神经网络的图像识别网络中包含卷积层，最大采样层，全连接层，改进型Soft-Max层四种网络层，其中，一个卷积层与一个最大采样层构成一个图像识别子结构，图像识别网络包含N个串联的子结构，图像识别网络的最后三层分别为图像特征层、图像分类层和改进型Soft-Max层，所述图像特征层和图像分类层分别为输出维度是C维和D维的全连接层，C表示图像特征数，D表示图像类别数，改进型Soft-Max层激活函数为：

其中，σ(x_i)表示在图像识别网络中的改进型Soft-Max层对第i个样本属于正确类别的预测概率值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重矩阵的第j列向量，n表示总训练样本的类别数，m表示决策边缘，由网络训练得到；

其中，L_i表示第i个样本的损失值，x_i∈R^d表示第i个样本在图像识别网络中的图像特征层的输出值，y_i表示第i个样本的图像类别标签，w_j表示图像特征层与图像分类层之间的权重矩阵的第j列向量，n表示总训练样本的类别数，λ表示权重系数，m表示决策边缘，由网络训练得到；

2.如权利要求1所述的一种基于改进型Soft-Max损失函数的图像相似度计算方法，其特征在于：步骤(2)中图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为：

第i个样本的损失函数对决策边缘m求偏导的公式为：

第i个样本的损失函数对权重

求偏导的公式为：

第i个样本的损失函数对偏置项b_i求偏导的公式为：

第i个样本的损失函数对权重w_j求偏导的公式为：