CN109101984A - 一种基于卷积神经网络的图像识别方法及装置 - Google Patents
一种基于卷积神经网络的图像识别方法及装置 Download PDFInfo
- Publication number
- CN109101984A CN109101984A CN201710468011.6A CN201710468011A CN109101984A CN 109101984 A CN109101984 A CN 109101984A CN 201710468011 A CN201710468011 A CN 201710468011A CN 109101984 A CN109101984 A CN 109101984A
- Authority
- CN
- China
- Prior art keywords
- image
- convolutional neural
- neural networks
- default
- probability value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积神经网络的图像识别方法及装置。该方法包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据间隔值、第一概率值以及预设软间隔归一化指数函数,确定训练图像的第二概率值;根据第二概率值和预设互熵损失函数,确定损失值;判断损失值是否收敛,如果是,将预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行前述步骤,直至损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用收敛卷积神经网络对待检测图像进行图像识别。采用该方法对未知图像进行识别,识别结果的准确度更高。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于卷积神经网络的图像识别方法及装置。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,例如,利用卷积神经网络进行图像识别。
现有技术中,在采用卷积神经网络对未知图像进行图像识别时,通常先采用已知图像对卷积神经网络进行训练,生成收敛卷积神经网络,之后采用收敛卷积神经网络即可对未知图像进行图像识别,其中,未知图像和已知图像的含义相反,两者的具体含义取决于图像识别的具体识别内容,例如,如果需要对图像的图像类别进行识别,则未知图像为图像类别不确定的图像,已知图像为图像类别已经确定的图像;如果需要对图像的年龄进行识别,则未知图像为年龄不确定的图像,已知图像为年龄已经确定的图像;如果需要对人脸图像进行验证,则未知图像为人脸类别不确定的图像,已知图像为人脸类别已经确定的图像。识别内容为其它内容时,未知图像和已知图像的含义类同,此处不再一一列举。不过,现有技术中,对卷积神经网络进行训练时,不会考虑图像特征的判别性,基于这样的卷积神经网络对图像进行图像识别时,图像识别结果的准确度较低。
综上可知,现有的基于卷积神经网络的图像识别方法,图像识别结果的准确度较低,适用性较差。
发明内容
本发明提供了一种基于卷积神经网络的图像识别方法及装置,以解决现有的基于卷积神经网络的图像识别方法,图像识别结果的准确度较低,适用性较差的问题。
第一方面,本发明提供了一种基于卷积神经网络的图像识别方法,该图像识别方法包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;根据所述第二概率值和预设互熵损失函数,确定损失值;判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用所述收敛卷积神经网络对待检测图像进行图像识别。
进一步,采用预设卷积神经网络确定训练图像的第一概率值的过程,具体包括:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
进一步,获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值的过程,具体包括:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。
进一步,根据所述第二概率值和预设互熵损失函数,确定损失值的过程,具体包括:根据所述第二概率值和下述预设互熵损失函数,确定损失值;
其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
进一步,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:采用所述收敛卷积神经网络提取待检测图像的目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。
第二方面,本发明还提供了一种基于卷积神经网络的图像识别装置,该图像识别装置包括:第一概率值确定模块,用于采用预设卷积神经网络确定训练图像的第一概率值;第二概率值确定模块,用于获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;损失值确定模块,用于根据所述第二概率值和预设互熵损失函数,确定损失值;收敛卷积神经网络确定模块,用于判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;图像识别模块,用于采用所述收敛卷积神经网络对待检测图像进行图像识别。
进一步,所述第一概率值确定模块具体用于:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
进一步,所述第二概率值确定模块具体用于:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;
其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。
进一步,所述损失值确定模块具体用于:根据所述第二概率值和下述预设互熵损失函数,确定损失值;
其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
进一步,所述图像识别模块具体用于:采用所述收敛卷积神经网络提取待检测图像的目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。
本发明实施例提供的技术方案可以包括以下有益效果:本发明提供了一种基于卷积神经网络的图像识别方法及装置。该图像识别方法中,在对预设卷积神经网络进行训练学习时,采用预设卷积神经网络预测获取训练图像的第一概率值,之后采用预设软间隔归一化指数函数对训练图像的第一概率值进行归一化,之后采用预设互熵损失函数对预设卷积神经网络进行训练,在对预设卷积神经网络的训练学习过程中,充分考虑了图像特征的判别性,使得学习好的收敛卷积神经网络的图像识别的准确性更高,采用该收敛卷积神经网络对未知图像进行图像识别时,得到的图像识别结果的准确度更高,适用性更好。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于卷积神经网络的图像识别方法的流程示意图;
图2为本发明实施例提供的一种基于卷积神经网络的图像识别装置的结构框图。
具体实施方式
下面结合附图,详细介绍本发明的具体实施例。
参见图1,图1示出的是本发明实施例提供的一种基于卷积神经网络的图像识别方法的流程示意图。结合图1可知,该图像识别方法包括:
步骤101、采用预设卷积神经网络确定训练图像的第一概率值。
其中,预设卷积神经网络为VGG(Visual Geometry Group)神经网络,也可以根据实际需要设定为其它卷积神经网络。其中,VGG神经网络的每一层卷积层中,卷积核的大小均为3*3,并且对输入其中的图像的上下两个边缘的每一个边缘的外部分别填充一行像素值为0的像素点,对该图像的左右两个边缘的每一个边缘的外部分别填充一列像素值为0的像素点,从而保证所有卷积层生成的特征图的大小相同;此外该VGG神经网络的每一层池化层中生成的特征图像的大小会减半,因此,该VGG神经网络的所有卷积层中,下一层卷积层的卷积核的数量为其相邻上一层卷积层的卷积核的数量的两倍,以保证VGG神经网络的每一层的时间复杂度不变。
采用预设卷积神经网络确定训练图像的第一概率值之前,该图像识别方法还包括:对已知图像进行预处理,获取训练图像。其中,已知图像指的是图像类别已经确定的图像。在其它的实施例中,已知图像也可以为人脸类别已经确定的图像(可参考后续实施例的内容)。具体实施时,对已知图像进行预处理,获取训练图像,可以按照下述实施方式实现:对于所有已知图像中的每一帧已知图像,在其上下两个边缘中每个边缘的外部分别填充四行像素值为0的像素点,在其左右两个边缘中每个边缘的外部分别填充四列像素值为0的像素点,生成该帧已知图像的填充图像;将所有填充图像中每帧填充图像进行镜像操作,生成该帧填充图像的镜像图像;之后在每帧填充图像和该帧填充图像的镜像图像中随机选取一帧图像作为备用图像;将所有备用图像中每帧备用图像裁剪为已知图像的大小,生成训练图像。对已知图像进行预处理,获取训练图像,可以扩展训练图像的随机性,提高训练的准确性。
获取到训练图像之后,采用预设卷积神经网络确定训练图像的第一概率值的过程,具体包括:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,即下述关系式(1),生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值:
关系式(1)中,预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,所有图像类别共Q类,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
步骤102、获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值。
获取到每一帧训练图像的第一概率值以后,需要对每一帧训练图像的第一概率值进行归一化。而在采用训练图像对预设卷积神经网络进行训练学习的过程中,通常希望学习到的分类器能够尽可能地将训练图像的图像特征区别开。例如,如果图像类别总共包括两类,某帧训练图像的图像类别为第一类,则希望学习到的分类器在对该帧训练图像进行图像识别后,可以得到即尽可能的识别出该帧训练图像的图像类别为第一类,关系式中,w1为预设卷积神经网络的最后一层全连接层中与第一个图像类别对应的分类器,w2为预设卷积神经网络的最后一层全连接层中与第二个图像类别对应的分类器,T为向量转置符号,x′为该帧训练图像的图像特征。为了使得关系式更好地成立,采用间隔值m设置一个中间值使得其中,间隔值m为正实数,通常设置为0.1,但不限于0.1,之后对预设卷积神经网络进行训练时,对于图像类别为第一类的训练图像均采用代替这样,如果均大于则必定大于基于此,本发明实施例提供的图像识别方法中采用预设软间隔归一化指数函数(Soft Margin Softmax,SM-Softmax)对每一帧训练图像的第一概率值进行归一化操作,归一化操作的具体过程为:获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值。
具体实施时,获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值的过程,具体包括:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,即下述关系式(2),确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值:
关系式(2)中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,也是将该帧训练图像属于编号为k的图像类别的第一概率值进行归一化后的概率值。
采用间隔值、第一概率值以及预设软间隔归一化指数函数,确定训练图像的第二概率值,即采用预设软间隔归一化指数函数对每一帧训练图像的第一概率值进行归一化操作之后,能够确保对预设卷积神经网络进行训练学习后,学习好的预设卷积神经网络对图像识别的准确性更高。
步骤103、根据所述第二概率值和预设互熵损失函数,确定损失值。
具体实施时,根据所述第二概率值和预设互熵损失函数,确定损失值的过程,具体包括:根据所述第二概率值和下述预设互熵损失函数,即下述关系式(3),确定损失值:
关系式(3)中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
步骤104、判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络。
确定损失值之后,首先判断该损失值是否收敛,如果该损失值收敛,说明预设卷积神经网络已经训练学习好,可以直接将预设卷积神经网络作为学习好的卷积神经网络使用,本文中,将学习好的卷积神经网络定义为收敛卷积神经网络;或,如果该损失值不收敛,说明预设卷积神经网络还没有训练学习好,则更新预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行步骤101~步骤104,直至确定出的损失值收敛,并将当前的更新后的预设卷积神经网络作为收敛卷积神经网络。
其中,可以采用随机梯度下降法(Stochastic Gradient Descent,SGD)更新预设卷积神经网络的网络参数。但是不限于此种实现方法。
步骤105、采用所述收敛卷积神经网络对待检测图像进行图像识别。
采用训练图像对预设卷积神经网络进行训练学习,生成收敛卷积神经网络后,即可采用收敛卷积神经网络对待检测图像进行图像识别,待检测图像指的是未知图像中当前即将被进行图像识别的未知图像。
如果待检测图像为图像类别没有确定的未知图像,则收敛卷积神经网络的网络参数对应的是图像类别,收敛卷积神经网络的最后一层全连接层包含的分类器的数量与图像类别的总类别数量相同,并且一个分类器对应一个图像类别,即分类器与图像类别一一对应。此种情况下,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:采用所述收敛卷积神经网络提取待检测图像的目标图像特征,本文中,将待检测图像的图像特征定义为目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数,本文中,将收敛卷积神经网络的最后一层全连接层的网络参数定义为目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,即下述关系式(4),确定所述待检测图像对应的目标图像类别:
关系式(4)中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号,确定了目标图像类别的编号之后,即可根据该编号确定出待检测图像对应的目标图像类别。
此外,生成收敛卷积神经网络后,还可以采用收敛卷积神经网络对待检测图像进行人脸验证,此时,待检测图像至少包括两帧,均为人脸类别不确定的未知图像,收敛卷积神经网络的网络参数对应的是人脸类别,收敛卷积神经网络的最后一层全连接层包含的分类器的数量与图像识别中包含的人脸类别的总数相同,并且一个分类器对应一个人脸类别,即分类器与人脸类别一一对应。此种情况下,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:采用收敛卷积神经网络提取两帧待检测图像的目标图像特征;根据所述目标图像特征以及下述预设第三关系式,即下述关系式(5),确定所述两帧待检测图像是否属于同一人脸类别:
关系式(5)中,x′1表示其中一帧待检测图像的目标图像特征;x′2表示另一帧待检测图像的目标图像特征;cos(x′1,x′2)表示这两个目标图像特征的余弦距离,即相似度;T表示向量转置符号;||x′1||2表示其中一个目标图像特征的2范数;||x′2||2表示另一个目标图像特征的2范数。通过关系式(5)确定出这两个目标图像特征的余弦距离cos(x′1,x′2)的值之后,如果cos(x′1,x′2)≥τ,则确定这两帧待检测图像属于同一人脸类别;或,如果cos(x′1,x′2)<τ,则确定这两帧待检测图像不属于同一人脸类别。其中,τ为预设相似度阈值,通常将τ的值设置为0.5。
需要说明的是,还可以将收敛卷积神经网络用于其他的图像识别过程中,此处不再一一列举。
本发明实施例提供的基于卷积神经网络的图像识别方法,在对预设卷积神经网络进行训练学习时,采用预设卷积神经网络预测获取训练图像的第一概率值,之后采用预设软间隔归一化指数函数对训练图像的第一概率值进行归一化,之后采用预设互熵损失函数对预设卷积神经网络进行训练,在对预设卷积神经网络的训练学习过程中,充分考虑了图像特征的判别性,使得学习好的收敛卷积神经网络的图像识别的准确性更高,采用该收敛卷积神经网络对未知图像进行图像识别时,得到的图像识别结果的准确度更高,适用性更好。
与上述基于卷积神经网络的图像识别方法相对应,本发明还提供了一种基于卷积神经网络的图像识别装置。
参见图2,图2示出的是本发明实施例提供的一种基于卷积神经网络的图像识别装置的结构框图。结合图2可知,该图像识别装置包括:第一概率值确定模块201,用于采用预设卷积神经网络确定训练图像的第一概率值;第二概率值确定模块202,用于获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;损失值确定模块203,用于根据所述第二概率值和预设互熵损失函数,确定损失值;收敛卷积神经网络确定模块204,用于判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;图像识别模块205,用于采用所述收敛卷积神经网络对待检测图像进行图像识别。
进一步,所述第一概率值确定模块201具体用于:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
进一步,所述第二概率值确定模块202具体用于:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;
其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。
进一步,所述损失值确定模块203具体用于:根据所述第二概率值和下述预设互熵损失函数,确定损失值;
其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
进一步,所述图像识别模块205具体用于:采用所述收敛卷积神经网络提取待检测图像的目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。
进一步,该图像识别装置还包括:预处理模块206,用于对已知图像进行预处理,获取训练图像。
进一步,所述预处理模块206具体用于:对于所有已知图像中的每一帧已知图像,在其上下两个边缘中每个边缘的外部分别填充四行像素值为0的像素点,在其左右两个边缘中每个边缘的外部分别填充四列像素值为0的像素点,生成该帧已知图像的填充图像;将所有填充图像中每帧填充图像进行镜像操作,生成该帧填充图像的镜像图像;之后在每帧填充图像和该帧填充图像的镜像图像中随机选取一帧图像作为备用图像;将所有备用图像中每帧备用图像裁剪为已知图像的大小,生成训练图像。
采用本发明实施例提供的基于卷积神经网络的图像识别装置,能够实施上述基于卷积神经网络的图像识别方法中的各个步骤,并达到相应的有益效果。采用本发明实施例提供的基于卷积神经网络的图像识别装置对待检测图像进行图像识别后,图像识别结果更加准确,适用性更好。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的基于卷积神经网络的图像识别方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于基于卷积神经网络的图像识别装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。
Claims (10)
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:
采用预设卷积神经网络确定训练图像的第一概率值;
获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;
根据所述第二概率值和预设互熵损失函数,确定损失值;
判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;
采用所述收敛卷积神经网络对待检测图像进行图像识别。
2.如权利要求1所述的图像识别方法,其特征在于,采用预设卷积神经网络确定训练图像的第一概率值的过程,具体包括:
随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;
将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;
其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
3.如权利要求2所述的图像识别方法,其特征在于,获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值的过程,具体包括:
获取输入的预设软间隔归一化指数函数的间隔值;
根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;
其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。
4.如权利要求3所述的图像识别方法,其特征在于,根据所述第二概率值和预设互熵损失函数,确定损失值的过程,具体包括:
根据所述第二概率值和下述预设互熵损失函数,确定损失值;
其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
5.如权利要求4所述的图像识别方法,其特征在于,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:
采用所述收敛卷积神经网络提取待检测图像的目标图像特征;
获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;
根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;
其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。
6.一种基于卷积神经网络的图像识别装置,其特征在于,包括:
第一概率值确定模块,用于采用预设卷积神经网络确定训练图像的第一概率值;
第二概率值确定模块,用于获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;
损失值确定模块,用于根据所述第二概率值和预设互熵损失函数,确定损失值;
收敛卷积神经网络确定模块,用于判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;
图像识别模块,用于采用所述收敛卷积神经网络对待检测图像进行图像识别。
7.如权利要求6所述的图像识别装置,其特征在于,所述第一概率值确定模块具体用于:
随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;
将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;
其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。
8.如权利要求7所述的图像识别装置,其特征在于,所述第二概率值确定模块具体用于:
获取输入的预设软间隔归一化指数函数的间隔值;
根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;
其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。
9.如权利要求8所述的图像识别装置,其特征在于,所述损失值确定模块具体用于:
根据所述第二概率值和下述预设互熵损失函数,确定损失值;
其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。
10.如权利要求9所述的图像识别装置,其特征在于,所述图像识别模块具体用于:
采用所述收敛卷积神经网络提取待检测图像的目标图像特征;
获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;
根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;
其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710468011.6A CN109101984B (zh) | 2017-06-20 | 2017-06-20 | 一种基于卷积神经网络的图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710468011.6A CN109101984B (zh) | 2017-06-20 | 2017-06-20 | 一种基于卷积神经网络的图像识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109101984A true CN109101984A (zh) | 2018-12-28 |
CN109101984B CN109101984B (zh) | 2022-04-08 |
Family
ID=64795610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710468011.6A Active CN109101984B (zh) | 2017-06-20 | 2017-06-20 | 一种基于卷积神经网络的图像识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109101984B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377781A (zh) * | 2019-06-06 | 2019-10-25 | 福建讯网网络科技股份有限公司 | 一种应用鞋底搜索匹配的改进算法 |
CN110503160A (zh) * | 2019-08-28 | 2019-11-26 | 北京达佳互联信息技术有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112508102A (zh) * | 2020-12-10 | 2021-03-16 | 广州华多网络科技有限公司 | 文本识别方法、装置、存储介质、计算机设备 |
CN112990154A (zh) * | 2021-05-11 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、计算机设备以及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100094787A1 (en) * | 2008-10-14 | 2010-04-15 | Xerox Corporation | Clustering and classification employing softmax function including efficient bounds |
CN106599797A (zh) * | 2016-11-24 | 2017-04-26 | 北京航空航天大学 | 一种基于局部并行神经网络的红外人脸识别方法 |
CN106650813A (zh) * | 2016-12-27 | 2017-05-10 | 华南理工大学 | 一种基于深度残差网络和lstm的图像理解方法 |
-
2017
- 2017-06-20 CN CN201710468011.6A patent/CN109101984B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100094787A1 (en) * | 2008-10-14 | 2010-04-15 | Xerox Corporation | Clustering and classification employing softmax function including efficient bounds |
CN106599797A (zh) * | 2016-11-24 | 2017-04-26 | 北京航空航天大学 | 一种基于局部并行神经网络的红外人脸识别方法 |
CN106650813A (zh) * | 2016-12-27 | 2017-05-10 | 华南理工大学 | 一种基于深度残差网络和lstm的图像理解方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377781A (zh) * | 2019-06-06 | 2019-10-25 | 福建讯网网络科技股份有限公司 | 一种应用鞋底搜索匹配的改进算法 |
CN110503160A (zh) * | 2019-08-28 | 2019-11-26 | 北京达佳互联信息技术有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112508102A (zh) * | 2020-12-10 | 2021-03-16 | 广州华多网络科技有限公司 | 文本识别方法、装置、存储介质、计算机设备 |
CN112508102B (zh) * | 2020-12-10 | 2024-08-20 | 广州华多网络科技有限公司 | 文本识别方法、装置、存储介质、计算机设备 |
CN112990154A (zh) * | 2021-05-11 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、计算机设备以及可读存储介质 |
CN112990154B (zh) * | 2021-05-11 | 2021-07-30 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、计算机设备以及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109101984B (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240062369A1 (en) | Detection model training method and apparatus, computer device and storage medium | |
US9811718B2 (en) | Method and a system for face verification | |
CN108985232A (zh) | 人脸图像比对方法、装置、计算机设备及存储介质 | |
CN111783505A (zh) | 伪造人脸的识别方法、装置和计算机可读存储介质 | |
CN106372581A (zh) | 构建及训练人脸识别特征提取网络的方法 | |
CN106295591A (zh) | 基于人脸图像的性别识别方法及装置 | |
CN107122375A (zh) | 基于图像特征的图像主体的识别方法 | |
CN109977980A (zh) | 一种验证码识别方法及装置 | |
CN109101984A (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
CN110414541B (zh) | 用于识别物体的方法、设备和计算机可读存储介质 | |
CN109993021A (zh) | 人脸正脸检测方法、装置及电子设备 | |
JP2019152964A (ja) | 学習方法および学習装置 | |
CN110457677A (zh) | 实体关系识别方法及装置、存储介质、计算机设备 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN112668698A (zh) | 一种神经网络的训练方法及系统 | |
CN113869098A (zh) | 植物病害识别方法、装置、电子设备及存储介质 | |
CN111414930B (zh) | 深度学习模型训练方法及装置、电子设备及存储介质 | |
CN112131354B (zh) | 答案筛选方法、装置、终端设备和计算机可读存储介质 | |
CN113420833A (zh) | 一种基于问题语义映射的视觉问答方法及装置 | |
JP7293658B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN107533672A (zh) | 模式识别装置、模式识别方法以及程序 | |
US20230104345A1 (en) | Image attack detection method and apparatus, and image attack detection model training method and apparatus | |
CN115713669B (zh) | 一种基于类间关系的图像分类方法、装置、存储介质及终端 | |
CN116935057A (zh) | 目标评价方法、电子设备和计算机可读存储介质 | |
CN115757112A (zh) | 基于变异分析的测试子集构建方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |