CN106529571B - 基于神经网络的多层图像特征提取建模、图像识别方法及装置 - Google Patents
基于神经网络的多层图像特征提取建模、图像识别方法及装置 Download PDFInfo
- Publication number
- CN106529571B CN106529571B CN201610900080.5A CN201610900080A CN106529571B CN 106529571 B CN106529571 B CN 106529571B CN 201610900080 A CN201610900080 A CN 201610900080A CN 106529571 B CN106529571 B CN 106529571B
- Authority
- CN
- China
- Prior art keywords
- picture
- classification
- layer image
- feature
- neutral net
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于神经网络的多层图像特征提取建模方法及装置,从预设应用场景的训练集中获取第一图片、第二图片、第一图片的第一分类及第二图片的第二分类;根据第一图片、第一分类、第二图片及第二分类确定全局损失代价函数值;根据全局损失代价函数值及训练参数在训练集上训练多层图像对象验证神经网络;通过预设应用场景的测试集对多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据测试精度及多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型。该方法及装置可以达到将建模得到的图像特征模型应用图像识别应用场景中进行图像识别时,提高图片识别精度的有益效果。本发明还提供一种图像识别方法及装置。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于神经网络的多层图像特征提取建模方法及装置以及一种图像识别方法及装置。
背景技术
图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。针对人脸的图像识别即为人脸识别,它是一种基于人的脸部特征信息进行身份识别的生物识别技术,一般是用摄像机或摄像头采集含有人脸的图像或视频流后,自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别,通常也叫做人像识别、面部识别。
目前,人脸识别算法均是基于人脸照片和与其对应的身份信息,使用神经网络进行模型训练,并最终使用分类器进行人脸识别。在人脸识别神经网络中对模型的训练中只考虑人脸图片的身份信息,对于利用该模型的人脸识别的识别精度还有待进一步地提升。
发明内容
基于此,有必要提供一种能够在图像识别应用场景中提高识别精度的基于神经网络的多层图像特征提取建模方法及装置,以及一种应用通过该基于神经网络的多层图像特征提取建模方法及装置建立的图像特征模型的图像识别方法及装置。
一种基于神经网络的多层图像特征提取建模方法,包括:
从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类;
将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值;
根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络;
通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型。
一种图像识别方法,包括:
获取待识别图片,并将所述待识别图片作为上述的基于神经网络的多层图像特征提取建模方法确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征;
将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
一种基于神经网络的多层图像特征提取建模装置,包括:
图片分类获取模块,用于从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类;
损失代价确定模块,用于将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值;
神经网络训练模块,用于根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络;
特征模型确定模块,用于通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型。
一种图像识别装置,包括:
待识特征确定模块,用于获取待识别图片,并将所述待识别图片作为上述的基于神经网络的多层图像特征提取建模装置确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征;
对比分类确定模块,用于将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
上述基于神经网络的多层图像特征提取建模方法及装置,由于训练模型的时候采用的全局损失代价函数值,不仅与第一图片、第二图片相关,还与第一图片的第一分类、第二图片的第二分类相关。因此,建模得到的图像对象验证特征模型与第一图片的第一分类、第二图片的第二分类相关。从而,可以达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。同时,采用的图像对象验证神经网络为多层次的多层图像对象验证神经网络,确定的图像对象验证特征提取模型为多层次的多层图像对象验证特征提取模型。相较于图像对象验证特征提取模型,多层图像对象验证特征提取模型不仅输出最高层图像对象验证特征,还输出中间层的图像对象验证特征。从而,可以进一步达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。
上述图像识别方法及装置,由于通过上述基于神经网络的多层图像特征提取建模方法或装置确定的目标多层图像对象验证特征提取模型确定待识别验证特征,并通过该待识别验证特征与训练集中的图片验证特征进行对比,最终确定待识别图片的分类,因此,上述图像识别方法及装置的识别精度高。
附图说明
图1为一实施例的基于神经网络的多层图像特征提取建模方法的流程图;
图2为图1的基于神经网络的多层图像特征提取建模方法的一个步骤的具体流程图;
图3为另一实施例的基于神经网络的多层图像特征提取建模方法的流程图;
图4为一实施例的基于神经网络的多层图像特征提取建模方法中进行人脸对齐处理前的示例图;
图5为图4的示例图进行人脸对齐处理后的结果图;
图6为图1的基于神经网络的多层图像特征提取建模方法的另一个步骤的具体流程图;
图7为一实施例的图像识别方法的流程图;
图8为一实施例的基于神经网络的多层图像特征提取建模装置的结构图;
图9为另一实施例的基于神经网络的多层图像特征提取建模装置的结构图;
图10为一实施例的图像识别装置的结构图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳的实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“或/和”包括一个或多个相关的所列项目的任意的和所有的组合。
如图1所示,为本发明一个实施例的基于神经网络的多层图像特征提取建模方法,包括:
S140:从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类。
预设应用场景可以为对图像识别精度要求较高的场景,尤其是对人脸识别精度要求较高的场景,如银行VTM(Virtual Teller Machine,远程柜员机)验证、珠宝店VIP(VeryImportant Person,贵宾)识别等场景。
每一张图片上均包括待识别的对象,如,可以为待识别的物品或人。同一分类表示同一个对象,如可以为同一个人或同一个物品。
S160:将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值。
通过第一图片及第二图片,根据多层图像对象验证神经网络中的多层图像对象验证特征提取模型可以分别确定第一图片、第二图片的对象特征及验证特征,进而根据第一分类、第二分类以及这些对象特征、验证特征确定全局损失代价函数的值。
多层图像对象验证神经网络以现有技术的图像对象识别神经网络为基础,包括以图像对象识别神经网络中的图像对象识别特征提取模型为基础确定的多层图像对象验证特征提取模型。
具体地,该图像对象识别神经网络为经过训练的图像对象识别神经网络,是采用现有技术进行图像识别的已经训练好了的神经网络。如此,在经过训练的图像对象识别神经网络的基础上进行后续训练,而无需再从零开始训练。因此,可以节约训练时间,更快地找到最优神经网络。进一步地,经过训练的图像对象识别神经网络为深度神经网络,即图像对象识别深度神经网络。
根据多层图像对象验证特征提取模型可以构造多层图像对象验证神经网络。优选地,多层图像对象验证神经网络为深度神经网络,即图像对象验证深度神经网络。
需要说明的是,多层图像对象验证特征提取模型在通过图像对象识别特征提取模型得到图像对象识别特征的基础上,根据图像对象识别特征得到图像对象验证特征。具体地,对图像对象识别特征进行二范数归一化处理,得到图像对象验证特征。二范数归一化处理具体为,将图像对象识别特征的每一个特征元素求平方和之后再开平方得到的结果作为图像对象验证特征的每个特征元素分母;再将图像对象识别特征中的每个与验证是否为同一对象相关的特征元素的特征值作为图像对象验证特征的一个特征元素的分子。
S170:根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络。
在一个实施例中,可以根据全局损失代价函数值和链式求导法则可以确定多层图像对象验证神经网络的多层图像对象验证特征提取模型中的每一个参数的梯度值;根据所述全局损失代价函数值及训练参数采用随机梯度下降法在所述训练集上训练所述多层图像对象验证神经网络。
训练参数包括特征距离阈值及学习速率。在一个较优实施例中,特征距离阈值的值可以默认设置为0.2或0.25;学习速率的值可以默认设置为0.0001。
S180:通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型。
只要测试集的容量足够大,对多层图像对象验证神经网络的训练可以一直持续下去。在本实施例中,每次训练预设时间之后,通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度。可以采用现有方式根据测试结果确定测试精度。
当测试精度到达预设精度时,不再继续训练,此时的多层图像对象验证神经网络为目标多层图像对象验证神经网络。通过目标多层图像对象验证神经网络可以确定目标多层图像对象验证特征提取模型。其中,预设精度为预先设置测试需要达到的精度要求。
在一个较优的实施例中,采用交叉验证的方式进行验证。测试集为与训练集没有交集的图像的集合,优选地,图像为人脸图片。
在一个具体的实施例中,测试集制作方式为:将N个分类中除了用于制作训练集的K个分类,剩下的N-K个分类的人脸照片用于制作测试集。测试集由随机抽取的人脸图片验证对组成,抽取规则如下:
第n个分类的第a张人脸图片,第n个分类的第b张人脸图片(正样本对)
第i个分类的第c张人脸图片,第j个分类的第d张人脸图片(负样本对)
按照国际标准人脸验证测试集的规则,此处正、负样本对各取3000对,共6000对。测试规则为:将正样本对中的两张照片判断成同一个人,则判断正确,即xi=1;将负样本对中的两张照片判断成不是同一个人,则判断正确,即xi=1;其它则判断错误,即xi=0。则测试精度定义为:
在其中一个实施例中,并不预先设置预设测试精度,预设精度的变化过程为先逐渐提升,当到达某个精度之后将产生较大波动;这里把这个精度记为最大稳定精度。因此,当测试精度不再稳定提升时,即到达最大稳定精度时,不再继续训练多层图像对象验证神经网络,当前多层图像对象验证神经网络即为最优的多层图像对象验证神经网络。取最优的多层图像对象验证神经网络中的一个多层图像对象验证特征提取模型,并仅以一张图片为输入、以图像对象验证特征为输出、而省略图像对象识别特征的输出,从而得到最终的目标多层图像对象验证特征提取模型。
上述基于神经网络的多层图像特征提取建模方法,由于训练模型的时候采用的全局损失代价函数值,不仅与第一图片、第二图片相关,还与第一图片的第一分类、第二图片的第二分类相关。因此,建模得到的图像对象验证特征模型与第一图片的第一分类、第二图片的第二分类相关。从而,可以达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。同时,采用的图像对象验证神经网络为多层次的多层图像对象验证神经网络,确定的图像对象验证特征提取模型为多层次的多层图像对象验证特征提取模型。相较于图像对象验证特征提取模型,多层图像对象验证特征提取模型不仅输出最高层图像对象验证特征,还输出中间层的图像对象验证特征。从而,可以进一步达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。
请继续参阅图1,在其中一个实施例中,步骤S140之后,步骤S160之前,还包括步骤:
获取图像对象识别神经网络,并根据所述图像对象识别神经网络确定多层图像对象验证神经网络。
获取现有技术的进行图像对象识别的图像对象识别神经网络,并根据所述图像对象识别神经网络确定多层图像对象验证神经网络。
可以理解地,在其中一个图像为人脸图像的实施例中,图像对象识别神经网络为人脸身份识别神经网络,优选为,人脸身份识别深度神经网络;多层图像对象验证神经网络为人脸身份验证神经网络,优选为,人脸身份验证深度神经网络。其中,人脸身份识别神经网络和人脸身份验证神经网络的关系与图像对象识别神经网络和多层图像对象验证神经网络的关系一致,故在此不作赘述。
请参阅图2,在其中一个实施例中,所述多层图像对象验证神经网络包括以图像对象识别神经网络的图像对象识别特征提取模型为基础确定的多层图像对象验证特征提取模型。
所述将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为所述多层图像对象验证神经网络的输入,确定全局损失代价函数值的步骤,即S160,包括:
S261:将所述第一图片与所述第一分类作为所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为所述多层图像对象验证特征提取模型的另一个模型输入,确定多层第二对象特征与多层第二验证特征;或者,所述多层图像对象验证特征提取模型包括相同的两个,将所述第一图片与所述第一分类作为其中一个所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为另一个所述多层图像对象验证特征提取模型的模型输入,确定多层第二对象特征与多层第二验证特征。
具体地,可以将所述第一图片与所述第一分类作为一个模型输入、所述第二图片与所述第二分类作为另一个模型输入,分两次先后作为所述多层图像对象验证神经网络的所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,以及多层第二对象特征与多层第二验证特征。也可以是所述多层图像对象验证特征提取模型包括相同的两个;将所述第一图片与所述第一分类作为一个所述多层图像对象验证特征提取模型的模型输入、将所述第二图片与所述第二分类作为另一个所述多层图像对象验证特征提取模型的模型输入,两个多层图像对象验证特征提取模型并行执行,最终分别确定多层第一对象特征与多层第一验证特征,以及多层第二对象特征与多层第二验证特征。
S263:根据所述多层第一对象特征及所述第一分类确定第一对象信息损失函数值。
可以采用现有神经网络中常用的方式根据一个对象特征及一个分类确定损失函数值。具体地,根据多层第一对象特征确定一个得到的分类信息,根据得到的分类信息与获取的第一分类是否属于同一类别,确定识别结果,进而反应到损失函数值中。
S265:根据所述多层第二对象特征及所述第二分类确定第二对象信息损失函数值。
第二对象信息损失函数值与第一对象信息损失函数值的确定是一致的,故在此不作赘述。
S267:根据所述第一分类、所述第二分类、所述多层第一验证特征及所述多层第二验证特征确定验证损失函数值。
具体地,验证损失函数的公式为:
VerifyLossk=ydk+(1-y)max(α-dk,0)
其中,α为训练参数中的特征距离阈值。VerifyLossk表示第k层验证特征的验证损失函数值;y表示属于同一分类;N1表示第一分类,N2表示第二分类;dk为第k层验证特征的特征距离;表示多层第一验证特征中的第k层的第一验证特征,表示多层第二验证特征中的第k层的第二验证特征;表示二范数运算。
S269:根据所述第一对象信息损失函数值、所述第二对象信息损失函数值及所述验证损失函数值确定全局损失代价函数值。
在本实施例中,全局损失代价函数值是关于第一对象信息损失函数值、第二对象信息损失函数值及验证损失函数的线性函数值。具体地,全局损失代价函数的公式为:
其中,Loss为全局损失代价函数值,SoftmaxLoss_1为第一对象信息损失函数值;SoftmaxLoss_2为第二对象信息损失函数值;VerifyLossk为第k层验证特征的验证损失函数值;m为验证特征的总层数;λk为各层验证特征的权重系数。经过实验验证,λm=1,λk=0.2,k=1,2,3,...,m-1时,能取得最好的训练效果和识别准确度。
由于在训练模型的过程中,全局损失代价函数值不仅与第一对象信息损失函数值及第二对象信息损失函数值相关,还与验证损失函数值相关,因此,可以进一步提高将建模得到的图像对象验证特征模型应用在预设应用场景中时,图像的识别精度。
请参阅图3,在其中一个实施例中,步骤S340~S380依次对应为步骤S140~S180。所述图像为人脸图片;所述从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类的步骤(即步骤S340)之前,还包括:
S310:在所述预设应用场景中采集视频图片,并对所述视频图片进行人脸检测得到人脸图片。
使用摄像头在预设应用场景中采集视频图片,并通过网络传输和数据线存放在计算机中。通过现有方式对采集到的视频图片进行人脸检测,将人脸图片提取出来存储在计算机硬盘中。
S320:获取对所述人脸图片进行分类的分类信息,根据所述分类信息对各所述人脸图片进行分类,并对分类后的各所述人脸图片进行人脸对齐处理,形成训练集。
人工对检测并提取出的人脸图片进行分类,因此,计算机获取人工输入的分类信息,并根据分类信息分类。属于相同分类的人脸照片放在一起并通过分类信息予以标记。
由于人脸图片中的人脸角度和人脸位置是不一致的,为了保证提取到稳定的特征并取得较好的人脸识别效果,需要通过现有方式对人脸图片进行关键点对齐操作,以进行人脸对齐处理,去除人脸角度对人脸识别带来的影响。其中,关键点包括眼睛、鼻尖和嘴角等的位置。如图4所示为一个采集到的人脸图片的,即进行人脸对齐处理前的示例图,对齐后的人脸图片如图5所示。
请参阅图6,在其中一个实施例中,所述根据所述损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络的步骤,即步骤S170,包括:
S671:获取初始训练参数,根据所述全局损失代价函数值及所述初始训练参数在所述训练集上训练所述多层图像对象验证神经网络。
S673:更新训练参数,根据所述全局损失代价函数值及更新后的所述训练参数在所述训练集上训练所述多层图像对象验证神经网络。
如此,不断调整多层图像对象验证神经网络的训练参数进行训练,确定最优地训练参数。通过大量调试和试验,发现针对本文描述的方法,特征距离阈值α=0.2且学习速率lr=0.001时,能得到最好的算法精度提升。
如图7所示,本发明还提供一种应用上述基于神经网络的多层图像特征提取建模方法的图像识别方法,包括:
S740:获取待识别图片,并将所述待识别图片作为基于神经网络的多层图像特征提取建模方法确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征。
目标多层图像对象验证特征提取模型为通过上述基于神经网络的多层图像特征提取建模方法建立的目标多层图像对象验证特征提取模型。
具体地,通过摄像头采集待识别图片,并将该待识别图片传输至计算机;计算机获取该待识别图片,将该待识别图片输入所建立的目标多层图像对象验证特征提取模型进行运算,从而可以确定待识别图片的图片特征,即待识别特征。
S760:将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
在本实施例中,预先通过目标多层图像对象验证特征提取模型确定训练集中所有图片的图片验证特征。确定待识别验证特征之后,计算待识别验证特征与训练集中的各个图片的图片验证特征的距离;与待识别验证特征距离最近的图片验证特征对应的图片所属的分类即为待识别图片的分类。
上述图像识别方法,由于通过上述基于神经网络的多层图像特征提取建模方法确定的目标多层图像对象验证特征提取模型确定待识别验证特征,并通过该待识别验证特征与训练集中的图片验证特征进行对比,最终确定待识别图片的分类,因此,上述图像识别方法的识别精度高。
请继续参阅图7,在其中一个实施例中,还包括:
S720:获取目标多层图像对象验证特征提取模型。
本发明还提供一种与基于神经网络的多层图像特征提取建模方法对应的虚拟装置。如图8所示,一个实施例的基于神经网络的多层图像特征提取建模装置,包括:
图片分类获取模块840,用于从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类;
损失代价确定模块860,用于将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值;
神经网络训练模块870,用于根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络;
特征模型确定模块880,用于通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型。
上述基于神经网络的多层图像特征提取建模装置,由于训练模型的时候采用的全局损失代价函数值,不仅与第一图片、第二图片相关,还与第一图片的第一分类、第二图片的第二分类相关。因此,建模得到的图像对象验证特征模型与第一图片的第一分类、第二图片的第二分类相关。从而,可以达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。同时,采用的图像对象验证神经网络为多层次的多层图像对象验证神经网络,确定的图像对象验证特征提取模型为多层次的多层图像对象验证特征提取模型。相较于图像对象验证特征提取模型,多层图像对象验证特征提取模型不仅输出最高层图像对象验证特征,还输出中间层的图像对象验证特征。从而,可以进一步达到将建模得到的图像对象验证特征模型应用在预设应用场景中进行图像识别时,提高图像识别精度的有益效果。
请参阅图9,在其中一个实施例中,还包括:
网络获取确定模块950,用于获取图像对象识别神经网络,并根据所述图像对象识别神经网络确定多层图像对象验证神经网络。
请继续参阅图9,在其中一个实施例中,所述多层图像对象验证神经网络包括以图像对象识别神经网络的图像对象识别特征提取模型为基础确定的多层图像对象验证特征提取模型。所述损失代价确定模块960,包括:
图片特征确定单元961(图未示),用于图片特征确定单元,用于将所述第一图片与所述第一分类作为所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为所述多层图像对象验证特征提取模型的另一个模型输入,确定多层第二对象特征与多层第二验证特征;或者,所述多层图像对象验证特征提取模型包括相同的两个;图片特征确定单元961,用于将所述第一图片与所述第一分类作为其中一个所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为另一个所述多层图像对象验证特征提取模型的模型输入,确定多层第二对象特征与多层第二验证特征;
第一损失确定单元(图未示),用于根据所述多层第一对象特征及所述第一分类确定第一对象信息损失函数值;
第二损失确定单元(图未示),用于根据所述多层第二对象特征及所述第二分类确定第二对象信息损失函数值;
验证损失确定单元(图未示),用于根据所述第一分类、所述第二分类、所述多层第一验证特征及所述多层第二验证特征确定验证损失函数值;
全局损失确定单元(图未示),用于根据所述第一对象信息损失函数值、所述第二对象信息损失函数值及所述验证损失函数值确定全局损失代价函数值。
请继续参阅图9,在其中一个实施例中,所述图像为人脸图片;所述装置,还包括:
图片采集检测模块910,用于在所述预设应用场景中采集视频图片,并对所述视频图片进行人脸检测得到人脸图片;
图片分类对齐模块920,用于获取对所述人脸图片进行分类的分类信息,根据各所述分类信息对所述人脸图片进行分类,并对分类后的各所述人脸图片进行人脸对齐处理,形成训练集。
在其中一个实施例中,所述神经网络训练模块970,包括:
初始参数训练单元971,用于获取初始训练参数,根据所述全局损失代价函数值及所述初始训练参数在所述训练集上训练所述多层图像对象验证神经网络;
更新参数训练单元973,用于更新训练参数,根据所述全局损失代价函数值及更新后的所述训练参数在所述训练集上训练所述多层图像对象验证神经网络。
本发明还提供一种与图像识别方法对应的虚拟装置。如图10所示,一个实施例的图像识别装置,包括:
待识特征确定模块1040,用于获取待识别图片,并将所述待识别图片作为上述的基于神经网络的多层图像特征提取建模装置确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征;
对比分类确定模块1060,用于将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
上述图像识别装置,由于根据通过上述基于神经网络的多层图像特征提取建模装置确定的目标多层图像对象验证特征提取模型确定待识别验证特征,并通过该待识别验证特征与训练集中的图片验证特征进行对比,最终确定待识别图片的分类,因此,上述图像识别装置的识别精度高。
在其中一个实施例中,还包括:
特征模型获取模块1020,用于获取目标多层图像对象验证特征提取模型。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出多个变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于神经网络的多层图像特征提取建模方法,其特征在于,包括:
从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类;
将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值;
根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络;
通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型;
所述将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为所述多层图像对象验证神经网络的输入,确定全局损失代价函数值的步骤包括:
将所述第一图片与所述第一分类作为所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为所述多层图像对象验证特征提取模型的另一个模型输入,确定多层第二对象特征与多层第二验证特征;或者,所述多层图像对象验证特征提取模型包括相同的两个,将所述第一图片与所述第一分类作为其中一个所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为另一个所述多层图像对象验证特征提取模型的模型输入,确定多层第二对象特征与多层第二验证特征;
根据所述多层第一对象特征及所述第一分类确定第一对象信息损失函数值;
根据所述多层第二对象特征及所述第二分类确定第二对象信息损失函数值;
根据所述第一分类、所述第二分类、所述多层第一验证特征及所述多层第二验证特征确定验证损失函数值;
根据所述第一对象信息损失函数值、所述第二对象信息损失函数值及所述验证损失函数值确定全局损失代价函数值。
2.根据权利要求1所述的基于神经网络的多层图像特征提取建模方法,其特征在于,所述多层图像对象验证神经网络包括以图像对象识别神经网络的图像对象识别特征提取模型为基础确定的多层图像对象验证特征提取模型。
3.根据权利要求1所述的基于神经网络的多层图像特征提取建模方法,其特征在于,所述图像为人脸图片;
所述从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类的步骤之前,还包括:
在所述预设应用场景中采集视频图片,并对所述视频图片进行人脸检测得到人脸图片;
获取对所述人脸图片进行分类的分类信息,根据所述分类信息对各所述人脸图片进行分类,并对分类后的各所述人脸图片进行人脸对齐处理,形成训练集。
4.根据权利要求1所述的基于神经网络的多层图像特征提取建模方法,其特征在于,所述根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络的步骤,包括:
获取初始训练参数,根据所述全局损失代价函数值及所述初始训练参数在所述训练集上训练所述多层图像对象验证神经网络;
更新训练参数,根据所述全局损失代价函数值及更新后的所述训练参数在所述训练集上训练所述多层图像对象验证神经网络。
5.一种图像识别方法,其特征在于,包括:
获取待识别图片,并将所述待识别图片作为权利要求1-4任意一项所述的基于神经网络的多层图像特征提取建模方法确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征;
将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
6.一种基于神经网络的多层图像特征提取建模装置,其特征在于,包括:
图片分类获取模块,用于从预设应用场景的训练集中获取第一图片、第二图片、所述第一图片的第一分类及所述第二图片的第二分类;
损失代价确定模块,用于将所述第一图片、所述第一分类、所述第二图片及所述第二分类作为多层图像对象验证神经网络的输入,确定全局损失代价函数值;
神经网络训练模块,用于根据所述全局损失代价函数值及训练参数在所述训练集上训练所述多层图像对象验证神经网络;
特征模型确定模块,用于通过所述预设应用场景的测试集对所述多层图像对象验证神经网络进行测试,并根据测试结果确定测试精度,根据所述测试精度及所述多层图像对象验证神经网络确定目标多层图像对象验证特征提取模型;
所述损失代价确定模块,包括:
图片特征确定单元,用于将所述第一图片与所述第一分类作为所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为所述多层图像对象验证特征提取模型的另一个模型输入,确定多层第二对象特征与多层第二验证特征;或者,所述多层图像对象验证特征提取模型包括相同的两个;图片特征确定单元,用于将所述第一图片与所述第一分类作为其中一个所述多层图像对象验证特征提取模型的模型输入,确定多层第一对象特征与多层第一验证特征,将所述第二图片与所述第二分类作为另一个所述多层图像对象验证特征提取模型的模型输入,确定多层第二对象特征与多层第二验证特征;
第一损失确定单元,用于根据所述多层第一对象特征及所述第一分类确定第一对象信息损失函数值;
第二损失确定单元,用于根据所述多层第二对象特征及所述第二分类确定第二对象信息损失函数值;
验证损失确定单元,用于根据所述第一分类、所述第二分类、所述多层第一验证特征及所述多层第二验证特征确定验证损失函数值;
全局损失确定单元,用于根据所述第一对象信息损失函数值、所述第二对象信息损失函数值及所述验证损失函数值确定全局损失代价函数值。
7.根据权利要求6所述的基于神经网络的多层图像特征提取建模装置,其特征在于,所述多层图像对象验证神经网络包括以图像对象识别神经网络的图像对象识别特征提取模型为基础确定的多层图像对象验证特征提取模型。
8.根据权利要求6所述的基于神经网络的多层图像特征提取建模装置,其特征在于,所述图像为人脸图片;所述装置,还包括:
图片采集检测模块,用于在所述预设应用场景中采集视频图片,并对所述视频图片进行人脸检测得到人脸图片;
图片分类对齐模块,用于获取对所述人脸图片进行分类的分类信息,根据各所述分类信息对所述人脸图片进行分类,并对分类后的各所述人脸图片进行人脸对齐处理,形成训练集。
9.根据权利要求6所述的基于神经网络的多层图像特征提取建模装置,其特征在于,所述神经网络训练模块,包括:
初始参数训练单元,用于获取初始训练参数,根据所述全局损失代价函数值及所述初始训练参数在所述训练集上训练所述多层图像对象验证神经网络;
更新参数训练单元,用于更新训练参数,根据所述全局损失代价函数值及更新后的所述训练参数在所述训练集上训练所述多层图像对象验证神经网络。
10.一种图像识别装置,其特征在于,包括:
待识特征确定模块,用于获取待识别图片,并将所述待识别图片作为权利要求6-9任意一项所述的基于神经网络的多层图像特征提取建模装置确定的目标多层图像对象验证特征提取模型的输入,确定待识别验证特征;
对比分类确定模块,用于将所述待识别验证特征与训练集中的图片对应的图片验证特征进行对比,并将与所述待识别验证特征距离最近的图片验证特征对应的图片所属的分类确定为所述待识别图片的分类。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610900080.5A CN106529571B (zh) | 2016-10-14 | 2016-10-14 | 基于神经网络的多层图像特征提取建模、图像识别方法及装置 |
PCT/CN2016/113147 WO2018068416A1 (zh) | 2016-10-14 | 2016-12-29 | 基于神经网络的多层图像特征提取建模、图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610900080.5A CN106529571B (zh) | 2016-10-14 | 2016-10-14 | 基于神经网络的多层图像特征提取建模、图像识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106529571A CN106529571A (zh) | 2017-03-22 |
CN106529571B true CN106529571B (zh) | 2018-04-20 |
Family
ID=58331848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610900080.5A Active CN106529571B (zh) | 2016-10-14 | 2016-10-14 | 基于神经网络的多层图像特征提取建模、图像识别方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106529571B (zh) |
WO (1) | WO2018068416A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069648A (zh) * | 2017-09-25 | 2019-07-30 | 杭州海康威视数字技术股份有限公司 | 一种图像检索方法及装置 |
KR102374747B1 (ko) * | 2017-12-15 | 2022-03-15 | 삼성전자주식회사 | 객체를 인식하는 장치 및 방법 |
CN109543526B (zh) * | 2018-10-19 | 2022-11-08 | 谢飞 | 基于深度差异性特征的真假面瘫识别系统 |
CN111382601A (zh) * | 2018-12-28 | 2020-07-07 | 河南中原大数据研究院有限公司 | 生成对抗网络模型的光照人脸图像识别预处理系统及方法 |
CN111382619B (zh) * | 2018-12-28 | 2023-04-18 | 广州市百果园信息技术有限公司 | 图片推荐模型的生成、图片推荐方法、装置、设备及介质 |
CN110569737A (zh) * | 2019-08-15 | 2019-12-13 | 深圳华北工控软件技术有限公司 | 一种人脸识别深度学习方法及加速人脸识别摄像机 |
CN111128348B (zh) * | 2019-12-27 | 2024-03-26 | 上海联影智能医疗科技有限公司 | 医学图像处理方法、装置、存储介质及计算机设备 |
CN111461052B (zh) * | 2020-04-13 | 2023-05-23 | 安徽大学 | 基于迁移学习的多个生育期小麦倒伏区域识别方法 |
CN111767826B (zh) * | 2020-06-24 | 2023-06-06 | 浙江大学 | 一种定时定点场景异常检测方法 |
CN113255695A (zh) * | 2021-05-21 | 2021-08-13 | 广州广电运通金融电子股份有限公司 | 一种目标重识别的特征提取方法及系统 |
CN113887532A (zh) * | 2021-11-17 | 2022-01-04 | 安徽省公共气象服务中心 | 一种基于场景分类的高速公路积雪图像识别与订正方法 |
CN114120420B (zh) * | 2021-12-01 | 2024-02-13 | 北京百度网讯科技有限公司 | 图像检测方法和装置 |
CN114879702B (zh) * | 2022-07-06 | 2022-09-30 | 季华实验室 | 多智能体巡检控制方法、装置、系统、设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105981008B (zh) * | 2014-05-27 | 2019-05-28 | 北京旷视科技有限公司 | 学习深度人脸表示 |
CN105608450B (zh) * | 2016-03-01 | 2018-11-27 | 天津中科智能识别产业技术研究院有限公司 | 基于深度卷积神经网络的异质人脸识别方法 |
-
2016
- 2016-10-14 CN CN201610900080.5A patent/CN106529571B/zh active Active
- 2016-12-29 WO PCT/CN2016/113147 patent/WO2018068416A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
Non-Patent Citations (1)
Title |
---|
FaceNet: A Unified Embedding for Face Recognition and Clustering;Schroff Florian 等;《The IEEE Conference on Computer Vision and Pattern Recognition(CVPR)》;20151231;815-822页 * |
Also Published As
Publication number | Publication date |
---|---|
WO2018068416A1 (zh) | 2018-04-19 |
CN106529571A (zh) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106529571B (zh) | 基于神经网络的多层图像特征提取建模、图像识别方法及装置 | |
CN105975959B (zh) | 基于神经网络的人脸特征提取建模、人脸识别方法及装置 | |
CN106250866A (zh) | 基于神经网络的图像特征提取建模、图像识别方法及装置 | |
CN109766872B (zh) | 图像识别方法和装置 | |
CN105468760B (zh) | 对人脸图片进行标注的方法和装置 | |
CN104392221B (zh) | 一种多元身份识别系统及多维多元身份识别方法 | |
CN104616664B (zh) | 一种基于声谱图显著性检测的音频识别方法 | |
WO2017024692A1 (zh) | 一种单测量节点模拟电路故障诊断方法 | |
CN105069477B (zh) | AdaBoost级联分类器检测图像目标的方法 | |
CN108171209A (zh) | 一种基于卷积神经网络进行度量学习的人脸年龄估计方法 | |
CN110378232B (zh) | 改进的ssd双网络的考场考生位置快速检测方法 | |
CN104021396A (zh) | 基于集成学习的高光谱遥感数据分类方法 | |
CN107633261A (zh) | 一种基于人工智能的消防建筑图纸智能审核系统及方法 | |
CN106156702A (zh) | 身份认证方法及设备 | |
CN106897570A (zh) | 一种基于机器学习的慢性阻塞性肺疾病测试系统 | |
CN108171162A (zh) | 人群拥挤度检测方法、装置及系统 | |
CN106611160A (zh) | 一种基于卷积神经网络的图像头发识别方法及其装置 | |
US20140297186A1 (en) | Rock Classification Based on Texture and Composition | |
CN104713835A (zh) | 一种烟叶颜色在线数值化识别方法 | |
CN108491884A (zh) | 基于轻量级网络的行人再识别系统及实现方法 | |
CN108960145A (zh) | 人脸图像检测方法、装置、存储介质和电子设备 | |
CN112183438B (zh) | 基于小样本学习神经网络的违规行为的图像识别方法 | |
CN106295574A (zh) | 基于神经网络的人脸特征提取建模、人脸识别方法及装置 | |
CN103310235B (zh) | 一种基于参数识别与估计的隐写分析方法 | |
CN110852364A (zh) | 矿井突水水源识别方法、装置与电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |