CN112766282A - 图像识别方法、装置、设备及计算机可读介质 - Google Patents
图像识别方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN112766282A CN112766282A CN202110064513.9A CN202110064513A CN112766282A CN 112766282 A CN112766282 A CN 112766282A CN 202110064513 A CN202110064513 A CN 202110064513A CN 112766282 A CN112766282 A CN 112766282A
- Authority
- CN
- China
- Prior art keywords
- image recognition
- training
- recognition model
- target image
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003062 neural network model Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 221
- 230000006870 function Effects 0.000 claims description 108
- 238000004891 communication Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像识别方法、装置、设备及计算机可读介质。该方法包括:获取待识别图像;将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;获取所目标图像识别模型对图像特征进行识别得到的图像识别结果。本申请通过使用迭代搜索得到模型超参数的神经网络模型作为图像识别模型来进行图像识别,避免了因人工设置超参数及经验不足导致的模型无法获得最优参数,识别结果不准确的问题。
Description
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像识别方法、装置、设备及计算机可读介质。
背景技术
随着深度学习技术的快速发展,以深度学习技术为基础的神经网络模型常常被用于构造图像识别模型来识别图像,从而代替人工完成重复、繁杂的识别工作,其中人脸识别模型的应用较为广泛且与人们的生活更加紧密相关。
目前,相关技术中,图像识别模型的超参数需要人为设定,且需要大量的专家经验,经验不足将很容易导致模型无法获得最优的参数。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种图像识别方法、装置、设备及计算机可读介质,以解决超参数需要人为设定,设定不准确影响模型识别结果的准确率的技术问题。
根据本申请实施例的一个方面,本申请提供了一种图像识别方法,包括:
获取待识别图像;
将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
获取所目标图像识别模型对图像特征进行识别得到的图像识别结果。
可选地,将待识别图像输入目标图像识别模型之前,该方法还包括按照如下方式训练目标图像识别模型:
利用训练数据集对目标图像识别模型进行训练,并利用训练得到的第一损失函数确定目标图像识别模型的第一更新超参数;
将第一更新超参数作为目标图像识别模型的超参数,并利用参照数据集对目标图像识别模型进行训练,并利用训练得到的第二损失函数确定目标图像识别模型的第二更新超参数;
将第二更新超参数作为目标图像识别模型新的超参数,并利用训练数据集和参照数据集依次对目标图像识别模型进行迭代训练,直至训练得到的第一损失函数的值降至最小值时,完成目标图像识别模型的训练。
可选地,利用训练数据集对目标图像识别模型进行训练,得到第一损失函数包括:
从训练数据池中选择目标训练数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标训练数据集的第一训练特征,目标训练数据集为训练数据池中未被选择过的数据集;
将第一训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第一子损失函数;
在训练数据池中所有的训练数据集都被选取过的情况下,将所有的第一子损失函数相加,得到训练数据池对目标图像识别模型进行训练得到的第一损失函数。
可选地,利用参照数据集对目标图像识别模型进行训练,得到第二损失函数包括:
从参照数据池中选择目标参照数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标参照数据集的第二训练特征,目标参照数据集为参照数据池中未被选择过的数据集;
将第二训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第二子损失函数;
在参照数据池中所有的参照数据集都被选取过的情况下,将所有的第二子损失函数相加,得到参照数据池对目标图像识别模型进行训练得到的第二损失函数。
可选地,利用训练得到的第一损失函数确定目标图像识别模型的第一更新超参数包括:将目标图像识别模型的初始超参数减去第一损失函数的梯度,得到第一更新超参数;利用训练得到的第二损失函数确定目标图像识别模型的第二更新超参数包括:将目标图像识别模型的初始超参数减去第二损失函数的梯度,得到第二更新超参数。
可选地,训练目标图像识别模型还包括:
提取第一损失函数的值降至最小值时,目标图像识别模型的搜索空间和权重参数,目标图像识别模型的超参数包括搜索空间和权重参数中的至少一种;
将业务训练数据输入目标图像识别模型进行训练,业务训练数据为待识别图像所表示的业务领域的图像数据;
在训练过程中搜索空间固定,权重参数作为初始化权重参数并随业务训练数据对目标图像识别模型训练而调整,直至目标图像识别模型对业务训练数据的输出识别结果达到目标阈值。
根据本申请实施例的另一方面,本申请提供了一种图像识别装置,包括:
图像获取模块,用于获取待识别图像;
特征提取模块,用于将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
识别结果获取模块,用于获取目标图像识别模型对图像特征进行识别得到的图像识别结果。
可选地,该装置还包括:
第一训练模块,用于利用训练数据集对目标图像识别模型进行训练,并利用训练得到的第一损失函数确定目标图像识别模型的第一更新超参数;
第二训练模块,用于将第一更新超参数作为目标图像识别模型的超参数,并利用参照数据集对目标图像识别模型进行训练,并利用训练得到的第二损失函数确定目标图像识别模型的第二更新超参数;
迭代训练模块,用于将第二更新超参数作为目标图像识别模型新的超参数,并利用训练数据集和参照数据集依次对目标图像识别模型进行迭代训练,直至训练得到的第一损失函数的值降至最小值时,完成目标图像识别模型的训练。
根据本申请实施例的另一方面,本申请提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述方法的步骤。
根据本申请实施例的另一方面,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述的方法。
本申请实施例提供的上述技术方案与相关技术相比具有如下优点:
本申请技术方案为获取待识别图像;将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;获取所目标图像识别模型对图像特征进行识别得到的图像识别结果。本申请通过使用迭代搜索得到模型超参数的神经网络模型作为图像识别模型来进行图像识别,避免了因人工设置超参数及经验不足导致的模型无法获得最优参数,识别结果不准确的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例提供的一种可选的图像识别方法硬件环境示意图;
图2为根据本申请实施例提供的一种可选的图像识别方法流程图;
图3为根据本申请实施例提供的一种可选的向量关系示意图;
图4为根据本申请实施例提供的一种可选的图像识别装置框图;
图5为本申请实施例提供的一种可选的电子设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
相关技术中,可以通过以下方式来进行损失函数的参数搜索:
第一种,基于边界的损失函数A-Softmax、Cosine Margin Loss、ArcFace等损失函数在角度空间或者余弦空间增大分类边界,来增大类间距离缩小类内距离;
第二种,设计一个能够覆盖常用的流行的损失函数的搜索空间,其采样的候选损失函数可以调整不同难度级别样本的梯度,并在训练过程中平衡类内距离和类间距离的重要性,并使用强化学习来优化损失函数,其中内层优化是最小化网络参数的损失函数,外层优化是最大化reward;
第三种,基于边界的损失函数的目的都是减小余弦值,经过公示变换找到一个统一的超参数构建搜索空间。每一轮训练中选取多个候选参数,每个候选参数构成一个loss函数训练一个模型,利用强化学习的思路选取最好的模型来作为下一轮的训练初始值。
但是,以上方式中,以ArcFace为代表的基于边界的损失函数,需要人为设定超参数,需要大量的专家经验,且不能使的模型获得最优参数;AutoML构建的搜索空间复杂且不稳定,搜索复杂;第三种方式每一轮需要训练多个模型并选取最优模型,增大了显卡占用,不利于在实际中的应用。
为了解决背景技术中提及的问题,根据本申请实施例的一方面,提供了一种图像识别方法的实施例。本申请技术方案可以具体应用于人脸识别。
人脸识别指的是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
可选地,在本申请实施例中,上述方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务,可在服务器上或独立于服务器设置数据库105,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101包括但不限于PC、手机、平板电脑等。
本申请实施例中的一种方法可以由服务器103来执行,还可以是由服务器103和终端101共同执行,如图2所示,该方法可以包括以下步骤:获取待识别图像;将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;获取所目标图像识别模型对图像特征进行识别得到的图像识别结果。本申请通过使用迭代搜索得到模型超参数的神经网络模型作为图像识别模型来进行图像识别,避免了因人工设置超参数及经验不足导致的模型无法获得最优参数,识别结果不准确的问题。
步骤S202,获取待识别图像。
本申请实施例中,应用于人脸识别场景,待识别图像可以是某公司打卡人员的人脸图像。
步骤S204,将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型。
本申请实施例中,通过目标图像识别模型对打卡人员的人脸图像进行特征提取,进而对提取的图像特征(人脸特征)进行识别。采用本申请技术方案提供的目标图像识别模型是通过迭代搜索得到模型超参数的神经网络模型,模型的超参数可以在利用训练数据对目标图像识别模型进行训练时自适应搜索最佳的模型超参数,从而使得目标图像识别模型能够获得最优的模型参数,对图像识别、人脸识别的准确率也能够显著提高,上述神经网络模型可以是卷积神经网络模型等。
步骤S206,获取所目标图像识别模型对图像特征进行识别得到的图像识别结果。
本申请实施例中,目标图像识别模型对图像特征进行识别,从而匹配到该打卡人员的身份信息(身份id),完成打卡。
通过步骤S202到S206,本申请通过使用迭代搜索得到模型超参数的神经网络模型作为图像识别模型来进行图像识别,避免了因人工设置超参数及经验不足导致的模型无法获得最优参数,识别结果不准确的问题。
可选地,将待识别图像输入目标图像识别模型之前,该方法还包括按照如下方式训练目标图像识别模型:
步骤11,利用训练数据集对目标图像识别模型进行训练,并利用训练得到的第一损失函数确定目标图像识别模型的第一更新超参数;
步骤12,将第一更新超参数作为目标图像识别模型的超参数,并利用参照数据集对目标图像识别模型进行训练,并利用训练得到的第二损失函数确定目标图像识别模型的第二更新超参数;
步骤13,将第二更新超参数作为目标图像识别模型新的超参数,并利用训练数据集和参照数据集依次对目标图像识别模型进行迭代训练,直至训练得到的第一损失函数的值降至最小值时,完成目标图像识别模型的训练。
可选的,将参照数据集和训练数据集各自划分为多个子集,参照数据集和训练数据集的子集两两配对,一对子集对目标图像识别模型的训练作为一次迭代,利用所有子集对对目标图像识别模型进行迭代训练,从而更加精确的找出最佳的搜索空间α和权重参数W。
本申请实施例中,可以采用训练数据和参照数据对目标图像识别模型进行迭代训练,即利用训练数据训练目标图像识别模型,利用训练数据训练得到的第一损失函数计算第一更新超参数,将该第一更新超参数作为目标图像识别模型新的模型参数,此时再利用参照数据训练目标图像识别模型,利用参照数据训练得到的第二损失函数计算第二更新超参数,再将该第二更新超参数作为目标图像识别模型新的模型参数,其中,第一损失函数计算的第一更新超参数可以是目标图像识别模型的权重参数,第二损失韩式计算的第二更新超参数可以是目标图像识别模型的搜索空间和权重参数。按照这个循环,利用训练数据和参照数据依次迭代训练目标图像识别模型,直至训练得到的第一损失函数的值降至最小值时,完成目标图像识别模型的训练。
本申请实施例中,目标图像识别模型的损失函数可以是:
其中,0<α≤1,为本申请中的搜索空间,当α=1时,该loss函数为普通的softmax损失函数,s为尺度系数,K为样本总数。x=f(input,W|α),input为输入图像,W为模型的权重。如图3所示,为两个向量的夹角,一个向量wy,指的是全联接权重中的第y行,另一个向量,指的是特征x,是图片经过主干网络(图3中的backbone)之后的输出。两个向量都进行了归一化,那么x分布在一个半径为1的超球面上,s为尺度系数,则将超球面的半径变成s。y指的是训练时该人脸图像属于的身份信息,即id,表示某个人,也作为类别,表示第y类。比如整个训练集有10000个id,某一张训练图像属于第10类,那么这张图片经过网络后计算loss时,y=10,k为除了10以外的9999个数,K为10000。
相关技术中,基于边界的损失函数能够增大类间距离,缩小类内距离,这一类损失函数在softmax的基础上,在角度空间或者余弦空间增加边界。基于边界的损失函数可以写成统一形式:
原始损失函数三种形式中m都是固定的某一个值,这个值是人为选取的。虽然他们三个形式不同,m的数值不同,但是起的作用都是相同的,即因此,本申请构造上述损失函数L,这个损失函数里有一个参数是α搜索空间,这个搜索空间也会起到的作用,但是α不是由人工确定给出的,是在训练中搜索到的。
本申请实施例中,基于上述损失函数L,通过训练数据和参照数据的迭代训练得到具有不同超参数(搜索空间α和权重W)的损失函数,例如,利用训练数据集对目标图像识别模型进行训练得到的第一损失函数可以为:
其中,inputi指的是输入的图片中的第i个图片。利用第一损失函数确定目标图像识别模型的第一更新超参数可以是:
利用第二损失函数确定目标图像识别模型的第二更新超参数可以是:
本申请实施例中,还可以将参照数据集和训练数据集各自划分为多个子集,参照数据集和训练数据集的子集两两配对,一对子集对目标图像识别模型的训练作为一次迭代,利用所有子集对对目标图像识别模型进行迭代训练,从而更加精确的找出最佳的搜索空间α和权重参数W。
可选地,利用训练数据集对目标图像识别模型进行训练,得到第一损失函数包括:
步骤21,从训练数据池中选择目标训练数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标训练数据集的第一训练特征,目标训练数据集为训练数据池中未被选择过的数据集;
步骤22,将第一训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第一子损失函数;
步骤23,在训练数据池中所有的训练数据集都被选取过的情况下,将所有的第一子损失函数相加,得到训练数据池对目标图像识别模型进行训练得到的第一损失函数。
本申请实施例中,训练数据池中保存有所有的训练数据,将训练数据池中的数据划分为多个训练数据集,逐个对目标图像识别模型进行训练,并逐个计算第一子损失函数,最后将所有的第一子损失函数相加得到总的第一损失函数。例如,共有1000个id,每个id对应5张图片。现在一次选择20个id,即输入网络的有20*5=100张图片,输入网络后输出x计算loss,一共有1000个id,那么需要选择50次,计算出50个loss,把50个loss加起来,得到一个总的loss。
可选地,利用参照数据集对目标图像识别模型进行训练,得到第二损失函数包括:
步骤31,从参照数据池中选择目标参照数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标参照数据集的第二训练特征,目标参照数据集为参照数据池中未被选择过的数据集;
步骤32,将第二训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第二子损失函数;
步骤33,在参照数据池中所有的参照数据集都被选取过的情况下,将所有的第二子损失函数相加,得到参照数据池对目标图像识别模型进行训练得到的第二损失函数。
本申请实施例中,参照数据池中保存有所有的参照数据,将参照数据池中的数据划分为多个参照数据集,逐个对目标图像识别模型进行训练,并逐个计算第二子损失函数,最后将所有的第二子损失函数相加得到总的第二损失函数。
可选地,训练目标图像识别模型还包括:
步骤41,提取第一损失函数的值降至最小值时,目标图像识别模型的搜索空间和权重参数,目标图像识别模型的超参数包括搜索空间和权重参数中的至少一种;
步骤42,将业务训练数据输入目标图像识别模型进行训练,业务训练数据为待识别图像所表示的业务领域的图像数据;
步骤43,在训练过程中搜索空间固定,权重参数作为初始化权重参数并随业务训练数据对目标图像识别模型训练而调整,直至目标图像识别模型对业务训练数据的输出识别结果达到目标阈值。
本申请实施例中,通过上述方式训练得到的模型已经具有了最优的搜索空间和权重参数。为了进一步契合应用领域,可以在业务训练数据输入目标图像识别模型进行训练时,固定α,将W作为业务训练数据训练时的初始化参数,而不是随机初始化,即可按照传统深度学习网络训练方法进行新业务上的训练,这样经过很少的迭代,就能够快速的训练出识别准确度高的该业务领域的图像识别模型,由此多了无限的扩展空间。
根据本申请实施例的又一方面,如图4所示,提供了一种图像识别装置,包括:
图像获取模块401,用于获取待识别图像;
特征提取模块403,用于将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
识别结果获取模块405,用于获取目标图像识别模型对图像特征进行识别得到的图像识别结果。
需要说明的是,该实施例中的图像获取模块401可以用于执行本申请实施例中的步骤S202,该实施例中的特征提取模块403可以用于执行本申请实施例中的步骤S204,该实施例中的识别结果获取模块405可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
可选地,该装置还包括:
第一训练模块,用于利用训练数据集对目标图像识别模型进行训练,并利用训练得到的第一损失函数确定目标图像识别模型的第一更新超参数;
第二训练模块,用于将第一更新超参数作为目标图像识别模型的超参数,并利用参照数据集对目标图像识别模型进行训练,并利用训练得到的第二损失函数确定目标图像识别模型的第二更新超参数;
迭代训练模块,用于将第二更新超参数作为目标图像识别模型新的超参数,并利用训练数据集和参照数据集依次对目标图像识别模型进行迭代训练,直至训练得到的第一损失函数的值降至最小值时,完成目标图像识别模型的训练。
可选地,第一训练模块,具体用于:
从训练数据池中选择目标训练数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标训练数据集的第一训练特征,目标训练数据集为训练数据池中未被选择过的数据集;
将第一训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第一子损失函数;
在训练数据池中所有的训练数据集都被选取过的情况下,将所有的第一子损失函数相加,得到训练数据池对目标图像识别模型进行训练得到的第一损失函数。
可选地,第二训练模块,具体用于:
从参照数据池中选择目标参照数据集输入目标图像识别模型中,以利用目标图像识别模型提取目标参照数据集的第二训练特征,目标参照数据集为参照数据池中未被选择过的数据集;
将第二训练特征带入目标图像识别模型的损失函数,得到本次训练得到的第二子损失函数;
在参照数据池中所有的参照数据集都被选取过的情况下,将所有的第二子损失函数相加,得到参照数据池对目标图像识别模型进行训练得到的第二损失函数。
可选地,第一训练模块还用于:将目标图像识别模型的初始超参数减去第一损失函数的梯度,得到第一更新超参数;第二训练模块还用于:将目标图像识别模型的初始超参数减去第二损失函数的梯度,得到第二更新超参数。
可选地,该装置还包括第三训练模块,用于:
提取第一损失函数的值降至最小值时,目标图像识别模型的搜索空间和权重参数,目标图像识别模型的超参数包括搜索空间和权重参数中的至少一种;
将业务训练数据输入目标图像识别模型进行训练,业务训练数据为待识别图像所表示的业务领域的图像数据;
在训练过程中搜索空间固定,权重参数作为初始化权重参数并随业务训练数据对目标图像识别模型训练而调整,直至目标图像识别模型对业务训练数据的输出识别结果达到目标阈值。
根据本申请实施例的另一方面,本申请提供了一种电子设备,如图5所示,包括存储器501、处理器503、通信接口505及通信总线507,存储器501中存储有可在处理器503上运行的计算机程序,存储器501、处理器503通过通信接口505和通信总线507进行通信,处理器503执行计算机程序时实现上述方法的步骤。
上述电子设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
根据本申请实施例的又一方面还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
可选地,在本申请实施例中,计算机可读介质被设置为存储用于所述处理器执行以下步骤的程序代码:
图像获取模块401,用于获取待识别图像;
特征提取模块403,用于将待识别图像输入目标图像识别模型,以利用目标图像识别模型提取待识别图像的图像特征,目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
识别结果获取模块405,用于获取目标图像识别模型对图像特征进行识别得到的图像识别结果。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本申请实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图像识别方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入目标图像识别模型,以利用所述目标图像识别模型提取所述待识别图像的图像特征,其中,所述目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
获取所述目标图像识别模型对所述图像特征进行识别得到的图像识别结果。
2.根据权利要求1所述的方法,其特征在于,将所述待识别图像输入目标图像识别模型之前,所述方法还包括按照如下方式训练所述目标图像识别模型:
利用训练数据集对所述目标图像识别模型进行训练,并利用训练得到的第一损失函数确定所述目标图像识别模型的第一更新超参数;
将所述第一更新超参数作为所述目标图像识别模型的超参数,并利用参照数据集对所述目标图像识别模型进行训练,并利用训练得到的第二损失函数确定所述目标图像识别模型的第二更新超参数;
将所述第二更新超参数作为所述目标图像识别模型新的超参数,并利用所述训练数据集和所述参照数据集依次对所述目标图像识别模型进行迭代训练,直至训练得到的所述第一损失函数的值降至最小值时,完成所述目标图像识别模型的训练。
3.根据权利要求2所述的方法,其特征在于,利用训练数据集对所述目标图像识别模型进行训练,得到第一损失函数包括:
从训练数据池中选择目标训练数据集输入所述目标图像识别模型中,以利用所述目标图像识别模型提取所述目标训练数据集的第一训练特征,其中,所述目标训练数据集为所述训练数据池中未被选择过的数据集;
将所述第一训练特征带入所述目标图像识别模型的损失函数,得到本次训练得到的第一子损失函数;
在所述训练数据池中所有的训练数据集都被选取过的情况下,将所有的所述第一子损失函数相加,得到所述训练数据池对所述目标图像识别模型进行训练得到的所述第一损失函数。
4.根据权利要求2所述的方法,其特征在于,利用参照数据集对所述目标图像识别模型进行训练,得到第二损失函数包括:
从参照数据池中选择目标参照数据集输入所述目标图像识别模型中,以利用所述目标图像识别模型提取所述目标参照数据集的第二训练特征,其中,所述目标参照数据集为所述参照数据池中未被选择过的数据集;
将所述第二训练特征带入所述目标图像识别模型的损失函数,得到本次训练得到的第二子损失函数;
在所述参照数据池中所有的参照数据集都被选取过的情况下,将所有的所述第二子损失函数相加,得到所述参照数据池对所述目标图像识别模型进行训练得到的所述第二损失函数。
5.根据权利要求3至4任一所述的方法,其特征在于,
利用训练得到的第一损失函数确定所述目标图像识别模型的第一更新超参数包括:将所述目标图像识别模型的初始超参数减去所述第一损失函数的梯度,得到所述第一更新超参数;
利用训练得到的第二损失函数确定所述目标图像识别模型的第二更新超参数包括:将所述目标图像识别模型的初始超参数减去所述第二损失函数的梯度,得到所述第二更新超参数。
6.根据权利要求5所述的方法,其特征在于,训练所述目标图像识别模型还包括:
提取所述第一损失函数的值降至最小值时,所述目标图像识别模型的搜索空间和权重参数,其中,所述目标图像识别模型的所述超参数包括所述搜索空间和所述权重参数中的至少一种;
将业务训练数据输入所述目标图像识别模型进行训练,其中,所述业务训练数据为所述待识别图像所表示的业务领域的图像数据;
在训练过程中所述搜索空间固定,所述权重参数作为初始化权重参数并随所述业务训练数据对所述目标图像识别模型训练而调整,直至所述目标图像识别模型对所述业务训练数据的输出识别结果达到目标阈值。
7.一种图像识别装置,其特征在于,包括:
图像获取模块,用于获取待识别图像;
特征提取模块,用于将所述待识别图像输入目标图像识别模型,以利用所述目标图像识别模型提取所述待识别图像的图像特征,其中,所述目标图像识别模型为通过迭代搜索得到模型超参数的神经网络模型;
识别结果获取模块,用于获取所述目标图像识别模型对所述图像特征进行识别得到的图像识别结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一训练模块,用于利用训练数据集对所述目标图像识别模型进行训练,并利用训练得到的第一损失函数确定所述目标图像识别模型的第一更新超参数;
第二训练模块,用于将所述第一更新超参数作为所述目标图像识别模型的超参数,并利用参照数据集对所述目标图像识别模型进行训练,并利用训练得到的第二损失函数确定所述目标图像识别模型的第二更新超参数;
迭代训练模块,用于将所述第二更新超参数作为所述目标图像识别模型新的超参数,并利用所述训练数据集和所述参照数据集依次对所述目标图像识别模型进行迭代训练,直至训练得到的所述第一损失函数的值降至最小值时,完成所述目标图像识别模型的训练。
9.一种电子设备,包括存储器、处理器、通信接口及通信总线,所述存储器中存储有可在所述处理器上运行的计算机程序,所述存储器、所述处理器通过所述通信总线和所述通信接口进行通信,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至6任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110064513.9A CN112766282B (zh) | 2021-01-18 | 2021-01-18 | 图像识别方法、装置、设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110064513.9A CN112766282B (zh) | 2021-01-18 | 2021-01-18 | 图像识别方法、装置、设备及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112766282A true CN112766282A (zh) | 2021-05-07 |
CN112766282B CN112766282B (zh) | 2024-04-12 |
Family
ID=75702918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110064513.9A Active CN112766282B (zh) | 2021-01-18 | 2021-01-18 | 图像识别方法、装置、设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766282B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117058536A (zh) * | 2023-07-19 | 2023-11-14 | 中公高科养护科技股份有限公司 | 一种基于双分支网络的路面病害识别方法、装置及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170243114A1 (en) * | 2016-02-19 | 2017-08-24 | International Business Machines Corporation | Adaptation of model for recognition processing |
US20190080243A1 (en) * | 2017-09-08 | 2019-03-14 | DeepCube LTD. | System and method for efficient evolution of deep convolutional neural networks using filter-wise recombination and propagated mutations |
CN111178316A (zh) * | 2020-01-06 | 2020-05-19 | 武汉大学 | 一种基于深度架构自动搜索的高分辨率遥感影像土地覆盖分类方法 |
CN111401517A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
US20200380652A1 (en) * | 2019-05-30 | 2020-12-03 | Signify Holding B.V. | Automated generation of synthetic lighting scene images using generative adversarial networks |
US20200380027A1 (en) * | 2019-05-30 | 2020-12-03 | Adobe Inc. | Multi-Modal Differential Search with Real-Time Focus Adaptation |
CN112100466A (zh) * | 2020-09-25 | 2020-12-18 | 北京百度网讯科技有限公司 | 生成搜索空间的方法、装置、设备及存储介质 |
-
2021
- 2021-01-18 CN CN202110064513.9A patent/CN112766282B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170243114A1 (en) * | 2016-02-19 | 2017-08-24 | International Business Machines Corporation | Adaptation of model for recognition processing |
US20190080243A1 (en) * | 2017-09-08 | 2019-03-14 | DeepCube LTD. | System and method for efficient evolution of deep convolutional neural networks using filter-wise recombination and propagated mutations |
US20200380652A1 (en) * | 2019-05-30 | 2020-12-03 | Signify Holding B.V. | Automated generation of synthetic lighting scene images using generative adversarial networks |
US20200380027A1 (en) * | 2019-05-30 | 2020-12-03 | Adobe Inc. | Multi-Modal Differential Search with Real-Time Focus Adaptation |
CN111178316A (zh) * | 2020-01-06 | 2020-05-19 | 武汉大学 | 一种基于深度架构自动搜索的高分辨率遥感影像土地覆盖分类方法 |
CN111401517A (zh) * | 2020-02-21 | 2020-07-10 | 华为技术有限公司 | 一种感知网络结构搜索方法及其装置 |
CN112100466A (zh) * | 2020-09-25 | 2020-12-18 | 北京百度网讯科技有限公司 | 生成搜索空间的方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
CHUMING LI ET AL.: "AM-LFS: AutoML for Loss Function Search", 《ARXIV》, pages 1 - 8 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117058536A (zh) * | 2023-07-19 | 2023-11-14 | 中公高科养护科技股份有限公司 | 一种基于双分支网络的路面病害识别方法、装置及介质 |
CN117058536B (zh) * | 2023-07-19 | 2024-04-30 | 中公高科养护科技股份有限公司 | 一种基于双分支网络的路面病害识别方法、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112766282B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI677852B (zh) | 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質 | |
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
CN111507419B (zh) | 图像分类模型的训练方法及装置 | |
WO2019100724A1 (zh) | 训练多标签分类模型的方法和装置 | |
CN112819686B (zh) | 基于人工智能的图像风格处理方法、装置及电子设备 | |
CN113705597B (zh) | 一种图像处理方法、装置、计算机设备以及可读存储介质 | |
US20180349743A1 (en) | Character recognition using artificial intelligence | |
CN111950728B (zh) | 图像特征提取模型的构建方法、图像检索方法及存储介质 | |
CN106372581A (zh) | 构建及训练人脸识别特征提取网络的方法 | |
CN109117817B (zh) | 人脸识别的方法及装置 | |
CN110287311B (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
CN113642400A (zh) | 基于2s-agcn的图卷积动作识别方法、装置及设备 | |
CN111275060A (zh) | 识别模型更新处理方法、装置、电子设备及存储介质 | |
CN109190521B (zh) | 一种基于知识提纯的人脸识别模型的构建方法及应用 | |
CN110879993B (zh) | 神经网络训练方法、人脸识别任务的执行方法及装置 | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
CN112507912A (zh) | 一种识别违规图片的方法及装置 | |
CN110991433A (zh) | 人脸识别方法、装置、设备及存储介质 | |
CN112766282B (zh) | 图像识别方法、装置、设备及计算机可读介质 | |
CN113762005B (zh) | 特征选择模型的训练、对象分类方法、装置、设备及介质 | |
CN113205045A (zh) | 行人重识别方法、装置、电子设备和可读存储介质 | |
CN115910217B (zh) | 一种碱基确定方法、装置、计算机设备及存储介质 | |
Chen et al. | Probabilistic urban structural damage classification using bitemporal satellite images | |
CN113221662A (zh) | 人脸识别模型的训练方法及装置、存储介质、终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |