CN111291841A - 图像识别模型训练方法、装置、计算机设备和存储介质 - Google Patents
图像识别模型训练方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111291841A CN111291841A CN202010400444.XA CN202010400444A CN111291841A CN 111291841 A CN111291841 A CN 111291841A CN 202010400444 A CN202010400444 A CN 202010400444A CN 111291841 A CN111291841 A CN 111291841A
- Authority
- CN
- China
- Prior art keywords
- image
- training
- recognition model
- image recognition
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像识别模型训练方法、装置、计算机设备和存储介质。该方法包括:获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型,可以将第一目标图像识别模型部署到云服务器中进行使用。采用本方法能够提高第一目标图像识别模型对图像识别的精准性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像识别模型训练方法、装置、计算机设备和存储介质。
背景技术
随着图像识别技术的发展,出现了通过人工智能算法训练得到的图像识别模型,使用图像识别模型来对图像中的物体类别进行识别,比如,对图像中的人、狗、猫和鸟等类别进行的识别并给出对象所属类别。目前在训练图像识别模型时,需要获取到大量的不同物体类别的图像样本,通过大量的图像样本进行训练,才能得到图像识别模型。然而,通常获取到的图像样本是长尾分布的,即不同物体类别的图像样本量是极度不均衡的,其中,一部分的类别的图像样本量极少,一部分的图像类别的样本量极多、其他类别的图像样本量居中。
由于长尾分布中的长尾类别的图像样本量不足,导致长尾类别得不到充分的训练,使得训练得到的图像识别模型对长尾类别的识别不够精确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高对长尾类别识别精确度的图像识别模型方法、装置、计算机设备和存储介质。
一种图像识别模型训练方法,所述方法包括:
获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;
将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;
使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
一种图像识别方法,所述方法包括:
获取待识别图像;
将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;
其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
一种图像识别模型训练装置,所述装置包括:
获取模块,用于获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;
权重计算模块,用于将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;
替换模块,用于使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
训练模块,使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
一种图像识别装置,所述装置包括:
图像获取模块,用于获取待识别图像;
图像识别模块,用于将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;
将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;
使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别图像;
将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;
将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;
使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待识别图像;
将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
上述图像识别模型训练方法、装置、计算机设备和存储介质,通过基础图像识别模型识别长尾类别对应的各个图像样本的图像样本特征向量,从而得到长尾类别权重,使用长尾类别权重作为基础图像识别模型中的长尾类别模型参数,然后进一步进行训练得到第一目标图像识别模型,能够使长尾类别对应的图像样本对类别表达的贡献更加的突出,从而使长尾类别对应的图像样本能够得到充分的学习,因此,使得到的第一目标图像识别模型提高了对长尾类别识别的精确性,同时由于只对长尾类别模型参数进行了替换,未对其他模型参数进行替换,从而未影响对长尾分布中头部类别的识别效果。
附图说明
图1为一个实施例中图像识别模型训练方法的应用环境图;
图2为一个实施例中图像识别模型训练方法的流程示意图;
图3为一个实施例中得到第二目标图像识别模型的流程示意图;
图4为一个具体实施例中模块的结构示意图;
图5为一个实施例中得到基础图像识别模型的流程示意图;
图6为一个具体实施例中长尾类别权重替换的流程示意图;
图7为一个实施例中得到第一目标图像识别模型的流程示意图;
图8为一个具体实施例中图像识别模型训练方法的框架示意图;
图9为一个具体实施例中得到第二目标图像识别模型的流程示意图;
图10为一个实施例中训练图像样本长尾分布的示意图;
图11为一个实施例中图像识别方法的应用环境图;
图12为一个实施例中图像识别方法的流程示意图;
图13为一个具体实施例中应用场景的应用环境图;
图14为一个实施例中图像识别模型训练装置的结构框图;
图15为一个实施例中图像识别装置的结构框图;
图16为一个实施例中计算机设备的内部结构图;
图17为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请实施例提供的方案涉及人工智能的计算机视觉技术、深度学习等技术,具体通过如下实施例进行说明:
本申请提供的图像识别模型训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102向服务器104发送图像识别模型的训练指令,服务器104根据训练指令获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;服务器104将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;服务器104使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像识别模型训练方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本。
其中,基础图像识别模型是指预先根据图像样本使用深度神经网络算法进行训练得到的图像分类模型,基础图像识别模型用于识别出图像的类别,比如,对图像中的人、狗、猫和鸟等类别进行识别。图像样本是指采集到的具有图像类别标签的图像,图像类别标签用于指示图像对应的类别。深度神经网络算法是指具有深层结构的神经网络算法,比如RNN(Recurrent Neural Network,循环神经网络)和CNN(Convolutional Neural Networks,卷积神经网络)等等。训练图像样本是指具备长尾分布的图像样本,长尾类别是指长尾分布中尾部的图像样本对应的类别。
具体地,服务器获取到基础图像识别模型,可以从第三方直接获取到图像识别模型,将获取到的图像识别模型作为基础图像识别模型,该第三方可以是提供图像识别模型的服务方。同时,服务器获取到训练图像样本,并从训练图像样本得到长尾类别对应的各个图像样本。在一个实施例中,服务器可以先获取到训练图像样本,根据训练图像样本使用深度神经网络算法进行训练,训练完成时得到基础图像识别模型。
步骤204,将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重。
其中,特征识别是指使用基础图像识别模型进行识别得到的图像样本对应的深度特征,比如,通过图像识别模型中的池化层输出的深度特征(embedding)。图像样本特征向量用于表征图像对应的特征,每一个长尾类别对应的图像样本都有对应的图像样本特征向量。长尾类别权重是根据长尾类别对应的图像样本特征向量得到的,用于表征模型对该长尾类别的学习能力,每个长尾类别都有对应的长尾类别权重。
具体地,服务器将每个长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到每个长尾类别对应的各个图像样本特征向量,然后对每个长尾类别对应的各个图像样本特征向量进行向量间的计算,得到计算结果,将计算结果作为长尾类别权重,其中,向量间的计算可以是计算各个图像样本特征向量的平均向量,将平均向量作为长尾类别权重。也可以对各个图像样本特征向量进行组合,将组合后的向量作为长尾类别权重。还可以将各个图像样本特征向量进行排序,获取到中间位置的图像样本特征向量,将中间位置的图像样本特征向量作为长尾类别权重。
步骤206,使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型。
其中,模型参数是指基础图像识别模型内部的变量参数,是基础图像识别模型训练完成时得到的,比如,权重(weight)。长尾类别模型参数是指基础图像识别模型内部该长尾类别对应的模型参数。当前图像识别模型是指使用所有的长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数后得到的模型。
具体地,服务器得到长尾类别权重时,先确定基础图像识别模型中对应的长尾类别模型参数,然后将该长尾类别模型参数进行删除,并将长尾类别权重写入,则该长尾类别权重替换完成,当所有长尾类别对应的长尾类别都替换完成时,得到当前图像识别模型。
步骤208,使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
其中,预设训练完成条件是指预先设置好的对当前图像识别模型进行训练时训练结束的条件,该条件包括但不限于训练迭代次数达到预先设置的最大次数、训练得到的损失值小于预先设置的值和训练得到的当前图像识别模型的准确率超过预先设置好的准确率。第一目标图像识别模型是指训练完成的目标图像识别模型,该目标图像识别模型能够提升识别长尾类别的准确性。
具体地,服务器在得到当前图像识别模型时,使用训练图像样本对当前图像识别模型进行进一步的训练,当检测到达到预设训练完成条件时,将符合预设训练完成条件的当前图像识别模型作为最终训练完成的第一目标图像识别模型。在一个具体实施例中,预设训练完成条件为进行10个epoch(时期)的训练,其中,一个epoch的训练是指将所有训练图像样本都在当前图像识别模型中进行了一次训练。其中,epoch的个数是一个超参数,可以人为设置。
在一个实施例中,可以将得到的第一目标图像识别模型部署到云服务器中,并生成第一目标图像识别模型的调用接口,从而能够使用户使用该调用接口从云服务器中调用第一目标图像识别模型对需要识别的图像进行识别,即通过云服务器来部署第一目标图像识别模型,然后供用户进行使用,方便高效,节省资源。
上述图像识别模型训练方法中,通过基础图像识别模型识别长尾类别对应的各个图像样本的图像样本特征向量,从而得到长尾类别权重,使用长尾类别权重作为基础图像识别模型中的长尾类别模型参数,然后进一步进行训练得到第一目标图像识别模型,能够使长尾类别对应的图像样本对类别表达的贡献更加的突出,从而使长尾类别对应的图像样本能够得到充分的学习,因此,使得到的第一目标图像识别模型提高了对长尾类别识别的精确性,同时由于只对长尾类别模型参数进行了替换,未对其他模型参数进行替换,从而未影响对长尾分布中头部类别的识别效果。
在一个实施例中,如图3所示,在步骤208之后,即在使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型之后,还包括:
步骤302,判断是否达到预设循环完成条件,当达到预设循环完成条件时,执行步骤304a,当未达到预设循环完成条件时,执行步骤304b并返回步骤204执行。步骤304a,得到第二目标图像识别模型。步骤304b,将第一目标图像识别模型作为基础图像识别模型,并返回将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重的步骤执行。
其中,预设循环完成条件是指预先设置好的结束循环的条件,该条件包括但不限于预先设置好的循环次数、训练得到的模型准确率达到预先设置好的准确率和训练得到的模型的损失值达到预先设置好的值。第二目标图像识别模型是指符合预设循环条件时的图像识别模型。
具体地,服务器当得到第一目标图像识别模型时,进一步判断是否达到预设循环完成条件,该循环是指循环执行步骤204,步骤206和步骤208,每次循环到执行完步骤208时,判断是否达到预设循环完成条件,当达到预设循环完成条件,将对应的第一目标图像识别模型作为第二目标图像识别模型。当未达到预设循环完成条件,将对应的第一目标图像识别模型作为基础图像识别模型,并从步骤204重新开始执行。在一个具体实施例中,执行完步骤206记为权重替换一次,当执行完步骤208,获取得到预设训练完成条件对应的epoch个数为10,记为适应性训练第一目标图像识别模型的次数为10次,则得到一次循环中执行步骤11次。则预设循环完成条件可以是预先设置的最大执行次数,比如,预先设置的最大执行次数为88次,则说明执行循环的次数为8次,即权重替换了8次,同时对应的步骤208执行了80次。
在上述实施例中,通过判断是否达到预设循环完成条件,当未达到时,将第一目标图像识别模型作为基础图像识别模型再次进行权重替换和模型训练,直到达到预设循环完成条件,将得到的图像识别模型作为第二目标图像识别模型。即通过权重替换和模型训练的交替进行,能够使得到的第二目标图像识别模型避免长尾训练过拟合或者学习方向偏离类别表达目标过大,进一步,提高了第二目标图像识别模型识别长尾类别的精确性。
在一个实施例中,在得到第二目标图像识别模型之后,还包括:
将第二目标图像识别模型部署到云服务器中,并生成调用接口,调用接口用于调用第二图像识别模型对待识别图像进行识别。
具体地,待识别图像是指需要识别对应类别的图像。服务器可以将第二目标图像识别模型部署到云服务器中,同时生成调用第二图像识别模型的接口。在需要对待识别图像进行识别时,可以使用调用接口调用第二图像识别模型对待识别图像进行识别,得到识别出的待识别图像对应的类别。在一个具体的实施例中,可以将第二目标图像识别模型部署到公有云服务器中,提供给各种不同的用户进行二次开发使用,也可以将第二目标图像识别模型部署到私有云服务器,即企业自身搭建的云服务器中,供企业使用,能够保证企业重要数据安全。
在上述实施例中,通过将第二目标图像识别模型部署的云服务器中,供用户进行使用,降低了用户的技术门槛,方便用户直接使用。
在一个实施例中,基础图像识别模型的生成包括以下步骤:
获取训练图像样本,将训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到基础图像识别模型。
其中,深度神经网络模型是指使用深度神经网络算法建立的初始模型,该初始模型的参数都是未经过训练的参数。预设基础训练完成条件是指预先设置好的基础图像识别模型训练完成的条件,该条件包括但不限于基础图像识别模型的训练次数达到预设最大迭代次数、基础图像识别模型的损失值达到预设的损失阈值和基础图像识别模型的图像识别准确率达到预设的准确率。
具体地,服务器获取到训练图像样本,使用训练图像样本对深度神经网络模型进行训练,当达到预设基础训练完成条件时,将最后一次得到的图像识别模型作为基础图像识别模型。
在一个具体的实施例中,获取到在ImageNet(大型通用物体识别开源数据集)数据集上预训练的 ResNet101(深度残差网络101层)中的卷积层的参数,然后将输出层的参数随机初始化,就得到了深度神经网络模型。其中,随机初始化可以是指采用方差为0.01,均值为0的高斯分布进行初始化。然后获取到训练图像样本,将训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到基础图像识别模型。其中,深度神经网络模型的激活函数可以是ReLU(Rectified Linear Unit,线性整流函数)函数。损失函数使用交叉熵损失函数和负对数似然损失函数等。表1为深度神经网络模型中ResNet101的结构表:
表1 ResNet101的结构表
表2为深度神经网络模型中输出层的结构表:
表2输出层结构表
其中,Conv5_x输出训练图像样本的深度特征feature map(图像和滤波器进行卷积后得到的特征图),pool层输出特征embedding(图像在经过深度学习神经网络前向计算后输出的深层高维度特征,一般在某个feature map后,进行池化(pooling)操作后得到的一维特征向量),Fc层输出各类别的预测概率。其中,图4为ResNet101中blocks(模块)的结构示意图,该图为一个三层的残差模块,用于降低参数的数目。
在一个具体的实施例中,也可以获取到预训练的inception(一种CNN网络模型)网络模型中卷积层的参数,然后将输出层的参数随机初始化,就得到了深度神经网络模型。其中,inception网络模型可以是Inceptionv1,Inceptionv2、 Inceptionv3、Inceptionv4和Inception-ResNet等的网络模型。
在一个实施例中,如图5所示,获取训练图像样本,将训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到基础图像识别模型,包括:
步骤502,从训练图像样本中选取当前训练样本。
步骤504,将当前训练样本输入到深度神经网络模型中进行前向传播计算,得到当前预测类别。
其中,当前训练样本是指当前需要训练的图像样本,可以是一张图像样本,也可以是一批图像样本,比如,当训练图像样本有30000张时,可以将训练图像样本分为100批次,每批次有300张图片。前向传播计算是指根据深度神经网络的输入计算输出的过程。当前预测类别是指当前训练样本经过深度神经网络模型的识别得到的类别。
具体地,服务器从训练图像样本中选取当前训练样本,将当前训练样本输入到深度神经网络模型中进行前向传播计算,得到模型输出的当前预测类别。
步骤506,获取当前训练样本对应的图像类别标签,使用当前预测类别和对应的图像类别标签计算当前损失值。
其中,图像类别标签是指当前训练样本对应的真实类别,是预先设置好的。
具体地,服务器获取到当前训练样本对应的图像类别标签,根据当前预测类别和对应的图像类别标签使用损失函数计算损失值,其中,损失函数是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。该损失函数可以使用交叉熵损失函数和负对数似然损失函数等。
步骤508,使用当前损失值对深度神经网络模型进行反向传播计算,得到更新模型参数的深度神经网络模型。
其中,反向传播计算是指使用优化算法对深度神经网络模型的模型参数进行更新的计算过程,其中,优化算法可以是梯度下降法、随机梯度下降法和小批量梯度下降等等。模型参数是指模型需要进行训练得到的变量,是模型内部的变量,属于模型的一部分。比如,深度神经网络模型中的权重和偏置为模型参数。
具体地,服务器使用当前损失值对深度神经网络模型进行反向传播计算,即对深度神经网络模型中的模型参数进行更新,当计算完成时,得到更新模型参数的深度神经网络模型。其中,初始学习率可以设置为0.001,学习率表示了每次参数更新的幅度大小,学习率是一个超参数,用于决定代价函数能否收敛到局部最小值以及何时收敛到最小值,学习率随着训练次数变化而动态更新。
步骤510,判断是否达到预设基础训练完成条件,当达到预设基础训练完成条件时,执行步骤512a,当未达到预设基础训练完成条件时,执行步骤512b并返回步骤502执行。
步骤512a,得到基础图像识别模型。
步骤512b,将更新模型参数的深度神经网络模型作为深度神经网络模型,并返回从训练图像样本中选取当前训练样本的步骤执行。
具体地,服务器判断是否达到预设基础训练完成条件,即是否对深度神经网络模型的模型参数优化完成,当达到预设基础训练完成条件,即说明模型参数优化完成,此时就得到了基础图像识别模型。当未达到预设基础训练完成条件,说明模型参数未优化完成,此时将更新模型参数的深度神经网络模型作为深度神经网络模型,并返回从训练图像样本中选取当前训练样本的步骤执行继续进行模型参数优化,经过多次优化后,直到达到预设基础训练完成条件,得到的最终的基础图像识别模型。
在上述实施例中,通过训练图像样本进行深度神经网络模型的训练,当训练完成时,得到了基础图像识别模型,方便使用。
在一个实施例中,基于各个图像样本特征向量计算得到长尾类别权重,包括步骤:从各个图像样本特征向量中确定各个长尾类别对应的目标图像样本特征向量;分别计算各个长尾类别对应的目标图像样本特征向量的平均向量,得到各个长尾类别对应的平均向量;将各个长尾类别对应的平均向量作为各个长尾类别对应的长尾类别权重。
其中,目标图像样本特征向量是指长尾类别对应的图像样本特征向量,不同的长尾类别有不同的图像样本特征向量。平均向量是指计算长尾类别对应所有的目标图像样本特征向量之和,然后在得到所有的目标图像样本特征向量的数量,计算所有的目标图像样本特征向量之和与所有的目标图像样本特征向量的数量的比值得到的,比如,长尾类别对应所有的目标图像样本特征向量包括(1,1,1),(2,2,2)和(3,3,3),进行向量的加法计算得到的向量为(6,6,6)。目标图像样本特征向量的数量为3,则得到平均向量为(2,2,2)。
具体地,服务器将从各个图像样本特征向量中确定每个长尾类别对应的所有目标图像样本特征向量,分别根据每个长尾类别对应的所有目标图像样本特征向量计算每个长尾类别对应的平均向量,然后将计算得到的每个长尾类别对应的平均向量作为每个类别对应的长尾类别权重。比如,当有10个长尾类别对应的所有目标图像样本特征向量,分别计算10个长尾类别对应的所有目标图像样本特征向量的平均向量,就得到的10个长尾类别对应的长尾类别权重。
在上述实施例中,通过从各个图像样本特征向量中确定各个长尾类别对应的目标图像样本特征向量,然后分别计算各个长尾类别对应的目标图像样本特征向量的平均向量,得到各个长尾类别对应的长尾类别权重,能够使得到的长尾类别权重更加的准确。
在一个实施例中,步骤206,使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型,包括:
获取到各个长尾类别对应的长尾类别权重,并从基础图像识别模型输出层中确定各个长尾类别对应的长尾类别模型参数。使用各个长尾类别对应的长尾类别权重替换对应的长尾类别模型参数,得到当前图像识别模型。
其中,基础图像识别模型输出层用于根据输入特征计算得到图像类别的概率。长尾类别模型参数是指基础图像识别模型输出层中计算长尾类别概率时使用的模型参数。
具体地,获取到每个长尾类别对应的长尾类别权重,并从基础图像识别模型输出层中确定每个长尾类别对应的长尾类别模型参数。然后分别使用每个长尾类别对应的长尾类别权重替换对应的长尾类别模型参数,当替换完成时,得到当前图像识别模型。比如,基础图像识别模型能够识别的类别数量为100,其中有25个为长尾类别,则获取到25个为长尾类别的长尾类别权重,然后从基础图像识别模型输出层中确定25个长尾类别模型参数,然后将一致长尾类别的长尾类别模型参数替换为长尾类别权重,得到当前图像识别模型。
在一个具体实施例中,如图6所示,为长尾类别权重替换的流程示意图,包括以下步骤:
步骤602,获取长尾类别I的训练图像样本。
步骤604,将长尾类别I的训练图像样本输入到基础图像识别模型中进行特征识别,得到长尾类别I对应的各个图像样本特征向量。
步骤606,基于长尾类别I对应的各个图像样本特征向量计算得到长尾类别权重。
步骤608,使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数。
步骤610,判断长尾类别是否处理结束,当处理结束时执行步骤612,当未处理结束时执行步骤602。
步骤612,得到当前图像识别模型。
具体地,服务器先获取到一个长尾类别的所有训练图像样本,通过基础图像识别模型识别得到该长尾类别的所有训练图像样本对应的图像样本特征向量,然后计算该各个图像样本特征向量的平均向量,得到该长尾类别权重,直接使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,然后判断长尾类别对应的长尾类别模型参数是否全部替换完成,当全部替换完成时,说明长尾类别处理结束,得到当前图像识别模型。当未全部替换完成时,获取到下一个长尾类别的所有训练图像样本的步骤继续进行执行,直到所有的长尾类别处理结束。
在该实施例中,通过将长尾类别模型参数一个接一个的进行替换,直到全部替换完成时,得到当前图像识别模型,能够防止替换过程中出现错误,提高替换的准确性。
在一个实施例中,如图7所示,步骤208,使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型,包括:
步骤702,从训练图像样本中确定目标图像样本,将目标图像样本输入到当前图像识别模型进行前向传播计算,得到训练预测类别;
步骤704,获取目标图像样本对应的目标图像类别,根据训练预测类别和目标图像类别计算初始损失值。
其中,目标图像样本是指随机从训练图像样本中确定的图像样本,该图像样本可以是长尾类别对应的图像样本,也可以是正常类别对应的图像样本。初始损失值是指根据训练预测类别和目标图像类别使用损失函数计算得到的,损失函数可以是交叉熵损失函数和负对数似然损失函数等。训练预测类别是指对目标图像样本进行识别得到的类别。目标图像类别是指目标图像样本对应的真实的图像类别,该真实的图像类别是预先设置好的。
具体地,服务器从训练图像样本中任意选取目标图像样本,将目标图像样本输入到当前图像识别模型进行前向传播计算,得到训练预测类别,获取选取的目标图像样本对应的目标图像类别,然后损失函数计算训练预测类别和目标图像类别之间的初始损失值。
步骤706,从训练图像样本中确定目标图像类别对应的图像样本数量,基于目标图像类别对应的图像样本数量计算目标图像类别对应的目标权重,根据目标权重和初始损失值计算目标损失值。
其中,图像样本数量是指训练图像样本中包括的目标图像类别对应的图像样本的数量。训练图像样本中每个图像样本都预先设置好对应的图像类别。目标权重是指目标图像类别对应的样本权重。每个图像类别对应的样本权重是不同的。
具体地,服务器从在训练图像样本中查找到目标图像类别对应的所有图像样本,并进行数量统计得到图像样本数量,使用该图像样本数量计算得到该目标图像类别对应的目标权重,使用目标权重对初始损失值进行加权计算得到目标损失值。在一个具体的实施例中,可以使用如下公式(1)计算目标损失值:
其中,Loos1是指目标损失值,M是指batch size批数量,是指单次训练时使用的图像样本数。N_class是指图像类别的数量,c是指目标图像类别。是指目标图像类别的权重,是指目标图像类别的初始损失值。
在一个实施例中,基于目标图像类别对应的图像样本数量计算目标图像类别对应的目标权重,包括步骤:
获取预设参数值,计算预设参数值与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。
其中,预设参数值是指预先设置好的用于计算目标权重的参数,该参数可以根据专家经验设置。
具体地,服务器获取到预先设置好的参数值,预设参数值与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。比如,可以使用公式(2)计算目标权重。
其中,k为预设参数值,可以设置为1,也可以设置为其他参数。为目标图像类别对应的图像样本数量。在该实施例中,使用预设参数值与目标图像类别对应的图像样本数量的比值作为目标权重,从而能够对图像类别均衡性的加权,保证长尾类别在损失值更新阶段的作用得到均衡性放大,使得训练过程中训练到的权重克服样本数量不均衡带来的过大偏离,使得最终训练得到的模型参数对长尾类型的识别有利。
在一个实施例中,基于目标图像类别对应的图像样本数量计算目标图像类别对应的目标权重,包括步骤:
获取训练图像样本总数量,计算训练图像样本总数量与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。
其中,训练图像样本总数量是指训练图像样本中所有的图像样本数量。
具体地,服务器统计得到训练图像样本总数量,计算训练图像样本总数量与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。比如,可以使用公式(3)计算目标权重。
其中,i为正整数,表示第i个图像类别,表示计算每个图像类别的数量之和得到训练图像样本总数量。在该实施例中,使用训练图像样本总数量与目标图像类别对应的图像样本数量的比值作为目标权重,使能够对图像类别均衡性的加权,提高了保证长尾类别在损失值更新阶段作用得到均衡性放大,使得训练过程中训练到的权重克服样本数量不均衡带来的过大偏离,使得最终的训练得到的模型参数对长尾类型的识别有利。
步骤708,使用目标损失值对当前图像识别模型进行反向传播计算,得到更新模型参数的图像识别模型。
步骤710,判断是否达到预设训练完成条件,当达到预设训练完成条件时,执行步骤712a,当未达到预设训练完成条件,执行步骤712b。
步骤712b,将更新模型参数的图像识别模型作为当前图像识别模型,并返回从训练图像样本中确定目标图像样本,将目标图像样本输入到当前图像识别模型进行前向传播计算,得到训练预测类别的步骤执行。
步骤712a,得到第一目标图像识别模型。
具体地,当得到目标损失值时,使用目标损失值对当前图像识别模型进行反向传播计算,得到更新模型参数的图像识别模型,其中,在进行反向传播计算时,设置的学习率远低于进行基础图像识别模型训练时的学习率,比如,可以设置为0.00001。从而使模型参数的更新对正常类别学习影响更少,保证了正常类别学习效果,使不会因为对长尾类别针对性学习从而导致对正常类别识别的性能快速下降。此时,服务器判断是否达到预设训练完成条件,当达到预设训练完成条件,得到第一目标图像识别模型,当未达到预设训练完成条件将更新模型参数的图像识别模型作为当前图像识别模型,并返回步骤702进行执行。
在上述实施例中,通过根据训练预测类别和目标图像类别计算初始损失值,然后从训练图像样本中确定目标图像类别对应的图像样本数量,基于目标图像类别对应的图像样本数量计算目标图像类别对应的目标权重,根据目标权重和初始损失值计算目标损失值,使用目标损失值对当前图像识别模型进行反向传播计算,得到更新模型参数的图像识别模型,当达到预设训练完成条件时,得到第一目标图像识别模型,能够使得到的第一目标图像识别模型提高识别图像长尾类别的准确性。
在一个具体的实施例中,图8为图像识别模型训练方法的训练框架示意图。其中,包括基础模型训练、长尾类别权重生成和带长尾类别权重的模型适应性训练三个部分。其中,W为正常类别对应的模型参数,w1为长尾类别对应的模型参数。通过基础模型训练部分训练得到基础图像识别模型,通过长尾类别权重生成部分得到长尾类别权重,然后带长尾的模型适应性训练部分,将长尾类别权重进行替换得到带长尾类别权重的模型,将该带长尾类别权重的模型再次进行适应性训练,同时,进行长尾类别权重生成和带长尾类别权重的模型适应性训练的交替学习,当完成训练时,得到第二目标图像识别模型。该第二目标图像识别模型可以用于进行二分类图像识别,也可以用于进行多分类图像识别。其中,二分类图像识别可以是识别图像中是否包括人或者识别图像中是否包括动物或者识别图像中是否包括车辆等等。多分类图像识别可以是识别图像中多个物体对应的物体类别,并得到识别的结果物体的类别,比如,图像中的人体、动物、植物、车辆和建筑物等等。
在一个具体的实施例中,如图9所示,使用图8所示的框架得到第二目标图像识别模型,具体包括以下步骤:
步骤902,获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本。其中,训练图像样本为长尾分布的示意图,如图10所示,当类别在尾部时,其对应的图像样本量就会极少。
步骤904,从训练图像样本中得到长尾类别I对应的各个图像样本,将长尾类别I对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到长尾类别I对应的各个图像样本特征向量,
步骤906,基于长尾类别I对应的各个图像样本特征向量计算平均向量,将平均向量作为长尾类别I对应的长尾类别权重。
步骤908,使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数。
步骤910,判断长尾类别是否处理结束,当处理结束时执行步骤912,当未处理结束时返回步骤904执行。
步骤912,得到当前图像识别模型,
步骤914,使用所述训练图像样本对所述当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
步骤916,判断是否达到预设循环完成条件,当达到预设循环完成条件时,执行步骤918a,当未达到预设循环完成条件时,执行步骤918b并返回步骤904执行。
步骤918b,将第一目标图像识别模型作为基础图像识别模型,并返回步骤904执行。
步骤918a,得到第二目标图像识别模型。
在上述实施例中,通过训练框架来完成对图像识别模型的训练,提高了得到第二目标图像识别模型的效率。
在一个实施例中,本申请提供的图像识别方法,可以应用于如图11所示的应用环境中。其中,前端设备A通过网络与服务器进行通信,服务器通过网络与前端设备B进行通信。服务器接收前端设备A发送的图像识别指令,然后获取待识别图像。服务器将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别,将图像类别返回到前端设备B中进行显示,在一个实施例中,也可以将图像类别返回前端设备A中进行显示,其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。前端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在一个实施例中,如图12所示,提供一种图像识别方法,该方法可以应用到终端或者服务器中,以该方法应用于图12中的服务器为例进行说明,包括以下步骤:
步骤1202,获取待识别图像。
步骤1204,将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别,其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
其中,待识别图像是指需要进行类别识别的图像。图像类别是指识别得到的待识别图像的类别。
具体地,服务器可以预先部署使用上述图像识别模型训练方法训练得到的图像识别模型。比如,将第一目标图像识别模型部署到服务器,然后,当服务器获取到用户终端发送的待识别图像时,对待识别图像输入第一目标图像识别模型中进行识别,得到输出的图像类别,将图像类别返回给用户终端进行展示。在一个实施例中,也可以将第二目标图像识别模型部署到服务器中。使用第二目标图像识别模型对待识别图像进行识别,得到输出的图像类别,将图像类别返回给用户终端进行展示。
在一个实施例中,可以使用在终端中部署使用上述图像识别模型训练方法训练得到的图像识别模型,直接获取到终端本地存储的待识别图像进行识别,提高了识别得到图像类别的效率。
在上述实施例中,通过获取待识别图像,将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别,能够提高得到长尾类别的准确性。
本申请提供一种应用场景,图13为应用场景的应用环境示意图,该应用场景应用上述图像识别模型训练方法和图像识别方法。具体地,该图像识别模型训练方法和图像识别方法在该应用场景的应用如下:
通过视频图像样本使用图像识别模型训练方法训练得到用于识别视频图像的第二目标图像识别模型,将第二目标图像识别模型部署到云服务器1302中,其中,云服务器1302与监控设备1304网络连接,云服务器1302与终端1306网络连接,其中,该监控设备1304可以是监控摄像头、监控摄像机等,通过云服务器1302实时获取到监控摄像头1304监控到的视频图像,使用第二目标图像识别模型对视频图像进行识别,识别出视频图像中的车辆和行人等,然后可以进一步判断车辆是否有违规现象,行人是否遵守交通规则等等,最后,可以将判断结果返回到终端1306中进行显示。
本申请提供一种应用场景,该应用场景应用上述图像识别方法。具体地,该图像识别方法在该应用场景的应用如下:
通过医学图像样本使用图像识别模型训练方法训练得到用于识别医学图像的第二目标图像识别模型,将第二目标图像识别模型部署到服务器中,服务器与医生对应的终端网络连接。获取到医生对应的终端发送的医学图像,使用第二目标图像识别模型对医学图像进行识别,识别出医学图像中的特定类别,比如,结核、肿瘤等等。将识别出的特定类别返回给医生对应的终端进行展示,提供给医生进行参考。
本申请还提供一种应用场景,该应用场景应用上述的图像识别模型训练方法和图像识别方法。具体地,该图像识别模型训练方法和图像识别方法在该应用场景的应用如下:
获取到动物图像训练样本和基础图像识别模型,所述动物图像训练样本中包括长尾类别对应的各个动物图像样本,将长尾类别对应的各个动物图像样本输入到基础图像识别模型中进行特征识别,得到各个动物图像样本特征向量,基于各个动物图像样本特征向量计算得到长尾类别权重,使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型。使用动物图像训练样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一动物图像识别模型。此时,将第一动物图像识别模型作为基础图像识别模型,并返回将长尾类别对应的各个动物图像样本输入到基础图像识别模型中进行特征识别,得到各个动物图像样本特征向量,基于各个动物图像样本特征向量计算得到长尾类别权重的步骤执行,直到达到预设循环完成条件时,得到第二动物图像识别模型,将第二动物图像识别模型部署到云服务器中,并生成调用接口。当用户需要对待识别动物图像进行识别时,通过该调用接口发送待识别动物图像,云服务器通过调用接口获取到待识别动物图像,使用第二动物图像识别模型对该待识别动物图像进行识别,得到识别结果,即动物名称,然后将该动物名称发送给用户终端进行显示。
应该理解的是,虽然图2、3、5-7、9、12的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、3、5-7、9、12中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图14所示,提供了一种图像识别模型训练装置1400,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块1402、权重计算模块1404、替换模块1406和训练模块1408,其中:
获取模块1402,用于获取基础图像识别模型,并获取训练图像样本,训练图像样本包括长尾类别对应的各个图像样本;
权重计算模块1404,用于将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重;
替换模块1406,用于使用长尾类别权重替换基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
训练模块1408,使用训练图像样本对当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
在一个实施例中,图像识别模型训练装置1400,还包括:
第二模型训练模块,用于将第一目标图像识别模型作为基础图像识别模型,并返回将长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到长尾类别权重的步骤执行,直到达到预设循环完成条件时,得到第二目标图像识别模型。
在一个实施例中,图像识别模型训练装置1400,还包括:
模型部署模块,用于将第二目标图像识别模型部署到云服务器中,并生成调用接口,调用接口用于调用第二图像识别模型对待识别图像进行识别。
在一个实施例中,图像识别模型训练装置1400,还包括:
基础模型训练模块,用于获取训练图像样本,将训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到基础图像识别模型。
在一个实施例中,基础模型训练模块,包括:
当前类别预测单元,用于从训练图像样本中选取当前训练样本;将当前训练样本输入到深度神经网络模型中进行前向传播计算,得到当前预测类别;
当前损失计算单元,用于获取当前训练样本对应的图像类别标签,使用当前预测类别和对应的图像类别标签计算当前损失值;
参数更新单元,用于使用当前损失值对深度神经网络模型进行反向传播计算,得到更新模型参数的深度神经网络模型,将更新模型参数的深度神经网络模型作为深度神经网络模型,并返回从训练图像样本中选取当前训练样本的步骤执行,直到达到预设基础训练完成条件时,得到基础图像识别模型。
在一个实施例中,权重计算模块1404,包括:
平均计算单元,用于从各个图像样本特征向量中确定各个长尾类别对应的目标图像样本特征向量;分别计算各个长尾类别对应的目标图像样本特征向量的平均向量,得到各个长尾类别对应的平均向量;将各个长尾类别对应的平均向量作为各个长尾类别对应的长尾类别权重。
在一个实施例中,替换模块1406,包括:
输出层替换单元,用于获取到各个长尾类别对应的长尾类别权重,并从基础图像识别模型输出层中确定各个长尾类别对应的长尾类别模型参数;使用各个长尾类别对应的长尾类别权重替换对应的长尾类别模型参数,得到当前图像识别模型。
在一个实施例中,训练模块1408,包括:
初始损失计算单元,用于从训练图像样本中确定目标图像样本,将目标图像样本输入到当前图像识别模型进行前向传播计算,得到训练预测类别;获取目标图像样本对应的目标图像类别,根据训练预测类别和目标图像类别计算初始损失值;
目标损失计算单元,用于从训练图像样本中确定目标图像类别对应的图像样本数量,基于目标图像类别对应的图像样本数量计算目标图像类别对应的目标权重,根据目标权重和初始损失值计算目标损失值;
第一模块得到单元,用于使用目标损失值对当前图像识别模型进行反向传播计算,得到更新模型参数的图像识别模型,将更新模型参数的图像识别模型作为当前图像识别模型,并返回从训练图像样本中确定目标图像样本,将目标图像样本输入到当前图像识别模型进行前向传播计算,得到训练预测类别的步骤执行,直到达到预设训练完成条件时,得到第一目标图像识别模型。
在一个实施例中,目标损失计算单元还用于获取预设参数值,计算预设参数值与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。
在一个实施例中,目标损失计算单元还用于获取训练图像样本总数量,计算训练图像样本总数量与目标图像类别对应的图像样本数量的比值,得到目标图像类别对应的目标权重。
在一个实施例中,如图15所示,提供了一种图像识别装置1500,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:图像获取模块1502和图像识别模块1504,其中:
图像获取模块1502,用于获取待识别图像;
图像识别模块1504,用于将待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;其中,第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对当前图像识别模型进行训练后得到,长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于各个图像样本特征向量计算得到的。
关于图像识别模型训练装置和图像识别装置的具体限定可以参见上文中对于图像识别模型训练方法和图像识别方法的限定,在此不再赘述。上述图像识别模型训练装置和图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像样本数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别模型训练方法或者图像识别方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图16和17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种图像识别模型训练方法,其特征在于,所述方法包括:
获取基础图像识别模型,并获取训练图像样本,所述训练图像样本包括长尾类别对应的各个图像样本;
将所述长尾类别对应的各个图像样本输入到所述基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于所述各个图像样本特征向量计算得到长尾类别权重;
使用所述长尾类别权重替换所述基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
使用所述训练图像样本对所述当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
2.根据权利要求1所述的方法,其特征在于,在所述使用所述训练图像样本对所述当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型之后,还包括:
将所述第一目标图像识别模型作为基础图像识别模型,并返回将所述长尾类别对应的各个图像样本输入到所述基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于所述各个图像样本特征向量计算得到长尾类别权重的步骤执行,直到达到预设循环完成条件时,得到第二目标图像识别模型。
3.根据权利要求2所述的方法,其特征在于,在所述得到第二目标图像识别模型之后,还包括:
将所述第二目标图像识别模型部署到云服务器中,并生成调用接口,所述调用接口用于调用所述第二图像识别模型对待识别图像进行识别。
4.根据权利要求1所述的方法,其特征在于,所述基础图像识别模型的生成包括以下步骤:
获取所述训练图像样本,将所述训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到所述基础图像识别模型。
5.根据权利要求4所述的方法,其特征在于,所述获取所述训练图像样本,将所述训练图像样本输入到深度神经网络模型中进行训练,当达到预设基础训练完成条件时,得到所述基础图像识别模型,包括:
从所述训练图像样本中选取当前训练样本;
将所述当前训练样本输入到所述深度神经网络模型中进行前向传播计算,得到当前预测类别;
获取所述当前训练样本对应的图像类别标签,使用所述当前预测类别和对应的所述图像类别标签计算当前损失值;
使用所述当前损失值对所述深度神经网络模型进行反向传播计算,得到更新模型参数的深度神经网络模型,将所述更新模型参数的深度神经网络模型作为深度神经网络模型,并返回从所述训练图像样本中选取当前训练样本的步骤执行,直到达到所述预设基础训练完成条件时,得到所述基础图像识别模型。
6.根据权利要求1所述的方法,其特征在于,基于所述各个图像样本特征向量计算得到长尾类别权重,包括:
从所述各个图像样本特征向量中确定各个长尾类别对应的目标图像样本特征向量;
分别计算所述各个长尾类别对应的目标图像样本特征向量的平均向量,得到所述各个长尾类别对应的平均向量;
将所述各个长尾类别对应的平均向量作为所述各个长尾类别对应的长尾类别权重。
7.根据权利要求1所述的方法,其特征在于,所述使用所述长尾类别权重替换所述基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型,包括:
获取到各个长尾类别对应的长尾类别权重,并从所述基础图像识别模型输出层中确定所述各个长尾类别对应的长尾类别模型参数;
使用所述各个长尾类别对应的长尾类别权重替换对应的长尾类别模型参数,得到当前图像识别模型。
8.根据权利要求1所述的方法,其特征在于,所述使用所述训练图像样本对所述当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型,包括:
从所述训练图像样本中确定目标图像样本,将所述目标图像样本输入到所述当前图像识别模型进行前向传播计算,得到训练预测类别;
获取所述目标图像样本对应的目标图像类别,根据所述训练预测类别和所述目标图像类别计算初始损失值;
从所述训练图像样本中确定所述目标图像类别对应的图像样本数量,基于所述目标图像类别对应的图像样本数量计算所述目标图像类别对应的目标权重,根据所述目标权重和所述初始损失值计算目标损失值;
使用所述目标损失值对所述当前图像识别模型进行反向传播计算,得到更新模型参数的图像识别模型,将所述更新模型参数的图像识别模型作为当前图像识别模型,并返回从所述训练图像样本中确定目标图像样本,将所述目标图像样本输入到所述当前图像识别模型进行前向传播计算,得到训练预测类别的步骤执行,直到达到所述预设训练完成条件时,得到所述第一目标图像识别模型。
9.根据权利要求8所述的方法,其特征在于,所述基于所述目标图像类别对应的图像样本数量计算所述目标图像类别对应的目标权重,包括:
获取预设参数值,计算所述预设参数值与所述目标图像类别对应的图像样本数量的比值,得到所述目标图像类别对应的目标权重。
10.根据权利要求8所述的方法,其特征在于,所述基于所述目标图像类别对应的图像样本数量计算所述目标图像类别对应的目标权重,包括:
获取训练图像样本总数量,计算所述训练图像样本总数量与所述目标图像类别对应的图像样本数量的比值,得到所述目标图像类别对应的目标权重。
11.一种图像识别方法,其特征在于,所述方法包括:
获取待识别图像;
将所述待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;
其中,所述第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对所述当前图像识别模型进行训练后得到,所述长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到所述基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于所述各个图像样本特征向量计算得到的。
12.一种图像识别模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取基础图像识别模型,并获取训练图像样本,所述训练图像样本包括长尾类别对应的各个图像样本;
权重计算模块,用于将所述长尾类别对应的各个图像样本输入到所述基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于所述各个图像样本特征向量计算得到长尾类别权重;
替换模块,用于使用所述长尾类别权重替换所述基础图像识别模型中对应的长尾类别模型参数,得到当前图像识别模型;
训练模块,使用所述训练图像样本对所述当前图像识别模型进行训练,当达到预设训练完成条件时,得到第一目标图像识别模型。
13.一种图像识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待识别图像;
图像识别模块,用于将所述待识别图像输入到第一目标图像识别模型中进行识别,得到输出的图像类别;其中,所述第一目标图像识别模型是使用长尾类别权重替换基础图像识别模型输出层对应的长尾类别模型参数,得到当前图像识别模型,并使用训练图像样本对所述当前图像识别模型进行训练后得到,所述长尾类别权重是将训练图像样本中长尾类别对应的各个图像样本输入到所述基础图像识别模型中进行特征识别,得到各个图像样本特征向量,基于所述各个图像样本特征向量计算得到的。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010400444.XA CN111291841B (zh) | 2020-05-13 | 2020-05-13 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010400444.XA CN111291841B (zh) | 2020-05-13 | 2020-05-13 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111291841A true CN111291841A (zh) | 2020-06-16 |
CN111291841B CN111291841B (zh) | 2020-08-21 |
Family
ID=71024938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010400444.XA Active CN111291841B (zh) | 2020-05-13 | 2020-05-13 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111291841B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523621A (zh) * | 2020-07-03 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN111582410A (zh) * | 2020-07-16 | 2020-08-25 | 平安国际智慧城市科技股份有限公司 | 图像识别模型训练方法、装置、计算机设备及存储介质 |
CN111931153A (zh) * | 2020-10-16 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 基于人工智能的身份验证方法、装置和计算机设备 |
CN111931768A (zh) * | 2020-08-14 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 一种自适应样本分布的车辆识别方法及系统 |
CN111950656A (zh) * | 2020-08-25 | 2020-11-17 | 深圳思谋信息科技有限公司 | 图像识别模型生成方法、装置、计算机设备和存储介质 |
CN112632319A (zh) * | 2020-12-22 | 2021-04-09 | 天津大学 | 基于迁移学习的提升长尾分布语音总体分类准确度的方法 |
CN112801237A (zh) * | 2021-04-15 | 2021-05-14 | 北京远鉴信息技术有限公司 | 暴恐内容识别模型的训练方法、训练装置及可读存储介质 |
CN112801178A (zh) * | 2021-01-26 | 2021-05-14 | 上海明略人工智能(集团)有限公司 | 模型训练方法、装置、设备及计算机可读介质 |
CN113408674A (zh) * | 2021-08-19 | 2021-09-17 | 杭州太美星程医药科技有限公司 | 模型训练方法及装置、图像识别方法及装置 |
CN113591637A (zh) * | 2021-07-20 | 2021-11-02 | 北京爱笔科技有限公司 | 对齐模型的训练方法、装置、计算机设备以及存储介质 |
CN114511887A (zh) * | 2022-03-31 | 2022-05-17 | 北京字节跳动网络技术有限公司 | 组织图像的识别方法、装置、可读介质和电子设备 |
WO2022099600A1 (en) * | 2020-11-13 | 2022-05-19 | Intel Corporation | Method and system of image hashing object detection for image processing |
CN114549928A (zh) * | 2022-02-21 | 2022-05-27 | 平安科技(深圳)有限公司 | 图像增强处理方法、装置、计算机设备及存储介质 |
CN114612753A (zh) * | 2022-03-09 | 2022-06-10 | 北京大学深圳研究生院 | 图像识别模型的训练方法、装置、电子设备及存储介质 |
CN114663717A (zh) * | 2020-12-22 | 2022-06-24 | 顺丰科技有限公司 | 包装材料视觉识别方法、装置、计算机设备和存储介质 |
CN115115844A (zh) * | 2022-06-28 | 2022-09-27 | 支付宝(杭州)信息技术有限公司 | 评估图像特征提取算法的方法和装置 |
CN115187809A (zh) * | 2022-07-11 | 2022-10-14 | 腾讯科技(深圳)有限公司 | 分类及分类模型训练方法、装置及存储介质 |
CN115506783A (zh) * | 2021-06-21 | 2022-12-23 | 中国石油化工股份有限公司 | 一种岩性识别方法 |
CN115830399A (zh) * | 2022-12-30 | 2023-03-21 | 广州沃芽科技有限公司 | 分类模型训练方法、装置、设备、存储介质和程序产品 |
CN117036670A (zh) * | 2022-10-20 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 质量检测模型的训练方法、装置、设备、介质及程序产品 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150309A1 (en) * | 2007-12-10 | 2009-06-11 | Yahoo! Inc. | System and method for training a multi-class support vector machine to select a common subset of features for classifying objects |
CN106355248A (zh) * | 2016-08-26 | 2017-01-25 | 深圳先进技术研究院 | 一种深度卷积神经网络训练方法及装置 |
US20180225516A1 (en) * | 2017-02-06 | 2018-08-09 | Brown University | Method and system for automated behavior classification of test subjects |
CN109086303A (zh) * | 2018-06-21 | 2018-12-25 | 深圳壹账通智能科技有限公司 | 基于机器阅读理解的智能对话方法、装置、终端 |
US20190012526A1 (en) * | 2017-07-04 | 2019-01-10 | Microsoft Technology Licensing, Llc | Image recognition with promotion of underrepresented classes |
US20190034798A1 (en) * | 2017-07-25 | 2019-01-31 | University Of Massachusetts Medical School | Method for Meta-Level Continual Learning |
CN109408624A (zh) * | 2018-11-06 | 2019-03-01 | 江西师范大学 | 一种视觉聊天机器人会话生成方法 |
US20190080453A1 (en) * | 2017-09-12 | 2019-03-14 | Nantomics, Llc | Few-shot learning based image recognition of whole slide image at tissue level |
CN109614989A (zh) * | 2018-11-13 | 2019-04-12 | 平安科技(深圳)有限公司 | 快速模型的训练方法、装置、计算机设备及存储介质 |
CN109784421A (zh) * | 2019-01-30 | 2019-05-21 | 北京朗镜科技有限责任公司 | 一种识别模型的构建方法及装置 |
CN110097130A (zh) * | 2019-05-07 | 2019-08-06 | 深圳市腾讯计算机系统有限公司 | 分类任务模型的训练方法、装置、设备及存储介质 |
CN110210560A (zh) * | 2019-05-31 | 2019-09-06 | 北京市商汤科技开发有限公司 | 分类网络的增量训练方法、分类方法及装置、设备及介质 |
CN110232406A (zh) * | 2019-05-28 | 2019-09-13 | 厦门大学 | 一种基于统计学习的液晶面板cf图片识别方法 |
CN110427846A (zh) * | 2019-07-19 | 2019-11-08 | 西安工业大学 | 一种利用卷积神经网络对不平衡小样本的人脸识别方法 |
CN110490227A (zh) * | 2019-07-09 | 2019-11-22 | 武汉理工大学 | 一种基于特征转换的少样本图像分类方法 |
CN110516737A (zh) * | 2019-08-26 | 2019-11-29 | 南京人工智能高等研究院有限公司 | 用于生成图像识别模型的方法和装置 |
CN110580500A (zh) * | 2019-08-20 | 2019-12-17 | 天津大学 | 一种面向人物交互的网络权重生成少样本图像分类方法 |
CN110766084A (zh) * | 2019-10-28 | 2020-02-07 | 北京理工大学 | 基于cae与hl-cnn的小样本sar目标识别方法 |
-
2020
- 2020-05-13 CN CN202010400444.XA patent/CN111291841B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090150309A1 (en) * | 2007-12-10 | 2009-06-11 | Yahoo! Inc. | System and method for training a multi-class support vector machine to select a common subset of features for classifying objects |
CN106355248A (zh) * | 2016-08-26 | 2017-01-25 | 深圳先进技术研究院 | 一种深度卷积神经网络训练方法及装置 |
US20180225516A1 (en) * | 2017-02-06 | 2018-08-09 | Brown University | Method and system for automated behavior classification of test subjects |
US20190012526A1 (en) * | 2017-07-04 | 2019-01-10 | Microsoft Technology Licensing, Llc | Image recognition with promotion of underrepresented classes |
US20190034798A1 (en) * | 2017-07-25 | 2019-01-31 | University Of Massachusetts Medical School | Method for Meta-Level Continual Learning |
US20190080453A1 (en) * | 2017-09-12 | 2019-03-14 | Nantomics, Llc | Few-shot learning based image recognition of whole slide image at tissue level |
CN109086303A (zh) * | 2018-06-21 | 2018-12-25 | 深圳壹账通智能科技有限公司 | 基于机器阅读理解的智能对话方法、装置、终端 |
CN109408624A (zh) * | 2018-11-06 | 2019-03-01 | 江西师范大学 | 一种视觉聊天机器人会话生成方法 |
CN109614989A (zh) * | 2018-11-13 | 2019-04-12 | 平安科技(深圳)有限公司 | 快速模型的训练方法、装置、计算机设备及存储介质 |
CN109784421A (zh) * | 2019-01-30 | 2019-05-21 | 北京朗镜科技有限责任公司 | 一种识别模型的构建方法及装置 |
CN110097130A (zh) * | 2019-05-07 | 2019-08-06 | 深圳市腾讯计算机系统有限公司 | 分类任务模型的训练方法、装置、设备及存储介质 |
CN110232406A (zh) * | 2019-05-28 | 2019-09-13 | 厦门大学 | 一种基于统计学习的液晶面板cf图片识别方法 |
CN110210560A (zh) * | 2019-05-31 | 2019-09-06 | 北京市商汤科技开发有限公司 | 分类网络的增量训练方法、分类方法及装置、设备及介质 |
CN110490227A (zh) * | 2019-07-09 | 2019-11-22 | 武汉理工大学 | 一种基于特征转换的少样本图像分类方法 |
CN110427846A (zh) * | 2019-07-19 | 2019-11-08 | 西安工业大学 | 一种利用卷积神经网络对不平衡小样本的人脸识别方法 |
CN110580500A (zh) * | 2019-08-20 | 2019-12-17 | 天津大学 | 一种面向人物交互的网络权重生成少样本图像分类方法 |
CN110516737A (zh) * | 2019-08-26 | 2019-11-29 | 南京人工智能高等研究院有限公司 | 用于生成图像识别模型的方法和装置 |
CN110766084A (zh) * | 2019-10-28 | 2020-02-07 | 北京理工大学 | 基于cae与hl-cnn的小样本sar目标识别方法 |
Non-Patent Citations (6)
Title |
---|
BOYAN ZHOU 等: "BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition", 《CVPR:2020》 * |
HUI BINYUAN 等: "SELF-ATTENTION RELATION NETWORK FOR FEW-SHOT LEARNING", 《2019 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA & EXPO WORKSHOPS (ICMEW)》 * |
JIALUN LIU 等: "Deep Representation Learning on Long-tailed Data_ A Learnable Embedding Augmentation Perspective", 《CVPR:2020》 * |
WEI XIU-SHEN 等: "Piecewise Classifier Mappings: Learning Fine-Grained Learners for Novel Categories With Few Examples", 《IEEE TRANSACTIONS ON IMAGE PROCESSING : A PUBLICATION OF THE IEEE SIGNAL PROCESSING SOCIETY》 * |
余亚萍: "基于深度学习的非平衡小样本异物检测识别技术研究", 《中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑》 * |
易心一: "面向小样本及数据不平衡问题的超声图像自动分类", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523621A (zh) * | 2020-07-03 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN111582410A (zh) * | 2020-07-16 | 2020-08-25 | 平安国际智慧城市科技股份有限公司 | 图像识别模型训练方法、装置、计算机设备及存储介质 |
CN111582410B (zh) * | 2020-07-16 | 2023-06-02 | 平安国际智慧城市科技股份有限公司 | 图像识别模型训练方法、装置、计算机设备及存储介质 |
CN111931768A (zh) * | 2020-08-14 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 一种自适应样本分布的车辆识别方法及系统 |
CN111950656A (zh) * | 2020-08-25 | 2020-11-17 | 深圳思谋信息科技有限公司 | 图像识别模型生成方法、装置、计算机设备和存储介质 |
CN111950656B (zh) * | 2020-08-25 | 2021-06-25 | 深圳思谋信息科技有限公司 | 图像识别模型生成方法、装置、计算机设备和存储介质 |
CN111931153A (zh) * | 2020-10-16 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 基于人工智能的身份验证方法、装置和计算机设备 |
WO2022099600A1 (en) * | 2020-11-13 | 2022-05-19 | Intel Corporation | Method and system of image hashing object detection for image processing |
CN112632319A (zh) * | 2020-12-22 | 2021-04-09 | 天津大学 | 基于迁移学习的提升长尾分布语音总体分类准确度的方法 |
CN114663717A (zh) * | 2020-12-22 | 2022-06-24 | 顺丰科技有限公司 | 包装材料视觉识别方法、装置、计算机设备和存储介质 |
CN112801178A (zh) * | 2021-01-26 | 2021-05-14 | 上海明略人工智能(集团)有限公司 | 模型训练方法、装置、设备及计算机可读介质 |
CN112801178B (zh) * | 2021-01-26 | 2024-04-09 | 上海明略人工智能(集团)有限公司 | 模型训练方法、装置、设备及计算机可读介质 |
CN112801237A (zh) * | 2021-04-15 | 2021-05-14 | 北京远鉴信息技术有限公司 | 暴恐内容识别模型的训练方法、训练装置及可读存储介质 |
CN112801237B (zh) * | 2021-04-15 | 2021-07-23 | 北京远鉴信息技术有限公司 | 暴恐内容识别模型的训练方法、训练装置及可读存储介质 |
CN115506783A (zh) * | 2021-06-21 | 2022-12-23 | 中国石油化工股份有限公司 | 一种岩性识别方法 |
CN113591637A (zh) * | 2021-07-20 | 2021-11-02 | 北京爱笔科技有限公司 | 对齐模型的训练方法、装置、计算机设备以及存储介质 |
CN113408674B (zh) * | 2021-08-19 | 2021-11-30 | 杭州太美星程医药科技有限公司 | 模型训练方法及装置、图像识别方法及装置 |
CN113408674A (zh) * | 2021-08-19 | 2021-09-17 | 杭州太美星程医药科技有限公司 | 模型训练方法及装置、图像识别方法及装置 |
CN114549928A (zh) * | 2022-02-21 | 2022-05-27 | 平安科技(深圳)有限公司 | 图像增强处理方法、装置、计算机设备及存储介质 |
WO2023155299A1 (zh) * | 2022-02-21 | 2023-08-24 | 平安科技(深圳)有限公司 | 图像增强处理方法、装置、计算机设备及存储介质 |
CN114549928B (zh) * | 2022-02-21 | 2024-09-20 | 平安科技(深圳)有限公司 | 图像增强处理方法、装置、计算机设备及存储介质 |
CN114612753A (zh) * | 2022-03-09 | 2022-06-10 | 北京大学深圳研究生院 | 图像识别模型的训练方法、装置、电子设备及存储介质 |
CN114511887B (zh) * | 2022-03-31 | 2022-07-05 | 北京字节跳动网络技术有限公司 | 组织图像的识别方法、装置、可读介质和电子设备 |
CN114511887A (zh) * | 2022-03-31 | 2022-05-17 | 北京字节跳动网络技术有限公司 | 组织图像的识别方法、装置、可读介质和电子设备 |
CN115115844A (zh) * | 2022-06-28 | 2022-09-27 | 支付宝(杭州)信息技术有限公司 | 评估图像特征提取算法的方法和装置 |
CN115187809A (zh) * | 2022-07-11 | 2022-10-14 | 腾讯科技(深圳)有限公司 | 分类及分类模型训练方法、装置及存储介质 |
CN117036670A (zh) * | 2022-10-20 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 质量检测模型的训练方法、装置、设备、介质及程序产品 |
CN117036670B (zh) * | 2022-10-20 | 2024-06-07 | 腾讯科技(深圳)有限公司 | 质量检测模型的训练方法、装置、设备、介质及程序产品 |
CN115830399A (zh) * | 2022-12-30 | 2023-03-21 | 广州沃芽科技有限公司 | 分类模型训练方法、装置、设备、存储介质和程序产品 |
CN115830399B (zh) * | 2022-12-30 | 2023-09-12 | 广州沃芽科技有限公司 | 分类模型训练方法、装置、设备、存储介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN111291841B (zh) | 2020-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111291841B (zh) | 图像识别模型训练方法、装置、计算机设备和存储介质 | |
US11455807B2 (en) | Training neural networks for vehicle re-identification | |
CN111523621B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN109241903B (zh) | 样本数据清洗方法、装置、计算机设备及存储介质 | |
CN110555481B (zh) | 一种人像风格识别方法、装置和计算机可读存储介质 | |
KR20180057096A (ko) | 표정 인식과 트레이닝을 수행하는 방법 및 장치 | |
CN111368672A (zh) | 一种用于遗传病面部识别模型的构建方法及装置 | |
CN110648289B (zh) | 图像的加噪处理方法及装置 | |
CN111242948B (zh) | 图像处理、模型训练方法、装置、设备和存储介质 | |
CN111783997B (zh) | 一种数据处理方法、装置及设备 | |
CN111382807B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN113033507B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN114495241B (zh) | 一种图像识别方法及装置、电子设备、存储介质 | |
CN111667001A (zh) | 目标重识别方法、装置、计算机设备和存储介质 | |
CN111507285A (zh) | 人脸属性识别方法、装置、计算机设备和存储介质 | |
CN113408570A (zh) | 一种基于模型蒸馏的图像类别识别方法、装置、存储介质及终端 | |
CN110765882A (zh) | 一种视频标签确定方法、装置、服务器及存储介质 | |
CN118229844B (zh) | 图像生成数据的处理方法、图像生成方法和装置 | |
KR20190061538A (ko) | 멀티 인식모델의 결합에 의한 행동패턴 인식방법 및 장치 | |
CN113705596A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN112818995A (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN116310318A (zh) | 交互式的图像分割方法、装置、计算机设备和存储介质 | |
CN111429414B (zh) | 基于人工智能的病灶影像样本确定方法和相关装置 | |
CN117726884B (zh) | 对象类别识别模型的训练方法、对象类别识别方法及装置 | |
CN117011577A (zh) | 图像分类方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40025253 Country of ref document: HK |