CN116258923A - 图像识别模型训练方法、装置、计算机设备和存储介质 - Google Patents
图像识别模型训练方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116258923A CN116258923A CN202211680934.5A CN202211680934A CN116258923A CN 116258923 A CN116258923 A CN 116258923A CN 202211680934 A CN202211680934 A CN 202211680934A CN 116258923 A CN116258923 A CN 116258923A
- Authority
- CN
- China
- Prior art keywords
- image recognition
- model
- task
- initial
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取至少两个图像识别任务对应的任务训练集、任务测试集;基于各个任务训练集训练初始图像识别模型得到各个中间模型;基于图像识别任务对应的任务测试集和中间模型得到各个中间模型损失;基于中间模型损失调整中间模型的初始模型参数得到各个中间模型参数;基于各个中间模型参数和初始模型参数调整初始模型参数得到目标模型参数;基于目标模型参数得到更新模型,将更新模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件得到目标模型。采用本方法能够提高图像识别准确性。
Description
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种图像识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机视觉技术的发展,出现了图像识别技术,通过训练好的图像识别模型对图像进行识别操作。
传统的图像识别技术往往是通过使用大量的训练样本对深度学习网络进行训练,得到图像识别模型。然而对于种类繁多但同类样本数量较少的少样本识别任务,基于传统的图像识别模型训练方法效果训练得到的图像识别模型,往往难以取得最佳的识别效果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高图像识别准确性的图像识别模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种图像识别模型训练方法。所述方法包括:
获取至少两个图像识别任务分别对应的任务训练集、任务测试集;至少两个图像识别任务用于识别图像中的目标对象;
基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型;
基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失;
基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数;
基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数;
基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
本申请还提供了一种图像识别模型训练装置。所述装置包括:
任务数据集获取模块,用于获取至少两个图像识别任务分别对应的任务训练集、任务测试集;至少两个图像识别任务用于识别图像中的目标对象。
中间模型确定模块,用于基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型。
中间损失确定模块,用于基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。
中间参数确定模块,用于基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。
目标参数确定模块,用于基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。
目标模型确定模块,用于基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述图像识别模型训练方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图像识别模型训练方法的步骤。
一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述图像识别模型训练方法的步骤。
上述图像识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品,通过获取至少两个图像识别任务分别对应的任务训练集、任务测试集,不同的图像识别任务分别用于识别不同类型的图像中的目标对象。使用各个任务训练集分别训练初始图像识别模型,得到各个中间图像识别模型。再基于同一图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。基于各个中间模型损失分别调整对应的中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。目标模型参数融合了各个图像识别任务分别对应的中间模型参数,这样可以使得目标模型参数能够在各个图像识别任务上都表现较好,能够适用于各个图像识别任务。基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。这样,使用各个图像识别任务分别对应的中间模型参数来更新模型参数,能够使得目标图像识别模型能够在各个图像识别任务上都具有很好的识别效果,有效提高图像识别模型的识别准确性。
附图说明
图1为一个实施例中图像识别模型训练方法的应用环境图;
图2为一个实施例中图像识别模型训练方法的流程示意图;
图3为一个实施例中确定目标图像识别模型的流程示意图;
图4为另一个实施例中图像识别模型训练方法的流程示意图;
图5为一个实施例中基于目标能量值更新目标图像识别模型的示意图;
图6为一个实施例中图像识别模型训练装置的结构框图;
图7为另一个实施例中图像识别模型训练装置的结构框图;
图8为一个实施例中计算机设备的内部结构图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的图像识别模型训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能电视、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
终端和服务器均可单独用于执行本申请实施例中提供的图像识别模型训练方法。
例如,终端获取至少两个图像识别任务分别对应的任务训练集、任务测试集,至少两个图像识别任务用于识别图像中的目标对象。终端基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型。终端基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。终端基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。终端基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。终端基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
终端和服务器也可协同用于执行本申请实施例中提供的图像识别模型训练方法。
例如,服务器从终端获取至少两个图像识别任务分别对应的任务训练集、任务测试集,至少两个图像识别任务用于识别图像中的目标对象。服务器基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型。服务器基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。服务器基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。服务器基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。服务器基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。服务器可以将目标图像识别模型发送至终端,终端基于目标图像识别模型进行图像识别。服务器也可以获取终端发送的图像,基于目标图像识别模型对图像进行识别,将识别结果发送至终端。
在一个实施例中,如图2所示,提供了一种图像识别模型训练方法,以该方法应用于计算机设备为例进行说明,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。图像识别模型训练方法包括以下步骤:
步骤S202,获取至少两个图像识别任务分别对应的任务训练集、任务测试集;至少两个图像识别任务用于识别图像中的目标对象。
其中,图像识别任务用于识别属于某一图像类型的图像中的目标对象,不同的图像识别任务用于识别属于不同图像类型的图像中的目标对象,例如,当图像识别模型为用于识别不同电力设备的模型时,可以根据电力设备的结构复杂程度将各个电力设备划分为三种类型,分别为高复杂度、中复杂度和低复杂度,进而将采集到的各个电力设备图像,根据图像中电力设备所属的类型将各个电力设备图像划分为三种图像类型,每种图像类型对应一种图像识别任务,得到三种图像识别任务,分别为用于识别高复杂度电力设备的图像识别任务、用于识别中复杂度电力设备的图像识别任务和用于识别低复杂度电力设备的图像识别任务。
任务训练集是指图像识别任务对应的用于训练图像识别模型的图像集,任务训练集中的图像均为已知目标对象的图像,并且任务训练集中的各个图像为属于图像识别任务对应的图像类型的图像,例如,对于用于识别中复杂度电力设备的图像识别任务,图像识别任务对应的任务训练集中的各个电力设备图像均为中复杂度电力设备的图像。
任务测试集是指图像识别任务对应的用于测试图像识别模型的图像集,任务测试集中的图像均为已知目标对象的图像,并且任务测试集中的各个图像可以为属于任何图像类型的图像,例如,对于用于识别中复杂度电力设备的图像识别任务,图像识别任务对应的任务测试集中的各个电力设备图像包括高复杂度电力设备的图像、中复杂度电力设备的图像和低复杂度电力设备的图像中的至少一种。
目标对象是指图像识别模型的识别对象,例如,对于用于识别电力设备的图像识别模型,目标对象为图像中的电力设备;对于用于识别植物的图像识别模型,目标对象为图像中的植物;等等。
示例性地,计算机设备获取初始图像识别模型对应的各个图像识别任务,并获取各个图像识别任务分别对应的任务训练集和任务测试集,基于各个图像识别任务分别对应的任务训练集和任务测试集来训练初始图像识别模型,得到目标图像识别模型,目标图像识别模型可以用于识别图像中的目标对象。
步骤S204,基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型。
其中,初始图像识别模型是指还未经过模型训练的图像识别模型或还未完成模型训练的图像识别模型,用于识别图像中的目标对象,图像识别模型的输入数据为图像,输出数据为目标对象识别结果。
示例性地,计算机设备将单个图像识别任务对应的任务训练集输入初始图像识别模型得到图像识别任务对应的中间图像识别模型。例如,任务训练集中的各个图像均为已知图像中目标对象的图像,将任务训练集中的各个图像输入初始图像识别模型,得到各个图像分别对应的识别结果,基于各个图像分别对应的目标对象和识别结果之间的差异得到模型损失,基于模型损失得到模型梯度,基于模型梯度调整初始图像识别模型中的初始模型参数,从而得到图像识别任务对应的中间图像识别模型。基于相同的方法,得到其他各个图像识别任务分别对应的中间图像识别模型,进而得到各个图像识别任务分别对应的中间图像识别模型。
步骤S206,基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。
示例性地,计算机设备将单个图像识别任务对应的任务测试集输入该图像识别任务对应的中间图像识别模型,得到相应的模型损失,将模型损失作为该图像识别任务对应的中间模型损失。例如,任务测试集中的各个图像均为已知图像中目标对象的图像,将任务测试集中的各个图像输入中间图像识别模型,得到各个图像分别对应的识别结果,基于各个图像分别对应的目标对象和识别结果之间的差异得到模型损失,将模型损失作为中间模型损失。基于相同的方法,得到其他各个图像识别任务分别对应的中间模型损失,进而得到各个图像识别任务分别对应的中间模型损失。
步骤S208,基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。
其中,中间图像识别模型的初始模型参数是指在基于中间模型损失调整中间图像识别模型的模型参数之前,中间图像识别模型对应的模型参数。
示例性地,计算机设备基于单个图像识别任务对应的中间模型损失,调整对应的中间图像识别模型的初始模型参数,得到更新后的模型参数,将更新后的模型参数作为图像识别任务对应的中间模型参数。例如,对单个图像识别任务对应的中间模型损失求梯度,得到对应的更新梯度,基于更新梯度调整图像识别任务对应的中间图像识别模型的初始模型参数,得到中间模型参数。基于相同的方法,得到其他各个图像识别任务分别对应的中间模型参数,进而得到各个图像识别任务分别对应的中间模型参数。
步骤S210,基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。
其中,初始图像识别模型的初始模型参数是指在对初始图像识别模型进行模型参数调整之前,初始图像识别模型的模型参数。
示例性地,计算机设备基计算各个中间模型参数分别与初始图像识别模型的初始模型参数之间的差异,融合各个初始模型参数之间的差异得到对应的融合结果,并基于融合结果对初始图像识别模型的初始模型参数进行调整,得到目标模型参数。
步骤S212,基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
其中,收敛条件是指用于判断图像识别模型是否完成模型训练的条件,可以根据实际需要进行设置。目标图像识别模型是指训练完成的图像识别模型,用于识别图像中的目标对象。
示例性地,计算机设备将初始图像识别模型中的初始模型参数更新为目标模型参数得到更新图像识别模型,判断此时是否满足收敛条件。若满足收敛条件,则将更新图像识别模型作为目标图像识别模型,若还未满足收敛条件,则将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,继续对图像识别模型进行训练,直至满足收敛条件,则将当前的更新图像识别模型作为目标图像识别模型。
在一个实施例中,收敛条件可以根据模型训练轮次进行设置。例如,将收敛条件设置为训练轮次是否达到100轮,若当前训练轮次达到100轮时,则将当前的更新图像识别模型作为目标图像识别模型,若当前训练轮次未达到100轮时,则将更新图像识别模型作为初始图像识别模型,继续进行模型训练,直至满足收敛条件。
上述图像识别模型训练方法中,通过获取至少两个图像识别任务分别对应的任务训练集、任务测试集,不同的图像识别任务分别用于识别不同类型的图像中的目标对象。使用各个任务训练集分别训练初始图像识别模型,得到各个中间图像识别模型。再基于同一图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。基于各个中间模型损失分别调整对应的中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。目标模型参数融合了各个图像识别任务分别对应的中间模型参数,这样可以使得目标模型参数能够在各个图像识别任务上都表现较好,能够适用于各个图像识别任务。基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。这样,使用各个图像识别任务分别对应的中间模型参数来更新模型参数,能够使得目标图像识别模型能够在各个图像识别任务上都具有很好的识别效果,有效提高图像识别模型的识别准确性。
在一个实施例中,获取至少两个图像识别任务分别对应的任务训练集、任务测试集,包括:
获取目标对象对应的多个图像样本;基于图像样本中的目标对象的对象复杂度,将各个图像样本划分为多个第一图像类别;基于图像样本对应的图像质量,将各个第一图像类别分别划分为多个第二图像类别;将各个图像样本划分为总训练集和总测试集;从总训练集中,基于属于同一第二图像类别的图像样本得到对应的图像识别任务的任务训练集;从总测试集中,获取各个图像识别任务分别对应的任务测试集。
其中,图像样本是指包含目标对象的图像,且图像样本中的目标对象是已知的。对象复杂度是指目标对象的复杂程度,例如,复杂程度可以是目标对象的结构复杂度、外观复杂度等。第一图像类别是指基于对象复杂度对各个图像样本进行划分得到的各个类别,例如,当目标对象为电力设备时,基于电力设备的结构复杂度对各个图像样本进行划分,得到高复杂度、中复杂度和低复杂度三个第一图像类别。
图像质量是指图像样本的质量,用于评价图像样本对应的目标对象识别难易程度,图像质量可以从图片清晰度、图片中背景复杂度等方面来衡量。第二图像类别是指基于图像质量对各个第一图像类别进行划分得到的各个类别,例如,当存在三个第一图像类别时,基于图像质量确定三个图像质量等级,分别为高图像质量、中图像质量和低图像质量,基于图像质量等级将每个第一图像类别划分为三个第二图像类别,最终得到9个第二图像类别。
总训练集是指由各个训练样本组成的图像集,用于确定各个任务训练集。
总测试集是指由各个测试样本组成的图像集,用于确定各个任务测试集。
示例性地,获取目标对象对应的多个图像样本。例如,当图像识别模型为用于识别不同植物的模型时,目标对象为各种植物,图像样本为包含植物的图像,各个图像样本分别包含的植物可以是相同的也可以是不同的。基于图像样本中目标对象的对象复杂度,将各个图像样本划分为多个第一图像类别。进一步地,基于各个图像样本分别对应的图像质量,将各个第一图像类别划分为多个第二图像类别。例如,当图像识别模型为用于识别不同电力设备的模型时,目标对象为各种电力设备,根据电力设备的结构复杂度,将各个图像样本划分为5个第一图像类别,进而基于各个图像样本分别对应的图像清晰度、背景复杂度等信息,确定各个图像样本分别对应的图像质量,基于图像质量,将各个第一图像类别分别划分为5个第二图像类别,得到25个第二图像类别。
计算机设备将各个图像样本按照预设比例划分为总训练集和总测试集。例如,当图像样本总数量为100时,按照8:2的预设比例将各个图像样本划分为总训练集和总测试集,总训练集中的图像样本数量为80,总测试集中的图像样本数量为20。在总训练集中,确定属于同一第二图像类别的各个图像样本,得到该第二图像类别对应的任务训练集,基于相同的方法得到其他各个第二图像类别分别对应的任务训练集,进而得到各个第二图像类别分别对应的任务训练集。在总测试集中,将总测试集中的各个图像样本划分为各个图像任务分别对应的任务测试集。
上述实施例中,根据对象复杂度和图像质量将目标对象对应的多个图像样本划分为多个第二图像类别,每个第二类别分别对应一种图像识别任务。将各个图像样本划分为总训练集和总测试集,在总训练集中确定各个图像识别任务分别对应的任务训练集,任务训练集中的图像均为属于图像识别任务对应的第二图像类别的图像,使用各个图像识别任务分别对应的任务训练集训练初始图像识别模型,可以使得图像识别模型能够在各个图像识别任务上都具有较高的识别准确性。而任务测试集中的图像不属于同一第二图像类别,可以为属于任何图像类型的图像,使用各个任务测试集分别去测试各个任务训练集的训练效果,得到各个图像识别任务分别对应的模型损失,这样得到的各个模型损失能够更全面地反应各个任务训练集在整体上的训练效果,基于各个模型损失对模型参数进行更新,可以有效提高图像识别模型的识别准确性。
在一个实施例中,初始模型参数包括初始权重和初始偏移量,基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数,包括:
将当前图像识别任务对应的中间模型损失作为当前模型损失,获取任务权重学习率和任务偏移量学习率;基于任务权重学习率调整当前模型损失对应的损失梯度,得到任务权重更新梯度,基于任务偏移量学习率调整当前模型损失对应的损失梯度,得到任务偏移量更新梯度;基于任务权重更新梯度更新初始权重,得到中间权重,基于任务偏移量更新梯度更新初始偏移量,得到中间偏移量;基于中间权重和中间偏移量,得到当前图像识别任务对应的中间模型参数。
其中,初始权重是指初始模型参数中属于权重类型的各个参数。初始偏移量是指初始模型参数中属于偏移量类型的各个参数。
任务权重学习率是指用于确定每次迭代中任务权重更新步长的模型超参数,能够表征任务权重的收敛速度。任务偏移量学习率是指用于确定每次迭代中任务偏移量更新步长的模型超参数,能够表征任务偏移量的收敛速度。
损失梯度是指基于当前模型损失确定的模型参数更新梯度。
示例性地,计算机设备将各个图像识别任务中的任意一个图像识别任务作为当前图像识别任务,将当前图像识别任务对应的中间模型损失作为当前模型损失,计算当前模型损失对应的损失梯度。获取任务权重学习率和任务偏移量学习率,基于任务权重学习率调整损失梯度得到任务权重更新梯度,基于任务偏移量学习率调整损失梯度得到任务偏移量更新梯度。基于任务权重更新梯度调整当前图像识别任务对应的中间图像识别模型的初始权重,得到当前图像识别任务对应的中间权重,基于任务偏移量更新梯度调整当前图像识别任务对应的中间图像识别模型的初始偏移量,得到当前图像识别任务对应的中间偏移量,中间权重和中间偏移量即为当前图像识别任务对应的中间模型参数。
在一个实施例中,可以通过以下公式计算图像识别任务对应的中间模型参数:
其中,j为图像识别模型当前已完成的训练轮次,ωj为图像识别任务在第j+1轮训练过程中对应的中间图像识别模型的初始权重,αj为图像识别任务在第j+1轮训练过程中对应的中间图像识别模型的初始偏移量,ωj+1为图像识别任务在第j+1轮训练过程中对应的中间权重,αj+1为图像识别任务在第j+1轮训练过程中对应的中间偏移量,λtask为任务权重学习率,ξtask为任务偏移量学习率,Ti为第i个图像识别任务,为第i个图像识别任务在第j+1轮训练过程中对应的任务训练集,/>为任务学习算法,即使用各个图像识别任务分别对应的任务训练集来训练图像识别模型,/>为第i个图像识别任务在第j+1轮训练过程中对应的中间模型损失,/>为第i个图像识别任务在第j+1轮训练中对应的损失梯度,/>为第i个图像识别任务在第j+1轮训练过程中对应的任务权重更新梯度,/>为第i个图像识别任务在第j+1轮训练过程中对应的任务偏移量更新梯度。
上述实施例中,获取当前图像识别任务对应的任务权重学习率和任务偏移量学习率,基于任务权重学习率调整当前模型损失对应的损失梯度得到任务权重更新梯度,基于任务权重更新梯度更新初始权重得到中间权重。基于任务偏移量学习率调整当前模型损失对应的损失梯度得到任务偏移量更新梯度,基于任务偏移量更新梯度更新初始权重得到中间偏移量。中间权重和中间偏移量为针对当前图像识别任务的模型参数,基于当前图像任务对应的中间权重和中间偏移量调整模型参数,能够使得图像识别模型在当前图像识别任务上的识别准确率得到保证。
在一个实施例中,初始模型参数包括初始权重和初始偏移量,中间模型参数包括中间权重和中间偏移量,基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数,包括:
获取综合权重学习率和综合偏移量学习率;基于综合权重学习率,融合各个中间权重分别和初始权重之间的差异,得到融合权重,基于融合权重和初始权重,得到目标权重;基于综合偏移量学习率,融合各个中间偏移量分别和初始偏移量之间的差异,得到融合偏移量,基于融合偏移量和初始偏移量,得到目标偏移量;基于目标权重和目标偏移量,得到目标模型参数。
其中,综合权重学习率是指用于确定每次迭代中初始权重更新步长的模型超参数,能够表征初始权重的收敛速度。综合偏移量学习率是指用于确定每次迭代中初始偏移量更新步长的模型超参数,能够表征初始偏移量的收敛速度。目标权重是指目标模型参数中属于权重类型的各个参数。目标偏移量是指目标模型参数中属于偏移量类型的各个参数。
示例性地,计算机设备获取图像识别模型对应的综合权重学习率和综合偏移量学习率。融合各个中间权重分别和初始权重之间的差异得到第一融合结果,基于综合权重学习率调整第一融合结果得到融合权重,融合初始权重和融合权重得到目标权重。融合各个中间偏移量分别和初始偏移量之间的差异得到第二融合结果,基于综合偏移量学习率调整第二融合结果得到融合偏移量,融合初始偏移量和融合偏移量得到目标偏移量。目标权重和目标偏移量即为目标模型参数。
在一个实施例中,可以通过以下公式计算图像识别任务对应的中间模型参数:
其中,i为图像识别模型当前已完成的训练轮次,为在第i+1轮训练过程中,初始图像识别模型对应的初始权重,/>为在第i+1轮训练过程中,初始图像识别模型对应的初始偏移量,/>为在第i+1轮训练过程中,初始图像识别模型对应的目标权重,为在第i+1轮训练过程中,初始图像识别模型对应的目标偏移量,ptrain为由图像识别模型的各个图像识别任务分别对应的训练集和测试集组成的图像集,φk为第k次利用梯度下降算法更新图像识别模型中的综合权重学习率和综合偏移量学习率,即使用各个图像识别任务分别对应的任务训练集来训练图像识别模型,/>为参数更新算法,λmeta为综合权重学习率,ξmeta为综合偏移量学习率,/>为在第i+1轮训练过程中,第i个图像识别任务对应的中间权重,/>为在第i+1轮训练过程中,第i个图像识别任务对应的中间偏移量,/>为在第i+1轮训练过程中,图像识别模型对应的融合权重,/>为在第i+1轮训练过程中,图像识别模型对应的融合偏移量。
上述实施例中,基于综合权重学习率,融合各个中间权重分别与初始权重之间的差异,得到融合权重,基于融合权重和初始权重得到目标权重。融合各个图像识别任务分别对应的中间权重得到目标权重,能够使得目标权重在各个图像识别任务上都具有较好的表现。基于综合偏移量学习率,融合各个中间偏移量分别与初始偏移量之间的差异,得到融合偏移量,基于融合偏移量和初始偏移量得到目标偏移量。融合各个图像识别任务分别对应的中间偏移量得到目标偏移量,能够使得目标偏移量在各个图像识别任务上都具有较好的表现。使用目标权重和目标偏移量更新初始图像识别模型中的模型参数,能够使得图像识别模型在各个图像识别任务上都具有较高的识别准确性。
在一个实施例中,基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型,包括:
步骤S302,融合各个中间模型损失,得到目标模型损失。
步骤S304,当目标模型损失满足收敛条件时,将更新图像识别模型作为目标图像识别模型。
步骤S306,当目标模型损失不满足收敛条件时,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
示例性地,计算机设备融合各个中间模型损失得到目标模型损失,例如,可以将各个中间模型损失之和作为目标模型损失。判断目标模型损失是否满足收敛条件,当目标模型损失满足收敛条件时,即目标模型损失小于预设阈值时,将更新图像识别模型作为目标图像识别模型,当目标模型损失不满足收敛条件时,即目标模型损失大于或等于预设阈值时,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至目标模型损失满足收敛条件,将更新图像识别模型作为目标图像识别模型。
上述实施例中,融合各个中间模型损失得到目标模型损失,基于目标模型损失判断模型是否收敛,当目标模型损失满足收敛条件时,将更新图像识别模型作为目标图像识别模型,当目标模型损失不满足收敛条件时,继续训练图像识别模型,直至目标模型损失满足收敛条件,得到目标图像识别模型。当目标模型损失满足收敛时,将更新图像识别模型作为目标图像识别模型,能够使得目标图像识别模型的识别准确性达到最佳。
在一个实施例中,图像识别模型训练方法还包括:
获取目标图像识别模型中各个相邻网络层之间的连接关系对应的初始能量值,获取初始温度和初始温度下降梯度;随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值;基于初始温度下降梯度调整初始温度,得到当前温度;将各个当前能量值分别作为对应的初始能量值,将当前温度作为初始温度,返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足迭代条件,得到各个目标能量值;基于各个目标能量值,更新目标图像识别模型中各个相邻网络层之间的连接关系,得到参考图像识别模型;获取参考测试集,基于参考测试集和参考图像识别模型,得到参考模型损失;当参考模型损失小于预设阈值时,将参考图像识别模型作为最终的目标图像识别模型;当参考模型损失大于或等于预设阈值时,下调初始温度下降梯度得到更新温度下降梯度,并获取目标图像识别模型中各个相邻网络层之间的连接关系对应的更新能量值和更新温度;将更新温度下降梯度作为初始温度下降梯度,将各个更新能量值分别作为对应的初始能量值,将更新温度作为初始温度;返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足结束条件,将参考图像识别模型作为最终的目标图像识别模型。
其中,网络层是指图像识别模型对应的图像识别网络中的用于进行数据处理的各个数据处理层。相邻网络层是指相互连接的两个网络层,包括前网络层和后网络层,前网络层的输出数据输入后网络层,后网络层接收前网络层的输出数据并进行相应的数据处理,得到相应的输出数据后,后网络层将该输出数据输入自身连接的下一个网络层。相邻网络层之间的连接关系是指相邻网络层之间的数据传输关系。
能量值是指相邻网络层之间的连接关系的权重,用于表征相邻网络层之间传输的数据的重要程度。初始能量值是指相邻网络层之间的连接关系对应的初始权重,初始能量值是随机生成的。初始温度是指预先设定的温度值,初始温度下降梯度是指预先设定的温度下降梯度,基于初始温度和初始温度下降梯度,可以确定能量值的更新次数。
更新能量值是再次获取的相邻网络层之间的连接关系对应的初始权重。更新温度是指再次获取预设的温度值,更新温度可以与初始温度相同,也可以与初始温度不同。
扰动值是随机生成的数值,用于更新初始能量值。迭代条件是指用于判断能量值更新过程是否结束的条件。参考测试集是指用于评估参考图像识别模型的图像识别效果的图像集,参考测试集中的图像均为已知目标对象的图像。结束条件是指判断参考图像识别模型能否作为最终的目标图像识别模型的条件,即基于参考测试集和参考图像识别模型得到的参考模型损失小于预设阈值。
示例性地,计算机设备获取目标图像识别模型中各个相邻网络层之间的连接关系分别对应的初始能量值,获取初始温度和初始温度下降梯度。对于每一个连接关系对应的初始能量值,随机生成对应的扰动值,基于各个扰动值分别更新对应初始能量值得到各个当前能量值。接着计算初始温度与初始温度下降梯度之间的差值,将差值作为当前温度。
此时,判断是否满足迭代条件,即判断当前温度是否小于0,当当前温度小于0时,则满足迭代条件,当当前温度大于或等于0时,则不满足迭代条件。不满足迭代条件时,将各个当前能量值分别作为对应的初始能量值,将当前温度作为初始温度,返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足迭代条件。满足迭代条件时,则将各个当前能量值作为对应的目标能量值。
基于各个目标能量值,更新目标图像识别模型中的各个相邻网络层之间的连接关系,得到参考图像识别模型。例如,当相邻网络层之间的连接关系对应的目标能量值为0时,则表明该相邻网络层之间传输的数据的重要程度极低,可以将该连接关系视为断开,具体地,给相邻网络层中前网络层输入到后网络层中的数据赋予相应的权重,权重即为相邻网络层的连接关系对应的目标能量值,也就是,从前网络层输入到后网络层的数据都需要乘以相应的目标能量值0,因此,该相邻网络层之间传输的数据始终为0;当相邻网络层之间的连接关系对应的目标能量值为1时,则表明该相邻网络层之间传输的数据的重要程度极高,可以视为无需对该连接关系进行更新,也就是,从前网络层输入到后网络层的数据都需要乘以相应的目标能量值1,因此,该相邻网络层之间传输的数据保持不变;当相邻网络层之间的连接关系对应的目标能量值为0.5时,则表明该相邻网络层之间传输的数据的重要程度降低了,也就是从前网络层输入到后网络层的数据都需要乘以相应的目标能量值0.5,因此,该相邻网络层之间传输的数据减小了;等等。
获取参考图像识别模型对应的参考测试集,将参考测试集输入参考图像识别模型,得到相应的模型损失,将模型损失作为该参考图像识别模型对应的参考模型损失。例如,参考测试集中的各个图像均为已知图像中目标对象的图像,将参考测试集中的各个图像输入参考图像识别模型,得到各个图像分别对应的识别结果,基于各个图像分别对应的目标对象和识别结果之间的差异,得到模型损失,将模型损失作为参考模型损失。当参考模型损失小于预设阈值时,则将参考图像识别模型作为最终的目标图像识别模型,当参考模型损失大于或等于预设阈值时,下调初始温度下降梯度得到更新温度下降梯度,并重新获取目标图像识别模型中各个向量网络层之间的连接关系分别对应的更新能量值和更新温度,将各个更新能量值分别作为对应的初始能量值,将更新温度作为初始温度,返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足结束条件,即参考模型损失小于预设阈值时,将参考图像识别模型作为最终的目标图像识别模型。
上述实施例中,给目标图像识别模型中各个相邻网络层之间的连接关系对应的初始能量值,基于随机生成的扰动值不断更新各个初始能量值,直至当前温度小于0,得到各个目标能量值。基于各个目标能量值更新目标模型参数中各个相邻网络层之间的连接关系,得到参考图像识别模型,基于参考测试集确定参考图像识别模型的参考模型损失,当参考模型损失小于预设阈值时,将参考图像识别模型作为最终的目标图像识别模型,当参考模型损失大于或等于预设阈值时,重新获取各个连接关系分别对应的初始能量值,再次对各个初始能量值进行迭代更新,直至参考模型损失小于预设阈值,得到最终的目标图像识别模型。这样,使用各个目标能量值更新目标图像识别模型中的各个相邻网络层之间的连接关系,能够简化最终的目标图像识别模型中的各个网络层之间的连接关系,降低图像识别模型运行时的计算量,同时减小图像识别模型运行时的内存占用,能够有效节省计算机资源,同时也能够保证图像识别的准确性。
在一个具体的实施例中,本申请的图像识别模型训练方法可以用于识别图像中的电力设备。图像识别模型训练方法包括以下步骤:
1、获取图像样本
计算机设备采集不同地理场景下的电力设备图像,标明各个电力设备图像中的电力设备信息。根据电力设备复杂度,将个电力设备图像划分为5个第一图像类别,再根据图像的背景复杂度与图像清晰度,将各个第一图像类别分别划分为5个第二图像类别,形成25个图像识别任务。
计算机设备将各个电力设备图像划分为总训练集和总测试集,从总训练集中确定各个图像识别任务分别对应的任务训练集,从总测试集中确定各个图像识别任务分别对应的任务测试集。
2、训练图像识别模型
确定初始图像识别模型,例如,可以选择yolo(You Only Look Once)网络作为图像识别模型,yolo网络中包括用于进行特征提取的卷积层,以及用于预测目标对象在图像中的位置和类别的全连接层,将电力设备图像输入yolo网络即可快速得到电力设备在图像中的位置与电力设备信息。
搭建图像识别模型对应的损失函数(即元目标函数):
其中,Lmeta(ω,5,ptrain,φk)为在当前训练轮次对应的模型训练过程中,图像识别模型对应的目标模型损失,为在当前训练轮次对应的模型训练过程中,第i个图像识别任务对应的中间模型损失,/>为在当前训练轮次对应的模型训练过程中,第i个图像识别任务对应的任务测试集,/>为在当前训练轮次对应的模型训练过程中,第i个图像识别任务对应的初始权重,/>为在当前训练轮次对应的模型训练过程中,第i个图像识别任务对应的初始偏移量。
基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型,基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取各个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
3、确定目标能量值
计算机设备获取目标图像识别模型中各个相邻网络层之间的连接关系对应的初始能量值,获取初始温度和初始温度下降梯度。随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到中间能量值,对中间能量值进行归一化得到当前能量值。
计算机设备可以通过以下公式对能量值进行归一化:
其中,o为网络层i与网络层j之间的连接关系,o′为除网络层i与网络层j之间的连接关系之外的,任意一个其他相邻网络层之间的连接关系,Ο为由目标图像识别模型中各个相邻网络层之间的连接关系组成的集合,为网络层i与网络层j之间的连接关系对应的中间能量值,/>为除网络层i与网络层j之间的连接关系之外的,任意一个其他相邻网络层之间的连接关系对应的中间能量值,τα为初始温度,/>为网络层i与网络层j之间的连接关系对应的当前能量值,即归一化后的能量值。
基于初始温度下降梯度调整初始温度,得到当前温度。将各个当前能量值分别作为对应的初始能量值,将当前温度作为初始温度,返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足迭代条件,得到各个目标能量值。基于各个目标能量值,更新目标图像识别模型中各个相邻网络层之间的连接关系,得到参考图像识别模型;获取参考测试集,基于参考测试集和参考图像识别模型,得到参考模型损失。当参考模型损失小于预设阈值时,将参考图像识别模型作为最终的目标图像识别模型。当参考模型损失大于或等于预设阈值时,下调初始温度下降梯度得到更新温度下降梯度,并获取目标图像识别模型中各个相邻网络层之间的连接关系对应的更新能量值和更新温度。将更新温度下降梯度作为初始温度下降梯度,将各个更新能量值分别作为对应的初始能量值,将更新温度作为初始温度。返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足结束条件,将参考图像识别模型作为最终的目标图像识别模型。最终的目标图像识别模型可应用到实际电力设备识别场景中进行电力设备识别。
上述实施例中,如图4所示,每一轮的模型训练过程均可划分为任务学习和元学习两个部分,首先,基于各个图像识别任务对应的任务训练集和任务测试集对图像识别模型进行训练,得到各个图像识别任务分别对应的中间模型损失(即任务损失)。接着,基于各个中间模型损失更新中间图像识别模型的初始权重和初始偏移量(即任务权重和任务偏移量),得到各个图像识别任务分别对应的中间权重和中间偏移量。进一步地,基于各个图像识别任务分别对应的中间权重和中间偏移量,更新初始图像识别模型中的初始权重和初始偏移量(即元权重和元偏移量),得到初始图像识别模型对应的目标权重和目标偏移量。最后,计算目标模型损失(即元损失),基于目标模型损失判断是否满足收敛条件,当满足收敛条件时,则完成模型训练,当不满足收敛条件时,继续进行下一轮的模型训练。每一轮的模型训练均可以视为模型结构搜索,也就是更新初始图像识别模型中的初始模型参数,逐步提高图像识别模型的识别准确性。由于电力设备图像具有背景复杂多变,种类多,但是单类样本数量少,类内差异性大的特点,使用本方案中的元学习算法,可以通过利用单个图像识别任务内的不同电力设备图像样本,逐层优化模型参数,使得图像识别模型对于每一个图像识别任务都具有良好的适应性。在单类样本数量少,类内差异性大的情况下,也能够使得图像识别模型的具有较高的图像识别准确性。此外,如图5所示,图中元学习得到的架构即为目标图像识别模型,目标图像识别模型中包含4个网络层,分别为网络层0、网络层1、网络层2和网络层3,图中的箭头即为相邻网络层之间的连接关系,通过更新目标图像识别模型(元学习得到的架构)中的各个相邻网络层之间的连接关系分别对应的能量值,能够实现模型软剪枝操作(即任务适应),得到最终的目标图像识别模型,使得图像识别模型运行时的计算量大大降低,节省计算机资源。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的图像识别模型训练方法的图像识别模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个图像识别模型训练装置实施例中的具体限定可以参见上文中对于图像识别模型训练方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种图像识别模型训练装置,包括:任务数据集获取模块602、中间模型确定模块604、中间损失确定模块606、中间参数确定模块608、目标参数确定模块610和目标模型确定模块612,其中:
任务数据集获取模块602,用于获取至少两个图像识别任务分别对应的任务训练集、任务测试集;至少两个图像识别任务用于识别图像中的目标对象。
中间模型确定模块604,用于基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型。
中间损失确定模块606,用于基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。
中间参数确定模块608,用于基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。
目标参数确定模块610,用于基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。
目标模型确定模块612,用于基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
上述图像识别模型训练装置,通过获取至少两个图像识别任务分别对应的任务训练集、任务测试集,不同的图像识别任务分别用于识别不同类型的图像中的目标对象。使用各个任务训练集分别训练初始图像识别模型,得到各个中间图像识别模型。再基于同一图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失。基于各个中间模型损失分别调整对应的中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数。基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数。目标模型参数融合了各个图像识别任务分别对应的中间模型参数,这样可以使得目标模型参数能够在各个图像识别任务上都表现较好,能够适用于各个图像识别任务。基于目标模型参数得到更新图像识别模型,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。这样,使用各个图像识别任务分别对应的中间模型参数来更新模型参数,能够使得目标图像识别模型能够在各个图像识别任务上都具有很好的识别效果,有效提高图像识别模型的识别准确性。
在一个实施例中,任务数据集获取模块602还用于:
获取目标对象对应的多个图像样本;基于图像样本中的目标对象的对象复杂度,将各个图像样本划分为多个第一图像类别;基于图像样本对应的图像质量,将各个第一图像类别分别划分为多个第二图像类别;将各个图像样本划分为总训练集和总测试集;从总训练集中,基于属于同一第二图像类别的图像样本得到对应的图像识别任务的任务训练集;从总测试集中,获取各个图像识别任务分别对应的任务测试集。
在一个实施例中,中间参数确定模块608还用于:
将当前图像识别任务对应的中间模型损失作为当前模型损失,获取任务权重学习率和任务偏移量学习率;基于任务权重学习率调整当前模型损失对应的损失梯度,得到任务权重更新梯度,基于任务偏移量学习率调整当前模型损失对应的损失梯度,得到任务偏移量更新梯度;基于任务权重更新梯度更新初始权重,得到中间权重,基于任务偏移量更新梯度更新初始偏移量,得到中间偏移量;基于中间权重和中间偏移量,得到当前图像识别任务对应的中间模型参数。
在一个实施例中,目标参数确定模块610还用于:
获取综合权重学习率和综合偏移量学习率;基于综合权重学习率,融合各个中间权重分别和初始权重之间的差异,得到融合权重,基于融合权重和初始权重,得到目标权重;基于综合偏移量学习率,融合各个中间偏移量分别和初始偏移量之间的差异,得到融合偏移量,基于融合偏移量和初始偏移量,得到目标偏移量;基于目标权重和目标偏移量,得到目标模型参数。
在一个实施例中,目标模型确定模块612还用于:
融合各个中间模型损失,得到目标模型损失;当目标模型损失满足收敛条件时,将更新图像识别模型作为目标图像识别模型;当目标模型损失不满足收敛条件时,将更新图像识别模型作为初始图像识别模型,返回获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
在一个实施例中,如图7所示,图像识别模型训练装置还包括:
目标模型优化模块702,用于获取目标图像识别模型中各个相邻网络层之间的连接关系对应的初始能量值,获取初始温度和初始温度下降梯度;随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值;基于初始温度下降梯度调整初始温度,得到当前温度;将各个当前能量值分别作为对应的初始能量值,将当前温度作为初始温度,返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足迭代条件,得到各个目标能量值;基于各个目标能量值,更新目标图像识别模型中各个相邻网络层之间的连接关系,得到参考图像识别模型;获取参考测试集,基于参考测试集和参考图像识别模型,得到参考模型损失;当参考模型损失小于预设阈值时,将参考图像识别模型作为最终的目标图像识别模型;当参考模型损失大于或等于预设阈值时,下调初始温度下降梯度得到更新温度下降梯度,并获取目标图像识别模型中各个相邻网络层之间的连接关系对应的更新能量值和更新温度;将更新温度下降梯度作为初始温度下降梯度,将各个更新能量值分别作为对应的初始能量值,将更新温度作为初始温度;返回随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足结束条件,将参考图像识别模型作为最终的目标图像识别模型。
上述图像识别模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储任务训练集、任务测试集、中间模型损失等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别模型训练方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种图像识别模型训练方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8、9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像识别模型训练方法,其特征在于,所述方法包括:
获取至少两个图像识别任务分别对应的任务训练集、任务测试集;所述至少两个图像识别任务用于识别图像中的目标对象;
基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型;
基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失;
基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数;
基于各个中间模型参数分别和所述初始图像识别模型的初始模型参数之间的差异,调整所述初始图像识别模型的初始模型参数,得到目标模型参数;
基于目标模型参数得到更新图像识别模型,将所述更新图像识别模型作为初始图像识别模型,返回所述获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
2.根据权利要求1所述的方法,其特征在于,所述获取至少两个图像识别任务分别对应的任务训练集、任务测试集,包括:
获取所述目标对象对应的多个图像样本;
基于图像样本中的目标对象的对象复杂度,将各个图像样本划分为多个第一图像类别;
基于图像样本对应的图像质量,将各个第一图像类别分别划分为多个第二图像类别;
将所述各个图像样本划分为总训练集和总测试集;
从所述总训练集中,基于属于同一第二图像类别的图像样本得到对应的图像识别任务的任务训练集;
从所述总测试集中,获取各个图像识别任务分别对应的任务测试集。
3.根据权利要求1所述的方法,其特征在于,所述初始模型参数包括初始权重和初始偏移量,所述基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数,包括:
将当前图像识别任务对应的中间模型损失作为当前模型损失,获取任务权重学习率和任务偏移量学习率;
基于所述任务权重学习率调整所述当前模型损失对应的损失梯度,得到任务权重更新梯度,基于所述任务偏移量学习率调整所述当前模型损失对应的损失梯度,得到任务偏移量更新梯度;
基于所述任务权重更新梯度更新所述初始权重,得到中间权重,基于所述任务偏移量更新梯度更新所述初始偏移量,得到中间偏移量;
基于所述中间权重和所述中间偏移量,得到所述当前图像识别任务对应的中间模型参数。
4.根据权利要求1所述的方法,其特征在于,所述初始模型参数包括初始权重和初始偏移量,所述中间模型参数包括中间权重和中间偏移量,所述基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数,包括:
获取综合权重学习率和综合偏移量学习率;
基于综合权重学习率,融合各个中间权重分别和初始权重之间的差异,得到融合权重,基于所述融合权重和所述初始权重,得到目标权重;
基于综合偏移量学习率,融合各个中间偏移量分别和初始偏移量之间的差异,得到融合偏移量,基于所述融合偏移量和所述初始偏移量,得到目标偏移量;
基于所述目标权重和所述目标偏移量,得到目标模型参数。
5.根据权利要求1所述的方法,其特征在于,所述基于目标模型参数得到更新图像识别模型,将所述更新图像识别模型作为初始图像识别模型,返回所述获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型,包括:
融合所述各个中间模型损失,得到目标模型损失;
当所述目标模型损失满足所述收敛条件时,将所述更新图像识别模型作为目标图像识别模型;
当所述目标模型损失不满足所述收敛条件时,将所述更新图像识别模型作为初始图像识别模型,返回所述获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标图像识别模型中各个相邻网络层之间的连接关系对应的初始能量值,获取初始温度和初始温度下降梯度;
随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值;
基于所述初始温度下降梯度调整所述初始温度,得到当前温度;
将各个当前能量值分别作为对应的初始能量值,将所述当前温度作为初始温度,返回所述随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足迭代条件,得到各个目标能量值;
基于所述各个目标能量值,更新所述目标图像识别模型中各个相邻网络层之间的连接关系,得到参考图像识别模型;
获取参考测试集,基于所述参考测试集和所述参考图像识别模型,得到参考模型损失;
当参考模型损失小于预设阈值时,将所述参考图像识别模型作为最终的目标图像识别模型;
当参考模型损失大于或等于预设阈值时,下调初始温度下降梯度得到更新温度下降梯度,并获取所述目标图像识别模型中各个相邻网络层之间的连接关系对应的更新能量值和更新温度;
将所述更新温度下降梯度作为初始温度下降梯度,将各个更新能量值分别作为对应的初始能量值,将更新温度作为初始温度;
返回所述随机生成初始能量值对应的扰动值,基于扰动值更新初始能量值,得到当前能量值的步骤执行,直至满足结束条件,将参考图像识别模型作为最终的目标图像识别模型。
7.一种图像识别模型训练装置,其特征在于,所述装置包括:
任务数据集获取模块,用于获取至少两个图像识别任务分别对应的任务训练集、任务测试集;所述至少两个图像识别任务用于识别图像中的目标对象;
中间模型确定模块,用于基于各个任务训练集分别训练初始图像识别模型,得到各个图像识别任务分别对应的中间图像识别模型;
中间损失确定模块,用于基于图像识别任务对应的任务测试集和中间图像识别模型,得到各个图像识别任务分别对应的中间模型损失;
中间参数确定模块,用于基于各个中间模型损失分别调整中间图像识别模型的初始模型参数,得到各个图像识别任务分别对应的中间模型参数;
目标参数确定模块,用于基于各个中间模型参数分别和初始图像识别模型的初始模型参数之间的差异,调整初始图像识别模型的初始模型参数,得到目标模型参数;
目标模型确定模块,用于基于目标模型参数得到更新图像识别模型,将所述更新图像识别模型作为初始图像识别模型,返回所述获取至少两个图像识别任务分别对应的任务训练集、任务测试集的步骤执行,直至满足收敛条件,得到目标图像识别模型。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211680934.5A CN116258923A (zh) | 2022-12-27 | 2022-12-27 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211680934.5A CN116258923A (zh) | 2022-12-27 | 2022-12-27 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116258923A true CN116258923A (zh) | 2023-06-13 |
Family
ID=86678402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211680934.5A Pending CN116258923A (zh) | 2022-12-27 | 2022-12-27 | 图像识别模型训练方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116258923A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612358A (zh) * | 2023-07-20 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法、相关装置、设备以及存储介质 |
-
2022
- 2022-12-27 CN CN202211680934.5A patent/CN116258923A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612358A (zh) * | 2023-07-20 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法、相关装置、设备以及存储介质 |
CN116612358B (zh) * | 2023-07-20 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法、相关装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
CN114339409B (zh) | 视频处理方法、装置、计算机设备及存储介质 | |
CN116580257A (zh) | 特征融合模型训练及样本检索方法、装置和计算机设备 | |
CN116010226A (zh) | 软件系统可靠性仿真评估方法、装置和计算机设备 | |
CN116258923A (zh) | 图像识别模型训练方法、装置、计算机设备和存储介质 | |
CN115953330B (zh) | 虚拟场景图像的纹理优化方法、装置、设备和存储介质 | |
CN110866866B (zh) | 图像仿色处理方法、装置、电子设备及存储介质 | |
CN116630630A (zh) | 语义分割方法、装置、计算机设备及计算机可读存储介质 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN114821248A (zh) | 面向点云理解的数据主动筛选标注方法和装置 | |
CN117112880A (zh) | 信息推荐、多目标推荐模型训练方法、装置和计算机设备 | |
CN111726592A (zh) | 获取图像信号处理器的架构的方法和装置 | |
CN117235584B (zh) | 图数据分类方法、装置、电子装置和存储介质 | |
CN115601550B (zh) | 模型确定方法、装置、计算机设备及计算机可读存储介质 | |
CN116894802B (zh) | 图像增强方法、装置、计算机设备和存储介质 | |
CN116881575B (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN115130539A (zh) | 分类模型训练、数据分类方法、装置和计算机设备 | |
CN117976238A (zh) | 传染病趋势预测方法、装置、计算机设备和存储介质 | |
CN116630168A (zh) | 图像处理方法、装置、设备、介质和计算机程序产品 | |
CN115130654A (zh) | 神经网络结构搜索方法、装置、计算机设备和存储介质 | |
CN116976464A (zh) | 去偏置联邦学习训练方法、装置、计算机设备和存储介质 | |
CN116127183A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN115545214A (zh) | 用户筛选方法、装置、计算机设备、存储介质和程序产品 | |
CN116597293A (zh) | 多模态场景识别方法、装置、计算机设备和存储介质 | |
CN116167073A (zh) | 对象信用模型训练方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |