CN116524229A

CN116524229A - 图像识别方法、图像识别装置、电子设备、存储介质

Info

Publication number: CN116524229A
Application number: CN202310246835.4A
Authority: CN
Inventors: 李武津; 詹佳伟; 高斌斌; 刘俊; 刘永; 郑锋
Original assignee: Southwest University of Science and Technology
Current assignee: Southwest University of Science and Technology
Priority date: 2023-03-07
Filing date: 2023-03-07
Publication date: 2023-08-01

Abstract

本申请公开了一种图像识别方法、图像识别装置、电子设备、存储介质，本申请涉及人工智能的图像识别技术领域。图像识别方法包括：根据预设的原始图像识别模型对第一样本图像进行图像识别，得到第一图像标签；根据第一样本图像得到第一差异图像；根据原始图像识别模型对第一差异图像进行图像识别，得到第二图像标签，以此对原始图像识别模型进行参数调整，得到初步图像识别模型；构建图像数据集；根据初步图像识别模型对第二样本图像进行图像识别，得到第三图像标签；对初步图像识别模型进行参数调整，得到目标图像识别模型；根据目标图像识别模型对待识别图像进行图像识别。本实施例的图像识别方法能够提高对多种对象类型图像的识别准确性。

Description

图像识别方法、图像识别装置、电子设备、存储介质

技术领域

本申请涉及人工智能的图像识别技术领域，尤其是涉及一种图像识别方法、图像识别装置、电子设备、存储介质。

背景技术

相关技术中，通过图像识别模型对图像进行识别，以判断待识别图像是否属于正常类别。但由于相关技术中图像识别模型在训练时仅采用单一对象类型的样本图像进行训练，因此该模型仅能够保证对相同对象类型的图像的识别准确性。也就是说，在获取到其他对象类型的图像时，相关技术中的图像识别模型容易出现识别准确性低的现象。因此，如何提高对多种对象类型图像的识别准确性成了亟待解决的技术问题。

发明内容

本申请旨在至少解决现有技术中存在的技术问题之一。为此，本申请提出一种图像识别方法，能够提高对多种类别图像的识别准确性。

本申请还提出一种图像识别装置，和一种应用上述图像识别方法的电子设备以及一种应用上述图像识别方法的计算机可读存储介质。

根据本申请的第一方面实施例的图像识别方法，包括：

根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签；其中，所述第一图像标签用于表征所述第一样本图像的图像类别，所述图像类别包括正常类别和异常类别；

对所述第一样本图像进行数据增强处理，得到第一差异图像；其中，所述第一差异图像的图像类别与所述第一样本图像的图像类别不相同；

将所述第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签；其中，所述第二图像标签用于表征所述第一差异图像的图像类别；

根据所述第一样本图像、所述第一图像标签、所述第一差异图像和所述第二图像标签对所述原始图像识别模型进行参数调整，得到初步图像识别模型；

根据所述第一样本图像、所述第一差异图像构建图像数据集；

根据所述图像数据集、所述初步图像识别模型对获取到的第二样本图像进行图像识别，得到第三图像标签；其中，所述第三图像标签用于表征所述第二样本图像的图像类别；

根据所述第二样本图像、所述图像数据集、所述第三图像标签对所述初步图像识别模型进行参数调整，得到目标图像识别模型；

根据所述目标图像识别模型对获取到的待识别图像进行图像识别。

根据本申请实施例的图像识别方法，至少具有如下有益效果：根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签。对第一样本图像进行数据增强处理，得到第一差异图像。将第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签。根据第一样本图像、第一图像标签、第一差异图像和第二图像标签对原始图像识别模型进行参数调整，得到初步图像识别模型。根据第一样本图像、第一差异图像构建图像数据集。根据图像数据集、初步图像识别模型对获取到的第二样本图像进行图像识别，得到第三图像标签。根据第二样本图像、图像数据集、第三图像标签对初步图像识别模型进行参数调整，得到目标图像识别模型。最后，根据得到的目标图像识别模型对获取到的待识别图像进行图像识别。本实施例的图像识别方法能够得到与样本图像的类别不相同的差异图像，将差异图像和样本图像一起对图像识别模型进行训练，并将差异图像和样本图像存储为图像数据集，以用于后续对图像识别模型的训练，避免了图像识别模型对历史样本图像的遗忘，以此提高了对多种对象类型图像的识别准确性。

根据本申请的一些实施例，所述对所述第一样本图像进行数据增强处理，得到第一差异图像，包括：

对所述第一样本图像进行像素截取操作，得到图像像素数据；

获取所述第一样本图像的第一随机位置数据；

根据所述第一随机位置数据、所述图像像素数据更新所述第一样本图像，得到所述第一差异图像。

获取所述第一样本图像的第二随机位置数据；

根据所述第二随机位置数据从所述第一样本图像中筛选得到样本像素数据；

对所述样本像素数据进行像素值调整操作，得到所述第一差异图像。

根据本申请的一些实施例，所述原始图像识别模型包括特征提取子模型和分类子模型；

所述根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签，包括：

将所述第一样本图像输入至所述特征提取子模型进行特征提取操作，得到样本特征向量；

将所述样本特征向量输入至所述分类子模型进行图像类别识别，得到所述第一图像标签。

根据本申请的一些实施例，所述特征提取子模型包括图像分割层和编码层；

所述将所述第一样本图像输入至所述特征提取子模型进行特征提取操作，得到样本特征向量，包括：

根据所述图像分割层对所述第一样本图像进行图像分割操作，得到样本切割图像；

根据所述编码层对所述样本切割图像进行归一化处理，得到所述样本特征向量。

根据本申请的一些实施例，所述根据所述第二样本图像、所述图像数据集、所述第三图像标签对所述初步图像识别模型进行参数调整，得到目标图像识别模型，包括：

对所述第二样本图像进行数据增强处理，得到第二差异图像；其中，所述第二差异图像的图像类别与所述第二样本图像的图像类别不相同；

将所述第二差异图像输入至所述初步图像识别模型进行图像识别，得到第四图像标签；其中，所述第四图像标签用于表征所述第二差异图像的图像类别；

根据所述第二样本图像、所述第二差异图像、所述图像数据集、所述第三图像标签、所述第四图像标签对所述初步图像识别模型进行参数调整，得到所述目标图像识别模型。

根据本申请的一些实施例，所述根据所述第二样本图像、所述第二差异图像、所述图像数据集、所述第三图像标签、所述第四图像标签对所述初步图像识别模型进行参数调整，得到所述目标图像识别模型，包括：

根据所述第二样本图像、所述第三图像标签得到正常损失数据；

根据所述第二差异图像、所述第四图像标签得到异常损失数据；

根据所述图像数据集得到历史损失数据；

根据所述正常损失数据、异常损失数据、历史损失数据对所述初步图像识别模型进行参数调整，得到所述目标图像识别模型。

根据本申请的第二方面实施例的图像识别装置，包括：

第一图像识别模块，所述第一图像识别用于根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签；其中，所述第一图像标签用于表征所述第一样本图像的图像类别，所述图像类别包括正常类别和异常类别；

数据增强模块，所述数据增强模块用于对所述第一样本图像进行数据增强处理，得到第一差异图像；其中，所述第一差异图像与所述第一样本图像的图像类别不相同；

第二图像识别模块，所述第二图像识别模块用于将所述第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签；其中，所述第二图像标签用于表征所述第一差异图像的图像类别；

第一训练模块，所述第一训练模块用于根据所述第一样本图像、所述第一图像标签、所述第一差异图像和所述第二图像标签对所述原始图像识别模型进行参数调整，得到初步图像识别模型；

数据集构建模块，所述数据集构建模块用于根据所述第一样本图像、所述第一差异图像构建图像数据集；

第三图像识别模块，所述第三图像识别模块用于根据所述图像数据集、所述初步图像识别模型对获取到的第二样本图像进行图像识别，得到第三图像标签；其中，所述第三图像标签用于表征所述第二样本图像的图像类别；

第二训练模块，所述第二训练模块用于根据所述第二样本图像、所述图像数据集、所述第三图像标签对所述初步图像识别模型进行参数调整，得到目标图像识别模型；

目标识别模块，所述目标识别模块用于根据所述目标图像识别模型对获取到的待识别图像进行图像识别。

根据本申请实施例的图像识别装置，至少具有如下有益效果：该图像识别装置通过采用上述图像识别方法，提高了对多种类别图像的识别准确性。

根据本申请的第三方面实施例的电子设备，包括：

至少一个存储器；

至少一个处理器；

至少一个计算机程序；

所述计算机程序被存储在所述存储器中，所述处理器执行所述至少一个计算机程序以实现上述第一方面实施例的图像识别方法。

根据本申请的第四方面实施例的计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行上述第一方面实施例的图像识别方法。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

下面结合附图和实施例对本申请做进一步的说明，其中：

图1为本申请实施例提供的图像处理方法的流程图；

图2为图1中步骤S120的具体方法的流程图；

图3A为本申请实施例提供的图像处理方法中第一样本图像示意图；

图3B为本申请实施例提供的图像处理方法中第一差异图像的第一实施例的示意图；

图3C为本申请实施例提供的图像处理方法中第一差异图像的第二实施例的示意图；

图4为图1中步骤S120的另一具体方法的流程图；

图5为图1中步骤S110的具体方法的流程图；

图6为图5中步骤S510的具体方法的流程图；

图7为本申请实施例提供的特征提取子模型的模块框图；

图8为图1中步骤S170的具体方法的流程图；

图9为图8中步骤S830的具体方法的流程图；

图10为本申请实施例提供的图像识别装置的模块框图；

图11为本申请实施例提供的电子设备的硬件结构示意图。

附图标记：

第一图像识别模块110、数据增强模块120、第二图像识别模块130、第一训练模块140、数据集构建模块150、第三图像识别模块160、第二训练模块170、目标识别模块180、处理器210、存储器220、输入/输出接口230、通信接口240、总线250。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

机器学习(Machine Learning)：是专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径。在机器学习中，深度学习(DeepLearning)是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

持续学习(Continual Learning)：持续学习又叫增量学习(IncrementalLearing)或终身学习(LifeLong Learning)，其不同于传统的深度学习模型在固定或平稳的数据分布下训练，持续学习模型是从非平稳的数据分布中持续不断地获取新知识。而获取新知识的同时，旧知识会受到干扰，导致模型性能快速下降，甚至会完全覆盖或遗忘以前学到的旧知识，即发生灾难性遗忘(catastrophicforgeeting)。而持续学习就是专注于解决灾难性遗忘问题。

数据增强(Data Augmentation)：通过对已有数据进行一系列改动以生成新的数据，以扩大数据集的规模和增加数据的多样性，从而提高模型的泛化能力。

蓄水池抽样算法：用于在内存无法加载全部数据时，从包含未知大小的数据流中随机选取若干个数据，并且要保证每个数据被抽取到的概率相等。

目前，在异常检测(Anomaly Detection)工作中，通常采用图像识别模型对待识别图像进行识别，以判断待识别图像是否属于正常类别。其中，异常检测工作可以应用于如对工业产品的良品率监控等的需确认是否存在异常的工作中。

基于此，本公开实施例提供一种图像识别方法、图像识别装置、电子设备、存储介质，能够提高对多种对象类型图像的识别准确性。

如图1所示，本申请实施例提供了一种图像识别方法，该方法包括但不限于步骤S110至步骤S180，下面对该八个步骤进行详细介绍。

步骤S110：根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签；其中，第一图像标签用于表征第一样本图像的图像类别，图像类别包括正常类别和异常类别；

步骤S120：对第一样本图像进行数据增强处理，得到第一差异图像；其中，第一差异图像的图像类别与第一样本图像的图像类别不相同；

步骤S130：将第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签；其中，第二图像标签用于表征第一差异图像的图像类别；

步骤S140：根据第一样本图像、第一图像标签、第一差异图像和第二图像标签对原始图像识别模型进行参数调整，得到初步图像识别模型；

步骤S150：根据第一样本图像、第一差异图像构建图像数据集；

步骤S160：根据图像数据集、初步图像识别模型对获取到的第二样本图像进行图像识别，得到第三图像标签；其中，第三图像标签用于表征第二样本图像的图像类别；

步骤S170：根据第二样本图像、图像数据集、第三图像标签对初步图像识别模型进行参数调整，得到目标图像识别模型；

步骤S180：根据目标图像识别模型对获取到的待识别图像进行图像识别。

在一些实施例的步骤S110中，获取第一样本图像，第一样本图像的数量可以为多张。该第一样本图像的对象类型可以选择为任意工业产品，例如参照图3A，第一样本图像的对象类型可以为轴承。将所有第一样本图像输入至原始图像识别模型后，原始图像识别模型对第一样本图像进行识别，并输出第一图像标签。该第一图像标签能够表征第一样本图像的图像类别，其中图像类别包括正常类别和异常类别，正常类别的图像包含正常图像的特征信息，异常类别的图像包含异常图像的特征信息。例如，所有第一样本图像均为表征待测物体正常的图像，将所有第一样本图像输入至原始图像识别模型，原始图像识别模型能够输出第一图像标签。

在一些实施例的步骤S120中，对获取的第一样本图像进行数据增强处理，以此得到图像类别与第一样本图像不相同的第一差异图像。可以理解的是，当获取的第一样本图像的数量为多个时，可以对部分或全部的第一样本图像进行数据增强处理。例如，第一样本图像的数量为8张，所有第一样本图像均为表征待测物体正常的图像，若对其中6张第一样本图像进行数据增强处理，则可以对应得到6张第一差异图像，该6张第一差异图像均为表征待测物体异常的图像。

在一些实施例的步骤S130中，将数据增强处理后得到的第一差异图像输入至原始图像识别模型，由原始图像识别模型对第一差异图像进行识别，并输出第二图像标签。该第二图像标签能够表征第一差异图像的图像类别。例如，所有第一样本图像均为表征待测物体正常的图像，对部分或全部的第一样本图像进行数据增强处理后得到表征待测物体异常的第一差异图像。将所有得到的第一差异图像输入至原始图像识别模型，原始图像识别模型能够输出第二图像标签。

在一些实施例的步骤S140中，得到第一图像标签、第二图像标签后，根据第一样本图像、第一图像标签、第一差异图像和第二图像标签对原始图像识别模型进行参数调整。由于第一样本图像与第一差异图像的图像类别不相同，因此在进行参数调整后原始图像模型能够学习到正常图像的特征信息、异常图像的特征信息，以此得到初步图像识别模型。例如，第一样本图像为表征待测物体正常的图像，则第一差异图像为表征待测物体异常的图像，在根据第一样本图像、第一图像标签对原始图像识别模型进行参数调整后，原始图像模型能够学习到正常图像的特征信息；在根据第一差异图像、第二图像标签对原始图像识别模型进行参数调整后，原始图像模型能够学习到异常图像的特征信息。此时对原始图像识别模型的训练过程的损失函数可以表示为下式(1)：

其中，x₁为输入的第一样本图像，为数据增强处理后得到的第一差异图像，h(f_e(x₁))表示第一图像标签，/>表示第二图像标签，y₁为0或者1，y₂为0或者1，当y₁为0时，y₂为1，当y₁为1时，y₂为0。

在一些实施例的步骤S150中，设置预设容量的存储空间，利用蓄水池抽样算法随机抽取部分第一样本图像、第一差异图像进行抽样，得到图像数据集。其次，再将抽取出的第一样本图像、第一差异图像存储至所述存储空间中。例如，设置一个容量为m的存储空间，从第一样本图像、第一差异图像中抽取m个图像存储至存储空间中。其次，从第一样本图像、第一差异图像中选取任一图像作为第i个存储至存储空间的元素(i大于或等于m)，在数组[0，i]中取得随机数a，若a处于[0，m-1]范围内，那么将该图像与前述存储空间中第a个存储的图像替换。通过上述方式遍历所有待抽取的第一样本图像、第一差异图像，以此得到图像数据集。

在一些实施例的步骤S160中，获取第二样本图像，第二样本图像的数量也可以为多张。该第二样本图像可以选择为与第一样本图像的对象类型不同的图像，例如，第二样本图像的对象类型可以为螺钉、螺帽等其他工业产品。将图像数据集、获取的所有第二样本图像输入至初步图像识别模型，并由初步图像识别模型对第二样本图像进行识别，并输出第三图像标签。该第三图像标签能够表征第二样本图像的图像类别。例如，与第一样本图像相同，所有第二样本图像均为表征待测物体正常的图像。将所有第二样本图像输入至初步图像识别模型后，初步图像识别模型能够根据第二样本图像输出第三图像标签，该第三图像标签表征第二样本图像的图像类别为正常类别。其中，图像数据集中的第一样本图像在输入至初步图像识别模型后同样得到上述的第一图像标签，图像数据集中的第一差异图像在输入至初步图像识别模型后同样得到上述的第二图像标签。

在一些实施例的步骤S170中，得到第三图像标签后，根据第二样本图像、图像数据集、第三图像标签对初步图像识别模型进行参数调整。由于图像数据集中包括第一样本图像、第一差异图像，因此在进行参数调整后初步图像识别模型不会遗忘前述对原始图像识别模型进行训练后学习到的特征信息。同时，再根据第二样本图像、第三图像标签对初步图像识别模型进行参数调整，使得初步图像识别模型能够进一步学习图像的特征信息，以此得到目标图像识别模型。可见，本实施例的目标图像识别模型能够在不损失对过去训练样本图像的识别准确性的情况下，提升对当前训练样本图像的识别准确性。

得到目标图像识别模型后，若需继续对该目标图像识别模型进行训练，则可以参照上述步骤S150，利用用于训练初步图像识别模型的第二样本图像对图像数据集进行更新，更新后的图像数据集存储有当前训练任务的第二样本图像以及历史训练任务的第一样本图像和第一差异图像。其次，再次执行上述步骤S160、步骤S170，利用获取的第三样本图像、上述更新后的图像数据集以及对应识别得到的图像标签对目标图像识别模型进行参数调整，以更新目标图像识别模型。其中，第三样本图像可以选择为与第一样本图像的对象类型、第二样本图像的对象类型均不相同的图像，也可以选择为分别与第一样本图像的对象类型或第二样本图像的对象类型相同的图像。

在一些实施例的步骤S180中，在推理阶段，将获取到的待识别图像输入至训练完毕的目标图像识别模型，并由该目标图像识别模型对待识别图像进行图像识别，以此判断待识别图像的图像类别。

本申请实施例提出的图像识别方法，通过预设的原始图像识别模型对第一样本图像进行图像识别，以得到第一图像标签。对第一样本图像进行数据增强处理，得到第一差异图像。将第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签。根据第一样本图像、第一图像标签、第一差异图像和第二图像标签对原始图像识别模型进行参数调整，得到初步图像识别模型。根据第一样本图像、第一差异图像构建图像数据集。利用图像数据集、初步图像识别模型对获取到的第二样本图像进行图像识别，以得到第三图像标签。根据第二样本图像、图像数据集、第三图像标签对初步图像识别模型进行参数调整，得到目标图像识别模型。最后，利用得到的目标图像识别模型对获取到的待识别图像进行图像识别。本实施例的图像识别方法能够得到与样本图像的类别不相同的差异图像，将差异图像和样本图像一起对图像识别模型进行训练，并将差异图像和样本图像存储为图像数据集，以用于后续对图像识别模型的训练，避免了图像识别模型对历史样本图像的遗忘，以此提高了对多种对象类型图像的识别准确性。

如图2所示，在本申请的一些实施例中，步骤S120包括但不限于步骤S210至步骤S230，下面对这三个步骤进行详细介绍。

步骤S210：对第一样本图像进行像素截取操作，得到图像像素数据；

步骤S220：获取第一样本图像的第一随机位置数据；

步骤S230：根据第一随机位置数据、图像像素数据更新第一样本图像，得到第一差异图像。

在一些实施例的步骤S210中，截取部分区域的第一样本图像的像素数据以得到图像像素数据，该图像像素数据即为第一样本图像中被截取区域的图像。可以理解的是，截取第一样本图像的区域大小以及区域位置可以根据实际需求进行选取。

在一些实施例的步骤S220中，从第一样本图像中获取第一随机位置数据，该第一随机位置数据为第一样本图像中随机位置的坐标数据。

在一些实施例的步骤S230中，利用得到的图像像素数据在第一样本图像的第一随机位置的坐标上，对第一样本图像进行更新，得到第一差异图像。可以理解的是，图像像素数据可以覆盖于第一样本图像的第一随机位置的图像像素上，也可以与第一样本图像的第一随机位置的图像像素进行替换。例如参照图3A、图3B，其中图3A为第一样本图像，该第一样本图像即为表征待测物体正常的图像。截取第一样本图像中部分区域的图像像素后，利用该图像像素在第一样本图像的随机位置上更新第一样本图像，以得到能够模拟用于表征待测物体异常的第一差异图像，该第一差异图像可参照图3B。

如图4所示，在本申请的另一些实施例中，步骤S120包括但不限于步骤S410至步骤S430，下面对这三个步骤进行详细介绍。

步骤S410：获取第一样本图像的第二随机位置数据；

步骤S420：根据第二随机位置数据从第一样本图像中筛选得到样本像素数据；

步骤S430：对样本像素数据进行像素值调整操作，得到第一差异图像。

在一些实施例的步骤S410中，从第一样本图像中获取第二随机位置数据，该第二随机位置数据为第一样本图像中随机位置的坐标数据。

在一些实施例的步骤S420中，筛选出第一样本图像中第二随机位置上的图像像素，该筛选出的图像像素即为样本像素数据。

在一些实施例的步骤S430中，对筛选得到的样本像素数据进行像素值调整，以此得到第一差异图像。例如参照图3A、图3C，其中图3A为第一样本图像，该第一样本图像即为表征待测物体正常的图像。获取第一样本图像的第二随机位置数据后，筛选出第一样本图像中第二随机位置上的样本像素数据，对该样本像素的像素值进行调整，如将第一样本图像第二随机位置上的RGB值调整为(255，255，255)，从而得到第一差异图像，该第一差异图像可参照图3C。可以理解的是，对该样本像素的像素值具体调整的数值，即具体第一样本图像在第二随机位置上的RGB值，可以根据实际需求进行适应性选取。

如图5所示，在本申请的一些实施例中，原始图像识别模型包括特征提取子模型和分类子模型。步骤S110包括但不限于步骤S510与步骤S520，下面对这两个步骤进行详细介绍。

步骤S510：将第一样本图像输入至特征提取子模型进行特征提取操作，得到样本特征向量；

步骤S520：将样本特征向量输入至分类子模型进行图像类别识别，得到第一图像标签。

在一些实施例的步骤S510中，第一样本图像输入至原始图像识别模型后，由原始图像识别模型的特征提取子模型对第一样本图像进行特征提取，以此得到第一样本图像的样本特征向量。该特征提取子模型可以选择为视觉转换器(Vision Transformer，ViT)、亚历克斯网络(AlexNet)、视觉几何网络(Visual Geometry Group Network，VGGNet)、残差网络(Residual Network，ResNet)中的任一个神经网络。

在一些实施例的步骤S520中，原始图像识别模型的分类子模型对输入的样本特征向量进行图像类别识别，以此得到表征第一样本图像的图像类别的第一图像标签。该分类子模型可以为全连接层或1×1的卷积层。以分类子模型是全连接层为例，设输入的样本特征向量为Z∈R^B×D，输出的第一图像标签为Y∈R^B×2，即分类子模型能够将D维度的特征向量映射到二分类中，该二分类即分类为正常类别、异常类别。其中，正常类别的图像可参照图3A，异常类别的图像图3B、图3C。该分类子模型的图像识别可形式化表示为下式(2)：

Y＝h(Z,ψ)..............式(2)

其中，h为分类子模型，ψ为可学习的参数。

可以理解的是，上述步骤S510与步骤S520中原始图像识别模型具体对第一样本图像进行的图像识别方式，同样可以运用于步骤S130的原始图像识别模型对第一差异图像的图像识别，以及步骤S160的初步图像识别模型的图像识别中。即步骤S130中原始图像识别模型的图像识别、步骤S160中初步图像识别模型的图像识别的具体方式，可以参照上述原始图像识别模型具体对第一样本图像进行的图像识别的描述。

如图6所示，在本申请的一些实施例中，特征提取子模型包括图像分割层和编码层。步骤S510包括但不限于步骤S610与步骤S620，下面对这两个步骤进行详细介绍。

步骤S610：根据图像分割层对第一样本图像进行图像分割操作，得到样本切割图像；

步骤S620：根据编码层对样本切割图像进行归一化处理，得到样本特征向量。

在一些实施例的步骤S610中，参照图7，特征提取子模型接收到第一样本图像后，由图像分割层对第一样本图像进行图像分割。图像分割层将输入的第一样本图像分割为若干个图像块，并对各个图像块进行线性映射，即可得到对应的各个样本切割图像。

在一些实施例的步骤S620中，编码层对上述得到的各个样本切割图像进行归一化处理，从而得到归一化后的特征向量，该特征向量即为样本特征向量。

如图8所示，在本申请的一些实施例中，步骤S170包括但不限于步骤S810至步骤S830，下面对这三个步骤进行详细介绍。

步骤S810：对第二样本图像进行数据增强处理，得到第二差异图像；其中，第二差异图像的图像类别与第二样本图像的图像类别不相同；

步骤S820：将第二差异图像输入至初步图像识别模型进行图像识别，得到第四图像标签；其中，第四图像标签用于表征第二差异图像的图像类别；

步骤S830：根据第二样本图像、第二差异图像、图像数据集、第三图像标签、第四图像标签对初步图像识别模型进行参数调整，得到目标图像识别模型。

在一些实施例的步骤S810中，对获取的第二样本图像进行数据增强处理，以此得到图像类别与第二样本图像不相同的第二差异图像。参照上述步骤S120的描述，当获取的第二样本图像的数量为多个时，可以对部分或全部的第二样本图像进行数据增强处理。

在一些实施例的步骤S820中，将数据增强处理后得到的第二差异图像输入至初步图像识别模型，由初步图像识别模型对第二差异图像进行识别，并输出第四图像标签。该第四图像标签能够表征第二差异图像的图像类别。例如，所有第二样本图像均为表征待测物体正常的图像，对部分或全部的第二样本图像进行数据增强处理后得到表征待测物体异常的第二差异图像。将所有得到的第二差异图像输入至初步图像识别模型后，初步图像识别模型能够输出第四图像标签，该第四图像标签表征第一差异图像的图像类别为异常类别。

在一些实施例的步骤S830中，得到第二差异图像后，根据第二样本图像、第二差异图像、图像数据集、第一图像标签、第二图像标签、第三图像标签、第四图像标签对初步图像识别模型进行参数调整。根据第二样本图像、第二差异图像、第三图像标签对初步图像识别模型进行参数调整，使得初步图像识别模型能够进一步学习图像的正常类别、异常类别的特征信息，以此得到目标图像识别模型。

如图9所示，在本申请的一些实施例中，步骤S820包括但不限于步骤S910至步骤S940，下面对这四个步骤进行详细介绍。

步骤S910：根据第二样本图像、第三图像标签得到正常损失数据；

步骤S920：根据第二差异图像、第四图像标签得到异常损失数据；

步骤S930：根据图像数据集得到历史损失数据；

步骤S940：根据正常损失数据、异常损失数据、历史损失数据对初步图像识别模型进行参数调整，得到目标图像识别模型。

在一些实施例的步骤S910中，通过获取的第二样本图像、初步图像识别模型输出的第三图像标签，可以得到对正常类别样本的正常损失数据。该正常损失数据可以表示为下式(3)：

L₁＝CE[h(f_e(x₂)),y₁]..............式(3)

其中，L₁为正常损失数据，x₂为输入的第二样本图像，h(f_e(x₂))表示第三图像标签，y₁为0或者1。

在一些实施例的步骤S920中，通过获取的第二差异图像、初步图像识别模型输出的第四图像标签，可以得到对异常类别样本的异常损失数据。该异常损失数据可以表示为下式(4)：

其中，L₂为异常损失数据，为数据增强处理后得到的第二差异图像，/>表示第四图像标签，y₂为0或者1。

在一些实施例的步骤S930中，通过图像数据集可以得到对正常类别样本的异常损失数据。该历史损失数据可以表示为下式(5)：

其中，L₃为异常损失数据，x₂为输入的第二样本图像，为图像数据集中存储的图像数据。

在一些实施例的步骤S940中，通过得到的正常损失数据、异常损失数据、历史损失数据对初步图像识别模型进行参数调整，即可得到目标图像识别模型。其中，通过正常损失数据、异常损失数据、历史损失数据可以得到对初步图像识别模型的训练过程的损失函数，即该损失函数可由上式(3)、式(4)、式(5)结合后得到，该损失函数可以表示为下式(6)：

其中，x₂为输入的第二样本图像，为数据增强处理后得到的第二差异图像，h(f_e(x₂))表示第三图像标签，/>表示第四图像标签；y₁为0或者1，y₂为0或者1，当y₁为0时，y₂为1，当y₁为1时，y₂为0；/>为图像数据集中存储的图像数据，α为上式(6)中各项之间的超参数。

如图10所示，本发明实施例还提供了一种图像识别装置，包括：

第一图像识别模块110，用于根据预设的原始图像识别模型对获取的第一样本图像进行图像识别，得到第一图像标签；其中，所述第一图像标签用于表征所述第一样本图像的图像类别，所述图像类别包括正常类别和异常类别；

数据增强模块120，用于对所述第一样本图像进行数据增强处理，得到第一差异图像；其中，所述第一差异图像与所述第一样本图像的图像类别不相同；

第二图像识别模块130，用于将所述第一差异图像输入至所述原始图像识别模型进行图像识别，得到第二图像标签；其中，所述第二图像标签用于表征所述第一差异图像的图像类别；

第一训练模块140，用于根据所述第一样本图像、所述第一图像标签、所述第一差异图像和所述第二图像标签对所述原始图像识别模型进行参数调整，得到初步图像识别模型；

数据集构建模块150，用于根据所述第一样本图像、所述第一差异图像构建图像数据集；

第三图像识别模块160，用于根据所述图像数据集、所述初步图像识别模型对获取到的第二样本图像进行图像识别，得到第三图像标签；其中，所述第三图像标签用于表征所述第二样本图像的图像类别；

第二训练模块170，用于根据所述第二样本图像、所述图像数据集、所述第三图像标签对所述初步图像识别模型进行参数调整，得到目标图像识别模型；

目标识别模块180，用于根据所述目标图像识别模型对获取到的待识别图像进行图像识别。

可见，上述图像识别方法实施例中的内容均适用于本图像识别装置实施例中，本图像识别装置实施例所具体实现的功能与上述图像识别方法实施例相同，并且达到的有益效果与上述图像识别方法实施例所达到的有益效果也相同。

下面结合图11对本发明实施例的电子设备进行详细介绍。

如图11，图11示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器210，可以采用通用的中央处理器(Central Processing Unit，CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本公开实施例所提供的技术方案；

存储器220，可以采用只读存储器(Read Only Memory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory，RAM)等形式实现。存储器220可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器220中，并由处理器210来调用执行本公开实施例的图像识别方法；

输入/输出接口230，用于实现信息输入及输出；

通信接口240，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；

总线250，在设备的各个组件(例如处理器210、存储器220、输入/输出接口230和通信接口240)之间传输信息；

其中处理器210、存储器220、输入/输出接口230和通信接口240通过总线250实现彼此之间在设备内部的通信连接。

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，计算机可执行指令用于使计算机执行如上述任一实施例所描述的图像识别方法。

可见，上述图像识别方法实施例中的内容均适用于本计算机可读存储介质实施例中，本计算机可读存储介质实施例所具体实现的功能与上述图像识别方法实施例相同，并且达到的有益效果与上述图像识别方法实施例所达到的有益效果也相同。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本发明的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本发明中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台电子设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序的介质。

以上参照附图说明了本公开实施例的优选实施例，并非因此局限本公开实施例的权利范围。本领域技术人员不脱离本公开实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本公开实施例的权利范围之内。

Claims

1.图像识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的图像识别方法，其特征在于，所述对所述第一样本图像进行数据增强处理，得到第一差异图像，包括：

获取所述第一样本图像的第一随机位置数据；

3.根据权利要求1所述的图像识别方法，其特征在于，所述对所述第一样本图像进行数据增强处理，得到第一差异图像，包括：

获取所述第一样本图像的第二随机位置数据；

4.根据权利要求1所述的图像识别方法，其特征在于，所述原始图像识别模型包括特征提取子模型和分类子模型；

5.根据权利要求4所述的图像识别方法，其特征在于，所述特征提取子模型包括图像分割层和编码层；

6.根据权利要求1至5任一项所述的图像识别方法，其特征在于，所述根据所述第二样本图像、所述图像数据集、所述第三图像标签对所述初步图像识别模型进行参数调整，得到目标图像识别模型，包括：

7.根据权利要求6所述的图像识别方法，其特征在于，所述根据所述第二样本图像、所述第二差异图像、所述图像数据集、所述第三图像标签、所述第四图像标签对所述初步图像识别模型进行参数调整，得到所述目标图像识别模型，包括：

根据所述图像数据集得到历史损失数据；

8.图像识别装置，其特征在于，包括：

9.电子设备，其特征在于，包括：

至少一个存储器；

至少一个处理器；

至少一个计算机程序；

所述计算机程序被存储在所述存储器中，处理器执行所述至少一个计算机程序以实现如权利要求1至7任一项所述的图像识别方法。

10.计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的图像识别方法。