CN114821204B

CN114821204B - 一种基于元学习嵌入半监督学习图像分类方法与系统

Info

Publication number: CN114821204B
Application number: CN202210754352.0A
Authority: CN
Inventors: 袭肖明; 孟令钊; 聂秀山; 尹义龙; 张光
Original assignee: Shandong Jianzhu University
Current assignee: Shandong Jianzhu University
Priority date: 2022-06-30
Filing date: 2022-06-30
Publication date: 2023-04-07
Anticipated expiration: 2042-06-30
Also published as: CN114821204A

Abstract

本公开提供了一种基于元学习嵌入半监督学习图像分类方法与系统，属于图像分类系统技术领域，采用提出的面向重要性区域加噪的样本生成方法，将该类样本引入到训练过程中，使模型学习到更加鲁棒的特征；另一方面，构建一种融合元学习和半监督学习的知识自适应挖掘的半监督学习网络，在半监督学习框架下，引入元学习器来对每个样本的知识进行自适应学习，并将获得的有效知识应用到网络的训练过程中，进一步提升模型的鲁棒性。

Description

一种基于元学习嵌入半监督学习图像分类方法与系统

技术领域

本公开涉及图像分类系统技术领域，具体涉及一种基于元学习嵌入半监督学习图像分类方法与系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

传统的图像分类方法大致可以分为基于手工设计特征加传统浅层分类模型的方法和基于深度学习的方法，对于传统的基于手工设计特征的方法，由于特征的表述能力有限，导致分类效果难以令人满意，相比较传统的手工设计特征的方法，深度神经网络具有强大的特征学习能力，目前已经成为图像分类的主流方法。

然而，在图像分类任务中，学到的知识的作用是不同的，例如，有些特征对噪声更为鲁棒，这类知识在分类模型的学习

中需要发挥更大的作用，另外，在某些任务中，例如医学图像分析，数据的标记获取成本往往较高，难以获取到足够的标记数据，然而，可以获得大量的低成本未标记噪音数据。半监督学习可以有效获取标记数据和未标记数据，但是现有的半监督学习模型并未考虑到对样本进行个性化的知识学习，限制了模型性能的提升

发明内容

本公开为了解决在图像分类任务中噪音样本限制模型性能提升的问题，提出了一种基于元学习嵌入半监督学习图像分类方法与系统，引入面向重要性区域的加噪方法的样本生成方法，将该样本引入到训练过程中，使得模型学习到更加鲁棒的特征。

根据一些实施例，本公开采用如下技术方案：

一种基于元学习嵌入半监督学习图像分类方法，包括：

采集不同类型的原始图像数据样本，构建数据集并进行预处理；

构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；

将加噪后训练样本集中的样本输入到分类网络模型中，输出每个样本的权重；

构建损失函数，更新标记数据并输入分类网络模型中进行迭代，计算交叉熵损失以及均方差损失并计算网络总损失；

更新网络参数，进行迭代达到收件条件，获得最小损失的半监督网络模型，并利用测试集进行测试，输出图像类别。

一种基于元学习嵌入半监督学习图像分类系统，包括：

数据采集处理模块，用于采集不同类型的原始图像数据样本，构建数据集并进行预处理；构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；

训练与样本自适应加权模块，用于将加噪后训练样本集中的样本输入到分类网络模型中，输出每个样本的权重；

损失计算模块，用于构建损失函数，更新标记数据并输入分类网络模型中进行迭代，计算交叉熵损失以及均方差损失并计算网络总损失；

分类模块，用于进行迭代达到收件条件，获得最小损失的半监督网络模型，并利用测试集进行测试，输出图像类别。

有益效果

与现有技术相比，本公开的有益效果为：

本公开提出一种基于元学习嵌入半监督学习图像分类方法，可以对每个样本的知识进行自适应学习，能够有效增强网络对鲁棒特征的学习能力。

一方面，采用提出的面向重要性区域加噪的样本生成样本方法，将该类样本引入到训练过程中，使模型学习到更加鲁棒的特征。

另一方面，构建了一种融合元学习和半监督学习的知识自适应挖掘的半监督学习网络，在半监督学习框架下，引入元学习器来对每个样本的知识进行自适应学习，并将获得的有效知识应用到网络的训练过程中，进一步提升模型的鲁棒性。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1为本公开图像分类算法实现图像分类的网络学习流程示意图；

图2为本公开图像分类系统模型框架示意图。

具体实施方式：

下面结合附图与实施例对本公开作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例1

本公开提供一种基于元学习嵌入半监督学习的图像分类方法，如图1所示：一种基于元学习嵌入半监督学习的图像分类算法实现图像分类的网络学习过程，包括以下步骤：

步骤1：采集不同类型的原始图像数据样本，构建数据集并进行预处理；

步骤2：构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；

步骤3：将加噪后训练样本集中的样本输入到分类网络模型中，输出每个样本的权重；

步骤4：构建损失函数，更新标记数据并输入分类网络模型中进行迭代，计算交叉熵损失以及均方差损失并计算网络总损失；

步骤5：更新网络参数，进行迭代达到收件条件，获得最小损失的半监督网络模型，并利用测试集进行测试，输出图像类别。

在步骤1中，对数据进行预处理；

采集不同类别的原始图像数据样本，由于原始数据样本在数据收集过程中图像尺寸可能存在不一致的问题，不利于深度网络模型的学习，因此需要将原始数据样本集的图像尺寸变换为统一大小。将每种类型的原始图像样本按照一定的比例进行分配划分，具体采用按样本类别等比例划分方式，比例为7:2:1，组合成训练集、验证集以及测试集。

在步骤2中，对数据样本重要特征区域加噪；

利用预训练好的图像分类模型（VGG、resnet32、resnet50等）获得原始数据样本集中每幅图像的类激活映射（CAM-Class Activation Mapping），根据CAM获得数据样本重要的特征区域信息。采用已有技术Grad-CAM方法获取样本的重要特征区域，越重要的特征区域其值越高。重要特征区域信息是网络预测的重要区域，为了促使模型学到的特征更加鲁棒，将CAM作为图像加噪的概率图，对图像按照获得的加噪概率图进行不同程度的加噪，即图像按照10%的设定比例进行随机区域加噪，根据上述类激活映射，可以获得网络预测的重要特征区域，越重要的特征区域其比例值越大，越重要的区域，加噪的概率越大，迫使模型学习出对噪声鲁棒的特征。主要的加噪方法有随机噪声、椒盐噪声、高斯噪声等。加噪的方式为随机选取一块区域，判断该区域中包含重要特征区域的比例，超过70%的阈值，则对该区域进行10%比例的加噪，否则继续寻找满足该条件的区域。

在步骤3中，数据输入模型进行训练；

数据样本经过重要特征区域加噪方法处理后，将训练样本集中的标记数据和未标记数据输入到学生分类网络中；教师网络输入未标记数据。在数据集划分标记数据和未标记数据，标记数据指有标签数据，即通过先验知识已标注样本的所属类型；未标记数据指无标签数据。首先将标记样本和未标记样本输入到学生分类网络的主干网络resnet50中，经过多次卷积操作后，进行数据样本的关键特征信息提取，获取对应的特征图。为之后获取样本权重以及计算损失函数的输入信息做准备工作。

进行样本自适应加权；

在学生网络中嵌入元学习挖掘器，用于有效知识自适应挖掘，该元学习挖掘器由一个三层的全连接神经网络构成，该全连接神经网络网络的输入是学生网络的主干网络经多次卷积操作获得的特征图，最终输出是每个样本的初始化权重。在学生分类网络模型中嵌入元学习挖掘器，所述元学习挖掘器由一个三层的全连接神经网络构成，将获取的特征图输入至所述全连接神经网络中，输出每个数据样本的初始化权重。

教师网络的输入是原始未标记图像的加噪图像。教师网络在进行参数更新时通过梯度下降更新学生网络的权重后，教师网络的权重被更新为学生网络权重的指数滑动平均值，教师网络主要用于指引学生网络更好的学习。

生成伪标签数据；

利用已经训练好的教师分类网络对未标记数据进行预测，并与学生网络的预测结果进行MSE损失计算，同时教师网络的参数根据学生网络更新后的参数进行指数滑动平均方式更新进行预测，设定类别的概率T，若是所述标记数据分类某一类别的概率大于阈值T，则对其进行标记，生成伪标签数据，并重新加入到标记数据中，进行新一轮的训练，将所述伪标签数据与原始数据一并再作为输入，进行网络模型的训练。

对于未标记数据，未标记数据输入学生网络中，使用学生网络进行标签预测，并经过SoftMax分类器处理后得到分为某类的概率；如果该未标记数据分到某类的概率大于阈值T，则对其进行标记，并加入到标记数据中。在新一轮的训练过程中，将伪标签数据与原始数据一并作为输入，进行网络模型训练。

步骤4中，计算交叉熵损失

将在学生网络分类模型获得的标记数据特征图，经过平均池化层、全连接层和softmax分类器处理后，获得标记数据的预测类别。将预测类别与真实类别进行交叉熵损失计算，所述真实类别为样本标签：

是有标记数据目标损失函数，表示学生网络；表示有标记样本数据集，是主干网络的网络参数。

教师网络和学生网络分别将未标记数据输入到网络中，经过卷积获得其特征图，将在学生分类网络与教师分类网络模型获得的未标记数据特征图，获得的特征图经过池化层、全连接层和Softmax分类器得到对应的预测结果，将学生网络和教师网络的预测类别做均方差损失计算:

，表示学生网络和教师网络对未标记数据预测结果的目标损失函数，表示教师网络，是学生网络的网络参数，表示教师网络的网络参数。

将交叉熵损失与均方差损失相加，然后与样本自适应加权的输出结果数据样本的权重进行融合计算得到网络模型的总损失：

表示元学习器输出的样本权重，是本网络模型的总损失。

更新网络参数，通过随机梯度下降法更新学生网络的主干网络参数，再基于更新后主干网络的参数优化元学习挖掘器，对于主干网络和元学习挖掘器进行交替优化。在更新完学生网络参数后，利用学生网络的参数通过指数滑动平均（EMA）方式进行教师网络参数更新。

该更新方法为Mean Teacher框架中已有更新教师网络参数的方法：

θTea=αθTea−1+(1−α)θStu

将交叉熵损失和均方差损失加权和做为总损失，重复进行前向传播和反向传播过程，直到达到收敛条件，保存其最小损失值时的网络模型作为最终的训练结果。

输入待测试图像数据到已训练好的网络模型中进行预测，最终网络模型输出计算的最大值所对应的类别做为最终的预测结果。

实施例2

本公开提供一种基于元学习嵌入半监督学习图像分类系统，包括：

上述的系统连接用户端，用户可以进行分类输入操作，实现分类系统的交互。

如图2所示，本公开的实现包括两大部分，用户端以及分类系统，输入待测试的图像集，在分类系统中完成分类判别，获得分类结果并和用户端进行交互。

其中特征向量提取部分包括：构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.一种基于元学习嵌入半监督学习图像分类方法，其特征在于，训练步骤包括：

构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；利用训练好的图像分类模型，获取原始数据样本集中每个图像的CAM，根据CAM获得数据样本重要的特征区域信息，将CAM作为图像加噪的概率图，对图像数据按照获得的加噪概率图进行不同程度的加噪；数据样本在进行重要特征加噪处理之后，将训练样本集中标记数据和未标记数据输入到学生分类网络模型和教师分类网络模型中，首先将标记样本输入到学生分类网络模型的主干网络resnet50中，进行多次卷积操作，提取数据样本的关键特征信息，获取对应的特征图；

将加噪后训练样本集中的样本输入到分类网络模型中，输出每个样本的权重；对数据样本进行自适应加权处理，具体的：在学生分类网络模型中嵌入元学习挖掘器，所述元学习挖掘器由一个三层的全连接神经网络构成，将获取的特征图输入至所述全连接神经网络中，输出每个数据样本的初始化权重；

将在学生网络分类模型获得的标记数据特征图，经过平均池化层、全连接层和softmax分类器处理后，获得标记数据的预测类别；将预测类别与真实类别进行交叉熵损失计算，所述真实类别为样本标签；

教师网络和学生网络分别将未标记数据输入到网络中，经过卷积获得其特征图，将在学生分类网络与教师分类网络模型获得的未标记数据特征图，获得的特征图经过池化层、全连接层和Softmax分类器得到对应的预测结果，将学生网络和教师网络的预测类别做均方差损失计算；

将交叉熵损失与均方差损失相加，然后与样本自适应加权的输出结果数据样本的权重进行融合计算得到网络模型的总损失；

更新网络参数，进行迭代达到收件条件，获得最小损失的半监督网络模型，并利用测试集进行测试，输出图像类别；通过随机梯度下降法更新学生网络的主干网络参数，再基于更新后主干网络的参数优化元学习挖掘器，对于主干网络和元学习挖掘器进行交替优化。

2.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法，其特征在于，数据预处理具体为：将原始图像数据样本中的每个图像的尺寸变换为统一大小，将每种类型的原始图像样本按照比例进行分配划分，组合成训练集、验证集和测试集。

3.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法，其特征在于，对于未标记数据，利用已经训练好的教师分类网络进行预测，设定类别的概率T，若是所述标记数据分类某一类别的概率大于阈值T，则对其进行标记，生成伪标签数据，并重新加入到标记数据中，进行新一轮的训练，将所述伪标签数据与原始数据一并再作为输入，进行网络模型的训练。

4.如权利要求1所述的一种基于元学习嵌入半监督学习图像分类方法，其特征在于，对于所述获得的标记数据特征图，进行平均池化层、全连接层和softmax分类器处理，获得标记数据的预测类别，将所述预测类别与真实类别进行交叉熵损失计算：

是有标记数据目标损失函数，表示学生网络；是学生网络的网络参数，表示有标记样本数据集，是主干网络的网络参数。

5.如权利要求3所述的一种基于元学习嵌入半监督学习图像分类方法，其特征在于，将在教师分类网络模型获得未标记数据特征图，经过处理分别获得对应的预测类别，将学生分类网络和教师分类网络的预测类别做均方差损失计算：

表示学生网络和教师网络对未标记数据预测结果的目标损失函数，表示学生网络，表示教师网络，是学生网络的网络参数，表示教师网络的网络参数。

6.如权利要求5所述的一种基于元学习嵌入半监督学习图像分类方法，其特征在于，计算网络模型损失：

将交叉熵损失与均方差损失相加，然后与所述输出结果数据样本的权重进行融合计算得到网络模型的总损失：

表示元学习器输出的样本权重，是本网络模型的总损失。

7.一种基于元学习嵌入半监督学习图像分类系统，其特征在于，包括：

数据采集处理模块，用于采集不同类型的原始图像数据样本，构建数据集并进行预处理；构建训练样本集，将原始图像数据样本进行重要特征区域加噪，获得重要的特征区域信息；利用训练好的图像分类模型，获取原始数据样本集中每个图像的CAM，根据CAM获得数据样本重要的特征区域信息，将CAM作为图像加噪的概率图，对图像数据按照获得的加噪概率图进行不同程度的加噪；数据样本在进行重要特征加噪处理之后，将训练样本集中标记数据和未标记数据输入到学生分类网络模型和教师分类网络模型中，首先将标记样本输入到学生分类网络模型的主干网络resnet50中，进行多次卷积操作，提取数据样本的关键特征信息，获取对应的特征图；

训练与样本自适应加权模块，用于将加噪后训练样本集中的样本输入到分类网络模型中，输出每个样本的权重；对数据样本进行自适应加权处理，具体的：在学生分类网络模型中嵌入元学习挖掘器，所述元学习挖掘器由一个三层的全连接神经网络构成，将获取的特征图输入至所述全连接神经网络中，输出每个数据样本的初始化权重；

分类模块，用于进行迭代达到收件条件，获得最小损失的半监督网络模型，并利用测试集进行测试，输出图像类别；通过随机梯度下降法更新学生网络的主干网络参数，再基于更新后主干网络的参数优化元学习挖掘器，对于主干网络和元学习挖掘器进行交替优化。