CN114580571B - 一种基于迁移互学习的小样本电力设备图像分类方法 - Google Patents

一种基于迁移互学习的小样本电力设备图像分类方法 Download PDF

Info

Publication number
CN114580571B
CN114580571B CN202210348529.7A CN202210348529A CN114580571B CN 114580571 B CN114580571 B CN 114580571B CN 202210348529 A CN202210348529 A CN 202210348529A CN 114580571 B CN114580571 B CN 114580571B
Authority
CN
China
Prior art keywords
model
classification
base class
image
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210348529.7A
Other languages
English (en)
Other versions
CN114580571A (zh
Inventor
周伯俊
顾菊平
张新松
程天宇
华亮
徐一鸣
赵凤申
赵佳皓
蒋凌
言淳恺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202210348529.7A priority Critical patent/CN114580571B/zh
Publication of CN114580571A publication Critical patent/CN114580571A/zh
Application granted granted Critical
Publication of CN114580571B publication Critical patent/CN114580571B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及小样本图像分类技术领域,尤其涉及一种基于迁移互学习的小样本电力设备图像分类方法,具体包括以下步骤:首先通过旋转、裁剪等方法增强数据集;然后构造两个具有交叉熵损失和自监督损失的互学习小样本迁移模型,同时两个模型的输出相互为另一模型提供互信息损失;最后固定训练好的其中一个模型的主干网络作为特征提取器与新的分类器结合,对新的电力设备类别的图像样本进行分类预测。本发明能够通过两个模型互学习的方式提高主干网络模型特征提取能力,训练后的主干网络可以与多种新的分类器相结合完成对未可见类别样本的分类决策;同时,本发明只需要少量图像数据,即可训练出高精度的分类模型,非常适用于电力设备巡检场景。

Description

一种基于迁移互学习的小样本电力设备图像分类方法
技术领域
本发明涉及小样本图像分类技术领域,尤其涉及一种基于迁移互学习的小样本电力设备图像分类方法。
背景技术
近年来,深度学习技术在诸如图像分类、目标检测和语义分割等计算机视觉任务中取得突破性发展。然而,在训练样本数目非常少的情况下,深度学习模型往往出现过拟合,其性能远远不能令人满意。相比之下,人类视觉只需要少量示例样本就能识别大量物体,并且具有快速理解新概念并将其泛化的能力。在这种强大学习能力的启发下,小样本学习逐渐成为计算机视觉和机器学习领域中的研究热点。
为了保证电力设备的安全可靠运行,电力公司需要对电力设备进行定期巡检。为了减轻人工巡检工作量,电力行业目前已投入大量智能巡检设备,通过人工智能图像处理算法代替人工完成设备巡检。
图像分类任务是电力设备智能巡检的重要一环。传统的人工智能算法需要大量的数据才能训练出较高分类精度的模型。由于电力设备的安全性和敏感性等原因,传统技术很难获得大量的电力设备图像。因此如何通过有限的图像数据集训练出高效的人工智能模型是目前电力设备图像分类的一大挑战。
目前,基于迁移学习的小样本图像分类方法虽然能够解决训练样本不足的问题,但是研究中发现迁移模型在训练过程中仍然存在过拟合现象。为了进一步提高小样本图像分类的性能,寻求一种具有较好泛化性能且适用于电力设备巡检场景的图像分类算法,显得尤为重要。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于迁移互学习的小样本电力设备图像分类方法,该方法能够通过两个模型互学习的方式提高主干网络模型特征提取能力,最后迁移至新的分类器,完成对未可见类别的样本的分类决策;同时,该方法只需要少量图像数据,即可训练出高精度的分类模型,非常适用于电力设备巡检场景。
为了实现上述目的,本发明采用了如下技术方案:
一种基于迁移互学习的小样本电力设备图像分类方法,具体步骤如下:
步骤1、对输入电力设备图像数据进行裁剪、旋转扩充预处理;
步骤2、构建两个互学习的小样本迁移模型T1和T2,模型T1通过参数为θ1的主干网络提取电力设备图像特征,通过参数为
Figure BDA0003578194610000021
的基类分类器进行基类标签预测,通过参数为τ1的旋转分类器进行旋转标签预测;同样地,对于模型T2,其主干网络、基类分类器以及旋转分类器的参数分别为θ2,/>
Figure BDA0003578194610000022
τ2;
步骤3、将预处理后的电力图像样本输入到模型T1和T2中,经过主干网络提取得到d维的特征张量,然后将特征张量传入基类分类器与旋转分类器得到基类分类值和旋转分类值;
步骤4、将T1和T2模型同时进行预训练,计算每个模型对应的交叉熵损失函数LCE和自监督损失函数LSSL以及它们之间的互信息损失函数LKD,从而得到总的损失函数,并基于总损失函数计算梯度分别对T1和T2中的参数进行优化从而完成预训练过程;
步骤5、任意选择T1和T2中的一个模型,将模型的主干网络迁移到新的分类器上,对新的电力设备类别的图像样本进行预测。
优选地,步骤1的具体步骤如下:
步骤1.1、对每个图像分别以图像矩形的四个顶点和中心点为起点,并按图像面积的80%裁剪5次并保存;然后再对扩充后的每个图像分别旋转0°,45°,90°以及180°并保存。
步骤1.2、对来自同一个图像的裁剪和旋转图像赋予原图相同的基类标签,第m个图像对应基类标签为ym,ym∈{1,2,…,Cb},Cb为基类标签类别数量。再
根据其旋转角度确定对应旋转标签为
Figure BDA0003578194610000023
优选地,所述步骤2中,主干网络嵌入GLSCA局部空间注意力模块,该模块通过融合图像每个像素点周围5x5的空间向量信息,更有效地提取电力设备轮廓信息。
优选地,步骤3的具体步骤如下:
步骤3.1、对于模型T1,第m个图像xm经过主干网络提取得到d维的特征表示为fθ1(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure BDA0003578194610000024
和/>
Figure BDA0003578194610000031
分别由下式得到:
Figure BDA0003578194610000032
其中Lφ1与Lτ1分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
步骤3.2、分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure BDA0003578194610000033
其中
Figure BDA0003578194610000034
表示基类分类分值/>
Figure BDA0003578194610000035
的第c个分量,/>
Figure BDA0003578194610000036
表示旋转分类分值/>
Figure BDA0003578194610000037
的第r个分量;p1(ym=c|xm)为模型T1基类分类预测概率值;/>
Figure BDA0003578194610000038
为模型T1旋转分类预测概率值;
步骤3.3、同样对于模型T2,第m个图像xm经过主干网络提取得到d维的特征表示为fθ2(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure BDA0003578194610000039
和/>
Figure BDA00035781946100000310
分别由下式得到:
Figure BDA00035781946100000311
其中Lφ2与Lτ2分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure BDA0003578194610000041
其中
Figure BDA0003578194610000042
表示基类分类分值/>
Figure BDA0003578194610000043
的第c个分量,/>
Figure BDA0003578194610000044
表示旋转分类分值/>
Figure BDA0003578194610000045
的第r个分量;p2(ym=c|xm)为模型T2基类分类预测概率值;/>
Figure BDA0003578194610000046
为模型T2旋转分类预测概率值。
优选地,步骤4的具体步骤如下:
步骤4.1、计算模型T1和T2基于基类分类预测概率值与真实基类标签之间的交叉熵损失函数,其计算公式分别为:
Figure BDA0003578194610000047
其中ymc表示图像样本基类标签ym的第c个分量,M为总训练图片量;
步骤4.2、计算模型T1和T2基于旋转分类预测概率值与真实旋转标签之间的自监督损失函数,其计算公式分别为:
Figure BDA0003578194610000048
其中
Figure BDA0003578194610000049
表示旋转标签/>
Figure BDA00035781946100000410
的第r个分量;
步骤4.3、计算模型T1和T2基类分类器概率输出之间的正则化损失函数,其计算公式分别为:
Figure BDA0003578194610000051
步骤4.4、计算模型T1和T2进行优化的总损失函数,其计算公式分别为:
Figure BDA0003578194610000052
其中α1、β1、λ1、α2、β2、λ2分别为模型T1和T2的超参数,根据训练结果不断微调;
步骤4.5、基于总损失函数计算梯度分别对T1和T2中的参数进行迭代优化从而完成预训练过程。
优选地,步骤5的具体步骤如下:
步骤5.1、任意选择T1和T2中的一个模型,移除模型中的基类分类器和旋转预测分类器,并固定主干神经网络中的参数;
步骤5.2、在新的电力设备类别的图像样本数据中,每类随机抽取5个样本,并通过主干神经网络对其进行特征提取得到新类样本的图像特征张量;
步骤5.3、将图像特征张量送入新的分类器中并结合标签数据进行分类拟合,得到新的分类器参数;
步骤5.4、利用新的分类器对剩余的同类样本进行分类预测。
与现有技术相比,本发明具有以下有益效果:
1、本发明能够通过两个模型互学习的方式提高主干网络模型特征提取能力,最后迁移至新的分类器,完成对未可见类别的样本的分类决策。
2、本发明只需要少量图像数据,即可训练出高精度的分类模型,非常适用于电力设备巡检场景。
附图说明
图1为本发明的总体框架图;
图2为本发明中模型主干网络的特征提取可视化应用实施例示意图。
具体实施方式
下面结合附图将对本发明实施例中的技术方案进行清楚、完整地描述,以使本领域的技术人员能够更好的理解本发明的优点和特征,从而对本发明的保护范围做出更为清楚的界定。本发明所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,一种基于迁移互学习的小样本电力设备图像分类方法,具体步骤如下:
步骤1、对输入电力设备图像数据进行裁剪、旋转扩充预处理;
步骤2、构建两个互学习的小样本迁移模型T1和T2,模型T1通过参数为θ1的主干网络提取电力设备图像特征,通过参数为
Figure BDA0003578194610000062
的基类分类器进行基类标签预测,通过参数为τ1的旋转分类器进行旋转标签预测;同样地,对于模型T2,其主干网络、基类分类器以及旋转分类器的参数分别为θ2,/>
Figure BDA0003578194610000063
τ2;
步骤3、将预处理后的电力图像样本输入到模型T1和T2中,经过主干网络提取得到d维的特征张量,然后将特征张量传入基类分类器与旋转分类器得到基类分类值和旋转分类值;
步骤4、将T1和T2模型同时进行预训练,计算每个模型对应的交叉熵损失函数LCE和自监督损失函数LSSL以及它们之间的互信息损失函数LKD,从而得到总的损失函数,并基于总损失函数计算梯度分别对T1和T2中的参数进行优化从而完成预训练过程;
步骤5、任意选择T1和T2中的一个模型,将模型的主干网络迁移到新的分类器上,对新的电力设备类别的图像样本进行预测。
具体的,步骤1的具体步骤如下:
步骤1.1、对每个图像分别以图像矩形的四个顶点和中心点为起点,并按图像面积的80%裁剪5次并保存;然后再对扩充后的每个图像分别旋转0°,45°,90°以及180°并保存。
步骤1.2、对来自同一个图像的裁剪和旋转图像赋予原图相同的基类标签,第m个图像对应基类标签为ym,ym∈{1,2,…,Cb},Cb为基类标签类别数量。再
根据其旋转角度确定对应旋转标签为
Figure BDA0003578194610000061
具体的,步骤2中,主干网络由Resnet12构成,同时主干网络中嵌入GLSCA局部空间注意力模块,该模块通过融合图像每个像素点周围5x5的空间向量信息,更有效地提取电力设备轮廓信息。模型主干网络对电力设备图像的特征提取可视化结果如图2所示。
具体的,步骤3的具体步骤如下:
步骤3.1、对于模型T1,第m个图像xm经过主干网络提取得到d维的特征表示为fθ1(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure BDA0003578194610000071
和/>
Figure BDA0003578194610000072
分别由下式得到:
Figure BDA0003578194610000073
其中Lφ1与Lτ1分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
步骤3.2、分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure BDA0003578194610000074
/>
其中
Figure BDA0003578194610000075
表示基类分类分值/>
Figure BDA0003578194610000076
的第c个分量,/>
Figure BDA0003578194610000077
表示旋转分类分值/>
Figure BDA0003578194610000078
的第r个分量;p1(ym=c|xm)为模型T1基类分类预测概率值;/>
Figure BDA0003578194610000079
为模型T1旋转分类预测概率值;
步骤3.3、同样对于模型T2,第m个图像xm经过主干网络提取得到d维的特征表示为fθ2(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure BDA00035781946100000710
和/>
Figure BDA00035781946100000711
分别由下式得到:
Figure BDA0003578194610000081
其中Lφ2与Lτ2分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure BDA0003578194610000082
其中
Figure BDA0003578194610000083
表示基类分类分值/>
Figure BDA0003578194610000084
的第c个分量,/>
Figure BDA0003578194610000085
表示旋转分类分值/>
Figure BDA0003578194610000086
的第r个分量;p2(ym=c|xm)为模型T2基类分类预测概率值;/>
Figure BDA0003578194610000087
为模型T2旋转分类预测概率值。
具体的,步骤4的具体描述如下:
步骤4.1、计算模型T1和T2基于基类分类预测概率值与真实基类标签之间的交叉熵损失函数,其计算公式分别为:
Figure BDA0003578194610000088
其中ymc表示图像样本基类标签ym的第c个分量,M为总训练图片量;
步骤4.2、计算模型T1和T2基于旋转分类预测概率值与真实旋转标签之间的自监督损失函数,其计算公式分别为:
Figure BDA0003578194610000089
其中
Figure BDA0003578194610000091
表示旋转标签/>
Figure BDA0003578194610000092
的第r个分量;
步骤4.3、计算模型T1和T2基类分类器概率输出之间的正则化损失函数,其计算公式分别为:
Figure BDA0003578194610000093
步骤4.4、计算模型T1和T2进行优化的总损失函数,其计算公式分别为:
Figure BDA0003578194610000094
其中α1、β1、λ1、α2、β2、λ2分别为模型T1和T2的超参数,根据训练结果不断手动微调;
步骤4.5、基于总损失函数计算梯度分别对T1和T2中的参数进行迭代优化从而完成预训练过程。
具体的,步骤5的具体步骤如下:
步骤5.1、任意选择T1和T2中的一个模型,移除模型中的基类分类器和旋转预测分类器,并固定主干神经网络中的参数。
步骤5.2、在新的电力设备类别的图像样本数据中,每类随机抽取5个样本,并通过主干神经网络对其进行特征提取得到新类样本的图像特征张量。
步骤5.3、将图像特征张量送入新的分类器中并结合标签数据进行分类拟合,得到新的分类器参数。
步骤5.4、利用新的分类器对剩余的同类样本进行分类预测。新的分类器可以从KNN、SVM、Cosine、LinearRegression等分类器中择优选择。
综上所述,本发明能够通过两个模型互学习的方式提高主干网络模型特征提取能力,最后迁移至新的分类器,完成对未可见类别的样本的分类决策;同时,本发明只需要少量图像数据,即可训练出高精度的分类模型,非常适用于电力设备巡检场景。
本发明中披露的说明和实践,对于本技术领域的普通技术人员来说,都是易于思考和理解的,且在不脱离本发明原理的前提下,还可以做出若干改进和润饰。因此,在不偏离本发明精神的基础上所做的修改或改进,也应视为本发明的保护范围。

Claims (1)

1.一种基于迁移互学习的小样本电力设备图像分类方法,其特征在于,具体步骤如下:
步骤1、对输入电力设备图像数据进行裁剪、旋转扩充预处理;
步骤2、构建两个互学习的小样本迁移模型T1和T2,模型T1通过参数为θ1的主干网络提取电力设备图像特征,通过参数为
Figure FDA0004151726880000011
的基类分类器进行基类标签预测,通过参数为τ1的旋转分类器进行旋转标签预测;同样地,对于模型T2,其主干网络、基类分类器以及旋转分类器的参数分别为θ2,/>
Figure FDA0004151726880000012
τ2;
步骤3、将预处理后的电力图像样本输入到模型T1和T2中,经过主干网络提取得到d维的特征张量,然后将特征张量传入基类分类器与旋转分类器得到基类分类值和旋转分类值;
步骤4、将T1和T2模型同时进行预训练,计算每个模型对应的交叉熵损失函数LCE和自监督损失函数LSSL以及它们之间的互信息损失函数LKD,从而得到总损失函数,并基于总损失函数计算梯度分别对T1和T2中的参数进行优化从而完成预训练过程;
步骤5、任意选择T1和T2中的一个模型,将模型的主干网络迁移到新的分类器上,对新的电力设备类别的图像样本进行预测;
步骤1的具体步骤如下:
步骤1.1、对每个图像分别以图像矩形的四个顶点和中心点为起点,并按图像面积的80%裁剪5次并保存;然后再对扩充后的每个图像分别旋转0°,45°,90°以及180°并保存;
步骤1.2、对来自同一个图像的裁剪和旋转图像赋予原图相同的基类标签,第m个图像对应基类标签为ym,ym∈{1,2,…,Cb},Cb为基类标签类别数量,再根据其旋转角度确定对应旋转标签为
Figure FDA0004151726880000013
Figure FDA0004151726880000014
所述步骤2中,主干网络由Resnet12构成,主干网络嵌入GLSCA局部空间注意力模块,该模块通过融合图像每个像素点周围5x5的空间向量信息;
步骤3的具体步骤如下:
步骤3.1、对于模型T1,第m个图像xm经过主干网络提取得到d维的特征表示为fθ1(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure FDA0004151726880000015
和/>
Figure FDA0004151726880000021
分别由下式得到:
Figure FDA0004151726880000022
其中Lφ1与Lτ1分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
步骤3.2、分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure FDA0004151726880000023
/>
其中
Figure FDA0004151726880000024
表示基类分类分值/>
Figure FDA0004151726880000025
的第c个分量,/>
Figure FDA0004151726880000026
表示旋转分类分值/>
Figure FDA0004151726880000027
的第r个分量;p1(ym=c|xm)为模型T1基类分类预测概率值;/>
Figure FDA0004151726880000028
为模型T1旋转分类预测概率值;
步骤3.3、同样对于模型T2,第m个图像xm经过主干网络提取得到d维的特征表示为fθ2(xm),基类预测分类器和旋转预测分类器对特征的分类分值表示为
Figure FDA0004151726880000029
和/>
Figure FDA00041517268800000210
分别由下式得到:
Figure FDA00041517268800000211
其中Lφ2与Lτ2分别表示基类预测分类器和旋转预测分类器,分类器由不同的全连接网络组成;
分类分值经过Sofmax层被转化为基类分类和旋转分类预测概率值,其计算公式分别为:
Figure FDA0004151726880000031
其中
Figure FDA0004151726880000032
表示基类分类分值/>
Figure FDA0004151726880000033
的第c个分量,/>
Figure FDA0004151726880000034
表示旋转分类分值/>
Figure FDA0004151726880000035
的第r个分量;p2(ym=c|xm)为模型T2基类分类预测概率值;/>
Figure FDA0004151726880000036
为模型T2旋转分类预测概率值;
步骤4的具体步骤如下:
步骤4.1、计算模型T1和T2基于基类分类预测概率值与真实基类标签之间的交叉熵损失函数,其计算公式分别为:
Figure FDA0004151726880000037
其中ymc表示图像样本基类标签ym的第c个分量,M为总训练图片量;
步骤4.2、计算模型T1和T2基于旋转分类预测概率值与真实旋转标签之间的自监督损失函数,其计算公式分别为:
Figure FDA0004151726880000038
其中
Figure FDA0004151726880000039
表示旋转标签/>
Figure FDA00041517268800000310
的第r个分量;/>
步骤4.3、计算模型T1和T2基类分类器概率输出之间的正则化损失函数,其计算公式分别为:
Figure FDA0004151726880000041
步骤4.4、计算模型T1和T2进行优化的总损失函数,其计算公式分别为:
Figure FDA0004151726880000042
其中α1、β1、λ1、α2、β2、λ2分别为模型T1和T2的超参数,根据训练结果不断微调;p1为模型T1的基类分类和旋转分类的预测概率值,p2为模型T2的基类分类和旋转分类的预测概率值;ym为第m个图像对应基类标签,xm为第m个图像;LCE1为模型T1基于基类分类预测概率值与真实基类标签之间的交叉熵损失函数,LCE2为模型T2基于基类分类预测概率值与真实基类标签之间的交叉熵损失函数;
LKD(p2|p1)为模型T1对模型T2的正则化损失函数,LKD(p1|p2)为模型T2对模型T1的正则化损失函数;
L(θ1,φ1,τ1)为模型T1的总损失函数,L(θ2,φ2,τ2)为模型T2的总损失函数;
步骤4.5、基于总损失函数计算梯度分别对T1和T2中的参数进行迭代优化从而完成预训练过程;
步骤5的具体步骤如下:
步骤5.1、任意选择T1和T2中的一个模型,移除模型中的基类分类器和旋转预测分类器,并固定主干神经网络中的参数;
步骤5.2、在新的电力设备类别的图像样本数据中,每类随机抽取5个样本,并通过主干神经网络对其进行特征提取得到新类样本的图像特征张量;
步骤5.3、将图像特征张量送入新的分类器中并结合标签数据进行分类拟合,得到新的分类器参数;
步骤5.4、利用新的分类器对剩余的同类样本进行分类预测,新的分类器从KNN、SVM、Cosine、Linear Regression分类器中择优选择。
CN202210348529.7A 2022-04-01 2022-04-01 一种基于迁移互学习的小样本电力设备图像分类方法 Active CN114580571B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210348529.7A CN114580571B (zh) 2022-04-01 2022-04-01 一种基于迁移互学习的小样本电力设备图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210348529.7A CN114580571B (zh) 2022-04-01 2022-04-01 一种基于迁移互学习的小样本电力设备图像分类方法

Publications (2)

Publication Number Publication Date
CN114580571A CN114580571A (zh) 2022-06-03
CN114580571B true CN114580571B (zh) 2023-05-23

Family

ID=81779339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210348529.7A Active CN114580571B (zh) 2022-04-01 2022-04-01 一种基于迁移互学习的小样本电力设备图像分类方法

Country Status (1)

Country Link
CN (1) CN114580571B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188888A (zh) * 2022-12-14 2023-05-30 北京百度网讯科技有限公司 目标检测模型的训练方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348792A (zh) * 2020-11-04 2021-02-09 广东工业大学 一种基于小样本学习和自监督学习的x光胸片图像分类方法
CN112784921A (zh) * 2021-02-02 2021-05-11 西北工业大学 任务注意力引导的小样本图像互补学习分类算法
CN113963165A (zh) * 2021-09-18 2022-01-21 中国科学院信息工程研究所 一种基于自监督学习的小样本图像分类方法及系统
CN114219804A (zh) * 2022-02-22 2022-03-22 汉斯夫(杭州)医学科技有限公司 一种基于原型分割网络的小样本牙齿检测方法及存储介质
CN114255371A (zh) * 2021-12-21 2022-03-29 中国石油大学(华东) 一种基于组件监督网络的小样本图像分类方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169527B (zh) * 2017-06-06 2020-04-03 西北工业大学 基于协同深度学习的医学图像分类方法
CN111767711B (zh) * 2020-09-02 2020-12-08 之江实验室 基于知识蒸馏的预训练语言模型的压缩方法及平台
CN113034483B (zh) * 2021-04-07 2022-06-10 昆明理工大学 基于深度迁移学习的烟支缺陷检测方法
CN112926696A (zh) * 2021-04-20 2021-06-08 江苏大学 一种基于注意力图的可解释局部迁移互学习方法
CN113761259A (zh) * 2021-04-29 2021-12-07 腾讯科技(深圳)有限公司 一种图像处理方法、装置以及计算机设备
CN114021285B (zh) * 2021-11-17 2024-04-12 上海大学 基于相互局部对抗迁移学习的旋转机械故障诊断方法
CN114092747A (zh) * 2021-11-30 2022-02-25 南通大学 基于深度元度量模型互学习的小样本图像分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348792A (zh) * 2020-11-04 2021-02-09 广东工业大学 一种基于小样本学习和自监督学习的x光胸片图像分类方法
CN112784921A (zh) * 2021-02-02 2021-05-11 西北工业大学 任务注意力引导的小样本图像互补学习分类算法
CN113963165A (zh) * 2021-09-18 2022-01-21 中国科学院信息工程研究所 一种基于自监督学习的小样本图像分类方法及系统
CN114255371A (zh) * 2021-12-21 2022-03-29 中国石油大学(华东) 一种基于组件监督网络的小样本图像分类方法
CN114219804A (zh) * 2022-02-22 2022-03-22 汉斯夫(杭州)医学科技有限公司 一种基于原型分割网络的小样本牙齿检测方法及存储介质

Also Published As

Publication number Publication date
CN114580571A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN110569901B (zh) 一种基于通道选择的对抗消除弱监督目标检测方法
CN111259786B (zh) 一种基于视频的外观和运动信息同步增强的行人重识别方法
CN108648233B (zh) 一种基于深度学习的目标识别与抓取定位方法
CN110414368B (zh) 一种基于知识蒸馏的无监督行人重识别方法
CN109508663B (zh) 一种基于多层次监督网络的行人重识别方法
CN111126360A (zh) 基于无监督联合多损失模型的跨域行人重识别方法
CN114241282A (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN112733656B (zh) 基于多流空间注意力图卷积sru网络的骨架动作识别方法
CN113177132B (zh) 基于联合语义矩阵的深度跨模态哈希的图像检索方法
CN113657267B (zh) 一种半监督行人重识别方法和装置
CN111488760A (zh) 基于深度多示例学习的少样本行人重识别方法
Liang et al. A 3D object recognition and pose estimation system using deep learning method
CN114580571B (zh) 一种基于迁移互学习的小样本电力设备图像分类方法
Xu et al. Task-aware meta-learning paradigm for universal structural damage segmentation using limited images
CN113011568A (zh) 一种模型的训练方法、数据处理方法及设备
Jemilda et al. Moving object detection and tracking using genetic algorithm enabled extreme learning machine
CN114782752B (zh) 基于自训练的小样本图像集成分类方法及装置
Kumar et al. Detection of concrete cracks using dual-channel deep convolutional network
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
Yin Object Detection Based on Deep Learning: A Brief Review
CN114463340A (zh) 一种边缘信息引导的敏捷型遥感图像语义分割方法
Yang et al. A novel robotic grasp detection technique by integrating yolo and grasp detection deep neural networks
CN116543192A (zh) 一种基于多视角特征融合的遥感图像小样本分类方法
CN116543432A (zh) 一种基于辅助网络的高效人脸检测方法
Langenkämper et al. COATL-a learning architecture for online real-time detection and classification assistance for environmental data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant