CN115272777A - 面向输电场景的半监督图像解析方法 - Google Patents
面向输电场景的半监督图像解析方法 Download PDFInfo
- Publication number
- CN115272777A CN115272777A CN202211169230.1A CN202211169230A CN115272777A CN 115272777 A CN115272777 A CN 115272777A CN 202211169230 A CN202211169230 A CN 202211169230A CN 115272777 A CN115272777 A CN 115272777A
- Authority
- CN
- China
- Prior art keywords
- model
- semi
- power transmission
- data
- supervised
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7753—Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及输电线路巡检技术领域,具体涉及一种面向输电场景的半监督图像解析方法,包括以下步骤:S1:数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;S2:数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和模型优化训练,将参数化后的混合数据增广策略融入到判别模型中;S3:半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的模型,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;S4:获取S3中预训练好的模型参数,在输电线路图像解析的下游任务中测试效果。
Description
技术领域
本发明涉及输电线路巡检技术领域,具体涉及面向输电场景的半监督图像解析方法。
背景技术
本发明背景技术中公开的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
电网是关系国计民生和国家能源安全的重要基础设施,由于外力破坏具有相当大的隐蔽性和随意性,人工巡检的工作方式很容易受地形复杂、环境复杂、气候复杂等客观因素限制且难以及时应对并处理突发事件。其中基于人工智能技术的自动监测巡检技术目前已经成为各大电网的重要巡检方式,“自动监测巡检为主,人工巡检为辅”业务已发展成为我国输电线路巡检的主要运维模式。
通常来说,对于深度学习技术,训练集包含的数据量越多、种类越丰富、标注数据的质量越高,在这个数据集上训练出来的神经网络模型的鲁棒性也就越强;现有技术中,通常采用半监督学习方法对输电线路进行检测,在半监督学习中,伪标签是一个很重要的技术。然而,随着模型训练而产生的伪标签往往伴随着大量错误标注,传统的解决方案是设定一个高而固定的阈值,筛选出置信度高的伪标签,然而固定阈值却影响了模型的鲁棒性和训练效率。
因此,尽管传统的半监督学习方法已在开放数据集上取得了足以媲美标准监督学习的性能表现,但若将传统半监督学习方法应用于与开放数据集相比噪声更大、类别更不平衡的目标数据集上时,将会暴露出模型鲁棒性低,训练效率低下,对模型初始化参数敏感等问题,从而严重影响模型的性能发挥。
发明内容
针对现有技术中存在的问题,本发明提供一种面向输电场景的半监督图像解析方法。
为了达到以上目的,本发明采取以下技术方案:
一种面向输电场景的半监督图像解析方法,包括以下步骤:
S1,数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;
S2,数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和判别模型中特征提取模块的优化训练,将参数化后的混合数据增广策略融入到判别模型中;
S3,半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的特征提取模块,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;
S4,获取S3中预训练好的特征提取模块参数,在输电线路图像解析的下游任务中测试效果。
进一步地,进行数据增广和判别模型中特征提取模块优化训练的主要过程包括以下步骤:
S21:构建动态参数混合数据增广网络的图片增广混合函数;
S22:构建动态参数混合数据增广网络的混合块;
S23,利用深度神经网络作为判别模型以提取图像特征并对图像进行分类,判别模型是由特征提取模块和分类头组成,特征提取模块提取的特征信息传递给分类头,分类头依据特征信息完成分类任务;将该深度神经网络作为动态参数混合数据增广网络的分类器模块,与混合模块共同构成动态参数混合数据增广网络;
S24:首先,将输电场景下采集的真实图像送入S23中的特征提取模块,特征提取模块提取这些图片的特征做成特征字典,然后将特征字典将传入S22中的混合块,混合块根据特征字典,使用提取好的特征组合生成新的训练数据集,将新的训练数据集传给S23中的特征提取模块进行训练,直到模型收敛。
进一步地,先对特征提取模块进行训练,然后单独训练混合模块,最后让特征提取模块和混合块一起训练,直至模型收敛。
进一步地,在步骤S3中,还包括以下步骤:
S31,通过将有标注数据用于标准交叉熵损失得到监督损失;
S32,对无标注样例生成临时伪标签,将所述伪标签用于标准交叉熵损失得到无监督损失;
S33,步骤S31中的监督损失和S32中的无监督损失通过一致性正则化算法进行半监督训练。
进一步地,在步骤S32中,还包括以下步骤:
S321,在给定无标注图像的弱增强版本的情况下计算其预测概率;
S322,对S321中得到的预测概率进行硬化操作得到伪标签;
S323,对S322中的伪标签进行择优操作;
S324,从S323中得到的伪标签按照比例r选出更优样本参与模型的优化;
进一步地,标准交叉熵损失函数如下:
进一步地,S321中得到的预测概率为:
所述伪标签为:
步骤S323中的伪标签进行择优操作为:
进一步地,S4包括以下步骤:
S41:加载在S3中预训练好的深度神经网络的模型参数,保留该模型的主体架构部分,去除该模型的最后一层输出作为特征提取器;
S42:构建新的网络结构;将原网络中的特征提取模块替换预训练好的特征提取器;
S43:使用新的网络结构进行测试。
进一步地,步骤S21中,动态参数混合数据增广网络的图片增广混合函数如下:
其中是逐元素点乘, 为混合比例,表示嵌入了混合比例信息的层特
征,和分别表示不同信息(和 )的层特征;为中间层的样本特征,为
计算样本之间关系的函数,是在给定输入的条件下,通过S22中混合块学习得到;
模型在给定输入的前提下,经过函数的作用,得到增广之后的图片。
本发明有益效果:本发明采用自主构建的输电线路数据集,充分学习和挖掘输电线路中存在各类隐患物体的视觉特征,并通过提出一种动态参数混合数据的增广技术,形成一个完整的数据与模型相互学习的闭环系统,数据随模型变化,模型随数据更新的双层优化问题来增强数据样本的多样性,从而保证检测模型具有鲁棒性。
本发明针对输电线路场景标注人力物力成本过大的问题和传统半监督学习中设定的固定高阈值带来的数据利用率不高、模型鲁棒性不好的问题,提出一种叫最优队列的标签筛选策略替换传统的固定高阈值策略,来选取那些置信度高的伪标签去计算无监督损失,进一步提高模型的泛化性和准确率。
通过基于动态参数混合数据增广技术和应用于半监督学习的高置信度样本筛选策略,在仅有少量标注数据训练情况下,构建了精度与速度方面都具有优势的模型。
附图说明
图1为基于动态参数混合数据增广和队列优化的鲁棒半监督方法的流程示意图;
图2为动态参数混合数据增广框架示意图;
图3队列优化的鲁棒半监督学习算法示意图;
图4为最优队列内部操作示意图。
具体实施方式
下面结合具体实施例和附图对本发明作进一步说明。
本发明提出了一种面向输电场景的半监督图像解析方法,包括以下步骤(整体的流程示意图参见附图1):
S1:数据预处理:人工少量标注输电线路场景的分类数据集和目标检测数据集;
S2: 使用动态参数混合数据增广框架(如图2所示)对少量有标注数据集进行数据增广和模型优化训练;这是一个不同于固定的数据增广策略的模式-独立于模型的优化,该过程将参数化后的混合(mixup)数据增广策略融入到判别模型中,形成一个完整的数据与模型相互学习的闭环系统,即同时学习混合样本的生成任务和判别任务。这是一个数据随模型变化,模型随数据更新的双层优化问题;判别模型由特征提取模块和分类头组成;
S3: 基于S1中获得的少量有标注数据、相对大量的无标注数据和S2中经过动态参数混合数据增广优化的模型,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失,以期取得相较传统半监督方法更好的模型泛化性与准确率;
S4: 获取S3中预训练好的模型参数,在输电线路图像解析的下游任务中测试效果。这里以构建目标检测任务为例,使用Faster R-CNN模型,采用预训练+调参的模式,实现参数和模型迁移。其中Backbone模块使用S3步骤中预训练好的分类模型。结合微调的方法,输入用少量有标注的目标检测数据集,冻结Backbone模块,训练Faster R-CNN目标检测模型,以获得更精确的输电线路目标检测的效果。
进一步地,所述步骤S1数据预处理的过程还包括:
S11:采用输电线路上高清摄像头,针对九类输电线路隐患物体采集的照片;并根据其图片内容做好类别标注;此数据集作为训练分类模型的数据集;
S12: 使用标注工具对固定尺度的图像数据进行人工标注,标注塔吊、卡车、防尘网、推土机、挖掘机、汽车起重机、烟、火和水泥搅拌机九种存在对输电线路造成隐患的物体,每张图片对应一个json格式的标注文件,再按照COCO数据集格式将所有标注文件转换为一个总的标注文件;此数据集作为图像解析下游任务微调的数据集。
进一步地,所述步骤S2使用动态参数混合数据增广框架对少量有标注数据进行数据增广和模型优化训练的过程还包括:
S21:本发明设计的动态参数混合数据增广网络的图片增广混合函数如下:
其中是逐元素点乘, 为混合比例,表示嵌入了混合比例信息的层特
征,和分别表示不同信息(和 )的层特征;为中间层的样本特征,
为计算样本之间关系的函数,是在给定输入的条件下,通过S22中混合块学习得
到;模型在给定输入的前提下,经过函数的作用,得到增广之后的图片;增广之
后的图片可以有效的训练分类器,分类器训练的结果也会影响函数,对函数进行优
化;分类器和函数相互促进彼此优化,在真实输电场景下应用时,可以使得分类器更加
快速的收敛,同时也可以增加其鲁棒性;
动态参数混合数据增广网络的混合块的输入是来自特征字典的两个特征和,以及混合比例;两个特征分别经过一个1x1的卷积核,改变其尺寸,使得两个特征保持相同的尺寸;之后分别经过线性变化矩阵的变换,是共享参数的线性变换矩阵,其参数是经过上述神经网络学习梯度优化后的参数,然后两矩阵相乘经过函数把结果作为的输入(见公式);同时特征直接经过一个1x1卷积,然后进线性变化矩阵,把结果和的输出进行矩阵乘法;最后把结果经过一个变化得到最后的输出;
S23: 利用深度神经网络作为判别模型,判别模型是由特征提取模块和分类头组成,构建了一个Resnet50结构的神经网络模型作为特征提取模块,该特征提取模块由若干卷积块通过残差连接的方式构成,卷积块可以提取图片中的特征信息,例如当我们输入一张人脸图片时,较为低层的卷积会提取出图片中的纹理,颜色等特征,但是随着网络加深,卷积视野变大变可以提取出类似眼睛,耳朵等的图片特征,最后将特征提取模块提取的特征信息传递给分类头,分类头依据特征信息完成最后的分类任务;这里的特征提取模块可以有多种主干网络选择,并不局限于Restnet50结构,它们目的是为了提取图像特征,然后通过分类头对图像进行分类;将该网络作为动态参数混合数据增广网络的分类器模块,与混合模块一起构成整个动态参数混合数据增广网络;
S24:首先,将输电场景下由各种摄影设备所采集的真实图像送入特征提取模块,特征提取模块将会提取这些图片的特征,将训练数据分别提取特征之后做成特征字典,然后特征字典将被传入混合块,混合块根据特征字典,使用提取好的特征组合生成新的训练图片和训练标签,这些新的数据集合又将传递给特征提取模块进行训练,直到模型收敛;训练刚刚开始时,可以先对特征提取模块进行训练,当特征提取模块有一定的特征提取能力之后,将特征提取模块冻住不进行梯度计算;单独训练混合模块,由于混合模块比较简单,故而仅仅只需要几个批次的训练即可有较好的性能;此时在让特征提取模块和混合块一起训练,直至模型收敛。
进一步地,在步骤S3中,将在少量的有标注数据与大量的无标注数据之上以半监督的方式训练模型,此处的数据特指输电场景下由摄影设备采集的各种图像,模型的目标任务是对所有的数据进行图像分类。通过这样的训练,将取得一个良好的特征提取器,在产生有限的源数据变更或业务目标改变时,它可以较快且较好地以微调等方式适应新的任务。需要注意的是,虽然传统的半监督训练方法,已在开放数据集上取得了相当优秀的分类效果,但仍存在模型鲁棒性低,训练效率低下,对模型初始化参数敏感等问题,特别是针对输电场景下的真实图片来说。本发明提出了基于最优队列的标签筛选策略加以改进,可以较好地增强模型鲁棒性,提高模型的训练效率,降低其对初始化的敏感程度。在此步骤中,有标注数据的来源有二,分别是以人工形式标注的少量数据,以及以数据增广形式生成的数据;无标注数据则全部来源于从真实的输电作业场景中采集得到但并未人工标注的数据。无论是有标注数据还是无标注数据,都将采用一致的预处理。同时,要求在S1和S2中完成所有的数据准备工作。
进一步地,S3中背景知识与符号引入:在这一部分将在引入要使用的符号的同时,补充与半监督算法密切相关的常识性知识;
对于一个类的分类问题,令为一批共计个的标注示例,其
中是训练样例,指的是输电场景下的真实图片,是以形式存储的标签,指的是
经由人工标注产生或S2生成的类别信息;令为一批共计个的无标注
示例,指的是因各种原因无法标注的输电场景图像;其中是确定和的相对大小的超参
数;设 是模型为输入生成标签的预测概率;例如其中两个概率和之间的交
叉熵是;在训练模型时,对样例分别应用强增强与弱增强,对应于和;具体
的增强形式可以在实际应用时,视实验的具体效果和数据的固有特点而定,在此处,仅要求
强增强应该具有比弱增强幅度更大的图像改变程度,比如空间上更大的扭曲,色彩上更大
的失真等;
一致性正则化算法是半监督算法的重要组成部分;其利用无标注的数据,依赖于模型在输入同一图像的扰动版本时应该输出相似预测的假设;模型通过与标准监督损失相一致的损失函数进行训练:
其中,是择优函数,将从产生了初步预测概率的样本中选出
符合期望的样本;为简单起见,假设应用于概率分布会产生有效的概率分
布;硬标签的使用使得伪标签与熵最小化密切相关,其中鼓励模型的预测是对无标注数据
的低熵,即高置信度;
将每个无标注的样例通过网络,生成一个临时的伪标签,然后将其用于标准交叉熵损失;为了获得这个伪标签,首先在给定无标注图像的弱增强版本的情况下计算其预测概率: ;然后,使用作为伪标签,在对的强增强版本的模型输出强制交叉熵损失之前,需要先进行一个重要的择优步骤:
其中,是预定义的择优函数,具体的,将维护一个包含所有或者部分无标
签样本的队列,队列中的样本将按照其最大预测概率进行降序排序,将前部的数据(最大预
测概率较高的那些)认为是符合期望的样本数据,通过函数的另一个参数,预定义比例值,
将从所有样本中选出比例为的较优样本参与模型的优化,并在整个训练过程中,随着的
变化以实现样本选择的动态策略;实际上,这一择优方式是的方法与传统半监督方法的重
要区别之一,其优势是可以显著增强模型的鲁棒性,降低其对初始化参数的敏感程度,并在
一定程度上改善模型的训练效率,尤其是在输电场这样一个明显区别于开放数据集的特殊
场景中;将最优化的目标损失定义为 ,是一个固定的标量超参数,表示无标注
损失的相对权重;
对半监督训练过程的伪码表述如下:
算法名称:算法3-1 队列优化的鲁棒半监督学习
1:进行有监督的训练,计算交叉熵损失:
3:循环结束后,使用作为伪标签,在对的强增强版本的模型输出强制
交叉熵损失之前,需要先进行一个重要的择优步骤,使用预定义的择优函数和预
定义比例值 ,从所有样本中选出比例为的较优样本参与模型的优化;即:
关于队列优化的鲁棒半监督学习算法的直观图示以及最优队列的内部操作示意图,请参见附图3和附图4。
进一步地,所述步骤S4采用预训练+调参的模式,实现参数和模型迁移;在输电线路图像解析的下游任务中测试,以目标检测Faster R-CNN模型为例;
S41:加载在S3中预训练好的深度神经网络(ResNet50)的模型参数,保留该模型的主体架构部分,去除该模型的最后一层输出作为特征提取器;该特征提取器可以运用到任意需要特征提取的网络架构当中,本专利中将该特征提取器应用于需要进行目标检测的场景下,以Faster R-CNN结构为例作为下游任务的测试模型;
S42:构建Faster R-CNN网络结构;将原网络中的特征提取模块替换为预训练好的特征提取器;
S43:在模型训练中特征提取器将不进行梯度计算;少量数据集经过特征提取器生成特征字典,特征字典通过分类器和锚框预测网络最终生成目标检测的结果;其中分类器和锚框预测网络使用原始Faster R-CNN中的架构,并对其进行梯度计算;经过多轮迭代直到模型收敛。
本发明解决了以下问题:
(1)如何构建输电线路巡检数据集并进行动态参数混合数据增广。因为目前没有开源的输电线路巡检的数据,需要基于安装在输电线路的高清摄像头进行数据集的自主采集并进行人工标注。针对这一问题,本发明拟使用基于动态参数混合增强的技术对有标注数据进行增广,建立一个完整的数据与模型相互学习的闭环系统,并设计一种策略能够精确定位目标区域并准确生成混合样本,而且在一定程度上减少了额外计算成本,提高了训练效率。针对大量因各种原因无法标注的样本,本发明将使用队列改良的半监督学习技术加以充分利用,以期达到媲美完全监督学习的性能。构建了充足、完整的输电线路场景数据集。
(2)如何改进现有的半监督学习框架,提高无标签数据的利用率和模型的鲁棒性。本发明将提出一种基于最优队列的标签筛选策略改良现有的半监督学习方法,此举将可以较好地增强模型鲁棒性,提高模型的训练效率,降低其对初始化的敏感程度。
本发明针对输电线路场景标注人力物力成本过大的问题和传统半监督学习中设定的固定高阈值带来的数据利用率不高、模型鲁棒性不好的问题,提出一种叫最优队列的标签筛选策略替换传统的固定高阈值策略,来选取那些置信度高的伪标签去计算无监督损失,进一步提高模型的泛化性和准确率。通过基于动态参数混合数据增广技术和应用于半监督学习的高置信度样本筛选策略,在仅有少量标注数据训练情况下,构建了精度与速度方面都具有优势的模型。
本发明采用预训练+调参的模式,针对图像解析的下游任务,实现参数和模型迁移。本发明以采用高精度的Faster R-CNN检测模型为例,主干网络采用上述技术预训练的ResNet50网络,并加入特征金字塔来捕捉不同尺度的特征信息,取得了在输电场景外患识别任务中不错的效果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种面向输电场景的半监督图像解析方法,其特征在于,包括以下步骤:
S1,数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;
S2,数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和判别模型中特征提取模块的优化训练,将参数化后的混合数据增广策略融入到判别模型中;
S3,半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的特征提取模块,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;
S4,获取S3中预训练好的特征提取模块参数,在输电线路图像解析的下游任务中测试效果。
2.根据权利要求1所述面向输电场景的半监督图像解析方法,其特征在于,数据集的增广和模型优化训练的主要过程包括以下步骤:
S21,构建动态参数混合数据增广网络的图片增广混合函数;
S22,构建动态参数混合数据增广网络的混合块;
S23,利用深度神经网络作为判别模型以提取图像特征并对图像进行分类,判别模型是由特征提取模块和分类头组成,特征提取模块提取的特征信息传递给分类头,分类头依据特征信息完成分类任务;将该深度神经网络作为动态参数混合数据增广网络的分类器模块,与混合模块共同构成动态参数混合数据增广网络;
S24,首先,将S1中的输电场景下采集的真实图像送入S23中的特征提取模块,特征提取模块提取这些图片的特征做成特征字典,然后将特征字典将传入S22中的混合块,混合块根据特征字典,使用提取好的特征组合生成新的训练数据集,将新的训练数据集传给S23中的特征提取模块进行训练,直到模型收敛。
3.根据权利要求2所述面向输电场景的半监督图像解析方法,其特征在于,先对特征提取模块进行训练,然后单独训练混合模块,最后让特征提取模块和混合块一起训练,直至模型收敛。
4.根据权利要求2所述面向输电场景的半监督图像解析方法,其特征在于,在步骤S3中,还包括以下步骤:
S31,通过将有标注数据用于标准交叉熵损失得到监督损失;
S32,对无标注样例生成临时伪标签,将所述伪标签用于标准交叉熵损失得到无监督损失;
S33,步骤S31中的监督损失和S32中的无监督损失通过一致性正则化算法进行半监督训练。
8.根据权利要求6所述面向输电场景的半监督图像解析方法,其特征在于,S4包括以下步骤:
S41,加载在S3中预训练好的深度神经网络的模型参数,保留该模型的主体架构部分,去除该模型的最后一层输出作为特征提取器;
S42,构建新的网络结构;将原网络中的特征提取模块替换预训练好的特征提取器;
S43,使用新的网络结构进行测试。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211169230.1A CN115272777B (zh) | 2022-09-26 | 2022-09-26 | 面向输电场景的半监督图像解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211169230.1A CN115272777B (zh) | 2022-09-26 | 2022-09-26 | 面向输电场景的半监督图像解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115272777A true CN115272777A (zh) | 2022-11-01 |
CN115272777B CN115272777B (zh) | 2022-12-23 |
Family
ID=83756449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211169230.1A Active CN115272777B (zh) | 2022-09-26 | 2022-09-26 | 面向输电场景的半监督图像解析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115272777B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894985A (zh) * | 2023-09-08 | 2023-10-17 | 吉林大学 | 半监督图像分类方法及半监督图像分类系统 |
CN117347803A (zh) * | 2023-10-25 | 2024-01-05 | 爱科特科技(海南)有限公司 | 一种局部放电检测方法、系统、设备及介质 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180336471A1 (en) * | 2017-05-19 | 2018-11-22 | Mehdi Rezagholizadeh | Semi-supervised regression with generative adversarial networks |
US20200125897A1 (en) * | 2018-10-18 | 2020-04-23 | Deepnorth Inc. | Semi-Supervised Person Re-Identification Using Multi-View Clustering |
CN111222648A (zh) * | 2020-01-15 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 半监督机器学习优化方法、装置、设备及存储介质 |
CN111753874A (zh) * | 2020-05-15 | 2020-10-09 | 江苏大学 | 一种结合半监督聚类的图像场景分类方法及系统 |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
CN112926547A (zh) * | 2021-04-13 | 2021-06-08 | 北京航空航天大学 | 飞行器电信号分类和识别的小样本迁移学习方法 |
CN113077388A (zh) * | 2021-04-25 | 2021-07-06 | 中国人民解放军国防科技大学 | 一种数据增广的深度半监督超限学习图像分类方法及系统 |
CN113254599A (zh) * | 2021-06-28 | 2021-08-13 | 浙江大学 | 一种基于半监督学习的多标签微博文本分类方法 |
CN113378632A (zh) * | 2021-04-28 | 2021-09-10 | 南京大学 | 一种基于伪标签优化的无监督域适应行人重识别算法 |
CN113420786A (zh) * | 2021-05-31 | 2021-09-21 | 杭州电子科技大学 | 一种特征混合图像的半监督分类方法 |
CN113920339A (zh) * | 2021-12-15 | 2022-01-11 | 智洋创新科技股份有限公司 | 一种基于深度学习的输电线路通道隐患中吊车误告警方法 |
CN113989549A (zh) * | 2021-10-21 | 2022-01-28 | 神思电子技术股份有限公司 | 一种基于伪标签的半监督学习图像分类优化方法及系统 |
CN114092798A (zh) * | 2021-10-26 | 2022-02-25 | 北京工业大学 | 一种基于半监督学习策略的火灾实例分割方法 |
CN114170480A (zh) * | 2021-12-15 | 2022-03-11 | 南京中设航空科技发展有限公司 | 一种基于Yolo V5的多阈值半监督道路异常病害智能检测方法 |
CN114419363A (zh) * | 2021-12-23 | 2022-04-29 | 北京三快在线科技有限公司 | 基于无标注样本数据的目标分类模型训练方法及装置 |
CN114444687A (zh) * | 2022-01-07 | 2022-05-06 | 同济大学 | 一种基于伪标签噪声过滤的小样本半监督学习方法和装置 |
CN114492843A (zh) * | 2022-02-14 | 2022-05-13 | 广州广电运通金融电子股份有限公司 | 一种基于半监督学习的分类方法、设备及存储介质 |
US20220156591A1 (en) * | 2020-11-13 | 2022-05-19 | Salesforce.Com, Inc. | Systems and methods for semi-supervised learning with contrastive graph regularization |
CN115049876A (zh) * | 2022-06-14 | 2022-09-13 | 山东建筑大学 | 基于判别性原子嵌入半监督网络的图像分类方法及系统 |
US20220301296A1 (en) * | 2021-03-12 | 2022-09-22 | Samsung Electronics Co., Ltd. | Multi-expert adversarial regularization for robust and data-efficient deep supervised learning |
-
2022
- 2022-09-26 CN CN202211169230.1A patent/CN115272777B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180336471A1 (en) * | 2017-05-19 | 2018-11-22 | Mehdi Rezagholizadeh | Semi-supervised regression with generative adversarial networks |
US20200125897A1 (en) * | 2018-10-18 | 2020-04-23 | Deepnorth Inc. | Semi-Supervised Person Re-Identification Using Multi-View Clustering |
CN111222648A (zh) * | 2020-01-15 | 2020-06-02 | 深圳前海微众银行股份有限公司 | 半监督机器学习优化方法、装置、设备及存储介质 |
CN111753874A (zh) * | 2020-05-15 | 2020-10-09 | 江苏大学 | 一种结合半监督聚类的图像场景分类方法及系统 |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
US20220156591A1 (en) * | 2020-11-13 | 2022-05-19 | Salesforce.Com, Inc. | Systems and methods for semi-supervised learning with contrastive graph regularization |
US20220301296A1 (en) * | 2021-03-12 | 2022-09-22 | Samsung Electronics Co., Ltd. | Multi-expert adversarial regularization for robust and data-efficient deep supervised learning |
CN112926547A (zh) * | 2021-04-13 | 2021-06-08 | 北京航空航天大学 | 飞行器电信号分类和识别的小样本迁移学习方法 |
CN113077388A (zh) * | 2021-04-25 | 2021-07-06 | 中国人民解放军国防科技大学 | 一种数据增广的深度半监督超限学习图像分类方法及系统 |
CN113378632A (zh) * | 2021-04-28 | 2021-09-10 | 南京大学 | 一种基于伪标签优化的无监督域适应行人重识别算法 |
CN113420786A (zh) * | 2021-05-31 | 2021-09-21 | 杭州电子科技大学 | 一种特征混合图像的半监督分类方法 |
CN113254599A (zh) * | 2021-06-28 | 2021-08-13 | 浙江大学 | 一种基于半监督学习的多标签微博文本分类方法 |
CN113989549A (zh) * | 2021-10-21 | 2022-01-28 | 神思电子技术股份有限公司 | 一种基于伪标签的半监督学习图像分类优化方法及系统 |
CN114092798A (zh) * | 2021-10-26 | 2022-02-25 | 北京工业大学 | 一种基于半监督学习策略的火灾实例分割方法 |
CN113920339A (zh) * | 2021-12-15 | 2022-01-11 | 智洋创新科技股份有限公司 | 一种基于深度学习的输电线路通道隐患中吊车误告警方法 |
CN114170480A (zh) * | 2021-12-15 | 2022-03-11 | 南京中设航空科技发展有限公司 | 一种基于Yolo V5的多阈值半监督道路异常病害智能检测方法 |
CN114419363A (zh) * | 2021-12-23 | 2022-04-29 | 北京三快在线科技有限公司 | 基于无标注样本数据的目标分类模型训练方法及装置 |
CN114444687A (zh) * | 2022-01-07 | 2022-05-06 | 同济大学 | 一种基于伪标签噪声过滤的小样本半监督学习方法和装置 |
CN114492843A (zh) * | 2022-02-14 | 2022-05-13 | 广州广电运通金融电子股份有限公司 | 一种基于半监督学习的分类方法、设备及存储介质 |
CN115049876A (zh) * | 2022-06-14 | 2022-09-13 | 山东建筑大学 | 基于判别性原子嵌入半监督网络的图像分类方法及系统 |
Non-Patent Citations (6)
Title |
---|
YAXIN LIU 等: "Self-supervised Correlation Learning for Cross-Modal Retrieval", 《IEEE TRANSACTIONS ON MULTIMEDIA》 * |
冯展祥等: "非可控环境行人再识别综述", 《中山大学学报(自然科学版)》 * |
刘航等: "基于无监督概念漂移识别和动态图嵌入的变压器故障检测方法", 《中国电机工程学报》 * |
秦敬轩: "面向真实场景的无监督行人重识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
翟永杰 等: "基于异常检测的输电线路山火检测方法研究", 《华北电力大学学报》 * |
赵振兵 等: "基于深度学习的输电线路视觉检测研究综述", 《广东电力》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894985A (zh) * | 2023-09-08 | 2023-10-17 | 吉林大学 | 半监督图像分类方法及半监督图像分类系统 |
CN116894985B (zh) * | 2023-09-08 | 2023-12-15 | 吉林大学 | 半监督图像分类方法及半监督图像分类系统 |
CN117347803A (zh) * | 2023-10-25 | 2024-01-05 | 爱科特科技(海南)有限公司 | 一种局部放电检测方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115272777B (zh) | 2022-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108537742B (zh) | 一种基于生成对抗网络的遥感图像全色锐化方法 | |
CN115272777B (zh) | 面向输电场景的半监督图像解析方法 | |
CN108615226B (zh) | 一种基于生成式对抗网络的图像去雾方法 | |
Si et al. | A deep convolutional neural network model for intelligent discrimination between coal and rocks in coal mining face | |
CN111368690B (zh) | 基于深度学习的海浪影响下视频图像船只检测方法及系统 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN109753878B (zh) | 一种恶劣天气下的成像识别方法及系统 | |
CN114627360A (zh) | 基于级联检测模型的变电站设备缺陷识别方法 | |
CN112287941B (zh) | 一种基于自动字符区域感知的车牌识别方法 | |
CN116029947B (zh) | 一种用于恶劣环境的复杂光学图像增强方法、装置和介质 | |
CN114511710A (zh) | 一种基于卷积神经网络的图像目标检测方法 | |
CN115131747A (zh) | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 | |
CN112488963A (zh) | 一种用于农作物病害数据的增强方法 | |
CN111126155A (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN115620083A (zh) | 模型训练方法、人脸图像质量评价方法、设备及介质 | |
CN115439738A (zh) | 一种基于自监督协同重构的水下目标检测方法 | |
CN114581789A (zh) | 一种高光谱图像分类方法及系统 | |
Tian et al. | Depth inference with convolutional neural network | |
Zhang et al. | Research on rainy day traffic sign recognition algorithm based on PMRNet | |
CN117036893B (zh) | 一种基于局部跨阶段和快速下采样的图像融合方法 | |
CN116563147B (zh) | 一种水下图像增强系统及方法 | |
Liu et al. | Enhanced Visual Pipeline Defect Detection Using Partial Convolution Image Restoration | |
Li et al. | Cycle-YOLO: A Efficient and Robust Framework for Pavement Damage Detection | |
Huo et al. | Fast Small Object Detection Algorithm Based on Feature Enhancement and Reconstruction | |
Lv et al. | Underwater Image Enhancement Based on Shallow Underwater Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |