CN115100542A - 基于半监督学习和可变形卷积的输电塔遥感目标检测方法 - Google Patents

基于半监督学习和可变形卷积的输电塔遥感目标检测方法 Download PDF

Info

Publication number
CN115100542A
CN115100542A CN202210864523.5A CN202210864523A CN115100542A CN 115100542 A CN115100542 A CN 115100542A CN 202210864523 A CN202210864523 A CN 202210864523A CN 115100542 A CN115100542 A CN 115100542A
Authority
CN
China
Prior art keywords
power transmission
transmission tower
remote sensing
target detection
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210864523.5A
Other languages
English (en)
Inventor
查雯婷
胡龙韦
李亚龙
金叶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology Beijing CUMTB
Original Assignee
China University of Mining and Technology Beijing CUMTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology Beijing CUMTB filed Critical China University of Mining and Technology Beijing CUMTB
Priority to CN202210864523.5A priority Critical patent/CN115100542A/zh
Publication of CN115100542A publication Critical patent/CN115100542A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开基于半监督学习和可变形卷积的输电塔遥感目标检测方法,所述方法包括:采集输电塔卫星遥感图片,构建已标注数据集和未标注数据集;构建基于可变形卷积的输电塔遥感目标检测模型;通过训练和验证得到基于已标注数据集的输电塔遥感目标检测模型;基于已标注数据集的输电塔遥感目标检测模型,对未标记数据集中的图片进行检测,得到未标记数据集的伪标签;针对已标注数据集和带伪标签的未标注数据集进行共同训练和验证,获得最优的输电塔遥感目标检测模型;基于最优的输电塔遥感目标检测模型,对卫星遥感图片中输电塔进行检测,并计算目标检测精度。本方法更准确地检测出输电塔目标,提高了输电塔勘测效率。

Description

基于半监督学习和可变形卷积的输电塔遥感目标检测方法
技术领域
本发明属于电力勘测和输变电技术领域,尤其涉及一种基于半监督学习和可变形卷积的输电塔遥感目标检测方法。
背景技术
输电塔分布地区广泛且地貌复杂,传统的输电塔勘测耗费大量人力物力,卫星遥感技术的快速发展为实现输电塔的高效稳定勘测提供了新的途径。通过遥感技术可以快速获取一定区域内包含输电塔的大量图片,这可以满足输电塔快速勘测的要求,但是由于遥感图片的成像特点以及输电塔目标本身稀疏的结构特点,造成从输电塔遥感图片中定位并识别输电塔类别非常困难,亟需研究提高输电塔遥感目标定位和识别精度的方法。因此,本发明提出一种基于半监督学习和可变形卷积的输电塔遥感目标检测方法,克服遥感图片进行定位识别输电塔类别的困难,提高输电塔遥感目标检测精度。
发明内容
为了提高输电塔遥感目标定位和识别的精度,本发明提出一种基于半监督学习和可变形卷积的输电塔遥感目标检测方法,提高输电塔遥感目标检测精度。
基于半监督学习和可变形卷积的输电塔遥感目标检测方法,所述检测方法包括以下步骤:
步骤1、采集待检测区域范围内的输电塔卫星遥感图片,将卫星遥感图片进行分割,构建输电塔遥感图片的已标注数据集和未标注数据集;
步骤2、构建基于可变形卷积的输电塔遥感目标检测模型;
步骤3、通过训练和验证得到基于已标注数据集的输电塔遥感目标检测模型;
步骤4、基于已标注数据集的输电塔遥感目标检测模型,对未标记数据集中的图片进行检测,得到未标记数据集的伪标签;
步骤5、将已标注数据集和带伪标签的未标注数据集进行合并进行共同训练和验证,对基于已标注数据集的输电塔遥感目标检测模型进行优化,获得最优的输电塔遥感目标检测模型;
步骤6、基于最优的输电塔遥感目标检测模型,将卫星遥感图片经过尺寸缩放和像素归一化后输入到最优的输电塔遥感目标检测模型中获得每张图片中的输电塔位置以及类别信息,并对最优的输电塔遥感目标检测模型检测结果计算平均精度均值mAP分数和准确率进而获取目标检测精度。
进一步地,所述步骤1构建输电塔遥感图片的已标注数据集和未标注数据集的方法为:
步骤11、采集待检测空间区域范围内的卫星遥感原始图片;
步骤12、将卫星遥感原始图片分割成W×H像素的小尺寸图片,得到汇总的图片集D;
步骤13、通过专家系统确定待检测空间区域范围内输电塔的种类及典型图片;
步骤14、将图片集D中专家能够明确判别种类的输电塔目标使用矩形框标注位置并标注输电塔塔形类别,汇总形成已标注数据集D1,将已标注数据集D1内的数据按照n:1的比例划分为训练集T1和验证集V1,剩余专家无法判别种类的输电塔目标图片不标注,直接汇总形成未标注数据集D2
步骤15,对T1和V1使用数据增强方法进行数据增强,得到增强后的增强训练集T11和增强验证集V11,T11={(x1,y1),(x2,y2),…,(xi,yi)}、V11={(x1,y1),(x2,y2),…,(xj,yj)},其中xi∈R3×600×600代表第i张输入图片,R代表实数,R3×600×600表示大小为3×600×600的实数空间,yi={(ci1,li1,ti1,wi1,hi1)1,(ci2,li2,ti2,wi2,hi2)2,…,(ciN,liN,tiN,wiN,hiN)N}是标签,N代表第i张输入图片中输电塔目标的个数,cij∈Z代表第i张输入图片中第j个输电塔的种类对应的编号,lij,tij,wij,hij∈R分别代表第i张输入图片中第j个输电塔的矩形标注框的左上角横坐标、左上角纵坐标、矩形框的宽、矩形框的高,增强训练集T11和增强验证集V11共同组合得到增强后的已标注数据集D11
进一步地,所述步骤2中所述构建基于可变形卷积的输电塔遥感目标检测模型,具体包括以下步骤:
步骤21、构建目标检测模型的输入模块,输入模块中包括图片尺寸缩放和像素值归一化;
步骤22、构建目标检测模型的特征提取模块,特征提取模块包括主干特征提取网络和使用可变形卷积构建的加强特征提取网络;
步骤23、构建目标检测模型的输出模块,输出模块包括分类网络、位置回归网络和非极大抑制操作。
进一步地,所述步骤3中已标注数据集的输电塔遥感目标检测模型的获取方法具体为:
使用增强训练集T11和增强验证集V11训练步骤2中的基于可变形卷积的输电塔遥感目标检测模型,训练中使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的p轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练q轮结束,获得基于已标注数据集的输电塔遥感目标检测模型。
进一步地,步骤4中未标记数据集的伪标签的获取方式包括以下步骤:
步骤41、将步骤1中未标注数据集D2送入步骤3中得到的基于已标注数据集的输电塔遥感目标检测模型中进行检测得到相应伪标签;
步骤42、对带有伪标签的未标注数据集D2使用离线数据增强方法得到扩充后的带有伪标签的未标注数据集D22
进一步地,步骤5中最优的输电塔遥感目标检测模型的具体获取方式为:
步骤51:将步骤3中的增强训练集T11和步骤4得到的扩充后的带有伪标签的未标注数据集D22合并为T12,将T12作为训练最优模型的训练集,验证集仍为增强验证集V11
步骤52:使用T12作为训练集,V11作为验证集,训练中使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的e轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练f轮结束,获得最优的输电塔遥感目标检测模型。
进一步地,步骤12中所述W×H为600×600。
进一步地,所述步骤14中所述n:1的比例为3:1的比例。
进一步地,步骤15中所述数据增强方法包括使用了平移、剪切、亮度变换、加噪声、随机旋转、随机镜像6种数据增强方法。
进一步地,所述mAP分数及准确率的计算过程如下:
Figure BDA0003756614340000031
Figure BDA0003756614340000032
Precision表示计算精度和Recall表示召回率,其中TP代表真阳性(样本的真实类别是正类,并且模型识别的结果也是正类),FP代表假阳性(样本的真实类别是负类,但是模型将其识别为正类),FN代表假阴性(样本的真实类别是正类,但是模型将其识别为负类);
Figure BDA0003756614340000033
Figure BDA0003756614340000034
式(3)计算一类的AP平均精度,式(4)对所有类的AP取均值得到平均精度均值mAP,准确率计算如式(5),其中TN代表真阴性:
Figure BDA0003756614340000035
Accuracy表示准确率。
其中,mAP分数为Mean Average Precision,平均精度均值。
有益效果:本发明的输电塔遥感目标检测方法,综合考虑了遥感图片的成像特点,将半监督学习和可变形卷积应用于输电塔遥感目标的检测,更准确地检测出遥感图片中的输电塔目标,提高了输电塔勘测效率。
附图说明
图1是本发明输电塔遥感目标检测方法步骤流程图;
图2是本发明可变形卷积的结构;
图3是本发明输电塔遥感目标检测模型的结构;
图4、本发明实施例2中的铁塔类型;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1
如图1所示的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,具体步骤包括:
步骤1:采集既定空间区域范围内的卫星遥感图片,将图片分割成600×600像素的小尺寸图片,得到汇总的图片集D。通过专家系统确定输电塔的种类及典型图片,图片集D中只包含专家能够明确判别种类的输电塔目标的图片标注完成后放入已标注数据集D1中,将D1按照3:1的比例划分为训练集T1和验证集V1,其余包含专家无法判别种类的输电塔目标图片无须标注直接放入未标注数据集D2中。对T1和V1使用数据增强方法,得到增强后的训练集T11和增强后的验证集V11。T11={(x1,y1),(x2,y2),…,(xi,yi)}、V11={(x1,y1),(x2,y2),…,(xj,yj)},其中xi∈R3×600×600代表第i张输入图片,yi={(ci1,li1,ti1,wi1,hi1)1,(ci2,li2,ti2,wi2,hi2)2,…,(ciN,liN,tiN,wiN,hiN)N}是标签,N的取值是自然数代表第i张图片中输电塔目标的个数,cij∈Z代表第i张输入图片中第j个输电塔的种类对应的编号,lij,tij,wij,hij∈R分别代表第i张输入图片中第j个输电塔的矩形标注框的左上角横坐标、左上角纵坐标、矩形框的宽、矩形框的高,增强训练集T11和增强验证集V11共同组合得到增强后的已标注数据集D11
步骤2:构建目标检测模型的输入模块,其中包括图片尺寸缩放和像素值归一化。构建目标检测模型的特征提取模块,其中包括主干特征提取网络EfficientNet-b1和使用可变形卷积构建的加强特征提取网络(GD-BiFPN)。构建目标检测模型的输出模块,其中包括分类网络、位置回归网络以及非极大抑制操作。
步骤3:使用增强训练集T11和增强验证集V11训练模型,训练使用了迁移学习的方法,使用预训练权重初始化模型权重,在开始的50轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练100轮结束,得到基于已标注数据集的输电塔遥感目标检测模型。
步骤4:将未标注数据集D2送入基于已标注数据集的输电塔遥感目标检测模型中进行推理得到相应伪标签。对带有伪标签的未标注数据集D2使用离线数据增强方法得到扩充后的带有伪标签的未标注数据集D22
步骤5:将步骤3中的训练集T11和步骤4得到的扩充后的带有伪标签的未标注数据集D22合并为T12作为训练最终模型的训练集,验证集仍为V11。使用V11作为训练集,V11作为验证集,同样使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的50轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练100轮结束,获得最终的输电塔遥感目标检测模型。
步骤6:将测试图片经过尺寸缩放和像素归一化后输入到最终的输电塔遥感目标检测模型中,即可获得每张图片中的输电塔位置以及类别信息。对各个模型的检测结果计算mAP分数和准确率。
mAP分数计算过程如下:
Figure BDA0003756614340000051
Figure BDA0003756614340000052
式(1)和式(2)分别是计算精度和召回率,其中TP代表真阳性,FP代表假阳性,FN代表假阴性。
Figure BDA0003756614340000053
Figure BDA0003756614340000054
式(3)计算一类的AP分数,式(4)对所有类的AP取均值得到mAP分数
准确率计算如式(5),其中TN代表真阴性。
Figure BDA0003756614340000055
实施例2
将本发明所提出的检测方法运用到具体实验中,数据来源于电网提供的某区域的卫星遥感图片,分割后获得的图片集中总共有1000张图片,其中包含5种类型的输电塔,其中一种塔仅在15张图片中出现,数量太少,不够训练模型,因此将这15张图片剔除,模型只检测4种主要类型的输电塔,这4种塔如下图所示,编号分别为tower-1、tower-2、tower-3、tower-4。
实例验证具体为:
步骤1:采集待检测空间区域范围内的卫星遥感图片,将图片分割成600×600像素的小尺寸图片。通过专家系统确定输电塔的种类及典型图片,将图片集D中只包含专家能够明确判别种类的输电塔目标图片标注完成后放入已标注数据集D1中,从D1中随机抽取183张图片作为测试集R后,D1中一共还有758张图片,其余包含专家无法判别种类的输电塔目标图片无须标注直接放入未标注数据集D2中,D2中一共有44张图片。将D1按照3:1的比例划分为训练集T1和验证集V1,T1包含603张图片,V1包含155张图片。对T1和V1使用平移、剪切、亮度变换、加噪声、随机旋转、随机镜像6种数据增强方法,加上原图,数据集扩充为原来7倍,得到增强训练集T11和增强验证集V11,其中T11包含4221张图片,V11包含1085张图片。
步骤2:构建目标检测模型的输入模块,其中包括图片尺寸缩放和像素值归一化,图片尺寸缩放是将图片从600×600放大到640×640。构建目标检测模型的特征提取模块,其中包括主干特征提取网络和使用可变形卷积构建的加强特征提取网络(GD-BiFPN),主干特征提取网络使用EfficientNet-b1网络。构建目标检测模型的输出模块,其中包括分类网络、位置回归网络以及非极大抑制操作。
步骤3:使用增强训练集T11和增强验证集V11训练模型,训练使用了迁移学习的方法,使用预训练权重初始化模型权重,在开始的50轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练100轮结束,得到基于已标注数据集的输电塔遥感目标检测模型。
步骤4:将未标注数据集D2送入基于已标注数据集的输电塔遥感目标检测模型中进行检测得到相应伪标签,这一过程可以适当的修正模型给出的检测结果。对带有伪标签的未标注数据集D2使用离线数据增强方法得到扩充后的带有伪标签的未标注数据集D22
步骤5:将步骤3中的增强训练集T11和步骤4得到的扩充后的带有伪标签的未标注数据集D22合并为T12作为训练最终模型的训练集,验证集仍为V11。使用T12作为训练集,V11作为验证集,同样使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的50轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练100轮结束,获得最优输电塔遥感目标检测模型。
步骤6:将测试集R经过尺寸缩放到模型需要的尺寸和像素值归一化后输入到最优输电塔遥感目标检测模型中,即可输出检测结果。如下图所示:其中蓝色代表真实位置和种类,红色代表检测出的位置和种类以及置信度。可以看出,对于tower-1、tower-2、tower-3类型的输电塔,其影子特征比较明显,检测结果的置信度都比较高,而tower-4特征比较单调,因此比较难检测,不过也有较高置信度。
通过对比YOLOV4以及Faster-rcnn模型可以说明ENGD-BiFPN(EfficientNetGrouped Deformable BiFPN)模型的优势。表1是ENGD-BiFPN、YOLOV4以及Faster-rcnn三种模型检测性能的对比,可以看出ENGD-BiFPN模型在mAP分数和准确率指标上表现都很好。
表1模型结果对比
Figure BDA0003756614340000071
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (10)

1.基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述检测方法包括以下步骤:
步骤1、采集待检测区域范围内的输电塔卫星遥感图片,将卫星遥感图片进行分割,构建输电塔遥感图片的已标注数据集和未标注数据集;
步骤2、构建基于可变形卷积的输电塔遥感目标检测模型;
步骤3、通过训练和验证得到基于已标注数据集的输电塔遥感目标检测模型;
步骤4、基于已标注数据集的输电塔遥感目标检测模型,对未标记数据集中的图片进行检测,得到未标记数据集的伪标签;
步骤5、将已标注数据集和带伪标签的未标注数据集进行合并进行共同训练和验证,对基于已标注数据集的输电塔遥感目标检测模型进行优化,获得最优的输电塔遥感目标检测模型;
步骤6、基于最优的输电塔遥感目标检测模型,将卫星遥感图片经过尺寸缩放和像素归一化后输入到最优的输电塔遥感目标检测模型中获得每张图片中的输电塔位置以及类别信息,并对最优的输电塔遥感目标检测模型检测结果计算平均精度均值mAP分数和准确率进而获取目标检测精度。
2.根据权利要求1所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述步骤1构建输电塔遥感图片的已标注数据集和未标注数据集的方法为:
步骤11、采集待检测空间区域范围内的卫星遥感原始图片;
步骤12、将卫星遥感原始图片分割成W×H像素的小尺寸图片,得到汇总的图片集D;
步骤13、通过专家系统确定待检测空间区域范围内输电塔的种类及典型图片;
步骤14、将图片集D中专家能够明确判别种类的输电塔目标使用矩形框标注位置并标注输电塔塔形类别,汇总形成已标注数据集D1,将已标注数据集D1内的数据按照n:1的比例划分为训练集T1和验证集V1,剩余专家无法判别种类的输电塔目标图片不标注,直接汇总形成未标注数据集D2
步骤15,对T1和V1使用数据增强方法进行数据增强,得到增强后的增强训练集T11和增强验证集V11,T11={(x1,y1),(x2,y2),…,(xi,yi)}、V11={(x1,y1),(x2,y2),…,(xj,yj)},其中xi∈R3×600×600代表第i张输入图片,R代表实数,R3×600×600表示大小为3×600×600的实数空间,yi={(ci1,li1,ti1,wi1,hi1)1,(ci2,li2,ti2,wi2,hi2)2,…,(ciN,liN,tiN,wiN,hiN)N}是标签,N代表第i张输入图片中输电塔目标的个数,cij∈Z代表第i张输入图片中第j个输电塔的种类对应的编号,lij,tij,wij,hij∈R分别代表第i张输入图片中第j个输电塔的矩形标注框的左上角横坐标、左上角纵坐标、矩形框的宽、矩形框的高,增强训练集T11和增强验证集V11共同组合得到增强后的已标注数据集D11
3.根据权利要求1所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述步骤2中所述构建基于可变形卷积的输电塔遥感目标检测模型,具体包括以下步骤:
步骤21、构建目标检测模型的输入模块,输入模块中包括图片尺寸缩放和像素值归一化;
步骤22、构建目标检测模型的特征提取模块,特征提取模块包括主干特征提取网络和使用可变形卷积构建的加强特征提取网络;
步骤23、构建目标检测模型的输出模块,输出模块包括分类网络、位置回归网络和非极大抑制操作。
4.根据权利要求1所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述步骤3中已标注数据集的输电塔遥感目标检测模型的获取方法具体为:
使用增强训练集T11和增强验证集V11训练步骤2中的基于可变形卷积的输电塔遥感目标检测模型,训练中使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的p轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练q轮结束,获得基于已标注数据集的输电塔遥感目标检测模型。
5.根据权利要求1所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,步骤4中未标记数据集的伪标签的获取方式包括以下步骤:
步骤41、将步骤1中未标注数据集D2送入步骤3中得到的基于已标注数据集的输电塔遥感目标检测模型中进行检测得到相应伪标签;
步骤42、对带有伪标签的未标注数据集D2使用离线数据增强方法得到扩充后的带有伪标签的未标注数据集D22
6.根据权利要求1所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,步骤5中最优的输电塔遥感目标检测模型的具体获取方式为:
步骤51:将步骤3中的增强训练集T11和步骤4得到的扩充后的带有伪标签的未标注数据集D22合并为T12,将T12作为训练最优模型的训练集,验证集仍为增强验证集V11
步骤52:使用T12作为训练集,V11作为验证集,训练中使用迁移学习的方法,使用预训练权重初始化模型权重,在开始的e轮先冻结主干特征提取模块的权重,然后再解冻所有权重继续训练f轮结束,获得最优的输电塔遥感目标检测模型。
7.根据权利要求2所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,步骤12中所述W×H为600×600。
8.根据权利要求2所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述步骤14中所述n:1的比例为3:1的比例。
9.根据权利要求2所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,步骤15中所述数据增强方法包括使用了平移、剪切、亮度变换、加噪声、随机旋转、随机镜像6种数据增强方法。
10.根据权利要求1-9任一所述的基于半监督学习和可变形卷积的输电塔遥感目标检测方法,其特征在于,所述mAP分数及准确率的计算过程如下:
Figure FDA0003756614330000031
Figure FDA0003756614330000032
Precision表示计算精度和Recall表示召回率,其中TP代表真阳性,FP代表假阳性,FN代表假阴性;
Figure FDA0003756614330000033
Figure FDA0003756614330000034
式(3)计算一类的AP平均精度,式(4)对所有类的AP取均值得到平均精度均值mAP,
准确率计算如式(5),其中TN代表真阴性:
Figure FDA0003756614330000035
Accuracy表示准确率。
CN202210864523.5A 2022-07-21 2022-07-21 基于半监督学习和可变形卷积的输电塔遥感目标检测方法 Pending CN115100542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210864523.5A CN115100542A (zh) 2022-07-21 2022-07-21 基于半监督学习和可变形卷积的输电塔遥感目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210864523.5A CN115100542A (zh) 2022-07-21 2022-07-21 基于半监督学习和可变形卷积的输电塔遥感目标检测方法

Publications (1)

Publication Number Publication Date
CN115100542A true CN115100542A (zh) 2022-09-23

Family

ID=83298731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210864523.5A Pending CN115100542A (zh) 2022-07-21 2022-07-21 基于半监督学习和可变形卷积的输电塔遥感目标检测方法

Country Status (1)

Country Link
CN (1) CN115100542A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012719A (zh) * 2023-03-27 2023-04-25 中国电子科技集团公司第五十四研究所 一种基于多实例学习的弱监督旋转目标检测方法
CN117152846A (zh) * 2023-10-30 2023-12-01 云南师范大学 学生行为识别方法、装置、系统及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012719A (zh) * 2023-03-27 2023-04-25 中国电子科技集团公司第五十四研究所 一种基于多实例学习的弱监督旋转目标检测方法
CN117152846A (zh) * 2023-10-30 2023-12-01 云南师范大学 学生行为识别方法、装置、系统及计算机可读存储介质
CN117152846B (zh) * 2023-10-30 2024-01-26 云南师范大学 学生行为识别方法、装置、系统及计算机可读存储介质

Similar Documents

Publication Publication Date Title
Yu et al. A new spatial-oriented object detection framework for remote sensing images
CN111222434A (zh) 基于局部二值模式和深度学习的合成人脸图像取证方法
CN115100542A (zh) 基于半监督学习和可变形卷积的输电塔遥感目标检测方法
CN109376606B (zh) 一种电力巡检图像杆塔基础故障检测方法
CN112837315B (zh) 一种基于深度学习的输电线路绝缘子缺陷检测方法
JP2014232533A (ja) Ocr出力検証システム及び方法
CN110210335A (zh) 一种行人重识别学习模型的训练方法、系统和装置
CN109034035A (zh) 基于显著性检测和特征融合的行人重识别方法
CN110675421B (zh) 基于少量标注框的深度图像协同分割方法
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN113361542A (zh) 一种基于深度学习的局部特征提取方法
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN112308040A (zh) 一种基于高清图像的河流排污口检测方法及系统
CN114119621A (zh) 基于深度编解码融合网络的sar遥感图像水域分割方法
CN116597438A (zh) 一种基于Yolov5的改进型水果识别方法及识别系统
CN117292313A (zh) 一种基于改进YOLOv7模型的小目标漂浮垃圾检测方法
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及系统
CN116579992A (zh) 一种用于无人机巡检的小目标螺栓缺陷检测方法
CN113343765B (zh) 一种基于点云刚性配准的场景检索方法及系统
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
CN114187506A (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法
CN117315484A (zh) 一种利用端到端的语义分割网络对高分辨率遥感图像提取光伏面板的方法
CN110826478A (zh) 一种基于对抗网络的航拍违建识别方法
CN116895016A (zh) 一种sar图像船舶目标生成与分类方法
CN111612800B (zh) 船舶图像检索方法、计算机可读存储介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination