CN115527082A - 一种基于图像多重预处理的深度学习小目标检测方法 - Google Patents

一种基于图像多重预处理的深度学习小目标检测方法 Download PDF

Info

Publication number
CN115527082A
CN115527082A CN202211136929.8A CN202211136929A CN115527082A CN 115527082 A CN115527082 A CN 115527082A CN 202211136929 A CN202211136929 A CN 202211136929A CN 115527082 A CN115527082 A CN 115527082A
Authority
CN
China
Prior art keywords
feature
image
loss function
layer
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211136929.8A
Other languages
English (en)
Inventor
刘升恒
陈嘉诚
黄永明
杨绿溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211136929.8A priority Critical patent/CN115527082A/zh
Publication of CN115527082A publication Critical patent/CN115527082A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/54Extraction of image or video features relating to texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像多重预处理的深度学习小目标检测方法,能够有效提高网络捕获小目标的能力。所述方法包括:图像多重预处理模块包括:过采样、小目标复制粘贴、图像增强,缓解了包含小目标的图像过少的问题并平衡大物体与小物体的数量分布;检测网络的建立包括:ResNeXt‑101特征提取网络、FPN+特征纹理传输模块,ROI Align池化操作,损失函数增加前景‑背景平衡损失函数;其中,特征纹理传输模块的建立,形成一个包含更多信息的特征金字塔层级,实现了更准确的小目标检测,前景‑背景平衡损失函数缓解了前景和背景的面积不平衡;本发明采取的训练原则包括分离训练以及端对端训练,逐步优化模型参数。

Description

一种基于图像多重预处理的深度学习小目标检测方法
技术领域
本发明涉及计算机视觉领域中的目标检测技术领域,特别是一种基于图像多重预处理的深度学习小目标检测方法。
背景技术
目标检测是指通过计算机技术手段找出图像或者视频中人们感兴趣的物体,并同时检测出他们的位置和大小。目标检测既需要解决分类问题,也要解决定位问题,属于多分类的问题。目前基于CNN的目标检测算法主要分为单阶段算法和两阶段算法。单阶段目标检测算法主要流程为输入图片,直接输出物体的类别和位置坐标值,经过一个阶段可以直接得到最终结果。单阶段算法有着更快的检测速度,代表算法有YOLO系列和SSD系列。两阶段目标检测首先使用选择性搜索或者区域生成网络获得可能包含物体的区域,然后在此基础上对区域进行特征提取以及生成最终的物体边框。两阶段目标检测的代表作品有R-CNN,Faster-Rcnn,Mask-RCNN等。
小目标检测在很多下游任务中至关重要。在自动驾驶任务中,需要从汽车的高分辨率场景照片中检测出小的或远处的物体;在医学成像中,需要检测出几个像素大小的肿瘤和肿块;在遥感图像中对海面人员搜救等。在上述任务中,提高小目标的识别率可以有效促进生产力的发展以及保障人民生命财产安全。
发明内容
基于此,有必要针对上述技术问题,本发明提出一种基于图像多重预处理的深度学习小目标检测方法,通过多重图像预处理以及改进现有的深度学习网络,丰富特征图的信息量,提高小目标的检测效果。
本发明的一种基于图像多重预处理的深度学习小目标检测方法,包括如下步骤:
步骤1,获取图像原始数据集,对原始数据集进行数据扩充并平衡图像中大物体与小物体的数量分布,并对数据进行增强;
步骤2,构建Faster-RCNN检测网络;
步骤3,将增强后的图片传入Faster-RCNN检测网络进行训练,优化模型参数。
进一步的,步骤1具体包括:
步骤1.1,对图像原始数据集进行过采样处理,增加包含小目标图像的数量;在图像的随机位置多次复制粘贴图像中的所有小目标,并且粘贴之前对目标进行尺度旋转变换,粘贴之后的小目标不会位于边缘并且不会重叠原有目标;
步骤1.2,使用随机裁剪拼接,旋转缩放,翻转、Mosaic方法对扩充过的数据集进行数据增强。
进一步的,步骤2中所述检测网络包括特征提取网络、多特征融合模块、RPN、池化操作模块和检测头;
使用特征提取网络对数据增强之后的图像进行特征提取后,输入到多特征融合模块进一步提取图像特征,再分别输入到RPN和池化操作模块,RPN的输出数据与多特征融合模块提取的图像特征经过池化操作后输入检测头,得到检测结果。
进一步的,步骤2中所述特征提取网络采用ResNeXt结构;
所述多特征融合模块包括FPN检测网络和特征纹理传输模块;
特征提取网络ResNeXt中ResNeXt stage2的最大池化层被删除,并得到C2’作为stage2的输出,C2’输入到FPN的各层,将FPN的P2层以及P3层的输出特征图传入特征纹理传输模块生成P3’层特征图,P3’层再与C2’融合得到P2’层特征图,P2’层特征图为特征纹理传输模块的输出,随后,特征纹理传输模块生成P2’层特征图会与FPN层的P2、P3、P4、P5层传入后继的RPN和池化操作模块进行处理。
进一步的,特征纹理传输模块包括内容语义提取器、亚像素卷积和特征纹理提取器;
FPN的P3层特征图先经过内容语义提取器后,再采用亚像素卷积增大尺度,形成超分辨率内容特征P3;FPN的P2层特征图先与超分辨率内容特征P3串联,再送入特征纹理提取器处理;最终再将特征纹理提取器的结果与超分辨率内容特征P3经1*1卷积处理得到P3’。
进一步的,步骤3中对Faster-RCNN检测网络的训练原则包括分离训练以及端对端训练;
首先,去掉特征纹理传输模块,对不含特征纹理传输模块的Faster-RCNN检测网络进行训练,训练使用的是原始FPN;
其次,固定特征提取网络以及检测头,增加特征纹理传输模块训练;
最后,当特征纹理传输模块收敛时,再对检测头进行训练微调。
进一步的,增加前景-背景平衡损失函数,前景-背景平衡损失函数由全局重建损失函数、正样本损失函数组成;
全局重建损失函数强调与真实背景特征的相似性,用公式表达为:
Lgrl(E,Et)=‖Et-E‖1
式中,E表示Faster-RCNN检测网络生成的特征图,Et表示目标特征图。
正样本损失函数强调对正样本的关注度,用公式表达为:
Figure BDA0003851802700000031
式中,Ppt表示真实目标的区域,N表示正像素总和,(x,y)表示特征图上像素的坐标。前景-背景平衡损失函数用公式表达为:
Lbf(E,Et)=Lgel(E,Et)+λLpt(E,Et)
式中,λ是权重平衡因子,
则总体前景-背景平衡损失函数表示为:
Figure BDA0003851802700000032
本发明与现有技术相比,至少包含以下有益效果:
(1)本发明使用的多重预处理模块,缓解了包含小目标的图像过少的问题,并且针对小目标物体进行随机复制粘贴,增加了网络捕捉小物体的概率,相比常规图像预处理操作提升了检测精度;
(2)本发明所构建的特征纹理传输模块将富含语义特征的特征金字塔层级与富含区域纹理的特征金字塔层级集成,形成一个包含更多区域细节的特征金字塔层级,有效提高了小目标的识别率;
(3)本发明所使用的前景-背景平衡损失函数,缓解了前景和背景的区域不平衡,增强小目标区域的学习能力
附图说明
图1是本发明实例的整体结构示意图
图2是本发明实例的特征提取以及融合示意图
图3是本发明实例的ResNeXt网络结构图
图4是本发明实例的特征纹理传输模块框架图
具体实施方式
为了使相关领域的研究人员对本结构的特点有更清楚的认识,下面结合附图对本申请的结构做进一步描述:
本发明的一种基于图像多重预处理的深度学习小目标检测方法,如图1所示,包括如下步骤:
步骤1,获取原始数据集,对原始数据集进行数据扩充并平衡图像中大物体与小物体的数量分布,并对数据进行增强;具体包括:
步骤1.1,对原始数据集进行过采样处理,增加包含小目标图像的数量;在图像的随机位置多次复制粘贴图像中的所有小目标,并且粘贴之前对目标进行尺度旋转变换,粘贴之后的小目标不会位于边缘并且不会重叠原有目标;
步骤1.2,使用随机裁剪拼接,旋转缩放,翻转、Mosaic方法对扩充过的数据集进行数据增强;
步骤2,构建Faster-RCNN检测网络;
所述检测网络包括特征提取网络、多特征融合模块、RPN、池化操作模块和检测头;
使用特征提取网络对数据增强之后的图像进行特征提取后,输入到多特征融合模块进一步提取图像特征,再分别输入到RPN和池化操作模块,经RPN后生成约1000个proposals,这些proposal与多特征融合模块提取的图像特征经过池化操作后输入检测头,得到检测结果。
本发明实例的特征提取网络采用的ResNeXt结构如图3所示;ResNeXt使用普通卷积核深度可分离卷积的分组卷积策略,ResNeXt的每个分支的拓扑结构是相同的,最后再结合残差网络,构成ResNeXt;ResNeXt的使用,增加了网络结构,提高了模型的表达能力。ResNeXt借用Inception的思想,将ResNet的重复策略与Inception网络的拆分、转换、合并策略相结合,增加了模型的宽度以及深度,减少了模型的超参数,在不明显增加参数量级的情况下提升了模型的准确率;
所述池化操作模块选用ROI Align;损失函数增加前景-背景平衡损失函数;
所述多特征融合模块包括FPN(feature pyramid networks)检测网络和特征纹理传输模块;
所述特征纹理传输模块用于将富含语义特征的特征金字塔层级与富含区域纹理的特征金字塔层级集成,并向下传递,形成包含更多信息的特征金字塔层级,以实现更准确的小目标检测;
本发明实例的特征提取以及融合示意图如图2所示,特征提取网络ResNeXt中ResNeXtstage2的最大池化层被删除,并得到C2’作为stage2的输出,也就是特征提取网络ResNeXt的输出,C2’与原始相比,拥有更高的分辨率,包含更多的区域细节。特征纹理传输模块建于FPN结构之后,C2’输入到FPN的各层,将FPN的P2层以及P3层的输出特征图传入特征纹理传输模块生成P3’层特征图,P3’层再与C2’融合得到P2’层特征图,P2’层特征图为特征纹理传输模块的输出,其用公式表达:
P2′=P3′↑+C2′ (1)
式中↑表示使用最近邻插值法放大特征尺度2倍;随后,特征纹理传输模块生成P′2层特征图会与FPN层的P2、P3、P4、P5层传入后继的RPN和ROIAlign进行处理。
本发明实例的特征纹理传输模块框架图如图4所示,特征纹理传输模块包括内容语义提取器、亚像素卷积和特征纹理提取器;
FPN的P3层特征图先经过内容语义提取器后,再采用亚像素卷积增大尺度,形成超分辨率内容特征P3;FPN的P2层特征图先与超分辨率内容特征P3串联,再送入特征纹理提取器处理;最终再将特征纹理提取器的结果与超分辨率内容特征P3经1*1卷积处理得到P′3,其用公式表达:
P′3=Ft(P2||Fc(P3)↑)+Fc(P3)↑ (2)
式中,其中Ft(·)表示特征纹理提取器,Fc(·)表示内容语义提取器,↑表示通过亚像素卷积放大特征尺度2倍,||表示特征串联。内容语义提取器和特征纹理提取器均由残余块组成。
步骤3,将增强后的图片传入Faster-RCNN检测网络并进行训练,优化模型参数;
本发明实例采取的训练原则包括分离训练以及端对端训练;
首先,去掉特征纹理传输模块,对不含特征纹理传输模块的Faster-RCNN检测网络进行训练,训练使用的是原始FPN;
其次,固定特征提取网络以及检测头,增加特征纹理传输模块训练;
最后,当特征纹理传输模块收敛时,再对检测头进行训练微调。
本发明设计增加了前景-背景平衡损失函数来关注正像素;常用的全局损失函数将导致小对象区域的学习不足,提高前景区域的特征质量来挖掘真实位置,缓解了前景和背景的面积不平衡,并通过提高背景区域的特征质量来消除误报;因为小对象只占整个图像的一小部分。
前景-背景平衡损失函数由全局重建损失函数、正样本损失函数组成。
全局重建损失函数强调与真实背景特征的相似性,因为背景占图像大多数部分,用公式表达为:
Lgrl(E,Et)=‖Et-E‖1 (3)
式中,E表示Faster-RCNN检测网络生成的特征图,Et表示目标特征图。
正样本损失函数强调对正样本的关注度,用公式表达为:
Figure BDA0003851802700000051
式中,Ppt表示真实目标的区域,N表示正像素总和,(x,y)表示特征图上像素的坐标。前景-背景平衡损失函数用公式表达为:
Lbf(E,Et)=Lgrl(E,Et)+λLpt(E,Et) (5)
式中,λ是权重平衡因子,前景-背景平衡损失函数通过提高前景区域的特征质量来挖掘真实位置,并通过提高背景区域的特征质量来消除假阳性。
总体前景-背景平衡损失函数不仅引入底部拓展金字塔层监督,还引入特征纹理传输模块监督。公式表达为:
Figure BDA0003851802700000061
上文所列出的一系列详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用于限制本发明的保护范围,凡是未脱离发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,包括如下步骤:
步骤1,获取图像原始数据集,对原始数据集进行数据扩充并平衡图像中大物体与小物体的数量分布,并对数据进行增强;
步骤2,构建Faster-RCNN检测网络;
步骤3,将增强后的图片传入Faster-RCNN检测网络进行训练,优化模型参数。
2.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,步骤1具体包括:
步骤1.1,对图像原始数据集进行过采样处理,增加包含小目标图像的数量;在图像的随机位置多次复制粘贴图像中的所有小目标,并且粘贴之前对目标进行尺度旋转变换,粘贴之后的小目标不会位于边缘并且不会重叠原有目标;
步骤1.2,使用随机裁剪拼接,旋转缩放,翻转、Mosaic方法对扩充过的数据集进行数据增强。
3.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,步骤2中所述检测网络包括特征提取网络、多特征融合模块、RPN、池化操作模块和检测头;
使用特征提取网络对数据增强之后的图像进行特征提取后,输入到多特征融合模块进一步提取图像特征,再分别输入到RPN和池化操作模块,RPN的输出数据与多特征融合模块提取的图像特征经过池化操作后输入检测头,得到检测结果。
4.根据权利要求1所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,所述特征提取网络采用ResNeXt结构;
所述多特征融合模块包括FPN检测网络和特征纹理传输模块;
特征提取网络ResNeXt中ResNeXt stage2的最大池化层被删除,并得到C2’作为stage2的输出,C2’输入到FPN的各层,将FPN的P2层以及P3层的输出特征图传入特征纹理传输模块生成P3’层特征图,P3’层再与C2’融合得到P2’层特征图,P2’层特征图为特征纹理传输模块的输出,随后,特征纹理传输模块生成P2’层特征图会与FPN层的P2、P3、P4、P5层传入后继的RPN和池化操作模块进行处理。
5.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,特征纹理传输模块包括内容语义提取器、亚像素卷积和特征纹理提取器;
FPN的P3层特征图先经过内容语义提取器后,再采用亚像素卷积增大尺度,形成超分辨率内容特征P3;FPN的P2层特征图先与超分辨率内容特征P3串联,再送入特征纹理提取器处理;最终再将特征纹理提取器的结果与超分辨率内容特征P3经1*1卷积处理得到P3’。
6.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,步骤3中对Faster-RCNN检测网络的训练原则包括分离训练以及端对端训练;
首先,去掉特征纹理传输模块,对不含特征纹理传输模块的Faster-RCNN检测网络进行训练,训练使用的是原始FPN;
其次,固定特征提取网络以及检测头,增加特征纹理传输模块训练;
最后,当特征纹理传输模块收敛时,再对检测头进行训练微调。
7.根据权利要求4所述一种基于图像多重预处理的深度学习小目标检测方法,其特征在于,损失函数增加前景-背景平衡损失函数,前景-背景平衡损失函数由全局重建损失函数、正样本损失函数组成;
全局重建损失函数强调与真实背景特征的相似性,用公式表达为:
Lgrl(E,Et)=‖Et-E‖1
式中,E表示Faster-RCNN检测网络生成的特征图,Et表示目标特征图;
正样本损失函数强调对正样本的关注度,用公式表达为:
Figure FDA0003851802690000021
式中,Ppt表示真实目标的区域,N表示正像素总和,(x,y)表示特征图上像素的坐标;前景-背景平衡损失函数用公式表达为:
Lbf(E,Et)=Lgrl(E,Et)+λLpt(E,Et)
式中,λ是权重平衡因子,
则总体前景-背景平衡损失函数表示为:
Figure FDA0003851802690000022
CN202211136929.8A 2022-09-19 2022-09-19 一种基于图像多重预处理的深度学习小目标检测方法 Pending CN115527082A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211136929.8A CN115527082A (zh) 2022-09-19 2022-09-19 一种基于图像多重预处理的深度学习小目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211136929.8A CN115527082A (zh) 2022-09-19 2022-09-19 一种基于图像多重预处理的深度学习小目标检测方法

Publications (1)

Publication Number Publication Date
CN115527082A true CN115527082A (zh) 2022-12-27

Family

ID=84697462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211136929.8A Pending CN115527082A (zh) 2022-09-19 2022-09-19 一种基于图像多重预处理的深度学习小目标检测方法

Country Status (1)

Country Link
CN (1) CN115527082A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503389A (zh) * 2023-06-25 2023-07-28 南京邮电大学 牙根外吸收自动检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116503389A (zh) * 2023-06-25 2023-07-28 南京邮电大学 牙根外吸收自动检测方法
CN116503389B (zh) * 2023-06-25 2023-10-20 南京邮电大学 牙根外吸收自动检测方法

Similar Documents

Publication Publication Date Title
Huang et al. Deepmvs: Learning multi-view stereopsis
CN109241982B (zh) 基于深浅层卷积神经网络的目标检测方法
CN107358262B (zh) 一种高分辨率图像的分类方法及分类装置
CN110163213B (zh) 基于视差图和多尺度深度网络模型的遥感图像分割方法
CN108537824B (zh) 基于交替反卷积与卷积的特征图增强的网络结构优化方法
CN108596108B (zh) 基于三元组语义关系学习的航拍遥感图像变化检测方法
WO2022000862A1 (zh) 鱼眼图像中的对象检测方法、装置及存储介质
CN111899172A (zh) 一种面向遥感应用场景的车辆目标检测方法
CN110909724B (zh) 一种多目标图像的缩略图生成方法
CN108648161A (zh) 非对称核卷积神经网络的双目视觉障碍物检测系统及方法
CN110689482A (zh) 一种基于有监督逐像素生成对抗网络的人脸超分辨率方法
CN111951368B (zh) 一种点云、体素和多视图融合的深度学习方法
CN113076871A (zh) 一种基于目标遮挡补偿的鱼群自动检测方法
CN110188802B (zh) 基于多层特征图融合的ssd目标检测算法
CN111640116B (zh) 基于深层卷积残差网络的航拍图建筑物分割方法及装置
CN111753677A (zh) 基于特征金字塔结构的多角度遥感船舶图像目标检测方法
CN112233129A (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN116071504B (zh) 一种面向高分辨率图像的多视图立体重建方法
CN115861799A (zh) 基于注意力梯度的轻量化空对地目标检测方法
CN110751271B (zh) 一种基于深度神经网络的图像溯源特征表征方法
CN113569981A (zh) 一种基于单阶段目标检测网络的电力巡检鸟窝检测方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN115527082A (zh) 一种基于图像多重预处理的深度学习小目标检测方法
CN117612153A (zh) 基于图像与点云信息补全的三维目标识别与定位方法
CN117437363A (zh) 基于深度感知迭代器的大规模多视图立体方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination