CN115049534A - 基于知识蒸馏的鱼眼图像实时语义分割方法 - Google Patents

基于知识蒸馏的鱼眼图像实时语义分割方法 Download PDF

Info

Publication number
CN115049534A
CN115049534A CN202110254588.3A CN202110254588A CN115049534A CN 115049534 A CN115049534 A CN 115049534A CN 202110254588 A CN202110254588 A CN 202110254588A CN 115049534 A CN115049534 A CN 115049534A
Authority
CN
China
Prior art keywords
model
semantic segmentation
lightweight
teacher
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110254588.3A
Other languages
English (en)
Inventor
李建勋
王允楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202110254588.3A priority Critical patent/CN115049534A/zh
Publication of CN115049534A publication Critical patent/CN115049534A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • G06T3/047Fisheye or wide-angle transformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

一种基于知识蒸馏的鱼眼图像实时语义分割方法,通过鱼眼图像构建数据集,训练教师语义分割模型,然后将教师语义分割模型中的复杂特征提取骨架替换为轻量级骨架后得到轻量级学生模型,通过数据集上训练轻量级学生模型;再构建基于知识蒸馏的输出迁移和特征迁移,在保持轻量级学生模型实时性情况下提升精度,在测试阶段,单独使用轻量级学生模型对测试图像进行基于知识蒸馏的鱼眼图像实时语义分割;本发明能够有效地在鱼眼图像语义分割过程中抑制环境中遮挡和光照强度等干扰的影响,对于输入的高分辨率图像可以在保证实时性的前提下大幅提升模型的精度。

Description

基于知识蒸馏的鱼眼图像实时语义分割方法
技术领域
本发明涉及的是一种计算机视觉与模式识别领域的技术,具体是一种基于知识蒸馏的鱼眼图像实时语义分割方法。
背景技术
现有的语义分割方法大多基于深度神经网络,近年来一些针对复杂语义分割网络加速改进的方法包括:限制网络输入图像的尺寸,复杂网络能够在维持结构不变的情况下获得实时性的提升;降低网络的规模,通过修剪网络早期的通道或者丢弃某些阶段从而提升实时性。然而这些方法对网络实时性的提升均是以牺牲精度和降低泛化能力为代价,并没有使模型在实时性与准确性间达到一个很好的平衡。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于知识蒸馏的鱼眼图像实时语义分割方法,能够有效地在鱼眼图像语义分割过程中抑制环境中遮挡和光照强度等干扰的影响,对于输入的高分辨率图像可以在保证实时性的前提下大幅提升模型的精度。
本发明是通过以下技术方案实现的:
本发明涉及一种基于知识蒸馏的鱼眼图像实时语义分割方法,通过鱼眼图像构建数据集,训练教师语义分割模型,然后将教师语义分割模型中的复杂特征提取骨架替换为轻量级骨架后得到轻量级学生模型,通过数据集上训练轻量级学生模型;再构建基于知识蒸馏的输出迁移和特征迁移,在保持轻量级学生模型实时性情况下提升精度,在测试阶段,单独使用轻量级学生模型对测试图像进行基于知识蒸馏的鱼眼图像实时语义分割。
所述的提升精度,具体包括:输出迁移采用损失函数对教师语义分割模型与轻量级学生模型的输出的概率分别差异进行衡量,使得两者输出尽可能保持一致,特征迁移对教师语义分割模型与轻量级学生模型输出中间层特征图进行处理形成相似度注意力图,提取结构化信息,通过损失函数对齐教师语义分割模型与轻量级学生模型间的相似度注意力图完成结构化知识迁移。
技术效果
本发明整体解决了现有语义分割技术在实时性与准确性直接难以平衡的问题;本发明利用参数规模更大的教师语义分割模型来辅助轻量级学生模型的训练,采用更换特征提取骨架的方式获得学生模型,由于具有相似的结构,学生模型可以更好地理解教师模型从数据集中获取的知识,更便于知识的迁移,能够在不降低输入图像分辨率的情况下兼具实时与准确的语义分割;通过输出迁移与特征迁移有效的提取教师语义分割模型的知识并迁移至轻量级学生模型,能够在不增加轻量级学生模型计算量的前提下提升其精度,使轻量级学生模型的实时性与准确性达到平衡。
相较于传统的知识蒸馏技术,本发明的特征迁移模块能够有效地将教师语义分割模型理解图像的结构化知识迁移至轻量级学生模型,获得比传统的输出蒸馏更大幅度的提升。
附图说明
图1为本发明知识蒸馏的整体框架图;
图2为鱼眼摄像头采集的图像及语义分割示意图;
图3为采集数据集的类别分布示意图;
图4为实时语义分割软件设计流程图;
具体实施方式
如图1所示,为本实施例涉及一种基于知识蒸馏的鱼眼图像实时语义分割系统,包括:依次相连的教师语义分割模块、输出迁移模块、特征迁移模块和轻量级学生模块,其中:轻量级学生模块训练的过程中,输出迁移模块提取教师语义分割模块输出概率分布中的知识至轻量级学生模块,特征迁移模块通过提取教师语义分割模块中间层输出特征图中的结构化知识至轻量级学生模块。
本实施例涉及上述系统的基于知识蒸馏的鱼眼图像实时语义分割方法,通过对齐教师模型与学生模型间输出的差异,再生成相似度注意力图并将结构化的语义知识从教师模型迁移至学生模型,具体为:首先利用车载鱼眼摄像机采集街景图像并标注以构建数据集,在该数据集上训练参数规模庞大的教师模型,学生模型将教师模型中的复杂特征提取骨架替换为更轻量的骨架,利用本发明多的知识蒸馏框架将教师模型中的知识迁移至学生模型,实现学生模型在实时性不变的情况下提升精度。
本实施例具体包括以下步骤:
第一步、利用车载鱼眼摄像头采集图像构建数据集,训练实时性不佳但精度高的教师语义分割模型:
所述的数据集中的图片由安装在无人驾驶车辆上的摄像头在真实街景环境下采集,在无人驾驶车辆的前后左右四个方向设置四个摄像头分别用来采集各个方向上的街景图片。采集图像分辨率大小为1920*1080,根据图像内的物体类别将像素标注为18类,构建有600张像素级标注图片的数据集,其中350张图片作为训练集;150张作为验证集,100张图片作为测试集。数据集中各类别的分布情况如图2所示。
所述的教师语义分割模型采用BiSeNet为基本网络框架,其特征提取骨架采用在ImgNet上经过预训练的ResNet18深度网络,并采用辅助损失函数来监督网络训练的过程,具体为:
Figure BDA0002967520280000031
其中:lm为用于监督最终分类结果的主损失函数,X为最终预测结果,W为网络参数,li为用于监督第i阶段的辅助损失函数,Xi为模型第i阶段输出的特征,α为用于结合二者的超参数,以上损失均为softmax损失。
所述的训练,将数据集中的图片在训练时采用数据增强操作,在输入教师语义分割模型前进行均值归一化、随机水平翻转和随机尺度变换等增强处理。
所述的随机尺度变换大小包括0.75、1.0、1.5、1.75、2.0。最终对增强后的图片进行随机裁剪为固定尺寸后进行训练。
所述的训练,采用批次梯度下降算法(SGD),在训练中引入动量方法(Momentum)与权重衰减(WeightDecay)对于批次梯度下降算法进行优化。训练中的学习率采用poly变化策略,具体为:
Figure BDA0002967520280000032
其中:lr0是初始学习率,iter为当前迭代次数,max_iter为最大迭代次数,power为衰减指数;训练完成后采用平均交并比对教师模型的精度进行衡量,具体为:
Figure BDA0002967520280000033
其中:pij代表标签属于第i类被预测为j类的像素数,pii为预测正确的像素数,pij为假正数(FalsePositives)即将第i类错误预测为其他类别的像素数,pji为假负数(FalseNegatives)即将其他类别错误预测为第i类的像素数。
第二步、将教师语义分割模型中的复杂特征提取骨架替换为轻量级骨架,在第一步的数据集上训练改进后的轻量级网络,具体为:将教师语义分割模型中的复杂特征提取骨架ResNet18替换为经过ImgNet预训练的ResNet系列或者Xception系列网络并作为轻量级学生模型,然后由第一步的数据集进行训练。
所述的轻量级学生模型的训练与第一步中教师语义分割模型的训练方式相同。
第三步、通过基于知识蒸馏的输出迁移处理,采用损失函数对教师语义分割模型与轻量级学生模型的输出概率分布差异进行衡量,使得两者输出尽可能保持一致,再通过基于知识蒸馏的特征迁移处理,对教师语义分割模型与轻量级学生模型输出中间层特征图进行处理形成相似度注意力图,提取结构化信息,通过损失函数对齐教师语义分割模型与轻量级学生模型间的相似度注意力图完成结构化知识迁移。
所述的输出迁移处理,通过L2损失函数实现,具体为:
Figure BDA0002967520280000041
其中:I为教师语义分割模型与轻量级学生模型中对应图片位置的索引集合,
Figure BDA0002967520280000042
分别为轻量级学生模型和教师语义分割模型在softmax层前输出的logits,本发明以logits此来提取输出概率分布中的知识。
所述的特征迁移处理,具体为:
Figure BDA0002967520280000043
其中:AS(φ)、AT(φ)分别为轻量级学生模型和教师语义分割模型输出的相似度注意力图,模型中间层特征图生成相似度注意力图的过程为:
Figure BDA0002967520280000044
其中:A(φ)ij为特征图中第i个特征与第j个特性间的相似度,φi为特征图中的第i个向量。
所述的结构化知识迁移是指:教师语义分割模型通过输出迁移与特征迁移对轻量级学生模型进行模型指导,在训练过程中教师语义分割模型参数保持不变,轻量级学生模型在原始softmax损失、输出迁移损失和特征迁移损失三者的监督下进行参数的更新,超参数α和β的设置应使三个损失函数保持在同一数量级;在轻量级学生模型的训练过程中原有的softmax损失函数基础上,增加输出迁移损失函数与特征迁移损失函数,具体为:
Ltotal(S)=LCE(S)+αLOT(S)+βLFT(S),其中:LCE为轻量级学生模型的单独训练的损失函数,LOT为输出迁移损失函数,LFT为特征迁移损失函数,α和β为用来调节损失对网络训练贡献大小的超参数。
第四步、在测试阶段,单独使用经第三步优化的轻量级学生模型对测试图像进行分割,获得尺寸为原图大小1/8的分割结果,通过双线性差值将最终结果上采样至输入图像尺寸。
本实施例通过实验对方法的有效性进行说明。训练的数据集有车载环视摄像头采集并被标注为18个类别,如图2所示。利用基于ResNet18的BiSeNet指导基于Xception39的BiSeNet训练,在训练的过程中,超参数的设置为,α=10,β=1000,lr0=0.1,power=0.9,batch size=16。不同模块对分割效果的提升如图2所示,实验结果如表1所示。
表1BiSeNet系列模型蒸馏实验
Figure BDA0002967520280000045
Figure BDA0002967520280000051
表1是BiSeNet在采集的鱼眼图像数据集下的实验结果,基于Xception39的BiSeNet1在基于ResNet18的BiSeNet2输出分布的指导下进行训练,采用了L2输出迁移损失函数对齐二者的输出分布。基于Xception39的BiSeNet1在基于ResNet18的BiSeNet2的输出迁移指导下的平均交并比为73.7%,比单独训练的BiSeNet1提高了0.8%。在此基础上进一步增加本发明设计的特征迁移蒸馏方案进行训练后,BiSeNet1的平均交并比提升至74.6%,两部分的蒸馏一共使学生模型的平均交并比提高了1.7%。
本实施例中将蒸馏的模型部署至NVIDIAJetsonXavier嵌入式平台,利用嵌入式平台实现了真实环境下的实时语义分割,速度达到了14FPS,证实本发明的语义分割方法兼具准确性与实时性。模型实时性的测试如表2所示。
表2模型在NVIDIAJetsonXavier嵌入式平台上实时性比较
模型 骨架 测试平台 输入大小 FPS
BiSeNet<sup>1</sup> Xception39 Xavier 1920*1080 14.0
BiSeNet<sup>2</sup> ResNet18 Xavier 1920*1080 6.6
为了提高现有实时语义分割网络的分割性能,本发明基于知识蒸馏技术设计了一套针对语义分割网络的训练方案,在实现实时语义分割的基础上,借助复杂精确的教师语义分割模型通过输出迁移与特征迁移两个方面的蒸馏训练得到更高性能的实时轻量级学生模型。本发明能够有效地提取复杂教师语义分割模型中的知识并迁移至轻量级学生模型,在大幅提升轻量级语义分割模型精度的同时没有任何计算量的增加,具有应用灵活,精度提升明显等优点。
与现有技术相比,本发明通过设计的知识蒸馏框架在不改变实时性的前提下提升了现有语义分割模型的准确性。从实施例可以看出,表1是BiSeNet在采集的鱼眼图像数据集下的实验结果,基于Xception39的BiSeNet1在基于ResNet18的BiSeNet2输出分布的指导下进行训练,采用了L2输出迁移损失函数对齐二者的输出分布。基于Xception39的BiSeNet1在基于ResNet18的BiSeNet2的输出迁移指导下的平均交并比为73.7%,比单独训练的BiSeNet1提高了0.8%。在此基础上进一步增加本发明设计的特征迁移蒸馏方案进行训练后,BiSeNet1的平均交并比提升至74.6%,两部分的蒸馏一共使学生模型的平均交并比提高了1.7%,在精度提升的同时学生模型的计算量没有任何增加。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (8)

1.一种基于知识蒸馏的鱼眼图像实时语义分割方法,其特征在于,通过鱼眼图像构建数据集,训练教师语义分割模型,然后将教师语义分割模型中的复杂特征提取骨架替换为轻量级骨架后得到轻量级学生模型,通过数据集上训练轻量级学生模型;再构建基于知识蒸馏的输出迁移和特征迁移,在保持轻量级学生模型实时性情况下提升精度,在测试阶段,单独使用轻量级学生模型对测试图像进行基于知识蒸馏的鱼眼图像实时语义分割;
所述的提升精度,具体包括:输出迁移采用损失函数对教师语义分割模型与轻量级学生模型的输出的概率分别差异进行衡量,使得两者输出尽可能保持一致,特征迁移对教师语义分割模型与轻量级学生模型输出中间层特征图进行处理形成相似度注意力图,提取结构化信息,通过损失函数对齐教师语义分割模型与轻量级学生模型间的相似度注意力图完成结构化知识迁移。
2.根据权利要求1所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,所述的输出迁移处理,通过L2损失函数实现,具体为:
Figure FDA0002967520270000011
其中:I为教师语义分割模型与轻量级学生模型中对应图片位置的索引集合,
Figure FDA0002967520270000012
分别为轻量级学生模型和教师语义分割模型在softmax层前输出的logits,本发明以logits此来提取输出概率分布中的知识。
3.根据权利要求1所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,所述的特征迁移处理,具体为:
Figure FDA0002967520270000013
其中:AS(φ)、AT(φ)分别为轻量级学生模型和教师语义分割模型输出的相似度注意力图,模型中间层特征图生成相似度注意力图的过程为:
Figure FDA0002967520270000014
其中:A(φ)ij为特征图中第i个特征与第j个特性间的相似度,φi为特征图中的第i个向量。
4.根据权利要求1所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,所述的结构化知识迁移是指:教师语义分割模型通过输出迁移与特征迁移对轻量级学生模型进行模型指导,在训练过程中教师语义分割模型参数保持不变,轻量级学生模型在原始softmax损失、输出迁移损失和特征迁移损失三者的监督下进行参数的更新,超参数α和β的设置应使三个损失函数保持在同一数量级;在轻量级学生模型的训练过程中原有的softmax损失函数基础上,增加输出迁移损失函数与特征迁移损失函数,具体为:Ltotal(S)=LCE(S)+αLOT(S)+βLFT(S),其中:LCE为轻量级学生模型的单独训练的损失函数,LOT为输出迁移损失函数,LFT为特征迁移损失函数,α和β为用来调节损失对网络训练贡献大小的超参数。
5.根据权利要求1~4中任一所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,所述的教师语义分割模型采用BiSeNet为基本网络框架,其特征提取骨架采用在ImgNet上经过预训练的ResNet18深度网络,并采用辅助损失函数来监督网络训练的过程,具体为:
Figure FDA0002967520270000021
其中:lm为用于监督最终分类结果的主损失函数,X为最终预测结果,W为网络参数,li为用于监督第i阶段的辅助损失函数,Xi为模型第i阶段输出的特征,α为用于结合二者的超参数,以上损失均为softmax损失。
6.根据权利要求5所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,所述的训练,采用批次梯度下降算法,在训练中引入动量方法与权重衰减对于批次梯度下降算法进行优化,学习率采用poly变化策略,具体为:
Figure FDA0002967520270000022
其中:lr0是初始学习率,iter为当前迭代次数,max_iter为最大迭代次数,power为衰减指数;训练完成后采用平均交并比对教师模型的精度进行衡量,具体为:
Figure FDA0002967520270000023
其中:pij代表标签属于第i类被预测为j类的像素数,pii为预测正确的像素数,pij为假正数即将第i类错误预测为其他类别的像素数,pji为假负数即将其他类别错误预测为第i类的像素数。
7.根据权利要求1~6中任一所述的基于知识蒸馏的鱼眼图像实时语义分割方法,其特征是,具体包括:
第一步、利用车载鱼眼摄像头采集图像构建数据集,训练实时性不佳但精度高的教师语义分割模型;
第二步、将教师语义分割模型中的复杂特征提取骨架替换为轻量级骨架,在第一步的数据集上训练改进后的轻量级网络,具体为:将教师语义分割模型中的复杂特征提取骨架ResNet18替换为经过ImgNet预训练的ResNet系列或者Xception系列网络并作为轻量级学生模型,然后由第一步的数据集进行训练,其中轻量级学生模型的训练与第一步中教师语义分割模型的训练方式相同;
第三步、通过基于知识蒸馏的输出迁移处理,采用损失函数对教师语义分割模型与轻量级学生模型的输出概率分布差异进行衡量,使得两者输出尽可能保持一致,再通过基于知识蒸馏的特征迁移处理,对教师语义分割模型与轻量级学生模型输出中间层特征图进行处理形成相似度注意力图,提取结构化信息,通过损失函数对齐教师语义分割模型与轻量级学生模型间的相似度注意力图完成结构化知识迁移;
第四步、在测试阶段,单独使用经第三步优化的轻量级学生模型对测试图像进行分割,获得尺寸为原图大小1/8的分割结果,通过双线性差值将最终结果上采样至输入图像尺寸。
8.一种实现上述任一权利要求所述基于知识蒸馏的鱼眼图像实时语义分割方法的系统,其特征在于,包括:依次相连的教师语义分割模块、输出迁移模块、特征迁移模块和轻量级学生模块,其中:轻量级学生模块训练的过程中,输出迁移模块提取教师语义分割模块输出概率分布中的知识至轻量级学生模块,特征迁移模块通过提取教师语义分割模块中间层输出特征图中的结构化知识至轻量级学生模块。
CN202110254588.3A 2021-03-09 2021-03-09 基于知识蒸馏的鱼眼图像实时语义分割方法 Pending CN115049534A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110254588.3A CN115049534A (zh) 2021-03-09 2021-03-09 基于知识蒸馏的鱼眼图像实时语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110254588.3A CN115049534A (zh) 2021-03-09 2021-03-09 基于知识蒸馏的鱼眼图像实时语义分割方法

Publications (1)

Publication Number Publication Date
CN115049534A true CN115049534A (zh) 2022-09-13

Family

ID=83156553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110254588.3A Pending CN115049534A (zh) 2021-03-09 2021-03-09 基于知识蒸馏的鱼眼图像实时语义分割方法

Country Status (1)

Country Link
CN (1) CN115049534A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116030257A (zh) * 2023-02-27 2023-04-28 速度时空信息科技股份有限公司 一种基于NesT模型的语义分割方法
CN116091307A (zh) * 2023-04-06 2023-05-09 湖北易康思科技有限公司 鱼眼图像的矫正模型的微调方法、装置及电子设备
CN116110022A (zh) * 2022-12-10 2023-05-12 河南工业大学 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN116609518A (zh) * 2023-05-17 2023-08-18 丽水瑞联医疗科技有限公司 一种胎盘大体分析一体机
CN117496509A (zh) * 2023-12-25 2024-02-02 江西农业大学 一种融合多教师知识蒸馏的Yolov7柚子计数方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116110022A (zh) * 2022-12-10 2023-05-12 河南工业大学 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN116110022B (zh) * 2022-12-10 2023-09-05 河南工业大学 基于响应知识蒸馏的轻量化交通标志检测方法及系统
CN116030257A (zh) * 2023-02-27 2023-04-28 速度时空信息科技股份有限公司 一种基于NesT模型的语义分割方法
CN116030257B (zh) * 2023-02-27 2023-08-15 速度科技股份有限公司 一种基于NesT模型的语义分割方法
CN116091307A (zh) * 2023-04-06 2023-05-09 湖北易康思科技有限公司 鱼眼图像的矫正模型的微调方法、装置及电子设备
CN116609518A (zh) * 2023-05-17 2023-08-18 丽水瑞联医疗科技有限公司 一种胎盘大体分析一体机
CN117496509A (zh) * 2023-12-25 2024-02-02 江西农业大学 一种融合多教师知识蒸馏的Yolov7柚子计数方法
CN117496509B (zh) * 2023-12-25 2024-03-19 江西农业大学 一种融合多教师知识蒸馏的Yolov7柚子计数方法

Similar Documents

Publication Publication Date Title
CN115049534A (zh) 基于知识蒸馏的鱼眼图像实时语义分割方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN107506722A (zh) 一种基于深度稀疏卷积神经网络人脸情感识别方法
CN109886225A (zh) 一种基于深度学习的图像手势动作在线检测与识别方法
CN113888550B (zh) 一种结合超分辨率和注意力机制的遥感图像道路分割方法
CN112464911A (zh) 基于改进YOLOv3-tiny的交通标志检测与识别方法
CN114038037B (zh) 基于可分离残差注意力网络的表情标签修正和识别方法
CN111401156B (zh) 基于Gabor卷积神经网络的图像识别方法
CN110717493B (zh) 一种基于深度学习的含堆叠字符的车牌识别方法
CN111353487A (zh) 用于变电站的设备信息提取方法
CN111461006B (zh) 一种基于深度迁移学习的光学遥感图像杆塔位置检测方法
CN110675405B (zh) 基于注意力机制的one-shot图像分割方法
CN115966010A (zh) 一种基于注意力和多尺度特征融合的表情识别方法
CN113743505A (zh) 基于自注意力和特征融合的改进ssd目标检测方法
CN110598746A (zh) 一种基于ode求解器自适应的场景分类方法
CN115131747A (zh) 基于知识蒸馏的输电通道工程车辆目标检测方法及系统
CN112395953A (zh) 一种道面异物检测系统
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN116796810A (zh) 一种基于知识蒸馏的深度神经网络模型压缩方法及装置
CN113436198A (zh) 一种协同图像超分辨率重建的遥感图像语义分割方法
CN117132910A (zh) 一种用于无人机的车辆检测方法、装置及存储介质
Zhao et al. Recognition and Classification of Concrete Cracks under Strong Interference Based on Convolutional Neural Network.
CN114639090A (zh) 一种非可控环境下的鲁棒中文车牌识别方法
Lian et al. Study on obstacle detection and recognition method based on stereo vision and convolutional neural network
CN116704196B (zh) 一种训练图像语义分割模型的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination