CN109086678B - 一种基于深度监督学习提取图像多级特征的行人检测方法 - Google Patents

一种基于深度监督学习提取图像多级特征的行人检测方法 Download PDF

Info

Publication number
CN109086678B
CN109086678B CN201810746609.1A CN201810746609A CN109086678B CN 109086678 B CN109086678 B CN 109086678B CN 201810746609 A CN201810746609 A CN 201810746609A CN 109086678 B CN109086678 B CN 109086678B
Authority
CN
China
Prior art keywords
pedestrian detection
training
network
deep
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810746609.1A
Other languages
English (en)
Other versions
CN109086678A (zh
Inventor
赵美蓉
何翼飞
郑叶龙
黄银国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201810746609.1A priority Critical patent/CN109086678B/zh
Publication of CN109086678A publication Critical patent/CN109086678A/zh
Application granted granted Critical
Publication of CN109086678B publication Critical patent/CN109086678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种基于深度监督学习提取图像多级特征的行人检测方法,包括:构建红外行人检测训练集和测试数据集;在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;采用RMSprop学习策略训练行人检测网络:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。本发明不需要预训练模型,从零开始训练的行人检测方法,实现了在红外数据集上的端到端训练,提高了基于远红外图像行人检测的准确率。可实现基于PC端X86 CPU和嵌入式端ARM CPU的实时检测。

Description

一种基于深度监督学习提取图像多级特征的行人检测方法
技术领域
本发明涉及一种行人检测方法。特别是涉及一种基于深度监督学习提取图像多级特征的行人检测方法。
背景技术
行人检测是利用计算机视觉技术判断图像中是否存在行人并给予精确定位。针对远红外图像的行人检测拥有诸多优点和广泛的应用场景。相比与可见光波段,远红外热成像探测距离远、成像质量高、行人目标特征突出,广泛应用在车辆自动驾驶、辅助驾驶、安防监控、机场安全等领域。
深度学习技术和卷积神经网络近年来在许多计算机视觉任务中都有不俗的表现。许多采用深度学习检测模型的行人检测方法,相比基于传统机器学习的模型,也取得了突破性的进展。现行的深度学习行人检测方法大多先行在ImageNet数据集上预训练分类模型,随后再于行人检测的数据集上进行检测任务的调优。但是远红外的图像为单通道灰度图像,而预训练的ImageNet数据集为彩色三通道图像,远红外热成像的细节特征也与可见光图像迥异,由分类模型转向检测任务会有也迁移学习的瓶颈,这些因素极大的影响了神经网络训练结果,限制了红外行人检测系统的准确率。
基于深度学习的行人检测方法虽然性能优异,但也有计算量大,占用内存空间大的缺点,现行算法多运行在GPU平台,限制了其在嵌入式终端和PC端CPU上的应用。
发明内容
本发明所要解决的技术问题是,提供一种实现了在红外数据集上的端到端训练,提高了基于远红外图像行人检测准确率的基于深度监督学习提取图像多级特征的行人检测方法。
本发明所采用的技术方案是:一种基于深度监督学习提取图像多级特征的行人检测方法,包括如下步骤:
1)构建红外行人检测训练集和测试数据集;
2)在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;
3)采用RMSprop学习策略训练行人检测网络,采用如下配置进行训练:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;
4)针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。
步骤1)中红外行人检测训练集和测试数据集所需红外图像数据采用Elektra研究中心的CVC-09和CVC-14数据集,包括:
(1)修改红外图像的标注数据格式为VOC数据集标准;
(2)将CVC-09和CVC-14两数据集合并;
(3)选取12534张图片为训练集,剩余3600张图片为测试集;
(4)制作训练和测试时时所需的图片目录文本文件。
在输入神经网络前,将图片尺寸裁剪为320*320,此时图片长宽均为CPU单指令多数据流指令宽度的整数倍。
步骤2)所述的行人检测网络包括:骨干网络和后端检测器。
所述的骨干网络采用MobileNet-V2,骨干网络最前端采用3*3传统卷积的基干层,后续各层均采用基于深度可分离卷积的bottleneck反转风格设计。
所述的骨干网络包括:1个3*3卷积的基干层,通道数为32,步长为2;15个反转bottleneck组成的特征提取层,各层通道数分别为16、24、24、32、32、32、64、64、64、64、96、96、96、160、160,且第2、4、7、11、14层的步长为2。
所述的后端检测器是以SSD的架构为基础,选用骨干网络的第十五层和SSD的五层特征图作为SSD的特征输入,所述的SSD的五层特征图,是采用MobileNet-V2中的bottleneck卷积建立的特征图,并将线性层的通道数提升为输入通道的二分之一,在特征图间建立深度监督残差连接,采用1*1卷积连接,连接合并后的结果先进行通道升维,再输送到后续检测网络。
步骤4)包括:
(1)对行人检测网络进行速度测试,得到网络中调用次数最多,占用运行时间最长的是深度可分离卷积;
(2)以深度可分离卷积的输入数据的宽、高作为变化最快的维度,对深度可分离卷积进行分块,并对每个分块的运算进行循环展开;
(3)在C++代码中调用Intel intrinsic指令,对循环展开后的分块进行向量化处理。
本发明的一种基于深度监督学习提取图像多级特征的行人检测方法,不需要预训练模型,从零开始训练的行人检测方法,实现了在红外数据集上的端到端训练,提高了基于远红外图像行人检测的准确率。同时精心设计了精简高效的网络架构,优化了运算热点,可实现基于PC端X86CPU和嵌入式端ARM CPU的实时检测。本发明有益效果如下:
1、本发明中,卷积网络各层之间均有残差连接,改善了梯度从网络较深层向较浅层的流动性,同时增加了特征的重用性,使得不同尺度的特征能被网络各层加以利用,使得网络可以基于较少的通道数量,特征图尺寸,实现较高的表达能力,在保证检测精度的同时减少了网络参数和运算量。
2、本发明中,基于深度监督网络的架构,可实现在红外数据集上从零开始的训练。传统方法为在大规模可见光数据集上预训练,再与目标数据集调优。由于可见光RGB的预训练模型与红外数据集的单通道图像有较大的属性差别,使得调优之后的网络并不能很好的拟合红外图像。本方法直接在红外数据集上训练,可实现更好的拟合。同时减小了训练的工作量,可节约训练时长和能耗。
3、本发明中,对神经网络推理阶段的“热点”:深度可分离卷积进行了优化加速,加大的减少了运行时间。同时,使得本行人检测方法可运行在许多运算资源受限的平台,例如手机和某些嵌入式设备,极大地拓宽了本发明的应用场景。
附图说明
图1是SSD检测网络特征图;
图2是本发明检测网络特征图;
图3是本发明中特征图间的Bottleneck卷积方式和残差连接。
具体实施方式
下面结合实施例和附图对本发明的一种基于深度监督学习提取图像多级特征的行人检测方法做出详细说明。
本发明的一种基于深度监督学习提取图像多级特征的行人检测方法,包括如下步骤:
1)构建红外行人检测训练集和测试数据集;所述的红外行人检测训练集和测试数据集所需红外图像数据采用Elektra研究中心的CVC-09和CVC-14数据集,本发明的构建红外行人检测训练集和测试数据集包括:
(1)修改红外图像的标注数据格式为VOC数据集标准;
(2)将CVC-09和CVC-14两数据集合并;
(3)选取12534张图片为训练集,剩余3600张图片为测试集;
(4)制作训练和测试时时所需的图片目录文本文件。
本发明在输入神经网络前,将图片尺寸裁剪为320*320,此时图片长宽均为CPU单指令多数据流指令宽度的整数倍,方便后续的向量化优化。
2)在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;所述的行人检测网络包括:骨干网络和后端检测器。其中,
(1)所述的骨干网络采用MobileNet-V2,骨干网络最前端采用3*3传统卷积的基干层,后续各层均采用基于深度可分离卷积的bottleneck反转风格设计,bottleneck为反转风格,bottleneck首先采用1*1的普通卷积进行升维,再选用3*3的深度可分离卷积对特征图的空间信息进行处理,最后再选用1*1卷积实现降维,并去掉非线性层relu以保全特征图的全部信息量。在此过程中,深度可分离卷积运算开销极小,故先将网络升维,再进行高维运算,以增强网络的表达能力。如图3所示,不同层次间的残差连接在低维的线性层进行,因线性层的通道数较小,在骨干网络中通常设定为输入通道数的六分之一,故此种连接方式可极大节约内存。
所述的骨干网络如表1所示,包括有:1个3*3卷积的基干层,通道数为32,步长为2;15个反转bottleneck组成的特征提取层,各层通道数分别为16、24、24、32、32、32、64、64、64、64、96、96、96、160、160,且第2、4、7、11、14层的步长为2。
(2)所述的后端检测器是以SSD的架构为基础,选用骨干网络的第十五层和SSD的五层特征图作为SSD的特征输入,这里与已有的SSD的不同之处在于,如图1所示,已有的SSD是采用传统卷积生成检测用特征图,本发明所述的SSD的五层特征图,如图2所示,是采用MobileNet-V2中的bottleneck卷积建立的特征图,并将线性层的通道数提升为输入通道的二分之一,使网络运行时开销更小,检测精度更高。在特征图间建立深度监督残差连接,由于不同特征图的尺寸、通道数不同,此处采用1*1卷积连接,连接合并后的结果先进行通道升维,再输送到后续检测网络。
3)采用RMSprop学习策略训练行人检测网络,采用如下配置进行训练:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;
4)针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。包括:
(1)对行人检测网络进行速度测试,得到网络中调用次数最多,占用运行时间最长的是深度可分离卷积;
(2)在现有深度学习框架如caffe中,深度可分离卷积采用传统分组卷积实现,利用for循环遍历各个通道,再进行im2col将卷积运算转化成矩阵相乘交给高性能gemm库完成。整个过程较繁琐,对于运算量不大的深度可分离卷积而言,产生了许多不必要的开销。
本发明不需要额外的存储空间,以深度可分离卷积的输入数据的宽、高作为变化最快的维度,对深度可分离卷积进行分块,并对每个分块的运算进行循环展开;
(3)本发明目标优化平台为采用Intel Haswell CPU,对输出特征的每个点而言,其计算都是独立的,故可以在使用循环展开的同时使用向量化处理,在C++代码中调用Intel intrinsic指令,对循环展开后的分块进行向量化处理。
在C++代码中调用Intel intrinsic指令,每条向量指令一次可处理8个32位浮点数据。最终测试算法性能提升小于8,瓶颈在三级缓存的带宽处。由于处理器具有四个核心,支持4线程,在使用AVX向量化和循环展开后,算法性能已经限制在三级缓存上,因此可使用OpenMP线程级并行,添加OpenMP的指导语句进行多核并行化,增加对三级缓存的独立请求,以充分发挥三级带宽,测试发现相比单线程代码,获得了1.2倍的性能提升。最终实现计算访存比4:3,并大幅缩短了程序运行时间。
表1:骨干网络配置
输入大小 操作类型 通道数 重复次数 步长
320*320*3 Conv2d 32 1 2
160*160*32 Bottleneck 16 1 1
160*160*16 Bottleneck 24 2 2
80*80*24 Bottleneck 32 3 2
40*40*32 Bottleneck 64 4 2
40*40*64 Bottleneck 96 3 1
16*16*96 Bottleneck 160 2 2
16*16*160 Bottleneck 128 1 1
16*16*128 Bottleneck 128 1 1
16*16*128 Bottleneck 64 1 2
8*8*64 Bottleneck 64 1 1
8*8*64 Bottleneck 64 1 1

Claims (3)

1.一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,包括如下步骤:
1)构建红外行人检测训练集和测试数据集;
2)在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;所述的行人检测网络包括:骨干网络和后端检测器,其中,所述的后端检测器是以SSD的架构为基础,选用骨干网络的第十五层和SSD的五层特征图作为SSD的特征输入,所述的SSD的五层特征图,是采用MobileNet-V2中的bottleneck卷积建立的特征图,并将线性层的通道数提升为输入通道的二分之一,在特征图间建立深度监督残差连接,采用1*1卷积连接,连接合并后的结果先进行通道升维,再输送到后续检测网络;
所述的骨干网络采用MobileNet-V2,骨干网络最前端采用3*3传统卷积的基干层,后续各层均采用基于深度可分离卷积的bottleneck反转风格设计;所述的骨干网络包括:1个3*3卷积的基干层,通道数为32,步长为2;15个反转bottleneck组成的特征提取层,各层通道数分别为16、24、24、32、32、32、64、64、64、64、96、96、96、160、160,且第2、4、7、11、14层的步长为2;
3)采用RMSprop学习策略训练行人检测网络,采用如下配置进行训练:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;
4)针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速;包括:
(1)对行人检测网络进行速度测试,得到网络中调用次数最多,占用运行时间最长的是深度可分离卷积;
(2)以深度可分离卷积的输入数据的宽、高作为变化最快的维度,对深度可分离卷积进行分块,并对每个分块的运算进行循环展开;
(3)在C++代码中调用Intel intrinsic指令,对循环展开后的分块进行向量化处理。
2.根据权利要求1所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,步骤1)中红外行人检测训练集和测试数据集所需红外图像数据采用Elektra研究中心的CVC-09和CVC-14数据集,包括:
(1)修改红外图像的标注数据格式为VOC数据集标准;
(2)将CVC-09和CVC-14两数据集合并;
(3)选取12534张图片为训练集,剩余3600张图片为测试集;
(4)制作训练和测试时所需的图片目录文本文件。
3.根据权利要求2所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,在输入神经网络前,将图片尺寸裁剪为320*320,此时图片长宽均为CPU单指令多数据流指令宽度的整数倍。
CN201810746609.1A 2018-07-09 2018-07-09 一种基于深度监督学习提取图像多级特征的行人检测方法 Active CN109086678B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810746609.1A CN109086678B (zh) 2018-07-09 2018-07-09 一种基于深度监督学习提取图像多级特征的行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810746609.1A CN109086678B (zh) 2018-07-09 2018-07-09 一种基于深度监督学习提取图像多级特征的行人检测方法

Publications (2)

Publication Number Publication Date
CN109086678A CN109086678A (zh) 2018-12-25
CN109086678B true CN109086678B (zh) 2022-02-25

Family

ID=64837321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810746609.1A Active CN109086678B (zh) 2018-07-09 2018-07-09 一种基于深度监督学习提取图像多级特征的行人检测方法

Country Status (1)

Country Link
CN (1) CN109086678B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209810B (zh) * 2018-12-26 2023-05-26 浙江大学 向可见光与红外图像准确实时行人检测的边界框分割监督深度神经网络架构
CN109902800B (zh) * 2019-01-22 2020-11-27 北京大学 基于拟反馈神经网络的多级骨干网络检测通用物体的方法
CN109902576B (zh) * 2019-01-25 2021-05-18 华中科技大学 一种头肩图像分类器的训练方法及应用
CN109840502B (zh) * 2019-01-31 2021-06-15 深兰科技(上海)有限公司 一种基于ssd模型进行目标检测的方法及设备
CN110059558B (zh) * 2019-03-15 2023-08-25 江苏大学 一种基于改进ssd网络的果园障碍物实时检测方法
CN110033038B (zh) * 2019-04-09 2022-08-05 电子科技大学 气动热试验数据的智能选取算法
CN111860046B (zh) * 2019-04-26 2022-10-11 四川大学 一种改进MobileNet模型的人脸表情识别方法
CN110378243A (zh) * 2019-06-26 2019-10-25 深圳大学 一种行人检测方法及装置
WO2020258077A1 (zh) * 2019-06-26 2020-12-30 深圳大学 一种行人检测方法及装置
CN110490188A (zh) * 2019-07-02 2019-11-22 天津大学 一种基于ssd网络改进型的目标物体快速检测方法
CN110490892A (zh) * 2019-07-03 2019-11-22 中山大学 一种基于USFaster R-CNN的甲状腺超声图像结节自动定位识别方法
CN110378254B (zh) * 2019-07-03 2022-04-19 中科软科技股份有限公司 车损图像修改痕迹的识别方法、系统、电子设备及存储介质
CN110472542A (zh) * 2019-08-05 2019-11-19 深圳北斗通信科技有限公司 一种基于深度学习的红外图像行人检测方法及检测系统
CN110580505A (zh) * 2019-08-29 2019-12-17 杭州火小二科技有限公司 一种基于餐盘识别的智慧收银方法
CN110619365B (zh) * 2019-09-18 2023-09-12 苏州经贸职业技术学院 一种落水检测方法
CN110766050B (zh) * 2019-09-19 2023-05-23 北京捷通华声科技股份有限公司 模型生成方法、文本识别方法、装置、设备及存储介质
CN110674827A (zh) * 2019-09-24 2020-01-10 哈尔滨工业大学 一种融合深度学习与形态学滤波的设备状态视觉检测方法
CN111127360B (zh) * 2019-12-20 2023-08-29 东南大学 一种基于自动编码器的灰度图像迁移学习方法
CN111753741B (zh) * 2020-06-28 2024-03-15 北京小眼探索科技有限公司 基于深度学习的特种车辆辅助驾驶方法、装置及存储介质
CN111832576A (zh) * 2020-07-17 2020-10-27 济南浪潮高新科技投资发展有限公司 一种用于移动端的轻量级目标检测方法及系统
CN111881828B (zh) * 2020-07-28 2022-05-06 浙江大学 一种面向移动端设备的障碍物检测方法
CN113052189B (zh) * 2021-03-30 2022-04-29 电子科技大学 一种基于改进的MobileNetV3特征提取网络
CN113240650A (zh) * 2021-05-19 2021-08-10 中国农业大学 基于深度学习密度图回归的鱼苗计数系统及计数方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123626A (ja) * 2010-12-08 2012-06-28 Toyota Central R&D Labs Inc 対象物検出装置及びプログラム
CN105404857A (zh) * 2015-11-04 2016-03-16 北京联合大学 一种基于红外的夜间智能车前方行人检测方法
CN106845430A (zh) * 2017-02-06 2017-06-13 东华大学 基于加速区域卷积神经网络的行人检测与跟踪方法
CN107589758A (zh) * 2017-08-30 2018-01-16 武汉大学 一种基于双源视频分析的智能化野外无人机搜救方法与系统
CN108229442A (zh) * 2018-02-07 2018-06-29 西南科技大学 基于ms-kcf的图像序列中人脸快速稳定检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123626A (ja) * 2010-12-08 2012-06-28 Toyota Central R&D Labs Inc 対象物検出装置及びプログラム
CN105404857A (zh) * 2015-11-04 2016-03-16 北京联合大学 一种基于红外的夜间智能车前方行人检测方法
CN106845430A (zh) * 2017-02-06 2017-06-13 东华大学 基于加速区域卷积神经网络的行人检测与跟踪方法
CN107589758A (zh) * 2017-08-30 2018-01-16 武汉大学 一种基于双源视频分析的智能化野外无人机搜救方法与系统
CN108229442A (zh) * 2018-02-07 2018-06-29 西南科技大学 基于ms-kcf的图像序列中人脸快速稳定检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MobileNetV2: Inverted Residuals and Linear Bottlenecks;Mark Sandler et al;《arXiv:1801.04381v3》;20180404;第4-6节 *
彭志蓉等.改进的多光谱聚合通道行人检测 .《光电工程》.2017, *
樊峻畅.红外图像中基于卷积神经网络的车辆检测.《中国优秀硕士学位论文全文数据库信息科技辑》.2018,第2018年卷(第4期), *
红外图像中基于卷积神经网络的车辆检测;樊峻畅;《中国优秀硕士学位论文全文数据库信息科技辑》;20180415;第2018年卷(第4期);摘要、第3.3、4.1-4.2节 *

Also Published As

Publication number Publication date
CN109086678A (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
CN109086678B (zh) 一种基于深度监督学习提取图像多级特征的行人检测方法
US10970619B1 (en) Method and system for hierarchical weight-sparse convolution processing
CN111967468A (zh) 一种基于fpga的轻量级目标检测神经网络的实现方法
CN111401406A (zh) 一种神经网络训练方法、视频帧处理方法以及相关设备
CN114972323B (zh) 一种用于模型训练的缺陷图片生成方法及系统
CN112257844B (zh) 一种基于混合精度配置的卷积神经网络加速器及其实现方法
CN103177414A (zh) 一种基于结构的图节点相似度并行计算方法
CN112070114A (zh) 基于高斯约束注意力机制网络的场景文字识别方法及系统
CN115797835A (zh) 一种基于异构Transformer的无监督视频目标分割算法
CN109447239B (zh) 一种基于arm的嵌入式卷积神经网络加速方法
CN114170581B (zh) 基于深度监督的Anchor-Free交通标志检测方法
CN114333062B (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN117744745B (zh) 一种基于YOLOv5网络模型的图像优化方法及优化系统
CN113836319B (zh) 融合实体邻居的知识补全方法及系统
Qu et al. Lightweight oriented detector for insulators in drone aerial images
CN113313720A (zh) 对象分割方法和装置
CN110120009B (zh) 基于显著物体检测和深度估计算法的背景虚化实现方法
CN111553442A (zh) 一种分类器链标签序列的优化方法及系统
CN116524180A (zh) 基于轻量级主干结构的戏曲舞台场景分割方法
CN111508024A (zh) 一种基于深度学习估计机器人位姿的方法
CN116229199A (zh) 基于模型轻量化的目标检测方法
CN114898881A (zh) 一种生存预测方法、装置、设备和存储介质
CN114612758A (zh) 一种基于深度分组可分离卷积的目标检测方法
CN114117896A (zh) 面向超长simd管线的二值规约优化实现方法及系统
CN109815911A (zh) 基于深度融合网络的视频运动物体检测系统、方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant