CN107220703A - 一种基于多尺度检测的深度神经网络 - Google Patents

一种基于多尺度检测的深度神经网络 Download PDF

Info

Publication number
CN107220703A
CN107220703A CN201611251241.9A CN201611251241A CN107220703A CN 107220703 A CN107220703 A CN 107220703A CN 201611251241 A CN201611251241 A CN 201611251241A CN 107220703 A CN107220703 A CN 107220703A
Authority
CN
China
Prior art keywords
layer
deep neural
neural network
characteristic
rise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611251241.9A
Other languages
English (en)
Inventor
王曦
周冕
谢晓靓
宋健明
赵贵平
王震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enbotai (tianjin) Technology Co Ltd
Original Assignee
Enbotai (tianjin) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enbotai (tianjin) Technology Co Ltd filed Critical Enbotai (tianjin) Technology Co Ltd
Priority to CN201611251241.9A priority Critical patent/CN107220703A/zh
Publication of CN107220703A publication Critical patent/CN107220703A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明一种基于多尺度检测的深度神经网络,在不同的网络层上设置多个检测网络,这样就解决了尺度变化的问题,即可以检测出小物体也可以检测大物体;在同一个网络层上设置多个不同大小不同形状的检测器,这样就解决了形状变化的问题;设置一个全新的合并层,将上面多个检测结果进行合并,共下面的分类网络使用;为了同时保留低层的细节信息和高层的全局信息,使用了一个特殊的反卷积层,对高层的特征层进行升维处理,并和低层的特征层进行特征合并,形成了新的特征图,然后对这个新的特征层进行ROI Pooling处理,本发明大大缓解了深度神经网络在ADAS中的应用。

Description

一种基于多尺度检测的深度神经网络
技术领域
本发明专利属于测距领域,尤其涉及一种基于多尺度检测的深度神经网络。
背景技术
随着中国汽车抱有辆的增多,中国的车祸也随之增多。因此ADAS(高级行车辅助系统)应运而生,并大大提高了行车的安全性。但是传统的ADAS有其先天的缺陷:对环境感知的性能不佳,只能感知有限的物体。近年来随着深度学习的发展,其强大的环境认知能力得到了越来越多研究者和工程师的认可,并将越来越广泛的得到应用。在汽车领域,环境感知也是也是其系统的重要组成部分,深度学习其强大的感知能力也应用到汽车系统上。但是汽车有其特殊的需求:1.车载相机为了实时性,其分辨率比常用的相机分辨率小,2.在相机视野范围内,很多不同大小的目标,最小的只有不到16x16个像素,最大的目标可以覆盖整个画面。这些都为检测提出了非常高的需求。本发明就是为了解决这样的尺度问题,并着重解决小目标的检测问题。
发明专利内容
本发明旨在解决ADAS中的环境感知问题,并且尤其解决的是深度神经网络中对尺度变化的物体效果较差,尤其在物体上的性能最差。传统的深度神经网络为了能应用于物体检测,将目标定位和目标分类分为2个子网络进行。首先使用一个简单的定位网络,对图像中的目标进行定位,然后使用ROI Pooling技术,使用第一个字网络的输出从共享层中提取物体的特征,然后送入第二个子网中进行识别。这里就有一个问题目标识别的精度取决于特征的分辨率。传统的算法中,使用的是下采16x16的特征层进行特征提取,因此理论上识别物体的最小大小为16x16个像素,再加上特征的误差,因此实际上物体最小大小可能为24x24或者32x32。综上所述,深度神经网络在检测小目标物体中性能较差。此问题大大制约了深度神经网络在ADAS中的应用。
一种基于多尺度检测的深度神经网络,在不同的网络层上设置多个检测网络,这样就解决了尺度变化的问题,即可以检测出小物体也可以检测大物体;在同一个网络层上设置多个不同大小不同形状的检测器,这样就解决了形状变化的问题;设置一个全新的合并层,将上面多个检测结果进行合并,共下面的分类网络使用;为了同时保留低层的细节信息和高层的全局信息,使用了一个特殊的反卷积层,对高层的特征层进行升维处理,并和低层的特征层进行特征合并,形成了新的特征图,然后对这个新的特征层进行ROI Pooling处理。
结构为一个典型的倒金字塔结构,越靠近输入端的网络层,其特征图越大,越靠近输出层的网络层,其特征图越小。
深度神经网络中,越靠近输入层的网络层,特征图对目标的细节保留的越好,越靠近输出层的网络层,特征图越表达高层信息,对大目标描述的越细致。
本发明的有益效果在于:1、本发明使用了不同尺度的检测器,可以在不同尺度的特征层上进行目标定位,这样便解决了尺度变化的问题。
2.本发明在也使用了不同形状的检测器,可以对不同的形状的物体进行定位,解决了物体的形变问题。
3.使用了特殊的反卷积层,对高层特征层进行升维处理,并和低层的特征层进行特征合并,这样生成的新的特征层即保留了高层的全局信息,也保留了低层的细节信息,这样进一步的提升检测的性能。
附图说明
图1为本发明专利一种基于多尺度检测的深度神经网络测距算法示意图。
具体实施方式
实施例:本发明旨在解决ADAS中的环境感知问题,并且尤其解决的是深度神经网络中对尺度变化的物体效果较差,尤其在物体上的性能最差。传统的深度神经网络为了能应用于物体检测,将目标定位和目标分类分为2个子网络进行。首先使用一个简单的定位网络,对图像中的目标进行定位,然后使用ROI Pooling技术,使用第一个字网络的输出从共享层中提取物体的特征,然后送入第二个子网中进行识别。这里就有一个问题目标识别的精度取决于特征的分辨率。传统的算法中,使用的是下采16x16的特征层进行特征提取,因此理论上识别物体的最小大小为16x16个像素,再加上特征的误差,因此实际上物体最小大小可能为24x24或者32x32。综上所述,深度神经网络在检测小目标物体中性能较差。此问题大大制约了深度神经网络在ADAS中的应用。
一种基于多尺度检测的深度神经网络,在不同的网络层上设置多个检测网络,这样就解决了尺度变化的问题,即可以检测出小物体也可以检测大物体;在同一个网络层上设置多个不同大小不同形状的检测器,这样就解决了形状变化的问题;设置一个全新的合并层,将上面多个检测结果进行合并,共下面的分类网络使用;为了同时保留低层的细节信息和高层的全局信息,使用了一个特殊的反卷积层,对高层的特征层进行升维处理,并和低层的特征层进行特征合并,形成了新的特征图,然后对这个新的特征层进行ROI Pooling处理。
结构为一个典型的倒金字塔结构,越靠近输入端的网络层,其特征图越大,越靠近输出层的网络层,其特征图越小。
深度神经网络中,越靠近输入层的网络层,特征图对目标的细节保留的越好,越靠近输出层的网络层,特征图越表达高层信息,对大目标描述的越细致。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (3)

1.一种基于多尺度检测的深度神经网络,其特征在于:在不同的网络层上设置多个检测网络,这样就解决了尺度变化的问题,即可以检测出小物体也可以检测大物体;在同一个网络层上设置多个不同大小不同形状的检测器,这样就解决了形状变化的问题;设置一个全新的合并层,将上面多个检测结果进行合并,共下面的分类网络使用;为了同时保留低层的细节信息和高层的全局信息,使用了一个特殊的反卷积层,对高层的特征层进行升维处理,并和低层的特征层进行特征合并,形成了新的特征图,然后对这个新的特征层进行ROIPooling处理。
2.根据权利要求1所述的一种基于多尺度检测的深度神经网络,其特征在于:结构为一个典型的倒金字塔结构,越靠近输入端的网络层,其特征图越大,越靠近输出层的网络层,其特征图越小。
3.根据权利要求1所述的一种基于多尺度检测的深度神经网络,其特征在于:深度神经网络中,越靠近输入层的网络层,特征图对目标的细节保留的越好,越靠近输出层的网络层,特征图越表达高层信息,对大目标描述的越细致。
CN201611251241.9A 2016-12-29 2016-12-29 一种基于多尺度检测的深度神经网络 Pending CN107220703A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611251241.9A CN107220703A (zh) 2016-12-29 2016-12-29 一种基于多尺度检测的深度神经网络

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611251241.9A CN107220703A (zh) 2016-12-29 2016-12-29 一种基于多尺度检测的深度神经网络

Publications (1)

Publication Number Publication Date
CN107220703A true CN107220703A (zh) 2017-09-29

Family

ID=59927670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611251241.9A Pending CN107220703A (zh) 2016-12-29 2016-12-29 一种基于多尺度检测的深度神经网络

Country Status (1)

Country Link
CN (1) CN107220703A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844746A (zh) * 2017-10-11 2018-03-27 苏州天瞳威视电子科技有限公司 基于深度学习的复杂路况感知系统及装置
CN108121951A (zh) * 2017-12-11 2018-06-05 北京小米移动软件有限公司 特征点定位方法及装置
CN108830280A (zh) * 2018-05-14 2018-11-16 华南理工大学 一种基于区域提名的小目标检测方法
CN109461144A (zh) * 2018-10-16 2019-03-12 杭州依图医疗技术有限公司 一种乳腺影像识别的方法及装置
CN110991359A (zh) * 2019-12-06 2020-04-10 重庆市地理信息和遥感应用中心(重庆市测绘产品质量检验测试中心) 基于多尺度深度卷积神经网络的卫星图像目标检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844746A (zh) * 2017-10-11 2018-03-27 苏州天瞳威视电子科技有限公司 基于深度学习的复杂路况感知系统及装置
CN108121951A (zh) * 2017-12-11 2018-06-05 北京小米移动软件有限公司 特征点定位方法及装置
CN108830280A (zh) * 2018-05-14 2018-11-16 华南理工大学 一种基于区域提名的小目标检测方法
CN108830280B (zh) * 2018-05-14 2021-10-26 华南理工大学 一种基于区域提名的小目标检测方法
CN109461144A (zh) * 2018-10-16 2019-03-12 杭州依图医疗技术有限公司 一种乳腺影像识别的方法及装置
CN109461144B (zh) * 2018-10-16 2021-02-23 杭州依图医疗技术有限公司 一种乳腺影像识别的方法及装置
CN110991359A (zh) * 2019-12-06 2020-04-10 重庆市地理信息和遥感应用中心(重庆市测绘产品质量检验测试中心) 基于多尺度深度卷积神经网络的卫星图像目标检测方法

Similar Documents

Publication Publication Date Title
CN107220703A (zh) 一种基于多尺度检测的深度神经网络
Li et al. Automatic pavement crack detection by multi-scale image fusion
CN109598287B (zh) 基于深度卷积生成对抗网络样本生成的外观瑕疵检测方法
CN105957059B (zh) 电子元件漏件检测方法和系统
CN102621150B (zh) 基于灰度共生矩阵和支持向量机的飞机蒙皮损伤识别方法
CN109816653B (zh) 一种用于导电粒子检测的方法
CN108288088A (zh) 一种基于端到端全卷积神经网络的场景文本检测方法
CN105869146B (zh) 基于显著性融合的sar图像变化检测方法
CN106296638A (zh) 显著性信息取得装置以及显著性信息取得方法
CN107203973A (zh) 一种三维激光扫描系统中线激光中心的亚像素定位方法
CN103268481A (zh) 一种复杂背景图像中的文本提取方法
CN104834915B (zh) 一种复杂云天背景下小红外目标检测方法
CN106056659A (zh) 车载激光扫描点云中建筑物角点空间位置自动提取方法
CN104182985A (zh) 遥感图像变化检测方法
CN103729649A (zh) 一种图像旋转角度检测方法和装置
CN109102015A (zh) 一种基于复数神经网络的sar图像变化检测方法
Zhao et al. Structure‐PoseNet for identification of dense dynamic displacement and three‐dimensional poses of structures using a monocular camera
CN105678737A (zh) 一种基于Radon变换的数字图像角点检测方法
CN108596952A (zh) 基于候选区域筛选的快速深度学习遥感图像目标检测方法
Zheng et al. Image processing and edge detection techniques to quantify shock wave dynamics experiments
CN106199544B (zh) 基于核鉴别局部切空间排列的雷达目标距离像识别方法
CN106203475B (zh) 基于srm超像素聚类的sar图像变化检测方法
CN116503340A (zh) 一种micro oled面板缺陷检测方法、装置以及设备
CN104732190B (zh) 一种基于正交纹理相关分析的合成孔径声纳目标检测方法
CN105654108A (zh) 分类方法、检查方法和检查装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170929

WD01 Invention patent application deemed withdrawn after publication