CN112926595A - 深度学习神经网络模型的训练装置、目标检测系统及方法 - Google Patents

深度学习神经网络模型的训练装置、目标检测系统及方法 Download PDF

Info

Publication number
CN112926595A
CN112926595A CN202110154938.9A CN202110154938A CN112926595A CN 112926595 A CN112926595 A CN 112926595A CN 202110154938 A CN202110154938 A CN 202110154938A CN 112926595 A CN112926595 A CN 112926595A
Authority
CN
China
Prior art keywords
characteristic
detection
layer
convolution
positive sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110154938.9A
Other languages
English (en)
Other versions
CN112926595B (zh
Inventor
罗小平
曹继
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Longhorn Automotive Electronic Equipment Co Ltd
Original Assignee
Shenzhen Longhorn Automotive Electronic Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Longhorn Automotive Electronic Equipment Co Ltd filed Critical Shenzhen Longhorn Automotive Electronic Equipment Co Ltd
Priority to CN202110154938.9A priority Critical patent/CN112926595B/zh
Publication of CN112926595A publication Critical patent/CN112926595A/zh
Application granted granted Critical
Publication of CN112926595B publication Critical patent/CN112926595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种深度学习神经网络模型的训练装置、目标检测系统及方法,所述装置包括:特征层提取模块,对原始图像进行卷积操作获得特征层;卷积运算模块,采用不同尺度和数量的卷积滤波器对特征层进行卷积运算提取出第一特征图;特征图处理模块,对各个第一特征图进行非线性转换获得第二特征图;检测框生成模块,生成不同预定尺度的待判定检测框,判断待检测区域与实际目标的初步相似度,确定出正样本检测框;参数更新模块,对第二特征图进行回归运算匹配,对比正样本检测框与实际目标框的目标相似度,更新普通卷积层、平均池化层及各个卷积滤波器的参数值;模型输出模块,输出检测模型。本实施例能获得对小目标的检测效果好的检测模型。

Description

深度学习神经网络模型的训练装置、目标检测系统及方法
技术领域
本发明实施例涉及深度学习卷积网络技术领域,尤其涉及一种深度学习神经网络模型的训练装置、目标检测系统及方法。
背景技术
目前,目标检测是自动驾驶中用到的一项关键技术,在图像中准确的定位出检测目标的位置并对目标的进行分类,可以有效辅助自动驾驶。目前目标检测的方法主要基于深度学习神经网络模型,通过采用大量预先标注的原始图像逐步输入至神经网络模型中,经过一系列的非线性转换,提取获得原始图像的特征层,然后在特征层中生成检测框,通过对检测框中的图像特征进行分类识别,从而实现目标检测。但是,由于不同方式的卷积操作会产生不一样的运算效果,卷积方式的选择合适与否,影响网络结构对有效特征的提取,现有的检测模型在对如路灯、行人等小目标物体特征进行检测时会随卷积网络层数的加深逐渐淡化,无法保证对图像中小目标的识别准确性;同时,随着卷积网络层数的增多,也会导致网络参数的快速增多,影响网络运行速度。
发明内容
本发明实施例要解决的技术问题在于,提供一种深度学习神经网络模型的训练装置,能获得对小目标的检测效果好的检测模型。
本发明实施例进一步要解决的技术问题在于,提供一种目标检测系统,能有效提高对小目标的检测效果。
本发明实施例进一步要解决的技术问题在于,提供一种深度学习神经网络模型的训练方法,能获得对小目标的检测效果好的检测模型。
为了解决上述技术问题,本发明实施例提供以下技术方案:一种深度学习神经网络模型的训练装置,包括:
特征层提取模块,用于采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
卷积运算模块,与所述特征层提取模块相连,用于依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并通过点积运算将尺寸相同的第一特征图进行组合;
特征图处理模块,与所述卷积运算模块相连,用于采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
检测框生成模块,与所述特征图处理模块相连,用于任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;
参数更新模块,与所述检测框生成模块相连,用于对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
模型输出模块,与所述参数更新模块和特征层提取模块相连,用于判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值重复运行上述各个模块。
进一步的,所述两个激活函数分别为ReLU激活函数和PReLU激活函数。
进一步的,所述检测框生成模块通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。
进一步的,所述普通卷积层与平均池化层的步长为2。
另一方面,为了解决进一步的上述技术问题,本发明实施例提供以下技术方案:一种目标检测系统,包括摄像装置以及与所述摄像装置相连的目标检测装置,所述目标检测装置采用如上述任一项所述的深度学习神经网络模型的训练装置对大量的原始图像进行训练获得的检测模型对摄像装置采集的实际图像进行检测。
再一方面,为了解决进一步的上述技术问题,本发明实施例提供以下技术方案:一种深度学习神经网络模型的训练方法,包括以下步骤:
采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并将尺寸相同的第一特征图通过点积运算进行组合;
采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;
对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值对外部输入的原始图像重复进行上述步骤。
进一步的,所述两个激活函数分别为ReLU激活函数和PReLU激活函数。
进一步的,通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。
进一步的,所述普通卷积层与平均池化层的步长为2。
采用上述技术方案后,本发明实施例至少具有如下有益效果:本发明实施例通过采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层,然后通过依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,利用深度分通道卷积操作获得特征图,使得图像特征能有效传递,尤其是保留底层小目标物体的图像特征,并通过点积运算将尺寸相同的第一特征图进行组合,可有效的减少参数量,再进一步用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换,加入非线性因素以获得第二特征图,有效提升神经网络对重要特征的表达能力,然后生成多个不同预定尺寸的待判定检测框以适应实际检测中对不同尺寸目标的检测需求,通过对比判断待检测区域与实际目标框的初步相似度,初步确定出正样本检测框,最后再次回归运算匹配后对比所述正样本检测框与所述实际目标框的目标相似度,最终确定出正样本,并结合正样本对普通卷积层、平均池化层及卷积滤波器的参数值修改,实现对卷积网络训练,并最终对正样本分类,确定坐标信息实现目标检测;最后从而判断所述类别和所述坐标信息的准确度,直至所述准确度大于预定阈值时输出检测模型否则进行重复的迭代运算,能获得对小目标的检测效果好的检测模型。
附图说明
图1为本发明深度学习神经网络模型的训练装置一个可选实施例的原理结构框图。
图2为本发明目标检测系统一个可选实施例的原理结构框图。
图3为本发明深度学习神经网络模型的训练方法一个可选实施例的步骤流程图。
具体实施方式
下面结合附图和具体实施例对本申请作进一步详细说明。应当理解,以下的示意性实施例及说明仅用来解释本发明,并不作为对本发明的限定,而且,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
如图1所示,本发明一个可选实施例提供一种深度学习神经网络模型的训练装置1,包括:
特征层提取模块10,用于采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
卷积运算模块12,与所述特征层提取模块10相连,用于依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并通过点积运算将尺寸相同的第一特征图进行组合;
特征图处理模块14,与所述卷积运算模块12相连,用于采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
检测框生成模块16,与所述特征图处理模块14相连,用于任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;以及
参数更新模块18,与所述检测框生成模块16相连,用于对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
模型输出模块19,与所述参数更新模块18和特征层提取模块10相连,用于判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值重复运行上述各个模块。
本发明实施例通过采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层,然后通过依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,利用深度分通道卷积操作获得特征图,使得图像特征能有效传递,尤其是保留底层小目标物体的图像特征,并通过点积运算将尺寸相同的第一特征图进行组合,可有效的减少参数量,再进一步用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换,加入非线性因素以获得第二特征图,有效提升神经网络对重要特征的表达能力,然后生成多个不同预定尺寸的待判定检测框以适应实际检测中对不同尺寸目标的检测需求,通过对比判断待检测区域与实际目标框的初步相似度,初步确定出正样本检测框,最后再次回归运算匹配后对比所述正样本检测框与所述实际目标框的目标相似度,最终确定出正样本,并结合正样本对普通卷积层、平均池化层及卷积滤波器的参数值修改,实现对卷积网络训练;并最终对正样本分类,确定坐标信息实现目标检测,从而判断所述类别和所述坐标信息的准确度,直至所述准确度大于预定阈值时输出检测模型否则进行重复的迭代运算,能获得对小目标的检测效果好的检测模型。在具体实施时,任意选取预定数量(例如:4个、5个等数量)的第一特征图,以其中一个第一特征图上的任意一坐标点为中心生成多个不同预定尺度的待判定检测框;将所述目标相似度大于预定相似度阈值(例如:50%)的正样本检测框确定为正样本。
在本发明又一个可选实施例中,所述两个激活函数分别为ReLU(RectifiedLinear Unit,线性整流函数)激活函数和PReLU(Parametric Rectified Linear Unit,带参数的线性整流函数)激活函数。本实施例采用上述两个激活函数,在特征图中加入非线性因素,可有效的提升神经网络对特征的表达能力。在具体实施时,可采用上述两个激活函数交替对各个特征图进行非线性转换。
其中:ReLU激活函数是带有卷积图像的输入x的最大函数(x,o),ReLU激活函数将矩阵x内所有负值都设为零,而其他的值不变,且ReLU激活函数的计算是在卷积之后进行的;PReLU激活函数可以看作是Leaky ReLU激活函数的一个变体。在PReLU激活函数中,负值部分的斜率是根据数据来确定。
在本发明一个可选实施例中,所述检测框生成模块16通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。本实施例通过比对待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置从而确定二者的初步相似度,判断依据简单,可有效的确定出二者的相似程度。
在本发明再一个可选实施例中,所述预定步长为2。本实施例采用步长为2的普通卷积层与平均池化层进行卷积操作并叠加卷积结果,可以最大程度保留原始图像的图像特征,防止原始图像中较小的目标在处理的过程中被淡化。
另一方面,如图2所示,本发明实施例提供一种目标检测系统,包括摄像装置3以及与所述摄像装置3相连的目标检测装置5,所述目标检测装置5采用如上述任一项所述的深度学习神经网络模型的训练装置1对大量的原始图像进行训练获得的检测模型对摄像装置3采集的实际图像进行检测。本实施例目标检测系统的目标检测装置采用如上述的训练装置1经过大量原始图片训练的得到的检测模型对实际图像进行检测,可有效的提高对小尺寸目标的检测精度。
再一方面,如图3所示,本发明实施例提供一种深度学习神经网络模型的训练方法,包括以下步骤:
S1:采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
S2:依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并将尺寸相同的第一特征图通过点积运算进行组合;
S3:采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
S4:任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;以及
S5:对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
S6:判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值对外部输入的原始图像重复进行步骤S1-步骤S5。
本发明实施例通过上述方法,采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层,然后通过依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,利用深度分通道卷积操作获得特征图,使得图像特征能有效传递,尤其是保留底层小目标物体的图像特征,并通过点积运算将尺寸相同的第一特征图进行组合,可有效的减少参数量,再进一步用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换,加入非线性因素以获得第二特征图,有效提升神经网络对重要特征的表达能力,然后生成多个不同预定尺寸的待判定检测框以适应实际检测中对不同尺寸目标的检测需求,通过对比判断待检测区域与实际目标框的初步相似度,初步确定出正样本检测框,最后再次回归运算匹配后对比所述正样本检测框与所述实际目标框的目标相似度,最终确定出正样本,并结合正样本对普通卷积层、平均池化层及卷积滤波器的参数值修改,实现对卷积网络训练;并最终对正样本分类,确定坐标信息实现目标检测,从而判断所述类别和所述坐标信息的准确度,直至所述准确度大于预定阈值时输出检测模型,能获得对小目标的检测效果好的检测模型。
在本发明又一个可选实施例中,所述两个激活函数分别为ReLU激活函数和PReLU激活函数。本实施例采用上述两个激活函数,在特征图中加入非线性因素,可有效的提升神经网络对特征的表达能力。在具体实施时,采用上述两个激活函数交替对各个特征图进行非线性转换。
在本发明再一个可选实施例中,通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。本实施例通过比对待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置从而确定二者的初步相似度,判断依据简单,可有效的确定二者的相似程度。
在本发明一个可选实施例中,所述预定步长为2。本实施例采用步长为2的普通卷积层与平均池化层进行卷积操作并叠加卷积结果,可以最大程度保留原始图像的图像特征,防止原始图像中较小的目标在处理的过程中被淡化。
本发明实施例所述的功能如果以软件功能模块或单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护范围之内。

Claims (9)

1.一种深度学习神经网络模型的训练装置,其特征在于,所述装置包括:
特征层提取模块,用于采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
卷积运算模块,与所述特征层提取模块相连,用于依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并将尺寸相同的第一特征图通过点积运算进行组合;
特征图处理模块,与所述卷积运算模块相连,用于采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
检测框生成模块,与所述特征图处理模块相连,用于任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;
参数更新模块,与所述检测框生成模块相连,用于对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
模型输出模块,与所述参数更新模块和特征层提取模块相连,用于判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值重复运行上述各个模块。
2.如权利要求1所述的深度学习神经网络模型的训练装置,其特征在于,所述两个激活函数分别为ReLU激活函数和PReLU激活函数。
3.如权利要求1所述的深度学习神经网络模型的训练装置,其特征在于,所述检测框生成模块通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。
4.如权利要求1所述的深度学习神经网络模型的训练装置,其特征在于,所述预定步长为2。
5.一种目标检测系统,包括摄像装置以及与所述摄像装置相连的目标检测装置,其特征在于,所述目标检测装置采用如权利要求1-4任一项所述的深度学习神经网络模型的训练装置对大量的原始图像进行训练获得的检测模型对摄像装置采集的实际图像进行检测。
6.一种深度学习神经网络模型的训练方法,其特征在于,所述方法包括以下步骤:
采用预定步长的普通卷积层与平均池化层对外部输入的原始图像进行卷积操作并叠加卷积结果后获得所述原始图像的若干特征层;
依次采用不同尺度和数量的卷积滤波器对各个特征层进行卷积运算以从各个特征层中提取出不同的第一特征图,并将尺寸相同的第一特征图通过点积运算进行组合;
采用两个激活函数相结合的方式对组合后的各个第一特征图进行非线性转换获得加入了非线性因素的第二特征图;
任意选取预定数量的第二特征图,在每个选定的第二特征图上均确定一个坐标点,所有选定的第二特征图中确定的坐标点具有相互对应的位置关系,在每个选定的第二特征图中均以所述坐标点为中心生成多个不同预定尺度的待判定检测框,将各个待判定检测框所包含的待检测区域与所述原始图像中预先标注的实际目标框进行对比,判断所述待检测区域与所述实际目标框的初步相似度,将所述初步相似度最高的待判定检测框确定为正样本检测框;
对每个第二特征图进行回归运算匹配,再次对比所述正样本检测框所包含的区域与所述实际目标框的目标相似度,将所述目标相似度大于预定相似度阈值的正样本检测框确定为正样本,根据各个所述正样本在所述第二特征图中的位置更新所述普通卷积层、平均池化层及各个卷积滤波器的参数值,对所述正样本进行卷积运算及回归确定所述正样本的类别和在所述原始图像中的坐标信息;以及
判断所述类别和所述坐标信息的准确度,在所述准确度大于预定阈值时输出检测模型,否则根据更新后的所述普通卷积层、平均池化层及各个卷积滤波器的参数值对外部输入的原始图像重复进行上述步骤。
7.如权利要求6所述的深度学习神经网络模型的训练方法,其特征在于,所述两个激活函数分别为ReLU激活函数和PReLU激活函数。
8.如权利要求6所述的深度学习神经网络模型的训练方法,其特征在于,通过对比所述待检测区域与所述实际目标框在对应的第二特征图的尺寸大小和位置以确定所述初步相似度。
9.如权利要求6所述的深度学习神经网络模型的训练方法,其特征在于,所述预定步长为2。
CN202110154938.9A 2021-02-04 2021-02-04 深度学习神经网络模型的训练装置、目标检测系统及方法 Active CN112926595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110154938.9A CN112926595B (zh) 2021-02-04 2021-02-04 深度学习神经网络模型的训练装置、目标检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110154938.9A CN112926595B (zh) 2021-02-04 2021-02-04 深度学习神经网络模型的训练装置、目标检测系统及方法

Publications (2)

Publication Number Publication Date
CN112926595A true CN112926595A (zh) 2021-06-08
CN112926595B CN112926595B (zh) 2022-12-02

Family

ID=76170315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110154938.9A Active CN112926595B (zh) 2021-02-04 2021-02-04 深度学习神经网络模型的训练装置、目标检测系统及方法

Country Status (1)

Country Link
CN (1) CN112926595B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255706A (zh) * 2021-07-16 2021-08-13 南京奕荣芯科技有限公司 一种基于卷积神经网络算法的目标识别方法及系统
CN117351240A (zh) * 2023-10-12 2024-01-05 北京卓视智通科技有限责任公司 一种正样本采样方法、系统、存储介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018158293A1 (en) * 2017-02-28 2018-09-07 Frobas Gmbh Allocation of computational units in object classification
CN109583483A (zh) * 2018-11-13 2019-04-05 中国科学院计算技术研究所 一种基于卷积神经网络的目标检测方法和系统
CN109740463A (zh) * 2018-12-21 2019-05-10 沈阳建筑大学 一种车载环境下的目标检测方法
CN110263809A (zh) * 2019-05-16 2019-09-20 华南理工大学 池化特征图处理方法、目标检测方法、系统、装置和介质
US20200356802A1 (en) * 2018-08-07 2020-11-12 Shenzhen Sensetime Technology Co., Ltd. Image processing method and apparatus, electronic device, storage medium, and program product

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018158293A1 (en) * 2017-02-28 2018-09-07 Frobas Gmbh Allocation of computational units in object classification
US20200356802A1 (en) * 2018-08-07 2020-11-12 Shenzhen Sensetime Technology Co., Ltd. Image processing method and apparatus, electronic device, storage medium, and program product
CN109583483A (zh) * 2018-11-13 2019-04-05 中国科学院计算技术研究所 一种基于卷积神经网络的目标检测方法和系统
CN109740463A (zh) * 2018-12-21 2019-05-10 沈阳建筑大学 一种车载环境下的目标检测方法
CN110263809A (zh) * 2019-05-16 2019-09-20 华南理工大学 池化特征图处理方法、目标检测方法、系统、装置和介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
星智云图工作室: "SSD-样本正负比控制+多尺度检测(目标检测)(one-stage)(深度学习》(ECCV 2016)", <<网页>> *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255706A (zh) * 2021-07-16 2021-08-13 南京奕荣芯科技有限公司 一种基于卷积神经网络算法的目标识别方法及系统
CN117351240A (zh) * 2023-10-12 2024-01-05 北京卓视智通科技有限责任公司 一种正样本采样方法、系统、存储介质和电子设备
CN117351240B (zh) * 2023-10-12 2024-04-09 北京卓视智通科技有限责任公司 一种正样本采样方法、系统、存储介质和电子设备

Also Published As

Publication number Publication date
CN112926595B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN109190752B (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
CN110533084B (zh) 一种基于自注意力机制的多尺度目标检测方法
CN109977943B (zh) 一种基于yolo的图像目标识别方法、系统和存储介质
CN112132156B (zh) 多深度特征融合的图像显著性目标检测方法及系统
CN109753913B (zh) 计算高效的多模式视频语义分割方法
CN108229523B (zh) 图像检测、神经网络训练方法、装置和电子设备
CN105930402A (zh) 基于卷积神经网络的视频检索方法及系统
CN110222604B (zh) 基于共享卷积神经网络的目标识别方法和装置
CN110991444B (zh) 面向复杂场景的车牌识别方法及装置
CN111626184B (zh) 一种人群密度估计方法及系统
CN112329702B (zh) 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质
CN112926595B (zh) 深度学习神经网络模型的训练装置、目标检测系统及方法
CN112581462A (zh) 工业产品的外观缺陷检测方法、装置及存储介质
CN109726195B (zh) 一种数据增强方法及装置
CN114782391A (zh) 少样本工业图像缺陷检测模型构建方法、系统及装置
CN110532959B (zh) 基于双通道三维卷积神经网络的实时暴力行为检测系统
CN114708437B (zh) 目标检测模型的训练方法、目标检测方法、装置和介质
CN111159150A (zh) 一种数据扩充方法及装置
CN111488945A (zh) 图像处理方法、装置、计算机设备和计算机可读存储介质
CN111507226A (zh) 道路图像识别模型建模方法、图像识别方法及电子设备
CN112149526A (zh) 一种基于长距离信息融合的车道线检测方法及系统
CN115131634A (zh) 图像识别方法、装置、设备、存储介质及计算机程序产品
CN112488220B (zh) 一种基于深度学习的小目标检测方法
CN108287817B (zh) 一种信息处理方法及设备
CN110728316A (zh) 一种课堂行为检测方法、系统、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant