CN107229904A - 一种基于深度学习的目标检测与识别方法 - Google Patents
一种基于深度学习的目标检测与识别方法 Download PDFInfo
- Publication number
- CN107229904A CN107229904A CN201710268957.8A CN201710268957A CN107229904A CN 107229904 A CN107229904 A CN 107229904A CN 201710268957 A CN201710268957 A CN 201710268957A CN 107229904 A CN107229904 A CN 107229904A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- layers
- window
- mfrac
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 238000011176 pooling Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 230000000644 propagated effect Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 238000012986 modification Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009514 concussion Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的目标检测与识别方法,是在Linux系统下,利用caffe平台搭建该模型由卷积层、池化层、RPN层、ROIs层、ROI Pooling层、全连接层、Sparse PCA层、预测窗口与预测类别输出层组成。本发明提出了多RPN层融合策略,增强了对各尺度目标的检测能力;在两个全连接层之间添加了新的Spares PCA层,在降低了计算量的同时保证了准确率;最后针对目标位置预测,提出了对数抑制方法,改进了目标位置回归算法。最终达到了在保证检测精度的同时提高检测速度的目的。本发明实现了准确快速得对感兴趣目标的检测与识别,具有重大的应用价值。
Description
技术领域
本发明属于计算机视觉识别技术领域,涉及一种基于深度学习的目标检测与识别方法。
背景技术
最近五年,伴随新的智能计算方法—深度学习理论基础的突破,人工智能的各项技术,如语音识别技术、图像识别技术、数据挖掘技术等都有了实质性的发展并且成功地应用在多项产品中。计算机视觉作为人工智能领域里一项举足轻重的科学技术,得到了学术界、工业界的广泛关注。尤其卷积神经网络在图像目标检测及识别领域取得了非常不错的成果。
从最近的学术研究情况来分析,传统的目标检测算法不论是在检测准确度标准还是检测时间消耗来看,都已经到了瓶颈期。对深度学习的研究正在逐步改变这一现状。深度学习在视觉领域取得重大成功的实践是在物体识别任务上。但是如何使用深度学习完成目标检测任务还处在研究的初步阶段。本文研究使用深度学习的卷积神经网络同步完成目标检测与识别任务,提高算法的对光照变化、场景变换、天气等因素的鲁棒性,并在提高检测准确度,加快检测速度,具有积极的理论研究意义。
发明内容
针对目标检测与识别技术,需要在提高检测准确率的同时加快检测速度,本发明提供一种基于深度学习的目标检测与识别方法。
在Linux系统下,利用caffe平台搭建一个基于深度学习的目标检测与识别模型。该模型由卷积层、池化层、RPN层、ROIs层、ROI Pooling层、全连接层、Sparse PCA层、预测窗口与预测类别输出层组成。本发明的方法提出了多RPN层融合策略,增强了对各尺度目标的检测能力;在两个全连接层之间添加了新的Spares PCA层,在降低了计算量的同时保证了准确率;最后针对目标位置预测,提出了对数抑制方法,改进了目标位置回归算法。最终达到了在保证检测精度的同时提高检测速度的目的。
一种基于深度学习的目标检测与识别方法,具体实现步骤如下:
步骤一:首先对输入图像进行卷积和下采样基本操作,该算法一共对输入图像进行5次卷积和5次下采样。卷积公式表述为:
o=∑i,j∈nwi,j*Ii′,j′ (1)
其中,wi,j是n*n大小的卷积核位置i,j处的参数;Ii′,j′是与卷积核元素对应位置像素值。
下采样操作中,步长一般取2,该层也不需要学习参数。下采样的过程类似卷积操作,同样是用一个n*n的核在大的N*M的矩阵上滑动,但是滑动过程中并不是计算积的和,只是选出当前与核对应位置的最大值或均值。在卷积神经网络中常用的下采样方法有两种:最大值采样和均值采样,公式表述分别为:
o=maxIi′,j′ (2)
其中,Ii′,j′表示图像中与核窗口对应的像素;n代表窗口核的尺寸。
步骤二:接下来,将步骤一的第5个池化层的输出输入到RPN层,RPN层的出发点是考虑在卷积神经网络中,与目标识别任务共用一组卷积操作以及卷积得到的特征。这样,网络卷积过程得到的中间特征图会有两个用途,一方面用来生成候选窗口,另一方面用来做特征分类识别。所以,RPN使用的目标函数也应该同时包含这两个部分,如式(4)。
其中,i是每个小窗口的索引;pi代表该窗口是物体的概率,取值为1或0,分半表示窗口是或不是目标物体;ti是一个四维的向量,表示该窗口的预测位置,是窗口的实际位置;Ncls与Nreg归一化系数,分别采用网络处理的图片数量(256)与小窗口数量(~2400)做归一化,λ用来平衡二者的权重,通常情况下,二者的权重设置为相同的,所以,本文设置λ=10;Lcls(·)实际是二分类问题的目标函数,这里采用了逻辑回归的思想,使用的是对数损失函数,Lreg(·)是位置回归函数。
RPN会生成一组候选窗口,可以根据各候选窗口对应的得分排序,筛选得分较高的作为最终的感兴趣窗口。往往使用RPN生成的300个窗口,与真正窗口的覆盖率就已经高于选择性搜索用2000个窗口的覆盖率,也正是如此,使用RPN生成的目标候选窗的准确率要远远高于选择性搜索。
步骤三:将RPN层得到的候选框经过筛选后输入到ROI Pooling层,ROI Pooling层主要是为了应对目标尺寸大小各异的情况提出的。这在只有识别分类的神经网络中是不存在的。ROI Pooling层一般采用最大值池化算法来把任意有效的感兴趣区域变换成一个固定尺度的特征图。这是因为深度神经网络的全连接层以及分类层需要采用固定尺度维度的特征向量作为输入。感兴趣区域是来自卷积特征图中的一个矩形窗口,每一个感兴趣区域用一个四元组表示roi:(r,c,h,w)。其中,(r,c)指定窗口的左上角坐标,h,w分别代表窗口的高度与宽度。
假设ROI Pooling层要得到的固定输出尺寸为H*W,采用的方法是把原h*w的窗口划分为多个子窗口,子窗口的大小近似为:
然后在各个子区域中再做标准的最大值采样即可。
步骤四:随后,将ROI Pooling层的输出输入到全连接层中,通过全连接层的处理,使得输出从二维矩阵变成了一维向量。
步骤五:在全连接层之间加入一个Sparse PCA层,实现在网络的末端进行数据降维,减少参数量,简化模型。Sparse PCA层的前向传播公式简写为:
V=YX (6)
其中,Y为(UTU+λI)-1UT。X的每一行为一个样本,同样V的每一行为对应X的编码。再考虑每一条输入的情况,v中各元素可以表示为和的形式:
步骤六:最后再通过一个全连接层连接网络的位置预测输出和类别预测输出。
步骤七:在测试阶段,到步骤六就结束了,在训练阶段,通过得到的位置预测输出和类别预测输出再返回输入处对比真实值,通过对比与真实值的差值,重新再在下一次的训练中修改权重参数,达到让模型具有学习的功能作用。
本发明为了解决待检测目标尺度变化较大的问题,降低漏检率,在分析网络中间卷积特征图的特点基础之上,提出了多RPN层融合策略,在不同卷积特征图上生成候选目标窗口,增强了对各尺度目标的检测能力。针对目标位置预测问题,提出对数抑制方法,改进了目标位置回归算法,既避免了误差过大产生的震荡问题,又加快了目标函数在最优解附近的收敛速度。该方法针对卷积神经网络容易出现的过拟合问题,文章介绍和分析了深度神经网络避免过拟合的方法,包括Dropout层的引入,以及目标函数中正则化项的作用。通过针对卷积神经网络中的参数分布情况,提出了对全连接层进行降维处理的方法。分析了全连接层的数据特点,给出使用稀疏主成分分析算法合理性,并通过实验对比数据,证明其有效性。
附图说明
图1为本专利的技术实现流程图
图2为基于深度学习的目标检测与识别网络结构图。
具体实施方式
下面结合附图和具体实现方案例对本发明作进一步说明。
参见图2,(1)模型的开始由5个卷积层和池化层交替连接,主要目的是通过卷积层提出图像的特征,通过池化层降低图像的维度从而相应地降低计算维度。
(2)接下来是RPN层,本方法使用了两个RPN层生成候选窗口。一个RPN层的输入来自Conv-5另一个卷积层的输入来自Conv-3。根据在这两个层上生成的窗口做了筛选,根据两个卷积层中特征图大小的比例关系,将特征窗口坐标位置映射到同一比例,如果该位置被重复检测,则保留包含目标置信度较高的窗口,舍弃置信度较低的窗口。
(3)通过筛选过的RPN层的输出再输入到ROI Pooling层中。该层主要为了应对目标尺寸大小各异的情况提出的。ROI Pooling层采用最大值池化算法来把任意有效的感兴趣区域变换成一个固定尺度的特征图。
(4)接下来将ROI Pooling层池化过的二维图像矩阵输入到全连接层,通过全连接层的计算,输出一个一维向量便于以后的计算和分类。
(5)在两个全连接层之间添加一个Sparse PCA层,由于在训练过程中,很大一部分的时间消耗跟全连接层的参数个数有关系,所以该层主要目的就是减少输出向量的维度,减少计算量,提高检测速度。
(6)通过PCA降维后的全连接层,输出检测的分类信息和位置信息。
(7)通过输出的分类信息和位置信息,再通过反向传播对比实际的标签,进行参数调整。其中在目标位置回归时采用对数抑制算法。
具体运用上:
步骤1:将想要检测的图片输入到模型中。
步骤2:模型通过卷积池化操作,对原始图像的特征进行了有效的提取,并且降低了原始图像的维度。
步骤3:将卷积Conv-3和Conv-5层的输出输入到RPN层中,通过RPN层对对这两个层产生可能的目标存在的候选窗口,随即通过置信值选取有效的窗口作为输出。
步骤4:将RPN层的输出输入到ROI Pooling层中,将感兴趣区域变换成一个固定尺寸的特征图。
步骤五:随后将ROI Pooling层中的输出输入到全连接层中,二维矩阵变换成一维向量,以便随后的输出分类。
步骤六:随后将全连接层计算完的一维向量输入到Sparse PCA层中,实施数据降维,减少随后全连接层的计算量。
步骤七:最后通过一个全连接层得到网络的预测位置输出和预测类别输出。
Claims (1)
1.一种基于深度学习的行人检测算法,其特征在于以下步骤,
步骤一:首先对输入图像进行5次卷积和5次下采样;卷积公式表述为:
o=∑i,j∈nwi,j*Ii′,j′ (1)
其中,wi,j是n*n大小的卷积核位置i,j处的参数;Ii′,j′是与卷积核元素对应位置的像素值;
下采样操作中,步长取2;下采样是用一个n*n的核在大的N*M的矩阵上滑动,选出当前与核对应位置的最大值或均值;下采样方法有两种:最大值采样和均值采样,公式表述分别为:
o=maxIi′,j′ (2)
<mrow>
<mi>O</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msup>
<mi>n</mi>
<mn>2</mn>
</msup>
</mfrac>
<msub>
<mi>&Sigma;I</mi>
<mrow>
<msup>
<mi>i</mi>
<mo>&prime;</mo>
</msup>
<mo>,</mo>
<msup>
<mi>j</mi>
<mo>&prime;</mo>
</msup>
</mrow>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Ii′,j′表示图像中与核窗口对应的像素;n代表窗口核的尺寸;
步骤二:将步骤一的第5个池化层的输出输入到RPN层,RPN层的出发点是考虑在卷积神经网络中,与目标识别任务共用一组卷积操作以及卷积得到的特征;RPN使用的目标函数也应该同时包含这两个部分,如式(4);
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mo>{</mo>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
<mo>}</mo>
<mo>,</mo>
<mo>{</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>}</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msub>
<mi>N</mi>
<mrow>
<mi>c</mi>
<mi>l</mi>
<mi>s</mi>
</mrow>
</msub>
</mfrac>
<msub>
<mi>&Sigma;</mi>
<mi>i</mi>
</msub>
<msub>
<mi>L</mi>
<mrow>
<mi>c</mi>
<mi>l</mi>
<mi>s</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msubsup>
<mi>p</mi>
<mi>i</mi>
<mo>*</mo>
</msubsup>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&lambda;</mi>
<mfrac>
<mn>1</mn>
<msub>
<mi>N</mi>
<mrow>
<mi>r</mi>
<mi>e</mi>
<mi>g</mi>
</mrow>
</msub>
</mfrac>
<msub>
<mi>&Sigma;</mi>
<mi>i</mi>
</msub>
<msub>
<mi>L</mi>
<mrow>
<mi>r</mi>
<mi>e</mi>
<mi>g</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msubsup>
<mi>t</mi>
<mi>i</mi>
<mo>*</mo>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,i是每个小窗口的索引;pi代表该窗口是物体的概率,取值为1或0,分半表示窗口是或不是目标物体;ti是一个四维的向量,表示该窗口的预测位置,是窗口的实际位置;Ncls与Nreg归一化系数,分别采用网络处理的图片数量与小窗口数量做归一化,λ用来平衡二者的权重,二者的权重设置为相同的;设置λ=10;Lcls(·)实际是二分类问题的目标函数,Lreg(·)是位置回归函数;
步骤三:将RPN层得到的候选框经过筛选后输入到ROI Pooling层;ROI Pooling层采用最大值池化算法把任意有效的感兴趣区域变换成一个固定尺度的特征图;感兴趣区域是来自卷积特征图中的一个矩形窗口,每一个感兴趣区域用一个四元组表示roi:(r,c,h,w)。其中,(r,c)指定窗口的左上角坐标,h,w分别代表窗口的高度与宽度;
ROI Pooling层要得到的固定输出尺寸为H*W,采用的方法是把原h*w的窗口划分为多个子窗口,子窗口的大小为:
<mrow>
<mfrac>
<mi>h</mi>
<mi>W</mi>
</mfrac>
<mo>*</mo>
<mfrac>
<mi>w</mi>
<mi>W</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
然后在各个子区域中再做标准的最大值采样;
步骤四:将ROI Pooling层的输出输入到全连接层中,通过全连接层的处理,使得输出从二维矩阵变成了一维向量;
步骤五:在全连接层之间加入一个Sparse PCA层,实现在网络的末端进行数据降维,减少参数量,简化模型;Sparse PCA层的前向传播公式简写为:
V=YX (6)
其中,Y为(UTU+λI)-1UT;X的每一行为一个样本,同样V的每一行为对应X的编码;再考虑每一条输入的情况,v中各元素表示为和的形式:
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</msubsup>
<msub>
<mi>Y</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
步骤六:最后再通过一个全连接层连接网络的位置预测输出和类别预测输出;
步骤七:在测试阶段,到步骤六就结束了,在训练阶段,通过得到的位置预测输出和类别预测输出再返回输入处对比真实值,通过对比与真实值的差值,重新再在下一次的训练中修改权重参数,达到让模型具有学习的功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710268957.8A CN107229904B (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的目标检测与识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710268957.8A CN107229904B (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的目标检测与识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107229904A true CN107229904A (zh) | 2017-10-03 |
CN107229904B CN107229904B (zh) | 2020-11-24 |
Family
ID=59933110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710268957.8A Expired - Fee Related CN107229904B (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的目标检测与识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107229904B (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107862383A (zh) * | 2017-11-09 | 2018-03-30 | 睿魔智能科技(东莞)有限公司 | 一种用于人体视觉感知的多任务深度学习方法和系统 |
CN107870321A (zh) * | 2017-11-03 | 2018-04-03 | 电子科技大学 | 基于伪标签学习的雷达一维距离像目标识别方法 |
CN108009524A (zh) * | 2017-12-25 | 2018-05-08 | 西北工业大学 | 一种基于全卷积网络的车道线检测方法 |
CN108012156A (zh) * | 2017-11-17 | 2018-05-08 | 深圳市华尊科技股份有限公司 | 一种视频处理方法及控制平台 |
CN108256567A (zh) * | 2018-01-12 | 2018-07-06 | 环球大数据科技有限公司 | 一种基于深度学习的目标识别方法及系统 |
CN108288270A (zh) * | 2018-02-05 | 2018-07-17 | 南京邮电大学 | 一种基于通道修剪与全卷积深度学习的目标检测方法 |
CN108416780A (zh) * | 2018-03-27 | 2018-08-17 | 福州大学 | 一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法 |
CN108549901A (zh) * | 2018-03-12 | 2018-09-18 | 佛山市顺德区中山大学研究院 | 一种基于深度学习的快速迭代目标检测方法 |
CN108764292A (zh) * | 2018-04-27 | 2018-11-06 | 北京大学 | 基于弱监督信息的深度学习图像目标映射及定位方法 |
CN108763612A (zh) * | 2018-04-02 | 2018-11-06 | 复旦大学 | 一种神经网络的池化层加速运算的方法与电路 |
CN109033979A (zh) * | 2018-06-29 | 2018-12-18 | 西北工业大学 | 基于wifi和摄像机传感器决策级融合的室内行人检测方法 |
CN109101932A (zh) * | 2018-08-17 | 2018-12-28 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习算法 |
CN109376674A (zh) * | 2018-10-31 | 2019-02-22 | 北京小米移动软件有限公司 | 人脸检测方法、装置及存储介质 |
CN109492636A (zh) * | 2018-09-30 | 2019-03-19 | 浙江工业大学 | 基于自适应感受野深度学习的目标检测方法 |
CN109522938A (zh) * | 2018-10-26 | 2019-03-26 | 华南理工大学 | 一种基于深度学习的图像中目标的识别方法 |
CN109558806A (zh) * | 2018-11-07 | 2019-04-02 | 北京科技大学 | 高分遥感图像变化的检测方法和系统 |
CN109583507A (zh) * | 2018-12-07 | 2019-04-05 | 浙江工商大学 | 一种基于深度卷积神经网络的猪体识别方法 |
CN109685199A (zh) * | 2017-10-18 | 2019-04-26 | 斯特拉德视觉公司 | 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置 |
CN109816097A (zh) * | 2019-01-23 | 2019-05-28 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN109840117A (zh) * | 2018-06-20 | 2019-06-04 | 中兴通讯股份有限公司 | 训练模型的实现方法、设备以及存储介质 |
CN110202583A (zh) * | 2019-07-09 | 2019-09-06 | 华南理工大学 | 一种基于深度学习的仿人机械手控制系统及其控制方法 |
CN110348311A (zh) * | 2019-06-13 | 2019-10-18 | 中国人民解放军战略支援部队信息工程大学 | 一种基于深度学习的道路交叉口识别系统及方法 |
CN110796144A (zh) * | 2019-11-08 | 2020-02-14 | 北京字节跳动网络技术有限公司 | 车牌检测方法、装置、设备及存储介质 |
CN110825217A (zh) * | 2018-08-13 | 2020-02-21 | 珠海格力电器股份有限公司 | 家电控制方法及装置 |
CN111126385A (zh) * | 2019-12-13 | 2020-05-08 | 哈尔滨工程大学 | 一种可变形活体小目标的深度学习智能识别方法 |
CN111199227A (zh) * | 2019-12-20 | 2020-05-26 | 广西柳州联耕科技有限公司 | 一种高精度图像识别方法 |
CN111382834A (zh) * | 2018-12-29 | 2020-07-07 | 杭州海康威视数字技术股份有限公司 | 一种置信度比较方法及装置 |
CN113139559A (zh) * | 2020-01-17 | 2021-07-20 | 初速度(苏州)科技有限公司 | 一种目标检测模型的训练方法、数据的标注方法和装置 |
CN113365382A (zh) * | 2021-08-10 | 2021-09-07 | 深圳市信润富联数字科技有限公司 | 灯光控制方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2048640A2 (en) * | 2007-10-12 | 2009-04-15 | Gruentjens, Norbert | A method and an apparatus for controlling a simulated moving object |
CN105718952A (zh) * | 2016-01-22 | 2016-06-29 | 武汉科恩斯医疗科技有限公司 | 使用深度学习网络对断层医学影像进行病灶分类的方法 |
CN106022232A (zh) * | 2016-05-12 | 2016-10-12 | 成都新舟锐视科技有限公司 | 基于深度学习的车牌检测方法 |
CN106372571A (zh) * | 2016-08-18 | 2017-02-01 | 宁波傲视智绘光电科技有限公司 | 路面交通标志检测与识别方法 |
CN106504233A (zh) * | 2016-10-18 | 2017-03-15 | 国网山东省电力公司电力科学研究院 | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统 |
-
2017
- 2017-04-24 CN CN201710268957.8A patent/CN107229904B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2048640A2 (en) * | 2007-10-12 | 2009-04-15 | Gruentjens, Norbert | A method and an apparatus for controlling a simulated moving object |
CN105718952A (zh) * | 2016-01-22 | 2016-06-29 | 武汉科恩斯医疗科技有限公司 | 使用深度学习网络对断层医学影像进行病灶分类的方法 |
CN106022232A (zh) * | 2016-05-12 | 2016-10-12 | 成都新舟锐视科技有限公司 | 基于深度学习的车牌检测方法 |
CN106372571A (zh) * | 2016-08-18 | 2017-02-01 | 宁波傲视智绘光电科技有限公司 | 路面交通标志检测与识别方法 |
CN106504233A (zh) * | 2016-10-18 | 2017-03-15 | 国网山东省电力公司电力科学研究院 | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统 |
Non-Patent Citations (3)
Title |
---|
ROSS GIRSHICK 等: "Fast R-CNN", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
SHAOQING REN 等: "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks", 《IEEE》 * |
昌硕 等: "基于移动小车的行人监控系统", 《研究与开发》 * |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685199A (zh) * | 2017-10-18 | 2019-04-26 | 斯特拉德视觉公司 | 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置 |
CN109685199B (zh) * | 2017-10-18 | 2023-07-28 | 斯特拉德视觉公司 | 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置 |
CN107870321A (zh) * | 2017-11-03 | 2018-04-03 | 电子科技大学 | 基于伪标签学习的雷达一维距离像目标识别方法 |
CN107862383A (zh) * | 2017-11-09 | 2018-03-30 | 睿魔智能科技(东莞)有限公司 | 一种用于人体视觉感知的多任务深度学习方法和系统 |
CN108012156A (zh) * | 2017-11-17 | 2018-05-08 | 深圳市华尊科技股份有限公司 | 一种视频处理方法及控制平台 |
CN108009524A (zh) * | 2017-12-25 | 2018-05-08 | 西北工业大学 | 一种基于全卷积网络的车道线检测方法 |
CN108009524B (zh) * | 2017-12-25 | 2021-07-09 | 西北工业大学 | 一种基于全卷积网络的车道线检测方法 |
CN108256567A (zh) * | 2018-01-12 | 2018-07-06 | 环球大数据科技有限公司 | 一种基于深度学习的目标识别方法及系统 |
CN108256567B (zh) * | 2018-01-12 | 2020-08-25 | 环球大数据科技有限公司 | 一种基于深度学习的目标识别方法及系统 |
CN108288270B (zh) * | 2018-02-05 | 2022-06-03 | 南京邮电大学 | 一种基于通道修剪与全卷积深度学习的目标检测方法 |
CN108288270A (zh) * | 2018-02-05 | 2018-07-17 | 南京邮电大学 | 一种基于通道修剪与全卷积深度学习的目标检测方法 |
CN108549901A (zh) * | 2018-03-12 | 2018-09-18 | 佛山市顺德区中山大学研究院 | 一种基于深度学习的快速迭代目标检测方法 |
CN108416780B (zh) * | 2018-03-27 | 2021-08-31 | 福州大学 | 一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法 |
CN108416780A (zh) * | 2018-03-27 | 2018-08-17 | 福州大学 | 一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法 |
CN108763612A (zh) * | 2018-04-02 | 2018-11-06 | 复旦大学 | 一种神经网络的池化层加速运算的方法与电路 |
CN108764292A (zh) * | 2018-04-27 | 2018-11-06 | 北京大学 | 基于弱监督信息的深度学习图像目标映射及定位方法 |
CN109840117A (zh) * | 2018-06-20 | 2019-06-04 | 中兴通讯股份有限公司 | 训练模型的实现方法、设备以及存储介质 |
CN109033979A (zh) * | 2018-06-29 | 2018-12-18 | 西北工业大学 | 基于wifi和摄像机传感器决策级融合的室内行人检测方法 |
CN109033979B (zh) * | 2018-06-29 | 2021-07-16 | 西北工业大学 | 基于wifi和摄像机传感器决策级融合的室内行人检测方法 |
CN110825217A (zh) * | 2018-08-13 | 2020-02-21 | 珠海格力电器股份有限公司 | 家电控制方法及装置 |
CN109101932A (zh) * | 2018-08-17 | 2018-12-28 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习算法 |
CN109101932B (zh) * | 2018-08-17 | 2020-07-24 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习方法 |
CN109492636A (zh) * | 2018-09-30 | 2019-03-19 | 浙江工业大学 | 基于自适应感受野深度学习的目标检测方法 |
CN109492636B (zh) * | 2018-09-30 | 2021-08-03 | 浙江工业大学 | 基于自适应感受野深度学习的目标检测方法 |
CN109522938A (zh) * | 2018-10-26 | 2019-03-26 | 华南理工大学 | 一种基于深度学习的图像中目标的识别方法 |
CN109376674A (zh) * | 2018-10-31 | 2019-02-22 | 北京小米移动软件有限公司 | 人脸检测方法、装置及存储介质 |
CN109558806A (zh) * | 2018-11-07 | 2019-04-02 | 北京科技大学 | 高分遥感图像变化的检测方法和系统 |
CN109583507A (zh) * | 2018-12-07 | 2019-04-05 | 浙江工商大学 | 一种基于深度卷积神经网络的猪体识别方法 |
CN111382834A (zh) * | 2018-12-29 | 2020-07-07 | 杭州海康威视数字技术股份有限公司 | 一种置信度比较方法及装置 |
CN111382834B (zh) * | 2018-12-29 | 2023-09-29 | 杭州海康威视数字技术股份有限公司 | 一种置信度比较方法及装置 |
CN109816097A (zh) * | 2019-01-23 | 2019-05-28 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN109816097B (zh) * | 2019-01-23 | 2022-12-09 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN110348311B (zh) * | 2019-06-13 | 2021-03-19 | 中国人民解放军战略支援部队信息工程大学 | 一种基于深度学习的道路交叉口识别系统及方法 |
CN110348311A (zh) * | 2019-06-13 | 2019-10-18 | 中国人民解放军战略支援部队信息工程大学 | 一种基于深度学习的道路交叉口识别系统及方法 |
CN110202583A (zh) * | 2019-07-09 | 2019-09-06 | 华南理工大学 | 一种基于深度学习的仿人机械手控制系统及其控制方法 |
CN110796144A (zh) * | 2019-11-08 | 2020-02-14 | 北京字节跳动网络技术有限公司 | 车牌检测方法、装置、设备及存储介质 |
CN111126385A (zh) * | 2019-12-13 | 2020-05-08 | 哈尔滨工程大学 | 一种可变形活体小目标的深度学习智能识别方法 |
CN111199227A (zh) * | 2019-12-20 | 2020-05-26 | 广西柳州联耕科技有限公司 | 一种高精度图像识别方法 |
CN113139559B (zh) * | 2020-01-17 | 2022-06-24 | 魔门塔(苏州)科技有限公司 | 一种目标检测模型的训练方法、数据的标注方法和装置 |
CN113139559A (zh) * | 2020-01-17 | 2021-07-20 | 初速度(苏州)科技有限公司 | 一种目标检测模型的训练方法、数据的标注方法和装置 |
CN113365382B (zh) * | 2021-08-10 | 2021-11-09 | 深圳市信润富联数字科技有限公司 | 灯光控制方法、装置、电子设备和存储介质 |
CN113365382A (zh) * | 2021-08-10 | 2021-09-07 | 深圳市信润富联数字科技有限公司 | 灯光控制方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107229904B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229904A (zh) | 一种基于深度学习的目标检测与识别方法 | |
CN114937151B (zh) | 基于多感受野和注意力特征金字塔的轻量级目标检测方法 | |
CN104850890B (zh) | 基于实例学习和Sadowsky分布的卷积神经网络参数调整方法 | |
CN105678284B (zh) | 一种固定位人体行为分析方法 | |
CN109934121A (zh) | 一种基于YOLOv3算法的果园行人检测方法 | |
CN109902798A (zh) | 深度神经网络的训练方法和装置 | |
CN108830188A (zh) | 基于深度学习的车辆检测方法 | |
CN105205453B (zh) | 基于深度自编码器的人眼检测和定位方法 | |
CN106845499A (zh) | 一种基于自然语言语义的图像目标检测方法 | |
CN106920243A (zh) | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 | |
CN110309842B (zh) | 基于卷积神经网络的物体检测方法及装置 | |
CN108388896A (zh) | 一种基于动态时序卷积神经网络的车牌识别方法 | |
CN112784736B (zh) | 一种多模态特征融合的人物交互行为识别方法 | |
CN113486764B (zh) | 一种基于改进的YOLOv3的坑洼检测方法 | |
CN108647583A (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN107679462A (zh) | 一种基于小波的深度多特征融合分类方法 | |
CN101866490B (zh) | 基于差分免疫克隆聚类的图像分割方法 | |
CN109558902A (zh) | 一种快速目标检测方法 | |
CN113128424B (zh) | 基于注意力机制的图卷积神经网络动作识别方法 | |
CN104156943B (zh) | 基于非支配邻域免疫算法的多目标模糊聚类图像变化检测方法 | |
CN106683102A (zh) | 基于脊波滤波器和卷积结构模型的sar图像分割方法 | |
CN111931801B (zh) | 一种基于路径多样性与一致性的动态路由网络学习方法 | |
CN106611423A (zh) | 基于脊波滤波器和反卷积结构模型的sar图像分割方法 | |
CN106780546A (zh) | 基于卷积神经网络的运动模糊编码点的身份识别方法 | |
CN112580662A (zh) | 一种基于图像特征识别鱼体方向的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201124 |