CN109145898A - 一种基于卷积神经网络和迭代机制的物体检测方法 - Google Patents

一种基于卷积神经网络和迭代机制的物体检测方法 Download PDF

Info

Publication number
CN109145898A
CN109145898A CN201810837645.9A CN201810837645A CN109145898A CN 109145898 A CN109145898 A CN 109145898A CN 201810837645 A CN201810837645 A CN 201810837645A CN 109145898 A CN109145898 A CN 109145898A
Authority
CN
China
Prior art keywords
neural network
frame
object detection
box
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810837645.9A
Other languages
English (en)
Inventor
袁春
邱鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201810837645.9A priority Critical patent/CN109145898A/zh
Publication of CN109145898A publication Critical patent/CN109145898A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

基于卷积神经网络和迭代机制的物体检测方法,包括:S1、构建物体检测模型并训练;S2、通过模型的骨干卷积神经网络抽取图像的全局特征图;S3、利用区域建议神经网络在全局特征图中的每个锚点位置输出所有可能的候选框的置信度和位置信息,利用阈值选出区域候选框;S4、使用感兴趣区域对齐层在全局特征图中切出各区域候选框的图像特征,并分别压缩成同长度的特征向量;S5、将每一特征向量输入到回归优化神经网络中,预测对应的物体类别及边界检测框;S6、将步骤S5得到的优化过的边界检测框作为新的区域候选框返回步骤S4和S5进行迭代;S7、重复执行步骤S4至S6直至迭代预定次数,将最新得到的边界检测框及其物体类别信息作为物体检测的结果输出。

Description

一种基于卷积神经网络和迭代机制的物体检测方法
技术领域
本发明涉及计算机视觉领域,尤其是涉及一种基于卷积神经网络和迭代机制的物体检测方法。
背景技术
作为图像理解的基础步骤,在图像中检测物体的技术受到了广泛关注,其检测的准确性对图像理解的结果有着重要影响。
物体检测算法主要分为两个阶段,一是基于传统特征的检测阶段,另外一个是基于深度卷积神经网络特征的检测阶段。2013年之前基于传统特征的检测方法为主流,大家使用传统特征(如SIFT,HOG等)然后训练SVM分类特征。之后,在整个学术界和工业界,深度学习逐渐成为了主流技术。与基于传统特征的检测技术相比,深度学习不再依赖专家的经验设计特征而是通过训练神经网络学习到特征抽取方式。使用深度学习的物体分类在精度上提高了很多。起先,深度学习还主要应用在物体分类上,并带来了十分显著的效果提升,但是很快也迁移并促进了物体检测的技术进步。
在基于卷积神经网络的物体检测技术发展早期,基本是通过滑动检测窗提取可能存在物体的区域(Proposal),后来出现了Selective Search等Proposal的提取算法,使得给定一张图像,无需再使用滑动窗口进行图像穷举扫描,而是采用该算法或类似的Proposal算法“提取”出一些候选窗口。在基本能够保持召回绝大多数物体的同时,明显降低了候选窗口的数量(如2000个左右)。但是这样依然会有大量的重复计算问题。Fast R-CNN的出现在一定程度上解决了该问题,Fast R-CNN使用一个类似SPP但简化的设计——RoI(Region ofInteresting)Pooling。Roi pooling层的训练和推断不再是分多步进行了,也不需要专门的存储中间特征结果,其训练梯度也能够通过RoI Pooling层直接反向传播。
Faster R-CNN则更进一步,直接通过一个新颖的RPN(Region ProposalNetworks)设计预测proposal。RPN在任意的图像上预测一定数量的物体包围框,每个包围框包含了物体的置信度和框的坐标信息。然后,Faster R-CNN在proposal的基础上进一步训练回归网络,优化proposal的分类结果和包围框坐标。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日前已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
虽然目前的这些检测方法能够在图像中得到物体检测的结果,但是通常提高检测准确度的方式是从模型大小和深度方向着手,我们则在此类检测算法中引入了迭代方法,通过多次迭代拓展检测精度的提升空间。在物体检测过程中,物体包围框需要紧密包围在物体周围,但是在很多情况下,物体包围框要么过小要么过大。在实际的物体检测研究工作中,本发明提出可以不用通过加深或者加大物体检测模型所使用的骨干网络来提高检测精度,而通过改进检测模型的训练方式并结合迭代机制,多次使用回归网络来优化候选区域框,提高物体检测输出的边界框(Bounding Box)的精度。本发明提出的技术方案如下:
一种基于卷积神经网络和迭代机制的物体检测方法,包括如下步骤:
S1、构建一以迭代机制优化边界框的物体检测模型,并进行训练;所述物体检测模型包括依次连接的骨干卷积神经网络、区域建议神经网络和回归优化神经网络;
S2、将待处理图像输入至所述物体检测模型,通过所述骨干卷积神经网络抽取所述待处理图像的全局特征图;
S3、利用所述区域建议神经网络,在所述全局特征图中的每个锚点位置输出所有可能的候选框的置信度信息和位置信息,在所有可能的候选框中,提取置信度大于一预设阈值的候选框作为区域候选框;
S4、使用感兴趣区域对齐层在所述全局特征图中切出各所述区域候选框内对应的图像特征,并分别压缩成具有相同且固定维度的特征向量;
S5、将每一所述特征向量输入到由两个全连接层组成的所述回归优化神经网络中,从每一所述特征向量中预测该特征向量对应的区域候选框内物体类别信息以及经所述回归优化神经网络优化过的边界检测框;
S6、将步骤S5得到的优化过的边界检测框作为新的区域候选框,对新的区域候选框返回执行步骤S4和S5,进行迭代;
S7、重复执行步骤S4至S6直至迭代预定次数,将最新得到的边界检测框及其物体类别信息作为物体检测的结果输出。
边界检测框的定位精度是评估物体检测效果的一个重要指标,因此,提升边界检测框的定位精度是提高物体检测准确度的重要步骤。本发明提出的上述技术方案,通过对模型输出的区域候选框进行迭代以提高检测精度。
附图说明
图1是本发明提出的基于卷积神经网络和迭代机制的物体检测方法流程图;
图2是本发明中对区域候选框进行迭代检测的过程示意图。
具体实施方式
下面结合附图和具体的实施方式对本发明作进一步说明。
本发明的具体实施方式提出一种基于卷积神经网络和迭代机制的物体检测方法,参考图1,包括以下步骤S1至S7:
S1、构建一以迭代机制优化边界框的物体检测模型,并进行训练;所述物体检测模型包括依次连接的骨干卷积神经网络、区域建议神经网络和回归优化神经网络。该物体检测模型是基于Faster R-CNN(更快速的区域卷积神经网络)使用迭代方法优化边界框的模型,虽然在本发明的后述实施例中使用的是基于Faster R-CNN的物体检测模型,但本发明提出的对边界框进行迭代优化提高检测精度的方法也可以应用于其它物体检测模型。在本发明的一实施例中采用大型的卷积神经网络作为模型的骨干卷积神经网络,用于运算输入的待处理图像的卷积神经网络特征,此处的骨干卷积神经网络例如可以是VGG16、ResNet101等。
S2、将待处理图像输入至所述物体检测模型,通过所述骨干卷积神经网络抽取所述待处理图像的全局特征图。在利用基于Faster R-CNN的物体检测模型运行物体检测流程时,只需要运行一次骨干卷积神经网络抽取全局特征即可。以VGG16为例,VGG16深度卷积神经网络共有13个卷积层,可以使用最后一个卷积层(Conv4-3)的激活值作为抽取的全局特征图。
S3、利用所述区域建议神经网络,在所述全局特征图中的每个锚点位置输出所有可能的候选框的置信度信息和位置信息,在所有可能的候选框中,提取置信度大于一预设阈值的候选框作为区域候选框。锚点框是预定义在图像上均匀分布的具有不同大小和比例的框,本文使用的锚点框定义与标准的Faster R-CNN相同(每个锚点位置9个锚点框)。区域建议网络以锚点框为参照物在每个锚点位置预测出区域候选框,区域候选框包含两个信息,一个是物体置信度(当前区域候选框有物体时置信度接近于1,没有物体则接近于0);另一个是锚点框到区域候选框的偏差信息,根据偏差信息可以得到区域候选框的位置。
S4、使用感兴趣区域对齐层在所述全局特征图中切出各所述区域候选框内对应的图像特征,并分别压缩成具有相同且固定维度的特征向量。
S5、将每一所述特征向量输入到由两个全连接层组成的所述回归优化神经网络中,从每一所述特征向量中预测该特征向量对应的区域候选框内物体类别信息以及经所述回归优化神经网络优化过的边界检测框。
S6、将步骤S5得到的优化过的边界检测框作为新的区域候选框,对新的区域候选框返回执行步骤S4和S5,进行迭代。
S7、重复执行步骤S4至S6直至迭代预定次数,将最新得到的边界检测框及其物体类别信息作为物体检测的结果输出。
模型中的区域建议神经网络在每个锚点位置输出所有可能的候选框的置信度信息Obj.和位置信息B0(共有w0×h0×9个锚点框,w0、h0分别是抽取的全局特征图的宽和高)。在所有的可能的候选框中,取置信度大于设定阈值(例如0.5)的候选框作为区域候选框。根据提取出的区域候选框,使用感兴趣区域对齐层(RoIAlign)在全局特征图中切出对应的图像特征。
本发明主要使用模型的回归优化神经网络来进行边界框的迭代优化,如图2所示,对于每一个已经提取出的区域候选框,在进入第一迭代优化之前,先使用感兴趣区域对齐层从全局特征图中提取出位于该区域候选框里的图像特征,并将其压缩成具有相同且固定维度的特征向量(大小一般为7×7)。接下来,每个固定维度的特征向量输入至由两个全连接层组成的回归优化神经网络中,然后,该回归优化神经网络对所输入的特征向量预测两个信息:物体所属的类别信息和预测的边界检测框。当通过区域建议神经网络得到置信度和区域候选框之后,对区域候选框进行迭代优化,第一次迭代即得到物体的分类1和边界检测框1(“1”代表第一次迭代的结果),第二次迭代优化得到分类2和边界检测框2。这样的优化迭代步骤可以进行多次,然而在本发明的实施例中迭代次数过多反而造成精度的下降,经过试验发现本发明的该实施例(VGG16作为骨干卷积神经网络的例子)迭代次数为2次时检测精度最优,迭代3次、4次时结果并无改进,反而略有下降。因此,第二次迭代的结果作为最终的检测结果输出。
在最后一次迭代优化输出最终的边界检测框之后,采用非极大值抑制算法和置信度阈值过滤等后处理方法进行抑制过低置信度的边界检测框和重复的边界检测框,得到最终的检测结果。
对本发明的基于Faster R-CNN的物体检测模型进行训练时,我们在标准的FasterR-CNN的训练方法上提出了两项主要改进:1)在所有的迭代步骤中都计算损失;2)对出现梯度爆炸的可能情况进行改进。
首先,在所有的迭代步骤中都计算损失。在对所述物体检测模型进行训练时,每一次迭代都相同的损失函数计算损失值,然后将每次迭代的损失值进行平均来作为最终的损失函数值,来进行训练。因为迭代检测框模型朝着真实值迭代地改进边界检测框,所以在所有迭代步骤中都使用相同的损失函数,然后将损失值平均起来,损失函数式(1)所示。如果像现有的通常做法一样,只在最后一步输出结果后计算损失,那么将减缓模型学习的速度,而且最终的检测精度会因此有一定程度的下降。
其中,i表示训练图像中边界检测框的索引号,表示第t次迭代时预测的物体类别信息,表示第t次迭代时预测的参数化的边界检测框的坐标,分别表示真实的物体类别信息和真实的边界检测框坐标;Lcls表示预测的边界检测框的物体类别信息与真实的物体类别信息之间的交叉熵损失;Lbox表示预测的边界检测框的定位损失;表示预测得到的边界检测框的数量;表示真正包含物体的边界检测框的数量。
另一方面,对于训练过程中可能出现梯度爆炸的情况,本发明提出了以下修正,于log函数内增加一修正数0.0001,修正方式如下
bw=log(w/wa+0.0001);
bh=log(h/ha+0.0001);
其中,bw、bh分别表示经过归一化之后的预测边界检测框的宽和高,分别表示经过归一化之后的真实边界检测框的宽和高,wa、ha分别表示所参考的锚点框的宽和高,w、h分别表示预测的边界检测框的宽和高,w*、h*分别表示真实的边界检测框的宽和高。所谓归一化,即如上述修正公式中所示,用预测值除以所参考的锚点框中对应含义的值再取对数,加入修正数0.0001是为了防止取对数之后可能出现的梯度爆炸。
再者,训练时使用了逐步减小的随机扰动,使用随机噪声修正预测的边界检测框的值,如下
其中,为添加随机噪声后的边界检测框的值,为预测的边界检测框的值,α为正态分布噪声,xpred、ypred为预测的边界检测框的中心点坐标,wpred和hpred分别为预测的边界检测框的宽和高。
这样,在每一次训练步骤中,我们计算的边界框损失是基于预测的边界框加了额外的扰动之后的值。这样做的好处是可以使模型训练更多样化的样本,同时避免了模型卡在固定的检测框上循环输出同样的值。虽然根据扰动后的输出值计算的反向传播梯度与实际的应使用的梯度并不完全一致,但是因为噪声的均值为0,所以累积多次训练后,可以使训练样本的梯度误差减小为0。通过使用这样的训练方法,我们的迭代检测框模型将不只再使用不同的训练样本训练网络,同时还能够从模型自己的成功和失误中逐渐地学习。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (7)

1.一种基于卷积神经网络和迭代机制的物体检测方法,包括如下步骤:
S1、构建一以迭代机制优化边界框的物体检测模型,并进行训练;所述物体检测模型包括依次连接的骨干卷积神经网络、区域建议神经网络和回归优化神经网络;
S2、将待处理图像输入至所述物体检测模型,通过所述骨干卷积神经网络抽取所述待处理图像的全局特征图;
S3、利用所述区域建议神经网络,在所述全局特征图中的每个锚点位置输出所有可能的候选框的置信度信息和位置信息,在所有可能的候选框中,提取置信度大于一预设阈值的候选框作为区域候选框;
S4、使用感兴趣区域对齐层在所述全局特征图中切出各所述区域候选框内对应的图像特征,并分别压缩成具有相同且固定维度的特征向量;
S5、将每一所述特征向量输入到由两个全连接层组成的所述回归优化神经网络中,从每一所述特征向量中预测该特征向量对应的区域候选框内物体类别信息以及经所述回归优化神经网络优化过的边界检测框;
S6、将步骤S5得到的优化过的边界检测框作为新的区域候选框,对新的区域候选框返回执行步骤S4和S5,进行迭代;
S7、重复执行步骤S4至S6直至迭代预定次数,将最新得到的边界检测框及其物体类别信息作为物体检测的结果输出。
2.如权利要求1所述的物体检测方法,其特征在于:所述物体检测模型基于更快速的区域卷积神经网络而构建,在对所述物体检测模型进行训练时,每一次迭代都相同的损失函数计算损失值,然后将每次迭代的损失值进行平均来作为最终的损失函数值,来进行训练。
3.如权利要求2所述的物体检测方法,其特征在于:所述损失函数如下
其中,i表示训练图像中边界检测框的索引号,表示第t次迭代时预测的物体类别信息,表示第t次迭代时预测的参数化的边界检测框的坐标,分别表示真实的物体类别信息和真实的边界检测框坐标;Lcls表示预测的边界检测框的物体类别信息与真实的物体类别信息之间的交叉熵损失;Lbox表示预测的边界检测框的定位损失;表示预测得到的边界检测框的数量;表示真正包含物体的边界检测框的数量。
4.如权利要求3所述的物体检测方法,其特征在于:在使用所述损失函数训练所述物体检测模型时,还使用随机噪声修正预测的边界检测框的值,如下
其中,为添加随机噪声后的边界检测框的值,为预测的边界检测框的值,α为正态分布噪声,xpred、ypred为预测的边界检测框的中心点坐标,wpred和hpred分别为预测的边界检测框的宽和高。
5.如权利要求3所述的物体检测方法,其特征在于:在训练所述物体检测模型时,于log函数内增加一修正数0.0001,修正方式如下
bw=log(w/wa+0.0001);
bh=log(h/ha+0.0001);
其中,bw、bh分别表示经过归一化之后的预测边界检测框的宽和高,分别表示经过归一化之后的真实边界检测框的宽和高,wa、ha分别表示所参考的锚点框的宽和高,w、h分别表示预测的边界检测框的宽和高,w*、h*分别表示真实的边界检测框的宽和高。
6.如权利要求1所述的物体检测方法,其特征在于:还包括对步骤S7输出的物体检测结果进行后处理,所述后处理包括置信度阈值过滤和非极大值抑制算法。
7.如权利要求1所述的物体检测方法,其特征在于:步骤S3中所述预设阈值为0.5。
CN201810837645.9A 2018-07-26 2018-07-26 一种基于卷积神经网络和迭代机制的物体检测方法 Withdrawn CN109145898A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810837645.9A CN109145898A (zh) 2018-07-26 2018-07-26 一种基于卷积神经网络和迭代机制的物体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810837645.9A CN109145898A (zh) 2018-07-26 2018-07-26 一种基于卷积神经网络和迭代机制的物体检测方法

Publications (1)

Publication Number Publication Date
CN109145898A true CN109145898A (zh) 2019-01-04

Family

ID=64797995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810837645.9A Withdrawn CN109145898A (zh) 2018-07-26 2018-07-26 一种基于卷积神经网络和迭代机制的物体检测方法

Country Status (1)

Country Link
CN (1) CN109145898A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977952A (zh) * 2019-03-27 2019-07-05 深动科技(北京)有限公司 基于局部最大值的候选目标检测方法
CN110070052A (zh) * 2019-04-24 2019-07-30 广东工业大学 一种基于人类演示视频的机器人控制方法、装置和设备
CN110176944A (zh) * 2019-04-25 2019-08-27 中国科学院上海微系统与信息技术研究所 一种基于深度学习的智能抗干扰装置及方法
CN110532985A (zh) * 2019-09-02 2019-12-03 北京迈格威科技有限公司 目标检测方法、装置及系统
CN110910445A (zh) * 2019-11-26 2020-03-24 深圳市丰巢科技有限公司 一种物件尺寸检测方法、装置、检测设备及存储介质
CN110942008A (zh) * 2019-11-21 2020-03-31 圆通速递有限公司 一种基于深度学习的面单信息定位方法和系统
JP2020126633A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョンStradvision,Inc. Avm及び強化学習を利用して自律走行の安全性を達成するためのアテンション−ドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avmand reinforcement learning to thereby achieve safety of autonomous driving}
JP2020126632A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョンStradvision,Inc. Avmを利用して自律走行の安全性を達成するためのアテンションドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avm to thereby achieve safety of autonomous driving}
CN111563499A (zh) * 2019-02-13 2020-08-21 Sap欧洲公司 神经网络中的盲点实施
CN111598078A (zh) * 2019-02-20 2020-08-28 北京奇虎科技有限公司 一种基于序列优化的物体检测的方法及系统
CN111738272A (zh) * 2019-03-25 2020-10-02 杭州海康威视数字技术股份有限公司 一种目标特征提取方法、装置及电子设备
CN111898560A (zh) * 2020-08-03 2020-11-06 华南理工大学 一种目标检测中的分类回归特征解耦方法
CN112149487A (zh) * 2019-06-28 2020-12-29 百度(美国)有限责任公司 一种用于自动驾驶的用于训练神经网络对象检测模型的用于确定锚框的方法
CN112233071A (zh) * 2020-09-28 2021-01-15 国网浙江省电力有限公司杭州供电公司 基于复杂环境下输电网图片的多粒度隐患检测方法及系统
CN112906621A (zh) * 2021-03-10 2021-06-04 北京华捷艾米科技有限公司 一种手部检测方法、装置、存储介质和设备
CN113128479A (zh) * 2021-05-18 2021-07-16 成都市威虎科技有限公司 一种学习噪声区域信息的人脸检测方法及装置
US11151358B2 (en) * 2019-04-30 2021-10-19 Beijing Sensetime Technology Development Co., Ltd. Target detection method and apparatus, device, and storage medium
CN113569911A (zh) * 2021-06-28 2021-10-29 北京百度网讯科技有限公司 车辆识别方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845374A (zh) * 2017-01-06 2017-06-13 清华大学 基于深度学习的行人检测方法及检测装置
CN107368845A (zh) * 2017-06-15 2017-11-21 华南理工大学 一种基于优化候选区域的Faster R‑CNN目标检测方法
CN107590489A (zh) * 2017-09-28 2018-01-16 国家新闻出版广电总局广播科学研究院 基于级联卷积神经网络的目标检测方法
CN107944443A (zh) * 2017-11-16 2018-04-20 深圳市唯特视科技有限公司 一种基于端到端深度学习进行对象一致性检测方法
CN108256555A (zh) * 2017-12-21 2018-07-06 北京达佳互联信息技术有限公司 图像内容识别方法、装置及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845374A (zh) * 2017-01-06 2017-06-13 清华大学 基于深度学习的行人检测方法及检测装置
CN107368845A (zh) * 2017-06-15 2017-11-21 华南理工大学 一种基于优化候选区域的Faster R‑CNN目标检测方法
CN107590489A (zh) * 2017-09-28 2018-01-16 国家新闻出版广电总局广播科学研究院 基于级联卷积神经网络的目标检测方法
CN107944443A (zh) * 2017-11-16 2018-04-20 深圳市唯特视科技有限公司 一种基于端到端深度学习进行对象一致性检测方法
CN108256555A (zh) * 2017-12-21 2018-07-06 北京达佳互联信息技术有限公司 图像内容识别方法、装置及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIN QIU等: "Improving Object Detection with Convolutional Neural Network via Iterative Mechanism", 《SPRINGER》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020126632A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョンStradvision,Inc. Avmを利用して自律走行の安全性を達成するためのアテンションドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avm to thereby achieve safety of autonomous driving}
JP2020126633A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョンStradvision,Inc. Avm及び強化学習を利用して自律走行の安全性を達成するためのアテンション−ドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avmand reinforcement learning to thereby achieve safety of autonomous driving}
CN111563499B (zh) * 2019-02-13 2023-06-06 Sap欧洲公司 神经网络中的盲点实施
CN111563499A (zh) * 2019-02-13 2020-08-21 Sap欧洲公司 神经网络中的盲点实施
CN111598078A (zh) * 2019-02-20 2020-08-28 北京奇虎科技有限公司 一种基于序列优化的物体检测的方法及系统
CN111738272A (zh) * 2019-03-25 2020-10-02 杭州海康威视数字技术股份有限公司 一种目标特征提取方法、装置及电子设备
CN109977952A (zh) * 2019-03-27 2019-07-05 深动科技(北京)有限公司 基于局部最大值的候选目标检测方法
CN109977952B (zh) * 2019-03-27 2021-10-22 深动科技(北京)有限公司 基于局部最大值的候选目标检测方法
CN110070052A (zh) * 2019-04-24 2019-07-30 广东工业大学 一种基于人类演示视频的机器人控制方法、装置和设备
CN110176944A (zh) * 2019-04-25 2019-08-27 中国科学院上海微系统与信息技术研究所 一种基于深度学习的智能抗干扰装置及方法
US11151358B2 (en) * 2019-04-30 2021-10-19 Beijing Sensetime Technology Development Co., Ltd. Target detection method and apparatus, device, and storage medium
CN112149487A (zh) * 2019-06-28 2020-12-29 百度(美国)有限责任公司 一种用于自动驾驶的用于训练神经网络对象检测模型的用于确定锚框的方法
CN110532985A (zh) * 2019-09-02 2019-12-03 北京迈格威科技有限公司 目标检测方法、装置及系统
CN110532985B (zh) * 2019-09-02 2022-07-22 北京迈格威科技有限公司 目标检测方法、装置及系统
CN110942008A (zh) * 2019-11-21 2020-03-31 圆通速递有限公司 一种基于深度学习的面单信息定位方法和系统
CN110942008B (zh) * 2019-11-21 2023-05-12 圆通速递有限公司 一种基于深度学习的面单信息定位方法和系统
CN110910445A (zh) * 2019-11-26 2020-03-24 深圳市丰巢科技有限公司 一种物件尺寸检测方法、装置、检测设备及存储介质
CN111898560A (zh) * 2020-08-03 2020-11-06 华南理工大学 一种目标检测中的分类回归特征解耦方法
CN111898560B (zh) * 2020-08-03 2023-08-01 华南理工大学 一种目标检测中的分类回归特征解耦方法
CN112233071A (zh) * 2020-09-28 2021-01-15 国网浙江省电力有限公司杭州供电公司 基于复杂环境下输电网图片的多粒度隐患检测方法及系统
CN112906621A (zh) * 2021-03-10 2021-06-04 北京华捷艾米科技有限公司 一种手部检测方法、装置、存储介质和设备
CN113128479A (zh) * 2021-05-18 2021-07-16 成都市威虎科技有限公司 一种学习噪声区域信息的人脸检测方法及装置
CN113569911A (zh) * 2021-06-28 2021-10-29 北京百度网讯科技有限公司 车辆识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109145898A (zh) 一种基于卷积神经网络和迭代机制的物体检测方法
US9424493B2 (en) Generic object detection in images
CN107784288B (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN109933656B (zh) 舆情极性预测方法、装置、计算机设备及存储介质
CN111488985B (zh) 深度神经网络模型压缩训练方法、装置、设备、介质
US9323886B2 (en) Performance predicting apparatus, performance predicting method, and program
CN112116613B (zh) 图像矢量化方法及系统
CN104008166A (zh) 一种基于形态和语义相似度的对话短文本聚类方法
CN113220886A (zh) 文本分类方法、文本分类模型训练方法及相关设备
CN116958688B (zh) 一种基于YOLOv8网络的目标检测方法及系统
CN113505583B (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN117152746B (zh) 一种基于yolov5网络的宫颈细胞分类参数获取方法
CN112861795A (zh) 基于多尺度特征融合的遥感图像显著目标检测方法及装置
CN106056577B (zh) 基于mds-srm混合级联的sar图像变化检测方法
CN114266894A (zh) 一种图像分割方法、装置、电子设备及存储介质
CN110674301A (zh) 一种情感倾向预测方法、装置、系统及存储介质
CN103324641B (zh) 信息记录推荐方法和装置
CN107766419B (zh) 一种基于阈值去噪的TextRank文档摘要方法及装置
CN117131348B (zh) 基于差分卷积特征的数据质量分析方法及系统
CN110728359B (zh) 搜索模型结构的方法、装置、设备和存储介质
CN117253087A (zh) 一种基于卷积神经网络的岩石类型识别方法及系统
CN117274355A (zh) 一种基于加速引导区域卷积神经网络和并行多尺度统一网络的排水管道流量智能测量方法
CN112559680B (zh) 基于多层次特征提取的文本分类方法、模型及存储介质
CN115205554A (zh) 一种基于语义概念抽取的检索方法
CN114266653A (zh) 集成学习的客户贷款风险预估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190104