CN108010060B - 目标检测方法及装置 - Google Patents

目标检测方法及装置 Download PDF

Info

Publication number
CN108010060B
CN108010060B CN201711275033.7A CN201711275033A CN108010060B CN 108010060 B CN108010060 B CN 108010060B CN 201711275033 A CN201711275033 A CN 201711275033A CN 108010060 B CN108010060 B CN 108010060B
Authority
CN
China
Prior art keywords
network model
target detection
detection network
target
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711275033.7A
Other languages
English (en)
Other versions
CN108010060A (zh
Inventor
张水发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711275033.7A priority Critical patent/CN108010060B/zh
Publication of CN108010060A publication Critical patent/CN108010060A/zh
Application granted granted Critical
Publication of CN108010060B publication Critical patent/CN108010060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于一种目标检测方法及装置。该方法包括:接收待检测的图像;利用目标检测网络模型,确定待检测的图像中移动目标的类别信息以及位置信息,其中,目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的。根据本公开的实施例,通过接收待检测的图像,并利用去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型,来确定待检测的图像中移动目标的类别信息以及位置信息,参数较稀疏的目标检测网络模型能够快速确定移动目标的类别信息以及位置信息,从而提高目标检测效率。

Description

目标检测方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种目标检测方法及装置。
背景技术
目标检测是检测图片中是否存在待检测的目标(例如图片中移动的行人、车辆等),并在存在目标时,确定该目标的位置。相关技术中存在很多目标检测的方法,然而,这些方法在实际检测过程中,均具有检测速度较慢、检测效率低的缺点。
发明内容
为克服相关技术中存在的问题,本公开提供一种目标检测方法及装置。
根据本公开实施例的第一方面,提供一种目标检测方法,所述方法包括:
接收待检测的图像;
利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的。
对于以上方法,在一种可能的实现方式中,所述方法还包括:
根据包括移动目标的样本图像,训练得到第一目标检测网络模型;
根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,其中,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失;
在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道;
去除所述第二目标检测网络模型中参数权重为零的通道;
将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
对于以上方法,在一种可能的实现方式中,根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,包括:
将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失;
根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
对于以上方法,在一种可能的实现方式中,将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失,包括:
将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
根据本公开实施例的第二方面,提供一种目标检测装置,所述装置包括:
图像接收模块,用于接收待检测的图像;
信息确定模块,用于利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的。
对于上述装置,在一种可能的实现方式中,所述装置还包括:
第一训练模块,用于根据包括移动目标的样本图像,训练得到第一目标检测网络模型;
第二训练模块,用于根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,其中,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失;
第一模型确定模块,用于在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道;
通道去除模块,用于去除所述第二目标检测网络模型中参数权重为零的通道;
第二模型确定模块,用于将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
对于上述装置,在一种可能的实现方式中,所述第二训练模块包括:
模型损失计算子模块,用于将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失;
权重调整子模块,用于根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
对于上述装置,在一种可能的实现方式中,所述模型损失计算子模块包括:
检测结果获取子模块,用于将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
模型损失确定子模块,用于根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
根据本公开实施例的第三方面,提供一种目标检测装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述目标检测方法。
本公开的实施例提供的技术方案可以包括以下有益效果:通过接收待检测的图像,并利用去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型,来确定待检测的图像中移动目标的类别信息以及位置信息,参数较稀疏的目标检测网络模型能够快速确定移动目标的类别信息以及位置信息,从而提高目标检测效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种目标检测方法的流程图。
图2是根据一示例性实施例示出的一种目标检测方法的目标检测网络模型的示意图。
图3是根据一示例性实施例示出的一种目标检测方法的流程图。
图4是根据一示例性实施例示出的一种目标检测方法的流程图。
图5是根据一示例性实施例示出的一种目标检测方法的应用场景的示意图。
图6是根据一示例性实施例示出的一种目标检测装置的框图。
图7是根据一示例性实施例示出的一种目标检测装置的框图。
图8是根据一示例性实施例示出的一种目标检测装置的框图。
图9是根据一示例性实施例示出的一种目标检测装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种目标检测方法的流程图。如图1所示,该方法用于终端设备(例如,手机、平板电脑等)或服务器中。根据本公开实施例的目标检测方法包括:
在步骤S11中,接收待检测的图像;
在步骤S12中,利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN(Faster Region Convolutional Neural Networks)中参数权重为零的通道所确定的。
根据本公开的实施例,通过接收待检测的图像,并利用去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型,来确定待检测的图像中移动目标的类别信息以及位置信息,参数较稀疏的目标检测网络模型能够快速确定移动目标的类别信息以及位置信息,从而提高目标检测效率。
其中,移动目标可以为行人、移动车辆等。该目标检测网络模型可以为训练好的,用于确定所述待检测的图像中移动目标的类别信息以及位置信息的目标检测网络模型。其中,该目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的。
图2是根据一示例性实施例示出的一种目标检测方法的目标检测网络模型的示意图。在一种可能的实现方式中,如图2所示,该目标检测网络模型可以包括特征提取网络21、区域生成网络22(Region Proposal Network,RPN)、兴趣区域池化层23(ROI Pooling,Region ofInterest Pooling)以及分类位置检测网络24。该目标检测网络模型是在Faster-RCNN基础上,通过去除Faster-RCNN中参数权重为零的通道所确定的,其中,参数权重为零是通过训练所得到的。例如,通过训练得到Faster-RCNN中部分参数权重为零,则通过去除参数权重为零的通道所确定的目标检测网络模型的参数较稀疏。
举例来说,该终端设备可以接收待检测的图像,并利用训练好的目标检测网络确定待检测的图像中移动目标的类别信息以及位置信息。例如,终端设备可以接收待检测的图像,并将该待检测的图像输入到目标检测网络模型中进行处理。该目标检测网络模型的特征提取网络21通过其多个卷积层对该待检测的图像进行特征提取,得到该待检测的图像的特征图像(feature map)。该目标检测网络模型的区域生成网络22可以根据该待检测的图像的特征图像,生成多个候选区域。该目标检测网络模型的兴趣区域池化层23可以根据该待检测的图像的特征图像以及多个候选区域,得到多个候选区域的分辨率相同的特征图像。该目标检测网络模型的分类位置检测网络24可以通过其多个全连接层(FullyConnected,FC),例如,可以通过图2所示的FC6以及FC7两层全连接层对多个候选区域的特征图像进行处理,来确定待检测的图像中的移动目标的类别信息以及位置信息。例如,可以确定待检测的图像中的移动目标的类别信息为行人,并得到该行人的位置信息。
通过这种方式,可以利用目标检测网络模型确定待检测的图像中的移动目标的类别信息以及位置信息。该目标检测网络模型是通过去除更快速区域卷积神经网络FasterRCNN中参数权重为零的通道所确定的,具有参数较稀疏的特点,因此,在利用参数较稀疏的目标检测网络模型对待检测的图像进行目标检测时,具有计算量较少、检测速度较快的特点,从而提高了目标检测效率。
本领域技术人员应理解,目标检测网络模型还可以包括其他结构,只要是通过去除Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型,且可以对待检测的图像进行处理,确定移动目标的类别信息以及位置信息即可,其中,特征提取网络的类型也可以包括多种,例如,可以是VGG16的多个卷积层、也可以是卷积神经网络AlexNet的多个卷积层等,区域生成网络也可以包括多种结构,只要可以根据该待检测的图像的特征图像,生成多个候选区域即可,分类位置检测网络也可以包括多种形式,只要可以对候选区域的特征图像进行处理,确定移动目标的类别信息以及位置信息即可,本公开对此不作限制。
图3是根据一示例性实施例示出的一种目标检测方法的流程图。在一种可能的实现方式中,如图3所示,该方法还包括:
在步骤S13中,根据包括移动目标的样本图像,训练得到第一目标检测网络模型。
举例来说,可以根据包括移动目标的样本图像,例如,可以采集包括行人的样本图像,并通过该样本图像,训练得到第一目标检测网络模型。例如,可以通过多维向量标记图像样本中行人的位置信息。例如,可以通过四维向量(x,y,w,h)来标记样本图像中移动目标的位置信息。其中,x可以表示该移动目标中心点的横轴坐标、y可以表示该移动目标中心点的纵轴左边,w可以表示该移动目标的宽度,h可以表示该移动目标的高度。将标记过的样本图像输入到初始目标检测网络模型中,对该初始目标检测网络模型进行训练,例如,采用随机梯度下降法训练该初始目标检测网络模型,确定该初始目标检测网络模型中的参数权重。在训练次数达到目标训练阈值或者该初始目标检测网络模型输出的结果收敛时,可以将当前的初始目标检测网络模型确定为第一目标检测网络模型。
通过这种方式,可以根据包括移动目标的样本图像,训练得到第一目标检测网络模型。本领域技术人员应理解,可以采用相关技术中Faster-RCNN的训练方法来训练得到第一目标检测网络模型。例如,图2所示的目标检测网络模型在训练过程中可以分为RPN以及快速区域卷积神经网络Fast-RCNN(Fast-Region Convolutional Neural Networks),其中,Fast-RCNN包括特征提取网络、ROI Pooling以及分类位置检测网络。可以根据包括移动目标的样本图像,对初始目标检测网络模型中的RPN进行第一次训练,根据第一训练后的RPN可以生成多个候选区域。根据该多个候选区域以及样本图像,对初始目标检测网络模型中的Fast-RCNN进行第一次训练。在对Fast-RCNN第一次训练完成后,对RPN进行第二次训练,根据第二次训练后的RPN再次生成多个候选区域。根据再次生成的多个候选区域以及样本图像,对Fast-RCNN进行第二次训练。需要说明的是,在对Fast-RCNN进行训练时,损失函数中可以包括二次惩罚项,该二次惩罚项可用于确定模型的参数的二维距离损失。通过包括二次惩罚项的损失函数训练初始目标检测网络模型,可以使得该初始目标检测网络模型中的参数权重都趋近于零,使得该初始目标检测网络模型的复杂度较低,对样本数据的拟合度较好,可以防止训练进入局部最优,从而提高训练得到的第一目标检测网络模型的普适性,保证训练得到的第一目标检测网络模型的检测准确度。
在步骤S14中,根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,其中,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失。
举例来说,如前文所述,根据样本图像可以训练得到的第一目标检测网络模型,因训练Fast-RCNN过程中的损失函数包括二次惩罚项,使得训练得到的第一目标检测网络模型具有较强的普适性,可以保证检测准确度。然而,该第一目标检测网络模型的参数较稠密,在实际检测过程中,计算量较大,具有检测速度过慢的缺点。本公开实施例可以根据样本图像及目标损失函数,训练该第一目标检测网络模型,以对该第一目标检测网络模型的参数进行稀疏化。其中,目标损失函数可用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失。例如,该目标损失函数可以包括类别位置误差项以及一次惩罚项,其中,类别位置误差项用于确定目标检测网络模型的类别损失以及位置损失,从而衡量目标检测网络模型对图像样本的检测结果与真实情况的误差。一次惩罚项可用于确定目标检测网络模型的参数的一维距离损失,一次惩罚项可以表示为参数权重的绝对值的和。
在一种可能的实现方式中,目标损失函数可以表示为公式(1)
J=L+λ×||w|| (1)
其中,J表示模型损失,L为类别位置误差项,用于确定类别损失以及位置损失,||w||为一次惩罚项,w表示参数权重,λ为惩罚系数。本领域技术人员应理解,目标损失函数还可以包括其他表现形式,本公开对此不作限制。
图4是根据一示例性实施例示出的一种目标检测方法的流程图。在一种可能的实现方式中,如图4所示,步骤S14可以包括:
在步骤S141中,将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失。
举例来说,可以将图像样本输入到第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失。
在一种可能的实现方式中,步骤S141可以包括:
将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
举例来说,将样本图像输入第一目标检测网络模型中进行处理,获取针对样本图像的训练检测结果,根据该训练检测结果、期望检测结果以及目标损失函数,可以确定该第一目标检测网络模型的模型损失。这样,可以确定第一目标检测网络模型的模型损失。本领域技术人员应理解,可以采用相关技术中公知的方式将图像样本输入到第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失,本公开对此不作限制。
在步骤S142中,根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
举例来说,可以根据确定的模型损失,调整第一目标检测网络模型中的参数权重。如前文所述,目标损失函数可以表示为公式(1),则在通过梯度下降法对第一目标检测网络模型进行训练时,例如,在调整参数权重wi时,可以对参数权重wi求导,得到公式(2)
Figure BDA0001496355710000081
其中,sgn表示参数权重wi的符号。
根据模型损失,调整第一目标检测网络模型中的参数权重的规则可以表示为公式(3):
Figure BDA0001496355710000082
其中,wi'表示更新后的参数权重。由公式(3)可知,当参数权重wi为正时,更新后的参数权重变小,当参数权重wi为负时,更新后的参数权重变大。因此,在调整第一目标检测网络模型中的参数权重时,因目标损失函数中包括一次惩罚项,可使得该第一目标检测网络模型中的参数权重以较大梯度向零靠近。
通过这种方式,根据图像样本以及包括一次惩罚项的目标损失函数,训练第一目标检测网络模型,可以使得调整后的第一目标检测网络模型中的参数权重都向零靠近,从而使得第一目标检测网络模型中的部分参数权重为零。本领域技术人员应理解,可以采用相关技术中公知的方式根据图像样本及目标损失函数,训练第一目标检测网络模型,本公开对此不作限制。
如图3所示,在步骤S15中,在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道。
举例来说,在训练次数达到训练阈值或第一目标检测网络模型输出的结果处于收敛时,可以将当前的第一目标检测网络模型确定为第二目标检测网络模型。如前文所述,目标损失函数中包括一次惩罚项,可以使得训练过程中,参数权重逐渐向零移动,最后仅保留对结果影响最大的一部分参数权重,部分参数权重变为零,因此,确定的第二目标检测网络模型中包括参数权重为零的通道。
在步骤S16中,去除所述第二目标检测网络模型中参数权重为零的通道;
在步骤S17中,将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
举例来说,得到的第二目标检测网络模型中包括参数权重为零的通道,可以通过去除该第二目标检测网络模型中参数权重为零的通道,例如,采用通道裁剪(ChannelPruning)来去除第二目标检测网络模型中包括参数权重为零的通道,并将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
通过这种方式,利用包括可用于确定参数的一维距离损失的一次惩罚项,调整第一目标检测网络模型中的参数,并去除参数权重为零的通道,得到参数较稀疏的目标检测网络模型,可以保证在实际检测过程中,计算量较小,保证检测准确度的基础上加快检测速度。本领域技术人员应理解,可以采用相关技术中公知的方式去除参数权重为零的通道,并将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型,本公开对此不作限制。
应用示例
以下结合“检测图像中的行人”作为一个示例性应用场景,给出根据本公开实施例的应用示例,以便于理解目标检测方法的流程。本领域技术人员应理解,以下应用示例仅仅是出于便于理解本公开实施例的目的,不应视为对本公开实施例的限制。
图5是根据一示例性实施例示出的一种目标检测方法的应用场景的示意图。在该应用示例中,基于Faster RCNN模型,训练得到可用于检测图像中行人的目标检测网络模型,其中,该目标检测网络模型是通过去除Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型。
在该应用示例中,可以获取包括行人的样本图像,并根据包括行人的样本图像,训练得到第一目标检测网络模型。在该应用示例中,根据包括行人的样本图像以及包括一次惩罚项的目标损失函数,训练该第一目标检测网络模型。在训练次数达到训练阈值或第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为第二目标检测网络模型,其中,第二目标检测网络模型中包括参数权重为零的通道。在该应用示例中,去除该第二目标检测网络模型中参数权重为零的通道,并将去除参数权重为零后的目标检测网络模型确定为最终的目标检测网络模型,此时,该目标检测网络模型具有参数较稀疏的特点。
在该应用示例中,终端设备可以接收待检测的图像,并利用目标检测网络模型,确定待检测的图像中行人的类别信息以及位置信息。例如,可以将待检测的图像导入电脑中行人检测软件中。电脑的行人检测软件可以利用目标检测网络模型,确定待检测的图像中移动目标的类别信息以及位置信息,例如,可以检测到该待检测的图像中移动目标的类别信息为行人以及该行人的位置信息。例如,可以通过如图5所示的加粗矩形框1(x1,y1,w1,h1)以及加粗矩形框2(x2,y2,w2,h2)来表示行人1和行人2的位置信息。
根据本公开的实施例,通过接收待检测的图像,并利用去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的参数较稀疏的目标检测网络模型,来确定待检测的图像中移动目标的类别信息以及位置信息,参数较稀疏的目标检测网络模型能够快速确定移动目标的类别信息以及位置信息,从而提高目标检测效率。
图6是根据一示例性实施例示出的一种目标检测装置的框图。参照图6,该装置包括图像接收模块61和信息确定模块62。
该图像接收模块61,被配置为接收待检测的图像;
该信息确定模块62,被配置为利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的。
图7是根据一示例性实施例示出的一种目标检测装置的框图。参照图7,在一种可能的实现方式中,所述装置还包括:
第一训练模块63,被配置为根据包括移动目标的样本图像,训练得到第一目标检测网络模型;
第二训练模块64,被配置为根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,其中,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失;
第一模型确定模块65,被配置为在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道;
通道去除模块66,被配置为去除所述第二目标检测网络模型中参数权重为零的通道;
第二模型确定模块67,被配置为将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
参照图7,在一种可能的实现方式中,所述第二训练模块64包括:
模型损失计算子模块641,被配置为将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失;
权重调整子模块642,被配置为根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
在一种可能的实现方式中,所述模型损失计算子模块641包括:
检测结果获取子模块,被配置为将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
模型损失确定子模块,被配置为根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种目标检测装置的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图9是根据一示例性实施例示出的一种目标检测装置的框图。例如,装置1900可以被提供为一服务器。参照图9,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1932,上述指令可由装置1900的处理组件1922执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种目标检测方法,其特征在于,所述方法包括:
接收待检测的图像;
利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的;
所述方法还包括:
根据包括移动目标的样本图像,以及包括二次惩罚项的损失函数训练得到第一目标检测网络模型;
根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,得到第二目标检测网络模型,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失;
根据所述第二目标检测网络模型确定所述目标检测网络模型;
其中,所述目标检测网络模型包括特征提取网络、区域生成网络、兴趣区域池化层以及分类位置检测网络;
所述特征提取网络通过其多个卷积层对所述待检测的图像进行特征提取,得到所述待检测的图像的特征图像;所述区域生成网络根据所述特征图像,生成多个候选区域;所述兴趣区域池化层根据所述特征图像以及多个所述候选区域,得到多个候选区域的分辨率相同的特征图像;所述分类位置检测网络通过其多个全连接层对多个候选区域的特征图像进行处理,来确定待检测的图像中的移动目标的类别信息以及位置信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,得到第二目标检测网络模型包括:
在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为所述第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道;
所述根据所述第二目标检测网络模型确定所述目标检测网络模型包括:
去除所述第二目标检测网络模型中参数权重为零的通道;
将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
3.根据权利要求2所述的方法,其特征在于,根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,包括:
将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失;
根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
4.根据权利要求3所述的方法,其特征在于,将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失,包括:
将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
5.一种目标检测装置,其特征在于,所述装置包括:
图像接收模块,用于接收待检测的图像;
信息确定模块,用于利用目标检测网络模型,确定所述待检测的图像中移动目标的类别信息以及位置信息,
其中,所述目标检测网络模型是通过去除更快速区域卷积神经网络Faster RCNN中参数权重为零的通道所确定的;
所述装置还包括:
第一训练模块,用于根据包括移动目标的样本图像,以及包括二次惩罚项的损失函数训练得到第一目标检测网络模型;
第二训练模块,用于根据所述样本图像及目标损失函数,训练所述第一目标检测网络模型,得到第二目标检测网络模型,所述目标损失函数用于确定第一目标检测网络模型的类别损失、位置损失以及参数的一维距离损失;
模型确定模块,用于根据所述第二目标检测网络模型确定所述目标检测网络模型;
其中,所述目标检测网络模型包括特征提取网络、区域生成网络、兴趣区域池化层以及分类位置检测网络;
所述特征提取网络通过其多个卷积层对所述待检测的图像进行特征提取,得到所述待检测的图像的特征图像;所述区域生成网络根据所述特征图像,生成多个候选区域;所述兴趣区域池化层根据所述特征图像以及多个所述候选区域,得到多个候选区域的分辨率相同的特征图像;所述分类位置检测网络通过其多个全连接层对多个候选区域的特征图像进行处理,来确定待检测的图像中的移动目标的类别信息以及位置信息。
6.根据权利要求5所述的装置,其特征在于,所述第二训练模块,用于在训练次数达到训练阈值或所述第一目标检测网络模型输出的结果处于收敛时,将当前的第一目标检测网络模型确定为所述第二目标检测网络模型,其中,所述第二目标检测网络模型中包括参数权重为零的通道;
所述模型确定模块,用于去除所述第二目标检测网络模型中参数权重为零的通道;将去除参数权重为零的通道后的目标检测网络模型确定为最终的目标检测网络模型。
7.根据权利要求6所述的装置,其特征在于,所述第二训练模块包括:
模型损失计算子模块,用于将所述样本图像输入所述第一目标检测网络模型中进行处理,通过目标损失函数计算得到模型损失;
权重调整子模块,用于根据所述模型损失,调整所述第一目标检测网络模型中的参数权重。
8.根据权利要求7所述的装置,其特征在于,所述模型损失计算子模块包括:
检测结果获取子模块,用于将所述样本图像输入所述第一目标检测网络模型中进行处理,获取针对所述样本图像的训练检测结果;
模型损失确定子模块,用于根据所述训练检测结果、期望检测结果以及所述目标损失函数,确定所述第一目标检测网络模型的模型损失。
9.一种目标检测装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求1-4中任意一项所述的方法。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得处理器能够执行根据权利要求1-4中任意一项所述的方法。
CN201711275033.7A 2017-12-06 2017-12-06 目标检测方法及装置 Active CN108010060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711275033.7A CN108010060B (zh) 2017-12-06 2017-12-06 目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711275033.7A CN108010060B (zh) 2017-12-06 2017-12-06 目标检测方法及装置

Publications (2)

Publication Number Publication Date
CN108010060A CN108010060A (zh) 2018-05-08
CN108010060B true CN108010060B (zh) 2021-07-27

Family

ID=62056751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711275033.7A Active CN108010060B (zh) 2017-12-06 2017-12-06 目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN108010060B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019276B (zh) * 2018-06-29 2024-01-30 珠海爱路达信息科技有限公司 一种智能公路设施数据采集与更新方法
CN110751163B (zh) * 2018-07-24 2023-05-26 杭州海康威视数字技术股份有限公司 目标定位方法及其装置、计算机可读存储介质和电子设备
CN109544503B (zh) * 2018-10-15 2020-12-01 北京达佳互联信息技术有限公司 图像处理方法、装置、电子设备及存储介质
CN109472220A (zh) * 2018-10-23 2019-03-15 广东电网有限责任公司 一种基于Faster R-CNN的变电站工人安全帽检测方法及其系统
CN109584266B (zh) * 2018-11-15 2023-06-09 腾讯科技(深圳)有限公司 一种目标检测方法及装置
CN109785333A (zh) * 2018-12-11 2019-05-21 华北水利水电大学 用于并联机器人视觉系统的目标检测方法及装置
CN111160242A (zh) * 2019-12-27 2020-05-15 上海眼控科技股份有限公司 图像目标检测方法、系统、电子终端及存储介质
CN111223128A (zh) * 2020-01-17 2020-06-02 深圳大学 目标跟踪方法、装置、设备及存储介质
CN112016569B (zh) * 2020-07-24 2024-08-20 驭势科技(浙江)有限公司 基于注意力机制的目标检测方法、网络、设备和存储介质
WO2022116104A1 (zh) * 2020-12-03 2022-06-09 华为技术有限公司 图像处理方法、装置、设备及存储介质
CN112949519B (zh) * 2021-03-09 2023-05-30 上海芯物科技有限公司 目标检测方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897390A (zh) * 2017-01-24 2017-06-27 北京大学 基于深度度量学习的目标精确检索方法
CN107067755A (zh) * 2017-04-28 2017-08-18 深圳市唯特视科技有限公司 一种基于计算机视觉自动校准交通监控相机的方法
CN107239731A (zh) * 2017-04-17 2017-10-10 浙江工业大学 一种基于Faster R‑CNN的手势检测和识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897390A (zh) * 2017-01-24 2017-06-27 北京大学 基于深度度量学习的目标精确检索方法
CN107239731A (zh) * 2017-04-17 2017-10-10 浙江工业大学 一种基于Faster R‑CNN的手势检测和识别方法
CN107067755A (zh) * 2017-04-28 2017-08-18 深圳市唯特视科技有限公司 一种基于计算机视觉自动校准交通监控相机的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Channel Pruning for Accelerating Very Deep Neural Network;Yihui He等;《arXiv.org》;20170821;第1-10页 *

Also Published As

Publication number Publication date
CN108010060A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN108010060B (zh) 目标检测方法及装置
CN109829501B (zh) 图像处理方法及装置、电子设备和存储介质
CN106651955B (zh) 图片中目标物的定位方法及装置
EP3163498B1 (en) Alarming method and device
CN109697734B (zh) 位姿估计方法及装置、电子设备和存储介质
CN109871896B (zh) 数据分类方法、装置、电子设备及存储介质
CN110287874B (zh) 目标追踪方法及装置、电子设备和存储介质
CN108256555B (zh) 图像内容识别方法、装置及终端
CN109446994B (zh) 手势关键点检测方法、装置、电子设备及存储介质
CN113538407B (zh) 锚点确定方法及装置、电子设备和存储介质
CN110009090B (zh) 神经网络训练与图像处理方法及装置
CN111310616A (zh) 图像处理方法及装置、电子设备和存储介质
CN107480665B (zh) 文字检测方法、装置及计算机可读存储介质
CN110619350B (zh) 图像检测方法、装置及存储介质
CN107784279B (zh) 目标跟踪方法及装置
CN105631803B (zh) 滤镜处理的方法和装置
CN106557759B (zh) 一种标志牌信息获取方法及装置
CN108062547B (zh) 文字检测方法及装置
CN107563994B (zh) 图像的显著性检测方法及装置
CN107944367B (zh) 人脸关键点检测方法及装置
CN105335684B (zh) 人脸检测方法及装置
CN110532956B (zh) 图像处理方法及装置、电子设备和存储介质
CN109034150B (zh) 图像处理方法及装置
CN109509195B (zh) 前景处理方法、装置、电子设备及存储介质
US20220383517A1 (en) Method and device for target tracking, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant