CN106845406A - 基于多任务级联卷积神经网络的头肩检测方法及装置 - Google Patents

基于多任务级联卷积神经网络的头肩检测方法及装置 Download PDF

Info

Publication number
CN106845406A
CN106845406A CN201710042383.2A CN201710042383A CN106845406A CN 106845406 A CN106845406 A CN 106845406A CN 201710042383 A CN201710042383 A CN 201710042383A CN 106845406 A CN106845406 A CN 106845406A
Authority
CN
China
Prior art keywords
head
shoulder
pondization
frame
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710042383.2A
Other languages
English (en)
Inventor
程炜
刘军
魏园波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Infinova Ltd
Original Assignee
Shenzhen Infinova Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Infinova Ltd filed Critical Shenzhen Infinova Ltd
Priority to CN201710042383.2A priority Critical patent/CN106845406A/zh
Publication of CN106845406A publication Critical patent/CN106845406A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于多任务级联卷积神经网络的头肩检测方法及装置,其中,该基于多任务级联卷积神经网络的头肩检测方法,包括如下步骤:对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像;根据第一级卷积神经网络依次对多个不同尺寸的目标图像第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及输出目标头肩框。本发明的技术方案能够提高头肩检测准确性和可靠性,适合行人数量的统计。

Description

基于多任务级联卷积神经网络的头肩检测方法及装置
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于多任务级联卷积神经网络的头肩检测方法及装置。
背景技术
随着计算机视觉和图像处理技术的快速发展,头肩检测通常用于人数统计及人形定位,在一定程度上可替代行人检测。目前,传统的头肩检测方法通常采用haar特征加adaboost级联,或者hog特征加svm分类器,但由于这些方法都是通过人工设计的特征提取低层次抽象特征,背景、光照、姿态等干扰很容易影响到头肩检测的效果,进一步导致头肩检测性能的严重降低,检测的精确性不能达到要求。
有鉴于此,有必要对上述头肩检测方法进行进一步的改进。
发明内容
为解决上述至少一技术问题,本发明的主要目的是提供一种基于多任务级联卷积神经网络的头肩检测方法。
为实现上述目的,本发明采用的一个技术方案为:提供一种基于多任务级联卷积神经网络的头肩检测方法,包括如下步骤:
S10、对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;
S20、根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
S30、根据第二级卷积神经网络依次对多个侯选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
S40、输出目标头肩框。
其中,所述步骤S30之后步骤S40之前,还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
其中,所述步骤S10,具体包括:
以设定的缩放因子对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
其中,所述步骤S20,具体包括:
根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
其中,所述步骤S30,具体包括:
根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
为实现上述目的,本发明采用的另一个技术方案为:提供一种基于多任务级联卷积神经网络的头肩检测装置,包括:
缩放模块,用于对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,以及根据多个目标图像建立多尺寸金字塔模型图像,所述目标图像包含有头肩框;
第一级卷积神经网络模块,用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
第二级卷积神经网络模块,用于根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
输出模块,用于输出目标头肩框。
其中,还包括第三级卷积神经网络模块,用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
其中,所述缩放模块具体用于,
以设定的缩放因子对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
其中,所述第一级卷积神经网络模块,具体用于,
依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
其中,所述第二级卷积神经网络模块,具体用于,
依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
本发明的技术方案主要通过对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;以及根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;然后根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,通过缩放图像和级联筛选符合要求的头肩框,从而可以提取出精确的头肩框,适合行人数量的统计。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明一实施例基于多任务级联卷积神经网络的头肩检测方法的结构示意图;
图2a为图1中第一级卷积神经网络卷积计算过程示意图;
图2b为图1中第二级卷积神经网络卷积计算过程示意图;
图2c为图1中第三级卷积神经网络卷积计算过程示意图;
图3为本发明一实施例基于多任务级联卷积神经网络的头肩检测装置的模块方框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请参照图1,在本发明实施例中,该基于多任务级联卷积神经网络的头肩检测方法,包括如下步骤:
S10、对输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;
S20、根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
S30、根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
S40、输出目标头肩框。
本实施例中,先采用对输入图像进行多级缩放处理,经处理结果为多个具有不同尺寸的目标图像,这些图标图像可以取相同的定点作为公共点,部分叠加在一起,形成多尺寸金字塔模型图像。应当指出的是,上述的目标图像中包含有头肩框,以方便下述的分析处理步骤;然后通过第一级卷积神经网络的卷积和池化操作,并根据设定的第一阈值对目标头肩框进行筛选,得到头肩置信度高的候选头肩框;在通过第二级卷积神经网络的卷积和池化操作,并根据设定的第二阈值对候选头肩框进行筛选,得到头肩置信度高的候选头肩框,最后输出该头肩框,如此,通过两级卷积神经网络卷积处理,能够提高头肩框检测的可靠性和准确性。
本发明的技术方案主要通过对输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;以及根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;然后根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,通过缩放图像和级联筛选符合要求的头肩框,从而可以提取出精确的头肩框,适合行人数量的统计。
请参照图1,在一些实施例中,所述步骤S30之后步骤S40之前,还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
请参照图2c,本实施例中,可以将候选头肩框尺寸归一化到48x48x3,依次输入到第三级卷积神经网络模块中,经过第三级卷积神经网络内部的一系列卷积和池化操作,输出长度为12的向量,分表表示头肩分类置信度,头肩框坐标。通过设定的阈值将头肩分类置信度低于阈值的头肩框去除,将剩下的头肩框作为输出。通过采用第三级卷积神经网络的卷积,可以对头肩框进行过滤处理,如此,以筛选出更为准确的头肩框信息。
在一些实施例中,所述步骤S10,具体包括:
以设定的缩放因子对输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
本实施例中,该缩放因子具体为0.7937,当然本实施例中,多级缩放处理时,还可以设定图像缩放尺寸阈值,当前图像小于阈值时,不再进行缩放处理。上述缩放因子0.7937同时兼顾了头肩检测的时间和精度,可以理解的,还可以选用其他的缩放因子,此处不作限制。
在一些实施例中,所述步骤S20,具体包括:
根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
请参照图2a,本实施例中,可以将多个尺寸的图像依次输入到第一级卷积神经网络模块,经过第一级卷积神经网络内部一系列卷积和池化操作,输出每个头肩框位置坐标以及相应的分类置信度,具体的,第一级卷积神经网络由3部分组成,分别为输入层,多个卷积层,输出层。输入层为输入不同尺寸的目标图像,是自适应输入尺寸。例如,输入图像的尺寸为(m,n,3),其中,m,n分别表示长乘宽,3表示选用3x3卷积核,经过10个3x3卷积核以及2x2最大值池化计算得到((m-2)/2,(m-2)/2,10),接下来经过16个3x3卷积核计算得到((m-2)/2-2,(m-2)/2-2,16),在接下来经过32个3x3卷积核得到((m-2)/2-4,(m-2)/2-4,32),最后得到((m-2)/2-4,(m-2)/2-4,2)和((m-2)/2-4,(m-2)/2-4,4),即为当前的所有头肩候选框的分类置信度和坐标;然后根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,得到多个候选头肩框。
在一些实施例中,所述步骤S30,具体包括:
根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
请参照图2b,本实施例中,可以将多个尺寸的图像依次输入到第二级卷积神经网络模块,经过第二级卷积神经网络内部一系列卷积和池化操作,输出每个头肩框位置坐标以及相应的分类置信度,具体的,第二级卷积神经网络由4部分组成,分别为输入层,多个卷积层,全连接层,输出层。输入层为目标头肩框并归一化到(24,24,3),经过28个3x3卷积核以及3x3最大值池化计算得到(11,11,28),接下来经过48个3x3卷积核以及3x3最大值池化计算得到(4,4,48),在接下来经过64个3x3卷积核得到128维全连接层,最后得到25维的输出向量,即为当前的所有头肩候选框的分类置信度、坐标和头肩轮廓关键点。然后根据分类置信度筛选出大于预设的第二置信度阈值的多个头肩框;以及采用非极大值抑制方法合并相邻两个重叠率大于30%的一头肩框,得到多个目标头肩框。
请参照图3,本实施例中,该基于多任务级联卷积神经网络的头肩检测装置,包括:
缩放模块10,用于对输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;
第一级卷积神经网络模块20,用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
第二级卷积神经网络模块30,用于根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
输出模块50,用于输出目标头肩框。
本实施例中,先通过缩放模块10,对输入图像进行多级缩放处理,经处理结果为多个具有不同尺寸的目标图像,这些图标图像可以取相同的定点作为公共点,部分叠加在一起,形成多尺寸金字塔模型图像。应当指出的是,上述的目标图像中包含有头肩框,以方便下述的分析处理步骤;然后通过第一级卷积神经网络模块,采用第一级卷积神经网络的卷积和池化操作,并根据设定的第一阈值对目标头肩框进行筛选,得到头肩置信度高的候选头肩框;在通过第二级卷积神经网络模块,采用第二级卷积神经网络的卷积和池化操作,并根据设定的第二阈值对候选头肩框进行筛选,得到头肩置信度高的候选头肩框,最后输出该头肩框,如此,通过两级卷积神经网络的卷积处理,能够提高头肩框检测的可靠性和准确性。
在一具体的实施例中,还包括第三级卷积神经网络模块40,用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
本实施例中,通过第三级卷积神经网络模块40,可以继续将目标头肩框尺寸归一化到48x48x3,依次输入到第三级卷积神经网络模块40,经过第三级卷积神经网络内部的一系列卷积和池化操作,输出长度为12的向量,分表表示头肩分类置信度,头肩框坐标。通过设定的阈值将头肩分类置信度低于阈值的头肩框去除,将剩下的头肩框作为输出。通过采用第三级卷积神经网络的卷积对头肩框进行处理,如此,以筛选出更为准确的头肩框信息。
在一具体的实施例中,所述缩放模块10具体用于,
以设定的缩放因子对输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
本实施例中,该该缩放因子为0.7937,当然本实施例中,多级缩放处理时,还可以设定图像缩放尺寸阈值,当前图像小于阈值时,不再进行缩放处理。上述缩放因子0.7937同时兼顾了头肩检测的时间和精度,可以理解的,还可以选用其他的缩放因子,此处不作限制。缩放模块10主要用于建立多尺寸金字塔模型图像。
在一具体的实施例中,所述第一级卷积神经网络模块20,具体用于,
根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
本实施例中,第一级卷积神经网络模块20,可以将多个尺寸的图像依次输入到第一级卷积神经网络模块20,经过第一卷积神经网络内部一系列卷积和池化操作,输出每个头肩框位置坐标以及相应的分类置信度,具体的,第一级卷积神经网络由3部分组成,分别为输入层,多个卷积层,输出层。输入层为输入不同尺寸的目标图像,是自适应输入尺寸,然后根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,得到多个候选头肩框。应该指出的,利用第一级卷积神经网络时需要对其进行训练,具体的,将训练集中所有图片缩放成预定大小,并为每个图片定义是否为头肩的标签信息,使用梯度下降法和反向传播算法进行训练。
在一具体的实施例中,所述第二级卷积神经网络模块30,具体用于,
根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
本实施例中,第二级卷积神经网络模块30可以将多个尺寸的图像依次输入到第二级卷积神经网络模块30,经过第二级卷积神经网络内部一系列卷积和池化操作,输出每个头肩框位置坐标以及相应的分类置信度,具体的,第二级卷积神经网络由4部分组成,分别为输入层,多个卷积层,全连接层,输出层。输入层为目标头肩框并归一化到(24,24,3),然后根据分类置信度筛选出大于预设的第二置信度阈值的多个头肩框;以及采用非极大值抑制方法合并相邻两个重叠率大于30%的一头肩框,得到多个目标头肩框。应该指出的,利用第二级卷积神经网络时需要对其进行训练,具体的,将第一级卷积神经网络误检的样本作为第二级卷积神经网络的输入,如果负样本数目低于某个阈值将进行负样本挖掘,并给每个正样本加上标签信息以及轮廓关键点信息,负样本只需要加上标签信息不需要轮廓关键点信息,同样采用梯度下降法和反向传播算法进行训练。上述的第三极卷积神经网络的训练和第二级卷积神经网络的训练类似,此处不再赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种基于多任务级联卷积神经网络的头肩检测方法,其特征在于,所述基于多任务级联卷积神经网络的头肩检测方法,包括如下步骤:
S10、对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;
S20、根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
S30、根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
S40、输出目标头肩框。
2.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法,其特征在于,所述步骤S30之后步骤S40之前,还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
3.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法,其特征在于,所述步骤S10,具体包括:
以设定的缩放因子对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
4.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法,其特征在于,所述步骤S20,具体包括:
根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
5.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法,其特征在于,所述步骤S30,具体包括:
根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
6.一种基于多任务级联卷积神经网络的头肩检测装置,其特征在于,所述基于多任务级联卷积神经网络的头肩检测装置,包括:
缩放模块,用于对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像,所述目标图像包含有头肩框;
第一级卷积神经网络模块,用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像中的头肩框进行第一次卷积及池化处理,并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框;
第二级卷积神经网络模块,用于根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理,并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框,以及
输出模块,用于输出目标头肩框。
7.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置,其特征在于,还包括第三级卷积神经网络模块,用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理,并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框,其中,第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。
8.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置,其特征在于,所述缩放模块具体用于,
以设定的缩放因子对每帧输入图像依次进行多级缩放处理,得到具有多个不同尺寸的目标图像。
9.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置,其特征在于,所述第一级卷积神经网络模块,具体用于,
根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理,以得到多个头肩框的位置坐标及对应的分类置信度;
根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于50%的一头肩框,形成候选头肩框。
10.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置,其特征在于,所述第二级卷积神经网络模块,具体用于,
根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理,以得到多个候选头肩框的位置坐标及对应的分类置信度,所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3;
根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框;以及
采用非极大值抑制方法合并相邻两个重叠率大于30%的一候选头肩框,形成目标头肩框。
CN201710042383.2A 2017-01-20 2017-01-20 基于多任务级联卷积神经网络的头肩检测方法及装置 Pending CN106845406A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710042383.2A CN106845406A (zh) 2017-01-20 2017-01-20 基于多任务级联卷积神经网络的头肩检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710042383.2A CN106845406A (zh) 2017-01-20 2017-01-20 基于多任务级联卷积神经网络的头肩检测方法及装置

Publications (1)

Publication Number Publication Date
CN106845406A true CN106845406A (zh) 2017-06-13

Family

ID=59119946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710042383.2A Pending CN106845406A (zh) 2017-01-20 2017-01-20 基于多任务级联卷积神经网络的头肩检测方法及装置

Country Status (1)

Country Link
CN (1) CN106845406A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330390A (zh) * 2017-06-26 2017-11-07 上海远洲核信软件科技股份有限公司 一种基于图像分析和深度学习的人数统计方法
CN107729895A (zh) * 2017-10-18 2018-02-23 吉林大学 一种智能车adas系统目标检测方法及装置
CN107886082A (zh) * 2017-11-24 2018-04-06 腾讯科技(深圳)有限公司 图像中数学公式检测方法、装置、计算机设备及存储介质
CN108010078A (zh) * 2017-11-29 2018-05-08 中国科学技术大学 一种基于三级卷积神经网络的物体抓取检测方法
CN108121931A (zh) * 2017-12-18 2018-06-05 广州市动景计算机科技有限公司 二维码数据处理方法、装置及移动终端
CN108280455A (zh) * 2018-01-19 2018-07-13 北京市商汤科技开发有限公司 人体关键点检测方法和装置、电子设备、程序和介质
CN108345832A (zh) * 2017-12-28 2018-07-31 新智数字科技有限公司 一种人脸检测的方法、装置及设备
CN108563998A (zh) * 2018-03-16 2018-09-21 新智认知数据服务有限公司 活体识别模型训练方法、活体检测方法及装置
CN108776805A (zh) * 2018-05-03 2018-11-09 北斗导航位置服务(北京)有限公司 一种建立图像分类模型、图像特征分类的方法及装置
CN108805016A (zh) * 2018-04-27 2018-11-13 新智数字科技有限公司 一种头肩区域检测方法及装置
CN108985148A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN108985147A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 目标检测方法及装置
CN108989677A (zh) * 2018-07-27 2018-12-11 上海与德科技有限公司 一种自动拍照方法、装置、服务器和存储介质
CN109002753A (zh) * 2018-06-01 2018-12-14 上海大学 一种基于卷积神经网络级联的大场景监控图像人脸检测方法
CN109165611A (zh) * 2018-08-31 2019-01-08 广州市派客朴食信息科技有限责任公司 一种基于机器视觉和神经网络的碗碟识别智能结算方法
CN109657591A (zh) * 2018-12-12 2019-04-19 东莞理工学院 基于级联卷积神经网络的面部识别方法及装置
CN109784296A (zh) * 2019-01-27 2019-05-21 武汉星巡智能科技有限公司 客车乘客数量统计方法、装置及计算机可读存储介质
CN109784293A (zh) * 2019-01-24 2019-05-21 苏州科达科技股份有限公司 多类目标对象检测方法、装置、电子设备、存储介质
CN110008900A (zh) * 2019-04-02 2019-07-12 北京市遥感信息研究所 一种由区域到目标的可见光遥感图像候选目标提取方法
CN110942012A (zh) * 2019-11-22 2020-03-31 上海眼控科技股份有限公司 图像特征提取方法、行人重识别方法、装置和计算机设备
CN111832559A (zh) * 2020-06-19 2020-10-27 浙江大华技术股份有限公司 目标检测方法及装置、存储介质、电子装置
CN112668358A (zh) * 2019-09-30 2021-04-16 广州慧睿思通科技股份有限公司 一种人脸识别方法、装置、系统及存储介质
CN112669452A (zh) * 2021-01-08 2021-04-16 天津大学 一种基于卷积神经网络多分支结构的物体定位方法
WO2022121075A1 (zh) * 2020-12-09 2022-06-16 中科视语(北京)科技有限公司 人体头肩区域的定位方法、定位装置和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161912A1 (en) * 2007-12-21 2009-06-25 Raviv Yatom method for object detection
CN105631519A (zh) * 2015-12-31 2016-06-01 北京工业大学 一种基于预决策的卷积神经网络加速方法及系统
CN105718868A (zh) * 2016-01-18 2016-06-29 中国科学院计算技术研究所 一种针对多姿态人脸的人脸检测系统及方法
CN105844234A (zh) * 2016-03-21 2016-08-10 商汤集团有限公司 一种基于头肩检测的人数统计的方法及设备
CN105868689A (zh) * 2016-02-16 2016-08-17 杭州景联文科技有限公司 一种基于级联卷积神经网络的人脸遮挡检测方法
CN106096670A (zh) * 2016-06-17 2016-11-09 北京市商汤科技开发有限公司 级联卷积神经网络训练和图像检测方法、装置及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161912A1 (en) * 2007-12-21 2009-06-25 Raviv Yatom method for object detection
CN105631519A (zh) * 2015-12-31 2016-06-01 北京工业大学 一种基于预决策的卷积神经网络加速方法及系统
CN105718868A (zh) * 2016-01-18 2016-06-29 中国科学院计算技术研究所 一种针对多姿态人脸的人脸检测系统及方法
CN105868689A (zh) * 2016-02-16 2016-08-17 杭州景联文科技有限公司 一种基于级联卷积神经网络的人脸遮挡检测方法
CN105844234A (zh) * 2016-03-21 2016-08-10 商汤集团有限公司 一种基于头肩检测的人数统计的方法及设备
CN106096670A (zh) * 2016-06-17 2016-11-09 北京市商汤科技开发有限公司 级联卷积神经网络训练和图像检测方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAOXIANG LI ETAL.: "A convolutional neural network cascade for face detection", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
KAIPENG ZHANG ETAL.: "Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
王梦来 等: "基于CNN的监控视频事件检测", 《自动化学报》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330390A (zh) * 2017-06-26 2017-11-07 上海远洲核信软件科技股份有限公司 一种基于图像分析和深度学习的人数统计方法
CN107729895A (zh) * 2017-10-18 2018-02-23 吉林大学 一种智能车adas系统目标检测方法及装置
CN107886082A (zh) * 2017-11-24 2018-04-06 腾讯科技(深圳)有限公司 图像中数学公式检测方法、装置、计算机设备及存储介质
CN107886082B (zh) * 2017-11-24 2023-07-04 腾讯科技(深圳)有限公司 图像中数学公式检测方法、装置、计算机设备及存储介质
CN108010078A (zh) * 2017-11-29 2018-05-08 中国科学技术大学 一种基于三级卷积神经网络的物体抓取检测方法
CN108010078B (zh) * 2017-11-29 2020-06-26 中国科学技术大学 一种基于三级卷积神经网络的物体抓取检测方法
CN108121931A (zh) * 2017-12-18 2018-06-05 广州市动景计算机科技有限公司 二维码数据处理方法、装置及移动终端
CN108121931B (zh) * 2017-12-18 2021-06-25 阿里巴巴(中国)有限公司 二维码数据处理方法、装置及移动终端
CN108345832A (zh) * 2017-12-28 2018-07-31 新智数字科技有限公司 一种人脸检测的方法、装置及设备
CN108280455A (zh) * 2018-01-19 2018-07-13 北京市商汤科技开发有限公司 人体关键点检测方法和装置、电子设备、程序和介质
CN108563998A (zh) * 2018-03-16 2018-09-21 新智认知数据服务有限公司 活体识别模型训练方法、活体检测方法及装置
CN108805016A (zh) * 2018-04-27 2018-11-13 新智数字科技有限公司 一种头肩区域检测方法及装置
CN108805016B (zh) * 2018-04-27 2022-02-08 新智数字科技有限公司 一种头肩区域检测方法及装置
CN108776805A (zh) * 2018-05-03 2018-11-09 北斗导航位置服务(北京)有限公司 一种建立图像分类模型、图像特征分类的方法及装置
CN108985148A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN108985147A (zh) * 2018-05-31 2018-12-11 成都通甲优博科技有限责任公司 目标检测方法及装置
CN108985148B (zh) * 2018-05-31 2022-05-03 成都通甲优博科技有限责任公司 一种手部关键点检测方法及装置
CN109002753B (zh) * 2018-06-01 2022-07-08 上海大学 一种基于卷积神经网络级联的大场景监控图像人脸检测方法
CN109002753A (zh) * 2018-06-01 2018-12-14 上海大学 一种基于卷积神经网络级联的大场景监控图像人脸检测方法
CN108989677A (zh) * 2018-07-27 2018-12-11 上海与德科技有限公司 一种自动拍照方法、装置、服务器和存储介质
CN109165611B (zh) * 2018-08-31 2020-03-24 广州市派客朴食信息科技有限责任公司 一种基于机器视觉和神经网络的碗碟识别智能结算方法
CN109165611A (zh) * 2018-08-31 2019-01-08 广州市派客朴食信息科技有限责任公司 一种基于机器视觉和神经网络的碗碟识别智能结算方法
CN109657591A (zh) * 2018-12-12 2019-04-19 东莞理工学院 基于级联卷积神经网络的面部识别方法及装置
CN109784293A (zh) * 2019-01-24 2019-05-21 苏州科达科技股份有限公司 多类目标对象检测方法、装置、电子设备、存储介质
CN109784296A (zh) * 2019-01-27 2019-05-21 武汉星巡智能科技有限公司 客车乘客数量统计方法、装置及计算机可读存储介质
CN110008900A (zh) * 2019-04-02 2019-07-12 北京市遥感信息研究所 一种由区域到目标的可见光遥感图像候选目标提取方法
CN110008900B (zh) * 2019-04-02 2023-12-12 北京市遥感信息研究所 一种由区域到目标的可见光遥感图像候选目标提取方法
CN112668358A (zh) * 2019-09-30 2021-04-16 广州慧睿思通科技股份有限公司 一种人脸识别方法、装置、系统及存储介质
CN110942012A (zh) * 2019-11-22 2020-03-31 上海眼控科技股份有限公司 图像特征提取方法、行人重识别方法、装置和计算机设备
CN111832559A (zh) * 2020-06-19 2020-10-27 浙江大华技术股份有限公司 目标检测方法及装置、存储介质、电子装置
WO2022121075A1 (zh) * 2020-12-09 2022-06-16 中科视语(北京)科技有限公司 人体头肩区域的定位方法、定位装置和电子设备
CN112669452A (zh) * 2021-01-08 2021-04-16 天津大学 一种基于卷积神经网络多分支结构的物体定位方法
CN112669452B (zh) * 2021-01-08 2022-07-29 天津大学 一种基于卷积神经网络多分支结构的物体定位方法

Similar Documents

Publication Publication Date Title
CN106845406A (zh) 基于多任务级联卷积神经网络的头肩检测方法及装置
CN109325954B (zh) 图像分割方法、装置及电子设备
CN111401177B (zh) 基于自适应时空注意力机制的端到端行为识别方法及系统
CN110738101B (zh) 行为识别方法、装置及计算机可读存储介质
Vig et al. Large-scale optimization of hierarchical features for saliency prediction in natural images
CN108664981A (zh) 显著图像提取方法及装置
Sharma et al. A static hand gesture and face recognition system for blind people
CN109685060A (zh) 图像处理方法和装置
WO2017129020A1 (zh) 视频中人体行为识别的方法、装置和计算机存储介质
CN110009556A (zh) 图像背景虚化方法、装置、存储介质及电子设备
CN105894464B (zh) 一种中值滤波图像处理方法和装置
CN112052834B (zh) 一种基于隐私保护的面部识别方法、装置及设备
CN107851195A (zh) 利用神经网络进行目标检测
CN108830199A (zh) 识别交通灯信号的方法、装置、可读介质及电子设备
CN105303163B (zh) 一种目标检测的方法及检测装置
CN107392214B (zh) 一种基于全卷积分裂网络的目标检测方法
CN106650615A (zh) 一种图像处理方法及终端
US10282601B2 (en) Electronic device and gesture recognition method applied therein
CN109472193A (zh) 人脸检测方法及装置
CN112883902A (zh) 视频检测方法、装置、电子设备及存储介质
CN112418360B (zh) 卷积神经网络的训练方法、行人属性识别方法及相关设备
CN107330360A (zh) 一种行人衣着颜色识别、行人检索方法和装置
CN111401278A (zh) 安全帽识别方法、装置、电子设备及存储介质
CN111738263A (zh) 目标检测方法、装置、电子设备及存储介质
CN109670517A (zh) 目标检测方法、装置、电子设备和目标检测模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613

RJ01 Rejection of invention patent application after publication