CN103324938A

CN103324938A - 训练姿态分类器及物体分类器、物体检测的方法及装置

Info

Publication number: CN103324938A
Application number: CN2012100772243A
Authority: CN
Inventors: 唐绍鹏; 王峰; 刘国翌; 张洪明; 曾炜
Original assignee: NEC China Co Ltd
Current assignee: NEC China Co Ltd
Priority date: 2012-03-21
Filing date: 2012-03-21
Publication date: 2013-09-25
Also published as: JP2013196683A; US20130251246A1

Abstract

本发明公开了一种训练姿态分类器及物体分类器、物体检测的方法及装置，属于图像处理领域。所述物体检测的方法包括：获取输入图像样本；根据所述姿态分类器对所述输入图像样本进行姿态估计处理；根据所述物体分类器对所述处理后的输入图像样本进行物体检测，获取物体的位置信息，其中所述物体为具有关节的物体。本发明可以对不同姿态的物体进行检测，从而提高了物体的检测率。

Description

训练姿态分类器及物体分类器、物体检测的方法及装置

技术领域

本发明涉及图像处理领域，特别涉及一种训练姿态分类器及物体分类器、物体检测的方法及装置。

背景技术

随着电子信息技术的进步和网络化的普及，人们在日常生活中越来越普遍地通过各种各样的图像采集设备，例如监控摄像机、数码摄像机、网络摄像机、数码相机、手机相机以及物联网中的视频传感器等来获取大量的图像和视频数据。面对如此大量的图像和视频数据，如何快速而智能地分析这些数据成为人们的迫切需求。

人体检测技术就是智能地分析这些数据的一个技术途径，如图1所示，对于一幅输入图像而言，人体检测的过程就是在图像中检测人体的存在，并且定位出人体的位置，将所述人体的位置作为检测结果输出。

现有的人体检测方法主要分为三类：

第一类是基于局部特征抽取的方法，该类方法在训练图片的子区域上计算特征，并且将不同子区域的特征按照某种方式排列组合起来作为人体的特征，根据这些人体的特征训练分类器。在检测的过程中，检测并计算输入图片的相应的子区域的特征，分类器对该计算出来的特征进行分类，实现人体的检测。

第二类是基于兴趣点的方法，该类方法首先在训练图片集上计算兴趣点，然后将以该点为中心的一定大小的块抽取出来，所有被抽取的块进行聚类操作生成词典。在检测的过程中，计算输入图像中相同的兴趣点，并且抽取块，然后在词典中查找相似的块，最后根据词典中的块投票决定输入图像中人体的位置，实现人体检测。

第三类是基于模板匹配的方法，该类方法要预先准备人体轮廓的模板。在检测的过程中，计算输入图像的边缘分布图像，在该边缘分布图像中搜索与人体轮廓最相似的区域，实现人体检测。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：虽然上述三类人体检测方法可以在一定程度上实现人体的检测，但是上述三类人体检测方法一般都是假设人体处于直立行走的状态，忽略了人体作为柔性物体的姿态变化，因此当人体的姿态变化时，现有的人体检测方法很难将人体和背景区域区分，从而降低了人体的检测率。

发明内容

为了提高物体的检测率，本发明实施例提供了一种训练姿态分类器及物体分类器、物体检测的方法及装置。所述技术方案如下：

一方面，本发明实施例提供了一种训练姿态分类器的方法，包括：

获取第一训练图像样本集；

获取所述第一训练图像样本集中指定个训练图像样本的实际姿态信息；

根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器。

在一种实施方式中，所述根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器包括：

构造损失函数，其中所述损失函数的输入为所述指定个训练图像样本及其实际姿态信息，所述损失函数的输出为所述指定个训练图像样本的实际姿态信息和估计姿态信息之间的差异值；

构造映射函数，其中所述映射函数的输入为所述指定个训练图像样本，所述映射函数的输出为所述指定个训练图像样本的估计姿态信息；

根据所述指定个训练图像样本及其实际姿态信息执行递归，获取使所述损失函数的输出值最小时的映射函数作为姿态分类器。

其中，优选的，所述损失函数为实际姿态信息和估计姿态信息的位置差异。

其中，优选的，所述损失函数为实际姿态信息和估计姿态信息的位置差异和方向差异。

另一方面，本发明实施例提供了一种利用上述方法生成的姿态分类器训练物体分类器的方法，所述物体为具有关节的物体，所述方法包括：

获取第二训练图像样本集；

根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理；

对所述姿态估计处理后的训练图像样本执行训练，生成物体分类器。

在一种实施方式中，所述根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理包括：

根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计，得到所述指定个训练图像样本的估计姿态信息；

根据所述指定个训练图像样本的估计姿态信息对每个具有关节的物体构造多个训练物体包围框，对所述多个训练物体包围框进行归一化处理，使不同物体的同一部分的训练物体包围框的大小和方向一致；

所述对所述姿态估计处理后的训练图像样本执行训练包括：

对所述归一化处理后的训练图像样本执行训练。

在另一实施方式中，所述得到所述指定个训练图像样本的估计姿态信息之后，进一步包括：

显示所述指定个训练图像样本的估计姿态信息。

再一种实施方式中，所述对所述多个训练物体包围框进行归一化处理之后，进一步包括：

显示所述归一化处理后的多个训练物体包围框。

再一种实施方式中，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：

头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；

所述根据所述指定个训练图像样本的估计姿态信息对每个具有关节的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理包括：

对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造3个物体包围框，对所述3个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点；

对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和右膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造5个物体包围框，对所述5个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

另一方面，本发明实施例提供了一种利用上述方法生成的姿态分类器及上述方法生成的物体分类器进行物体检测的方法，所述物体为具有关节的物体，所述方法包括：

获取输入图像样本；

根据所述姿态分类器对所述输入图像样本进行姿态估计处理；

根据所述物体分类器对所述处理后的输入图像样本进行物体检测，获取物体的位置信息。

在一种实施方式中，所述根据所述姿态分类器对所述输入图像样本进行姿态估计处理包括：

根据所述姿态分类器对所述输入图像样本进行姿态估计，得到所述输入图像样本的估计姿态信息；

根据所述输入图像样本的估计姿态信息对每个具有关节的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理，使不同物体的同一部分的训练物体包围框的大小和方向一致；

相应的，所述根据所述物体分类器对所述处理后的输入图像样本进行物体检测包括：

根据所述物体分类器对所述归一化处理后的输入图像样本进行物体检测。

在另一实施方式中，所述得到所述输入图像样本的估计姿态信息之后，进一步包括：

将所述输入图像样本的估计姿态信息进行显示。

再一种实施方式中，所述对所述多个物体包围框进行归一化处理之后，进一步包括：

将所述归一化处理后的多个物体包围框进行显示。

再一种实施方式中，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：

所述根据所述输入图像样本的估计姿态信息对每个具有关节的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理包括：

另一方面，本发明实施例提供了一种训练姿态分类器的装置，包括：

第一获取模块，用于获取第一训练图像样本集；

第二获取模块，用于获取所述第一训练图像样本集中指定个训练图像样本的实际姿态信息；

第一训练生成模块，用于根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器。

在一种实施方式中，所述第一训练生成模块包括：

第一构造单元，用于构造损失函数，其中所述损失函数的输入为所述指定个训练图像样本及其实际姿态信息，所述损失函数的输出为所述指定个训练图像样本的实际姿态信息和估计姿态信息之间的差异值；

第二构造单元，用于构造映射函数，其中所述映射函数的输入为所述指定个训练图像样本，所述映射函数的输出为所述指定个训练图像样本的估计姿态信息；

姿态分类器获取单元，用于根据所述指定个训练图像样本及其实际姿态信息执行递归，获取使所述损失函数的输出值最小时的映射函数作为姿态分类器。

另一方面，本发明实施例提供了一种利用上述装置生成的姿态分类器训练物体分类器的装置，所述物体为具有关节的物体，所述装置包括：

第三获取模块，用于获取第二训练图像样本集；

第一姿态估计模块，用于根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理；

第二训练生成模块，用于对所述姿态估计处理后的训练图像样本执行训练，生成物体分类器。

在一种实施方式中，所述第一姿态估计模块包括：

第一姿态估计单元，用于根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计，得到所述指定个训练图像样本的估计姿态信息；

第一构造处理单元，用于根据所述指定个训练图像样本的估计姿态信息对每个具有关节的物体构造多个训练物体包围框，对所述多个训练物体包围框进行归一化处理，使不同物体的同一部分的训练物体包围框的大小和方向一致；

所述第二训练生成模块包括：

训练单元，用于对所述归一化处理后的训练图像样本执行训练。

在另一种实施方式中，所述装置进一步包括：

第一图形用户界面，用于在所述得到所述指定个训练图像样本的估计姿态信息之后，显示所述指定个训练图像样本的估计姿态信息。

再一种实施方式中，所述装置进一步包括：

第二图像用户界面，用于在所述对所述多个训练物体包围框进行归一化处理之后，显示所述归一化处理后的多个训练物体包围框。

所述第一构造处理单元包括：

第一构造子单元，用于对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造3个物体包围框，对所述3个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

所述第一构造处理单元包括：

第二构造子单元，用于对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和右膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造5个物体包围框，对所述5个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

另一方面，本发明实施例提供了一种利用上述装置生成的姿态分类器及上述装置生成的物体分类器进行物体检测的装置，所述物体为具有关节的物体，所述装置包括：

第四获取模块，用于获取输入图像样本；

第二姿态估计模块，用于根据所述姿态分类器对所述输入图像样本进行姿态估计处理；

检测模块，用于根据所述物体分类器对所述处理后的输入图像样本进行物体检测，获取物体的位置信息。

在一种实施方式中，所述第二姿态估计模块包括：

第二姿态估计单元，用于根据所述姿态分类器对所述输入图像样本进行姿态估计，得到所述输入图像样本的估计姿态信息；

第二构造处理单元，用于根据所述输入图像样本的估计姿态信息对每个具有关节的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理，使不同物体的同一部分的训练物体包围框的大小和方向一致；

所述检测模块包括：

检测单元，用于根据所述物体分类器对所述归一化处理后的输入图像样本进行物体检测。

在另一实施方式中，所述装置进一步包括：

第三图形用户界面，用于在所述得到所述输入图像样本的估计姿态信息之后，将所述输入图像样本的估计姿态信息进行显示。

再一种实施方式中，所述装置进一步包括：

第四图形用户界面，用于在所述对所述多个物体包围框进行归一化处理之后，将所述归一化处理后的多个物体包围框进行显示。

所述第二构造处理单元包括：

第三构造子单元，用于对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造3个物体包围框，对所述3个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

所述第二构造处理单元包括：

第四构造子单元，用于对每个具有关节的物体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和右膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造5个物体包围框，对所述5个物体包围框进行旋转和缩放处理；其中所述物体结构特征点位于对应的所述物体包围框内。

本发明实施例提供的技术方案带来的有益效果是：采用递归方法对第一训练图像样本集中指定个训练图像样本进行训练，生成姿态分类器，然后根据所述姿态分类器在物体分类器的训练过程和物体检测过程中进行姿态估计，再构造物体包围框并进行归一化处理，从而消除了姿态对物体特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量，可以对不同姿态的具有关节的物体进行检测，从而提高了物体的检测率。

此外，采用递归方法生成的姿态分类器分别输出至训练物体分类器的过程和物体检测过程用于姿态估计，相对于传统的姿态估计的方法而言，降低了计算复杂度。

优选的，构造的损失函数考虑了方向上的差异，更有利于不同姿态物体的检测，提高了物体的检测率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种训练姿态分类器的方法实施例的流程图；

图2是本发明实施例提供的另一种训练姿态分类器的方法实施例的流程图；

图3是本发明实施例提供的训练图像样本特征提取示意图；

图4是本发明实施例提供的估计位置示意图；

图5是本发明实施例提供的一种训练物体分类器的方法实施例的流程图；

图6是本发明实施例提供的另一种训练物体分类器的方法实施例的流程图；

图7是本发明实施例提供的4个特征点的物体包围框示意图；

图8是本发明实施例提供的6个特征点的物体包围框示意图；

图9是本发明实施例提供的一种物体检测的方法实施例的流程图；

图10是本发明实施例提供的另一种物体检测的方法实施例的流程图；

图11为本发明实施例提供的本发明实施例和现有技术的ROC曲线示意图；

图12为本发明实施例提供的一种训练姿态分类器的装置实施例的结构示意图；

图13为本发明实施例提供的另一种训练姿态分类器的装置实施例的结构示意图；

图14为本发明实施例提供的一种训练物体分类器的装置实施例的结构示意图；

图15为本发明实施例提供的另一种训练物体分类器的装置实施例的结构示意图；

图16是本发明实施例提供的一种物体检测的装置实施例的结构示意图；

图17是本发明实施例提供的另一种物体检测的装置实施例的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

参考图1，图1是本发明实施例提供的一种训练姿态分类器的方法实施例的流程图；所述训练姿态分类器的方法包括：

S101：获取第一训练图像样本集。

S102：获取所述第一训练图像样本集中指定个训练图像样本的实际姿态信息。

S103：根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器。

本实施例中，获取第一训练图像样本集和所述第一训练图像样本集中指定个训练图像样本的实际姿态信息，根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器，使得该姿态分类器可以对不同姿态的物体进行检测，从而提高了物体的检测率。

本发明实施例中的物体具体为具有关节的物体，包括人体、机器人、猴子或狗等物体，但是并不局限于此，本实施例中具体以人体为例进行详细描述，参考图2，图2是本发明实施例提供的另一种训练姿态分类器的方法实施例的流程图；

所述训练姿态分类器的方法包括：

S201：获取第一训练图像样本集。

在训练姿态分类器的过程中，需要将多张图像样本作为训练图像样本执行训练过程，具体地，所述多张图像样本可以是一张张的图片，该图片中可以包含具有关节的物体，例如人体，也可以不包含人体。本发明实施例中，可以将多张训练图像样本以第一训练图像样本集的形式进行存储。

所述第一训练图像样本集中的所有训练图像样本可以是由图像采集设备在同一场景下获取的图像样本，也可以是由图像采集设备在不同场景下获取的图像样本，优选的，本发明实施例中需要多选择一些具有不同姿态人体的图像样本作为训练图像样本存储于所述第一训练图像样本集中，这样可以提高生成的姿态分类器的精确度。

S202：获取所述第一训练图像样本集中指定个训练图像样本的实际姿态信息。

本发明实施例中涉及的实际姿态信息是指人体各部分的位置信息，例如头部的位置信息、腰部的位置信息等；该人体各部分的位置信息可以表示人体各部分的具体位置。所述指定个训练图像样本可以是所述第一训练图像样本集中全部训练图像样本，也可以是所述第一训练图像样本集中部分训练图像样本，优选的，所述指定个训练图像样本为所述第一训练图像样本集中全部训练图像样本，这样可以提高生成的姿态分类器的精确度。

本步骤中，需要对所述指定个训练图像样本中的人体进行手工标注，得到所述指定个训练图像样本中人体的实际姿态信息。

具体地，所述人体各部分可以通过人体结构特征点的形式进行表示，该人体结构特征点是指能够反映人体结构的点，可以是一个点或多个点；优选的，所述人体结构特征点可以为4个特征点或6个特征点。当所述人体结构特征点为4个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；当所述人体结构特征点为6个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点。但是人体结构特征点并不局限于为4个特征点或6个特征点，在此不再赘述。

S203：构造损失函数，所述损失函数的输入为所述指定个训练图像样本及其实际姿态信息，所述损失函数的输出为所述指定个训练图像样本的实际姿态信息和估计姿态信息之间的差异值。

本发明实施例中，损失函数的输入包括所述指定个训练图像样本，具体为所述指定个训练图像样本的特征向量。参考图3，图3是本发明实施例提供的训练图像样本的特征向量提取示意图；假设训练图像样本为I，其特征向量为X，通过对训练图像样本I进行特征提取，得到特征向量X。其中训练图像样本的特征向量X可以描述了物体的模式信息，例如图像的颜色、灰度、纹理、梯度、形状等信息；在视频中所述训练图像样本的特征向量X还可以描述物体的运行信息。

优选的，所述训练图像样本的特征向量可以为HOG特征。其中HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子，HOG特征的提取方法使用了图像本身的梯度方向特征，是在一个网格密集的大小统一的方格单元上计算，最后将不同网格的特征串联起来作为训练图像样本的特征，而且为了提高精确度使用了重叠的局部对比度归一化的方法。HOG特征的提取方法与现有技术类似，在此不再赘述，可参见现有技术的相关描述。

所述损失函数可以有多种形式，例如，所述损失函数为实际姿态信息和估计姿态信息的位置差异，包括：

J^{'} (y, F (x)) = Σ_{i = 1}^{N} ψ (y_{i}, F (x_{i})) = Σ_{i = 1}^{N} {| | y_{i} - F (x_{i}) | |}^{2},

其中J′(y，F(x))为损失函数，F(x)为映射函数；y为所述指定个训练图像样本的实际姿态信息，ψ(y_i，F(x_i))为第i个训练图像样本的映射函数；y_i为第i个训练图像样本的实际姿态信息，x_i为第i个训练图像样本，F(x_i)为第i个训练图像样本的映射函数，N为训练图像样本总数。

该损失函数J′(y，F(x))并不局限于上述表达形式，在此不再赘述，只要能反映实际姿态信息与估计姿态信息之间位置差异的损失函数都在本发明实施例的保护范围之内。

另一实施方式中，优选的，所述损失函数为实际姿态信息和估计姿态信息的位置差异和方向差异，包括：

J (y, F (x)) = Σ_{i = 1}^{N} Σ_{j = 2}^{q} {{| | y_{i, 1} - g (x_{i}) | |}^{2} + α {| | (y_{i, j} - y_{i, 1}) - (F_{j} (x_{i}) - g (x_{i})) | |}^{2}},

其中J(y，F(x))为损失函数，y为所述指定个训练图像样本的实际姿态信息，F(x)为映射函数，y_i，1为第i张训练图像样本中根节点的实际位置，g(x_i)为第i张训练图像样本中根节点的估计位置；y_i，j为第i张训练图像样本中第j个人体结构特征点的实际位置，F_j(x_i)为第i张训练图像样本中第j个人体结构特征点的映射函数，N为训练图像样本总数，q为人体结构特征点总数，α为加权系数，且0＜α＜1。

损失函数J(y，F(x))中，以腰部中心位置点为根节点，根据所述腰部中心位置点和其他人体结构特征点构造中轴线作为实际姿态信息的中轴线，进而根据所述实际姿态信息的中轴线和相应的估计姿态信息的中轴线之间的向量来表示所述实际姿态信息和估计姿态信息的方向差异，如

本发明实施例中也可以通过实际姿态信息与估计姿态信息的中轴线之间的夹角来表示，在此不再赘述。

所述损失函数J(y，F(x))并不局限于上述表达形式，在此不再赘述，只要能反映实际姿态信息和估计姿态信息之间的位置差异和方向差异的损失函数都在本发明实施例的保护范围之内。

参考图4，图4是本发明实施例提供的估计位置示意图，对于损失函数J(y，F(x))而言，图4中估计2相比较估计1而言更有效，因为估计2的方向与实际位置的方向一致，这样对于特征提取也更有效。因此，在构造损失函数时考虑实际姿态信息与估计姿态信息之间的位置差异和方向差异可以有利于不同姿态人体的检测。

S204：构造映射函数，其中所述映射函数的输入为所述指定个训练图像样本，所述映射函数的输出为所述指定个训练图像样本的估计姿态信息。

本步骤中，首先从预设的弱映射函数池中选择使所述损失函数的输出值最小的弱映射函数，将所述弱映射函数作为初始映射函数，根据所述初始映射函数构造映射函数。

本发明实施例涉及的弱映射函数池为包含了多个弱映射函数的池子，所述弱映射函数池中的弱映射函数为根据经验构造的弱映射函数，优选的，所述弱映射函数池中包含3025个弱映射函数。其中每个弱映射函数对应一个子窗口，则优选的，本发明实施例中所述若映射函数池中包含3025个子窗口。

根据损失函数的表达式可知，所述损失函数为映射函数F(x)的函数，将所述弱映射函数池中的每个弱映射函数分别代入所述损失函数中，根据所述指定个训练图像样本及实际姿态信息计算所述损失函数的输出值，获取使所述损失函数的输出值最小的弱映射函数，将所述使所述损失函数的输出值最小的弱映射函数作为初始映射函数F₀(x)。

根据初始映射函数F₀(x)构造映射函数F(x)，例如，

其中所述映射函数F(x)的输入为所述指定个训练图像样本，所述映射函数的输出为所述指定个训练图像样本的估计姿态信息；λ_t为第t次递归时的最优权值，h_t(x)为第t次递归时的最优弱映射函数，T为递归总次数。

S205：根据所述指定个训练图像样本及其实际姿态信息执行递归，获取使所述损失函数的输出值最小时的映射函数作为姿态分类器。

本发明实施例中求解F(x)的过程为Regression(递归)的过程，每次递归时，根据预设的公式从弱映射函数池中选择最优弱映射函数h_t(x)，根据所述h_t(x)计算此次递归时的最优权值λ_t，得到此次递归的映射函数F(x)；随着逐次递归，映射函数对应的损失函数的输出值递减，当得到的映射函数F(x)收敛时，停止递归，此时映射函数F(x)对应的所述损失函数的输出值最小，将使所述损失函数的输出值最小的映射函数作为姿态分类器。

判断映射函数是否收敛的过程，具体包括：假如第T次递归得到的映射函数F(x)收敛，计算第T次递归的映射函数F(x)对应的损失函数的输出值为

第(T-1)次递归的映射函数F(x)对应的损失函数的输出值为

则预设阈值，其中所述预设阈值可以为0.01，但是并不局限于此。

损失函数表示人体的实际姿态信息与估计姿态信息(即映射函数)之间的差异程度，本实施例中可以利用所述损失函数计算姿态分类器，即将损失函数的值最小时对应的映射函数作为姿态分类器，也就是说姿态分类器为最接近实际姿态信息的估计姿态信息。

下面以损失函数J(y，F(x))为例来描述获取姿态分类器的计算过程。

对于单个训练图像样本而言，损失函数为：

ψ = Σ_{j = 1}^{j = q} {{| | P_{root, j} - P_{root, j}^{'} | |}^{2} + α {| | (P_{j} - P_{root, j}) - (P_{j}^{'} - P_{root, j}^{'}) | |}^{2}}

其中q为人体结构特征点总数，P_j为第j个人体结构特征点的实际位置，P′_j为第j个人体结构特征点的估计位置；P_root，j为P_j的根节点的实际位置，其中所述根节点优选为腰部中心位置点；P′_root，j为P_j的根节点的估计位置；(P_root，j，P_j)为实际姿态信息的中轴线。

对于整个第一训练图像样本集而言，损失函数为：

J (y, F (x)) = Σ_{i = 1}^{N} ψ = Σ_{i = 1}^{N} Σ_{j = 2}^{q} {{| | y_{i, 1} - g (x_{i}) | |}^{2} + α {| | (y_{i, j} - y_{i, 1}) - (F_{j} (x_{i}) - g (x_{i})) | |}^{2}}

= Σ_{i = 1}^{N} Σ_{j = 2}^{q} {| | y_{i, 1} - g (x_{i}) | |}^{2} + Σ_{i = 1}^{N} Σ_{j = 2}^{q} α {| | (y_{i, j} - y_{i, 1}) - (F_{j} (x_{i}) - g (x_{i})) | |}^{2}

= q Σ_{i = 1}^{N} {| | y_{i, 1} - g (x_{i}) | |}^{2} + α Σ_{i = 1}^{N} Σ_{j = 2}^{q} {| | (y_{i, j} - y_{i, 1}) - (F_{j} (x_{i}) - g (x_{i})) | |}^{2}

= q Σ_{i = 1}^{N} {| | y_{i, 1} - g (x_{i}) | |}^{2} + α Σ_{i = 1}^{N} Σ_{j = 2}^{q} {| | u_{i, j} - k_{j} (x_{i}) | |}^{2}

= q Σ_{i = 1}^{N} {|| y_{i, 1} -g (x_{i}) ||}^{2} + α Σ_{i = 1}^{N} {| | u_{i} - k (x_{i}) | |}^{2}

= M (k (x))

所述J(y，F(x))为所述第一训练图像样本集中全部训练图像样本的损失函数，在构造J(y，F(x))时，规定所有人体包围框的中轴线的起始点为同一特征点，定义所述同一特征点为根节点，优选的，所述根节点为腰部中心位置点，因此，损失函数J(y，F(x))中j的起始点为2，不包括根节点。

其中，k_j(x_i)＝F_j(x_i)-g(x_i)，u_i，j＝y_i，j-y_i，1；

对于上述J(y，F(x))而言，通过计算k(x)和g(x)便可以得到F(x)。

对于g(x)，可以采用SVR(Support Vector Regression，支持向量递归)和PCA(PrincipalComponent Analysis，主元成分分析)的方法进行求解，具体为：

1a)输入：

{y_{i}, x_{i}}_{1}^{N}, y_{i} &Element; R^{2 q}, x_{i} &Element; R^{d};

2a)计算r_i＝p(y_i，1)：R²→R¹，用PCA求解；

3a)通过最小化

\frac{1}{2} {| | w | |}^{2} + C Σ_{n = 1}^{N} {| r_{i} - g^{'} (x_{i}) |}_{ξ}

计算w，其中

g^{'} (x) = Σ_{n = 1}^{N} w_{n} k (x, x_{n}),

k(x，x_n)为核函数。

4a)输出：g(x)＝p^-1(g′(x))：R^d→R²

其中，R表示实数域，x_i表示第i个训练图像样本，y_i表示第j个人体结构特征点的位置；r_i表示第i个训练图像样本的根节点的位置，y_i，1为第i张训练图像样本中根节点的实际位置；w为向量，表示方程的系数，如z＝ax+by，则w＝(a，b)；C为比例系数，N为训练图像样本总数，g′(x_i)表示第i个训练图像样本中根节点的估计位置，ξ表示截断系数。

对于k(x)，采用boosting方法进行计算，具体为：

1b)输入：

{y_{i}, x_{i}}_{1}^{N}, y_{i} &Element; R^{2 q}, x_{i} &Element; R^{d};

2b)计算

u_{i} = {(y_{i, j} - y_{i, 1})}_{j = 2}^{q} &Element; R^{2 q - 2};

3b)设置k(x)＝0；

4b)循环：t：1→T，计算k_t(x)＝λ_th_t(x)，k(x)＝k(x)+k_t(x)，检查k(x)的收敛性，当k(x)收敛时，结束循环，其中，λ_t为第t次递归时的最优权值，h_t(x)为第t次递归时的最优弱映射函数，T为递归总次数。

其中

λ_{t} = \frac{Σ_{i = 1}^{N} {(u_{i} - k (x_{i})) (h (x_{i}))}^{T}}{Σ_{i = 1}^{N} {| | h (x_{i}) | |}^{2}},

h_{t} = \underset{h}{\arg \max} {α \frac{{(Σ_{i = 1}^{N} {(u_{i} - k (x_{i})) (h (x_{i}))}^{T})}^{2}}{(Σ_{i = 1}^{N} {| | h (x_{i}) | |}^{2})} \frac{1}{q Σ_{i = 1}^{N} {| | y_{i, 1} - g (x_{i}) | |}^{2} + α Σ_{i - 1}^{N} {| | u_{i} - k (x_{i}) | |}^{2}}}

= \underset{h}{\arg \max} \frac{| Σ_{i = 1}^{N} {(u_{i} - k (x_{i})) (h (x_{i}))}^{T} |}{\sqrt{(Σ_{i = 1}^{N} {| | h (x_{i}) | |}^{2})}}

= \underset{h}{\arg \max} ϵ (h)

5b)输出：

F (x) = J (g (x), k (x)) : R^{d} &RightArrow; R^{2 q};

当k(x)收敛时，M(k(x))的值最小，此时对应的映射函数F(x)即为姿态分类器。

计算k(x)的过程是一个递归的过程，在每一轮的递归中，最优的弱映射函数h_t(x)从映射函数池中获取。

在生成所述姿态分类器后，还可以对所述姿态分类器进行存储，以备后用。具体地，本实施例中生成的姿态分类器还可以用于后续的训练物体分类器的过程和物体检测过程中实现姿态估计。

本实施例中S203和S205的实现过程具体实现根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，从而生成姿态分类器。

本实施例中，获取第一训练图像样本集和所述第一训练图像样本集中指定个训练图像样本的实际姿态信息，根据所述指定个训练图像样本及其实际姿态信息构造映射函数和损失函数，根据所述损失函数的输出值调整所述映射函数直至所述损失函数的输出值最小，获取使所述损失函数的输出值最小时的映射函数作为姿态分类器，实现递归训练过程，使得该姿态分类器可以对不同姿态的具有关节的物体进行检测，从而提高了物体的检测率。

此外采用Regression方法生成的姿态分类器分别输出至训练物体分类器的过程和物体检测过程用于姿态估计，即本实施例采用了多输出Regression的方法，相对于传统的姿态估计的方法而言，降低了计算复杂度。本实施例构造的损失函数考虑了方向上的差异，更有利于不同姿态物体的检测，提高了物体的检测率。

参考图5，图5是本发明实施例提供的一种训练物体分类器的方法实施例的流程图；所述物体为具有关节的物体，例如人体、机器人、猴子或狗等物体，但是并不局限于此；本实施例中采用的姿态分类器为上述实施例中生成的姿态分类器。

所述训练物体分类器的方法包括：

S501：获取第二训练图像样本集。

S502：根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理。

S503：对所述姿态估计处理后的训练图像样本执行训练，生成物体分类器。

本实施例中，根据姿态分类器对第二训练图像样本集中指定个训练图像样本进行姿态估计处理，然后对所述姿态估计处理后的训练图像样本执行训练后生成物体分类器，从而使得训练生成的物体分类器消除了姿态对物体特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量，可以用于对不同姿态的具有关节的物体进行检测，从而提高了物体的检测率。

本发明实施例中所述物体具体为具有关节的物体，包括人体、机器人、猴子或狗等物体，但是并不局限于此，本实施例中具体以人体为例进行详细描述，参考图6，图6是本发明实施例提供的另一种训练物体分类器的方法实施例的流程图；本实施例中采用的姿态分类器为上述实施例中生成的姿态分类器。

所述训练物体分类器的方法包括：

S601：获取第二训练图像样本集。

在训练物体分类器的过程中，需要将多张图像样本作为训练图像样本执行训练过程，具体地，所述多张图像样本可以是一张张的图片，该图片中可以包含具有关节的物体，例如人体，也可以不包含人体。本发明实施例中，将多张训练图像样本以第二训练图像样本集的形式进行存储。

所述第二训练图像样本集中的所有训练图像样本可以是由图像采集设备在同一场景下获取的图像样本，也可以是由图像采集设备在不同场景下获取的图像样本。

S602：根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计，得到所述指定个训练图像样本的估计姿态信息。

所述指定个训练图像样本可以是所述第二训练图像样本集中全部训练图像样本，也可以是所述第二训练图像样本集中部分训练图像样本，优选的，所述指定个训练图像样本为所述第二训练图像样本集中全部训练图像样本，这样可以提高生成的物体分类器的精确度。

本发明实施例中涉及的估计姿态信息为人体各部分的估计位置信息，具体可以为训练人体结构特征点的位置信息。所述训练人体特征点可以为一个点或多个点，优选的，所述人体结构特征点可以为4个特征点或6个特征点，具体地，当所述人体结构特征点为4个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；当所述人体结构特征点为6个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点。

在另一实施方式中，还可以在所述得到所述指定个训练图像样本的估计姿态信息之后，显示所述指定个训练图像样本的估计姿态信息，具体的，显示所述指定个训练图像样本的人体结构特征点的位置信息。

S603：根据所述指定个训练图像样本的估计姿态信息对每个人体构造多个训练人体包围框，对所述多个训练人体包围框进行归一化处理，使不同人体的同一部分的训练人体包围框的大小和方向一致。

此步骤中，所述估计姿态信息具体为人体结构特征点的位置信息，则根据所述人体结构特征点的位置信息对每个人体构造多个训练人体包围框；优选的，将腰部中心位置点作为根节点构造人体包围框，但不局限于此。

具体地，当所述训练人体结构特征点为4个特征点时，对每个人体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造3个人体包围框，如图7所示，图7是本发明实施例提供的4个特征点的人体包围框示意图。

构造完3个人体包围框后，对所述3个人体包围框进行旋转和缩放处理，即进行归一化处理，使不同人体的同一部分的人体包围框的大小和方向一致；其中所述人体结构特征点位于对应的所述人体包围框内。

在另一实施方式中，当所述训练人体结构特征点为6个特征点时，对每个人体分别以头部中心位置点和腰部中心位置点所在的直线为中轴线、以腰部中心位置点和左膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和右膝盖中心位置点所在的直线为中轴线、以腰部中心位置点和左脚中心位置点所在的直线为中轴线，和，以腰部中心位置点和右脚中心位置点所在的直线为中轴线构造5个人体包围框，如图8所示，图8是本发明实施例提供的6个特征点的人体包围框示意图。

构造完5个人体包围框后，对所述5个人体包围框进行旋转和缩放处理，即进行归一化处理，使不同人体的同一部分的人体包围框的大小和方向一致；其中所述人体结构特征点位于对应的所述人体包围框内。

本实施例中S602和S603的实现过程具体实现根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理的过程。

在另一实施方式中，在所述对所述多个训练物体包围框进行归一化处理之后，显示所述归一化处理后的多个训练物体包围框，具体可以显示进行旋转和缩放处理后的多个训练物体包围框，如图7和图8所示。

S604：对所述归一化处理后的训练图像样本执行训练，生成物体分类器。

此步骤中，所述对所述归一化处理后的训练图像样本执行训练，具体为：计算所述归一化处理后的训练图像样本的人体包围框中的特征向量，对所述特征向量执行训练，这样可以消除人体的姿态对于特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量；其中所述特征向量为HOG向量。

优选的，所述物体分类器包括：SVM(Support Vector Machine，支持向量机)物体分类器，具体可以为SVM人体分类器，但是并不局限于此。

可选的，在计算出所述归一化处理后的训练图像样本的人体包围框中的特征向量后，可以对所述特征向量进行存储，以备后用。具体地，本实施例中生成的物体分类器可以用于后续的物体检测过程中实现物体的检测。

可选的，在获取所述SVM物体分类器后，还可以存储所述SVM物体分类器，以备后用。

参考图9，图9是本发明实施例提供的一种物体检测的方法实施例的流程图；本发明实施例中的物体具体为具有关节的物体，例如人体、机器人、猴子或狗等物体，但是并不局限于此，本实施例中采用的姿态分类器和物体分类器为上述实施例中生成的姿态分类器和物体分类器。

所述物体检测的方法包括：

S901：获取输入图像样本。

S902：根据所述姿态分类器对所述输入图像样本进行姿态估计处理。

S903：根据所述物体分类器对所述处理后的输入图像样本进行物体检测，获取物体的位置信息。

本实施例中，根据姿态分类器对输入图像样本进行姿态估计处理，这样可以消除物体的姿态对于特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量；然后根据基于姿态估计生成的物体分类器对所述处理后的的输入图像样本进行物体检测，从而获取物体的位置信息，使得在物体检测的过程中充分考虑了物体的姿态信息，可以对不同姿态的具有关节的物体进行检测，从而提高了物体的检测率。

本发明实施例中所述物体具体为具有关节的物体，包括人体、机器人、猴子或狗等物体，但是并不局限于此，本实施例中具体以人体为例进行详细描述，参考图10，图10是本发明实施例提供的另一种物体检测的方法实施例的流程图；本实施例中采用的姿态分类器和物体分类器为上述实施例中生成的姿态分类器和物体分类器。

S1001：获取输入图像样本。

在进行物体检测的过程中，需要对输入图像样本进行检测，检测所述输入图像样本中是否存在具有关节的物体，例如人体，所述输入图像样本可以是一张图片，该图片中可以包含一个或多个人体，也可以不包含人体，对此并不做具体限定。

S1002：根据所述姿态分类器对所述输入图像样本进行姿态估计，得到所述输入图像样本的估计姿态信息。

所述估计姿态信息具体为人体结构特征点的位置信息，优选的，所述人体结构特征点可以为4个特征点或6个特征点，具体地，当所述人体结构特征点为4个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；当所述人体结构特征点为6个特征点时，所述人体结构特征点包括：头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点。

S1003：根据所述输入图像样本的估计姿态信息对每个人体构造多个人体包围框，对所述多个人体包围框进行归一化处理，使不同人体的同一部分的人体包围框的大小和方向一致。

S1003与S603的处理过程类似，所不同的就是S603是根据所述第二训练图像样本集中的指定个图像样本的估计姿态信息进行相应处理，S1003是对所述输入图像样本的估计姿态信息进行相应处理，在此不再赘述，具体可参见S603的相关描述。

本实施例中S1002和S1003的实现过程具体实现根据所述姿态分类器对所述输入图像样本进行姿态估计处理的过程。

S1004：根据所述物体分类器对所述归一化处理后的输入图像样本进行物体检测，获取物体的位置信息。

此步骤中，所述根据所述物体分类器对所述归一化处理后的输入图像进行人体检测，具体为：计算所述归一化处理后的输入图像样本的人体包围框中的特征向量，根据所述物体分类器，具体为人体分类器对所述输入图像样本的人体包围框中的特征向量进行人体检测，这样可以消除人体的姿态对于特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量；其中所述特征向量为HOG向量。

ROC曲线(receiver operating characteristic curve，受试者工作特征曲线)反映了系统的检测率和误检率之间的关系，其中，检测率＝正确检测到的目标物体的数目/测试集中的目标物体的总数目，误检率＝错误检测到的目标物体的数目/测试集中所有扫描窗口的总数目；本实施例所述物体检测方法的ROC曲线如图11所示，图11为本发明实施例提供的本发明实施例和现有技术的ROC曲线示意图。从图11可以看出，本发明实施例所述物体检测方法的ROC曲线明显优于现有技术中的物体检测方法。

本实施例中，根据姿态分类器对输入图像样本进行姿态估计处理，这样可以消除物体的姿态对于特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量；然后根据基于姿态估计生成的物体分类器对所述处理后的的输入图像样本进行物体检测，从而获取物体的位置信息，使得在物体检测的过程中充分考虑了具有关节的物体的姿态信息，可以对不同姿态的具有关节的物体进行检测，从而提高了物体的检测率。

参考图12，图12为本发明实施例提供的一种训练姿态分类器的装置实施例的结构示意图；所述训练姿态分类器的装置包括：

第一获取模块1201，用于获取第一训练图像样本集。

第二获取模块1202，用于获取所述第一训练图像样本集中指定个训练图像样本的实际姿态信息。

第一训练生成模块1203，用于根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器。

参见图13，在一种实施方式下，所述第一训练生成模块1203可以包括：

第一构造单元1203a，用于构造损失函数，其中所述损失函数的输入为所述指定个训练图像样本及其实际姿态信息，所述损失函数的输出为所述指定个训练图像样本的实际姿态信息和估计姿态信息之间的差异值。

第二构造单元1203b，用于构造映射函数，其中所述映射函数的输入为所述指定个训练图像样本，所述映射函数的输出为所述指定个训练图像样本的估计姿态信息。

姿态分类器获取单元1203c，用于根据所述指定个训练图像样本及其实际姿态信息执行递归，获取使所述损失函数的输出值最小时的映射函数作为姿态分类器。

其中，所述损失函数为实际姿态信息和估计姿态信息的位置差异。

或者，所述损失函数为实际姿态信息和估计姿态信息的位置差异和方向差异。

此外采用Regression方法生成的姿态分类器分别输出至训练物体分类器的过程和物体检测过程用于姿态估计，即本实施例采用了多输出Regression的方法，相对于传统的姿态估计的方法而言，降低了计算复杂度。本实施例构造的损失函数考虑了方向上的差异，更有利于不同姿态具有关节的物体的检测，提高了物体的检测率。

本发明实施例中的物体具体为具有关节的物体，包括人体、机器人、猴子或狗等物体，但是并不局限于此，参考图14，图14为本发明实施例提供的一种训练物体分类器的装置实施例的结构示意图；本实施例中所述训练物体分类器的装置采用上述装置实施例生成的姿态分类器。

所述训练物体分类器的装置包括：

第三获取模块1401，用于获取第二训练图像样本集。

第一姿态估计模块1402，用于根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理。

第二训练生成模块1403，用于对所述姿态估计处理后的训练图像样本执行训练，生成物体分类器。

参见图15，在一种实施方式下，所述第一姿态估计模块1402包括：

第一姿态估计单元1402a，用于根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计，得到所述指定个训练图像样本的估计姿态信息。

第一构造处理单元1402b，用于根据所述指定个训练图像样本的估计姿态信息对每个具有关节的物体构造多个训练物体包围框，对所述多个训练物体包围框进行归一化处理，使不同物体的同一部分的训练物体包围框的大小和方向一致。

相应的，所述第二训练生成模块1403包括：

训练单元1403a，用于对所述归一化处理后的训练图像样本执行训练。

在另一实施方式下，所述装置进一步包括：

第一图形用户界面(GUI，Graphical User Interface)，用于在所述得到所述指定个训练图像样本的估计姿态信息之后，显示所述指定个训练图像样本的估计姿态信息。

在另一实施方式下，所述装置进一步包括：

在另一实施方式下，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；

所述第一构造处理单元1402b包括：

在另一实施方式下，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点；

所述第一构造处理单元1402b包括：

本发明实施例中的物体具体为具有关节的物体，包括人体、机器人、猴子或狗等物体，但是并不局限于此，参考图16，图16是本发明实施例提供的一种物体检测的装置实施例的结构示意图；本实施例中所述物体检测的装置采用上述装置实施例中生成的姿态分类器和物体分类器。

所述物体检测的装置包括：

第四获取模块1601，用于获取输入图像样本。

第二姿态估计模块1602，用于根据所述姿态分类器对所述输入图像样本进行姿态估计处理。

检测模块1603，用于根据所述物体分类器对所述处理后的输入图像样本进行物体检测，获取物体的位置信息。

参见图17，在一种实施方式下，所述第二姿态估计模块1602包括：

第二姿态估计单元1602a，用于根据所述姿态分类器对所述输入图像样本进行姿态估计，得到所述输入图像样本的估计姿态信息。

第二构造处理单元1602b，用于根据所述输入图像样本的估计姿态信息对每个据有关街的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理，使不同物体的同一部分的物体包围框的大小和方向一致。

相应的，所述检测模块1603包括：

检测单元1603a，用于根据所述物体分类器对所述归一化处理后的输入图像样本进行物体检测。

在另一实施方式下，所述装置进一步包括：

在另一实施方式下，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：头部中心位置点、腰部中心位置点、左脚中心位置点和右脚中心位置点；

所述第二构造处理单元1602b包括：

在另一实施方式下，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：头部中心位置点、腰部中心位置点、左膝盖中心位置点、右膝盖中心位置点、左脚中心位置点和右脚中心位置点；

所述第二构造处理单元1602b包括：

本实施例中，根据姿态分类器对输入图像样本进行姿态估计处理，这样可以消除物体的姿态对于特征计算的影响，使同一类别的物体即使在不同的姿态下也能得到一致的特征向量；然后根据基于姿态估计生成的物体分类器对所述处理后的的输入图像样本进行物体检测，从而获取物体的位置信息，使得在物体检测的过程中充分考虑了物体的姿态信息，可以对不同姿态的物体进行检测，从而提高了物体的检测率。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种训练姿态分类器的方法，其特征在于，包括：

获取第一训练图像样本集；

2.根据权利要求1所述的方法，其特征在于，所述根据所述指定个训练图像样本及其实际姿态信息执行递归训练过程，生成姿态分类器包括：

3.根据权利要求2所述的方法，其特征在于，所述损失函数为实际姿态信息和估计姿态信息的位置差异。

4.根据权利要求2所述的方法，其特征在于，所述损失函数为实际姿态信息和估计姿态信息的位置差异和方向差异。

5.一种利用权利要求1-4任一项方法生成的姿态分类器训练物体分类器的方法，其特征在于，所述物体为具有关节的物体，所述方法包括：

获取第二训练图像样本集；

6.根据权利要求5所述的方法，其特征在于，所述根据所述姿态分类器对所述第二训练图像样本集中指定个训练图像样本进行姿态估计处理包括：

所述对所述姿态估计处理后的训练图像样本执行训练包括：

对所述归一化处理后的训练图像样本执行训练。

7.根据权利要求6所述的方法，其特征在于，所述得到所述指定个训练图像样本的估计姿态信息之后，进一步包括：

显示所述指定个训练图像样本的估计姿态信息。

8.根据权利要求6所述的方法，其特征在于，所述对所述多个训练物体包围框进行归一化处理之后，进一步包括：

显示所述归一化处理后的多个训练物体包围框。

9.根据权利要求5-8任一项所述的方法，其特征在于，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：

10.根据权利要求5-8任一项所述的方法，其特征在于，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：

11.一种利用权利要求1-4任一项方法生成的姿态分类器及权利要求5-10任一项方法生成的物体分类器进行物体检测的方法，其特征在于，所述物体为具有关节的物体，所述方法包括：

获取输入图像样本；

12.根据权利要求11所述的方法，其特征在于，所述根据所述姿态分类器对所述输入图像样本进行姿态估计处理包括：

根据所述输入图像样本的估计姿态信息对每个具有关节的物体构造多个物体包围框，对所述多个物体包围框进行归一化处理，使不同物体的同一部分的物体包围框的大小和方向一致；

13.根据权利要求12所述的方法，其特征在于，所述得到所述输入图像样本的估计姿态信息之后，进一步包括：

将所述输入图像样本的估计姿态信息进行显示。

14.根据权利要求12所述的方法，其特征在于，所述对所述多个物体包围框进行归一化处理之后，进一步包括：

将所述归一化处理后的多个物体包围框进行显示。

15.根据权利要求12-14任一项所述的方法，其特征在于，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：

16.根据权利要求12-14任一项所述的方法，其特征在于，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：

17.一种训练姿态分类器的装置，其特征在于，包括：

第一获取模块，用于获取第一训练图像样本集；

18.根据权利要求17所述的装置，其特征在于，所述第一训练生成模块包括：

19.根据权利要求18所述的装置，其特征在于，所述损失函数为实际姿态信息和估计姿态信息的位置差异。

20.根据权利要求18所述的装置，其特征在于，所述损失函数为实际姿态信息和估计姿态信息的位置差异和方向差异。

21.一种利用权利要求17-20任一项装置生成的姿态分类器训练物体分类器的装置，其特征在于，所述物体为具有关节的物体，所述装置包括：

第三获取模块，用于获取第二训练图像样本集；

22.根据权利要求21所述的装置，其特征在于，所述第一姿态估计模块包括：

所述第二训练生成模块包括：

23.根据权利要求22所述的装置，其特征在于，进一步包括：

24.根据权利要求22所述的装置，其特征在于，进一步包括：

25.根据权利要求22-24任一项所述的装置，其特征在于，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：

所述第一构造处理单元包括：

26.根据权利要求22-24任一项所述的装置，其特征在于，所述估计姿态信息具体为训练物体结构特征点的位置信息，所述训练物体结构特征点包括：

所述第一构造处理单元包括：

27.一种利用权利要求17-20任一项装置生成的姿态分类器及权利要求21-26任一项装置生成的物体分类器进行物体检测的装置，其特征在于，所述物体为具有关节的物体，所述装置包括：

第四获取模块，用于获取输入图像样本；

28.根据权利要求27所述的装置，其特征在于，所述第二姿态估计模块包括：

所述检测模块包括：

29.根据权利要求28所述的装置，其特征在于，进一步包括：

30.根据权利要求28所述的装置，其特征在于，进一步包括：

31.根据权利要求28-30任一项所述的装置，其特征在于，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：

所述第二构造处理单元包括：

32.根据权利要求28-30任一项所述的装置，其特征在于，所述估计姿态信息具体为物体结构特征点的位置信息，所述物体结构特征点包括：

所述第二构造处理单元包括：