CN113689578A

CN113689578A - 一种人体数据集生成方法及装置

Info

Publication number: CN113689578A
Application number: CN202010414665.2A
Authority: CN
Inventors: 李顺枝; 许娅彤; 李�杰; 毛慧
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2021-11-23
Anticipated expiration: 2040-05-15
Also published as: CN113689578B

Abstract

本申请实施例提供了一种人体数据集生成方法及装置，获取人体三维模型、背景图像及指定形变参数，根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型，将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息，对应存储渲染图像及标注信息，得到人体数据集。仅需获取少量的人体三维模型和背景图像，通过设置不同的指定形变参数，可以得到不同的指定形变参数下形变后的人体三维模型，进而通过图像渲染，能够得到多张包括不同人体行为/姿态的渲染图像，只需对应存储渲染图像和该渲染图像中人体的标注信息，即可生成人体数据集，因此，能够快速生成人体数据集。

Description

一种人体数据集生成方法及装置

技术领域

本申请涉及计算机视觉技术领域，特别是涉及一种人体数据集生成方法及装置。

背景技术

随着人工智能技术的不断发展，在行人监控、行人跟踪等领域中，对于人体检测的需求不断增加，为了实现对不同应用场景中的人体检测功能，计算机可以通过人体检测模型进行人体检测，得到人体的标注信息，标注信息例如人体的行为/姿态类型、人体位置等。其中，人体检测模型由计算机基于人体数据集，对初始检测模型进行训练得到；初始检测模型例如支持向量机、随机森林等，人体数据集包括多张图像以及每张图像中人体的标注信息。

相关技术中，训练初始检测模型所需的人体数据集由人工生成，具体处理过程为：针对多种需要进行人体检测的应用场景，工作人员拍摄该应用场景中的人体，得到包含该人体的图像。然后，人工标注人体的标注信息，例如，人工标注人体在该图像中的位置、人体的行为类型/姿态类型，得到该应用场景的样本图像。由此，得到由每种应用场景的样本图像组成的人体数据集。

为了保证人体检测模型检测结果的准确率，需要基于优质人体数据集对初始检测模型进行训练，优质人体数据集是指包含的样本图像的数量大、且样本图像所包含人体的行为/姿态多样的数据集。然而，通过人工方式生成人体数据集的效率低，无法快速生成优质人体数据集。

发明内容

本申请实施例的目的在于提供一种人体数据集生成方法及装置，以实现快速生成人体数据集。具体技术方案如下：

第一方面，本申请实施例提供了一种人体数据集生成方法，该方法包括：

获取人体三维模型、背景图像及指定形变参数；

根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型；

将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息；

对应存储渲染图像及标注信息，得到人体数据集。

可选的，获取人体三维模型的步骤，包括：

获取多台采集设备采集的多视角图像和深度图像，以及预先对多台采集设备进行参数标定得到的各采集设备的内参和各采集设备之间的外参；

根据各采集设备的内参及各采集设备之间的外参，将多视角图像中的各视角图像和深度图像对齐，并将对齐后的各视角图像和深度图像投影至世界坐标系，得到各视角三维点云；

将各视角三维点云进行对齐，并去除对齐后的各视角三维点云中共视的重复三维点云，得到融合后的多视角三维点云；

对多视角三维点云进行表面模型重建，得到网络三维模型；

将多视角图像映射至网络三维模型，得到人体三维模型。

可选的，在根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型的步骤之前，该方法还包括：

对人体三维模型进行拟合，得到人体三维模型对应的参数化模型；

根据人体三维模型各顶点的三维坐标以及参数化模型各顶点的三维坐标，将人体三维模型各顶点与参数化模型上距离最近的顶点相关联；

根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型的步骤，包括：

根据指定形变参数，确定参数化模型各顶点的旋转平移矩阵；

根据参数化模型各顶点的旋转平移矩阵，分别将人体三维模型对应的各顶点进行坐标变换，得到形变后的人体三维模型。

可选的，对人体三维模型进行拟合，得到人体三维模型对应的参数化模型的步骤，包括：

对人体三维模型进行关键点检测，得到人体三维模型各人体关键点的三维坐标；

根据人体三维模型各人体关键点的三维坐标及预设参数化模型各人体关键点的三维坐标，计算人体三维模型和预设参数化模型各人体关键点的距离和，得到姿态损失；

根据人体三维模型各顶点的三维坐标及预设参数化模型各顶点的三维坐标，计算人体三维模型和预设参数化模型各顶点的距离和，得到轮廓损失；

对姿态损失及轮廓损失进行优化，得到人体三维模型对应的参数化模型。

可选的，在将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤之前，该方法还包括：

设置多个虚拟相机以及各虚拟相机的角度、距离；

将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤，包括：

根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像。

可选的，在根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤之后，该方法还包括：

确定渲染图像中的人体区域；

若人体区域占渲染图像总面积的比例超出预设比例，则重新设置各虚拟相机的角度、距离，并重新执行根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤。

可选的，该方法还包括：

将人体数据集中的每个图像输入至初始检测模型中，得到检测结果；

将检测结果与预先标定的该图像所包含人体的标注信息进行比较，得到差异信息；

基于差异信息，调整初始检测模型的参数，直至初始检测模型的迭代次数达到预设次数，或，差异信息小于预设阈值，停止训练，得到人体检测模型。

可选的，该方法还包括：

将人体检测模型加载至计算机，其中，人体检测模型用于对输入计算机的待检测图像进行检测，检测出待检测图像中的人体信息。

第二方面，本申请实施例提供了一种人体数据集生成装置，该装置包括：

获取模块，用于获取人体三维模型、背景图像及指定形变参数；

形变模块，用于根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型；

渲染模块，用于将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息；

存储模块，用于对应存储渲染图像及标注信息，得到人体数据集。

可选的，获取模块，具体用于：

对多视角三维点云进行表面模型重建，得到网络三维模型；

将多视角图像映射至网络三维模型，得到人体三维模型。

可选的，该装置还包括：

拟合模块，用于对人体三维模型进行拟合，得到人体三维模型对应的参数化模型；

关联模块，用于根据人体三维模型各顶点的三维坐标以及参数化模型各顶点的三维坐标，将人体三维模型各顶点与参数化模型上距离最近的顶点相关联；

形变模块，具体用于：

可选的，拟合模块，具体用于：

可选的，该装置还包括：

设置模块，用于设置多个虚拟相机以及各虚拟相机的角度、距离；

渲染模块，具体用于：

可选的，该装置还包括：

确定模块，用于确定渲染图像中的人体区域；

渲染模块，具体用于若人体区域占渲染图像总面积的比例超出预设比例，则重新设置各虚拟相机的角度、距离，并重新执行根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤。

可选的，该装置还包括：

训练模块，用于将人体数据集中的每个图像输入至初始检测模型中，得到检测结果；将检测结果与预先标定的该图像所包含人体的标注信息进行比较，得到差异信息；基于差异信息，调整初始检测模型的参数，直至初始检测模型的迭代次数达到预设次数，或，差异信息小于预设阈值，停止训练，得到人体检测模型。

可选的，该装置还包括：

加载模块，用于将人体检测模型加载至计算机，其中，人体检测模型用于对输入计算机的待检测图像进行检测，检测出待检测图像中的人体信息。

第三方面，本申请实施例提供了一种检测器，包括图像传感器和处理器；

图像传感器，用于采集待检测图像；

处理器，用于加载利用人体数据集训练得到的人体检测模型，其中，人体数据集根据本申请实施例第一方面所提供的人体数据集生成方法生成；通过人体检测模型，检测待检测图像中的人体信息。

第四方面，本申请实施例提供了一种电子设备，包括处理器和机器可读存储介质，机器可读存储介质存储有能够被处理器执行的机器可执行指令，处理器被机器可执行指令促使：实现本申请实施例第一方面提供的方法。

第五方面，本申请实施例提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，实现本申请实施例第一方面提供的方法。

第六方面，本申请实施例还提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行实现本申请实施例第一方面所提供的方法。

本申请实施例提供的一种人体数据集生成方法及装置，通过获取人体三维模型、背景图像及指定形变参数，根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型，将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息，对应存储渲染图像及标注信息，得到人体数据集。本申请实施例中，仅需要获取少量的人体三维模型和背景图像，通过设置不同的指定形变参数，可以得到不同的指定形变参数下形变后的人体三维模型，进而通过图像渲染，能够得到多张包括不同人体行为/姿态的渲染图像，只需对应存储渲染图像和该渲染图像中人体的标注信息，即可生成人体数据集，因此，能够快速生成人体数据集。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的人体数据集生成方法的流程示意图；

图2为本申请实施例的重建人体三维模型的流程示意图；

图3为本申请实施例的人体三维模型形变的流程示意图；

图4为本申请实施例的将形变后的人体三维模型渲染到背景图像的流程示意图；

图5为本申请实施例的生成人体数据集的具体实施流程示意图；

图6为本申请实施例的人体数据集生成装置的结构示意图；

图7为本申请实施例的电子设备的结构示意图；

图8为本申请实施例的检测器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为解决相关技术中采用人工方式生成人体数据集，导致人体数据集生成效率低的问题，本申请实施例提供了一种人体数据集生成方法及装置。下面，首先对本申请实施例所提供的人体数据集生成方法进行介绍。该方法应用于电子设备，电子设备可以是具有数据处理功能的设备，例如，计算机、平板电脑等。本申请实施例所提供的人体数据集生成方法可以被设置于电子设备中的软件、硬件电路和逻辑电路中的至少一种。

如图1所示，本申请实施例所提供的一种人体数据集生成方法，可以包括如下步骤。

S101，获取人体三维模型、背景图像及指定形变参数。

S102，根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型。

S103，将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息。

S104，对应存储渲染图像及标注信息，得到人体数据集。

应用本申请实施例，仅需要获取少量的人体三维模型和背景图像，通过设置不同的指定形变参数，可以得到不同的指定形变参数下形变后的人体三维模型，进而通过图像渲染，能够得到多张包括不同人体行为/姿态的渲染图像，只需对应存储渲染图像和该渲染图像中人体的标注信息，即可生成人体数据集，因此，能够快速生成人体数据集，其中，指定形变参数是指控制人体三维模型发生人体形变的参数，人体三维模型中的人体姿态、体型、表情等根据指定形变参数的不同会发生变化。相较于人工标注，本申请实施例生成人体数据集的效率更高，并且，大大减少了人工操作，能极大节省人力和时间成本。

另外，在相应的方法中，也有少部分借助三维渲染进行数据集生成的方法，然而这些方法中，人体仅能保持固定的动作和姿态，样本多样性极为受限，而本申请实施例中，可以设置不同的指定形变参数，则人体行为/姿态可以随着指定形变参数的不同，存在多种类型的人体行为/姿态，从而增强了人体数据集中样本的多样性。

人体三维模型是指能够表征一个人体三维特征的模型，人体三维模型可以是预先建立的，也可以是从其他建模设备中直接获取到的，还可以是电子设备重建出来的，这里所说的人体三维模型重建方式可以包括但不限于多视角三维重建、扫描式重建，当然，任何可重建人体三维模型的方式均适用本申请实施例。

示例性的，以多视角三维重建为例，获取人体三维模型的步骤具体可以通过如下步骤实现：

第一步，获取多台采集设备采集的多视角图像和深度图像，以及预先对多台采集设备进行参数标定得到的各采集设备的内参和各采集设备之间的外参。

第二步，根据各采集设备的内参及各采集设备之间的外参，将多视角图像中的各视角图像和深度图像对齐，并将对齐后的各视角图像和深度图像投影至世界坐标系，得到各视角三维点云。

第三步，将各视角三维点云进行对齐，并去除对齐后的各视角三维点云中共视的重复三维点云，得到融合后的多视角三维点云。

第四步，对多视角三维点云进行表面模型重建，得到网络三维模型。

第五步，将多视角图像映射至网络三维模型，得到人体三维模型。

在具体应用时，可以设置采集设备为5台共视角的RGBD(色彩深度)相机，相机1到相机4在人体周围每隔90度排布，相机5置于中心顶部以上约1-2m，当然，采集设备的数目可以设置的更多或者更少，只要保证可以各个角度、各个方向地采集到人体图像即可。

具体的重建人体三维模型的流程如图2所示，主要包括：多相机参数标定、RGBD数据采集、多视角点云对齐与融合、表面模型重建和模型纹理映射。各步骤具体如下：

1)多相机参数标定：标定各相机的内参、RGB相机与深度相机之间的外参、各RGBD相机之间的外参等，可以采用张正友的棋盘标定格进行标定。多相机参数标定可以是在进行人体三维模型重建之前进行的，标定好之后将标定的内外参存储在本地，以便在需要进行人体三维模型重建时，直接从本地读取。

2)RGBD数据采集：5台RGBD相机可以设置相同的采集帧率，同步采集图像，4台RGB相机采集的是各视角图像、1台深度相机采集的是深度图像，采集帧率可以设置30fps。

3)多视角点云对齐和融合：将各视角图像和深度图像对齐并投影至世界坐标系，得到各视角三维点云，然后采用ICP(Iterative Closest Point，迭代最近邻)等匹配算法对各视角点云进行对齐，并去除对齐后的各视角三维点云中共视的重复三维点云，得到融合后的多视角三维点云。具体的，将各视角图像和深度图像对齐的方式为：在获取到深度相机和RGB相机之间的外参后，在RGB相机采集的视角图像上按照成像规律取像素值，将获取的像素值填充到深度图像的每一个像素中，使得深度图像每个像素都包含深度信息和RGB颜色信息。然后，再根据成像原理及深度约束，将对齐的图像投影到世界坐标系下，即可得到各视角三维点云。

4)表面模型重建：对多视角三维点云进行表面模型重建，得到网络三维模型，进行表面模型重建的方法可以采用MC(Marching Cubes，一种面显示算法)、泊松重建等方法。

5)模型纹理映射：按照可视性原则，将多视角图像映射至网络三维模型上，则得到人体三维模型，该人体三维模型一般为带纹理的三维模型，如果得到的是黑白不带纹理的三维模型，可以通过增加纹理特征，得到带纹理的人体三维模型。

在获取到人体三维模型后，可以根据输入的指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型，指定形变参数包括姿态调整参数、形状调整参数、脸部表情调整参数、手部动作调整参数等。

在获取到人体三维模型和指定形变参数后，可以直接采用表面模型调整的策略对人体三维模型进行人体形变，然而，一般情况下，人体三维模型并没有语义信息，因此，可以将人体三维模型关联参数化模型，根据参数化模型的形变规律，对人体三维模型进行人体形变，这里所提及的参数化模型可以是但不限于SMPL模型(A Skinned Multi-PersonLinear Model，一种基于顶点的人体三维模型)、BlendSCAPE模型(一种基于形变的人体三维模型)，任何可参数化的模型均适用于本申请实施例。

具体的，在执行S102之前，本申请实施例还可以执行：对人体三维模型进行拟合，得到人体三维模型对应的参数化模型；根据人体三维模型各顶点的三维坐标以及参数化模型各顶点的三维坐标，将人体三维模型各顶点与参数化模型上距离最近的顶点相关联。

相应的，S102具体可以为：根据指定形变参数，确定参数化模型各顶点的旋转平移矩阵；根据参数化模型各顶点的旋转平移矩阵，分别将人体三维模型对应的各顶点进行坐标变换，得到形变后的人体三维模型。

其中，对人体三维模型进行拟合，得到人体三维模型对应的参数化模型的步骤是为了给人体三维模型提供形变语义信息，主要是通过优化迭代函数的方式来优化参数化模型，具体包括：对人体三维模型进行关键点检测，得到人体三维模型各人体关键点的三维坐标；根据人体三维模型各人体关键点的三维坐标及预设参数化模型各人体关键点的三维坐标，计算人体三维模型和预设参数化模型各人体关键点的距离和，得到姿态损失；根据人体三维模型各顶点的三维坐标及预设参数化模型各顶点的三维坐标，计算人体三维模型和预设参数化模型各顶点的距离和，得到轮廓损失；对姿态损失及轮廓损失进行优化，得到人体三维模型对应的参数化模型。

具体的人体三维模型形变的流程如图3所示，主要包括：人体三维模型各人体关键点检测、人体三维模型拟合、人体三维模型语义信息关联、人体三维模型形变。各步骤具体如下：

1)人体三维模型各人体关键点检测：对人体三维模型进行关键点检测，得到各人体关键点的三维坐标。

2)人体三维模型拟合：由于人体三维模型无语义信息，可通过参数化模型对人体三维模型进行拟合，用以给人体三维模型提供形变语义信息。根据人体三维模型各人体关键点的三维坐标及预设参数化模型各人体关键点的三维坐标，计算人体三维模型和预设参数化模型各人体关键点的距离和，得到姿态损失；根据人体三维模型各顶点的三维坐标及预设参数化模型各顶点的三维坐标，计算人体三维模型和预设参数化模型各顶点的距离和，得到轮廓损失。这里所提及的距离可以采用欧式距离。在得到姿态损失和轮廓损失后，可以对姿态损失和轮廓损失进行共同优化，使得参数化模型最大程度标注人体三维模型的信息，从而能够得到人体三维模型对应的参数化模型。其中，对姿态损失和轮廓损失进行共同优化的方式具体可以为：以姿态损失和轮廓损失的加权和作为总损失值，以参数化模型的参数作为优化变量，通过调整优化参数化模型的参数，使得总损失取得最小，即可获得优化后的参数化模型的参数。

3)人体三维模型语义信息关联：在得到人体三维模型对应的参数化模型后，可以将人体三维模型上每个顶点与离其最近的参数化模型上的顶点(欧式距离最小)相关联，由于参数化模型上每个顶点都有语义信息，从而可以得到人体三维模型上每个顶点的语义信息，参数化模型和表面模型顶点关联后即为获取到了顶点的语义信息。

4)人体三维模型形变：由于人体三维模型上每个顶点都继承了参数化模型上对应顶点的语义信息，可以借助参数化模型的形变规律来完成形变。首先，读入指定形变参数；接下来，通过参数化模型的形变规律，计算出人体三维模型对应拟合的参数化模型上每个顶点到需形变到的顶点的旋转平移矩阵；最后，将人体三维模型上每个顶点按其对应参数化模型上顶点的旋转平移矩阵进行坐标变换，并保持原有拓扑关系不变，即可得到形变后的人体三维模型。

在得到形变后的人体三维模型后，需要将该人体三维模型渲染至背景图像中，背景图像是指无人室内、街道、风景等为主的二维图像，背景图像可以是从背景库中随机选取的，通过将形变后的人体三维模型渲染至背景图像，可以得到包含有人体的渲染图像。具体的渲染方式可以采用传统的图像渲染方式，这里不做具体限定。

在进行渲染时，可以以任意角度将人体三维模型渲染到背景图像中，以丰富人体数据集中的图像数据，进一步增加样本的多样性。因此，在执行S103之前，本申请实施例还可以执行：设置多个虚拟相机以及各虚拟相机的角度、距离。

相应的，S103中将形变后的人体三维模型渲染至背景图像中，得到渲染图像，具体可以为：根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像。

将形变后的人体三维模型渲染到背景图像的流程如图4所示，包括：背景图像选取、确定虚拟相机位置、模型渲染。各步骤具体如下：

1)背景图像选取：在背景库中随机选取背景图像。背景库为无人室内、街道、风景为主的二维图像数据库，用以三维模型渲染调用。

2)确定虚拟相机位置：以人体为中心，每隔一定角度(例如30度)设置一个虚拟相机，距离由1-10m随机设置，并计算出对应的内外参。

3)模型渲染：在渲染时，根据需求制定相机的角度、距离，将形变后的人体三维模型渲染到背景图像中，得到渲染图像。

如果渲染图像中人体所占面积过大，实际很难完整体现人体，因此，在执行根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像之后，本申请实施例所提供的方法还可以执行：确定渲染图像中的人体区域；若人体区域占渲染图像总面积的比例超出预设比例，则重新设置各虚拟相机的角度、距离，并重新执行根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤。

如果人体区域占渲染图像总面积的比例超出预设比例(例如50％)，说明渲染图像中可能只显示了人体的一部分，因此，需要剔除该渲染图像，并重新设置各虚拟相机的角度、距离，重新进行渲染，直至得到合适的渲染图像为止。

在得到渲染图像后，可以根据具体任务类型的不同，进行不同形式的自动标注，得到人体的标注信息，然后将渲染图像和该渲染图像的标注信息进行存储，即可得到人体数据集。其中，任务类型可以包括分割任务、检测任务、人体关键点检测任务。针对分割任务，标注方式可以是将渲染图像中的人体区域灰度值设置为255，除人体区域以外的区域的灰度值设置为0，则人体区域凸显出来，可以将设置灰度值后的图像进行存储作为标注信息；针对检测任务，标注方式可以是对渲染图像中的人体区域取外接矩形，记录外接矩形的左上角点和右下角点坐标，将外接矩形的左上角点和右下角点坐标以文本文档形式存储作为标注信息；针对人体关键点检测任务，标注方式可以是将形变后的人体三维模型的关键点按照当前内外参渲染到背景图像上，记录关键点的二维坐标，将关键点的二维坐标以文本文档形式存储作为标注信息。

综上所述，生成人体数据集的具体实施流程如图5所示，主要包括：人体三维模型重建、模型驱动形变、模型渲染到背景图像和图像标注信息生成4个步骤，其中人体三维模型重建的具体实现如图2所示，模型驱动形变的具体实现如图3所示，模型渲染到背景图像的具体实现如图4所示，具体实现见上述实施例，这里不再赘述。

本申请实施例中，人体数据集可以用于对初始检测模型进行训练，得到人体检测模型，以便电子设备基于人体检测模型检测待检测图像中的人体行为/姿态。

可选的，在生成人体数据集后，电子设备可以基于人体数据集对初始检测模型进行训练，即：将人体数据集中的每个图像输入至初始检测模型中，得到检测结果；将检测结果与预先标定的该图像所包含人体的标注信息进行比较，得到差异信息；基于差异信息，调整初始检测模型的参数，直至初始检测模型的迭代次数达到预设次数，或，差异信息小于预设阈值，停止训练，得到人体检测模型。

电子设备基于图像集训练初始检测模型的具体实现方式可以采用相关技术中任一种模型训练方式，在此不做限定。

本申请实施例中，将对人体数据集中图像输入检测模型得到的输出，与预先标定的该图像所包含人体的标注信息进行比较，得到用于表示准确度的差异信息，以准确度为训练结束的基准，由此，能够提升人体检测模型的检测结果准确率。

在基于人体数据集对初始检测模型进行训练，得到人体检测模型后，可以执行：将人体检测模型加载至计算机，其中，人体检测模型用于对输入计算机的待检测图像进行检测，检测出待检测图像中的人体信息。

训练得到人体检测模型后，可以将人体检测模型加载至用于检测人体行为/姿态的计算机中，例如摄像机、手机、机器人等，具体由计算机的CPU、GPU等运行人体检测模型，人体检测模型可以对待检测图像中的人体进行检测，将待检测图像输入人体检测模型，可以直接检测出待检测图像中的人体信息，具体的可检测出待检测图像中人体的具体位置、人体的行为类型是什么、人体的姿态为什么类型等。

上述检测结果所包含的标注信息可以是多种多样的，例如，检测结果可以包括人体位置、人体行为类型、人体姿态类型等，本申请实施例不作具体限定。

本申请实施例还提供了一种人体数据集生成装置，如图6所示，该装置包括：

获取模块610，用于获取人体三维模型、背景图像及指定形变参数；

形变模块620，用于根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型；

渲染模块630，用于将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息；

存储模块640，用于对应存储渲染图像及标注信息，得到人体数据集。

可选的，获取模块610，具体可以用于：

对多视角三维点云进行表面模型重建，得到网络三维模型；

将多视角图像映射至网络三维模型，得到人体三维模型。

可选的，该装置还可以包括：

形变模块620，具体可以用于：

可选的，拟合模块，具体可以用于：

可选的，该装置还可以包括：

渲染模块630，具体可以用于：

可选的，该装置还可以包括：

确定模块，用于确定渲染图像中的人体区域；

渲染模块630，具体可以用于若人体区域占渲染图像总面积的比例超出预设比例，则重新设置各虚拟相机的角度、距离，并重新执行根据各虚拟相机的角度及距离，将形变后的人体三维模型渲染至背景图像中，得到渲染图像的步骤。

可选的，该装置还可以包括：

应用本申请实施例，通过获取人体三维模型、背景图像及指定形变参数，根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型，将形变后的人体三维模型渲染至背景图像中，得到渲染图像，并根据预设的任务类型，对渲染图像进行人体标注得到标注信息，对应存储渲染图像及标注信息，得到人体数据集。本申请实施例中，仅需要获取少量的人体三维模型和背景图像，通过设置不同的指定形变参数，可以得到不同的指定形变参数下形变后的人体三维模型，进而通过图像渲染，能够得到多张包括不同人体行为/姿态的渲染图像，只需对应存储渲染图像和该渲染图像中人体的标注信息，即可生成人体数据集，因此，能够快速生成人体数据集。

本申请实施例还提供了一种电子设备，如图7所示，可以包括处理器701和机器可读存储介质702，机器可读存储介质702存储有能够被处理器701执行的机器可执行指令，处理器701被机器可执行指令促使实现如下步骤：

获取人体三维模型、背景图像及指定形变参数；

对应存储渲染图像及标注信息，得到人体数据集。

可选的，处理器701在实现获取人体三维模型的步骤时，具体可以实现：

对多视角三维点云进行表面模型重建，得到网络三维模型；

将多视角图像映射至网络三维模型，得到人体三维模型。

可选的，处理器701还可以实现：

处理器701在实现根据指定形变参数，对人体三维模型进行人体形变，得到形变后的人体三维模型时，具体可以实现：

可选的，处理器701在实现对人体三维模型进行拟合，得到人体三维模型对应的参数化模型时，具体可以实现：

可选的，处理器701还可以实现：

设置多个虚拟相机以及各虚拟相机的角度、距离；

处理器701在实现将形变后的人体三维模型渲染至背景图像中，得到渲染图像时，具体可以实现：

可选的，处理器701还可以实现：

确定渲染图像中的人体区域；

可选的，处理器701还可以实现：

上述机器可读存储介质可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-Volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，机器可读存储介质还可以是至少一个位于远离上述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processing，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

机器可读存储介质702与处理器701之间可以通过有线连接或者无线连接的方式进行数据传输，并且电子设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。图7所示的仅为处理器701与机器可读存储介质702之间通过总线进行数据传输的示例，不作为具体连接方式的限定。

本申请实施例还提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，实现上述人体数据集生成方法。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中的人体数据集生成方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line，数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD(DigitalVersatile Disc，数字多功能光盘))、或者半导体介质(例如SSD(Solid State Disk，固态硬盘))等。

本申请实施例还提供了一种检测器，如图8所示，包括图像传感器801和处理器802；

图像传感器801，用于采集待检测图像；

处理器802，用于加载利用人体数据集训练得到的人体检测模型；通过人体检测模型，检测待检测图像中的人体信息，其中，人体数据集的生成方法包括：

获取人体三维模型、背景图像及指定形变参数；

对应存储渲染图像及标注信息，得到人体数据集。

人体数据集快速生成，利用人体数据集中的图像训练人体检测模型，人体检测模型加载在检测器上，CPU、GPU等处理器通过人体检测模型，对待检测图像中的人体进行检测，可以直接检测出待检测图像中的人体信息，人体检测过程快速可靠。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备、机器可读存储介质、包含指令的计算机程序产品以及检测器而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

1.一种人体数据集生成方法，其特征在于，所述方法包括：

获取人体三维模型、背景图像及指定形变参数；

根据所述指定形变参数，对所述人体三维模型进行人体形变，得到形变后的所述人体三维模型；

将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像，并根据预设的任务类型，对所述渲染图像进行人体标注得到标注信息；

对应存储所述渲染图像及所述标注信息，得到人体数据集。

2.根据权利要求1所述的方法，其特征在于，所述获取人体三维模型，包括：

获取多台采集设备采集的多视角图像和深度图像，以及预先对所述多台采集设备进行参数标定得到的各采集设备的内参和所述各采集设备之间的外参；

根据所述各采集设备的内参及所述各采集设备之间的外参，将所述多视角图像中的各视角图像和所述深度图像对齐，并将对齐后的所述各视角图像和所述深度图像投影至世界坐标系，得到各视角三维点云；

将所述各视角三维点云进行对齐，并去除对齐后的各视角三维点云中共视的重复三维点云，得到融合后的多视角三维点云；

对所述多视角三维点云进行表面模型重建，得到网络三维模型；

将所述多视角图像映射至所述网络三维模型，得到人体三维模型。

3.根据权利要求1所述的方法，其特征在于，在所述根据所述指定形变参数，对所述人体三维模型进行人体形变，得到形变后的所述人体三维模型之前，所述方法还包括：

对所述人体三维模型进行拟合，得到所述人体三维模型对应的参数化模型；

根据所述人体三维模型各顶点的三维坐标以及所述参数化模型各顶点的三维坐标，将所述人体三维模型各顶点与所述参数化模型上距离最近的顶点相关联；

所述根据所述指定形变参数，对所述人体三维模型进行人体形变，得到形变后的所述人体三维模型，包括：

根据所述指定形变参数，确定所述参数化模型各顶点的旋转平移矩阵；

根据所述参数化模型各顶点的旋转平移矩阵，分别将所述人体三维模型对应的各顶点进行坐标变换，得到形变后的人体三维模型。

4.根据权利要求3所述的方法，其特征在于，所述对所述人体三维模型进行拟合，得到所述人体三维模型对应的参数化模型，包括：

对所述人体三维模型进行关键点检测，得到所述人体三维模型各人体关键点的三维坐标；

根据所述人体三维模型各人体关键点的三维坐标及预设参数化模型各人体关键点的三维坐标，计算所述人体三维模型和所述预设参数化模型各人体关键点的距离和，得到姿态损失；

根据所述人体三维模型各顶点的三维坐标及所述预设参数化模型各顶点的三维坐标，计算所述人体三维模型和所述预设参数化模型各顶点的距离和，得到轮廓损失；

对所述姿态损失及所述轮廓损失进行优化，得到所述人体三维模型对应的参数化模型。

5.根据权利要求1所述的方法，其特征在于，在所述将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像之前，所述方法还包括：

设置多个虚拟相机以及各虚拟相机的角度、距离；

所述将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像，包括：

根据所述各虚拟相机的角度及距离，将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像。

6.根据权利要求5所述的方法，其特征在于，在所述根据所述各虚拟相机的角度及距离，将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像之后，所述方法还包括：

确定所述渲染图像中的人体区域；

若所述人体区域占所述渲染图像总面积的比例超出预设比例，则重新设置所述各虚拟相机的角度、距离，并重新执行所述根据所述各虚拟相机的角度及距离，将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述人体数据集中的每个图像输入至初始检测模型中，得到检测结果；

将所述检测结果与预先标定的该图像所包含人体的标注信息进行比较，得到差异信息；

基于所述差异信息，调整所述初始检测模型的参数，直至所述初始检测模型的迭代次数达到预设次数，或，所述差异信息小于预设阈值，停止训练，得到人体检测模型。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

将所述人体检测模型加载至计算机，所述人体检测模型用于对输入所述计算机的待检测图像进行检测，检测出所述待检测图像中的人体信息。

9.一种人体数据集生成装置，其特征在于，所述装置包括：

形变模块，用于根据所述指定形变参数，对所述人体三维模型进行人体形变，得到形变后的所述人体三维模型；

渲染模块，用于将形变后的所述人体三维模型渲染至所述背景图像中，得到渲染图像，并根据预设的任务类型，对所述渲染图像进行人体标注得到标注信息；

存储模块，用于对应存储所述渲染图像及所述标注信息，得到人体数据集。

10.一种检测器，其特征在于，包括图像传感器和处理器；

所述图像传感器，用于采集待检测图像；

所述处理器，用于加载利用人体数据集训练得到的人体检测模型，其中，所述人体数据集根据权利要求1-6任一项所述的方法生成；通过所述人体检测模型，检测所述待检测图像中的人体信息。