CN106548179A

CN106548179A - 物体和服饰关键点的检测方法、装置和电子设备

Info

Publication number: CN106548179A
Application number: CN201610868345.8A
Authority: CN
Inventors: 汤晓鸥; 刘子纬; 颜思捷; 罗平; 王晓刚
Original assignee: Beijing Sensetime Technology Development Co Ltd
Current assignee: Beijing Sensetime Technology Development Co Ltd
Priority date: 2016-09-29
Filing date: 2016-09-29
Publication date: 2017-03-29
Anticipated expiration: 2036-09-29
Also published as: CN106548179B

Abstract

本发明实施例公开了一种物体和服饰关键点的检测方法、装置和电子设备，其中，方法包括：利用第一神经网络对待检测图像中物体进行关键点定位，获得所述物体的关键点的初始位置信息；从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络；利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。本发明实施例可以节省计算资源，并提高处理效率和检测精度。

Description

物体和服饰关键点的检测方法、装置和电子设备

技术领域

本发明涉及深度学习技术，尤其是一种物体和服饰关键点的检测方法、装置和电子设备。

背景技术

服饰识别是图像检索领域最重要也是最有挑战性的问题之一。在当今互联网上，80％的用户搜索与网上购物内容与服饰相关。因此，服饰识别是解决同款检索、风格识别以及穿搭推荐需求中的关键问题。然而，服饰识别具有很高的难度，一是由于服饰的形变非常大，衣服本身是柔性很大的物体，用户的姿势不同时，其身上的服饰将呈现不同的状态；二是在不同条件、角度下拍出的服饰图片差距也非常大，例如模特的摆拍照和消费者的自拍照差别就很明显。

发明内容

本发明实施例提供一种关键点检测的技术方案。

根据本发明实施例的一个方面，提供的一种物体关键点的检测方法，包括：

利用第一神经网络对待检测图像中物体进行关键点定位，获得所述物体的关键点的初始位置信息；

从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络；

利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。

基于上述物体关键点的检测方法的另一实施例中，从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络之前，还包括：

获取所述待检测图像的难易程度。

基于上述物体关键点的检测方法的另一实施例中，所述获取所述待检测图像的难易程度之前，还包括：

对所述待检测图像进行特征提取，获得所述检测图像的图像特征；

获取所述待检测图像的难易程度包括：根据所述待检测图像的图像特征确定所述待检测图像的难易程度。

基于上述物体关键点的检测方法的另一实施例中，根据所述检测图像的图像特征确定所述待检测图像的难易程度包括：

根据训练样本集中包括的具有与所述检测图像的图像特征相同特征的样本数量的多少，确定所述待检测图像的难易程度。

基于上述物体关键点的检测方法的另一实施例中，所述待检测图像的难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多。

基于上述物体关键点的检测方法的另一实施例中，待检测图像的难易程度至少包括较高难度和较低难度；

所述至少二个复杂程度不同的第二神经网络至少包括适应于较高难度的待检测图像的第二神经网络和适应于较低难度的待检测图像的第二神经网络。

基于上述物体关键点的检测方法的另一实施例中，所述初始位置信息包括初始位置坐标；

所述利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息包括：

利用确定的第二神经网络对各关键点的初始位置坐标进行修正，获得所述待检测图像的各关键点修正后的位置坐标。

分别针对各关键点，利用确定的第二神经网络获取修正后的位置坐标相对于初始位置坐标的相对位置；

分别根据各关键点的初始位置坐标与所述相对于该初始位置坐标的相对位置，获得各关键点修正后的位置坐标。

基于上述物体关键点的检测方法的另一实施例中，还包括：

从所述待检测图像的图像特征中提取所述物体的全局特征，并分别从各关键点修正后的位置处提取所述物体的局部特征；

根据所述物体的全局特征与从各关键点修正后的真实位置处提取的局部特征进行物体识别，获得所述物体的识别结果。

基于上述物体关键点的检测方法的另一实施例中，还包括：

预设初始关键点检测神经网络；

将标注关键点信息的样本图像作为待检测图像输入所述初始关键点检测神经网络，以所述标注关键点信息作为监督信息，对所述初始关键点检测神经网络进行迭代训练直至设定指标满足预定收敛条件，获得最终的关键点检测神经网络；所述最终的神经网络包括所述第一神经网络和至少二个复杂程度不同的第二神经网络，所述标准关键点信息包括关键点数量以及各关键点的标准位置信息。

基于上述物体关键点的检测方法的另一实施例中，所述设定指标满足预定收敛条件包括：

所述初始关键点检测神经网络输出的关键点信息与所述标准关键点信息之间的偏差小于第一预设阈值；和/或

所述初始关键点检测神经网络进行迭代训练的次数达到第二预设阈值。

根据本发明实施例的另一个方面，提供的一种服饰关键点的检测方法，包括：

利用第一神经网络对待检测图像中服饰进行关键点定位，获得所述服饰的关键点的初始位置信息，所述初始位置信息包括初始位置坐标和/或初始可见性状态；

利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息。

基于上述服饰关键点的检测方法的另一实施例中，所述关键点包括以下任意一项或多项：领口、袖口和下摆；

所述可见性状态包括以下至少之一：可见、遮挡和截断。

基于上述服饰关键点的检测方法的另一实施例中，从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络之前，还包括：

获取所述待检测图像的难易程度。

基于上述服饰关键点的检测方法的另一实施例中，所述获取所述待检测图像的难易程度之前，还包括：

基于上述服饰关键点的检测方法的另一实施例中，根据所述检测图像的图像特征确定所述待检测图像的难易程度包括：

基于上述服饰关键点的检测方法的另一实施例中，所述待检测图像的难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多。

基于上述服饰关键点的检测方法的另一实施例中，待检测图像的难易程度至少包括较高难度和较低难度；

所述至少二个复杂程度不同的第二神经网络至少包括适应于较高难度的待检测图像的第一神经网络和适应于较低难度的待检测图像的第二神经网络。

基于上述服饰关键点的检测方法的另一实施例中，所述利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息包括：

利用确定的第二神经网络对各关键点的初始位置坐标进行修正，获得各关键点修正的位置坐标。

基于上述服饰关键点的检测方法的另一实施例中，所述利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息还包括：

利用确定的第二神经网络对各关键点的初始可见性状态进行修正，获得所述待检测图像的各关键点修正后的可见性状态。

基于上述服饰关键点的检测方法的另一实施例中，利用确定的第二神经网络对各关键点的初始可见性状态进行修正包括：

分别针对各关键点，利用确定的第二神经网络获取修正后的各可见性状态的概率值；

分别针对各关键点，从修正后的各可见性状态的概率值中选取一个最高的概率值对应的可见性状态作为该关键点修改后的可见性状态。

分别针对各关键点，利用确定的第二神经网络获取修正后的各可见性状态的概率值相对于各初始可见性状态的概率值的相对概率偏差；

分别针对各关键点，获取根据各初始可见性状态的概率值与所述相对于各初始可见性状态的概率值的相对概率偏差，获取修正后的各可见性状态的概率值；

基于上述服饰关键点的检测方法的另一实施例中，还包括：

从所述待检测图像的图像特征中提取所述服饰的全局特征，并分别从各关键点修正后的位置处提取所述服饰的局部特征；

根据所述服饰的全局特征与从各关键点修正后的真实位置处提取的局部特征进行服饰识别，获得所述服饰的识别结果。

基于上述服饰关键点的检测方法的另一实施例中，所述服饰的识别结果包括：所述服饰的分类和细节属性。

基于上述服饰关键点的检测方法的另一实施例中，还包括：

预设初始关键点检测神经网络；

基于上述服饰关键点的检测方法的另一实施例中，所述设定指标满足预定收敛条件包括：

根据本发明实施例的另一个方面，提供的一种物体关键点的检测装置，包括：

第一特征提取单元，用于对待检测图像进行特征提取，获得所述检测图像的图像特征；

初检测单元，用于作为第一神经网络，根据所述检测图像的图像特征，对所述待检测图像中物体进行关键点定位，获得所述物体的关键点，并获取各关键点的初始位置信息；

选取单元，用于从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络；

修正检测单元，用于作为所述确定的第二神经网络，对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息。

基于上述服饰关键点的检测装置的另一实施例中，还包括：

难度检测单元，用于获取所述待检测样本的难易程度。

基于上述服饰关键点的检测装置的另一实施例中，所述难度检测单元，具体用于根据所述检测图像的图像特征确定所述待检测图像的难易程度。

基于上述服饰关键点的检测装置的另一实施例中，所述难度检测单元，具体用于根据训练样本集中包括的具有与所述检测图像的图像特征相同特征的样本数量的多少，确定所述待检测图像的难易程度。

基于上述服饰关键点的检测装置的另一实施例中，所述待检测样本的难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多。

基于上述服饰关键点的检测装置的另一实施例中，待检测图像的难易程度至少包括较高难度和较低难度；

所述至包括适应于较高难度的待检测图像的第二神经网络和适应于较低难度的待检测图像的第二神经网络。

基于上述服饰关键点的检测装置的另一实施例中，所述初始位置信息包括初始位置坐标；

所述修正检测单元，具体用于对各关键点的初始位置坐标进行修正，获得所述待检测图像的各关键点修正后的位置坐标。

所述修正检测单元，具体用于分别针对各关键点，获取修正后的位置坐标相对于初始位置坐标的相对位置；以及分别根据各关键点的初始位置坐标与所述相对于该初始位置坐标的相对位置，获得各关键点修正后的位置坐标。

基于上述服饰关键点的检测装置的另一实施例中，还包括：

第二特征提取单元，用于从所述待检测图像的图像特征中提取所述物体的全局特征，并分别从各关键点修正后的位置处提取所述物体的局部特征；

物体识别单元，用于根据所述物体的全局特征与从各关键点修正后的真实位置处提取的局部特征进行物体识别，获得所述物体的识别结果。

基于上述服饰关键点的检测装置的另一实施例中，所述物体具体为服饰；

所述关键点包括以下任意一项或多项：领口、袖口和下摆；

所述物体的识别结果包括：所述物体的分类和细节属性。

基于上述服饰关键点的检测装置的另一实施例中，所述初始位置信息还包括初始可见性状态；所述可见性状态包括以下至少之一：可见、遮挡和截断；

所述修正检测单元，还用于利用确定的第二神经网络对各关键点的初始可见性状态进行修正，获得所述待检测图像的各关键点修正后的可见性状态。

基于上述服饰关键点的检测装置的另一实施例中，所述修正检测单元具体用于：

分别针对各关键点，获取修正后的各可见性状态的概率值；

基于上述服饰关键点的检测装置的另一实施例中，所述修正检测单元，还用于：

分别针对各关键点，获取修正后的各可见性状态的概率值相对于各初始可见性状态的概率值的相对概率偏差；

分别针对各关键点，获取根据各初始可见性状态的概率值与所述相对于各初始可见性状态的概率值的相对概率偏差，获取修正后的各可见性状态的概率值；以及

基于上述服饰关键点的检测装置的另一实施例中，还包括：

网络训练单元，用于将标注关键点信息的样本图像作为待检测图像输入所述初始关键点检测神经网络，以所述标注关键点信息作为监督信息，对所述初始关键点检测神经网络进行迭代训练直至设定指标满足预定收敛条件，获得最终的关键点检测神经网络；所述最终的神经网络包括所述第一神经网络和至少二个复杂程度不同的第二神经网络，所述标准关键点信息包括关键点数量以及各关键点的标准位置信息。

根据本发明实施例的又一个方面，提供的一种数据处理装置，包括上述任一实施例所述的物体关键点的检测装置。

基于上述数据处理装置的另一实施例中，所述数据处理装置包括进阶精简指令集机器ARM、中央处理单元CPU或图形处理单元GPU。

根据本发明实施例的再一个方面，提供的一种电子设备，设置有上述任一实施例所述的数据处理装置。

根据本发明实施例的再一个方面，提供的一种计算机存储介质，用于存储计算机可读取的指令，所述指令包括：

利用第一神经网络对待检测图像中物体进行关键点定位，获得所述物体的关键点的初始位置信息的指令；

从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络的指令；

利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息的指令。

利用第一神经网络对待检测图像中服饰进行关键点定位，获得所述服饰的关键点的初始位置信息的指令，所述初始位置信息包括初始位置坐标和/或初始可见性状态；

利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息的指令。

根据本发明实施例的再一个方面，提供一种计算机设备，包括：

存储器，存储可执行指令；

一个或多个处理器，与存储器通信以执行可执行指令从而完成本发明上述任一实施例的物体关键点的检测方法或上述任一实施例的服饰关键点的检测方法对应的操作。

基于本发明上述实施例提供的物体、服饰关键点的检测方法、装置和电子设备，提出了自适应处理难易图像技术，首先利用第一神经网络对待检测图像中物体的关键点进行初始定位，获得物体的关键点以及各关键点的初始位置信息，对待检测图像的检测难易程度进行区分，从至少二个复杂程度不同的第二神经网络中确定其中一个与该待检测图像的检测难易程度对应的第二神经网络，对各关键点的初始位置信息进行修正，以获得各关键点修正后的位置信息，利用与不同检测难易程度对应的、不同的第二神经网络分别处理难易程度不同的图像，通过较简单的第二神经网络对检测难度较低的待检测图像进行处理，可以节省计算资源，避免计算资源的浪费；通过较复杂的、处理能力较强的第二神经网络对难度较高的待检测图像进行处理，可以提高处理效率和检测精度，从而提升了最终的物体识别的准确性。

特别地，本发明各实施例中的物体可以是服饰，本发明各实施例均适用。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本发明的实施例，并且连同描述一起用于解释本发明的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本发明，其中：

图1为本发明物体关键点的检测方法一个实施例的流程图。

图2为本发明物体关键点的检测方法另一个实施例的流程图。

图3为本发明物体关键点的检测方法一个应用实施例的流程图。

图4为本发明服饰关键点的检测方法一个实施例的流程图。

图5为本发明物体关键点的检测装置一个实施例的结构示意图。

图6为本发明物体关键点的检测装置一个实施例的结构示意图。

图7为本发明物体关键点的检测装置一个实施例的结构示意图。

图8为本发明电子设备一个应用实施例的结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本发明实施例可以应用于计算机系统/服务器，其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于：个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境，等等。

计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

在实现本发明的过程中，本发明人经过创造性研究发现，有效的服饰关键点检测是通往鲁棒服饰识别的一个关键环节。其中，服饰关键点为在功能和结构上能区分不同服饰款式、且为多数服饰所共享的局部位置，例如领口、袖口和下摆等。服饰关键点的位置由两部分组成：第一、每个服饰关键点的空间位置坐标；第二、每个服饰关键点的可见性状态，比如可见、遮挡和截断等。

在实现本发明的过程中，本发明人经过调查研究发现，现有技术中，通过一个神经网络针对难易程度不同的所有服饰进行关键点检测，则对于难度较低的服饰，会造成计算资源的浪费；而对于难度较高的服饰，检测精度较低，降低了服饰识别的准确性。

图1为本发明物体关键点的检测方法一个实施例的流程图。如图1所示，该实施例物体关键点的检测方法包括：

102，利用第一神经网络对待检测图像中物体进行关键点定位，获得该物体的关键点的初始位置信息。

本发明实施例中，物体的关键点为物体所属物体类别中多数物体具有的、在功能和结构上可用于区分物体类别中不同款式物体的局部位置。每个物体可以具有一个或者多个关键点。

利用第一神经网络对待检测图像中物体进行关键点定位，获得该物体的关键点的初始位置信息时，具体可以先获取该物体的关键点，然后再获取各关键点的初始位置信息。

104，从至少二个复杂程度不同的第二神经网络中确定其中一个与上述待检测图像的检测难易程度对应的第二神经网络。

其中，神经网络的复杂程度可以通过神经网络的网络层数和/或网络参数来衡量，网络层数越多，网络参数越多，神经网络的复杂程度越高，即越复杂，需要占用的计算资源和存储资源越多，但是计算、处理能力越强。

106，利用确定的第二神经网络对上述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。

基于本发明上述实施例提供的物体关键点的检测方法，提出了自适应处理难易图像技术，首先利用第一神经网络对待检测图像中物体的关键点进行初始定位，获得物体的关键点以及各关键点的初始位置信息，对待检测图像的检测难易程度进行区分，从至少二个复杂程度不同的第二神经网络中确定其中一个与该待检测图像的检测难易程度对应的第二神经网络，对各关键点的初始位置信息进行修正，以获得各关键点修正后的位置信息，利用与不同检测难易程度对应的、不同的第二神经网络分别处理难易程度不同的图像，通过较简单的第二神经网络对检测难度较低的待检测图像进行处理，可以节省计算资源，避免计算资源的浪费；通过较复杂的、处理能力较强的第二神经网络对难度较高的待检测图像进行处理，可以提高处理效率和检测精度，从而提升了最终的物体识别的准确性。

在本发明物体关键点的检测方法的又一个实施例中，在图1所示实施例的操作104之前，还可以包括获取待检测图像的难易程度的操作。该获取待检测样本的难易程度的操作具体可以与102的操作同步执行，或者以任意的先后顺序执行。

图2为本发明物体关键点的检测方法另一个实施例的流程图。如图2所示，该实施例物体关键点的检测方法包括：

202，接收或获取待检测图像。

其中的待检测图像可以是实时接收到的图像，也可以是存储单元中的图像。

204，对待检测图像进行特征提取，获得待检测图像的图像特征。

206，对待检测图像中物体进行关键点定位，获得物体的关键点，并获取各关键点的初始位置信息；以及根据待检测图像的图像特征确定该待检测图像的难易程度。

其中的初始位置信息可以包括初始位置坐标。

作为其中一个具体示例，根据待检测图像的图像特征确定待检测样本的难易程度的操作，具体可以通过如下方式实现：

根据训练样本集中包括的、具有与待检测图像的图像特征相同特征的样本数量的多少，确定待检测样本的检测难易程度。其中的训练样本集中包括对神经网络进行训练以获得第二神经网络的样本图像，训练样本集中具有与待检测图像的图像特征相同特征的样本数量越多时，越易于实现对该待检测图像的处理，该待检测图像的检测难度越低；反之，训练样本集中具有与待检测图像的图像特征相同特征的样本数量越少时，越难于实现对该待检测图像的处理，该待检测图像的检测难度越高。

208，从至少二个复杂程度不同的第二神经网络中确定其中一个与上述待检测图像的检测难易程度对应的第二神经网络。

210，利用确定的第二神经网络对上述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。

具体地，待检测样本的检测难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多，即：确定处理待检测图像的第二神经网络的处理能力越强。

由于直接检测物体的关键点的位置是较困难的任务，本发明实施例中利用级联训练技术，先获取各关键点的初始位置信息，来给出对于物体关键点位置进行大致估计(可以称为第一阶段)，再对第一阶段获得的初始位置信息进行修正，来获得物体各关键点修正后的位置信息。通过将整个困难的物体关键点检测任务分解为两个阶段，可以减轻每个阶段的CNN网络模型学习复杂度。

在本发明实施例的具体应用中，可以根据待检测任务可能的检测难易程度情况，设置复杂程度不同的第二神经网络的数量，以及各复杂程度的第二神经网络对应的待检测图像的检测难易程度。例如，如果可能处理的待检测任务的检测难易程度对应的第二神经网络的复杂程度划分为5个阶段比较合理，则可以预先设置5个复杂程度的第二神经网络，并设置这5个复杂程度的第二神经网络对应处理的待检测图像的检测难易程度的分布范围。则在该具体示例中，待检测图像的检测难易程度按照由难到易包括最高、较高、适中、较低、最低共五个检测难易程度。相应地，5个复杂程度不同的第二神经网络包括分别适应于最高、较高、适中、较低、最低共五个检测难易程度的待检测图像的第二神经网络。其中，适应于检测难易程度高的待检测图像的第二神经网络的网络层数和/或网络参数大于适应于检测难易程度低的待检测图像的第二神经网络。

作为本发明实施例的另一个具体示例，待检测图像的检测难易程度至少包括较高难度和较低难度两个检测难易程度。相应地，至少二个复杂程度不同的第二神经网络至少包括适应于较高难度的待检测图像的第二神经网络和适应于较低难度的待检测图像的第二神经网络。其中，适应于较高难度的待检测图像的第二神经网络的网络层数和/或网络参数大于适应于较低难度的待检测图像的第二神经网络。

本发明实施例将实现第二阶段操作的第二神经网络分为两个分支，其中第一个分支的第二神经网络负责处理较难样本，而第二个分支的第二神经网络负责处理较易样本，通过自适应处理难易样本技术，降低了第二神经网络的学习复杂度。

本发明实施例提出利用级联技术来由粗到精地对物体(例如，服饰)关键点位置进行预测，并通过神经网络分支技术来自适应地处理不同难易程度的图像，可以联合优化各个操作执行单元的性能，并且能显著提升整个系统在各个测试任务上的结果。

在本发明各物体关键点的检测方法实施例的一个具体示例中，操作106或210中，利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息时，具体可以利用确定的第二神经网络对各关键点的初始位置坐标进行修正，获得所述待检测图像的各关键点修正后的位置坐标。

在本发明各物体关键点的检测方法实施例的一个具体示例中，操作106或208中，利用确定的第二神经网络对所述待检测图像的各关键点的初始位置信息进行修正，获得所述待检测图像的各关键点修正后的位置信息时，具体可以分别针对各关键点，获取修正后的位置坐标相对于初始位置坐标的相对位置；以及分别根据各关键点的初始位置坐标与所述相对于该初始位置坐标的相对位置，获得各关键点修正后的位置坐标。

其中，相对位置具体指以初始位置坐标为基准的相对位置。例如，x＝x1+dx，其中x为关键点的真实位置坐标，x1为该关键点的初始位置坐标，dx即为相对位置坐标，由于获取相对位置时搜索空间比绝对位置要小，获取相对位置比获取绝对位置的神经网络更容易训练和应用。

图3为本发明物体关键点的检测方法一个应用实施例的流程图。如图3所示，该应用实施例包括：

302，接收或获取待检测图像。

304，对待检测图像进行特征提取，获得待检测图像的图像特征。

306，对待检测图像中物体进行关键点定位，获得物体的一个以上关键点，并获取该一个以上关键点中各关键点的初始位置信息；以及根据待检测图像的图像特征确定待检测样本的难易程度。

其中的初始位置信息包括初始位置坐标和/或初始可见性状态。

308，从至少二个复杂程度不同的第二神经网络中确定其中一个与上述待检测图像的检测难易程度对应的第二神经网络。

310，利用确定的第二神经网络对上述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。

312，从待检测图像的图像特征中提取物体的全局特征，并分别从各关键点修正后的位置处提取该物体的局部特征。

314，根据该物体的全局特征与从各关键点修正后的位置处提取的局部特征进行物体识别，获得物体的识别结果，例如可以包括：物体的分类和细节属性。

特别地，本发明上述各实施例中的物体具体可以是服饰，或其他形状易变、或不同摆放方式和拍摄视角变化会影响识别效果的物体，例如棉被、纸画、油画、充气玩具等。本发明上述各实施例尤其适用于服饰或其他形状易变、或不同摆放方式和拍摄视角变化会影响识别效果的物体，例如棉被、纸画、油画、充气玩具等，相对于现有技术识别准确性的提升效果更明显。此时，物体的识别结果包括：物体的分类和细节属性。其中，分类例如上装、和服、西装、卫衣、毛衣等，细节属性例如各种花式、纹理、领口类型、袖口类型等，细节属性的特征例如荷花边袖口、V型领等。

例如，图4为本发明服饰关键点的检测方法一个实施例的流程图。如图4所示，该实施例服饰关键点的检测方法包括：

402，利用第一神经网络对待检测图像中服饰进行关键点定位，获得该服饰的关键点的初始位置信息。

初始位置信息包括初始位置坐标和/或初始可见性状态。

本发明实施例中，服饰的关键点为服饰所属服饰类别中多数服饰具有的、在功能和结构上可用于区分服饰类别中不同款式服饰的局部位置，例如可以包括领口、袖口和下摆等。每个服饰可以具有一个或者多个关键点。可见性状态(包括初始可见性状态或修正后的可见性状态)包括以下至少之一：可见、遮挡和截断。

利用第一神经网络对待检测图像中服饰进行关键点定位，获得该服饰的关键点的初始位置信息时，具体可以先获取该服饰的关键点，然后再获取各关键点的初始位置信息。

404，从至少二个复杂程度不同的第二神经网络中确定其中一个与上述待检测图像的检测难易程度对应的第二神经网络。

406，利用确定的第二神经网络对上述待检测图像的各关键点的初始位置信息进行修正，获得各关键点修正后的位置信息。

对于服饰或其他形状易变、或不同摆放方式和拍摄视角变化会影响识别效果的物体，操作406中可以基于本发明上述各实施例对初始位置信息中的初始位置坐标进行修正而不修正初始可见性状态，输出待检测图像的各关键点修正后的位置信息和初始可见性状态。

另外，操作404中除了基于本发明上述各实施例对初始位置信息中的初始位置坐标进行修正，还可以进一步利用确定的第二神经网络对各关键点的初始可见性状态进行修正，获得待检测图像的各关键点修正后的可见性状态。

在其中一个具体示例中，利用确定的第二神经网络对各关键点的初始可见性状态进行修正，具体可以通过如下方式实现：

在另一个具体示例中，利用确定的第二神经网络对各关键点的初始可见性状态进行修正，具体可以通过如下方式实现：

分别针对各关键点，获取根据各初始可见性状态的概率值与相对于各初始可见性状态的概率值的相对概率偏差，获取修正后的各可见性状态的概率值；

另外，在本发明物体关键点的检测方法的再一个实施例中，还可以预设初始关键点检测神经网络，将被预先标注关键点信息的样本图像作为待检测图像输入初始关键点检测神经网络，以被预先标注关键点信息作为监督信息，对初始关键点检测神经网络进行迭代训练直至设定指标满足预定收敛条件，获得最终的关键点检测神经网络；最终的神经网络包括第一神经网络和至少二个复杂程度不同的第二神经网络，标准关键点信息包括关键点数量以及各关键点的标准位置信息。

其中，被预先的标注关键点信息具体可以包括关键点数量以及各关键点的标准位置信息，该标准位置信息包括标准位置坐标，还可以进一步包括标准可见性状态。

设定指标满足预定收敛条件，例如可以是，初始关键点检测神经网络输出的关键点信息与述标准关键点信息之间的偏差小于第一预设阈值；和/或，初始关键点检测神经网络进行迭代训练的次数达到第二预设阈值。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

图5为本发明物体关键点的检测装置一个实施例的结构示意图。该实施例的物体关键点的检测装置可用于实现本发明上述各实施例的物体关键点的检测方法。本发明各实施例的物体关键点的检测装置具体可以示例性但不被限制地是由CNN构成的关键点检测模型。如图5所示，该实施例的物体识别装置包括：第一特征提取单元，初检测单元，选取单元和修正检测单元。其中：

第一特征提取单元，用于对待检测图像进行特征提取，获得待检测图像的图像特征。

初检测单元，用于作为第一神经网络，根据待检测图像的图像特征，对待检测图像中物体进行关键点定位，获得物体的一个以上关键点，并获取各关键点的初始位置信息。

选取单元，用于从至少二个复杂程度不同的第二神经网络中确定其中一个与上述待检测图像的检测难易程度对应的第二神经网络。

修正检测单元，用于作为确定的第二神经网络，对待检测图像的各关键点的初始位置信息进行修正，获得待检测图像的各关键点修正后的位置信息。

基于本发明上述实施例提供的物体关键点的检测装置，提出了自适应处理难易图像技术，首先利用第一神经网络对待检测图像中物体的关键点进行初始定位，获得物体的关键点以及各关键点的初始位置信息，对待检测图像的检测难易程度进行区分，从至少二个复杂程度不同的第二神经网络中确定其中一个与该待检测图像的检测难易程度对应的第二神经网络，对各关键点的初始位置信息进行修正，以获得各关键点修正后的位置信息，利用与不同检测难易程度对应的、不同的第二神经网络分别处理难易程度不同的图像，通过较简单的第二神经网络对检测难度较低的待检测图像进行处理，可以节省计算资源，避免计算资源的浪费；通过较复杂的、处理能力较强的第二神经网络对难度较高的待检测图像进行处理，可以提高处理效率和检测精度，从而提升了最终的物体识别的准确性。

图6为本发明物体关键点的检测装置另一个实施例的结构示意图。如图6所示，与图5所示的实施例相比，该物体关键点的检测装置还包括难度检测单元，用于获取待检测图像的难易程度。

示例性地，难度检测单元具体可用于根据待检测图像的图像特征确定待检测图像的难易程度。

进一步地，难度检测单元，具体用于根据训练样本集中包括的具有与上述检测图像的图像特征相同特征的样本数量的多少，确定该待检测图像的难易程度。其中，训练样本集中包括的具有与上述检测图像的图像特征相同特征的样本数量越多，该待检测图像的检测难度越低；反之，待检测图像的难度越高。

其中，可以根据实际需求，设置在满足包括但不限于以下任意一个或多个条件时，认为训练样本集中包括与检测图像的图像特征相同特征的样本：

训练样本集中有样本的特征与检测图像的图像特征完全相同；

训练样本集中有样本的特征包括但多于检测图像的图像特征；

训练样本集中有样本的特征与检测图像的图像特征之间的相同特征达到一定数量或者预设的一定比例；

训练样本集中有样本的特征与检测图像的图像特征之间的相同特征满足其他预设条件。

相应地，待检测样本的难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多。

作为本发明实施例的一个具体示例，可以将待检测图像的检测难易程度划分为较高难度和较低难度两个难易程度。相应地，至少二个复杂程度不同的第二神经网络至少包括适应于较高检测难度的第二神经网络和适应于较低检测难度的第二神经网络。其中，适应于较高检测难度的第二神经网络的网络层数越多和/或网络参数大于适应于较低难度的待检测图像的第二神经网络。

在本发明各物体关键点的检测装置实施例的一个具体示例中，初始位置信息包括初始位置坐标。修正检测单元具体用于对各关键点的初始位置坐标进行修正，获得待检测图像的各关键点修正后的位置坐标。

在本发明各物体关键点的检测装置实施例的另一个具体示例中，初始位置信息包括初始位置坐标。修正检测单元具体用于分别针对各关键点，获取修正后的位置坐标相对于初始位置坐标的相对位置；以及分别根据各关键点的初始位置坐标与相对于该初始位置坐标的相对位置，获得各关键点修正后的位置坐标。

再参见图6，在本发明物体关键点的检测装置的另一个实施例中，还可以包括：第二特征提取单元和物体识别单元。其中：

第二特征提取单元，用于从待检测图像的图像特征中提取物体的全局特征，并分别从各关键点的真实位置处提取物体的局部特征。

物体识别单元，用于结合物体的全局特征与从各关键点的真实位置处提取的局部特征进行物体识别，获得物体的识别结果，例如可以包括：物体的分类和细节属性。

本发明上述各物体关键点的检测装置实施例的一个具体示例中，物体具体可以为服饰，或其他形状易变、或不同摆放方式和拍摄视角变化会影响识别效果的物体，例如棉被、纸画、油画、充气玩具等。则服饰的关键点可以包括领口、袖口和下摆等；物体的分类例如上装、和服、西装、卫衣、毛衣等，细节属性例如各种花式、纹理、领口类型、袖口类型等，细节属性的特征例如荷花边袖口、V型领等。

物体为服饰或其他形状易变、或不同摆放方式和拍摄视角变化会影响识别效果的物体时，上述初始位置信息还可以包括初始可见性状态。

相应地，修正检测单元，还用于利用确定的第二神经网络对各关键点的初始可见性状态进行修正，获得待检测图像的各关键点修正后的可见性状态。

在其中一个具体示例中，修正检测单元具体用于分别针对各关键点，获取修正后的各可见性状态的概率值；以及分别针对各关键点，从修正后的各可见性状态的概率值中选取一个最高的概率值对应的可见性状态作为该关键点修改后的可见性状态。

在另一个具体示例中，修正检测单元具体用于分别针对各关键点，获取修正后的各可见性状态的概率值相对于各初始可见性状态的概率值的相对概率偏差；分别针对各关键点，获取根据各初始可见性状态的概率值与相对于各初始可见性状态的概率值的相对概率偏差，获取修正后的各可见性状态的概率值；以及分别针对各关键点，从修正后的各可见性状态的概率值中选取一个最高的概率值对应的可见性状态作为该关键点修改后的可见性状态。

图7为本发明物体关键点的检测装置一个实施例的结构示意图。如图7所示，与图5或图6所示的实施例相比，该实施例的物体关键点的检测装置还包括网络训练单元，用于将了关键点信息的样本图像作为待检测图像输入初始关键点检测神经网络，以被预先标注的关键点信息作为监督信息，对初始关键点检测神经网络进行迭代训练直至设定指标满足预定收敛条件，获得最终的关键点检测神经网络；最终的神经网络包括第一神经网络和至少二个复杂程度不同的第二神经网络，标准关键点信息包括关键点数量以及各关键点的标准位置信。

其中，设定指标满足预定收敛条件可以包括：初始关键点检测神经网络输出的关键点信息与标准关键点信息之间的偏差小于第一预设阈值；和/或，初始关键点检测神经网络进行迭代训练的次数达到第二预设阈值。本发明实施例还提供了一种数据处理装置，包括本发明上述任一实施例提供的物体关键点的检测装置。

具体地，本发明实施例的数据处理装置可以是任意具有数据处理功能的装置，例如可以包括但不限于：进阶精简指令集机器(ARM)、中央处理单元(CPU)或图形处理单元(GPU)等。

基于本发明上述实施例提供的数据处理装置，包括本发明上述任一实施例提供的物体关键点的检测装置，利用第一神经网络对待检测图像中物体的关键点进行初始定位，获得物体的关键点以及各关键点的初始位置信息后，从至少二个复杂程度不同的第二神经网络中确定其中一个与该待检测图像的检测难易程度对应的第二神经网络，对各关键点的初始位置信息进行修正，可以节省计算资源，避免计算资源的浪费；并提高处理效率和检测精度，从而提升了最终的物体识别的准确性。

另外，本发明实施例还提供了一种电子设备，例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等，该电子设备设置有本发明上述任一实施例的数据处理装置。

基于本发明上述实施例提供的电子设备，包括本发明上述数据处理装置，从而包括本发明上述任一实施例提供的物体关键点的检测装置，利用第一神经网络对待检测图像中物体的关键点进行初始定位，获得物体的关键点以及各关键点的初始位置信息后，从至少二个复杂程度不同的第二神经网络中确定其中一个与该待检测图像的检测难易程度对应的第二神经网络，对各关键点的初始位置信息进行修正，可以节省计算资源，避免计算资源的浪费；并提高处理效率和检测精度，从而提升了最终的物体识别的准确性。

图8为本发明电子设备一个应用实施例的结构示意图。如图8所示，用于实现本发明实施例的电子设备包括中央处理单元(CPU)或者图形处理单元(GPU)，其可以根据存储在只读存储器(ROM)中的可执行指令或者从存储部分加载到随机访问存储器(RAM)中的可执行指令而执行各种适当的动作和处理。中央处理单元或者图形处理单元可与只读存储器和/或随机访问存储器中通信以执行可执行指令从而完成本发明实施例提供的物体关键点的检测方法对应的操作，例如：接收或获取待检测图像；对所述待检测图像中物体进行关键点定位，获得所述物体的一个以上关键点，并获取所述一个以上关键点中各关键点的初始位置信息，所述初始位置信息包括初始位置坐标和/或初始可见性状态；通过与所述待检测图像的难易程度对应的神经网络对各关键点的初始位置坐标进行修正，以获得各关键点的真实位置信息。

此外，在RAM中，还可存储有系统操作所需的各种程序和数据。CPU、GPU、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。

以下部件连接至I/O接口：包括键盘、鼠标等的输入部分；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分；包括硬盘等的存储部分；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器上，以便于从其上读出的计算机程序根据需要被安装入存储部分。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，计算机程序包含用于执行流程图所示的方法的程序代码，所述程序代码可包括对应执行本发明实施例提供的任一项物体关键点的检测方法步骤对应的指令，例如，接收或获取待检测图像的指令；对所述待检测图像中物体进行关键点定位，获得所述物体的一个以上关键点，并获取所述一个以上关键点中各关键点的初始位置信息的指令，所述初始位置信息包括初始位置坐标和/或初始可见性状态；通过与所述待检测图像的难易程度对应的神经网络对各关键点的初始位置坐标进行修正，以获得各关键点的真实位置信息的指令。该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)或图形处理单元(GPU)执行时，执行本发明的方法中限定的上述功能。

本发明实施例还提供了一种计算机存储介质，用于存储计算机可读取的指令，所述指令包括：接收或获取待检测图像的指令；对所述待检测图像中物体进行关键点定位，获得所述物体的一个以上关键点，并获取所述一个以上关键点中各关键点的初始位置信息的指令，所述初始位置信息包括初始位置坐标和/或初始可见性状态；通过与所述待检测图像的难易程度对应的神经网络对各关键点的初始位置坐标进行修正，以获得各关键点的真实位置信息的指令。

另外，本发明实施例还提供了一种计算机设备，包括：

存储器，存储可执行指令；

一个或多个处理器，与存储器通信以执行可执行指令从而完成本发明上述任一实施例的物体关键点的检测方法或服饰关键点的检测方法对应的操作。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本发明的方法和装置、设备。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置、设备。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

本发明的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种物体关键点的检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，从至少二个复杂程度不同的第二神经网络中确定其中一个与所述待检测图像的检测难易程度对应的第二神经网络之前，还包括：

获取所述待检测图像的难易程度。

3.根据权利要求2所述的方法，其特征在于，所述获取所述待检测图像的难易程度之前，还包括：

4.根据权利要求3所述的方法，其特征在于，根据所述检测图像的图像特征确定所述待检测图像的难易程度包括：

5.根据权利要求1至4任一所述的方法，其特征在于，所述待检测图像的难度越高，确定的第二神经网络的网络层数越多和/或网络参数越多。

6.根据权利要求4或5所述的方法，其特征在于，待检测图像的难易程度至少包括较高难度和较低难度；

7.一种服饰关键点的检测方法，其特征在于，包括：

8.一种物体关键点的检测装置，其特征在于，包括：

9.一种数据处理装置，其特征在于，包括权利要求8所述的物体关键点的检测装置。

10.一种电子设备，其特征在于，设置有权利要求9所述的数据处理装置。