CN106803056B

CN106803056B - 一种肢体关系的估计方法及装置

Info

Publication number: CN106803056B
Application number: CN201510845504.8A
Authority: CN
Inventors: 初晓; 欧阳万里; 王晓刚; 黎伟; 刘健庄
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2015-11-26
Filing date: 2015-11-26
Publication date: 2020-11-06
Anticipated expiration: 2035-11-26
Also published as: EP3173972A1; CN106803056A; US20170154213A1; US10115009B2

Abstract

本发明公开了一种肢体关系的估计方法及装置，该方法包括：获取目标图片；根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；第一位置信息通过对每个人物进行单人姿态估计而获取得到，第二位置信息通过在第一位置信息指示两个人物之间的身体部位有重叠时，对两个人物进行双人联合姿态估计而获取得到；根据第一肢体关系特征，确定两个人物的肢体关系。实施本发明实施例，可以提高肢体关系估计的准确性。

Description

一种肢体关系的估计方法及装置

技术领域

本发明涉及计算机技术领域，具体涉及一种肢体关系的估计方法及装置。

背景技术

人际关系是一种资源。通过人际关系可以进一步推断出人们的生活圈子、消费水平、社会地位、甚至个人喜好，进而做有目的的推荐或者优质客户挽留等，这些对于商家来说无疑具有重要意义。人际关系的获取有多种方式，目前常通过大量数据的分析来推断人际关系。其中，照片提供了最为直观的视觉信息，随着照相成为手机的一种重要功能，照片的数量爆炸式增长，人们乐意将自己和亲朋好友的照片分享到Facebook等网络媒介，这些资源为通过照片进行人际关系估计提供了可行性。

人与人的肢体位置关系往往会反映人与人的亲密程度，进而可以推断出人际关系。对于让计算机自动判别照片中的两个人的肢体关系，现有技术中首先对图像做人体检测，然后对检测到的每一个人体做单人姿态估计，进而对姿态估计结果有重叠的两个人体做双人联合姿态估计，进而得到人体的肢体关系。

单人姿态估计或双人联合姿态估计因为容易受到遮挡等因素的影响，准确性不高，因此，由于缺乏对单人姿态估计或双人姿态估计结果的有效分析，直接根据单人姿态估计或双人联合姿态估计的结果估计出的肢体关系的准确性不高。

发明内容

本发明实施例公开一种肢体关系的估计方法及装置，用于提高肢体关系估计的准确性。

本发明实施例第一方面公开一种肢体关系的估计方法，包括：

获取目标图片，目标图片可以是存储在本地的图片，也可以是通过网络获取的图片；

根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；其中，第一位置信息可以是通过对每个人物进行单人姿态估计获取得到的，第二位置信息可以是当第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计获取得到的；其中，第一位置信息和第二位置信息是绝对位置信息；

利用第一肢体关系特征确定两个人物的肢体关系。

在一个实施例中，第一肢体关系特征可以包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度、两个人物的重叠比例以及两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离中的至少一种。

在一个实施例中，第一位置信息可以包括用于表示每个人物的身体部位的位置的第一区域；两个人物的重叠比例可以包括：两个人物各自的第i个身体部位的重叠比例，i为大于或等于1的整数；

当第一肢体关系特征包括两个人物的重叠比例时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的重叠比例可以包括：

利用如下公式计算两个人物各自的第i个身体部位的重叠比例：

其中，Ψ_ov表示两个人物各自的第i个身体部位的重叠比例，

表示两个人物中的第一个人物的第i个身体部位的位置的第一区域，

表示两个人物中的第二个人物的第i个身体部位的位置的第一区域。

在一个实施例中，两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离包括两个人物中每个人物的第j个身体部位到这两个人物的中心位置的相对距离，第一位置信息可以包括每个人物的身体部位在目标图片中的坐标，j为大于或等于1的整数；

当第一肢体关系特征包括两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离包括：

利用如下公式计算两个人物中每个人物的第j个身体部位到这两个人物的中心位置的相对距离：

其中，Ψ_L表示两个人物中每个人物的第j个身体部位到这两个人物的中心位置的相对距离，

表示这两个人物中的第k个人物的第j个身体部位在目标图片中的坐标，n表示每个人物包括的身体部位的总数量，n_scale为中心位置到这两个人物所有身体部位的距离的和，

表示中心位置的坐标，n为大于1的整数，k为1或2。

在一个实施例中，第一位置信息可以包括用于表示每个人物的身体部位的位置的第一区域，第二位置信息可以包括用于表示每个人物的身体部位的位置的第二区域，第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度包括：用于表示每个人物的第t个身体部位的位置的第一区域与用于表示每个人物的第t个身体部位的位置的第二区域的匹配度，t为大于或等于1的整数；

当第一肢体关系特征包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度包括：

利用如下公式计算用于表示每个人物的第t个身体部位的位置的第一区域与用于表示每个人物的第t个身体部位的位置的第二区域的匹配度：

其中，Ψ_m表示用于表示每个人物的第t个身体部位的位置的第一区域与用于表示每个人物的第t个身体部位的位置的第二区域的匹配度，

表示用于表示每个人物的第t个身体部位的位置的第一区域，

表示用于表示每个人物的第t个身体部位的位置的第二区域，其中，第一(或二)区域可以是包括身体部位的正方形区域。

在一个实施例中，肢体关系可以包括：两个人物之间的肢体交互关系、两个人物之间的相对距离、两个人物之间的身体倾斜方向以及两个人物之间的身体朝向中的至少一种，其中，肢体交互关系可以包括手挽手、握手、拥抱、背抱、击掌、手搭肩、肩并肩等中的至少一种，相对距离可以是近、中、远，身体倾斜方向可以是左倾、右倾、直立，身体朝向可以是前、后、左、右。

在一个实施例中，该方法还可以包括：

获取两个人物的第二肢体关系特征，第二肢体关系特征可以包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；其中，第一可信度值以及第一方向信息是通过对每个人物进行单人姿态估计获取得到的，第二可信度值以及第二方向信息是在第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计获取得到的；其中，第一(或二)位置信息的第一可信度值是处于第一(二)位置信息对应位置的身体部位在第一(或二)位置信息对应位置的可信度；每个人物的身体部位的第一(或二)方向信息是每个人物的身体部位可以展现出来的各种姿势对应的方向的信息；

当获取有第二肢体关系特征时，根据第一肢体关系特征确定两个人物的肢体关系可以包括：

根据第一肢体关系特征以及第二肢体关系特征确定两个人物的肢体关系。可以根据第一肢体关系特征和第二肢体关系特征共同确定两个人物的肢体关系，可以进一步提高肢体关系估计的准确性。

在一个实施例中，根据第一肢体关系特征以及第二肢体关系特征，确定两个人物的肢体关系可以包括：

将第一肢体关系特征以及第二肢体关系特征作为第一层神经网络模型的输入；

将第g层神经网络模型的输出确定为第g+1层神经网络模型的输入，直到得到第N层神经网络模型的输出，N为大于或等于1的整数，g为大于或等于1且小于或等于N-1的整数；

将第N层神经网络模型的输出确定为第N+1层神经网络模型的第一次递归的输入；

将第N+1层神经网络模型的第q次递归的输出和第N层神经网络模型的输出确定为第N+1层神经网络模型的第q+1次递归的输入，直到得到第N+1层神经网络模型的第M次递归的输出，将第N+1层神经网络模型的第M次递归的输出确定为两个人物的肢体关系，M为大于1的整数，q为大于或等于1且小于或等于M-1的整数。其中，神经网络模型可以为深度神经网络算法。

在一个实施例中，神经网络模型的前N层可以表示为如下公式：

其中，h_g+1,1表示第g+1层神经网络模型的输出，W₁、b₁、W_g+1和b_g+1表示神经网络模型的参数，f(〃)表示非线性的激活函数，α表示第一肢体关系特征以及第二肢体关系特征；相应地，

M次递归可以表示为如下公式：

其中，P_q表示第N+1层神经网络模型的第q次递归的输出，在q为M时，P_q表示两个人物的肢体关系，h_N+1,q+1表示第N+1层神经网络模型的第q+1次递归的中间变量，W_N+1、W_b、b_N+1、W_cls和b_cls表示神经网络模型的参数。其中，神经网络模型中的所有参数都可以通过训练得到。其中，N和M是在训练过程中使输出结果误差小于预设值时的迭代次数和递归次数。

本发明实施例第二方面公开一种用于肢体关系估计的神经网络模型的生成方法，包括：

获取至少一张训练图片；

根据至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；其中，第一位置信息是通过对每个人物进行单人姿态估计得到的，第二位置信息是在第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计得到的；

根据第一肢体关系特征以及两个人物的预设的肢体关系确定神经网络模型。

在一个实施例中，该方法还可以包括：

获取两个人物的第二肢体关系特征，第二肢体关系特征可以包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；其中，第一可信度值以及第一方向信息是通过对每个人物进行单人姿态估计得到的，第二可信度值以及第二方向信息是在第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计得到的；其中，第一(或二)位置信息的第一可信度值是处于第一(二)位置信息对应位置的身体部位在第一(或二)位置信息对应位置的可信度；每个人物的身体部位的第一(或二)方向信息是每个人物的身体部位可以展现出来的各种姿势对应的方向的信息；

相应地，根据第一肢体关系特征以及两个人物的预设的肢体关系确定神经网络模型可以包括：

根据第一肢体关系特征、第二肢体关系特征以及两个人物的预设的肢体关系确定神经网络模型。可以根据第一肢体关系特征和第二肢体关系特征共同确定两个人物的神经网络模型，可以进一步提高神经网络模型的准确性。

本发明实施例第三方面公开一种肢体关系的估计装置，包括：

第一获取单元，用于获取目标图片，目标图片可以是存储在本地的图片，也可以是通过网络获取的图片；

计算单元，用于根据第一获取单元获取的目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；其中，第一位置信息可以是通过对每个人物进行单人姿态估计获取得到的，第二位置信息可以是当第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计获取得到的；其中，第一位置信息和第二位置信息是绝对位置信息；

确定单元，用于根据计算单元计算的第一肢体关系特征确定两个人物的肢体关系。

当第一肢体关系特征包括两个人物的重叠比例时，计算单元计算两个人物的重叠比例的方式具体为：

其中，Ψ_ov表示两个人物各自的第i个身体部位的重叠比例，

当第一肢体关系特征包括两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离时，计算单元计算两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离的方式具体为：

利用如下公式计算每个人物的第j个身体部位到两个人物的中心位置的相对距离：

表示中心位置的坐标，n为大于1的整数，k为1或2。

当第一肢体关系特征包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度时，计算单元计算第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度的方式具体为：

表示用于表示每个人物的第t个身体部位的位置的第一区域，

在一个实施例中，该装置还可以包括：

第二获取单元，用于获取两个人物的第二肢体关系特征，第二肢体关系特征包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；其中，第一可信度值以及第一方向信息是通过对每个人物进行单人姿态估计获取得到的，第二可信度值以及第二方向信息是在第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计获取得到的；其中，第一(或二)位置信息的第一可信度值是处于第一(二)位置信息对应位置的身体部位在第一(或二)位置信息对应位置的可信度；每个人物的身体部位的第一(或二)方向信息是每个人物的身体部位可以展现出来的各种姿势对应的方向的信息；

相应地，确定单元，具体用于根据计算单元计算的第一肢体关系特征以及第二获取单元获取的第二肢体关系特征，确定两个人物的肢体关系。

在一个实施例中，确定单元根据第一肢体关系特征以及第二肢体关系特征，确定两个人物的肢体关系的方式具体为：

在一个实施例中，神经网络模型的前N层表示为如下公式：

M次递归表示为如下公式：

其中，P_q表示第N+1层神经网络模型的第q次递归的输出，在q为M时，P_q表示两个人物的肢体关系，h_N+1,q+1表示第N+1层神经网络模型的第q+1次递归的中间变量，W_N+1、W_b、b_N+1、W_cls和b_cls表示神经网络模型的参数。其中，神经网络模型中的参数可以通过训练得到。

本发明实施例第四方面公开一种用于肢体关系估计的神经网络模型的生成装置，包括：

第一获取单元，用于获取至少一张训练图片；

计算单元，用于根据第一获取单元获取的至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；其中，第一位置信息是通过对每个人物进行单人姿态估计得到的，第二位置信息是在第一位置信息指示述两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计得到的；

确定单元，用于根据计算单元计算的第一肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

在一个实施例中，该装置还可以包括：

第二获取单元，用于获取两个人物的第二肢体关系特征，第二肢体关系特征包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；其中，第一可信度值以及第一方向信息是通过对每个人物进行单人姿态估计得到的，第二可信度值以及第二方向信息是在第一位置信息指示两个人物之间的身体部位有重叠时，通过对两个人物进行双人联合姿态估计得到的；其中，第一(或二)位置信息的第一可信度值是处于第一(二)位置信息对应位置的身体部位在第一(或二)位置信息对应位置的可信度；每个人物的身体部位的第一(或二)方向信息是每个人物的身体部位可以展现出来的各种姿势对应的方向的信息；

相应地，确定单元，具体用于根据计算单元计算的第一肢体关系特征、第二获取单元获取的第二肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

本发明实施例中，先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算两个人物的肢体关系特征，之后根据肢体关系特征确定两个人物的肢体关系，可以提高肢体关系估计的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种肢体关系的估计方法的流程图；

图2是本发明实施例公开的一种用于肢体关系估计的神经网络模型的生成方法的流程图；

图3是本发明实施例公开的一种肢体关系的估计装置的结构图；

图4是本发明实施例公开的另一种肢体关系的估计装置的结构图；

图5是本发明实施例公开一种用于肢体关系估计的神经网络模型的生成装置的结构图；

图6是本发明实施例公开另一种用于肢体关系估计的神经网络模型的生成装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开一种肢体关系的估计方法及装置，用于提高肢体关系估计的准确性。以下分别进行详细说明。

请参阅图1，图1是本发明实施例公开的一种肢体关系的估计方法的流程图。其中，该肢体关系的估计方法适用于可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图1所示，该肢体关系的估计方法可以包括以下步骤。

101、获取目标图片。

本实施例中，当需要通过计算机等设备确定图片中两个人物的肢体关系时，用户可以向设备输入肢体关系确定指令，之后可以是设备自动从网络或本地获取目标图片，也可以是在用户的操作下使设备从网络或本地获取目标图片，本实施例不作限定。当图片只包括一个人物时，无法通过该图片确定这个人物与其它人物之间的肢体关系，因此，该肢体关系的估计方法适用于包括至少两个人物的图片。

102、根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征。

本实施例中，第一肢体关系特征可以包括第一位置信息所表示的人物的身体部位与第二位置信息所表示的两个人物中的任一人物的身体部位的匹配度、第一位置信息所表示的两个人物的重叠比例以及第一位置信息所表示的两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离中的至少一种，第一肢体关系特征包括的元素越多，估计的肢体关系的准确性越高，第一肢体关系特征包括的各个元素的计算公式与发明内容部分相同，在此不再赘述。其中，单人姿态估计是根据方向梯度直方图(Histogram ofOriented Gradient，HOG)特征和支持向量机(Support Vector Machine，SVM)分类器对图片中每个人物进行独立的估计，双人联合姿态估计是当图片中两个人物有重叠部分时，根据HOG特征和SVM对这两个人物进行联合估计。

103、获取两个人物的第二肢体关系特征。

本实施例中，第二肢体关系可以包括第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种。其中，第一(或二)位置信息的第一可信度值是处于第一(二)位置信息对应位置的身体部位在第一(或二)位置信息对应位置的可信度，其值越高表明其可信度越高。其中，每个人物的身体部位的第一(或二)方向信息是每个人物的身体部位可以展现出来的各种姿势对应的方向的信息，例如：当人站立时，手可以放置的方向。

104、根据第一肢体关系特征，或者根据第一肢体关系特征和第二肢体关系特征，确定两个人物的肢体关系。

本实施例中，肢体关系可以包括两个人物之间的肢体交互关系、两个人物之间的相对距离、两个人物之间的身体倾斜方向以及两个人物之间的身体朝向中的至少一种。肢体关系可以由第一肢体关系特征确定，也可以由第一肢体关系特征和第二肢体关系特征共同确定，但由第一肢体关系特征和第二肢体关系特征共同确定的准确性，要比由第一肢体关系特征确定的准确性要高。

在图1所描述的肢体关系的估计方法，先根据单人姿态估计和双人联合姿态估计的估计得到身体部位的位置信息，进一步计算两个人物的肢体关系特征，之后根据肢体关系特征确定两个人物的肢体关系，可以提高肢体关系估计的准确性。

请参阅图2，图2是本发明实施例公开一种用于肢体关系估计的神经网络模型的生成方法。其中，该用于肢体关系估计的神经网络模型的生成方法适用于可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图2所示，该用于肢体关系估计的神经网络模型的生成方法可以包括以下步骤。

201、获取至少一张训练图片。

本实施例中，为了得到实施例一所需要的神经网络模型，可以先获取至少一张训练图片进行训练。

202、根据至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征。

本实施例中，第一位置信息是通过对训练图片中的每个人物进行单人姿态估计得到的，第二位置信息是在第一位置信息指示目标图片中有两个人物之间的身体部位存在重叠时，通过对目标图片中有重叠的两个人物进行双人联合姿态估计得到的；其中，第一肢体关系特征可以包括第一位置信息所表示的人物的身体部位与第二位置信息所表示的两个人物中的任一人物的身体部位的匹配度、第一位置信息所表示的两个人物的重叠比例以及第一位置信息所表示的两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离中的至少一种。其中，单人姿态估计是根据HOG和SVM分类器对图片中每个人物进行独立的估计，双人联合姿态估计是当图片中两个人物有重叠部分时，根据HOG特征和SVM对这两个人物进行联合估计。

203、获取两个人物的第二肢体关系特征。

204、根据第一肢体关系特征以及两个人物的预设的肢体关系，或者根据第一肢体关系特征、第二肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

本实施例中，神经网络模型可以由第一肢体关系特征确定和两个人物的预设的肢体关系，也可以由第一肢体关系特征、第二肢体关系特征以及两个人物的预设的肢体关系共同确定，但由第一肢体关系特征、第二肢体关系特征以及两个人物的预设的肢体关系共同确定的准确性，要比由第一肢体关系特征确定和两个人物的预设的肢体关系确定的准确性要高。

在图2所描述的用于肢体关系估计的神经网络模型的生成方法，先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算训练图片中两个人物的肢体关系特征，之后根据肢体关系特征确定神经网络模型，可以提高神经网络模型的准确性。

请参阅图3，图3是本发明实施例公开的一种肢体关系的估计装置。其中，该肢体关系的估计装置是可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图3所示，该肢体关系的估计装置可以包括：

第一获取单元301，用于获取目标图片；

计算单元302，用于根据第一获取单元301获取的目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；

第一位置信息通过对每个人物进行单人姿态估计而获取得到，第二位置信息通过在第一位置信息指示两个人物之间的身体部位有重叠时，对两个人物进行双人联合姿态估计而获取得到；

确定单元303，用于根据计算单元302计算的第一肢体关系特征，确定两个人物的肢体关系。

作为一种可能的实施方式，第一肢体关系特征可以包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度、两个人物的重叠比例以及两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离中的至少一种。

作为一种可能的实施方式，第一位置信息可以包括用于表示每个人物的身体部位的位置的第一区域，两个人物的重叠比例包括：两个人物各自的第i个身体部位的重叠比例，i为大于或等于1的整数；

当第一肢体关系特征包括两个人物的重叠比例时，计算单元302计算两个人物的重叠比例的方式具体为：

其中，Ψ_ov表示两个人物各自的第i个身体部位的重叠比例，

作为一种可能的实施方式，两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离包括每个人物中的第j个身体部位到这两个人物的中心位置的相对距离，第一位置信息可以包括每个人物的身体部位在目标图片中的坐标，j为大于或等于1的整数；

当第一肢体关系特征包括两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离时，计算单元302计算两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离的方式具体为：

利用如下公式计算每个人物的第j个身体部位到这两个人物的中心位置的相对距离：

其中，Ψ_L表示每个人物的第j个身体部位到这两个人物的中心位置的相对距离，

表示中心位置的坐标，n为大于1的整数，k为1或2。

作为一种可能的实施方式，第一位置信息可以包括用于表示每个人物的身体部位的位置的第一区域，第二位置信息可以包括用于表示每个人物的身体部位的位置的第二区域，第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度包括：用于表示每个人物的第t个身体部位的位置的第一区域与用于表示每个人物的第t个身体部位的位置的第二区域的匹配度，t为大于或等于1的整数；

当第一肢体关系特征包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度时，计算单元302计算第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度的方式具体为：

表示用于表示每个人物的第t个身体部位的位置的第一区域，

表示用于表示每个人物的第t个身体部位的位置的第二区域。

作为一种可能的实施方式，肢体关系可以包括两个人物之间的肢体交互关系、两个人物之间的相对距离、两个人物之间的身体倾斜方向以及两个人物之间的身体朝向中的至少一种，肢体交互关系可以包括手挽手、握手以及拥抱中至少一种。

作为一种可能的实施，该肢体关系的估计装置300还可以包括：

第二获取单元304，用于获取两个人物的第二肢体关系特征，第二肢体关系特征可以包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；

第一可信度值以及第一方向信息为通过对每个人物进行单人姿态估计而获取得到，第二可信度值以及第二方向信息通过在第一位置信息指示两个人物之间的身体部位有重叠时，对两个人物进行双人联合姿态估计而获取得到；

相应地，确定单元303，具体用于根据计算单元302计算的第一肢体关系特征以及第二获取单元304获取的第二肢体关系特征，确定两个人物的肢体关系。

作为一种可能的实施方式，确定单元303根据第一肢体关系特征以及第二肢体关系特征，确定两个人物的肢体关系的方式具体为：

将第一肢体关系特征以及第二肢体关系特征作为第N+1层神经网络模型的输入，将神经网络模型的第N+1层的输出作为两个人物的肢体关系，第N+1层包括M次递归，第N+1层的输出包括第M次递归的输出，N为大于或等于1的整数，M为大于1的整数。

作为一种可能的实施方式，神经网络模型的前N层可以表示为如下公式：

M次递归可以表示为如下公式：

其中，P_q表示第N+1层神经网络模型的第q次递归的输出，在q为M时，P_q表示两个人物的肢体关系，h_N+1,q+1表示第N+1层神经网络模型的第q+1次递归的中间变量，W_N+1、W_b、b_N+1、W_cls和b_cls表示神经网络模型的参数。

在图3所描述的肢体关系的估计装置中，先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算两个人物的肢体关系特征，之后根据肢体关系特征确定两个人物的肢体关系，可以提高肢体关系估计的准确性。

请参阅图4，图4是本发明实施例公开的另一种肢体关系的估计装置的结构图。其中，该肢体关系的估计装置是可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图4所示，该肢体关系的估计装置可以包括处理器401、存储器402，其中，处理器401和存储器402之间可以通过总线或其它方式连接，其中，本实施例中是以总线连接的方式为例。其中：

存储器402中存储有一组程序代码，处理器401用于调用存储器402中存储的程序代码执行以下操作：

获取目标图片；

根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；

根据第一肢体关系特征，确定两个人物的肢体关系。

作为一种可能的实施方式，第一肢体关系特征包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度、两个人物的重叠比例以及每个人物的每个身体部位每个人物的每个身体部位到两个人物的中心位置的相对距离中的至少一种。

当第一肢体关系特征包括两个人物的重叠比例时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的重叠比例的方式具体为：

其中，Ψ_ov表示两个人物各自的第i个身体部位的重叠比例，

作为一种可能的实施方式，每个人物的每个身体部位每个人物的每个身体部位到两个人物的中心位置的相对距离包括每个人物中的第j个身体部位到两个人物的中心位置的相对距离，第一位置信息包括每个人物的身体部位在目标图片中的坐标，j为大于或等于1的整数；

当第一肢体关系特征包括两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物中每个人物的每个身体部位到这两个人物的中心位置的相对距离的方式具体为：

其中，Ψ_L表示每个人物的第j个身体部位到两个人物的中心位置的相对距离，

表示两个人物中的第k个人物的第j个身体部位在目标图片中的坐标，n表示每个人物包括的身体部位的总数量，n_scale为中心位置到两个人物所有身体部位的距离的和，

表示中心位置的坐标，n为大于1的整数，k为1或2。

作为一种可能的实施方式，第一位置信息包括用于表示每个人物的身体部位的位置的第一区域，第二位置信息包括用于表示每个人物的身体部位的位置的第二区域，第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度包括：用于表示每个人物的第t个身体部位的位置的第一区域与用于表示每个人物的第t个身体部位的位置的第二区域的匹配度，t为大于或等于1的整数；

当第一肢体关系特征包括第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度时，根据目标图片中两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算第一位置信息所表示的身体部位与第二位置信息所表示的身体部位的匹配度的方式具体为：

表示用于表示每个人物的第t个身体部位的位置的第一区域，

表示用于表示每个人物的第t个身体部位的位置的第二区域。

作为一种可能的实施方式，肢体关系包括：两个人物之间的肢体交互关系、两个人物之间的相对距离、两个人物之间的身体倾斜方向以及两个人物之间的身体朝向中的至少一种，肢体交互关系包括手挽手、握手以及拥抱中至少一种。

作为一种可能的实施方式，处理器401还用于调用存储器402存储的程序代码执行以下操作：

获取两个人物的第二肢体关系特征，第二肢体关系特征包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；

相应地，根据第一肢体关系特征，确定两个人物的肢体关系的方式具体为：

根据第一肢体关系特征以及第二肢体关系特征，确定两个人物的肢体关系。

作为一种可能的实施方式，根据第一肢体关系特征以及第二肢体关系特征，确定两个人物的肢体关系的方式具体为：

作为一种可能的实施方式，神经网络模型的前N层表示为如下公式：

M次递归表示为如下公式：

在图4所描述的肢体关系的估计装置中。先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算两个人物的肢体关系特征，之后根据肢体关系特征确定两个人物的肢体关系，可以提高肢体关系估计的准确性。

请参阅图5，图5是本发明实施例公开的一种用于肢体关系估计的神经网络模型的生成装置的结构图。其中，该生成装置是可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图5所示，该生成装置可以包括：

第一获取单元501，用于获取至少一张训练图片；

计算单元502，用于根据第一获取单元501获取的至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；

确定单元503，用于根据计算单元502计算的第一肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

作为一种可能的实施方式，该生产装置500还可以包括：

第二获取单元504，用于获取两个人物的第二肢体关系特征，第二肢体关系特征包括：第一位置信息的第一可信度值、每个人物的身体部位的第一方向信息、第二位置信息的第二可信度值以及每个人物的身体部位的第二方向信息中至少一种；

相应地，确定单元503，具体用于根据计算单元502计算的第一肢体关系特征、第二获取单元504获取的第二肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

在图5所描述的用于肢体关系估计的神经网络模型的生成装置中，先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算训练图片中两个人物的肢体关系特征，之后根据肢体关系特征确定神经网络模型，可以提高神经网络模型的准确性。

请参阅图6，图6是本发明实施例公开的另一种用于肢体关系估计的神经网络模型的生成装置的结构图。其中，该生成装置是可以显示图片且可以运行深度神经网络算法的计算机等各种设备。如图6所示，该生成装置可以包括处理器601、存储器602，其中，处理器601和存储器602之间可以通过总线或其它方式连接，其中，本实施例中是以总线连接的方式为例。其中：

存储器602存储有一组程序代码，处理器601用于调用存储器602中存储的程序代码执行以下操作：

获取至少一张训练图片；

根据至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及两个人物的身体部位的第二位置信息中至少一种，计算两个人物的第一肢体关系特征；

根据第一肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

作为一种可能的实施方式，处理器601还用于调用存储器602中存储的程序代码执行以下操作：

相应地，根据第一肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型包括：

根据第一肢体关系特征、第二肢体关系特征以及两个人物的预设的肢体关系，确定神经网络模型。

在图6所描述的用于肢体关系估计的神经网络模型的生成装置中，先根据单人姿态估计和双人联合姿态估计得到身体部位的位置信息，进一步计算训练图片中两个人物的肢体关系特征，之后根据肢体关系特征确定神经网络模型，可以提高神经网络模型的准确性。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccessMemory，RAM)、磁盘或光盘等。

以上对本发明实施例所提供的肢体关系的估计方法及装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种肢体关系的估计方法，其特征在于，包括：

获取目标图片；

根据所述目标图片中两个人物中每个人物的身体部位的第一位置信息，以及所述两个人物的身体部位的第二位置信息，计算所述两个人物的第一肢体关系特征，所述第一位置信息通过对所述每个人物进行单人姿态估计而获取得到，所述第二位置信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到，所述单人姿态估计是根据方向梯度直方图HOG特征和支持向量机SVM分类器对所述目标图片中每个人物进行独立的估计，所述双人联合姿态估计是对所述目标图片中有重叠部分的两个人物根据HOG特征和SVM进行联合估计；

根据所述第一肢体关系特征，确定所述两个人物的肢体关系。

2.根据权利要求1所述的方法，其特征在于，所述第一肢体关系特征包括第一位置信息所表示的身体部位与所述第二位置信息所表示的身体部位的匹配度、所述两个人物的重叠比例以及所述每个人物的每个身体部位到所述两个人物的中心位置的相对距离中的至少一种。

3.根据权利要求2所述的方法，其特征在于，所述第一位置信息包括用于表示所述每个人物的身体部位的位置的第一区域，所述两个人物的重叠比例包括：所述两个人物各自的第i个身体部位的重叠比例，i为大于或等于1的整数；

其中，所述两个人物各自的第i个身体部位的重叠比例利用如下公式计算：

其中，Ψ_ov表示所述两个人物各自的第i个身体部位的重叠比例，

表示所述两个人物中的第一个人物的第i个身体部位的位置的第一区域，

表示所述两个人物中的第二个人物的第i个身体部位的位置的第一区域。

4.根据权利要求2或3所述的方法，其特征在于，所述每个人物的每个身体部位到所述两个人物的中心位置的相对距离包括所述每个人物中的第j个身体部位到所述两个人物的中心位置的相对距离，所述第一位置信息包括所述每个人物的身体部位在所述目标图片中的坐标，j为大于或等于1的整数；

其中，所述每个人物的第j个身体部位到所述两个人物的中心位置的相对距离利用如下公式计算：

其中，Ψ_L表示所述每个人物的第j个身体部位到所述两个人物的中心位置的相对距离，

表示所述两个人物中的第k个人物的第j个身体部位在所述目标图片中的坐标，n表示所述每个人物包括的身体部位的总数量，n_scale为所述中心位置到所述两个人物所有身体部位的距离的和，

表示所述中心位置的坐标，n为大于1的整数，k为1或2。

5.根据权利要求2或3所述的方法，其特征在于，所述第一位置信息包括用于表示所述每个人物的身体部位的位置的第一区域，所述第二位置信息包括用于表示所述每个人物的身体部位的位置的第二区域，所述第一位置信息所表示的身体部位与所述第二位置信息所表示的身体部位的匹配度包括：用于表示所述每个人物的第t个身体部位的位置的第一区域与用于表示所述每个人物的第t个身体部位的位置的第二区域的匹配度，t为大于或等于1的整数；

其中，用于表示所述每个人物的第t个身体部位的位置的第一区域与用于表示所述每个人物的第t个身体部位的位置的第二区域的匹配度利用如下公式计算：

其中，Ψ_m表示用于表示所述每个人物的第t个身体部位的位置的第一区域与用于表示所述每个人物的第t个身体部位的位置的第二区域的匹配度，

表示用于表示所述每个人物的第t个身体部位的位置的第一区域，

表示用于表示所述每个人物的第t个身体部位的位置的第二区域。

6.根据权利要求1至3任一项所述的方法，其特征在于，所述肢体关系包括：所述两个人物之间的肢体交互关系、所述两个人物之间的相对距离、所述两个人物之间的身体倾斜方向以及所述两个人物之间的身体朝向中的至少一种，所述肢体交互关系包括手挽手、握手以及拥抱中至少一种。

7.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

获取所述两个人物的第二肢体关系特征，所述第二肢体关系特征包括：所述第一位置信息的第一可信度值、所述每个人物的身体部位的第一方向信息、所述第二位置信息的第二可信度值以及所述每个人物的身体部位的第二方向信息中至少一种，所述第一可信度值以及所述第一方向信息为通过对所述每个人物进行单人姿态估计而获取得到，所述第二可信度值以及所述第二方向信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到；

相应地，所述根据所述第一肢体关系特征，确定所述两个人物的肢体关系包括：

根据所述第一肢体关系特征以及所述第二肢体关系特征，确定所述两个人物的肢体关系。

8.根据权利要求7所述的方法，其特征在于，所述根据所述第一肢体关系特征以及所述第二肢体关系特征，确定所述两个人物的肢体关系包括：

将所述第一肢体关系特征以及所述第二肢体关系特征作为第N+1层神经网络模型的输入，将所述神经网络模型的第N+1层的输出作为所述两个人物的肢体关系，所述第N+1层包括M次递归，所述第N+1层的输出包括第M次递归的输出，N为大于或等于1的整数，M为大于1的整数。

9.根据权利要求8所述的方法，其特征在于，所述神经网络模型的前N层表示为如下公式：

其中，h_g+1,1表示第g+1层神经网络模型的输出，W₁、b₁、W_g+1和b_g+1表示所述神经网络模型的参数，f(·)表示非线性的激活函数，α表示所述第一肢体关系特征以及所述第二肢体关系特征；相应地，

所述M次递归表示为如下公式：

其中，P_q表示第N+1层神经网络模型的第q次递归的输出，在q为M时，P_q表示所述两个人物的肢体关系，h_N+1,q+1表示第N+1层神经网络模型的第q+1次递归的中间变量，W_N+1、W_b、b_N+1、W_cls和b_cls表示所述神经网络模型的参数。

10.一种用于肢体关系估计的神经网络模型的生成方法，其特征在于，包括：

获取至少一张训练图片；

根据所述至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及所述两个人物的身体部位的第二位置信息，计算所述两个人物的第一肢体关系特征，所述第一位置信息通过对所述每个人物进行单人姿态估计而获取得到，所述第二位置信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到，所述单人姿态估计是根据方向梯度直方图HOG特征和支持向量机SVM分类器对所述每张图片中每个人物进行独立的估计，所述双人联合姿态估计是对所述每张图片中有重叠部分的两个人物根据HOG特征和SVM进行联合估计；

根据所述第一肢体关系特征以及所述两个人物的预设的肢体关系，确定所述神经网络模型。

11.根据权利要求10所述的方法，其特征在于，所述方法还包括：

相应地，所述根据所述第一肢体关系特征以及所述两个人物的预设的肢体关系，确定所述神经网络模型包括：

根据所述第一肢体关系特征、所述第二肢体关系特征以及所述两个人物的预设的肢体关系，确定所述神经网络模型。

12.一种肢体关系的估计装置，其特征在于，包括：

第一获取单元，用于获取目标图片；

计算单元，用于根据所述第一获取单元获取的目标图片中两个人物中每个人物的身体部位的第一位置信息，以及所述两个人物的身体部位的第二位置信息，计算所述两个人物的第一肢体关系特征，所述第一位置信息通过对所述每个人物进行单人姿态估计而获取得到，所述第二位置信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到，所述单人姿态估计是根据方向梯度直方图HOG特征和支持向量机SVM分类器对所述目标图片中每个人物进行独立的估计，所述双人联合姿态估计是对所述目标图片中有重叠部分的两个人物根据HOG特征和SVM进行联合估计；

确定单元，用于根据所述计算单元计算的第一肢体关系特征，确定所述两个人物的肢体关系。

13.根据权利要求12所述的装置，其特征在于，所述第一肢体关系特征包括第一位置信息所表示的身体部位与所述第二位置信息所表示的身体部位的匹配度、所述两个人物的重叠比例以及所述每个人物的每个身体部位到所述两个人物的中心位置的相对距离中的至少一种。

14.根据权利要求13所述的装置，其特征在于，所述第一位置信息包括用于表示所述每个人物的身体部位的位置的第一区域，所述两个人物的重叠比例包括：所述两个人物各自的第i个身体部位的重叠比例，i为大于或等于1的整数；

所述计算单元用于：

利用如下公式计算所述两个人物各自的第i个身体部位的重叠比例：

15.根据权利要求13或14所述的装置，其特征在于，所述每个人物的每个身体部位每个人物的每个身体部位到所述两个人物的中心位置的相对距离包括所述每个人物中的第j个身体部位到所述两个人物的中心位置的相对距离，所述第一位置信息包括所述每个人物的身体部位在所述目标图片中的坐标，j为大于或等于1的整数；

所述计算单元用于：

利用如下公式计算所述每个人物的第j个身体部位到所述两个人物的中心位置的相对距离：

表示所述中心位置的坐标，n为大于1的整数，k为1或2。

16.根据权利要求13或14所述的装置，其特征在于，所述第一位置信息包括用于表示所述每个人物的身体部位的位置的第一区域，所述第二位置信息包括用于表示所述每个人物的身体部位的位置的第二区域，所述第一位置信息所表示的身体部位与所述第二位置信息所表示的身体部位的匹配度包括：用于表示所述每个人物的第t个身体部位的位置的第一区域与用于表示所述每个人物的第t个身体部位的位置的第二区域的匹配度，t为大于或等于1的整数；

所述计算单元用于：

利用如下公式计算用于表示所述每个人物的第t个身体部位的位置的第一区域与用于表示所述每个人物的第t个身体部位的位置的第二区域的匹配度：

17.根据权利要求12至14任一项所述的装置，其特征在于，所述肢体关系包括：所述两个人物之间的肢体交互关系、所述两个人物之间的相对距离、所述两个人物之间的身体倾斜方向以及所述两个人物之间的身体朝向中的至少一种，所述肢体交互关系包括手挽手、握手以及拥抱中至少一种。

18.根据权利要求12至14任一项所述的装置，其特征在于，所述装置还包括：

第二获取单元，用于获取所述两个人物的第二肢体关系特征，所述第二肢体关系特征包括：所述第一位置信息的第一可信度值、所述每个人物的身体部位的第一方向信息、所述第二位置信息的第二可信度值以及所述每个人物的身体部位的第二方向信息中至少一种，所述第一可信度值以及所述第一方向信息为通过对所述每个人物进行单人姿态估计而获取得到，所述第二可信度值以及所述第二方向信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到；

相应地，所述确定单元，用于根据所述计算单元计算的第一肢体关系特征以及所述第二获取单元获取的第二肢体关系特征，确定所述两个人物的肢体关系。

19.根据权利要求18所述的装置，其特征在于，所述确定单元用于：

20.根据权利要求19所述的装置，其特征在于，所述神经网络模型的前N层表示为如下公式：

所述M次递归表示为如下公式：

21.一种用于肢体关系估计的神经网络模型的生成装置，其特征在于，包括：

第一获取单元，用于获取至少一张训练图片；

计算单元，用于根据所述第一获取单元获取的至少一张训练图片中的每张图片中的两个人物中每个人物的身体部位的第一位置信息，以及所述两个人物的身体部位的第二位置信息，计算所述两个人物的第一肢体关系特征，所述第一位置信息通过对所述每个人物进行单人姿态估计而获取得到，所述第二位置信息通过在所述第一位置信息指示所述两个人物之间的身体部位有重叠时，对所述两个人物进行双人联合姿态估计而获取得到，所述单人姿态估计是根据方向梯度直方图HOG特征和支持向量机SVM分类器对所述每张图片中每个人物进行独立的估计，所述双人联合姿态估计是对所述每张图片中有重叠部分的两个人物根据HOG特征和SVM进行联合估计；

确定单元，用于根据所述计算单元计算的第一肢体关系特征以及所述两个人物的预设的肢体关系，确定所述神经网络模型。

22.根据权利要求21所述的装置，其特征在于，所述装置还包括：

相应地，所述确定单元，用于根据所述计算单元计算的第一肢体关系特征、所述第二获取单元获取的第二肢体关系特征以及所述两个人物的预设的肢体关系，确定所述神经网络模型。