CN108304762B

CN108304762B - 一种人体姿态匹配方法及其设备、存储介质、终端

Info

Publication number: CN108304762B
Application number: CN201711240868.9A
Authority: CN
Inventors: 张中宝; 谭君; 丁寻; 周奕; 伍学平; 向华; 汪雨秋; 何永辉; 翁锦深; 刘立; 苏凌枫; 林友荣
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2021-11-05
Anticipated expiration: 2037-11-30
Also published as: CN108304762A

Abstract

本发明公开一种人体姿态匹配方法及其设备、存储介质、终端，其中方法包括：基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在基准图像序列中依次获取用于指示基准动作的基准图像，并将基准图像显示于业务交互应用的应用界面的第一区域中；在应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像；采用基准图像对人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据。采用本发明，可以结合基准图像中的基准动作进行人体动作的采集，并由基准图像对携带人体动作的人体姿态二维图像进行匹配，节省人力资源，有效提升人体姿态匹配的效率以及与终端设备间的交互性。

Description

一种人体姿态匹配方法及其设备、存储介质、终端

技术领域

本发明涉及计算机技术领域，尤其涉及一种人体姿态匹配方法及其设备、存储介质、终端。

背景技术

随着计算机技术不断的开发和完善，手机和平板电脑等终端已经成为了人们生活中不可或缺的一个部分，人们不仅可以利用这些终端进行通讯，还可以进行文件传输、摄像、玩游戏等。

在一些对人体姿态的采集的交互应用中，例如：舞蹈录制应用、游戏互动应用等场景中，通常需要采用终端对用户的人体姿态进行拍照或录制，并将拍照或录制后得到的图像、视频等传输至后台，由专业人士或者工作人员来匹配该用户的人体姿态是否准确。然而，采用人工匹配的方式必然需要浪费大量的人力资源，降低了人体姿态匹配的效率，并且容易因为细节动作问题而导致的误判，影响了人体姿态匹配的准确性。

发明内容

本发明实施例提供一种人体姿态匹配方法及其设备、存储介质、终端，可以结合基准图像中的基准动作进行人体动作的采集，并由基准图像对携带人体动作的人体姿态二维图像进行匹配，节省人力资源，有效提升人体姿态匹配的效率以及与终端设备间的交互性。

本发明实施例第一方面提供了一种人体姿态匹配方法，可包括：

基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中；

在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作为按照所述基准动作所输入的动作信息；

采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据。

可选的，还包括：

获取应用服务器发送的当前终端类型对应的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。

可选的，所述基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中之前，还包括：

基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中；

在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作为按照所述初始启动动作所输入的动作信息；

采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果确定转入执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中的步骤。

可选的，所述基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，包括：

基于业务交互应用获取当前所选取的基准音频对应的基准图像序列；

依据基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像；

控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中。

可选的，所述在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，包括：

控制单目摄像头采集按照所述基准动作所输入的人体动作，并在所述应用界面的第二区域中显示携带有人体动作的人体姿态二维图像。

可选的，所述采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据，包括：

提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述基准图像中基准动作的基准特征点所建立的坐标系；

在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果；

在所述业务交互应用中基于所述匹配结果获取针对所述基准图像的业务数据。

可选的，所述提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中，包括：

提取所述人体姿态二维图像中人体动作的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成人体动作的人体姿态特征点；

在所述基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系；

在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点；

获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中。

可选的，所述在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，包括：

在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的距离偏差数据；

当所述距离偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功。

在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的向量数据，并获取所述对应点的向量数据对应的角度偏差数据；

当所述角度偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功。

基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，并基于所述业务交互应用输出基准音频。

可选的，所述方法还包括：

获取基于当前输出的基准音频所采集的音频数据，获取所述音频数据中的语音信息和所述语音信息对应的音调信息，并将所述语音信息识别为文本信息；

采用所述基准音频对应的基准文本与所述文本信息进行匹配，并采用所述基准音频对应的基准音调与所述音调信息进行匹配；

基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，生成所述基准音频与所述音频数据的匹配结果，并根据所述基准音频与所述音频数据的匹配结果生成业务交互应用的业务数据。

本发明实施例第二方面提供了一种人体姿态匹配设备，可包括：

基准图像显示单元，用于基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中；

人体图像显示单元，用于在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作为按照所述基准动作所输入的动作信息；

业务数据生成单元，用于采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据。

可选的，还包括：

信息获取单元，用于获取应用服务器发送的当前终端类型对应的配置信息，所述配置信息包括基准图像、所述中基准动作基准图像的基准特征点和偏差标准数据。

可选的，还包括：

初始图像显示单元，用于基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中；

启动图像显示单元，用于在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作为按照所述初始启动动作所输入的动作信息；

通知单元，用于采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果通知所述基准图像显示单元执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中。

可选的，所述基准图像显示单元包括：

序列获取子单元，用于基于业务交互应用获取当前所选取的基准音频对应的基准图像序列；

图像获取子单元，用于依据基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像；

图像显示子单元，用于控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中。

可选的，所述人体图像显示单元具体用于控制单目摄像头采集按照所述基准动作所输入的人体动作，并在所述应用界面的第二区域中显示携带有人体动作的人体姿态二维图像。

可选的，所述业务数据生成单元包括：

特征点映射子单元，用于提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述基准图像中基准动作的基准特征点所建立的坐标系；

图像匹配子单元，用于在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果；

数据获取子单元，用于在所述业务交互应用中基于所述匹配结果获取针对所述基准图像的业务数据。

可选的，所述特征点映射子单元包括：

特征点生成子单元，用于提取所述人体姿态二维图像中人体动作的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成人体动作的人体姿态特征点；

坐标系建立子单元，用于在所述基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系；

特征点获取子单元，用于在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点；

特征点映射子单元，用于获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中。

可选的，所述图像匹配子单元包括：

距离数据获取子单元，用于在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的距离偏差数据；

第一图像匹配子单元，用于当所述距离偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功。

可选的，所述图像匹配子单元包括：

角度数据获取子单元，用于在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的向量数据，并获取所述对应点的向量数据对应的角度偏差数据；

第二图像匹配子单元，用于当所述角度偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功。

可选的，所述基准图像显示单元具体用于基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，并基于所述业务交互应用输出基准音频。

可选的，还包括：

音频识别单元，用于获取基于当前输出的基准音频所采集的音频数据，获取所述音频数据中的语音信息和所述语音信息对应的音调信息，并将所述语音信息识别为文本信息；

音频匹配单元，用于采用所述基准音频对应的基准文本与所述文本信息进行匹配，并采用所述基准音频对应的基准音调与所述音调信息进行匹配；

所述业务数据生成单元，还用于基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，生成所述基准音频与所述音频数据的匹配结果，并根据所述基准音频与所述音频数据的匹配结果生成业务交互应用的业务数据。

本发明实施例第三方面提供了一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述第一方面的方法步骤。

本发明实施例第四方面提供了一种终端，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行以下步骤：

在本发明实施例中，通过对携带有基准动作的基准图像获取并显示于业务交互应用的应用界面的第一区域中，可以使得用户做出与基准动作相同的人体动作，并通过在应用界面指示的第二区域显示所获取的携带有人体动作的人体姿态二维图像，最终采用基准图像对人体姿态二维图像进行匹配，实现了自动对人体姿态进行匹配的过程，节省了人力资源，提升了人体姿态匹配的效率，同时通过与基准动作进行人体动作的交互并进行匹配，有效的提升了与终端设备间的交互性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种人体姿态匹配方法的流程示意图；

图2是本发明实施例提供的另一种人体姿态匹配方法的流程示意图；

图3是本发明实施例提供的一种特征点映射的流程示意图；

图4是本发明实施例提供的一种人体姿态匹配的举例示意图；

图5是本发明实施例提供的另一种人体姿态匹配的举例示意图；

图6是本发明实施例提供的又一种人体姿态匹配的举例示意图；

图7是本发明实施例提供的又一种人体姿态匹配的举例示意图；

图8是本发明实施例提供的又一种人体姿态匹配的举例示意图；

图9是本发明实施例提供的又一种人体姿态匹配的举例示意图；

图10是本发明实施例提供的又一种人体姿态匹配的举例示意图；

图11是本发明实施例提供的又一种人体姿态匹配方法的流程示意图；

图12是本发明实施例提供的一种人体姿态匹配设备的结构示意图；

图13是本发明实施例提供的另一种人体姿态匹配设备的结构示意图；

图14是本发明实施例提供的基准图像显示单元的结构示意图；

图15是本发明实施例提供的业务数据生成单元的结构示意图；

图16是本发明实施例提供的特征点映射子单元的结构示意图；

图17是本发明实施例提供的一种图像匹配子单元的结构示意图；

图18是本发明实施例提供的另一种图像匹配子单元的结构示意图；

图19是本发明实施例提供的又一种人体姿态匹配设备的结构示意图；

图20是本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的人体姿态匹配方法可以应用于需要进行人体姿态匹配的场景，例如：舞蹈教学场景、姿态验证场景、广告推广场景、即时通讯互动场景等，人体姿态匹配设备基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，所述人体姿态匹配设备在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作为按照所述基准动作所输入的动作信息，所述人体姿态匹配设备采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据。通过对携带有基准动作的基准图像获取并显示于业务交互应用的应用界面的第一区域中，可以使得用户做出与基准动作相同的人体动作，并通过在应用界面指示的第二区域显示所获取的携带有人体动作的人体姿态二维图像，最终采用基准图像对人体姿态二维图像进行匹配，实现了自动对人体姿态进行匹配的过程，节省了人力资源，提升了人体姿态匹配的效率，同时通过与基准动作进行人体动作的交互并进行匹配，有效的提升了与终端设备间的交互性。

本发明实施例涉及的人体姿态匹配设备可以是平板电脑、智能手机、掌上电脑以及移动互联网设备(MID)等终端设备。

下面将结合附图1-附图11，对本发明实施例提供的人体姿态匹配方法进行详细介绍。

请参见图1，为本发明实施例提供了一种人体姿态匹配方法的流程示意图。如图1所示，本发明实施例的所述方法可以包括以下步骤S101-步骤S103。

S101，基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中；

具体的，人体姿态匹配设备可以基于业务交互应用获取基准图像序列，可以理解的是，所述人体姿态匹配设备中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述人体姿态匹配设备可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

所述人体姿态匹配设备可以按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，所述基准图像具体为所述基准图像序列中按照排列顺序当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述基准动作为所述基准图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等。

所述人体姿态匹配设备可以进一步将所述基准图像显示于业务交互应用的应用界面的第一区域中，所述第一区域可以为将业务交互应用的完整的应用界面，也可以为所述应用界面的部分显示区域中，例如：所述应用界面的左半边部分显示区域、右半边部分显示区域等，可以理解的是，所述人体姿态匹配设备可以控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中，所述图像显示方向可以为在所述第一区域中按照预先设定的方向对基准图像进行显示，所述第一区域中可以按照所述各基准图像的排列顺序显示排序在前的第一数量的候选基准图像，并将当前需要指示用户进行人体动作的候选基准图像作为基准图像，当然也可以按照所述各基准图像的排列顺序显示排序在前的基准图像，所述图像显示方向可以用于指示所述候选基准图像的显示方向，也可以用于指示所述基准图像的特定显示方式，例如：对所述基准图像进行放大显示、对所述基准图像进行特效显示等，需要说明的是，当当前的基准图像结束显示时，例如：当前的基准图像已经到达显示时间门限等，可以不再对当前的基准图像进行显示，并按照所述排列顺序将候选基准图像的下一个基准图像加入到候选基准图像中，或者获取当前的基准图像的下一个图像作为基准图像等。

S102，在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像；

具体的，所述人体姿态匹配设备可以在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作具体可以为用户按照所述基准动作做出相应动作时的动作信息，所述人体姿态二维图像为所述人体姿态匹配设备对当前人体动作进行采集得到的图像信息，优选的，可以通过所述人体姿态匹配设备的前置摄像头、可旋转摄像头等单目摄像头对用户的人体姿态二维图像进行采集，所述第二区域具体可以为所述类人体的镂空姿态图像中的镂空区域，也可以是所述应用界面中除所述第一区域外的其它区域，所述第一区域与所述第二区域可以存在重叠的部分，也可以分别占据所述应用界面的不同区域，具体可以根据实际应用场景进行调节。基于应用界面的显示方式，用户可以对准单目摄像头，并在应用界面的动作区域中看见自身，即所述人体姿态匹配设备可以将单目摄像头获取的用户姿态显示于所述第二区域，此时可以基于显示的基准图像中的基准动作做出相应的人体动作，单目摄像头可以每隔预设时间段采集一帧携带有人体动作的人体姿态二维图像。

S103，采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据；

具体的，所述人体姿态匹配设备可以采用所述基准图像对所述人体姿态二维图像进行匹配处理，以生成匹配结果，优选的，所述人体姿态匹配设备可以提取所述人体姿态二维图像的人体姿态特征点，所述人体姿态匹配设备可以采用特征点提取算法对人体姿态二维图像中的人体姿态特征点进行提取，所述人体姿态特征点具体为人体姿态二维图像中识别得到的人体不同关节部位的点。所述人体姿态匹配设备可以将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述基准图像对应的基准特征点所建立的坐标系。

所述人体姿态匹配设备可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。所述人体姿态匹配设备可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述人体姿态二维图像与所述基准图像匹配成功时，可以获取该基准图像对应的游戏分值、舞蹈分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

请参见图2，为本发明实施例提供了另一种人体姿态匹配方法的流程示意图。如图2所示，本发明实施例的所述方法可以包括以下步骤S201-步骤S211。

S201，获取应用服务器发送的当前终端类型对应的配置信息；

具体的，人体姿态匹配设备在安装或开启业务交互应用时，例如：游戏应用、舞蹈应用、广告应用、即时通信应用等，可以向业务交互应用对应的应用服务器请求所述人体姿态匹配设备的当前终端类型对应的配置信息，进一步的，请一并参见图4，所述人体姿态匹配设备(即，终端)可以向所述应用服务器(即，服务器)发送携带有当前终端类型的配置请求，所述终端可以包括但不限于所有IOS系统的手机终端、所有Android系统的手机终端、PC(个人电脑)、Mac(苹果电脑)以及Pad(平板电脑)等，所述当前终端类型可以包括所述人体姿态匹配设备的图形处理器(Graphics Processing Unit，GPU)型号、中央处理器(CentralProcessing Unit，CPU)型号中的至少一种，所述应用服务器可以基于所述当前终端类型，获取适用于所述人体姿态匹配设备的配置信息，并将所述配置信息返回至所述人体姿态匹配设备，所述配置信息可以包括基准图像、所述基准图像的基准特征点以及偏差标准数据等，所述基准特征点为所述基准图像中预先识别得到的不同关节部位的点，所述偏差标准数据为基准图像与人体姿态二维图像进行匹配时所采用的标准判断数据。

S202，基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中；

具体的，由于需要对用户的人体姿态进行采集，因此考虑到用户此时为远离所述人体姿态匹配设备的位置，因而为了确定用户已经做好准备，可以在启动业务交互应用时，在所述配置信息中随机获取一个基准图像作为初始图像，所述人体姿态匹配设备可以基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中，所述初始图像可以为当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述初始启动动作为所述初始图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等，所述初始图像可以在整个应用界面中进行显示，也可以在所述应用界面中的特定区域进行显示，具体可以根据实际应用需求进行设置。请一并参见图5，图5示出了一种初始图像的示意图，其中，该初始图像为类人体的镂空姿态图像，所述初始图像可以显示于完整的应用界面中。

S203，在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像；

具体的，所述人体姿态匹配设备可以在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作具体可以为用户按照所述初始启动动作做出相应动作时的动作信息，所述应用启动图像为所述人体姿态匹配设备对当前人体动作进行采集得到的图像信息，优选的，可以通过所述人体姿态匹配设备的前置摄像头、可旋转摄像头等单目摄像头对用户的应用启动图像进行采集，所述动作区域具体可以为所述类人体的镂空姿态图像中的镂空区域，也可以是所述应用界面中除所述特定区域外的其它区域，所述动作区域和所述特定区域可以存在重叠的部分，也可以分别占据所述应用界面的不同区域，具体可以根据实际应用场景进行调节。基于应用界面的显示方式，用户可以对准单目摄像头，并在应用界面的动作区域中看见自身，即所述人体姿态匹配设备可以将单目摄像头获取的用户姿态显示于所述动作区域，此时可以基于显示的初始图像中的初始启动动作做出相应的人体初始动作。再请一并参见图5，图5所示的类人体的镂空姿态图像中，可以采用单目摄像头采集用户基于类人体的镂空姿态图像中的初始启动动作做出的人体初始动作，并将携带有人体初始动作的应用启动图像显示于类人体的镂空姿态图像中的镂空区域。

S204，采用所述初始图像对所述应用启动图像进行匹配处理；

具体的，所述人体姿态匹配设备可以采用所述初始图像对所述应用启动图像进行匹配处理，以生成匹配结果，优选的，所述人体姿态匹配设备可以提取所述应用启动图像的人体姿态特征点，所述人体姿态匹配设备可以采用特征点提取算法对人体姿态二维图像中的人体姿态特征点进行提取，所述人体姿态特征点具体为应用启动图像中识别得到的人体不同关节部位的点。所述人体姿态匹配设备可以将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述初始图像对应的基准特征点所建立的坐标系。

所述人体姿态匹配设备可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述应用启动图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。

需要说明的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据，同时所述偏差标准数据还可以对多个距离偏差数据的总和进行判断。当所述距离偏差数据满足所述偏差标准数据时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功，优选的，当所述距离偏差数据小于所述偏差标准数据时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功。

或者，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据。当所述角度偏差数据满足所述偏差标准数据时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功，优选的，当每个角度偏差数据均小于其各自的偏差标准数据时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功；或者，当每个角度偏差数据乘以其各自的向量权重后均处于其各自的偏差标准数据所指示的阈值范围内时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功。

或者，所述人体姿态匹配设备可以预先获取多个样本姿态特征点，并基于多个样本姿态特征点与基准特征点进行机器学习模型的训练，以获取所述机器学习模型中的模型参数，并将所述模型参数代入机器学习模型中生成训练后的姿态判别模型，所述人体姿态匹配设备可以基于所述姿态判别模型并采用获取到的人体姿态特征点，获取所述应用启动图像与所述初始图像的匹配结果。

或者，所述人体姿态匹配设备还可以获取所述应用启动图像中人体初始动作覆盖所述初始图像指示的动作区域的覆盖面积比例，当所述覆盖面积比例大于比例阈值时，所述人体姿态匹配设备可以确定所述应用启动图像与所述初始图像匹配成功。

所述应用启动图像与所述初始图像均可以为二维图像。

S205，根据匹配处理后的匹配结果确定执行基于业务交互应用获取当前所选取的基准音频对应的基准图像序列；

具体的，当所述应用启动图像与所述初始图像匹配处理后的匹配结果为匹配成功时，此时说明用户已经做好进入所述业务交互应用的准备，例如：生成确认指令以进入游戏过程、舞蹈过程等，所述人体姿态匹配设备可以基于业务交互应用获取当前所选取的基准音频对应的基准图像序列，可以理解的是，所述人体姿态匹配设备中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述人体姿态匹配设备可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

S206，依据基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像；

具体的，所述人体姿态匹配设备可以按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，所述基准图像具体为所述基准图像序列中按照排列顺序当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述基准动作为所述基准图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等。

S207，控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中；

具体的，所述人体姿态匹配设备可以进一步将所述基准图像显示于业务交互应用的应用界面的第一区域中，所述第一区域可以为将业务交互应用的完整的应用界面，也可以为所述应用界面的部分显示区域中，例如：所述应用界面的左半边部分显示区域、右半边部分显示区域等，可以理解的是，所述人体姿态匹配设备可以控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中，所述图像显示方向可以为在所述第一区域中按照预先设定的方向对基准图像进行显示，所述第一区域中可以按照所述各基准图像的排列顺序显示排序在前的第一数量的候选基准图像，并将当前需要指示用户进行人体动作的候选基准图像作为基准图像，当然也可以按照所述各基准图像的排列顺序显示排序在前的基准图像，所述图像显示方向可以用于指示所述候选基准图像的显示方向，也可以用于指示所述基准图像的特定显示方式，例如：对所述基准图像进行放大显示、对所述基准图像进行特效显示等，需要说明的是，当当前的基准图像结束显示时，例如：当前的基准图像已经到达显示时间门限等，可以不再对当前的基准图像进行显示，并按照所述排列顺序将候选基准图像的下一个基准图像加入到候选基准图像中，或者获取当前的基准图像的下一个图像作为基准图像等。请一并参见图6，所述人体姿态匹配设备的应用界面中左半边(即，第一区域)为该基准图像序列中的候选基准图像，中间的指示方向(即，图像显示方向)为所述基准图像序列中候选基准图像的移动方向，随着候选基准图像的移动方向。

S208，在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像；

具体的，所述人体姿态匹配设备可以在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作具体可以为用户按照所述基准动作做出相应动作时的动作信息，所述人体姿态二维图像为所述人体姿态匹配设备对当前人体动作进行采集得到的图像信息，优选的，可以通过所述人体姿态匹配设备的前置摄像头、可旋转摄像头等单目摄像头对用户的人体姿态二维图像进行采集，所述第二区域具体可以为所述类人体的镂空姿态图像中的镂空区域，也可以是所述应用界面中除所述第一区域外的其它区域，所述第一区域与所述第二区域可以存在重叠的部分，也可以分别占据所述应用界面的不同区域，具体可以根据实际应用场景进行调节。基于应用界面的显示方式，用户可以对准单目摄像头，并在应用界面的动作区域中看见自身，即所述人体姿态匹配设备可以将单目摄像头获取的用户姿态显示于所述第二区域，此时可以基于显示的基准图像中的基准动作做出相应的人体动作，单目摄像头可以每隔预设时间段采集一帧携带有人体动作的人体姿态二维图像。再请一并参见图6，所述人体姿态匹配设备的应用界面中右边(即，第二区域)为人体姿态二维图像，用户需要依据当前排序在最前的基准图像做出相对应的动作。

S209，提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中；

在步骤S209中，请一并参见图3，为本发明实施例提供了一种特征点映射的流程示意图。如图3所示，步骤S209可以包括：

S2091，提取所述人体姿态二维图像中人体动作的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成人体动作的人体姿态特征点；

具体的，为了解决人体姿态二维图像中的人体姿态特征点的丢点问题和跳点问题，所述人体姿态匹配设备可以进一步对所述人体姿态二维图像进行特征点平滑处理，所述人体姿态匹配设备在采集人体姿态二维图像的其它时间中还可以采集多帧图像以对人体姿态二维图像进行平滑处理，优选的，可以获取该人体姿态二维图像的前两帧图像对该人体姿态二维图像进行平滑处理，处理过程可以包括：

所述人体姿态匹配设备提取所述人体姿态二维图像中的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成所述人体姿态二维图像的人体姿态特征点，优选的，可以采用前两帧图像获取的特征点的置信度作为权重值，所述人体姿态中的各个特征点均可以携带有各自的置信度，该置信度的取值可以根据该特征点是否为人体指定关节的点来确定，并通过以下平滑公式对不同的候选姿态特征点进行特征点平滑处理：

其中，R_i表示特征点平滑后得到的人体姿态特征点，P_i表示特征点平滑前的候选姿态特征点，C_i表示该特征点的置信度，i表示图像的帧数变量，j表示取得特征点的帧数。

S2092，在所述基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系；

具体的，在获取到所述人体姿态二维图像中的人体姿态特征点后，所述人体姿态匹配设备可以在所述基准图像的基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系，以上半身特征点为例，请一并参见图7，所述人体姿态匹配设备可以在所述基准图像中获取到A1、B1、C1、D1、E1和F1六个特征点，可以选取C1和D1两个点作为X轴建立该基准图像的基准坐标系，并分别将其余四个点代入该基准坐标系中，其中基准坐标系的原点可以为C1，也可以为D1，还可以以C1和D1所在X轴上的其余点作为原点，本发明实施例不对此进行限定。

S2093，在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点；

具体的，所述人体姿态匹配设备进一步可以在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点，基于上述举例，请一并参见图8，所述人体姿态匹配设备获取到平滑后的人体姿态特征点包括A2、B2、C2、D2、E2和F2，所述人体姿态匹配设备可以获取与第一特征点C1对应的第三特征点C2，以及获取与第二特征点D1对应的第四特征点D2。

S2094，获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中；

具体的，所述人体姿态匹配设备可以获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中，所述位置关系数据可以包括多种位置调整的参数，例如：平移长度、旋转角度、缩放比例等，请一并参见图9和图10，图9和图10示出了两种特征点的比对图例，如图9和图10所示，通过将C2和D2按一定的旋转角度以及放大比例进行调整，使得C2和D2的位置与C1和D1重合，进而按照该旋转角度以及放大比例，分别将A2、B2、E2和F2映射至所述基准坐标系中。

可以理解的是，上述特征点的取点数量以及标号仅为举例，其它的取点数量以及标号需要根据实际的使用场景进行变换，具体的实现过程可以参见上述的实现过程，再次不进行赘述。

S210，在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果；

具体的，所述人体姿态匹配设备可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。

在本发明实施例的第一种实施方式中，所述人体姿态匹配设备可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的距离偏差数据，请再一并参见图9，图9示出映射后的基准坐标系，分别获取A1与A2的距离偏差数据、B1与B2的距离偏差数据、C1与C2的距离偏差数据、D1与D2的距离偏差数据、E1与E2的距离偏差数据以及F1与F2的距离偏差数据，进而采用偏差标准数据分别对每个距离偏差数据进行判断，可以理解的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据，同时所述偏差标准数据还可以对多个距离偏差数据的总和进行判断。当所述距离偏差数据满足所述偏差标准数据时，所述人体姿态匹配设备可以确定所述人体姿态二维图像与所述基准图像匹配成功，优选的，当所述距离偏差数据小于所述偏差标准数据时，所述人体姿态匹配设备可以确定所述人体姿态二维图像与所述基准图像匹配成功。

在本发明实施例的第二种实施方式中，所述人体姿态匹配设备可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的向量数据，并获取所述对应点的向量数据对应的角度偏差数据，请再一并参见图10，图10示出映射后的基准坐标系，分别获取A1的向量与A2的向量的角度偏差数据、B1的向量与B2的向量的角度偏差数据、C1的向量与C2的向量的角度偏差数据、D1的向量与D2的向量的角度偏差数据、E1的向量与E2的向量的角度偏差数据以及F1的向量与F2的向量的角度偏差数据，进而采用偏差标准数据分别对每个角度偏差数据进行判断，可以理解的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据。当所述角度偏差数据满足所述偏差标准数据时，所述人体姿态匹配设备可以确定所述人体姿态二维图像与所述基准图像匹配成功，优选的，当每个角度偏差数据均小于其各自的偏差标准数据时，所述人体姿态匹配设备可以确定所述人体姿态二维图像与所述基准图像匹配成功；或者，当每个角度偏差数据乘以其各自的向量权重后均处于其各自的偏差标准数据所指示的阈值范围内时，所述人体姿态匹配设备可以确定所述人体姿态二维图像与所述基准图像匹配成功。

在本发明实施例的第三种实施方式中，所述人体姿态匹配设备可以预先获取多个样本姿态特征点，并基于多个样本姿态特征点与基准特征点进行机器学习模型的训练，以获取所述机器学习模型中的模型参数，并将所述模型参数代入机器学习模型中生成训练后的姿态判别模型，所述人体姿态匹配设备可以基于所述姿态判别模型并采用获取到的人体姿态特征点，获取所述人体姿态二维图像与基准图像的匹配结果。

S211，在所述业务交互应用中基于所述匹配结果获取针对所述基准图像的业务数据；

具体的，所述人体姿态匹配设备可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述人体姿态二维图像与所述基准图像匹配成功时，可以获取该基准图像对应的游戏分值、舞蹈分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

在本发明实施例中，通过对携带有基准动作的基准图像获取并显示于业务交互应用的应用界面的第一区域中，可以使得用户做出与基准动作相同的人体动作，并通过在应用界面指示的第二区域显示所获取的携带有人体动作的人体姿态二维图像，最终采用基准图像对人体姿态二维图像进行匹配，实现了自动对人体姿态进行匹配的过程，节省了人力资源，提升了人体姿态匹配的效率，同时通过与基准动作进行人体动作的交互并进行匹配，有效的提升了与终端设备间的交互性；通过基准特征点与映射至基准坐标系中的人体姿态特征点进行匹配，有效的提升了人体姿态匹配的准确性；通过对特征点进行特征点平滑处理，可以解决人体姿态二维图像中的丢点问题和跳点问题，保证了特征点的准确获取，进一步提升了人体姿态匹配的准确性；通过距离匹配的方式以及角度匹配的方式，简化了特征点的匹配过程，使其满足实时动作的检测，进一步提升了人体姿态匹配的效率。

请参见图11，为本发明实施例提供了又一种人体姿态匹配方法的流程示意图。如图11所示，在对人体姿态进行匹配的基础上还可以添加对音频的识别匹配过程，进而可以更加满足舞蹈或者游戏场景中的实际需求，本发明实施例的所述方法可以包括以下步骤S301-步骤S310。

S301，获取应用服务器发送的当前终端类型对应的配置信息；

具体的，人体姿态匹配设备在安装或开启终端应用时，例如：舞蹈应用、即时通信应用等，可以向终端应用对应的应用服务器请求所述人体姿态匹配设备的当前终端类型对应的配置信息，进一步的，请一并参见图3，所述人体姿态匹配设备(即，终端)可以向所述应用服务器发送携带有当前终端类型的配置请求，所述终端可以包括但不限于所有IOS系统的手机终端、所有Android系统的手机终端、PC、Mac以及Pad等，所述当前终端类型可以包括所述人体姿态匹配设备的GPU型号、CPU型号中的至少一种，所述应用服务器可以基于所述当前终端类型，获取适用于所述人体姿态匹配设备的配置信息，并将所述配置信息返回至所述人体姿态匹配设备，所述配置信息可以包括基准图像、所述基准图像的基准特征点以及偏差标准数据等，所述基准特征点为所述基准图像中预先识别得到的不同关节部位的点，所述偏差标准数据为基准图像与人体姿态二维图像进行匹配时所采用的标准判断数据。

进一步的，所述配置信息还可以包括基准音频、基准音频对应的基准文本以及基准音频对应的音调信息，所述基准音频可以是针对基准图像配置的音频，例如：歌曲、诗词等音频，所述基准文本为预先将所述基准音频识别得到的音频中的文本字段，所述音调信息为所述基准音频中的每一时刻的音调。

S302，基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中；

S303，在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像；

S304，采用所述初始图像对所述应用启动图像进行匹配处理；

本发明实施例的步骤S302至步骤S304的具体实现过程可以参见图1和图2所示实施例的具体描述，在此不进行赘述。

S305，根据匹配处理后的匹配结果确定执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，并基于所述业务交互应用输出基准音频；

所述人体姿态匹配设备在显示所述基准图像的同时，还可以对基于业务交互应用对基准音频进行输出，可以理解的是，所述基准音频可以为用户在配置信息中自定义选择的音频，也可以为人体姿态匹配设备选择的音频，并可以通过所述人体姿态匹配设备的麦克风、耳机输出接口等对所述基准音频进行输出。

S306，在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像；

S307，采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据；

本发明实施例的步骤S306和S307的具体实现过程可以参见图1和图2所示实施例的具体描述，在此不进行赘述。

S308，获取基于当前输出的基准音频所采集的音频数据，获取所述音频数据中的语音信息和所述语音信息对应的音调信息，并将所述语音信息识别为文本信息；

具体的，所述人体姿态匹配设备在采集所述人体姿态二维图像的同时，还可以获取用户基于当前配合所述基准图像输出的基准音频所采集的音频数据，优选的，可以通过所述人体姿态匹配设备的麦克风等对用户的音频数据进行采集。所述人体姿态匹配设备可以解析所采集的所述音频数据，并获取所述音频数据中的语音信息和所述语音信息对应的音调信息，可以理解的是，所述语音信息为去除所述音调信息后所得到的文字片段，所述人体姿态匹配设备可以进一步将所述语音信息识别为文本信息，即将语音形式的文字片段转换为文本形式的文字片段，所述音调信息为用户在对所述文字片段进行朗诵或者歌唱时所产生的音调。

S309，采用所述基准音频对应的基准文本与所述文本信息进行匹配，并采用所述基准音频对应的基准音调与所述音调信息进行匹配；

具体的，所述人体姿态匹配设备可以采用预先从配置信息中获取到的所述基准音频的基准文本以及基准音调分别对获取的文本信息以及音调信息进行匹配。

S310，基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，生成所述基准音频与所述音频数据的匹配结果，并根据所述基准音频与所述音频数据的匹配结果生成业务交互应用的业务数据；

具体的，所述人体姿态匹配设备可以分别基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，所述基准文本与所述文本信息进行匹配的匹配结果以及所述基准音调与所述音调信息进行匹配的匹配结果可以为分别匹配后得到的匹配相似度值，通过将两者的匹配相似度值进行计算，所述人体姿态匹配设备可以得到所述基准音频与所述音频数据的匹配结果，优选的，可以分别对文本及音调的匹配过程分配不同的语音权重值，基于该语音权重值以及两者的匹配相似度值获取所述基准音频与所述音频数据的匹配结果。在得到该匹配结果后，所述人体姿态匹配设备可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述基准音频与所述音频数据匹配成功时，可以获取该基准音频对应的游戏分值、歌唱分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

在本发明实施例中，通过对携带有基准动作的基准图像获取并显示于业务交互应用的应用界面的第一区域中，可以使得用户做出与基准动作相同的人体动作，并通过在应用界面指示的第二区域显示所获取的携带有人体动作的人体姿态二维图像，最终采用基准图像对人体姿态二维图像进行匹配，实现了自动对人体姿态进行匹配的过程，节省了人力资源，提升了人体姿态匹配的效率，同时通过与基准动作进行人体动作的交互并进行匹配，有效的提升了与终端设备间的交互性；通过基准特征点与映射至基准坐标系中的人体姿态特征点进行匹配，有效的提升了人体姿态匹配的准确性；通过对特征点进行特征点平滑处理，可以解决人体姿态二维图像中的丢点问题和跳点问题，保证了特征点的准确获取，进一步提升了人体姿态匹配的准确性；通过距离匹配的方式以及角度匹配的方式，简化了特征点的匹配过程，使其满足实时动作的检测，进一步提升了人体姿态匹配的效率；通过在对人体姿态进行匹配的基础上结合了对音频的识别匹配过程，满足了舞蹈或者游戏场景中的实际需求，扩展了应用的范围。

下面将引用两个具体的应用场景对本发明实施例的人体姿态匹配方法进行详细介绍。

当应用场景为商家活动推广场景时，用户可以通过终端扫描广告商家的二维码、条形码等编码进入到该商家推广应用的游戏进程中，终端可以基于商家推广应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于商家推广应用的应用界面中，终端基于商家推广应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于商家推广应用的应用界面中，终端在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作为按照所述初始启动动作所输入的动作信息，终端采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果，当匹配结果显示所述初始图像对所述应用启动图像匹配成功时，终端可以确定用户当前已经准备好进入到该商家推广应用的游戏进程中，此时终端基于商家推广应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述商家推广应用的应用界面的第一区域中，终端在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作为按照所述基准动作所输入的动作信息，终端采用所述基准图像对所述人体姿态二维图像进行匹配处理，当匹配处理后的匹配结果表示所述基准图像和所述人体姿态二维图像匹配成功时，可以进一步生成该基准图像的游戏分值，而当匹配处理后的匹配结果表示所述基准图像和所述人体姿态二维图像匹配不成功时，表示当前基准图像做出的动作不得分。以此类推，终端继续对该基准图像序列中的剩余基准图像进行显示，用户可以基于依据接下来的基准图像做出相应的动作，对剩余基准图像的处理过程可以参照上述的实现过程，当该基准图像序列中的所有基准图像均完成后，可以得到用户对该基准图像序列的动作所得到的游戏总分值，终端可以将该游戏总分值以及终端标识发送至商家推广应用对应的应用服务器，应用服务器可以生成该游戏总分值对应的商家优惠券信息，并根据该终端标识将商家优惠券信息下发至终端。或者终端可以显示游戏总分值，用户可以将游戏总分值给商家的工作人员查看，并获取相应的商家产品等。

当应用场景为唱片公司推广场景时，用户通过终端进入到音乐应用中时，可以通过音乐应用中的地址信息跳转至唱片公司开发的舞蹈应用中，或者用户通过终端直接进入到舞蹈应用中，所述舞蹈应用可以启动游戏进程，该游戏进程中可以包含一段即将推出的新曲以及该新曲对应舞蹈教学流程，终端可以基于舞蹈应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于舞蹈应用的应用界面中，终端基于舞蹈应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于舞蹈应用的应用界面中，终端在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作为按照所述初始启动动作所输入的动作信息，终端采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果，当匹配结果显示所述初始图像对所述应用启动图像匹配成功时，终端可以确定用户当前已经准备好进入到该舞蹈应用的游戏进程中，此时终端基于舞蹈应用获取舞蹈教学的基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述舞蹈应用的应用界面的第一区域中，终端在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作为按照所述基准动作所输入的动作信息，终端采用所述基准图像对所述人体姿态二维图像进行匹配处理，当匹配处理后的匹配结果表示所述基准图像和所述人体姿态二维图像匹配成功时，可以进一步生成该基准图像的游戏分值，而当匹配处理后的匹配结果表示所述基准图像和所述人体姿态二维图像匹配不成功时，表示当前基准图像做出的动作不得分。以此类推，终端继续对该基准图像序列中的剩余基准图像进行显示，用户可以基于依据接下来的基准图像做出相应的动作，对剩余基准图像的处理过程可以参照上述的实现过程，当该基准图像序列中的所有基准图像均完成后，可以得到用户对该基准图像序列的动作所得到的游戏总分值，终端可以将该游戏总分值以及终端标识发送至舞蹈应用对应的应用服务器，应用服务器可以生成该游戏总分值对应的歌曲免费下载权限信息、舞蹈视频免费下载权限信息等针对歌曲应用或者舞蹈应用的使用权限信息，并根据该终端标识将使用权限信息下发至终端。

下面将结合附图12-附图19，对本发明实施例提供的人体姿态匹配设备进行详细介绍。需要说明的是，附图12-附图19所示的设备，用于执行本发明图1-图11所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明图1-图11所示的实施例。

请参见图12，为本发明实施例提供了一种人体姿态匹配设备的结构示意图。如图12所示，本发明实施例的所述人体姿态匹配设备1可以包括：基准图像显示单元11、人体图像显示单元12和业务数据生成单元13。

基准图像显示单元11，用于基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中；

具体实现中，所述基准图像显示单元11可以基于业务交互应用获取基准图像序列，可以理解的是，所述人体姿态匹配设备1中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述基准图像显示单元11可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

所述基准图像显示单元11可以按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，所述基准图像具体为所述基准图像序列中按照排列顺序当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述基准动作为所述基准图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等。

所述基准图像显示单元11可以进一步将所述基准图像显示于业务交互应用的应用界面的第一区域中，所述第一区域可以为将业务交互应用的完整的应用界面，也可以为所述应用界面的部分显示区域中，例如：所述应用界面的左半边部分显示区域、右半边部分显示区域等，可以理解的是，所述人基准图像显示单元11可以控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中，所述图像显示方向可以为在所述第一区域中按照预先设定的方向对基准图像进行显示，所述第一区域中可以按照所述各基准图像的排列顺序显示排序在前的第一数量的候选基准图像，并将当前需要指示用户进行人体动作的候选基准图像作为基准图像，当然也可以按照所述各基准图像的排列顺序显示排序在前的基准图像，所述图像显示方向可以用于指示所述候选基准图像的显示方向，也可以用于指示所述基准图像的特定显示方式，例如：对所述基准图像进行放大显示、对所述基准图像进行特效显示等，需要说明的是，当当前的基准图像结束显示时，例如：当前的基准图像已经到达显示时间门限等，可以不再对当前的基准图像进行显示，并按照所述排列顺序将候选基准图像的下一个基准图像加入到候选基准图像中，或者获取当前的基准图像的下一个图像作为基准图像等。

人体图像显示单元12，用于在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像；

具体实现中，所述人体图像显示单元12可以在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像，所述人体动作具体可以为用户按照所述基准动作做出相应动作时的动作信息，所述人体姿态二维图像为所述人体姿态匹配设备1对当前人体动作进行采集得到的图像信息，优选的，可以通过所述人体姿态匹配设备1的前置摄像头、可旋转摄像头等单目摄像头对用户的人体姿态二维图像进行采集，所述第二区域具体可以为所述类人体的镂空姿态图像中的镂空区域，也可以是所述应用界面中除所述第一区域外的其它区域，所述第一区域与所述第二区域可以存在重叠的部分，也可以分别占据所述应用界面的不同区域，具体可以根据实际应用场景进行调节。基于应用界面的显示方式，用户可以对准单目摄像头，并在应用界面的动作区域中看见自身，即所述人体图像显示单元12可以将单目摄像头获取的用户姿态显示于所述第二区域，此时可以基于显示的基准图像中的基准动作做出相应的人体动作，单目摄像头可以每隔预设时间段采集一帧携带有人体动作的人体姿态二维图像。

业务数据生成单元13，用于采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据；

具体实现中，所述业务数据生成单元13可以采用所述基准图像对所述人体姿态二维图像进行匹配处理，以生成匹配结果，优选的，所述业务数据生成单元13可以提取所述人体姿态二维图像的人体姿态特征点，所述业务数据生成单元13可以采用特征点提取算法对人体姿态二维图像中的人体姿态特征点进行提取，所述人体姿态特征点具体为人体姿态二维图像中识别得到的人体不同关节部位的点。所述业务数据生成单元13可以将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述基准图像对应的基准特征点所建立的坐标系。

所述业务数据生成单元13可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。所述业务数据生成单元13可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述人体姿态二维图像与所述基准图像匹配成功时，可以获取该基准图像对应的游戏分值、舞蹈分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

请参见图13，为本发明实施例提供了另一种人体姿态匹配设备的结构示意图。如图13所示，本发明实施例的所述人体姿态匹配设备1可以包括：基准图像显示单元11、人体图像显示单元12、业务数据生成单元13、信息获取单元14、初始图像显示单元15、启动图像显示单元16和通知单元17。

信息获取单元14，用于获取应用服务器发送的当前终端类型对应的配置信息；

具体实现中，所述信息获取单元14在安装或开启业务交互应用时，例如：游戏应用、舞蹈应用、广告应用、即时通信应用等，可以向业务交互应用对应的应用服务器请求所述人体姿态匹配设备1的当前终端类型对应的配置信息，进一步的，请一并参见图4，所述人体姿态匹配设备1(即，终端)可以向所述应用服务器(即，服务器)发送携带有当前终端类型的配置请求，所述终端可以包括但不限于所有IOS系统的手机终端、所有Android系统的手机终端、PC、Mac以及Pad等，所述当前终端类型可以包括所述人体姿态匹配设备1的GPU型号、CPU型号中的至少一种，所述应用服务器可以基于所述当前终端类型，获取适用于所述人体姿态匹配设备1的配置信息，并将所述配置信息返回至所述人体姿态匹配设备1，所述配置信息可以包括基准图像、所述基准图像的基准特征点以及偏差标准数据等，所述基准特征点为所述基准图像中预先识别得到的不同关节部位的点，所述偏差标准数据为基准图像与人体姿态二维图像进行匹配时所采用的标准判断数据。所述信息获取单元14获取应用服务器发送的当前终端类型对应的配置信息。

初始图像显示单元15，用于基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中；

具体实现中，由于需要对用户的人体姿态进行采集，因此考虑到用户此时为远离所述人体姿态匹配设备1的位置，因而为了确定用户已经做好准备，可以在启动业务交互应用时，在所述配置信息中随机获取一个基准图像作为初始图像，所述初始图像显示单元15可以基于业务交互应用获取携带有初始启动动作的初始图像，并将所述初始图像显示于业务交互应用的应用界面中，所述初始图像可以为当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述初始启动动作为所述初始图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等，所述初始图像可以在整个应用界面中进行显示，也可以在所述应用界面中的特定区域进行显示，具体可以根据实际应用需求进行设置。请一并参见图5，图5示出了一种初始图像的示意图，其中，该初始图像为类人体的镂空姿态图像，所述初始图像可以显示于完整的应用界面中。

启动图像显示单元16，用于在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像；

具体实现中，所述启动图像显示单元16可以在所述初始图像指示的动作区域中显示所采集的携带有人体初始动作的应用启动图像，所述人体初始动作具体可以为用户按照所述初始启动动作做出相应动作时的动作信息，所述应用启动图像为所述人体姿态匹配设备1对当前人体动作进行采集得到的图像信息，优选的，可以通过所述人体姿态匹配设备1的前置摄像头、可旋转摄像头等单目摄像头对用户的应用启动图像进行采集，所述动作区域具体可以为所述类人体的镂空姿态图像中的镂空区域，也可以是所述应用界面中除所述特定区域外的其它区域，所述动作区域和所述特定区域可以存在重叠的部分，也可以分别占据所述应用界面的不同区域，具体可以根据实际应用场景进行调节。基于应用界面的显示方式，用户可以对准单目摄像头，并在应用界面的动作区域中看见自身，即所述启动图像显示单元16可以将单目摄像头获取的用户姿态显示于所述动作区域，此时可以基于显示的初始图像中的初始启动动作做出相应的人体初始动作。再请一并参见图5，图5所示的类人体的镂空姿态图像中，可以采用单目摄像头采集用户基于类人体的镂空姿态图像中的初始启动动作做出的人体初始动作，并将携带有人体初始动作的应用启动图像显示于类人体的镂空姿态图像中的镂空区域。

通知单元17，用于采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果通知所述基准图像显示单元11执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中；

具体实现中，所述通知单元17可以采用所述初始图像对所述应用启动图像进行匹配处理，以生成匹配结果，优选的，所述通知单元17可以提取所述应用启动图像的人体姿态特征点，所述通知单元17可以采用特征点提取算法对人体姿态二维图像中的人体姿态特征点进行提取，所述人体姿态特征点具体为应用启动图像中识别得到的人体不同关节部位的点。所述人体姿态匹配设备1可以将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述初始图像对应的基准特征点所建立的坐标系。

所述通知单元17可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述应用启动图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。

需要说明的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据，同时所述偏差标准数据还可以对多个距离偏差数据的总和进行判断。当所述距离偏差数据满足所述偏差标准数据时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功，优选的，当所述距离偏差数据小于所述偏差标准数据时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功。

或者，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据。当所述角度偏差数据满足所述偏差标准数据时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功，优选的，当每个角度偏差数据均小于其各自的偏差标准数据时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功；或者，当每个角度偏差数据乘以其各自的向量权重后均处于其各自的偏差标准数据所指示的阈值范围内时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功。

或者，所述人体姿态匹配设备1可以预先获取多个样本姿态特征点，并基于多个样本姿态特征点与基准特征点进行机器学习模型的训练，以获取所述机器学习模型中的模型参数，并将所述模型参数代入机器学习模型中生成训练后的姿态判别模型，所述通知单元17可以基于所述姿态判别模型并采用获取到的人体姿态特征点，获取所述应用启动图像与所述初始图像的匹配结果。

或者，所述通知单元17还可以获取所述应用启动图像中人体初始动作覆盖所述初始图像指示的动作区域的覆盖面积比例，当所述覆盖面积比例大于比例阈值时，所述通知单元17可以确定所述应用启动图像与所述初始图像匹配成功。

所述应用启动图像与所述初始图像均可以为二维图像。

具体实现中，当所述应用启动图像与所述初始图像匹配处理后的匹配结果为匹配成功时，此时说明用户已经做好进入所述业务交互应用的准备，例如：生成确认指令以进入游戏过程、舞蹈过程等，所述基准图像显示单元11可以基于业务交互应用获取基准图像序列，可以理解的是，所述人体姿态匹配设备1中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述基准图像显示单元11可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

所述基准图像显示单元11可以进一步将所述基准图像显示于业务交互应用的应用界面的第一区域中，所述第一区域可以为将业务交互应用的完整的应用界面，也可以为所述应用界面的部分显示区域中，例如：所述应用界面的左半边部分显示区域、右半边部分显示区域等，可以理解的是，所述基准图像显示单元11可以控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中，所述图像显示方向可以为在所述第一区域中按照预先设定的方向对基准图像进行显示，所述第一区域中可以按照所述各基准图像的排列顺序显示排序在前的第一数量的候选基准图像，并将当前需要指示用户进行人体动作的候选基准图像作为基准图像，当然也可以按照所述各基准图像的排列顺序显示排序在前的基准图像，所述图像显示方向可以用于指示所述候选基准图像的显示方向，也可以用于指示所述基准图像的特定显示方式，例如：对所述基准图像进行放大显示、对所述基准图像进行特效显示等，需要说明的是，当当前的基准图像结束显示时，例如：当前的基准图像已经到达显示时间门限等，可以不再对当前的基准图像进行显示，并按照所述排列顺序将候选基准图像的下一个基准图像加入到候选基准图像中，或者获取当前的基准图像的下一个图像作为基准图像等。

具体的，请一并参见图14，为本发明实施例提供了基准图像显示单元的结构示意图。如图14所示，所述基准图像显示单元11可以包括：

序列获取子单元111，用于基于业务交互应用获取当前所选取的基准音频对应的基准图像序列；

具体实现中，当所述应用启动图像与所述初始图像匹配处理后的匹配结果为匹配成功时，此时说明用户已经做好进入所述业务交互应用的准备，例如：生成确认指令以进入游戏过程、舞蹈过程等，所述人序列获取子单元111可以基于业务交互应用获取当前所选取的基准音频对应的基准图像序列，可以理解的是，所述人体姿态匹配设备1中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述序列获取子单元111可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

图像获取子单元112，用于依据基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像；

具体实现中，所述图像获取子单元112可以按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，所述基准图像具体为所述基准图像序列中按照排列顺序当前在业务交互应用的应用界面中显示的标准姿态图像，例如：类人体的镂空姿态图像、卡通姿态图像、舞蹈者姿态图像等，所述基准图像也可以为二维图像，所述基准动作为所述基准图像中给出的标准的动作信息，例如：类人体的镂空指示的动作、卡通人物的动作、舞蹈者的动作等。

图像显示子单元113，用于控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中；

具体实现中，所述图像显示子单元113可以进一步将所述基准图像显示于业务交互应用的应用界面的第一区域中，所述第一区域可以为将业务交互应用的完整的应用界面，也可以为所述应用界面的部分显示区域中，例如：所述应用界面的左半边部分显示区域、右半边部分显示区域等，可以理解的是，所述图像显示子单元113可以控制所述基准图像采用图像显示方向显示于所述业务交互应用的应用界面的第一区域中，所述图像显示方向可以为在所述第一区域中按照预先设定的方向对基准图像进行显示，所述第一区域中可以按照所述各基准图像的排列顺序显示排序在前的第一数量的候选基准图像，并将当前需要指示用户进行人体动作的候选基准图像作为基准图像，当然也可以按照所述各基准图像的排列顺序显示排序在前的基准图像，所述图像显示方向可以用于指示所述候选基准图像的显示方向，也可以用于指示所述基准图像的特定显示方式，例如：对所述基准图像进行放大显示、对所述基准图像进行特效显示等，需要说明的是，当当前的基准图像结束显示时，例如：当前的基准图像已经到达显示时间门限等，可以不再对当前的基准图像进行显示，并按照所述排列顺序将候选基准图像的下一个基准图像加入到候选基准图像中，或者获取当前的基准图像的下一个图像作为基准图像等。请一并参见图6，所述人体姿态匹配设备1的应用界面中左半边(即，第一区域)为该基准图像序列中的候选基准图像，中间的指示方向(即，图像显示方向)为所述基准图像序列中候选基准图像的移动方向，随着候选基准图像的移动方向。

具体的，请一并参见图15，为本发明实施例提供了业务数据生成单元的结构示意图。如图15所示，所述业务数据生成单元13可以包括：

特征点映射子单元131，用于提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中；

具体实现中，所述特征点映射子单元131可以采用所述基准图像对所述人体姿态二维图像进行匹配处理，以生成匹配结果，优选的，所述特征点映射子单元131可以提取所述人体姿态二维图像的人体姿态特征点，所述特征点映射子单元131可以采用特征点提取算法对人体姿态二维图像中的人体姿态特征点进行提取，所述人体姿态特征点具体为人体姿态二维图像中识别得到的人体不同关节部位的点。所述特征点映射子单元131可以将所述人体姿态特征点映射至基准坐标系中，所述基准坐标系为基于所述基准图像对应的基准特征点所建立的坐标系。

具体的，请一并参见图16，为本发明实施例提供了特征点映射子单元的结构示意图。如图16所示，所述特征点映射子单元131可以包括：

特征点生成子单元1311，用于提取所述人体姿态二维图像中人体动作的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成人体动作的人体姿态特征点；

具体实现中，为了解决人体姿态二维图像中的人体姿态特征点的丢点问题和跳点问题，所述特征点生成子单元1311可以进一步对所述人体姿态二维图像进行特征点平滑处理，所述特征点生成子单元1311在采集人体姿态二维图像的其它时间中还可以采集多帧图像以对人体姿态二维图像进行平滑处理，优选的，可以获取该人体姿态二维图像的前两帧图像对该人体姿态二维图像进行平滑处理，处理过程可以包括：

所述特征点生成子单元1311提取所述人体姿态二维图像中的候选姿态特征点，对所述候选姿态特征点进行特征点平滑处理，以生成所述人体姿态二维图像的人体姿态特征点，优选的，可以采用前两帧图像获取的特征点的置信度作为权重值，所述人体姿态中的各个特征点均可以携带有各自的置信度，该置信度的取值可以根据该特征点是否为人体指定关节的点来确定，并通过以下平滑公式对不同的候选姿态特征点进行特征点平滑处理：

坐标系建立子单元1312，用于在所述基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系；

具体实现中，在获取到所述人体姿态二维图像中的人体姿态特征点后，所述坐标系建立子单元1312可以在所述基准图像的基准特征点中任意选取第一特征点和第二特征点，并基于所述第一特征点和所述第二特征点建立基准坐标系，以上半身特征点为例，请一并参见图7，所述坐标系建立子单元1312可以在所述基准图像中获取到A1、B1、C1、D1、E1和F1六个特征点，可以选取C1和D1两个点作为X轴建立该基准图像的基准坐标系，并分别将其余四个点代入该基准坐标系中，其中基准坐标系的原点可以为C1，也可以为D1，还可以以C1和D1所在X轴上的其余点作为原点，本发明实施例不对此进行限定。

特征点获取子单元1313，用于在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点；

具体实现中，所述特征点获取子单元1313进一步可以在所述人体姿态特征点中获取与所述第一特征点对应的第三特征点，以及获取与所述第二特征点对应的第四特征点，基于上述举例，请一并参见图8，所述特征点获取子单元1313获取到平滑后的人体姿态特征点包括A2、B2、C2、D2、E2和F2，所述特征点获取子单元1313可以获取与第一特征点C1对应的第三特征点C2，以及获取与第二特征点D1对应的第四特征点D2。

特征点映射子单元1314，用于获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中；

具体实现中，所述特征点映射子单元1314可以获取所述第一特征点和所述第二特征点与所述第三特征点和所述第四特征点的位置关系数据，并根据所述位置关系数据将所述人体姿态特征点映射至所述基准坐标系中，所述位置关系数据可以包括多种位置调整的参数，例如：平移长度、旋转角度、缩放比例等，请一并参见图9和图10，图9和图10示出了两种特征点的比对图例，如图9和图10所示，通过将C2和D2按一定的旋转角度以及放大比例进行调整，使得C2和D2的位置与C1和D1重合，进而按照该旋转角度以及放大比例，分别将A2、B2、E2和F2映射至所述基准坐标系中。

图像匹配子单元132，用于在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果；

具体实现中，所述图像匹配子单元132可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，所述偏差数据可以为距离偏差数据或者角度偏差数据，所述距离偏差数据可以为所述基准坐标系中各基准特征点与其对应的人体姿态特征点间的距离数值，也可以为在获取每对基准特征点与人体姿态特征点的距离数值后得到的所有距离数值的总和，所述角度偏差数据可以为所述基准坐标系中各基准特征点的向量与其对应的人体姿态特征点的向量间的余弦角度偏差。

在本发明实施例的第一种实施方式中，请一并参见图17，为本发明实施例提供了一种图像匹配子单元的结构示意图。如图17所示，所述图像匹配子单元132可以包括：

距离数据获取子单元1321，用于在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的距离偏差数据；

第一图像匹配子单元1322，用于当所述距离偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功；

具体实现中，所述距离数据获取子单元1321可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的距离偏差数据，请再一并参见图9，图9示出映射后的基准坐标系，分别获取A1与A2的距离偏差数据、B1与B2的距离偏差数据、C1与C2的距离偏差数据、D1与D2的距离偏差数据、E1与E2的距离偏差数据以及F1与F2的距离偏差数据，进而采用偏差标准数据分别对每个距离偏差数据进行判断，可以理解的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据，同时所述偏差标准数据还可以对多个距离偏差数据的总和进行判断。当所述距离偏差数据满足所述偏差标准数据时，所述第一图像匹配子单元1322可以确定所述人体姿态二维图像与所述基准图像匹配成功，优选的，当所述距离偏差数据小于所述偏差标准数据时，所述第一图像匹配子单元1322可以确定所述人体姿态二维图像与所述基准图像匹配成功。

在本发明实施例的第二种实施方式中，请一并参见图18，为本发明实施例提供了另一种图像匹配子单元的结构示意图。如图18所示，所述图像匹配子单元132可以包括：

角度数据获取子单元1323，用于在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的向量数据，并获取所述对应点的向量数据对应的角度偏差数据；

第二图像匹配子单元1324，用于当所述角度偏差数据满足所述偏差标准数据时，确定所述人体姿态二维图像与所述基准图像匹配成功；

具体实现中，所述角度数据获取子单元1323可以在基准坐标系中获取所述人体姿态特征点与所述基准特征点间对应点的向量数据，并获取所述对应点的向量数据对应的角度偏差数据，请再一并参见图10，图10示出映射后的基准坐标系，分别获取A1的向量与A2的向量的角度偏差数据、B1的向量与B2的向量的角度偏差数据、C1的向量与C2的向量的角度偏差数据、D1的向量与D2的向量的角度偏差数据、E1的向量与E2的向量的角度偏差数据以及F1的向量与F2的向量的角度偏差数据，进而采用偏差标准数据分别对每个角度偏差数据进行判断，可以理解的是，每对特征点可以对应有一个偏差标准数据，也可以是每对特征点均对应同一个偏差标准数据。当所述角度偏差数据满足所述偏差标准数据时，所述第二图像匹配子单元1324可以确定所述人体姿态二维图像与所述基准图像匹配成功，优选的，当每个角度偏差数据均小于其各自的偏差标准数据时，所述第二图像匹配子单元1324可以确定所述人体姿态二维图像与所述基准图像匹配成功；或者，当每个角度偏差数据乘以其各自的向量权重后均处于其各自的偏差标准数据所指示的阈值范围内时，所述第二图像匹配子单元1324可以确定所述人体姿态二维图像与所述基准图像匹配成功。

在本发明实施例的第三种实施方式中，所述人体姿态匹配设备1可以预先获取多个样本姿态特征点，并基于多个样本姿态特征点与基准特征点进行机器学习模型的训练，以获取所述机器学习模型中的模型参数，并将所述模型参数代入机器学习模型中生成训练后的姿态判别模型，所述图像匹配子单元132可以基于所述姿态判别模型并采用获取到的人体姿态特征点，获取所述人体姿态二维图像与基准图像的匹配结果。

数据获取子单元133，用于在所述业务交互应用中基于所述匹配结果获取针对所述基准图像的业务数据；

具体实现中，所述数据获取子单元133可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述人体姿态二维图像与所述基准图像匹配成功时，可以获取该基准图像对应的游戏分值、舞蹈分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

请参见图19，为本发明实施例提供了又一种人体姿态匹配设备的结构示意图。如图19所示，本发明实施例的所述人体姿态匹配设备1可以包括：基准图像显示单元11、人体图像显示单元12、业务数据生成单元13、信息获取单元14、初始图像显示单元15、启动图像显示单元16、通知单元17、音频识别单元18和音频匹配单元19。

具体实现中，所述信息获取单元14在安装或开启终端应用时，例如：舞蹈应用、即时通信应用等，可以向终端应用对应的应用服务器请求所述人体姿态匹配设备1的当前终端类型对应的配置信息，进一步的，请一并参见图3，所述人体姿态匹配设备1(即，终端)可以向所述应用服务器发送携带有当前终端类型的配置请求，所述终端可以包括但不限于所有IOS系统的手机终端、所有Android系统的手机终端、PC、Mac以及Pad等，所述当前终端类型可以包括所述人体姿态匹配设备1的GPU型号、CPU型号中的至少一种，所述应用服务器可以基于所述当前终端类型，获取适用于所述人体姿态匹配设备1的配置信息，并将所述配置信息返回至所述人体姿态匹配设备1，所述配置信息可以包括基准图像、所述基准图像的基准特征点以及偏差标准数据等，所述基准特征点为所述基准图像中预先识别得到的不同关节部位的点，所述偏差标准数据为基准图像与人体姿态二维图像进行匹配时所采用的标准判断数据。所述信息获取单元14获取应用服务器发送的当前终端类型对应的配置信息。

通知单元17，用于采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果通知所述基准图像显示单元11执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，并基于所述业务交互应用输出基准音频；

本发明实施例的初始图像显示单元15、启动图像显示单元16和通知单元17可以参见图12和图13所示实施例的具体描述，在此不进行赘述。

基准图像显示单元11，用于基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，并基于所述业务交互应用输出基准音频；

具体实现中，当所述应用启动图像与所述初始图像匹配处理后的匹配结果为匹配成功时，此时说明用户已经做好进入所述业务交互应用的准备，例如：生成确认指令以进入游戏过程、舞蹈过程等，所述人体姿态匹配设备1可以基于业务交互应用获取当前所选取的基准音频对应的基准图像序列，可以理解的是，所述人体姿态匹配设备1中可以预先存储有应用服务器下发的配置信息，所述配置信息包括基准图像、所述基准图像中基准动作的基准特征点和偏差标准数据。所述人体姿态匹配设备1可以基于业务交互应用采用预存的基准图像，随机排列生成所述基准图像序列，或者可以基于当前选取的基准音频，获取该基准音频对应的基准图像序列，其中，所述业务交互应用可以为舞蹈应用、游戏应用、即时通讯应用等，所述应用服务器可以为所述业务交互应用的后台服务设备。

所述基准图像显示单元11在显示所述基准图像的同时，还可以对基于业务交互应用对基准音频进行输出，可以理解的是，所述基准音频可以为用户在配置信息中自定义选择的音频，也可以为人体姿态匹配设备1选择的音频，并可以通过所述人体姿态匹配设备1的麦克风、耳机输出接口等对所述基准音频进行输出。

本发明实施例的人体图像显示单元12和业务数据生成单元13可以参见图12和图13所示实施例的具体描述，在此不进行赘述。

音频识别单元18，用于获取基于当前输出的基准音频所采集的音频数据，获取所述音频数据中的语音信息和所述语音信息对应的音调信息，并将所述语音信息识别为文本信息；

具体实现中，在采集所述人体姿态二维图像的同时，所述音频识别单元18可以获取用户基于当前配合所述基准图像输出的基准音频所采集的音频数据，优选的，可以通过所述人体姿态匹配设备1的麦克风等对用户的音频数据进行采集。所述音频识别单元18可以解析所采集的所述音频数据，并获取所述音频数据中的语音信息和所述语音信息对应的音调信息，可以理解的是，所述语音信息为去除所述音调信息后所得到的文字片段，所述音频识别单元18可以进一步将所述语音信息识别为文本信息，即将语音形式的文字片段转换为文本形式的文字片段，所述音调信息为用户在对所述文字片段进行朗诵或者歌唱时所产生的音调。

音频匹配单元19，用于采用所述基准音频对应的基准文本与所述文本信息进行匹配，并采用所述基准音频对应的基准音调与所述音调信息进行匹配；

具体实现中，所述音频匹配单元19可以采用预先从配置信息中获取到的所述基准音频的基准文本以及基准音调分别对获取的文本信息以及音调信息进行匹配。

所述业务数据生成单元13，还用于基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，生成所述基准音频与所述音频数据的匹配结果，并根据所述基准音频与所述音频数据的匹配结果生成业务交互应用的业务数据；

具体实现中，所述业务数据生成单元13可以分别基于所述基准文本与所述文本信息进行匹配的匹配结果和所述基准音调与所述音调信息进行匹配的匹配结果，所述基准文本与所述文本信息进行匹配的匹配结果以及所述基准音调与所述音调信息进行匹配的匹配结果可以为分别匹配后得到的匹配相似度值，通过将两者的匹配相似度值进行计算，所述业务数据生成单元13可以得到所述基准音频与所述音频数据的匹配结果，优选的，可以分别对文本及音调的匹配过程分配不同的语音权重值，基于该语音权重值以及两者的匹配相似度值获取所述基准音频与所述音频数据的匹配结果。在得到该匹配结果后，所述业务数据生成单元13可以根据匹配处理后的匹配结果生成业务交互应用的业务数据，可以理解的是，当匹配结果确定所述基准音频与所述音频数据匹配成功时，可以获取该基准音频对应的游戏分值、歌唱分值、优惠券等业务数据，具体可以基于不同的业务场景实现业务数据的分配。

本发明实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图1-图11所示实施例的方法步骤，具体执行过程可以参见图1-图11所示实施例的具体说明，在此不进行赘述。

请参见图20，为本发明实施例提供了一种终端的结构示意图。如图20所示，所述终端1000可以包括：至少一个处理器1001，例如CPU，至少一个网络接口1004，用户接口1003，存储器1005，至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、摄像头(Camera)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图20所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及姿态匹配应用程序。

在图20所示的终端1000中，用户接口1003主要用于为用户提供输入的接口，获取用户输入的数据；网络接口1004用于与应用服务器进行数据通信；而处理器1001可以用于调用存储器1005中存储的姿态匹配应用程序，并具体执行以下操作：

在一个实施例中，所述处理器1001还执行以下步骤：

在一个实施例中，所述处理器1001在执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中之前，还执行以下步骤：

在一个实施例中，所述处理器1001在执行基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中时，具体执行以下步骤：

在一个实施例中，所述处理器1001在执行在所述应用界面的第二区域中显示所获取的携带有人体动作的人体姿态二维图像时，具体执行以下步骤：

在一个实施例中，所述处理器1001在执行采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据时，具体执行以下步骤：

在一个实施例中，所述处理器1001在执行提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中时，具体执行以下步骤：

在一个实施例中，所述处理器1001在执行在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果时，具体执行以下步骤：

在一个实施例中，所述处理器1001还执行以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种人体姿态匹配方法，其特征在于，包括：

控制单目摄像头采集携带有按照所述基准动作所输入的人体动作的人体姿态二维图像，并在所述应用界面的第二区域中显示所述人体姿态二维图像；

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求1所述的方法，其特征在于，所述基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中之前，还包括：

采用所述初始图像对所述应用启动图像进行匹配处理，并根据匹配处理后的匹配结果确定转入执行基于业务交互应用获取基准图像序列的步骤。

4.根据权利要求1所述的方法，其特征在于，所述基于业务交互应用获取基准图像序列，按照基准图像序列中各基准图像的排列顺序，在所述基准图像序列中依次获取用于指示基准动作的基准图像，并将所述基准图像显示于所述业务交互应用的应用界面的第一区域中，包括：

5.根据权利要求1所述的方法，其特征在于，所述提取所述人体姿态二维图像中人体动作的人体姿态特征点，并将所述人体姿态特征点映射至基准坐标系中，包括：

6.根据权利要求1所述的方法，其特征在于，所述在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述在所述基准坐标系中获取所述人体姿态特征点与所述基准特征点间的偏差数据，并根据所述偏差数据生成所述人体姿态二维图像与所述基准图像的匹配结果，包括：

8.一种人体姿态匹配设备，其特征在于，包括：

人体图像显示单元，用于控制单目摄像头采集携带有按照所述基准动作所输入的人体动作的人体姿态二维图像，并在所述应用界面的第二区域中显示所述人体姿态二维图像；

业务数据生成单元，用于采用所述基准图像对所述人体姿态二维图像进行匹配处理，并根据匹配处理后的匹配结果生成业务交互应用的业务数据；

其中，所述业务数据生成单元包括：

9.根据权利要求8所述的设备，其特征在于，所述基准图像显示单元包括：

10.根据权利要求8所述的设备，其特征在于，所述特征点映射子单元包括：

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～7任意一项的方法步骤。

12.一种终端，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行以下步骤：