WO2021078182A1

WO2021078182A1 - 一种播放方法以及播放系统

Info

Publication number: WO2021078182A1
Application number: PCT/CN2020/122672
Authority: WO
Inventors: 王斌; 赵其勇; 史浩
Original assignee: 华为技术有限公司
Priority date: 2019-10-22
Filing date: 2020-10-22
Publication date: 2021-04-29
Also published as: CN112702611A

Abstract

本申请公开了一种播放方法，包括：第一终端设备通过广域网接收动作捕捉数据，动作捕捉数据由第二终端设备通过云服务器向第一终端设备发送。第一终端设备通过广域网接收语音信息，语音信息由第二终端设备通过云服务器向第一终端设备发送，第一终端设备与第二终端设备以及云服务器实时共享语音信息。第一终端设备根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。第一终端设备同步播放第一动画和语音信息。通过本申请提供的方案，第二终端设备和第一终端设备不需要部署在同一个地方，还可以实现第一终端设备以全息方式观看数字形象，用户观看视角自行调整，提升用户的观看体验。

Description

一种播放方法以及播放系统

本申请要求于2019年10月22日提交中国专利局，申请号为201911007650.8、发明名称为“一种播放方法以及播放系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，具体涉及一种播放方法。

背景技术

虚拟偶像是用计算机技术生成的媒体明星，比如“初音未来”、“洛天依”、“乐正绫”等等。2018年，虚拟偶像“绊爱”的走红，衍生出了以直播为表现形式的虚拟偶像。虚拟偶像直播是指借助安置在真实人物的头部与肢体上的动作捕捉设备以及传感器将真实人物动作展现到虚拟角色上。借助于实时动作捕捉的机制，虚拟偶像还可以通过肢体或者语言等方式与现实世界中的粉丝进行交流互动。

由于在直播的场景下，对实时性要求比较高，因此目前动作捕捉系统和渲染主机都是在同一个地方部署，二者通过线缆连接或者二者处于同一个局域网络，这在一定程度上限制了动作捕捉系统部署的便携性，增加了动作捕捉系统的部署成本。此外，目前虚拟主播只能以视频直播的方式观看，这意味着所有观看者都以导播控制的相同视角观看虚拟主播，不能以自己需要的视角观看，缺少临场感，观看者的体验感差。

发明内容

本申请实施例提供一种播放方法，使得动作捕捉系统和渲染主机不需要部署在同一个地方，用户可以以全息方式观看数字形象，观看视角自行调整，提升用户的观看体验。

为达到上述目的，本申请实施例提供如下技术方案：

本申请第一方面提供一种播放方法，可以包括：第一终端设备通过广域网接收动作捕捉数据，动作捕捉数据由第二终端设备通过云服务器向第一终端设备发送。第一终端设备通过广域网接收语音信息，语音信息由第二终端设备通过云服务器向第一终端设备发送，第一终端设备与第二终端设备以及云服务器实时共享语音信息。第一终端设备根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。第一终端设备同步播放第一动画和语音信息。由第一方面可知，第二终端设备获取动作捕捉数据，通过广域网传输动作捕捉数据，第一终端设备根据动作捕捉数据对数字形象进行渲染，第二终端设备和第一终端设备不需要部署在同一个地方，此外，相比于现有技术对视频内容进行VR渲染或者AR渲染，本方案对动作捕捉数据实时驱动的虚拟形象进行VR渲染或者AR渲染，实现第一终端设备以全息方式观看数字形象，用户观看视角自行调整，提升用户的观看体验。

可选地，结合上述第一方面，在第一种可能的实现方式中，语音信息和动作捕捉数据可以包括相同的时间戳。第一终端设备同步播放第一动画和语音信息，可以包括：第一终端设备根据相同的时间戳同步播放第一动画和语音信息。

本申请第二方面提供一种播放方法，可以包括：云服务器通过广域网接收第一终端设备发送的第一信息，第一信息用于计算数字形象的3D渲染视角参数。云服务器通过广域网接收第二终端设备发送的动作捕捉数据和语音信息，第一终端设备与第二终端设备以及云服务器实时共享语音信息。云服务器根据动作捕捉数据和第一信息对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。云服务器对第一动画和语音信息进行编码并进行IP封装得到视频。云服务器向第一终端设备发送视频，视频用于第一终端设备解码后播放。由第二方面可知，云服务器对数字形象进行渲染后得到IP视频流，云服务器向第一终端设备发送编码后的IP视频流，当云服务器获取到第一终端设备的控制信息后，可以根据该控制信息，重新渲染数字形象以及场景得到更新后的IP视频流，并将更新后的IP视频流向第一终端设备发送。第二方面提供的方案解决了数字形象的模型精度过高，第一终端设备无法满足其渲染要求的问题。

本申请第三方面提供一种播放方法，可以包括：第一终端设备向云服务器发送第一信息，第一信息用于计算数字形象的3D渲染视角参数，3D渲染视角参数用于云服务器结合动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。第一终端设备接收云服务器发送的视频，视频为云服务器根据第一动画编码获得。

本申请第四方面提供一种播放系统，可以包括：第一终端设备、第二终端设备以及云服务器。第二终端设备，用于通过广域网向云服务器发送动作捕捉数据和语音信息。云服务器，用于将动作捕捉数据和语音信息向第一终端设备发送。第一终端设备，用于根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。第一终端设备，还用于同步播放第一动画和语音信息。

本申请第五方面提供一种播放系统，可以包括：第一终端设备、第二终端设备以及云服务器。第一终端设备为第三方面所描述的第一终端设备，第二终端设备为第二方面所描述的第二终端设备，云服务器为第二方面所描述的云服务器。

本申请第六方面提供一种终端设备，可以包括：收发单元，用于通过广域网接收动作捕捉数据，动作捕捉数据由第二终端设备通过云服务器向第一终端设备发送。收发单元，还用于通过广域网接收语音信息，语音信息由第二终端设备通过云服务器向第一终端设备发送，第一终端设备与第二终端设备以及云服务器实时共享语音信息。处理单元，用于根据收发单元接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。播放单元，用于同步播放第一动画和语音信息。

本申请第七方面提供一种云服务器，可以包括：收发单元，用于通过广域网接收第一终端设备发送的第一信息，第一信息用于计算数字形象的3D渲染视角参数。收发单元，还用于通过广域网接收第二终端设备发送的动作捕捉数据和语音信息，第一终端设备与第二终端设备以及云服务器实时共享语音信息。处理单元，用于根据收发单元接收到的动作捕捉数据和第一信息对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。处理单元，还用于对第一动画和语音信息进行编码并进行IP封装得到视频。收发单元，还用于向第一终端设备发送视频，视频用于第一终端设备解码后播放。

本申请第八方面提供一种终端设备，可以包括：收发单元，用于向云服务器发送第一信息，第一信息用于计算数字形象的3D渲染视角参数，3D渲染视角参数用于云服务器结合动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。收发单元，还用于接收云服务器发送的视频，视频为云服务器根据第一动画编码获得。

本申请第九方面提供一种计算机可读存储介质，当指令在计算机装置上运行时，使得计算机装置执行第一方面的播放方法。

本申请第十方面提供一种计算机可读存储介质，当指令在计算机装置上运行时，使得计算机装置执行如第二方面的播放方法。

本申请第十一方面提供一种计算机可读存储介质，当指令在计算机装置上运行时，使得计算机装置执行如第三方面的播放方法。

本申请第十二方面提供一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如第一方面的播放方法。

本申请第十三方面提供一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如第二方面的播放方法。

本申请第十四方面提供一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如第三方面的播放方法。

本申请第十五方面提供一种终端设备，包括存储器、处理器，所述存储器中存储代码和数据，所述存储器与所述处理器耦合，所述处理器运行所述存储器中的代码使得所述设备执行如第一方面或第一方面第一种可能实现方式的播放方法，或者执行如第三方面的播放方法。

本申请第十六方面提供一种云服务器，包括存储器、处理器，所述存储器中存储代码和数据，所述存储器与所述处理器耦合，所述处理器运行所述存储器中的代码使得所述设备执行如第二方面的播放方法。

通过本申请提供的方案，第二终端设备和第一终端设备不需要部署在同一个地方，还可以实现第一终端设备以全息方式观看数字形象，用户观看视角自行调整，提升用户的观看体验。

附图说明

图1为本申请实施例提供的一种播放系统的架构示意图；

图2为本申请实施例提供的另一种播放系统的架构示意图；

图3为本申请实施例提供的一种应用场景示意图；

图4为本申请实施例提供的通信设备的硬件结构的一个示意图；

图5为本申请实施例提供的一种云服务器的结构示意图；

图6为本申请实施例提供的第一终端设备、第二终端设备相关的手机的部分结构的框图；

图7为本申请实施例提供的第一终端设备的结构示意图；

图8为本申请实施例提供的第二终端设备的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请实施例提供一种播放方法、播放系统及存储介质，第一终端设备通过广域网接收动作捕捉数据，动作捕捉数据由第二终端设备通过云服务器向第一终端设备发送。第一终端设备通过广域网接收语音信息，语音信息由第二终端设备通过云服务器向第一终端设备发送，第一终端设备与第二终端设备以及云服务器实时共享语音信息。第一终端设备根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画。第一终端设备同步播放第一动画和语音信息。通过本申请提供的方案，第二终端设备和第一终端设备不需要部署在同一个地方，还可以实现第一终端设备以全息方式观看数字形象，用户观看视角自行调整，提升用户的观看体验。以下分别进行详细说明。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号，并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤，已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序，只要能达到相同或者相类似的技术效果即可。本申请中所出现的模块的划分，是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个系统中，或一些特征可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些端口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

需要说明的是，本申请实施例中，名词“网络”和“系统”经常交替使用，但本领域的技术人员可以理解其含义。信息(information)，信号(signal)，消息(message)有时可以混用，应当指出的是，在不强调其区别时，其所要表达的含义是一致的。

还需要说明的是，在本申请实施例中，“上报”和“反馈”以及“响应”经常交替使用，但本领域的技术人员可以理解其含义。因此，在本申请实施例中，在不强调其区别时，其所要表达的含义是一致的。

还需要说明的是，在本申请实施例中，“数据”和“信息”经常交替使用，但本领域的技术人员可以理解其含义。因此，在本申请实施例中，在不强调其区别时，其所要表达的含义是一致的。

由于在直播的场景下，对实时性要求比较高，因此目前动作捕捉系统和渲染主机都是在同一个地方部署，二者通过线缆连接或者二者处于同一个局域网络，这在一定程度上限制了动作捕捉系统部署的便携性，增加了动作捕捉系统的部署成本。此外，目前虚拟主播只能以视频直播的方式观看，这意味着所有观看者都以导播控制的相同视角观看虚拟主播，不能以自己需要的视角观看，缺少临场感，观看者的体验感差。为了解决上述问题，本申请提供一种播放系统，以下进行详细的说明。

在本申请提供的方案中，通过引入云服务器，动作捕捉系统和渲染主机不需要部署在同一个地方，其中一种方式，渲染过程在用户的终端设置上进行，另一种方式，渲染过程在云服务器上进行，以下将针对这两种方式分别进行说明。

图1为本申请实施例提供的一种播放系统的架构示意图。

如图1所示，本申请实施例提供的一种播放系统，可以包括：

101、第二终端设备获取动作捕捉数据。

将动作捕捉设备设于人体上，以采集人体的动作。比如可以将动作捕捉设备按照需求分别设置于人体的骶骨、左大腿、右大腿、左小腿、右小腿、左脚、右脚、左肩膀、右肩膀、背心、左上臂、右上臂、左小臂、右小臂、左手掌、右手掌、后脑勺中的任意几个部位上。当然上述提到的几个人体部分仅仅是为了举例说明，并不代表对动作捕捉设备设置位置的限制，在实际应用场景中，可以根据需要将动作捕捉设备设置在人体的其他位置，比如还可以将动作捕捉设备设置在人脸上，以获取人体的表情以及嘴型。动作捕捉设备采集人体动作后将动作信号发送至第二终端设备，第二终端设备对该动作信号进行处理得到动作捕捉数据。需要说明的是，现有技术中关于如何获取动作捕捉数据的技术方案，本申请实施例均可以采用。

102、云服务器通过广域网接收第二终端设备发送的动作捕捉数据。

云服务器通过高速互联网接收第二终端设备发送的动作捕捉数据。比如，云服务器通过第五代(5th generation，5G)移动通信系统接收第二终端设备发送的动作捕捉数据。相比于现有技术为了降低动作捕捉流程和渲染流程之间的时延，实现数字形象直播的顺畅，现有技术要在局域网中传播动作捕捉数据，所以，目前动作捕捉系统和渲染主机都是在同一个地方部署，本方案中通过引入5G通信系统，可以在广域网中传输动作捕捉数据。此外，需要说明的是，随着技术的发展，将来可能会发展到第六代(6th generation，6G)移动通信系统，第七代(7th generation，7G)移动通信系统等等，本申请实施例均可以采用。

103、云服务器通过广域网向第一终端设备发送动作捕捉数据。

在本申请实施例中，第一终端设备可以是在云服务器中注册的终端设备。比如第一终端设备可以向云服务器发送注册请求，该注册请求中携带第一终端设备的标识信息，比如云服务器接收到了N个第一终端设备发送的注册请求，N为正整数，则当云服务器接收到第二终端设备发送的动作捕捉数据后，可以将该动作捕捉数据向该N个第一终端设备发送。或者，第一终端设备也可以是安装了云服务器对应的APP的终端设备，比如第一终端设备预先下载并安装了云服务器对应的APP，则用户可以通过操控第二终端终端上对应的APP和云服务器进行交互。

104、第二终端设备、云服务器以及第一终端设备实时共享语音信息。

第二终端设备、云服务器以及第一终端设备可以进行语音实时通信，关于多个终端设备之间进行语音实时通信，现有技术中已经有成熟的技术，比如微信的语音通信功能，现有技术中关于各个设备之间进行语音实时通信的技术本申请均可以采用。

105、第一终端设备根据接收到的动作捕捉数据对数字形象进行增强现实(augmented reality，AR)渲染或者虚拟现实(virtual reality，VR)渲染。

本申请中，该数字形象可以是一个数字模型。该数字形象可能是上述提到的虚拟偶像的3D数字模型，或者是其他卡通人物的数字模型，或者是其他需要与人互动的形象的数字模型。若第一终端设备上预先存储了该数字形象，则可以直接使用本地存储数字形象，若第一终端设备上没有预先存储该数字形象，第一终端设备可以从云服务器中获取该数字形象。

VR技术是指综合利用计算机图形装置和各种现实及控制等接口设备，在计算机上生成的、可交互的三维环境中提供沉浸感觉的技术。AR是指通过电脑技术，将虚拟的信息应用到真实世界，真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。

在一个具体的实施方式中，第一终端设备根据接收到的动作捕捉数据对数字形象进行VR渲染。具体的，VR引擎根据用户的动作信息计算3D渲染视角参数，比如用户通过手柄进行视角的调控，则VR引擎获取用户对手柄的控制信息，并根据获取到的用户对手柄的控制信息计算3D渲染视角参数。3D渲染引擎根据VR引擎获取到的3D渲染视角参数，以及获取到的动作捕捉数据渲染数字形象对应的数字模型，即渲染数字形象。比如可以采用unity 3D渲染数字形象的3D模型，unity 3D是一个开发软件，当今流行的3D游戏开发引擎之一，当然unity 3D只是为了为了举例说明，任意一个可以实现3D渲染的引擎，本申请实施例均可以采用。VR引擎对3D渲染引擎渲染后得到的3D模型进行VR渲染。

在一个具体的实施方式中，第一终端设备根据接收到的动作捕捉数据对数字形象进行AR渲染。具体的，AR引擎计算3D渲染视角参数，比如AR引擎获取空间坐标信息以及用户的手势控制，并根据获取到的空间坐标信息以及用户的手势控制计算3D渲染视角参数。3D渲染引擎根据AR引擎获取到的3D渲染视角参数，以及获取到的动作捕捉数据渲染数字形象对应的数字模型，即渲染数字形象。

在一个具体的实施方式中，还可以设置数字形象所在的场景，该场景对应一个3D场景的数字模型，在对数字形象进行渲染的同时对该3D场景的数字模型进行渲染。场景的数字模型可以是第一终端设备本地保存的，也可以是第一终端设备从云服务器中获取的。需要说明的是，在直播过程中，第一终端设备还可以接收第二终端设备通过云服务器发送的更换场景的指令，则当第一终端设备接收到更换场景的指令后，更换到指定的场景，对应的，对更换后的场景的3D数字模型进行渲染。

此外，为了保证数字形象的动作和语音的同步，在一个具体的实施方式中，还包括106、第一终端设备对动作捕捉数据和语音信息同步渲染。

第一终端设备接收到的动作捕捉数据和语音信息分别包括对应的相同的时间戳，第一终端设备可以根据对应的时间戳确定与动作捕捉数据匹配的语音信息，或者根据对应的时间戳确定与语音信息匹配的动作捕捉数据，实现动作捕捉数据和语音信息的同步渲染，保证数字形象动作和语音的同步，即第一终端设备同步播放VR渲染或者AR渲染后得到的第一动画和所述语音信息。

由图1对应的实施例可知，第二终端设备获取动作捕捉数据，通过广域网传输动作捕捉数据，第一终端设备根据动作捕捉数据对数字形象进行渲染，第二终端设备和第一终端设备不需要部署在同一个地方，此外，相比于现有技术对视频内容进行VR渲染或者AR渲染，本方案对动作捕捉数据实时驱动的虚拟形象进行VR渲染或者AR渲染，实现第一终端设备以全息方式观看数字形象，用户观看视角自行调整，提升用户的观看体验。

图2为本申请实施例提供的另一种播放系统的架构示意图。

如图2所示，本申请实施例提供的一种播放系统，可以包括：

201、第二终端设备获取动作捕捉数据。

202、云服务器通过广域网接收第二终端设备发送的动作捕捉数据。

步骤201和步骤202可以参考图1对应的实施例中的步骤101和102进行理解，此处不再重复赘述。

203、第二终端设备、云服务器以及第一终端设备实时共享语音信息。

第一终端设备可以是在云服务器中注册的终端设备。第二终端设备、云服务器以及第一终端设备可以进行语音实时通信，关于多个终端设备之间进行语音实时通信，现有技术中已经有成熟的技术，比如微信的语音通信功能，现有技术中关于各个设备之间进行语音实时通信的技术本申请均可以采用。

204、云服务器接收第一终端设备发送的第一信息。

该第一信息为用户的控制信息。比如获取用户对观看角度的调整信息，对画面的缩放信息等等，举例说明，在AR场景中，可以向云服务器发送用户的手势信息或者触屏控制信息，在VR场景中，可以向云服务器发送用户对VR头盔的动作信息以及用户对VR手柄的操控信息。

205、云服务器根据接收到的动作捕捉数据以及第一信息对数字形象进行AR渲染或者VR渲染。

在一个具体的实施方式中，云服务器根据接收到的动作捕捉数据对数字形象进行VR渲染。具体的，VR引擎根据第一信息计算3D渲染视角参数，3D渲染引擎根据VR引擎获取到的3D渲染视角参数，以及获取到的动作捕捉数据渲染数字形象对应的数字模型，即渲染数字形象。VR引擎对3D渲染引擎渲染后得到的3D模型进行VR渲染。

在一个具体的实施方式中，云服务器根据接收到的动作捕捉数据对数字形象进行AR渲染。具体的，AR引擎计算3D渲染视角参数，比如AR引擎根据第一信息计算3D渲染视角参数。3D渲染引擎根据AR引擎获取到的3D渲染视角参数，以及获取到的动作捕捉数据渲染数字形象对应的数字模型，即渲染数字形象。

在一个具体的实施方式中，还可以设置数字形象所在的场景，该场景对应一个3D场景的数字模型，在对数字形象进行渲染的同时对该3D场景的数字模型进行渲染。

此外，为了保证数字形象的动作和语音的同步，在一个具体的实施方式中，云服务器对动作捕捉数据和语音信息同步渲染。

云服务器接收到的动作捕捉数据和语音信息分别包括对应的相同的时间戳，云服务器可以根据对应的时间戳确定与动作捕捉数据匹配的语音信息，或者根据对应的时间戳确定与语音信息匹配的动作捕捉数据，实现动作捕捉数据和语音信息的同步渲染，保证数字形象动作和语音的同步。

206、云服务器向第一终端设备发送编码后的IP视频流。

云服务器对动作捕捉数据实时驱动的数字形象以及语音信息，场景进行VR渲染或者AR渲染后得到的数据进行音视频编码，再对编码后的数据进行IP包封装，将封装后的IP视频流向第一终端设备发送。

207、第一终端设备接收云服务器发送的IP视频流，并对该IP视频流进行解码并显示。

需要说明的是，步骤204至步骤206可以重复执行，比如第一终端设备每隔预设时间向云服务器发送第一信息，云服务器每隔预设时间根据接收到的第一信息以及动作捕捉数据对数字形象进行AR渲染或者VR渲染，并将更新后的IP视频流向第一终端设备发送。

由图2对应的实施例可知，云服务器对数字形象进行渲染后得到IP视频流，云服务器向第一终端设备发送编码后的IP视频流，当云服务器获取到第一终端设备的控制信息后，可以根据该控制信息，重新渲染数字形象以及场景得到更新后的IP视频流，并将更新后的IP视频流向第一终端设备发送。图2对应的方案，解决了数字形象的模型精度过高，第一终端设备无法满足其渲染要求的问题。

在上述图1和图2对应的实施例中，第二终端设备要获取动作捕捉数据以及语音信息，在一些具体的应用场景中，第一终端设端可以看做是一个整体，也可以看做是由几个不同的设备组成，比如第二终端设备包括语音采集设备和动作捕捉数据采集设备。此外，云服务器接收第二终端设备发送的动作捕捉数据和语音信息，在一些具体的应用场景中，云服务器可以看做是一个整体，也可以看做是由几个不同的设备组成，比如，云服务器可以包括语音交互服务器和全系数据服务器，以下分别进行说明。

如3所示，为本申请实施例提供的一种应用场景示意图。

以手机为例进行说明，用户可以操控手机上的APP与云服务器进行交互。如图3中的a所示，用户可以点击进入APP，选择想要观看的直播或者视频。比如，用户点击APP后进入到如图3中的b所示的画面，用户可以选择想要观看的种类，比如用户可以选择观看直播也可以选择视频或者回放，假设用户选择观看直播，在直播界面中，用户可以进一步选择想要观看的主播，其中可以包括虚拟主播，如图3中的b示意性的展示了第一直播间，第二直播间，第三直播间以及第四直播间。假设用户选择进入了第一直播间，第一直播间的主播为第一数字形象，则手机接收来自云端的关于该第一数字形象的动作捕捉数据、该第一数字形象的数字模型、语音信息以及场景信息，根据上述信息，手机结合用户的操作，比如在VR场景中，用户对手柄以及头盔的操作，对动作捕捉数据实时驱动的虚拟形象以及场景模型进行VR渲染或者AR渲染，使得用户可以沉浸式的观看直播。需要说明的是，如果手机本地保存了第一数字形象的数字模型和场景对应的数字模型的相关数据，也可以不从云端获取，这在图1和图2对应的实施例中已经进行了说明，此处不再重复赘述。此外，需要说明的是，手机可以提前获取某一个或者某几个数字形象的数字模型以及场景数字模型，比如如图3中的b所示，在用户进入到APP页面后，为用户推荐了4个直播间，第一直播间，第二直播间，第三直播间以及第四直播间，则如果手机上没有预先存储该四个直播间对应的数字形象的数字模型和场景模型信息，手机可以预先从云端获取这些内容，换句话说，不用等到用户进入直播间后再从云端获取数字形象以及场景对应的数字模型的数据，而是提前从云端获取这些内容。此外，需要说明的，VR渲染或者AR渲染的过程可以在云服务器上进行，这在图1和图2对应的实施例中已经进行了描述，此处不再重复赘述。

上述主要从第一终端设备、第二终端设备以及云服务器之间交互的角度对本申请实施例提供的方案进行了介绍。可以理解的是，上述第一终端设备、第二终端设备以及云服务器为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

从硬件结构上来描述，图1至图3中第一终端设备、第二终端设备以及云服务器可以由一个实体设备实现，也可以由多个实体设备共同实现，还可以是一个实体设备内的不同逻辑功能模块，本申请实施例对此不作具体限定。

例如，云服务器可以通过图4中的通信设备来实现。图4所示为本申请实施例提供的通信设备的硬件结构示意图。该通信设备包括至少一个处理器401。可选地，该通信设备还可以包括：存储器403，通信线路402以及至少一个通信接口404。

处理器401可以是一个通用中央处理器(central processing unit，CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本申请方案程序执行的集成电路。

通信线路402可包括一通路，在上述组件之间传送信息。

通信接口404，使用任何收发器一类的装置，用于与其他设备或通信网络通信，如以太网，无线接入网(radio access network，RAN)，无线局域网(wireless local area networks，WLAN)等，或者也可以是通信模块和其他模块之间的通信接口。

存储器403可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically er服务器able programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过通信线路402与处理器相连接。存储器也可以和处理器集成在一起。

其中，存储器403用于存储执行本申请方案的计算机执行指令，并由处理器401来控制执行。处理器401用于执行存储器403中存储的计算机执行指令，从而实现本申请下述实施例提供的通信的方法。存储器403可以跟处理器401耦合在一起，也可以不耦合在一起。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

在具体实现中，作为一种实施例，处理器401可以包括一个或多个CPU。

在具体实现中，作为一种实施例，通信设备可以包括多个处理器。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中，作为一种实施例，通信设备还可以包括输出设备和输入设备。输出设备和处理器401通信，可以以多种方式来显示信息。例如，输出设备可以是液晶显示器(liquid crystal display，LCD)，发光二级管(light emitting diode，LED)显示设备，阴极射线管(cathode ray tube，CRT)显示设备，或投影仪(projector)等。输入设备和处理器401通信，可以以多种方式接收用户的输入。例如，输入设备可以是鼠标、键盘、触摸屏设备或传感设备等。

本申请实施例可以根据上述方法示例对云服务器进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

比如，以采用集成的方式划分各个功能模块的情况下，图5示出了一种云服务器的结构示意图。

如图5所示，本申请实施例提供的云服务器可以包括收发单元501，

在一个具体的实施方式中，收发单元501，用于执行上述图1对应的实施例中的步骤102，上述图1对应的实施例中的步骤103，上述图1对应的实施例中的步骤104，和/或收发单元501 还用于执行图1对应的实施例中云服务器侧的其他收发步骤。

在一个具体的实施方式中，收发单元501，用于执行上述图2对应的实施例中的步骤202，上述图2对应的实施例中的步骤203，上述图2对应的实施例中的步骤204，上述图2对应的实施例中的步骤206，上述图2对应的实施例中的步骤207，和/或收发单元501还用于执行图2对应的实施例中云服务器侧的其他收发步骤。处理单元502，用于执行上述图2对应的实施例中的步骤205，和/或处理单元502还用于执行图2对应的实施例中云服务器侧的其他处理步骤。

上述实施例中，云服务器以采用集成的方式划分各个功能模块的形式来呈现。当然，本申请实施例也可以对应各个功能划分CU网元和DU网元的各个功能模块，本申请实施例对此不作具体限定。

本申请所涉及的第一终端设备、第二终端设备可以表示任意适用的终端设备，可以包括(或可以表示)诸如无线发送/接收单元(wireless transmit/receive unit，WTRU)、移动站、移动节点、移动设备、固定或移动签约单元、寻呼机、移动电话、手持设备、车载设备、可穿戴设备、掌上电脑(personal digital assistant，PDA)、智能手机、笔记本型电脑、计算机、触摸屏设备、无线传感器或消费电子设备等设备。下面，以第一终端设备、第二终端设备为手机为例进行说明：

图6示出的是与本发明实施例提供的第一终端设备、第二终端设备相关的手机的部分结构的框图。参考图6，手机包括：射频(Radio Frequency，RF)电路601、存储器602、触摸屏603、传感器604、音频电路606、无线保真(wireless fidelity，WiFi)模块605、处理器607、以及电源608等部件。本领域技术人员可以理解，图6中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图6对手机的各个构成部件进行具体的介绍：RF电路601可用于收发信息或通话过程中信号的接收和发送，特别地，将基站的下行信息接收后，给处理器607处理；另外，将设计上行的数据发送给基站。通常，RF电路601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。此外，RF电路601还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(Global System of Mobile communication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、第五代(5th generation，5G)移动通信系统或新无线(new radio，NR)通信系统以及未来的移动通信系统，电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器602可用于存储软件程序以及模块，处理器607通过运行存储在存储器602的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

触摸屏603，也称为触控面板，触摸屏603可以包括触敏表面6031和显示器6032。其中，触敏表面6031(例如触控面板)可采集手机的用户在其上或附近的触摸事件(比如用户使用手指、触控笔等任何适合的物体在触敏表面6031上或在触敏表面6031附近的操作)，并将采集到的触摸信息发送给其他器件例如处理器607。其中，用户在触敏表面6031附近的触摸事件可以称之为悬浮触控；悬浮触控可以是指，用户无需为了选择、移动或拖动目标(例如图标等)而直接接触触控板，而只需用户位于第一终端设备附近以便执行所想要的功能。在悬浮触控的应用场景下，术语“触摸”、“接触”等不会暗示用于直接接触触摸屏，而是在其附近或接近的接触。能够进行悬浮触控的触敏表面6031可以采用电容式、红外光感以及超声波等实现。触敏表面6031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再发送给处理器607，触摸控制器还可以接收处理器607发送的指令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型来实现触敏表面6031。显示器(也称为显示屏)6032可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。可以采用液晶显示器、有机发光二极管等形式来配置显示器6032。触敏表面6031可以覆盖在显示器6032之上，当触敏表面6031检测到在其上或附近的触摸事件后，传送给处理器607以确定触摸事件的类型，随后处理器606可以根据触摸事件的类型在显示器6032上提供相应的视觉输出。虽然在图6中，触敏表面6031与显示屏6032是作为两个独立的部件来实现手机的输入和输出功能，但是在某些实施例中，可以将触敏表面6031与显示屏6032集成而实现手机的输入和输出功能。可以理解的是，603触摸屏是由多层材料堆叠而成，本申请实施例中只展示出了触敏表面(层)和显示屏(层)，其他层在本申请实施例中不予记载。另外，在本申请其他一些实施例中，触敏表面6031可以覆盖在显示器6032之上，并且触敏表面6031的尺寸大于显示屏6032的尺寸，使得显示屏6032全部覆盖在触敏表面6031下面，或者，上述触敏表面6031可以以全面板的形式配置在手机的正面，也即用户在手机正面的触摸均能被手机感知，这样就可以实现手机正面的全触控体验。在其他一些实施例中，触敏表面6031以全面板的形式配置在手机的正面，显示器6032也可以以全面板的形式配置在手机的正面，这样在手机的正面就能够实现无边框的结构。

手机还可包括至少一种传感器604，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示器6032的亮度，接近传感器可在手机移动到耳边时，关闭显示器603和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路606、扬声器6062，传声器6061可提供用户与手机之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号，传输到扬声器6062，由扬声器6062转换为声音信号输出；另一方面，传声器6061将收集的声音信号转换为电信号，由音频电路606接收后转换为音频数据，再将音频数据输出处理器607处理后，经RF电路601以发送给比如另一手机，或者将音频数据输出至存储器602以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块605可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块605，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器607是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器602内的软件程序和/或模块，以及调用存储在存储器602内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器607可包括一个或多个处理单元；优选的，处理器607可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器607中。

手机还包括给各个部件供电的电源608(比如电池)，优选的，电源可以通过电源管理系统与处理器607逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

本申请实施例可以根据上述方法示例对第一终端设备和第二终端设备进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

比如，以采用集成的方式划分各个功能模块的情况下，图7示出了一种第一终端设备的结构示意图。

在一个具体的实施方式中，收发单元701用于执行上述图1对应的实施例中的步骤104、105，和/或收发单元701还用于执行图1对应的实施例中第一终端设备侧的其他收发步骤。处理单元702用于执行上述图1对应的实施例中的步骤105，和/或处理单元702还用于执行图1对应的实施例中第一终端设备侧的其他处理步骤。

在一个具体的实施方式中，收发单元701用于执行上述图2对应的实施例中的步骤203，204，206，207，和/或收发单元701还用于执行图1对应的实施例中第一终端设备侧的其他收发步骤。播放单元703用于执行上述图2对应的实施例中的步骤207。

以采用集成的方式划分各个功能模块的情况下，图8示出了一种第二终端设备的结构示意图。

在一个具体的实施方式中，收发单元801，用于执行上述图1对应的实施例中的步骤101、 102，上述图1对应的实施例中的步骤103，上述图1对应的实施例中的步骤104，和/或收发单元801还用于执行图1对应的实施例中第二终端设备侧的其他收发步骤。处理单元802用于执行上述图1对应的实施例中的步骤101，和/或处理单元802还用于执行图1对应的实施例中第二终端设备侧的其他收发步骤。

在一个具体的实施方式中，收发单元801，用于执行上述图2对应的实施例中的步骤201、202，上述图2对应的实施例中的步骤203，和/或收发单元801还用于执行图2对应的实施例中第二终端设备侧的其他收发步骤。处理单元802，用于执行上述图2对应的实施例中的步骤201，和/或处理单元802还用于执行图2对应的实施例中第二终端设备侧的其他处理步骤。

由于本申请实施例提供的云服务器、第一终端设备以及第二终端终端设备可用于执行上述定位的方法，因此其所能获得的技术效果可参考上述方法实施例，在此不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

以上对本申请实施例所提供的播放方法、播放系统以及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种播放方法，其特征在于，包括：

第一终端设备通过广域网接收动作捕捉数据，所述动作捕捉数据由第二终端设备通过云服务器向所述第一终端设备发送；

所述第一终端设备通过广域网接收语音信息，所述语音信息由第二终端设备通过云服务器向所述第一终端设备发送，所述第一终端设备与所述第二终端设备以及所述云服务器实时共享语音信息；

所述第一终端设备根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述第一终端设备同步播放所述第一动画和所述语音信息。
根据权利要求1所述的播放方法，其特征在于，所述语音信息和所述动作捕捉数据包括相同的时间戳；

所述第一终端设备同步播放所述第一动画和所述语音信息，包括：

所述第一终端设备根据所述相同的时间戳同步播放所述第一动画和所述语音信息。
一种播放方法，其特征在于，包括：

云服务器通过广域网接收第一终端设备发送的第一信息，所述第一信息用于计算数字形象的3D渲染视角参数；

所述云服务器通过广域网接收第二终端设备发送的动作捕捉数据和语音信息，所述第一终端设备与所述第二终端设备以及所述云服务器实时共享语音信息；

所述云服务器根据所述动作捕捉数据和所述第一信息对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述云服务器对所述第一动画和所述语音信息进行编码并进行IP封装得到视频；

所述云服务器向所述第一终端设备发送所述视频，所述视频用于所述第一终端设备解码后播放。
一种播放方法，其特征在于，包括：

第一终端设备向云服务器发送第一信息，所述第一信息用于计算数字形象的3D渲染视角参数，所述3D渲染视角参数用于所述云服务器结合动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述第一终端设备接收所述云服务器发送的视频，所述视频为所述云服务器根据第一动画编码获得。
一种播放系统，其特征在于，包括：第一终端设备、第二终端设备以及云服务器；

所述第二终端设备，用于通过广域网向所述云服务器发送动作捕捉数据和语音信息；

所述云服务器，用于将所述动作捕捉数据和所述语音信息向所述第一终端设备发送；

所述第一终端设备，用于根据接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述第一终端设备，还用于同步播放所述第一动画和所述语音信息。
一种播放系统，其特征在于，包括：第一终端设备、第二终端设备以及云服务器；

所述第一终端设备为权利要求4所描述的第一终端设备，所述第二终端设备为权利要求3所描述的第二终端设备，所述云服务器为权利要求3所描述的云服务器。
一种终端设备，其特征在于，包括：

收发单元，用于通过广域网接收动作捕捉数据，所述动作捕捉数据由第二终端设备通过云服务器向所述第一终端设备发送；

所述收发单元，还用于通过广域网接收语音信息，所述语音信息由第二终端设备通过云服务器向所述第一终端设备发送，所述第一终端设备与所述第二终端设备以及所述云服务器实时共享语音信息；

处理单元，用于根据所述收发单元接收到的动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

播放单元，用于同步播放所述第一动画和所述语音信息。
一种云服务器，其特征在于，包括：

收发单元，用于通过广域网接收第一终端设备发送的第一信息，所述第一信息用于计算数字形象的3D渲染视角参数；

所述收发单元，还用于通过广域网接收第二终端设备发送的动作捕捉数据和语音信息，所述第一终端设备与所述第二终端设备以及所述云服务器实时共享语音信息；

处理单元，用于根据所述收发单元接收到的所述动作捕捉数据和所述第一信息对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述处理单元，还用于所述对所述第一动画和所述语音信息进行编码并进行IP封装得到视频；

所述收发单元，还用于向所述第一终端设备发送所述视频，所述视频用于所述第一终端设备解码后播放。
一种终端设备，其特征在于，包括：

收发单元，用于向云服务器发送第一信息，所述第一信息用于计算数字形象的3D渲染视角参数，所述3D渲染视角参数用于所述云服务器结合动作捕捉数据对数字形象进行增强现实AR渲染或者虚拟现实VR渲染得到第一动画；

所述收发单元，还用于接收所述云服务器发送的视频，所述视频为所述云服务器根据第一动画编码获得。
一种计算机可读存储介质，其特征在于，当指令在计算机装置上运行时，使得所述计算机装置执行如权利要求1或2所述的方法。
一种计算机可读存储介质，其特征在于，当指令在计算机装置上运行时，使得所述计算机装置执行如权利要求3所述的方法。
一种计算机可读存储介质，其特征在于，当指令在计算机装置上运行时，使得所述计算机装置执行如权利要求4所述的方法。
一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如权利要求1或2所述的方法。
一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如权利要求 3所述的方法。
一种计算机程序产品，当其在计算机上运行时，使得计算机可以执行如权利要求4所述的方法。
一种终端设备，其特征在于，所述设备包括存储器、处理器，所述存储器中存储代码和数据，所述存储器与所述处理器耦合，所述处理器运行所述存储器中的代码使得所述设备执行如权利要求1或2所述的方法，或者执行如权利要求4所述的方法。
一种云服务器，其特征在于，所述设备包括存储器、处理器，所述存储器中存储代码和数据，所述存储器与所述处理器耦合，所述处理器运行所述存储器中的代码使得所述设备执行如权利要求3所述的方法。