WO2022222533A1

WO2022222533A1 - 视频播放方法、装置及系统、计算机可读存储介质

Info

Publication number: WO2022222533A1
Application number: PCT/CN2021/141641
Authority: WO
Inventors: 侯成宝; 屈小刚; 李虹波; 曹阳
Original assignee: 华为技术有限公司
Priority date: 2021-04-22
Filing date: 2021-12-27
Publication date: 2022-10-27
Also published as: EP4319168A1; EP4319168A4; CN115243076A

Abstract

公开了一种视频播放方法、装置及系统、计算机可读存储介质，属于视频处理技术领域。上层设备在接收到终端发送的播放请求后，向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据。当终端接收到旋转指令时，可以根据预先获取的旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低。并且终端播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同，因此不受限于前端拍摄所采用的相机数量，应用范围广。

Description

视频播放方法、装置及系统、计算机可读存储介质

本申请要求于2021年04月22日提交的申请号为202110435658.5、发明名称为“视频播放方法、装置及系统、计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频处理技术领域，特别涉及一种视频播放方法、装置及系统、计算机可读存储介质。

背景技术

随着互联网技术的快速发展，用户开始追求更好的视频观看体验，从而衍生出围绕目标对象环绕观看的需求。特别是在体育比赛、演唱会或其它具有特定焦点的场景下，环绕观看需求更甚。为了满足用户的环绕观看需求，需要在终端上实现环绕播放。

环绕播放要求前端拍摄采用分布在特定位置的多相机采集同一焦点区域内不同角度的视频画面，同时基于相机同步技术，保证多相机采集图像的时刻和频率相同。然后多相机分别将采集的视频流发送到视频处理平台，由视频处理平台对多路视频流进行处理，进一步在终端上实现对焦点区域的环绕播放。

相关技术中，通常由服务端将多路视频流中采集时刻相同的视频帧拼接成一个视频帧。例如，前端拍摄采用16个相机采集同一焦点区域内不同角度的视频画面。服务端将接收到的16路视频流中每路视频流中的视频帧的分辨率均调整为960×540，然后将16路视频流中采集时刻相同的16个视频帧按照4×4等比例组合成分辨率为3840×2160(即4K)的一个视频帧，得到一路视频流。服务端向终端发送该路视频流。终端对该路视频流进行解码后，根据设置的观看机位，选择其中的1/16的视频画面(一个相机采集的视频画面)进行播放。

但是，采用相关技术中的视频播放方法，由于终端播放画面的分辨率与前端拍摄采用的相机数量成反比，导致前端拍摄采用的相机数量受限，因此应用局限性较高。

发明内容

本申请提供了一种视频播放方法、装置及系统、计算机可读存储介质，可以解决相关技术中视频播放的应用局限性较高的问题。

第一方面，提供了一种视频播放方法。该方法包括：上层设备接收终端发送的播放请求，该播放请求中包括播放机位信息，该播放机位信息用于指示所请求播放的目标机位。上层设备向终端发送目标机位对应的视频分片以及目标机位对应的旋转视频数据。该旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据。正向机位包括位于目标机位的顺时针方向的一个或多个第一机位，逆向机位包括位于目标机位的逆时针方向的一个或多个第二机位。

本申请中，上层设备向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据，终端在接收到目标机位对应的视频分片后，对该视频分片进行解码即可实现对该目标机位所采集的视频画面的播放；当终端接收到旋转指令时，可以根据预先获取的旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低，且播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同。因此本申请提供的视频播放方法不受限于前端拍摄所采用的相机数量，应用范围广。另外，与相关技术相比，上层设备无需始终向终端发送所有相机所采集的视频画面，可以减少数据传输量，节约传输资源。

可选地，上层设备向终端发送目标机位对应的旋转视频数据的实现过程，包括：响应于上层设备接收到终端发送的旋转预备请求，上层设备向终端发送旋转视频数据，旋转预备请求用于请求获取目标机位对应的旋转视频数据。或者，响应于播放请求，上层设备向终端发送旋转视频数据。

本申请中，上层设备可以在接收到终端发送的播放请求后，主动向终端发送所请求播放的机位对应的旋转视频数据，或者，也可以在接收到终端发送的旋转预备请求后，被动响应向终端发送所请求播放的机位对应的旋转视频数据。

可选地，正向机位对应的视频数据包括每个第一机位对应的视频分片。或者，正向机位包括位于目标机位的顺时针方向的多个第一机位，正向机位对应的视频数据为正向旋转分片，正向旋转分片包括正向动态旋转子分片和/或正向静态旋转子分片。其中，正向动态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向动态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，正向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。正向静态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，正向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

可选地，逆向机位对应的视频数据包括每个第二机位对应的视频分片。或者，逆向机位包括位于目标机位的逆时针方向的多个第二机位，逆向机位对应的视频数据为逆向旋转分片，逆向旋转分片包括逆向动态旋转子分片和/或逆向静态旋转子分片。其中，逆向动态旋转子分片包括基于多个第二机位对应的视频分片中的视频图像得到的多个图像帧组，逆向动态旋转子分片中的每个图像帧组基于一个第二机位对应的视频分片中的视频图像得到，逆向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第二机位在逆时针方向上到目标机位的距离由近至远依次排列。逆向静态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，逆向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，逆向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

本申请中涉及的图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。

可选地，上层设备还可以接收终端发送的环绕播放请求，该环绕播放请求中包括旋转机位信息，旋转机位信息用于指示旋转范围。上层设备基于环绕播放请求确定播放时间信息。上层设备根据旋转机位信息和播放时间信息生成旋转分片，该旋转分片中包括旋转范围内的多个机位对应的图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。上层设备向终端发送旋转分片。

本申请中，上层设备根据终端发送的环绕播放请求确定播放时间信息，然后根据播放时间信息以及环绕播放请求中的旋转机位信息生成旋转分片。由于旋转分片中包含旋转机位信息所指示的旋转范围内的多个机位对应的图像帧组，终端在接收到旋转分片后，对旋转分片进行解码即可实现对视频画面的环绕播放，且播放的视频画面的分辨率可以与旋转分片中的视频图像的分辨率相同。因此本申请提供的视频播放方法不受限于前端拍摄采用的摄像机数量，应用范围广。

可选地，图像帧组为GOP。或者，图像帧组包括插入帧。或者，图像帧组包括插入帧和P帧的组合。或者，图像帧组包括插入帧、P帧和B帧的组合。

本申请中，图像帧组包括插入帧，即旋转分片可以基于插入帧生成，此时上层设备向终端发送的视频分片中无需使用全I帧或mini GOP，而可以使用正常GOP，能够降低上层设备向终端发送的视频分片的数据量；并且，插入帧的数据量通常小于I帧的数据量，能够降低上层设备向终端发送的旋转分片的数据量，因此利用插入帧技术生成旋转分片，可以有效减少网络传输资源的消耗。

可选地，旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，预备旋转状态包括动态旋转状态和/或静态旋转状态，旋转预备请求中的内容是终端中预先配置的。

第二方面，提供了一种视频播放方法。该方法包括：当终端接收到播放指令时，终端向上层设备发送基于播放指令生成的播放请求，播放请求中包括播放机位信息，播放机位信息用于指示所请求播放的目标机位。终端接收上层设备发送的目标机位对应的视频分片以及目标机位对应的旋转视频数据，旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，正向机位包括位于目标机位的顺时针方向的一个或多个第一机位，逆向机位包括位于目标机位的逆时针方向的一个或多个第二机位。当终端在基于目标机位对应的视频分片播放视频画面的过程中，接收到旋转指令时，终端根据旋转指令确定旋转方向，旋转方向为顺时针方向或逆时针方向。响应于旋转视频数据包括位于目标机位的旋转方向上的机位对应的目标视频数据，终端基于目标视频数据播放视频画面。

本申请中，上层设备向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据，终端在接收到目标机位对应的视频分片后，对该视频分片进行解码即可实现对该目标机位所采集的视频画面的播放；当终端接收到旋转指令时，可以根据旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低，且播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同。因此本申请提供的视频播放方法不受限于前端拍摄所采用的相机数量，应用范围广。另外，与相关技术相比，上层设备无需始终向终端发送所有相机所采集的视频画面，可以减少数据传输量，节约传输资源。

可选地，在终端接收到旋转指令之前，终端还可以生成旋转预备请求，该旋转预备请求用于请求获取目标机位对应的旋转视频数据。终端向上层设备发送旋转预备请求，目标机位对应的旋转视频数据是上层设备响应于旋转预备请求发送的。

在一种实现方式中，目标视频数据为目标旋转分片。目标旋转分片包括基于位于目标机位的旋转方向的多个机位对应的视频分片中的视频图像得到的多个图像帧组，目标旋转分片中的每个图像帧组基于位于目标机位的旋转方向的一个机位对应的视频分片中的视频图像得到，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。

其中，响应于终端在视频播放状态下接收到旋转指令，目标旋转分片包括动态旋转子分片，该动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个机位在旋转方向上到目标机位的距离由近至远依次排列。或者，响应于终端在视频暂停播放状态下接收到旋转指令，目标旋转分片包括静态旋转子分片，所述静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个机位在旋转方向上到目标机位的距离由近至远依次排列。

相应地，终端基于目标视频数据播放视频画面的实现过程，包括：终端对目标旋转分片进行解码播放。

在该实现方式中，当终端接收到旋转指令时，通过对预先获取的旋转分片进行解码即可实现对视频画面的环绕播放，环绕播放时延较低。

在另一种实现方式中，目标视频数据包括位于目标机位的旋转方向的多个机位分别对应的视频分片。终端基于目标视频数据播放视频画面的实现过程，包括：终端基于多个机位对应的视频分片中的视频图像分别生成图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。终端按照多个机位在旋转方向上到目标机位的距离由近至远的顺序，依次播放生成的图像帧组中的视频图像。

在该实现方式中，当终端接收到旋转指令时，终端可以解码播放预先获取的旋转方向上的机位对应的视频分片中的视频图像实现对视频画面的环绕播放，环绕播放时延较低。

可选地，当终端接收到旋转指令时，终端向上层设备发送基于旋转指令生成的环绕播放请求，环绕播放请求中包括旋转机位信息，旋转机位信息用于指示旋转范围。终端接收上层设备发送的旋转分片，旋转分片中包括旋转范围内的多个机位对应的图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。终端对旋转分片进行解码播放。

可选地，图像帧组为GOP；或者，图像帧组包括插入帧；或者，图像帧组包括插入帧和P帧的组合；或者，图像帧组包括插入帧、P帧和B帧的组合。

第三方面，提供了一种视频播放装置。该视频播放装置为上层设备。所述装置包括多个功能模块，所述多个功能模块相互作用，实现上述第一方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现，且所述多个功能模块可以基于具体实现进行任意组合或分割。

第四方面，提供了一种视频播放装置。该视频播放装置为终端。所述装置包括多个功能模块，所述多个功能模块相互作用，实现上述第二方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现，且所述多个功能模块可以基于具体实现进行任意组合或分割。

第五方面，提供了一种视频播放系统，所述系统包括：上层设备和终端，所述上层设备包括如第三方面所述的视频播放装置，所述终端包括如第四方面所述的视频播放装置。

第六方面，提供了一种视频播放装置，包括：处理器和存储器；

所述存储器，用于存储计算机程序，所述计算机程序包括程序指令；

所述处理器，用于调用所述计算机程序，实现如第一方面任一所述的视频播放方法；或者，实现如第二方面任一所述的视频播放方法。

第七方面，提供了一种计算机存储介质，所述计算机存储介质上存储有指令，当所述指令被计算机设备的处理器执行时，实现如第一方面或第二方面任一所述的视频播放方法。

第八方面，提供了一种芯片，芯片包括可编程逻辑电路和/或程序指令，当芯片运行时，实现上述第一方面及其各实施方式中的方法或实现上述第二方面及其各实施方式中的方法。

第九方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现如第一方面或第二方面任一所述的视频播放方法。

本申请提供的技术方案带来的有益效果至少包括：

上层设备向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据，终端在接收到目标机位对应的视频分片后，对该视频分片进行解码即可实现对该目标机位所采集的视频画面的播放；当终端接收到旋转指令时，可以根据预取的旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低，且播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同。因此本申请实施例提供的视频播放方法不受限于前端拍摄所采用的相机数量，应用范围广。另外，与相关技术相比，上层设备无需始终向终端发送所有相机所采集的视频画面，可以减少数据传输量，节约传输资源。另外，旋转分片可以基于插入帧生成，此时上层设备向终端发送的视频分片中无需使用全I帧或mini GOP，而可以使用正常GOP，能够降低上层设备向终端发送的视频分片的数据量；并且，插入帧的数据量通常小于I帧的数据量，能够降低上层设备向终端发送的旋转分片的数据量，因此利用插入帧技术生成旋转分片，可以有效减少网络传输资源的消耗。

附图说明

图1是本申请实施例提供的一种视频播放系统的结构示意图；

图2是本申请实施例提供的一种视频分片的结构示意图；

图3是本申请实施例提供的一种编码得到的GOP与插入帧流的对比结构示意图；

图4是本申请实施例提供的一种媒体源侧的摄像机分布场景示意图；

图5是本申请实施例提供的一种视频播放方法的流程示意图；

图6是本申请实施例提供的另一种媒体源侧的摄像机分布场景示意图；

图7是本申请实施例提供的多个机位分别对应的视频分片的结构示意图；

图8是本申请实施例提供的一种上层设备向终端发送的媒体内容的示意图；

图9是本申请实施例提供的一种正向静态旋转分片的结构示意图；

图10是本申请实施例提供的多个机位分别对应的视频流和插入帧流的结构示意图；

图11是本申请实施例提供的另一种上层设备向终端发送的媒体内容的示意图；

图12是本申请实施例提供的另一种正向静态旋转分片的结构示意图；

图13是本申请实施例提供的一种动态旋转分片的生成过程示意图；

图14是本申请实施例提供的另一种动态旋转分片的生成过程示意图；

图15是本申请实施例提供的一种静态旋转分片的生成过程示意图；

图16是本申请实施例提供的另一种静态旋转分片的生成过程示意图；

图17是本申请实施例提供的一种视频播放装置的结构示意图；

图18是本申请实施例提供的另一种视频播放装置的结构示意图；

图19是本申请实施例提供的一种视频播放装置的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的一种视频播放系统的结构示意图。如图1所示，该系统包括：媒体源101、视频服务器102和终端103。

媒体源101用于提供多路视频流。参见图1，媒体源101包括多个摄像机1011和前端编码器1012。摄像机1011与前端编码器1012连接。每个摄像机1011用于采集一路视频流，并将采集到的视频流传输至前端编码器1012。前端编码器1012用于对多个摄像机1011采集的视频流进行编码，并将编码后的视频流发送给视频服务器102。本申请实施例中，多个摄像机1011用于采集同一焦点区域内不同角度的视频图像，且该多个摄像机1011采集图像的时刻和频率相同。可选地，可以采用相机同步技术实现多个摄像机1011的同步拍摄。图中摄像机的数量仅用作示例性说明，不作为对本申请实施例提供的视频播放系统的限制。多个摄像机可以采用环形排布方式或扇形排布方式等，本申请实施例对摄像机的排布方式不做限定。

视频服务器102用于对媒体源101发送的视频流采用OTT(over the top)技术进行处理，并将处理后的视频流通过内容分发网络(content delivery network，CDN)分发至终端。CDN是构建在现有网络基础之上的智能虚拟网络，CDN可以包括部署在各地的边缘服务器，还可以包括中心服务器。可选地，参见图1，视频服务器102包括视频处理服务器1021和视频分发服务器1022。视频处理服务器1021用于采用OTT技术对视频流进行处理，并将处理后的视频流发送给视频分发服务器1022；视频分发服务器1022用于将视频流分发至终端。其中，视频处理服务器1021也可称为视频处理平台，视频处理服务器1021可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心。视频分发服务器1022可以是CDN的中心服务器或者边缘服务器。当然，视频处理服务器1021与视频分发服务器1022也可以集成在一起，本申请实施例对此不做限定。

终端103即视频播放端，用于对视频服务器102发送的视频流进行解码播放。可选地，终端103能够通过触控、语音控制、手势控制或遥控器控制等控制方式中一种或多种方式改变播放角度。本申请实施例对触发终端改变播放角度的控制方式不做限定。例如，终端103可以是手机、平板电脑或智能可穿戴设备等能够通过触控方式或语音控制方式改变播放角度的设备。或者，终端103也可以是机顶盒(set top box，STB)等能够通过遥控器的控制改变播放角度的设备。

本申请实施例中，媒体源101侧的前端编码器1012或视频服务器102侧的视频处理服务器1021在获取多路视频流后，对每路视频流进行重新编码(也可称为转码)得到图像组(Group of Pictures，GOP)，并基于GOP生成视频分片进行传输，每个GOP可被独立解码。其中，一个视频分片中通常封装有多个GOP，每个GOP包括一帧或多帧视频图像。例如，一个GOP可以包括一个帧内编码图像(intra coded picture，I)帧；或者，一个GOP可以包括一个I帧以及位于I帧之后的一个或多个预测编码图像(predictive coded picture，P)帧；又或者，一个GOP可以包括一个I帧、位于I帧之后的一个或多个P帧以及位于I帧和P帧之间的一个或多个双向预测编码图像(bidirectionally predicted picture，B)帧。GOP通常是一组时间上的连续视频图像。对视频流进行重新编码得到的GOP的时间戳与摄像机对该GOP中的视频图像的采集时刻对应。例如，GOP的时间戳可以被设置为该GOP中最后一帧视频图像的采集时刻。又例如，当GOP中包括多帧视频图像时，GOP对应有开始时间戳和结束时间戳，开始时间戳为该GOP中第一帧视频图像的采集时刻，结束时间戳为该GOP中最后一帧视频图像的采集时刻。

可选地，时间长度小于1秒的GOP通常被称为小GOP(mini GOP)。GOP的时间参数可由管理人员设置。在固定时间长度下，每个GOP中包含的视频图像帧数与摄像机的拍摄帧率正相关，即摄像机的拍摄帧率越高，每个GOP中包含的视频图像帧数越多。例如，GOP中可以包括2帧视频图像(可对应每秒传输帧数(frame per second，FPS)为25(简称：25FPS))、3帧视频图像(可对应30FPS)、5帧视频图像(可对应50FPS)或6帧视频图像(可对应60FPS)。当然，GOP中也可以只包括1帧视频图像(即仅包括I帧)或包括更多帧视频图像，本申请实施例对此不做限定。

本申请实施例中，视频分片中的GOP采用独立传输封装方式编码，使得每个GOP可以作为单独的碎片(也可称为子分片)进行独立使用。例如，视频分片可以采用碎片mp4(fragmented mp4，fmp4)格式进行封装。fmp4格式是运动图像专家组(moving picture expert group，MPEG)提出的MPEG-4标准中定义的流媒体格式。图2是本申请实施例提供的一种视频分片的结构示意图。如图2所示，该视频分片中包括n个封装头和n个数据字段(mdat)，每个mdat用于承载一个GOP的数据，也即是该视频分片中封装有n个GOP，n为大于1的整数。每个封装头中包括moof字段。该视频分片的封装方式也可称为多moof头封装方式。可选地，封装头中还可以包括styp字段和sidx字段。

值得说明的是，本申请实施例中涉及的分片(segment)是指能够被独立请求获取的视频数据，子分片(fragment)是指能够被独立解码播放的视频数据。一个分片通常包括一个或多个子分片。

可选地，媒体源101侧的前端编码器1012或视频服务器102侧的视频处理服务器1021在获取多路视频流后，还可以对每路视频流进行重新编码得到插入帧流。插入帧流包括多个插入帧，插入帧为不参考时域运动矢量编码得到的P帧，插入帧可视为I帧的延续。插入帧被定义为不依赖于I帧能够独立解码的P帧，普通P帧必须依赖于I帧才能进行解码操作，而插入帧可以独立解码。本申请以下实施例中采用P’帧表示插入帧。

本申请实施例中，针对每个机位，前端编码器1012或视频处理服务器1021可以针对一个GOP中的多个P帧，间隔编码得到对应的P’帧。例如，图3是本申请实施例提供的一种编码得到的GOP与插入帧流的对比结构示意图。如图3所示，GOP包括I帧以及位于I帧之后的9个P帧，该9个P帧分别为P-0至P-8，对应地，插入帧流包括4个P’帧，该4个P’帧分别为P’-1、P’-3、P’-5和P’-7。其中，P’-1帧对应的视频画面与P-1帧对应的视频画面相同，P’-3帧对应的视频画面与P-3帧对应的视频画面相同，P’-5帧对应的视频画面与P-5帧对应的视频画面相同，P’-7帧对应的视频画面与P-7帧对应的视频画面相同。P-0帧依赖于I帧解码得到视频图像，P-2帧可以依赖于P’-1帧解码得到视频图像，P-4帧可以依赖于P’-3帧解码得到视频图像，P-6帧可以依赖于P’-5帧解码得到视频图像，P-8帧可以依赖于P’-7帧解码得到视频图像。

视频服务器102侧的视频处理服务器1021还根据外部设置的数据，生成媒体内容索引(也可称为OTT索引)。媒体内容索引用于描述每条视频流的信息，媒体内容索引实质上为描述视频流的信息的文件。视频流的信息包括视频流的地址信息以及视频流的时间信息等。视频流的地址信息用于指示该视频流的获取地址，例如视频流的地址信息可以是该视频流对应的统一资源定位符(uniform resource locator，URL)地址。视频流的时间信息用于指示该视频流中每个视频分片的起始时刻和结束时刻。其中，视频分片的起始时刻可以是该视频分片中的第一帧视频图像的采集时刻，视频分片的结束时刻可以是该视频分片中最后一帧视频图像的采集时刻。可选地，该媒体内容索引中还可以包括机位信息。机位信息包括机位数量(即媒体源侧的摄像机数量)和每条视频流对应的机位角度。视频流对应的机位角度即摄像机对应的机位角度。

例如，图4是本申请实施例提供的一种媒体源侧的摄像机分布场景示意图。如图4所示，该场景中包括20个摄像机，分别记为摄像机1-20。该20个摄像机采用环形排布方式，用于拍摄同一焦点区域M，拍摄焦点均为点O。可以将其中一个摄像机对应的机位角度设置为0，并对应计算其它摄像机对应的机位角度。例如可以将摄像机4对应的机位角度设置为0°，分别计算其它摄像机对应的机位角度，则摄像机9对应的机位角度为90°，摄像机14对应的机位角度为180°，摄像机19对应的机位角度为270°。

管理人员可以将摄像机数量以及各个摄像机对应的机位角度输入视频处理服务器，供视频处理服务器生成媒体内容索引。可选地，本申请实施例中的媒体内容索引可以是m3u8文件(可称为基于超文本传输协议(hyper text transfer protocol，HTTP)的直播流(HTTP living streaming，HLS)索引)或媒体演示描述(media presentation description，MPD)文件(可称为基于HTTP的动态自适应流(dynamic adaptive streaming over HTTP，DASH)索引)。其中，m3u8文件是指8位统一码转换格式(8-bit unicode transformation format，UTF-8)编码格式的m3u文件。

本申请实施例中，视频服务器102与终端103之间可以基于超文本传输协议(hyper text transfer protocol，HTTP)传输视频流。终端获取视频服务器中的视频内容的过程包括：终端先从视频服务器下载媒体内容索引，通过解析该媒体内容索引得到视频流的信息。终端选择当前需要播放的视频流，并从媒体内容索引中提取该视频流的URL地址，然后通过该视频流的URL地址向视频服务器发送媒体内容请求。视频服务器接收到该媒体内容请求后，向终端发送对应的视频流。

可选地，请继续参见图1，该视频播放系统中还可以包括网络设备104，视频服务器102与终端103之间通过网络设备104连接。网络设备104可以是网关或其它中间设备。当然，视频服务器102与终端103之间也可以直接连接，本申请实施例对此不做限定。

图5是本申请实施例提供的一种视频播放方法的流程示意图。该方法可以应用于如图1所示的视频播放系统中。如图5所示，该方法包括：

步骤501、当终端接收到播放指令时，终端基于该播放指令生成播放请求。

该播放请求中包括播放机位信息，该播放机位信息用于指示所请求播放的目标机位。

可选地，播放机位信息包括目标机位对应的视频流的URL地址。或者，当终端获取的媒体内容索引中包括机位信息时，播放机位信息可以包括目标机位的标识。本申请实施例中，播放请求也可称为媒体内容请求。

步骤502、终端向上层设备发送播放请求。

本申请实施例中，上层设备指终端的上游设备。可选地，上层设备可以是如图1所示的视频播放系统中的视频服务器102或网络设备104。

步骤503、上层设备向终端发送目标机位对应的视频分片以及该目标机位对应的旋转视频数据。

其中，目标机位对应的旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据。正向机位包括位于目标机位的顺时针方向的一个或多个第一机位。逆向机位包括位于目标机位的逆时针方向的一个或多个第二机位。例如在如图3所示的场景中，假设目标机位为摄像机4，正向机位可以包括摄像机5、摄像机6和摄像机7等，逆向机位可以包括摄像机3、摄像机2和摄像机1等。又例如，图6是本申请实施例提供的另一种媒体源侧的摄像机分布场景示意图。如图6所示，该场景中包括9个摄像机，分为记为摄像机J至摄像机R。该9个摄像机采用扇形排布方式，用于拍摄同一焦点区域M’。假设目标机位为摄像机N，正向机位可以包括摄像机M、摄像机L、摄像机K和摄像机J，逆向机位可以包括摄像机O、摄像机P、摄像机Q和摄像机R。

可选地，当正向机位包括位于目标机位的顺时针方向的一个第一机位时，正向机位对应的视频数据包括该第一机位对应的视频分片。当正向机位包括位于目标机位的顺时针方向的多个第一机位时，正向机位对应的视频数据包括该多个第一机位中的每个第一机位分别对应的视频分片；或者，正向机位对应的视频数据为正向旋转分片。其中，正向旋转分片包括正向动态旋转子分片和/或正向静态旋转子分片。正向动态旋转子分片包括基于该多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向动态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到。正向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。正向静态旋转子分片包括基于该多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到。正向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

可选地，当逆向机位包括位于目标机位的逆时针方向的一个第二机位时，逆向机位对应的视频数据包括该第二机位对应的视频分片。当逆向机位包括位于目标机位的逆时针方向的多个第二机位时，逆向机位对应的视频数据包括该多个第二机位中的每个第二机位分别对应的视频分片；或者，逆向机位对应的视频数据为逆向旋转分片。其中，逆向旋转分片包括逆向动态旋转子分片和/或逆向静态旋转子分片。逆向动态旋转子分片包括基于该多个第二机位对应的视频分片中的视频图像得到的多个图像帧组，逆向动态旋转子分片中的每个图像帧组基于一个第二机位对应的视频分片中的视频图像得到。逆向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第二机位在逆时针方向上到目标机位的距离由近至远依次排列。逆向静态旋转子分片包括基于该多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，逆向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到。逆向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

值得说明的是，动态旋转分片和静态旋转分片的区别在于：前者包括的多个图像帧组按照时间先后顺序排列，后者包括的多个图像帧组对应的播放时段相同。前者可以预备用于视频播放状态下进行的环绕播放，后者可以预备用于视频暂停播放状态下进行的环绕播放。

本申请实施例中，旋转分片中的每个图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。可选地，图像帧组为GOP。或者，图像帧组包括插入帧。或者，图像帧组包括插入帧和P帧的组合，P帧依赖于插入帧解码。或者，图像帧组包括插入帧、P帧和B帧的组合，P帧依赖于插入帧解码，B帧依赖于插入帧和P帧解码。

在第一种实现方式中，旋转分片中的图像帧组为GOP。例如，图7是本申请实施例提供的多个机位分别对应的视频分片的结构示意图。如图7所示，在图6所示的场景中的摄像机J至摄像机R中的每个摄像机都对应有按照时间先后顺序排列的视频分片a(对应时段T1)、视频分片b(对应时段T2)和视频分片c(对应时段T3)。每个视频分片分别包括5个GOP，视频分片a包括编号为1至5的GOP，视频分片b包括编号为6至10的GOP，视频分片c包括编号为11至15的GOP。

假设目标机位为摄像机N，正向机位包括摄像机M、摄像机L和摄像机K，逆向机位包括摄像机O、摄像机P和摄像机Q，目标机位对应的旋转视频数据包括正向动态旋转分片和逆向动态旋转分片。则上层设备向终端发送的时段T1内的媒体内容可以如图8所示，包括摄像机N对应的视频分片N-a、摄像机N对应的正向动态旋转分片N-a1以及摄像机N对应的逆向动态旋转分片N-a2。其中，摄像机N对应的视频分片N-a包括N-1至N-5；正向动态旋转分片N-a1包括M-1、L-2、K-3、M-4和L-5；逆向动态旋转分片N-a2包括O-1、P-2、Q-3、O-4和P-5。其中，M-1、L-2和K-3组成一个正向动态旋转子分片，M-4和L-5组成另一个正向动态旋转子分片，即正向动态旋转分片N-a1包括两个正向动态旋转子分片；对应地，O-1、P-2和Q-3组成一个逆向动态旋转子分片，O-4和P-5组成另一个逆向动态旋转子分片，即逆向动态旋转分片N-a2包括两个逆向动态旋转子分片。

例如，图9是本申请实施例提供的一种正向静态旋转分片的结构示意图。如图9所示，继续参考图7的示例，摄像机N对应的正向机位包括摄像机M和摄像机L，摄像机N在时段T1内对应有5个正向静态旋转子分片1-5，该5个正向静态旋转子分片1-5与N-1至N-5在时间上一一对应，正向静态旋转子分片1包括M-1和L-1，正向静态旋转子分片2包括M-2和L-2，正向静态旋转子分片3包括M-3和L-3，正向静态旋转子分片4包括M-4和L-4，正向静态旋转子分片5包括M-5和L-5。其中，正向静态旋转子分片1用于视频画面暂停在N-1对应的视频图像上时进行顺时针环绕播放，正向静态旋转子分片2用于视频画面暂停在N-2对应的视频图像上时进行顺时针环绕播放，以此类推，本申请实施例不再一一赘述。逆向静态旋转子分片的结构可参考正向静态旋转子分片的结构。

在第二种实现方式中，当各个机位分别对应有视频流(包括视频分片)和插入帧流时，旋转分片中的图像帧组可以包括插入帧(P’帧)。例如，图10是本申请实施例提供的多个机位分别对应的视频流和插入帧流的结构示意图。如图10所示，在图6所示的场景中的摄像机J至摄像机R中的每个摄像机都对应有视频流和插入帧流，视频流包括多个视频分片(图10中仅示出视频分片中的一个GOP)，该GOP包括I帧以及位于I帧之后的8个P帧，该8个P帧分别为P-1至P-8。插入帧流包括针对GOP中的多个P帧，间隔编码得到的多个P’帧，包括P’-1、P’-3、P’-5和P’-7。

假设目标机位为摄像机N，正向机位包括摄像机M、摄像机L和摄像机K，逆向机位包括摄像机O、摄像机P和摄像机Q，目标机位对应的旋转视频数据包括正向动态旋转分片和逆向动态旋转分片。则上层设备向终端发送的时段T1’内的媒体内容可以如图11所示，包括摄像机N对应的N-GOP、摄像机N对应的正向动态旋转分片N-a1’以及摄像机N对应的逆向动态旋转分片N-a2’。其中，摄像机N对应的N-GOP包括NI以及NP-0至NP-8；正向动态旋转分片N-a1’包括MI、MP-0、LP’-1、LP-2、KP’-3、KP-4、MP’-5、MP-6、LP’-7和LP-8；逆向动态旋转分片N-a2’包括OI、OP-0、PP’-1、PP-2、QP’-3、QP-4、OP’-5、OP-6、PP’-7和PP-8。其中，MI、MP-0、LP’-1、LP-2、KP’-3和KP-4组成一个正向动态旋转子分片，MP’-5、MP-6、LP’-7和LP-8组成另一个正向动态旋转子分片；对应地，OI、OP-0、PP’-1、PP-2、QP’-3和QP-4组成一个逆向动态旋转子分片，OP’-5、OP-6、PP’-7和PP-8组成另一个逆向动态旋转子分片。

例如，图12是本申请实施例提供的另一种正向静态旋转分片的结构示意图。如图12所示，继续参考图10的示例，摄像机N对应的正向机位包括摄像机M和摄像机L，摄像机N在时段T1’内对应有10个正向静态旋转子分片1-10，该10个正向静态旋转子分片1-10与N-GOP中的10帧视频图像在时间上一一对应，正向静态旋转子分片1包括MI和LI，正向静态旋转子分片2包括MI、MP-0、LI和LP-0(MI用于供MP-0解码，LI用于供LP-0解码)，正向静态旋转子分片3包括MP’-1和LP’-1，正向静态旋转子分片4包括MP’-1、MP-2、LP’-1和LP-2(MP’-1用于供MP-2解码，LP’-1用于供LP-2解码)，以此类推。可选地，正向静态旋转子分片2中也可以不包括MI和LI，MP-0依赖于正向静态旋转子分片1中的MI解码，LP-0依赖于正向静态旋转子分片1中的LI解码；正向静态旋转子分片4中也可以不包括MP’-1和LP’-1，MP-2依赖于正向静态旋转子分片3中的MP’-1解码，LP-2依赖于正向静态旋转子分片3中的LP’-1解码；等等。也即是，P帧对应的静态旋转子分片可以基于该P帧解码时所依赖的I帧或P’帧对应的静态旋转子分片进行解码。其中，正向静态旋转子分片1用于视频画面暂停在NI对应的视频图像上时进行顺时针环绕播放，正向静态旋转子分片2用于视频画面暂停在NP-0对应的视频图像上时进行顺时针环绕播放，以此类推，本申请实施例不再一一赘述。逆向静态旋转子分片的结构可参考正向静态旋转子分片的结构。

在上述第二种实现方式中，由于旋转分片可以基于插入帧生成，因此上层设备向终端发送的视频分片中无需使用全I帧或mini GOP，而可以使用正常GOP，相较于上述第一种实现方式，能够降低上层设备向终端发送的视频分片的数据量。另外，插入帧的数据量通常小于I帧的数据量，相较于第一种实现方式，能够降低上层设备向终端发送的正向旋转分片和逆向旋转分片的数据量。因此该第二种实现方式可以有效减少网络传输资源的消耗。

可选地，上层设备接收到终端发送的播放请求后，可以响应于该播放请求，向终端发送目标机位对应的视频分片以及目标机位对应的旋转视频数据，也即是，目标机位对应的视频分片以及目标机位对应的旋转视频数据可以均是上层设备响应于播放请求发送的。

或者，上层设备接收到终端发送的播放请求后，可以响应于该播放请求，只向终端发送目标机位对应的视频分片。终端还可以生成旋转预备请求，并向上层设备发送该旋转预备请求。该旋转预备请求用于请求获取目标机位对应的旋转视频数据。响应于上层设备接收到该旋转预备请求，上层设备再向终端发送目标机位对应的旋转视频数据。也即是，目标机位对应的视频分片是上层设备响应于播放请求发送的，目标机位对应的旋转视频数据是上层设备响应于旋转预备请求发送的。可选地，终端可以向上层设备同时发送播放请求和旋转预备请求；或者，终端也可以先向上层设备发送播放请求，再向上层设备发送旋转预备请求，本申请实施例对此不做限定。值得说明的是，旋转预备请求是终端在接收到旋转指令之前向上层设备发送的，也即是该旋转预备请求用于预取所请求播放的机位对应的旋转视频数据。

本申请实施例中，上层设备可以在接收到终端发送的播放请求后，主动向终端发送所请求播放的机位对应的旋转视频数据，或者，也可以在接收到终端发送的旋转预备请求后，被动响应向终端发送所请求播放的机位对应的旋转视频数据。

可选地，旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，预备旋转状态包括动态旋转状态和/或静态旋转状态，该旋转预备请求中的内容是终端中预先配置的。其中，动态旋转状态用于指示获取动态旋转分片，静态旋转状态用于指示获取静态旋转分片。终端可以在接收到预设的触发操作后，生成并向上层设备发送旋转预备请求。例如，当终端检测到顺时针横屏显示视频图像时，确定预备旋转方向为顺时针方向，此时终端可以向上层设备请求正向机位对应的视频数据。又例如，当终端检测到逆时针横屏显示视频图像时，确定预备旋转方向为逆时针方向，此时终端可以向上层设备请求逆向机位对应的视频数据。又例如，终端可以在显示界面上显示目标按钮，当终端检测到对目标按钮的触控操作时，终端向上层设备请求目标机位对应的旋转视频数据。又例如，终端可以基于用户历史行为数据向上层设备请求相应的旋转视频数据，等等。

步骤504、当终端在基于目标机位对应的视频分片播放视频画面的过程中，接收到旋转指令时，终端根据该旋转指令确定旋转方向。

该旋转方向为顺时针方向或逆时针方向。终端在基于目标机位对应的视频分片播放视频画面的过程中接收到旋转指令，可以是终端在视频播放状态下接收到旋转指令，或者也可以是终端在视频暂停播放状态下接收到旋转指令。

在一种实现方式中，当终端在视频播放界面上检测到滑动操作时，终端确定接收到旋转指令。终端根据该滑动操作的滑动方向，确定旋转方向。例如，滑动方向向左表示逆时针旋转，滑动方向向右表示顺时针旋转。

在另一种实现方式中，当终端接收到遥控设备发送的目标遥控指令时，终端确定接收到旋转指令。终端根据目标遥控指令中的按键标识，确定旋转方向。例如，当遥控按键信息中包括左键的标识时，表示旋转方向为逆时针方向，当遥控按键信息中包括右键的标识时，表示旋转方向为顺时针方向。当然还可以设置遥控设备上的其它按键控制旋转方向，本申请实施例对此不做限定。

步骤505、响应于旋转视频数据包括位于目标机位的旋转方向上的机位对应的目标视频数据，终端基于目标视频数据播放视频画面。

在一种实现方式中，目标视频数据为目标旋转分片，该目标旋转分片包括基于位于目标机位的旋转方向的多个机位对应的视频分片中的视频图像得到的多个图像帧组，该目标旋转分片中的每个图像帧组基于位于该目标机位的旋转方向的一个机位对应的视频分片中的视频图像得到。其中，响应于终端在视频播放状态下接收到该旋转指令，目标旋转分片包括动态旋转子分片，动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照该多个机位在旋转方向上到目标机位的距离由近至远依次排列，也即是，该目标旋转分片为动态旋转分片。或者，响应于终端在视频暂停播放状态下接收到该旋转指令，目标旋转分片包括静态旋转子分片，静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照该多个机位在旋转方向上到目标机位的距离由近至远依次排列，也即是，该目标旋转分片为静态旋转分片。

相应地，终端基于目标视频数据播放视频画面的实现过程，包括：终端对目标旋转分片进行解码播放。具体实现时，若终端在视频播放状态下接收到旋转指令，且旋转指令所指示的旋转方向为顺时针方向，则终端对与播放时刻对应的正向动态旋转子分片进行解码播放。若终端在视频播放状态下接收到旋转指令，且旋转指令所指示的旋转方向为逆时针方向，则终端对与播放时刻对应的逆向动态旋转子分片进行解码播放。若终端在视频暂停播放状态下接收到旋转指令，且旋转指令所指示的旋转方向为顺时针方向，则终端对视频暂停时刻对应的正向静态旋转子分片进行解码播放。若终端在视频暂停播放状态下接收到旋转指令，且旋转指令所指示的旋转方向为逆时针方向，则终端对视频暂停时刻对应的逆向静态旋转子分片进行解码播放。

在另一种实现方式中，目标视频数据包括位于目标机位的旋转方向的多个机位分别对应的视频分片。终端基于目标视频数据播放视频画面的实现过程，包括：终端基于该多个机位对应的视频分片中的视频图像分别生成图像帧组。终端按照多个机位在旋转方向上到目标机位的距离由近至远的顺序，依次播放生成的图像帧组中的视频图像。

具体实现时，若终端在视频播放状态下接收到旋转指令，则终端根据位于目标机位的旋转方向的多个机位在旋转方向上到目标机位的距离，基于该多个机位对应的视频分片中的视频图像生成按照时间先后顺序排列的多个图像帧组，每个图像帧组基于一个机位对应的视频分片中的视频图像生成，然后依次播放该多个图像帧组中的视频图像。例如，参考图7示出的例子，目标机位为摄像机N，正向机位包括摄像机M和摄像机L，终端当前正在播放摄像机N对应的视频分片，假设在播放至N-2时接收到旋转指令，且基于该旋转指令确定的旋转方向为顺时针方向，则终端依次提取并解码播放摄像机M对应的视频分片a中的M-3以及摄像机L对应的视频分片a中的L-4。

若终端在视频暂停播放状态下接收到旋转指令，则终端基于该多个机位对应的视频分片中视频暂停时刻对应的视频图像分别生成图像帧组，每个图像帧组基于一个机位对应的视频分片中该视频暂停时刻对应的视频图像生成，然后按照该多个机位在旋转方向上到目标机位的距离由近至远的顺序，依次播放生成的图像帧组中的视频图像。例如，参考图7示出的例子，目标机位为摄像机N，正向机位包括摄像机M和摄像机L，终端当前的视频画面暂停在摄像机N对应的视频分片a中的N-2，此时接收到旋转指令，且基于该旋转指令确定的旋转方向为顺时针方向，则终端分别提取摄像机M对应的视频分片a中的M-2以及摄像机L对应的视频分片a中的L-2，并依次解码播放M-2和L-2。

可选地，当目标视频数据仅包括位于目标机位的旋转方向的一个机位对应的视频分片时，终端直接解码播放该机位对应的视频分片中的视频图像。若终端在视频播放状态下接收到旋转指令，则终端解码播放该机位对应的视频分片中下一播放时刻对应的视频图像。例如，参考图7示出的例子，目标机位为摄像机N，正向机位包括摄像机M，终端当前正在播放摄像机N对应的视频分片，假设在播放至N-2时接收到旋转指令，且基于该旋转指令确定的旋转方向为顺时针方向，此时终端解码播放摄像机M对应的视频分片a中的M-3。若终端在视频暂停播放状态下接收到该旋转指令，则终端解码播放该机位对应的视频分片中视频暂停时刻对应的视频图像。例如，参考图7示出的例子，目标机位为摄像机N，正向机位包括摄像机M，终端当前的视频画面暂停在摄像机N对应的视频分片a中的N-2，此时接收到旋转指令，且基于该旋转指令确定的旋转方向为顺时针方向，终端解码播放摄像机M对应的视频分片a中的M-2。

本申请实施例中，上层设备向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据，终端在接收到目标机位对应的视频分片后，对该视频分片进行解码即可实现对该目标机位所采集的视频画面的播放；当终端接收到旋转指令时，可以根据预先获取的旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低，且播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同。因此本申请实施例提供的视频播放方法不受限于前端拍摄所采用的相机数量，应用范围广。另外，与相关技术相比，上层设备无需始终向终端发送所有相机所采集的视频画面，可以减少数据传输量，节约传输资源。

可选地，当终端接收到旋转指令时，还可以执行以下步骤506至步骤511。

步骤506、终端基于该旋转指令生成环绕播放请求。

环绕播放请求中包括旋转机位信息，该旋转机位信息用于指示旋转范围。可选地，当终端获取的媒体内容索引中包括机位信息时，终端接收到旋转指令后，可以根据旋转指令以及机位信息确定起始机位、终止机位和旋转方向，此时旋转机位信息中可以包括起始机位的标识、终止机位的标识和旋转方向。或者，终端接收到旋转指令后，可以根据旋转指令确定旋转角度，此时旋转机位信息中可以包括旋转角度。

可选地，当终端在视频播放状态下接收到旋转指令时，终端生成的环绕播放请求用于请求动态环绕播放视频内容。这种情况下，环绕播放请求还用于确定播放开始时刻和播放结束时刻。可选地，环绕播放请求还包括播放时间信息，该播放时间信息包括播放开始时刻、播放结束时刻或环绕播放时长中的一个或多个。

可选地，当终端在视频暂停播放状态下接收到旋转指令时，终端生成的环绕播放请求用于请求静态环绕播放视频内容。这种情况下，环绕播放请求还用于确定目标播放时刻。可选地，环绕播放请求中包括该目标播放时刻，该目标播放时刻可以是视频暂停时刻。静态环绕播放视频内容指，对多个机位提供的目标播放时刻对应的视频画面进行环绕播放。

在一种实现方式中，当终端在视频播放界面上检测到滑动操作时，终端确定接收到旋转指令。终端根据该滑动操作的滑动信息，确定旋转机位信息，该滑动信息包括滑动起始位置、滑动长度、滑动方向或滑动角度中的一个或多个。然后终端基于该旋转机位信息生成环绕播放请求。其中，滑动起始位置、滑动长度和滑动方向可以用于确定起始机位、终止机位和旋转方向。滑动角度可以用于确定旋转角度。

可选地，滑动起始位置对应起始机位，滑动方向对应旋转方向，滑动长度用于定义切换的机位数量。滑动方向向左表示逆时针旋转，滑动方向向右表示顺时针旋转。滑动长度每达到单位长度，表示切换一个机位。例如单位长度可以设置为1厘米，当滑动长度达到3厘米时，表示切换3个机位。滑动敏感度与单位长度的设置值负相关，即单位长度的设置值越小，滑动敏感度越高。滑动敏感度可根据实际需求设置。例如，假设滑动方向向右，滑动长度为5厘米，单位长度为1厘米，则表示顺时针旋转切换5个机位。参考图4，假设滑动起始位置对应的起始机位为摄像机9，则终端确定旋转方向为顺时针，终止机位为摄像机14。

可选地，当环绕播放请求用于请求动态环绕播放视频内容时，还可通过滑动时长定义环绕播放时长。例如可以使环绕播放时长等于滑动时长。

可选地，滑动角度用于确定旋转角度。可以设置旋转角度与滑动角度满足一定关系，例如使旋转角度等于滑动角度；或者使旋转角度等于滑动角度的2倍；等等。当旋转机位信息中包括旋转角度时，还可以采用旋转角度的正负表示旋转方向。例如旋转角度为正值，表示顺时针旋转，旋转角度为负值，表示逆时针旋转。

在另一种实现方式中，当终端接收到遥控设备发送的目标遥控指令时，终端确定接收到旋转指令。目标遥控指令中包括遥控按键信息，遥控按键信息包括按键标识和/或按键次数。终端根据该遥控按键信息，确定旋转机位信息。然后终端基于该旋转机位信息生成环绕播放请求。其中，按键标识可以用于确定旋转方向。按键次数可以用于确定切换机位数量。

可选地，旋转方向基于按键标识确定。例如，当遥控按键信息中包括左键的标识时，表示旋转方向为逆时针方向，当遥控按键信息中包括右键的标识时，表示旋转方向为顺时针方向。当然还可以设置遥控设备上的其它按键控制旋转方向，本申请实施例对此不做限定。按键次数用于定义切换的机位数量，例如按键次数为1，表示切换一个机位。例如，假设遥控按键信息中包括左键的标识，且按键次数为3，则表示逆时针旋转切换3个机位。参考图4，假设起始机位为摄像机9，则终端根据按键标识确定旋转方向为逆时针，根据按键次数确定切换的机位数量为3，进而确定终止机位为摄像机6。

可选地，当环绕播放请求用于请求动态环绕播放视频内容时，还可通过按键时长定义环绕播放时长。例如可以使环绕播放时长等于按键时长。

步骤507、终端向上层设备发送环绕播放请求。

步骤508、上层设备基于环绕播放请求确定播放时间信息。

在本申请的一个可选实施例中，环绕播放请求用于请求动态环绕播放视频内容，则播放时间信息包括播放开始时刻和播放结束时刻。上层设备基于环绕播放请求确定播放时间信息的实现方式包括以下五种：

在第一种实现方式中，步骤508的实现过程包括：上层设备根据接收到环绕播放请求的时刻以及预设的策略，确定播放开始时刻和播放结束时刻。预设的策略中包括预设环绕播放时长。

可选地，预设的策略中定义有：将上层设备接收到环绕播放请求时的视频播放时刻作为播放开始时刻，且播放结束时刻与播放开始时刻的间隔时长等于预设环绕播放时长。例如，上层设备接收到环绕播放请求时的视频播放时刻为00:19:35，预设环绕播放时长为2秒，则上层设备确定播放开始时刻为00:19:35，播放结束时刻为00:19:37。或者，预设的策略中也可以定义：将与环绕播放请求的接收时刻(对应视频播放时刻)间隔一定时长的视频播放时刻作为播放开始时刻，该播放开始时刻在时序上可以位于环绕播放请求的接收时刻之前，或者，该播放开始时刻在时序上也可以位于环绕播放请求的接收时刻之后。例如，环绕播放请求的接收时刻为00:19:35，播放开始时刻可以为00:19:34，或者，播放开始时刻也可以为00:19:36。

在第二种实现方式中，环绕播放请求中包括播放开始时刻和播放结束时刻。则步骤508的实现过程包括：上层设备在环绕播放请求中识别出播放开始时刻和播放结束时刻。

可选地，预先定义或预先配置环绕播放请求的指定字段用于携带播放开始时刻和播放结束时刻。其中，预先定义可以是在标准或协议中定义；预先配置可以是上层设备与终端预先协商。上层设备在接收到环绕播放请求后，可以从指定字段中识别出播放开始时刻和播放结束时刻。例如，环绕播放请求的指定字段中携带有两个时刻，分别为00:19:35和00:19:37，则上层设备确定播放开始时刻为00:19:35，播放结束时刻为00:19:37。

在第三种实现方式中，环绕播放请求中包括播放开始时刻。则步骤508的实现过程包括：上层设备根据播放开始时刻以及预设环绕播放时长，确定播放结束时刻。例如，环绕播放请求中携带的播放开始时刻为00:19:35，预设环绕播放时长为2秒，则上层设备确定播放结束时刻为00:19:37。

在第四种实现方式中，环绕播放请求中包括环绕播放时长。则步骤508的实现过程包括：上层设备根据接收到环绕播放请求的时刻以及环绕播放时长，确定播放开始时刻和播放结束时刻。该实现方式可参考上述第一种实现方式，本申请实施例在此不再赘述。

在第五种实现方式中，环绕播放请求中包括播放开始时刻和环绕播放时长。则步骤508的实现过程包括：上层设备根据播放开始时刻以及环绕播放时长，确定播放结束时刻。例如，环绕播放请求中携带的播放开始时刻为00:19:35，环绕播放时长为2秒，则上层设备确定播放结束时刻为00:19:37。

在本申请的另一个可选实施例中，环绕播放请求用于请求静态环绕播放视频内容，则播放时间信息包括目标播放时刻。可选地，环绕播放请求中包括该目标播放时刻。或者，环绕播放请求中不包括该目标播放时刻，上层设备根据接收到环绕播放请求的时刻确定目标播放时刻，上层设备确定目标播放时刻的方式可参考上述第一种实现方式中上层设备确定播放开始时刻的方式，本申请实施例在此不再赘述。

步骤509、上层设备根据旋转机位信息和播放时间信息生成旋转分片。

该旋转分片中包括旋转范围内的多个机位对应的图像帧组。可选地，该旋转分片中依次包括沿旋转方向从起始机位至终止机位的多个机位对应的图像帧组。

可选地，上层设备先根据旋转机位信息确定起始机位、终止机位和旋转方向，再沿旋转方向从起始机位至终止机位的机位中确定多个机位。

可选地，当旋转机位信息中包括起始机位的标识、终止机位的标识和旋转方向时，上层设备接收到环绕播放请求后，可以根据旋转机位信息中的内容确定起始机位、终止机位和旋转方向。当旋转机位信息中包括旋转角度时，上层设备接收到环绕播放请求后，根据起始机位和旋转角度，确定终止机位和旋转方向。例如，参考图4，假设上层设备确定的起始机位为摄像机9，环绕播放请求中携带的旋转角度为-90°，则上层设备确定旋转方向为逆时针，终止机位为摄像机4。

可选地，上层设备确定的多个机位可以包括沿旋转方向从起始机位至终止机位的所有机位或部分机位。例如，参考图4，假设起始机位为摄像机9，终止机位为摄像机14，旋转方向为顺时针方向，则上层设备确定的多个机位依次包括摄像机9、摄像机10、摄像机11、摄像机12、摄像机13和摄像机14。或者，当环绕播放请求用于请求静态环绕播放视频内容时，上层设备确定的多个机位可以包括沿旋转方向从起始机位至终止机位的部分机位。例如，假设图3中摄像机11的拍摄区域和摄像机13的拍摄区域的并集完全覆盖摄像机12的拍摄区域，则上层设备确定的多个机位中可以不包括摄像机12的拍摄区域。在静态环绕播放摄像机9至摄像机14采集的视频画面时，由于摄像机11拍摄的视频画面和摄像机13拍摄的视频画面包含摄像机12拍摄的视频画面，因此不会导致环绕播放过程中的视频画面突变，进而可以保证环绕播放画面的流畅性。

在本申请的一个可选实施例中，环绕播放请求用于请求动态环绕播放视频内容。

在一种实现方式中，旋转分片中的图像帧组为GOP。则步骤509的实现过程包括：

在步骤5091A1中，上层设备获取多个机位中的每个机位对应的从播放开始时刻至播放结束时刻的m个视频分片，m为正整数。

例如，假设该多个机位沿旋转方向依次包括q个机位，播放开始时刻为t1，播放结束时刻为t2，q为大于0的整数，t2>t1，每个机位对应的视频流在时间段(t1，t2)包括m个视频分片。则上层设备分别获取该q个机位在时间段(t1，t2)内对应的m个视频分片。

在步骤5092A1中，上层设备根据播放时间信息，从每个机位对应的m个视频分片中提取一个或多个GOP。

可选地，上层设备根据环绕播放时长以及多个机位的数量，确定每个机位对应的GOP提取时刻以及GOP提取数量，该环绕播放时长等于播放结束时刻与播放开始时刻的差值。上层设备根据每个机位对应的GOP提取时刻以及GOP提取数量，从每个机位对应的m个视频分片中提取GOP。

沿旋转方向排布的两个机位中，前一个机位对应的GOP提取时刻在时序上位于后一个机位对应的GOP提取时刻之前。每个机位对应的GOP提取数量等于环绕播放时长与GOP的时间长度以及多个机位的数量的乘积的比值(可对该比值向上取整或向下取整)。

例如，继续参考步骤5091A中的例子，假设每个GOP的时间长度为t，每个机位对应的GOP提取数量等于(t2-t1)/(q*t)。

在步骤5093A1中，上层设备对提取的GOP进行组装，得到旋转分片。

可选地，上层设备按照旋转方向将提取的GOP依次进行组装，得到旋转分片，该旋转分片为动态旋转分片。

例如，请参考图7示出的例子，假设播放开始时刻为时段T2的起始时刻，播放结束时刻为时段T2的终止时刻，起始机位为摄像机N，终止机位为摄像机R，旋转方向为逆时针方向，各个机位对应的视频分片b包括5个GOP，每个机位对应的GOP提取数量为1，请参考图13，图13是本申请实施例提供的一种动态旋转分片的生成过程示意图。如图13所示，上层设备从摄像机N对应的视频分片b中提取的GOP为N-6，从摄像机O对应的视频分片b中提取的GOP为O-7，从摄像机P对应的视频分片b中提取的GOP为P-8,从摄像机Q对应的视频分片b中提取的GOP为Q-9，从摄像机R对应的视频分片b中提取的GOP为R-10。然后上层设备按照旋转方向将从该5个机位对应的视频分片中提取的GOP依次进行组装，得到动态旋转分片。

在另一种实现方式中，旋转分片中的图像帧组基于插入帧生成。则步骤509的实现过程包括：

在步骤5091A2中，上层设备获取多个机位中的每个机位对应的从播放开始时刻至播放结束时刻的m个视频分片，m为正整数。

此步骤的解释可参考上述步骤5091A1，本申请实施例在此不再赘述。

在步骤5092A2中，上层设备根据播放时间信息，从每个机位对应的m个视频分片中提取一帧或多帧视频图像。

可选地，上层设备根据环绕播放时长以及多个机位的数量，确定每个机位对应的视频图像提取时刻以及视频图像提取数量，该环绕播放时长等于播放结束时刻与播放开始时刻的差值。上层设备根据每个机位对应的视频图像提取时刻以及视频图像提取数量，从每个机位对应的m个视频分片中提取视频图像。

沿旋转方向排布的两个机位中，前一个机位对应的视频图像提取时刻在时序上位于后一个机位对应的视频图像提取时刻之前。每个机位对应的视频图像提取数量等于环绕播放时长与视频图像的时间长度以及多个机位的数量的乘积的比值(可对该比值向上取整或向下取整)。

在步骤5093A2中，对于该多个机位中的每个机位，上层设备根据该机位对应的插入帧流以及提取的视频图像生成图像帧组，并对该多个机位对应的图像帧组进行组装，得到旋转分片。

可选地，上层设备按照旋转方向将生成的图像帧组依次进行组装，得到旋转分片，该旋转分片为动态旋转分片。

例如，请参考图12示出的例子，假设播放开始时刻为时段T1’的起始时刻，播放结束时刻为时段T1’的终止时刻，起始机位为摄像机N，终止机位为摄像机R，旋转方向为逆时针方向，每个机位对应的视频图像提取数量为2，请参考图14，图14是本申请实施例提供的另一种动态旋转分片的生成过程示意图。如图14所示，上层设备从摄像机N对应的GOP中提取视频图像NI和NP-0，从摄像机O对应的插入帧流中提取视频图像OP’-1并从摄像机O对应的GOP中提取视频图像OP-2，从摄像机P对应的插入帧流中提取视频图像PP’-3并从摄像机P对应的GOP中提取视频图像PP-4，从摄像机Q对应的插入帧流中提取视频图像QP’-5并从摄像机Q对应的GOP中提取视频图像QP-6，从摄像机R对应的插入帧流中提取视频图像RP’-7并从摄像机R对应的GOP中提取视频图像RP-8。其中，NI和NP-0为摄像机N对应的图像帧组，OP’-1和OP-2为摄像机O对应的图像帧组，PP’-3和PP-4为摄像机P对应的图像帧组，QP’-5和QP-6为摄像机Q对应的图像帧组，RP’-7和RP-8为摄像机R对应的图像帧组。上层设备按照旋转方向将从该5个机位对应的图像帧组依次进行组装，得到动态旋转分片。

在本申请的另一个可选实施例中，环绕播放请求用于请求静态环绕播放视频内容。

在一种实现方式中，旋转分片中的图像帧组为GOP，每个GOP包括一帧视频图像。则步骤509的实现过程包括：

在步骤5091B1中，上层设备获取多个机位中的每个机位对应的目标视频分片，该目标视频分片对应的时间段包含目标播放时刻。

该目标视频分片对应的时间段包含目标播放时刻，指该目标播放时刻位于目标视频分片的起始时刻和结束时刻之间。

在步骤5092B1中，上层设备从每个机位对应的目标视频分片中，提取目标播放时刻对应的一个GOP。

该目标播放时刻对应的一个GOP，指该GOP中的视频图像的采集时刻为目标播放时刻。

在步骤5093B1中，上层设备对提取的GOP进行组装，得到旋转分片。

可选地，上层设备按照旋转方向将提取的GOP依次进行组装，得到旋转分片，该旋转分片为静态旋转分片。

例如，请参考图7示出的例子，起始机位为摄像机N，终止机位为摄像机R，目标播放时刻播放的是摄像机M对应的视频分片b中的GOP M-7，旋转方向为逆时针方向，请参考图15，图15是本申请实施例提供的一种静态旋转分片的生成过程示意图。如图15所示，上层设备从摄像机N对应的视频分片b中提取的GOP为N-7，从摄像机O对应的视频分片b中提取的GOP为O-7，从摄像机P对应的视频分片b中提取的GOP为P-7，从摄像机Q对应的视频分片b中提取的GOP为Q-7，从摄像机R对应的视频分片b中提取的GOP为R-7。然后上层设备按照旋转方向将从该5个机位对应的视频分片中提取的GOP依次进行组装，得到静态旋转分片。

在步骤5091B2中，上层设备获取多个机位中的每个机位对应的目标视频分片，该目标视频分片对应的时间段包含目标播放时刻。

在步骤5092B2中，上层设备从每个机位对应的目标视频分片中，提取目标播放时刻对应的一帧视频图像。

该目标播放时刻对应的一帧视频图像，指该视频图像的采集时刻为目标播放时刻。

在步骤5093B2中，对于该多个机位中的每个机位，上层设备根据该机位对应的插入帧流以及提取的视频图像生成图像帧组，并对该多个机位对应的图像帧组进行组装，得到旋转分片。

其中，若提取的视频图像为I帧，则图像帧组包括该I帧。若提取的视频图像不为I帧且该视频图像对应有插入帧，则图像帧组包括该视频图像对应的插入帧。若提取的视频图像不为I帧且该视频图像没有对应的插入帧，则图像帧组包括该视频图像以及该视频图像解码所依赖的I帧或插入帧。

可选地，上层设备按照旋转方向将生成的图像帧组依次进行组装，得到旋转分片，该旋转分片为静态旋转分片。

例如，请参考图12示出的例子，起始机位为摄像机N，终止机位为摄像机R，目标播放时刻播放的是摄像机M对应的GOP中的MP-1，请参考图16，图16是本申请实施例提供的另一种静态旋转分片的生成过程示意图。如图16所示，上层设备从摄像机N对应的插入帧流中提取插入帧NP’-1，从摄像机O对应的插入帧流中提取插入帧OP’-1，从摄像机P对应的插入帧流中提取插入帧PP’-1，从摄像机Q对应的插入帧流中提取插入帧QP’-1，从摄像机R对应的插入帧流中提取插入帧RP’-1。上层设备按照旋转方向将从该5个机位对应的视频图像依次进行组装，得到静态旋转分片。

可选地，旋转分片包含的图像帧组数量与其它视频分片包含的图像帧组数量可以相同，也可以不同，例如旋转分片包含的图像帧组数量可以少于或多于其它视频分片包含的图像帧组数量，本申请实施例对此不做限定。

可选地，当上层设备为网络设备时，上层设备接收到环绕播放请求后，先从视频服务器下载媒体内容索引，通过解析该媒体内容索引得到视频流的信息。上层设备从媒体内容索引中提取多个机位中每个机位对应的视频流的URL地址，然后通过视频流的URL分别获取对应的视频分片。

步骤510、上层设备向终端发送旋转分片。

可选地，当环绕播放请求用于请求动态环绕播放视频内容时，上层设备向终端发送旋转分片后，继续向终端发送终止机位对应的视频分片，使得终端能够流畅地从起始机位对应的播放画面切换至终止机位对应的播放画面。或者，当环绕播放请求用于请求静态环绕播放视频内容时，上层设备向终端发送旋转分片后，停止向终端发送视频数据。

步骤511、终端对旋转分片进行解码播放。

终端对旋转分片进行解码播放，能够实现对沿旋转方向从起始机位起至终止机位中的多个机位对应的视频画面的环绕播放。其中，终端播放的视频画面的分辨率可以与旋转分片中的视频图像的分辨率相同。

本申请实施例提供的方法的步骤的先后顺序能够进行适当调整，例如，步骤506和步骤507可以与步骤505同时执行，即终端接收到旋转指令后，可以在基于预先获取的旋转视频数据播放视频画面的同时，生成并向上层设备发送环绕播放请求。步骤也能够根据情况进行相应增减。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

综上所述，在本申请实施例提供的视频播放方法中，上层设备向终端发送该终端所请求播放的目标机位对应的视频分片以及该目标机位对应的旋转视频数据，终端在接收到目标机位对应的视频分片后，对该视频分片进行解码即可实现对该目标机位所采集的视频画面的播放；当终端接收到旋转指令时，可以根据预先获取的旋转视频数据实现对视频画面的环绕播放，环绕播放时延较低，且播放的视频画面的分辨率可以与视频分片中的视频图像或旋转视频数据中的视频图像的分辨率相同。因此本申请实施例提供的视频播放方法不受限于前端拍摄所采用的相机数量，应用范围广。另外，与相关技术相比，上层设备无需始终向终端发送所有相机所采集的视频画面，可以减少数据传输量，节约传输资源。另外，旋转分片可以基于插入帧生成，此时上层设备向终端发送的视频分片中无需使用全I帧或mini GOP，而可以使用正常GOP，能够降低上层设备向终端发送的视频分片的数据量；并且，插入帧的数据量通常小于I帧的数据量，能够降低上层设备向终端发送的旋转分片的数据量，因此利用插入帧技术生成旋转分片，可以有效减少网络传输资源的消耗。

图17是本申请实施例提供的一种视频播放装置的结构示意图。该装置应用于上层设备，例如，该上层设备可以是如图1所示的视频播放系统中的视频服务器或网络设备。如图17所示，该装置170包括：

接收模块1701，用于接收终端发送的播放请求，播放请求中包括播放机位信息，播放机位信息用于指示所请求播放的目标机位。

发送模块1702，用于向终端发送目标机位对应的视频分片以及目标机位对应的旋转视频数据，旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，正向机位包括位于目标机位的顺时针方向的一个或多个第一机位，逆向机位包括位于目标机位的逆时针方向的一个或多个第二机位。

可选地，发送模块1702，用于：响应于上层设备接收到终端发送的旋转预备请求，上层设备向终端发送旋转视频数据，旋转预备请求用于请求获取目标机位对应的旋转视频数据。或者，响应于播放请求，向终端发送旋转视频数据。

可选地，正向机位对应的视频数据包括每个第一机位对应的视频分片；或者，正向机位包括位于目标机位的顺时针方向的多个第一机位，正向机位对应的视频数据为正向旋转分片，正向旋转分片包括正向动态旋转子分片和/或正向静态旋转子分片，其中，正向动态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向动态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，正向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列；正向静态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，正向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，正向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

可选地，逆向机位对应的视频数据包括每个第二机位对应的视频分片；或者，逆向机位包括位于目标机位的逆时针方向的多个第二机位，逆向机位对应的视频数据为逆向旋转分片，逆向旋转分片包括逆向动态旋转子分片和/或逆向静态旋转子分片，其中，逆向动态旋转子分片包括基于多个第二机位对应的视频分片中的视频图像得到的多个图像帧组，逆向动态旋转子分片中的每个图像帧组基于一个第二机位对应的视频分片中的视频图像得到，逆向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个第二机位在逆时针方向上到目标机位的距离由近至远依次排列；逆向静态旋转子分片包括基于多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，逆向静态旋转子分片中的每个图像帧组基于一个第一机位对应的视频分片中的视频图像得到，逆向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个第一机位在顺时针方向上到目标机位的距离由近至远依次排列。

其中，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。

可选地，请继续参见图17，该装置170还包括：处理模块1703。

接收模块1701，还用于接收终端发送的环绕播放请求，环绕播放请求中包括旋转机位信息，旋转机位信息用于指示旋转范围。处理模块1703，用于基于环绕播放请求确定播放时间信息；并根据旋转机位信息和播放时间信息生成旋转分片，旋转分片中包括旋转范围内的多个机位对应的图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。发送模块1702，还用于向终端发送旋转分片。

图18是本申请实施例提供的另一种视频播放装置的结构示意图。该装置应用于终端，例如，该装置可以是如图1所示的视频播放系统中的终端103。如图18所示，该装置180包括：

发送模块1801，用于当终端接收到播放指令时，向上层设备发送基于播放指令生成的播放请求，播放请求中包括播放机位信息，播放机位信息用于指示所请求播放的目标机位。

接收模块1802，用于接收上层设备发送的目标机位对应的视频分片以及目标机位对应的旋转视频数据，旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，正向机位包括位于目标机位的顺时针方向的一个或多个第一机位，逆向机位包括位于目标机位的逆时针方向的一个或多个第二机位。

处理模块1803，用于当终端在基于目标机位对应的视频分片播放视频画面的过程中，接收到旋转指令时，根据旋转指令确定旋转方向，旋转方向为顺时针方向或逆时针方向。

播放模块1804，用于响应于旋转视频数据包括位于目标机位的旋转方向上的机位对应的目标视频数据，基于目标视频数据播放视频画面。

可选地，处理模块1803，还用于生成旋转预备请求，旋转预备请求用于请求获取目标机位对应的旋转视频数据。发送模块1801，还用于向上层设备发送旋转预备请求，目标机位对应的旋转视频数据是上层设备响应于旋转预备请求发送的。

可选地，目标视频数据为目标旋转分片，目标旋转分片包括基于位于目标机位的旋转方向的多个机位对应的视频分片中的视频图像得到的多个图像帧组，目标旋转分片中的每个图像帧组基于位于目标机位的旋转方向的一个机位对应的视频分片中的视频图像得到，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。其中，响应于终端在视频播放状态下接收到旋转指令，目标旋转分片包括动态旋转子分片，动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照多个机位在旋转方向上到目标机位的距离由近至远依次排列；或者，响应于终端在视频暂停播放状态下接收到旋转指令，目标旋转分片包括静态旋转子分片，静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照多个机位在旋转方向上到目标机位的距离由近至远依次排列。播放模块1804，用于对目标旋转分片进行解码播放。

可选地，目标视频数据包括位于目标机位的旋转方向的多个机位分别对应的视频分片。播放模块1804，用于：基于多个机位对应的视频分片中的视频图像分别生成图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。按照多个机位在旋转方向上到目标机位的距离由近至远的顺序，依次播放生成的图像帧组中的视频图像。

可选地，发送模块1801，还用于当终端接收到旋转指令时，向上层设备发送基于旋转指令生成的环绕播放请求，环绕播放请求中包括旋转机位信息，旋转机位信息用于指示旋转范围。接收模块1802，还用于接收上层设备发送的旋转分片，旋转分片中包括旋转范围内的多个机位对应的图像帧组，图像帧组包括一帧或多帧视频图像，每个图像帧组可被独立解码。播放模块1804，还用于对旋转分片进行解码播放。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本申请实施例还提供了一种视频播放系统，该系统包括：上层设备和终端。上层设备包括如图17所示的视频播放装置，终端包括如图18所示的视频播放装置。

图19是本申请实施例提供的一种视频播放装置的框图。该视频播放装置可以是上层设备或终端，上层设备可以是视频服务器或网络设备，终端可以是手机、平板电脑、智能可穿戴设备或机顶盒等。如图19所示，该视频播放装置190包括：处理器1901和存储器1902。

存储器1902，用于存储计算机程序，所述计算机程序包括程序指令；

处理器1901，用于调用所述计算机程序，实现如图5所示的视频播放方法中上层设备执行的动作或终端执行的动作。

可选地，该视频播放装置190还包括通信总线1903和通信接口1904。

其中，处理器1901包括一个或者一个以上处理核心，处理器1901通过运行计算机程序，执行各种功能应用以及数据处理。

存储器1902可用于存储计算机程序。可选地，存储器可存储操作系统和至少一个功能所需的应用程序单元。操作系统可以是实时操作系统(Real Time eXecutive，RTX)、LINUX、UNIX、WINDOWS或OS X之类的操作系统。

通信接口1904可以为多个，通信接口1904用于与其它存储设备或网络设备进行通信。例如在本申请实施例中，上层设备的通信接口可以用于向终端发送旋转分片，终端的通信接口可以用于向上层设备发送环绕播放请求。网络设备可以是交换机或路由器等。

存储器1902与通信接口1904分别通过通信总线1903与处理器1901连接。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令被计算机设备的处理器执行时，实现如上述方法实施例所述的视频播放方法中上层设备执行的动作或者终端执行的动作。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本申请实施例中，术语“第一”、“第二”和“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的构思和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种视频播放方法，其特征在于，所述方法包括：

上层设备接收终端发送的播放请求，所述播放请求中包括播放机位信息，所述播放机位信息用于指示所请求播放的目标机位；

所述上层设备向所述终端发送所述目标机位对应的视频分片以及所述目标机位对应的旋转视频数据，所述旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，所述正向机位包括位于所述目标机位的顺时针方向的一个或多个第一机位，所述逆向机位包括位于所述目标机位的逆时针方向的一个或多个第二机位。
根据权利要求1所述的方法，其特征在于，所述上层设备向所述终端发送所述目标机位对应的旋转视频数据，包括：

响应于所述上层设备接收到所述终端发送的旋转预备请求，所述上层设备向所述终端发送所述旋转视频数据，所述旋转预备请求用于请求获取所述目标机位对应的旋转视频数据；

或者，

响应于所述播放请求，所述上层设备向所述终端发送所述旋转视频数据。
根据权利要求1或2所述的方法，其特征在于，

所述正向机位对应的视频数据包括每个所述第一机位对应的视频分片；或者，所述正向机位包括位于所述目标机位的顺时针方向的多个第一机位，所述正向机位对应的视频数据为正向旋转分片，所述正向旋转分片包括正向动态旋转子分片和/或正向静态旋转子分片，其中，所述正向动态旋转子分片或所述正向静态旋转子分片包括基于所述多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，所述正向动态旋转子分片或所述正向静态旋转子分片中的每个图像帧组基于一个所述第一机位对应的视频分片中的视频图像得到；所述正向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；所述正向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；

所述逆向机位对应的视频数据包括每个所述第二机位对应的视频分片；或者，所述逆向机位包括位于所述目标机位的逆时针方向的多个第二机位，所述逆向机位对应的视频数据为逆向旋转分片，所述逆向旋转分片包括逆向动态旋转子分片和/或逆向静态旋转子分片，其中，所述逆向动态旋转子分片或所述逆向静态旋转子分片包括基于所述多个第二机位对应的视频分片中的视频图像得到的多个图像帧组，所述逆向动态旋转子分片或所述逆向静态旋转子分片中的每个图像帧组基于一个所述第二机位对应的视频分片中的视频图像得到；所述逆向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个第二机位在逆时针方向上到所述目标机位的距离由近至远依次排列；所述逆向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；

其中，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码。
根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：

所述上层设备接收所述终端发送的环绕播放请求，所述环绕播放请求中包括旋转机位信息，所述旋转机位信息用于指示旋转范围；

所述上层设备基于所述环绕播放请求确定播放时间信息；

所述上层设备根据所述旋转机位信息和所述播放时间信息生成旋转分片，所述旋转分片中包括所述旋转范围内的多个机位对应的图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

所述上层设备向所述终端发送所述旋转分片。
根据权利要求3或4所述的方法，其特征在于，所述图像帧组为图像组GOP；或者，所述图像帧组包括插入帧；或者，所述图像帧组包括插入帧和P帧的组合；或者，所述图像帧组包括插入帧、P帧和B帧的组合。
根据权利要求2所述的方法，其特征在于，所述旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，所述预备旋转状态包括动态旋转状态和/或静态旋转状态，所述旋转预备请求中的内容是所述终端中预先配置的。
一种视频播放方法，其特征在于，所述方法包括：

当终端接收到播放指令时，所述终端向上层设备发送基于所述播放指令生成的播放请求，所述播放请求中包括播放机位信息，所述播放机位信息用于指示所请求播放的目标机位；

所述终端接收所述上层设备发送的所述目标机位对应的视频分片以及所述目标机位对应的旋转视频数据，所述旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，所述正向机位包括位于所述目标机位的顺时针方向的一个或多个第一机位，所述逆向机位包括位于所述目标机位的逆时针方向的一个或多个第二机位；

当所述终端在基于所述目标机位对应的视频分片播放视频画面的过程中，接收到旋转指令时，所述终端根据所述旋转指令确定旋转方向，所述旋转方向为顺时针方向或逆时针方向；

响应于所述旋转视频数据包括位于所述目标机位的所述旋转方向上的机位对应的目标视频数据，所述终端基于所述目标视频数据播放视频画面。
根据权利要求7所述的方法，其特征在于，在所述终端接收到所述旋转指令之前，所述方法还包括：

所述终端生成旋转预备请求，所述旋转预备请求用于请求获取所述目标机位对应的旋转视频数据；

所述终端向所述上层设备发送所述旋转预备请求，所述目标机位对应的旋转视频数据是所述上层设备响应于所述旋转预备请求发送的。
根据权利要求8所述的方法，其特征在于，所述旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，所述预备旋转状态包括动态旋转状态和/或静态旋转状态，所述旋转预备请求中的内容是所述终端中预先配置的。
根据权利要求7至9任一所述的方法，其特征在于，所述目标视频数据为目标旋转分片，所述目标旋转分片包括基于位于所述目标机位的所述旋转方向的多个机位对应的视频分片中的视频图像得到的多个图像帧组，所述目标旋转分片中的每个图像帧组基于位于所述目标机位的所述旋转方向的一个机位对应的视频分片中的视频图像得到，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

其中，响应于所述终端在视频播放状态下接收到所述旋转指令，所述目标旋转分片包括动态旋转子分片，所述动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远依次排列；或者，响应于所述终端在视频暂停播放状态下接收到所述旋转指令，所述目标旋转分片包括静态旋转子分片，所述静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远依次排列；

所述终端基于所述目标视频数据播放视频画面，包括：

所述终端对所述目标旋转分片进行解码播放。
根据权利要求7至9任一所述的方法，其特征在于，所述目标视频数据包括位于所述目标机位的所述旋转方向的多个机位分别对应的视频分片；

所述终端基于所述目标视频数据播放视频画面，包括：

所述终端基于所述多个机位对应的视频分片中的视频图像分别生成图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

所述终端按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远的顺序，依次播放生成的所述图像帧组中的视频图像。
根据权利要求7至11任一所述的方法，其特征在于，所述方法还包括：

当所述终端接收到所述旋转指令时，所述终端向所述上层设备发送基于所述旋转指令生成的环绕播放请求，所述环绕播放请求中包括旋转机位信息，所述旋转机位信息用于指示旋转范围；

所述终端接收所述上层设备发送的旋转分片，所述旋转分片中包括所述旋转范围内的多个机位对应的图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

所述终端对所述旋转分片进行解码播放。
根据权利要求10至12任一所述的方法，其特征在于，所述图像帧组为图像组GOP；或者，所述图像帧组包括插入帧；或者，所述图像帧组包括插入帧和P帧的组合；或者，所述图像帧组包括插入帧、P帧和B帧的组合。
一种视频播放装置，其特征在于，应用于上层设备，所述装置包括：

接收模块，用于接收终端发送的播放请求，所述播放请求中包括播放机位信息，所述播放机位信息用于指示所请求播放的目标机位；

发送模块，用于向所述终端发送所述目标机位对应的视频分片以及所述目标机位对应的旋转视频数据，所述旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，所述正向机位包括位于所述目标机位的顺时针方向的一个或多个第一机位，所述逆向机位包括位于所述目标机位的逆时针方向的一个或多个第二机位。
根据权利要求14所述的装置，其特征在于，所述发送模块，用于：

响应于所述上层设备接收到所述终端发送的旋转预备请求，向所述终端发送所述旋转视频数据，所述旋转预备请求用于请求获取所述目标机位对应的旋转视频数据；

或者，响应于所述播放请求，向所述终端发送所述旋转视频数据。
根据权利要求14或15所述的装置，其特征在于，

所述正向机位对应的视频数据包括每个所述第一机位对应的视频分片；或者，所述正向机位包括位于所述目标机位的顺时针方向的多个第一机位，所述正向机位对应的视频数据为正向旋转分片，所述正向旋转分片包括正向动态旋转子分片和/或正向静态旋转子分片，其中，所述正向动态旋转子分片或所述正向静态旋转子分片包括基于所述多个第一机位对应的视频分片中的视频图像得到的多个图像帧组，所述正向动态旋转子分片或所述正向静态旋转子分片中的每个图像帧组基于一个所述第一机位对应的视频分片中的视频图像得到；所述正向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；所述正向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；

所述逆向机位对应的视频数据包括每个所述第二机位对应的视频分片；或者，所述逆向机位包括位于所述目标机位的逆时针方向的多个第二机位，所述逆向机位对应的视频数据为逆向旋转分片，所述逆向旋转分片包括逆向动态旋转子分片和/或逆向静态旋转子分片，其中，所述逆向动态旋转子分片或所述逆向静态旋转子分片包括基于所述多个第二机位对应的视频分片中的视频图像得到的多个图像帧组，所述逆向动态旋转子分片或所述逆向静态旋转子分片中的每个图像帧组基于一个所述第二机位对应的视频分片中的视频图像得到，所述逆向动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个第二机位在逆时针方向上到所述目标机位的距离由近至远依次排列；所述逆向静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个第一机位在顺时针方向上到所述目标机位的距离由近至远依次排列；

其中，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码。
根据权利要求14至16任一所述的装置，其特征在于，所述装置还包括：处理模块；

所述接收模块，还用于接收所述终端发送的环绕播放请求，所述环绕播放请求中包括旋转机位信息，所述旋转机位信息用于指示旋转范围；

所述处理模块，用于基于所述环绕播放请求确定播放时间信息；并根据所述旋转机位信息和所述播放时间信息生成旋转分片，所述旋转分片中包括所述旋转范围内的多个机位对应的图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

所述发送模块，还用于向所述终端发送所述旋转分片。
根据权利要求16或17所述的装置，其特征在于，所述图像帧组为图像组GOP；或者，所述图像帧组包括插入帧；或者，所述图像帧组包括插入帧和P帧的组合；或者，所述图像帧组包括插入帧、P帧和B帧的组合。
根据权利要求15所述的装置，其特征在于，所述旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，所述预备旋转状态包括动态旋转状态和/或静态旋转状态，所述旋转预备请求中的内容是所述终端中预先配置的。
一种视频播放装置，其特征在于，应用于终端，所述装置包括：

发送模块，用于当所述终端接收到播放指令时，向上层设备发送基于所述播放指令生成的播放请求，所述播放请求中包括播放机位信息，所述播放机位信息用于指示所请求播放的目标机位；

接收模块，用于接收所述上层设备发送的所述目标机位对应的视频分片以及所述目标机位对应的旋转视频数据，所述旋转视频数据包括正向机位对应的视频数据和/或逆向机位对应的视频数据，所述正向机位包括位于所述目标机位的顺时针方向的一个或多个第一机位，所述逆向机位包括位于所述目标机位的逆时针方向的一个或多个第二机位；

处理模块，用于当所述终端在基于所述目标机位对应的视频分片播放视频画面的过程中，接收到旋转指令时，根据所述旋转指令确定旋转方向，所述旋转方向为顺时针方向或逆时针方向；

播放模块，用于响应于所述旋转视频数据包括位于所述目标机位的所述旋转方向上的机位对应的目标视频数据，基于所述目标视频数据播放视频画面。
根据权利要求20所述的装置，其特征在于，

所述处理模块，还用于在所述终端接收到所述旋转指令之前，生成旋转预备请求，所述旋转预备请求用于请求获取所述目标机位对应的旋转视频数据；

所述发送模块，还用于向所述上层设备发送所述旋转预备请求，所述目标机位对应的旋转视频数据是所述上层设备响应于所述旋转预备请求发送的。
根据权利要求21所述的装置，其特征在于，所述旋转预备请求包括预备旋转方向、预备旋转机位的数量、预备旋转机位的标识或预备旋转状态中的一个或多个，所述预备旋转状态包括动态旋转状态和/或静态旋转状态，所述旋转预备请求中的内容是所述终端中预先配置的。
根据权利要求20至22任一所述的装置，其特征在于，所述目标视频数据为目标旋转分片，所述目标旋转分片包括基于位于所述目标机位的所述旋转方向的多个机位对应的视频分片中的视频图像得到的多个图像帧组，所述目标旋转分片中的每个图像帧组基于位于所述目标机位的所述旋转方向的一个机位对应的视频分片中的视频图像得到，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

其中，响应于所述终端在视频播放状态下接收到所述旋转指令，所述目标旋转分片包括动态旋转子分片，所述动态旋转子分片中的多个图像帧组按照时间先后顺序排列，且按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远依次排列；或者，响应于所述终端在视频暂停播放状态下接收到所述旋转指令，所述目标旋转分片包括静态旋转子分片，所述静态旋转子分片中的多个图像帧组对应的播放时段相同，且按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远依次排列；

所述播放模块，用于对所述目标旋转分片进行解码播放。
根据权利要求20至22任一所述的装置，其特征在于，所述目标视频数据包括位于所述目标机位的所述旋转方向的多个机位分别对应的视频分片；所述播放模块，用于：

基于所述多个机位对应的视频分片中的视频图像分别生成图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

按照所述多个机位在所述旋转方向上到所述目标机位的距离由近至远的顺序，依次播放生成的所述图像帧组中的视频图像。
根据权利要求20至24任一所述的装置，其特征在于，

所述发送模块，还用于当所述终端接收到所述旋转指令时，向所述上层设备发送基于所述旋转指令生成的环绕播放请求，所述环绕播放请求中包括旋转机位信息，所述旋转机位信息用于指示旋转范围；

所述接收模块，还用于接收所述上层设备发送的旋转分片，所述旋转分片中包括所述旋转范围内的多个机位对应的图像帧组，所述图像帧组包括一帧或多帧视频图像，每个所述图像帧组可被独立解码；

所述播放模块，还用于对所述旋转分片进行解码播放。
根据权利要求23至25任一所述的装置，其特征在于，所述图像帧组为图像组GOP；或者，所述图像帧组包括插入帧；或者，所述图像帧组包括插入帧和P帧的组合；或者，所述图像帧组包括插入帧、P帧和B帧的组合。
一种视频播放系统，其特征在于，所述系统包括：上层设备和终端，所述上层设备包括如权利要求14至19任一所述的视频播放装置，所述终端包括如权利要求20至26任一所述的视频播放装置。
一种视频播放装置，其特征在于，包括：处理器和存储器；

所述存储器，用于存储计算机程序，所述计算机程序包括程序指令；

所述处理器，用于调用所述计算机程序，实现如权利要求1至6任一所述的视频播放方法；或者，实现如权利要求7至13任一所述的视频播放方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有指令，当所述指令被计算机设备的处理器执行时，实现如权利要求1至13任一所述的视频播放方法。
一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时，实现如权利要求1至13任一所述的视频播放方法。