WO2021208321A1

WO2021208321A1 - 一种多视点视频的视点切换方法和系统

Info

Publication number: WO2021208321A1
Application number: PCT/CN2020/111970
Authority: WO
Inventors: 田路; 夏洪升
Original assignee: 烽火通信科技股份有限公司
Priority date: 2020-04-15
Filing date: 2020-08-28
Publication date: 2021-10-21
Also published as: CN111372145A; CN111372145B

Abstract

本发明公开了一种多视点视频的视点切换方法，包括：终端接收到视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；如果预设时长内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报服务器；如果预设时长内不存在IDR帧，且缓存内容大于预设时长，则将预设时长后的时间点加入视点切换请求，上报服务器；如果预设时长内不存在IDR帧，且缓存内容不足预设时长，则将缓存末端的时间点加入视点切换请求，上报服务器；清空上报服务器视点切换请求中的时间点之后的终端本地缓存。本发明实现了多视点视频切换中的不同视点时间戳的对齐，使得前后视点的衔接在时间上同步。本发明还公开了相应的多视点视频的视点切换系统。

Description

一种多视点视频的视点切换方法和系统

技术领域

本发明属于视频播放技术领域，更具体地，涉及一种多视点视频的视点切换方法和系统。

背景技术

多视点视频由多个相机组成的相机阵列从不同位置和角度对同一场景或物体进行拍摄得到，如图1所示，相对于单视点视频，多视点视频可以提供同一场景或物体多角度的信息，使人们获得更为丰富的视觉体验。相机阵列采集的多视点视频数据经过编码服务器的编码后传入CDN(Content Delivery Network，内容分发网络)服务器，由CDN服务器将视频进行流化处理，发送到用户终端(例如电视机顶盒、PC、手机等)。用户通过终端观看时，可以通过如方向键、拖动等方式自由切换多视点视频中的视点以变换角度观看被摄对象的情况，达到相比传统单个视点视频更好的观看体验。

编码服务器对相机阵列采集的多视点原始视频码流进行编码压缩后，形成压缩的多路视频码流，压缩的视频帧一般分为I/P/B三类帧。I帧为关键帧，是构成一个帧组(GOP，Group of Picture)的第一个帧；P帧是未来单项预测帧，只储存与之前一个已解压画面的差值，B帧是双向预测帧，除了参考之前解压过了的画面外，也会参考后面一帧中的画面信息。I帧中包括IDR(Instantaneous Decoding Refresh，即时解码刷新)帧，IDR帧的作用是立刻刷新，使错误不致传播，从IDR帧开始，重新算一个新的序列开始编码，其具有普通I帧所不具有的随机访问能力，从随机存取的视频流中，播放器永远可以从一个IDR帧播放。

CDN服务器完成对多视点视频内容的流化打包，并针对用户需求，取出某一个视点的视频码流发送给终端。在发送过程中，CDN服务器一般会存在临时保存视频数据的缓存区，同时终端也存在临时保存视频数据的缓存区，CDN服务器及终端缓冲区的视频内容总长可能达到秒级甚至十秒级，故而终端播放的内容与CDN服务器当前处理的内容在时间点上会有较大延迟。

发明内容

针对现有技术的以上缺陷或改进需求，本发明的目的在于提供一种多视点视频的视点切换方法和系统，在多视点视频视点切换时，对切换时间点的当前和下个视点的视频播放进行处理，实现同一时间点上不同视点间视频自然的衔接以完善视点切换效果。

为实现上述目的，按照本发明的一个方面，提供了一种多视点视频的视点切换方法，包括：

终端接收到用户视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；

如果当前视点的终端本地缓存内容预设时长内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容大于预设时长，则将预设时长后的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容不足预设时长，则将终端本地缓存末端的时间点加入视点切换请求，上报服务器；

清空上报服务器视点切换请求中的时间点之后的终端本地缓存。

本发明的一个实施例中，所述终端向服务器上报视点切换请求后，还接收服务器发送的切换视点后的视频流，具体为：

服务器接收终端发送的视点切换请求；

如果终端本地缓存内容预设时长内存在IDR帧，则直接从服务器上保存的要切换到的下个视点视频中，找出对应时间点的IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端；

如果终端本地缓存内容在上报视点切换请求中的时间点前不存在IDR帧，则将服务器上要切换到的下个视点的对应时间点视频帧结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，替换原有的该时间点的非IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端。

本发明的一个实施例中，在所述多视点视频中，每路视频在每个n秒的时间节点上有一个IDR帧，各路视频的IDR帧在时间点上对齐，n为预设值。

本发明的一个实施例中，所述将服务器上要切换到的下个视点的对应时间点视频帧结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，具体为：将该时间点所属的GOP内所有的编码帧进行解压缩处理生成原始视频数据，并根据该时间点相对GOP起点时间的偏移截取原始视频数据，以该时间点为起点对截取的原始视频数据进行压缩编码，首帧生成IDR帧替换原GOP内的编码帧。

本发明的一个实施例中，视频内容的每帧原始视频数据前增加扩展字段用于视点切换，所述扩展字段包括相机视点信息和时间戳信息。

本发明的一个实施例中，所述相机视点信息包括：当前视点的编号，视点的总数，报文中帧信息，帧类型。

本发明的一个实施例中，所述n取值为2秒，所述预设时长取值为500毫秒。

按照本发明的另一方面，还提供了一种多视点视频的视点切换系统，包括终端和服务器，其中：

所述终端用于在接收到用户视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；

所述服务器接收终端发送的视点切换请求；

总体而言，通过本发明所构思的以上技术方案与现有技术相比，具有如下有益效果：

(1)本发明中实现了多视点视频切换中的不同视点时间戳的对齐，使得前后视点的衔接在时间上同步；

(2)本发明通过对IDR帧的判断和处理，可以保证在视点切换衔接过程中不出现花屏、黑屏等情况，提高视点切换的用户体验；

(3)本发明通过对CDN服务器和机顶盒终端的视频缓存情况的处理，可以提高切换前后视点衔接过程中的播放流畅度。

附图说明

图1为多视点视频通过相机阵列采集多视点视频的示意图；

图2为本发明实施例中的多视点视频播放的业务场景架构图；

图3为多视点视频编码IDR/P/B帧示意图；

图4为本发明实施例中多视点视频的视点切换方法示意图；

图5为本发明实施例中多视点视频视点切换时终端及CDN服务器侧流程图；

图6为本发明实施例中多视点视频的视点切换系统结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明要解决的技术问题是：

在多视点视频播放过程中，用户控制终端切换视点(例如通过电视机顶盒遥控器的方向键等)，CDN服务器响应用户的请求，将当前视点播放的画面切换到下一个视点播放的画面，用户期待终端播放的当前视点与下个视点在切换的时间点上对齐。

视频编码中，存在多种类型(I/P/B)的图像帧，其中只有I帧中的IDR帧是独立不参考其它帧的类型，用户请求视点切换时，下个视点对应切换时间点播放的画面可能为需要关联其它帧的帧类型情况，而下个视点播放帧因与前一视点帧之间无关联性，造成花屏、黑屏的结果。

另外由于机顶盒终端和服务器的缓存功能，可能存在用户发出切换命令时，缓存中仍保存着一段时间当前视点的视频内容，下个视点视频的播放需要经过较长时间才能显示。

由于视频帧特性和设备缓存的因素造成前后视点的切换播放不能在同一时间点正确衔接，影响视点切换效果。

实施例1

图2为本发明实施例中的多视点视频播放的业务场景架构图，本发明采用多视点视频端到端的系统，分为直播和点播2个部分，其中直播由相机阵列实时采集对象的多视点视频内容，由编码服务器进行压缩编码，再由CDN服务器进行流化打包，发送给终端；而点播内容以文件方式直接注入到CDN服务器，由CDN服务器进行处理，再经流化打包后，发送给终端。

直播过程中，相机阵列采集共计x个相机采集的原始视频数据，在编码服务器进行压缩编码时，如图3所示，对每路的视频码流以n秒为周期生成IDR帧，即每路视频在每个n秒的时间节点上有一个IDR帧，也即编码视频的GOP(Group of Pictures)长度为n秒，各路视频的IDR帧在时间点上对齐，生成共计x路编码后的视频码流，n为预设值，经测试验证，n取值为2秒较为合适。

点播的多视点视频文件注入到CDN服务器，由CDN服务器进行存储，由于外部获取的视频文件的编码方式可能不一，需要经过CDN服务器对注入的视频文件进行检查和转码工作，同样以n秒为周期生成IDR帧，保持各路视频的IDR帧在时间点上对齐。

周期生成IDR帧的压缩视频内容，由CDN服务器对各个视点的视频使用流媒体协议进行流化打包。在打包过程中，CDN服务器在视频内容的每帧的原始视频数据前增加8个字节的扩展字段，包括相机视点信息、时间戳信息，用于后续视点切换用途。相机视点信息可以为：当前视点的编号，视点的总数，报文中帧信息，帧类型。

例如如表1所示，1个字节用于记录当前相机(视点)的编号；1个字节用于记录相机(视点)的总数；FP字段占用4个bit位，值为1时表示一帧都在该报文中，值为2时表示一帧的头部，值为3时表示一帧的中段，值为4时表示一帧的末尾；FT字段占用4个bit位，值为1时表示该帧为IDR帧，值为2时表示该帧为P帧，值为3时表示该帧为B帧，值为4时表示该帧为除了IDR帧之外的I帧；最后4个字节用于记录以ms为单位的时间戳。终端在播放视频时，需要将扩展字段的内容剥除后播放视频帧。

表1

终端(如电视机顶盒、PC、手机等)在播放某个视点视频的过程中，通过方向按键等控制方式发起视点切换，目的是将当前播放的视点切换到其他视点播放视频。在切换视点的过程中，由于不同视点的视频前后内容无参考关系，需要切换后新的视点播放的视频帧为IDR帧，才能保证新的视点播放视频与前一视点播放视频无关联性，不会因此造成花屏、黑屏的情况。同时，在切换的时间点上，需要保证前后视点在时间点上能够正常衔接，否则会因前后视点的时间跳变造成观感体验差的情况，这就需要对包括CDN服务器和终端的缓存中的前一视点的数据进行处理。

实施例2

如图4所示，为本发明实施例中一种多视点视频的视点切换方法，包括：

S1、终端接收到用户视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；

S2、如果当前视点的终端本地缓存内容预设时长内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报服务器；

S3、如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容大于预设时长，则将预设时长后的时间点加入视点切换请求，上报服务器；

S4、如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容不足预设时长，则将终端本地缓存末端的时间点加入视点切换请求，上报服务器；

S5、清空上报服务器视点切换请求中的时间点之后的终端本地缓存。

需要注意的是：上述步骤S2、S3、S4是并列关系，而非先后执行关系，即根据判断条件，S2、S3、S4三者之一执行即可。

另外，因为CDN在接收到切换请求时，可能CDN本地缓存中存在前一视点的视频内容，这部分内容无需再发送到终端，所以在在接收到切换请求时也需要CDN清空本地的缓存。

实施例3

终端接收用户切换视点的命令时，对终端本地缓存的内容，检查每一帧的扩展字段时间戳信息，如果当前视点的终端本地缓存内容预设时长(例如m毫秒)内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报CDN服务器；如果当前视点的终端本地缓存内容m毫秒内不存在IDR帧，且缓存内容大于m毫秒，则将m毫秒后的时间点加入视点切换请求，上报CDN服务器；如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容不足m毫秒，则将终端本地缓存末端的时间点加入视点切换请求，上报CDN服务器。并且，清空上报服务器时间点之后的终端本地缓存。

CDN服务器接收终端发送的视点切换请求，如果发现上报的终端缓存m毫秒内存在IDR帧，则直接从CDN服务器上保存的要切换到的下个视点中，根据扩展字段的时间戳信息，找出对应时间点的IDR帧，清空本地缓存后，从该时间点流化打包，发送到终端；如果发送上报的终端切换时间点前不存在IDR帧，则需要将保存的CDN服务器上要切换到的下个视点的对应时间点视频帧，结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，替换原有的该时间点的非IDR帧，并从该时间点流化打包，发送到终端。

计算合成出一个IDR帧所采用的方法可以是：将该时间点所属的GOP(n秒)内所有的编码帧进行解压缩处理，生成n秒的原始视频数据，并根据该时间点相对GOP起点时间的偏移，截取原始视频数据，以该时间点为起点，对截取的原始视频数据进行压缩编码，首帧生成IDR帧，替换原GOP内的编码帧。

终端在视点切换时，从切换时间点开始，播放原视点最长m毫秒的内容，继而播放新视点的视频内容，前后视点在切换的时间点上对齐。经测试验证，m毫秒取值为500毫秒较为合适。

需要注意的是：因为CDN在接收到切换请求时，可能CDN本地缓存中存在前一视点的视频内容，这部分内容无需再发送到终端，所以在接收到切换请求时也需要CDN清空本地的缓存。

实施例4

图5为本发明实施例中多视点视频视点切换时终端及CDN服务器侧流程图；本发明实施例描述了多视点视频切换时，终端与CDN服务器为达到前后视点衔接播放所做的处理。

其中，在终端侧：

S101：终端(如电视机顶盒、手机、PC等)正在播放多视点视频视点A的视频内容；

S102：用户通过终端方向键等方式(如机顶盒遥控器方向键、手机滑动、PC鼠标拖动)发起视点切换操作；

S103：终端解析用户的操作请求，判断切换到的下个视点为B；

S104：终端检查本地针对当前视点A的缓存内容，查找m毫秒内的视频帧是否有IDR帧；

S105：终端发现终端本地缓存的视点A的视频帧内容在m毫秒内有IDR帧，则将该IDR帧的时间点信息、视点切换到视点B的切换请求上报到CDN服务器，同时清空终端本地缓存内该IDR帧时间点及之后的内容；

S106：终端未在终端本地缓存的m毫秒内发现IDR帧，则检查终端本地缓存的内容长度是否大于m毫秒；

S107：终端发现本地的内容长度大于m毫秒，则将m毫秒处视频帧的时间点信息、IDR帧生成请求、视点切换请求上报CDN服务器，同时清空终端本地缓存m毫秒时间点及之后的内容；

S108：终端发现本地的内容长度小于m毫秒，则将终端本地缓存末端的时间点信息、IDR帧生成请求、视点切换请求上报CDN服务器；

S109：终端接收并播放切换后下个视点B的内容。

在CDN服务器侧：

S201：CDN服务器检查多视点视频内容，保证每个视点的视频以n秒为周期，固定存在IDR帧，如不符合，则需要进行转码，生成n秒为周期的IDR帧替换原有帧；

S202：CDN服务器在流化打包时，在每个视点的每个视频帧前，以本发明实施例1方案中的描述方式增加视点、时间戳信息的扩展字段；

S203：CDN服务器接收到终端的将视点切换到B的切换请求，以及终端缓存IDR帧的时间点信息后，清空CDN服务器本地的缓存，并根据该时间点信息，直接提供下个视点B的对应时间点视频码流，无需计算合成，首帧即为IDR帧；

S204：CDN服务器接收到终端的视点切换到B的切换请求，以及IDR帧生成请求和生成时间点信息时，清空本地缓存，然后通过合成计算将下个视点B在该时间点的视频帧转换为IDR帧，替换B视点在该时间点的原有帧，同时将该IDR帧作为首帧发送给终端，并持续发送B视点的视频码流。

实施例5

图6所示为本发明实施例中多视点视频的视点切换系统的结构示意图。所述系统包括终端和服务器，其中：

进一步地，所述终端向服务器上报视点切换请求后，还接收服务器发送的切换视点后的视频流，具体为：

所述服务器接收终端发送的视点切换请求；

进一步地，在所述多视点视频中，每路视频在每个n秒的时间节点上有一个IDR帧，各路视频的IDR帧在时间点上对齐，n为预设值。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

一种多视点视频的视点切换方法，其特征在于，包括：

终端接收到用户视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；

如果当前视点的终端本地缓存内容预设时长内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容大于预设时长，则将预设时长后的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容不足预设时长，则将终端本地缓存末端的时间点加入视点切换请求，上报服务器；

清空上报服务器视点切换请求中的时间点之后的终端本地缓存。
如权利要求1所述的多视点视频的视点切换方法，其特征在于，所述终端向服务器上报视点切换请求后，还接收服务器发送的切换视点后的视频流，具体为：

服务器接收终端发送的视点切换请求；

如果终端本地缓存内容预设时长内存在IDR帧，则直接从服务器上保存的要切换到的下个视点视频中，找出对应时间点的IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端；

如果终端本地缓存内容在上报视点切换请求中的时间点前不存在IDR帧，则将服务器上要切换到的下个视点的对应时间点视频帧结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，替换原有的该时间点的非IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端。
如权利要求1或2所述的多视点视频的视点切换方法，其特征在于，在所述多视点视频中，每路视频在每个n秒的时间节点上有一个IDR帧，各路视频的IDR帧在时间点上对齐，n为预设值。
如权利要求2所述的多视点视频的视点切换方法，其特征在于，所述将服务器上要切换到的下个视点的对应时间点视频帧结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，具体为：将该时间点所属的GOP内所有的编码帧进行解压缩处理生成原始视频数据，并根据该时间点相对GOP起点时间的偏移截取原始视频数据，以该时间点为起点对截取的原始视频数据进行压缩编码，首帧生成IDR帧替换原GOP内的编码帧。
如权利要求1或2所述的多视点视频的视点切换方法，其特征在于，视频内容的每帧原始视频数据前增加扩展字段用于视点切换，所述扩展字段包括相机视点信息和时间戳信息。
如权利要求5述的多视点视频的视点切换方法，其特征在于，所述相机视点信息包括：当前视点的编号，视点的总数，报文中帧信息，帧类型。
如权利要求3所述的多视点视频的视点切换方法，其特征在于，所述n取值为2秒，所述预设时长取值为500毫秒。
一种多视点视频的视点切换系统，其特征在于，包括终端和服务器，其中：

所述终端用于在接收到用户视点切换请求后，检查当前视点的终端本地缓存内容预设时长内是否存在IDR帧；

如果当前视点的终端本地缓存内容预设时长内存在IDR帧，则将该IDR帧的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容大于预设时长，则将预设时长后的时间点加入视点切换请求，上报服务器；

如果当前视点的终端本地缓存内容预设时长内不存在IDR帧，且缓存内容不足预设时长，则将终端本地缓存末端的时间点加入视点切换请求，上报服务器；

清空上报服务器视点切换请求中的时间点之后的终端本地缓存。
如权利要求8所述的多视点视频的视点切换系统，其特征在于，所述终端向服务器上报视点切换请求后，还接收服务器发送的切换视点后的视频流，具体为：

所述服务器接收终端发送的视点切换请求；

如果终端本地缓存内容预设时长内存在IDR帧，则直接从服务器上保存的要切换到的下个视点视频中，找出对应时间点的IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端；

如果终端本地缓存内容在上报视点切换请求中的时间点前不存在IDR帧，则将服务器上要切换到的下个视点的对应时间点视频帧结合该时间点所处GOP的相关视频帧，计算合成出一个IDR帧，替换原有的该时间点的非IDR帧，清空服务器缓存后，从该时间点流化打包并发送到终端。
如权利要求8或9所述的多视点视频的视点切换系统，其特征在于，在所述多视点视频中，每路视频在每个n秒的时间节点上有一个IDR帧，各路视频的IDR帧在时间点上对齐，n为预设值。