CN112702522B

CN112702522B - 一种基于vr直播系统的自适应控制播放方法

Info

Publication number: CN112702522B
Application number: CN202011564741.4A
Authority: CN
Inventors: 李灯; 张晖; 史雪勇
Original assignee: Individual
Current assignee: Nanjing Vtc Network Technology Co ltd
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-07-12
Anticipated expiration: 2040-12-25
Also published as: CN112702522A

Abstract

本发明提出了一种基于VR直播系统的自适应控制播放方法，涉及VR直播领域，包括：采用全景摄像机实时采集直播流、合并拼接成360度全景画面，进行压缩编码；然后将编码后的全景直播流实时推送到流媒体服务器上进行切片存储；客户端浏览器从流媒体服务器获取VR直播流并解码，运用开源三维绘图引擎对解码后的VR直播流结合重力感应进行360度全景绘图，根据用户终端位置和方向的改变，虚拟摄像机的位置和方向也随之变化，以生成并显示不同视角的直播画面；借助于反馈记忆模型，以实现对不同用户的自适应播放效果；本发明极大地提高了用户观看直播视频的自由度和方向切换的流畅度，不仅扩展了视野范围，而且用户不用佩戴VR眼镜就可以享受沉浸式的体验。

Description

一种基于VR直播系统的自适应控制播放方法

技术领域

本发明属于VR直播领域，特别是涉及一种基于VR直播系统的自适应控制播放方法。

背景技术

随着5G时代的到来，在给网络直播行业带来巨大商机的同时，人们对观看直播的体验度和舒适度的要求也越来越高。在VR直播领域，沉浸式体验逐渐走向人们的视野，然而传统的沉浸式体验需要购买佩戴专业的VR眼镜，不仅价格十分昂贵，而且也不利于人们的携带和直播的推广，因而随时随地看直播成为了人们更高的追求。此外，以往的直播形式并不支持用户观察视角的改变，存在视野范围十分受限及切换不流畅等问题，因此，消除视野盲区和提高用户的视觉感受，成为了直播领域迫切解决的问题。

发明内容

为了解决上述技术问题，本发明的目的是：提出一种能够消除直播时视野盲区、提高用户的视觉感受的自适应控制播放方法。

为了实现上述目的，本发明所采用的的技术方案为：一种基于VR直播系统的自适应控制播放方法，包括以下步骤：

步骤1，采用全景摄像机实时采集直播流、合并拼接成360度全景画面，进行压缩编码；

步骤2，将编码后的全景直播流实时推送到流媒体服务器上进行切片流存储；

步骤3，客户端浏览器从流媒体服务器获取VR切片流并解码，运用三维绘图引擎对解码后的VR切片流进行360度全景绘图；

步骤4，结合移动设备携带的陀螺仪，根据用户手持终端位置和方向的改变，虚拟摄像机的位置和方向也随之变化，从而显示不同视角的直播画面，以达到重力感应的效果；

步骤5，根据不同用户的习惯及偏好，建立反馈记忆模型，动态调整虚拟摄像机参数，以实现对不同用户自适应播放的目的。

进一步的，所述步骤2中的上行采用RTMP传输协议，实时推流到SRS流媒体服务器，直播流切片为ts格式。

进一步的，所述步骤3中的下行采用HLS传输协议，三维绘图引擎技术为threejs，客户端浏览器需支持html5，所述步骤3具体包括：

步骤3-1，在开发环境中创建一个虚拟场景；建立一个半径为500，水平垂直分割面分别为60和40的三维球体对象；在虚拟场景内，通过三维球体对象和视频纹理材质构建一个网格模型对象；

步骤3-2，虚拟相机采用透视相机，初始位置指定在(r,0,0),r为三维球体对象的半径，方向指向目标对象，视野范围为75度。

步骤3-3，场景中创建三维渲染器，将虚拟摄像机视野范围内的二维直播画面通过坐标系变换转变成三维画面并显示；

进一步的，所述步骤4中的移动设备需要支持陀螺仪，所述的陀螺仪可以感知用户设备XYZ三个不同坐标轴的旋转角度alpha、beta、gamma，当用户手持终端移动时，根据陀螺仪传递的这三个角度信息来相应改变虚拟摄像机的坐标位置，达到给用户展示当前三维直播画面的效果，可以根据用户自己的喜好观看到不同的视角，同时建立反馈记忆模型，对陀螺仪获取的参数进行动态调整，以实现不同用户的自适应播放。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

该方法应用在支持陀螺仪的移动设备上，采用三维绘图引擎技术threejs对全景直播画面进行三维重建，达到重力感应渲染的效果，可以使用户在不佩戴任何设备的情况下，体验到裸眼3D的效果和沉浸感，从而还原最真实的三维直播场景，同时建立反馈记忆模型以实现不同用户的自适应播放，极大地提高了用户观看直播视频的自由度和方向切换的流畅度，非常有利于直播的推广。

附图说明

图1为本发明的基于VR直播系统的重力感应渲染方法示意图；

图2为本发明的基于VR直播系统的自适应控制播放方法的总体流程图；

具体实施方式

为了更加详细的描述本发明提出的一种VR直播系统的自适应控制播放方法，结合附图和具体实施方式，举例说明如下:

图1显示了本发明的基于VR直播系统的重力感应渲染方法，该方法主要包括以下步骤:

步骤S101，本发明采用threejs引擎构建一个虚拟场景；

步骤S102，在虚拟场景内建立一个半径r为500，水平垂直分割面分别为60和40的三维球体对象，通过三维球体对象和视频纹理材质构建一个网格模型；

其中，threejs引擎基于ts直播流创建视频纹理对象，使用视频纹理作为材质，将小段的ts视频流贴在三维球体的内表面。

步骤S103，之后在虚拟场景中创建虚拟透视相机，初始位置指定在(r,0,0),r为三维球体对象的半径，方向指向目标对象，视野范围为75度。

步骤S104，在开发环境中，使用threejs引擎创建一个渲染器并设置好渲染范围，将构建好的三维全景直播画面显示在容器中，通过循环实时刷新直播画面。

步骤S105，在支持陀螺仪的移动设备上，根据用户手持终端位置和方向的改变，虚拟摄像机的位置和方向也随之变化，从而实时更新渲染直播画面，以达到重力感应的效果。移动终端中的陀螺仪可以感知用户设备XYZ三个不同坐标轴的旋转角度alpha、beta、gamma，这里的alpha、beta、gamma表示的是相对于坐标轴，设备在某个给定轴上的旋转量，采用笛卡尔坐标系。

alpha:表示设备沿Z轴旋转的角度，范围为0～360；

beta:表示设备在X轴上的旋转角度，范围为-180～180，它描述的是设备由前向后旋转的情况；

gamma:表示设备在Y轴上的旋转角度，范围为-90～90，它描述的是设备由左向右旋转的情况。

当用户手持终端移动时，可将设备状态划分为六个状态：竖屏向上、竖屏向下、横屏向左、横屏向右、水平向上和其他。根据设备状态的不同，陀螺仪传递的这三个角度相应改变虚拟摄像机的坐标位置，从而达到重力感应的效果。

注意，重力感应时要把摄像机绕X轴旋转负90度，因为手机陀螺仪的初始状态是在手机平放于水平面的时候，但是我们处理3D环绕视角场景时是希望在手机竖直时的状态为初始状态，因此需要把坐标系绕X轴旋转负90度，旋转负90度之后，现在Z轴相当于以前的负Y轴，现在的Y轴相当于以前的Z轴，此时gamma和alpha的位置发生了交换。

图2显示了本发明的基于VR直播系统的自适应控制播放方法的总体流程图，该方法主要包括以下步骤:

步骤S201，采用全景摄像机实时采集直播流、合并拼接成360度全景画面，进行压缩编码，采用H.264编码格式；

步骤S202，将编码后的全景直播流实时推送到流媒体服务器上进行切片流存储，上行采用RTMP传输协议，实时推流到SRS流媒体服务器，直播流切片为ts格式，一个ts切片为2s；

步骤S203，客户端浏览器采用HLS协议从流媒体服务器获取VR切片流并解码，运用三维绘图引擎对解码后的VR切片流进行360度全景绘图，下行采用HLS传输协议，三维绘图引擎技术为threejs，客户端浏览器需支持html5；

步骤S204，结合移动设备携带的陀螺仪，根据用户手持终端位置和方向的改变，虚拟摄像机的位置和方向也随之变化，从而显示不同视角的直播画面，以达到重力感应的效果；

步骤S205,在上述基础上同时建立反馈记忆模型，对当前用户来说，先对陀螺仪获取的参数进行存储，对这些存储的参数进行训练，输出虚拟摄像机对应的角度；参考神经网络模型训练方法，输入参数alpha、beta、gamma,输出为虚拟摄像机的坐标位置(x,y,z),采用随机梯度下降算法，具体公式如下：

之后进行VR直播时，可以快速找到当前用户的感兴趣区域，预测当前用户的行为习惯，以实现对不同用户的自适应播放。

以上仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。本发明未涉及的技术均可通过现有的技术加以实现。

Claims

1.一种基于VR直播系统的自适应控制播放方法，采用threejs引擎构建一个虚拟场景，threejs引擎基于ts直播流创建视频纹理对象，使用视频纹理作为材质；其特征在于，包括以下步骤：

所述步骤3具备包括：步骤3-1，创建一个虚拟场景：建立一个半径为500，水平垂直分割面分别为60和40的三维球体对象；在虚拟场景内，通过三维球体对象和视频纹理材质构建一个网格模型对象； threejs引擎将小段的ts视频流贴在三维球体的内表面；

步骤3-2，虚拟相机采用透视相机，初始位置指定在(r,0,0)，r为三维球体对象的半径，方向指向目标对象，视野范围为75度；

步骤3-3，在虚拟场景中创建三维渲染器，将虚拟摄像机视野范围内的二维直播画面通过坐标系变换转变成三维画面并显示；

步骤5，根据不同用户的习惯及偏好，建立反馈记忆模型，动态调整虚拟摄像机参数，以实现对不同用户自适应播放的目的；

所述步骤4中陀螺仪能够感知用户设备XYZ三个不同坐标轴的旋转角度alpha、beta和gamma，所述alpha、beta和gamma 表示的是相对于坐标轴，设备在某个给定轴上的旋转量，其中：

alpha:表示设备沿Z轴旋转的角度，范围为0~360；

beta:表示设备在X轴上的旋转角度，范围为-180~180，它描述的是设备由前向后旋转的情况；

gamma:表示设备在Y轴上的旋转角度，范围为-90~90，它描述的是设备由左向右旋转的情况；

所述步骤5具体为：对当前用户来说，先对陀螺仪获取的参数进行存储，对这些存储的参数进行训练，输出虚拟摄像机对应的角度；利用神经网络模型训练方法，输入参数alpha、beta、gamma，输出为虚拟摄像机的坐标位置(x,y,z),采用随机梯度下降算法；之后进行VR直播时，能够快速找到当前用户的感兴趣区域，预测当前用户的行为习惯，以实现对不同用户的自适应播放。

2.根据权利要求1所述的自适应控制播放方法，其特征在于，所述步骤2具体为：上行采用RTMP传输协议，实时推流到SRS流媒体服务器，直播流切片为ts格式。

3.根据权利要求1所述的自适应控制播放方法，其特征在于，所述步骤3具体为：下行采用HLS传输协议，三维绘图引擎技术为threejs，客户端浏览器需支持html5。

4.根据权利要求1所述的自适应控制播放方法，其特征在于：当用户手持终端移动屏幕方向时，可将设备状态划分为六个状态：竖屏向上、竖屏向下、横屏向左、横屏向右、水平向上和其他，根据陀螺仪传递的这三个角度信息来相应改变虚拟摄像机的坐标位置，达到给用户展示当前直播画面的效果。