WO2018108104A1 - 一种全景视频传输方法、装置、终端、服务器及系统 - Google Patents

一种全景视频传输方法、装置、终端、服务器及系统 Download PDF

Info

Publication number
WO2018108104A1
WO2018108104A1 PCT/CN2017/115943 CN2017115943W WO2018108104A1 WO 2018108104 A1 WO2018108104 A1 WO 2018108104A1 CN 2017115943 W CN2017115943 W CN 2017115943W WO 2018108104 A1 WO2018108104 A1 WO 2018108104A1
Authority
WO
WIPO (PCT)
Prior art keywords
video file
panoramic video
fov
file
server
Prior art date
Application number
PCT/CN2017/115943
Other languages
English (en)
French (fr)
Inventor
黄成�
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Priority to EP17879726.2A priority Critical patent/EP3557845B1/en
Priority to US16/469,355 priority patent/US20190387214A1/en
Priority to FIEP17879726.2T priority patent/FI3557845T3/fi
Publication of WO2018108104A1 publication Critical patent/WO2018108104A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/10Architectures or entities
    • H04L65/1059End-user terminal functionalities specially adapted for real-time communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/612Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/261Image signal generators with monoscopic-to-stereoscopic image conversion
    • H04N13/264Image signal generators with monoscopic-to-stereoscopic image conversion using the relative movement of objects in two video frames or fields
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种全景视频传输方法及装置,所述方法包括:向服务器请求获取第一全景视频文件;当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。

Description

一种全景视频传输方法、装置、终端、服务器及系统 技术领域
本发明涉及视频传输技术,尤其涉及一种全景视频传输方法、装置、终端、服务器及系统。
背景技术
虚拟现实(VR,Virtual Reality)是指利用计算机技术模拟产生三维的虚拟世界,让使用者在视、听、触、味觉等方面体验高度逼真的虚拟空间环境。随着VR技术的快速发展,VR(全景)视频直播、点播等应用也越来越广泛,这给用户带来了沉浸感很强的视频业务体验。
VR全景视频的在线传输有两种主要的技术路线:全视角传输方案和视窗(FOV,Field of View)传输方案。所谓的全视角传输方案就是将360度环绕的画面都传输给终端,当用户头部转动需要切换画面时,所有的处理都在终端本地完成。VR全景视频在相同单眼可视分辨率情况下,由于帧率、位深、360度等原因,码率要比普通平面视频大很多,前者一般是后者的5-10倍,以单眼8K的VR极致全景视频为例,观看时要求的带宽达到5G,这对于网络来说是个极大的挑战,成本也大大增加。虽然整个全景视频是360度的,但是观看者在观看时,实际只能看到当前视野部分,看不到的部分只是占了网络带宽,而没有真正用到,对网络资源造成了比较大的浪费。针对这种情况,业界提出了基于视角进行有差别传输VR视频的传输方案,也即FOV传输方案。在FOV传输方案中,主要传输当前视角中的可见画面。一般都是将360度全景视野划分为若干个视角,每个视角生成一个视频文件,传输给终端的视频只包含用户视角内高分辨率和周围部分低分辨率的视觉信息,终端根据用户当前视角姿态位置,向服务器请求对应的视角文件。当头部转动视角发生变化时,终端向服务器请求新视角对应的视角文件。在一种基于FOV方式传输的方案中,一共划分了30个视角,每个视角文件大小,只有原始文件的20%,传输码率也相 应的只有原来的20%,大大降低了观看VR视频的带宽要求,并且提高带宽的有效利用率。这种方案也存在不足,就是所有视角的视频文件大小总和是原始文件的6倍,在服务器上会占用比较多的存储空间,这种以存储换时延的方案牺牲了部分画质体验。
发明内容
为解决上述技术问题,本发明实施例提供了一种全景视频传输方法、装置、终端、服务器及系统。
本发明实施例提供的全景视频传输方法,包括:
向服务器请求获取第一全景视频文件;
当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第一全景视频文件的FOV类型,包括以下至少之一:
所述第一全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述第一全景视频文件中存在预先确定的主要FOV;
所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法,包括:
如果所述第一全景视频文件中存在预先确定的辅助FOV,且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述根据所述第一全景视频文件的FOV类型,向 所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法,包括:
如果所述第一全景视频文件中存在预先确定的主要FOV,且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全景视频文件。
本发明实施例中,所述根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法,包括:
如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
本发明实施例中,所述方法还包括:
向服务器请求获取媒体描述文件,所述媒体描述文件包括用户视角与视频文件的对应关系,其中,所述视频文件包括全景视频文件,以及辅助FOV视频文件。
本发明实施例中,所述媒体描述文件中还包括全景视频文件与其辅助FOV视频文件的对应关系。
本发明实施例中,所述向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件的方法,包括:
当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;
根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述向所述服务器请求获取第二全景视频文件的方法,包括:
当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;
根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
本发明实施例中,所述向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件的方法,包括:
当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;
根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述方法还包括:
请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
本发明另一实施例提供的全景视频传输方法,包括:
向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本发明实施例中,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
本发明实施例提供的全景视频传输装置,包括:
第一获取单元,设置为向服务器请求获取第一全景视频文件;
第二获取单元,设置为当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第一全景视频文件的FOV类型,包括以下至少之一:
所述第一全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述第一全景视频文件中存在预先确定的主要FOV;
所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的辅助FOV,且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV,且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全景视频文件。
本发明实施例中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
本发明实施例中,所述装置还包括:
第三获取单元,设置为向服务器请求获取媒体描述文件,所述媒体描述文件包括用户视角与视频文件的对应关系,其中,所述视频文件包括全 景视频文件,以及辅助FOV视频文件。
本发明实施例中,所述媒体描述文件中还包括全景视频文件与其辅助FOV视频文件的对应关系。
本发明实施例中,所述第二获取单元,具体设置为:当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第二获取单元,具体设置为:当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
本发明实施例中,所述第二获取单元,具体设置为:当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
本发明另一实施例提供的全景视频传输装置,包括:
发送单元,设置为向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本发明实施例中,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
本发明实施例提供的终端,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,所述处理器,设置为执行如下步骤:
向服务器请求获取第一全景视频文件;
当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第一全景视频文件的FOV类型,包括以下至少之一:
所述第一全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述第一全景视频文件中存在预先确定的主要FOV;
所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例提供的服务器,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,所述处理器,设置为执行如下步骤:
向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本发明实施例中,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例提供的全景视频传输系统,包括终端、服务器;其中,
所述终端包括第一处理器以及存储有所述第一处理器可执行指令的第一存储器,当所述指令被第一处理器执行时,所述第一处理器,设置为执行如下步骤:向服务器请求获取第一全景视频文件;当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件;
所述服务器包括第二处理器以及存储有所述第二处理器可执行指令的第二存储器,当所述指令被第二处理器执行时,所述第二处理器,设置为执行如下步骤:向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本发明实施例中,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例的技术方案中,终端向服务器请求获取第一全景视频文件;当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。采用本发明实施例的技术方案,在用户观看全景视频切换视角时,保障了切换过程中画质的视觉体验,从而实现了在有限带宽的情况下,尽可能为用户提供更好的视频体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例的全景视频传输方法的流程示意图一;
图2为本发明实施例的全景视频传输方法的流程示意图二;
图3为本发明实施例的全景视频传输方法的流程示意图三;
图4为本发明实施例的全景视频传输方法的流程示意图四;
图5为本发明实施例的全景视频传输方法的流程示意图五;
图6为本发明实施例一的全景视频传输方法的流程图;
图7为本发明实施例一的应用示意图;
图8为本发明实施例二的全景视频传输方法的流程图;
图9为本发明实施例二的应用示意图;
图10为本发明实施例的全景视频传输装置的结构组成示意图一;
图11为本发明实施例的全景视频传输装置的结构组成示意图二;
图12为本发明实施例的全景视频传输系统的结构组成示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明实施例。
图1为本发明实施例的全景视频传输方法的流程示意图一,如图1所示,所述全景视频传输方法包括以下步骤:
步骤101:向服务器请求获取第一全景视频文件。
在向服务器请求获取第一全景视频文件之前,所述方法还包括:向服务器请求获取媒体描述文件。
本发明实施例中,所述媒体描述文件中还包括全景视频文件的FOV类型信息,如下表所示:
Figure PCTCN2017115943-appb-000001
表1
本发明实施例中,所述媒体描述文件包括用户视角与视频文件的对应关系。其中,所述视频文件包括全景视频文件,以及辅助FOV视频文件。
通过全景视频文件预先确定的主要FOV建立用户视角与全景视频文件之间的对应关系。所述媒体描述文件中全景视频文件预先确定的主要FOV描述信息,如下表所示:
基本属性值或者补充属性值 使用 描述
Primary_yaw 必选 主要观看方向的方位角
Primary_pitch 必选 主要观看方向的仰俯角
Primary_FOV_width 可选 主要FOV的水平视场角
Primary_FOV_height 可选 主要FOV的垂直视场角
表2
通过辅助FOV视频文件空间区域信息建立用户视角与辅助FOV视频文件的对应关系。所述媒体描述文件中辅助FOV视频文件空间区域信息,如下表所示:
Figure PCTCN2017115943-appb-000002
Figure PCTCN2017115943-appb-000003
表3
所述媒体描述文件还包括全景视频文件与其辅助FOV视频文件对应关系,如下表所示:
Figure PCTCN2017115943-appb-000004
表4
步骤102:当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
这里,所述第一全景视频文件的FOV类型,包括以下至少之一:
所述第一全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述第一全景视频文件中存在预先确定的主要FOV;
所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
相应地,如果所述第一全景视频文件中存在预先确定的辅助FOV且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
相应地,如果所述第一全景视频文件中存在预先确定的主要FOV且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全 景视频文件。
相应地,如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
在所述第一全景视频文件中存在预先确定的辅助FOV的情况下,当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
在所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV的情况下,当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
上述基于FOV类型的全景视频传输方法支持多种360°视频传输场景需求,包括:
Figure PCTCN2017115943-appb-000005
表5
图2为本发明实施例的全景视频传输方法的流程示意图二,如图2所示,所述全景视频传输方法包括以下步骤:
步骤201:对应用户视角创建全景视频文件及其辅助FOV视频文件。
步骤202:向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
这里,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
进一步,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
图3为本发明实施例的全景视频传输方法的流程示意图三,如图3所示,所述全景视频传输方法包括以下步骤:
步骤301:终端向服务器请求媒体描述文件,获取播放视角与视频文件的对应关系。
步骤302:终端选择播放视角Viewport#i,向服务器请求获取视角Viewport#i对应的全景视频文件360Video#i。
步骤303:终端检测用户当前姿态位置,获取用户观看视角变化(θ,Ф)。
步骤304:终端判断(θ,Ф)是否超出Viewport#i的第一阈值范围,是时,执行步骤305,否时,执行步骤306。
步骤305:终端根据视角变化(θ,Ф)确定新的播放视角Viewport#j,向服务器请求获取视角Viewport#j对应的全景视频文件360Video#j。继续 执行步骤303。
步骤306:终端判断(θ,Ф)是否超出Viewport#i的第二阈值范围,是时,执行步骤307,否时,执行步骤303。
步骤307:终端向服务器请求获取视角变化(θ,Ф)对应的视窗视频文件FOVVideo#i(θ,Ф)
图4为本发明实施例的全景视频传输方法的流程示意图四,如图4所示,所述全景视频传输方法包括以下步骤:
步骤401:终端向服务器请求媒体描述文件。
步骤402:服务器将终端返回媒体描述文件。
步骤403:终端选择播放视角Viewport#i,向服务器请求播放视角Viewport#i对应的全景视频文件360Video#i。
步骤404:服务器返回全景视频文件360Video#i。
步骤405:检测到终端在Viewport#i对应的阈值范围内改变视角
Figure PCTCN2017115943-appb-000006
向服务器请求改变视角
Figure PCTCN2017115943-appb-000007
对应的视窗视频文件FOV Video#i
Figure PCTCN2017115943-appb-000008
步骤406:服务器返回视窗视频文件FOVVideo#i(θ,Ф)
步骤407:检测到终端改变视角
Figure PCTCN2017115943-appb-000009
超过Viewport#i对应的阈值范围,选择播放视角Viewport#j,向服务器请求播放视角Viewport#j对应的全景视频文件360Video#j。
步骤408:服务器返回全景视频文件360Video#j。
图5为本发明实施例的全景视频传输方法的流程示意图五,如图5所示,所述全景视频传输方法包括以下步骤:
步骤501:终端向服务器请求获取第一全景视频文件,播放所述第一全景视频文件。
步骤502:终端检测到用户视角姿态发生变化。
步骤503:终端判断第一全景视频文件FOV类型;存在辅助FOV时, 执行步骤504;存在主要FOV以及辅助FOV时,执行步骤506;存在主要FOV时,执行步骤508。
步骤504:判断用户视角变化量是否大于第一阈值,是时,执行步骤505,否时,执行步骤502。
步骤505:终端向服务器请求获取第一全景视频文件的辅助FOV视频文件。
步骤506:判断用户视角变化量是否大于第二阈值,否时,执行步骤507,是时,执行步骤509。
步骤507:判断用户视角变化量是否大于第三阈值,是时,执行步骤505,否时,执行步骤502。
步骤508:判断用户视角变化量是否大于第二阈值,是时,执行步骤509,否时,执行步骤502。
步骤509:终端向服务器请求获取第二全景视频文件。
下面结合具体应用场景对本发明实施例的方案做进一步描述。
实施例一:360视频点播(单播)
图6为本发明实施例一的全景视频传输方法的流程图;本实施例为360视频FOV点播传输。不失一般性,针对本实施例中涉及的各功能实体说明如下:
360视频播放器:如虚拟现实头戴式显示设备(HDM),能够跟踪用户视角姿态变化,通过位于用户眼睛前方的目视光学系统放大微型显示屏上的图像,从而提供360全景视频沉浸式显示效果。
流媒体客户端:如动态自适应流媒体(DASH,Dynamic Adaptive Streaming over HTTP)客户端,提供针对360全景视频等媒体资源的访问、解码和缓存。
流媒体服务器:可以是任何合适类型的网络服务器,如内容分发网络 (Content Delivery Network,简称为CDN)的一个节点、代理服务器、Web服务器、或这些项的组合。流媒体客户端可以通过任意接入网与流媒体服务器建立网络连接。
视频源服务器:完成视频源的捕获、编码压缩、分段处理,将原始视频内容划分成为具有固定时间间隔的多个视频片段。还提供动态自适应流媒体中媒体描述文件(MPD,Media Presentation Description)存储。
步骤1:360视频播放器根据用户的指示选择并请求播放360视频节目。
步骤2:流媒体客户端向流媒体服务器请求与所选择360视频节目对应的媒体描述文件。在实际环境中,流媒体客户端可根据预先参数配置(譬如访问页面网络链接)向流媒体服务器发送上述请求。可选的,流媒体服务器将所述请求转发视频源服务器,获取360视频节目对应的媒体描述文件。
步骤3:流媒体服务器返回与所选择360视频节目对应的媒体描述文件。由于360视频FOV传输涉及不同视角的视频文件,服务器返回的媒体描述文件中包括360视频节目中所有视角视频文件URL以及角度关系信息。
下面结合图7对本实施例360视频节目中涉及的相关视频文件进行说明:
在本实施例中,视频源服务器预先定义在观看360视频节目时用户在空间球坐标系中的视角姿态位置,并进行1-N的编号,每个编号对应一个视角范围。视频源服务器根据用户视角姿态位置编号,生成对应的N个全景视频文件360Video#i(i=1..N)。如图7所示,视频源服务器采用基于正六面体投影的非均匀映射方式生成6个全景视频文件360VideoCubeFace#i(i=1..6),其中,每个全景视频文件具有预先确定的主要FOV描述信息,包括:主要FOV的观看方向:(方位角,仰俯角);主要FOV的视场角:(水平视场角,垂直视场角)。
如图7-(1)所示,全景视频文件360VideoCubeFace#1预先确定的主要FOV是立方体投影面的面#1(前面,Front)。假定全局球面坐标系中水平视角(0,360),垂直视角(-90,90),则全景视频文件360VideoCubeFace#1预先确定的主要FOV的观看方向为(120,30),主要FOV的视场角为(240,120)。
同时,视频源服务器针对每个全景视频文件360Video#i生成若干个辅助FOV视频文件FOVVideo#i(θ,Ф)(i=1..N),存放在流媒体服务器。如图7所示,视频源服务器对应每个全景视频文件360VideoCubeFace#i(i=1..6),将各自生成8个辅助FOV视频文件FOVVideoCubeFace#i(θ,Ф)(每个主要FOV与立方体4个投影面相邻,为每个相邻面设置2个视角变动范围(θ,Ф)及其对应辅助FOV)。其中,每个辅助FOV视频文件具有预先确定的空间区域描述信息,包括:(最小方位角,最大方位角,最小仰俯角,最大仰俯角)。
如图7-(2)所示,针对全景视频文件360VideoCubeFace#1主要FOV与相邻面#2视角变动范围(θ,Ф),设置辅助FOV视频文件FOVVideoCubeFace#1(θ,Ф)。假定全局球面坐标系中水平视角(0,360),垂直视角(-90,90),则辅助FOV视频文件FOVVideoCubeFace#1(θ,Ф)预先确定的空间区域为(240,360,30,90)。
同时,视频源服务器编制对应的媒体描述文件,所述媒体描述文件中携带上述全景视频文件和辅助FOV视频文件的视角描述信息,以及全景视频文件和辅助FOV视频文件的对应关系。
步骤4:流媒体客户端返回360视频节目播放确认。
步骤5:基于360视频节目的配置或者用户选择,360视频播放器选择初始观看视角。
步骤6-步骤8:流媒体客户端根据当前用户视角请求对应的全景视频文件360Video#i以及360视频开始播放的时间点t0。如图7-(1)所示,本实施例流媒体客户端根据当前用户视角以及全景视频文件主要FOV信 息请求下载全景视频文件360VideoCubeFace#1。流媒体服务器接收到请求后,寻址到全景视频文件360VideoCubeFace#1的t0时刻开始传输。360视频播放器在接收到最小缓冲数据量后,从时间点t0开始播放全景视频文件360VideoCubeFace#1。
步骤9-步骤12:在某时刻用户改变观看视角姿态,对于每一个检测到的视角改变度(θ,Ф),流媒体客户端判断视角变化(θ,Ф)是否超出全景视频文件360Video#i主要FOV所对应视野Viewport#i的第一阈值范围。
若是,则识别出对应的新的视角姿态位置为j。流媒体客户端请求对应的全景视频文件360Video#j,以及360视频开始播放时间点t1。360视频播放器在接收到可支持播放的最小缓冲数据量后,并在播放完全景视频文件360Video#i剩余的时长后,从时间点t1开始播放全景视频文件360Video#j;
若否,则判断视角变化(θ,Ф)是否超出全景视频文件360Video#i主要FOV所对应视野Viewport#i的第二阈值范围。若是,则流媒体客户端请求获取视角变化(θ,Ф)对应的辅助FOV视频文件FOVVideo#i(θ,Ф),360视频播放器在接收到可支持播放的最小缓冲数据量后,开始同时播放全景视频文件360Video#i以及辅助FOV视频文件FOVVideo#i(θ,Ф)。
如图7-(2)所示,本实施例中检测到视角姿态变化(θ,Ф),且Viewport#1第二阈值≤(θ,Ф)<Viewport#1第一阈值,流媒体客户端根据视角姿态变化(θ,Ф)以及辅助FOV视频文件FOVVideoCubeFace#1(θ,Ф)空间区域信息,请求下载相邻立方体面#2的辅助FOV视频文件FOVVideoCubeFace#1(θ,Ф)。360视频播放器在接收到最小缓冲数据量后,开始同时播放全景视频文件360VideoCubeFace#1及其辅助FOVVideoCubeFace#1(θ,Ф)。
步骤13-步骤16:如图7-(3)所示,某时刻检测到视角姿态变化(θ,Ф),且(θ,Ф)≥Viewport#1第一阈值,流媒体客户端根据视角姿态变化(θ,Ф)以及全景视频文件主要FOV信息请求下载全景视频文件360VideoCubeFace#2。流媒体服务器接收到请求后,寻址到全景视频文件 360VideoCubeFace#2的t1时刻开始传输。360视频播放器在接收到最小缓冲数据量后,从时间点t1开始播放全景视频文件360VideoCubeFace#2。
实施例二:360视频直播(组播)
图8为本发明实施例二的全景视频传输方法的流程图;本实施例为360视频FOV直播传输。
步骤1:360视频播放器根据用户的指示选择并请求播放360视频节目。
步骤2-步骤3:对于采用组播方式传输的360视频直播,每个节目中包含多个视角姿态的全景视频文件视频流,每个视角对应一个组播组地址。流媒体客户端请求流媒体服务器返回与所选择360视频节目对应的组播组列表以及相应视角关系信息。
步骤4-步骤5:为了通过单播方式传输辅助FVO视频文件,流媒体客户端请求流媒体服务器返回与所选择360视频节目对应的媒体描述文件,由于360视频FOV传输涉及不同视角的视频文件,服务器返回的媒体描述文件包括360视频节目中所有视角视频文件URL以及角度关系信息。
下面结合图9对本实施例360视频节目中涉及的相关视频文件进行说明:
在本实施例中,视频源服务器预先定义在观看360视频节目时用户在空间球坐标系中的视角姿态位置,并进行1-N的编号,每个编号对应一个视角范围。视频源服务器根据用户视角姿态位置编号,生成对应的N个全景视频文件360Video#i(i=1..N)。如图9所示,视频源服务器采用基于长方形投影的非均匀编码方式生成6个全景视频文件360VideoERPTile#i(i=1..6),其中,每个全景视频文件具有预先确定的主要FOV描述信息,包括:主要FOV的观看方向:(方位角,仰俯角);主要FOV的视场角:(水平视场角,垂直视场角)。
如图9-(1)所示,全景视频文件360VideoERPTile#1预先确定的主要FOV是长方形投影面的瓦片#1(瓦片,Tile)。假定全局球面坐标系中水 平视角(0,360),垂直视角(-90,90),则全景视频文件360VideoERPTile#1预先确定的主要FOV的观看方向为(60,45),主要FOV的视场角为(120,90)。
同时,视频源服务器针对每个全景视频文件360Video#i生成若干个辅助FOV视频文件FOVVideo#i(θ,Ф)(i=1..N),存放在流媒体服务器。如图9所示,视频源服务器对应每个全景视频文件360VideoERPTile#i(i=1..6),生成4个辅助FOV视频文件FOVVideoERPTile#i(θ,Ф)(每个主要FOV与长方形投影面至多4个瓦片相邻,为每个相邻瓦片设置1个视角变动范围(θ,Ф)及其对应辅助FOV)。其中,每个辅助FOV视频文件具有预先确定的空间区域描述信息,包括:(最小方位角,最大方位角,最小仰俯角,最大仰俯角)。
如图9-(2)所示,针对全景视频文件360VideoERPTile#1主要FOV与相邻瓦片#2视角变动范围(θ,Ф),设置辅助FOV视频文件FOVVideoERPTile#1(θ,Ф)。假定全局球面坐标系中水平视角(0,360),垂直视角(-90,90),则辅助FOV视频文件FOVVideoERPTile#1(θ,Ф)预先确定的空间区域为(120,220,15,90)。
同时,视频源服务器编制对应的媒体描述文件,所述媒体描述文件中携带上述全景视频文件和辅助FOV视频文件的视角描述信息,以及全景视频文件和辅助FOV视频文件的对应关系。
步骤6:流媒体客户端返回360视频节目播放确认。
步骤7:基于360视频节目的配置或者用户选择,360视频播放器选择初始观看视角。
步骤8-步骤10:流媒体客户端根据组播组列表以及相应视角关系信息请求加入相应的组播组以接收对应于当前用户视角的全景视频文件360Video#i。如图9-(1)所示,本实施例中流媒体客户端请求加入组播组#1以接收全景视频文件360VideoERPTile#1。360视频播放器在接收到最小缓冲数据量后,开始播放全景视频文件360VideoERPTile#1。
步骤11-步骤14:在某时刻用户改变观看视角姿态,对于每一个检测到的视角改变度(θ,Ф),流媒体客户端判断视角变化(θ,Ф)是否超出全景视频文件360Video#i主要FOV所对应视野Viewport#i的第一阈值范围。
若是,则识别出对应的新的视角姿态位置为j。流媒体客户端根据组播组列表以及相应视角关系信息请求加入组播组#j以接收对应的全景视频文件360Video#j。360视频播放器在接收到可支持播放的最小缓冲数据量后,开始播放全景视频文件360Video#j;
若否,则判断视角变化(θ,Ф)是否超出全景视频文件360Video#i主要FOV所对应视野Viewport#i的第二阈值范围。若是,则流媒体客户端利用单播方式请求获取视角变化(θ,Ф)对应的辅助FOV视频文件FOVVideo#i(θ,Ф),360视频播放器在接收到可支持播放的最小缓冲数据量后,开始同时播放全景视频文件360Video#i以及辅助FOV视频文件FOVVideo#i(θ,Ф)。
如图9-(2)所示,本实施例中检测到视角姿态变化(θ,Ф),且Viewport#1第二阈值≤(θ,Ф)<Viewport#1第一阈值,流媒体客户端根据视角姿态变化(θ,Ф)以及辅助FOV视频文件FOVVideoERPTile#1(θ,Ф)空间区域信息,请求长方形投影中相邻瓦片#2的辅助FOV视频文件FOVVideoERPTile#1(θ,Ф)。360视频播放器在接收到最小缓冲数据量后,开始同时播放全景视频文件360VideoERPTile#1及其辅助FOVVideoERPTile#1(θ,Ф)。
步骤15-步骤18:如图9-(3)所示,某时刻检测到视角姿态变化(θ,Ф),且(θ,Ф)≥Viewport#1第一阈值,流媒体客户端根据组播组列表以及相应视角关系信息请求加入组播组#j以接收对应的全景视频文件360VideoERPTile#2。360视频播放器在接收到最小缓冲数据量后,开始播放全景视频文件360VideoCubeFace#2。
图10为本发明实施例的全景视频传输装置的结构组成示意图一,如 图10所示,所述装置包括:
第一获取单元1001,设置为向服务器请求获取第一全景视频文件;
第二获取单元1002,设置为当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第一全景视频文件的FOV类型,包括以下至少之一:
所述第一全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述第一全景视频文件中存在预先确定的主要FOV;
所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述第二获取单元1002,具体设置为:如果所述第一全景视频文件中存在预先确定的辅助FOV,且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第二获取单元1002,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV,且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全景视频文件。
本发明实施例中,所述第二获取单元1002,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
本发明实施例中,所述装置还包括:
第三获取单元1003,设置为向服务器请求获取媒体描述文件,所述媒体描述文件包括用户视角与视频文件的对应关系,其中,所述视频文件包 括全景视频文件,以及辅助FOV视频文件。
本发明实施例中,所述媒体描述文件中还包括全景视频文件与其辅助FOV视频文件的对应关系。
本发明实施例中,在所述第一全景视频文件中存在预先确定的辅助FOV的情况下,所述第二获取单元1002,具体设置为:当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,所述第二获取单元1002,具体设置为:当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
本发明实施例中,在所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV的情况下,所述第二获取单元1002,具体设置为:当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
本发明实施例中,请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
本领域技术人员应当理解,图10所示的全景视频传输装置中的各单元的实现功能可参照前述全景视频传输方法的相关描述而理解。图10所示的全景视频传输装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
基于图10所述的全景视频传输装置,本发明实施例还提供了一种终 端,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,所述处理器,设置为执行如下步骤:
向服务器请求获取第一全景视频文件;
当检测到用户视角发生变化时,根据所述第一全景视频文件的视窗FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
本领域技术人员应当理解,终端中的处理器还能够执行如图10所述的全景视频传输装置的全部功能。
图11为本发明实施例的全景视频传输装置的结构组成示意图二,如图11所示,所述装置包括:
发送单元1101,设置为向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本发明实施例中,所述全景视频文件的FOV类型,包括以下至少之一:
所述全景视频文件中不存在预先确定的FOV;
所述第一全景视频文件中存在预先确定的辅助FOV;
所述全景视频文件中存在预先确定的主要FOV;
所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
本发明实施例中,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
本领域技术人员应当理解,图11所示的全景视频传输装置中的各单元的实现功能可参照前述全景视频传输方法的相关描述而理解。图11所示的全景视频传输装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
基于图11所述的全景视频传输装置,本发明实施例还提供了一种服务器,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指 令被处理器执行时,所述处理器,设置为执行如下步骤:
向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
本领域技术人员应当理解,服务器中的处理器还能够执行如图11所述的全景视频传输装置的全部功能。
图12为本发明实施例的全景视频传输系统的结构组成示意图,如图12所示,所述系统包括终端1201、服务器1202;其中,
所述终端1201包括第一处理器以及存储有所述第一处理器可执行指令的第一存储器,当所述指令被第一处理器执行时,所述第一处理器,设置为执行如图1所示的方法步骤;
所述服务器1202包括第二处理器以及存储有所述第二处理器可执行指令的第二存储器,当所述指令被第二处理器执行时,所述第二处理器,设置为执行如图2所示的方法步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处 理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
工业实用性
本发明实施例的技术方案中,终端向服务器请求获取第一全景视频文件;当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。采用本发明实施例的技术方案,在用户观看全景视频切换视角时,保障了切换过程中画质的视觉体验,从而实现了在有限带宽的情况下,尽可能为用户提供更好的视频体验。

Claims (36)

  1. 一种全景视频传输方法,所述方法包括:
    向服务器请求获取第一全景视频文件;
    当检测到用户视角发生变化时,根据所述第一全景视频文件的视场角FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
  2. 根据权利要求1所述的全景视频传输方法,其中,所述第一全景视频文件的FOV类型,包括以下至少之一:
    所述第一全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述第一全景视频文件中存在预先确定的主要FOV;
    所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  3. 根据权利要求2所述的全景视频传输方法,其中,所述根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法,包括:
    如果所述第一全景视频文件中存在预先确定的辅助FOV,且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
  4. 根据权利要求2所述的全景视频传输方法,其中,所述根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法, 包括:
    如果所述第一全景视频文件中存在预先确定的主要FOV,且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全景视频文件。
  5. 根据权利要求2所述的全景视频传输方法,其中,所述根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的方法,包括:
    如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
  6. 根据权利要求1所述的全景视频传输方法,其中,所述方法还包括:
    向服务器请求获取媒体描述文件,所述媒体描述文件包括用户视角与视频文件的对应关系,其中,所述视频文件包括全景视频文件,以及辅助FOV视频文件。
  7. 根据权利要求6所述的全景视频传输方法,其中,所述媒体描述文件中还包括全景视频文件与其辅助FOV视频文件的对应关系。
  8. 根据权利要求6所述的全景视频传输方法,其中,所述向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件的方法,包括:
    当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;
    根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
  9. 根据权利要求6所述的全景视频传输方法,其中,所述向所述服务器请求获取第二全景视频文件的方法,包括:
    当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;
    根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
  10. 根据权利要求6所述的全景视频传输方法,其中,所述向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件的方法,包括:
    当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;
    根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
  11. 根据权利要求1至10任一项所述的全景视频传输方法,其中,所述方法还包括:
    请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
  12. 一种全景视频传输方法,所述方法包括:
    向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
  13. 根据权利要求12所述的全景视频传输方法,其中,所述全景视频文件的FOV类型,包括以下至少之一:
    所述全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述全景视频文件中存在预先确定的主要FOV;
    所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  14. 根据权利要求12所述的全景视频传输方法,其中,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
  15. 一种全景视频传输装置,所述装置包括:
    第一获取单元,设置为向服务器请求获取第一全景视频文件;
    第二获取单元,设置为当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
  16. 根据权利要求15所述的全景视频传输装置,其中,所述第一全景视频文件的FOV类型,包括以下至少之一:
    所述第一全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述第一全景视频文件中存在预先确定的主要FOV;
    所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  17. 根据权利要求16所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的辅助FOV,且所述用户视角变化量大于第一阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件。
  18. 根据权利要求16所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV,且所述用户视角变化量大于第二阈值,则向所述服务器请求获取所述第二全景视频文件。
  19. 根据权利要求16所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:如果所述第一全景视频文件中存在预先确定的主要FOV及其辅助FOV,且所述用户视角的变化量小于第二阈值且大于等于第三阈值,则向所述服务器请求获取所述第一全景视频文件的辅助FOV视频文件;否则,向所述服务器请求获取第二全景视频文件。
  20. 根据权利要求15所述的全景视频传输装置,其中,所述装置还包括:
    第三获取单元,设置为向服务器请求获取媒体描述文件,所述媒体描述文件包括用户视角与视频文件的对应关系,其中,所述视频文件包括全景视频文件,以及辅助FOV视频文件。
  21. 根据权利要求20所述的全景视频传输装置,其中,所述媒体描述文件中还包括全景视频文件与其辅助FOV视频文件的对应关 系。
  22. 根据权利要求20所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:当所述用户视角的变化量大于第一阈值,则确定当前所述用户视角为第一视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第一视角对应的所述第一全景视频文件的辅助FOV视频文件。
  23. 根据权利要求20所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:当所述用户视角的变化量大于等于第二阈值,则确定当前所述用户视角为第二视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第二视角对应的所述第二全景视频文件。
  24. 根据权利要求20所述的全景视频传输装置,其中,所述第二获取单元,具体设置为:当所述用户视角的变化量小于第二阈值且大于等于第三阈值,则确定当前所述用户视角为第三视角;根据所述用户视角与视频文件的对应关系,向所述服务器请求获取与所述第三视角对应的所述第一全景视频文件的辅助FOV视频文件。
  25. 根据权利要求15至24任一项所述的全景视频传输装置,其中,请求服务器获取所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件时,在所述请求中携带所述第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件的开始播放时间。
  26. 一种全景视频传输装置,其中,所述装置包括:
    发送单元,设置为向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
  27. 根据权利要求26所述的全景视频传输装置,其中,所述全 景视频文件的FOV类型,包括以下至少之一:
    所述全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述全景视频文件中存在预先确定的主要FOV;
    所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  28. 根据权利要求26所述的全景视频传输装置,其中,所述媒体描述文件中还包括所述全景视频文件与其辅助FOV视频文件的对应关系。
  29. 一种终端,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,所述处理器,设置为执行如下步骤:
    向服务器请求获取第一全景视频文件;
    当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件。
  30. 根据权利要求29所述的终端,其中,所述第一全景视频文件的FOV类型,包括以下至少之一:
    所述第一全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述第一全景视频文件中存在预先确定的主要FOV;
    所述第一全景视频文件中存在预先确定的主要FOV及其辅助 FOV。
  31. 一种服务器,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,所述处理器,设置为执行如下步骤:
    向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
  32. 根据权利要求31所述的服务器,其中,所述全景视频文件的FOV类型,包括以下至少之一:
    所述全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述全景视频文件中存在预先确定的主要FOV;
    所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  33. 一种全景视频传输系统,所述系统包括终端、服务器;其中,
    所述终端包括第一处理器以及存储有所述第一处理器可执行指令的第一存储器,当所述指令被第一处理器执行时,所述第一处理器,设置为执行如下步骤:向服务器请求获取第一全景视频文件;当检测到用户视角发生变化时,根据所述第一全景视频文件的FOV类型,向所述服务器请求获取第二全景视频文件或者所述第一全景视频文件的辅助FOV视频文件;
    所述服务器包括第二处理器以及存储有所述第二处理器可执行指令的第二存储器,当所述指令被第二处理器执行时,所述第二处理器,设置为执行如下步骤:向终端发送全景视频文件的媒体描述文件,所述媒体描述文件中包括所述全景视频文件的FOV类型。
  34. 根据权利要求33所述的全景视频传输系统,其中,所述全景视频文件的FOV类型,包括以下至少之一:
    所述全景视频文件中不存在预先确定的FOV;
    所述第一全景视频文件中存在预先确定的辅助FOV;
    所述全景视频文件中存在预先确定的主要FOV;
    所述全景视频文件中存在预先确定的主要FOV及其辅助FOV。
  35. 一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至11中任一项所述的方法。
  36. 一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至11任一项中所述的方法。
PCT/CN2017/115943 2016-12-13 2017-12-13 一种全景视频传输方法、装置、终端、服务器及系统 WO2018108104A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP17879726.2A EP3557845B1 (en) 2016-12-13 2017-12-13 Method and device for transmitting panoramic videos, terminal, server and system
US16/469,355 US20190387214A1 (en) 2016-12-13 2017-12-13 Method for transmitting panoramic videos, terminal and server
FIEP17879726.2T FI3557845T3 (fi) 2016-12-13 2017-12-13 Menetelmä ja laite panoraamavideoiden lähettämiseksi, päätelaite, palvelin sekä järjestelmä

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611149103.X 2016-12-13
CN201611149103.XA CN108616557B (zh) 2016-12-13 2016-12-13 一种全景视频传输方法、装置、终端、服务器及系统

Publications (1)

Publication Number Publication Date
WO2018108104A1 true WO2018108104A1 (zh) 2018-06-21

Family

ID=62559281

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/115943 WO2018108104A1 (zh) 2016-12-13 2017-12-13 一种全景视频传输方法、装置、终端、服务器及系统

Country Status (5)

Country Link
US (1) US20190387214A1 (zh)
EP (1) EP3557845B1 (zh)
CN (1) CN108616557B (zh)
FI (1) FI3557845T3 (zh)
WO (1) WO2018108104A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109348291A (zh) * 2018-11-16 2019-02-15 深圳市梦网百科信息技术有限公司 一种基于运动分析的全景视频码流分发方法和系统
WO2020024373A1 (zh) * 2018-08-02 2020-02-06 华为技术有限公司 传输媒体数据的方法、客户端和服务器
CN111131865A (zh) * 2018-10-30 2020-05-08 中国电信股份有限公司 提高vr视频播放流畅度的方法、装置、系统和机顶盒

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3573339A4 (en) * 2017-01-19 2020-08-05 Sony Interactive Entertainment Inc. IMAGE PROVIDING DEVICE
KR102374404B1 (ko) * 2017-07-25 2022-03-15 삼성전자주식회사 콘텐트를 제공하기 위한 디바이스 및 방법
CN110519652B (zh) * 2018-05-22 2021-05-18 华为软件技术有限公司 Vr视频播放方法、终端及服务器
CN109934764A (zh) * 2019-01-31 2019-06-25 北京奇艺世纪科技有限公司 全景视频文件的处理方法、装置、终端、服务器及存储介质
CN111818336B (zh) * 2019-04-12 2022-08-26 华为技术有限公司 视频处理方法、装置、存储介质以及通信装置
CN110999377A (zh) * 2019-11-22 2020-04-10 北京小米移动软件有限公司 资源切换方法、装置及存储介质
CN110913278B (zh) * 2019-12-06 2022-04-08 深圳创维新世界科技有限公司 视频播放方法、显示终端及存储介质
CN111263177A (zh) * 2020-01-22 2020-06-09 杭州皮克皮克科技有限公司 一种视频互动直播方法及系统
CN111405330A (zh) * 2020-03-26 2020-07-10 康佳集团股份有限公司 一种高清电视机的显示方法及高清电视机
CN112468806B (zh) * 2020-11-12 2022-07-26 中山大学 一种用于云vr平台的全景视频传输优化方法
CN112468873A (zh) * 2020-11-16 2021-03-09 北京达佳互联信息技术有限公司 画面显示方法、装置、系统、电子设备、服务器及介质
CN112437286B (zh) * 2020-11-23 2024-04-26 成都易瞳科技有限公司 一种全景原始画面视频分块传输方法
CN114449162B (zh) * 2021-12-22 2024-04-30 天翼云科技有限公司 一种播放全景视频的方法、装置、计算机设备及存储介质
CN114979089B (zh) * 2022-04-25 2023-03-24 北京邮电大学 一种实时传输全景视频的系统和方法
CN115002519A (zh) * 2022-05-31 2022-09-02 北京势也网络技术有限公司 一种在低带宽网络下播放8k全景视频文件的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130204977A1 (en) * 2012-01-25 2013-08-08 Tourwrist, Inc. Systems and Methods for Panoramic Video Streaming of Virtual Tours
CN105916060A (zh) * 2016-04-26 2016-08-31 乐视控股(北京)有限公司 数据传输的方法、装置及系统
CN105933343A (zh) * 2016-06-29 2016-09-07 深圳市优象计算技术有限公司 一种用于720度全景视频网络播放的码流缓存机制
CN105939482A (zh) * 2015-03-05 2016-09-14 诺基亚技术有限公司 视频流式传输方法
CN105988578A (zh) * 2015-03-04 2016-10-05 华为技术有限公司 一种交互式视频显示的方法、设备及系统
CN106101847A (zh) * 2016-07-12 2016-11-09 三星电子(中国)研发中心 全景视频交互传输的方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2824883A1 (en) * 2013-07-12 2015-01-14 Alcatel Lucent A video client and video server for panoramic video consumption
EP3562170A1 (en) * 2013-07-29 2019-10-30 Koninklijke KPN N.V. Providing tile video streams to a client
CN105828090A (zh) * 2016-03-22 2016-08-03 乐视网信息技术(北京)股份有限公司 全景直播方法及装置
CN106028115A (zh) * 2016-05-18 2016-10-12 乐视控股(北京)有限公司 视频播放方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130204977A1 (en) * 2012-01-25 2013-08-08 Tourwrist, Inc. Systems and Methods for Panoramic Video Streaming of Virtual Tours
CN105988578A (zh) * 2015-03-04 2016-10-05 华为技术有限公司 一种交互式视频显示的方法、设备及系统
CN105939482A (zh) * 2015-03-05 2016-09-14 诺基亚技术有限公司 视频流式传输方法
CN105916060A (zh) * 2016-04-26 2016-08-31 乐视控股(北京)有限公司 数据传输的方法、装置及系统
CN105933343A (zh) * 2016-06-29 2016-09-07 深圳市优象计算技术有限公司 一种用于720度全景视频网络播放的码流缓存机制
CN106101847A (zh) * 2016-07-12 2016-11-09 三星电子(中国)研发中心 全景视频交互传输的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZARE, ALIREZA ET AL.: "HEVC-compliant Viewport-adaptive Streaming of Stereoscopic Panoramic Video", PICTURE CODING SYMPOSIUM (PCS, 7 December 2016 (2016-12-07), XP033086909, ISSN: 2472-7822 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020024373A1 (zh) * 2018-08-02 2020-02-06 华为技术有限公司 传输媒体数据的方法、客户端和服务器
CN110798707A (zh) * 2018-08-02 2020-02-14 华为技术有限公司 传输媒体数据的方法、客户端和服务器
US11368729B2 (en) 2018-08-02 2022-06-21 Huawei Technologies Co., Ltd. Media data transmission method, client, and server
CN111131865A (zh) * 2018-10-30 2020-05-08 中国电信股份有限公司 提高vr视频播放流畅度的方法、装置、系统和机顶盒
CN109348291A (zh) * 2018-11-16 2019-02-15 深圳市梦网百科信息技术有限公司 一种基于运动分析的全景视频码流分发方法和系统

Also Published As

Publication number Publication date
FI3557845T3 (fi) 2023-08-23
EP3557845A4 (en) 2020-06-17
EP3557845B1 (en) 2023-05-24
US20190387214A1 (en) 2019-12-19
EP3557845A1 (en) 2019-10-23
CN108616557A (zh) 2018-10-02
CN108616557B (zh) 2022-01-25

Similar Documents

Publication Publication Date Title
WO2018108104A1 (zh) 一种全景视频传输方法、装置、终端、服务器及系统
CN108156484B (zh) 利用自适应速率分配优先处理基于图块的虚拟现实视频流
EP3459252B1 (en) Method and apparatus for spatial enhanced adaptive bitrate live streaming for 360 degree video playback
KR102611448B1 (ko) 콘텐트를 전달 및/또는 콘텐트를 재생하기 위한 방법들 및 장치
US10049495B2 (en) System and method for providing virtual reality content
CN107888987B (zh) 一种全景视频播放方法及装置
WO2019202207A1 (en) Processing video patches for three-dimensional content
US10306212B2 (en) Methods and systems for capturing a plurality of three-dimensional sub-frames for use in forming a volumetric frame of a real-world scene
WO2019096064A1 (zh) 数据传输方法和装置、存储介质及电子装置
US11539983B2 (en) Virtual reality video transmission method, client device and server
JP2019524004A (ja) 仮想現実メディアコンテンツのストリーミングを向上させる方法、デバイス及びコンピュータプログラム
US10547879B2 (en) Method and apparatus for streaming video content
US20160330408A1 (en) Method for progressive generation, storage and delivery of synthesized view transitions in multiple viewpoints interactive fruition environments
US10493360B2 (en) Image display device and image display system
US10289193B2 (en) Use of virtual-reality systems to provide an immersive on-demand content experience
US20180035172A1 (en) Method and apparatus for streaming video content
CN112511849A (zh) 一种游戏显示方法、装置、设备、系统及存储介质
CN110710203B (zh) 用于生成和渲染沉浸式视频内容的方法、系统和介质
CN110798707B (zh) 传输媒体数据的方法、客户端和服务器
CN108810567A (zh) 一种音频与视频视角匹配的方法、客户端和服务器
EP3635958B1 (en) Image processing device and system
JP2023549657A (ja) 複数の視点から撮像された立体レンダリング画像データを表示するための3dビデオ会議システムおよび方法
WO2021256326A1 (ja) サーバ装置、端末装置、情報処理システム及び情報処理方法
KR20200080041A (ko) 모바일 단말을 이용한 다채널 영상 생성 방법 및 장치
JP2017182706A (ja) サーバ装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17879726

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017879726

Country of ref document: EP

Effective date: 20190715