CN107087212B - 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 - Google Patents
基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 Download PDFInfo
- Publication number
- CN107087212B CN107087212B CN201710322335.9A CN201710322335A CN107087212B CN 107087212 B CN107087212 B CN 107087212B CN 201710322335 A CN201710322335 A CN 201710322335A CN 107087212 B CN107087212 B CN 107087212B
- Authority
- CN
- China
- Prior art keywords
- user
- video data
- layer video
- spatial
- spatial layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 abstract description 3
- 230000000007 visual effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/34—Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440227—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440263—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于空间可伸缩编码的交互式全景视频转码与播放方法及系统,其将原始视频分成多个分辨率不同的空间层视频数据,再将每层数据按tile形式划分,根据用户的操作指令将ROI投影到各层视频上,基于视频缩放系数最趋近于1的原则,选择最合适的空间层视频数据以及对应的Tile,进行转码重写,其他未选定的数据则以skip数据流填充以减少带宽,保证兼容性。本发明能够根据不同的带宽环境,给用户播放最适合播放窗口分辨率的视频数据,具有空间可伸缩、空间分辨率自适应匹配等特点,能够使用户更好的享受交互视频的自然场景或虚拟场景的三维沉浸视觉感受、无缝式视点切换与灵活的人机交互特性。
Description
技术领域
本发明属于交互式全景视频转码与播放技术领域,具体涉及一种基于空间可伸缩编码的交互式全景视频转码与播放方法及系统。
背景技术
交互式全景视频是兴起的一种新型媒体,它在传统的二维视频的基础上,增加了视觉的现实感和逼真感,它允许用户自由的选择视点与视角以获得其所感兴趣的视频内容。交互性是这种媒体的重要特征。
2001年,国际音视频标准组织MPEG成立研究组,对三维音视频3DAV技术展开探索性研究,ITU-T的视频编码专家组VCEG与MPEG成立的联合视频专家组JVT也对3DAV编码标准的进行研究与制定。3DAV的主要研究目标是拓展现有标准视频所具有的功能,向用户提供:(1)交互性,在一个场景中允许用户自主地选择场景视点;(2)沉浸感,提供给用户具有深度感和临境感的视频服务。
对于全景视频,通常使用360度全景浏览器在显示器上显示,需通过鼠标控制视口进行360度观看,某时刻观察到的图像仅是全景图像的一部分。而对于整个全景视频播放系统而言,服务器需要将每帧全景视频数据发送给播放终端,因此浪费大量的传输带宽和计算资源。
针对这一问题,国际国内许多研究机构与企业提出了改进方法。长春理工大学的权巍等人提出了一种基于CAVE的交互式全景视频显示方法,其使用五个虚拟相机对该全景视频映射球面的四面及顶面进行拍摄,并将所得五幅图像分别投影到CAVE系统中各投影幕中;美国北卡罗来纳大学的Srihari Pratapa等人提出了一种针对视频显示图像进行纹理压缩的方法;韩国电信研究院的Seong Yong Lim等人提出了一种基于Tile分块显示的基于MPEG-DASH协议的全景视频传输系统;挪威奥斯陆大学的Vamsidhar Reddy Gaddam等人也提出了一种针对全景视频的Tile划分方法。以上这些改进方法,基本思想均是将全景视频划分为固定数据量的多块数据,只传输用户观看的部分,能够部分缓解传输带宽占用的压力,但是未考虑接收播放终端的计算能力、网络状态的动态变化以及用户互动操作pan/tilt/zoom(平移/旋转/缩放)等指令的特点,因此实际使用效果还有待改进。
发明内容
本发明针对交互式全景视频数据量大、收播放终端的计算能力多样化、网络带宽动态变化以及用户互动操作pan/tilt/zoom等指令的特点,提出了一种基于空间可伸缩编码的交互式全景视频转码与播放方法及系统,能够在降低传输带宽的同时,针对播放终端、网络状态和用户互动操作指令提供合适的视频数据,大大增强播放终端的用户体验。
一种基于空间可伸缩编码的交互式全景视频转码与播放方法,包括如下步骤:
(1)通过源地址获取超高清的原始全景视频,通过高斯金字塔对原始全景视频进行空间下采样,得到多组不同分辨率的空间层视频数据;
(2)将所述空间层视频数据划分成多个Tile,每个Tile大小为N×N,N=2n且n为大于0的自然数;
(3)根据用户的pan/tilt/zoom操作指令确定ROI(感兴趣区域)的位置,该ROI即为用户当前观看的视频窗口;
(4)选取最适合用户播放器终端分辨率的一组空间层视频数据,并将ROI投影到该空间层视频数据上;
(5)将该空间层视频数据上ROI所覆盖占用的Tile转码重写成标准码流,其余Tile以Skip数据流填充并采用Skip模式进行编码,进而将得到的视频码流传输给用户播放器终端,由终端对其解码后进行播放显示。
所述步骤(1)中通过高斯金字塔对原始全景视频进行空间下采样,得到的多组空间层视频数据的分辨率从上往下依次减小,即利用高斯核与上一层视频数据Gi的卷积和移除Gi中的偶数行和偶数列,从而得到当前空间层视频数据Gi+1,依此得到多组不同分辨率的空间层视频数据。
优选地,所述步骤(3)中采用卡尔曼滤波算法预测用户的pan/tilt/zoom操作指令,即用户播放器终端根据信号与噪声的状态空间模型,利用前一时刻pan/tilt/zoom操作指令的估计值和当前时刻pan/tilt/zoom操作指令的观测值来更新对pan/tilt/zoom操作指令的估计,求出当前时刻pan/tilt/zoom操作指令的估计值,从而确定ROI的位置,并将预测得到的ROI位置信息实时地反馈给转码分发服务器,以减少交互延时。
所述步骤(4)中根据用户播放器终端的分辨率以及各空间层视频数据的分辨率,基于视频缩放系数最趋近于1的原则,即空间层视频数据分辨率与用户播放器终端分辨率最接近的原则,从而选取最适合用户播放器终端分辨率的一组空间层视频数据。
一种基于空间可伸缩编码的交互式全景视频转码与播放系统,包括用户播放器终端以及转码分发服务器;所述用户播放器终端用于向转码分发服务器提供全景视频的源地址、终端的本地配置信息以及ROI(即用户当前观看的视频窗口)的位置信息,所述转码分发服务器包括:
空间采样单元,用于通过源地址获取超高清的原始全景视频,通过高斯金字塔对原始全景视频进行空间下采样,得到多组不同分辨率的空间层视频数据;
数据划分单元,用于将所述空间层视频数据划分成多个Tile,每个Tile大小为N×N,N=2n且n为大于0的自然数;
匹配投影单元,用于选取最适合用户播放器终端分辨率的一组空间层视频数据,并将ROI投影到该空间层视频数据上;
编码单元,用于将该空间层视频数据上ROI所覆盖占用的Tile转码重写成标准码流,其余Tile以Skip数据流填充并采用Skip模式进行编码;
通信传输单元,用于将编码单元生成的视频码流传输给用户播放器终端;
所述用户播放器终端对接收到的视频码流解码后进行播放显示。
所述空间采样单元通过高斯金字塔对原始全景视频进行空间下采样,得到的多组空间层视频数据的分辨率从上往下依次减小,即利用高斯核与上一层视频数据Gi的卷积和移除Gi中的偶数行和偶数列,从而得到当前空间层视频数据Gi+1,依此得到多组不同分辨率的空间层视频数据。
优选地,所述用户播放器终端采用卡尔曼滤波算法预测用户的pan/tilt/zoom操作指令,即用户播放器终端根据信号与噪声的状态空间模型,利用前一时刻pan/tilt/zoom操作指令的估计值和当前时刻pan/tilt/zoom操作指令的观测值来更新对pan/tilt/zoom操作指令的估计,求出当前时刻pan/tilt/zoom操作指令的估计值,从而确定ROI的位置,并将预测得到的ROI位置信息实时地反馈给转码分发服务器,以减少交互延时。
所述匹配投影单元根据用户播放器终端的分辨率以及各空间层视频数据的分辨率,基于视频缩放系数最趋近于1的原则,即空间层视频数据分辨率与用户播放器终端分辨率最接近的原则,从而选取最适合用户播放器终端分辨率的一组空间层视频数据。
本发明将原始视频分成多个分辨率不同的空间层视频数据,再将每层数据按tile形式划分,根据用户的操作指令将ROI投影到各层视频上,通过对比用户播放器终端的视频窗口分辨率及所选空间层视频分辨率,基于视频缩放系数最趋近于1的原则,转码分发服务器选择最合适的空间层视频数据以及对应的Tile,进行转码重写,其他未选定的数据则以skip数据流填充以减少带宽,保证兼容性;同时,用户播放器终端采用kalman滤波方式预测用户的操作指令,从而预测ROI的位置以减少交互延时。
故本发明能够根据不同的带宽环境,给用户播放最适合播放窗口分辨率的视频数据,具有空间可伸缩、空间分辨率自适应匹配等特点,能够使用户更好的享受交互视频的自然场景或虚拟场景的三维沉浸视觉感受、无缝式视点切换与灵活的人机交互特性。
附图说明
图1为本发明系统的结构示意图。
图2为高斯金字塔下采样的示意图。
图3为本发明方法的流程示意图。
图4为空间下采样的示意图。
图5为感兴趣区域的投影示意图。
图6为空间层视频数据的选择示意图。
图7为Skip数据流的填充示意图。
图8为感兴趣区域的预测示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,本发明基于空间可伸缩编码的交互式全景视频转码与播放系统包括用户播放器终端与转码分发服务器。用户播放器终端用于提供交互视频的源地址以及作为用户的操作界面,为转码分发服务器提供本地屏幕分辨率等配置信息。布置于云端的转码分发服务器用于接收用户播放器终端传过来的pan/tilt/zoom操作指令,并根据操作指令在各层视频上投影的ROI作出pan/tilt/zoom指令反馈,本发明的总体实施流程如图3所示。
如图4所示,转码分发服务器将超高清原始视频按金字塔方式进行空间下采样,对超高清原始视频序列进行抽样,获得M个分辨率不同的空间层视频数据,这些空间层视频数据的分辨率依次由大到小排列,然后将每层数据按Tile形式划分,每个Tile的大小均为N×N,N为2的指数倍,每个空间层视频数据的Tile数因各层的分辨率不同而有所差异,通过采用空间下采样的方案可以实现空间可伸缩性。
如图5所示,用户播放器终端将pan/tilt/zoom操作指令传到转码分发服务器,转码分发服务器将用户感兴趣区域ROI,即当前观看的视频窗口,投影到各层视频上。
如图6所示,转码分发服务器根据用户播放器终端的视频窗口分辨率及所选空间层视频分辨率,基于视频缩放系数最趋近于1的原则,即空间层视频的分辨率与用户播放器终端的视频窗口分辨率最接近的原则,选择最合适的空间层视频数据,以及对应的Tile。
如图7所示,转码分发服务器提取选定的空间层视频Tile数据,转码重写成标准码流,使其他未选定的Tile数据均以skip数据流填充,采用skip跳跃式编码模式,可以节省码流,保证兼容性,减少带宽。
用户播放器终端接收到转码分发服务器重写后的视频流后,解码并提取ROI视频数据进行缩放显示,用户可根据喜好对播放的视频进行pan(平移)或是tilt(旋转)或是zoom(缩放)的操作,从而获取更好的观看视点。
如图8所示,用户播放器终端采用kalman滤波方式预测用户pan/tilt/zoom操作,用户播放器终端根据信号与噪声的状态空间模型,利用前一时刻对用户操作指令的估计值和现时刻对用户操作指令的观测值来更新对用户操作指令的估计,求出现时刻的估计值,从而预测用户感兴趣区域ROI的位置,并将预测与实际位置实时地反馈给转码分发服务器,以减少交互延时。
如图2所示,转码分发服务器对原始视频进行空间采样时,所采用的是高斯金字塔下采样。图像的分辨率从上往下依次减小,通过利用高斯核与Gi层的卷积和移走每个偶数行和列产生Gi+1层,如此可生成M层,即M个分辨率不同的空间层视频数据。
本发明将原始视频分成M个分辨率不同的空间层视频数据,再将每层数据按tile形式划分,根据用户的操作指令将ROI投影到各层视频上,通过对比用户播放器终端的视频窗口分辨率及所选空间层视频分辨率,基于视频缩放系数最趋近于1的原则,转码分发服务器选择最合适的空间层视频数据以及对应的Tile,进行转码重写,其他未选定的数据则以skip数据流填充以减少带宽,保证兼容性;同时,用户播放器终端采用kalman滤波方式预测用户的操作指令,从而预测ROI的位置以减少交互延时。
因此,本发明能够根据不同的带宽环境,给用户播放最适合播放窗口分辨率的视频数据,具有空间可伸缩、空间分辨率自适应匹配等特点,大大提升了交互式全景视频播放的用户体验。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
Claims (2)
1.一种基于空间可伸缩编码的交互式全景视频转码与播放方法,包括如下步骤:
(1)通过源地址获取超高清的原始全景视频,通过高斯金字塔对原始全景视频进行空间下采样,得到多组不同分辨率的空间层视频数据;这些空间层视频数据的分辨率从上往下依次减小,即利用高斯核与上一层视频数据Gi的卷积和移除Gi中的偶数行和偶数列,从而得到当前空间层视频数据Gi+1,依此得到多组不同分辨率的空间层视频数据;
(2)将所述空间层视频数据划分成多个Tile,每个Tile大小为N×N,N=2n且n为大于0的自然数;
(3)根据用户的pan/tilt/zoom操作指令确定ROI的位置,该ROI即为用户当前观看的视频窗口;具体地,采用卡尔曼滤波算法预测用户的pan/tilt/zoom操作指令,即用户播放器终端根据信号与噪声的状态空间模型,利用前一时刻pan/tilt/zoom操作指令的估计值和当前时刻pan/tilt/zoom操作指令的观测值来更新对pan/tilt/zoom操作指令的估计,求出当前时刻pan/tilt/zoom操作指令的估计值,从而确定ROI的位置,并将预测得到的ROI位置信息实时地反馈给转码分发服务器,以减少交互延时;
(4)根据用户播放器终端的分辨率以及各空间层视频数据的分辨率,基于视频缩放系数最趋近于1的原则即空间层视频数据分辨率与用户播放器终端分辨率最接近的原则,从而选取最适合用户播放器终端分辨率的一组空间层视频数据,并将ROI投影到该空间层视频数据上;
(5)将该空间层视频数据上ROI所覆盖占用的Tile转码重写成标准码流,其余Tile以Skip数据流填充并采用Skip模式进行编码,进而将得到的视频码流传输给用户播放器终端,由终端对其解码后进行播放显示。
2.一种基于空间可伸缩编码的交互式全景视频转码与播放系统,其特征在于:包括用户播放器终端以及转码分发服务器;所述用户播放器终端用于向转码分发服务器提供全景视频的源地址、终端的本地配置信息以及ROI的位置信息,该ROI即为用户当前观看的视频窗口;所述转码分发服务器包括:
空间采样单元,用于通过源地址获取超高清的原始全景视频,通过高斯金字塔对原始全景视频进行空间下采样,得到多组不同分辨率的空间层视频数据;
数据划分单元,用于将所述空间层视频数据划分成多个Tile,每个Tile大小为N×N,N=2n且n为大于0的自然数;
匹配投影单元,用于选取最适合用户播放器终端分辨率的一组空间层视频数据,并将ROI投影到该空间层视频数据上;
编码单元,用于将该空间层视频数据上ROI所覆盖占用的Tile转码重写成标准码流,其余Tile以Skip数据流填充并采用Skip模式进行编码;
通信传输单元,用于将编码单元生成的视频码流传输给用户播放器终端;
所述用户播放器终端对接收到的视频码流解码后进行播放显示;
所述空间采样单元通过高斯金字塔对原始全景视频进行空间下采样,得到的多组空间层视频数据的分辨率从上往下依次减小,即利用高斯核与上一层视频数据Gi的卷积和移除Gi中的偶数行和偶数列,从而得到当前空间层视频数据Gi+1,依此得到多组不同分辨率的空间层视频数据;
所述用户播放器终端采用卡尔曼滤波算法预测用户的pan/tilt/zoom操作指令,即用户播放器终端根据信号与噪声的状态空间模型,利用前一时刻pan/tilt/zoom操作指令的估计值和当前时刻pan/tilt/zoom操作指令的观测值来更新对pan/tilt/zoom操作指令的估计,求出当前时刻pan/tilt/zoom操作指令的估计值,从而确定ROI的位置,并将预测得到的ROI位置信息实时地反馈给转码分发服务器,以减少交互延时;
所述匹配投影单元根据用户播放器终端的分辨率以及各空间层视频数据的分辨率,基于视频缩放系数最趋近于1的原则,即空间层视频数据分辨率与用户播放器终端分辨率最接近的原则,从而选取最适合用户播放器终端分辨率的一组空间层视频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710322335.9A CN107087212B (zh) | 2017-05-09 | 2017-05-09 | 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710322335.9A CN107087212B (zh) | 2017-05-09 | 2017-05-09 | 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107087212A CN107087212A (zh) | 2017-08-22 |
CN107087212B true CN107087212B (zh) | 2019-10-29 |
Family
ID=59612750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710322335.9A Active CN107087212B (zh) | 2017-05-09 | 2017-05-09 | 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107087212B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180189980A1 (en) * | 2017-01-03 | 2018-07-05 | Black Sails Technology Inc. | Method and System for Providing Virtual Reality (VR) Video Transcoding and Broadcasting |
CN110351492B (zh) * | 2018-04-06 | 2021-11-19 | 中兴通讯股份有限公司 | 一种视频数据处理方法、装置及介质 |
US10284753B1 (en) * | 2018-07-03 | 2019-05-07 | Sony Corporation | Virtual reality media content generation in multi-layer structure based on depth of field |
CN109525842B (zh) * | 2018-10-30 | 2022-08-12 | 深圳威尔视觉科技有限公司 | 基于位置的多Tile排列编码方法、装置、设备和解码方法 |
CN111263191B (zh) * | 2018-11-30 | 2023-06-27 | 中兴通讯股份有限公司 | 视频数据的处理方法、装置、相关设备及存储介质 |
CN109672897B (zh) * | 2018-12-26 | 2021-03-16 | 北京数码视讯软件技术发展有限公司 | 全景视频编码方法及装置 |
CN111277911B (zh) * | 2020-01-10 | 2021-10-15 | 聚好看科技股份有限公司 | 一种全景视频的图像处理方法、显示设备及服务器 |
CN113453046B (zh) * | 2020-03-24 | 2022-07-12 | 腾讯科技(深圳)有限公司 | 沉浸式媒体提供方法、获取方法、装置、设备及存储介质 |
CN111586414B (zh) * | 2020-04-07 | 2022-04-15 | 南京师范大学 | 一种基于svc和dash的360°视频流调度方法 |
CN114598853A (zh) * | 2020-11-20 | 2022-06-07 | 中国移动通信有限公司研究院 | 视频数据的处理方法、装置及网络侧设备 |
JP2022184517A (ja) * | 2021-06-01 | 2022-12-13 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム、記憶媒体、および撮像システム |
CN113905256B (zh) * | 2021-12-10 | 2022-04-12 | 北京拙河科技有限公司 | 支持交互式观看的视频数据处理方法、设备及系统 |
CN115580738B (zh) * | 2022-02-23 | 2023-09-19 | 北京拙河科技有限公司 | 一种按需传输的高分辨率视频展现方法、设备和系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1319383C (zh) * | 2005-04-07 | 2007-05-30 | 西安交通大学 | 高性能空域可伸缩的运动估计与运动矢量编码实现方法 |
CN102084653B (zh) * | 2007-06-29 | 2013-05-08 | 弗劳恩霍夫应用研究促进协会 | 支持像素值细化可缩放性的可缩放视频编码 |
CN101252687B (zh) * | 2008-03-20 | 2010-06-02 | 上海交通大学 | 实现多通道联合的感兴趣区域视频编码及传输的方法 |
CN103546754B (zh) * | 2012-07-16 | 2016-09-14 | 中国科学院声学研究所 | 从h.264/avc到svc空间可分级的转码方法及系统 |
CN102790905B (zh) * | 2012-08-03 | 2016-08-17 | 重庆大学 | 基于P2PVoD视频点播系统的H.264/SVC到H.264/AVC的转码方法 |
CN103489178A (zh) * | 2013-08-12 | 2014-01-01 | 中国科学院电子学研究所 | 一种图像配准方法和系统 |
CN103995684B (zh) * | 2014-05-07 | 2017-01-25 | 广州瀚阳工程咨询有限公司 | 超高分辨率平台下的海量影像并行处理显示方法及系统 |
US9877031B2 (en) * | 2015-04-29 | 2018-01-23 | Pitney Bowes Inc. | System and method for multi-resolution raster data processing |
CN106097251B (zh) * | 2016-06-22 | 2019-03-19 | 深圳信息职业技术学院 | 非均匀稀疏采样视频超分辨率方法 |
-
2017
- 2017-05-09 CN CN201710322335.9A patent/CN107087212B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107087212A (zh) | 2017-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107087212B (zh) | 基于空间可伸缩编码的交互式全景视频转码与播放方法及系统 | |
US11458393B2 (en) | Apparatus and method of generating a representation of a virtual environment | |
US11325037B2 (en) | Apparatus and method of mapping a virtual environment | |
El-Ganainy et al. | Streaming virtual reality content | |
US20200118342A1 (en) | Methods and apparatuses for dynamic navigable 360 degree environments | |
US11563793B2 (en) | Video data processing method and apparatus | |
CN107615338B (zh) | 用于生成和使用降低分辨率图像并且/或者将这样的图像传送到重放或内容分发设备的方法和装置 | |
Shi et al. | Using graphics rendering contexts to enhance the real-time video coding for mobile cloud gaming | |
Yuan et al. | Spatial and temporal consistency-aware dynamic adaptive streaming for 360-degree videos | |
CN109891906A (zh) | 视图感知360度视频流化 | |
JP2014522600A (ja) | 分解能トレードオフおよび最適化を実装するビデオ圧縮 | |
KR102640664B1 (ko) | Vr 디바이스 및 vr 디바이스 제어 방법 | |
KR102067694B1 (ko) | 파노라마 픽처 처리 | |
CN106713895A (zh) | 处理内容的方法和设备 | |
Inoue et al. | Interactive panoramic video streaming system over restricted bandwidth network | |
Rossi et al. | Navigation-aware adaptive streaming strategies for omnidirectional video | |
CN113243112B (zh) | 流式传输体积视频和非体积视频 | |
CN108965847A (zh) | 一种全景视频数据的处理方法及装置 | |
KR101034966B1 (ko) | 3차원 그래픽을 2차원 비디오로 인코딩하는 방법과 그래픽-비디오 인코더 | |
EP3223524A1 (en) | Method, apparatus and stream of formatting an immersive video for legacy and immersive rendering devices | |
CN107211081A (zh) | 基于独立编码的背景更新的视频传输 | |
CN113438495A (zh) | Vr直播方法、装置、系统、设备及存储介质 | |
CN108040260B (zh) | C/s架构下高清全景视频的观看方法、系统及服务器 | |
JP2022521701A (ja) | 画像信号を生成する装置および方法 | |
JP4809025B2 (ja) | 3次元グラフィクスから2次元ビデオへのエンコーディングのための方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |