CN111587577A - 用于针对虚拟现实应用程序发送信号通知子图片组合信息的系统和方法 - Google Patents
用于针对虚拟现实应用程序发送信号通知子图片组合信息的系统和方法 Download PDFInfo
- Publication number
- CN111587577A CN111587577A CN201980008115.6A CN201980008115A CN111587577A CN 111587577 A CN111587577 A CN 111587577A CN 201980008115 A CN201980008115 A CN 201980008115A CN 111587577 A CN111587577 A CN 111587577A
- Authority
- CN
- China
- Prior art keywords
- track
- picture
- video
- sub
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/332—Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
- H04N13/344—Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/349—Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
Abstract
本发明公开了一种发送信号通知并且解析与全向视频相关联的信息的方法。“轨道组标识符”中的两位指示对应于所述轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者:仅左视图;仅右视图;或者左视图和右视图两者。(参见第[0052]段中的“定义”)。
Description
技术领域
本公开涉及交互式视频分发领域,并且更具体地涉及用于在虚拟现实应用程序中发送信号通知子图片组合信息的技术。
背景技术
数字媒体回放功能可以结合到各种设备中,这些设备包括:数字电视(包括所谓的“智能”电视)、机顶盒、膝上型电脑或台式电脑、平板电脑、数字录音设备、数字媒体播放器、视频游戏设备、蜂窝电话(包括所谓的“智能”电话)、专用视频流设备等。数字媒体内容(例如,视频和音频编程)可以源自多个源,包括例如无线电视提供方、卫星电视提供方、有线电视提供方、在线媒体服务提供方(包括所谓的流媒体服务提供方)等。数字媒体内容可以通过分组交换网络递送,包括双向网络(诸如互联网协议(IP)网络)和单向网络(诸如数字广播网络)。
可以根据视频编码标准来对包括在数字媒体内容中的数字视频进行编码。视频编码标准可以结合视频压缩技术。视频编码标准的示例包括ISO/IEC MPEG-4Visual和ITU-TH.264(也被称为ISO/IEC MPEG-4AVC)和高效率视频编码(HEVC)。视频压缩技术能够减少存储和传输视频数据的数据需求。视频压缩技术可通过利用视频序列中固有的冗余来减少数据需求。视频压缩技术可将视频序列再分成连续较小的部分(即,视频序列内的帧组、帧组内的帧、帧内的片段、片段内的编码树单元(例如,宏块)、编码树单元内的编码块等)。可以使用预测编码技术来生成待编码的单位视频数据与参考单位视频数据之间的差值。该差值可以被称为残差数据。残差数据可以被编码为量化变换系数。语法元素可以涉及残差数据和参考编码单元。残差数据和语法元素可以包括在兼容比特流中。可以根据数据结构来格式化兼容比特流和相关联的元数据。可以根据传输标准将兼容比特流和相关联的元数据从源传输到接收器设备(例如,数字电视或智能电话)。传输标准的示例包括数字视频广播(DVB)标准、综合业务数字广播标准(ISDB)标准和由高级电视系统委员会(ATSC)开发的标准,包括例如ATSC 2.0标准。ATSC目前正在开发所谓的ATSC 3.0标准系列。
发明内容
在一个示例中,发送信号通知与全向视频相关联的信息的方法包括发送信号通知轨道组标识符,其中发送信号通知轨道组标识符包括发送信号通知指示对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的值:仅左视图;仅右视图;或者左视图和右视图。
在一个示例中,确定与全向视频相关联的信息的方法包括解析与全向视频相关联的轨道组标识符,并且确定对应于轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者:仅左视图;仅右视图;或者基于轨道组标识符的值的左视图和右视图。
附图说明
图1是示出根据本公开的一种或多种技术的可以被配置为传输编码视频数据的系统的示例的框图。
图2A是示出根据本公开的一种或多种技术的编码视频数据和对应数据结构的概念图。
图2B是示出根据本公开的一种或多种技术的编码视频数据和对应数据结构的概念图。
图3是示出根据本公开的一种或多种技术的编码视频数据和对应数据结构的概念图。
图4是示出根据本公开的一种或多种技术的坐标系的示例的概念图。
图5A是示出根据本公开的一种或多种技术的在球体上指定区域的示例的概念图。
图5B是示出根据本公开的一种或多种技术的在球体上指定区域的示例的概念图。
图6是示出根据本公开的一种或多种技术的投影图片区域和封装图片区域的示例的概念图。
图7是示出根据本公开的一种或多种技术的可以包括在可以被配置为传输编码视频数据的系统的具体实施中的部件的示例的概念图。
图8是示出可实现本公开的一种或多种技术的数据封装器的示例的框图。
图9是示出可实现本公开的一种或多种技术的接收器设备的示例的框图。
具体实施方式
一般来讲,本公开描述了用于发送信号通知与虚拟现实应用程序相关联的信息的各种技术。具体地讲,本公开描述了用于发送信号通知子图片信息的技术。应当指出的是,尽管在一些示例中,相对于传输标准描述了本公开的技术,但本文所述的技术可以是普遍适用的。例如,本文所述的技术通常适用于DVB标准、ISDB标准、ATSC标准、数字地面多媒体广播(DTMB)标准、数字多媒体广播(DMB)标准、混合广播和宽带电视(HbbTV)标准、万维网联盟(W3C)标准和通用即插即用(UPnP)标准中的任一者。此外,还应当指出的是,尽管本公开的技术相对于ITU-T H.264和ITU-T H.265进行描述,但是本公开的技术通常适用于视频编码,包括全向视频编码。例如,本文所述的编码技术可结合到视频编码系统(包括基于未来视频编码标准的视频编码系统)中,这些技术包括块结构、帧内预测技术、帧间预测技术、变换技术、滤波技术和/或熵编码技术,不同于ITU-T H.265中包括的那些技术。因此,对ITU-TH.264和ITU-T H.265的参考用于描述性目的,并且不应被解释为限制本文所述技术的范围。此外,应当指出的是,将文献以引用方式并入本文不应被解释为限制或产生关于本文所用术语的歧义。例如,在并入的参考文献中提供的对某个术语的定义不同于另一个并入的参考文献和/或如本文中使用的该术语的情况下,则该术语应以广泛地包括每个相应定义的方式和/或以包括替代方案中的特定定义中的每个特定定义的方式来解释。
在一个示例中,一种设备包括被配置为发送信号通知轨道组标识符的一个或多个处理器,其中发送信号通知轨道组标识符包括发送信号通知指示对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的值:仅左视图;仅右视图;或者左视图和右视图。
在一个示例中,一种非暂态计算机可读存储介质包括存储在其上的指令,这些指令在被执行时使得设备的一个或多个处理器发送信号通知轨道组标识符,其中发送信号通知轨道组标识符包括发送信号通知指示对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的值:仅左视图;仅右视图;或者左视图和右视图。
在一个示例中,一种装置包括用于发送信号通知轨道组标识符的装置件,其中发送信号通知轨道组标识符包括发送信号通知指示对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的值:仅左视图;仅右视图;或者左视图和右视图。
在一个示例中,一种设备包括一个或多个处理器,该一个或多个处理器被配置为解析与全向视频相关联的轨道组标识符,并且确定对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者:仅左视图;仅右视图;或者基于轨道组标识符的值的左视图和右视图。
在一个示例中,一种非暂态计算机可读存储介质包括存储在其上的指令,这些指令在被执行时使得设备的一个或多个处理器解析与全向视频相关联的轨道组标识符,并且确定对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者:仅左视图;仅右视图;或者基于轨道组标识符的值的左视图和右视图。
在一个示例中,一种装置包括用于解析与全向视频相关联的轨道组标识符的装置件,以及用于确定对应于该轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的装置件:仅左视图;仅右视图;或者基于轨道组标识符的值的左视图和右视图。
在以下附图和描述中阐述了一个或多个示例的细节。其他特征、目的和优点将从描述和附图以及权利要求书中显而易见。
视频内容通常包括由一系列帧组成的视频序列。一系列帧也可以被称为一组图片(GOP)。每个视频帧或图片可以包括一个或多个片段,其中片段包括多个视频块。视频块可以被定义为可以被预测性地编码的像素值(也被称为样本)的最大阵列。视频块可以根据扫描模式(例如,光栅扫描)来排序。视频编码器对视频块及其子分区执行预测编码。ITU-TH.264指定了包括16×16亮度样本的宏块。ITU-T H.265指定了类似的编码树单元(CTU)结构,其中图片可以被分割成相同尺寸的CTU,并且每个CTU可以包括具有16×16、32×32或64×64亮度样本的编码树块(CTB)。如本文所用,术语“视频块”通常可以指图片的区域,或者可以更具体地指可以被预测性地编码的像素值的最大阵列、其子分区和/或对应结构。此外,根据ITU-T H.265,每个视频帧或图片可以被划分为包括一个或多个图块,其中图块是与图片的矩形区域相对应的编码树单元序列。
在ITU-T H.265中,可以根据对应的四叉树块结构将CTU的CTB划分为编码块(CB)。根据ITU-T H.265,一个亮度CB连同两个对应的色度CB和相关联的语法元素被称为编码单元(CU)。CU与针对CU定义一个或多个预测单元(PU)的预测单元(PU)结构相关联,其中PU与对应的参考样本相关联。也就是说,在ITU-T H.265中,使用帧内预测或帧间预测来对图片区域进行编码的决定是在CU级别进行的,并且针对CU,可以使用对应于帧内预测或帧间预测的一个或多个预测来生成针对CU的CB的参考样本。在ITU-T H.265中,PU可以包括亮度和色度预测块(PB),其中方形PB被支持用于帧内预测,并且矩形PB被支持用于帧间预测。帧内预测数据(例如,帧内预测模式语法元素)或帧间预测数据(例如,运动数据语法元素)可将PU与对应的参考样本相关联。残差数据可以包括对应于视频数据的每个分量(例如,亮度(Y)和色度(Cb和Cr))的相应差值阵列。残差数据可能在像素域中。可对像素差值应用变换诸如离散余弦变换(DCT)、离散正弦变换(DST)、整数变换、小波变换或概念上类似的变换,以生成变换系数。应当指出的是,在ITU-T H.265中,CU可进一步再分为变换单元(TU)。也就是说,为了生成变换系数,可以对像素差值的阵列进行再分(例如,可以将四个8×8变换应用于对应于16×16亮度CB的16×16残差值阵列),此类子分区可以被称为变换块(TB)。可以根据量化参数(QP)来量化变换系数。可以根据熵编码技术(例如,内容自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)、概率区间划分熵编码(PIPE)等)对量化的变换系数(可以被称为位阶值)进行熵编码。此外,也可对语法元素(诸如,指示预测模式的语法元素)进行熵编码。熵编码的量化变换系数和对应的熵编码语法元素可形成可用于再现视频数据的兼容比特流。可以对语法元素执行二值化处理,将其作为熵编码处理的一部分。二值化是指将语法值转换为一个或多个比特的序列的过程。这些比特可以被称为“二进制位”。
虚拟现实(VR)应用程序可以包括可利用头戴式显示器渲染的视频内容,其中仅渲染与用户头部的取向相对应的球形视频的区域。VR应用程序可通过全向视频启用,该全向视频也被称为360°视频中的360°球形视频。全向视频通常由多个相机捕获,这些相机覆盖高达360°的场景。与普通视频相比,全向视频的显著特征在于,通常仅显示整个捕获视频区域的子集,即,显示与当前用户的视场(FOV)相对应的区域。FOV有时也被称为视区。在其他情况下,视区可以被描述为球形视频中当前被显示并由用户查看的部分。应当指出的是,视区的尺寸可小于或等于视场。此外,应当指出的是,可使用单视场相机或立体相机捕获全向视频。单视场相机可以包括捕获对象的单个视图的相机。立体相机可以包括捕获同一对象的多个视图(例如,使用两个镜头在略微不同的角度下捕获视图)的相机。此外,应当指出的是,在一些情况下,可使用超广角镜头(即,所谓的鱼眼镜头)捕获用于全向视频应用程序中的图像。在任何情况下,通常可将用于创建360°球形视频的过程描述为将输入图像拼接在一起并将拼接在一起的输入图像投影到三维结构(例如,球体或立方体)上,这可得到所谓的投影帧。此外,在一些情况下,可以对投影帧的区域进行变换、尺寸调整和重新定位,这可以得到所谓的封装帧。
传输系统可以被配置为将全向视频传输到一个或多个计算设备。计算设备和/或传输系统可基于包括一个或多个抽象层的模型,其中每个抽象层的数据根据特定结构表示,例如,分组结构、调制方案等。包括已定义的抽象层的模型的示例是所谓的开放系统互连(OSI)模型。OSI模型定义了7层堆栈模型,包括应用程序层、呈现层、会话层、传输层、网络层、数据链路层和物理层。应当指出的是,相对于描述堆栈模型中的层,术语“上”和“下”的使用可基于作为最上层的应用程序层和作为最下层的物理层。此外,在一些情况下,术语“层1”或“L1”可用于指物理层,术语“层2”或“L2”可用于指链路层,并且术语“层3”或“L3”或“IP层”可用于指网络层。
物理层通常可指电信号形成数字数据的层。例如,物理层可指定义调制的射频(RF)符号如何形成数字数据帧的层。数据链路层(也可以被称为链路层)可指在发送侧的物理层处理之前以及在接收侧的物理层接收之后使用的抽象层。如本文所用,链路层可指用于在发送侧处将数据从网络层传输到物理层并且用于在接收侧处将数据从物理层传输到网络层的抽象层。应当指出的是,发送侧和接收侧是逻辑角色,并且单个设备可以在一个实例中作为发送侧操作并且在另一个实例中作为接收侧操作。链路层可将封装在特定分组类型(例如,运动图像专家组-传输流(MPEG-TS)分组、互联网协议第4版(IPv4)分组等)中的各种类型的数据(例如,视频、音频或应用程序文件)抽象为单个通用格式,以供物理层处理。网络层通常可指发生逻辑寻址的层。也就是说,网络层通常可以提供寻址信息(例如,互联网协议(IP)地址),使得数据分组可以被递送到网络内的特定节点(例如,计算设备)。如本文所用,术语“网络层”可指链路层上方的层和/或结构中具有数据使得可以接收该数据以用于链路层处理的层。传输层、会话层、呈现层和应用程序层中的每一者均可以定义如何递送数据以供用户应用程序使用。
ISO/IEC FDIS 23090-12:201x(E);“Information technology-Codedrepresentation of immersive media(MPEG-I)-Part 2:Omnidirectional mediaformat”,ISO/IEC JTC 1/SC 29/WG 11,2017年12月11日(以引用方式并入本文并且在本文中被称为MPEG-I)定义了启用全向媒体应用程序的媒体应用程序格式。MPEG-I指定了用于全向视频的坐标系;可用于将球形视频序列或图像分别转换成二维矩形视频序列或图像的投影和矩形区域式封装方法;使用ISO基础媒体文件格式(ISOBMFF)存储全向媒体和相关联的元数据;媒体流传输系统中的全向媒体的封装、发送信号通知和流传输;以及媒体配置文件和呈现配置文件。应当指出的是,为了简洁起见,本文未提供对MPEG-I的完整描述。然而,参考了MPEG-I的相关部分。
MPEG-I提供了其中根据ITU-T H.265对视频进行编码的媒体配置文件。ITU-TH.265在2016年12月的ITU-T H.265建议书的高效率视频编码(HEVC)中有所描述,该文献以引用方式并入本文,并且在本文中被称为ITU-T H.265。如上所述,根据ITU-T H.265,每个视频帧或图片可以被划分为包括一个或多个片段,并且进一步被划分为包括一个或多个图块。图2A至2B是示出包括片段并将图片进一步划分为图块的一组图片的示例的概念图。在图2A所示的示例中,图片4被示出为包括两个片段(即,片段1和片段2),其中每个片段包括CTU序列(例如,以光栅扫描顺序排列)。在图2B所示的示例中,图片4被示出为包括六个图块(即,图块1至图块6),其中每个图块是矩形的并且包括CTU序列。应当指出的是,在ITU-TH.265中,图块可以由包含在不止一个片段中的编码树单元组成,并且片段可以由包含在不止一个图块中的编码树单元组成。然而,ITU-T H.265规定了应满足以下一个或两个条件:(1)片段中的所有编码树单元属于同一个图块;以及(2)图块中的所有编码树单元属于同一个片段。
360°球形视频可以包括区域。参考图3所示的示例,360°球形视频包括区域A至C,并且如图3所示,图块(即,图块1至图块6)可形成全向视频的区域。在图3所示的示例中,这些区域中的每个区域被示出为包括CTU。如上所述,CTU可形成编码视频数据的片段和/或视频数据的图块。此外,如上所述,视频编码技术可以根据视频块、其子分区和/或对应的结构对图片的区域进行编码,并且应当指出的是,视频编码技术使得视频编码参数能够在视频编码结构的各种水平上进行调整,例如,针对片段、图块、视频块和/或在子分区进行调整。在一个示例中,图3中所示的360°视频可表示体育赛事,其中区域A和区域C包括体育场的观众席的视图,区域B包括比赛场地的视图(例如,视频由放置在50码线处的360°相机捕获)。
如上所述,视区可以是球形视频中当前被显示并由用户查看的部分。因此,可以根据用户的视区选择性地递送全向视频的区域,即,可以在全向视频流中启用视区相关的递送。通常,为了启用视区相关的递送,在编码之前将源内容分割成子图片序列,其中每个子图片序列覆盖全向视频内容的空间区域的子集,然后将子图片序列彼此独立地编码为单层比特流。例如,参考图3,区域A、区域B和区域C中的每一者或其部分可对应于独立编码的子图片比特流。每个子图片比特流可以被封装在文件中作为其自身的轨道,并且可以基于视区信息选择性地将轨道递送到接收器设备。应当指出的是,在一些情况下,子图片可能重叠。例如,参考图3,图块1、图块2、图块4和图块5可形成子图片,并且图块2、图块3、图块5和图块6可形成子图片。因此,特定样本可以被包括在多个子图片中。MPEG-I提供了组合对准的样本包括轨道中的与另一个轨道相关联的样本中的一个样本的情况,该样本具有与该另一个轨道中的特定样本相同的组合时间,或者提供了当在该另一个轨道中具有相同的组合时间的样本不可用时,该样本具有相对于该另一个轨道中的特定样本的组合时间最近的先前组合时间。此外,MPEG-I提供了组成图片包括对应于一个视图的空间帧封装立体图片的一部分的情况,或者当不使用帧封装或使用时间交织帧封装布置时,提供图片本身。
如上所述,MPEG-I指定了用于全向视频的坐标系。在MPEG-I中,坐标系由单位球体和三个坐标轴组成,即X(从后往前)轴、Y(侧向,从左往右)轴和Z(竖直,从下往上)轴,其中三个轴交于球体的中心。球体上的点的位置由一对球体坐标方位角和仰角(θ)识别。图4示出了球体坐标方位角和仰角(θ)与如在MPEG-I中指定的X、Y和Z坐标轴的关系。应当指出的是,在MPEG-I中,方位角的值范围是-180.0°(包括端值)至180.0°(不包括端值),并且仰角的值范围是-90.0°至90.0°(包括端值)。MPEG-I指定了球体上的区域可由四个大圆来指定的情况,其中大圆(也被称为黎曼圆)是球体与穿过该球体的中心点的平面的交点,其中球体的中心和大圆的中心是协同定位的。MPEG-I还描述了球体上的区域可由两个方位角圆和两个仰角圆指定的情况,其中方位角圆是球体上的连接具有相同方位角值的所有点的圆,并且仰角圆是球体上的连接具有相同仰角值的所有点的圆。
如上所述,MPEG-I指定了如何利用国际标准化组织(ISO)基础媒体文件格式(ISOBMFF)存储全向媒体和相关联元数据。MPEG-I指定了支持元数据的文件格式的情况,该元数据指定由投影帧覆盖的球形表面的区域。具体地讲,MPEG-I包括球体区域结构,该球体区域结构指定具有以下定义、语法和语义的球体区域:
定义
球体区域结构(SphereRegionStruct)指定球体区域。
当center_tilt等于0时,由该结构指定的球体区域如下导出:
-如果azimuth_range和elevation_range两者均等于0,则由该结构指定的球体区域是球形表面上的点。
-否则,使用如下导出的变量centreAzimuth、centreElevation、cAzimuth1、cAzimuth、cElevationl和cElevation2定义球体区域:
centreAzimuth=centre_azimuth÷65536
centreElevation=centre_elevation÷65536
cAzimuth1=(centre_azimuth-azimuth_range÷2)÷65536
cAzimuth2=(centre_azimuth+azimuth_range÷2)+65536
cElevation1=(centre_elevation-elevation_range÷2)÷65536
cElevation2=(centre_elevation+elevation_range÷2)÷65536
参考包含SphereRegionStruct的该实例的结构的语义中指定的形状类型值来如下定义球体区域:
-当形状类型值等于0时,球体区域由四个大圆和中心点指定,这四个大圆由四个点cAzimuth1、cAzimuth2、cElevation1、cElevation2定义,并且该中心点由centreAzimuth和centreElevation定义,并且如图5A所示。
-当形状类型值等于1时,球体区域由两个方位角圆和两个仰角圆以及中心点指定,这两个方位角圆和两个高度圆由四个点cAzimuth1、cAzimuth2、cElevation1、cElevation2定义,并且该中心点由centreAzimuth和centreElevation定义,并且如图5B所示。
当centre_tilt不等于0时,首先如上导出球体区域,并且然后沿源自球体原点的穿过球体区域的中心点的轴线应用倾斜旋转,其中当从原点向轴线的正方向观察时,角度值顺时针增大。最终球体区域是在应用倾斜旋转之后的那一个球体区域。
形状类型值等于0指定由四个大圆指定球形区域,如图5A所示。
形状类型值等于1指定由两个方位角圆和两个高度角指定球形区域,如图5B所示。
保留大于1的形状类型值。
语法
语义
centre_azimuth和centre_elevation指定球体区域的中心。centre_azimuth的范围应在-180*216至180*216-1(包括端值)之间。centre_elevation的范围应在-90*216至90*216(包括端值)之间。
centre_tilt指定球体区域的倾斜角度。centre_tilt的范围应在-180*216至180*216-1(包括端值)之间。
azimuth_range和elevation_range(当存在时)分别指定由该结构指定的球体区域的以2-16°为单位的方位角和仰角范围。azimuth_range和levation_range指定通过球体区域的中心点的范围,如图5A或图5B所示。当azimuth_range和height_range不存在于SphereRegionStruct的该实例中时,则按照包含SphereRegionStruct的该实例的结构的语义中所指定的那样推断它们。azimuth_range的范围应在0至360*216(包括端值)之间。elevation_range的范围应在0至180*216(包括端值)之间。
interpolate的语义由包含SphereRegionStruct的该实例的结构的语义指定。
应当指出的是,关于本文所用的公式,可使用以下算术运算符:
+ 加法
- 减法(作为双参数运算符)或负数(作为一元前缀运算符)
* 乘法,包括矩阵乘法
xy 求幂。将x指定为y的幂。在其他上下文中,此类符号用于上标而非旨在用于解释为求幂。
/ 将结果向着零截断的整数除法。例如,将7/4和-7/-4截断为1,并且将-7/4和7/-4截断为-1。
÷ 在不旨在进行截断或舍入情况下用于表示数学公式中的除法。
x/y 在不旨在进行截断或舍入情况下用于表示数学公式中的除法。
x%y 模量。x除以y的余数,仅针对x≥0且y>0的整数x和y定义。
应当指出的是,关于本文所用的公式,可使用以下逻辑运算符:
x&&y x和y的布尔逻辑“和”
x||y x和y的布尔逻辑“或”
! 布尔逻辑“否”
x?y:z 如果x为TRUE或不等于0,则求值为y;否则,求值为z。
应当指出的是,关于本文所用的公式,可使用以下关系运算符:
> 大于
≥ 大于或等于
< 小于
≤ 小于或等于
== 等于
!= 不等于
应当指出的是,在本文所用的语法中,无符号整数(n)是指具有n位的无符号整数。此外,位(n)是指具有n个位的位值。
此外,MPEG-I指定了内容覆盖范围包括一个或多个球体区域的情况。MPEG-I包括具有以下定义、语法和语义的内容覆盖范围结构:
定义
该结构中的字段提供内容覆盖范围,该内容覆盖范围由该内容所覆盖的一个或多个球体区域相对于全局坐标轴来表示。
语法
语义
coverage_shape_type指定表达内容覆盖范围的球体区域的形状。coverage_shape_type具有与在描述样本条目的子句(下文提供)中指定的shape_type相同的语义当将描述球体区域的子句(上文提供)应用于ContentCoverageStruct的语义时,coverage_shape_type的值用作形状类型值。
num_region指定球体区域的数量。保留值0。
view_idc_presence_flag等于0指定不存在view_idc[i]。view_idc_presence_flag等于1指定存在view_idc[i]并且指示球体区域与特定(左、右或两者)视图的关联。
default_view_idc等于0指示每个球体区域是单视场的,等于1指示每个球体区域在立体内容的左视图上,等于2指示每个球体区域在立体内容的右视图上,等于3指示每个球体区域在左视图和右视图两者上。
view_idc[i]等于1指示第i个球体区域在立体内容的左视图上,等于2指示第i个球体区域在立体内容的右视图上,并且等于3指示第i个球体区域在左视图和右视图两者上。保留等于0的view_idc[i]。
注释:view_idc_presence_flag等于1使能够指示非对称立体覆盖范围。例如;非对称立体覆盖范围的一个示例可通过将num_regions设置为等于2来描述,从而指示一个球体区域位于覆盖-90°至90°(包括端值)的方位角范围的左视图上,并且指示另一个球体区域位于覆盖-60至60°(包括端值)的方位角范围的右视图上。
当SphereRegionStruct(1)包括在ContentCoverageStruct()中时,应用描述球体区域的子句(上文提供)并且interpolate应等于0。
内容覆盖范围由num_regions SphereRegionStruct(1)结构的并集指定。当num_regions大于1时,内容覆盖范围可以是非连续的。
MPEG-I包括具有以下定义、语法和语义的样本条目结构:
定义
样本条目中应只存在一个SphereRegionConfigBox。SphereRegionConfigBox指定由样本指定的球体区域的形状。当样本中的球体区域的方位角和仰角范围不变时,可以在样本条目中指示该方位角和仰角范围。
语法
语义
shape_type等于0指定球体区域由四个大圆指定。shape_type等于1指定球体区域由两个方位角圆和两个仰角圆指定。保留大于1的shape_type值。当将描述球体区域的子句(上文提供)应用于球体区域元数据轨道的样本的语义时,shape_type的值用作形状类型值。
dynamic_range_flag等于0指定球体区域的方位角和仰角范围在参考该样本条目的所有样本中保持不变。dynamic_range_flag等于1指定以样本格式指示球体区域的方位角和仰角范围。
static_azimuth_range和static_elevation_range分别指定参考该样本条目的每个样本的以2-16°为单位的球体区域的方位角和仰角范围。static_azimuth_range和static_elevation_range指定通过球体区域的中心点的范围,如图5A或图5B所示。static_azimuth_range的范围应在0至360*216(包括端值)之间。static_elevation_range的范围应在0至180*216(包括端值)之间。当存在static_azimuth_range和static_elevation_range并且两者均等于0时,参考该样本条目的每个样本的球体区域是球形表面上的点。当存在static_azimuth_range和static_elevation_range时,当将描述球体区域的子句(上文提供)应用于球体区域元数据轨道的样本的语义时,推断azimuth_range和height_range的值分别等于static_azimuth_range和static_elevation_range。
num_regions指定参考该样本条目的样本中的球体区域的数量。num_regions应等于1。保留num_regions的其他值。
此外,MPEG-I包括具有以下定义和语法的覆盖范围信息盒:
定义
盒类型:“covi”
容器:ProjectedOmniVideoBox
强制性的:No
数量:零或一
该盒提供关于该轨道的内容覆盖范围的信息。
注释:当渲染全向视频内容时,完全由OMAF(Omnidirectional MediA Format)播放器处理未被该内容覆盖的区域。
指定内容覆盖范围的球体区域内的每个球体位置应在解码图片中具有对应的样本。然而,可能存在确实在解码图片中具有对应样本但在内容覆盖范围之外的一些球体位置。
语法
aligned(8)class CoverageInformationBox extends FullBox(′covi′,0,0){
ContentCoverageStruct0
}
如上所述,MPEG-I指定了可用于将球形视频序列转换成二维矩形视频序列的投影和矩形区域式封装方法。这样,MPEG-I指定了具有以下定义、语法和语义的区域式封装结构:
定义
RegionWisePackingStruct指定封装区域与相应投影区域之间的映射,并且指定保护带(如果有的话)的位置和尺寸。
注释:在其他信息中,RegionWisePackingStruct还在2D笛卡尔图片域中提供内容覆盖范围信息。
根据该语法结构的容器,该子句的语义中的解码图片是以下中的任一者:
-针对视频,解码图片是由视频轨道的样本所得的解码输出。
-针对图像项,解码图片是该图像项的重构图像。
下文翔实地汇总了RegionWisePackingStruct的内容,而规范语义随后跟随在该子句中:
-投影图片的宽度和高度分别用proj_picture_width和proj_picture_height明确地发送信号通知。
-封装图片的宽度和高度分别用packed_picture_width和packed_picture_height明确地发送信号通知。
-当投影图片是立体的并且具有上下帧封装布置或并排帧封装布置时,constituent_picture_matching_flag等于1指定
○该语法结构中的投影区域信息、封装区域信息和保护带区域信息单独地应用于每个组成图片,
○封装图片和投影图片具有相同的立体帧封装格式,并且
○投影区域和封装区域的数量是语法结构中num_regions的值所指示的数量的两倍。
-RegionWisePackingStruct包含循环,其中循环条目对应于两个组成图片中的相应投影区域和封装区域(当components_picture_matching_flag等于1时),或者对应于投影区域和相应封装区域(当constitutional_picture_matching_flag等于0时),并且循环条目包含以下项:
○指示封装区域的保护带的存在的标记,
○封装类型(然而,在MPEG-I中仅指定矩形区域式封装),
○矩形区域封装结构RectRegionPacking(i)中的投影区域与相应封装区域之间的映射,
○当存在保护带时,用于封装区域的保护带结构GuardBand(i)。
下文翔实地汇总了矩形区域封装结构RectRegionPacking(i)的内容,而规范语义随后跟随在该子句中:
-proj_reg_width[i]、proj_reg_height[i]、proj_reg_top[i]和proj_reg_left[i]分别指定第i个投影区域的宽度、高度、顶部偏移和左侧偏移。
-transform_type[i]指定应用于第i个封装区域以将其重新映射到第i个投影区域的旋转和镜像(如果有的话)。
-packed_reg_width[i]、packed_reg_height[i]、packed_reg_top[i]和packed_reg_left[i]分别指定第i个封装区域的宽度、高度、顶部偏移和左侧偏移。
下文翔实地汇总了保护带结构GuardBand(i)的内容,而规范语义随后跟随在该子句中:
-left_gb_width[i]、right_gb_width[i]、top_gb_height[i]或bottom_gb_height[i]分别指定第i个封装区域的左侧、右侧、上方或下方的保护带尺寸。
-gb_not_used_for_pred_flag[i]指示编码是否以保护带在帧间预测过程中不用作参考的方式受到约束。
-gb_type[i][j]指定第i个封装区域的保护带的类型。
图6示出了投影图片内(在左侧上)的投影区域的位置和尺寸以及具有保护带的封装图片内(在右侧上)的封装区域的位置和尺寸的示例。当composition_picture_matching_flag的值等于0时,应用该示例。
语法
语义
Proj_reg_width[i]、proj_reg_height[i]、proj_reg_top[i]和proj_reg_left[i]分别指定在投影图片内(当constituent_picture_matching_flag等于0时)或在投影图片的组成图片内(当constituent_picture_matching_flag等于1时)第i个投影区域的宽度、高度、顶部偏移和左侧偏移。proj_reg_width[i]、proj_reg_height[i]、proj_reg_top[i]和proj_reg_left[i]以相对投影图片样本单位指示。
注释1:两个投影区域可部分地或完全地彼此重叠。当存在质量差异的指示(例如,通过区域式质量排名指示)时,则对于任何两个重叠投影区域的重叠区域,应当使用对应于被指示为具有较高质量的投影区域的封装区域进行渲染。
transform_type[i]指定应用于第i个封装区域以将其重新映射到第i个投影区域的旋转和镜像。当transform_type[i]指定旋转和镜像两者时,在镜像之前应用旋转以用于将封装区域的样本位置转换为投影区域的样本位置。指定了以下值:
0:无变换
1:水平镜像
2:旋转180°(逆时针)
3:在水平镜像之前旋转180°(逆时针)
4:在水平镜像之前旋转90°(逆时针)
5:旋转90°(逆时针)
6:在水平镜像之前旋转270°(逆时针)
7:旋转270°(逆时针)
注释2:MPEG-I指定了transform_type[i]的语义,用于将封装图片中封装区域的样本位置转换为投影图片中投影区域的样本位置。
packed_reg_width[i]、packed_reg_height[i]、packed_reg_top[i]和packed_reg_left[i]分别指定在封装图片内(当constituent_picture_matching_flag等于0时)或在封装图片的每个组成图片内(当constituent_picture_matching_flag等于1时)第i个封装区域的宽度、高度、偏移和左侧偏移。packed_reg_width[i]、packed_reg_height[i]、packed_reg_top[i]和packed_reg_left[i]以相对封装图片样本单位指示。packed_reg_width[j]、packed_reg_height[i]、packed reg top[i]和packed_reg_left[i]应表示解码图片内亮度样本单位的整数水平和垂直坐标。
注释3:两个封装区域可部分地或完全地彼此重叠。
应当指出的是,为了简洁起见,本文不提供矩形区域封装结构、保护带结构和区域式封装结构的完整语法和语义。此外,本文不提供区域式封装结构的语法元素的区域式封装变量和约束的完全推导。然而,参考了MPEG-I的相关部分。
如上所述,MPEG-I指定了媒体流传输系统中的全向媒体的封装、发送信号通知和流传输。具体地讲,MPEG-I指定了如何利用超文本传输协议(HTTP)上的动态自适应流传输(DASH)来封装、发送信号通知和流传输全向媒体。DASH在以下中有所描述:ISO/IEC:ISO/IEC 23009-1:2014,“Information technology-Dynamic adaptive streaming over HTTP(DASH)-Part 1:Media presentation description and segment formats”,国际标准化组织,第2版,5/15/2014(在下文中,“ISO/IEC 23009-1:2014”),其以引用方式并入本文。DASH媒体呈现可以包括数据分段、视频分段和音频分段。在一些示例中,DASH媒体呈现可对应于由服务提供方定义的给定持续时间的线性服务或线性服务的一部分(例如,单个TV节目或在一段时间内连续的线性TV节目集)。根据DASH,媒体呈现描述(MPD)是包括DASH客户端构造适当的HTTP-URL以访问分段并向用户提供流传输服务所需的元数据的文档。MPD文档片段可以包括可扩展标记语言(XML)编码的元数据片段集。MPD的内容提供了媒体呈现内分段的资源标识符和所识别资源的上下文。相对于ISO/IEC 23009-1:2014描述了MPD片段的数据结构和语义。此外,应当指出的是,目前正在提出ISO/IEC 23009-1的草案版本。因此,如本文所用,MPD可以包括如在ISO/IEC 23009-1:2014中描述的MPD、当前提出的MPD和/或它们的组合。在ISO/IEC 23009-1:2014中,如在MPD中描述的媒体呈现可以包括一个或多个周期的序列,其中每个周期可以包括一个或多个适应集。应当指出的是,在适应集包括多个媒体内容部件的情况下,可以单独描述每个媒体内容部件。每个适应集可以包括一个或多个表示。在ISO/IEC 23009-1:2014中,提供了每个表示:(1)作为单个分段,其中子分段在具有适应集的表示中对准;以及(2)作为一系列分段,其中每个分段可由模板生成的全球资源定位符(URL)寻址。每个媒体内容部件的属性可以由适应集元素和/或适应集内的元素描述,包括例如内容部件元素。
如上所述,MPEG-I提供了组合对准的样本包括轨道中的与另一个轨道相关联的样本中的一个样本的情况,该样本具有与该另一个轨道中的特定样本相同的组合时间,或者提供了当在该另一个轨道中具有相同的组合时间的样本不可用时,该样本具有相对于该另一个轨道中的特定样本的组合时间最近的先前组合时间。Hannuksela等人在2017年12月的ISO/IEC JTC1/SC29/WG11 MPEG2017/W17279“Technologies under consideration onsub-picture composition track grouping for OMAF”(中国澳门,以引用方式并入,并且在本文中被称为“Hannuksela”)中提出了组合图片,该组合图片是适合呈现的图片,并且通过如由子图片组合轨道组的语法元素所指定的那样在空间上布置它们来从子图片组合轨道组的所有轨道的组合对准的样本的解码输出获得。
相对于子图片组合轨道组,Hannuksela提供了具有以下定义、语法和语义的子图片组合轨道分组数据结构:
定义
track_group_type等于“spco”的TrackGroupTypeBox指示该轨道属于可以在空间上被布置用于获得组合图片的轨道的组合。映射到该分组的视觉轨道(即,在track_group_type等于“spco”的TrackGroupTypeBox内具有相同的track_group_id值的视觉轨道)共同表示可呈现的视觉内容。在没有其他视觉轨道的情况下可能或可能不旨在单独地呈现映射到该分组的每个单独的视觉轨道,而适合呈现组合图片。
注释1:内容作者可以使用TrackHeaderBox的track_not_intended_for_presentation_alone标记来指示在没有其他视觉轨道的情况下不旨在单独地呈现单独的视觉轨道。
注释2:当图块轨道集和相关联的图块基础轨道中携带有HEVC视频比特流并且该比特流表示由子图片组合轨道组指示的子图片时,仅图块基础轨道包含SubPictureCompositionBox。
如根据下文的语义所指定的,通过在空间上布置属于相同子图片组合轨道组和属于相同另选组的所有轨道的组合对准的样本的解码输出来导出组合图片。
语法
语义
track_x指定以亮度样本为单位的该轨道的样本的左上角在组合图片上的水平位置。track_x的值应在0至composition_width-1(包括端值)的范围内。
track_y指定以亮度样本为单位的该轨道的样本的左上角在组合图片上的垂直位置。track_y的值应在0至composition_height-1(包括端值)的范围内。
track_width指定以亮度样本为单位的该轨道的样本在组合图片上的宽度。track_width的值应在1至composition_width-1(包括端值)的范围内。
track_height指定以亮度样本为单位的该轨道的样本在组合图片上的高度。track_height的值应在1至composition_height-1(包括端值)的范围内。
composition_width指定以亮度样本为单位的组合图片的宽度。在具有相同的track_group_id值的SubPictureCompositionBox的所有实例中,composition_width的值应相同。
composition_height指定以亮度样本为单位的组合图片的高度。在具有相同的track_group_id值的SubPictureCompositionBox的所有实例中,composition_height的值应相同。
由track_x、track_y、track_width和track_height表示的矩形被称为该轨道的子图片矩形。
对于属于相同子图片组合轨道组和属于相同另选组(即,具有相同的非零alternate_group值)的所有轨道,子图片矩形的位置和尺寸应分别相同。
子图片组合轨道组的组合图片如下导出:
1)在属于子图片组合轨道组的所有轨道中,从每个另选组中选取一个轨道。
2)对于每个所选取的轨道,应用以下项:
a.对于在0至track_width-1(包括端值)的范围内的i的每个值以及对于在0至track_height-1(包括端值)的范围内的j的每个值,将在亮度样本位置((i+track_x)%composition_width,(j+track_y)%composition_height)处的组合图片的亮度样本设置为等于在亮度样本位置(i,j)处的该轨道的子图片的亮度样本。
b.当解码的图片具有除4:0:0的色度格式时,相应地导出色度分量。
属于相同子图片组合轨道组和属于不同另选组(即,具有alternate_group等于0或是不同的alter_group值)的所有轨道的子图片矩形不应重叠且不应有间隔,使得在组合图片的上述推导过程中,每个亮度样本位置(x,y)恰好遍历一次,其中x在0至composition_width-1(包括端值)的范围内,并且y在0至composition_height-1(包括端值)的范围内。
此外,相对于可如何将子图片组合轨道分组应用于全向视频,Hannuksela提供了以下项:
当映射到子图片组合轨道组的轨道中的任一个在包括在样本条目中的SchemeTypeBox中具有等于“resv”的样本条目类型和等于“podv”的scheme_type时,则应用本子句。
每个组合图片是封装图片,该封装图片具有由任何ProjectionFormatBox指示的投影格式,并且任选地具有由相同子图片组合轨道组的任何轨道的样本条目内的任何StereoVideoBox指示的帧封装布置,并且任选地具有由包括在相同子图片组合轨道组的任何SubPictureCompositionBox中的任何RegionWisePackingBox指示的区域式封装格式。
SubPictureCompositionBox中的SubPictureRegionBox的track_width和track_height应分别等于由解码器以亮度样本为单位输出的图片的宽度和高度。
将以下约束应用于映射到该分组的轨道:
-映射到该分组的每个轨道应具有等于“rev”的样本输入类型。scheme_type应等于包括在样本条目中的SchemeTypeBox中的“podv”。
-包括在映射到相同子图片组合轨道组的轨道的样本条目中的ProjectionFormatBox的所有实例的内容应相同。
-RegionWisePackingBox不应存在于映射到任何子图片组合轨道组的轨道的样本条目中。
-当RegionWisePackingBox存在于具有特定track_group_id值的SubPictureCompositionBox中时,其将存在于具有相同track_group_id值的SubPictureCompositionBox的所有实例中并且是相同的。
注释:可将区域式封装应用于子图片轨道中携带的立体全向视频,使得子图片是单视场(仅包含一个视图)或立体的(包含两个视图)。当来自左视图和右视图两者的封装区域被布置为形成矩形区域时,该矩形区域的边界可以是由左视图和右视图两者组成的立体子图片的边界。当来自仅左视图或仅右视图的封装区域被布置为形成矩形区域时,该矩形区域的边界可以是仅由左视图或仅由右视图组成的单视场子图片的边界。
-包括在映射到相同子图片组合轨道组的轨道的样本条目中的RotationBox的所有实例的内容应相同。
-包括在映射到相同子图片组合轨道组的轨道的样本条目中的Stereo VideoBox的所有实例的内容应相同。
-包括在映射到相同子图片组合轨道组的轨道中的SubPictureCompositionBox的所有实例中的CoverageInformationBox的所有实例的内容应相同。
将以下项应用于每个子图片组合轨道组:
-单视场投影亮度图片的宽度和高度(分别为ConstituentPicWidth和ConstituentPicHeight)如下导出:
○如果RegionWisePackingBox不存在于SubPictureCompositionBox中,则分别将ConstituentPicWidth和ConstituentPicHeight设置为等于composition_width/HorDiv1和composition_height/VerDiv1。
○否则,分别将ConstituentPicWidth和ConstituentPicHeight设置为等于proj_picture_width/HorDiv1和proj_picture_height/VerDiv1。
-如果RegionWisePackingBox不存在于SubPictureCompositionBox中,则将RegionWisePackingFlag设置为等于0。否则,将RegionWisePackingFlag设置为等于1。
-该子图片组合轨道组的每个组合图片的样本位置的语义在MPEG-I的子句7.3.1中指定。
Hannuksela提出的子图片区域盒可能不太理想。具体地讲,Hannuksela提出的SubPictureRegionBox可能相对于发送信号通知子图片组合轨道分组没有提供足够的灵活性。
图1是示出根据本公开的一种或多种技术的可以被配置为对视频数据进行编码(例如,编码和/或解码)的系统的示例的框图。系统100表示可以根据本公开的一种或多种技术封装视频数据的系统的示例。如图1所示,系统100包括源设备102、通信介质110和目标设备120。在图1所示的示例中,源设备102可以包括被配置为对视频数据进行编码并将编码的视频数据传输到通信介质110的任何设备。目标设备120可以包括被配置为经由通信介质110接收编码的视频数据并且对编码的视频数据进行解码的任何设备。源设备102和/或目标设备120可以包括配备用于进行有线和/或无线通信的计算设备,并且可以包括例如机顶盒、数字视频录像机、电视机、台式电脑、膝上型电脑或平板电脑、游戏控制台、医学成像设备和移动设备(包括例如智能电话、蜂窝电话、个人游戏设备)。
通信介质110可以包括无线和有线通信介质和/或存储设备的任意组合。通信介质110可以包括同轴电缆、光纤电缆、双绞线电缆、无线发射器和接收器、路由器、交换机、中继器、基站或可用于促进各种设备与站点之间的通信的任何其他设备。通信介质110可以包括一个或多个网络。例如,通信介质110可以包括被配置为允许访问万维网例如互联网的网络。网络可以根据一个或多个电信协议的组合来操作。电信协议可以包括专用方面并且/或者可以包括标准化电信协议。标准化电信协议的示例包括数字视频广播(DVB)标准、高级电视系统委员会(ATSC)标准、综合服务数字广播(ISDB)标准、有线数据业务接口规范(DOCSIS)标准、全球移动通信系统(GSM)标准、码分多址(CDMA)标准、第三代合作伙伴计划(3GPP)标准、欧洲电信标准协会(ETSI)标准、互联网协议(IP)标准、无线应用协议(WAP)标准以及电气与电子工程师协会(IEEE)标准。
存储设备可以包括能够存储数据的任何类型的设备或存储介质。存储介质可以包括有形或非暂态计算机可读介质。计算机可读介质可以包括光盘、闪存存储器、磁存储器或任何其他合适的数字存储介质。在一些示例中,存储器设备或其部分可以被描述为非易失性存储器,并且在其他示例中,存储器设备的部分可以被描述为易失性存储器。易失性存储器的示例可以包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)和静态随机存取存储器(SRAM)。非易失性存储器的示例可以包括磁性硬盘、光盘、软盘、闪存存储器或电可编程存储器(EPROM)或电可擦除和可编程(EEPROM)存储器的形式。存储设备可以包括存储卡(例如,安全数字(SD)存储卡)、内部/外部硬盘驱动器和/或内部/外部固态驱动器。数据可以根据定义的文件格式存储在存储设备上。
图7是示出可以包括在系统100的具体实施中的部件的示例的概念图。在图7所示的示例性具体实施中,系统100包括一个或多个计算设备402A至402N、电视服务网络404、电视服务提供方站点406、广域网408、局域网410和一个或多个内容提供方站点412A至412N。图7中所示的具体实施表示系统的示例,该系统可以被配置为允许将数字媒体内容(诸如,例如电影、现场体育赛事等)以及与其相关联的数据和应用程序与媒体呈现分发到多个计算设备(诸如计算设备402A至402N)并由这些多个计算设备访问。在图7所示的示例中,计算设备402A至402N可以包括被配置为从电视服务网络404、广域网408和/或局域网410中的一者或多者处接收数据的任何设备。例如,计算设备402A至402N可以被配备用于有线和/或无线通信,并且可以被配置为通过一个或多个数据信道接收服务,并且可以包括电视(包括所谓的智能电视)、机顶盒和数字视频录像机。此外,计算设备402A至402N可以包括台式电脑、膝上型电脑或平板电脑、游戏控制台、移动设备(包括例如“智能”电话、蜂窝电话和个人游戏设备)。
电视服务网络404是被配置为使能够分发可以包括电视服务的数字媒体内容的网络的示例。例如,电视服务网络404可以包括公共无线电视网络、公共或基于订阅的卫星电视服务提供方网络,以及公共或基于订阅的有线电视提供方网络和/或OTT提供方或互联网服务提供方。应当指出的是,尽管在一些示例中,电视服务网络404可主要用于使能够提供电视服务,但是电视服务网络404还可以使能够根据本文所述的电信协议的任何组合来提供其他类型的数据和服务。此外,应当指出的是,在一些示例中,电视服务网络404可启用电视服务提供方站点406与计算设备402A至402N中的一个或多个之间的双向通信。电视服务网络404可以包括无线和/或有线通信媒体的任何组合。电视服务网络404可以包括同轴电缆、光纤电缆、双绞线电缆、无线发射器和接收器、路由器、交换机、中继器、基站或可用于促进各种设备与站点之间的通信的任何其他设备。电视服务网络404可以根据一个或多个电信协议的组合来操作。电信协议可以包括专用方面并且/或者可以包括标准化电信协议。标准化电信协议的示例包括DVB标准、ATSC标准、ISDB标准、DTMB标准、DMB标准、有线数据服务接口规范(DOCSIS)标准、HbbTV标准、W3C标准和UPnP标准。
再次参考图7,电视服务提供方站点406可以被配置为经由电视服务网络404分发电视服务。例如,电视服务提供方站点406可以包括一个或多个广播站、有线电视提供方、或卫星电视提供方、或基于互联网的电视提供方。例如,电视服务提供方站点406可以被配置为通过卫星上行链路/下行链路接收包括电视节目的传输。此外,如图7所示,电视服务提供方站点406可与广域网408通信,并且可以被配置为从内容提供方站点412A至412N处接收数据。应当指出的是,在一些示例中,电视服务提供方站点406可以包括电视演播室,并且内容可源自该电视演播室。
广域网408可以包括基于分组的网络,并且根据一个或多个电信协议的组合来操作。电信协议可以包括专用方面并且/或者可以包括标准化电信协议。标准化电信协议的示例包括全球移动通信系统(GSM)标准、码分多址(CDMA)标准、第三代合作伙伴计划(3GPP)标准、欧洲电信标准协会(ETSI)标准、欧洲标准(EN)、IP标准、无线应用协议(WAP)标准、以及电气与电子工程师协会(IEEE)标准诸如一个或多个IEEE 802标准(例如,Wi-Fi)。广域网408可以包括无线和/或有线通信媒体的任何组合。广域网480可以包括同轴电缆、光纤电缆、双绞线电缆、以太网电缆、无线发射器和接收器、路由器、交换机、中继器、基站、或可用于促进各种设备与站点之间的通信的任何其他设备。在一个示例中,广域网408可以包括互联网。局域网410可以包括基于分组的网络,并且根据一个或多个电信协议的组合来操作。可基于访问级别和/或物理基础设施将局域网410与广域网408区分开。例如,局域网410可以包括安全家庭网络。
再次参考图7,内容提供方站点412A至412N表示可向电视服务提供方站点406和/或计算设备402A至402N提供多媒体内容的站点的示例。例如,内容提供方站点可以包括具有一个或多个演播室内容服务器的演播室,该演播室内容服务器被配置为向电视服务提供方站点406提供多媒体文件和/或流。在一个示例中,内容提供方站点412A至412N可以被配置为使用IP套件提供多媒体内容。例如,内容提供方站点可以被配置为根据实时流协议(RTSP)、HTTP等向接收器设备提供多媒体内容。此外,内容提供方站点412A至412N可以被配置为通过广域网408向接收器设备402A至402N和/或电视服务提供方站点406中的一个或多个提供包括基于超文本的内容等的数据。内容提供方站点412A至412N可以包括一个或多个web服务器。可以根据数据格式来定义由数据提供方站点412A至412N提供的数据。
再次参考图1,源设备102包括视频源104、视频编码器106、数据封装器107和接口108。视频源104可以包括被配置为捕获和/或存储视频数据的任何设备。例如,视频源104可以包括摄像机和可操作地与其耦接的存储设备。视频编码器106可以包括被配置为接收视频数据并生成表示视频数据的兼容比特流的任何设备。兼容比特流可指视频解码器可以从其接收和再现视频数据的比特流。兼容比特流的各方面可以根据视频编码标准来定义。当生成兼容比特流时,视频编码器106可压缩视频数据。压缩可能是有损的(观察者可觉察的或不可觉察的)或无损的。
再次参考图1,数据封装器107可接收编码的视频数据,并根据定义的数据结构生成兼容比特流,例如,NAL单元序列。接收兼容比特流的设备可以从其再现视频数据。应当指出的是,可使用术语符合性比特流来代替术语兼容比特流。应当指出的是,数据封装器107不需要必须位于与视频编码器106相同的物理设备中。例如,被描述为由视频编码器106和数据封装器107执行的功能可分布在图7所示的设备中。
在一个示例中,数据封装器107可以包括被配置为接收一个或多个媒体部件并基于DASH生成媒体呈现的数据封装器。图8是示出可实现本公开的一种或多种技术的数据封装器的示例的框图。数据封装器500可以被配置为根据本文所述的技术生成媒体呈现。在图8所示的示例中,部件封装器500的功能块对应于用于生成媒体呈现(例如,DASH媒体呈现)的功能块。如图8所示,部件封装器500包括媒体呈现描述生成器502、分段生成器504和系统存储器506。媒体呈现描述生成器502、分段生成器504和系统存储器506中的每一者可互连(物理地、通信地和/或可操作地)以用于部件间的通信,并且可以被实现为各种合适电路中的任一者,诸如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或它们的任何组合。应当指出的是,尽管数据封装器500被示为具有不同的功能块,但是此类图示是出于描述的目的,并且不会将数据封装器500限制到特定的硬件构架。可以使用硬件、固件和/或软件具体实施的任何组合来实现数据封装器500的功能。
媒体呈现描述生成器502可以被配置为生成媒体呈现描述片段。分段生成器504可以被配置为接收媒体部件并生成用于包括在媒体呈现中的一个或多个分段。系统存储器506可以被描述为非暂态或有形计算机可读存储介质。在一些示例中,系统存储器506可提供临时和/或长期存储。在一些示例中,系统存储器506或其部分可以被描述为非易失性存储器,并且在其他示例中,系统存储器506的部分可以被描述为易失性存储器。系统存储器506可以被配置为存储可以在操作期间由数据封装器使用的信息。
如上所述,Hannuksela提出的子图片区域盒可能不太理想。在一个示例中,根据本文所述的技术,数据封装器107可以被配置为基于以下定义、语法和语义来发送信号通知子图片区域盒:
定义
track_group_type等于“spco”的TrackGroupTypeBox指示该轨道属于可以在空间上被布置用于获得组合图片的轨道的组合。映射到该分组的视觉轨道(即,在track_group_type等于“spco”的TrackGroupTypeBox内具有相同的track_group_id值的视觉轨道)共同表示可呈现的视觉内容。
track_group_type等于“spco”的TrackGroupTypeBox内的track_group_id解释如下:
如果track_group_id值的两个最低有效位是“10”,则指示具有该track_group_id值且track_group_type等于“spco”的每个子图片轨道仅包含左视图的内容。
如果track_group_id值的两个最低有效位是“01”,则指示具有该track_group_id值且track_group_type等于“spco”的每个子图片轨道仅包含右视图的内容。
如果track_group_id值的两个最低有效位是“11”,则指示具有该track_group_id值且track_group_type等于“spco”的每个子图片轨道包含左视图和右视图的内容。
如果track_group_id值的两个最低有效位是“00”,则指示未发送信号通知关于具有该track_group_id值且track_group_type等于“spco”的子图片轨道是包含左视图还是右视图的内容的信息。在另选的示例中,保留等于“00”的group_id值的两个最低有效位。
在另选的示例中:
如果track_group_id值的两个最低有效位是“11”,则指示具有该track_group_id值且track_group_type等于“spco”的子图片轨道包含左视图和右视图的内容。
应当指出的是,在其他示例中,代替上文两个最低有效位,最高有效位可用于指示。在其他示例中,track_group_id中的任何两位可用于指示。在又一个示例中,可以在具有track_group_type等于“spco”的TrackGroupTypeBox中发送信号通知至少两个位宽的新位字段,并且可以将其用于指示以上左视图/右视图/两个视图的指示。
在另一个变体示例中,track_group_id值空间可以如下划分以用于将来的可扩展性。
该标准的该版本的track_group_id值应在0至65535的范围内。
保留大于65535的track_group_id值。
在另一个示例中,代替值65535,一些其他值可用于将track_group_id的值的空间划分为保留下来的值和该标准的该版本所用的值。
在没有其他视觉轨道的情况下可能或可能不旨在单独地呈现映射到该分组的每个单独的视觉轨道,而适合呈现组合图片。
注释1:内容作者可以使用TrackHeaderBox的track_not_intended_for_presentation_alone标记来指示在没有其他视觉轨道的情况下不旨在单独地呈现单独的视觉轨道。
注释2:当图块轨道集和相关联的图块基础轨道中携带有HEVC视频比特流并且该比特流表示由子图片组合轨道组指示的子图片时,仅图块基础轨道包含SubPictureCompositionBox。
如根据下文的语义所指定的,通过在空间上布置属于相同子图片组合轨道组和属于相同另选组的所有轨道的组合对准的样本的解码输出来导出组合图片。
语法
在另一示例中,用于track_x、track_y、track_width、track_height、composition_width、composition_height的以上位字段宽度中的一个或多个位字段宽度可以是16位而不是32位。
语义
track_x指定以亮度样本为单位的该轨道的样本的左上角在组合图片上的水平位置。track_x的值应在0至composition_width-1(包括端值)的范围内。
track_y指定以亮度样本为单位的该轨道的样本的左上角在组合图片上的垂直位置。track_y的值应在0至composition_height-1(包括端值)的范围内。
track_width指定以亮度样本为单位的该轨道的样本在组合图片上的宽度。track_width的值应在1至composition_width(包括端值)的范围内。
track_height指定以亮度样本为单位的该轨道的样本在组合图片上的高度。track_height的值应在1至composition_height-track_y(包括端值)的范围内。在另一个示例中,track_height的值应在1至composition_height(包括端值)的范围内。
composition_width指定以亮度样本为单位的组合图片的宽度。当不存在时,推断composition_width等于SubPictureCompositionBox中发送信号通知的composition_width语法元素,SubPictureCompositionBox的track_group_id值与该TrackGroupTypeBo相同,并且track_group_type等于“spco”。composition_width的值应大于或等于1。
composition_height指定以亮度样本为单位的组合图片的高度。当不存在时,推断composition_height等于SubPictureCompositionBox中发送信号通知的composition_height语法元素,SubPictureCompositionBox的track_group_id值与该TrackGroupTypeBox相同,并且track_group_type等于“spco”。composition_height的值应大于或等于1。
对于属于相同子图片组合轨道组的所有轨道,对于仅一个SubPictureCompositionBox,标记的最低有效位的值应等于1。因此,composition_width和composition_height元素应仅在一个SubPictureCompositionBox中发送信号通知。
在另一个示例中:
对于属于相同子图片组合轨道组的所有轨道,对于至少一个SubPictureCompositionBox,标记的最低有效位的值应等于1。
因此,composition_width和composition_height元素应至少在一个SubPictureCompositionBox中发送信号通知。
在变体示例中,代替对composition_width和composition_height大于0的约束,可以使用具有语义的减1编码来对这些语法元素进行编码,如下所示。
composition_width_minus1加1指定以亮度样本为单位的组合图片的宽度。
composition_height_minus1加1指定以亮度样本为单位的组合图片的高度。
在变体示例中,代替标记的最低有效位值,可以使用标记中的其他位来调节composition_width和composition_height的信令。例如,在下文的语法中,标记的最高有效位用于此目的。
在另一示例中,用于track_x、track_y、track_width、track_height、composition_width、composition_height的以上一个或多个位字段宽度可以是32位而不是16位。由track_x、track_y、track_width和track_height表示的矩形被称为该轨道的子图片矩形。
对于属于相同子图片组合轨道组和属于相同另选组(即,具有相同的非零alternate_group值)的所有轨道,子图片矩形的位置和尺寸应分别相同。
子图片组合轨道组的组合图片如下导出:
1)在属于子图片组合轨道组的所有轨道中,从每个另选组中选取一个轨道。
2)对于每个所选取的轨道,应用以下项:
a.对于在0至track_width-1(包括端值)的范围内的i的每个值以及对于在0至track_height-1(包括端值)的范围内的j的每个值,将在亮度样本位置((i+track_x)%composition_width,(j+track_y))处的组合图片的亮度样本设置为等于在亮度样本位置(i,j)处的该轨道的子图片的亮度样本。
b.当解码的图片具有除4:0:0的色度格式时,相应地导出色度分量。
属于相同子图片组合轨道组和属于不同另选组(即,具有alternate_group等于0或是不同的alter_group值)的所有轨道的子图片矩形不应重叠且不应有间隔,使得在组合图片的上述推导过程中,每个亮度样本位置(x,y)恰好遍历一次,其中x在0至composition_width-1(包括端值)的范围内,并且y在0至composition_height-1(包括端值)的范围内。
在一个示例中,子图片区域盒可基于语法:
语法
在其他示例中,用于track_x、track_y、track_width、track_height、composition_width、composition_height的以上一个或多个位字段宽度可以是16位而不是32位。
其中track_x、track_y、track_width、track_height、composition_width和composition_height的语义可以基于上文提供的示例,并且composition_params_present_flag的语义基于以下项:
composition_params_present_flag等于1指定语法元素composition_width和composition_height存在于该盒中。composition_params_present_flag等于0指定语法元素composition_width和composition_height不存在于该盒中。
应当指出的是,相对于Hannuksela,在根据本文所述的技术的子图片区域盒中,SubPictureRegionBox中用于子图片组合轨道分组的语法元素的位宽从16位增加到了32位,放宽了对SubPictureRegionBox中用于子图片组合轨道分组的轨道宽度和轨道高度的语法元素的约束以允许更多的值,提出了对SubPictureRegionBox中用于子图片组合轨道分组的组合宽度和组合高度的语法元素的新约束,并且修改了对轨道高度的约束,并且修改了子图片组合轨道组的组合图片的推导。应当指出的是,由于在MPEG-I中不支持上下接缝扩展,所以这些修改提供了与MPEG-I的整体功能对准。
此外,相对于Hannuksela,在根据本文所述的技术的子图片区域盒中,当由具有track_group_type“spco”和相同的track_group_id值的TrackGroupTypeBox指示子图片组合轨道分组时,提议划分track_group_id值的空间以指示属于组合的子图片轨道是否仅包括左视图、仅包括右视图或包括左视图和右视图两者的内容。track_group_id值空间的此类划分可以允许播放器避免解析SubPictureRegionBox和RegionWisePackingBox来确定关于子图片轨道和所得组合属于哪个视图的信息。相反,播放器可以仅解析track_group_id值以了解该信息。在其他示例中,track_group_id值范围的空间被划分为支持将来的可扩展性。
此外,相对于Hannuksela,在根据本文所述的技术的子图片区域盒中,在具有相同track_group_id值的SubPictureCompositionBox的仅一个实例或至少一个实例中用于发送信号通知composition_width和composition_height语法元素的语法修改和标记提供了位的节省。
这样,数据封装器107表示被配置为根据本文所述的技术中的一种或多种发送信号通知与虚拟现实应用程序相关联的信息的设备的示例。
再次参考图1,接口108可以包括被配置为接收由数据封装器107生成的数据并且将该数据发送和/或存储到通信介质的任何设备。接口108可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可以发送和/或接收信息的任何其他类型的设备。此外,接口108可以包括计算机系统接口,该计算机系统接口可使文件能够存储在存储设备上。例如,接口108可以包括支持外围部件互连(PCI)和高速外围部件互连(PCIe)总线协议、专用总线协议、通用串行总线(USB)协议、I2C的芯片集或可用于互连对等设备的任何其他逻辑和物理结构。
再次参考图1,目标设备120包括接口122、数据解封装器123、视频解码器124和显示器126。接口122可以包括被配置为从通信介质处接收数据的任何设备。接口122可以包括网络接口卡诸如以太网卡,并且可以包括光收发器、射频收发器或者可接收和/或发送信息的任何其他类型的设备。此外,接口122可以包括使能够从存储设备处检索兼容视频比特流的计算机系统接口。例如,接口122可以包括支持PCI和PCIe总线协议、专用总线协议、USB协议、I2C的芯片集或可用于互连对等设备的任何其他逻辑和物理结构。数据解封装器123可以被配置为根据本文所述的技术中的一种或多种接收由数据封装器107生成的比特流并且执行子比特流提取。
视频解码器124可以包括被配置为接收比特流和/或其可接受变体并且从其再现视频数据的任何设备。显示器126可以包括被配置为显示视频数据的任何设备。显示器126可以包括各种显示设备诸如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一种类型的显示器中的一者。显示器126可以包括高清显示器或超高清显示器。显示器126可以包括立体显示器。应当指出的是,尽管在图1所示的示例中,视频解码器124被描述为将数据输出到显示器126,但视频解码器124可以被配置为将视频数据输出到各种类型的设备和/或其子部件。例如,视频解码器124可以被配置为将视频数据输出到任何通信介质,如本文所述。目标设备120可以包括接收设备。
图9是示出可实现本公开的一种或多种技术的接收器设备的示例的框图。也就是说,接收器设备600可以被配置为基于上述语义来解析信号。接收器设备600是计算设备的示例,该计算设备可以被配置为从通信网络处接收数据并允许用户访问多媒体内容(包括虚拟现实应用程序)。在图9所示的示例中,接收器设备600被配置为经由电视网络(诸如上述电视服务网络404)接收数据。此外,在图9所示的示例中,接收器设备600被配置为经由广域网发送和接收数据。应当指出的是,在其他示例中,接收器设备600可以被配置为通过电视服务网络404简单地接收数据。本文所述的技术可以由被配置为使用通信网络的任意组合和全部组合进行通信的设备利用。
如图9所示,接收器设备600包括中央处理单元602、系统存储器604、系统接口610、数据提取器612、音频解码器614、音频输出系统616、视频解码器618、显示系统620、I/O设备622和网络接口624。如图9所示,系统存储器604包括操作系统606和应用程序608。一个或多个中央处理单元602、系统存储器604、系统接口610、数据提取器612、音频解码器614、音频输出系统616、视频解码器618、显示系统620、I/O设备622和网络接口624中的每一者可互连(物理地、通信地和/或可操作地)以用于部件间的通信,并且可实现为各种合适电路中的任一种,诸如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。应当指出的是,尽管接收器设备600被示出为具有不同的功能块,但是此类图示是出于描述的目的,并且不会将接收器设备600限制到特定的硬件构架。可使用硬件、固件和/或软件具体实施的任意组合来实现接收器设备600的功能。
CPU 602可以被配置为实现用于在接收器设备600中执行的功能和/或处理指令。CPU 602可以包括单核和/或多核中央处理单元。CPU 602能够检索和处理用于实现本文所述技术中的一种或多种的指令、代码和/或数据结构。指令可存储在计算机可读介质诸如系统存储器604上。
系统存储器604可以被描述为非暂态或有形计算机可读存储介质。在一些示例中,系统存储器604可提供临时和/或长期存储。在一些示例中,系统存储器604或其部分可以被描述为非易失性存储器,并且在其他示例中,系统存储器604的部分可以被描述为易失性存储器。系统存储器604可以被配置为存储可以在操作期间由接收器设备600使用的信息。系统存储器604可以用于存储程序指令以供CPU 602执行,并且可以由在接收器设备600上运行的程序使用以在程序执行期间临时存储信息。此外,在其中接收器设备600作为数字视频录像机的一部分被包括的示例中,系统存储器604可以被配置为存储多个视频文件。
应用程序608可以包括在接收器设备600内实现或由其执行的应用程序,并且可以被实现或包含在接收器设备600的部件内,可由该接收器设备的部件操作、执行,并且/或者可操作地/通信地耦接到该接收器设备的部件。应用程序608可以包括可使接收器设备600的CPU 602执行特定功能的指令。应用程序608可以包括在计算机编程语句中表达的算法,诸如for循环、while循环、if语句、do循环等。可使用指定的编程语言来开发应用程序608。编程语言的示例包括JavaTM、JiniTM、C、C++、Objective C、Swift、Perl、Python、PhP、UNIXShell、Visual Basic和Visual Basic Script。在其中接收器设备600包括智能电视的示例中,应用程序可由电视制造商或广播公司开发。如图9所示,应用程序608可结合操作系统606执行。也就是说,操作系统606可以被配置为促进应用程序608与CPU 602以及接收器设备600的其他硬件部件的交互。操作系统606可以是被设计为安装在机顶盒、数字视频录像机、电视等上的操作系统。应当指出的是,本文所述的技术可以由被配置为使用软件架构的任意组合和全部组合进行操作的设备利用。
系统接口610可以被配置为启用接收器设备600的部件之间的通信。在一个示例中,系统接口610包括使数据能够从一个对等设备传输到另一个对等设备或传输到存储介质的结构。例如,系统接口610可以包括支持基于加速图形端口(AGP)的协议、基于外围部件互连(PCI)总线的协议(诸如PCI ExpressTM(PCIe)总线规范)的芯片集,其由外围部件互连专门兴趣组维护或者可用于互连对等设备的任何其他形式的结构(例如,专用总线协议)维护。
如上所述,接收器设备600被配置为经由电视服务网络接收并任选地发送数据。如上所述,电视服务网络可以根据电信标准来操作。电信标准可定义通信属性(例如,协议层),诸如物理信令、寻址、信道访问控制、分组属性和数据处理。在图9所示的示例中,数据提取器612可以被配置为从信号中提取视频、音频和数据。可以根据例如DVB标准、ATSC标准、ISDB标准、DTMB标准、DMB标准和DOCSIS标准的各方面来定义信号。
数据提取器612可以被配置为从信号中提取视频、音频和数据。也就是说,数据提取器612可以与服务分发引擎互逆的方式操作。此外,数据提取器612可以被配置为基于上述结构中的一个或多个的任意组合来解析链路层分组。
数据分组可以由CPU 602、音频解码器614和视频解码器618来处理。音频解码器614可以被配置为接收和处理音频包。例如,音频解码器614可以包括被配置为实现音频编解码器的各方面的硬件和软件的组合。也就是说,音频解码器614可以被配置为接收音频包并将音频数据提供给音频输出系统616以进行渲染。音频数据可使用多信道格式编码,诸如由杜比和数字影院系统开发的格式。可使用音频压缩格式对音频数据进行编码。音频压缩格式的示例包括运动图像专家组(MPEG)格式、高级音频编码(AAC)格式、DTS-HD格式和杜比数字(AC-3)格式。音频输出系统616可以被配置为渲染音频数据。例如,音频输出系统616可以包括音频处理器、数字-模拟转换器、放大器和扬声器系统。扬声器系统可以包括各种扬声器系统中的任一种,诸如耳机、集成立体声扬声器系统、多扬声器系统或环绕声系统。
视频解码器618可以被配置为接收和处理视频包。例如,视频解码器618可以包括用于实现视频编解码器的各方面的硬件和软件的组合。在一个示例中,视频解码器618可以被配置为解码根据任何数量的视频压缩标准编码的视频数据,这些视频压缩标准诸如ITU-T H.262或ISO/IEC MPEG-2Visual、ISO/IEC MPEG-4Visual、ITU-T H.264(也被称为ISO/IEC MPEG-4高级视频编码(AVC))以及高效率视频编码(HEVC)。显示系统620可以被配置为检索和处理视频数据以供显示。例如,显示系统620可从视频解码器618处接收像素数据并输出数据以用于视觉呈现。此外,显示系统620可以被配置为结合视频数据输出图形(例如,图形用户界面)。显示系统620可以包括各种显示设备中的一者,这些显示设备诸如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或能够向用户呈现视频数据的其他类型的显示设备。显示设备可以被配置为显示标准清晰度内容、高清晰度内容或超高清内容。
I/O设备622可以被配置为在接收器设备600的操作期间接收输入并提供输出。也就是说,I/O设备622可以使用户能够选择要渲染的多媒体内容。可以从输入设备处生成输入,这些输入设备诸如按钮式遥控器、包括触敏屏幕的设备、基于运动的输入设备、基于音频的输入设备或被配置为接收用户输入的任何其他类型的设备。I/O设备622可以利用标准化通信协议可操作地耦接到接收器设备600,该标准化通信协议诸如通用串行总线协议(USB)、蓝牙、ZigBee或专有通信协议(诸如,专用的红外通信协议)。
网络接口624可以被配置为使接收器设备600能够经由局域网和/或广域网发送和接收数据。网络接口624可以包括网络接口卡,诸如以太网卡、光收发器、射频收发器或者被配置为发送和接收信息的任何其他类型的设备。网络接口624可以被配置为根据网络中利用的物理和媒体访问控制(MAC)层执行物理信令、寻址和信道访问控制。接收器设备600可以被配置为解析根据上文相对于图8所述的技术中的任一种生成的信号。这样,接收器设备600表示被配置为解析包括与虚拟现实应用程序相关联的信息的一个或多个语法元素的设备的示例。
在一个或多个示例中,描述的功能可以通过硬件、软件、固件或其任何组合来实现。如果以软件实现,则可将功能作为一个或多个指令或代码存储在计算机可读介质上或在计算机可读介质上传输,并且由基于硬件的处理单元执行。计算机可读介质可以包括对应于有形介质诸如数据存储介质的计算机可读存储介质,或者包括例如根据通信协议来促进计算机程序从某个地方传输到另一个地方的任何介质的通信介质。这样,计算机可读介质通常可对应于:(1)非暂态的有形计算机可读存储介质,或者(2)通信介质诸如信号或载波。数据存储介质可以是可以由一个或多个计算机或一个或多个处理器访问以检索用于实现本公开中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可以包括计算机可读介质。
以举例而非限制的方式,此类计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储设备、磁盘存储设备或其他磁存储设备、闪存存储器,或者可用于存储指令或数据结构形式的所需程序代码并且可由计算机访问的任何其他介质。而且,任何连接都被适当地称为计算机可读介质。例如,如果使用同轴电缆、光纤电缆、双绞线、数字用户线路(DSL)或无线技术诸如红外线、无线电和微波从网站、服务器或其他远程源传输指令,则同轴电缆、光纤电缆、双绞线、DSL或无线技术诸如红外线、无线电和微波都包括在介质的定义中。然而,应当理解,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其他暂态介质,而是针对非暂态有形存储介质。如本文所用,磁盘和光盘包括压缩光盘(CD)、激光盘、光学光盘、数字通用光盘(DVD)、软磁盘及Blu-ray光盘,其中磁盘通常以磁性方式复制数据,而光盘则利用激光以光学方式复制数据。上述的组合也应该包括在计算机可读介质的范围内。
可以由一个或多个处理器诸如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其他等效集成或离散逻辑电路执行指令。因此,如本文所用的术语“处理器”可以指前述结构中的任一个或适用于实现本文所述的技术的任何其他结构。此外,在一些方面中,可以在被配置用于编码和解码的专用硬件和/或软件模块内提供本文所述的功能,或者将其结合到组合编解码器中。而且,这些技术可以完全在一个或多个电路或逻辑元件中实现。
本公开的技术可以在各种设备或装置包括无线手机、集成电路(IC)或IC集(例如,芯片集)中实现。在本公开中描述了各种部件、模块或单元,以强调被配置为执行所公开的技术的设备的功能方面,但是不一定需要通过不同的硬件单元来实现。相反,如上所述,可以将各种单元组合在编解码器硬件单元中,或者通过互操作硬件单元包括如上所述的一个或多个处理器的集合,组合合适的软件和/或固件来提供各种单元。
此外,每个上述实施方案中所用的基站设备和终端设备的每个功能块或各种特征可通过电路(通常为一个集成电路或多个集成电路)实施或执行。被设计为执行本说明书中所述的功能的电路可以包括通用处理器、数字信号处理器(DSP)、专用或通用集成电路(ASIC)、现场可编程门阵列(FPGA)、或其他可编程逻辑设备、分立栅极或晶体管逻辑器、或分立硬件部件、或它们的组合。通用处理器可以是微处理器,或另选地,该处理器可以是常规处理器、控制器、微控制器或状态机。通用处理器或上述每种电路可以由数字电路进行配置,或可以由模拟电路进行配置。此外,当由于半导体技术的进步而出现制成取代当前集成电路的集成电路的技术时,也能够使用通过该技术生产的集成电路。
已经描述了各种示例。这些示例和其他示例在以下权利要求的范围内。
<交叉引用>
本非临时专利申请根据《美国法典》第35卷第119节(35U.S.C.§119)要求于2018年1月12日提交的临时专利申请62/617,009的优先权,其全部内容据此以引用方式并入。
Claims (5)
1.一种发送信号通知与全向视频相关联的信息的方法,所述方法包括:
发送信号通知轨道组标识符,其中发送信号通知轨道组标识符包括发送信号通知指示对应于所述轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者的值:仅左视图;仅右视图;或者左视图和右视图。
2.一种确定与全向视频相关联的信息的方法,所述方法包括:
解析与全向视频相关联的轨道组标识符;以及
确定对应于所述轨道组标识符的每个子图片轨道是否包括用于以下内容中的一者:仅左视图;仅右视图;或者基于所述轨道组标识符的所述值的左视图和右视图。
3.一种设备,所述设备包括被配置为执行根据权利要求1至2所述的步骤的任意组合和全部组合的一个或多个处理器。
4.一种装置,所述装置包括用于执行根据权利要求1至2所述的步骤的任意组合和全部组合的装置件。
5.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质包括存储在其上的指令,所述指令在被执行时使得设备的一个或多个处理器执行根据权利要求1至2所述的步骤的任意组合和全部组合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862617009P | 2018-01-12 | 2018-01-12 | |
US62/617009 | 2018-01-12 | ||
PCT/JP2019/000258 WO2019139014A1 (en) | 2018-01-12 | 2019-01-08 | Systems and methods for signaling sub-picture composition information for virtual reality applications |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111587577A true CN111587577A (zh) | 2020-08-25 |
Family
ID=67218325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980008115.6A Pending CN111587577A (zh) | 2018-01-12 | 2019-01-08 | 用于针对虚拟现实应用程序发送信号通知子图片组合信息的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200344462A1 (zh) |
CN (1) | CN111587577A (zh) |
WO (1) | WO2019139014A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115022715A (zh) * | 2020-06-04 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 一种沉浸媒体的数据处理方法及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11831665B2 (en) | 2021-01-04 | 2023-11-28 | Bank Of America Corporation | Device for monitoring a simulated environment |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103748882A (zh) * | 2011-07-22 | 2014-04-23 | 高通股份有限公司 | 支持内侧视图运动预测模式的以多重视图译码为基础的三维视频译码编解码器 |
WO2016204481A1 (ko) * | 2015-06-16 | 2016-12-22 | 엘지전자 주식회사 | 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법 |
CN106464854A (zh) * | 2014-02-26 | 2017-02-22 | 索尼电脑娱乐欧洲有限公司 | 图像编码和显示 |
-
2019
- 2019-01-08 US US16/960,974 patent/US20200344462A1/en not_active Abandoned
- 2019-01-08 WO PCT/JP2019/000258 patent/WO2019139014A1/en active Application Filing
- 2019-01-08 CN CN201980008115.6A patent/CN111587577A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103748882A (zh) * | 2011-07-22 | 2014-04-23 | 高通股份有限公司 | 支持内侧视图运动预测模式的以多重视图译码为基础的三维视频译码编解码器 |
CN106464854A (zh) * | 2014-02-26 | 2017-02-22 | 索尼电脑娱乐欧洲有限公司 | 图像编码和显示 |
WO2016204481A1 (ko) * | 2015-06-16 | 2016-12-22 | 엘지전자 주식회사 | 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115022715A (zh) * | 2020-06-04 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 一种沉浸媒体的数据处理方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019139014A1 (en) | 2019-07-18 |
US20200344462A1 (en) | 2020-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200120326A1 (en) | Systems and methods for signaling view information for virtual reality applications | |
WO2019189038A1 (en) | Systems and methods for signaling camera parameter information | |
WO2020045593A1 (en) | Systems and methods for signaling sub-picture timed metadata information | |
WO2019194241A1 (en) | Systems and methods for signaling sub-picture composition information for virtual reality applications | |
CN110574381B (zh) | 解析全向视频质量信息语法元素的方法及设备 | |
WO2019146601A1 (en) | Systems and methods for signaling position information | |
US10848735B2 (en) | Systems and methods for signaling information associated with constituent pictures in virtual reality applications | |
US20200344462A1 (en) | Systems and methods for signaling sub-picture composition information for virtual reality applications | |
WO2019235305A1 (en) | Systems and methods for signaling overlay information | |
US20200221104A1 (en) | Systems and methods for signaling a projected region for virtual reality applications | |
US20200382809A1 (en) | Systems and methods for signaling of information associated with most-interested regions for virtual reality applications | |
WO2021125117A1 (en) | Systems and methods for signaling information for a mesh in omnidirectional media | |
WO2021137300A1 (en) | Systems and methods for signaling viewpoint switching information in omnidirectional media | |
WO2021075407A1 (en) | Systems and methods for enabling interactivity for actionable locations in omnidirectional media | |
WO2021125185A1 (en) | Systems and methods for signaling viewpoint looping information in omnidirectional media | |
US20230421828A1 (en) | Systems and methods for signaling content component information in omnidirectional media | |
US20210084283A1 (en) | Systems and methods for signaling application specific messages in a virtual reality application | |
WO2019139052A1 (en) | Systems and methods for signaling source information for virtual reality applications | |
WO2020141604A1 (en) | Systems and methods for signaling camera parameter information | |
US20210127144A1 (en) | Systems and methods for signaling information for virtual reality applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200825 |
|
WD01 | Invention patent application deemed withdrawn after publication |