CN118285108A - 基于几何的点云的自适应流传输 - Google Patents
基于几何的点云的自适应流传输Info
- Publication number
- CN118285108A CN118285108A CN202280072599.2A CN202280072599A CN118285108A CN 118285108 A CN118285108 A CN 118285108A CN 202280072599 A CN202280072599 A CN 202280072599A CN 118285108 A CN118285108 A CN 118285108A
- Authority
- CN
- China
- Prior art keywords
- pcc
- descriptor
- representation
- component
- tile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title description 13
- 230000006978 adaptation Effects 0.000 claims abstract description 174
- 230000002123 temporal effect Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims description 71
- 230000006835 compression Effects 0.000 abstract description 13
- 238000007906 compression Methods 0.000 abstract description 13
- 238000004891 communication Methods 0.000 description 56
- 230000015654 memory Effects 0.000 description 42
- 230000008569 process Effects 0.000 description 32
- 230000006870 function Effects 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 23
- 230000011664 signaling Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 22
- 238000013507 mapping Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 15
- 238000005538 encapsulation Methods 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000003068 static effect Effects 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 239000012092 media component Substances 0.000 description 9
- 230000000153 supplemental effect Effects 0.000 description 9
- 241000760358 Enodes Species 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 8
- 230000002093 peripheral effect Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 101150030514 GPC1 gene Proteins 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 101150097497 GPT1 gene Proteins 0.000 description 2
- 101100172132 Mus musculus Eif3a gene Proteins 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 241000509579 Draco Species 0.000 description 1
- 230000005355 Hall effect Effects 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Abstract
媒体内容可以基于时间级别自适应地(例如,选择性地或部分地)流传输。这些时间级别可以在媒体内容清单(例如,媒体呈现描述(MPD))中指示。例如,用于基于几何的点云压缩(G‑PCC)媒体内容的媒体样本可被划分为与时间级别标识符相关联的时间级别。MPD可以指示与G‑PCC媒体内容相关联的一个或多个自适应集。可以从多个自适应集中选择自适应集。可以根据所选择的自适应集来确定表示集。可以从该MPD获得与该表示集的表示相关联的G‑PCC描述符的指示。可以使用该G‑PCC描述符来标识该表示中存在的时间级别,该G‑PCC描述符可包括一组时间级别标识符。可以基于该G‑PCC描述符来选择该表示。
Description
相关申请的交叉引用
本申请要求2021年10月5日提交的美国临时申请63/252,366号的权益,该美国临时申请的全部内容据此以引用方式并入本文。
背景技术
视频译码系统可用于压缩数字视频信号,例如,以减少此类信号所需要的存储和/或传输带宽。视频译码系统可包括例如基于小波的系统、基于对象的系统和/或基于块的系统(诸如基于块的混合视频译码系统)。
发明内容
公开了用于视觉媒体内容(诸如基于几何的体积或点云视频帧序列)的自适应流传输的系统、方法和工具。例如,可以基于媒体内容中的时间级别来自适应地(例如,选择性地或部分地)访问或下载媒体内容。流传输客户端可以例如基于在发信号通知的信息中指示的时间级别来标识和/或选择点云流和/或组件子流,诸如针对媒体内容(例如,基于几何的点云压缩(G-PCC)媒体内容)的媒体内容清单(例如,媒体呈现描述(MPD)文件)中的元素、属性和/或元数据。
例如,MPD文件可以指示与G-PCC媒体内容相关联的一个或多个自适应集。可以从自适应集中选择自适应集。可以根据所选择的自适应集来确定表示集。可以从MPD文件获得与表示集的表示相关联的G-PCC描述符的指示。可以使用G-PCC描述符来标识存在于表示中的一个或多个时间级别,该G-PCC描述符可包括一组时间级别标识符。可以基于G-PCC描述符来调度对表示的下载。该组时间级别标识符中的每个时间级别标识符可以与G-PCC媒体内容的G-PCC组件媒体样本相关联。与G-PCC媒体内容相关联的G-PCC组件媒体样本可被划分成多个时间级别。(例如,每个)时间级别标识符可以与G-PCC组件媒体样本的时间级别相关联。一组G-PCC组件媒体样本可被存储在一个或多个时间级别轨道中。G-PCC描述符可以存在于表示级别处。
描述了本文的任何地方公开的每个特征,并且该特征可以分开地/单独地以及以与本文公开的任何其他特征和/或与本文可隐含地或明确地提到的或可以其他方式落入本文公开的主题的范围内的其他地方公开的任何特征的任何组合实施。
附图说明
图1A是示出在其中一个或多个所公开的实施方案可以被实施的示例通信系统的系统图解。
图1B是示出根据实施方案的可以在图1A所示的通信系统内使用的示例无线发射/接收单元(WTRU)的系统图解。
图1C是示出根据实施方案的可以在图1A所示的通信系统内使用的示例无线电接入网络(RAN)和示例核心网络(CN)的系统图解。
图1D是示出根据实施方案的可以在图1A所示的通信系统内使用的另外一个示例RAN和另外一个示例CN的系统图解。
图2是示出示例视频编码器的示意图。
图3是示出视频解码器的示例的示意图。
图4是示出可在其中实现各个方面和示例的系统的示例的示意图。
图5示出了用于基于几何的点云压缩(G-PCC)的比特流结构的示例。
图6示出了当G-PCC几何和属性比特流被存储在单个轨道中时的样本结构的示例。
图7示出了多轨道G-PCC容器的示例。
图8示出了示例媒体呈现描述(MPD)分级数据模型。
图9示出了使用预选择对MPD中的G-PCC组件进行分组的示例。
图10示出了使用预选择对MPD中的G-PCC组件的多个版本进行分组的示例。
图11示出了具有多个图块轨道的G-PCC内容的示例。
图12示出了G-PCC序列中的多个时间级别的示例。
具体实施方式
现在将参考各种附图来描述例示性实施方案的详细描述。尽管本说明书提供了可能的具体实施的详细示例,但应当指出的是,细节旨在为示例性的,并且绝不限制本申请的范围。
图1A是示出在其中一个或多个所公开的实施方案可得以实现的示例通信系统100的示意图。通信系统100可为向多个无线用户提供诸如语音、数据、视频、消息、广播等内容的多址接入系统。通信系统100可使多个无线用户能够通过系统资源(包括无线带宽)的共享来访问此类内容。例如,通信系统100可采用一个或多个信道接入方法,诸如码分多址接入(CDMA)、时分多址接入(TDMA)、频分多址接入(FDMA)、正交FDMA(OFDMA)、单载波FDMA(SC-FDMA)、零尾唯一字DFT扩展OFDM(ZT UW DTS-s OFDM)、唯一字OFDM(UW-OFDM)、资源块滤波OFDM、滤波器组多载波(FBMC)等。
如图1A所示,通信系统100可包括无线传输/接收单元(WTRU)102a、102b、102c、102d、RAN 104/113、CN 106/115、公共交换电话网(PSTN)108、互联网110和其他网络112,但应当理解,所公开的实施方案设想了任何数量的WTRU、基站、网络和/或网络元件。WTRU102a、102b、102c、102d中的每一者可以是被配置为在无线环境中操作和/或通信的任何类型的设备。作为示例,WTRU 102a、102b、102c、102d(其中任何一个均可被称为“站”和/或“STA”)可被配置为传输和/或接收无线信号,并且可包括用户装备(UE)、移动站、固定或移动用户单元、基于订阅的单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能手机、膝上计算机、上网本、个人计算机、无线传感器、热点或Mi-Fi设备、物联网(IoT)设备、手表或其他可穿戴设备、头戴式显示器(HMD)、车辆、无人机、医疗设备和应用(例如,远程手术)、工业设备和应用(例如,在工业和/或自动处理链环境中操作的机器人和/或其他无线设备)、消费电子设备、在商业和/或工业无线网络上操作的设备等。WTRU 102a、102b、102c和102d中的任一者可互换地称为UE。
通信系统100还可包括基站114a和/或基站114b。基站114a、114b中的每一个基站可为任何类型的设备,其被配置为与WTRU 102a、102b、102c、102d中的至少一个WTRU无线对接以促进对一个或多个通信网络(诸如CN 106/115、互联网110和/或其他网络112)的访问。作为示例,基站114a、114b可为收发器基站(BTS)、节点B、演进节点B、家庭节点B、家庭演进节点B、gNB、NR节点B、站点控制器、接入点(AP)、无线路由器等。虽然基站114a、114b各自被描绘为单个元件,但应当理解,基站114a、114b可包括任何数量的互连基站和/或网络元件。
基站114a可为RAN 104/113的一部分,该RAN还可包括其他基站和/或网络元件(未示出),诸如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。基站114a和/或基站114b可被配置为在一个或多个载波频率(其可被称为小区(未示出))上发射和/或接收无线信号。这些频率可在许可频谱、未许可频谱或许可和未许可频谱的组合中。小区可向特定地理区域提供无线服务的覆盖,该特定地理区域可为相对固定的或可随时间改变。小区可进一步被划分为小区扇区。例如,与基站114a相关联的小区可被划分为三个扇区。因此,在一个实施方案中,基站114a可包括三个收发器,即,小区的每个扇区一个收发器。在一个实施方案中,基站114a可采用多输入多输出(MIMO)技术并且可针对小区的每个扇区利用多个收发器。例如,可使用波束成形在所需的空间方向上发射和/或接收信号。
基站114a、114b可通过空中接口116与WTRU 102a、102b、102c、102d中的一者或多者通信,该空中接口可为任何合适的无线通信链路(例如,射频(RF)、微波、厘米波、微米波、红外(IR)、紫外(UV)、可见光等)。可使用任何合适的无线电接入技术(RAT)来建立空中接口116。
更具体地,如上所指出,通信系统100可为多址接入系统,并且可采用一个或多个信道接入方案,诸如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等。例如,RAN 104/113中的基站114a和WTRU 102a、102b、102c可实现诸如通用移动电信系统(UMTS)陆地无线电接入(UTRA)的无线电技术,其可使用宽带CDMA(WCDMA)来建立空中接口115/116/117。WCDMA可包括诸如高速分组接入(HSPA)和/或演进的HSPA(HSPA+)之类的通信协议。HSPA可包括高速下行链路(DL)分组接入(HSDPA)和/或高速UL分组接入(HSUPA)。
在一个实施方案中,基站114a和WTRU 102a、102b、102c可实现诸如演进的UMTS陆地无线电接入(E-UTRA)的无线电技术,其可使用长期演进(LTE)和/高级LTE(LTE-A)和/或高级LTE Pro(LTE-A Pro)来建立空中接口116。
在实施方案中,基站114a和WTRU 102a、102b、102c可实现无线电技术,诸如NR无线电接入,该无线电技术可使用新无线电(NR)来建立空中接口116。
在一个实施方案中,基站114a和WTRU 102a、102b、102c可实现多种无线电接入技术。例如,基站114a和WTRU 102a、102b、102c可例如使用双连接(DC)原理一起实现LTE无线电接入和NR无线电接入。因此,WTRU 102a、102b、102c所利用的空中接口可由多种类型的无线电接入技术和/或向/从多种类型的基站(例如,eNB和gNB)发送的发射来表征。
在其他实施方案中,基站114a和WTRU 102a、102b、102c可实现诸如IEEE 802.11(即,无线保真(WiFi))、IEEE 802.16(即,全球微波接入互操作性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暂行标准2000(IS-2000)、暂行标准95(IS-95)、暂行标准856(IS-856)、全球移动通信系统(GSM)、GSM增强数据率演进(EDGE)、GSM EDGE(GERAN)等无线电技术。
图1A中的基站114b可为例如无线路由器、家庭节点B、家庭演进节点B或接入点,并且可利用任何合适的RAT来促进诸如商业场所、家庭、车辆、校园、工业设施、空中走廊(例如,供无人机使用)、道路等局部区域中的无线连接。在一个实施方案中,基站114b和WTRU102c、102d可实现诸如IEEE 802.11的无线电技术以建立无线局域网(WLAN)。在一个实施方案中,基站114b和WTRU 102c、102d可实现诸如IEEE 802.15的无线电技术以建立无线个域网(WPAN)。在另一个实施方案中,基站114b和WTRU 102c、102d可利用基于蜂窝的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NR等)来建立微微蜂窝基站或毫微微蜂窝基站。如图1A所示,基站114b可具有与互联网110的直接连接。因此,基站114b可不需要经由CN106/115访问互联网110。
RAN 104/113可与CN 106/115通信,该CN可为被配置为向WTRU 102a、102b、102c、102d中的一者或多者提供语音、数据、应用和/或互联网协议语音技术(VoIP)服务的任何类型的网络。数据可具有不同的服务质量(QoS)要求,诸如不同的吞吐量要求、延迟要求、误差容限要求、可靠性要求、数据吞吐量要求、移动性要求等。CN 106/115可提供呼叫控制、账单服务、基于移动位置的服务、预付费呼叫、互联网连接、视频分发等,和/或执行高级安全功能,诸如用户认证。尽管未在图1A中示出,但是应当理解,RAN 104/113和/或CN 106/115可与采用与RAN 104/113相同的RAT或不同RAT的其他RAN进行直接或间接通信。例如,除了连接到可利用NR无线电技术的RAN 104/113之外,CN 106/115还可与采用GSM、UMTS、CDMA2000、WiMAX、E-UTRA或WiFi无线电技术的另一RAN(未示出)通信。
CN 106/115也可充当WTRU 102a、102b、102c、102d的网关,以访问PSTN 108、互联网110和/或其他网络112。PSTN 108可包括提供普通老式电话服务(POTS)的电路交换电话网络。互联网110可包括使用常见通信协议(诸如传输控制协议(TCP)、用户数据报协议(UDP)和/或TCP/IP互联网协议组中的互联网协议(IP))的互连计算机网络和设备的全球系统。网络112可包括由其他服务提供商拥有和/或运营的有线通信网络和/或无线通信网络。例如,网络112可包括连接到一个或多个RAN的另一个CN,该另一个CN可采用与RAN 104/113相同的RAT或不同的RAT。
通信系统100中的WTRU 102a、102b、102c、102d中的一些或全部WTRU可包括多模式能力(例如,WTRU 102a、102b、102c、102d可包括用于通过不同无线链路与不同无线网络通信的多个收发器)。例如,图1A所示的WTRU 102c可被配置为与可采用基于蜂窝的无线电技术的基站114a通信,并且与可采用IEEE 802无线电技术的基站114b通信。
图1B是示出示例WTRU 102的系统图。如图1B所示,WTRU 102可包括处理器118、收发器120、发射/接收元件122、扬声器/麦克风124、小键盘126、显示器/触摸板128、不可移动存储器130、可移动存储器132、电源134、全球定位系统(GPS)芯片组136和/或其他外围设备138等。应当理解,在与实施方案保持一致的同时,WTRU 102可包括前述元件的任何子组合。
处理器118可为通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等。处理器118可执行信号译码、数据处理、功率控制、输入/输出处理和/或任何其他功能,这些其他功能使WTRU 102能够在无线环境中操作。处理器118可耦合到收发器120,该收发器可耦合到发射/接收元件122。虽然图1B将处理器118和收发器120描绘为单独的组件,但是应当理解,处理器118和收发器120可在电子封装或芯片中集成在一起。
发射/接收元件122可被配置为通过空中接口116向基站(例如,基站114a)发射信号或从基站接收信号。例如,在一个实施方案中,发射/接收元件122可为被配置为发射和/或接收RF信号的天线。在一个实施方案中,发射/接收元件122可为被配置为发射和/或接收例如IR、UV或可见光信号的发射器/检测器。在另一个实施方案中,发射/接收元件122可被配置为发射和/或接收RF信号和光信号两者。应当理解,发射/接收元件122可被配置为发射和/或接收无线信号的任何组合。
尽管发射/接收元件122在图1B中被描绘为单个元件,但是WTRU 102可包括任何数量的发射/接收元件122。更具体地,WTRU 102可采用MIMO技术。因此,在一个实施方案中,WTRU 102可包括用于通过空中接口116发射和接收无线信号的两个或更多个发射/接收元件122(例如,多个天线)。
收发器120可被配置为调制将由发射/接收元件122发射的信号并且解调由发射/接收元件122接收的信号。如上所指出,WTRU 102可具有多模式能力。例如,因此,收发器120可包括多个收发器,以便使WTRU 102能够经由多种RAT(诸如NR和IEEE 802.11)进行通信。
WTRU 102的处理器118可耦合到扬声器/麦克风124、小键盘126和/或显示器/触摸板128(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)并且可从其接收用户输入数据。处理器118还可将用户数据输出到扬声器/麦克风124、小键盘126和/或显示器/触摸板128。此外,处理器118可从任何类型的合适存储器(诸如不可移动存储器130和/或可移动存储器132)访问信息,并且将数据存储在任何类型的合适存储器中。不可移动存储器130可包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或任何其他类型的存储器存储设备。可移动存储器132可包括用户身份模块(SIM)卡、记忆棒、安全数字(SD)存储卡等。在其他实施方案中,处理器118可从物理上没有定位在WTRU 102上(诸如,服务器或家用计算机(未示出)上)的存储器访问信息,并且将数据存储在该存储器中。
处理器118可从电源134接收功率,并且可被配置为向WTRU 102中的其他组件分配和/或控制功率。电源134可为用于为WTRU 102供电的任何合适的设备。例如,电源134可包括一个或多个干电池组(例如,镍镉(NiCd)、镍锌(NiZn)、镍金属氢化物(NiMH)、锂离子(Li-ion)等)、太阳能电池、燃料电池等。
处理器118还可耦合到GPS芯片组136,该GPS芯片组可被配置为提供关于WTRU 102的当前位置的位置信息(例如,经度和纬度)。除了来自GPS芯片组136的信息之外或代替该信息,WTRU 102可通过空中接口116从基站(例如,基站114a、114b)接收位置信息和/或基于从两个或更多个附近基站接收到信号的定时来确定其位置。应当理解,在与实施方案保持一致的同时,WTRU 102可通过任何合适的位置确定方法来获取位置信息。
处理器118还可耦合到其他外围设备138,该其他外围设备可包括提供附加特征、功能和/或有线或无线连接的一个或多个软件模块和/或硬件模块。例如,外围设备138可包括加速度计、电子指南针、卫星收发器、数字相机(用于照片和/或视频)、通用串行总线(USB)端口、振动设备、电视收发器、免提耳麦、模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏播放器模块、互联网浏览器、虚拟现实和/或增强现实(VR/AR)设备、活动跟踪器等。外围设备138可包括一个或多个传感器,该传感器可为以下中的一者或多者:陀螺仪、加速度计、霍尔效应传感器、磁力计、方位传感器、接近传感器、温度传感器、时间传感器;地理位置传感器;测高计、光传感器、触摸传感器、磁力计、气压计、手势传感器、生物识别传感器和/或湿度传感器。
WTRU 102可包括全双工无线电台,对于该全双工无线电台,一些或所有信号的传输和接收(例如,与用于UL(例如,用于传输)和下行链路(例如,用于接收)的特定子帧相关联)可为并发的和/或同时的。全双工无线电台可包括干扰管理单元,该干扰管理单元用于经由硬件(例如,扼流圈)或经由处理器(例如,单独的处理器(未示出)或经由处理器118)进行的信号处理来减少和/或基本上消除自干扰。在一个实施方案中,WRTU 102可包括半双工无线电台,对于该半双工无线电台,一些或所有信号的传输和接收(例如,与用于UL(例如,用于传输)或下行链路(例如,用于接收)的特定子帧相关联)。
图1C是示出根据一个实施方案的RAN 104和CN 106的系统图。如上所指出,RAN104可采用E-UTRA无线电技术通过空中接口116与WTRU 102a、102b、102c通信。RAN 104还可以与CN 106通信。
RAN 104可包括演进节点B 160a、160b、160c,但是应当理解,在与实施方案保持一致的同时,RAN 104可包括任何数量的演进节点B。演进节点B 160a、160b、160c各自可包括一个或多个收发器以便通过空中接口116与WTRU 102a、102b、102c通信。在一个实施方案中,演进节点B 160a、160b、160c可实现MIMO技术。因此,演进节点B 160a例如可使用多个天线来向WTRU 102a发射无线信号和/或从该WTRU接收无线信号。
演进节点B 160a、160b、160c中的每一者可与特定小区(未示出)相关联,并且可被配置为处理无线电资源管理决策、切换决策、UL和/或DL中的用户的调度等。如图1C所示,演进节点B 160a、160b、160c可通过X2接口彼此通信。
图1C所示的CN 106可包括移动性管理实体(MME)162、服务网关(SGW)164和分组数据网络(PDN)网关(或PGW)166。虽然前述元件中的每一个元件被描绘为CN 106的一部分,但应当理解,这些元件中的任一元件可由除CN运营商之外的实体拥有和/或操作。
MME 162可经由S1接口连接到RAN 104中的演进节点B 162a、162b、162c中的每一者,并且可用作控制节点。例如,MME 162可负责认证WTRU 102a、102b、102c的用户、承载激活/停用、在WTRU 102a、102b、102c的初始附加期间选择特定服务网关等。MME 162可提供用于在RAN 104和采用其他无线电技术(诸如GSM和/或WCDMA)的其他RAN(未示出)之间进行切换的控制平面功能。
SGW 164可经由S1接口连接到RAN 104中的演进节点B 160a、160b、160c中的每一者。SGW 164通常可向/从WTRU 102a、102b、102c路由和转发用户数据分组。SGW 164可执行其他功能,诸如在演进节点B间切换期间锚定用户平面、当DL数据可用于WTRU 102a、102b、102c时触发寻呼、管理和存储WTRU 102a、102b、102c的上下文等。
SGW 164可连接到PGW 166,该PGW可向WTRU 102a、102b、102c提供对分组交换网络(诸如互联网110)的访问,以促进WTRU 102a、102b、102c和启用IP的设备之间的通信。
CN 106可以促进与其他网络的通信。例如,CN 106可为WTRU 102a、102b、102c提供对电路交换网络(诸如,PSTN 108)的访问,以促进WTRU 102a、102b、102c与传统陆线通信设备之间的通信。例如,CN 106可包括充当CN 106和PSTN 108之间的接口的IP网关(例如,IP多媒体子系统(IMS)服务器)或者可与该IP网关通信。此外,CN 106可以向WTRU 102a、102b、102c提供对其他网络112的访问,其他网络可包括由其他服务提供商拥有和/或运营的其他有线网络和/或无线网络。
尽管WTRU在图1A至图1D中被描述为无线终端,但是可以设想到,在某些代表性实施方案中,此类终端可(例如,临时或永久)使用与通信网络的有线通信接口。
在代表性实施方案中,其他网络112可为WLAN。
处于基础结构基本服务集(BSS)模式的WLAN可具有用于BSS的接入点(AP)以及与AP相关联的一个或多个站(STA)。AP可具有至分发系统(DS)或将流量携带至和/或携带流量离开BSS的另一种类型的有线/无线网络的接入或接口。源自BSS外部并通向STA的流量可通过AP到达并且可被传递到STA。源自STA并通向BSS外部的目的地的流量可被发送到AP以被传递到相应目的地。BSS内的STA之间的流量可通过AP发送,例如,其中源STA可向AP发送流量,并且AP可将流量传递到目的地STA。BSS内的STA之间的流量可被视为和/或称为点对点流量。可利用直接链路建立(DLS)在源STA和目的地STA之间(例如,直接在它们之间)发送点对点流量。在某些代表性实施方案中,DLS可使用802.11e DLS或802.11z隧道DLS(TDLS)。使用独立BSS(IBSS)模式的WLAN可不具有AP,并且IBSS内或使用IBSS的STA(例如,STA中的所有STA)可彼此直接通信。IBSS通信模式在本文中有时可称为“ad-hoc”通信模式。
当使用802.11ac基础结构操作模式或相似操作模式时,AP可在固定信道(诸如主信道)上发射信标。主信道可以为固定宽度(例如,20MHz宽带宽)或经由信令动态设置的宽度。主信道可为BSS的操作信道,并且可由STA用来建立与AP的连接。在某些代表性实施方案中,例如在802.11系统中可实现载波侦听多路访问/冲突避免(CSMA/CA)。对于CSMA/CA,STA(例如,每个STA)(包括AP)可侦听主信道。如果主信道被特定STA侦听/检测和/或确定为繁忙,则特定STA可退避。一个STA(例如,仅一个站)可在给定BSS中在任何给定时间传输。
高吞吐量(HT)STA可使用40MHz宽的信道进行通信,例如,经由主20MHz信道与相邻或不相邻的20MHz信道的组合以形成40MHz宽的信道。
甚高吞吐量(VHT)STA可支持20MHz、40MHz、80MHz和/或160MHz宽的信道。40MHz和/或80MHz信道可通过组合连续的20MHz信道来形成。可通过组合8个连续的20MHz信道,或通过组合两个非连续的80MHz信道(这可称为80+80配置)来形成160MHz信道。对于80+80配置,在信道编码之后,数据可通过可将数据分成两个流的段解析器。可单独地对每个流进行快速傅里叶逆变换(IFFT)处理和时间域处理。可将这些流映射到两个80MHz信道,并且可通过发射STA来发射数据。在接收STA的接收器处,可颠倒上述用于80+80配置的操作,并且可将组合的数据发送到介质访问控制(MAC)。
802.11af和802.11ah支持低于1GHz的操作模式。相对于802.11n和802.11ac中使用的那些,802.11af和802.11ah中减少了信道操作带宽和载波。802.11af支持电视白空间(TVWS)频谱中的5MHz、10MHz和20MHz带宽,并且802.11ah支持使用非TVWS频谱的1MHz、2MHz、4MHz、8MHz和16MHz带宽。根据代表性实施方案,802.11ah可支持仪表类型控制/机器类型通信,诸如宏覆盖区域中的MTC设备。MTC设备可具有某些能力,例如有限的能力,包括支持(例如,仅支持)某些带宽和/或有限的带宽。MTC设备可包括电池寿命高于阈值(例如,以保持非常长的电池寿命)的电池。
可支持多个信道的WLAN系统以及诸如802.11n、802.11ac、802.11af和802.11ah之类的信道带宽包括可被指定为主信道的信道。主信道可具有等于由BSS中的所有STA支持的最大公共操作带宽的带宽。主信道的带宽可由来自在BSS中操作的所有STA的STA(其支持最小带宽操作模式)设置和/或限制。在802.11ah的示例中,对于支持(例如,仅支持)1MHz模式的STA(例如,MTC型设备),主信道可为1MHz宽,即使AP和BSS中的其他STA支持2MHz、4MHz、8MHz、16MHz和/或其他信道带宽操作模式。载波侦听和/或网络分配向量(NAV)设置可取决于主信道的状态。如果主信道繁忙,例如,由于STA(仅支持1MHz操作模式)正在向AP发射,即使大多数频段保持空闲并且可能可用,整个可用频段也可被视为繁忙。
在美国,可供802.11ah使用的可用频带为902MHz至928MHz。在韩国,可用频带为917.5MHz至923.5MHz。在日本,可用频带为916.5MHz至927.5MHz。802.11ah可用的总带宽为6MHz至26MHz,具体取决于国家代码。
图1D是示出根据一个实施方案的RAN 113和CN 115的系统图。如上所指出,RAN113可采用NR无线电技术以通过空中接口116与WTRU 102a、102b、102c通信。RAN 113还可与CN 115通信。
RAN 113可包括gNB 180a、180b、180c,但是应当理解,在与实施方案保持一致的同时,RAN 113可包括任何数量的gNB。gNB 180a、180b、180c各自可包括一个或多个收发器以便通过空中接口116与WTRU 102a、102b、102c通信。在一个实施方案中,gNB 180a、180b、180c可实现MIMO技术。例如,gNB 180a、108b可利用波束成形来向gNB 180a、180b、180c发射信号和/或从中接收信号。因此,gNB 180a例如可使用多个天线来向WTRU 102a发射无线信号和/或从该WTRU接收无线信号。在一个实施方案中,gNB 180a、180b、180c可实现载波聚合技术。例如,gNB 180a可向WTRU 102a(未示出)发射多个分量载波。这些分量载波的子集可在未许可频谱上,而其余分量载波可在许可频谱上。在一个实施方案中,gNB 180a、180b、180c可实现被协调的多点(CoMP)技术。例如,WTRU 102a可从gNB 180a和gNB 180b(和/或gNB 180c)接收被协调的发射。
WTRU 102a、102b、102c可使用与可扩展参数集相关联的传输来与gNB 180a、180b、180c通信。例如,OFDM符号间隔和/或OFDM子载波间隔可因不同发射、不同小区和/或无线发射频谱的不同部分而变化。WTRU 102a、102b、102c可使用各种或可扩展长度的子帧或传输时间间隔(TTI)(例如,包含不同数量的OFDM符号和/或持续变化的绝对时间长度)来与gNB180a、180b、180c通信。
gNB 180a、180b、180c可被配置为以独立配置和/或非独立配置与WTRU 102a、102b、102c通信。在独立配置中,WTRU 102a、102b、102c可与gNB 180a、180b、180c通信,同时也不访问其他RAN(例如,诸如演进节点B 160a、160b、160c)。在独立配置中,WTRU 102a、102b、102c可将gNB 180a、180b、180c中的一者或多者用作移动性锚定点。在独立配置中,WTRU 102a、102b、102c可在未许可频带中使用信号与gNB 180a、180b、180c通信。在非独立配置中,WTRU 102a、102b、102c可与gNB 180a、180b、180c通信/连接,同时也与另外的RAN(诸如,演进节点B160a、160b、160c)通信/连接。例如,WTRU 102a、102b、102c可实现DC原理以基本上同时与一个或多个gNB 180a、180b、180c和一个或多个演进节点B 160a、160b、160c通信。在非独立配置中,演进节点B 160a、160b、160c可用作WTRU 102a、102b、102c的移动性锚点,并且gNB 180a、180b、180c可提供用于服务WTRU 102a、102b、102c的附加覆盖和/或吞吐量。
gNB 180a、180b、180c中的每一个gNB可与特定小区(未示出)相关联,并且可被配置为处理无线电资源管理决策、切换决策、UL和/或DL中的用户的调度、网络切片的支持、双连接、NR和E-UTRA之间的互通、用户平面数据朝向用户平面功能(UPF)184a、184b的路由、控制平面信息朝向接入和移动性管理功能(AMF)182a、182b的路由等。如图1D所示,gNB 180a、180b、180c可通过Xn接口彼此通信。
图1D所示的CN 115可包括至少一个AMF 182a、182b、至少一个UPF 184a、184b、至少一个会话管理功能(SMF)183a、183b以及可能的数据网络(DN)185a、185b。虽然前述元件中的每个元件被描绘为CN 115的一部分,但应当理解,这些元件中的任一元件都可由除CN运营商之外的实体拥有和/或操作。
AMF 182a、182b可经由N2接口连接到RAN 113中的gNB 180a、180b、180c中的一者或多者,并且可用作控制节点。例如,AMF 182a、182b可以负责认证WTRU 102a、102b、102c的用户、网络切片的支持(例如,具有不同要求的不同PDU会话的处理)、选择特定SMF 183a、183b、注册区域的管理、NAS信令的终止、移动性管理等。AMF 182a、182b可使用网络切片,以便基于WTRU 102a、102b、102c所使用的服务的类型来为WTRU 102a、102b、102c定制CN支持。例如,可针对不同的用例(诸如,依赖超高可靠低延迟(URLLC)接入的服务、依赖增强型移动宽带(eMBB)接入的服务、用于机器类型通信(MTC)接入的服务等)建立不同的网络切片。AMF162可提供用于在RAN 113和采用其他无线电技术(诸如LTE、LTE-A、LTE-A Pro和/或非3GPP接入技术(诸如WiFi))的其他RAN(未示出)之间进行切换的控制平面功能。
SMF 183a、183b可经由N11接口连接到CN 115中的AMF 182a、182b。SMF 183a、183b还可经由N4接口连接到CN 115中的UPF 184a、184b。SMF 183a、183b可选择并控制UPF184a、184b,并且配置通过UPF 184a、184b进行的流量路由。SMF 183a、183b可执行其他功能,诸如管理和分配UE IP地址、管理PDU会话、控制策略实施和QoS、提供下行链路数据通知等。PDU会话类型可以是基于IP的、非基于IP的、基于以太网的等。
UPF 184a、184b可经由N3接口连接到RAN 113中的gNB 180a、180b、180c中的一者或多者,这些gNB可向WTRU 102a、102b、102c提供对分组交换网络(诸如互联网110)的接入,以促进在WTRU 102a、102b、102c与启用IP的设备之间的通信。UPF 184、184b可执行其他功能,诸如路由和转发分组、实施用户平面策略、支持多宿主PDU会话、处理用户平面QoS、缓冲下行链路分组、提供移动性锚定等。
CN 115可促进与其他网络的通信。例如,CN 115可包括用作CN 115与PSTN 108之间的接口的IP网关(例如,IP多媒体子系统(IMS)服务器)或者可与该IP网关通信。此外,CN115可向WTRU 102a、102b、102c提供对其他网络112的访问,该其他网络可包括由其他服务提供商拥有和/或运营的其他有线网络和/或无线网络。在一个实施方案中,WTRU 102a、102b、102c可通过UPF 184a、184b经由至UPF 184a、184b的N3接口以及在UPF 184a、184b与本地数据网络(DN)185a、185b之间的N6接口连接到DN 185a、185b。
鉴于图1A至图1D以及图1A至图1D的对应描述,本文参照以下中的一者或多者描述的功能中的一个或多个功能或全部功能可由一个或多个仿真设备(未示出)执行:WTRU102a-d、基站114a-b、演进节点B 160a-c、MME 162、SGW 164、PGW 166、gNB 180a-c、AMF182a-b、UPF 184a-b、SMF 183a-b、DN 185a-b和/或本文所述的任何其他设备。仿真设备可以是被配置为模仿本文所述的功能中的一个或多个功能或所有功能的一个或多个设备。例如,仿真设备可用于测试其他设备和/或模拟网络和/或WTRU功能。
仿真设备可被设计为在实验室环境和/或运营商网络环境中实现其他设备的一个或多个测试。例如,该一个或多个仿真设备可执行一个或多个功能或所有功能,同时被完全或部分地实现和/或部署为有线和/或无线通信网络的一部分,以便测试通信网络内的其他设备。该一个或多个仿真设备可执行一个或多个功能或所有功能,同时临时被实现/部署为有线和/或无线通信网络的一部分。仿真设备可直接耦合到另一个设备以用于测试目的和/或可使用空中无线通信来执行测试。
该一个或多个仿真设备可执行一个或多个(包括所有)功能,同时不被实现/部署为有线和/或无线通信网络的一部分。例如,仿真设备可在测试实验室和/或非部署(例如,测试)有线和/或无线通信网络中的测试场景中使用,以便实现一个或多个组件的测试。该一个或多个仿真设备可为测试装备。经由RF电路系统(例如,其可包括一个或多个天线)进行的直接RF耦合和/或无线通信可由仿真设备用于发射和/或接收数据。
本申请描述了多个方面,包括工具、特征、示例或实施方案、模型、方法等。这些方面中的许多方面以特定的方式进行描述,并且至少为了示出个体特征,通常以听起来可能具有限制性的方式来描述。然而,这是为了描述清楚,并不限制这些方面的应用或范围。实际上,所有不同的方面可组合和互换以提供进一步的方面。此外,这些方面也可与较早提交中描述的方面组合和互换。
本申请中描述和设想的方面可以许多不同的形式实现。本文所述的图5至图8可提供一些实施方案,但也设想了其他实施方案。图5至图8的讨论并不限制具体实施的广度。这些方面中的至少一个方面通常涉及视频编码和解码,并且至少一个其他方面通常涉及传输生成或编码的比特流。这些方面和其他方面可被实现为方法、装置、其上存储有用于根据方法中的任一方法对视频数据进行编码或解码的指令的计算机可读存储介质,和/或其上存储有根据方法中的任一方法生成的比特流的计算机可读存储介质。
在本申请中,术语“重建”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。
本文描述了各种方法,并且每种方法包括用于实现方法的一个或多个步骤或动作。除非正确操作方法需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或用途。此外,术语诸如“第一”、“第二”等可用于各种实施方案以修改元件、组件、步骤、操作等,诸如“第一解码”和“第二解码”。除非具体要求,否则使用此类术语并不暗示对修改操作的排序。因此,在这个示例中,第一解码不需要在第二解码之前执行,并且可例如在第二解码之前、期间或在重叠的时间段中发生。
本申请中描述的各种方法和其他方面可(例如,用于)修改模块,例如,如图2和图3分别所示的视频编码器200和视频解码器300的预编码处理201、帧内预测260、熵译码245和/或熵解码模块330、帧内预测360、解码后处理385。此外,本文所公开的主题呈现了不限于VVC或HEVC的方面,并且可应用于例如任何类型、格式或版本的视频译码(无论是在标准中描述的还是在建议中描述的,无论是预先存在的还是未来开发的),以及任何此类标准和建议的扩展(例如,包括VVC和HEVC)。除非另有指示或技术上排除,否则本申请中所述的方面可单独使用或组合使用。
在本申请描述的示例中使用各种数值,诸如最小值范围和最大值范围(例如,0至1、0至N或0至255)、针对指示或确定的比特值、默认值、ID号(例如,针对自适应ID)等。这些和其他特定值是为了描述示例的目的,并且所描述的方面不限于这些特定值。
图2是示出示例视频编码器的示意图。设想了示例编码器200的变型,但下文为了清楚起见描述了编码器200,而不描述所有预期的变型。
在被编码之前,视频序列可经过预编码处理(201),例如,将颜色变换应用于输入的彩色图片(例如,从RGB 4:4:4转换为YCbCr 4:2:0),或者执行输入图片分量的重新映射,以便获取更能弹性应对压缩的信号分布(例如,使用颜色分量中的一个颜色分量的直方图均衡化)。元数据可与预处理相关联,并且附加到比特流。
在编码器200中,图片由如下文所述的编码器元件进行编码。以例如译码单元(CU)为单位对待编码图片进行分区(202)和处理。例如,使用帧内模式或帧间模式对每个单元进行编码。当以帧内模式对单元进行编码时,该单元执行帧内预测(260)。以帧间模式执行运动估计(275)和补偿(270)。编码器决定(205)要使用帧内模式或帧间模式中的哪一种对单元进行编码,以及通过例如预测模式标记来指示帧内/帧间决策。预测残差例如通过从原始图像块中减去(210)预测的块进行计算。
然后,对预测残差进行变换(225)和量化(230)。对经量化的变换系数以及运动矢量和其他语法元素进行熵译码(245)以输出比特流。编码器可以跳过变换,并将量化直接应用于未变换的残差信号。编码器可以绕过变换和量化两者,即,在不应用变换或量化过程的情况下直接对残差进行译码。
编码器对编码块进行解码,以提供进一步预测的参考。对经量化的变换系数进行解量化(240)和逆变换(250)以对预测残差进行解码。通过将经解码的预测残差和预测块进行组合(255)重构图像块。将环内滤波器(265)应用于重建的图片以执行例如解块/SAO(样本自适应偏移)滤波,从而减少编码伪影。经滤波的图像存储在参考图片缓冲器(280)处。
图3是示出视频解码器的示例的示意图。在示例解码器300中,比特流由解码器元件解码,如下所述。视频解码器300通常执行与图2中描述的编码过程相反的解码过程。编码器200通常还可执行视频解码作为对视频数据编码的一部分。例如,编码器200可执行本文呈现的视频解码步骤中的一个或多个视频解码步骤。编码器例如重建所解码的图像,以相对于以下项中的一者或多者维持与解码器的同步:参考图片、熵译码上下文和其他解码器相关状态变量。
具体地,解码器的输入包括视频比特流,该视频比特流可由视频编码器200生成。最先,对比特流进行熵解码(330)以获得变换系数、运动矢量和其他经译码的信息。图片分区信息指示如何对图片进行分区。因此,解码器可以根据经解码的图片分区信息来划分(335)图片。对变换系数进行解量化(340)和逆变换(350)以对预测残差进行解码。通过将经解码的预测残差和所预测的块进行组合(355)重构图像块。可从帧内预测(360)或运动补偿预测(即,帧间预测)(375)获得(370)预测的块。环内滤波器(365)被应用于所重构的图像。经滤波的图像被存储在参考图片缓冲器(380)处。
经解码的图片还可经过解码后处理(385),例如,逆颜色变换(例如,从YCbCr 4:2:0转换为RGB 4:4:4)或执行与在预编码处理(201)中执行的重新映射过程相逆的逆重新映射。解码后处理可以使用在预编码处理中导出并在比特流中发信号通知的元数据。
图4是示出可在其中实现本文所述的各个方面和实施方案的系统的示例的示意图。系统400可体现为一种设备,该设备包括下文所述的各种组件并且被配置为执行本文档中所述方面中的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视机接收器、个人视频录制系统、连接的家用电器和服务器。系统400的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立组件中。例如,在至少一个示例中,系统400的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施方案中,系统400经由例如通信总线或通过专用输入端口和/或输出端口通信地耦合到一个或多个其他系统或其他电子设备。在各种实施方案中,系统400被配置为实现本文档中所述的方面中的一个或多个方面。
系统400包括至少一个处理器410,该至少一个处理器被配置为执行加载在其中的指令以用于实现例如本文档中所述的各个方面。处理器410可包括嵌入式存储器、输入输出接口以及如本领域所已知的各种其他电路系统。系统400包括至少一个存储器420(例如,易失性存储器设备和/或非易失性存储器设备)。系统400包括存储设备440,该存储设备可包括非易失性存储器和/或易失性存储器,包括但不限于电可擦可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备440可包括内部存储设备、附接的存储设备(包括可拆卸和不可拆卸的存储设备)和/或网络可访问的存储设备。
系统400包括编码器/解码器模块430,该编码器/解码器模块被配置为例如处理数据以提供经编码的视频或经解码的视频,并且编码器/解码器模块430可包括其自身的处理器和存储器。编码器/解码器模块430表示可被包括在设备中以执行编码和/或解码功能的模块。众所周知,设备可包括编码模块和解码模块中的一者或两者。另外,编码器/解码器模块430可被实现为系统400的独立元件,或者可被结合在处理器410内作为本领域技术人员已知的硬件和软件的组合。
要加载到处理器410或编码器/解码器430上以执行本文档中所述的各个方面的程序代码可存储在存储设备440中,并且随后加载到存储器420上以供处理器410执行。根据各种实施方案,处理器410、存储器420、存储设备440和编码器/解码器模块430中的一者或多者可在本文档中所述的过程的执行期间存储各个项目中的一个或多个项目。此类存储项目可包括但不限于输入视频、解码的视频或部分解码的视频、比特流、矩阵、变量以及处理等式、公式、运算和运算逻辑的中间或最终结果。
在一些实施方案中,处理器410和/或编码器/解码器模块430内部的存储器用于存储指令以及提供在编码或解码期间所需的用于处理的工作存储器。然而,在其他实施方案中,在处理设备外部的存储器(例如,处理设备可以是处理器410或编码器/解码器模块430)用于这些功能中的一个或多个功能。外部存储器可以是存储器420和/或存储设备440,例如,动态易失性存储器和/或非易失性闪存存储器。在若干实施方案中,外部非易失性闪存存储器用于存储例如电视机的操作系统。在至少一个实施方案中,快速外部动态易失性存储器诸如RAM用作视频译码和解码操作的工作存储器,诸如例如MPEG-2(MPEG是指运动图片专家组,MPEG-2也称为ISO/IEC 13818,并且13818-1也称为H.222,13818-2也称为H.262)、HEVC(HEVC是指高效视频译码,也称为H.265和MPEG-H部分2)或VVC(通用视频译码,由联合视频专家小组JVET开发的新标准)。
系统400的元件的输入可以通过如框445中指示的各种输入设备来提供。此类输入设备包括但不限于:(i)射频(RF)部分,其接收例如由广播器通过空中传输的RF信号;(ii)分量(COMP)输入端子(或一组COMP输入端子);(iii)通用串行总线(USB)输入端子;和/或(iv)高清晰度多媒体接口(HDMI)输入端子。其他示例(图4中未示出)包括复合视频。
在各种实施方案中,框445的输入设备具有如本领域中已知的相关联的相应输入处理元件。例如,RF部分可与适用于以下项的元件相关联:(i)选择所需的频率(也称为选择信号,或将信号频带限制到一个频带),(ii)下变频选择的信号,(iii)再次频带限制到更窄频带以选择(例如)在某些实施方案中可称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择所需的数据包流。各种实施方案的RF部分包括用于执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器,这些功能包括例如下变频接收信号至更低频率(例如,中频或近基带频率)或至基带。在一个机顶盒实施方案中,RF部分及其相关联的输入处理元件接收通过有线(例如,电缆)介质传输的RF信号,并且通过滤波、下变频和再次滤波至所需的频带来执行频率选择。各种实施方案重新布置上面所描述的(和其他)元件的顺序,移除这些元件中的一些元件,和/或添加执行相似或不同功能的其他元件。添加元件可包括在现有元件之间插入元件,例如,插入放大器和模数变换器。在各种实施方案中,RF部分包括天线。
另外地,USB和/或HDMI端子可包括用于跨USB和/或HDMI连接将系统400连接到其他电子设备的相应的接口处理器。应当理解,输入处理(例如,Reed-Solomon纠错)的各个方面可以按照需要例如在单独的输入处理IC内或在处理器410内实现。相似地,USB或HDMI接口处理的各方面可以按照需要在独立的接口IC内或在处理器410内实现。将经解调的、经纠错的和经解复用的流提供给各种处理元件,包括例如处理器410以及编码器/解码器430,各种处理元件与存储器和存储元件结合操作以根据需要处理数据流以用于在输出设备上呈现。
系统400的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置425(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。
系统400包括通信接口450,该通信接口使得能够经由通信信道460与其他设备通信。通信接口450可包括但不限于收发器,该收发器被配置为通过通信信道460发射和接收数据。通信接口450可包括但不限于调制解调器或网卡,并且通信信道460可例如在有线和/或无线介质内实现。
在各种实施方案中,使用无线网络诸如Wi-Fi网络(例如IEEE 802.11(IEEE是指电气和电子工程师协会))来将数据流传输或以其他方式提供给系统400。这些示例的Wi-Fi信号通过适于Wi-Fi通信的通信信道460和通信接口450来接收。这些实施方案的通信信道460通常连接到接入点或路由器,该接入点或路由器提供对外部网络(包括互联网)的访问,从而允许流传输应用程序和其他越过运营商的通信。其他实施方案使用机顶盒向系统400提供流传输的数据,该机顶盒通过输入框445的HDMI连接来递送数据。还有其他实施方案使用输入框445的RF连接向系统400提供流传输的数据。如上所述,各种实施方案以非流式传输方式提供数据。另外地,各种实施方案使用除了Wi-Fi以外的无线网络,例如蜂窝网络或蓝牙网络。
系统400可以向各种输出设备(包括显示器475、扬声器485和其他外围设备495)提供输出信号。各种实施方案的显示器475包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器475可用于电视机、平板计算机、膝上型计算机、移动电话(移动电话)或其他设备。显示器475还可以与其他组件集成(例如,如在智能电话中),或者是独立的(例如,用于膝上型计算机的外部监测器)。在实施方案的各种示例中,其他外围设备495包括独立数字视频光盘(或数字多功能光盘)(DVR,用于这两个术语)、光盘播放器、立体声系统和/或照明系统中的一者或多者。各种实施方案使用一个或多个外围设备495,该一个或多个外围设备基于系统400的输出来提供功能。例如,光盘播放器执行播放系统400的输出的功能。
在各种实施方案中,使用信令诸如AV.Link、消费电子控制(CEC)或允许带有或不带有用户干预的设备到设备控制的其他通信协议,在系统400与显示器475、扬声器485或其他外围设备495之间传送控制信号。输出设备可通过相应的接口470、480和490经由专用连接通信地耦合到系统400。另选地,输出设备可以使用通信信道460经由通信接口450连接到系统400。显示器475和扬声器485可与电子设备(诸如例如电视)中的系统400的其他组件集成在单个单元中。在各种实施方案中,显示器接口470包括显示驱动器,例如定时控制器(TCon)芯片。
例如,如果输入445的RF部分是单独的机顶盒的一部分,则显示器475和扬声器485可另选地与其他组件中的一个或多个组件分开。在其中显示器475和扬声器485是外部组件的各种实施方案中,输出信号可经由专用输出连接(包括例如,HDMI端口、USB端口或COMP输出)来提供。
这些实施方案可通过由处理器410实现的计算机软件或通过硬件或通过硬件和软件的组合来执行。作为非限制性示例,这些实施方案可由一个或多个集成电路实现。作为非限制性示例,存储器420可以是适合于技术环境的任何类型,并且可使用任何适当的数据存储技术来实现,诸如光存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。处理器410可为适合技术环境的任何类型,并且作为非限制性示例,可涵盖微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一者或多者。
各种具体实施涉及解码。如本申请中所用,“解码”可涵盖例如对所接收的编码序列执行的过程的全部或部分,以便产生适于显示的最终输出。在各种实施方案中,此类过程包括典型地由解码器执行的一个或多个过程,例如,熵解码、逆量化、逆变换和差分解码。在各种实施方案中,此类过程还包括或者另选地包括由本申请中描述的各种具体实施的解码器执行的过程,例如,接收、解码和解译指示与点云组件相关联的元素、属性和元数据的信号(例如,如本文中所述);标识媒体呈现描述符(MPD)内的点云流及其组件子流;标识点云和/或其组件的版本;对MPD进行解码以标识主自适应集和其他自适应集,从而标识基于几何的点云压缩(G-PCC)内容中的G-PCC组件;对MPD进行解码以标识自适应集或表示中的点云组件的类型;对MPD进行解码以标识一个或多个预选择;对MPD进行解码以标识G-PCC媒体的一个或多个版本;对MPD进行解码以标识一个或多个G-PCC图块组;对MPD进行解码以标识针对自适应集中的G-PCC组件的一个或多个图块ID;对MPD进行解码以标识空间区域的一个或多个特性和区域与G-PCC图块之间的映射、空间区域的特性和区域与G-PCC组件的对应的自适应集之间的映射以及/或者空间区域与G-PCC组件的对应的自适应集之间的映射;对MPD进行解码以标识针对动态空间区域的定时元数据轨道;等等。
作为进一步实施方案,在一个示例中,“解码”仅是指熵解码,在另一个实施方案中,“解码”仅是指差分解码,并且在另一个实施方案中,“解码”是指熵解码和差分解码的组合。短语“解码过程”旨在具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且被认为会被本领域的技术人员很好地理解。
各种具体实施涉及编码。以与上面关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码比特流的全部或部分过程。在各种实施方案中,此类过程包括典型地由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵编码。在各种实施方案中,此类过程还包括或者另选地包括由本申请中描述的各种具体实施的编码器执行的过程,例如,生成、编码和发送指示与点云组件相关联的元素、属性和元数据的信号(例如,如本文所述);对MPD进行编码以指示点云流及其组件子流;对MPD进行编码以指示主自适应集和其他自适应集以支持对基于几何的点云压缩(G-PCC)内容中的G-PCC组件的标识;对MPD进行编码以支持对自适应集或表示中的点云组件的类型的标识;对MPD进行编码以标识一个或多个预选择;对MPD进行编码以支持对G-PCC媒体的一个或多个版本的标识;对MPD进行编码以支持对一个或多个G-PCC图块组的标识;对MPD进行编码以支持对自适应集中的G-PCC组件的一个或多个图块ID的标识;对MPD进行编码以支持对以下各项的标识:空间区域的一个或多个特性和区域与G-PCC图块之间的映射、空间区域的特性和区域与G-PCC组件的对应的自适应集之间的映射,以及/或者空间区域与G-PCC组件的对应的自适应集之间的映射;对MPD进行解码以标识针对动态空间区域的定时元数据轨道;等等。
作为进一步的示例,在一个实施方案中,“编码”仅是指熵编码,在另一个实施方案中,“编码”仅是指差分编码,并且在又一个实施方案中,“编码”是指差分编码和熵编码的组合。短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
需注意,如本文中所使用的语法元素(诸如可在表1至表23中指示且以其他方式在本文中所呈现的论述或图中指示的语法元素)为描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,其还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,其还提供了对应的方法/过程的流程图。
在编码过程期间,通常考虑速率和失真之间的平衡或权衡,这常常考虑到计算复杂性的约束。速率失真优化通常表述为最小化速率失真函数,该速率失真函数是速率和失真的加权和。存在不同的方法解决速率失真优化问题。例如,这些方法可基于对所有编码选项(包括所有考虑的模式或译码参数值)的广泛测试,并且完整评估其译码成本以及重建信号在译码和解码之后的相关失真。更快的方法还可用于降低编码复杂性,特别是对基于预测或预测残差信号而不是重建的残差信号的近似失真的计算。也可使用这两种方法的混合,诸如通过针对可能的编码选项中的仅一些编码选项使用近似失真,而针对其他编码选项使用完全失真。其他方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中任一种来执行优化,但是优化不一定是对译码成本和相关失真两者的完整评估。
本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如,仅作为方法讨论),讨论的特征的具体实施也可以其他形式(例如,装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。这些方法可在例如处理器中实现,该处理器通常指处理设备,包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(“PDA”)以及便于最终用户之间信息通信的其他设备。
提及“一个实施方案”、“实施方案”、“示例”或“一个具体实施”或“具体实施”以及它们的其他变型,意味着结合实施方案描述的特定的特征、结构、特性等包括在至少一个实施方案中。因此,短语“在一个实施方案中”、“在实施方案中”、“在示例中”或“在一个实施中”或“在实施中”的出现以及出现在本申请通篇的各个地方的任何其他变型不一定都是指同一实施方案或示例。
另外地,本申请可以涉及“确定”各种信息片段。确定信息可以包括例如估计信息、计算信息、预测信息或从存储器检索信息中的一者或多者。获得可包括接收、检索、构造、生成和/或确定。
此外,本申请可涉及“访问”各种信息。访问信息可以包括例如接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。
另外地,本申请可涉及“接收”各种信息。与“访问”一样,接收旨在为广义的术语。接收信息可以包括例如访问信息或检索信息(例如,从存储器)中的一者或多者。此外,在诸如例如存储信息、处理信息、传输信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,“接收”通常以一种方式或另一种方式参与。
应当理解,例如,在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”和“至少一种”中的任一种旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,此类短语旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一列出的选项和第二列出的选项(A和B),或仅选择第一列出的选项和第三列出的选项(A和C),或仅选择第二列出的选项和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是,这可扩展到所列出的尽可能多的项目。
而且,如本文所用,词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。例如,在一些实施方案中,编码器(例如,向解码器)发信号通知MPD、自适应集、表示、预选择、G-PCC组件、G-PCCComponent描述符、G-PCC描述符或基本属性描述符、补充属性描述符、G-PCC图块库存描述符、G-PCC静态空间区域描述符、GPCCTileId描述符、GPCC3DRegionID描述符、其他描述符、元素和属性、元数据、模式等(例如,如本文所公开的,包括在表1至表23中)。这样,在一个实施方案中,在编码器侧和解码器侧两者处使用相同的参数。因此,例如,编码器可将特定参数传输(显式信令)到解码器,使得解码器可使用相同的特定参数。相反,如果解码器已具有特定参数以及其他参数,则可在不传输(隐式信令)的情况下使用信令,以简单地允许解码器知道并选择特定参数。通过避免传输任何实际功能,在各种实施方案中实现了比特节省。应当理解,信令可以多种方式实现。例如,在各种实施方案中,使用一个或多个语法元素、标志等将信息发信号通知至对应解码器。虽然前面涉及词语“发信号通知(signal)”的动词形式,但是词语“信号(signal)”在本文也可用作名词。
对于本领域的普通技术人员将显而易见的是,具体实施可产生格式化为携带例如可存储或可传输的信息的多种信号。信息可以包括例如用于执行方法的指令或由所描述的具体实施中的一个具体实施产生的数据。例如,可格式化信号以携带该实施方案的比特流。此类信号可格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。格式化可包括例如对数据流进行编码并且使用经编码的数据流调制载体。信号携带的信息可为例如模拟或数字信息。众所周知,信号可通过多种不同的有线或无线链路传输。信号可存储在处理器可读介质上。
公开了用于视觉媒体内容的自适应流传输的系统、方法和工具,诸如基于几何的体积或点云帧序列。流传输客户端可以例如基于发信号通知的信息来标识和/或选择点云流及其组件子流的版本。可以例如在媒体呈现描述符(MPD)内发信号通知与点云组件相关联的元素、属性和/或元数据。流传输客户端可以例如基于指导(例如,在MPD文件中发信号通知的指示)来确定点云内容的不同表示。例如,指示可以指示跨不同的点云组件的哪一组表示构成一个或多个质量水平。点云内容的组件可被划分为多个图块或图块部分。客户端可以例如基于带宽可用性来流传输几何组件的图块部分(例如,所选择的图块部分)(例如,而不是流传输所有点云数据)。点云组件图块比特流可以在不同的自适应集中可用。自适应集(例如,每个自适应集)可以表示点云组件图块。
可在通过HTTP的动态流传输(DASH)中发信号通知基于几何的点云压缩(G-PCC)组件。例如,可以使用DASH清单文件或MPD文件来发信号通知G-PCC组件。(例如,每个)G-PCC组件可以在DASH MPD文件中表示为自适应集(例如,独立的自适应集)。附加的(例如,主)自适应集可以充当G-PCC内容的主接入点。在示例中,可以针对每个组件每个分辨率发信号通知(例如,一个)自适应集。
流传输客户端可以例如基于G-PCC组件描述符来标识自适应集和/或表示中的点云组件的类型,该类型可以被发信号通知给流传输客户端。G-PCC描述符可使流传输客户端能够区分存在于MPD文件中的不同点云流。流传输客户端可标识针对相应点云流的组件流。
可以例如利用标识符(ID)列表来发信号通知G-PCC预选择(例如,在MPD中),该ID列表可包括例如针对体积媒体的主自适应集ID以及/或者与G-PCC组件相对应的自适应集ID。可以例如使用周期元素内的预选择元素来发信号通知预选择,并且/或者使用在自适应集级别的预选择描述符来发信号通知该预选择。
可发信号通知G-PCC媒体的多个版本。可例如使用独立预选择来发信号通知相同点云媒体的多个版本。表示相同的基于几何的点云媒体的另选版本的预选择可包括例如具有相同属性值的G-PCC描述符。
可以发信号通知G-PCC图块。可以发信号通知图块边界框信息,例如,在基于几何的点云中存在多个图块的情形下。客户端可以从(例如,在MPD中的)图块库存边界框信息选择图块ID,例如以流传输分图块的G-PCC组件数据。
客户端可例如通过检查G-PCC组件描述符来标识针对自适应集中的点云组件的图块ID。可以发信号通知G-PCC图块ID描述符,例如,以使流传输客户端能够区分G-PCC图块流。
可以发信号通知空间区域的特性和/或区域与G-PCC图块之间的映射,例如,在基于几何的体积媒体内容中的3D空间区域是静态的情形下。可以(例如,使用G-PCC 3D区域描述符)发信号通知空间区域的特性和/或区域与G-PCC组件的对应的自适应集之间的映射,例如,在3D空间区域是静态的并且图块库存信息不可用的情形下。可以(例如,通过G-PCC区域ID描述符或G-PCC组件描述符)发信号通知空间区域与G-PCC组件的对应的自适应集之间的映射。
定时元数据轨道(例如,指示3D区域在呈现时间线上的位置和尺寸)可以例如在具有表示的自适应集中发信号通知(例如,针对动态空间区域)并且与一个或多个主G-PCC自适应集相关联。
流传输客户端行为可基于信令。可例如通过在MPD中提供的信息来引导DASH客户端。
3D点云可以(例如,用于)表示沉浸式媒体。点云可包括在三维(3D)空间中表示的点集。(例如,每个)点可以与指示点的位置和/或一个或多个属性(例如,点颜色、透明度、采集时间、激光反射率、材料属性等)的坐标相关联。可例如使用一个或多个相机、深度传感器和/或光检测和测距(LiDAR)激光扫描仪来捕获或部署点云。点云可包括多个点。(例如,每个)点可以由映射在3D空间中的一组坐标(例如,x、y、z坐标)来表示。可基于对象的采样来生成点。在示例中,点云内的点的数量可大约为数百万或数十亿。点云可用于重建一个或多个对象和/或场景。例如,点云可被表示和/或压缩,以有效地存储和传输点云数据。点云压缩可以支持点云的几何坐标和/或属性的有损和/或无损译码(例如,编码或解码)。点云可被部署以支持各种应用(例如,远程呈现、虚拟现实(VR)和/或大规模动态3D映射)。在一个示例中,用于网格和点云压缩的库可以支持对顶点位置、法向量、颜色、纹理坐标和其他通用顶点属性的压缩,例如,以改善传输3D内容的效率和/或速度。库的非限制性示例是由GOOGLETM开发的DRACOTM。
图5示出了用于基于几何的点云压缩(G-PCC)的比特流结构的示例。G-PCC比特流510可包括一组G-PCC单元。G-PCC单元可被称为类型-长度-值(TLV)封装结构,例如,如图5所示。G-PCC和GPCC在本文中可互换地使用。如图5所示,G-PCC单元520可包括关于G-PCCtlv_type和/或G-PCC tlv单元有效载荷的信息。图5示出了各种tlv单元有效载荷类型530。
表1示出了G-PCC TLV单元语法的示例。(例如,每个)G-PCC TLV单元可具有TLV类型、G-PCC TLV单元有效载荷长度和/或G-PCC TLV单元有效载荷。TLV类型(例如,如表1中所示的tlv_type)可以指示G-PCC单元类型。表2示出了TLV类型(例如,如表2所示的tlv_type)和相关联的数据单元描述的示例。例如,具有单元类型2的G-PCC TLV单元可以为几何数据单元,而具有单元类型4的G-PCC TLV单元可以为属性数据单元。可例如基于几何数据单元和属性数据单元来重建点云。几何和属性G-PCC单元有效载荷可以对应于可以由G-PCC解码器解码的媒体数据单元(例如,TLV单元)。几何和属性参数集G-PCC单元可指定G-PCC解码器来对对应的TLV单元进行解码。G-PCC比特流高级语法(HLS)可支持针对几何和属性数据的切片和图块组。可将帧划分为多个图块及切片。切片可以为可以独立地编码和/或解码的点的集合。切片可包括几何数据单元以及零或更多个属性数据单元。属性数据单元可取决于(例如)同一切片内的对应几何数据单元。在切片内,几何数据单元可出现在相关联的属性单元之前。切片的数据单元可以是连续的。可不指定帧内的切片的排序。可通过公共图块标识符来标识切片组。图块库存可以描述图块(例如,每个图块)的边界框。在边界框中图块可与另一图块重叠。切片(例如,每个切片)可包含索引,该索引可以标识该切片所属的图块。表1示出了G-PCC TLV封装单元有效负载语法的示例。表2示出了G-PCC TLV类型和数据单元描述的示例。表3示出了G-PCC TLV封装单元有效负载语法的示例。
表1-G-PCC
TLV单元语法的示例
表2-tlv_type和相关联的数据单元描述的示例
tlv_type | 描述 |
0 | 序列参数集 |
1 | 几何参数集 |
2 | 几何数据单元 |
3 | 属性参数集 |
4 | 属性数据单元 |
5 | 图块库存 |
6 | 帧边界标志 |
表3-G-PCC TLV封装单元有效载荷语法的示例
本文示出并且描述了元素、属性、语法和语义的示例。元素与属性不同。属性可以由属性之前的@来标识。元素使用值范围的示例可以按以下格式提供:<minimum>...<maximum>,其中字母值(例如,N)可以指示值是无界的。本文所述的元素、属性、语法和语义是非限制性示例,在各种具体实施中,在具有或不具有示例使用的情况下,该非限制性示例可以或可以不单独地或以各种组合来实现。
可以为G-PCC实现一个或多个G-PCC容器文件格式。图6示出了在G-PCC几何和属性比特流可存储在单个轨道中时的样本结构的示例。例如,G-PCC编码比特流可以由单轨道声明来表示,如果/在单个轨道中携带G-PCC比特流的情形下。G-PCC数据的单轨道封装可以利用封装,例如ISO基础媒体文件格式(ISOBMFF)封装,该封装可以将G-PCC比特流存储在单个轨道中而无需进一步处理。单个轨道中的样本610(例如,轨道中的每个样本)可包括一个或多个G-PCC组件。样本(例如,每个样本)610可以由一个或多个TLV封装结构组成。
图7示出了多轨道(例如,ISOBMFF)G-PCC容器结构的示例。多轨道容器结构可包括例如标头(诸如ftyp 710)、数据(诸如mdat 730)和/或支持信息(例如,索引、元数据)(诸如moov 720)。例如,轨道中的样本(例如,每个样本)可包括携带G-PCC组件数据的至少一个TLV封装结构,如果/在经译码的G-PCC几何比特流和经译码的G-PCC属性比特流存储在单独的磁道中的情形下。
多轨道G-PCC ISOBMFF容器可包括G-PCC轨道,该G-PCC轨道可包括例如以下各项中的一者或多者:几何参数集、序列参数集和/或携带几何数据TLV单元的几何比特流样本。轨道(例如,还)可以包括对携带G-PCC属性组件的有效负载的其他轨道的轨道引用。多轨道G-PCC ISOBMFF容器(例如,还)可以包括零或多个G-PCC轨道,(例如,每个)轨道包括相应的属性的属性参数集和/或携带属性数据TLV单元的属性比特流样本。
例如,轨道引用工具可用于在G-PCC组件轨道之间进行链接,如果/在多个轨道中携带G-PCC比特流的情形下。例如,可将TrackReferenceTypeBoxes添加到G-PCC轨道的TrackBox内的TrackReferenceBox中。TrackReferenceTypeBox可包括指定可以由G-PCC轨道引用的轨道的track_ID的阵列。G-PCC几何轨道可以通过引用链接到G-PCC属性轨道。例如,G-PCC几何轨道的TrackReferenceTypeBox的reference_type可以标识相关联的属性轨道。轨道引用类型的4CC可以为‘gpca’,这可以指示所引用的轨道包括G-PCC属性数据的经译码的比特流。
(例如,每个)图块或图块组可被封装在独立的轨道(诸如几何图块轨道)中,如果/在G-PCC-PCC比特流的几何形状流包括多个图块的情形下。几何图块轨道可携带一个或多个几何图块的TLV单元,这可以实现对图块的直接访问。(例如,还)可以在多个属性图块轨道中携带包括多个图块的G-PCC比特流的属性流。
可以在容器中的独立几何和属性图块轨道中携带G-PCC图块数据。可支持在ISOBMFF容器中针对G-PCC经译码流的部分访问。可在定时元数据轨道(诸如,具有Dynamic3DSpatialRegionSampleEntry的轨道)的样本中或者在GPCCSpatialRegionInfoBox框中发信号通知与点云场景内的空间区域相对应的图块。这可以使得播放器和流传输客户端能够检索(例如,仅)携带渲染点云场景内的某些空间区域或图块所需的信息的图块轨道集。
G-PCC基础轨道可携带TLV封装结构。TLV封装结构可包括(例如,可仅包括)SPS、GPS、APS和/或图块库存信息。G-PCC基础轨道可以例如基于引用而链接到几何形状图块轨道。例如,可以使用四字符代码(4CC):‘gccg’来定义具有轨道引用类型的轨道引用。轨道引用类型的轨道引用可用于链接G-PCC基础轨道与(例如,每个)几何图块轨道。
可以使用轨道引用工具将几何图块轨道(例如,每个几何图块轨道)与携带相应的图块或图块组的属性信息的其他属性G-PCC图块轨道链接。这些轨道引用类型的4CC可以为‘gpca’。
另选轨道可由另选轨道机制(例如,TrackHeaderBox的alternate_group字段)指示。与相同的alternate_group值相关联的G-PCC组件图块轨道可以是相同的G-PCC组件的不同的经编码的版本。可在另选轨道中对体积视觉场景进行译码。例如,作为彼此的另选轨道的G-PCC轨道可以在它们的TrackHeaderBox具有相同的alternate_group值。
G-PCC组件图块轨道可具有另选轨道。例如,属于另选组的一个或多个(例如,所有)G-PCC组件图块轨道可以由G-PCC基础轨道和/或相应的G-PCC几何图块轨道引用。可作为彼此的另选轨道的G-PCC组件图块轨道可以使用另选分组机制。
通过HTTP(MPEG-DASH)的MPEG动态自适应流传输可被用作可以动态地适应网络递送条件的变化以例如向最终用户提供(例如,更好的)视频体验的递送格式。
动态HTTP流传输可在服务器处可用的一个或多个比特率下递送多媒体内容。多媒体内容可包括多个媒体组件(例如,音频、视频、文本)。不同的媒体组件可具有不同的特性。媒体组件的特性可例如由媒体呈现描述(MPD)描述。
图8示出了MPD分级数据模型的示例。如图8中所示,MPD 810可以描述周期序列(例如,时间间隔)。例如,媒体内容组件的一组编码版本在某个周期期间可不改变。周期可以与开始时间和持续时间相关联,诸如周期id=2并且开始=60秒。周期可以由一个或多个自适应集(例如,AdaptationSet,诸如图8中所示的Adaptation Set I)组成。自适应集(Adaptation Set、adaptation set)、AdaptationSet和adaptationset在本文中可互换地使用。DASH流传输客户端可以为WTRU,例如,如本文中相对于图1A至图1D所述。
自适应集(例如,Adaptation Set、adaptation set、AdaptationSet或adaptationset)可表示共享一个或多个(例如,相同的)属性的一个或多个(例如,若干)媒体内容组件的一组经编码的版本,诸如语言、媒体类型、图片长宽比、角色、可访问性、视点、评级属性等中的一者或多者。在示例中,AdaptationSet可包括多媒体(例如,G-PCC)内容的几何和/或属性组件的不同比特率。AdaptationSet可包括(例如,相同的)多媒体内容的音频分量(例如,较低质量的立体声和/或较高质量的环绕声)的不同比特率。AdaptationSet可包括多个表示。
Representation诸如Representation 2可以描述一个或多个(例如,若干)媒体组件的可递送的经编码的版本。Representation可例如在比特率、分辨率、信道数量和/或其他特性方面与其他表示不同。Representation可包括一个或多个片段。Representation元素的属性(例如,@id、@bandwidth、@qualityRanking和@dependencyId)可(例如,可用于)指定Representation的一个或多个属性。
可利用HTTP请求来检索片段。(例如,每个)片段(例如,初始化片段、媒体片段1、媒体片段2等)可具有统一资源定位符(URL)(例如,服务器上的可寻址位置)。可以例如使用HTTP GET或具有字节范围的HTTP GET来下载片段。
DASH客户端可解析MPD XML文档。DASH客户端可以例如基于AdaptationSet的元素来选择AdaptationSet的集合(例如,适合其环境的集合)。客户端可以为AdaptationSet(例如,在每个AdaptationSet内)选择(例如,一个)Representation。客户端可例如基于@bandwidth属性的值、客户端译码能力和/或客户端渲染能力来选择Representation。客户端可下载所选择的Representation的初始化片段。客户端可以(例如,通过请求整个片段或片段的字节范围)访问内容。客户端可以继续消费媒体内容,例如,在呈现已经开始的情形下或者在呈现期间。客户端可在呈现期间请求(例如,连续地请求)媒体片段和/或媒体片段的部分。客户端可以根据媒体呈现时间线来播放内容。客户端可例如基于来自客户端环境的更新信息从第一Representation切换到第二Representation。客户端可例如跨两个或多个周期连续地播放内容。可以终止(例如,正在由客户端按片段消费的)媒体呈现,可以开始某个周期,并且/或者可以重新获取MPD,例如,朝Representation中所通告的媒体的结尾。
MPEG-DASH描述符可提供关于媒体内容的专用信息。描述符元素结构可以是类似的。描述符元素可包括例如@schemeIdUri属性(其可提供URI以标识方案)、属性@value和/或属性@id。元素语义可特定于所采用的方案。标识该方案的统一资源标识符(URI)可以是例如统一资源名称(URN)或URL。MPD可能或者可能不提供关于如何使用元素的信息。采用DASH格式的应用程序可以例如利用适当的方案信息来实例化描述元素。使用元素(例如,描述符元素)的DASH应用程序可以(例如,最先)定义方案标识符(例如,呈URI的形式)并且/或者可以定义针对元素的值空间(例如,针对使用方案标识符的情况)。可以在例如针对结构化数据的独立命名空间中定义扩展元素和/或属性。描述符可出现在MPD内的多个级别下。例如,元素在MPD级别下的存在可指示该元素为MPD元素的子元素。元素在自适应集级别的存在可以指示该元素为AdaptationSet元素的子元素。元素在表示级别的存在可以指示该元素为表示元素的子元素。
(例如,在MPEG-DASH中的)捆绑包可以为可由(例如,单个)解码器实例共同消费的媒体组件集。(例如,每个)捆绑包可包括(例如,主)媒体组件,该媒体组件可包括解码器特定信息并且/或者可以引导解码器。PreSelection可以指、标识和/或定义例如可共同消费的捆绑包中的媒体组件的子集。
包括主媒体组件的AdaptationSet可称为主自适应集(Main Adaptation Set)。Main Adaptation Set、main Adaptation Set和main adaptation set(例如,以及基于自适应集(adaptation set)的首字母大写或复合的任何变型形式(例如,adaptationset))在本文中可互换地使用。主媒体组件可包括在可与捆绑包相关联的PreSelection中。(例如,每个)捆绑包可包括一个或多个部分AdaptationSet。部分AdaptationSet可与主AdaptationSet组合地处理。
表4示出了PreSelection元素语义的示例。可例如通过PreSelection元素(例如如表4所示)来定义预选择。对PreSelection的选择可基于可包括在PreSelection元素中的属性和元素。
表4-针对PreSelection元素的语义的示例
可以用3D点云来实现或由3D点云来表示多媒体应用程序(诸如VR和沉浸式3D图形),该多媒体应用程序可实现与虚拟世界的更新形式的交互和/或通信。静态点云和动态点云可生成大量信息。高效译码算法可用于压缩点云信息,例如,以减少点云信息对存储和/或传输资源的利用。例如,压缩动态点云信息的比特流可比未压缩信息的比特流利用更少的传输资源。
点云应用程序可以利用译码、存储和/或网络资源(例如,通过网络流传输点云数据)。点云应用程序可以执行点云内容的实况和/或按需流传输,例如,具体取决于生成内容的方式。点云应用程序可以创建、处理和/或发送/接收表示点云的大量信息。点云应用程序可支持自适应流传输技术,例如,以避免网络过载和/或提供优化的观看体验,例如相对于变化的网络容量和/或其他操作条件。
MPEG-DASH可以(例如,用于)提供点云的自适应递送。可例如利用支持点云媒体(包括点云流)的信令来实现MPEG-DASH。信令元素可指示或可使流传输客户端能够标识MPD文件内的点云流及其组件子流。信令元素可以指示以及/或者使流传输客户端能够标识可以与点云组件相关联的一种或多种类型的元数据,例如,使得流传输客户端能够选择流传输客户端可被配置和/或能够配置来支持的点云和/或点云组件的(例如,最佳)版本。
点云内容的组件可在不同的表示下可用。在示例中,多个表示中的每一个表示可表示不同的质量水平。流传输客户端可利用关于不同表示的引导(例如,在MPD文件中发信号通知的指示)。例如,该指示可以指示跨不同组件的哪个表示集构成(例如,特定)质量水平(例如,以便执行适度质量降级)。点云内容的组件可被划分为多个图块。客户端可以例如基于带宽可用性来流传输几何组件的特定的(例如,所选择的)图块部分(例如,而不是流传输所有的点云数据)。G-PCC组件图块比特流可以在不同的自适应集处可用。(例如,每个)自适应集可以表示G-PCC组件图块。
G-PCC 3D空间区域信息可以例如与3D图块库存信息一起提供G-PCC数据中的空间部分访问支持。在一些示例中,如果G-PCC比特流解码中涉及的复杂性较高,则部分访问可能不会降低G-PCC播放器处的复杂性。可以支持G-PCC容器中的时间可扩展性,以例如降低播放器端的复杂性以及/或者提供具有较低帧速率的G-PCC流。MPEG DASH流传输客户端可能不支持时间可扩展性信息信令。例如,可以向流传输客户端提供例如在MPD文件中发信号通知的关于跨不同组件的哪组表示构成G-PCC比特流中存在的时间级别的指导。
G-PCC媒体内容可包括多个组件,诸如几何和属性。(例如,每个)组件(例如,在多个组件中)可以被单独编码,例如,作为G-PCC比特流的子流。可例如使用G-PCC编码器对组件(诸如几何和属性)进行编码。子流可被共同地解码(例如,与附加的元数据一起),例如,以渲染点云。
元素和属性可以被定义为例如XML元素和属性。可例如在独立命名空间(例如,“urn:mpeg:mpegI:gpcc:2020”)中定义XML元素。命名空间指定符“gpcc:”可在本文中用于例如指代独立命名空间。
可在DASH MPD中发信号通知G-PCC组件。在示例中,(例如,每个)G-PCC组件可以在DASH清单(例如,MPD)文件中表示为独立的AdaptationSet,该独立的AdaptationSet可被称为Component Adaptation Set。包括几何信息的Adaptation Set可以是Main AdaptationSet,其可以充当G-PCC内容的主接入点。在示例中,可以针对每个组件每个分辨率发信号通知(例如,一个)自适应集。在示例中,Main Adaptation Set可具有被设定为‘gpc1’的@codecs属性。
例如,EssentialProperty描述符可与被设定等于“urn:mpeg:mpegI:gpcc:2020:component”的@schemeIdUri属性一起使用,以标识Component Adaptation Set中的G-PCC组件的类型。EssentialProperty描述符可被称为例如GPCCComponent描述符。
在示例中(例如,在自适应集级别),可针对存在于自适应集的Representation中的(例如,每个)点云组件来发信号通知(例如,一个)GPCCComponent描述符。
表5示出了针对GPCCComponent描述符的元素和属性的示例。在示例中,GPCCComponent描述符的@value属性可能不存在。GPCCComponent描述符可包括在表5中定义的属性。
表5-针对GPCCComponent描述符的元素和属性的示例
表6示出了对应于表5的GPCCComponent描述符的XML模式的示例。
表6-针对GPCCComponent描述符的XML模式的示例
Main Adaptation Set可包括例如自适应集级别的(例如,单个)InitializationSegment或表示级别的多个初始化片段(例如,每个Representation一个初始化片段)。初始化片段可包括G-PCC参数集,G-PCC参数集可以(例如,可用于)初始化G-PCC解码器。例如,如果存在(例如,单个)初始化片段,则用于一个或多个(例如,所有)Representation的G-PCC参数集可被包括在初始化片段中。
在示例中,(例如,每个)Representation的初始化片段可包括用于Representation的G-PCC参数集和几何数据,例如,如果在Main Adaptation Set中发信号通知一个以上的Representation。其他Component Adaptation Set的Representation可以例如使用@dependencyId属性来列出来自Main Adaptation Set的对应的Representation标识符。主自适应集中的Representation可以被映射到G-PCC组件AdaptationSet中的对应Representation。针对主自适应集的Representation的媒体片段可包括例如G-PCC轨道的一个或多个轨道片段。针对组件AdaptationSet的Representation的媒体片段可包括例如对应的组件轨道的一个或多个轨道片段(例如,在文件格式级别)。
在示例中,角色描述符元素可与可针对G-PCC组件定义的值一起使用。例如,几何组件可具有gpcc-geometry的对应值,并且属性组件可具有gpcc-attribute的对应值。可以在自适应集级别发信号通知(例如,附加的)EssentialProperty描述符元素(例如,类似于针对表5中示出的示例描述的EssentialProperty描述符元素)。在示例中,可在不包括component_type属性的情况下发信号通知EssentialProperty描述符元素(例如,在自适应集级别)。可以发信号通知EssentialProperty描述符元素(例如,在任一情况下)以标识几何组件和/或属性组件。
在示例中,可以在独立的AdaptationSet中发信号通知G-PCC组件的多个版本中的(例如,每一个)版本,其中根据所使用的媒体编解码器来设定@codecs属性集的值,例如,在使用不同的编解码器来对G-PCC组件的多个版本进行编码的情况下。可以支持跨G-PCC组件的多个版本的AdaptationSet进行Representation之间的切换(例如,无缝切换)。自适应集(例如,多个自适应集中的每一个自适应集)可包括SupplementalProperty描述符,例如,其中@schemeIdURI被设定为urn:mpeg:dash:adaptation-set-switching:2016,并且@value包括与其他可用版本相对应的以逗号分隔的AdaptationSet ID列表,以例如指示支持跨G-PCC组件的多个版本的AdaptationSet的Representation之间的无缝切换。在示例中,可以不应用或应用用于支持跨自适应集切换的多个规则(例如,附加的规则)。
可以发信号通知G-PCC图块轨道。当在G-PCC容器中存在多个图块轨道时,MainAdaptation Set可包括(例如,可以仅包括)来自G-PCC基础轨道的参数集和图块库存信息。几何和/或属性数据可能不存在于Main Adaptation Set及其Representation中。MainAdaptation Set的@codecs属性可被设定为‘gpcb’,这可以指示Adaptation Set包括基础轨道数据,并且该基础轨道包括(例如,仅包括)G-PCC内容的SPS、GPS、APS和/或图块库存信息。
可以在独立的Adaptation Set中发信号通知(例如,每个)组件图块轨道。独立的Adaptation Set可被称为Tile Component Adaptation Set。可以在Tile ComponentAdaptation Set的Representation中发信号通知(例如,每一个)版本,例如,如果/在相同的图块(或图块集合)的组件的多个版本存在并且在独立的图块轨道中携带的情形下。针对Tile Component Adaptation Set的表示针对G-PCC媒体内容的组件图块轨道的@codecs属性可被设定为‘gpt1’。
可以在Tile Component Adaptation Set级别发信号通知GPCCComponent描述符。GPCCComponent描述符可包括指示存在于图块比特流中的图块列表的(例如,附加的)属性@tile_ids。GPCCComponent描述符(例如,有条件地还)可包括附加的XML属性@attr_index,例如,如果/在由封闭Adaptation Set表示的组件是G-PCC属性组件的情形下。@attr_index属性可以发信号通知G-PCC属性组件在SPS中的次序并且/或者可以实现区分G-PCC属性组件,例如,如果/在G-PCC内容中存在具有相同的属性类型(例如,多于一个颜色属性)的多个G-PCC属性组件的情形下。存在于Tile Component Adaptation Set级别的GPCCComponent描述符可包括元素和属性,例如,如表7中的示例所示(例如,定义)的。
表7-针对GPCCComponent描述符的元素和属性
表8示出了对应于表7的GPCCComponent描述符的XML模式的示例。
表8-针对GPCCComponent描述符的XML模式的示例
在示例中(例如,如果/当容器中存在多个图块轨道时),几何Tile ComponentAdaptation Set中的(例如,每个)Representation可以例如使用@dependencyId属性来引用Main Adaptation Set中的对应的Representation。属性Tile Component AdaptationSet中的(例如,每个)Representation可例如使用@dependencyId属性来引用几何TileComponent Adaptation Set中的对应Representation。
G-PCC组件图块轨道(例如,具有相同的alternate_group值的相关联的G-PCC组件图块轨道)可以在MPD中被发信号通知为Tile Component Adaptation Set的表示。
可发信号通知G-PCC描述符。流传输客户端可以(例如,能够或被配置为)标识AdaptationSet或Representation中的点云组件的类型,例如基于(例如,通过检查)对应的元素内的GPCCComponent描述符。流传输客户端可区分存在于MPD文件中的不同几何点云流。
G-PCC描述符可包括例如SupplementalProperty元素,其具有例如等于“urn:mpeg:mpegI:gpcc:2020:gpc”的@schemeIdUri属性。表9示出了针对G-PCC描述符的属性的示例。在示例中,没有或多个G-PCC描述符(例如,至多一个G-PCC描述符)可以存在于G-PCC媒体的Main Adaptation Set的自适应集级别处。
表9-针对G-PCC描述符的属性的示例
针对属性的数据类型可以如在例如XML模式中所定义的。表10示出了针对G-PCC描述符的XML模式的示例。模式可例如表示为具有命名空间urn:mpeg:mpegI:gpcc:2020的XML模式。
表10-针对G-PCC描述符的XML模式的示例
可发信号通知GPCCTileId描述符。流传输客户端可以例如基于(例如,通过检查)GPCCComponent描述符来标识G-PCC Tile Component AdaptationSet中存在的一个或多个图块id。在示例中,G-PCC图块的组件中的一个或多个(例如,所有)组件可被存储在单个轨道中。例如,如果G-PCC图块的所有组件都存储在单个轨道中,则GPCCComponent描述符可以不在与该轨道相关联的AdapatationSet中发信号通知。流传输客户端可以区分可存在于MPD文件中的不同G-PCC图块轨道。例如,流传输客户端可以基于(例如,通过标识)相应的图块流来区分不同的G-PCC图块轨道。
在示例中,@schemeIdUri属性等于“urn:mpeg:mpegI:gpcc:2020:tileID”的SupplementalProperty元素可以为GPCCTileId描述符。GPCCTileId描述符可用于区分不同的G-PCC图块流。在示例中,一个(例如,至多一个GPCCTileId描述符)可以被发信号通知或者可以存在于G-PCC图块媒体的适配集级别处。GPCCTileId描述符(例如,至多一个GPCCTileId描述符)可以在自适应集级别被发信号通知或呈现,例如,如果/在GPCCComponent描述符在自适应集级别不可用的情形下(例如,如果/在一个图块或一组图块的所有G-PCC组件数据在一个轨道中的情形下)。
在示例中,GPCCTileId描述符的@value属性可能不存在。GPCCTileId描述符可包括一个或多个属性,例如,如表11所示。
表11-针对GPCCTileID描述符的属性的示例
针对属性的数据类型可如XML模式中所提供。例如,可以提供针对GPCCTileId描述符的XML模式,如表12中所示的示例模式所示。模式可以用命名空间urn:mpeg:mpegI:gpcc:2020的XML模式来表示,例如,如表12中的示例所示。
表12-针对GPCCTileId描述符的XML模式的示例
可发信号通知G-PCC预选择。可以例如使用PreSelection元素(例如,如在DASH中所定义的)在MPD中发信号通知G-PCC预选择,例如,其中针对@preselectionComponents属性的标识符(ID)列表包括例如针对体积媒体的Main Adaptation Set的ID以及(例如,之后的)与G-PCC组件相对应的AdaptationSet ID。在示例中,针对PreSelection的@codecs属性可被设定为可以指示PreSelection媒体为基于几何的点云的‘gpc1’。可例如使用周期元素内的预选择元素来发信号通知预选择,并且/或者使用在自适应集级别的预选择描述符来发信号通知该预选择。
图9示出了使用预选择对MPD中的G-PCC组件进行分组的示例。图9示出了用于对可能属于MPEG-DASH MPD文件内的(例如,单个)体积媒体的G-PCC组件进行分组的示例DASH配置。
可发信号通知G-PCC媒体的多个版本。在示例中,可例如使用独立预选择来发信号通知相同点云媒体的多个版本。表示相同的基于几何的点云媒体的另选版本的预选择可包括例如具有相同@gpcId值的G-PCC描述符。例如,在预选择级别,可以不存在或存在多个(例如,至多一个)G-PCC描述符。预选择可以为可选择的另选预选择。@preselectionComponents属性的ID列表可包括在剩余组件Adaptation Set ID之后的MainAdaptation Set的ID,例如,如果/在@codecs属性被设定为‘gpc1’的情形下。
图10示出了使用预选择对MPD中的G-PCC组件的多个版本进行分组的示例。图10示出了用于对可属于MPEG-DASH MPD文件内的单点云的G-PCC组件的多个版本进行分组的DASH配置的示例。可例如使用预选择描述符来发信号通知分组/关联。表13示出了使用预选择在MPD中发信号通知G-PCC组件的多个版本的示例。
表13-使用预选择在MPD中发信号通知多个版本的G-PCC组件的示例
在示例中,点云的G-PCC组件AdaptationSet或者Main Adaptation Set的Representation可以使用例如@dependencyId属性来列出G-PCC组件AdaptationSet和/或Representation的标识符。例如,如果Main Adaptation Set中的片段可以(例如,需要)结合来自点云组件的AdaptationSet中的片段进行解码,例如以重建点云,则可能存在(例如,固有的)依赖性。
在示例中,可以实现G-PCC Tile Preselection。Main Adaptation Set可以发信号通知G-PCC基础轨道数据,例如,如果/在使用多个区块轨道携带G-PCC内容的情形下。Tile Component Adaptation Set可以发信号通知G-PCC几何和属性图块轨道数据。
可以例如使用PreSelection元素在MPD中发信号通知G-PCC Tile Preselection。例如,Preselection的@codecs属性可以被设定(例如,设定为‘gpt1’),以指示Preselection媒体是一组基于几何的点云图块。可以使用Period元素内的PreSelection元素来发信号通知Preselection。可以使用在Tile Component Adaptation Set级别的Preselection描述符来发信号通知Preselection。
Preselection元素可包括针对@preselectionComponents属性的ID列表。针对G-PCC Tile Preselection的@preselectionComponents属性ID列表可包括几何TileComponent Adaptation Set的ID,之后是对应的属性Tile Component Adaptation SetID。可以例如使用在Adaptation Set的Representation中发信号通知的@dependencyId属性来标识Main Adaptation Set的与所选择的几何Tile Component Adaptation Set的Representation相对应的Representation。
(例如,每个)G-PCC Tile Preselection可包括一个或多个GPCCTileId描述符。这可以允许标识在Preselection(例如,每个Preselection)中引用的图块。在一些示例中(例如,如果/当GPCCTileId描述符不存在时),可以通过以下操作来标识属于G-PCC TilePreselection的图块:从@preselectionComponents属性的ID列表找到几何TileComponent Adaptation Set并且检查来自存在于几何Tile Component Adaptation Set中的GPCCComponent描述符的图块ID列表。
图11示出了具有多个图块轨道的G-PCC内容的示例。图11可以为示例性DASH配置。如图11所示,G-PCC内容可具有例如一(1)个几何组件和三(3)个属性组件。G-PCC比特流可包括例如六(6)个图块,这些图块可被分组为(例如,两个)图块集。例如,第一图块集可包括图块1、2和3,并且第二图块集可包括图块4、5和6。每个图块集的组件可以在(例如,两个)不同版本中可用(例如,以不同的质量编码)。可以在ISOBMFF容器文件中的独立的G-PCC图块轨道中携带针对图块集的(例如,每个)组件版本。MPD文件可包括针对一个或多个(例如,两个)图块集的每个组件的Tile Component Adaptation Set。(例如,每个)Tile ComponentAdaptation Set可包括一个或多个(例如,两个)表示(例如,组件的每一个版本一个表示)。例如,MPD中的两(2)个Preselection可以发信号通知存在于G-PCC比特流中的两个图块集。
表14示出了DASH MPD文件利用多个图块轨道以及Preselection描述符来发信号通知G-PCC内容的示例。
表14-用多个图块轨道发信号通知G-PCC内容的示例。
在示例中,可使用独立预选择来发信号通知媒体数据,例如,在多个点云媒体可用的情形下。表示基于几何的点云媒体数据的预选择可包括具有唯一@gpcId值的G-PCC描述符。例如,在预选择级别,可以不存在或存在多个(例如,至多一个)G-PCC描述符。可以存在主自适应集的ID、@preselectionComponents属性的自适应集ID列表中的第一ID和/或(例如,后跟)与点云组件相对应的AdaptationSet的ID(例如,提供/发信号通知和/或接收)。例如,可以使用@gpcId属性的唯一值来标识点云,该属性可以在G-PCC描述符中定义。
可以发信号通知一个或多个G-PCC图块组。在示例中,可以(例如,使用GPCCTileInventory描述符)发信号通知图块边界框信息,例如,在存在基于几何的点云中的多个图块的情形下。GPCCTileInventory描述符可以为SupplementalProperty元素,例如具有可被设定为“urn:mpeg:mpegI:gpcc:2020:gptl”的@schemeIdUri属性。GPCCTileInventory描述符可存在于针对G-PCC媒体的Main Adaptation Set的自适应集级别下,例如,在G-PCC媒体是分图块的情形下。表15示出了针对GPCCTileInventory描述符的元素和属性的示例。
表15-针对GPCCTileInventory描述符的元素和属性的示例
表16示出了针对GPCCTileInventory描述符的XML模式的示例。可例如根据XML模式(诸如表16中所示的示例模式)来定义针对各种元素的数据类型和针对GPCCTileInventory描述符的属性。
表16-针对GPCCTileInventory描述符的XML模式的示例
客户端可以(例如,最先)从MPD中存在的图块库存边界框信息中选择图块ID,例如以流传输来自服务器的分图块的G-PCC组件数据。具有所选择的tile_id的G-PCC组件可被流传输到客户端。
可以发信号通知动态G-PCC图块库存信息。关于变化的信息可以被携带在G-PCC基础轨道的样本中,例如,如果/在参数集数据和/或图块库存信息动态改变的情形下。在示例中(例如,如果/当基于几何的点云中存在多个图块和/或图块的边界框信息动态变化时)可以在Main Adaptation Set的Representation的Media Segment中携带图块边界框信息(例如,连同参数集数据)。
空间区域可以是静态的。可以(例如,使用GPCC3DRegions描述符)发信号通知空间区域的特性和/或区域与G-PCC图块之间的映射,例如,在3D空间区域是静态的情形下。例如,如果(例如,每个)区域的位置和/或尺寸不随呈现时间改变,则3D空间区域可以是静态的。GPCC3DRegions描述符可以为SupplementalProperty元素,其例如具有等于“urn:mpeg:mpegI:gpcc:2020:gpsr”的@schemeIdUri属性。(例如,单个)GPCC3DRegions描述符可以存在于例如主G-PCC轨道中的自适应集级别或表示级别,和/或基于几何的体积媒体内容的预选择级别。
GPCC3DRegions描述符的@value属性可能不存在。GPCC3DRegions描述符可包括元素和属性(例如,如在表17中指定的)。表17示出了针对GPCC3DRegions描述符的元素和属性的示例。
表17-针对GPCC3DRegions描述符的元素和属性的示例
可由模式(诸如表18中举例示出的XML模式)来定义针对各种元素的数据类型和针对GPCC3DRegions描述符的属性。表18示出了针对GPCC3DRegions描述符的XML模式的示例。
表18-针对GPCC3DRegions描述符的XML模式的示例
在示例中,可以(例如,使用GPCC3DRegions描述符)发信号通知空间区域的特性和/或空间区域与G-PCC组件的对应AdaptationSet之间的映射,例如,在3D空间区域是静态的并且/或者如果图块库存信息不可用的情形下。该GPCC3DRegions描述符可以为SupplementalProperty元素,其例如具有等于“urn:mpeg:mpegI:gpcc:2020:gpsr”的@schemeIdUri属性。(例如,单个)GPCC3DRegions描述符可以存在于例如主G-PCC轨道中的自适应集级别和/或表示级别,和/或基于几何的体积媒体内容的预选择级别。
GPCC3DRegions描述符的@value属性可能不存在。GPCC3DRegions描述符可包括元素和属性(例如,如在表19中指定的)。表19示出了针对GPCC3DRegions描述符的元素和属性的示例。
表19-针对GPCC3DRegions描述符的元素和属性的示例
可以例如根据模式诸如XML模式来定义针对各种元素的数据类型和针对GPCC3DRegions描述符的属性。表20示出了针对GPCC3DRegions描述符的XML模式的示例。
表20-针对GPCC3DRegions描述符的XML模式的示例
在示例中,可以使用GPCC3DRegionId描述符来发信号通知空间区域与G-PCC组件的对应的AdaptationSet之间的映射,例如,如果/在3D空间区域是静态的情形下。GPCC3DRegionId描述符可以为具有等于“urn:mpeg:mpegI:gpcc:2020:gp3rid”的@schemeIdUri属性的SupplementalProperty元素。(例如,单个)GPCC3DRegionId描述符可以存在于(例如,每个)G-PCC组件的自适应集级别处。GPCC3DRegionId可能不存在,例如,如果/当gpsr.spatialRegion@asIds属性存在于GPCC3DRegions描述符中时。
GPCC3DRegionId描述符的@value属性可能不存在。GPCC3DRegionId描述符可包括例如如表21所示的一个或多个属性。
表21-针对GPCC3DRegionID描述符的属性的示例
针对属性的数据类型可如XML模式中所提供。表22中的示例示出了针对GPCC3DRegionID描述符的XML模式。该模式可以用具有命名空间urn:mpeg:mpegI:gpcc:2020的XML模式来表示,例如,如表22中的示例所指定的。
表22-GPCCRegionId描述符模式
在示例中,可以(例如,使用GPCC组件描述符)发信号通知空间区域与G-PCC组件的一个或多个对应的AdaptationSet之间的映射,例如,如果/当3D空间区域是静态时。GPCCComponent描述符可包括例如如表23中所定义的元素和属性。GPCC3DRegionID描述符可能不存在,例如,如果/当@region_Id属性存在于GPCCComponents描述符中时。
表23-针对GPCCComponent描述符的元素和属性
表24示出了针对GPCCComponent描述符的XML模式示例。
表24-针对GPCCComponent描述符的XML模式的示例
空间区域可以是动态的。在一些示例中(例如,如果/在3D分区是动态的情形下),用于发信号通知呈现时间线中的(例如,每一个)3D区域的位置和/或尺寸的定时元数据轨道可以在具有(例如,单个)表示的(例如,独立的)AdaptationSet中携带。自适应集可以与主G-PCC自适应集相关联(例如,链接)。所使用的属性可包括@associationId属性和@associationType值,该值可包括针对对应的AdaptationSet和/或Representation的4CC‘gpdr’。
可以发信号通知时间级别信息。流传输客户端可以标识(例如,需要标识)存在于G-PCC Component AdaptationSet或G-PCC Tile Component AdaptationSet的表示中的时间级别。流传输客户端可以标识(例如,需要标识)G-PCC内容的时间级别轨道表示之间的解码依赖性。
在示例中,具有等于“urn:mpeg:mpegI:gpcc:2020:temporallevelIds”的@schemeIdUri属性的SupplementalProperty元素(其可被称为GPCCTemporalLevelId描述符)可用于区分G-PCC流的不同时间级别。例如,如果G-PCC媒体被存储在多个时间级别轨道中,则GPCCTemporalLevelId描述符(例如,仅一个GPCCTemporalLevelId描述符)可以存在于G-PCC媒体的表示集级别处。例如,如果G-PCC组件媒体样本被划分为多个时间级别以及/或者如果时间级别样本(例如,所有时间级别样本)被存储在时间级别轨道(例如,单个时间级别轨道)中,则GPCCTemporalLevelId描述符(例如,仅一个GPCCTemporalLevelId描述符)可存在于G-PCC媒体的表示集级别。例如,如果G-PCC媒体样本不是基于时间级别划分的,则GPCCTemporalLevelId描述符可能不存在于表示集级别。
GPCCTemporalLevelId描述符的@value属性可能不存在。GPCCTemporalLevelId描述符可包括例如表25中所示的属性。
在示例中,较高时间级别内容的表示可以取决于较低时间级别内容的表示。较高时间级别标识符内容Representation对较低时间级别Representation的依赖性可以例如基于可以在较高时间级别内容Representation中发信号通知的@dependencyId属性来标识。较高时间级别内容Representation中的@dependencyId属性的值可以等于对应的较低时间级别内容Representation的@id属性值。
表25-针对GPCCTemporalLevelId描述符的属性
属性的数据类型可以在XML模式中定义。本文描述了GPCCTemporalLevelId描述符的XML模式的示例。模式可以用XML模式来表示,例如,具有名称空间urn:mpeg:mpegI:gpcc:2020,例如,如表26中所示。
表26-针对GPCCTemporalLevelId描述符的XML模式的示例
表27示出了DASH MPD文件发信号通知具有封装在两个时间级别轨道中的三个时间级别的G-PCC内容的示例。
表27-发信号通知G-PCC内容的DASH
MPD文件的示例
流传输客户端行为可以与多个时间级别轨道表示相关联。在一些示例中(例如,如表27中的示例所示),MPD可包括具有几何组件和一个或多个(例如,三个)属性组件的G-PCC内容。例如,G-PCC内容样本可被划分为多个(例如,三个)时间级别。G-PCC组件时间级别样本可以使用例如两个时间级别轨道封装在ISOBMFF文件中以及/或者可以作为一个或多个G-PCC组件(例如,每个G-PCC组件)的两个时间级别轨道表示在MPD文件中发信号通知。
图12示出了G-PCC序列中的多个时间级别的示例。如图12中的示例所示,可以利用G-PCC时间级别ID描述符(例如,GPCCTemporalLevelId描述符)的一个或多个(例如,三个)属性来指示多个时间级别轨道表示。不同的时间级别可以在两个连续帧之间具有相同或不同的呈现时间差T。例如,G-PCC序列中的时间级别0可具有呈现时间差T0,例如,如图12所示。G-PCC序列中的时间级别1可具有呈现时间差T1,例如,如图12所示。G-PCC序列中的时间级别2可具有呈现时间差T1,例如,如图12所示。
流传输客户端或设备(例如,被配置用于部分访问)可以(例如,最先)发出来自内容服务器的对MPD文件的HTTP请求。客户端可以从内容服务器下载(例如,并且从而接收)MPD文件。客户端可解析MPD文件,例如,以生成MPD文件中的XML元素的对应存储器内表示。
客户端可以例如通过检查@codecs属性来确认/理解G-PCC内容的存在。例如,如果@codecs属性被设定为‘gpc1’,则自适应集中存在的内容可以为G-PCC组件。例如,如果@codecs属性被设定为‘gpt1’,则自适应集中存在的内容可以为G-PCC图块组件。
客户端可以从MPD文件的预选择元素(例如,@Preselection元素中提到的)中提供的自适应集列表中选择自适应集(例如,所需的自适应集)。
在示例中(例如,在选择自适应集之后),客户端可以扫描在所选择的自适应集中可用的表示集。客户端可以找到具有GPCCTemporalLevelId描述符的多个表示集。客户端可以确认和/或理解(例如,基于找到多个表示集)内容是用多个时间级别轨道封装的,并且可以在MPD中用多个时间级别轨道表示来发信号通知。
客户端可以例如通过确认/理解与GPCCTemporalLevelId描述符相关联的@temporal_level_Ids属性来确认和/或理解一个或多个表示(例如,每个表示)中存在的时间级别。客户端可以确定与一个或多个表示集中的表示集相关联的多个时间级别标识(ID)值。时间级别ID值(例如,多个时间级别ID值中的每一个时间级别ID值)可以指示与表示集相关联的时间级别轨道。
客户端可以确定与所选择的自适应集相关联的一个或多个表示集。客户端可以从多个时间级别ID值中选择时间级别ID值。对时间级别ID的选择可以取决于流传输客户端或被配置用于部分访问的设备的一项或多项能力(例如,功率)。例如,客户端可以选择(例如,最先)具有时间级别值0的表示。客户端可以(例如,如果客户端带宽和解码能力足够)从相同的自适应集中选择具有较高时间级别(例如,以递增顺序)的另一个表示。例如,为了成功解码,较高的时间级别表示可以依赖于较低的时间级别表示。例如,客户端可以使用在RepresentationSet级别发信号通知的@dependencyId属性来标识依赖表示。例如,客户端可以选择@id值等于2的较高时间级别表示。客户端可以确认/理解@id值等于2的表示取决于@id值等于1的表示,例如基于@dependencyId属性值被设定为1。客户端可以调度对与所选择的时间级别ID值相关联的一个或多个表示的下载。例如,客户端可以调度对多个表示的下载(例如,两个表示都包括@id值等于1的表示和和@id值等于2的从属表示)。
流传输客户端行为可基于信令。可例如通过在MPD中提供的信息来引导DASH客户端。以下是用于(例如,动态地、选择性地或部分地)流传输基于几何的点云压缩内容(例如,基于时间级别(例如,如本文所描述的))的客户端行为的示例。示例客户端行为可以假设(例如,基于配置、指示和/或确定)使用G-PCC描述符来发信号通知组件AdaptationSet与主点云AdaptationSet的关联。
客户端可以(例如,最先)发出HTTP请求。客户端可以从内容服务器下载MPD文件。客户端可解析MPD文件,例如,以生成MPD文件中的XML元素的对应存储器内表示。
流传输客户端可以检查在周期级别(例如,具有被设定为‘gpc1’或‘gpt1’的@codecs属性)的PreSelection元素,例如,以标识Period中的可用G-PCC媒体内容。
可例如通过检查PreSelection的@preselectionComponents属性中的ID列表来标识属于由PreSelection元素表示的点云内容的AdaptationSet。Main Adaptation Set可具有@id值,其与该列表中的第一ID的@id值相等。
流传输客户端可例如通过检查AdaptationSet的G-PCC描述符来标识独特的点云的数量。流传输客户端可以将其G-PCC描述符中具有相同@gpcId值的AdaptationSet分组为相同内容的版本。
流传输客户端可以(例如,能够)例如通过检查@preselectionComponent属性的ID列表中引用的剩余AdaptationSet的GPCCComponent描述符来标识点云的组件。流传输客户端可以将(例如,每个)组件映射到其对应的AdaptationSet。在AdaptationSet中可能存在一个以上的点云组件。
例如,可以基于用户希望流传输的点云内容,从@preselectionComponent属性的ID列表中选择具有与内容相对应的G-PCC描述符中存在的@gpcId值的AdaptationSet组。流传输客户端可以选择具有支持版本(例如,支持分辨率)的AdaptationSet组,例如,在存在具有相同的@gpcId值的多个预选择描述符的情形下。例如,可以选择唯一的AdaptationSet组,否则(例如,如果不存在具有相同的@gpcId值的多个预选择描述符)。
客户端可例如通过以下操作来开始流传输点云:下载针对Main Adaptation Set的包括用于初始化G-PCC解码器的参数集的初始化片段。
例如,可以下载经译码的组件流的初始化片段并且将其高速缓存在存储器中。
流传输客户端可以从Main Adaptation Set和组件Adaptation Set(例如,通过HTTP并行地)下载(例如,开始下载)时间对齐的媒体片段。所下载的片段可被存储在存储器内片段缓冲器中。
例如,时间对齐的媒体片段可以从它们相应的缓冲器中移除,并且与它们相应的初始化片段连接。
例如,可以解析媒体容器(例如,ISO基础媒体文件格式(ISOBMFF))以提取G-PCC比特流的基本流信息和结构。比特流可以被传递到G-PCC解码器。
可例如使用如本文所述的MPD信令来实现用于流传输具有多个图块的G-PCC媒体的客户端行为。客户端(例如,流媒体客户端)可以发出HTTP请求并且从内容服务器下载MPD文件。客户端可解析MPD文件,例如,以生成MPD文件中的XML元素的对应存储器内表示。
客户端可以例如基于@codecs属性设定为‘gpcb’的AdaptationSet元素和/或@codecs属性设定为‘gpt1’的PreSelection元素来标识Period中可用的G-PCC分图块的媒体内容。
客户端可以基于其当前视口来标识点云比特流中感兴趣的图块,例如,如果/当存在G-PCC分图块的媒体内容时。例如,客户端可以解析GPCC3DRegions描述符,并且可以找到视口内的相应图块。可以下载定时元数据Adaptation Set的Media Segment,例如,如果/当3D分区是动态的时。定时元数据Adaptation Set可以携带呈现时间线中的(例如,每个)3D区域的位置和/或尺寸。可标识在视口内的3D区域。属于视口内的3D区域的相应图块可以被标识。
客户端可以(例如,如果找到感兴趣的图块)例如通过解析(例如,每个)PreSelection元素中存在的GPCCTileId描述符来选择具有属于视口内的3D区域的图块的PreSelection元素。GPCCTileId描述符中的@tile_Ids属性可以列出可用的图块。可以选择具有感兴趣图块的PreSelection元素。其他Preselection可以被忽略。
客户端可以(例如,如果/当GPCCTileId描述符不可用时)例如通过从@preselectionComponents属性的ID列表找到几何Tile Component Adaptation Set以及从存在于几何Tile Component Adaptation Set中的GPCCComponent描述符的图块id列表来标识存在于PreSelection元素中的图块。例如,如果感兴趣的图块存在于PreSelection元素中,则客户端可以选择PreSelection元素。
可以从@preselectionComponent属性的ID列表标识待用于下载Media Segment的Tile Component Adaptation Set组(例如,根据所选择的Preselection)。@preselectionComponents列表可包括几何Tile Component Adaptation Set ID。@preselectionComponents列表可包括剩余组件的Tile Component Adaptation Set ID。在@preselectionComponents列表中可不存在Main Adaptation Set的ID。例如,可以使用几何Tile Component Adaptation Set的Representation中的@dependencyId属性来标识Main Adaptation Set的ID。
客户端可以例如通过从Main Adaptation Set下载Initialization Segment来流传输(例如,开始流传输)点云。Initialization Segment可包括用于初始化G-PCC解码器的参数集(例如,可能需要的参数集)。
例如,可以下载经译码的组件流的初始化片段(例如,如果存在的话),并且将其高速缓存在存储器中。
流传输客户端可以从几何Tile Component Adaptation Set和相关联的属性TileComponent Adaptation Set下载时间对齐的Media Segment。下载可以通过HTTP并行进行。所下载的片段可被存储在存储器内片段缓冲器中。
时间对齐的媒体片段可从其相应的缓冲器移除和与其相应的初始化片段级联。
可以解析媒体容器(例如,ISOBMFF)以提取基本流信息。媒体容器可以例如根据G-PCC标准来构造。所得的比特流可以被传递到G-PCC解码器。
本文描述了许多实施方案。实施方案的特征可跨各种权利要求类别和类型单独或以任何组合提供。此外,实施方案可包括在本文跨各种权利要求类别和类型(诸如例如以下项中的任一者)单独或以任何组合描述的特征、设备或方面中的一者或多者。
解码器诸如示例解码器300可被配置为例如:接收、解码和解译指示与点云组件相关联的元素、属性和元数据的信号(例如,如本文所述);标识媒体呈现描述符(MPD)内的点云流及其组件子流;标识点云和/或其组件的版本;对MPD进行解码以标识主自适应集和其他自适应集,从而标识基于几何的点云压缩(G-PCC)内容中的G-PCC组件;对MPD进行解码以标识自适应集或表示中的点云组件的类型;对MPD进行解码以标识一个或多个预选择;对MPD进行解码以标识G-PCC媒体的一个或多个版本;对MPD进行解码以标识一个或多个G-PCC图块组;对MPD进行解码以标识针对自适应集中的G-PCC组件的一个或多个图块ID;对MPD进行解码以标识空间区域的一个或多个特性和区域与G-PCC图块之间的映射、空间区域的特性和区域与G-PCC组件的对应自适应集之间的映射、和/或空间区域与G-PCC组件的对应自适应集之间的映射;对MPD进行解码以标识针对动态空间区域的定时元数据轨道;等等。
一种包括处理器的视频设备,该处理器可包括示例解码器300,该视频设备可被配置为:获得媒体呈现描述(MPD)文件,其中该MPD文件可以指示与G-PCC媒体内容相关联的一个或多个自适应集;从一个或多个自适应集中选择自适应集;确定与所选择的自适应集相关联的表示集;从MPD文件获得与表示集的表示相关联的G-PCC描述符的指示,其中G-PCC描述符可用于标识表示中存在的一个或多个时间级别;以及/或者基于G-PCC描述符来调度对表示的下载。G-PCC描述符可包括一组时间级别标识符或者可以与一组时间级别标识符相关联,其中该组时间级别标识符中的一个(例如,每个)时间级别标识符可以与G-PCC媒体内容的G-PCC组件媒体样本相关联。与G-PCC媒体内容相关联的G-PCC组件媒体样本可被划分成多个时间级别。时间级别标识符中的一个(例如,每个)时间级别标识符可以与G-PCC组件媒体样本的时间级别相关联。一组G-PCC组件媒体样本可被存储在单个时间级别轨道中。G-PCC描述符可以存在于表示级别处。在一些示例中,至多一个G-PCC描述符可以与表示集相关联。G-PCC描述符可以为GPCCTemporalLevelId描述符。
例如,包括熵解码、逆量化、逆变换和/或差分解码中的一项或多项的解码工具和技术可用于在解码器中实现本文描述的示例。
编码器(诸如示例编码器200)被配置为:例如,生成、编码和发送指示与点云组件相关联的元素、属性和元数据的信号(例如,如本文所述);对MPD进行编码以指示点云流及其组件子流;对MPD进行编码以指示主自适应集和其他自适应集,从而支持对基于几何的点云压缩(G-PCC)内容中的G-PCC组件的标识;对MPD进行编码以支持对自适应集或表示中的点云组件的类型的标识;对MPD进行编码以标识一个或多个预选择;对MPD进行编码以支持对G-PCC媒体的一个或多个版本的标识;对MPD进行编码以支持对一个或多个G-PCC图块组的标识;对MPD进行编码以支持对自适应集中的G-PCC组件的一个或多个图块ID的标识;对MPD进行编码以支持对以下各项的标识:空间区域的一个或多个特性和区域与G-PCC图块之间的映射、空间区域的特性和区域与G-PCC组件的对应自适应集之间的映射、和/或空间区域与G-PCC组件的对应自适应集之间的映射;对MPD进行解码以标识针对动态空间区域的定时元数据轨道;等等。
包括处理器的视频设备(该视频设备可包括示例编码器200)可被配置为:生成媒体呈现描述(MPD)文件,其中MPD文件可以指示与G-PCC媒体内容相关联的一个或多个自适应集,其中表示集可以与自适应集相关联;其中G-PCC描述符的指示可以与表示集的表示相关联,其中G-PCC描述符可以用于标识表示中存在的一个或多个时间级别,并且其中可以基于G-PCC描述符来调度对表示的下载。G-PCC描述符可包括一组时间级别标识符或者可以与一组时间级别标识符相关联,其中该组时间级别标识符中的一个(例如,每个)时间级别标识符可以与G-PCC媒体内容的G-PCC组件媒体样本相关联。与G-PCC媒体内容相关联的G-PCC组件媒体样本可被划分成多个时间级别。时间级别标识符中的一个(例如,每个)时间级别标识符可以与G-PCC组件媒体样本的时间级别相关联。一组G-PCC组件媒体样本可被存储在单个时间级别轨道中。G-PCC描述符可以存在于表示级别处。在一些示例中,至多一个G-PCC描述符可以与表示集相关联。G-PCC描述符可以为GPCCTemporalLevelId描述符。
例如,包括量化、熵译码、逆量化、逆变换和差分译码中的一者或多者的编码工具和技术可以用于在编码器中实现本文所述的示例。
语法元素可以被插入到信令中,例如,以使解码器能够标识与执行本文所述的示例中的任一示例相关联的指示。
语法元素可以被插入到信令中,例如,以使编码器能够生成与执行本文所述的示例中的任一示例相关联的指示或对其进行编码。
比特流或信号可包括所描述的语法元素中的一个或多个语法元素或其与执行本文所述的示例中的任一示例相关联的变型形式。
一种方法、过程、装置、存储指令的介质、存储数据的介质或用于创建和/或发射和/或接收和/或解码可包括所述的语法元素中的一个或多个语法元素或其变型的比特流或信号的信号。
用于创建和/或发射和/或接收和/或解码的信号的方法、过程、装置、存储指令的介质、存储数据的介质或信号可以根据本文所述的示例中的任一个示例来实现。
TV、机顶盒、蜂窝电话、平板计算机或其他电子设备可以在点云流传输服务中执行根据本文所述的示例中的任一示例的基于几何的点云(诸如点云组件子流)的自适应流传输。
TV、机顶盒、蜂窝电话、平板计算机或其他电子设备可以在点云流传输服务中执行根据本文所述的示例中的任一示例的基于几何的点云(诸如点云组件子流)的自适应流传输,以及/或者可以显示(例如,使用监测器、屏幕或其他类型的显示器)所得图像。
TV、机顶盒、蜂窝电话、平板计算机或其他电子设备可以(例如,使用调谐器)选择信道以接收包括编码图像的信号,以及/或者可以在点云流传输服务中执行根据本文所述的示例中的任一示例的基于几何的点云(诸如点云组件子流)的自适应流传输。
TV、机顶盒、蜂窝电话、平板计算机或其他电子设备可以(例如,使用天线)通过无线电接收包括经编码的图像的信号,以及/或者可以在点云流传输服务中执行根据本文所述的示例中的任一示例的基于几何的点云(诸如点云组件子流)的自适应流传输。
尽管上文以特定组合描述了特征和元件,但是本领域的普通技术人员将理解,每个特征或元件可单独使用或以与其他特征和元件的任何组合来使用。此外,本文所述的方法可在结合于计算机可读介质中以供计算机或处理器执行的计算机程序、软件或固件中实现。计算机可读介质的示例包括电子信号(通过有线连接或无线连接发射)和计算机可读存储介质。计算机可读存储介质的示例包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、高速缓存存储器、半导体存储器设备、磁介质(诸如内置硬盘和可移动磁盘)、磁光介质和光介质(诸如CD-ROM磁盘和数字通用光盘(DVD))。与软件相关联的处理器可用于实施用于WTRU、UE、终端、基站、RNC或任何主计算机的射频收发器。
Claims (16)
1.一种视频设备,包括:
处理器,所述处理器被配置为:
获得媒体呈现描述(MPD)文件,其中所述MPD文件指示与基于几何的点云压缩(G-PCC)媒体内容相关联的一个或多个自适应集;
从所述一个或多个自适应集中选择自适应集;
确定与所选择的自适应集相关联的表示集;
从所述MPD文件获得与所述表示集的表示相关联的G-PCC描述符的指示,其中所述G-PCC描述符用于标识所述表示中存在的一个或多个时间级别;以及
基于所述G-PCC描述符来调度对所述表示的下载。
2.根据权利要求1所述的视频设备,其中所述G-PCC描述符与一组时间级别标识符相关联,其中所述一组时间级别标识符中的每一个时间级别标识符与所述G-PCC媒体内容的G-PCC组件媒体样本相关联。
3.根据权利要求2所述的视频设备,其中与所述G-PCC媒体内容相关联的所述G-PCC组件媒体样本被划分为多个时间级别。
4.根据权利要求2所述的视频设备,其中所述时间级别标识符中的每一个时间级别标识符与G-PCC组件媒体样本的时间级别相关联。
5.根据权利要求4所述的视频设备,其中一组G-PCC组件媒体样本被存储在单个时间级别轨道中。
6.根据权利要求1所述的视频设备,其中所述G-PCC描述符存在于表示级别处。
7.根据权利要求1所述的视频设备,其中至多一个G-PCC描述符与所述表示集相关联。
8.根据权利要求1所述的视频设备,其中所述G-PCC描述符是GPCCTemporalLevelId描述符。
9.一种方法,包括:
获得媒体呈现描述(MPD)文件,其中所述MPD文件指示与基于几何的点云压缩(G-PCC)媒体内容相关联的一个或多个自适应集;
从所述一个或多个自适应集中选择自适应集;
确定与所选择的自适应集相关联的表示集;
从所述MPD文件获得与所述表示集的表示相关联的G-PCC描述符的指示,其中所述G-PCC描述符用于标识所述表示中存在的一个或多个时间级别;以及
基于所述G-PCC描述符来调度对所述表示的下载。
10.根据权利要求9所述的方法,其中所述G-PCC描述符与一组时间级别标识符相关联,其中所述一组时间级别标识符中的每一个时间级别标识符与所述G-PCC媒体内容的G-PCC组件媒体样本相关联。
11.根据权利要求10所述的方法,其中与所述G-PCC媒体内容相关联的所述G-PCC组件媒体样本被划分为多个时间级别。
12.根据权利要求10所述的方法,其中所述时间级别标识符中的每一个时间级别标识符与G-PCC组件媒体样本的时间级别相关联。
13.根据权利要求12所述的方法,其中一组G-PCC组件媒体样本被存储在单个时间级别轨道中。
14.根据权利要求9所述的方法,其中所述G-PCC描述符存在于表示级别处。
15.根据权利要求9所述的方法,其中至多一个G-PCC描述符与所述表示集相关联。
16.根据权利要求9所述的方法,其中所述G-PCC描述符是GPCCTemporalLevelId描述符。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/252,366 | 2021-10-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118285108A true CN118285108A (zh) | 2024-07-02 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019342612B2 (en) | Methods and apparatus for point cloud compression bitstream format | |
US20240195999A1 (en) | Dynamic adaptation of volumetric content component sub-bitstreams in streaming services | |
US20230188751A1 (en) | Partial access support in isobmff containers for video-based point cloud streams | |
CN114631325A (zh) | 基于视频的点云流 | |
US20230276053A1 (en) | Adaptive streaming of geometry-based point clouds | |
US20240022773A1 (en) | Mmt signaling for streaming of visual volumetric video-based and geometry-based point cloud media | |
CN118285108A (zh) | 基于几何的点云的自适应流传输 | |
KR20240089338A (ko) | 기하구조 기반 포인트 클라우드의 적응적 스트리밍 | |
WO2023059730A1 (en) | Adaptive streaming of geometry-based point clouds | |
CN116830588A (zh) | 用于基于视觉体积视频(v3c)媒体和基于几何的点云(g-pcc)媒体的流式传输的mmt信令 | |
WO2024006279A1 (en) | Signaling parameter sets for geometry-based point cloud streams | |
CN118216140A (zh) | 用于云游戏视频译码的变换单元划分 | |
WO2024081395A1 (en) | Viewport and/or region-of-interest dependent delivery of v3c data using rtp |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |