TW201714452A

TW201714452A - 用於高效率視訊寫碼（ｈｅｖｃ）及延伸之視訊參數集

Info

Publication number: TW201714452A
Application number: TW105143030A
Authority: TW
Inventors: 陳盈; 王益魁
Original assignee: 高通公司
Priority date: 2012-07-02
Filing date: 2013-07-02
Publication date: 2017-04-16
Also published as: EP2868085A1; TWI575936B; US20170094277A1; RU2015103126A; EP3200465B1; BR122017006773A2; EP3200465A1; US9716892B2; TW201415895A; IL236071A0; BR122017006773B1; WO2014008286A1; JP2015526972A; CN107105295B; KR101799165B1; BR112014033008A2; JP6400660B2; CN104396253B; CN107105295A; RU2654138C2

Abstract

一視訊處理器件可經組態以進行以下操作：處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該參數集中接收用於該參數集之一偏移語法元素，該偏移語法元素識別該參數集內之待跳過之語法元素；及基於該偏移語法元素來跳過該參數集內之該等語法元素；及處理該參數集中之一或多個額外語法元素，該一或多個額外語法元素係在該參數集中處於該等被跳過之語法元素之後。

Description

用於高效率視訊寫碼(HEVC)及延伸之視訊參數集

本申請案係關於以下各申請案：2012年7月2日申請之美國臨時申請案第61/667,387號，2012年7月9日申請之美國臨時申請案第61/669,587號，及2013年3月15日申請之美國臨時申請案第61/798,135號，該等美國臨時申請案中之每一者之全部內容係以引用之方式併入本文中。

本發明係關於視訊資料之處理，且更特定言之，本發明描述有關於產生及處理用於視訊資料之參數集之技術。

可將數位視訊能力併入於廣泛範圍之器件中，包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術，諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第十部分(進階視訊寫碼(AVC))定義之標準、目前在開發中之高效率視訊寫碼(HEVC)標準及此等標準之延伸中所描述之視訊壓縮技術。視訊器件可藉由實施此等視訊壓縮技術來更有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。

視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼，視訊切片(亦即，視訊圖框或視訊圖框之一部分)可被分割成多個視訊區塊，視訊區塊亦可被稱為樹型區塊、寫碼單元(CU)及/或寫碼節點。圖像之經框內寫碼(I)切片中之視訊區塊係使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之經框間寫碼(P或B)切片中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他圖像中之參考樣本的時間預測。圖像可被稱為圖框，且參考圖像可被稱為參考圖框。

空間或時間預測產生用於待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間寫碼區塊係根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼。經框內寫碼區塊係根據框內寫碼模式及殘餘資料來編碼。為了進一步壓縮，殘餘資料可自像素域變換至變換域，從而產生接著可被量化之殘餘變換係數。最初配置成二維陣列的經量化之變換係數可經掃描以便產生變換係數之一維向量，且可應用熵寫碼以達成甚至更多壓縮。

本發明描述用於視訊寫碼中之參數集之設計技術，且更特定言之，本發明描述有關於視訊參數集(VPS)之技術。VPS為可應用於多個完整視訊序列之語法結構。根據本發明之技術，VPS可包括一偏移語法元素以使一媒體感知網路元件(MANE)能夠自固定長度語法元素之一個集合跳至固定長度語法元素之另一集合，其中被跳過之語法元素可能包括可變長度語法元素。

在一個實例中，一種處理視訊資料之方法包括：處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該參數集中接收該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素；基於該偏移語法元素來跳過該參數集內之該等語法元素；及處理該參數集中之一或多個額外語法元素，其中該一或多個額外語法元素在該參數集中處於該等被跳過之語法元素之後。

在另一實例中，一種處理視訊資料之方法包括：產生與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；產生用於該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素的數目；產生待跳過之該等語法元素；及產生該參數集中之一或多個額外語法元素，其中該一或多個額外語法元素在該參數集中處於待跳過之該等語法元素之後。

在另一實例中，一種解碼視訊資料之方法包括：解碼與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該視訊位元串流中接收該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素；及解碼待跳過之該等語法元素。

在另一實例中，視訊處理器件包括一視訊處理元件，該視訊處理元件經組態以進行以下操作：處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該參數集中接收該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素；基於該偏移語法元素來跳過該參數集內之該等語法元素；及處理該參數集中之一或多個額外語法元素，其中該一或多個額外語法元素在該參數集中處於該等被跳過之語法元素之後。

在另一實例中，一種視訊處理器件包括一視訊處理元件，該視訊處理元件經組態以進行以下操作：產生與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；產生用於該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素的數目；產生待跳過之該等語法元素；產生該參數集中之一或多個額外語法元素，其中該一或多個額外語法元素在該參數集中處於待跳過之該等語法元素之後。

在另一實例中，一種視訊處理器件包括一視訊處理元件，該視訊處理元件經組態以進行以下操作：解碼與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該視訊位元串流中接收該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素；及解碼待跳過之該等語法元素。

在另一實例中，一種視訊處理器件包括：用於處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素的構件；用於在該參數集中接收該參數集之一偏移語法元素的構件，其中該偏移語法元素識別該參數集內之待跳過之語法元素；用於基於該偏移語法元素來跳過該參數集內之該等語法元素的構件；用於處理該參數集中之一或多個額外語法元素的構件，其中該一或多個額外語法元素在該參數集中處於該等被跳過之語法元素之後。

在另一實例中，一種電腦可讀儲存媒體儲存在執行時使一或多個處理器進行以下操作之指令：處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該參數集中接收該參數集之一偏移語法元素，其中該偏移語法元素識別該參數集內之待跳過之語法元素；基於該偏移語法元素來跳過該參數集內之該等語法元素；及處理該參數集中之一或多個額外語法元素，其中該一或多個額外語法元素在該參數集中處於該等被跳過之語法元素之後。

在附圖及以下描述中陳述一或多個實例之細節。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。

10‧‧‧視訊編碼及解碼系統

12‧‧‧源器件

14‧‧‧目的地器件

16‧‧‧鏈路

18‧‧‧視訊源

20‧‧‧視訊編碼器

22‧‧‧輸出介面

27‧‧‧儲存器件

28‧‧‧輸入介面

29‧‧‧媒體感知網路器件(MANE)

30‧‧‧視訊解碼器

32‧‧‧顯示器件

35‧‧‧分割單元

41‧‧‧預測處理單元

42‧‧‧運動估計單元

44‧‧‧運動補償單元

46‧‧‧框內預測處理單元

50‧‧‧求和器

52‧‧‧變換處理單元

54‧‧‧量化單元

56‧‧‧熵編碼單元

57‧‧‧後處理器件

58‧‧‧反量化單元

60‧‧‧反變換處理單元

62‧‧‧求和器

63‧‧‧濾波器單元

64‧‧‧圖像記憶體

79‧‧‧網路實體

80‧‧‧熵解碼單元

81‧‧‧預測處理單元

82‧‧‧運動補償單元

84‧‧‧框內預測處理單元

86‧‧‧反量化單元

88‧‧‧反變換處理單元

90‧‧‧求和器

91‧‧‧濾波器單元

92‧‧‧圖像記憶體

150‧‧‧網路

152‧‧‧伺服器器件

154A‧‧‧路由器件

154B‧‧‧路由器件

156‧‧‧轉碼器件

158‧‧‧用戶端器件

圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統之方塊圖。

圖2為說明實例MVC解碼次序之概念圖。

圖3為展示實例MVC時間及視圖間預測結構之概念圖。

圖4為說明可實施本發明中所描述之技術的實例視訊編碼器之方塊圖。

圖5為說明可實施本發明中所描述之技術的實例視訊解碼器之方塊圖。

圖6為說明形成網路之部分的器件之實例集合之方塊圖。

圖7為展示根據本發明之技術的用於處理參數集之實例方法的流程圖。

圖8為展示根據本發明之技術的用於產生參數集之實例方法的流程圖。

圖9為展示根據本發明之技術的用於解碼參數集之實例方法的流程圖。

圖10為展示根據本發明之技術的用於處理參數集之實例方法的流程圖。

圖11為展示根據本發明之技術的用於產生參數集之實例方法的流程圖。

圖12為展示根據本發明之技術的用於處理參數集之實例方法的流程圖。

圖13為展示根據本發明之技術的用於產生參數集之實例方法的流程圖。

本發明描述用於視訊寫碼中之參數集之技術，且更特定言之，本發明描述有關於視訊參數集(VPS)之技術。除VPS外，參數集之其他實例包括(僅列舉一些)序列參數集(SPS)、圖像參數集(PPS)及適應參數集(APS)。

視訊編碼器編碼視訊資料。視訊資料可包括一或多個圖像，其中該等圖像中之每一者為形成視訊之部分的靜態影像。當視訊編碼器編碼視訊資料時，視訊編碼器產生一位元串流，其包括形成視訊資料之經寫碼表示的位元之序列。該位元串流可包括經寫碼圖像及相關聯之資料，其中經寫碼圖像指代圖像之經寫碼表示。相關聯之資料可包括各種類型之參數集(包括VPS、SPS、PPS及APS)，及可能之其他語法結構。SPS用以攜載對整個視訊序列有效之資料，而PPS攜載基於逐圖像有效之資訊。APS攜載圖像自適應資訊，圖像自適應資訊亦基於逐圖像有效，但預期比PPS中之資訊更頻繁地改變。

HEVC亦已引入VPS，HEVC工作草案將VPS描述如下：視訊參數集(VPS)：一語法結構，其含有應用於零個或多個完整之經寫碼視訊序列之語法元素，完整之經寫碼視訊序列由在seq_parameter_set_id語法元素所參考之序列參數集中發現之video_parameter_set_id語法元素之內容判定，seq_parameter_set_id語法元素係在每一切片區段標頭中所發現之pic_parameter_set_id語法元素所參考之圖像參數集中發現。

因此，由於VPS應用於完整之經寫碼視訊序列，因此VPS包括很少改變之語法元素。在HEVC之一些版本中，VPS、SPS、PPS及APS機制自經寫碼視訊區塊資料之傳輸去耦很少改變之資訊之傳輸。在一些應用中，VPS、SPS、PPS及APS可經「頻帶外」遞送，亦即，不與含有經寫碼視訊資料之單元一起輸送。頻帶外傳輸通常係可靠的，且相對於頻道內傳輸而言對改良可靠性可為需要的。在HEVC WD7中，可針對每一參數集來寫碼VPS、SPS、PPS或APS之識別符(ID)。每一SPS包括一SPS ID及一VPS ID，每一PPS包括一PPS ID及一SPS ID，且每一切片標頭包括一PPS ID且可能包括一APS ID。以此方式，可使用ID來識別待在不同例子中使用之適當參數集。

如上文所介紹，視訊編碼器通常編碼視訊資料，且解碼器通常解碼視訊資料。然而，編碼器及解碼器並非用於處理視訊資料之唯一器件。當視訊係(例如)作為基於封包之網路(諸如，區域網路、廣域網路或諸如網際網路之全球網路)之部分而輸送時，路由器件及其他此等器件可處理視訊資料以便將視訊資料自源遞送至目的地器件。特殊路由器件(有時被稱作媒體感知網路元件(MANE))可基於視訊資料之內容而執行各種路由功能。為了判定視訊資料之內容且執行此等路由功能，MANE可存取經編碼位元串流中之資訊，諸如VPS或SPS中之資訊。

在一參數集中，一些語法元素係使用固定數目個位元來寫碼，而一些語法元素係使用可變數目個位元來寫碼。為了處理具可變長度之語法元素，器件可需要熵解碼能力。然而，執行熵解碼可引入對MANE或其他網路元件而言不合需要之一定程序之複雜性。根據本發明中所引入之一項技術，可將一偏移語法元素包括於一參數集(諸如，VPS)中，以便幫助網路元件識別可在無任何熵解碼之情況下解碼之語法元素。固定長度語法元素可在該偏移語法元素之前。該偏移語法元素可接著識別參數集中之待使用可變長度語法元素加以寫碼之語法元素。藉由使用該偏移語法元素，一器件(諸如，MANE)可略過經可變長度寫碼之語法元素且重新繼續處理固定長度語法元素。該偏移語法元素可藉由識別該參數集中內之待跳過的位元組之數目來識別待跳過之語法元素。此等被跳過之位元組可對應於被跳過之語法元素。如上文所提及，被跳過之語法元素可包括經可變長度寫碼之語法元素且亦可包括經固定長度寫碼之語法元素。

在此上下文中，跳過語法元素意謂MANE可避免對以可變長度寫碼之語法元素進行剖析或其他處理。因此，MANE可在不必執行熵解碼之情況下處理VPS中之一些語法元素(例如，固定長度元素)，同時跳過可能另外需要熵解碼之某些語法元素。MANE所跳過之語法元素不限於可變長度語法元素，此係因為一些固定長度語法元素在各種實例中亦可被跳過。視訊解碼器可經組態以在接收到該偏移語法元素後即基本上忽略語法元素中之一或多者，此意謂該視訊解碼器可避免剖析及處理MANE所跳過之語法元素。

偏移語法元素之使用可(例如)藉由消除對MANE執行熵解碼之需要來降低MANE處理參數集之多個部分所需之複雜性。另外，如本發明中所建議，偏移語法元素之使用可使階層格式能夠用於參數集。作為階層格式之實例，在VPS中，替代使用於基礎層及增強層之語法元素在VPS內互混，基礎層之所有或實質上所有語法元素可在第一增強層之所有或實質上所有語法元素之前，第一增強層之所有或實質上所有語法元素又可在第二增強層之所有或實質上所有語法元素之前，等等。藉由使用本發明中所引入之偏移語法元素，MANE可處理用於基礎層之數個固定長度語法元素、跳過用於該基礎層之數個可變長度語法元素、處理用於第一增強層之數個固定長度語法元素、跳過用於該第一增強層之數個可變長度語法元素、處理用於第二增強層之數個固定長度語法元素，等等。視訊解碼器可經組態以剖析並處理MANE所跳過之語法元素。

偏移語法元素之使用可另外實現視訊寫碼標準之未來延伸。舉例而言，即使將其他類型之經可變長度寫碼之資訊添加至位元串流(例如，根據HEVC之未來延伸)，亦可定義一或多個偏移語法元素以促進跳過此等可變長度元素。換言之，該一或多個偏移語法元素可用以識別該位元串流內之固定長度語法元素之位置，且該等偏移語法元素可經修改以說明該位元串流中之任何其他元素之添加，(例如)MANE可避免針對該等任何其他元素進行解碼。

本發明另外建議將有關於作業階段協商之語法元素包括於視訊參數集中，與包括於諸如SPS之另一參數集中相對比。藉由將有關於作業階段協商之語法元素包括於VPS中，發信號附加項可能夠尤其在VPS描述用於視訊之多個層之資訊(與僅用於單一層之資訊相對比)時減少。此外，本發明建議將固定長度語法元素用於作業階段協商語法元素，且固定長度作業階段協商語法元素可位於任何可變長度語法元素之前。為了處理可變長度之語法元素，器件需要能夠執行熵解碼。然而，執行熵解碼可能引入對MANE而言不合需要之一定程序之複雜性。因此，藉由使用存在於VPS中之在任何可變長度語法元素之前的固定長度語法元素，MANE可能夠在不必執行熵解碼之情況下剖析用於作業階段協商之語法元素。

下文之表2展示可包括於VPS中的作業階段協商相關語法元素之實例。用於作業階段協商之資訊之實例包括識別設定檔、層疊(tier)及層級之資訊。HEVC工作草案將設定檔、層疊及層級描述如下：「設定檔」為此建議｜國際標準所指定之完整位元串流語法之子集。在由給定設定檔之語法強加之界限內，仍可能取決於位元串流中之語法元素所選用之值(諸如，經解碼圖像之指定大小)而需要編碼器及解碼器之效能之極大變化。在許多應用中，實施能夠處置特定設定檔內之語法之所有假想用途的解碼器目前既不實際亦不經濟。

為了處置此問題，在每一設定檔內指定「多個層疊」及「多個層級」。層疊之層級係強加於位元串流中之語法元素之值的約束之指定集合。此等約束可為對值之簡單限制。或者，其可採用對值之算術組合的約束形式(例如，圖像寬度乘以圖像高度乘以每秒解碼之圖像數目)。為較低層疊指定之層級比為較高層疊指定之層級受更多約束。

在用戶端與MANE之間的作業階段協商期間，用戶端可查詢在 MANE處根據特定設定檔、層級及/或層疊寫碼之視訊資料之可用性。MANE可能夠剖析VSP之包括設定檔、層級及層疊資訊之第一部分(亦即，經固定長度寫碼之部分)。在MANE處可用之操作點之中，可由用戶端選擇一適當操作點，且MANE可在作業階段經協商之後將對應封包轉遞至用戶端。

本發明另外建議將用於識別假想參考解碼器(HRD)之語法元素包括於視訊參數集中，與包括於諸如SPS之另一參數集中相對比。該等HRD參數識別指定對確認NAL單元串流或確認編碼程序可產生之位元組串流之變化性之約束的假想解碼器模型。兩個類型之HRD參數集(NAL HRD參數及VCL HRD參數)可包括於VPS中。NAL HRD參數係關於類型II位元串流確認，而VCL HRD參數係關於所有位元串流確認。HEVC目前區分經受HRD確認之兩個類型之位元串流。第一類型之位元串流被稱作類型I位元串流且指代僅含有用於位元串流中之所有存取單元之VCL NAL單元及填充符資料NAL單元的NAL單元串流。第二類型之位元串流被稱作類型II位元串流且含有用於位元串流中之所有存取單元之VCL NAL單元及填充資料NAL單元加上其他類型之額外NAL單元。

本發明之技術可在單層寫碼中應用，亦可應用於可調式及多視圖視訊寫碼。舉例而言，層可為空間可調層、品質可調層、紋理視圖或深度視圖。在HEVC中，層通常指代視訊寫碼層(VCL)NAL單元及相關聯之非VCL NAL單元之集合，該等NAL單元全部具有特定層ID值。在第一層可含有較低層之意義上，層可為階層式的。有時使用層集合(layer set)來指代藉由子位元串流提取程序自另一位元串流建立之位元串流內所表示的層之集合。操作點通常指代藉由對另一位元串流進行子位元串流提取程序之操作而自另一位元串流建立之位元串流。操作點可包括層集合中之所有層或可為形成為該層集合之子集之位元串流。

圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統10之方塊圖。如圖1所展示，系統10包括產生在稍後時間由目的地器件14解碼之經編碼視訊資料的源器件12。經編碼視訊資料可由媒體感知網路元件(MANE)29自源器件12投送至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中之任一者，包括桌上型電腦、筆記型(亦即，膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話、所謂的「智慧型」板之電話手機、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件，或其類似者。在一些情況下，源器件12及目的地器件14可為無線通信而裝備。

系統10可根據多個不同視訊寫碼標準、一專屬標準或多視圖寫碼之任何其他方式而操作。舉例而言，視訊編碼器20及視訊解碼器30可根據諸如包括以下各者之視訊壓縮標準而操作：ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC)，包括標準之可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)延伸。MVC延伸之新近公眾可得之聯合草案係描述於「Advanced video coding for generic audiovisual services」(ITU-T建議H.264，2010年3月)中。MVC延伸之更新近公眾可得之聯合草案係描述於「Advanced video coding for generic audiovisual services」(ITU-T建議H.264，2011年6月)中。MVC延伸之當前聯合草案已自2012年1月起被核准。

另外，存在新的視訊寫碼標準，即，目前由ITU-T視訊寫碼專家群(VCEG)及ISO/IEC動畫專家群(MPEG)之視訊寫碼聯合工作小組(JCT-VC)開發之高效率視訊寫碼(HEVC)標準。HEVC之近期工作草案(WD)(且在下文中被稱為HEVC WD7)可自2013年7月1起自http：//phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v6.zip獲得。

HEVC標準之開發在進行中，且HEVC之較新工作草案(WD)(被稱為HEVC WD9)可自2013年7月1起自http：//phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v10.zip獲得。出於描述目的，將在HEVC或H.264標準及此等標準之延伸之內容脈絡下描述視訊編碼器20及視訊解碼器30。然而，本發明之技術不限於任何特定寫碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263。專屬寫碼技術(諸如，被稱為On2 VP6/VP7/VP8之寫碼技術)亦可實施本文中所描述之該等技術中之一或多者。即將到來之HEVC標準之較新草案(被稱為「HEVC工作草案10」或「HEVC WD10」)係描述於Bross等人之「Editors' proposed corrections to HEVC version 1」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合工作小組(JCT-VC)，第13次會議(Incheon，KR)，2013年4月)中，該較新草案自2013年7月1日起可自http：//phenix.int-evry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M0432-v3.zip獲得，其全部內容係以引用之方式併入本文中。

本發明之技術可能可應用於若干MVC及/或3D視訊寫碼標準，包括基於HEVC之3D視訊寫碼(3D-HEVC)。本發明之技術可能亦可應用於H.264/3D-AVC及H.264/MVC+D視訊寫碼標準或其延伸，以及其他寫碼標準。有時可參考或使用特定視訊寫碼標準之術語來描述本發明之技術；然而，不應將此描述解譯為意謂該等所描述技術僅限於彼特定標準。

目的地器件14可經由鏈路16來接收待解碼之經編碼視訊資料。鏈路16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14 的任何類型之媒體或器件。在一個實例中，鏈路16可包含通信媒體以使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14。可根據諸如無線通信協定之通信標準來調變經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體，諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如，區域網路、廣域網路，或諸如網際網路之全球網路)之部分。通信媒體可包括路由器、交換器、基地台，或可用於促進自源器件12至目的地器件14之通信之任何其他設備。鏈路16可包括將視訊資料自源器件12投送至目的地器件14之一或多個MANE，諸如MANE 29。

或者，經編碼資料可自輸出介面22輸出至儲存器件27。類似地，經編碼資料可由輸入介面自儲存器件27存取。儲存器件27可包括多種分散式或本端存取之資料儲存媒體(諸如，硬碟、藍光光碟(Blu-ray disc)、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體，或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體)中之任一者。在另一實例中，儲存器件27可對應於可保留由源器件12產生之經編碼視訊之一檔案伺服器或另一中間儲存器件。目的地器件14可經由串流傳輸或下載而自儲存器件27存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將該經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括web伺服器(例如，用於網站)、FTP伺服器、網路附接儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)來存取經編碼視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如，Wi-Fi連接)、有線連接(例如，DSL、纜線數據機等)或兩者之組合。經編碼視訊資料自儲存器件27之傳輸可為串流傳輸、下載傳輸或兩者之組合。可使用一或多個 MANE(諸如，MANE 29)將自儲存器件27擷取之視訊資料投送至目的地器件14。

本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼，該等多媒體應用諸如空中(over-the-air)電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸(例如，經由網際網路)、待儲存於資料儲存媒體上之數位視訊之編碼、儲存於資料儲存媒體上之數位視訊之解碼，或其他應用。在一些實例中，系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。

在圖1之實例中，源器件12包括視訊源18、視訊編碼器20及輸出介面22。視訊編碼器20可(例如)產生本發明中所描述之偏移語法。在一些情況下，輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中，視訊源18可包括諸如以下各者之源：視訊俘獲器件(例如，視訊攝影機)、含有先前所俘獲之視訊之視訊存檔、用以自視訊內容提供者接收視訊之視訊饋送介面，及/或用於產生作為源視訊之電腦圖形資料之電腦圖形系統，或此等源之組合。作為一個實例，若視訊源18為視訊攝影機，則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而，一般而言，本發明中所描述之該等技術可適用於視訊寫碼，且可應用於無線及/或有線應用。

經俘獲、經預先俘獲或電腦產生之視訊可由視訊編碼器12來編碼。經編碼視訊資料可經由源器件20之輸出介面22直接傳輸至目的地器件14。經編碼視訊資料亦可(或替代地)儲存至儲存器件27上以便由目的地器件14或其他器件稍後存取以用於解碼及/或播放。

目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。視訊解碼器30可剖析本發明中所描述之偏移語法元素。如上所述，視訊解碼器30可在一些例子中忽略偏移語法元素，因此使視訊解碼器30 能夠剖析由MANE跳過之語法元素。在一些情況下，輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28經由鏈路16接收經編碼視訊資料。經由鏈路16傳達或在儲存器件27上提供之經編碼視訊資料可包括由視訊編碼器20產生之多種語法元素，其供諸如視訊解碼器30之視訊解碼器在解碼視訊資料時使用。此等語法元素可包括於在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器上之經編碼視訊資料中。

顯示器件32可與目的地器件14整合或在目的地器件14外部。在一些實例中，目的地器件14可包括整合式顯示器件且亦可經組態以與外部顯示器件介接。在其他實例中，目的地器件14可為顯示器件。一般而言，顯示器件32向使用者顯示經解碼視訊資料，且可包含多種顯示器件中之任一者，諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。

雖然圖1中未展示，但在一些態樣中，視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合，且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若適用，則在一些實例中，MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。

視訊編碼器器20及視訊解碼器30可各自實施為多種合適編碼器電路中之任一者，諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地以軟體實施時，器件可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中，且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中，其中之任一者可整合為各別器件中之組合式編碼器/解碼器(編解碼器(CODEC))之部分。

JCT-VC致力於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之演進模型，其被稱為HEVC測試模型(HM)。HM根據(例如)ITU-T H.264/AVC來假定視訊寫碼器件相對於現有器件之若干額外能力。舉例而言，H.264提供九個框內預測編碼模式，而HM可提供多達三十三個框內預測編碼模式。

一般而言，HM之工作模型描述：視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之一序列。樹型區塊具有與H.264標準之巨集區塊之目的類似的目的。切片以寫碼次序包括數個連續樹型區塊。可將視訊圖框或圖像分割成一或多個切片。每一樹型區塊可根據四分樹而分裂成多個寫碼單元(CU)。舉例而言，作為四分樹之根節點，樹型區塊可分裂成四個子代節點，且每一子代節點又可為親代節點且可分裂成另外四個子代節點。作為四分樹之葉節點，最後未分裂之子代節點包含寫碼節點，亦即，經寫碼視訊區塊。與經寫碼位元串流相關聯之語法資料可定義樹型區塊可分裂之最大次數，且亦可定義寫碼節點之最小大小。

CU包括寫碼節點及與寫碼節點相關聯之多個預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小且形狀必須為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹型區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼而不同。PU之形狀可分割成非正方形。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹至一或多個TU之分割。TU之形狀可為正方形或非正方形。

HEVC標準允許根據TU之變換，該等變換對於不同CU可不同。通常基於針對經分割LCU定義之給定CU內之PU的大小來設定TU大小，但情況可能並非始終如此。TU通常與PU大小相同或小於PU。在一些實例中，可使用被稱為「殘餘四分樹」(RQT)之四分樹結構而將對應於CU之殘餘樣本再分為多個較小單元。RQT之葉節點可被稱為變換單元(TU)。可變換與TU相關聯之像素差值以產生可被量化之變換係數。

一般而言，PU包括有關於預測程序之資料。舉例而言，當PU經框內模式編碼時，PU可包括描述PU之框內預測模式之資料。作為另一實例，當PU經框間模式編碼時，PU可包括描述定義PU之運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如，四分之一像素精度或八分之一像素精度)、運動向量所指向之參考圖像及/或運動向量之參考圖像清單(例如，清單0、清單1或清單C)。

一般而言，TU用於變換程序及量化程序。具有一或多個PU之給定CU亦可包括一或多個變換單元(TU)。在預測之後，視訊編碼器20可計算對應於PU之殘餘值。殘餘值包含像素差值，可使用UT將該等值變換成變換係數、量化且掃描以產生用於熵寫碼之串列式變換係數。本發明通常使用術語「視訊區塊」來指代CU之寫碼節點。在一些特定情況下，本發明亦可使用術語「視訊區塊」來指代包括一寫碼節點及多個PU及多個TU之樹型區塊(亦即，LCU或CU)。

視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)通常包含一系列一或多個視訊圖像。GOP可在GOP之標頭中、圖像中之一或多者之標頭中的或在別處包括描述包括於GOP中之圖像之數目的語法資料。圖像之每一切片可包括描述各別切片之編碼模式之切片語法資料。視訊編碼器20通常對個別視訊切片內之視訊區塊進行操作以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小，且可根據指定寫碼標準而在大小方面不同。

作為一實例，HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N，則HM支援以2N×2N或N×N之PU大小進行框內預測，及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援不對稱分割以按2N×nU、2N×nD、nL×2N及nR×2N之PU大小進行框間預測。在不對稱分割中，CU之一方向未分割，而另一方向分割成25%及75%。CU之對應於25%分割之部分由「n」繼之以「上」、「下」、「左」或「右」之指示來指示。因此，例如，「2N×nU」指代在水平方向上以頂部2N×0.5N PU及底部2N×1.5N PU分割之2N×2N CU。

在本發明中，「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸及水平尺寸上之像素尺寸，例如，16×16像素或16乘16像素。一般而言，16×16區塊將在垂直方向上具有16個像素(y=16)，且在水平方向上具有16個像素(x=16)。同樣，N×N區塊通常在垂直方向上具有N個像素，且在水平方向上具有N個像素，其中N表示非負整數值。可按列及行來配置區塊中之像素。此外，區塊未必需要在水平方向上與在垂直方向上具有相同數目個像素。舉例而言，區塊可包含N×M個像素，其中M未必等於N。

在使用CU之PU進行之框內預測性或框間預測性寫碼後，視訊編碼器20可計算CU之TU的殘餘資料。PU可包含空間域(亦被稱為像素域)中之像素資料，且TU可在對殘餘視訊資料應用變換(例如，離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換)後包含變換域中之係數。殘餘資料可對應於未經編碼圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料之TU，且接著變換該等TU以產生CU之變換係數。

在用以產生變換係數之任何變換之後，視訊編碼器20可執行變換係數之量化。量化通常指代如下程序：將變換係數量化以可能減少用以表示該等係數之資料之量，從而提供進一步壓縮。該量化程序可減小與該等係數中之一些或所有相關聯的位元深度。舉例而言，在量化期間可將n位元值降值捨位至m位元值，其中n大於m。

在一些實例中，視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數以產生可加以熵編碼之串列化向量。在其他實例中，視訊編碼器20可執行自適應性掃描。在掃描該等經量化之變換係數以形成一維向量之後，視訊編碼器20可(例如)根據內容脈絡自適應性可變長度寫碼(CAVLC)、內容脈絡自適應性二進位算術寫碼(CABAC)、基於語法之內容脈絡自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法而熵編碼該一維向量。視訊編碼器20亦可熵編碼與經編碼視訊資料相關聯之語法元素以供視訊解碼器30在解碼視訊資料時使用。

為了執行CABAC，視訊編碼器20可將內容脈絡模型內之內容脈絡指派給待傳輸之符號。該內容脈絡可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC，視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可建構VLC中之碼字使得相對較短的碼對應於更有可能的符號，而較長碼對應於較不可能的符號。以此方式，使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用相等長度碼字相比較)。機率判定可基於指派給符號之內容脈絡。

本發明描述用於包括視訊參數集及序列參數集兩者之參數集的設計方法，該等設計方法可以相互相容方式應用於單層寫碼以及可調式及多視圖寫碼中。多視圖視訊寫碼(MVC)為H.264/AVC之延伸。將在下文簡要地論述MVC規範。

圖2為說明根據本發明中所描述之一或多個實例的實例MVC編碼或解碼次序的圖形圖(graphical diagram)。舉例而言，將圖2中所說明之解碼次序配置稱為時間優先寫碼。在圖2中，S0至S7各自指代多視圖視訊之不同視圖。T0至T8各自表示一個輸出時間瞬時。一存取單元可包括一個輸出時間瞬時之所有視圖之經寫碼圖像。舉例而言，第一存取單元包括時間瞬時T0之所有視圖S0至S7(亦即，圖像0至7)，第二存取單元包括時間瞬時T1之所有視圖S0至S7(亦即，圖像8至15)，等等。在此實例中，圖像0至7在同一時間瞬時(亦即，時間瞬時T0)，圖像8至15在同一時間瞬時(亦即，時間瞬時T1)。通常同時顯示具有相同時間瞬時之圖像，且同一時間瞬時之圖像內之物件之間的水平像差及可能之某一垂直像差使觀看者感知涵蓋3D體積之影像。

在圖2中，視圖中之每一者包括圖像之集合。舉例而言，視圖S0包括圖像0、8、16、24、32、40、48、56及64之集合，視圖S1包括圖像1、9、17、25、33、41、49、57及65之集合，等等。每一集合包括兩個圖像：一個圖像被稱為紋理視圖分量，且另一圖像被稱為深度視圖分量。可將一視圖之圖像之一集合內的紋理視圖分量及深度視圖分量視為彼此對應。舉例而言，可將一視圖之圖像之一集合內之紋理視圖分量視為對應於該視圖之該等圖像的該集合內之深度視圖分量，且反之亦然(亦即，深度視圖分量對應於該集合中之其紋理視圖分量，且反之亦然)。如本發明中所使用，可將紋理視圖分量及對應之深度視圖分量視為單一存取單元之同一視圖之部分。

紋理視圖分量包括所顯示之實際影像內容。舉例而言，紋理視圖分量可包括明度(Y)及色度(Cb及Cr)分量。深度視圖分量可指示像素在其對應紋理視圖分量中之相對深度。作為一個實例，深度視圖分量可類似於僅包括明度值之灰階影像。換言之，深度視圖分量可不遞送任何影像內容，而是提供像素在紋理視圖分量中之相對深度之量測值。

舉例而言，深度視圖分量中的對應於純白色像素之像素值可指示：對應紋理視圖分量中之其一或多個對應像素離觀看者之視點較近；且深度視圖分量中的對應於純黑色像素之像素值可指示：對應紋理視圖分量中之其一或多個對應像素離觀看者之視點較遠。對應於黑色與白色之間的各種灰色陰影之像素值指示不同深度位準。舉例而言，深度視圖分量中之極灰色像素指示紋理視圖分量中之其對應像素比深度視圖分量中之輕微灰色像素離得更遠。因為類似於灰階，僅需要一個像素值來識別像素之深度，所以深度視圖分量可僅包括一個像素值。因此，當寫碼深度時不需要類似於色度分量之值。

出於說明目的而提供僅使用明度值(例如，強度值)來識別深度之深度視圖分量，且不應將深度視圖分量視為限制性的。換言之，可利用任何技術來指示像素在紋理視圖分量中之相對深度。

根據MVC，紋理視圖分量係根據同一視圖中之紋理視圖分量或根據一或多個不同視圖中之紋理視圖分量而框間預測。可以視訊資料之區塊寫碼紋理視圖分量，該等區塊可被稱為「視訊區塊」且在H.264內容脈絡中通常被稱作為「巨集區塊」。

在MVC中，視圖間預測由像差運動補償支援，像差運動補償使用H.264/AVC運動補償之語法，但允許將不同視圖中之圖像用作為用於預測正寫碼之圖像之參考圖像。兩個視圖之寫碼亦可由MVC支援。MVC之一個潛在優點為MVC編碼器可將兩個以上視圖視為3D視訊輸入，且MVC解碼器可解碼所俘獲視訊之多視圖表示。具有MVC解碼器之任何呈現器(renderer)可處理具有兩個以上視圖之3D視訊內容。

在MVC中，允許同一存取單元中(亦即，具有相同時間瞬時)之圖像之間的視圖間預測。當寫碼非基本視圖中之圖像時，若圖像在不同視圖中但具有相同視圖瞬時，則可將該圖像添加至參考圖像中。正如任何框間預測參考圖像，視圖間預測參考圖像可置入參考圖像清單之任何位置中。

圖3為說明實例MVC預測型樣之概念圖。在圖3之實例中，說明八個視圖(具有視圖ID「S0」至「S7」)，且針對每一視圖說明十二個時間位置(「T0」至「T11」)。亦即，圖3中之每一列對應於一視圖，而每一行指示一時間位置。在圖3之實例中，大寫「B」及小寫「b」用以指示圖像之間的不同階層關係，而非不同寫碼方法。一般而言，大寫「B」圖像在預測階層中相對高於小寫「b」圖框。

在圖3中，可將視圖S0視為基本視圖，且可將視圖S1至S7視為相依視圖。基本視圖包括並非經視圖間預測之圖像。基本視圖中之圖像可相對於同一視圖中之其他圖像進行框間預測。舉例而言，視圖S0中無圖像可相對於視圖S1至S7中之任一者中之圖像進行框間預測，但視圖S0中之圖像中之一些可相對於視圖S0中之其他圖像進行框間預測。

相依視圖包括經視圖間預測之圖像。舉例而言，視圖S1至S7中之每一視圖包括相對於另一視圖中之圖像進行框間預測之至少一圖像。相依視圖中之圖像可相對於基本視圖中之圖像進行框間預測，或可相對於其他相依視圖中之圖像進行框間預測。

包括基本視圖及一或多個相依視圖兩者之視訊串流可能可由不同類型之視訊解碼器來解碼。舉例而言，一個基本類型之視訊解碼器可經組態以僅解碼基本視圖。另外，另一類型之視訊解碼器可經組態以解碼視圖S0至S7中之每一者。可將經組態以解碼基本視圖及相依視圖兩者之解碼器稱為支援多視圖寫碼之解碼器。

在圖3中之每一列與每一行之相交處指示圖3中之圖像。具有MVC延伸之H.264/AVC標準可使用術語圖框來表示視訊之一部分，而HEVC標準可使用術語圖像來表示視訊之一部分。本發明可互換地使用術語圖像及圖框。

圖3中之圖像係使用包括字母之陰影區塊說明，該字母指示對應圖像係經框內寫碼(亦即，I圖像)、在一個方向上經框間寫碼(亦即，作為P圖像)抑或在多個方向上經框間寫碼(亦即，作為B圖像)。一般而言，藉由箭頭來指示預測，其中箭頭所指向之圖像將箭頭所指出之圖像用於預測參考。舉例而言，視圖S2之在時間位置T0處之P圖像係自視圖S0之在時間位置T0處之I圖像來預測。

如同單視圖視訊編碼，可相對於不同時間位置處之圖像對多視圖視訊寫碼視訊序列之圖像進行預測性編碼。舉例而言，視圖S0之在時間位置T1處之B圖像具有自視圖S0之在時間位置T0處之I圖像指向該B圖像的箭頭，此情形指示該b圖像係自該I圖像預測。然而，另外，在多視圖視訊編碼之內容脈絡中，可以視圖間方式預測圖像。亦即，視圖分量(亦即，紋理視圖分量)可使用其他視圖中之視圖分量用於參考。在MVC中，例如，實現視圖間預測，仿似另一視圖中之視圖分量為框間預測參考。可能之視圖間參考係在序列參數組(SPS)MVC延伸中用信號表示且可藉由參考圖像清單建構程序加以修改，該程序能夠實現框間預測或視圖間預測參考之靈活排序。

圖3提供視圖間預測之各種實例。在圖3之實例中，將視圖S1之圖像說明為係自視圖S1之在不同時間位置處之圖像來預測，以及係自視圖S0及S2之在相同時間位置處之圖像以視圖間方式預測。舉例而言，視圖S1在時間位置T1處之B圖像係自視圖S1之在時間位置T0及T2處之B圖像以及視圖S0及S2在時間位置T1處之B圖像中之每一者來預測。

圖3亦說明使用不同陰影位準之預測階層之變化，其中較大量陰影(亦即，相對較暗)圖框在預測階層中高於具有較少陰影之(亦即，相對較亮)圖框。舉例而言，用全陰影說明圖3中之所有I圖像，而P圖像具有稍微較亮之陰影，且B圖像(及小寫b圖像)相對於彼此具有各種陰影位準，但始終比P圖像及I圖像之陰影亮。

一般而言，預測階層可有關於視圖次序索引，有關之處在於：在預測階層中相對較高之圖像應在階層中相對較低之圖像之前進行解碼。在階層中相對較高之彼等圖像可在階層中相對較低之圖像之解碼期間用作參考圖像。視圖次序索引為指示存取單元中之視圖分量之解碼次序的索引。如H.264/AVC之附錄H(MVC修正)中所指定，視圖次序索引暗示於序列參數集(SPS)MVC延伸中。在SPS中，對於每一索引i，用信號表示對應view_id。視圖分量之解碼可遵循視圖次序索引之遞升次序。若呈現所有視圖，則視圖次序索引將為自0至num_views_minus_1之連續次序。

以此方式，用作參考圖像之圖像係在取決於參考圖像之圖像之前經解碼。視圖次序索引為指示存取單元中之視圖分量之解碼次序的索引。對於每一視圖次序索引i，用信號表示對應view_id。視圖分量之解碼遵循視圖次序索引之遞升次序。若呈現所有視圖，則視圖次序索引之集合可包含自零至比視圖之全部數目小1之連續排序集合。

對於處於階層之相同層級之特定圖像，解碼次序相對於彼此而言可能並不重要。舉例而言，可使用視圖S0之在時間位置T0處之I圖像作為視圖S2之在時間位置T0處之P圖像的參考圖像，視圖S2之在時間位置T0處之P圖像又被用作視圖S4之在時間位置T0處之P圖像的參考圖像。因此，視圖S0之在時間位置T0處之I圖像應在視圖S2之在時間位置T0處之P圖像之前解碼，視圖S2之在時間位置T0處之P圖像又應在視圖S4之在時間位置T0處之P圖像之前解碼。然而，在視圖S1與視圖S3之間，解碼次序並不重要，此係因為視圖S1及視圖S3並不依賴於彼此來預測。實情為，視圖S1及S3僅自在預測階層中較高之其他視圖來預測。此外，可在視圖S4之前解碼視圖S1，只要視圖S1係在視圖S0及視圖S2之後解碼即可。

以此方式，階層排序可用以描述視圖S0至視圖S7。在本發明中，記法「SA>SB」意謂視圖SA應在視圖SB之前進行解碼。藉由使用此記法，在圖2之實例中，S0>S2>S4>S6>S7。又，相對於圖2之實例，S0>S1、S2>S1、S2>S3、S4>S3、S4>S5且S6>S5。不違反此階層排序之用於視圖之任何解碼次序係可能的。因此，許多不同解碼次序係可能的，但具有基於階層排序之限制。

現將描述SPS MVC延伸。視圖分量可使用其他視圖中之視圖分量用於參考，此情形被稱作視圖間預測。在MVC中，實現視圖間預測，仿似另一視圖中之視圖分量為框間預測參考。然而，可能之視圖間參考係在序列參數集(SPS)MVC延伸中用信號表示(如以下語法表表1中所展示)且可藉由參考圖像清單建構程序加以修改，該程序能夠實現框間預測或視圖間預測參考之靈活排序。視訊編碼器20表示經組態以產生如表1中所展示之語法的視訊編碼器之實例，且視訊解碼器30表示經組態以剖析並處理此語法之視訊解碼器之實例。

在SPS MVC延伸中，對於每一視圖，用信號表示可用以形成參考圖像清單0及參考圖像清單1之視圖之數目。如在SPS MVC延伸中用信號表示，用於錨定圖像之預測關係可不同於用於同一視圖之非錨定圖像(在SPS MVC延伸中用信號表示)之預測關係。

現將描述用於HEVC之參數集。在HEVC WD7中，HEVC中之視訊、序列、圖像及適應參數集機制自經寫碼區塊資料之傳輸去耦很少改變之資訊之傳輸。在一些應用中，視訊、序列、圖像及適應參數集可經「頻帶外」遞送，亦即，不與含有經寫碼視訊資料之單元一起輸送。頻帶外傳輸通常為可靠的。

在HEVC WD7中，使用可變長度語法元素「ue(v)」來寫碼視訊序列參數集(VPS)、序列參數集(SPS)、圖像參數集(PPS)或適應參數集(APS)之識別符。每一SPS包括一SPS ID及一VPS ID，每一PPS包括一PPS ID及一SPS ID，且每一切片標頭包括一PPS ID且可能包括一APS ID。

雖然在HEVC WD7中支援視訊參數集(VPS)，但大多數序列層級資訊參數仍僅存在於SPS中。存在WD7之VPS設計之若干問題或可能缺陷。作為一個實例，SPS中所含的相當大量之資訊對於所有SPS可能相同或對於至少兩個SPS可能相同。複製SPS中之此資訊需要較高頻寬。該等參數集(至少包括VPS、SPS及PPS)可能需要在頻帶外用信號表示。若在頻帶內用信號表示，則此位元速率增加對於隨機存取點處之每一調入(tune-in)有效。

作為第二實例，在可能HEVC延伸中，若遵循與AVC類似之設計原理，則操作點描述資訊之大部分可不包括於SPS或VPS中，且實情為，可將SEI訊息用於作業階段初始化及協商。因此，可能需要MANE剖析用於上文所提及之目的之SPS、VPS及SEI訊息。作為第三實例，可在HEVC延伸中改變或移除WD7中存在於SPS中之某一資訊。

為了解決上文所論述之可能問題，本發明針對參數集(包括VPS或其他參數集)之設計建議若干技術。舉例而言，根據本發明中所描述之技術，對於整個經寫碼視訊序列通常相同之資訊可存在於VPS中，而在SPS層級可能改變之語法元素僅可存在於SPS中。其他語法元素在已存在於VPS中之情況下可自SPS排除。

作為本發明之技術之另一實例，有關於作業階段協商之資訊可存在於VPS中。有關於作業階段協商之資訊之實例包括設定檔資訊、層級資訊、圖框解析度資訊、圖框速率資訊及位元速率資訊，以及其他資訊。作為本發明之技術之另一實例，可以某一方式設計VPS，使得對於作業階段協商重要之操作點資訊之剖析不需要可變長度寫碼，操作點資訊可能包括用於基礎層或視圖及用於增強層或視圖兩者之資訊。VPS中之語法元素可經分組，使得對於每一群組，HEVC延伸可提供零個或多個例項，且HEVC延伸中之操作點僅參考索引。

下文提供用於VPS、SPS、視訊可用性資訊(VUI)及HRD參數之語法及語意之各種實例。表2至表6說明第一實例。上文所陳述之表1展示VPS語法之實例。表2至表6中以及本發明之其他表中之「描述符」欄識別用於每一語法元素之位元之數目，其中「v」指示位元之數目可係可變的。「描述符」欄中之數字值指示語法元素係使用固定數目個位元遞送。舉例而言，「u(8)」表示具有固定數目個(八個)位元之語法元素，而「ue(v)」表示具有可變數目個位元之語法元素。為了剖析具有描述符ue(v)之語法元素，剖析器件(諸如，視訊解碼器或MANE)可能需要實施熵寫碼以便解碼並解譯此等語法元素。

現將描述視訊參數集RBSP語意，諸如上文之表2中所展示之語意。表2中之語法元素video_parameter_set_id提供對視訊參數集之識別。藉由使用video_parameter_set_id之值，另一語法結構(諸如，SPS)可啟動(activate)特定VPS。展示實例SPS語法結構之表3(例如)亦包括語法元素video_parameter_set_id。基於SPS中之語法元素 video_parameter_set_id之值，可啟動具有彼相同值之特定VPS以用於寫碼與該SPS相關聯之視訊區塊。通常，多個SPS將與同一VPS相關聯。作為一實例，視訊解碼器30可在視訊資料中接收包括語法元素video_parameter_set_id之第一值之第一SPS，且視訊解碼器30亦可接收包括語法元素video_parameter_set_id之相同值之第二SPS。第一SPS可為包括應用於視訊資料之一或多個完整圖像之語法元素的第一群組之第一語法結構，且第二SPS可為包括應用於視訊資料之一或多個不同完整圖像之語法元素的第二群組之第二語法結構。視訊解碼器30基於來自同一VPS之參數來解碼與第一SPS及第二SPS兩者相關聯之視訊區塊。

以下語法元素具有如在WD7中所指定之序列參數集中具有相同語法元素名稱之彼等語法元素的相同語意，但根據本發明之建議技術已自SPS移至VPS：profile_space、profile_idc、profile_compatability_flag[i]、constraint_flags、level_idc、bit_depth_luma_minus8、bit_depth_chroma_minus8、chroma_format_idc、pic_width_in_luma_samples、pic_height_in_luma_samples、pic_cropping_flag、pic_crop_left_offset、pic_crop_right_offset、pic_crop_top_offset、pic_crop_bottom_offset、temporal_id_nesting_flag及separate_colour_plane_flag。

語法元素profile_space識別用於解譯語法元素profile_idc之內容脈絡，且語法元素profile_idc識別設定檔之群組。語法元素profile_compatability_flag[i]可識別視訊資料是否與設定檔profile[i]相容。視訊解碼器30可(例如)在視訊資料中接收profile_space及profile_idc之值，且基於profile_space之值來識別用於解譯語法元素profile_idc之內容脈絡。基於profile_idc之解譯值，視訊解碼器30可識別設定檔之群組，且對於每一設定檔，視訊解碼器30可接收語法元素 profile_compatability_flag[i]之值以識別視訊資訊是否與profile[i]相容。語法元素profile_idc可(例如)具有32個相關聯之旗標，每一旗標指示設定檔之特定態樣。舉例而言，給定同一設定檔，旗標可指示一個特定寫碼或處理工具是否開啟或關閉。

語法元素level_idc識別與視訊資料相關聯之最大層級，且語法元素level_lower_temporal_layers_present_flag識別視訊資料之時間層是否具有低於最大層級之層級。設定為等於1之語法元素level_lower_temporal_layers_present_flag指定可存在level_idc_temporal_subset[i]。設定為等於0之語法元素level_lower_temporal_layers_present_flag指定不存在level_idc_temporal_subset[i]。語法元素level_idc_temporal_subset[i]指定與由具小於或等於i之temporal_id的所有NAL單元組成之位元串流子集相符的層級。

視訊解碼器30可(例如)回應於接收到設定為等於1之語法元素level_lower_temporal_layers_present_flag而接收語法元素level_idc_temporal_subset[i]。語法元素level_idc_temporal_subset[i]可存在以識別時間層[i]遵照之層級。

語法元素vps_temporal_id_nesting_flag、vps_temporal_id_nesting_flag、vps_max_dec_pic_buffering[i]、vps_num_reorder_pics[i]及vps_max_latency_increase[i]具有分別在HEVC WD 7之序列參數集中之以下語法元素的相同語意：sps_temporal_id_nesting_flag、sps_temporal_id_nesting_flag、sps_max_dec_pic_buffering[i]、sps_num_reorder_pics[i]、sps_max_latency_increase[i]。

語法元素next_essential_info_byte_offset為本發明中所引入之偏移語法元素之實例。語法元素next_essential_info_byte_offset指定設定檔以及VPS NAL單元中之層級資訊及其他經固定長度寫碼之資訊之下一集合自NAL單元之開頭開始的位元組偏移。MANE 29(例如)可接收語法元素next_essential_info_byte_offset且判定由語法元素next_essential_info_byte_offset指示之位元組之數目，且基於位元組之經判定數目，MANE 29可跳過表2中所展示之一或多個經可變長度寫碼之語法元素，諸如可變長度語法元素pic_crop_left_offset、pic_crop_right_offset、pic_crop_top_offset、pic_crop_bottom_offset及表2中所展示之其他可變長度語法元素。然而，視訊解碼器30在接收到語法元素next_essential_info_byte_offset時可忽略該語法元素之值。因此，在剖析語法元素next_essential_info_byte_offset之後，視訊解碼器30可繼續剖析可變長度語法元素pic_crop_left_offset、pic_crop_right_offset、pic_crop_top_offset、pic_crop_bottom_offset及表2中所展示之其他可變長度語法元素。

在HEVC規範之未來延伸(例如，可調式寫碼延伸或3DV延伸)中，用於非基礎層或視圖之VPS資訊可包括於VPS NAL單元中在用於基礎層或視圖之VPS資訊之後。用於非基礎層或視圖之VPS資訊亦可以固定長度語法元素(諸如，作業階段協商必需的經寫碼設定檔、層級及其他資訊)開始。藉由使用由next_essential_info_byte_offset指定之位元偏移，MANE 29可在無需執行熵解碼之情況下定位並存取VPS NAL單元中之必需資訊。經組態以輸送並處理視訊資料之一些網路實體(例如，MANE 29)可能未經配備以用於熵解碼。然而，藉由使用如本發明中所描述之一偏移語法元素，此等網路實例仍可處理參數集之一些態樣，且在為視訊資料作出路由決策時使用經處理語法元素中所含之資訊。網路實體在作出路由決策時可處理之資訊之實例包括有關於作業階段協商之資訊。

語法元素nal_hrd_parameters_present_flag[i]及 vcl_hrd_parameters_present_flag[i]具有與存在於WD7之VUI參數中之nal_hrd_parameters_present_flag及vcl_hrd_parameters_present_flag類似的語意，但可應用於第i個時間層表示。語法元素nal_hrd_parameters_present_flag可(例如)用信號表示HRD參數，諸如位元速率、經寫碼圖像緩衝器(CPB)大小，及初始CPB移除延遲(initial_cpb_removal_delay_length_minus1)、CPB移除延遲(cpb_removal_delay_length_minus1)、DPB輸出延遲(dpb_output_delay_length_minus1)，及時間偏移長度(time_offset_length)。該等語法元素可(例如)包括指示視訊資料之位元速率係恆定抑或可變之一語法元素(cbr_flag)。

語法元素low_delay_hrd_flag可用以指示解碼單元自DPB之移除時間。等於1之語法元素sub_pic_cpb_params_present_flag可指定：子圖像層級CPB移除延遲參數存在且CPB可在存取單元層級或子圖像層級操作。等於0之語法元素sub_pic_cpb_params_present_flag可指定：子圖像層級CPB移除延遲參數不存在且CPB在存取單元層級操作。語法元素num_units_in_sub_tick表示以對應於子圖像時脈刻度計數器之一個增量(稱作子圖像時脈刻度)之time_scale Hz之頻率操作的時脈之時間單位之數目。上文所論述之HRD參數可適用於所有時間層表示。

設定為等於1之語法元素vui_video_parameters_present_flag指定vui_vps( )語法結構存在於VPS中。設定為等於0之此旗標指定vui_vps( )語法元素不存在。語法元素num_vps_short_term_ref_pic_sets指定視訊參數集中所指定之短期參考圖像集合之數目。設定為等於1之語法元素bitrate_info_present_flag[i]指定第i個時間層之位元速率資訊存在於視訊參數集中。設定為0之語法元素bitrate_info_present_flag[i]指定第i個時間層之位元速率資訊不存在於VPS中。

設定為1之語法元素frm_rate_info_present_flag[i]指定第i個時間層之圖框速率資訊存在於視訊參數集中。設定為等於0之語法元素frm_rate_info_present_flag[i]指定第i個時間層之圖框速率資訊不存在於視訊參數集中。

語法元素avg_bitrate[i]指示第i個時間層表示之平均位元速率。以每秒位元數計的第i個時間層表示之平均位元速率係由BitRateBPS(avg_bitrate[i])給出，其中函數BitRateBPS( )由下式指定。

BitRateBPS(x)=(x &(2¹⁴-1)) * 10^(2+(x>>14))

平均位元速率可根據HEVC標準之附錄C中所指定之存取單元移除時間導出。在下文中，bTotal為第i個時間層表示之所有NAL單元中之位元的數目，t₁為VPS所應用於之第一存取單元之移除時間(以秒計)，且t₂為VPS所應用於之最後存取單元(按解碼次序)之移除時間(以秒計)。

用x指定avg_bitrate[i]之值，以下情況適用：

- 若t₁不等於t₂，則以下條件可為真：(x &(2¹⁴-1))==Round(bTotal÷((t₂-t₁) * 10^(2+(x>>14))))

- 否則(t₁等於t₂)，以下條件可為真：(x &(2¹⁴-1))==0

如附錄C中所指定，語法元素max_bitrate_layer[i]指示存取單元移除時間之任何一秒時間窗口中的第i個時間層表示之位元速率之上界。以每秒位元數計的當前可調式層之位元速率之上界係由BitRateBPS(max_bitrate_layer[i])給出，其中函數BitRateBPS( )由方程式G-369指定。位元速率值係根據HEVC標準之附錄C中所指定之存取單元移除時間導出。在下文中，t₁為任何時間點(以秒計)，t₂經設定等於t₁+max_bitrate_calc_window[i]÷100，且bTotal為當前可調式層的屬於具有大於或等於t₁且小於t₂之移除時間之存取單元的所有NAL單元中之位元之數目。用x指定max_bitrate_layer[i]之值，對於t₁之所有值，可遵守以下條件：(x &(2¹⁴-1))>=bTotal÷((t₂-t₁) * 10^(2+(x>>14)))。

語法元素constant_frm_rate_idc[i]指示第i個時間層表示之圖框速率是否恆定。在下文中，時間區段tSeg為當前時間層表示之兩個或兩個以上連續存取單元(按解碼次序)之任何集合，fTotal(tSeg)為時間區段tSeg中之圖像之數目，t₁(tSeg)為時間區段tSeg之第一存取單元(按解碼次序)之移除時間(以秒計)，t₂(tSeg)為時間區段tSeg之最後存取單元(按解碼次序)之移除時間(以秒計)，且avgFR(tSeg)為時間區段tSeg中之平均圖框速率，avgFR(tSeg)係由以下給出：avgFR(tSeg)==Round(fTotal(tSeg) * 256÷(t₂(tSeg)-t₁(tSeg)))。

若第i個時間層表示僅含有一個存取單元或avgFR(tSeg)之值在第i個時間層表示之所有時間區段上恆定，則圖框速率係恆定的，否則，圖框速率不恆定。設定為等於0之語法元素constant_frm_rate_idc[i]指示第i個時間層表示之圖框速率不恆定。設定為等於1之語法元素constant_frm_rate_idc[i]指示第i個時間層表示之圖框速率恆定。

設定為等於2之語法元素constant_frm_rate_idc[i]指示第i個時間層表示之圖框速率可恆定或可不恆定。constant_frm_rate_idc[i]之值可在0至2(包括0及2)之範圍中。

語法元素avg_frm_rate[i]指示第i個時間層表示之平均圖框速率(以每256秒之圖框數為單位)。以fTotal為第i個時間層表示中之圖像之數目，t₁為VPS所應用於之第一存取單元之移除時間(以秒計)，且t₂為VPS所應用於之最後存取單元(按解碼次序)之移除時間(以秒計)，以下情況適用：若t₁不等於t₂，則以下條件可為真：avg_frm_rate[i]==Round(fTotal * 256÷(t₂-t₁))

否則(t₁等於t₂)，以下條件可為真：avg_frm_rate[i]==0

現將描述VUI參數語意。VUI參數中之每一語法元素具有與如在WD7中所指定之VUI參數語法中具有相同名稱之語法元素相同的語意。

現將描述序列參數集RBSP語意。設定為等於1之語法元素use_rps_from_vps_flag指定包括於序列參數集中之短期參考圖像集合係包括於所參考視訊參數集中之短期參考圖像集合之添加(additive)。設定為等於0之語法元素use_rps_from_vps_flag指定包括於序列參數集中之短期參考圖像集合優先於(override)包括於所參考視訊參數集中之短期參考圖像集合。

或者，語法元素num_short_term_ref_pic_sets可不存在於SPS中且可始終經推斷為設定成等於0。或者，語法元素use_rps_from_vps_flag可不存在且可始終經推斷為設定成等於1。或者，語法元素use_rps_from_vps_flag可不存在且可始終經推斷為設定成等於0。

可如下導出變數NumShortTermRefPicSets。

NumShortTermRefPicSets=num_short_term_ref_pic_sets

if(use_rps_from_vps_flag)

NumShortTermRefPicSets+=num_vps_short_term_ref_pic_sets

現將描述切片標頭語意。語法元素short_term_ref_pic_set_idx指定作用中序列參數集中所指定之短期參考圖像集合之清單的索引，該等短期參考圖像集合可用於建立當前圖像之參考圖像集合。語法元素short_term_ref_pic_set_idx可由Ceil(Log2(NumShortTermRefPicSets)) 個位元來表示。short_term_ref_pic_set_idx之值可在0至num_short_term_ref_pic_sets-1(包括0及num_short_term_ref_pic_sets-1)之範圍中，其中num_short_term_ref_pic_sets為來自作用中序列參數集之語法元素。

可如下導出變數StRpsIdx。

if(short_term_ref_pic_set_sps_flag)

StRpsIdx=short_term_ref_pic_set_idx

else

StRpsIdx=NumShortTermRefPicSets

設定為等於0之語法元素tiles_fixed_structure_idc指示經寫碼視訊序列中之任何圖像所參考之每一圖像參數集具有設定為等於0之tiles_or_entropy_coding_sync_idc。設定為等於1之語法元素tiles_fixed_structure_idc指示經寫碼視訊序列中之任何圖像所參考之每一圖像參數集具有語法元素num_tile_columns_minus1、num_tile_rows_minus1、uniform_spacing_flag、column_width[i]、row_height[i]及loop_filter_across_tiles_enabled_flag(當存在時)之相同值。設定為等於2之語法元素tiles_fixed_structure_idc指示經寫碼視訊序列中之圖像所參考的不同圖像參數集中之影像塊語法元素可具有相同值或可不具有相同值。tiles_fixed_structure_idc之值可在0至2(包括0及2)之範圍中。當語法元素tiles_fixed_structure_flag不存在時，推斷該語法元素等於2。

設定為等於1之語法元素tiles_fixed_structure_flag之發信號可向解碼器保證經寫碼視訊序列中之每一圖像具有以相同方式分散之相同數目個影像塊，此可對多執行緒解碼之情況下之工作負載分配有用。

現將描述類似於上文所描述之第一實例之第二實例。在此第二實例中，SPS中剩餘之語法元素可存在於VPS中且有條件地存在於SPS 中。改變並在下文在表7至表9中描述根據此實例之VPS及SPS之語法及語意。

現將描述可選SPS參數語意。此語法結構中之語法元素及語法結構之語意具有與SPS中的具有如第一實例中所指定之相同語法元素名稱的彼等語法元素相同的語意。

現將描述序列參數集RBSP語意。設定為等於1之語法元素sps_parameters_override_flag指定如序列參數集中所指定之自pcm_enabled_flag至tiles_fixed_structure_idc之語法元素及語法結構之值優先於如所參考視訊參數集中所指定之相同語法元素及語法結構之值。設定為等於0之語法元素sps_parameters_override_flag指示如所參考視訊參數集中所指定之自pcm_enabled_flag至tiles_fixed_structure_idc之語法元素及語法結構之值在使用中。

可由MANE 29及/或視訊解碼器30以上文參考表2所描述之方式來處理並剖析表7中所展示之語法元素next_essential_byte_offset。類似地，亦可以上文所描述之方式由視訊編碼器20產生且由視訊解碼器30來處理並剖析語法元素video_parameter_set_id、profile_idc及profile_space。

第三實例為第一實例之超集。在此第三實例中，可以使延伸較容易實施之方式來設計語法。另外，在此實例中可支援VPS之延伸。不存在與第一實例中之對應物完全相同的語法表之語法設計或語意設計。下文參考表10至表19來描述第三實例。

現將描述視訊參數集RBSP語意。語法元素byte_alligned_bits指定使VPS NAL單元中在num_additional_profile_level_info之前的位元經位元組對準之可能位元。語法元素byte_alligned_bits在0至7(包括0及7)之範圍中。語法元素num_additional_profile_level_info指定存在於VPS中之額外設定檔及層級資訊表之數目。語法元素num_additional_rep_fromat_info指定存在於VPS中之額外表示格式資訊表之數目。語法元素num_additional_dependency_operation_points指定進一步存在於位元串流中之相依性操作點之數目，不管時間可調性。每一相依性操作點可包括時間子操作點，每一時間子操作點具有相同層結構。語法元素extension_type指定當前位元串流之延伸之類型，其中0對應於3DV且1對應於SVC。語法元素profile_level_index[k]指示針對當前第k個相依性操作點的用以在VPS中用信號表示之層級資訊表的索引。語法元素ref_format_index指示針對當前第k個相依性操作點的用以在VPS中用信號表示之表示格式資訊表的索引。

語法元素applicable_lowest_temporal_id[k]及applicable_highest_temporal_id[k]分別指定對應於第k個相依性操作點的用信號表示之時間子操作點之最低temporal_id值及最高temporal_id值。或者，語法元素applicable_lowest_temporal_id[k]及applicable_highest_temporal_id[k]均未用信號表示且經推斷為分別等於0及vps_max_temporal_layers_minusl。或者，語法元素applicable_lowest_temporal_id[k]未用信號表示且經推斷為等於0。或者，語法元素applicable_highest_temporal_id[k]未用信號表示且經推斷為等於vps_max_temporal_layers_minus1。

等於1之語法元素depth_included_flag[k]指示當前3DV相依性操作點含有深度。等於0之此旗標指示當前3DV操作點不含深度。或者，語法元素depth_included_flag[k]未用信號表示，因此指示深度VCL NAL單元依賴於layer_id_plust1。

語法元素num_target_output_views_minus1[k]加1指定第k個相依性操作點中之目標輸出視圖之數目。語法元素num_depedent_layers[k]指示用於解碼當前第k個相依性操作點之相依層之數目。語法元素layer_id[k][j]指示第k個相依性操作點之第j個目標輸出視圖之layer_id。語法元素dependent_layer_id[k][j]指示第k個相依性操作點之第j個相依視圖之layer_id。在一個替代例中，恰在dependent_layer_id[k][j]之後，將一旗標用信號表示為direct_dependent_flag[k][j]。

語法元素direct_dependent_flag[k][j]指示第j個相依視圖是否為直接相依視圖，從而用以導出視圖間RPS。語法元素layer_id[k]指示當前第k個(SVC)相依性操作點之最高layer_id。或者，可將num_target_output_views_minus1[k]、num_depedent_layers[k]、layer_id[k][j]及dependent_layer_id[k][j]用信號表示為ue(v)。

語法元素num_additional_vui_vps_set_info可指定存在於VPS中之額外VUI VPS集表之數目。

對於設定檔及層級資訊表語意，語法元素profileLevelInfoIdx指示設定檔及層級資訊表之索引。對於表示格式資訊表語意，語法元素repFormatInfoIdx指示表示格式資訊表之索引。

可由MANE 29及/或視訊解碼器30以上文參考表2所描述之方式來處理並剖析表7中所展示之語法元素next_essential_byte_offset。

對於VUI VPS集表語意，語法元素vuiVpsSetIndex指示VUI VPS集表之索引。

或者，可如下在SPS中用信號表示每一視圖之視圖相依性：

語法元素num_reerence_views指示用以建構視圖間RPS子集之紋理或深度視圖之最大數目。語法元素ref_view_layer_id[i]識別用以指示視圖間RPS子集中之第i個視圖間(唯一)參考圖像的第i個紋理/深度視圖之layer_id。

或者，可如下用信號表示VPS延伸。當語法元素extension_type指示SVC時，不用信號表示語法元素num_additional_dependency_operation_points，但將其導出為等於vps_max_layers_minus1。給定存取單元內之VCL NAL單元處於layer_id之非下降次序中之約束。在MVC中，語法元素layer_id等效於view_idx。在3DV中，可如下根據layer_id計算語法元素view_idx：view_idx=(layer_idx>>1)。

設定為等於1之語法元素depth_present_flag指示可存在含有深度之操作點。設定為等於0之語法元素depth_present_flag指示無操作點含有深度。

語法元素num_target_output_views_minus1[k]加1可用以指定第k個相依性操作點中之目標輸出視圖之數目。語法元素num_dependent_layers[k]可用以指示用於解碼當前第k個相依性操作點之相依層之數目。當將depth_present_flag設定為等於1時，相依層可為深度視圖或紋理視圖兩者。語法元素layer_id[k][j]指示第k個相依性操作點之第j個目標輸出紋理視圖之layer_id。與紋理視圖相關聯之深度視圖之layer_id(若存在)為layer_id[k][j]+1。

或者，對於每一目標輸出視圖，可用信號表示語法元素view_idx[k][j]而非layer_id[k][j]。對於每一view_idx[k][j]，對應紋理視圖之layer_id為(view_idx[k][j]<<depth_present_flag)。若depth_included_flag[k]等於1，則對應深度視圖之layer_id為(view_idx[k][j]<<depth_present_flag)+1，其為(view_idx[k][j]<<1)+1，此係因為在此情況下depth_present_flag必須為1。或者，可將語法元素layer_id[k][j]改變為view_idx[k][j]且用u(v)寫碼，其中長度為5-depth_present_flag。或者，可將語法元素layer_id[k][j]改變為view_idx[k][j]且用u(v)寫碼，其中長度為5-depth_included[k]。

第四實例為第二實例之超集。以延伸友好方式來設計語法。另外，在此實例中提供VPS之延伸。不存在與第二實例中之對應物完全相同之語法表的語法設計或語意設計。

可由MANE 29及/或視訊解碼器30以上文參考表2所描述之方式來處理並剖析表21中所展示之語法元素next_essential_byte_offset。

圖4為說明可實施本發明中所描述之技術的實例視訊編碼器20之方塊圖。視訊編碼器20可(例如)產生上文關於表1至表21所描述之語法結構。視訊編碼器20可執行視訊切片內之視訊區塊之框內及框間寫碼。框內寫碼依賴於空間預測以減少或移除給定視訊圖框或圖像內之視訊中的空間冗餘。框間寫碼依賴於時間預測以減少或移除視訊序列之鄰近圖框或圖像內之視訊中的時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中之任一者。諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干基於時間之壓縮模式中之任一者。

在圖4之實例中，視訊編碼器20包括分割單元35、預測處理單元41、濾波器單元63、圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。預測處理單元41包括運動估計單元42、運動補償單元44及框內預測處理單元46。對於視訊區塊重建構，視訊編碼器20亦包括反量化單元58、反變換處理單元60及求和器62。濾波器單元63意欲表示一或多個迴路濾波器，諸如解區塊濾波器、自適應性迴路濾波器(ALF)及樣本自適應性偏移(SAO)濾波器。雖然在圖4中將濾波器單元63展示為迴路內濾波器，但在其他組態中，濾波器單元63亦可實施為迴路後濾波器。圖4亦展示後處理器件57，其可對由視訊編碼器20產生之經編碼視訊資料執行額外處理。在一些例子中，本發明之技術(其包括產生具有偏移語法元素之參數集)可由視訊編碼器20來實施。然而，在其他例子中，本發明之技術可由後處理器件57來實施。

如圖4中所展示，視訊編碼器20接收視訊資料，且分割單元35將該資料分割成多個視訊區塊。此分割亦可包括分割成切片、影像塊或其他較大單元，以及(例如)根據LCU及CU之四分樹結構的視訊區塊分割。視訊編碼器20通常說明編碼待編碼之視訊切片內之視訊區塊的組件。切片可劃分成多個視訊區塊(且可能劃分成被稱為影像塊之視訊區塊之集合)。預測處理單元41可基於錯誤結果(例如，寫碼速率及失真程度)而為當前視訊區塊選擇複數個可能寫碼模式中之一者(諸如，複數個框內寫碼模式中之一者或複數個框間寫碼模式中之一者)。預測處理單元41可將所得之經框內或經框間寫碼之區塊提供至求和器50以產生殘餘區塊資料，且提供至求和器62以重建構經編碼區塊以用作參考圖像。

預測處理單元41內之框內預測處理單元46可執行當前視訊區塊相對於在與待寫碼之當前區塊相同的圖框或切片中之一或多個相鄰區塊的框內預測性寫碼，以提供空間壓縮。預測處理單元41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊的框間預測性寫碼，以提供時間壓縮。

運動估計單元42可經組態以根據視訊序列之預定型樣判定視訊切片之框間預測模式。預定型樣可將序列中之視訊切片指定為P切片、B切片或GPB切片。運動估計單元42及運動補償單元44可高度整合，但為概念目的而分別說明。由運動估計單元42執行之運動估計為產生運動向量之程序，運動向量估計視訊區塊之運動。舉例而言，運動向量可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖像內之預測性區塊的移位。

預測性區塊為經發現在像素差方面緊密匹配待寫碼之視訊區塊之PU的區塊，像素差可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度來判定。在一些實例中，視訊編碼器20可計算儲存於圖像記憶體64中之參考圖像之子整數像素位置的值。舉例而言，視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此，運動估計單元42可相對於全像素位置及分數像素位置執行運動搜尋且輸出具有分數像素精度之運動向量。

運動估計單元42藉由比較經框間寫碼之切片中之視訊區塊的PU 之位置與參考圖像之預測性區塊之位置來計算PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1)，該等清單中之每一者識別儲存於圖像記憶體64中之一或多個參考圖像。運動估計單元42將計算出之運動向量發送至熵編碼單元56及運動補償單元44。

由運動補償單元44執行之運動補償可涉及基於由運動估計判定之運動向量來提取或產生預測性區塊，從而可能執行至子像素精度之內插。在接收到當前視訊區塊之PU之運動向量後，運動補償單元44可將運動向量所指向之預測性區塊定位於參考圖像清單中之一者中。視訊編碼器20藉由自正經寫碼之當前視訊區塊之像素值減去預測性區塊之像素值來形成殘餘視訊區塊，從而形成像素差值。像素差值形成區塊之殘餘資料，且可包括明度差分量及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊切片相關聯之語法元素以供視訊解碼器30在解碼視訊切片之視訊區塊時使用。

如上所述，作為由運動估計單元42及運動補償單元44執行之框間預測的替代，框內預測處理單元46可對當前區塊進行框內預測。詳言之，框內預測處理單元46可判定用以編碼當前區塊之框內預測模式。在一些實例中，框內預測處理單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式來編碼當前區塊，且框內預測處理單元46(或在一些實例中，模式選擇單元40)可自經測試模式選擇適當框內預測模式來使用。舉例而言，框內預測處理單元46可使用用於各種經測試框內預測模式之速率-失真分析來計算速率-失真值，且在經測試模式中選擇具有最佳速率-失真特性之框內預測模式。速率-失真分析通常判定經編碼區塊與經編碼以產生經編碼區塊的原始未經編碼區塊之間的失真(或誤差)之量，以及用以產生經編碼區塊之位元速率(亦即，位元之數目)。框內預測處理單元46可根據各種經編碼區塊之失真及速率計算比率以判定哪一框內預測模式展現區塊之最佳速率-失真值。

在任何情況下，在選擇用於區塊之框內預測模式之後，框內預測處理單元46可將指示用於區塊之選定框內預測模式之資訊提供至熵編碼單元56。熵編碼單元56可根據本發明之技術來編碼指示選定框內預測模式之資訊。視訊編碼器20可在所傳輸之位元串流中包括組態資料，該組態資料可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦稱為碼字映射表)、各種區塊之編碼內容脈絡之定義，及用於內容脈絡中之每一者的最大機率框內預測模式、框內預測模式索引表及經修改框內預測模式索引表之指示。

在預測處理單元41經由框間預測或框內預測產生當前視訊區塊之預測性區塊之後，視訊編碼器20藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且應用於變換處理單元52。變換處理單元52使用變換(諸如，離散餘弦變換(DCT)或概念上類似之變換)將殘餘視訊資料變換成殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至諸如頻域之變換域。

變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減小位元速率。量化程序可減小與該等係數中之一些或所有係數相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中，量化單元54可接著執行對包括經量化之變換係數之矩陣的掃描。或者，熵編碼單元56可執行該掃描。

在量化之後，熵編碼單元56熵編碼經量化之變換係數。舉例而言，熵編碼單元56可執行內容脈絡自適應性可變長度寫碼(CAVLC)、內容脈絡自適應性二進位算術寫碼(CABAC)、基於語法之內容脈絡自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在藉由熵編碼單元56進行之熵編碼之後，經編碼位元串流可被傳輸至視訊解碼器30，或經存檔以供稍後傳輸或由視訊解碼器30擷取。熵編碼單元56亦可熵編碼正經寫碼之當前視訊切片之運動向量及其他語法元素。

反量化單元58及反變換處理單元60分別應用反量化及反變換，以在像素域中重建構殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖像清單中之一者內的參考圖像中之一者之預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重建構之殘餘區塊以計算子整數像素值以供在運動估計中使用。求和器62將經重建構之殘餘區塊加至由運動補償單元44產生的經運動補償之預測區塊以產生參考區塊以儲存於圖像記憶體64中。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊來框間預測後續視訊圖框或圖像中之區塊。

以此方式，圖4之視訊編碼器20表示經組態以產生上文在表1至表21中所描述之語法的視訊編碼器之實例。視訊編碼器20可(例如)產生如上所述之VPS、SPS、PPS及APS參數集。在一個實例中，視訊編碼器20可針對經寫碼視訊資料產生參數集，該參數集包括繼之以偏移語法元素之一或多個初始固定長度語法元素。該一或多個初始固定長度語法元素可(例如)包括有關於作業階段協商之資訊。當參數集係由MANE處理時，偏移語法元素可指示待跳過之位元組之數目。待跳過之該數目個位元組可(例如)包括一或多個可變長度語法元素。視訊編碼器20可將額外固定長度語法元素包括於參數集中處於該等被跳過之位元組之後。該等額外固定長度語法元素可(例如)包括有關於視訊資料之另一層之資訊。在一個實例中，該等初始固定長度語法元素可包括有關於用於基礎層之作業階段協商之資訊，而該等額外固定長度語法元素可包括有關於用於非基礎層之作業階段協商之資訊。

視訊編碼器20可基於用以寫碼一或多個可變長度語法元素之位元之數目來判定該偏移語法元素之值。舉例而言，針對第一VPS假設：待跳過之語法元素包括2個位元、3個位元及5個位元之三個固定長度語法元素，以及2個位元、4個位元、5個位元及3個位元之四個可變長度語法元素。在此實例中，該等固定長度語法元素包括總10個位元，而該等可變長度語法元素包括總計14個位元。因此，對於該第一VPS，視訊編碼器20可將該偏移語法元素之值設定為24，包括待跳過之24個位元(例如，3個位元組)。對於第二VPS，用於固定長度語法元素之位元之數目將再次為10，但用於可變長度語法元素之位元之數目可不同。因此，對於第二VPS，視訊編碼器20可將該偏移語法元素之值設定為不同值。

已關於視訊編碼器20大體上描述了本發明之技術，但如上文所提及，本發明之技術中之一些亦可由後處理器件57來實施。舉例而言，後處理器件57可針對由視訊編碼器20產生之視訊資料之多個層產生VPS。

圖5為說明可實施本發明中所描述之技術的實例視訊解碼器30之方塊圖。視訊解碼器30可(例如)經組態以處理並剖析上文關於表1至表21所描述之語法結構。在圖5之實例中，視訊解碼器30包括熵解碼單元80、預測處理單元81、反量化單元86、反變換處理單元88、求和器90、濾波器單元91及圖像記憶體92。預測處理單元81包括運動補償單元82及框內預測處理單元84。在一些實例中，視訊解碼器30可執行與關於來自圖4之視訊編碼器20所描述之編碼遍次大體上互反之解碼遍次。

在解碼程序期間，視訊解碼器30自視訊編碼器20接收表示經編碼視訊切片之視訊區塊及相關聯之語法元素的經編碼視訊位元串流。視訊解碼器30可自網路實體79接收經編碼視訊位元串流。舉例而言，網路實體79可為伺服器、MANE、視訊編輯器/剪接器，或經組態以實施上文所描述之技術中之一或多者之其他此種器件。網路實體79可包括或可不包括視訊編碼器20。如上所述，本發明中所描述之技術中之一些可由網路實體79在網路實體79將經編碼視訊位元串流傳輸至視訊解碼器30之前實施。在一些視訊解碼系統中，網路實體79及視訊解碼器30可為單獨器件之部分，而在其他例子中，關於網路實體79所描述之功能性可由包含視訊解碼器30之同一器件執行。

網路實體79表示視訊處理器件之實例，該視訊處理器件經組態以進行以下操作：處理與一視訊位元串流相關聯之一參數集之一或多個初始語法元素；在該參數集中接收該參數集之一偏移語法元素，該偏移語法元素識別該參數集內之待跳過之語法元素；且基於該偏移語法元素來跳過該參數集內之該等語法元素。網路實體79亦可處理該參數集中之一或多個額外語法元素。該一或多個額外語法元素在該參數集中處於該等被跳過之語法元素之後。

在解碼程序期間，視訊解碼器30自視訊編碼器20接收表示經編碼視訊切片之視訊區塊及相關聯之語法元素的經編碼視訊位元串流。該等視訊區塊可(例如)經由一或多個MANE(諸如，圖1中之MANE 29或圖5中之網路實體79)而自視訊編碼器20投送至視訊解碼器30。視訊解碼器30之熵解碼單元80熵解碼該位元串流以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理模組81。視訊解碼器30可在視訊切片層級及/或視訊區塊層級接收語法元素。

如上文所介紹，熵解碼單元80可處理並剖析一或多個參數集(諸如，VPS、SPS、PPS及APS)中之固定長度語法元素及可變長度語法元素兩者。視訊解碼器30可在該等參數集中之一或多者(例如，VPS) 中接收如本發明中所描述之偏移語法元素。回應於接收到偏移語法元素，視訊解碼器30可基本上忽略偏移語法元素之值。舉例而言，視訊解碼器30可接收偏移語法元素，但可不跳過任何語法元素而繼續解碼在該偏移語法元素後之語法元素(包括可變長度語法元素)。

當視訊切片經寫碼為經框內寫碼(I)切片時，預測處理單元81之框內預測處理單元84可基於用信號表示之框內預測模式及來自當前圖框或圖像之先前經解碼區塊之資料產生當前視訊切片之視訊區塊之預測資料。當視訊圖框經寫碼為經框間寫碼(亦即，B、P或GPB)切片時，預測處理單元81之運動補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素產生當前視訊切片之視訊區塊之預測性區塊。可自參考圖像清單中之一者內的參考圖像中之一者產生該等預測性區塊。視訊解碼器30可基於儲存於圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單(清單1及清單1)。

運動補償單元82藉由剖析運動向量及其他語法元素來判定當前視訊切片之視訊區塊之預測資訊，且使用該預測資訊產生正經解碼之當前視訊區塊之預測性區塊。舉例而言，運動補償單元82使用所接收之語法元素中之一些判定用以寫碼視訊切片之視訊區塊之預測模式(例如，框內或框間預測)、框間預測切片類型(例如，B切片、P切片或GPB切片)、用於切片之參考圖像清單中之一或多者的建構資訊、切片之每一經框間編碼視訊區塊之運動向量、切片之每一經框間寫碼視訊區塊之框間預測狀態，及用以解碼當前視訊切片中之視訊區塊的其他資訊。

運動補償單元82亦可基於內插濾波器來執行內插。運動補償單元82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器來計算參考區塊之子整數像素之內插值。在此情況下，運動補償單元82可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器，且使用該等內插濾波器來產生預測性區塊。

反量化單元86反量化(亦即，解量化)提供於位元串流中且由熵解碼單元80解碼之經量化之變換係數。反量化程序可包括將由視訊編碼器20針對視訊切片中之每一視訊區塊計算之量化參數用以判定量化之程度及(同樣地)應該應用的反量化之程度。反變換處理單元88將反變換(例如，反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數以便產生像素域中之殘餘區塊。

在運動補償單元82基於運動向量及其他語法元素產生當前視訊區塊之預測性區塊之後，視訊解碼器30藉由將來自反變換處理單元88之殘餘區塊與由運動補償單元82產生之對應預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之一或多個組件。若需要，亦可將迴路濾波器(在寫碼迴路中或在寫碼迴路之後)用以平滑像素轉變或以其他方式改良視訊品質。濾波器單元91意欲表示一或多個迴路濾波器，諸如解區塊濾波器、自適應性迴路濾波器(ALF)及樣本自適應性偏移(SAO)濾波器。雖然在圖5中將濾波器單元91展示為迴路內濾波器，但在其他組態中，濾波器單元91可實施為迴路後濾波器。接著將給定圖框或圖像中之經解碼視訊區塊儲存於圖像記憶體92中，圖像記憶體92儲存用於後續運動補償之參考圖像。圖像記憶體92亦儲存經解碼視訊以供稍後呈現於顯示器件(諸如，圖1之顯示器件32)上。

以此方式，圖5之視訊解碼器30表示經組態以剖析上文在表1至表21中所描述之語法的視訊解碼器之實例。視訊解碼器30可(例如)剖析如上所述之VPS、SPS、PPS及APS參數集。

圖6為說明形成網路150之部分的器件之實例集合之方塊圖。在此實例中，網路150包括路由器件154A、154B(路由器件154)及轉碼器件156。路由器件154及轉碼器件156意欲表示可形成網路150之部分的少量器件。其他網路器件(諸如，交換器、集線器、閘道器、防火牆、橋接器及其他此等器件)亦可包括於網路150內。此外，可沿著伺服器器件152與用戶端器件158之間的網路路徑提供額外網路器件。在一些實例中，伺服器器件152可對應於源器件12(圖1)，而用戶端器件158可對應於目的地器件14(圖1)。路由器件154可(例如)為經組態以為投送媒體資料之MANE。

一般而言，路由器件154實施一或多個路由協定以經由網路150交換網路資料。一般而言，路由器件154執行路由協定以發現經由網路150之路線。藉由執行此等路由協定，路由器件154B可發現自其本身經由路由器件154A至伺服器器件152之網路路線。圖6之各種器件表示可實施本發明之技術的器件之實例。根據本發明，路由器件154可(例如)為經組態以剖析參數集(諸如，VPS)之語法元素之媒體感知網路元件。舉例而言，路由器件154可在VPS中接收一或多個初始固定長度語法元素且剖析並處理該等固定長度語法元素。該等初始固定長度語法元素可(例如)為有關於作業階段協商之語法元素。路由器件154亦可在該VPS中接收偏移語法元素。該偏移語法元素可識別待跳過之位元組之數目。路由器件154可跳過指定數目個位元組，且在跳過指定數目個位元組之後，可重新繼續剖析並處理該VPS內之固定長度語法元素。該等被跳過之位元組可包括路由器件154不能剖析(此係因為路由器件154不能執行熵解碼操作)之一或多個可變長度語法元素。

圖7為說明如何根據本發明之技術處理偏移語法元素之實例的流程圖。將參考網路器件(諸如，圖1之MANE 29或圖6中之路由器件154中之一者)來描述圖7之技術。該網路實體處理與視訊位元串流相關聯之參數集之一或多個初始語法元素(171)。該一或多個初始語法元素可另外包括固定長度語法元素且在該偏移語法元素之前。該一或多個初始語法元素可包括以下語法元素：該等語法元素包括有關於作業階段協商之資訊。此外，該一或多個初始語法元素包含用於視訊資料之基礎層之語法元素且該一或多個額外語法元素包含用於視訊資料之非基礎層之語法元素。

該網路實體在該視訊位元串流中接收該參數集之偏移語法元素(172)。該偏移語法元素識別該參數集內之待跳過之位元的數目。該偏移語法元素可(例如)為視訊參數集之部分。待跳過之該數目個位元可(例如)對應於使用可變長度寫碼來寫碼之一或多個語法元素。基於該偏移語法元素，該網路實體跳過該參數集內之數個位元(173)。該網路實體處理該參數集中之一或多個額外語法元素(174)。該一或多個額外語法元素在該參數集中處於被跳過之該數目個位元之後。該一或多個額外語法元素可為額外固定長度語法元素，且該一或多個額外語法元素可在該偏移語法元素之後且在待跳過之該等位元之後。

圖8為說明如何根據本發明之技術處理偏移語法元素之實例的流程圖。將參考經組態以編碼視訊資料或處理經編碼視訊資料之視訊處理器件來描述圖8之技術。經組態以處理經編碼視訊資料之視訊處理器件之實例包括圖1及圖4之視訊編碼器20及圖4之後處理器件57。視訊處理器件產生與視訊位元串流相關聯之參數集之一或多個初始語法元素(181)。該一或多個初始語法元素可包括固定長度語法元素，且該一或多個初始語法元素可在該偏移語法元素之前。該一或多個初始語法元素可包括以下語法元素：該等語法元素包括有關於作業階段協商之資訊。該一或多個初始語法元素可包括用於視訊資料之基礎層之語法元素，且該一或多個額外語法元素可包括用於視訊資料之非基礎層之語法元素。

視訊處理器件產生該參數集之偏移語法元素(182)。該偏移語法元素可識別該參數集內之待跳過之位元的數目。該偏移語法元素可為視訊參數集之部分。視訊處理器件產生待跳過之一或多個語法元素(183)。待跳過之該等位元包括待跳過之該一或多個語法元素。待跳過之該一或多個語法元素可包括使用可變長度寫碼來寫碼之一或多個語法元素。視訊處理器件產生該參數集中之一或多個額外語法元素(184)。該一或多個額外語法元素在該參數集中處於待跳過之該數目個位元之後。該一或多個額外語法元素可包括額外固定長度語法元素，該一或多個額外語法元素可在該偏移語法元素之後且在待跳過之該等位元之後。

圖9為說明如何根據本發明之技術解碼偏移語法元素之實例的流程圖。將參考視訊解碼器(諸如，圖1及圖5之視訊解碼器30)來描述圖9之技術。該視訊解碼器解碼與視訊位元串流相關聯之參數集之或多個初始語法元素(191)。該視訊解碼器在該視訊位元串流中接收該參數集之偏移語法元素(192)。該偏移語法元素識別該參數集內之待跳過之位元的數目。該視訊解碼器解碼待跳過之該等位元(193)。在一些實例中，該視訊解碼器藉由執行熵解碼以解碼包括於待跳過之該等位元中之可變長度語法元素來解碼待跳過之該等位元。因為該等位元組在藉由視訊處理器(諸如，MANE)處理視訊資料時被跳過，但該等位元可為解碼視訊資料必需的，所以該視訊解碼器可(例如)解碼待跳過之該等位元。與視訊解碼器相比，MANE可跳過該等位元以便對視訊資料執行特定處理而不必完全解碼視訊資料。在一些例子中，MANE甚至可不必擁有解碼視訊資料所需之所有能力。

圖10為說明如何根據本發明之技術處理VPS之實例的流程圖。將參考通用視訊處理器件來描述圖10之技術。訊處理器件可對應於諸如圖1之MANE 29或圖6中之路由器件154中之一者的網路器件。視訊處理器件可另外對應於諸如圖1及圖4之視訊解碼器30的視訊解碼器。視訊處理器件在視訊參數集中接收包括有關於作業階段協商之資訊之一或多個語法元素(201)。視訊處理器件在該視訊資料中接收第一序列參數集(202)，該第一序列參數集包含識別該視訊參數集之第一語法元素。該第一序列參數集包含第一語法結構，該第一語法結構包括應用於視訊資料之一或多個完整圖像的語法元素之第一群組。視訊處理器件在該視訊資料中接收第二序列參數集(203)，該第二序列參數集包含識別該視訊參數集之第二語法元素。該第二序列參數集包含第二語法結構，該第二語法結構包括應用於視訊資料之一或多個不同完整圖像之語法元素之第二群組。視訊處理器件基於該一或多個語法元素來處理與該第一參數集相關聯之視訊區塊之第一集合及與該第二參數集相關聯之視訊區塊之第二集合(204)。

該一或多個語法元素可為(例如)固定長度語法元素且在該視訊參數集中可處於任何經可變長度寫碼之語法元素之前。該一或多個語法元素可包括識別視訊寫碼標準之設定檔之語法元素。該一或多個語法元素可進一步或替代地包括識別視訊寫碼標準之層級之語法元素。該層級可(例如)對應於與該視訊寫碼標準之該設定檔相關聯的多個層級中之一者。

該一或多個語法元素可包括第一語法元素及第二語法元素。該第一語法元素可識別用於解譯該第二語法元素之內容脈絡，且該第二語法元素可識別設定檔之群組。視訊處理器件可在該視訊參數集中接收一或多個相容性旗標，該一或多個相容性旗標中之每一者與來自設定檔之該群組之設定檔相關聯。該一或多個相容性旗標中之每一者之值可識別視訊資料是否與來自設定檔之該群組之相關聯設定檔相容。

該一或多個語法元素亦可包括識別與視訊資料相關聯之最大時間層級之第一語法元素及識別視訊資料之時間層是否具有低於該最大時間層級之層級之第二語法元素。回應於該第二語法元素指示視訊資料之時間層具有低於該最大時間層級之層級，視訊處理器件可接收額外語法元素，該等額外語法元素識別視訊資料之一或多個時間層之層級。

在多個例子中，當視訊處理器件為視訊解碼器時，該視訊解碼器可解碼視訊區塊之該第一集合及視訊區塊之該第二集合。在多個例子中，當視訊處理器件為MANE時，該MANE可將視訊區塊之該第一集合及視訊區塊之該第二集合轉遞至用戶端器件。

圖11為說明如何根據本發明之技術產生供包括於VPS中之語法元素之實例的流程圖。將參考經組態以編碼視訊資料或處理經編碼視訊資料之視訊處理器件來描述圖8之技術。經組態以處理經編碼視訊資料之視訊處理器件之實例包括圖1及圖4之視訊編碼器20及圖4之後處理器件57。視訊處理器件產生包括有關於作業階段協商之資訊之一或多個語法元素以用於包括於視訊參數集中(211)。視訊處理器件產生第一序列參數集以用於包括於該視訊資料中(212)，該第一序列參數集包含識別該視訊參數集之第一語法元素。該第一序列參數集包含第一語法結構，該第一語法結構包括應用於視訊資料之一或多個完整圖像的語法元素之第一群組。視訊處理器件產生第二序列參數集以用於包括於該視訊資料中(213)，該第二序列參數集包含識別該視訊參數集之第二語法元素。該第二序列參數集包含第二語法結構，該第二語法結構包括應用於視訊資料之一或多個不同完整圖像之語法元素之第二群組。視訊處理器件基於該一或多個語法元素來編碼與該第一參數集相關聯之視訊區塊之第一集合及與該第二參數集相關聯之視訊區塊之第二集合(214)。

該一或多個語法元素亦可包括識別與視訊資料相關聯之最大時間層級之第一語法元素及識別視訊資料之時間層是否具有低於該最大時間層級之層級之第二語法元素。回應於該第二語法元素指示視訊資料之時間層具有低於該最大時間層級之層級，該視訊處理器件可接收額外語法元素，該等額外語法元素識別視訊資料之一或多個時間層之層級。

圖12為說明如何根據本發明之技術處理VPS之實例的流程圖。將參考通用視訊處理器件來描述圖12之技術。該視訊處理器件可對應於諸如圖1之MANE 29或圖6中之路由器件154中之一者的一網路器件。該視訊處理器件可另外對應於諸如圖1及圖4之視訊解碼器30的一視訊解碼器。該視訊處理器件在視訊參數集中接收包括有關於HRD參數之資訊之一或多個語法元素(221)。該視訊處理器件在該視訊資料中接收第一序列參數集(222)，該第一序列參數集包含識別該視訊參數集之第一語法元素。該第一序列參數集包含第一語法結構，該第一語法結構包括應用於視訊資料之一或多個完整圖像的語法元素之第一群組。該視訊處理器件在該視訊資料中接收第二序列參數集(223)，該第二序列參數集包含識別該視訊參數集之第二語法元素。該第二序列參數集包含第二語法結構，該第二語法結構包括應用於視訊資料之一或多個不同完整圖像的語法元素之第二群組。該視訊處理器件基於該一或多個語法元素來處理與該第一參數集相關聯之視訊區塊之第一集合及與該第二參數集相關聯之視訊區塊之第二集合(224)。

圖13為說明如何根據本發明之技術產生供包括於VPS中之語法元素之實例的流程圖。將參考經組態以編碼視訊資料或處理經編碼視訊資料之一視訊處理器件來描述圖13之技術。經組態以處理經編碼視訊資料之視訊處理器件之實例包括圖1及圖4之視訊編碼器20及圖4之後處理器件57。該視訊處理器件產生包括有關於HRD參數之資訊之一或多個語法元素以用於包括於視訊參數集中(231)。該視訊處理器件產生第一序列參數集以用於包括於該視訊資料中(232)，該第一序列參數集包含識別該視訊參數集之第一語法元素。該第一序列參數集包含第一語法結構，該第一語法結構包括應用於視訊資料之一或多個完整圖像的語法元素之第一群組。該視訊處理器件產生第二序列參數集以用於包括於該視訊資料中(233)，該第二序列參數集包含識別該視訊參數集之第二語法元素。該第二序列參數集包含第二語法結構，該第二語法結構包括應用於視訊資料之一或多個不同完整圖像的語法元素之第二群組。視訊處理器件基於該一或多個語法元素來編碼與該第一參數集相關聯之視訊區塊之第一集合及與該第二參數集相關聯之視訊區塊之第二集合(234)。

在一或多個實例中，所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施，則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸，且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體，通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式，電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體，或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。

藉由實例而非限制，此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體，或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又，任何連接可適當地稱為電腦可讀媒體。舉例而言，若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如，紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令，則同軸纜線、光纖纜線、雙絞線、DSL或無線技術(諸如，紅外線、無線電及微波)包括於媒體之定義中。然而，應理解，電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體，而是有關非暫時性有形儲存媒體。如本文中所使用，磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟，其中磁碟通常以磁性方式再現資料，而光碟用雷射以光學方式再現資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。

可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此，如本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外，在一些態樣中，可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內，或併入於組合式編解碼器中。又，該等技術可完全實施於一或多個電路或邏輯元件中。

本發明之技術可以廣泛多種器件或裝置予以實施，該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如，晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件之功能態樣，但未必要求藉由不同硬體單元來實現。更確切而言，如上所述，可將各種單元組合於編解碼器硬體單元中，或藉由交互操作性硬體單元(包括如上所述之一或多個處理器)之集合而結合合適軟體及/或韌體來提供該等單元。

已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。

Claims

一種用於處理視訊資料之器件，該器件包含：一記憶體，其用於儲存該視訊資料；及一或多個處理器，其經組態以進行以下操作：用於在該視訊資料之一視訊參數集(VPS)語法結構中接收指定設定檔(profile)、層疊(tier)及層級資訊之一或多個語法元素，其中該一或多個語法元素包含一或多個固定長度語法元素；接收該視訊資料中包含識別該VPS語法結構之一第一語法元素之一第一序列參數集(SPS)；接收該視訊資料中包含識別該VPS語法結構之一第二語法元素之一第二SPS；及基於該一或多個語法元素處理與該第一SPS相關聯之視訊區塊之一第一集合及與該第二SPS相關聯之視訊區塊之一第二集合。
如請求項1之器件，其中該第一SPS包含一第一語法結構，該第一語法結構包含應用於該視訊資料之一或多個完整圖像之語法元素之一第一群組，且其中該第二SPS包含一第二語法結構，該第二語法結構包含應用於該視訊資料之一或多個不同的完整圖像之語法元素之一第二群組。
如請求項1之器件，其中該VPS語法結構包含一VPS延伸。
如請求項1之器件，其中在該VPS語法結構中該一或多個語法元素在該VPS語法結構中任何可變長度之經寫碼語法元素之前。
如請求項1之器件，其中該一或多個語法元素包含識別一視訊寫碼標準之一設定檔之一語法元素。
如請求項1之器件，其中該一或多個語法元素進一步包含識別一視訊寫碼標準之一層級之一語法元素，其中該層級包含與該視訊寫碼標準之該設定檔相關聯之多個層級之一者。
如請求項1之器件，其中該一或多個語法元素進一步包含一第三語法元素及一第四語法元素，其中該第三語法元素識別用於解譯該第四語法元素之一內容脈絡，且其中該第四語法元素識別設定檔之一群組，其中該一或多個處理器進一步經組態以在該VPS語法結構中接收一或多個相容性旗標，其中該一或多個相容性旗標之每一者與來自設定檔之該群組之一設定檔相關聯，及其中該一或多個相容性旗標之每一者之一值識別該視訊資料是否與來自設定檔之該群組之一相關聯設定檔相容。
如請求項1之器件，其中該一或多個處理器進一步經組態以進行以下操作：判定與該視訊資料相關聯之一最大時間層級，及其中該一或多個語法元素包含一第三語法元素，其指示該視訊資料之一時間層是否具有低於該最大時間層級之一層級。
如請求項8之器件，其中該一或多個處理器進一步經組態以回應指示該視訊資料之一時間層具有低於該最大時間層級之一層級之該第三語法元素而接收額外語法元素，其中該等額外語法元素識別該視訊資料之一或多個時間層之層級。
如請求項1之器件，其中該一或多個處理器包含一視訊解碼器，其經組態以解碼視訊區塊之該第一集合及視訊區塊之該第二集合。
如請求項1之器件，其中該一或多個處理器包含一媒體感知網路元件(MANE)，其經組態以將視訊區塊之該第一集合及視訊區塊之該第二集合轉遞至一用戶端器件。
如請求項1之器件，其中該器件包含以下之至少一者：一積體電路；一微處理器；及一無線通信器件，其包含一視訊解碼器。
一種用於處理視訊資料之器件，該器件包含：一記憶體，其用於儲存該視訊資料；及一或多個處理器，其經組態以進行以下操作：產生包括於該視訊資料之一視訊參數集(VPS)語法結構中指定設定檔(profile)、層疊(tier)及層級資訊之一或多個語法元素，其中該一或多個語法元素包含一或多個固定長度語法元素；產生包括於該視訊資料中包含識別該VPS語法結構之一第一語法元素之一第一序列參數集(SPS)；產生包括於該視訊資料中包含識別該VPS語法結構之一第二語法元素之一第二SPS；及基於該一或多個語法元素編碼與該第一SPS相關聯之視訊區塊之一第一集合及與該第二SPS相關聯之視訊區塊之一第二集合。
如請求項13之器件，其中該第一SPS包含一第一語法結構，該第一語法結構包含應用於該視訊資料之一或多個完整圖像之語法元素之一第一群組，且其中該第二SPS包含一第二語法結構，該第二語法結構包含應用於該視訊資料之一或多個不同的完整圖像之語法元素之一第二群組。
如請求項13之器件，其中該VPS語法結構包含一VPS延伸。
如請求項13之器件，其中在該VPS語法結構中該一或多個語法元素在該VPS語法結構中任何可變長度之經寫碼語法元素之前。
如請求項13之器件，其中該一或多個語法元素包含識別一視訊寫碼標準之一設定檔之一語法元素。
如請求項13之器件，其中該一或多個語法元素進一步包含識別一視訊寫碼標準之一層級之一語法元素，其中該層級包含與該視訊寫碼標準之該設定檔相關聯之多個層級之一者。
如請求項13之器件，其中該一或多個語法元素進一步包含一第三語法元素及一第四語法元素，其中該第三語法元素識別用於解譯該第四語法元素之一內容脈絡，且其中該第四語法元素識別設定檔之一群組，其中該一或多個處理器進一步經組態以產生包括於該VPS語法結構中之一或多個相容性旗標，其中該一或多個相容性旗標之每一者與來自設定檔之該群組之一設定檔相關聯，及其中該一或多個相容性旗標之每一者之一值識別該視訊資料是否與來自設定檔之該群組之一相關聯設定檔相容。
如請求項13之器件，其中該一或多個處理器進一步經組態以進行以下操作：產生包括於該視訊資料中指示與該視訊資料相關聯之一最大時間層級之資訊，及其中該一或多個語法元素包含一第三語法元素，其指示該視訊資料之一時間層是否具有低於該最大時間層級之一層級。
如請求項20之器件，其中該一或多個處理器進一步經組態以回應指示該視訊資料之一時間層具有低於該最大時間層級之一層級之該第三語法元素而產生額外語法元素，其中該等額外語法元素識別該視訊資料之一或多個時間層之層級。
如請求項13之器件，其中該器件包含以下之至少一者：一積體電路；一微處理器；及一無線通信器件，其包含一視訊解碼器。
一種用於處理視訊資料之器件，該器件包含：用於在該視訊資料之一視訊參數集(VPS)語法結構中接收指定設定檔(profile)、層疊(tier)及層級資訊之一或多個語法元素之構件，其中該一或多個語法元素包含一或多個固定長度語法元素；用於接收該視訊資料中包含識別該VPS語法結構之一第一語法元素之一第一序列參數集(SPS)之構件；用於接收該視訊資料中包含識別該VPS語法結構之一第二語法元素之一第二SPS之構件；及用於基於該一或多個語法元素處理與該第一SPS相關聯之視訊區塊之一第一集合及與該第二SPS相關聯之視訊區塊之一第二集合之構件。
一種電腦可讀儲存媒體，其儲存指令，其當執行時使一或多個處理器進行以下操作：用於在視訊資料之一視訊參數集(VPS)語法結構中接收指定設定檔(profile)、層疊(tier)及層級資訊之一或多個語法元素，其中該一或多個語法元素包含一或多個固定長度語法元素；接收該視訊資料中包含識別該VPS語法結構之一第一語法元素之一第一序列參數集(SPS)；接收該視訊資料中包含識別該VPS語法結構之一第二語法元素之一第二SPS；及基於該一或多個語法元素處理與該第一SPS相關聯之視訊區塊之一第一集合及與該第二SPS相關聯之視訊區塊之一第二集合。