TWI517692B - 用於視訊寫碼之寫碼參數組及網路抽象層單元標頭 - Google Patents
用於視訊寫碼之寫碼參數組及網路抽象層單元標頭 Download PDFInfo
- Publication number
- TWI517692B TWI517692B TW102101271A TW102101271A TWI517692B TW I517692 B TWI517692 B TW I517692B TW 102101271 A TW102101271 A TW 102101271A TW 102101271 A TW102101271 A TW 102101271A TW I517692 B TWI517692 B TW I517692B
- Authority
- TW
- Taiwan
- Prior art keywords
- video
- vps
- layers
- code
- writing
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本申請案主張以下各者之權利:2012年1月14日申請之美國臨時申請案第61/586,777號;2012年1月16日申請之美國臨時申請案第61/587,070號;2012年1月19日申請之美國臨時申請案第61/588,629號;2012年4月23日申請之美國臨時申請案第61/637,195號;及2012年4月24日申請之美國臨時申請案第61/637,774號,該等申請案中之每一者係以全文引用方式併入本文中。
本發明係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧電話」、視訊電傳會議器件、視訊串流傳輸器件及其類似者。數位視訊器件實施視訊寫碼技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第十部分(進階視訊寫碼(AVC))界定之標準、目前在開發中之高效率視訊寫碼
(HEVC)標準及此等標準之擴展中所描述之視訊寫碼技術。即將到來之HEVC標準之近期最新草案可於http://phenix.int-evry.fr/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G1103-v3.zip獲得。視訊器件可藉由實施此等視訊寫碼技術來更有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,視訊片段(亦即,視訊圖框或視訊圖框之一部分)可分被割成多個視訊區塊,視訊區塊亦可被稱為樹型區塊、寫碼單元(CU)及/或寫碼節點。圖像之框內寫碼(I)片段之視訊區塊係使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之框間寫碼(P或B)片段中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他圖像中之參考樣本的時間預測。圖像可被稱為圖框,且參考圖像可被稱為參考圖框。
空間或時間預測產生用於待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間寫碼之區塊係根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼。經框內寫碼之區塊係根據框內寫碼模式及殘餘資料來編碼。為了進一步壓縮,殘餘資料可自像素域變換至變換域,從而產生接著可被量化之殘餘變換係數。最初配置成二維陣列的經量化之變換係數可經掃描以便產生變換係數之一維向量,且可應用熵寫碼以達成更大壓縮。
大體而言,本發明描述用於寫碼用於視訊寫碼之參數組及網路抽象層(NAL)單元之技術。此等技術可應用於單層經寫碼資料(諸如,二維視訊資料),以及可縮放視訊寫碼(SVC)視訊資料及多視圖視訊寫
碼(MVC)視訊資料。因此,該等參數組及該等NAL單元在各種類型之視訊資料之間可相互相容。舉例而言,一視訊寫碼器(諸如一視訊編碼器或視訊解碼器)可寫碼定義用於視訊資料之一或多個層之參數之一視訊參數組(VPS)。該等層可對應於(例如)SVC層(具有各種圖框率、空間解析度及/或品質位準)及/或MVC資料之視圖(例如,自關於水平軸線之各種相機視角俘獲之場景之影像之序列)。
在一個實例中,一種寫碼視訊資料之方法包括:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;及至少部分地基於該VPS寫碼視訊資料之該一或多個層。
在另一實例中,一種用於寫碼視訊資料之器件包括一視訊寫碼器(諸如一視訊編碼器或視訊解碼器),該視訊寫碼器經組態以:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;且至少部分地基於該VPS寫碼視訊資料之該一或多個層。
在另一實例中,一種用於寫碼視訊資料之器件包括:用於寫碼用於視訊資料之一或多個層之一視訊參數組(VPS)之構件,其中視訊資料之該一或多個層中之每一者參考該VPS;及用於至少部分地基於該VPS寫碼視訊資料之該一或多個層之構件。
在另一實例中,一種電腦可讀儲存媒體具有儲存於其上之指令,該等指令在執行時使一處理器進行以下操作:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;及至少部分地基於該VPS寫碼視訊資料之該一或多個層。
在附圖及以下描述中陳述一或多個實例之細節。其他特徵、目標及優勢將自該描述及圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換單元
62‧‧‧求和器
64‧‧‧參考圖像記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧反量化單元
78‧‧‧反變換單元
80‧‧‧求和器
82‧‧‧參考圖像記憶體
圖1為說明可利用用於寫碼用於視訊資料之一或多個層之參數組及網路抽象層(NAL)單元之技術之實例視訊編碼及解碼系統的方塊圖。
圖2為說明可實施用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之技術之視訊編碼器20之實例的方塊圖。
圖3為說明可實施用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之技術之視訊解碼器30之實例的方塊圖。
圖4為說明實例MVC預測型樣之概念圖。
圖5為說明視訊參數組(VPS)及各種層參數組(LPS)之概念圖。
圖6為說明實例分群參數組(GPS)及GPS與其他參數組及片段標頭之關係的概念圖。
圖7為說明根據本發明之技術之用於編碼視訊資料之實例方法的流程圖。
圖8為說明根據本發明之技術之用於解碼視訊資料之實例方法的流程圖。
圖9為說明至少部分地基於在VPS中用信號表示之時間層之數目寫碼視訊資料之實例方法的流程圖。
圖10為說明至少部分地基於在一或多個層中待重新排序之圖像及待儲存於經解碼圖像緩衝器中之圖像之數目寫碼視訊資料之實例方法的流程圖。
圖11為說明至少部分地基於在VPS中用信號表示之假想參考解碼器(HRD)參數寫碼視訊資料之實例方法的流程圖。
圖12為說明至少部分地基於在VPS中用信號表示之擴展資料寫碼視訊資料之實例方法的流程圖。
大體而言,本發明描述使用一視訊參數組(VPS)寫碼視訊資料。視訊資料可在階層上分類為包括複數個層、一給定層內之圖像之一序列、一序列內之一圖像、一圖像內之多個片段及一片段內之多個區塊(例如,巨集區塊或寫碼樹單元)。序列參數組(SPS)可用以用信號表示用於圖像之一序列之很少變化之參數,且圖像參數組(PPS)可用以用信號表示用於個別圖像之很少變化之參數。
根據本發明之技術,VPS可用信號表示用於跨各別層之複數個序列之很少變化之參數。亦即,VPS可包括用於不同層之時間上共置之序列之一集合之參數。不同層可包括(例如)多視圖視訊資料之不同視圖、不同品質層、不同空間解析度層、時間上可縮放之層(亦即,允許不同圖框率之層)及其類似者。以此方式,可為複數個不同層提供一個VPS,以使得該VPS用信號表示為各別層中之每一者(例如,各別層內之各別序列)所共有之參數。位元串流可據稱包括該複數個層中之每一者,且該等各別層可形成各別子位元串流。此外,子位元串流可對應於兩個或兩個以上層之組合。
本發明描述可包括於VPS中之資料之各種實例。在一些實例中,此資料可包括相應層內之子層之數目(例如,子層之最大數目)之一指示。舉例而言,VPS可包括用信號表示時間層之數目及/或時間層之最大數目(例如,最高時間層指示符)之資料。
作為另一實例,另外或替代地,VPS可包括實質上類似於先前在SPS中用信號表示(亦即,在習知SPS中用信號表示)之任何資料的資料。以此方式,當位元串流之兩個或兩個以上層之序列包括實質上類似或相同之參數時,視訊寫碼器可寫碼VPS以用信號表示用於該等層之序列之參數,而非冗餘地在不同層之間在各種序列之各別SPS中寫碼此資料。
另外或替代地,VPS可包括定義視訊可用性資訊(VUI)之資料,
諸如視訊表示資訊、假想參數解碼器(HRD)參數及/或位元串流限制資訊。位元串流限制資訊可包括關於運動向量範圍、經解碼圖像緩衝器(DPB)大小(例如,關於待由DPB保存之圖像之數目)、重新排序圖框之數目(亦即,待自解碼次序至顯示次序重新排序之圖框之數目的指示)、區塊(例如,巨集區塊(MB)或寫碼樹單元)之經寫碼大小及圖像之經寫碼大小之限制。VPS可進一步提供用於一或多個VPS擴展之資料,以使得VPS可藉由未來標準或擴展而擴展至即將到來之HEVC標準。
圖1為說明可利用用於寫碼用於視訊資料之一或多個層之參數組及網路抽象層(NAL)單元之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1所示,系統10包括提供在稍後時間由目的地器件14解碼之經編碼視訊資料之源器件12。詳言之,源器件12經由電腦可讀媒體16將視訊資料提供至目的地器件14。源器件12及目的地器件14可包含包括以下各者之廣泛範圍之器件中之任一者:桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、諸如所謂「智慧」電話、所謂「智慧」板之電話手機、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流傳輸器件,或其類似者。在一些情況下,源器件12及目的地器件14可經配備以用於無線通信。
目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14的任何類型之媒體或器件。在一個實例中,電腦可讀媒體16可包含一通信媒體以使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14。經編碼視訊資料可根據諸如無線通信協定之通信標準來調變且傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路,或諸如網際
網路之全球網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源器件12至目的地器件14之通信之任何其他設備。
在一些實例中,經編碼資料可自輸出介面22輸出至儲存器件。類似地,經編碼資料可由輸入介面自儲存器件存取。儲存器件可包括多種分散式或本端存取之資料儲存媒體(諸如,硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體)中之任一者。在另一實例中,儲存器件可對應於檔案伺服器或可儲存由源器件12產生之經編碼視訊之另一中間儲存器件。目的地器件14可經由串流傳輸或下載而自儲存器件存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將該經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接儲存(NAS)器件或本端硬碟。目的地器件14可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之適合於存取儲存於檔案伺服器上之經編碼視訊資料之組合。經編碼視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,該等多媒體應用諸如空中(over-the-air)電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(例如,經由HTTP之動態自適應性串流傳輸(DASH))、編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊之解碼或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之該等技術。在其他實例中,源器件及目的地器件可包括其他組件及配置。舉例而言,源器件12可自外部視訊源18(諸如外部攝影機)接收視訊資料。同樣,目的地器件14可與外部顯示器件介接,而非包括整合式顯示器件。
圖1之所說明系統10僅為一個實例。用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之技術可由任何數位視訊編碼及/或解碼器件來執行。雖然通常藉由視訊編碼器件來執行本發明之該等技術,但亦可藉由視訊編碼器/解碼器(通常被稱為「編解碼器(CODEC)」)來執行該等技術。此外,亦可藉由視訊預處理器來執行本發明之該等技術。源器件12及目的地器件14僅為此等寫碼器件之實例,在該等編碼器件中,源器件12產生用於傳輸至目的地器件14之經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱之方式操作,以使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流傳輸、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括視訊俘獲器件(諸如,視訊攝影機)、含有先前俘獲之視訊之視訊封存檔及/或用以自視訊內容提供者接收視訊之視訊饋送介面。作為另一替代,視訊源18可產生基於電腦圖形之資料作為源視訊,或直播視訊、封存視訊及電腦產生之視訊的組合。在一些情況下,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之該等技術通常可適用於視訊寫碼,且可應用於無線及/或有線應用。在每一情況下,可藉由視訊編碼器20來編碼經俘
獲、經預俘獲或經電腦產生之視訊。經編碼視訊資訊可接著藉由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括暫態媒體(諸如無線廣播或有線網路傳輸),或儲存媒體(亦即,非暫時性儲存媒體),諸如硬碟、快閃磁碟機、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未圖示)可自源器件12接收經編碼視訊資料,且(例如)經由網路傳輸將該經編碼視訊資料提供至目的地器件14。類似地,媒體製造設施(諸如光碟燙印設施)之計算器件可自源器件12接收經編碼視訊資料,且產生含有該經編碼視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解為包括各種形式之一或多個電腦可讀媒體。
目的地器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括藉由視訊編碼器20定義之語法資訊(其亦藉由視訊解碼器30定義),語法資訊包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理之語法元素。顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據視訊寫碼標準(諸如,目前在開發中之高效率視訊寫碼(HEVC)標準)來操作,且可遵照HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據其他專屬或工業標準(諸如,替代地稱為MPEG-4第十部分(進階視訊寫碼(AVC))之ITU-T H.264標準)或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。雖然圖1中未展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包
括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或不同資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
ITU-T H.264/MPEG-4(AVC)標準由ITU-T視訊寫碼專家群(VCEG)連同ISO/IEC動畫專家群(MPEG)一起闡明為被稱為聯合視訊小組(JVT)之集體合作夥伴之產品。在一些態樣中,本發明中所描述之技術可應用於通常遵照H.264標準之器件。H.264標準被描述於由ITU-T研究群提出且日期為2005年3月之ITU-T建議案H.264(用於通用視聽服務之進階視訊寫碼(Advanced Video Coding for generic audiovisual services))中,該標準在本文中可被稱為H.264標準或H.264規範,或H.264/AVC標準或規範。聯合視訊小組(JVT)繼續致力於對H.264/MPEG-4 AVC之擴展。
視訊編碼器器20及視訊解碼器30可各自實施為多種合適編碼器電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地以軟體實施時,器件可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且在使用一或多個處理器之硬體中執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其任一者可整合為各別器件中的組合式編碼器/解碼器(編解碼器)之部分。
JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之被稱為HEVC測試模型(HM)之演進模型。HM根據(例如)ITU-T H.264/AVC假定視訊寫碼器件相對於現有器件之若干額外能力。舉例而言,儘管H.264提供九個框內預測編碼模式,但HM可提供
多達三十三個框內預測編碼模式。
一般而言,HM之工作模型描述:視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之一序列。位元串流內之語法資料可定義LCU之大小,在像素之數目方面,LCU為最大寫碼單元。片段以寫碼次序包括數個連續樹型區塊。視訊圖框或圖像分割成一或多個片段。每一樹型區塊可根據四分樹分裂成多個寫碼單元(CU)。一般而言,四分樹資料結構包括每個CU一個節點,其中根節點對應於樹型區塊。若CU分裂成四個子CU,則對應於CU之節點包括四個葉節點,該四個葉節點中之每一者對應於該等子CU中之一者。
四分樹資料結構之每一節點可提供相應CU之語法資料。舉例而言,四分樹中之節點可包括分裂旗標,其指示對應於該節點之CU是否分裂成子CU。CU之語法元素可遞迴地定義,且可視CU是否分裂成子CU而定。若CU未進一步分裂,則將該CU稱為葉CU。在本發明中,即使不存在原始葉CU之明顯分裂,亦將葉CU之四個子CU稱為葉CU。舉例而言,若16×16大小之CU未進一步分裂,則雖然16×16 CU從未分裂,但亦將四個8×8子CU稱為葉CU。
除了CU不具有大小區別之外,CU具有與H.264標準之巨集區塊類似之用途。舉例而言,樹型區塊可分裂成四個子節點(亦被稱為子CU),且每一子節點又可為父節點且可分裂成另外四個子節點。最後的未分裂子節點(被稱為四分樹之葉節點)包含亦被稱為葉CU之寫碼節點。與經寫碼位元串流相關聯之語法資料可定義樹型區塊可分裂之最大次數(被稱為最大CU深度),且亦可定義寫碼節點之最小大小。因此,位元串流亦可定義最小寫碼單元(SCU)。本發明使用術語「區塊」來在HEVC之內容脈絡下指代CU、PU或TU中之任一者,或在其他標準之內容脈絡下指代類似資料結構(例如,H.264/AVC中之巨集區
塊及其子區塊)。
CU包括寫碼節點及與寫碼節點相關聯之預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小,且其形狀必須為正方形。CU之大小可在8×8個像素至高達最大為64×64個像素或更多像素的樹型區塊之大小的範圍內。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式在CU以跳躍或直接模式編碼、以框內預測模式編碼或是以框間預測模式編碼之間可能不同。PU在形狀上可被分割為非正方形。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹至一或多個PU之分割。TU在形狀上可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,該等變換對於不同CU可能不同。TU通常基於針對經分割LCU界定之給定CU內的PU之大小來設定大小,但情況可能並非始終如此。TU通常與PU大小相同或小於PU。在一些實例中,對應於CU之殘餘樣本可使用被稱為「殘餘四分樹」(RQT)之四分樹結構而再分為較小單元。RQT之葉節點可被稱為變換單元(TU)。與TU相關聯之像素差值可經變換以產生可量化之變換係數。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於相應CU之全部或一部分之空間區域,且可包括用於擷取PU之參考樣本之資料。此外,PU包括與預測有關之資料。舉例而言,當PU係以框內模式編碼時,用於PU之資料可包括於殘餘四分樹(RQT)內,該資料可包括描述用於對應於PU之TU之框內預測模式之資料。作為另一實例,當PU係以框間模式編碼時,PU可包括定義用於PU之一或多個運動向量之資料。定義用於PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向之參考圖像
及/或運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。如上文所論述,可使用RQT(亦被稱為TU四分樹結構)來指定變換單元。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。因而,每一變換單元可進一步分裂成子TU。當TU未進一步分裂時,該TU亦可被稱為葉TU。一般而言,對於框內寫碼,屬於葉CU之所有葉TU共用同一框內預測模式。亦即,通常應用同一框內預測模式以計算葉CU之所有TU之預測值。對於框內寫碼,視訊編碼器可使用框內預測模式來計算每一葉TU之殘餘值,以作為對應於TU之CU部分與原始區塊之間的差異。TU未必限於PU之大小。因此,TU可大於或小於PU。對於框內寫碼,PU可與同一CU之相應葉TU共置。在一些實例中,葉TU之最大大小可對應於相應葉CU之大小。
此外,葉CU之TU亦可與被稱為殘餘四分樹(RQT)之各別四分樹資料結構相關聯。亦即,葉CU可包括指示葉CU如何分割成TU之四分樹。TU四分樹之根節點通常對應於葉CU,而CU四分樹之根節點通常對應於樹型區塊(或LCU)。RQT之未分裂之TU亦被稱為葉TU。一般而言,本發明分別使用術語CU及TU來指代葉CU及葉TU,除非另有說明。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)一般包含一系列一或多個視訊圖像。GOP可包括在GOP之標頭中、圖像中之一或多者之標頭中或別處的描述包括於GOP中之圖像之數目的語法資料。圖像之每一片段可包括描述用於各別片段之編碼模式之片段語法資料。視訊編碼器20通常對個別視訊片段內之視訊區塊進行操作以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定之寫碼標準而在大小上不同。
作為實例,HM支援各種PU大小之預測。假設特定CU之大小為
2N×2N,HM支援2N×2N或N×N之PU大小之框內預測,及2N×2N、2N×N、N×2N或N×N之對稱PU大小之框間預測。HM亦支援用於2N×nU、2N×nD、nL×2N及nR×2N之PU大小之框間預測之不對稱分割。在不對稱分割中,CU的一個方向未被分割,而另一方向經分割成25%及75%。CU之對應於25%分割之部分係由「n」繼之以「上(U)」、「下(D)」、「左(L)」或「右(R)」之指示之來指示。因此,舉例而言,「2N×nU」指代經水平分割而在頂部具2N×0.5N PU且在底部具2N×1.5N PU之2N×2N CU。
在本發明中,「N×N」及「N乘N」可互換地使用以指代視訊區塊在垂直維度及水平維度上之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊在垂直方向上將具有16個像素(y=16),且在水平方向上將具有16個像素(x=16)。同樣,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。此外,區塊未必需要在水平方向上與在垂直方向上具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M不必等於N。
在使用CU之PU的框內預測性寫碼或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述在空間域(亦被稱為像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可在對殘餘視訊資料應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換)之後包含變換域中之係數。殘餘資料可對應於未經編碼之圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料之TU,且接著變換TU以產生CU之變換係數。
在用以產生變換係數之任何變換之後,視訊編碼器20可執行變換係數之量化。量化通常指代量化變換係數以可能減少用以表示該等
係數之資料之量,從而提供進一步壓縮的程序。量化程序可減少與該等係數中之一些或所有係數相關聯的位元深度。舉例而言,可在量化期間將n位元值捨去至m位元值,其中n大於m。
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化之變換係數之二維矩陣產生一維向量。掃描可經設計以使較高能量(且因此較低頻率)係數處於陣列之前部且使較低能量(且因此較高頻率)係數處於陣列之後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數以產生可進行熵編碼之串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描該等經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法來對該一維向量進行熵編碼。視訊編碼器20亦可對與經編碼視訊資料相關聯之語法元素進行熵編碼以供視訊解碼器30在解碼視訊資料時使用。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可與(例如)符號之相鄰值是否係非零有關。為了執行CAVLC,視訊編碼器20可選擇用於待傳輸符號之可變長度碼。可構造VLC中之碼字,以使得相對較短之碼對應於機率較大之符號,而較長碼對應於機率較低之符號。以此方式,較之於(例如)將相等長度碼字用於待傳輸之每一符號,使用VLC可達成位元節省。機率判定可基於指派給符號之上下文。
根據本發明之技術,一視訊寫碼器(諸如視訊編碼器20或視訊解碼器30)可經組態以:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),且至少部分地基於該VPS寫碼視訊資料之該一或多個層。將在下文更詳細描述之表2及表5包括VPS之語法元素之實例集合。視
訊資料之該一或多層中之每一者可參考VPS,亦即,相同VPS。換言之,VPS可應用於視訊資料之共用集合之所有層,例如,所有SVC層及/或MVC視訊資料之所有視圖。
VPS可包括各種類別之資訊。舉例而言,VPS可包括樣本維度計數描述(SDCD)。亦即,對於每一維度,視訊寫碼器可用信號表示索引之一集合。可能維度包括:cnt_p:經寫碼視訊序列中所含之優先層之數目;cnt_d:位元串流中有多少不同相依層,具有相同空間解析度及位元深度之多個層可屬於不同相依層;cnt_t:位元串流中有多少時間層;cnt_q:位元串流中之任何相依層之品質之最大數目;及cnt_v:視圖之最大數目。位元深度設定可包括8位元或12位元,且對於不同色彩分量可不同。色度取樣格式可包括4:0:0、4:2:0及4:4:4。
VPS亦可包括特性映射之一樣本索引。若對於每一維度,特性指示符不等於0至(樣本維度計數-1)之範圍之索引,則可引入迴圈以為每一特性索引指定特性指示符。針對每一相依索引,該映射可包括具特定位元深度值及特定色度樣本格式之特定空間解析度。注意,若解碼器處始終存在固定查找表,例如,0可對應於4:2:0,1可對應於4:4:4,且2可對應於4:0:0,則可省略此迴圈。另外或替代地,映射可包括:對於每一時間index/id,特定圖框率或平均圖框率;對於每一視圖索引,特定視圖識別符;對於每一位元深度索引,明度及色度之一對特定位元深度值;及對於每一色度取樣格式,特定色度取樣格式指示符。
VPS亦可包括諸如以下各者之控制參數及工具啟用/停用旗標:pcm_bit_depth_luma_minus1、pcm_bit_depth_chroma_minus1、loop_filter_across_slice_flag、pcm_loop_filter_disable_flag、temporal_id_nesting_flag、一或多個影像塊相關語法元素,chroma_pred_from_luma_enabled_flag、sample_adaptive_offset_enabled_flag、
adaptive_loop_filter_enabled_flag,及inter_4×4_enabled_flag。
VPS亦可包括一或多個操作點描述。操作點通常描述包括於位元串流中的視訊資料之視圖之總數之一子集。操作點可包括作為輸出目標之特定數目個視圖,以及在解碼、輸出或進行兩者時可用作參考之其他視圖。位元串流可包括操作點描述所描述之一或多個操作點。該等操作點描述可包括定義最大操作點之數目、不同層或視圖之間的相依性、每一操作點之設定檔及層級、每一操作點之位元速率、操作點之間的相依性、每一操作點之其他限制、每一操作點之視訊可用性資訊(VUI)或VUI之部分及/或關於每一層或視圖之VUI或VUI之部分的資訊。另外或在替代例中,該等操作點描述可包括每一操作點之操作點視訊寫碼層(VCL)網路抽象層(NAL)單元表示。在一些實例中,操作點VCL NAL單元表示可包括(例如)三個可能選擇:(1)(例如)用於空間解析度、用於位元深度、用於色度取樣格式之一特定索引值;(2)該索引值之一範圍:例如,對於時間層,0至最高時間層識別符,對於品質層,0至最高品質層識別符;或(3)索引值之一清單,例如,對於視圖,視圖索引值之一清單。
在一些實例中,VPS可包括指示位元串流之層中的時間層之最大數目之資料。亦即,視訊編碼器20及/或視訊解碼器30可經組態以寫碼包括指示相應位元串流之時間層的最大數目之資料之一VPS。舉例而言,視訊編碼器20可判定時間層之最大數目,且編碼VPS以包括表示時間層之經判定最大數目之資料,而視訊解碼器30可解碼VPS以判定時間層之最大數目。視訊編碼器20及視訊解碼器30亦可基於時間層之經判定最大數目而寫碼位元串流之視訊資料。舉例而言,時間層之最大數目可影響表示各種時間層所需之時間識別符之數目。作為另一實例,時間層之最大數目可影響視訊編碼器20及視訊解碼器30藉以寫碼參考圖像識別符(例如,使用圖像次序計數(POC)值)之方式。
作為又一實例,視訊編碼器20及視訊解碼器30可經組態以僅使用直至(且包括)相同時間層之參考資料來寫碼一特定時間層之資料。換言之,視訊編碼器20及視訊解碼器30可經組態以避免使用較高時間層之參考資料來寫碼特定時間層之資料。以此方式,可確保視訊解碼器30準確地解碼時間層之一給定集合之視訊資料,甚至在子位元串流提取之後亦如此。因此,若執行子位元串流提取,則在經提取子位元串流之最高層以上之特定時間層將不可用於參考。藉由僅參考當前層處或當前層以下之層之資料來寫碼每一時間層之資料,可避免使特定層處之資料依賴於來自較高層之資料(其可由於子位元串流提取而丟失)而原本可能產生之錯誤。
在一些實例中,另外或替代地,VPS可包括指示將在位元串流之一或多個層中重新排序之圖像之數目及/或待儲存於經解碼圖像緩衝器(DPB)中之圖像之數目中之任一者或兩者之資料。如上文所說明,此資料可被稱為位元串流限制資訊。因此,目的地器件14可判定視訊解碼器30之能力,且使用該位元串流限制資訊判定相應位元串流對於由視訊解碼器30進行解碼是否適當,或目的地器件14是否應(例如,自基於網路之內容提供者,假定可得到內容之多個版本)選擇替代內容。
此外,視訊編碼器20及視訊解碼器30可在視訊資料之寫碼期間使用該位元串流限制資訊。舉例而言,視訊編碼器20可確保該位元串流限制資訊不被違反。亦即,假定該位元串流限制資訊指示至多N個圖像將儲存於DPB中,視訊編碼器20可確保在任何給定時間,不多於N個之圖像將包括於一或多個參考圖像清單之任何組合中。作為另一實例,假定圖像重新排序資訊指示圖像將移位至多M個圖像,視訊編碼器20可確保無圖像移位M個圖像以上。以此方式,圖像之移位通常對應於圖像之解碼次序與顯示次序之間的差異。同樣,視訊解碼器30
可在寫碼期間使用此資訊(例如)以執行DPB管理,諸如DPB清除。當寫碼參考圖像識別符值時,視訊編碼器20及視訊解碼器30亦可使用位元串流限制資訊,諸如待儲存於DPB中之圖像之最大數目及/或待重新排序之圖像之數目。
在一些實例中,另外或替代地,VPS包括指示假想參考解碼器(HRD)參數之資料。HRD參數包括(例如)描述將自經寫碼圖像緩衝器(CPB)移除資料之時間之資料。在解碼器(諸如視訊解碼器30)中,CPB表示在經寫碼視訊資料準備好解碼之前儲存該資料之緩衝器。解碼器(諸如視訊解碼器30)亦可包括經解碼圖像緩衝器(DPB),經解碼視訊資料係儲存於DPB中(例如)以用作經框間預測之資料之參考資料且用於圖像自解碼次序至顯示次序之重新排序。
該等HRD參數可包括指示特定圖像何時將自CPB移除且加以解碼之資料。因此,視訊編碼器20可編碼VPS之HRD參數以指示圖像何時可自CPB移除且加以解碼,而視訊解碼器30可解碼VPS之HRD參數以判定何時自CPB移除圖像。同樣,視訊編碼器20及視訊解碼器30可(例如)以藉由該等HRD參數指示之一寫碼次序來根據該等HRD參數寫碼圖像。以此方式,視訊編碼器20及/或視訊解碼器30可經組態以寫碼包括HRD參數之一VPS,且至少部分地基於該等HRD參數寫碼對應於該VPS之視訊資料。
VPS亦可包括指示VPS是否已擴展之擴展資料(例如)以為一或多個額外寫碼工具提供資料。此等寫碼工具可為不同於相應視訊寫碼標準(諸如,ITU-T H.264/AVC或即將到來之HEVC標準)之彼等寫碼工具的工具。此外,此等寫碼工具可能需要組態資料。此組態資料可在VPS之擴展資料中提供。以此方式,當使用此等寫碼工具寫碼視訊資料時,視訊編碼器20及/或視訊解碼器30可寫碼指示擴展資料是否存在之一VPS,且若擴展資料存在,則寫碼該VPS之擴展資料。此外,
當此擴展資料存在時,視訊編碼器20及/或視訊解碼器30可執行相應寫碼工具以使用該擴展資料來寫碼視訊資料。
各種視訊寫碼標準定義無錯誤位元串流之相應語法、語意及解碼程序,其中之任一者符合特定設定檔或層級。視訊寫碼標準通常不指定編碼器,但編碼器有保證所產生之位元串流對於解碼器係標準相容的之任務。在視訊寫碼標準之內容脈絡下,「設定檔」對應於演算法、特徵或應用於演算法、特徵之工具及約束之子集。如H.264標準所定義,例如,「設定檔」為由H.264標準指定之完整位元串流語法之子集。「層級」對應於解碼器資源消耗之限制,諸如,與圖像之解析度、位元速率及區塊處理速率有關之解碼器記憶體及計算。設定檔可用profile_idc(設定檔指示符)值用信號表示,而層級可用level_idc(層級指示符)值用信號表示。根據本發明之技術,設定檔及層級資訊可在操作點描述中指定,如上文所論述。
在一些實例中,位元串流之每一層或視圖參考視訊參數組(VPS),且分層序列參數組(LPS)對每一層而言可為作用中的。可藉由參考該設計中之VPS而將LPS保持為儘可能無足輕重的。LPS可包括下文所論述之資訊之任一者或全部。LPS可包括針對每一維度指示至每一維度之索引之樣本維度指示。舉例而言,若在VPS中,空間解析度0之索引經指派至320×240之空間特性,且空間解析度1之索引經指派至640×480,且當前層將經指派具有640×480之解析度,則視訊編碼器20及/或視訊解碼器30可針對當前層寫碼具有值1之語法元素。亦即,視訊編碼器20可用信號表示用於語法元素之值1以指定640×480之解析度,而視訊解碼器30可基於用於語法元素之值1來判定具有值1之語法元素之當前層具有640×480之解析度。
LPS亦可包括控制參數及工具啟用/停用旗標。舉例而言,該等控制參數及該等工具啟用/停用旗標可包括
pcm_bit_depth_luma_minus1、pcm_bit_depth_chroma_minus1、loop_filter_across_slice_flag、pcm_loop_filter_disable_flag、一或多個影像塊相關語法元素、chroma_pred_from_luma_enabled_flag、sample_adaptive_offset_enabled_flag、adaptive_loop_filter_enabled_flag及寫碼單元(CU)階層。
LPS可進一步包括應用於一片段、片段之一群組、一圖像或若干圖像之其他類型之參數組之資訊。此等參數組中之每一者可參考一特定圖像參數組(PPS)。
諸如視訊編碼器20及視訊解碼器30之視訊寫碼器可經組態以確保及/或判定PPS不參考LPS或VPS。因此,視訊寫碼器可保證位元串流中之每一PPS不參考LPS或VPS。PPS之剖析可為獨立的。當PPS包括與VPS或LPS之語法元素相同之語法元素中之一或多者時,PPS之語法元素可覆寫VPS或LPS之語法元素。
視訊寫碼器可經進一步組態以寫碼將所有參數組分群在一起之分群參數組(GPS)。視訊寫碼器可寫碼GPS內之複數個不同群組,每一群組具有個別GPS識別符(id)。GPS中之群組中之每一者可包括參數組之不同組合。以此方式,片段標頭僅需包括對相應GPS識別符之參考,且不必包括參數組之類型之指示。2012年1月25日申請之美國臨時專利申請案第61/590,702號亦描述多個技術,其中不同類型之參數組被分群在一起且僅參數組分群RBSP之ID將在片段標頭中較詳細地用信號表示。
如上文所論述,諸如視訊編碼器20或視訊解碼器30之視訊寫碼器可經組態以寫碼一視訊參數組及/或一分群參數組。視訊參數組之實例將關於圖5進行更詳細地論述,而分群參數組之實例將關於圖6進行更詳細地論述。
視訊編碼器20可(例如)在圖框標頭、區塊標頭、片段標頭或GOP
標頭中進一步將語法資料(諸如基於區塊之語法資料、基於圖框之語法資料及基於GOP之語法資料)發送至視訊解碼器30。GOP語法資料可描述各別GOP中之圖框之數目,且圖框語法資料可指示用以編碼相應圖框之編碼/預測模式。
視訊編碼器20及視訊解碼器30可各自實施為可適用之多種合適編碼器或解碼器電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其任一者可整合為組合式視訊編碼器/解碼器(編解碼器)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含積體電路、微處理器及/或無線通信器件,諸如蜂巢式電話。
圖2為說明可實施用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之技術之視訊編碼器20之實例的方塊圖。視訊編碼器20可執行視訊片段內之視訊區塊之框內及框間寫碼。框內寫碼依靠空間預測以減少或移除給定視訊圖框或圖像內之視訊中的空間冗餘。框間寫碼依靠時間預測以減少或移除視訊序列之鄰近圖框或圖像內之視訊中的時間冗餘。框內模式(I模式)可指代若干基於空間之寫碼模式中之任一者。框間模式(諸如,單一方向預測(P模式)或雙向預測(B模式))可指代若干基於時間之寫碼模式中之任一者。
如圖2中所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測單元46及分割單元48。為進行視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換單元60及求和器62。亦可包括一解區塊
濾波器(圖2中未圖示)以對區塊邊界進行濾波以自重建構之視訊移除方塊效應假影。若需要,解區塊濾波器通常可對求和器62之輸出進行濾波。除解區塊濾波器外,亦可使用額外濾波器(迴圈內或迴圈後)。為簡單起見,未展示此等濾波器,但若需要,此等濾波器可對求和器50(作為迴圈內濾波器)之輸出進行濾波。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或片段。圖框或片段可被分成多個視訊區塊。運動估計單元42及運動補償單元44相對於一或多個參考圖框中之一或多個區塊執行當前所接收視訊區塊之框間預測性寫碼以提供時間預測。框內預測模組46可替代地相對於與待寫碼之區塊相同之圖框或片段中一或多個相鄰區塊執行所接收視訊區塊之框內預測性寫碼以提供空間預測。視訊編碼器20可執行多個寫碼遍次,例如,以為視訊資料之每一區塊選擇適當寫碼模式。
此外,分割單元48可基於對先前寫碼遍次中之先前分割方案之評估而將視訊資料之區塊分割成子區塊。舉例而言,分割單元48最初可將圖框或片段分割成多個LCU,且基於速率失真分析(例如,速率失真最佳化)而將該等LCU中之每一者分割成多個子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割之四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可(例如)基於錯誤結果而選擇寫碼模式中之一者(框內或框間),且將所得之經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62以重建構經編碼區塊以用作為參考圖框。模式選擇單元40亦將諸如運動向量、框內模式指示符、分割資訊及其他此種語法資訊之語法元素提供至熵編碼單元56。
運動估計單元42及運動補償單元44可高度整合,但為概念目的而單獨說明。由運動估計單元42執行之運動估計為產生運動向量之程
序,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示相對於在當前圖框(或其他經寫碼單元)內寫碼之當前區塊,當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖像(或其他經寫碼單元)內之預測性區塊之移位。預測性區塊為經發現在像素差方面緊密匹配待寫碼之視訊區塊之區塊,其可藉由絕對差之和(SAD)、平方差之和(SSD)或其他差量度來判定。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中之參考圖像之次整數像素位置之值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置之值。因此,運動估計單元42可對於完整像素位置及分率像素位置執行運動搜尋,且輸出具有分率像素精度之運動向量。
運動估計單元42藉由比較PU之位置與參考圖像之預測性區塊之位置來計算用於經框間寫碼之片段中的視訊區塊之PU的運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將所計算出之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於藉由運動估計單元42判定之運動向量來提取或產生預測性區塊。此外,在一些實例中,運動估計單元42及運動補償單元44在功能上可整合。在接收到用於當前視訊區塊之PU的運動向量時,運動補償單元44可在參考圖像清單中之一者中找出運動向量所指向之預測性區塊的位置。如下文所論述,求和器50藉由自正寫碼之當前視訊區塊之像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。一般而言,運動估計單元42相對於明度分量執行運動估計,且運動補償單元44將基於明度分量計算之運動向量用於色度分量及明度分量兩者。模式選擇
單元40亦可產生與視訊區塊及視訊片段相關聯之語法元素以供視訊解碼器30在解碼視訊片段之視訊區塊時使用。
框內預測單元46可框內預測當前區塊,以作為如上所述的由運動估計單元42及運動補償單元44執行之框間預測之替代。詳言之,框內預測單元46可判定用以編碼當前區塊之框內預測模式。在一些實例中,框內預測單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測單元46(或在一些實例中,模式選擇單元40)可自經測試模式選擇適當框內預測模式來使用。
舉例而言,框內預測單元46可使用各種經測試框內預測模式之速率失真分析計算速率失真值,且在經測試模式中選擇具有最佳速率失真特性之框內預測模式。速率失真分析通常判定經編碼區塊與經編碼以產生經編碼區塊的原始未經編碼區塊之間的失真(或錯誤)之量,以及用以產生經編碼區塊之位元速率(亦即,位元之數目)。框內預測模組46可根據各種經編碼區塊之失真及速率計算比率以判定哪一框內預測模式展現區塊之最佳速率失真值。
在選擇用於區塊之框內預測模式之後,框內預測單元46可將指示用於區塊之選定框內預測模式之資訊提供至熵編碼單元56。熵編碼單元56可對指示選定框內預測模式之資訊進行編碼。視訊編碼器20可在所傳輸之位元串流中包括組態資料,該組態資料可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱為碼字映射表)、各種區塊之編碼上下文之定義及最大機率框內預測模式之指示、框內預測模式索引表及經修改框內預測模式索引表以用於該等上下文中之每一者。
視訊編碼器20藉由自正在寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將一變換(諸如,離散餘弦變
換(DCT)或概念上類似之變換)應用於殘餘視訊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。
在任何情況下,變換處理單元52將該變換應用於該殘餘區塊,從而產生殘餘變換係數之一區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如頻域)。變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減小位元速率。量化程序可減少與該等係數中之一些或所有係數相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化單元54可接著執行包括經量化之變換係數之矩陣之掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56對經量化之變換係數進行熵寫碼。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼之情況下,上下文可基於相鄰小區。在藉由熵編碼單元56進行之熵寫碼之後,經編碼位元串流可傳輸至另一器件(例如,視訊解碼器30)或經存檔以供稍後傳輸或擷取。
反量化單元58及反變換單元60分別應用反量化及反變換,以重建構像素域中之殘餘區塊(例如)以供稍後用作為參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖像記憶體64之圖框中之一者之預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於重建構之殘餘區塊以計算次整數像素值以供在運動估計中使用。求和器62將重建構之殘餘區塊加至由運動補償單元44產生的運動
經補償之預測區塊以產生重建構之視訊區塊以儲存於參考圖像記憶體64中。重建構之視訊區塊可由運動估計單元42及運動補償單元44用作參考區塊來對順序視訊圖框中之區塊進行框內寫碼。
視訊編碼器20可經進一步組態以寫碼根據本發明之技術之視訊參數組(VPS)、層參數組(LPS)及/或分群參數組,以及序列參數組(SPS)、圖像參數組(PPS)、適應參數組(APS)或其他此等發信資料結構。更特定言之,熵編碼單元56可經組態以寫碼此等資料結構中之任一者或全部。就此等各種資料結構之參數可能影響寫碼效能而言,模式選擇單元40可選擇適當參數且將該等參數傳遞至熵編碼單元56以便包括於(例如)VPS內。其他參數(諸如,時間層之數目、待重新排序之圖像之數目及待儲存於經解碼圖像緩衝器中之圖像之數目)可由使用者(例如,管理員)來選擇。在其他實例中,特定參數(諸如HRD參數)可經由編碼程序而出現。
熵編碼單元56可寫碼VPS以包括本發明所描述的各種類型之資料之任一者或全部。視訊編碼器20亦可根據VPS之參數來編碼資料。更特定言之,視訊編碼器20可根據VPS之參數來寫碼VPS所對應之視訊資料之一或多個層之間的圖像之序列。
以此方式,圖2之視訊編碼器20表示一視訊編碼器之一實例,該視訊編碼器經組態以:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;且至少部分地基於該VPS寫碼視訊資料之該一或多個層。
雖然大體關於視訊編碼器進行描述,但VPS之編碼可藉由其他器件(例如,媒體感知網路元件(MANE))執行。MANE可對應於源器件(諸如圖1之源器件12)與目的地器件(諸如目的地器件14)之間的網路元件。MANE可經組態以根據本發明之技術編碼VPS。MANE可使用藉由MANE接收之其他資料結構(例如,序列參數組)之資料產生VPS。
圖3為說明可實施用於寫碼用於視訊資料之一或多個層之參數組及NAL單元之技術之視訊解碼器30之實例的方塊圖。在圖3之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測單元74、反量化單元76、反變換單元78、參考圖像記憶體82及求和器80。參考圖像記憶體82亦可被稱為「經解碼圖像緩衝器」或DPB。視訊解碼器30在一些實例中可執行與關於視訊編碼器20(圖2)描述之編碼遍次大體上互反之解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量產生預測資料,而框內預測單元74可基於自熵解碼單元70接收之框內預測模式指示符產生預測資料。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊片段之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器30之熵解碼單元70熵解碼該位元串流以產生經量化之係數、運動向量或框內預測模式指示符及其他語法元素。熵解碼單元70將運動向量及其他語法元素轉發至運動補償單元72。視訊解碼器30可在視訊片段層級及/或視訊區塊層級接收語法元素。
當視訊片段經寫碼為框內寫碼(I)片段時,框內預測單元74可基於發信之框內預測模式及來自當前圖框或圖像之先前經解碼區塊之資料來產生用於當前視訊片段之視訊區塊之預測資料。當視訊圖框經寫碼為框間寫碼(亦即,B、P或GPB)片段時,運動補償單元72基於自熵解碼單元70接收之運動向量及其他語法元素來產生用於當前視訊片段之視訊區塊的預測性區塊。該等預測性區塊可根據參考圖像清單中之一者內的參考圖像中之一者產生。視訊解碼器30可基於儲存於參考圖像記憶體82中之參考圖像使用預設建構技術來建構參考圖框清單(清單0及清單1)。
運動補償單元72藉由剖析運動向量及其他語法元素來判定用於當前視訊片段之視訊區塊之預測資訊,且使用該預測資訊產生用於正
解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元72使用所接收之語法元素中之一些判定用以寫碼視訊片段之視訊區塊之預測模式(例如,框內或框間預測)、框間預測片段類型(例如,B片段、P片段或GPB片段)、用於片段之參考圖像清單中之一或多者之構造資訊、用於片段之每一經框間編碼視訊區塊之運動向量、用於片段之每一經框間寫碼視訊區塊之框間預測狀態及用以解碼當前視訊片段中之視訊區塊的其他資訊。
運動補償單元72亦可基於內插濾波器執行內插。運動補償單元72可使用由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器來計算用於參考區塊之次整數像素之內插值。在此情況下,運動補償單元72可根據所接收之語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。
反量化單元76反量化(亦即,去量化)提供於位元串流中且由熵解碼單元80解碼之經量化之變換係數。反量化程序可包括將由視訊編碼器30計算之量化參數用於視訊片段中之每一視訊區塊以判定量化之程度及(同樣地)應應用的反量化之程度。反變換單元78將反變換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數以便產生像素域中之殘餘區塊。
在運動補償單元72基於運動向量及其他語法元素產生用於當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自反變換單元78之殘餘區塊與由運動補償單元72產生之相應預測性區塊相加而形成經解碼視訊區塊。求和器90表示執行此求和運算之一或多個組件。若需要,亦可應用解區塊濾波器來對經解碼區塊進行濾波以便移除方塊效應假影。其他迴圈濾波器(在寫碼迴圈中或在寫碼迴圈之後)亦可用以使像素轉變平滑或以其他方式改良視訊品質。給定圖框或圖像中之經解碼視訊區塊接著被儲存於儲存用於後續運動補償之參考圖像之參考
圖像記憶體82中。參考圖像記憶體82亦儲存經解碼視訊以供稍後呈現於顯示器件(諸如圖1之顯示器件32)上。
根據本發明之技術,視訊解碼器30可解碼根據本發明之技術之視訊參數組(VPS)、層參數組(LPS)及/或分群參數組,以及序列參數組(SPS)、圖像參數組(PPS)、適應參數組(APS)或其他此等發信資料結構。更特定言之,熵解碼單元70可經組態以解碼此等資料結構中之任一者或全部。藉由解碼此等各種資料結構,熵解碼單元70可判定將用於解碼相應視訊資料之參數。舉例而言,視訊解碼器30可使用經解碼VPS之參數來解碼一或多個層之視訊資料之相應序列。
儘管圖3中未展示,但視訊解碼器30可另外包括一經寫碼圖像緩衝器(CPB)。CPB通常可設置於熵解碼單元70之前。或者,CPB可耦接至熵解碼單元70以用於臨時儲存,或處於熵解碼單元70之輸出端處以用於儲存經熵解碼之資料,直至此資料將被解碼。一般而言,CPB儲存經寫碼視訊資料,直至經寫碼視訊資料將被解碼(例如,如視訊解碼器30可自經解碼VPS提取之HRD參數所指示)。同樣,視訊解碼器30之其他元件可經組態以使用(例如)VPS來解碼視訊資料。舉例而言,視訊解碼器30可解碼用於各種時間層之圖像之時間識別符,指示待重新排序及/或待儲存於參考圖像記憶體82(表示DPB)中之圖像之數目之資料。
此外,視訊解碼器30可包括用於根據藉由視訊寫碼標準之擴展提供之各種寫碼工具來處理視訊資料之額外處理單元。或者,圖3中所展示之視訊解碼器30之現有元件可經組態以執行此等擴展之寫碼工具。熵解碼單元70可經組態以解碼VPS擴展資料,且將此擴展資料提供至經組態以執行藉由該等擴展提供之寫碼工具之單元。
以此方式,圖3之視訊解碼器30表示一視訊解碼器之一實例,該視訊解碼器經組態以:寫碼用於視訊資料之一或多個層之一視訊參數
組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;且至少部分地基於該VPS寫碼視訊資料之該一或多個層。
雖然大體關於視訊解碼器進行描述,但VPS之解碼可藉由其他器件(例如,媒體感知網路元件(MANE))執行。MANE可經組態以根據本發明之技術解碼VPS。MANE可使用VPS之資料進一步產生其他參數組資料,諸如一或多個序列參數組。以此方式,MANE可提供與先前標準(諸如ITU-T H.264/AVC)之回溯相容性。
圖4為說明實例MVC預測型樣之概念圖。多視圖視訊寫碼(MVC)為ITU-T H.264/AVC之擴展。類似技術可應用於HEVC。在圖4之實例中,說明八個視圖(具有視圖ID「S0」至「S7」),且針對每一視圖說明十二個時間位置(「T0」至「T11」)。亦即,圖4中之每一列對應於視圖,而每一行指示時間位置。
圖4中展示用於多視圖視訊寫碼之典型MVC預測(包括每一視圖內之圖像間預測及視圖間預測兩者)結構,其中預測由箭頭來指示,箭頭指向的物件使用箭頭出發的(point-from)物件用於預測參考。在MVC中,視圖間預測由不均等運動補償(disparity motion compensation)支援,不均等運動補償可使用H.264/AVC運動補償之語法,但允許將不同視圖中之圖像用作參考圖像。
兩個視圖之寫碼亦可藉由MVC來支援,且MVC之優點中之一者為MVC編碼器可選取兩個以上視圖作為3D視訊輸入且MVC解碼器可解碼此多視圖表示。因此,具有MVC解碼器之任何呈現器可經組態以接收具有兩個以上視圖之3D視訊內容。
雖然MVC具有由H.264/AVC解碼器可解碼之所謂基本視圖且立體視圖對亦可藉由MVC支援,但MVC之一個優點在於MVC可支援使用兩個以上視圖作為三維視訊輸入且解碼由該多個視圖表示之此三維視訊之實例。用戶端之具有MVC解碼器之呈現器可期待具有多個視圖
之三維視訊內容。
典型MVC解碼次序被稱為時間優先寫碼(time-first coding)。存取單元可包括一個輸出時間例項之所有視圖之經寫碼圖像。舉例而言,時間T0之圖像中之每一者可包括於共同存取單元中,且時間T1之圖像中之每一者可包括於第二共同存取單元中,等。解碼次序不必等於輸出或顯示次序。
圖4中之圖框係使用包括字母之陰影區塊展示於圖4中之每一行與每一列之相交處,字母指示相應圖框為經框內寫碼的(亦即,I圖框)或在一個方向上經框間寫碼(亦即,P圖框)或在多個方向上經框間寫碼(亦即,作為B圖框)。一般而言,藉由箭頭來指示預測,其中箭頭指向的圖框將箭頭出發的物件用於預測參考。舉例而言,視圖S2之時間位置T0處之P圖框係根據視圖S0之時間位置T0處之I圖框來預測。
如同單視圖視訊編碼,可對多視圖視訊寫碼視訊序列之圖框相對於不同時間位置處之圖框進行預測性編碼。舉例而言,視圖S0之時間位置T1處之b圖框具有自視圖S0之時間位置T0處之I圖框指向該b圖框之箭頭,此指示該b圖框係根據該I圖框預測。然而,另外,在多視圖視訊編碼之內容脈絡下,可以視圖間方式預測圖框。亦即,視圖分量可使用其他視圖中之視圖分量作為參考。在MVC中,例如,實現視圖間預測,好像另一視圖中之視圖分量為框間預測參考。可能之視圖間參考係在序列參數組(SPS)MVC擴展中用信號表示且可藉由參考圖像清單建構程序加以修改,該程序能夠實現框內預測或視圖間預測參考之靈活排序。
在H.264/AVC之MVC擴展中,作為一實例,視圖間預測由不均等運動補償支援,不均等運動補償使用H.264/AVC運動補償之語法,但允許將不同視圖中之圖像用作為參考圖像。兩個視圖之寫碼可由MVC來支援,此通常被稱為立體視圖。MVC之優點之一在於,MVC
編碼器可選取兩個以上視圖作為三維視訊輸入且MVC解碼器可解碼此多視圖表示。因此,具有MVC解碼器之呈現器件可期待具有兩個以上視圖之三維視訊內容。
在MVC中,在同一存取單元(亦即,具有相同時間例項)中之圖像之間允許視圖間預測(IVP)。存取單元通常為包括用於共同時間例項之所有視圖分量(例如,所有NAL單元)之資料單元。因此,在MVC中,在同一存取單元中之圖像之間准許視圖間預測。當寫碼非基本視圖中之一者中之一圖像時,若該圖像在不同視圖中但具有相同時間例項(例如,相同POC值,且因此在同一存取單元中),則可將該圖像添加至一參考圖像清單中。正如任何框間預測參考圖像一樣,可將視圖間預測參考圖像置於一參考圖像清單之任何位置中。
在多視圖視訊寫碼之內容脈絡下,存在兩種運動向量。一種運動向量為指向時間參考圖像之普通運動向量,且將相應框間預測模式稱為經運動補償預測(MCP)。另一種運動向量為指向不同視圖中之圖像之不均等運動向量,且將相應視圖間預測模式稱為經不均等補償預測(DCP)。
在習知HEVC中,存在用於預測運動參數之兩個模式:一個模式為合併模式,且另一模式為進階運動向量預測(AMVP)。在合併模式中,構造運動參數(參考圖像及運動向量)之候選清單,其中候選者可來自空間或時間相鄰之區塊。空間上及時間上相鄰之區塊可形成候選清單,亦即,運動預測資訊可選自之候選者之集合。因此,視訊編碼器20可藉由將索引寫碼至候選清單中來寫碼經選擇作為運動預測資訊之運動參數。在視訊解碼器30已解碼索引之後,可以合併模式繼承索引指向之相應區塊之所有運動參數。
在AMVP中,根據習知HEVC,基於經寫碼參考索引來導出用於每一運動假設之運動向量預測子之候選清單。此清單包括與相同參考
索引相關聯之相鄰區塊之運動向量,以及基於時間參考圖像中之共置區塊之相鄰區塊之運動向量導出的時間運動向量預測子。藉由將索引傳輸至候選清單中來用信號表示所選運動向量。另外,亦用信號表示參考索引值及運動向量差。
圖4提供視圖間預測之各種實例。在圖4之實例中,將視圖S1之圖框說明為係根據視圖S1之處於不同時間位置處之圖框預測,且係根據視圖S0及S2之處於相同時間位置處之圖框以視圖間方式預測。舉例而言,視圖S1在時間位置T1處之b圖框係根據視圖S1在時間位置T0及T2處之B圖框以及視圖S0及S2在時間位置T1處之b圖框中之每一者預測。
在圖4之實例中,大寫字母「B」及小寫字母「b」意欲指示圖框之間的不同階層關係,而非不同編碼技術。一般而言,大寫字母「B」圖框在預測階層上相對高於小寫字母「b」圖框。圖4亦說明使用不同陰影位準之預測階層之變化,其中較大量陰影(亦即,相對較暗)圖框在預測階層上高於具有較少陰影之(亦即,相對較亮)圖框。舉例而言,用全陰影說明圖4中所有I圖框,而P圖框具有稍微較亮之陰影,且B圖框(及小寫字母b圖框)相對於彼此具有各種陰影位準,但始終比P圖框及I圖框之陰影亮。
一般而言,預測階層與視圖次序索引相關,相關之處在於預測階層相對較高之圖框應在解碼階層相對較低之圖框之前進行解碼,以使得階層相對較高之彼等圖框可在階層相對較低之圖框之解碼期間用作參考圖框。視圖次序索引為指示存取單元中之視圖分量之解碼次序之索引。如H.264/AVC之附錄H(MVC修正)中所指定,視圖次序索引暗示於SPS MVC擴展中。在SPS中,對於每一索引i,用信號表示相應view_id。在一些實例中,視圖分量之解碼應遵循視圖次序索引之遞升次序。若呈現所有視圖,則視圖次序索引將為自0至
num_views_minus_1之連續次序。
以此方式,用作為參考圖框之圖框可在參考參考圖框編碼之圖框之前予以解碼。視圖次序索引為指示存取單元中之視圖分量之解碼次序之索引。對於視圖次序索引i,用信號表示相應view_id。視圖分量之解碼遵循視圖次序索引之遞升次序。若呈現所有視圖,則視圖次序索引之集合可包含自零至比視圖之全部數目小1之連續排序集合。
對於處於階層之相同層級之特定圖框,解碼次序相對於彼此而言並不重要。舉例而言,使用視圖S0在時間位置T0處之I圖框作為視圖S2在時間位置T0處之P圖框之參考圖框,視圖S2在時間位置T0處之P圖框又被用作視圖S4在時間位置T0處之P圖框之參考圖框。因此,應在視圖S2在時間位置T0處之P圖框之前解碼視圖S0在時間位置T0處之I圖框,應在視圖S4在時間位置T0處之P圖框之前解碼視圖S2在時間位置T0處之P圖框。然而,在視圖S1與視圖S3之間,解碼次序並不重要,此係因為視圖S1及視圖S3並不依賴於彼此來預測,而是僅根據預測階層較高之視圖來預測。此外,可在視圖S4之前解碼視圖S1,只要視圖S1係在視圖S0及視圖S2之後解碼即可。
以此方式,階層排序可用以描述視圖S0至視圖S7。令記法SA>SB意謂視圖SA應在視圖SB之前進行解碼。使用此記法,在圖4之實例中,S0>S2>S4>S6>S7。又,相對於圖4之實例,S0>S1、S2>S1、S2>S3、S4>S3、S4>S5且S6>S5。不違反此等要求之用於視圖之任何解碼次序係可能的。因此,許多不同解碼次序係可能的,但僅具有特定限制。
根據本發明之技術,可將視圖S0至S7中之每一者視為相應位元串流之各別層。因此,VPS可描述位元串流之可應用於視圖S0至S7中之任一者或全部之參數,同時可針對視圖S0至S7中之任一者或全部提供個別層參數組。另外,可針對參數組之群組提供分群參數組,以使
得視圖S0至S7之個別圖像內之片段僅參考分群參數組之識別符。
如圖4中所示,視圖分量可使用其他視圖中之視圖分量作為參考。此被稱為視圖間預測。在MVC中,實現視圖間預測,好像另一視圖中之視圖分量為框間預測參考。視訊編碼器20及視訊解碼器30可寫碼序列參數組(SPS)MVC擴展中之可能視圖間參考(如表1之實例中所展示)。視訊編碼器20及視訊解碼器30可藉由執行參考圖像清單建構程序來進一步修改該等可能視圖間參考,該程序可能能夠實現框間預測或視圖間預測參考之靈活排序。
在表1中所展示之SPS MVC擴展中,對於每一視圖,用信號表示可用以形成參考圖像清單0及參考圖像清單1之視圖之數目。如在SPS MVC擴展中用信號表示,用於錨定圖像之預測關係可不同於用於同一視圖之非錨定圖像(在SPS MVC擴展中用信號表示)之預測關係。
視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC),包括標準之可縮放視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。
另外,存在新的視訊寫碼標準,即正由ITU-T視訊寫碼專家群(VCEG)及ISO/IEC動畫專家群(MPEG)之視訊寫碼聯合合作小組(JCT-VC)開發之高效率視訊寫碼(HEVC)。HEVC之近期最新工作草稿(WD)(且在下文中被稱為HEVC WD4)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/6_Torino/wg11/JCTVC-F803-v6.zip(表示為HEVC WD4d1)獲得。
序列及圖像參數組機制自經寫碼區塊資料之傳輸分離出(decouple)很少變化之資訊之傳輸。在一些應用中,序列及圖像參數組可使用可靠傳送機制進行「頻帶外」傳遞。圖像參數組原始位元組序列有效負載(RBSP)可包括可由一或多個經寫碼圖像之經寫碼片段網路抽象層(NAL)單元參考之參數。序列參數組RBSP可包括可由一或多個圖像參數組RBSP或含有緩衝週期補充增強資訊(SEI)訊息之一或多個SEI NAL單元參考之參數。序列參數組RBSP可包括可由一或多個圖像參數組RBSP或含有緩衝週期SEI訊息之一或多個SEI NAL單元參考之參數。
序列參數組可包括被稱作視訊可用性資訊(VUI)之參數之可選集
合。VUI可包括以下三個類別之可選資訊:視訊表示資訊,假想參考解碼器(HRD)資訊,及位元串流限制資訊。視訊表示資訊包括縱橫比、色彩空間變換相關資訊、相對於明度之色度相移及圖框率。HRD包括用於經寫碼視訊序列之視訊換緩衝參數。位元串流限制參數包括關於運動向量範圍、經解碼圖像緩衝器(DPB)大小及重新排序圖框之數目及區塊(例如,巨集區塊或寫碼單元(CU))及圖像之經寫碼大小之限制。
HEVC WD5包括支援適應參數組(APS)。適應參數組(APS)之概念亦可見於可自http://phenix.int-evry.fr/jct/doc_end_user/documents/6_Torino/wg11/JCTVC-F747-v4.zip獲得之JCTVC-F747中。
統一NAL單元標頭可用於HEVC非可縮放位元串流以及遵照HEVC之可能可縮放或多視圖擴展之可縮放位元串流兩者。統一NAL單元標頭可不同於以下態樣中之當前HEVC NAL單元標頭:對於一個完整經寫碼視訊序列可能存在固定NAL單元標頭長度,而該長度可跨不同經寫碼視訊序列改變;及NAL單元標頭中之可縮放性語法元素之有效寫碼,且當不需要特定語法元素時,特定語法元素不必存在。在此設計中,不同NAL單元類型或參數組可用於整個位元串流。
圖5為說明視訊參數組(VPS)及各種層參數組(LPS)之概念圖。圖5中之第二LPS之後的省略號意欲指示可存在任何數目(N)個VPS,其中N為整數。舉例而言,每一層(例如,每一SVC層或MVC視圖)可具有相應LPS。諸如視訊編碼器20或視訊解碼器30之視訊寫碼器可經組態以寫碼VPS及一或多個LPS,諸如圖5中所說明之VPS及LPS。
下文之表2提供VPS之實例原始位元組序列有效負載(RBPS)語法。
視訊寫碼器可經組態以使得經寫碼視訊序列(例如,包括一或多個層之位元串流)僅可具有一個有效視訊參數組(VPS)。VPS可囊封於特定類型之NAL單元內。舉例而言,用於VPS RBSP之nal_unit_type可為10。下文將描述表2之VPS之實例語意:
在此實例中,video_para_set_id識別相應視訊參數組(VPS)。
在此實例中,cnt_p指定存在於相應經寫碼視訊序列中之priority_id值之最大數目。
在此實例中,cnt_d指定存在於相應經寫碼視訊序列中之相依層之最大數目。具有相同解析度之多個視圖可被視為屬於同一相依層。兩個相依層可具有相同空間解析度。
在此實例中,cnt_t指定存在於經寫碼視訊序列中之時間層之最大數目。
在此實例中,cnt_q指定存在於經寫碼視訊序列中之相依層中之品質層之最大數目。
在此實例中,cnt_v指定存在於經寫碼視訊序列中之視圖之最大數目。
在此實例中,cnt_f指定NAL單元標頭中用以表示reserved_flags語法元素之位元之數目。
在此實例中,pic_width_in_luma_samples[i]及pic_height_in_luma_samples[i]分別以明度樣本為單位指定第i個相依層解析度之寬度及高度。
在此實例中,bit_depth_luma_minus8[i]+8及bit_depth_chroma_minus8[i]+8指定第i個位元深度表示之明度及色度分量之位元深度。
在此實例中,chroma_format_idc[i]指定第i個色度樣本格式表示之色度樣本格式。舉例而言,等於0之值可指示4:2:0;等於1之值可指示4:4:4,等於2之值可指示4:2:2,且等於3之值可指示4:0:0。
在此實例中,average_frame_rate[i]以每256秒之圖框數為單位指定第i個時間層表示之平均圖框率。
在此實例中,view_id[i]指定具有等於i之視圖次序索引之第i個視
圖之視圖識別符。當不存在時,view_id[0]之值可推斷為0。等於0之vps_extension_flag指定無vps_extension_data_flag語法元素存在於視訊參數組RBSP語法結構中。vps_extension_flag在遵照即將到來之HEVC標準之位元串流中可等於0。可保留用於vps_extension_flag之值1(例如)以供ITU-T|ISO/IEC未來使用。諸如視訊解碼器30之解碼器可忽視視訊參數組NAL單元中在vps_extension_flag之值1之後的所有資料。
在此實例中,vps_extension_data_flag可具有任何值。vps_extension_data_flag不影響對即將到來之HEVC標準中所指定之設定檔之遵循,且允許該即將到來之標準之進一步開發。
VPS中之其他語法元素可具有與在當前HEVC工作草案之SPS中具有相同名稱之語法元素相同之語意。彼等語法元素可應用於參考此VPS之經寫碼視訊序列,除非被較低層級參數組覆寫。
在一些實例中,可在VPS中進一步用信號表示3DV_flag以指示深度是否存在於經寫碼視訊序列中。
在一些實例中,在LPS中用信號表示VUI參數。
在一些實例中,語法元素cnt_p、cnt_t、cnt_d、cnt_q及cnt_v分別指定用以寫碼priority_id、temporal_id、dependency_id、quality_id及view_idx之位元之數目,且在VPS中亦可用信號表示存在於經寫碼視訊序列中之priority_id值、時間層、相依層、品質層及視圖之最大數目。
在一些實例中,可引入任何類型之NAL單元以含有語法元素cnt_p、cnt_t、cnt_d、cnt_q、cnt_v及cnt_f。此新NAL單元類型亦可包括識別符(ID),且在VPS中可參考ID。
在一些實例中,在VPS中未用信號表示表2中之自log2_max_pic_order_cnt_lsb_minus4至inter_4×4_enabled_flag之語法元素,但替代地,視訊編碼器20及視訊解碼器30可寫碼LPS中之此等語
法元素。
在一些實例中,表2之operation_point_desription()語法結構未包括於VPS中;替代地,視訊編碼器20及視訊解碼器30或其他元件(例如,輸出介面22及/或輸入介面28)可在補充增強資訊(SEI)訊息中寫碼operation_point_desription()語法結構中之內容。
在一些實例中,視訊編碼器20及視訊解碼器30可寫碼VPS中之視訊可用性資訊(VUI)參數。舉例而言,VPS可包括指定位元串流限制資訊之資料,諸如關於運動向量範圍、DPB大小、重新排序圖框之數目及區塊(例如,巨集區塊或CU)及圖像之經寫碼大小之限制。以此方式,VPS可指定指示視訊解碼器(諸如視訊解碼器30)為了正確解碼相應位元串流(亦即,包括VPS之位元串流)所需之DPB大小之資訊。同樣,VPS可指定圖像重新排序資訊,亦即,按解碼次序可在給定圖像之前及按輸出次序(亦即,顯示次序)接在給定圖像後面的圖像之數目。
另外或替代地,VPS可包括指定假想參考解碼器(HRD)資訊之資料。如上文所指出,視訊編碼器20及/或視訊解碼器30可寫碼(亦即,用信號表示)VPS中之可包括HRD資訊之VUI參數。因此,VPS可包括描述(例如)相應位元串流之操作點之資料。舉例而言,VPS可包括描述以下各者中之一或多者之資料:最大操作點之數目、不同層或視圖之間的相依性、每一操作點之設定檔及層級資訊、用於每一操作點之操作點VCL NAL單元表示、用於每一操作點之位元速率、操作點之間的相依性、每一操作點之限制、用於每一操作點之VUI或部分VUI,及/或用於每一層或視圖之VUI或部分VUI。
針對每一維度,VPS亦可包括:特定索引值、索引值之範圍,或索引值之清單。舉例而言,當VPS包括描述特定索引值之資料時,就空間解析度而言,索引值可對應於色度取樣格式之位元深度。作為另
一實例,當VPS包括索引值之範圍時,對時間層而言,該範圍可包含零(0)至最高時間層ID,且對品質層而言,該範圍可包含零(0)至最高品質層ID。作為又一實例,當VPS包括描述索引值之清單之資料時,該清單可包含多個視圖之視圖索引值之清單。
在一些實例中,視訊編碼器20可編碼(亦即,用信號表示)一或多個表示格式參數(寬度、高度、位元深度等)且視訊解碼器可解碼一或多個表示格式參數(寬度、高度、位元深度等),且可存在表示格式參數之不同集合。層或操作點因而可參考表示格式參數之此集合之索引。在下文之表3中展示用於此集合之語法設計之實例。
在一些實例中,可改為在層參數組中用信號表示ref_format_idx。
下文之表4提供用於操作點描述之實例語法。
下文論述表4之語法元素之語意之實例:在此實例中,num_operation_point_minus1+1指定操作點之最大數目,該等操作點存在於經寫碼視訊序列中,且關於該等操作點之操作點資訊係藉由以下語法元素而用信號表示。
在此實例中,op_profile_level_idc[i]、operation_point_id[i]、priority_id[i]、num_target_output_views_minus1[i]、frm_rate_info_present_flag[i]、avg_bitrate[i]、max_bitrate[i]、max_bitrate_calc_window[i]、constant_frm_rate_idc[i]及num_directly_dependent_views[i]具有與H.264之視圖可縮放性資訊SEI訊息中具有相同名稱之語法元素相同之語意。
在此實例中,quality_id[i]及dependency_id[i]可具有與H.264之可縮放性資訊SEI訊息中具有相同名稱之語法元素相同之語意。
在此實例中,directly_dependent_view_idx[i][j]指定當前操作點
之目標輸出視圖所直接依賴於的第j個視圖在當前操作點之表示內之視圖索引。
在此實例中,num_ref_views[i]指定解碼具有等於i之視圖次序索引之視圖分量中的初始參考圖像清單RefPicList0及RefPicList1中用於視圖間預測之視圖分量之數目。在此實例中,num_ref_views[i]之值不應大於Min(15,num_views_minus1)。在一些實例中,num_ref_views[0]之值等於0。
在此實例中,ref_view_idx[i][j]指定解碼具有等於i之視圖次序索引之視圖分量中的初始參考圖像清單RefPicList0及RefPicList1中用於視圖間預測之第j個視圖分量之視圖次序索引。在此實例中,ref_view_idx[i][j]之值應在0至31之範圍內,包括0及31。
在一些實例中,作為替代,可縮放性資訊SEI訊息(例如,如H.264中所描述)中之語法元素中之某些(例如,層相依性資訊有關之語法元素)可包括於表4之operation_points_description()語法結構中。
在一些實例中,視訊編碼器20及/或視訊解碼器30可寫碼(亦即,用信號表示)表4之operation_points_description()語法結構中之某些VUI參數。
下文之表5提供視訊參數組之替代語法:
下文論述表5之視訊參數組之語法之語意之實例。一般而言,下文未論述之類似命名之語法元素可具有與上文參考表2所論述相同之語意。其他語法元素之語意可如下。
在此實例中,bit_equal_to_one等於1(亦即,二進位「1」值)。
在此實例中,等於0之extention_type指示多個視圖層可存在於位元串流中。在此實例中,等於1之extension_type指定多個相依層及/或品質層可存在於位元串流中。
在此實例中,num_rep_formats_minus1+1指定此視訊參數組所支援之不同集合表示格式之最大數目,表示格式包括經寫碼視訊序列中之位元深度及色度格式(亦即,bit_depth_luma_minus8、bit_depth_chroma_minus8及chroma_format_idc值之集合)、圖像解析度及裁剪窗資訊。num_rep_formats_minus1之值可在0至X之範圍內,包括0及X。視訊編碼器20及視訊解碼器30可根據bit_depth_luma_minus8、bit_depth_chroma_minus8及
chroma_format_idc來寫碼用於基礎層之位元深度及色度格式之集合,且根據語法元素bit_depth_luma_minus8[i]、bit_depth_chroma_minus8[i]及chroma_format_idc[i]之以下集合用信號表示用於增強層之位元深度及色度格式之集合。
視訊編碼器20及視訊解碼器30可根據bit_depth_luma_minus8、bit_depth_chroma_minus8、chroma_format_idc、pic_width_in_luma_samples、pic_height_in_luma_samples、pic_cropping_flag、pic_crop_left_offset、pic_crop_right_offset、pic_crop_top_offset及pic_crop_bottom_offset來寫碼表示格式之第一集合。
在此實例中,bit_depth_luma_minus8[i]、bit_depth_chroma_minus8[i]及chroma_format_idc[i]分別指定經寫碼視訊序列中之bit_depth_luma_minus8、bit_depth_chroma_minus8及chroma_format_idc值之第i個集合。
在此實例中,pic_width_in_luma_samples[i]及pic_height_in_luma_samples[i]分別以使用第i個表示格式之明度樣本為單位指定每一經解碼圖像之寬度及高度。
在此實例中,針對表示格式之第i個集合,關於用於輸出之圖像座標中所指定之矩形區域,pic_cropping_flag[i]pic_crop_left_offset[i]、pic_crop_right_offset[i]、pic_crop_top_offset[i]及pic_crop_bottom_offset[i]指定經寫碼視訊序列中自解碼程序輸出之圖像之樣本。
在此實例中,rep_format_idx[i]指定編索引至應用於layer_id等於i之層的額外位元深度及色度格式之集合之值。layer_id等於i之層的bit_depth_luma_minus8、bit_depth_chroma_minus8及chroma_format_idc之值可分別等於
bit_depth_luma_minus8[rep_format_idx[i]]、bit_depth_chroma_minus8[rep_format_idx[i]]及chroma_fonnat_idc[rep_format_idx[i]]。rep_format_idx[i]之值應在0至X之範圍內,包括0及X。
在此實例中,dependency_id[i]指定layer_id等於i之層之相依性識別符。dependency_id[i]可在0至X之範圍內,包括0及X。當不存在時,dependency_id[i]可推斷為0。當num_directly_dependent_layers[i]大於0時,dependency_id[i]可等於或大於layer_id等於i之層所依賴之任何層之相依性識別符。
在此實例中,quality_id[i]指定layer_id等於i之層之相等性識別符。quality_id[i]可在0至X之範圍內,包括0及X。當不存在時,quality_id[i]可推斷為0。當num_directly_dependent_layers[i]大於0時,quality_id[i]可等於或大於layer_id等於i之層所依賴且具有等於dependency_id[i]之相依性識別符之任何層之相依性識別符。
在此實例中,num_short_term_ref_pic_sets指定在視訊參數組中指定之短期參考圖像集合之數目。num_short_term_ref_pic_sets之值可在0至64之範圍內,包括0及64。
在此實例中,等於1之depth_included_flag指示當前3DV操作點含有深度。在此實例中,等於0之depth_included_flag指示當前3DV操作點不含深度。
在下文之表6中提供表5之視圖相依性元素之實例語法:
下文之表7定義資料之實例集合,其中每一非基本視圖之視圖相依性係在序列層級中直接用信號表示。
在此實例中,num_ref_views[i]指定解碼具有等於i之視圖次序索引之視圖分量中的初始參考圖像清單RefPicList0及RefPicList1中用於視圖間預測之視圖分量之數目。在此實例中,num_ref_views[i]之值不大於Min(15,num_views_minus1)。在此實例中,num_ref_views[0]之值等於0。
在此實例中,ref_view_idx[i][j]指定解碼具有等於i之視圖次序索引之視圖分量中的初始參考圖像清單RefPicList0及RefPicList1中用於視圖間預測之第j個視圖分量之視圖次序索引。在此實例中,ref_view_idx[i][j]之值在0至31之範圍內,包括0及31。
如上文所說沒,特定類型之NAL單元(例如,NAL單元類型10)可用以囊封視訊參數組。NAL單元語法可如下文之表8之實例中所示而修改。
在此實例中,相對於習知NAL單元語法,添加「if(nal_unit_type!=10」語句內之元素。在此實例中,用以用信號表示語法元素priority_id、temporal_id、dependency_id、quality_id及view_idx之位元之數目分別為Ceil(log2(cnt_p))、Ceil(log2(cnt_t))、Ceil(log2(cnt_d))、Ceil(log2(cnt_q))及Ceil(log2(cnt_v))。同樣,在此實例中,當語法元素priority_id、temporal_id、dependency_id、quality_id及view_idx中之任一者不存在時,該語法元素之值經推斷為等於0。
除了如上文相對於位元之數目及可進行之推斷所定義,表8之語
法元素之語意可定義如下。priority_id、dependency_id及quality_id之語意可如ITU-T H.264/AVC之SVC擴展中所定義。temporal_id之語意可如HEVC之WD4中所定義。在此實例中,reserved_one_bit等於1。reserved_one_bit之值0可由HEVC標準之未來擴展指定。諸如視訊解碼器30之解碼器可經組態以忽略reserved_one_bit之值。
在此實例中,view_idx指定視圖之視圖次序索引。view_idx之語意可與ITU-T H.264/AVC之MVC擴展中所指定之語法元素「視圖次序索引」相同。
在此實例中,reserved_flags之每一位元等於1。reserved_flags之其他值可由即將到來之HEVC標準之未來擴展指定。諸如視訊解碼器30之解碼器可經組態以忽略reserved_flags之值,除非解碼器經組態以根據將語意指派給reserved_flags之位元之擴展而操作。在此實例中,用以表示reserved_flags之位元之數目為reserved_flags_len。
在此實例中,reserved_bits之每一位元等於1。reserved_bits之其他值可由即將到來之HEVC標準之未來擴展指定。諸如視訊解碼器30之解碼器可經組態以忽略reserved_bits之值,除非解碼器再次根據此未來擴展而組態。在此實例中,用以表示reserved_bits之位元之數目為((m+7>>3)<<3)-m。
下文之表9提供層參數組之實例語法。在一些實例中,相同語法可用於圖5之LPS中之每一者。
下文描述表9之LPS語法之語意之實例。不同層(例如,MVC中之不同視圖或SVC中之不同層)可參考不同LPS。同一相依性層中之不同品質層可共用相同LPS。同一相依性層中之不同時間層可共用相同LPS。或者,不同視圖可參考相同LPS,且不同相依性層可參考相同LPS。
在此實例中,等於0之depth_flag指定,LPS應用於由LPS NAL單元之temporal_id、dependency_id、quality_id及view_idx之值識別之深度表示。等於1之depth_flag指定,LPS應用於由LPS NAL單元之temporal_id、dependency_id、quality_id及view_idx之值識別之紋理表
示。
在此實例中,layer_para_set_id指定當前層參數組(LPS)之id。dependency_id及view_idx之值分別相同的不同層參數組共用layer_para_set_id的一個值空間,此意謂具有depencey_id及view_idx之不同組合之不同LPS可具有layer_para_set_id之相同值。
或者,所有LPS可共用該一個值空間,此意謂每一LPS具有layer_para_set_id之不同值。
在此實例中,vps_id識別此層參數組所參考之視訊參數組。
在此實例中,等於0之lps_extension_flag指定無lps_extension_data_flag語法元素存在於層參數組RBSP語法結構中。在此實例中,lps_extension_flag在遵照即將到來之HEVC標準之位元串流中可等於0。可保留用於lps_extension_flag之值1以供ITU-T|ISO/IEC未來使用。諸如視訊解碼器30之解碼器可忽視層參數組NAL單元中在lps_extension_flag之值1之後的所有資料。
在此實例中,lps_extension_data_flag可具有任何值,且不影響對即將到來之HEVC標準中所指定之設定檔之遵守。
其他語法元素可具有與HEVC WD之SPS中之具有相同名稱之語法元素相同之語意,但僅適用於參考此LPS之圖像。
LPS可含於NAL單元中,NAL單元之標頭可根據上文之表8定義。以下語法元素在該等語法元素與LPS相關聯時具有以下稍微經修改之語意。
在此實例中,priority_id等於參考此LPS之所有NAL單元之priority_id值之最小值。
在此實例中,temporal_id等於參考此LPS之所有NAL單元之temporal_id之最小值。
在此實例中,dependency_id等於參考此LPS之所有NAL單元之
dependency_id。
在此實例中,quality_id等於參考此LPS之所有NAL單元之quality_id之最小值。
在此實例中,v_idx為當前LPS之視圖索引。參考此LPS之所有圖像可具有view_id[v_idx]之視圖識別符。
或者,以上語法元素可在層參數組語法表中直接用信號表示,如表10之實例中所展示。可根據下文之表9來設計較詳細語法表。在此情況下,彼等語法元素不在LPS之NAL單元標頭中,且LPS之剖析可依賴於ID等於vps_id之VPS。
在此情況下,LPS不必具有重複以上語法元素之NAL單元標頭。假設囊封LPS之NAL單元之NAL單元類型為(例如)5,NAL單元標頭語法可如表11中所展示經稍微修改,此在表8之「if」語句中添加例外「&& nal_unit_type!=5」:
在其他實例中,視訊編碼器20及視訊解碼器30可使用固定長度寫碼來寫碼可縮放特性相關之語法元素,如下文之表12之實例中所展示。
下文之表13提供用於根據本發明之技術之圖像參數組(PPS)之語法之實例。在此實例中,與習知HEVC之PPS相反,圖像參數組不必用信號表示「seq_parameter_set_id」。
下文描述表13之PPS之語意之實例。
在此實例中,等於0之pps_extension_flag指定無pps_extension_data_flag語法元素存在於圖像參數組RBSP語法結構中。在此實例中,pps_extension_flag在遵照即將到來之HEVC標準之位元串流中等於0。可保留用於pps_extension_flag之值1以供ITU-T|ISO/IEC未來使用。諸如視訊解碼器30之解碼器可忽視圖像參數組NAL單元中在pps_extension_flag之值1之後的所有資料。
在此實例中,pps_extension_data_flag可具有任何值。pps_extension_data_flag無需影響對即將到來之HEVC標準中所指定之
設定檔之遵守。pps_extension_data_flag之值之語意可在HEVC標準或該標準之擴展之進一步開發中進行指派,從而不與本發明之技術衝突。
在本發明之技術,無序列參數組識別符或層參數組識別符必須在PPS中用信號表示。可將PPS中之某些其他語法元素移動至LPS。亦即,視訊編碼器20及/或視訊解碼器30可經組態以寫碼包括類似於表13中所展示之語法元素之資料的一或多個LPS。
圖6為說明實例分群參數組(GPS)及GPS與其他參數組及片段標頭之關係的概念圖。在此實例中,其他參數組包括LPS、SPS、PPS、類型0之適應參數組(APS)(例如,用信號表示自適應性迴圈濾波器(ALF)參數之APS)、類型1之APS(例如,用信號表示量化矩陣之APS)及其他參數組。在此實例中,GPS包括各自具有唯一GPS ID(亦被稱為群組ID)之複數個不同群組,其中每一群組藉由參數組ID來指示各種參數組中之每一者之特定群組。以此方式,片段標頭僅需指定一group_id以指定對應於具有該group_id之群組之參數組中之每一者。
下文之表14及表15提供分群參數組RBSP之語法之替代實例。
諸如視訊編碼器20及視訊解碼器30之視訊寫碼器可經組態以根據(例如)表14或表15來寫碼一分群參數組。在下文提供分群參數組之語法之語意之實例。
在此實例中,number_signalled_para_set_groups_minus1+1指定用信號表示之參數群組之數目。此值可在0至30之範圍內,包括0及30。
在此實例中,para_set_group_id[i]指定第i個用信號表示之參數組群組之識別符。para_set_group_id[i]之值應在0至31之範圍內,包括0及31。
在此實例中,para_set_type_id[i][j]指定用於第i個參數組群組之第i個參數組類型之識別符。
在此實例中,lps_id[i]指示由群組識別符為para_set_group_id[i]之參數組群組參考的層參數組之識別符。layer_para_set_id等於lps_id[i]之LPS之dependency_id及view_idx之值可等同於參數組群組NAL單元之dependency_id及view_idx之各自之值。
參數組分群RBSP之dependency_id及view_idx之值存在於表14及表15之實例中之此RBSP之NAL單元標頭中,且LPS之dependency_id及view_idx之值可存在於此LPS之NAL單元標頭中或存在於LPS之語
法表中。
或者,layer_para_set_id等於lps_id[i]之LPS之dependency_id及view_idx之值可不等於參數組群組NAL單元各自之dependency_id及view_idx之值。
在此實例中,pps_id[i]指示由群組識別符為para_set_group_id[i]之參數組群組參考的圖像參數組之識別符。
在此實例中,aps_id[i]指示由群組識別符為para_set_group_id[i]之參數組群組參考的適應參數組之識別符。
在此實例中,等於0之gps_extension_flag指定無gps_extension_data_flag語法元素存在於參數組分群RBSP語法結構中。gps_extension_flag在遵照即將到來之HEVC標準之位元串流中可等於0。可保留用於gps_extension_flag之值1以供ITU-T|ISO/IEC未來使用。諸如視訊解碼器30之解碼器可忽視參數組分群NAL單元中在gps_extension_flag之值1之後的所有資料。一般而言,gps_extension_data_flag可具有任何值。gps_extension_data_flag無需影響對即將到來之HEVC標準中所指定之設定檔之遵守。
在一些實例中,para_set_type_id[i][j]可改為aps_id[i][j],其具有與上文所描述之aps_id[i]類似之語意。
如圖6所示,替代參考片段標頭中之圖像參數組ID,根據本發明之技術,片段標頭可參考參數組群組ID,從而間接地參考LPS、PPS及每一類型之APS(例如,提供ALF參數及量化矩陣之APS)。
當VCL NAL單元(含有經寫碼片段)(例如)基於H.264/AVC設計原理而間接參考參數組時,視訊寫碼器可啟動視訊參數組或層參數組。
在一些實例中,可藉由特定類型之NAL單元而非藉由經寫碼片段來啟動參數組。舉例而言,此特定類型之NAL單元類型(參數組啟動NAL單元)(若存在於位元串流中)可啟動一個且恰好一個VPS。在各種
替代例中,另外,此類型之NAL單元可啟動至少一LPS。另外,此類型之NAL單元可啟動至少一PPS。另外,此類型之NAL單元可啟動至少一APS。參數組啟動NAL單元可為分群參數組RBSP。參數組啟動(PSA)NAL單元可適用於一個經寫碼視訊序列。可將PSA NAL單元視為非VCL NAL單元,亦即,不直接與視訊寫碼器相關。PSA NAL單元之NAL單元標頭語法可與VPS NAL單元相同。
在一些實例中,PSA NAL單元(若存在於存取單元中)可在存取單元之第一VCL NAL單元前面。在經寫碼視訊序列(例如,IDR圖像)之第一存取單元中可存在至少一PSA NAL單元。同一經寫碼視訊序列中之多個PSA NAL單元可含有相同VPSid;因此,在同一經寫碼視訊序列內無需啟動不同視訊參數組。PSA NAL單元(若存在於存取單元中)可在任何LPS、PPS、APS或SEI NAL單元(若存在)前面。VPS NAL單元(若存在於存取單元中)可在任何LPS、PPS、APS或SEI NAL單元(若存在)前面。在各種替代例中,另外,PSA NAL單元(若存在於存取單元中)可在VPS NAL單元(若存在)前面。
在一些實例中,諸如視訊編碼器20及視訊解碼器30之視訊寫碼器可經組態以將表16之語法用於序列參數組(SPS)(與(例如)HEVC之習知SPS語法相對比)。
表16之實例SPS消除來自習知SPS語法之profile_idc、reserved_zero_8bits、level_idc、chroma_format_idc、separate_colour_plane_flag及相應有條件「if」,max_temporal_layers_mimis1、pic_width_in_luma_samples、pic_height_in_luma_samples、pic_cropping_flag、pic_crop_left_offset、pic_crop_right_offset、pic_crop_top_offset及pic_crop_bottom_offset及相應有條件「if」語句,bit_depth_luma_minus8、bit_depth_chroma_minus8、num_short_term_ref_pic_sets及short_term_ref_pic_set(i)及相應有條件「if」語句。此外,表16之SPS添加video_parameter_set_id及rep_format_idx。其他剩餘語法元素之語意可與習知HEVC中所定義之語意相同。添加元素video_parameter_set_id及rep_format_idx之語意可定義如下。
在此實例中,video_parameter_set_id識別由當前SPS參考之視訊參數組(VPS)。或者,無需用信號表示video_parameter_set_id,且GPS可用以將SPS連結至特定VPS。
在此實例中,rep_format_idx指定至在所參考視訊參數組中用信號表示之表示格式之索引。
作為再一替代例,表17提供分群參數組之語法之另一實例。假定,在此實例中,視訊參數組ID語法元素不存在於SPS語法中,如上所述。
表17之語法元素之語意可定義如下:在此實例中,gps_id指定群組參數組(GPS)之識別符。
在此實例中,vps_id指定GPS所參考之視訊參數組之識別符。
在此實例中,sps_id指定GPS所參考之序列參數組之識別符。
在此實例中,pps_id指定GPS所參考之圖像序列參數組之識別符。
在此實例中,num_ref_aps_ids指定following ref_aps_id[i]語法元素之數目。num_ref_aps_ids之值應在0至4之範圍內,包括0及4。
在此實例中,ref_aps_id[i]識別群組參數組所參考之第i個適應參數組。
ref_aps_id[i]之相同值可存在於迴圈中一次以上,且因此,來自相同APS之APS參數之一個以上類型可供相同GPS參考且可應用於參考該GPS之經寫碼片段。
在此實例中,ref_aps_param_type[i]指定包括於群組參數組所參考之第i個適應參數組中之APS參數之類型。ref_aps_parame_type[i]之
值可在0至3之範圍內,包括0及3。ref_aps_parame_type[i]之0至3(包括性)之值分別對應於縮放清單、解區塊濾波器、樣本適應性偏移(SAO)及ALF之APS參數類型。在一些實例中,ref_aps_parame_type[i]之值對於i之任意兩個不同值不應相等。
在此實例中,等於0之gps_extension_flag指定無gps_extension_data_flag語法元素存在於參數組分群RBSP語法結構中。gps_extension_flag在遵照即將到來之HEVC標準之位元串流中可等於0。可保留用於gps_extension_flag之值1以供ITU-T|ISO/IEC未來使用。諸如視訊解碼器30之解碼器可忽視參數組分群NAL單元中在gps_extension_flag之值1之後的所有資料。
在此實例中,gps_extension_data_flag可具有任何值。gps_extension_data_flag無需影響對即將到來之HEVC標準中所指定之設定檔之遵守。
當GPS係根據表17指定或實質上遵照表17之實例時,諸如視訊編碼器20及視訊解碼器30之視訊寫碼器可應用以下程序以啟動用於單層或單視圖位元串流之參數組。
適應參數組RBSP可包括可經由供經寫碼片段NAL單元參考之一或多個群組參數組間接地供一或多個經寫碼圖像之經寫碼片段NAL單元參考之參數。在解碼程序之操作開始時,每一適應參數組RBSP最初可被視為不在作用中。對每一類型之APS參數而言,在解碼程序之操作期間的任何給定時刻,至多一個適應參數組RBSP可被視為在作用中,且用於特定類型之APS參數之任何特定適應參數組RBSP之啟動導致用於該特定類型之APS參數之先前作用中適應參數組RBSP(若存在)之撤銷啟動。
當一適應參數組RBSP(具有特定值aps_id)對一特定類型之ASP參數而言不在作用中且該適應參數組RBSP係經由供經寫碼片段NAL單
元參考之群組參數組間接地供用於該類型之APS參數(使用aps_id之值)之經寫碼片段NAL單元參考時,可針對該特定類型之APS參數啟動該適應參數組RBSP。此適應參數組RBSP被稱作用於該特定類型之APS參數之作用中適應參數組RBSP,直至其由於用於該特定類型之APS參數之另一適應參數組RBSP之啟動而被撤銷啟動。具有特定值aps_id之適應參數組RBSP可在其啟動之前用於解碼程序。
圖像參數組RBSP可包括可經由供經寫碼片段NAL單元參考之一或多個群組參數組間接地供一或多個經寫碼圖像之經寫碼片段NAL單元參考之參數。在解碼程序之操作開始時,每一圖像參數組RBSP最初可被視為不在作用中。在解碼程序之操作期間的任何給定時刻,至多一個圖像參數組RBSP可被視為在作用中,且任何特定圖像參數組RBSP之啟動導致先前作用中圖像參數組RBSP(若存在)之撤銷啟動。
當一圖像參數組RBSP(具有特定值pic_parameter_set_id)不在作用中且該圖像參數組RBSP係經由供經寫碼片段NAL單元參考之群組參數組間接地供經寫碼片段NAL單元參考(使用pic_parameter_set_id之值)時,可啟動該圖像參數組RBSP。將此圖像參數組RBSP稱作作用中圖像參數組RBSP,直至此圖像參數組RBSP由於另一圖像參數組RBSP之啟動而被撤銷啟動。具有特定值pic_parameter_set_id之圖像參數組RBSP可在其啟動之前用於解碼程序。
用於經寫碼圖像之作用中圖像參數組RBSP的含有pic_parameter_set_id之值之任何圖像參數組NAL單元可具有與經寫碼圖像之作用中圖像參數組RBSP之內容相同之內容,除非該圖像參數組NAL單元跟在經寫碼圖像之最後一個VCL NAL單元之後且在另一經寫碼圖像之第一VCL NAL單元之前。
序列參數組RBSP可包括可經由供經寫碼片段NAL單元參考之一或多個群組參數組間接地供一或多個經寫碼圖像之經寫碼片段NAL單
元參考或可供含有緩衝週期SEI訊息之一或多個SEI NAL單元參考之參數。在解碼程序之操作開始時,每一序列參數組RBSP最初可被視為不在作用中。在解碼程序之操作期間的任何給定時刻,至多一個序列參數組RBSP可被視為在作用中,且任何特定序列參數組RBSP之啟動導致先前作用中序列參數組RBSP(若存在)之撤銷啟動。
當序列參數組RBSP(具有seq_parameter_set_id之特定值)尚未在作用中且經由供經寫碼片段NAL單元參考之群組參數組間接地供經寫碼片段NAL單元參考(使用seq_parameter_set_id之該值)或供含有緩衝週期SEI訊息之SEI NAL單元參考(使用seq_parameter_set_id之該值)時,可啟動該序列參數組RBSP。將此序列參數組RBSP稱作作用中序列參數組RBSP,直至此序列參數組RBSP由於另一序列參數組RBSP之啟動而被撤銷啟動。具有特定值seq_parameter_set_id且含於temporal_id等於0之存取單元內之序列參數組RBSP可在其啟動之前用於解碼程序。已啟動之序列參數組RBSP對於整個經寫碼視訊序列應保持在作用中。
視訊參數組RBSP可包括可經由供經寫碼片段NAL單元參考之一或多個群組參數組間接地供一或多個經寫碼圖像之經寫碼片段NAL單元參考或可供含有緩衝週期SEI訊息之一或多個SEI NAL單元參考之參數。在解碼程序之操作開始時,每一視訊參數組RBSP最初可被視為不在作用中。在解碼程序之操作期間的任何給定時刻,至多一個視訊參數組RBSP可被視為作用中,且任何特定視訊參數組RBSP之啟動導致先前作用中視訊參數組RBSP(若存在)之撤銷啟動。
當視訊參數組RBSP(具有video_parameter_set_id之特定值)尚未在作用中且經由供經寫碼片段NAL單元參考之群組參數組間接地供經寫碼片段NAL單元參考(使用video_parameter_set_id之該值)或供含有緩衝週期SEI訊息之SEI NAL單元參考(使用video_parameter_set_id之該
值)時,可啟動該視訊參數組RBSP。將此視訊參數組RBSP稱作作用中視訊參數組RBSP,直至此視訊參數組RBSP由於另一視訊參數組RBSP之啟動而被撤銷啟動。具有特定值video_parameter_set_id且含於temporal_id等於0之存取單元內之視訊參數組RBSP應在其啟動之前用於解碼程序。已啟動之視訊參數組RBSP對於整個經寫碼視訊序列應保持在作用中。
用於經寫碼視訊序列之作用中序列參數組RBSP的含有seq_parameter_set_id之值之任何序列參數組NAL單元可具有與經寫碼視訊序列之作用中序列參數組RBSP之內容相同之內容,除非該序列參數組NAL單元跟在經寫碼視訊序列之最後一個存取單元之後且在另一經寫碼視訊序列之第一VCL NAL單元及含有緩衝週期SEI訊息(當存在時)之第一SEI NAL單元之前。
用於經寫碼視訊序列之作用中視訊參數組RBSP的含有video_parameter_set_id之值之任何視訊參數組NAL單元可具有與經寫碼視訊序列之作用中視訊參數組RBSP之內容相同之內容,除非該視訊參數組NAL單元跟在經寫碼視訊序列之最後一個存取單元之後且在另一經寫碼視訊序列之第一VCL NAL單元及含有緩衝週期SEI訊息(當存在時)之第一SEI NAL單元之前。
關於視訊參數組、序列參數組、圖像參數組及適應參數組中之語法元素之值(及自彼等語法元素導出之變數之值)與其他語法元素之間的關係所表達之所有約束為僅可應用於每一特定類型之APS參數之作用中視訊參數組、作用中序列參數組、作用中圖像參數組及作用中適應參數組之約束之表達。若存在在位元串流中未啟動之任何視訊參數組RBSP,則在該視訊參數組RBSP在其他符合位元串流中藉由參考而啟動之情況下,該視訊參數組RBSP之語法元素可具有將遵照指定約束之值。若存在在位元串流中未啟動之任何序列參數組RBSP,則
在該序列參數組RBSP在其他符合位元串流中藉由參考而啟動之情況下,該序列參數組RBSP之語法元素可具有將遵照指定約束之值。若存在在位元串流中未啟動之任何圖像參數組RBSP,則在該圖像參數組RBSP在其他符合位元串流中藉由參考而啟動之情況下,該圖像參數組RBSP之語法元素可具有將遵照指定約束之值。若存在在位元串流中未啟動之任何適應參數組RBSP,則在該適應參數組RBSP在其他符合位元串流中藉由參考而啟動之情況下,該適應參數組RBSP之語法元素可具有將遵照指定約束之值。
在解碼程序之操作期間,用於每一類型之APS參數的作用中視訊參數組、作用中序列參數組、作用中圖像參數組及作用中適應參數組之參數之值可被視為有效的。為瞭解譯SEI訊息,對用於同一存取單元中之經寫碼圖像之VCL NAL單元之解碼程序之操作而言在作用中的視訊參數組、序列參數組、圖像參數組及適應參數組之參數之值可被視為有效的,除非SEI訊息語意中另有指定。
圖7為說明根據本發明之技術之用於編碼視訊資料之實例方法的流程圖。雖然關於視訊編碼器20進行描述,但應理解,其他視訊編碼器件可經組態以執行圖7之方法。
最初,在此實例中,視訊編碼器20接收包括原始視訊資料之一或多個層之位元串流(100)。舉例而言,視訊源18(圖1)可將多視圖視訊資料提供至視訊編碼器20。或者,視訊編碼器20或其預處理器可將原始視訊位元串流分成複數個各種層,例如,空間解析度層、品質層、時間層或其類似者。在其他實例中,可將位元串流分割成各種層之組合,例如,視圖、空間解析度層、品質層、時間層或其類似者之任何組合。
視訊編碼器20可判定用於一組層中之相應序列之一或多個共同參數(102)。相應序列可為不同層中之具有相應時間位置之序列。亦
即,具有開始時間T1(關於顯示時間)及結束時間T2(亦關於顯示時間)之第一序列及亦具有開始時間T1及結束時間T2之第二序列可被稱為相互對應。詳言之,第一序列可形成第一層之部分,且第二序列可形成第二不同層之部分。「序列」可包括呈解碼次序之一系列連續圖像,例如,以解碼次序自瞬時解碼再新(IDR)圖像開始且恰在後續IDR圖像之前結束。一般而言,參數可對應於一或多個層(例如,N個層,其中N為整數)之相應序列之一集合。視訊編碼器20可接著編碼包括用於該等經判定參數之資料之一VPS(104)。舉例而言,視訊編碼器20可寫碼對應於表2或表5之實例中之一者之VPS。
視訊編碼器20亦可判定用於一個層內之一序列之共同參數(106)。該序列可包含對應於其他層中之其他序列之序列中之一者,VPS係針對該序列而寫碼。視訊編碼器20可寫碼包括用於該序列之該等共同參數之一序列參數組(SPS)(108)。因此,應理解,VPS及SPS為單獨資料結構且對應於不同類型之視訊資料。而VPS可對應於複數個層之中之相應序列之一集合,SPS對應於一個層中之一個序列。SPS可實質上遵照H.264/AVC之SPS,H.264/AVC之SPS藉由MVC(在上文之表1中說明)、即將到來之HEVC標準或上文所描述之表16之實例來擴展。另外,視訊編碼器20可寫碼用於序列中之圖像之圖像參數組(PPS)(110)。PPS可實質上遵照H.264/AVC之SPS、即將到來之HEVC標準或上文所描述之表13之實例。雖然圖7之方法展示僅一個PPS之寫碼,但應理解,可寫碼多個PPS。一或多個圖像可參考同一PPS。
視訊編碼器20可接著判定寫碼SPS及PPS所針對之最近層是否為最後一個層(112)。若最後一個層尚未經定址(112之「否」分支),則視訊編碼器20選擇下一層且(例如)根據步驟106-110寫碼用於該下一層之SPS及一或多個PPS。在最後一個層已經定址(112之「是」分支)之後,視訊編碼器20可基於VPS、SPS及PPS之資料來編碼各種層之視訊
資料。將在下文參看圖9至圖12更詳細地描述至少部分地基於VPS寫碼視訊資料之各種實例。
儘管圖7之實例中未展示,但在一些實例中,視訊編碼器20可另外編碼一或多個LPS及/或一或多個GPS,如上所述。LPS可實質上遵照表9、表10或表12之實例,而GPS可實質上遵照表14、表15或表17之實例。在此等實例中,視訊編碼器20至少部分地基於LPS及/或GPS來寫碼視訊資料。
以此方式,圖7之方法表示一方法之一實例,該方法包括:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;及至少部分地基於該VPS寫碼視訊資料之該一或多個層。
圖8為說明根據本發明之技術之用於解碼視訊資料之實例方法的流程圖。雖然關於視訊解碼器30進行描述,但應理解,其他視訊解碼器件可經組態以執行圖8之方法。
最初,視訊解碼器30接收包括用於經寫碼視訊資料之多個層之VPS、一或多個SPS及一或多個PPS之位元串流(120)。視訊解碼器30可接著解碼包括用於一或多個層之中之相應序列之共同參數之VPS(122)。同樣,視訊解碼器30可解碼包括用於一個層之一序列之共同參數之一序列參數組(124)。此外,視訊解碼器30可解碼包括用於該序列之一圖像之參數之一圖像參數組(126)。如上文所論述,一或多個圖像可參考相同PPS,且因此,PPS之參數可被視為為一或多個圖像所共有。同樣,雖然圖8中未展示,但視訊解碼器30可解碼用於該序列之複數個PPS。
此外,視訊解碼器30可判定最近層是否為待定址之最後一個層(128)。若最近層並非最後一個層(128之「否」分支),則視訊解碼器30可進行至根據步驟124及126解碼用於後續層之SPS及一或多個
PPS。另一方面,若最近層為最後一個層(128之「是」分支),則視訊解碼器30可進行至基於VPS、SPS及PPS解碼該等層之視訊資料(130)。將參看圖9至圖12更詳細地論述至少部分地基於VPS寫碼視訊資料之實例。
儘管圖8之實例中未展示,但在一些實例中,視訊解碼器30可另外解碼一或多個LPS及/或一或多個GPS,如上所述。LPS可實質上遵照表9、表10或表12之實例,而GPS可實質上遵照表14、表15或表17之實例。在此等實例中,視訊解碼器30亦至少部分地基於LPS及/或GPS來解碼視訊資料。
以此方式,圖8之方法表示一方法之一實例,該方法包括:寫碼用於視訊資料之一或多個層之一視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS;及至少部分地基於該VPS寫碼視訊資料之該一或多個層。
圖9說明至少部分地基於在VPS中用信號表示之時間層之數目寫碼視訊資料之實例方法的流程圖。圖9之方法可由視訊編碼器20及/或視訊解碼器30執行。出於例示目的,關於視訊解碼器30來描述圖9之方法。
在此實例中,視訊解碼器30寫碼(亦即,解碼)指示視訊資料中之時間層(例如,VPS所對應之一或多個層)之數目之VPS(150)。舉例而言,視訊解碼器30可解碼「cnt_t」,如上文關於表2所描述。作為另一實例,視訊解碼器30可解碼num_temporal_layers_minus1,如上文關於表5所描述。
基於此指示,在此實例中,視訊解碼器30解碼該等時間層中之每一者之時間識別符(152)。同樣,視訊解碼器30可基於時間層之數目判定參考圖像識別符值(154)。舉例而言,視訊解碼器30可經組態以判定對於層N處之當前圖像,當前圖像不將層N+1上或以上之圖像
用作參考。因此,視訊解碼器30可判定層N上或層N以下之層上之可能參考圖像之識別符。此外,視訊解碼器30可使用直至(且包括)層N之層之參考資料解碼時間層N上之圖像之資料(156)。因此,圖9表示方法之實例,該方法包括寫碼指示視訊資料之一或多個層中之時間層之最大數目的VPS之資料,及至少部分地基於該VPS寫碼該一或多個層。
圖10為說明至少部分地基於在一或多個層中待重新排序之圖像及待儲存於經解碼圖像緩衝器中之圖像之數目來寫碼視訊資料之實例方法的流程圖。圖10之方法可由視訊編碼器20及/或視訊解碼器30執行。出於例示目的,關於視訊解碼器30來描述圖10之方法。
在此實例中,視訊解碼器30解碼指示在一給定時間在視訊資料之一或多個層中待重新排序之圖像之數目及待儲存於一經解碼圖像緩衝器(例如,參考圖像記憶體82)中之圖像之數目之一VPS(160)。舉例而言,視訊解碼器30可解碼VPS之實質上對應於如上文關於表16所描述之num_reorder_pics之語法元素及/或指定DPB大小之位元串流限制資訊。在其他實例中,VPS可僅包括待重新排序之圖像之數目及待儲存於經解碼圖像緩衝器中之圖像之數目中之一者或另一者,且不必包括該兩者。視訊解碼器30可接著基於待重新排序及/或待儲存之圖像之數目管理經解碼圖像緩衝器(例如,參考圖像記憶體82)(162)。舉例而言,當多於待儲存之圖像之數目之圖像儲存於參考圖像記憶體82中時,視訊解碼器30可自參考圖像記憶體82移除圖像。
視訊解碼器30亦可基於DPB中(亦即,參考圖像記憶體82中)之圖像之數目判定參考圖像識別符值(164)。此外,視訊解碼器30可基於該等參考圖像識別符值解碼圖像之資料(166)。因此,圖10之方法表示包括寫碼一VPS之指示在一或多個層之解碼期間將儲存於一經解碼圖像緩衝器(DPB)中之圖像之數目之資料的方法及包括寫碼一VPS之
指示在一或多個層中之至少一者中待重新排序之圖框之數目之資料的方法之實例。
圖11為說明至少部分地基於在VPS中用信號表示之假想參考解碼器(HRD)來寫碼視訊資料之實例方法的流程圖。圖11之方法可由視訊編碼器20及/或視訊解碼器30執行。出於例示目的,關於視訊解碼器30來描述圖11之方法。
在此實例中,視訊解碼器30解碼指示HRD參數之一VPS(170)。視訊解碼器30可基於該等HRD參數進一步判定來自經寫碼圖像緩衝器(CPB)之圖像的移除時間(172)。視訊解碼器30可接著基於該等經判定之移除時間而自該CPB移除資料(174),且解碼自該CPB移除之資料。因此,圖11之方法表示包括以下步驟之方法之實例:寫碼一VPS之指示一或多個假想參考解碼器(HRD)參數之資料,及基於該HRD參數解碼一或多個層之資料。
圖12為說明至少部分地基於在VPS中用信號表示之擴展資料來寫碼視訊資料之實例方法的流程圖。圖12之方法可由視訊編碼器20及/或視訊解碼器30執行。出於例示目的,關於視訊解碼器30來描述圖12之方法。
在此實例中,視訊解碼器30解碼指示VPS是否包括擴展資料之VPS之資料(180)。舉例而言,視訊解碼器30可解碼該VPS之一vps_extension_flag。視訊解碼器30接著判定該資料是否指示該VPS包括擴展資料(182)。若該資料指示該VPS包括擴展資料(182之「是」分支),則視訊解碼器30寫碼用於一或多個擴展寫碼工具之VPS擴展資料(184),且使用該等擴展寫碼工具及該擴展資料解碼視訊資料(186)。另一方面,若該資料指示該VPS不包括擴展資料(182之「否」分支),則視訊解碼器30可使用習知寫碼工具解碼視訊資料(188)。以此方式,圖12之方法表示包括以下操作之方法之實例:寫碼VPS之指
示該VPS是否包括超出一相應標準之一擴展之資料,且在該VPS包括該擴展時寫碼用於該擴展之資料;以及基於該VPS之該擴展資料寫碼視訊資料。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同順序執行、可增添、合併或完全省略(例如,對於實踐該等技術而言並非所有所描述之動作或實踐皆係必要的)。此外,在某些實例中,可(例如)經由多執行緒處理、中斷處理或多個處理器同時而非按順序執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
藉由實例而非限制,此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纖纜線、雙
絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為,係有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可藉由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
在另外其他實例中,本發明涵蓋一電腦可讀媒體,該電腦可讀媒體包含儲存於其上之資料結構,其中該資料結構包括符合本發明之經編碼位元串流。詳言之,該經編碼位元串流可包括視訊資料之一或多個層,及用於視訊資料之該一或多個層之視訊參數組(VPS),其中視訊資料之該一或多個層中之每一者參考該VPS,且視訊資料之該一或多個層係至少部分地基於該VPS而寫碼。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件之功能態樣,但未必需要藉由不同硬體單元予以實現。相反地,如上所述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬
體單元(包括如上所述之一或多個處理器)之集合而結合適合軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
Claims (39)
- 一種寫碼視訊資料之方法,該方法包含:寫碼用於視訊資料之複數個層之一視訊參數組(VPS),其中視訊資料之該複數個層中之每一者參考該VPS,且其中寫碼該VPS包含:寫碼該VPS之指示視訊資料之該複數個層中之至少一者中待重新排序之圖框之一數目的資料;寫碼該VPS之指示在視訊資料之該複數個層之解碼期間待儲存於一經解碼圖像緩衝器(DPB)中之圖像之一數目的資料;及寫碼該VPS之指示視訊資料之該複數個層中之時間層之一最大數目之資料;及至少部分地基於該VPS以寫碼視訊資料之該複數個層。
- 如請求項1之方法,其中寫碼該VPS進一步包含寫碼該VPS之指示假想參考解碼器(HRD)參數之一或多個集合的資料。
- 如請求項1之方法,其中寫碼該VPS進一步包含寫碼該VPS之指示該VPS是否包括超出一相應標準之一擴展的資料,且在該VPS包括該擴展時,寫碼用於該擴展之資料。
- 如請求項1之方法,其中寫碼視訊資料之該複數個層包含根據高效率視訊寫碼(HEVC)寫碼視訊資料之該複數個層。
- 如請求項1之方法,其中寫碼視訊資料之該複數個層包含根據多視圖視訊寫碼(MVC)及可縮放視訊寫碼(SVC)中之至少一者寫碼視訊資料之該複數個層。
- 如請求項1之方法,其中寫碼該VPS包含寫碼針對視訊資料之該複數個層之一或多個維度指定以下各者中之一或多者的資訊:視訊資料之該複數個層中之優先層之一數目,視訊資料之該複 數個層中之相依層之一數目,視訊資料之該複數個層中之時間層之一數目,用於視訊資料之該複數個層中之該等相依層中之任一者的品質層之一最大數目,及視訊資料之該複數個層中之視圖之一最大數目。
- 如請求項6之方法,其中當視訊資料之該複數個層之一子集具有相同空間解析度及相同位元深度時,該子集之該等層中之每一者對應於該等相依層中之一不同層。
- 如請求項7之方法,其中寫碼該VPS包含寫碼定義一特性指示符之一樣本索引之一映射之資訊,且其中寫碼定義該映射之該資訊包含寫碼當定義視訊資料之該複數個層之一維度之特性的一特性指示符不在零至一樣本維度計數減1之一索引範圍內時,指定用於複數個特性索引中之每一者之一各別特性指示符之資訊,其中該計數係由一索引所定義。
- 如請求項7之方法,其中寫碼該VPS包含寫碼定義一特性指示符之一樣本索引之一映射之資訊,且其中寫碼定義該映射之該資訊包含寫碼以下各者中之一或多者:複數個相依索引中之每一者之一各別空間解析度、複數個時間索引中之每一者之一圖框率、複數個視圖索引中之每一者之一視圖識別符、複數個位元深度索引中之每一者之明度及色度之一對特定深度值,及複數個色度取樣格式中之每一者之一特定色度取樣格式指示符。
- 如請求項1之方法,其中寫碼該VPS包含寫碼定義控制參數及一或多個工具啟用/停用旗標之資訊。
- 如請求項10之方法,其中該等控制參數及該一或多個工具啟用/停用旗標包含以下各者中之一或多者:一pcm_bit_depth_luma_minus1、一pcm_bit_depth_chroma_minus1、一loop_filter_across_slice_flag、 一pcm_loop_filter_disable_flag、一temporal_id_nesting_flag、一或多個影像塊相關之語法元素、一chroma_pred_from_luma_enabled_flag、一sample_adaptive_offset_enabled_flag、一adaptive_loop_filter_enabled_flag及一inter_4×4_enabled_flag。
- 如請求項1之方法,其中寫碼該VPS包含寫碼定義一或多個操作點描述符之資訊。
- 如請求項12之方法,其中寫碼定義該一或多個操作點描述符之該資訊包含寫碼定義以下各者中之一或多者之資訊:最大操作點之一數目;不同層或視圖之間的相依性;該等操作點中之每一者之設定檔及層級;對於每一操作點,操作點視訊寫碼層(VCL)網路抽象層(NAL)單元表示;對於每一維度,一特定索引值、該維度之可能索引值之一範圍及索引值之一清單中之一或多者;該等操作點中之每一者之位元速率;該等操作點之間的相依性;該等操作點中之每一者之限制;該等操作點中之每一者之視訊可用性資訊(VUI);及用於視訊資料之該複數個層中之每一者之VUI。
- 如請求項1之方法,其進一步包含寫碼用於視訊資料之該複數個層中之每一者之一各別分層序列參數組(LPS),其中至少部分地基於該VPS寫碼視訊資料之該複數個層包含至少部分地基於該VPS及該各別LPS寫碼視訊資料之該複數個層。
- 如請求項14之方法,其中寫碼用於視訊資料之該複數個層中之每一者的該等各別LPS包含寫碼定義針對每一維度指示每一維度之一索引之一樣本維度指示的資訊。
- 如請求項14之方法,其中寫碼用於視訊資料之該複數個層中之每一者的該等各別LPS包含寫碼定義控制參數及工具啟用/停用 旗標之資訊。
- 如請求項16之方法,其中該等控制參數及該一或多個工具啟用/停用旗標包含以下各者中之一或多者:一pcm_bit_depth_luma_minus1、一pcm_bit_depth_chroma_minus1、一loop_filter_across_slice_flag、一pcm_loop_filter_disable_flag、一或多個影像塊相關之語法元素、一chroma_pred_from_luma_enabled_flag、一sample_adaptive_offset_enabled_flag、一adaptive_loop_filter_enabled_flag及一寫碼單元(CU)階層。
- 如請求項14之方法,其中寫碼用於視訊資料之該複數個層中之每一者的該等各別LPS包含寫碼定義應用於一片段、片段之一群組、一圖像及參考一共同圖像參數組(PPS)之若干圖像中之至少一者的一或多個其他參數組之資訊的資訊。
- 如請求項1之方法,其進一步包含寫碼一或多個圖像參數組(PPS),以使得該等PPS不參考該VPS、不參考視訊資料之該複數個層之分層序列參數組(LPS)。
- 如請求項19之方法,其中至少部分地基於該VPS寫碼視訊資料之該複數個層包含至少部分地基於該VPS、該等PPS及該等LPS寫碼視訊資料之該複數個層,以使得當該等PPS中之一者之一語法元素與該VPS或該等LPS中之一各別者衝突時,基於該等PPS中之該一者之該語法元素寫碼視訊資料之該複數個層中之一相應層。
- 如請求項1之方法,其進一步包含寫碼將用於視訊資料之該複數個層之包括該VPS之所有參數組分群在一起之一分群參數組(GPS)。
- 如請求項21之方法,其中寫碼該GPS包含寫碼定義該GPS之一識 別符之資訊,該方法進一步包含寫碼對應於該GPS之該識別符之一片段標頭之資訊。
- 如請求項1之方法,其中寫碼視訊資料之該複數個層包含解碼視訊資料之該複數個層,且其中寫碼該VPS包含剖析該VPS。
- 如請求項1之方法,其中寫碼視訊資料之該複數個層包含編碼視訊資料之該複數個層,且其中寫碼該VPS包含構造該VPS。
- 一種用於寫碼視訊資料之器件,該器件包含一視訊寫碼器,該視訊寫碼器經組態以:寫碼用於視訊資料之複數個層之一視訊參數組(VPS),其中視訊資料之該複數個層中之每一者參考該VPS,且其中經組態以寫碼該VPS之該視訊寫碼器經組態以:寫碼該VPS之指示視訊資料之該複數個層中之至少一者中待重新排序之圖框之一數目的資料;寫碼該VPS之指示在視訊資料之該複數個層之解碼期間待儲存於一經解碼圖像緩衝器(DPB)中之圖像之一數目的資料;及寫碼該VPS之指示視訊資料之該複數個層中之時間層之一最大數目之資料;及至少部分地基於該VPS以寫碼視訊資料之該複數個層。
- 如請求項25之器件,其中經組態以寫碼該VPS之該視訊寫碼器經進一步組態以寫碼該VPS之指示假想參考解碼器(HRD)參數之一或多個集合之資料。
- 如請求項25之器件,其中經組態以寫碼該VPS之該視訊寫碼器經進一步組態以寫碼該VPS之指示該VPS是否包括超出一相應標準之一擴展之資料,且在該VPS包括該擴展時,寫碼用於該擴展之資料。
- 如請求項25之器件,其中該視訊寫碼器經組態以根據高效率視 訊寫碼(HEVC)、多視圖視訊寫碼(MVC)及可縮放視訊寫碼(SVC)中之一者寫碼視訊資料之該複數個層。
- 如請求項25之器件,其中該視訊寫碼器包含一視訊解碼器,且其中該器件進一步包含經組態以顯示該視訊資料之一顯示器。
- 如請求項25之器件,其中該視訊寫碼器包含一視訊編碼器,且其中該器件進一步包含經組態以產生該視訊資料之一相機。
- 如請求項25之器件,其中該器件包含以下各者中之至少一者:一積體電路;一微處理器;或包括該視訊寫碼器之一行動無線通信器件。
- 一種用於寫碼視訊資料之器件,該器件包含:用於寫碼用於視訊資料之複數個層之一視訊參數組(VPS)之構件,其中視訊資料之該複數個層中之每一者參考該VPS,且其中用於寫碼該VPS之該構件包含:用於寫碼該VPS之指示視訊資料之該複數個層中之至少一者中待重新排序之圖框之一數目的資料之構件;用於寫碼該VPS之指示在視訊資料之該複數個層之解碼期間待儲存於一經解碼圖像緩衝器(DPB)中之圖像之一數目的資料之構件;及用於寫碼該VPS之指示視訊資料之該複數個層中之時間層之一最大數目之資料之構件;及用於至少部分地基於該VPS以寫碼視訊資料之該複數個層之構件。
- 如請求項32之器件,其中用於寫碼該VPS之該構件進一步包含用於寫碼該VPS之指示假想參考解碼器(HRD)參數之一或多個集合之資料之構件。
- 如請求項32之器件,其中用於寫碼該VPS之該構件進一步包含用於寫碼該VPS之指示該VPS是否包括超出一相應標準之一擴展之資料之構件,且在該VPS包括該擴展時,寫碼用於該擴展之資料。
- 如請求項32之器件,其中用於寫碼該VPS之該構件包含用於根據高效率視訊寫碼(HEVC)、多視圖視訊寫碼(MVC)及可縮放視訊寫碼(SVC)中之一者寫碼視訊資料之該複數個層。
- 一種非暫時性之電腦可讀儲存媒體,其上儲存有在執行時使一處理器進行以下操作之指令:寫碼用於視訊資料之複數個層之一視訊參數組(VPS),其中視訊資料之該複數個層中之每一者參考該VPS,且其中使該處理器寫碼該VPS之該等指令包含指令使該處理器:寫碼該VPS之指示視訊資料之該複數個層中之至少一者中待重新排序之圖框之一數目的資料;寫碼該VPS之指示在視訊資料之該複數個層之解碼期間待儲存於一經解碼圖像緩衝器(DPB)中之圖像之一數目的資料;及寫碼該VPS之指示視訊資料之該複數個層中之時間層之一最大數目之資料;及至少部分地基於該VPS以寫碼視訊資料之該複數個層。
- 如請求項36之電腦可讀儲存媒體,其中使該處理器寫碼該VPS之該等指令進一步包含使該處理器寫碼該VPS之指示假想參考解碼器(HRD)參數之一或多個集合之資料的指令。
- 如請求項36之電腦可讀儲存媒體,其中使該處理器寫碼該VPS之該等指令進一步包含使該處理器寫碼該VPS之指示該VPS是否包括超出一相應標準之一擴展之資料,且在該VPS包括該擴展時寫碼用於該擴展之資料的指令。
- 如請求項36之電腦可讀儲存媒體,其中使該處理器寫碼視訊資料之該複數個層之該等指令包含使該處理器根據高效率視訊寫碼(HEVC)、多視圖視訊寫碼(MVC)及可縮放視訊寫碼(SVC)中之一者寫碼視訊資料之該複數個層之指令。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261586777P | 2012-01-14 | 2012-01-14 | |
US201261587070P | 2012-01-16 | 2012-01-16 | |
US201261588629P | 2012-01-19 | 2012-01-19 | |
US201261637195P | 2012-04-23 | 2012-04-23 | |
US201261637774P | 2012-04-24 | 2012-04-24 | |
US13/738,377 US9451252B2 (en) | 2012-01-14 | 2013-01-10 | Coding parameter sets and NAL unit headers for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201342891A TW201342891A (zh) | 2013-10-16 |
TWI517692B true TWI517692B (zh) | 2016-01-11 |
Family
ID=48779946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102101271A TWI517692B (zh) | 2012-01-14 | 2013-01-11 | 用於視訊寫碼之寫碼參數組及網路抽象層單元標頭 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9451252B2 (zh) |
EP (1) | EP2803193B1 (zh) |
JP (1) | JP6117243B2 (zh) |
KR (1) | KR101760165B1 (zh) |
CN (1) | CN104054345B (zh) |
AU (1) | AU2013207799B2 (zh) |
BR (1) | BR112014017159B1 (zh) |
CA (1) | CA2860776C (zh) |
DK (1) | DK2803193T3 (zh) |
ES (1) | ES2633651T3 (zh) |
HU (1) | HUE032097T2 (zh) |
IL (1) | IL233228A (zh) |
MY (1) | MY167149A (zh) |
PH (1) | PH12014501447A1 (zh) |
RU (1) | RU2633117C2 (zh) |
SG (2) | SG11201403325SA (zh) |
SI (1) | SI2803193T1 (zh) |
TW (1) | TWI517692B (zh) |
WO (1) | WO2013106705A2 (zh) |
Families Citing this family (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8761502B1 (en) | 2011-09-30 | 2014-06-24 | Tribune Broadcasting Company, Llc | Systems and methods for identifying a colorbar/non-colorbar frame attribute |
US20130114710A1 (en) * | 2011-11-08 | 2013-05-09 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video by prediction using reference picture list, and method and apparatus for decoding video by performing compensation using reference picture list |
US9451252B2 (en) | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
KR20130116782A (ko) * | 2012-04-16 | 2013-10-24 | 한국전자통신연구원 | 계층적 비디오 부호화에서의 계층정보 표현방식 |
WO2013162450A1 (en) * | 2012-04-24 | 2013-10-31 | Telefonaktiebolaget L M Ericsson (Publ) | Encoding and deriving parameters for coded multi-layer video sequences |
GB2501535A (en) * | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US9602827B2 (en) | 2012-07-02 | 2017-03-21 | Qualcomm Incorporated | Video parameter set including an offset syntax element |
WO2014005305A1 (en) * | 2012-07-04 | 2014-01-09 | Intel Corporation | Inter-view filter parameters re-use for three dimensional video coding |
EP2871567A4 (en) * | 2012-07-06 | 2016-01-06 | Samsung Electronics Co Ltd | METHOD AND APPARATUS FOR ENCODING MULTILAYER VIDEO, AND METHOD AND APPARATUS FOR DECODING MULTILAYER VIDEO |
US9992490B2 (en) * | 2012-09-26 | 2018-06-05 | Sony Corporation | Video parameter set (VPS) syntax re-ordering for easy access of extension parameters |
BR112015006323A2 (pt) * | 2012-09-28 | 2017-07-04 | Sony Corp | dispositivo e método de processamento de imagem |
US9706199B2 (en) * | 2012-09-28 | 2017-07-11 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
US20150237372A1 (en) * | 2012-10-08 | 2015-08-20 | Samsung Electronics Co., Ltd. | Method and apparatus for coding multi-layer video and method and apparatus for decoding multi-layer video |
US9936196B2 (en) * | 2012-10-30 | 2018-04-03 | Qualcomm Incorporated | Target output layers in video coding |
KR20140087971A (ko) | 2012-12-26 | 2014-07-09 | 한국전자통신연구원 | 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치 |
US9848202B2 (en) * | 2012-12-28 | 2017-12-19 | Electronics And Telecommunications Research Institute | Method and apparatus for image encoding/decoding |
US10219006B2 (en) | 2013-01-04 | 2019-02-26 | Sony Corporation | JCTVC-L0226: VPS and VPS_extension updates |
US10419778B2 (en) | 2013-01-04 | 2019-09-17 | Sony Corporation | JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure |
EP2966864A4 (en) * | 2013-04-05 | 2016-10-19 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR DECODING A MULTILAYER VIDEO AND METHOD AND DEVICE FOR CODING MULTILAYER VIDEOS |
US9591321B2 (en) | 2013-04-07 | 2017-03-07 | Dolby International Ab | Signaling change in output layer sets |
SG10201913539SA (en) | 2013-04-07 | 2020-02-27 | Dolby Int Ab | Signaling change in output layer sets |
US9565437B2 (en) | 2013-04-08 | 2017-02-07 | Qualcomm Incorporated | Parameter set designs for video coding extensions |
US10075735B2 (en) * | 2013-07-14 | 2018-09-11 | Sharp Kabushiki Kaisha | Video parameter set signaling |
US9100631B2 (en) * | 2013-08-05 | 2015-08-04 | Cable Television Laboratories, Inc. | Dynamic picture quality control |
US9426465B2 (en) * | 2013-08-20 | 2016-08-23 | Qualcomm Incorporated | Sub-PU level advanced residual prediction |
CN104427323B (zh) * | 2013-08-23 | 2016-08-10 | 鸿富锦精密工业(深圳)有限公司 | 基于深度的三维图像处理方法 |
US20150078457A1 (en) * | 2013-09-13 | 2015-03-19 | Qualcomm Incorporated | Representation format signaling in multi-layer video coding |
US10104362B2 (en) * | 2013-10-08 | 2018-10-16 | Sharp Kabushiki Kaisha | Image decoding device, image coding device, and coded data |
US9648333B2 (en) * | 2013-10-11 | 2017-05-09 | Vid Scale, Inc. | High level syntax for HEVC extensions |
US20160227227A1 (en) * | 2013-10-11 | 2016-08-04 | Sharp Kabushiki Kaisha | Color information and chromaticity signaling |
KR20150043222A (ko) * | 2013-10-12 | 2015-04-22 | 삼성전자주식회사 | 멀티 레이어 비디오 부호화 방법 및 그 장치, 멀티 레이어 비디오 복호화 방법 및 그 장치 |
KR102275639B1 (ko) | 2013-10-14 | 2021-07-08 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징 |
US9936207B2 (en) * | 2013-10-14 | 2018-04-03 | Qualcomm Incorporated | Indication of parallel processing in video coding |
KR102290091B1 (ko) * | 2013-10-14 | 2021-08-18 | 한국전자통신연구원 | 다계층 기반의 영상 부호화/복호화 방법 및 장치 |
KR102257269B1 (ko) | 2013-10-14 | 2021-05-26 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐 |
WO2015056158A1 (en) * | 2013-10-14 | 2015-04-23 | Nokia Technologies Oy | Multi-layer hypothetical reference decoder |
CN105659602B (zh) | 2013-10-14 | 2019-10-08 | 微软技术许可有限责任公司 | 用于视频和图像编码的帧内块复制预测模式的编码器侧选项 |
WO2015056566A1 (ja) * | 2013-10-15 | 2015-04-23 | ソニー株式会社 | 画像処理装置および方法 |
WO2015078304A1 (en) | 2013-11-27 | 2015-06-04 | Mediatek Singapore Pte. Ltd. | Method of video coding using prediction based on intra picture block copy |
US9854270B2 (en) * | 2013-12-19 | 2017-12-26 | Qualcomm Incorporated | Device and method for scalable coding of video information |
CN104754358B (zh) * | 2013-12-27 | 2019-02-19 | 中兴通讯股份有限公司 | 码流的生成和处理方法、装置及系统 |
WO2015103462A1 (en) * | 2014-01-02 | 2015-07-09 | Vidyo, Inc. | Overlays using auxiliary pictures |
US10469863B2 (en) | 2014-01-03 | 2019-11-05 | Microsoft Technology Licensing, Llc | Block vector prediction in video and image coding/decoding |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US9749642B2 (en) | 2014-01-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Selection of motion vector precision |
US9774881B2 (en) * | 2014-01-08 | 2017-09-26 | Microsoft Technology Licensing, Llc | Representing motion vectors in an encoded bitstream |
US10567804B2 (en) | 2014-01-08 | 2020-02-18 | Qualcomm Incorporated | Carriage of HEVC extension bitstreams and buffer model with MPEG-2 systems |
US9826232B2 (en) * | 2014-01-08 | 2017-11-21 | Qualcomm Incorporated | Support of non-HEVC base layer in HEVC multi-layer extensions |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
US10368091B2 (en) | 2014-03-04 | 2019-07-30 | Microsoft Technology Licensing, Llc | Block flipping and skip mode in intra block copy prediction |
US20150264099A1 (en) * | 2014-03-14 | 2015-09-17 | Sharp Laboratories Of America, Inc. | Systems and methods for constraining a bitstream |
AU2015228999B2 (en) * | 2014-03-14 | 2018-02-01 | Interdigital Vc Holdings, Inc. | Systems and methods for RGB video coding enhancement |
JP6150134B2 (ja) * | 2014-03-24 | 2017-06-21 | ソニー株式会社 | 画像符号化装置および方法、画像復号装置および方法、プログラム、並びに記録媒体 |
US9402083B2 (en) * | 2014-04-24 | 2016-07-26 | Vidyo, Inc. | Signaling conformance points using profile space |
WO2015165030A1 (en) | 2014-04-29 | 2015-11-05 | Microsoft Technology Licensing, Llc | Encoder-side decisions for sample adaptive offset filtering |
WO2015192353A1 (en) | 2014-06-19 | 2015-12-23 | Microsoft Technology Licensing, Llc | Unified intra block copy and inter prediction modes |
US10356415B2 (en) | 2014-06-20 | 2019-07-16 | Qualcomm Incorporated | Systems and methods for constraining representation format parameters for a parameter set |
CN105874800B (zh) * | 2014-09-17 | 2019-05-10 | 联发科技股份有限公司 | 句法解析装置和句法解析方法 |
EP3202150B1 (en) | 2014-09-30 | 2021-07-21 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US10306269B2 (en) * | 2014-10-10 | 2019-05-28 | Qualcomm Incorporated | Operation point for carriage of layered HEVC bitstream |
US20160112724A1 (en) * | 2014-10-15 | 2016-04-21 | Qualcomm Incorporated | Hrd descriptor and buffer model of data streams for carriage of hevc extensions |
CN106105221B (zh) * | 2015-01-09 | 2021-05-04 | 索尼公司 | 图像处理设备、图像处理方法以及记录介质 |
US9591325B2 (en) | 2015-01-27 | 2017-03-07 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
WO2016123001A1 (en) | 2015-01-27 | 2016-08-04 | Dolby International Ab | Predictive image encoding and decoding with pixel group based quantization |
US10148969B2 (en) * | 2015-02-11 | 2018-12-04 | Qualcomm Incorporated | Of sample entry and operation point signalling in a layered video file format |
US11418812B2 (en) * | 2015-02-11 | 2022-08-16 | Qualcomm Incorporated | Placement of parameter sets and sync samples in video coding |
CN106664405B (zh) | 2015-06-09 | 2020-06-09 | 微软技术许可有限责任公司 | 用调色板模式对经逸出编码的像素的稳健编码/解码 |
US20170006283A1 (en) * | 2015-06-30 | 2017-01-05 | Microsoft Technology Licensing, Llc | Computationally efficient sample adaptive offset filtering during video encoding |
WO2017008263A1 (en) | 2015-07-15 | 2017-01-19 | Mediatek Singapore Pte. Ltd. | Conditional binary tree block partitioning structure |
US10547860B2 (en) * | 2015-09-09 | 2020-01-28 | Avago Technologies International Sales Pte. Limited | Video coding with trade-off between frame rate and chroma fidelity |
US10003822B2 (en) * | 2016-02-10 | 2018-06-19 | Primacomp, Inc. | Error-resilient coder of image sequences and video |
US11405611B2 (en) | 2016-02-15 | 2022-08-02 | Qualcomm Incorporated | Predicting filter coefficients from fixed filters for video coding |
JP6969541B2 (ja) * | 2016-04-12 | 2021-11-24 | ソニーグループ株式会社 | 送信装置および送信方法 |
US10356800B2 (en) * | 2016-05-09 | 2019-07-16 | Qualcomm Incorporated | Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication |
US10271069B2 (en) | 2016-08-31 | 2019-04-23 | Microsoft Technology Licensing, Llc | Selective use of start code emulation prevention |
US10506230B2 (en) * | 2017-01-04 | 2019-12-10 | Qualcomm Incorporated | Modified adaptive loop filter temporal prediction for temporal scalability support |
WO2018198487A1 (en) * | 2017-04-25 | 2018-11-01 | Sharp Kabushiki Kaisha | Systems and methods for signaling quality information for regions in virtual reality applications |
CN117201818A (zh) | 2017-05-26 | 2023-12-08 | Sk电信有限公司 | 对视频数据进行编码或解码的方法和发送比特流的方法 |
KR102435881B1 (ko) * | 2017-05-26 | 2022-08-24 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화하기 위한 장치 및 방법 |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
WO2019172202A1 (ja) * | 2018-03-05 | 2019-09-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
GB2588004B (en) | 2018-06-05 | 2023-03-01 | Beijing Bytedance Network Tech Co Ltd | Interaction between IBC and affine |
WO2019244117A1 (en) | 2018-06-21 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Unified constrains for the merge affine mode and the non-merge affine mode |
CN113115046A (zh) | 2018-06-21 | 2021-07-13 | 北京字节跳动网络技术有限公司 | 分量相关的子块分割 |
US10628276B2 (en) | 2018-06-29 | 2020-04-21 | International Business Machines Corporation | Unit test framework for testing code in a gateway service |
CN108898321B (zh) * | 2018-07-09 | 2021-08-24 | 西北工业大学 | 一种基于语义模板的制造技术问题标准冲突参数获取方法 |
CN110944196B (zh) | 2018-09-24 | 2023-05-30 | 北京字节跳动网络技术有限公司 | 简化的基于历史的运动矢量预测 |
WO2020094150A1 (en) | 2018-11-10 | 2020-05-14 | Beijing Bytedance Network Technology Co., Ltd. | Rounding in current picture referencing |
KR102660160B1 (ko) | 2018-11-22 | 2024-04-24 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 서브 블록 기반 인터 예측을 위한 조정 방법 |
US10812818B2 (en) | 2018-12-14 | 2020-10-20 | Tencent America LLC | Network abstraction unit layer type classes in network abstraction layer unit header |
CN113228666B (zh) | 2018-12-31 | 2022-12-30 | 华为技术有限公司 | 支持视频编解码中的自适应分辨率改变 |
WO2020142483A1 (en) * | 2018-12-31 | 2020-07-09 | Futurewei Technologies, Inc. | Explicit address signaling in video coding |
CN113366833A (zh) | 2019-02-01 | 2021-09-07 | 北京字节跳动网络技术有限公司 | 对环路整形的限制 |
CN113366841B (zh) | 2019-02-01 | 2024-09-20 | 北京字节跳动网络技术有限公司 | 配置用于视频编解码的依赖于亮度的色度残差缩放 |
KR102661416B1 (ko) * | 2019-02-27 | 2024-04-25 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코더, 디코더 및 대응하는 방법 |
US11395006B2 (en) * | 2019-03-06 | 2022-07-19 | Tencent America LLC | Network abstraction layer unit header |
CN113574889B (zh) | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
KR20210118951A (ko) * | 2019-03-15 | 2021-10-01 | 엘지전자 주식회사 | 크로마 포맷에 대한 정보를 시그널링 하는 방법 및 장치 |
KR20210139272A (ko) * | 2019-03-23 | 2021-11-22 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 적응적 루프 필터링 파라미터 세트들에 대한 제한들 |
CN113796074A (zh) * | 2019-03-25 | 2021-12-14 | 联发科技股份有限公司 | 用于视频编解码的量化矩阵计算和表示的方法和装置 |
US11917143B2 (en) * | 2019-04-03 | 2024-02-27 | Lg Electronics Inc. | Adaptive loop filter-based video or image coding |
KR20210130235A (ko) | 2019-04-15 | 2021-10-29 | 엘지전자 주식회사 | 스케일링 리스트 파라미터 기반 비디오 또는 영상 코딩 |
CN113728627B (zh) * | 2019-04-26 | 2023-09-19 | 北京字节跳动网络技术有限公司 | 用于环路内重构的参数的预测 |
KR102653570B1 (ko) * | 2019-05-12 | 2024-04-02 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 참조 픽처 리샘플링을 위한 신호 |
BR112021023469A2 (pt) * | 2019-05-24 | 2022-01-18 | Digital Insights Inc | Método de codificação de vídeo e aparelho usando conjunto de parâmetros adaptativos |
US11032548B2 (en) * | 2019-06-24 | 2021-06-08 | Tencent America LLC | Signaling for reference picture resampling |
KR20220042125A (ko) | 2019-08-10 | 2022-04-04 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 서브픽처 디코딩에서의 버퍼 관리 |
EP3997877A4 (en) | 2019-08-13 | 2023-05-24 | Beijing Bytedance Network Technology Co., Ltd. | MOTION ACCURACY IN SUBBLOCK-BASED INTERPREDICTION |
CN114586350A (zh) | 2019-08-29 | 2022-06-03 | Lg 电子株式会社 | 基于交叉分量自适应环路滤波的图像编译装置和方法 |
CA3241768A1 (en) | 2019-08-29 | 2021-03-04 | Lg Electronics Inc. | Device and method for coding video on basis of filtering |
CN114762330A (zh) | 2019-09-22 | 2022-07-15 | 北京字节跳动网络技术有限公司 | 视频的子图片编码和解码 |
JP2022549011A (ja) * | 2019-09-24 | 2022-11-22 | 華為技術有限公司 | ビデオコーディングにおけるピクチャーヘッダーのシグナリング |
KR20220065044A (ko) * | 2019-09-24 | 2022-05-19 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 공간 및 snr 확장성을 위한 ols |
CN115209153B (zh) | 2019-09-24 | 2023-06-06 | 华为技术有限公司 | 编码器、解码器及对应方法 |
JPWO2021117813A1 (zh) * | 2019-12-13 | 2021-06-17 | ||
WO2021134015A1 (en) | 2019-12-26 | 2021-07-01 | Bytedance Inc. | Profile, tier and layer indication in video coding |
EP4062634A4 (en) * | 2019-12-26 | 2022-12-28 | ByteDance Inc. | LIMITATIONS ON SIGNALING HYPOTHETICAL REFERENCE DECODER PARAMETERS IN VIDEO BITSTREAMS |
JP7568350B2 (ja) * | 2019-12-26 | 2024-10-16 | バイトダンス インコーポレイテッド | ビデオコーディングにおける復号パラメータセット |
CN114902567A (zh) | 2019-12-27 | 2022-08-12 | 字节跳动有限公司 | 视频编解码中的子图像信令 |
US11343524B2 (en) * | 2019-12-27 | 2022-05-24 | Tencent America LLC | Method for adaptation parameter set reference and constraints in coded video stream |
US11356698B2 (en) | 2019-12-30 | 2022-06-07 | Tencent America LLC | Method for parameter set reference constraints in coded video stream |
EP4074052A4 (en) | 2020-01-09 | 2023-05-31 | ByteDance Inc. | PROCESSING OF FILLER DATA UNITS IN VIDEO STREAMS |
RU2730422C1 (ru) * | 2020-01-14 | 2020-08-21 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский автомобильно-дорожный государственный технический университет (МАДИ) | Способ пространственного кодирования и передачи цифровой информации |
CN115280771A (zh) * | 2020-01-15 | 2022-11-01 | Lg电子株式会社 | 基于滤波相关信息信令的图像编码设备和方法 |
KR20220110299A (ko) * | 2020-01-15 | 2022-08-05 | 엘지전자 주식회사 | 인루프 필터링 기반 영상 코딩 장치 및 방법 |
WO2021145726A1 (ko) * | 2020-01-15 | 2021-07-22 | 엘지전자 주식회사 | 적응적 루프 필터링 기반 영상 코딩 장치 및 방법 |
BR112022015242A2 (pt) * | 2020-02-04 | 2022-09-20 | Huawei Tech Co Ltd | Codificador, decodificador e métodos correspondentes sobre sinalização de sintaxe de alto nível |
EP4101166A1 (en) * | 2020-02-06 | 2022-12-14 | Interdigital Patent Holdings, Inc. | Systems and methods for encoding a deep neural network |
EP4304174A3 (en) | 2020-03-11 | 2024-03-20 | Beijing Bytedance Network Technology Co., Ltd. | Adaptive loop filtering |
US11509920B2 (en) | 2020-03-27 | 2022-11-22 | Tencent America LLC | Indication of max sublayer numbers in multilayered video stream |
WO2021197433A1 (en) * | 2020-04-01 | 2021-10-07 | Mediatek Inc. | Method and apparatus for signaling slice partition information in image and video coding |
JP2023524201A (ja) * | 2020-04-21 | 2023-06-09 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ビデオ・コーディングにおける制約処理及び適合性試験のためのセマンティクス |
EP4140140A4 (en) | 2020-05-21 | 2023-07-05 | ByteDance Inc. | PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS |
US11431998B2 (en) * | 2020-05-22 | 2022-08-30 | Tencent America LLC | Systems and methods for decoding based on inferred video parameter sets |
CN115668949A (zh) * | 2020-05-26 | 2023-01-31 | 字节跳动有限公司 | 编解码视频中的帧间层参考图片的标识 |
WO2021244419A1 (en) | 2020-05-31 | 2021-12-09 | Beijing Bytedance Network Technology Co., Ltd. | Constraint signaling using general constraint information syntax element |
US11770549B2 (en) * | 2020-06-10 | 2023-09-26 | Sony Group Corporation | Video data encoding and decoding circuity applying constraint data |
GB2599171A (en) * | 2020-09-29 | 2022-03-30 | Canon Kk | Method and apparatus for encapsulating video data into a file |
WO2022226523A1 (en) * | 2021-04-23 | 2022-10-27 | Bytedance Inc. | Method, device, and medium for video processing |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7302490B1 (en) | 2000-05-03 | 2007-11-27 | Microsoft Corporation | Media file format to support switching between multiple timeline-altered media streams |
US20040006575A1 (en) | 2002-04-29 | 2004-01-08 | Visharam Mohammed Zubair | Method and apparatus for supporting advanced coding formats in media files |
EP1385337A1 (en) | 2002-07-22 | 2004-01-28 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for storing and transmitting audio-visual data |
US7336720B2 (en) | 2002-09-27 | 2008-02-26 | Vanguard Software Solutions, Inc. | Real-time video coding/decoding |
US7724818B2 (en) | 2003-04-30 | 2010-05-25 | Nokia Corporation | Method for coding sequences of pictures |
US20050254575A1 (en) | 2004-05-12 | 2005-11-17 | Nokia Corporation | Multiple interoperability points for scalable media coding and transmission |
KR20050113501A (ko) | 2004-05-29 | 2005-12-02 | 삼성전자주식회사 | 에이치 264 비디오 디코더를 위한 구문 분석기 |
US9560367B2 (en) | 2004-09-03 | 2017-01-31 | Nokia Technologies Oy | Parameter set and picture header in video coding |
DE102004042819A1 (de) | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
US20060233247A1 (en) | 2005-04-13 | 2006-10-19 | Visharam Mohammed Z | Storing SVC streams in the AVC file format |
US8208564B2 (en) | 2005-06-24 | 2012-06-26 | Ntt Docomo, Inc. | Method and apparatus for video encoding and decoding using adaptive interpolation |
KR20080066784A (ko) | 2005-10-11 | 2008-07-16 | 노키아 코포레이션 | 규모가변적 비디오 코딩을 위한 효율적 디코딩 화상 버퍼관리 |
JP5213064B2 (ja) | 2006-03-29 | 2013-06-19 | トムソン ライセンシング | マルチビュービデオ符号化方法及びその装置 |
KR100934674B1 (ko) | 2006-03-30 | 2009-12-31 | 엘지전자 주식회사 | 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치 |
EP1985121A4 (en) | 2006-11-17 | 2010-01-13 | Lg Electronics Inc | METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL |
EP2103136B1 (en) | 2006-12-21 | 2017-11-01 | Thomson Licensing | Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding |
JP5535646B2 (ja) * | 2007-01-05 | 2014-07-02 | トムソン ライセンシング | スケーラブル映像符号化用の仮想リファレンスデコーダ |
US9344362B2 (en) | 2007-01-12 | 2016-05-17 | University-Industry Cooperation Group Of Kyung Hee University | Packet format of network abstraction layer unit, and algorithm and apparatus for video encoding and decoding using the format, QOS control algorithm and apparatus for IPV6 label switching using the format |
US20100266042A1 (en) | 2007-03-02 | 2010-10-21 | Han Suh Koo | Method and an apparatus for decoding/encoding a video signal |
US8548261B2 (en) | 2007-04-11 | 2013-10-01 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding multi-view image |
BR122012013077A2 (pt) | 2007-04-18 | 2015-07-14 | Thomson Licensing | Sinal tendo parâmetros de decodificação para codificação de vídeo de múltiplas vistas |
US20090003431A1 (en) | 2007-06-28 | 2009-01-01 | Lihua Zhu | Method for encoding video data in a scalable manner |
BR122012021950A2 (pt) * | 2007-10-05 | 2015-08-04 | Thomson Licensing | Aparelho para incorporação de informação de usabilidade de vídeo (vui) em um sistema de codificação de vídeo com múltiplos visualizações (mvc) |
CA2650151C (en) * | 2008-01-17 | 2013-04-02 | Lg Electronics Inc. | An iptv receiving system and data processing method |
EP2286595A1 (en) | 2008-06-16 | 2011-02-23 | Dolby Laboratories Licensing Corporation | Rate control model adaptation based on slice dependencies for video coding |
US8683515B2 (en) | 2008-11-25 | 2014-03-25 | Cisco Technology, Inc. | Receiver for accelerating channel change time |
US20100132007A1 (en) | 2008-11-25 | 2010-05-27 | Cisco Technology, Inc. | Accelerating channel change time with external picture property markings |
TW201032597A (en) | 2009-01-28 | 2010-09-01 | Nokia Corp | Method and apparatus for video coding and decoding |
WO2010102650A1 (en) | 2009-03-13 | 2010-09-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Technique for bringing encoded data items into conformity with a scalable coding protocol |
US20120050475A1 (en) | 2009-05-01 | 2012-03-01 | Dong Tian | Reference picture lists for 3dv |
US9774882B2 (en) | 2009-07-04 | 2017-09-26 | Dolby Laboratories Licensing Corporation | Encoding and decoding architectures for format compatible 3D video delivery |
US8462797B2 (en) | 2009-11-30 | 2013-06-11 | Alcatel Lucent | Method of priority based transmission of wireless video |
US9094658B2 (en) | 2010-05-10 | 2015-07-28 | Mediatek Inc. | Method and apparatus of adaptive loop filtering |
US10034009B2 (en) | 2011-01-14 | 2018-07-24 | Vidyo, Inc. | High layer syntax for temporal scalability |
US9113172B2 (en) | 2011-01-14 | 2015-08-18 | Vidyo, Inc. | Techniques for describing temporal coding structure |
US20120230430A1 (en) | 2011-03-10 | 2012-09-13 | Stephan Wenger | Parameter Set Maintenance in Video Coding |
AU2012225513B2 (en) | 2011-03-10 | 2016-06-23 | Vidyo, Inc. | Dependency parameter set for scalable video coding |
CA2829290C (en) | 2011-03-10 | 2017-10-17 | Vidyo, Inc. | Render-orientation information in video bitstream |
US9635355B2 (en) | 2011-07-28 | 2017-04-25 | Qualcomm Incorporated | Multiview video coding |
US10237565B2 (en) | 2011-08-01 | 2019-03-19 | Qualcomm Incorporated | Coding parameter sets for various dimensions in video coding |
US20130094774A1 (en) * | 2011-10-13 | 2013-04-18 | Sharp Laboratories Of America, Inc. | Tracking a reference picture based on a designated picture on an electronic device |
US20130114694A1 (en) | 2011-11-08 | 2013-05-09 | Qualcomm Incorporated | Parameter set groups for coded video data |
US20130195201A1 (en) | 2012-01-10 | 2013-08-01 | Vidyo, Inc. | Techniques for layered video encoding and decoding |
US9451252B2 (en) | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
KR20130119379A (ko) | 2012-04-23 | 2013-10-31 | 삼성전자주식회사 | 다시점 비디오 예측을 위한 참조리스트를 이용하는 다시점 비디오 부호화 방법 및 그 장치, 다시점 비디오 예측을 위한 참조리스트를 이용하는 다시점 비디오 복호화 방법 및 그 장치 |
US9602827B2 (en) | 2012-07-02 | 2017-03-21 | Qualcomm Incorporated | Video parameter set including an offset syntax element |
US20140218473A1 (en) | 2013-01-07 | 2014-08-07 | Nokia Corporation | Method and apparatus for video coding and decoding |
US9565437B2 (en) | 2013-04-08 | 2017-02-07 | Qualcomm Incorporated | Parameter set designs for video coding extensions |
-
2013
- 2013-01-10 US US13/738,377 patent/US9451252B2/en active Active
- 2013-01-11 DK DK13700835.5T patent/DK2803193T3/en active
- 2013-01-11 AU AU2013207799A patent/AU2013207799B2/en active Active
- 2013-01-11 CN CN201380005237.2A patent/CN104054345B/zh active Active
- 2013-01-11 TW TW102101271A patent/TWI517692B/zh active
- 2013-01-11 BR BR112014017159-9A patent/BR112014017159B1/pt active IP Right Grant
- 2013-01-11 RU RU2014133415A patent/RU2633117C2/ru active
- 2013-01-11 SI SI201330712T patent/SI2803193T1/sl unknown
- 2013-01-11 CA CA2860776A patent/CA2860776C/en active Active
- 2013-01-11 ES ES13700835.5T patent/ES2633651T3/es active Active
- 2013-01-11 JP JP2014552328A patent/JP6117243B2/ja active Active
- 2013-01-11 MY MYPI2014701914A patent/MY167149A/en unknown
- 2013-01-11 SG SG11201403325SA patent/SG11201403325SA/en unknown
- 2013-01-11 SG SG10201605700SA patent/SG10201605700SA/en unknown
- 2013-01-11 EP EP13700835.5A patent/EP2803193B1/en active Active
- 2013-01-11 WO PCT/US2013/021227 patent/WO2013106705A2/en active Search and Examination
- 2013-01-11 KR KR1020147022571A patent/KR101760165B1/ko active IP Right Grant
- 2013-01-11 HU HUE13700835A patent/HUE032097T2/en unknown
-
2014
- 2014-06-18 IL IL233228A patent/IL233228A/en active IP Right Grant
- 2014-06-23 PH PH12014501447A patent/PH12014501447A1/en unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI517692B (zh) | 用於視訊寫碼之寫碼參數組及網路抽象層單元標頭 | |
JP6400660B2 (ja) | Hevcおよび拡張のためのビデオパラメータセット | |
JP6141386B2 (ja) | 深度範囲パラメータのシグナリング | |
JP6513650B2 (ja) | ビデオコーディングのための復号ピクチャバッファ動作 | |
TWI520573B (zh) | 用於寫碼視訊資料之方法、器件及電腦可讀儲存媒體 | |
JP5902300B2 (ja) | マルチビュービデオコード化 | |
JP6591424B2 (ja) | Hevcマルチレイヤ拡張における非hevcベースレイヤのサポート | |
KR102113906B1 (ko) | 비디오 코딩에서의 nooutputofpriorpicsflag 의 개선된 추론 | |
JP6542251B2 (ja) | マルチレイヤビットストリームのためのsps時間idネスティング情報の導出 | |
TW201830965A (zh) | 用於時間延展性支持之修改適應性迴路濾波器時間預測 | |
JP6158422B2 (ja) | アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント | |
JP5908586B2 (ja) | マルチビュービデオコード化 | |
KR102127549B1 (ko) | 멀티-계층 비디오 코딩에서의 상이한 코덱의 기본 계층의 지원 | |
TW201511530A (zh) | 用於視訊寫碼之跨層平行處理與偏移延遲參數 | |
US9813736B2 (en) | Inter-view dependency type in MV-HEVC | |
JP6434044B2 (ja) | ビデオ情報のスケーラブルコード化のための機器及び方法 | |
JP6479798B2 (ja) | マルチレイヤビデオコーディングのためのpoc値設計 |