TWI543593B - 具有一固定長度寫碼之視訊參數集識別之補充增強資訊訊息 - Google Patents
具有一固定長度寫碼之視訊參數集識別之補充增強資訊訊息 Download PDFInfo
- Publication number
- TWI543593B TWI543593B TW102122790A TW102122790A TWI543593B TW I543593 B TWI543593 B TW I543593B TW 102122790 A TW102122790 A TW 102122790A TW 102122790 A TW102122790 A TW 102122790A TW I543593 B TWI543593 B TW I543593B
- Authority
- TW
- Taiwan
- Prior art keywords
- video
- vps
- sei
- sei message
- active
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
2012年7月9日申請之美國臨時申請案第61/669,556號,該案之全部內容被以引用的方式併入本文中。
本發明大體係關於處理視訊資料,且更特定言之,係關於適用於一或多個視訊寫碼標準之技術。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型手機」、視訊電傳會議器件、視訊串流器件及類似者。數位視訊器件實施視訊壓縮技術,諸如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第十部分(進階視訊寫碼(AVC))定義之標準、目前在開發中之高效率視訊寫碼(HEVC)標準、專屬標準、諸如VP8之開放式視訊壓縮格式及此等標準、技術或格式之擴展中所描述之技術。視訊器件可藉由實施此等視訊壓縮技術來更有效率地傳輸、接收、編碼、解碼及/或儲存數位視
訊資訊。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,視訊片段(亦即,視訊圖框或視訊圖框之一部分)可被分割成視訊區塊,視訊區塊亦可被稱為樹型區塊、寫碼單元(CU)及/或寫碼節點。圖像之經框內寫碼(I)片段中之視訊區塊係使用相關於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之經框間寫碼(P或B)片段中之視訊區塊可使用相關於同一圖像中之相鄰區塊中之參考樣本的空間預測或相關於其他參考圖像中之參考樣本的時間預測。圖像可被稱為圖框,且參考圖像可被稱為參考圖框。
空間或時間預測導致寫碼用於區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間寫碼之區塊係根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼。經框內寫碼之區塊係根據框內寫碼模式及殘餘資料來編碼。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而導致接著可被量化之殘餘變換係數。一開始配置成二維陣列的經量化之變換係數可經掃描以便產生變換係數之一維向量,且可應用熵寫碼以達成更大壓縮。
在一實例中,本發明描述用於寫碼一補充增強資訊(SEI)訊息之技術。在一些實例中,該SEI訊息可含有一作用中視訊參數集(VPS)之一識別符。在一些實例中,該識別符可經固定長度寫碼。
在一實例中,本發明描述一種寫碼視訊資料之方法,該方法包括寫碼含有一作用中視訊參數集(VPS)之一識別符之一補充增強資訊(SEI)訊息,其中該作用中VPS之該識別符經固定長度寫碼。
在另一實例中,本發明描述一種用於寫碼視訊資料之器件,該
器件包括一處理器,該處理器經組態以寫碼含有一作用中視訊參數集(VPS)之一識別符之一補充增強資訊(SEI)訊息,其中該作用中VPS之該識別符經固定長度寫碼。
在另一實例中,本發明描述一種用於寫碼視訊資料之器件,其包括用於儲存與一作用中視訊參數集(VPS)相關聯之資料之構件,及用於寫碼一補充增強資訊(SEI)訊息之構件,該SEI訊息包括該SEI訊息中的一作用中視訊參數集(VPS)之指示,其中該作用中VPS之該指示經固定長度寫碼且含於該SEI訊息中。
在另一實例中,本發明描述一種電腦可讀儲存媒體。該電腦可讀儲存媒體具有儲存於其上之指令,該等指令在執行時使一或多個處理器寫碼含有一作用中視訊參數集(VPS)之一識別符之一補充增強資訊(SEI)訊息,其中該作用中VPS之該識別符經固定長度寫碼。
在附圖及以下描述中闡明一或多個實例之細節。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧鏈路
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
29‧‧‧網路實體
30‧‧‧視訊解碼器
32‧‧‧顯示器件
34‧‧‧儲存器件
35‧‧‧分割模組
41‧‧‧預測處理單元/預測模組
42‧‧‧運動估計模組
44‧‧‧運動補償模組
46‧‧‧框內預測處理單元
50‧‧‧求和器
52‧‧‧變換模組
54‧‧‧量化模組
56‧‧‧熵編碼器/熵編碼模組
58‧‧‧反量化模組
60‧‧‧反變換處理單元
62‧‧‧求和器
63‧‧‧濾波器模組
64‧‧‧參考圖像記憶體
66‧‧‧囊封單元
80‧‧‧熵解碼模組
81‧‧‧預測處理單元
82‧‧‧運動補償模組
84‧‧‧框內預測處理單元
86‧‧‧反量化模組
88‧‧‧反變換模組/反變換處理單元
90‧‧‧求和器
91‧‧‧濾波器模組
92‧‧‧參考圖像記憶體
94‧‧‧解囊封單元
100‧‧‧網路
102‧‧‧伺服器器件
104A‧‧‧路由器件
104B‧‧‧路由器件
106‧‧‧轉碼器件
108‧‧‧用戶端器件
圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統之方塊圖。
圖2為說明可實施本發明中所描述之技術的實例視訊編碼器之方塊圖。
圖3為說明可實施本發明中所描述之技術的實例視訊解碼器之方塊圖。
圖4為說明形成網路之部分的器件之實例集合之方塊圖。
圖5為說明根據本發明之一或多個實例的一實例方法之流程圖。
圖6為說明根據本發明之一或多個實例的另一實例方法之流程圖。
圖7為說明根據本發明之一或多個實例的一實例方法之另一流程
圖。
圖8為說明根據本發明之一或多個實例的一實例方法之另一流程圖。
圖9為說明根據本發明之一或多個實例的一實例方法之另一流程圖。
圖10為說明根據本發明之一或多個實例的一實例方法之另一流程圖。
本發明描述各種視訊寫碼改良。現將描述一些視訊寫碼標準。視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。
另外,存在新的視訊寫碼標準,即,正由ITU-T視訊寫碼專業團體(VCEG)及ISO/IEC動畫專業團體(MPEG)之關於視訊寫碼之聯合合作團隊(JCT-VC)開發之高效率視訊寫碼(HEVC)。HEVC之近期工作草案(在下文中被稱為HEVC WD7)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v6.zip獲得。HEVC WD7被以引用的方式全部併入本文中。
HEVC之近期最新工作草案(且在下文中被稱為HEVC WD9)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v10.zip獲得。HEVC WD9被以引用的方式全部併入本文中。
在一實例中,根據本發明之技術,各種系統、方法及器件可寫碼一補充增強資訊(SEI)訊息。在一些實例中,該SEI訊息可含有一作用中視訊參數集(VPS)之一識別符,例如,vps_id。在一些實例中,
作用中VPS之識別符可經固定長度寫碼。另外,該作用中VPS之該識別符可在SEI訊息中之任何經熵寫碼(例如,ue(v)寫碼)之語法元素前的SEI訊息中之一早先位置(諸如,該SEI訊息中之第一語法元素)中寫碼,或在(例如)SEI訊息中的前兩個、三個、四個或五個語法元素內寫碼。因此希望不需要熵解碼來判定作用中VPS。此亦可通常允許較不複雜之器件能夠不需要解碼器而存取作用中VPS之識別符。
現將描述參數集。在HEVC WD7中,視訊、序列、圖像及自適應參數集機制自經寫碼區塊資料之傳輸去耦很少改變之資訊之傳輸。在一些應用中,視訊、序列、圖像及自適應參數集可進行「頻帶外」遞送,亦即,不與含有經寫碼視訊資料之單元一起輸送。頻帶外傳輸通常可靠。
在HEVC WD7中,使用「ue(v)」來寫碼VPS之識別符、序列參數集(SPS)、圖像參數集(PPS)或自適應參數集(APS)。每一SPS包括一SPS識別(ID)及一VPS ID,每一PPS包括一PPS ID及一SPS ID,且每一片段標頭包括一PPS ID且可能包括一APS ID。雖然支援VPS,但大多數序列層級資訊參數仍僅存在於SPS中。
VPS通常可傳送高層級參數資訊。舉例而言,VPS可指定框間預測對參考視訊參數集之經寫碼視訊序列而言是否受額外限制。VPS亦可指定可存在於位元串流中之時間子層之最大數目及以圖像儲存緩衝器為單位的經解碼圖像緩衝器之所需大小。VPS可指示按解碼次序在任何圖像前面且按輸出次序在彼圖像後面的圖像之最大允許數目,及按輸出次序可在經寫碼視訊序列中之任何圖像前面且按解碼次序在彼圖像後面的圖像之最大數目。VPS可指定存在於視訊參數集原始位元組序列有效負載(RBSP)中之vps_extension_data_flag語法結構之數目,且無vps_extension_data_flag語法元素存在於視訊參數集RBSP語法結構中。
在一些情況下,vps_extension_data_flag可具有任何值且不影響對HEVC WD9中所指定之設定檔之遵守。在一些實例中,器件可較佳能夠在位元串流之處理之早期存取VPS資訊。根據本文中所描述之技術,寫碼器可較早地使用此等技術來處理此資訊。舉例而言,在VPS訊息為固定長度且因此未經熵寫碼之例子中,視訊編碼器可即刻編碼VPS訊息。作為另一實例,若此資訊為固定長度且因此未經熵解碼,則視訊解碼器可能能夠即刻完成包括此資訊的位元串流之解碼。另外,較不複雜之器件(諸如,媒體感知網路元件(MANE))可不需要解碼器而存取資訊,此係因為VPS資訊不需要熵解碼。
現將描述隨機存取及位元串流接合。隨機存取指自並非位元串流中之第一經寫碼圖像的經寫碼圖像開始解碼視訊位元串流。在諸如廣播及串流之許多視訊應用中,需要對位元串流之隨機存取例如,以供使用者在不同頻道之間切換、跳躍至視訊之特定部分或切換至不同位元串流以用於(位元速率、圖框速率、空間解析度等之)串流適應。藉由以規則間隔將隨機存取圖像或隨機存取點多次插入至視訊位元串流內來實現此特徵。
位元串流接合指兩個或兩個以上位元串流或其部分之串接。舉例而言,可將第一位元串流附加至第二位元串流(可能伴有對該等位元串流中之一或兩者之某些修改)以產生一接合式位元串流。第二位元串流中之第一經寫碼圖像亦被稱作接合點。因此,在串接位元串流中,接合點前面的圖像可來自第一位元串流且接合點之後的圖像可來自第二位元串流。
可藉由位元串流接合器來執行位元串流之接合。位元串流接合器通常不如編碼器複雜且不如編碼器智慧。舉例而言,位元串流接合器可配備熵解碼及編碼能力。
位元串流切換可在自適應性串流環境中使用。在切換至位元串
流中的某一圖像處之位元串流切換操作實際上為位元串流接合操作,其中接合點為位元串流切換點,亦即,來自切換至位元串流之第一圖像。
現將描述隨機存取點(RAP)圖像。如AVC或中HEVC所指定之瞬時解碼再新(IDR)圖像可用於隨機存取。然而,由於按解碼次序在IDR圖像之後的圖像不能使用在IDR圖像之前解碼之圖像作為參考,故依賴於用於隨機存取之IDR圖像之位元串流可具有顯著較低之寫碼效率。
為了改良寫碼效率,將清潔隨機存取(CRA)圖像之概念引入至HEVC中以允許按解碼次序在CRA圖像之後、但按輸出次序在CRA圖像前的圖像使用在CRA圖像前解碼之圖像作為參考。按解碼次序在CRA圖像之後、但按輸出次序在CRA圖像前的圖像被稱作與CRA圖像相關聯之前置圖像(或CRA圖像之前置圖像)。若解碼自當前CRA圖像前的IDR或CRA圖像開始,則CRA圖像之前置圖像可正確解碼。然而,當自CRA圖像之隨機存取發生時,CRA圖像之前置圖像可為不可正確解碼的;因此,在隨機存取解碼期間通常丟棄前置圖像。為了防止自可能視解碼開始之處而不可用的參考圖像之錯誤傳播,按解碼次序及輸出次序兩者在CRA圖像之後的所有圖像不應使用按解碼次序或輸出次序在CRA圖像前面的任何圖像(其包括前置圖像)作為參考。
在引入CRA圖像之後且基於CRA圖像之概念,將中斷連結存取(BLA)圖像之概念進一步引入HEVC中。BLA圖像通常源自在CRA圖像之位置處接合之位元串流,且在接合之位元串流中,接合點CRA圖像改變至BLA圖像。將IDR圖像、CRA圖像及BLA圖像共同稱作RAP圖像。
BLA圖像與CRA圖像之間的最根本差異如下。對於CRA圖像,相關聯之前置圖像在解碼自按解碼次序在CRA圖像前面的RAP圖像開始
之情況下可正確解碼,且在自CRA圖像之隨機存取發生時(亦即,當解碼自CRA圖像開始時,或換言之,當CRA圖像為位元串流中之第一圖像時)可為不可正確解碼的。對於BLA圖像,甚至當解碼自按解碼次序在BLA圖像前面的RAP圖像開始時,相關聯前置圖像在所有情況下亦可為不可正確解碼的。
對於一特定CRA或BLA圖像,甚至當CRA或BLA圖像為位元串流中之第一圖像時,相關聯之前置圖像中之一些亦為可正確解碼的。此等前置圖像被稱作可解碼前置圖像(DLP),且其他前置圖像被稱作不可解碼前置圖像(NLP)。在最新HEVC草案規範中,NLP亦被稱作標記為丟棄(TFD)圖像。
將描述標頭參數集(HPS)。
在JCTVC-J0109(可於http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J0109-v1.zip獲得)中,提議標頭參數集(HPS)。片段標頭中之大多數語法元素常可自HPS來預測。JCTVC-J0109被以引用的方式全部併入本文中。
現將描述各種問題。
文件JVTVC-J0216(可於http://phenix.it-sudparis.eu/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J0216-v2.zip獲得)提議以下改變以藉由僅剖析片段標頭來實現片段損失之偵測:1)用slice_idx_in_pic(藉由ue(v)寫碼)替換當前語法元素first_slice_in_pic_flag(藉由u(1)寫碼);2)添加旗標last_slice_in_pic_flag(藉由u(1)寫碼)。JVTVC-J0216被以引用的方式全部併入本文中。
然而,儘管JVTVC-J0216之方法可藉由僅剖析片段標頭來實現圖像之片段損失之偵測,但可能不可能知道哪些寫碼樹型區塊已丟失。
此資訊將有助於實現單一遍次解碼,其對硬體解碼器實施而言可為重要的,甚至在片段損失之情況下。
文件JCTVC-J0261(可於http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J0261-v1.zip獲得)提議藉由包括經ue(v)寫碼之vps_id來指示存取單元定界符中、新SEI訊息中或恢復點SEI訊息中之作用中VPS,經ue(v)寫碼之vps_id指示用於IDR存取單元之作用中VPS之ID。然而,基於此等解決方案,仍需要熵解碼以弄清楚作用中VPS。JCTVC-J0261被以引用的方式全部併入本文中。
現將描述與片段損失偵測有關之實例。可按任何組合使用此等實例之任何細節。在一實例中,語法元素num_slices_minus1(經ue(v)寫碼)係在APS或HPS中傳訊。num_slices_minus1之值指定圖像中的片段之數目。在接收到同一存取單元之所有片段後,若片段之數目N小於num_slices_minus1+1,則num_slices_minus1+1-N個片段丟失。
在一實例中,包括於一片段中的寫碼樹型區塊之數目係在片段標頭中傳訊。值0指示圖像僅具有一個片段。
在一實例中,包括於片段中之每一者中的寫碼樹型區塊之數目係在APS或HPS中傳訊,且片段ID係在片段標頭中傳訊。
在一實例中,每一片段之片段結束位址(例如,以寫碼樹型區塊為單位)係在HPS或片段標頭中傳訊。
在一實例中,當傳訊每一片段中包括的寫碼樹型區塊之數目時,不傳訊end_of_slice_flag,而自已經解碼等於片段中包括的寫碼樹型區塊之數目的寫碼樹型區塊之數目推斷片段之結束。
現將描述傳訊作用中VPS之實例。可在任何組合中使用此等替代例之任何細節。此等替代例亦可與本文中所描述之片段損失偵測中之一或多者一起在任何實例中使用。
在一實例中,一新SEI訊息僅含有作用中VPS之vps_id,其中vps_id經固定長度寫碼(例如u(5)),且若一SEI NAL單元包括此新SEI訊息,則無其他SEI訊息應包括於該SEI NAL單元中。此SEI NAL單元應包括於任何RAP存取單元中,且可包括於其他存取單元中。
在一實例中,在任何經熵寫碼之語法元素前的片段標頭中之一早先位置中,在經固定長度寫碼(例如,u(5))的RAP圖像之片段標頭中重複作用中VPS ID。因此,視訊編碼器可即刻編碼VPS訊息,因為VPS訊息為固定長度且因此未經熵寫碼。作為另一實例,若此資訊為固定長度且因此未經熵解碼,則視訊解碼器可能能夠即刻完成包括此資訊的位元串流之解碼。另外,較不複雜之器件(諸如,MANE)可能夠不需要解碼器而存取資訊,此係因為VPS資訊不需要熵解碼。
在一實例中,定義一新NAL單元類型,其具有僅兩個位元組之長度,第一位元組與目前在HEVC WD7中定義之其他NAL單元類型相同,且第二位元組包括用於作用中VPS ID之N個位元及8-N個保留位元,其中2^N之值應等於或大於APS ID之最大值加1。當N等於8時,VPS ID加1係在第二位元組中傳訊。當N不等於8時,作為一個值的8-N個保留位元必須大於或等於1。在一個替代方案中,定義一新NAL單元類型,其具有僅三個位元組之長度,且具有為2位元組之相同NAL單元標頭(作為當前HEVC NAL單元),第三位元組包括用於作用中VPS ID之N個位元及8-N個保留位元,其中2^N之值應等於或大於APS ID之最大值加1。當N等於8時,VPS ID加1係在第二位元組中傳訊。當N不等於8時,作為一個值的8-N個保留位元必須大於或等於1。
在一實例中,VPS NAL單元之NAL單元標頭之第二位元組中的一位元係用以指示VPS為用於含有VPS NAL單元之存取單元的作用中VPS。
圖1為說明可利用本發明中所描述之技術的一實例視訊編碼及解碼系統10之方塊圖。如圖1所示,系統10包括產生在稍後時間由目的地器件14解碼之經編碼視訊資料之源器件12。源器件12及目的地器件14可包含廣泛範圍器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如,所謂的「智慧型」手機)、所謂的「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或類似者。在一些情況下,源器件12及目的地器件14可經配備以用於無線通信。
目的地器件14可經由鏈路16來接收待解碼之經編碼視訊資料。鏈路16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14的任一類型之媒體或器件。在一實例中,鏈路16可包含一通信媒體以使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14。經編碼視訊資料可根據諸如無線通信協定之通信標準來調變且傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源器件12至目的地器件14之通信之任何其他設備。
或者,經編碼資料可自輸出介面22輸出至儲存器件34。類似地,經編碼資料可由輸入介面自儲存器件34存取。儲存器件34可包括多種分散式或本端存取之資料儲存媒體(諸如,硬碟、Blu-ray光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體)中之任一者。在另一實例中,儲存器件34可對應於檔案伺服器或可保持由源器件12產生之經編碼視訊的另一中間儲存器件。目的地器件14可經由串流或下載而自儲存器件34存取儲存之視訊資料。檔案伺服器可為能夠儲存經編碼
視訊資料且將彼經編碼視訊資料傳輸至目的地器件14的任一類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接儲存(NAS)器件或本端碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之適合於存取儲存於檔案伺服器上之經編碼視訊資料之組合。經編碼視訊資料自儲存器件34之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,該等多媒體應用諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸(例如,經由網際網路)、用於儲存於資料儲存媒體上的數位視訊之編碼、儲存於資料儲存媒體上的數位視訊之解碼或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些情況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如以下之源:視訊獲取器件(例如,視訊攝影機)、含有先前獲取之視訊之視訊檔案庫、自視訊內容提供者接收視訊之視訊饋送介面及/或用於產生作為源視訊之電腦圖形資料的電腦圖形系統或此等源之組合。作為一實例,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,本發明中所描述之該等技術大體上可適用於視訊寫碼,且可應用於無線及/或有線應用。
所獲取、預先獲取或電腦產生之視訊可由視訊編碼器20編碼。經編碼視訊資料可經由源器件12之輸出介面22直接傳輸至目的地器件
14。經編碼視訊資料亦可(或替代地)儲存至儲存器件34上以供由目的地器件14或其他器件稍後存取以用於解碼及/或播放。
在一實例中,諸如源器件12或目的地器件14之器件可寫碼一SEI訊息。SEI訊息可含有一作用中VPS之一vps_id。另外,vps_id可經固定長度寫碼。舉例而言,源器件12可編碼含有一作用中VPS之一vps_id的一固定長度寫碼之SEI訊息。類似地,目的地器件14可解碼可含有一作用中VPS之vps_id的固定長度寫碼之SEI訊息。
根據本發明之一實例,可藉由一視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)來執行SEI訊息中的使用固定長度寫碼之作用中視訊參數集ID之傳訊。更具體言之,在一些實例中,視訊編碼器20可包括一囊封單元、一SEI訊息產生單元或可產生SEI訊息之其他單元。其他視訊編碼器20可使用旁路模式中之熵編碼器,在旁路模式期間,熵解碼器執行非熵編碼。熵解碼器可產生SEI訊息。
使用含有一作用中VPS之一vps_id且經固定長度寫碼之一SEI訊息可允許源器件12傳達作用中VPS,以使得系統10中之其他器件(諸如,目的地器件14)具有關於哪個VPS為作用中VPS之資訊。使此資訊到達系統10中之器件以為此等器件提供關於自源器件12之傳達之「大圖像」可為重要的。更快速地為目的地器件14提供VPS可允許目的地器件14具有關於(例如)圖像有多少層及多少個視圖之資料。
如上文所論述,VPS通常可提供高層級參數資訊。VPS可指定:(1)框間預測對參考視訊參數集之經寫碼視訊序列而言是否額外受限;(2)可存在於位元串流中的時間子層之最大數目;(3)以圖像儲存緩衝器為單位的經解碼圖像緩衝器之所需大小;(4)按解碼次序在任何圖像前面的圖像之最大允許數目;(5)按輸出次序在彼圖像後面的圖像之最大允許數目;(6)按輸出次序可在經寫碼視訊序列中之任何圖像前面的圖像之最大數目;(7)按解碼次序可在彼圖像後面的圖像
之最大數目;(8)存在於視訊參數集原始位元組序列有效負載(RBSP)中的vps_extension_data_flag語法結構之數目;及(9)無vps_extension_data_flag語法元素存在於視訊參數集RBSP語法結構中。其他高層級參數資訊亦可包括於VPS中。
目的地器件14包括一輸入介面28、一視訊解碼器30及一顯示器件32。在一些情況下,輸入介面28可包括一接收器及/或一數據機。目的地器件14之輸入介面28經由鏈路16接收經編碼視訊資料。經由鏈路16傳達或在儲存器件34上提供之經編碼視訊資料可包括由視訊編碼器20產生之供視訊解碼器(諸如,視訊解碼器30)在解碼視訊資料時使用之多種語法元素。此等語法元素可與在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器中的經編碼視訊資料包括在一起。
視訊解碼器30可解碼含有一作用中VPS之一vps_id的一SEI訊息。vps_id可經固定長度寫碼。另外,該SEI訊息可僅含有VPS之vps_id。在一些實例中,視訊解碼器30可包括一解囊封單元、一SEI訊息剖析單元或可處理或剖析SEI訊息之其他單元。其他視訊解碼器30可使用旁路模式中之熵解碼器來處理SEI訊息,在旁路模式期間,熵解碼器執行非熵解碼。使用含有一作用中VPS之一vps_id且經固定長度寫碼之一SEI訊息可允許目的地器件14具有關於哪一VPS為作用中VPS之資訊。如本文中所描述,實例目的地器件14可接收SEI訊息以指示哪一VPS在作用中。在一些實例中,目的地器件14可每個寫碼器視訊序列至多接收此訊息一次,或然而,此訊息常由源器件12傳輸。
實例系統10可使用經固定長度寫碼之SEI訊息,使得較不複雜或較不智慧之器件(諸如,媒體感知網路元件(MANE))可存取該資訊。舉例而言,藉由使用固定長度,一些實例可不必熵解碼所接收之資料來存取作用中視訊參數集ID。在另一實例中,一NAL類型可僅在標頭
中含有作用中視訊參數集ID資訊。
一些實例可包括顯示器件32。顯示器件32可與目的地器件14整合或在目的地器件14外。在一些實例中,目的地器件14可包括整合式顯示器件且亦可經組態以與外部顯示器件介面連接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如,液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
如本文中所描述,視訊編碼器20及視訊解碼器30可寫碼可含有一作用中VPS之一vps_id的一SEI訊息,且vps_id可經固定長度寫碼。視訊編碼器20及視訊解碼器30可根據視訊壓縮標準(諸如,目前在開發中之高效率視訊寫碼(HEVC)標準)來操作,且可遵守HEVC測試模型(HM)。自2012年7月9日起,HEVC之最近草案可自http://wg11.sc29.org/jct/doc_end_user/current_document.php?id=5885/JCTVC-I1003-v5獲得,該草案之全部內容被以引用的方式併入本文中。或者,視訊編碼器20及視訊解碼器30可根據其他專屬或行業標準(諸如,替代地被稱作MPEG-4第十部分(進階視訊寫碼(AVC))之ITU-T H.264標準)或此等標準之擴展來操作。然而,本發明之技術不限於任一特定寫碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263,以及諸如VP8之開放式格式。
在一些實例中,一SEI網路抽象層(NAL)單元可包括SEI訊息。在一些實例中,無其他SEI訊息包括於SEI NAL單元中。SEI NAL單元亦可包括於視訊資料之所有RAP存取單元中,且可包括於其他類型之存取單元中。舉例而言,可使用僅含有作用中VPS之vps_id的新SEI訊息。vps_id可經固定長度寫碼(例如u(5)),且若SEI NAL單元包括此新SEI訊息。在一實例中,無其他SEI訊息可包括於SEI NAL單元中。此
SEI NAL單元可包括於任一RAP存取單元中,且可包括於其他存取單元中。
雖然未展示於圖1中,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或分開資料串流中之音訊及視訊兩者的編碼。若適用,則在一些實例中,MUX-DEMUX單元可遵守ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
如本文中所描述,源器件12中之視訊編碼器20可執行可含有一作用中VPS之一vps_id的一SEI訊息之編碼,且vps_id可經固定長度寫碼。另外,目的地器件14中之視訊解碼器30可解碼可含有一作用中VPS之一vps_id的SEI訊息,且vps_id可經固定長度寫碼。視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地以軟體實施時,器件可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且在使用一或多個處理器之硬體中執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為各別器件中的組合式編碼器/解碼器(編解碼器(CODEC))之部分。
一般而言,TU用於變換過程及量化過程。具有一或多個PU之一給定CU亦可包括一或多個變換單元(TU)。在預測之後,視訊編碼器20可計算對應於PU之殘餘值。殘餘值包含像素差值,該等值可變換為變換係數,使用TU量化並掃描以產生用於熵寫碼之串行化變換係數。本發明通常使用術語「視訊區塊」來指代CU之寫碼節點。在一
些特定情況下,本發明亦可使用術語「視訊區塊」來指代包括寫碼節點及PU及TU之樹型區塊(亦即,LCU或CU)。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)通常包含一系列視訊圖像中之一或多者。GOP可包括在GOP之標頭、圖像中之一或多者之標頭中或別處的描述GOP中包括之圖像之數目的語法資料。圖像之每一片段可包括描述用於各別片段之編碼模式之片段語法資料。視訊編碼器20通常對個別視訊片段內之視訊區塊進行操作以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而大小不同。
作為一實例,HM支援各種PU大小之預測。假設特定CU之大小為2N×2N,則HM支援2N×2N或N×N之PU大小的框內預測,及2N×2N、2N×N、N×2N或N×N之對稱PU大小的框間預測。HM亦支援用於2N×nU、2N×nD、nL×2N及nR×2N之PU大小的路由器件104、轉碼器件106及用戶端器件108框間預測之不對稱分割。在不對稱分割中,CU之一個方向未被分割,而另一方向經分割成25%及75%。CU之對應於25%分割區之部分由「n」繼之以「上(Up)」、「下(Down)」、「左(Left)」或「右(Right)」之指示來指示。因此,舉例而言,「2N×nU」指代經水平分割而在頂部具有2N×0.5N PU且在底部具有2N×1.5N PU之2N×2N CU。
在本發明中,「N×N」及「N乘N」可互換地使用以指代就視訊區塊在垂直維度及水平維度而言之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊在垂直方向上將具有16個像素(y=16),且在水平方向上將具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。此外,區塊未必需要在水平方向上具有與在垂直方向上相同數目個像素。舉例而言,
區塊可包含N×M個像素,其中M未必等於N。
在使用CU之PU的框內預測性寫碼或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含空間域(亦被稱作像素域)中之像素資料,且TU可包含在對殘餘視訊資料應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換)後的變換域中之係數。殘餘資料可對應於未經編碼之圖像的像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括用於CU之殘餘資料的TU,且接著變換TU以產生用於CU之變換係數。
在產生變換係數之任何變換之後,視訊編碼器20可執行變換係數之量化。量化通常指量化變換係數以可能減少用以表示該等係數之資料之量從而提供進一步壓縮的過程。量化過程可減少與該等係數中之一些或所有係數相關聯的位元深度。舉例而言,可在量化期間將n位元值捨去至m位元值,其中n大於m。
在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數以產生可熵編碼的串行化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描該等經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法來熵編碼該一維向量。視訊編碼器20亦可熵編碼與經編碼視訊資料相關聯之語法元素以供視訊解碼器30在解碼視訊資料時使用。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可選擇用於待傳輸符號之可變長度碼。可建構VLC中之碼字,使得相對較短之碼對應於更有可能之
符號,而較長碼對應於較不可能之符號。以此方式,使用VLC可較之(例如)將相等長度碼字用於待傳輸之每一符號達成位元節省。機率判定可基於指派給符號之上下文。
如本文中所描述,視訊編碼器20及視訊解碼器30亦可寫碼含有作用中VPS之vps_id的SEI訊息。vps_id可經固定長度寫碼。視訊編碼器20可編碼含有一作用中VPS之一vps_id的一固定長度SEI訊息。視訊解碼器30可解碼含有一作用中VPS之一vps_id的SEI訊息。使用含有一作用中VPS之一vps_id且經固定長度寫碼的一SEI訊息可允許目的地器件14具有關於哪一VPS為作用中VPS之資訊。僅舉幾個例子,此可提供可存在於位元串流中之時間子層之最大數目或以圖像儲存緩衝器為單位的經解碼圖像緩衝器之所需大小。
圖2為說明可實施本發明中所描述之技術的實例視訊編碼器20之方塊圖。在一實例中,視訊編碼器20編碼可含有一作用中VPS之一vps_id的一SEI訊息。vps_id可經固定長度寫碼。在圖2之所說明實例中,視訊編碼器20包括產生SEI訊息之一囊封單元66。根據本發明之一實例,SEI訊息中的使用固定長度寫碼之作用中視訊參數集ID之傳訊可由囊封單元66執行。視訊編碼器20之囊封單元66可編碼含有一作用中VPS之一vps_id的一SEI訊息。另外,vps_id可經固定長度寫碼。使用含有一作用中VPS之一vps_id且經固定長度寫碼的一SEI訊息可允許源器件12傳達作用中VPS,使得系統10中之其他器件(諸如,目的地器件14)具有關於哪一VPS為作用中VPS之資訊。
在一些實例中,熵編碼器56可編碼含有一作用中VPS之一vps_id且可經固定長度寫碼的一SEI訊息。熵解碼器可在旁路模式中起作用,在旁路模式期間,熵解碼器而非囊封單元66執行非熵編碼且產生SEI訊息。
在其他實例中,囊封單元或某一其他單元可跟在熵編碼模組56
之後。舉例而言,SEI訊息可含有一作用中VPS之一vps_id且可經固定長度寫碼,可由跟在熵編碼器之後的囊封單元或其他單元編碼。使用固定長度寫碼可允許產生含有vps_id之SEI訊息的囊封單元66或其他單元較早地在傳出位元串流中執行此功能,此係因為通常可不需要熵編碼。
視訊編碼器20可執行其他解碼器功能性。舉例而言,視訊編碼器20可執行視訊片段內的視訊區塊之框內及框間寫碼。框內寫碼依賴於空間預測以減少或移除給定視訊圖框或圖像內的視訊中之空間冗餘。框間寫碼依賴於時間預測以減少或移除視訊序列之鄰近圖框或圖像內的視訊中之時間冗餘。框內模式(I模式)可指若干基於空間之壓縮模式中之任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指若干基於時間之壓縮模式中之任一者。因此,視訊編碼器20可寫碼可含有一作用中VPS之一vps_id的一SEI訊息且vps_id可經固定長度寫碼,以及執行視訊片段內的視訊區塊之框內及框間寫碼。
在圖2之實例中,視訊編碼器20包括一分割模組35、預測處理單元41、濾波器模組63、參考圖像記憶體64、求和器50、變換模組52、量化模組54及熵編碼模組56。預測處理單元41包括運動估計模組42、運動補償模組44及框內預測處理單元46。為了視訊區塊重建構,視訊編碼器20亦包括反量化模組58、反變換處理單元60及求和器62。濾波器模組63意欲表示一或多個迴路濾波器,諸如,解區塊濾波器、自適應迴路濾波器(ALF)及樣本適應性偏移(SAO)濾波器。雖然在圖2中將濾波器模組62展示為迴路內濾波器,但在其他組態中,濾波器模組63亦可實施為迴路後濾波器。
如圖2所示,視訊編碼器20接收視訊資料,且分割模組35將該資料分割成多個視訊區塊。此分割亦可包括(例如)根據LCU及CU之四元樹結構分割成片段、頻塊或其他較大單元,以及視訊區塊分割。視訊
編碼器20通常說明編碼待編碼之視訊片段內之視訊區塊的組件。片段可劃分成多個視訊區塊(且可能劃分成被稱為頻塊的視訊區塊之集合)。預測處理單元41可基於錯誤結果(例如,寫碼速率及失真度)為當前視訊區塊選擇複數個可能寫碼模式中之一者(諸如,複數個框內寫碼模式中之一者或複數個框間寫碼模式中之一者)。預測處理單元41可將所得之經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼區塊以用作參考圖像。
預測處理單元41內之框內預測處理單元46可相對於與待寫碼之當前區塊相同之圖框或片段中一或多個相鄰區塊執行當前視訊區塊之框內預測性寫碼以提供空間壓縮。預測處理單元41內之運動估計模組42及運動補償模組44相對於一或多個參考圖像中之一或多個預測性區塊執行當前視訊區塊之框間預測性寫碼以提供時間壓縮。
運動估計模組42可經組態以根據視訊序列之預定型樣判定用於視訊片段之框間預測模式。預定型樣可將序列中之視訊片段指明為P片段、B片段或GPB片段。運動估計模組42及運動補償模組44可經高度整合,但為概念目的而分開說明。由運動估計模組42執行之運動估計為產生運動向量之過程,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖形內之預測性區塊的位移。
預測性區塊為發現就像素差而言緊密匹配待寫碼之視訊區塊之PU的區塊,其可藉由絕對差之和(SAD)、平方差之和(SSD)或其他差量度來判定。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中的參考圖像之次整數像素位置之值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計模組42可相對於全像素位置及分數像素位置執行運動搜尋,且按分數像素精度輸出運動向量。
運動估計模組42藉由比較PU之位置與參考圖像之預測性區塊之位置來計算用於經框間寫碼之片段中的視訊區塊之PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計模組42將所計算出之運動向量發送至熵編碼模組56及運動補償模組44。
由運動補償模組44執行之運動補償可涉及基於藉由運動估計判定之運動向量來提取或產生預測性區塊,從而可能執行至子像素精度之內插。在接收到用於當前視訊區塊之PU的運動向量後,運動補償模組44可在參考圖像清單中之一者中找出運動向量所指向之預測性區塊。視訊編碼器20藉由自正寫碼之當前視訊區塊之像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。像素差值形成區塊之殘餘資料,且可包括亮度差分量及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償模組44亦可產生與視訊區塊及視訊片段相關聯之語法元素以供視訊解碼器30在解碼視訊片段之視訊區塊時使用。
框內預測處理單元46可框內預測當前區塊,以作為如上所述的由運動估計模組42及運動補償模組44執行的框間預測之替代。詳言之,框內預測處理單元46可判定用以編碼當前區塊之框內預測模式。在一些實例中,框內預測處理單元46可(例如)在分開之編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測處理單元46(或在一些實例中,模式選擇模組40)可自測試之模式選擇適當框內預測模式來使用。舉例而言,框內預測處理單元46可使用用於各種測試之框內預測模式之速率失真分析來計算速率失真值,且在測試之模式中選擇具有最佳速率失真特性之框內預測模式。速率失真分析通常判定經編碼區塊與經編碼以產生經編碼區塊的原始未經編碼區塊之間的失真
(或誤差)之量,以及用以產生經編碼區塊之位元速率(亦即,位元之數目)。框內預測處理單元46可自各種經編碼區塊之失真及速率計算比率以判定哪一框內預測模式展現區塊之最佳速率失真值。
在任何情況下,在選擇用於區塊之框內預測模式之後,框內預測處理單元46可將指示用於區塊之選定框內預測模式的資訊提供至熵編碼模組56。熵編碼模組56可根據本發明之技術編碼指示選定框內預測模式之資訊。視訊編碼器20可在所傳輸之位元串流中包括組態資料,該組態資料可包括複數個框內預測模式索引表及複數個經修改框內預測模式索引表(亦被稱作碼字映射表)、用於各種區塊之編碼上下文之定義及最有可能框內預測模式之指示、框內預測模式索引表及經修改框內預測模式索引表以用於上下文中之每一者。
在預測處理單元41經由框間預測或框內預測產生當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且應用於變換處理單元52。變換處理單元52使用一變換(諸如,離散餘弦變換(DCT)或一概念上類似之變換)將殘餘視訊資料變換成殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至諸如頻域之變換域。
變換處理單元52可將所得變換係數發送至量化模組54。量化模組54量化該等變換係數以進一步減小位元速率。量化過程可減少與該等係數中之一些或所有係數相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化模組54可接著執行包括經量化之變換係數的矩陣之掃描。或者,熵編碼模組56可執行該掃描。
在量化之後,熵編碼模組56熵編碼經量化之變換係數。舉例而言,熵編碼模組56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性
二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在熵編碼模組56進行之熵編碼後,經編碼位元串流可傳輸至視訊解碼器30,或經存檔以供稍後傳輸或由視訊解碼器30擷取。熵編碼模組56亦可熵編碼用於正在寫碼之當前視訊片段的運動向量及其他語法元素。
反量化模組58及反變換模組60分別應用反量化及反變換,以重建像素域中之殘餘區塊以供稍後用作為參考圖像之參考區塊。運動補償模組44可藉由將殘餘區塊添加至參考圖像清單中之一者內的參考圖像中之一者之預測性區塊來計算參考區塊。運動補償模組44亦可將一或多個內插濾波器應用於重建構之殘餘區塊以計算次整數像素值以供在運動估計中使用。求和器62將重建構之殘餘區塊加至由運動補償模組44產生的經運動補償之預測區塊以產生用於儲存於參考圖像記憶體64中之參考區塊。參考區塊可由運動估計模組42及運動補償模組44用作參考區塊來框間預測後續視訊圖框或圖像中之區塊。
如上文所論述,圖2之視訊編碼器20表示經組態以實施本文中所描述之技術中之一或多者的視訊編碼器之一實例。在一實例中,視訊編碼器20可寫碼SEI訊息。舉例而言,囊封單元66可寫碼SEI訊息。SEI訊息可含有一作用中VPS之一vps_id。另外,vps_id可經固定長度寫碼。在其他實例中,熵編碼模組56可編碼可含有一作用中VPS之一vps_id的SEI訊息,該vps_id可經固定長度寫碼。
根據本發明之一實例,SEI訊息中的使用固定長度寫碼之作用中視訊參數集ID之傳訊可由視訊編碼器20中之一或多個組件(諸如,囊封單元66、熵編碼模組56或某一其他單元)執行。在一些視訊編碼器中,可使用一群單元。舉例而言,一個單元可在一SEI訊息產生時,且另一單元可產生SEI訊息。
在一實例編碼器20中,含有一作用中VPS之一vps_id的一固定長
度SEI訊息之產生可允許視訊編碼器傳達該作用中VPS,使得系統10中之其他器件具有關於哪一VPS為作用中VPS之資訊。舉例而言,如圖1中所說明,目的地器件14可接收關於哪一VPS為作用中VPS之資訊。
如本文中所描述,一實例系統可使用固定長度,使得較不複雜或較不智慧之系統可存取資訊。舉例而言,藉由使用固定長度,一些實例可不需要熵解碼所接收之資料來存取作用中視訊參數集ID。在另一實例中,一NAL類型可僅在標頭中含有作用中視訊參數集ID資訊。
圖3為說明可實施本發明之技術的實例視訊解碼器30之方塊圖。在一實例中,視訊解碼器30解碼SEI訊息。SEI訊息可含有一作用中VPS之一vps_id。vps_id可經固定長度寫碼。在圖3之所說明實例中,視訊解碼器30包括處理或剖析SEI訊息之解囊封單元94。根據本發明之一實例,SEI訊息中的使用固定長度寫碼之作用中視訊參數集ID之處理可由解囊封單元94執行。視訊解碼器30之解囊封單元94可解碼含有一作用中VPS之一vps_id的一SEI訊息。另外,vps_id可經固定長度寫碼。使用含有一作用中VPS之一vps_id且經固定長度寫碼的一SEI訊息可為目的地器件14提供關於哪一VPS為作用中VPS之資訊。
在一些實例中,熵解碼模組80可解碼含有一作用中VPS之一vps_id且可經固定長度寫碼的一SEI訊息。熵解碼模組80可在旁路模式中起作用,在旁路模式期間,熵解碼模組80而非解囊封單元94執行非熵解碼且解碼SEI訊息。在其他實例視訊解碼器中,一SEI訊息可由在熵解碼模組前之某一單元解碼。
在其他實例中,解囊封單元94或某一其他單元可在熵解碼模組80前。舉例而言,SEI訊息可含有一作用中VPS之一vps_id且可經固定長度寫碼,可由在熵解碼模組80前的解囊封單元94或其他單元解碼。
在圖3之實例中,視訊解碼器30包括一熵解碼模組80、預測處理
單元81、反量化模組86、反變換模組88、求和器90、濾波器模組91及參考圖像記憶體92。預測處理單元81包括運動補償模組82及框內預測處理單元84。視訊解碼器30在一些實例中可執行與關於來自圖2之視訊編碼器20所描述之編碼遍次大體互反之解碼遍次。
在解碼過程期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊片段之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器30可自網路實體29接收經編碼視訊位元串流。舉例而言,網路實體29可為伺服器、媒體感知網路元件(MANE)、視訊編輯器/接合器,或經組態以實施上文所描述之技術中之一或多者之其他此器件。如上所述,本發明中所描述之技術中之一些可由網路實體29在網路實體29將經編碼視訊位元串流串流至視訊解碼器30之前實施。在一些視訊解碼系統中,網路實體29及視訊解碼器30可為分開的器件之部分,而在其他例子中,相關於網路實體29所描述之功能性可由包含視訊解碼器30之同一器件執行。
根據本發明之一實例,網路實體29可處理或剖析SEI訊息。舉例而言,網路實體29可為處理SEI訊息之MANE。SEI訊息可含有一作用中VPS之一vps_id。另外,vps_id可經固定長度寫碼。使用含有一作用中VPS之一vps_id且經固定長度寫碼的SEI訊息可為目的地器件14提供關於哪一VPS為作用中VPS之資訊至網路實體29,網路實體可為不包括視訊解碼器之器件。因此,此可允許網路實體29(諸如MANE、視訊編輯器/接合器或其他此器件)能夠存取VPS資訊。
因此,如相關於網路實體29所描述,一實例編碼器20可使用固定長度,使得所傳輸之信號可由較不複雜或較不智慧之器件(例如,網路實體29)接收並處理,使得較不複雜或較不智慧之器件可存取由視訊編碼器20在位元串流內編碼之VPS資訊。舉例而言,經由囊封單元66、熵編碼模組56或某一其他單元,視訊編碼器20可對SEI訊息進
行固定長度寫碼,使得一些實例器件可不需要熵解碼所接收之資料以存取作用中視訊參數集ID。因此,不包括熵解碼器之器件可處理含有vps_id之SEI訊息。根據本發明之技術,網路實體29(例如,MANE)可能能夠在不進行完全解碼(例如,可能無熵解碼)之情況下解碼SEI訊息。因為網路實體29可能能夠在不進行完全解碼之情況下而解碼SEI訊息,所以其亦可基於SEI訊息中之VPS來進行下游媒體分佈選擇,而無需完全解碼位元串流自身。
視訊解碼器30之熵解碼模組80熵解碼該位元串流以產生經量化之係數、運動向量及其他語法元素。熵解碼模組80將運動向量及其他語法元素轉發至預測處理單元81。視訊解碼器30可在視訊片段層級及/或視訊區塊層級接收語法元素。
當視訊片段經寫碼為經框內寫碼(I)之片段時,預測處理單元81之框內預測處理單元84可基於傳訊之框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料來產生用於當前視訊片段之視訊區塊的預測資料。當視訊圖框經寫碼為框間寫碼(亦即,B、P或GPB)片段時,預測處理單元81之運動補償模組82基於自熵解碼模組80接收之運動向量及其他語法元素產生用於當前視訊片段之視訊區塊的預測性區塊。該等預測性區塊可自參考圖像清單中之一者內的參考圖像中之一者產生。視訊解碼器30可基於儲存於參考圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單(清單0及清單1)。
運動補償模組82藉由剖析運動向量及其他語法元素來判定用於當前視訊片段之視訊區塊的預測資訊,且使用該預測資訊產生用於正解碼之當前視訊區塊的預測性區塊。舉例而言,運動補償模組82使用所接收之語法元素中之一些來判定用以寫碼視訊片段之視訊區塊的預測模式(例如,框內或框間預測)、框間預測片段類型(例如,B片段、P片段或GPB片段)、用於片段的參考圖像清單中之一或多者之建構資
訊、用於片段之每一經框間編碼視訊區塊之運動向量、用於片段之每一經框間寫碼視訊區塊之框間預測狀態及解碼當前視訊片段中之視訊區塊的其他資訊。
運動補償模組82亦可基於內插濾波器執行內插。運動補償模組82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器來計算用於參考區塊之次整數像素的內插值。在此情況下,運動補償模組82可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。
反量化模組86反量化(亦即,去量化)提供於位元串流中且由熵解碼模組80解碼的經量化之變換係數。反量化過程可包括將由視訊編碼器20計算之量化參數用於視訊片段中之每一視訊區塊以判定量化之程度及(同樣地)應應用的反量化之程度。反變換處理單元88將反變換(例如,反DCT、反整數變換或概念上類似之反變換過程)應用於變換係數以便產生像素域中之殘餘區塊。
在運動補償模組82基於運動向量及其他語法元素產生用於當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自反變換處理單元88之殘餘區塊與由運動補償模組82產生之對應的預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之該或該等組件。若需要,迴路濾波器(在寫碼迴路中或在寫碼迴路之後)亦可用以使像素轉變平滑或以其他方式改良視訊品質。濾波器模組91意欲表示一或多個迴路濾波器,諸如,解區塊濾波器、自適應迴路濾波器(ALF)及樣本適應性偏移(SAO)濾波器。雖然在圖3中將濾波器模組91展示為迴路內濾波器,但在其他組態中,濾波器模組91可實施為迴路後濾波器。給定圖框或圖像中之經解碼視訊區塊接著被儲存於儲存用於後續運動補償之參考圖像的參考圖像記憶體92中。參考圖像記憶體92亦儲存經解碼視訊以便稍後呈現於顯示器件(諸如,圖1之顯示器件
32)上。
圖3之視訊解碼器30表示經組態以實施本文中所描述之技術中之一或多者的視訊解碼器之一實例。各種實例方法可寫碼僅含有一作用中VPS之一vps_id的SEI訊息,其中vps_id經固定長度寫碼,其中當SEI NAL單元包括SEI訊息時,且其中無其他SEI訊息包括於SEI NAL單元中。舉例而言,視訊解碼器30可寫碼SEI訊息。SEI訊息可含有一作用中VPS之一vps_id。另外,vps_id可經固定長度寫碼。在一實例中,SEI NAL單元包括於視訊資料之所有RAP存取單元中,且可包括於其他類型之存取單元中。
圖4為說明形成網路100之部分的器件之實例集合之方塊圖。在此實例中,網路100包括路由器件104A、104B(路由器件104)及轉碼器件106。路由器件104及轉碼器件106意欲表示可形成網路100之部分的少量器件。其他網路器件(諸如,交換器、集線器、閘道器、防火牆、橋接器及其他此等器件)亦可包括於網路100內。此外,可沿著伺服器器件102與用戶端器件108之間的網路路徑提供額外網路器件。在一些實例中,伺服器器件102可對應於源器件12(圖1),而用戶端器件108可對應於目的地器件14(圖1)。
一般而言,路由器件104實施一或多個路由協定以經由網路100交換網路資料。在一些實例中,路由器件104可經組態以執行代理或快取操作。因此,在一些實例中,路由器件104可被稱作代理器件。一般而言,路由器件104執行路由協定以發現經由網路100之路線。藉由執行此等路由協定,路由器件104B可發現自其自身經由路由器件104A至伺服器器件102之網路路線。
本發明之技術可藉由諸如路由器件104及轉碼器件106之網路器件來實施,但亦可藉由用戶端器件108來實施。以此方式,路由器件104、轉碼器件106及用戶端器件108表示經組態以執行本發明之技術
的器件之實例,該等技術包括本發明之申請專利範圍部分中所列舉之技術。此外,圖1之該等器件與圖2中所展示之編碼器及圖3中所展示之解碼器亦為可經組態以執行本發明之技術之例示性器件,該等技術包括本發明之申請專利範圍部分中所列舉之技術。舉例而言,網路器件(諸如,路由器件104、轉碼器件106及用戶端器件108)可寫碼SEI訊息。SEI訊息可含有一作用中VPS之一vps_id。另外,vps_id可經固定長度寫碼。舉例而言,路由器件104、轉碼器件106及用戶端器件108可編碼可含有一作用中VPS之一vps_id的SEI訊息,且vps_id可經固定長度寫碼。在一些源器件12中,視訊編碼器20可執行編碼。在另一實例中,路由器件104、轉碼器件106及用戶端器件108可解碼可含有一作用中VPS之一vps_id的SEI訊息,且vps_id可經固定長度寫碼。
根據本發明之一實例,路由器件104、轉碼器件106及用戶端器件108可編碼或解碼視訊資料及諸如SEI訊息之其他訊息。通常地,路由器件104可包含MANE,而轉碼器件106及用戶端器件108通常可包括寫碼器。舉例而言,轉碼器件106可解碼位元串流、轉碼位元串流且編碼所得經轉碼位元串流。作為另一實例,通常用戶端器件108可解碼可包括接著可在用戶端器件處或附近觀看之視訊的位元串流。
在一些實例中,此等器件(通常,路由器件104)不可完全解碼所有訊息或視訊資料。舉例而言,路由器件104可接收一位元串流且處理或剖析該位元串流內之一SEI訊息。舉例而言,若路由器件104為MANE,則在一些實例中,其可在不完全解碼SEI訊息之情況下處理該等SEI訊息。SEI訊息可含有一作用中VPS之一vps_id,器件可能能夠在不解碼整個位元串流之情況下處理或剖析vps_id。此可允許路由器件104(例如)將位元串流路由至不同用戶端器件108。可出於各種原來來進行此路由;舉例而言,不同用戶端器件可將不同視訊資料或不同視訊品質提供至最終使用者。因此,可將不同位元串流導引至此等
用戶端器件108。藉由使用固定長度寫碼編碼具有vps_id之SEI訊息,MANE可能能夠存取此資訊。
因此,如上文相對於網路實體29所描述,路由器件104、轉碼器件106及用戶端器件108可為較不複雜或較不智慧之器件,該等器件可存取藉由可對SEI訊息進行固定長度寫碼之視訊編碼器20(例如,經由囊封單元66、熵編碼模組56或某一其他單元)在位元串流內編碼之VPS資訊。因此,在一些實例中,路由器件104、轉碼器件106及用戶端器件108可不需要熵解碼所接收之資料以存取作用中視訊參數集ID,但仍可處理含有vps_id之SEI訊息。因為路由器件104、轉碼器件106及用戶端器件108可能能夠在不進行完全解碼之情況下解碼SEI訊息,所以該等器件亦可基於SEI訊息中之VPS來進行下游媒體分佈選擇,而無需完全解碼位元串流自身。
根據本發明之一實例,視訊寫碼器可使用可由視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)執行的SEI訊息中之固定長度寫碼來傳訊作用中視訊參數集ID。在一實例系統中,可至多每個寫碼器視訊序列一次地傳輸SEI訊息以指示哪一VPS在作用中。換言之,在一些實例中,視訊寫碼器可產生形成位元串流之部分的SEI訊息。此等SEI訊息可每個IDR圖像出現一次或每個PLA圖像出現一次。然而,在其他實例中,視訊寫碼器可以一不同間隔傳輸SEI訊息。
用於寫碼視訊資料之一實例裝置可包括一或多個處理器,該一或多個處理器經組態以寫碼含有一作用中VPS之一vps_id的一SEI訊息。vps_id經固定長度寫碼。如本文中所描述,一實例系統可使用固定長度寫碼,使得較不複雜或較不智慧之系統可存取資訊。舉例而言,藉由使用固定長度寫碼,一些實例可不需要熵解碼所接收之資料來存取作用中視訊參數集ID。
一實例可包括具有一或多個處理器之一視訊編碼器,該一或多
個處理器經組態以編碼含有一作用中VPS之一vps_id的SEI訊息。vps_id經固定長度寫碼。視訊編碼器20可經進一步組態以:(1)預測使用經判定框內模式之當前區塊以產生參考視訊區塊(例如,在預測模組41中);(2)判定包含參考區塊與當前區塊之間的差之殘餘區塊(例如,在求和器50中);且(3)將殘餘區塊包括於(例如)來自熵編碼模組56之位元串流中。
在另一實例中,該裝置可包含一視訊解碼器。視訊解碼器可包括一或多個處理器,該一或多個處理器經組態以解碼含有一作用中視訊參數集(VPS)之一vps_id的SEI訊息。vps_id可經固定長度寫碼。另外,該裝置可經進一步組態以:(1)自經編碼位元串流獲得與當前區塊相關聯之殘餘視訊區塊;(2)藉由將經識別之框內模式用於當前區塊來預測當前區塊而產生一參考區塊;及(3)自參考區塊與所接收之殘餘視訊區塊之一組合判定當前區塊之值。
圖5為說明根據本發明之一或多個實例的一實例方法之流程圖。在一實例中,一寫碼器(諸如,視訊編碼器20或視訊解碼器30)可寫碼含有一作用中VPS之一vps_id的一SEI訊息(500)。舉例而言,在視訊編碼器20中,囊封單元66、熵編碼模組56或其他單元可產生含有一作用中VPS之一vps_id的一SEI訊息。因此,視訊編碼器20可編碼含有一作用中VPS之一vps_id的一SEI訊息。在另一實例中,視訊解碼器30可包括剖析或以其他方式處理含有一作用中VPS之一vps_id的一SEI訊息之解囊封單元94、熵解碼模組80或其他單元。因此,視訊解碼器30可解碼含有一作用中VPS之一vps_id的一SEI訊息。在一些實例中,MANE或可能不包括熵解碼器之其他網路實體可解碼含有一作用中VPS之一vps_id的一SEI訊息。
vps_id可經固定長度寫碼(502)。在一些實例中,SEI訊息可僅含有VPS之vps_id。在其他實例中,SEI訊息由VPS之vps_id組成或基本
上由VPS之vps_id組成。亦即,在一些實例中,SEI訊息可包括VPS之vps_id及極少其他或無其他。
源器件12可傳輸含有一作用中VPS之一vps_id的SEI訊息,或一目的地器件可接收含有一作用中VPS之一vps_id的SEI訊息(504)。在一實例中,源器件12之輸出介面22可傳輸含有一作用中VPS之一vps_id的SEI訊息。在另一實例中,目的地器件14之輸入介面28可接收含有一作用中VPS之一vps_id的SEI訊息。一般而言,在一實例中,源器件12可固定長度編碼含有一作用中VPS之一VPS_ID的一SEI訊息,且接著傳輸經編碼SEI訊息。目的地器件14可接著接收經固定長度編碼之SEI訊息,且接著解碼所接收之經固定長度編碼之SEI訊息。
在一實例中,SEI NAL單元可包括SEI訊息。在一些情況下,無其他SEI訊息包括於SEI NAL單元中。SEI NAL單元亦可包括於視訊資料之所有RAP存取單元中,且可包括於其他類型之存取單元中。
如本文中所論述,在一些實例中,器件可較佳地能夠在位元串流之處理中的早期存取VPS資訊。根據本文中所描述之技術,寫碼器可使用此等技術較早地處理此資訊。舉例而言,在VPS訊息為固定長度且因此未經熵寫碼之例子中,視訊編碼器可即刻編碼VPS訊息。作為另一實例,若此資訊為固定長度且因此未經熵解碼,則視訊解碼器可能能夠即刻完成包括此資訊的位元串流之解碼。此外,較不複雜之器件(諸如)媒體感知網路元件(MANE)可能能夠不需要解碼器而存取資訊,此係因為VPS資訊不需要熵解碼。
圖6為說明根據本發明之一或多個實例的另一實例方法之流程圖。一視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可寫碼APS或標頭參數集(HPS)中之語法元素num_slices_minus1,其中num_slices_minus1之值指定對應的圖像中之片段之數目(600)。
在一些實例中,此等功能可由一語法寫碼單元提供,該語法寫
碼單元可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分。舉例而言,視訊編碼器20內之囊封單元66可在一語法編碼單元中編碼一語法元素。語法元素編碼單元可編碼APS或標頭參數集(HPS)中之num_slices_minus1,其中num_slices_minus1之值指定對應的圖像中之片段之數目,而視訊解碼器可寫碼APS或標頭參數集(HPS)中之語法元素num_slices_minus1。num_slices_minus1之值指定對應的圖像中之片段之數目。在另一實例中,語法解碼單元可用以解碼語法元素。視訊解碼器30亦可基於實際所接收的片段之數目及num_slices_minus1之值來判定是否已接收到對應的圖像之所有片段(602)。此可(例如)由比較實際所接收的片段之數目與num_slices_minus1之值之比較器執行。在一些實例中,語法元素之值(例如,「0」)指示圖像僅具有一個片段。在各種實例中,視訊寫碼器可為視訊編碼器20或視訊解碼器30。另外,視訊寫碼器可在一些實例中彼此獨立地執行步驟600與602。
圖7為說明根據本發明之一或多個實例的一實例方法可寫碼片段標頭中之另一語法元素之另一流程圖,其中另一語法元素為片段ID(700)。一視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可在編碼器內之一語法編碼單元中寫碼一語法元素。該寫碼器亦可寫碼片段標頭中之語法元素,其中該語法元素為該片段中包括的寫碼樹型區塊之數目之指示(702)。在一些實例中,此等功能可由一語法寫碼單元提供,該語法寫碼單元可為囊封單元66或解囊封單元94之部分或視訊編碼器20或視訊解碼器30之其他部分。在一些實例中,語法元素之值(例如,「0」)指示圖像僅具有一個片段。寫碼器可寫碼與標頭參數集或片段標頭中之每一片段相關聯的一片段結束位址(704)。在一些實例中,此等功能亦可由一語法寫碼單元(諸如,囊封單元66或解囊封單元94內之語法編碼單元)來提供。在一些實例中,片段結束位址可
在寫碼樹型區塊之單元中指定。在一些實例中,視訊寫碼器可在一些實例中彼此獨立地執行步驟700、702與704。
圖8為說明根據本發明之一或多個實例的一實例方法之另一流程圖。一寫碼器(諸如,視訊編碼器20或視訊解碼器30)可解碼指示用於一片段的寫碼樹型區塊之數目之一語法元素(800)。在一些實例中,此等功能可由一語法寫碼單元提供,該語法寫碼單元可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分。當已解碼的寫碼樹型區塊之總數等於用於片段的寫碼樹型區塊之數目時,寫碼器可推斷片段旗標之結束(802)。在一些實例中,此等功能亦可由一語法寫碼單元提供,該語法寫碼單元諸如可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分的語法編碼單元。另外,在一些實例中,視訊寫碼器可在一些實例中彼此獨立地執行步驟800與802。
圖9為說明根據本發明之一或多個實例的一實例方法之另一流程圖。一寫碼器(諸如,視訊編碼器20或視訊解碼器30)可寫碼一作用中VPS ID在RAP圖像之一片段標頭中的重複,以作為片段標頭中在任何經熵寫碼之語法元素前的一固定長度碼(900)。在一些實例中,此等功能可由一語法寫碼單元提供,該語法寫碼單元可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分。在一些實例中,此等功能亦可由一語法寫碼單元提供,該語法寫碼單元諸如可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分的語法編碼單元。寫碼器可寫碼具有兩個位元組之長度的NAL單元。第一位元組可與目前在高效率視訊寫碼工作草案7(HEVC WD7)中所定義之其他NAL單元類型相同。第二位元組可包括用於作用中VPS ID之N個位元及8-N個保留位元,其中2^N之值等於或大於APS ID之最大值加1(902)。在一些實例中,此等功能亦可由一語
法寫碼單元提供,該語法寫碼單元諸如可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分的語法編碼單元。在一些實例中,N等於8,VPS ID加1經在第二位元組中寫碼。在其他實例中,當N不等於8時,8-N個保留位元大於或等於1。另外,在一些實例中,步驟900及902可在一些實例中彼此獨立地執行。
圖10為說明根據本發明之一或多個實例的一實例方法之另一流程圖。一寫碼器(諸如,視訊編碼器20或視訊解碼器30)可寫碼具有三個位元組之長度的NAL單元。NAL單元具有定義對應於當前高效率視訊寫碼(HEVC)NAL單元之NAL單元標頭之一部分的兩個位元組,及包括用於作用中VPS ID之N個位元及8-N個保留位元的第三位元組。2^N之值等於或大於APS ID之最大值加1(1000)。在一些實例中,此等功能可由語法寫碼單元來提供,語法寫碼單元可為囊封單元66或解囊封單元94之部分。在一實例中,N等於8,VPS ID加1經在第二位元組中傳訊。在另一實例中,當N等於8時,VPS ID加1經在第三位元組中傳訊。在另一實例中,當N不等於8時,8-N個保留位元大於或等於1。
一寫碼器(諸如,視訊編碼器20或視訊解碼器30)可寫碼VPS NAL單元之一NAL單元標頭之第二位元組中的至少一位元以指示對應的VPS對於含有對應的VPS NAL單元之存取單元是否為作用中VPS(1002)。在一些實例中,此等功能亦可由一語法寫碼單元提供,該語法寫碼單元諸如可為囊封單元66或解囊封單元94之部分或視訊解碼器30或視訊編碼器20之其他部分的語法編碼單元。另外,在一些實例中,視訊寫碼器可在一些實例中彼此獨立地執行步驟1000與1002。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體傳輸,且由基於硬
體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體通常可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可藉由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
在再其他實例中,本發明預料到一電腦可讀媒體,該電腦可讀媒體包含儲存於其上之資料結構,其中該資料結構包括與本發明一致地寫碼之經編碼位元串流。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纖纜線、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及Blu-ray光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊
應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指前述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。此外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以廣泛的多種器件或裝置實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能態樣,但未必需要藉由不同硬體單元實現。相反地,如上所述,可將各種單元組合於編解碼器硬體單元中,或由互操作性硬體單元(包括如上所述之一或多個處理器)之集合而結合合適的軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
Claims (28)
- 一種寫碼視訊資料之方法,該方法包含:寫碼一補充增強資訊(SEI)訊息;固定長度寫碼一作用中視訊參數集(VPS)之一識別符作為該SEI訊息之一部份,其中在該SEI訊息中任何語法元素經熵寫碼之前該作用中VPS之該識別符係經固定長度寫碼;及藉由一視訊處理裝置基於該作用中VPS之該識別符以處理該視訊資料。
- 如請求項1之方法,其中該SEI訊息之一有效負載包含該作用中VPS之該識別符。
- 如請求項1之方法,其中該作用中VPS之該識別符經寫碼為該SEI訊息中之一第一語法元素。
- 如請求項1之方法,其中一SEI網路抽象層(NAL)單元包含該SEI訊息。
- 如請求項4之方法,其中無其他SEI訊息包括於該SEI NAL單元中。
- 如請求項5之方法,其進一步包含寫碼該視訊資料之每一隨機存取點(RAP)存取單元以包括該SEI NAL單元。
- 如請求項1之方法,其中寫碼該SEI訊息包含編碼含有該作用中VPS之該識別符的該SEI訊息,其中處理該視訊資料包含傳輸該視訊資料。
- 如請求項1之方法,其中寫碼該SEI訊息包含解碼含有該作用中VPS之該識別符的該SEI訊息,且其中處理該視訊資料包含使用由該作用中VPS之該識別符識別的該VPS來解碼該視訊資料。
- 如請求項1之方法,其中該作用中VPS之該識別符包含一視訊參 數集識別值。
- 一種用於寫碼視訊資料之器件,其包含:一記憶體,其經組態以儲存該視訊資料;一或多個處理器,其經組態以:寫碼一補充增強資訊(SEI)訊息,固定長度寫碼一作用中視訊參數集(VPS)之一識別符作為該SEI訊息之一部份,其中在該SEI訊息中任何語法元素經熵寫碼之前該作用中VPS之該識別符係經固定長度寫碼;及基於該作用中VPS之該識別符以處理該視訊資料。
- 如請求項10之器件,其中該SEI訊息之一有效負載包含該作用中VPS之該識別符。
- 如請求項10之器件,其中該作用中VPS之該識別符經寫碼為該SEI訊息中之第一語法元素。
- 如請求項12之器件,其中一SEI網路抽象層(NAL)單元包含該SEI訊息。
- 如請求項13之器件,其中無其他SEI訊息包括於該SEI NAL單元中。
- 如請求項14之器件,其中該一或多個處理器進一步經組態以寫碼視訊資料之每一隨機存取點(RAP)存取單元以包括該SEI NAL單元。
- 如請求項10之器件,其中該器件包含一視訊編碼器,且該一或多個處理器經組態以編碼該SEI訊息。
- 如請求項10之器件,其中該器件包含一視訊解碼器,且該一或多個處理器經組態以解碼該SEI訊息。
- 如請求項10之器件,其中該作用中VPS之該識別符包含一視訊參數集識別值。
- 一種非暫態電腦可讀儲存媒體,其儲存在由一或多個處理器執行時使該一或多個處理器進行以下操作之多個指令:寫碼一補充增強資訊(SEI)訊息;及固定長度寫碼一作用中視訊參數集(VPS)之一識別符作為該SEI訊息之一部份,且其中在該SEI訊息中任何語法元素經熵寫碼之前該作用中VPS之該識別符係經固定長度寫碼;及基於該作用中VPS之該識別符以處理該視訊資料。
- 如請求項19之非暫態電腦可讀儲存媒體,其中該SEI訊息之一有效負載由該作用中VPS之該識別符組成。
- 如請求項19之非暫態電腦可讀儲存媒體,其中該作用中VPS之該識別符經寫碼為該SEI訊息中之一第一語法元素。
- 如請求項19之非暫態電腦可讀儲存媒體,其中一SEI網路抽象層(NAL)單元包含該SEI訊息。
- 如請求項22之非暫態電腦可讀儲存媒體,其中無其他SEI訊息包括於該SEI NAL單元中。
- 如請求項19之非暫態電腦可讀儲存媒體,其儲存多個進一步指令以在執行時使該一或多個處理器進行寫碼視訊資料之每一隨機存取點(RAP)存取單元以包括該SEI NAL單元。
- 一種用於寫碼視訊資料之器件,該器件包含:用於儲存與一作用中視訊參數集(VPS)相關聯之資料之構件,用於寫碼一作用中視訊參數集(VPS)之一識別符作為一SEI訊息之一部份之構件,其中該作用中VPS之該識別符經固定長度寫碼且含於該SEI訊息中,其中在該SEI訊息中任何語法元素經熵寫碼之前該作用中VPS之該識別符係經固定長度寫碼;及用於基於該作用中VPS之該識別符以處理該視訊資料之構件。
- 如請求項25之器件,其中一SEI網路抽象層(NAL)單元包含該SEI 訊息。
- 如請求項26之器件,其中無其他SEI訊息包括於該SEI NAL單元中。
- 如請求項27之器件,其進一步包含用於寫碼視訊資料之每一隨機存取點(RAP)存取單元以包括該SEI NAL單元之構件。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261669556P | 2012-07-09 | 2012-07-09 | |
US13/777,413 US20140010277A1 (en) | 2012-07-09 | 2013-02-26 | Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201408046A TW201408046A (zh) | 2014-02-16 |
TWI543593B true TWI543593B (zh) | 2016-07-21 |
Family
ID=49878497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102122790A TWI543593B (zh) | 2012-07-09 | 2013-06-26 | 具有一固定長度寫碼之視訊參數集識別之補充增強資訊訊息 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20140010277A1 (zh) |
EP (1) | EP2870754B1 (zh) |
JP (1) | JP6321002B2 (zh) |
KR (1) | KR102147553B1 (zh) |
CN (1) | CN104429084B (zh) |
TW (1) | TWI543593B (zh) |
WO (1) | WO2014011363A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014024491A1 (ja) | 2012-08-09 | 2014-02-13 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置および画像符号化復号装置 |
US9706199B2 (en) * | 2012-09-28 | 2017-07-11 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
JP6257448B2 (ja) * | 2014-05-30 | 2018-01-10 | 三菱電機株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
EP2980793A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
US10158874B2 (en) * | 2015-09-30 | 2018-12-18 | Apple Inc. | Parallel bypass and regular bin coding |
WO2020057530A1 (en) * | 2018-09-18 | 2020-03-26 | Huawei Technologies Co., Ltd. | Coding method, device, system |
US10812818B2 (en) * | 2018-12-14 | 2020-10-20 | Tencent America LLC | Network abstraction unit layer type classes in network abstraction layer unit header |
US11140403B2 (en) * | 2018-12-20 | 2021-10-05 | Tencent America LLC | Identifying tile from network abstraction unit header |
US12113997B2 (en) * | 2019-01-22 | 2024-10-08 | Tencent America LLC | Method for tile group identification |
US11425376B2 (en) * | 2019-08-23 | 2022-08-23 | Apple Inc. | Image signal encoding/decoding method and apparatus therefor |
US11716488B2 (en) * | 2019-09-20 | 2023-08-01 | Qualcomm Incorporated | Subpicture signaling in high-level syntax for video coding |
US12041386B2 (en) | 2020-09-29 | 2024-07-16 | Lemon Inc. | Dependent random access point indication in video bitstreams |
KR20230165249A (ko) * | 2021-04-08 | 2023-12-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 확장성 차원 정보 추가 향상 정보 메시지 |
US11785239B2 (en) * | 2021-06-29 | 2023-10-10 | Tencent America LLC | Independent coded region output supplementary enhancement information message |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5841478A (en) * | 1996-04-09 | 1998-11-24 | Thomson Multimedia, S.A. | Code sequence detection in a trellis decoder |
US6115072A (en) * | 1999-01-27 | 2000-09-05 | Motorola, Inc. | 16:9 aspect ratio conversion by letterbox method for an MPEG image |
JP4144193B2 (ja) * | 2000-10-25 | 2008-09-03 | ソニー株式会社 | 表示パネル、及びディスプレイ装置 |
JP2006518127A (ja) * | 2003-02-18 | 2006-08-03 | ノキア コーポレイション | ピクチャ復号化方法 |
EP2039168A2 (en) * | 2006-07-05 | 2009-03-25 | Thomson Licensing | Methods and apparatus for multi-view video encoding and decoding |
ZA200900857B (en) * | 2006-07-06 | 2010-05-26 | Thomson Licensing | Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding |
US20100027615A1 (en) * | 2006-10-24 | 2010-02-04 | Purvin Bibhas Pandit | Picture identification for multi-view video coding |
CN101193321B (zh) * | 2006-11-27 | 2012-02-22 | 汤姆森许可贸易公司 | 编码设备、解码设备、记录设备、音频/视频数据传送系统 |
EP2103136B1 (en) * | 2006-12-21 | 2017-11-01 | Thomson Licensing | Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding |
US8553781B2 (en) * | 2007-12-07 | 2013-10-08 | Thomson Licensing | Methods and apparatus for decoded picture buffer (DPB) management in single loop decoding for multi-view video |
JP5944013B2 (ja) * | 2012-01-17 | 2016-07-05 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 参照画像リストの取り扱い |
-
2013
- 2013-02-26 US US13/777,413 patent/US20140010277A1/en not_active Abandoned
- 2013-06-17 CN CN201380036237.9A patent/CN104429084B/zh active Active
- 2013-06-17 JP JP2015521626A patent/JP6321002B2/ja active Active
- 2013-06-17 EP EP13732054.5A patent/EP2870754B1/en active Active
- 2013-06-17 KR KR1020157003362A patent/KR102147553B1/ko active IP Right Grant
- 2013-06-17 WO PCT/US2013/046157 patent/WO2014011363A1/en active Application Filing
- 2013-06-26 TW TW102122790A patent/TWI543593B/zh active
Also Published As
Publication number | Publication date |
---|---|
CN104429084B (zh) | 2019-04-26 |
US20140010277A1 (en) | 2014-01-09 |
EP2870754C0 (en) | 2024-07-17 |
TW201408046A (zh) | 2014-02-16 |
KR20150036464A (ko) | 2015-04-07 |
KR102147553B1 (ko) | 2020-08-24 |
JP2015527808A (ja) | 2015-09-17 |
EP2870754B1 (en) | 2024-07-17 |
EP2870754A1 (en) | 2015-05-13 |
WO2014011363A1 (en) | 2014-01-16 |
CN104429084A (zh) | 2015-03-18 |
JP6321002B2 (ja) | 2018-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI543593B (zh) | 具有一固定長度寫碼之視訊參數集識別之補充增強資訊訊息 | |
KR102372120B1 (ko) | 멀티계층 코덱들을 위한 hevc sei 메시지들의 일반적인 이용 | |
TWI556630B (zh) | 用於處理視訊資料之方法及器件及電腦可讀取儲存媒體 | |
US9596486B2 (en) | IRAP access units and bitstream switching and splicing | |
TWI521953B (zh) | 用於視訊寫碼之參數集合的指示及啓用 | |
JP6542271B2 (ja) | マルチレイヤビデオコーディング | |
US9641834B2 (en) | RTP payload format designs | |
TWI489877B (zh) | 基於乾淨隨機存取(cra)圖像之串流適應 | |
US9350781B2 (en) | Single network abstraction layer unit packets with decoding order number for video coding | |
US9686542B2 (en) | Network abstraction layer header design | |
TWI566582B (zh) | 用於處理及編碼視訊資料之方法、器件及裝置以及電腦可讀儲存媒體 | |
JP2015518352A (ja) | パラメータセットコーディング | |
JP2017525240A (ja) | マルチレイヤビデオコーデック内の回復点seiメッセージ |