TWI532383B - 在視訊寫碼中長期參考圖像之隨機存取及發信 - Google Patents
在視訊寫碼中長期參考圖像之隨機存取及發信 Download PDFInfo
- Publication number
- TWI532383B TWI532383B TW102123059A TW102123059A TWI532383B TW I532383 B TWI532383 B TW I532383B TW 102123059 A TW102123059 A TW 102123059A TW 102123059 A TW102123059 A TW 102123059A TW I532383 B TWI532383 B TW I532383B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- images
- rap
- rap image
- decoding
- Prior art date
Links
- 230000007774 longterm Effects 0.000 title description 50
- 230000011664 signaling Effects 0.000 title description 24
- 238000000034 method Methods 0.000 claims description 146
- 238000003860 storage Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 239000000463 material Substances 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 30
- 239000013598 vector Substances 0.000 description 29
- 238000013139 quantization Methods 0.000 description 24
- 230000005540 biological transmission Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 10
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 9
- 238000013500 data storage Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 241000023320 Luma <angiosperm> Species 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 235000013290 Sagittaria latifolia Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000015246 common arrowhead Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本申請案主張以下各者之權利:2012年6月28日申請之美國臨時申請案第61/665,862號,及2012年6月29日申請之美國臨時申請案第61/666,688號,該等申請案中之每一者的全文特此以引用之方式併入。
本發明大體上係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板型電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電傳會議器件、視訊串流器件,及其類似者。數位視訊器件實施視訊寫碼技術,諸如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4部分10進階視訊寫碼(AVC)所定義之標準、目前正在發展之高效視訊寫碼(HEVC)標準及此等標準之擴展中所描述的視訊寫碼技術。在ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合協作小組(JCT-VC),2012年4月27日至2012年5月7日瑞士日內瓦,第9次會議,Bross等人之名為「High Efficiency Video Coding(HEVC)Text Specification
Draft 7」的文件HCTVC-I1003中描述即將到來的HEVC標準之最近草案(稱作「HEVC工作草案7」或「WD7」),自2013年2月5日起,該文件可自http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v5.zip下載。視訊器件可藉由實施此等視訊寫碼技術來更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,視訊切片(例如,視訊圖框或視訊圖框之一部分)可經分割成視訊區塊,其亦可稱作樹區塊、寫碼樹單元、寫碼單元(CU)及/或寫碼節點。使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之框內寫碼(I)切片中的視訊區塊。圖像之框間寫碼(P或B)切片中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間預測或時間預測導致寫碼用於區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼框內寫碼區塊。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而引起殘餘變換係數,可接著量化殘餘變換係數。可掃描最初配置成二維陣列之經量化之變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
一般而言,本發明描述用於支援視訊寫碼中長期參考圖像之隨機存取及發信的技術。本發明提議若干限制用於支援基於各種類型圖像之隨機存取。在一個實例中,隨機存取點(RAP)圖像之所有標記為
捨棄(TFD)的圖像可具有一早於RAP之所有可解碼前置圖像(DLP)之顯示次序值的顯示次序值。本發明亦提議一防止前置圖像與「結尾圖像」在解碼次序方面交錯的限制。亦即,根據本發明之技術,視訊寫碼器可確保所有前置圖像(包括TFD圖像及DLP兩者)具有早於具有大於對應RAP圖像之顯示次序值之顯示次序值及大於對應RAP圖像之解碼次序值的解碼次序值兩者的圖像之解碼次序值的解碼次序值。顯示次序亦可稱作輸出次序。TFD圖像亦可稱作隨機存取跳過前置(RASL)圖像,且DLP圖像亦可稱作隨機存取可解碼前置(RADL)圖像。
在一個實例中,寫碼視訊資料之方法包括:寫碼一隨機存取點(RAP)圖像;及寫碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
在另一實例中,一用於寫碼視訊資料之器件包括一視訊寫碼器,其經組態以執行以下操作:寫碼一隨機存取點(RAP)圖像;及寫碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
在另一實例中,一用於寫碼視訊資料之裝置包括:用於寫碼一隨機存取點(RAP)圖像之構件;及用於寫碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP的構件。
在另一實例中,一儲存指令之電腦可讀儲存媒體,該等指令在由一或多個處理器執行時使該一或多個處理器執行以下操作:寫碼一隨機存取點(RAP)圖像;及寫碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
在另一實例中,一編碼視訊資料之方法包括:編碼一隨機存取點(RAP)圖像;及編碼RAP圖像之一或多個可解碼前置圖像(DLP),使
得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
在另一實例中,一用於編碼視訊資料之器件包括一視訊編碼器,該視訊編碼器經組態以執行以下操作:編碼一隨機存取點(RAP)圖像;及編碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
在另一實例中,一用於編碼視訊資料之裝置包括:用於編碼一隨機存取點(RAP)圖像之構件;及用於編碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP的構件。
在另一實例中,一儲存指令之電腦可讀儲存媒體,該等指令在由一或多個處理器執行時使該一或多個處理器執行以下操作:編碼一隨機存取點(RAP)圖像;及編碼RAP圖像之一或多個可解碼前置圖像(DLP),使得經標記為捨棄的所有圖像按顯示次序先於與RAP圖像相關聯之DLP。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測處理單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧逆量化單元
60‧‧‧逆變換處理單元
62‧‧‧求和器
64‧‧‧參考圖像記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測處理單元
76‧‧‧逆量化單元
78‧‧‧逆變換處理單元
80‧‧‧求和器
82‧‧‧參考圖像記憶體
92‧‧‧參考圖框記憶體
100‧‧‧經寫碼視訊圖像
102‧‧‧經寫碼視訊圖像
104‧‧‧經寫碼視訊圖像
106‧‧‧經寫碼視訊圖像
108‧‧‧經寫碼視訊圖像
110‧‧‧經寫碼視訊圖像
112‧‧‧經寫碼視訊圖像
114‧‧‧經寫碼視訊圖像
116‧‧‧經寫碼視訊圖像
118‧‧‧經寫碼視訊圖像
120‧‧‧經寫碼視訊圖像
122‧‧‧經寫碼視訊圖像
124‧‧‧經寫碼視訊圖像
126‧‧‧經寫碼視訊圖像
128‧‧‧經寫碼視訊圖像
130‧‧‧經寫碼視訊圖像
132‧‧‧經寫碼視訊圖像
134‧‧‧圖像群組
136‧‧‧圖像群組
150‧‧‧網路
152‧‧‧伺服器器件
154A‧‧‧路由器件
154B‧‧‧路由器件
156‧‧‧代碼轉換器件
158‧‧‧用戶端器件
圖1為說明可利用用於在切片標頭中發信長期參考圖像之技術的實例視訊編碼及解碼系統的方塊圖。
圖2為說明可實施用於在切片標頭中發信長期參考圖像之技術的視訊編碼器之實例的方塊圖。
圖3為說明可實施用於在切片標頭中發信長期參考圖像之技術的視訊解碼器之實例的方塊圖。
圖4為說明經寫碼視訊圖像之序列的概念圖。
圖5為說明形成網路之部分的實例器件集合之方塊圖。
圖6為說明根據本發明之技術的用於寫碼隨機存取點(RAP)圖像之實例操作的流程圖。
圖7為說明根據本發明之技術的用於寫碼RAP圖像之實例操作的流程圖。
圖8為說明根據本發明之技術的用於寫碼RAP圖像之實例操作的流程圖。
圖9為說明根據本發明之技術的用於寫碼RAP圖像之實例操作的流程圖。
圖10為說明根據本發明之技術的用於寫碼RAP圖像之實例操作的流程圖。
圖11為說明根據本發明之技術的用於寫碼RAP圖像之實例操作的流程圖。
一般而言,視訊資料係由經快速連續地俘獲或顯示的圖像之序列表示。應理解在一些實例中,圖像或圖像之部分可(例如)使用電腦圖形來產生,而非被俘獲(或除被俘獲外)。待顯示圖像的次序(其可或可不與俘獲或產生圖像的次序相同)可不同於經寫碼圖像包括於位元串流中之次序。經寫碼視訊序列中之圖像之顯示次序可由圖像次序計數(POC)值來表示,而圖像之寫碼次序可由圖框編號(frame_num)值來表示。
圖像之寫碼一般涉及利用圖像中出現之冗餘資料。舉例而言,空間寫碼(亦稱作框內預測性寫碼)利用共同圖像之像素值的空間相鄰區塊之間出現的冗餘。作為另一實例,時間寫碼(亦稱作框間預測性寫碼)利用在不同時間執行個體處俘獲、產生或顯示的不同圖像之間出現的冗餘。更特定言之,圖像可經劃分成多個切片,其可經指定用
於框內預測或框間預測。此外,每一切片可經劃分成多個區塊(例如,最大寫碼單元(LCU),亦稱作寫碼樹單元),且該等區塊中之每一者可基於對應切片是經指定用於框內預測還是框間預測而經進一步分割或寫碼。
關於框間預測性寫碼之實例,當前正被寫碼之圖像(亦稱作「當前圖像」)之區塊可自參考圖像而預測。WD7將「參考圖像」定義為一具有等於1之nal_ref_flag的圖像。該nal_ref_flag為網路抽象層(NAL)單元之指示包括於NAL單元中之資料是否被視為參考圖像的語法元素。WD7亦規定一參考圖像含有在後續圖像按解碼次序之解碼程序中可用於框間預測的樣本(亦即,像素值)。
如上文所介紹,一般而言,視訊資料包括各種類型之圖像。舉例而言,視訊資料包括可用以開始視訊資料之串流的隨機存取點(RAP)。RAP為經獨立寫碼為(例如)框內預測寫碼圖像(I圖像)之圖像。RAP包括瞬時解碼器再新(IDR)圖像、中斷連結存取(BLA)圖像、乾淨隨機存取(CRA)圖像,及逐漸解碼再新(GDR)圖像。其他類型之圖像包括經標記為捨棄(TFD)之圖像、可解碼前置圖像(DLP)及結尾圖像。一般而言,DLP(類似於所有前置圖像)為具有一早於對應RAP之輸出次序的輸出次序但具有一遲於對應RAP之解碼次序的解碼次序的圖像。然而,DLP為在不擷取按解碼次序先於對應RAP的資料情況下可解碼的前置圖像。另一方面,結尾圖像具有一遲於對應RAP之輸出次序的輸出次序,以及一遲於對應RAP之解碼次序的解碼次序。為TFD之圖像在執行自對應RAP之隨機存取時不可被適當地解碼。此一般歸因於TFD圖像係自按解碼次序先於對應RAP的資料預測。因為自RAP之隨機存取省略擷取按解碼次序早於RAP之資料,所以當RAP用作隨機存取點時TFD圖像(其取決於按解碼次序早於RAP之資料)不可被正確地解碼,且因此可在未被解碼情況下被捨棄。在相對於按解碼
次序早於RAP出現之一或多個圖像而預測TFD圖像的意義上來講,TFD圖像「取決於」較早資料。
NAL單元可經指派(例如)NAL單元標頭中之特定NAL單元類型值以指示包括於對應NAL單元中的資料之類型。NAL單元一般可包括視訊寫碼層(VCL)資料(亦稱作VCL NAL單元)或非VCL資料(亦稱作非VCL NAL單元)。非VCL資料包括(例如)參數集,諸如圖像參數集(PPS)、序列參數集(SPS)及調適參數集(APS),以及補充增強資訊(SEI)訊息。VCL資料一般包括經寫碼視訊資料。NAL單元類型可提供包括於NAL單元中的資料之類型的一指示,包括NAL單元中之經寫碼視訊資料是否對應於RAP,且若對應,則經寫碼視訊資料是對應於CRA、BLA還是IDR圖像。NAL單元類型可指示NAL單元是否亦包括其他類型之資料。下文表1提供一些NAL單元類型值之實例及包括於對應NAL單元中的資料,如WD7中所提供:
此外,WD7區別長期參考圖像與短期參考圖像。舉例而言,WD7將一長期參考圖像定義為一標記為「用於長期參考」之參考圖像。WD7規定序列參數集(SPS)中之旗標指示長期參考圖像是否完全被發信用於經寫碼視訊序列。根據WD7,視訊寫碼器在切片之切片標
頭中發信長期參考圖像之POC值之最低有效位元(LSB)。發信LSB相對於發信完整POC值可導致位元節省。根據WD7,若經解碼圖像緩衝器(DPB)中存在具有與長期參考圖像相同之LSB位元的一個以上參考圖像,則視訊寫碼器可發信長期參考圖像之POC值之最高有效位元(MSB)。此外,根據WD7,視訊寫碼器可使用一旗標來指示經發信之長期參考圖像是否可由當前圖像用於參考。
對於HEVC之參考圖像集(RPS)設計的一個假定係RPS導出必須對於圖像丟失係穩健的,只要可正確地建立針對短期參考圖像(STRP)及長期參考圖像(LTRP)兩者的相對POC值。為實現此,任一圖像之RPS導出可為自含式的,亦即,不取決於經解碼圖像緩衝器(DPB)狀態。藉由此設計原理,根據WD7,STRP係使用其相對於當前圖像之增量(delta)POC值來發信。因此,解碼器可能甚至在一些圖像丟失時仍能夠導出此等參考圖像之POC值並因此檢查STRP中之每一者是否存在。
本發明認識到在有WD7之圖像丟失情況下LTRP之當前切片標頭發信中的某些問題。RPS之錯誤導出在有丟失之情況下係可能的。此係歸因於僅發信LTRP之與用於每一當前圖像之POC值之發信相同的量的POC LSB(亦即,pic_order_cnt_lsb),但在一些狀況下使用delta_poc_msb_cycle_lt語法元素之完整POC值經發信用於LTRP。若DPB中存在具有與經發信用於LTRP之LSP相同的LSB之圖像,則在RPS之導出中可能存在歧義,且RPS之不正確結果可能出現,如下文呈現之實例中所示。在下文論述之實例中,「MaxPicOrderCntLsb」經假定為等於256,或換言之,log2_max_pic_order_cnt_lsb_minus4等於4。
作為說明上文論述之問題的第一實例,考慮按解碼次序連續的三個圖像n-1、n及n+1。假定圖像n-1具有作為LTRP之具有0及256
之POC值的參考圖像,且圖像n及n+1僅具有作為LTRP之具有POC 256之參考圖像。圖像n-1、n及n+1之POC值全部在257至511之範圍內(包括257及511)。亦假定圖像n-1、n及n+1或DPB中之任一其他圖像中一個皆不具有等於0之LSB值。在HEVC WD7之發信情況下,符合型位元串流之相關語法元素如表2中所示。
對於圖像n,即使僅圖像256作為LTRP而被發信,當圖像n之RPS經導出時,圖像0仍將在DPB中。因此,甚至對於圖像n,delta_poc_msb_present_flag經設定為1,且delta_poc_msb_msb_cycle_lt值被發送。在用於圖像n之RPS導出後,圖像0經標記為「未用於參考」且可自DPB中移除。然而,對於圖像n+1,因為僅一個LTRP存在於DPB中,所以delta_poc_msb_present_flag經設定為0且delta_poc_msb_cycle_lt不存在。
在WD7之語法結構下,上述表將對應於符合型位元串流。然而,若圖像n丟失,則圖像n+1之LTRP發信將不足以解決來自DPB之哪一圖像待被作為LTRP拾取。0及256兩者具有為0之LSB,且解碼器將不能夠解決問題。解碼器將需要用於圖像n+1之delta_poc_msb_present_flag等於1以唯一地識別待用作僅LTRP之圖像。
上文論述之問題(關於上文之第一實例)的第二實例如下。除圖像0作為LTRP發信且圖像256作為圖像n-1之STRP發信外,表3之描述類
似於表2之描述。
此處再次,若圖像n丟失,則解碼器將不能夠正確地識別作為圖像256發信之LTRP,且解碼器將需要delta_poc_msb_present_flag等於1以唯一地識別待用作僅LTRP之圖像。
參看表4描述上文論述之問題的第三實例。
參看表4之實例,假定具有POC 255之圖像被接收到,繼之以圖像258(換言之,圖像256及257丟失)。在解碼圖像258之切片標頭之後,圖像0(而非圖像256)將被標記為LTRP。解碼器將不正確地導出圖像0為經發信之LTRP且繼續解碼(假定解碼程序之其他態樣為此丟失而工作),而非針對圖像258而算出參考圖像256不存在。
自上述實例,用於解決上述問題之靠不住的簡單解決方案可能好像是發信LTRP之實際完整POC值。亦好像是RPS導出在完整POC發信情況下將為自含式的。然而,CRA圖像可起始位元串流或CRA圖像可藉由拼接器轉換成BLA圖像之概率消除發信完整POC值。舉例而言,考慮位元串流中具有256(仍假定MaxPicOrderCntLsb=256)之POC
值的CRA圖像,且令按解碼次序在CRA圖像之後的一些圖像具有作為LTRP之CRA圖像。若CRA圖像之完整POC(其為256)經發信,且CRA圖像轉換成BLA圖像或起始一位元串流,則LTRP將被不正確地導出,且位元串流將變得不合格。當CRA圖像轉換至BLA圖像或起始位元串流時,解碼器根據WD7之技術僅基於其LSB導出其POC值。在上述實例中,CRA圖像(其現在為BLA圖像)之POC將經判定為0。當解碼器尋找具有POC 256之LTRP時,DPB將不含有任何此圖像,因為現在CRA圖像具有為0的導出之POC。此將導致RPS中「無參考圖像」,且若當前圖像並非為與CRA圖像相關聯之TFD圖像,則所得位元串流將係不合格的。
本發明描述用於支援對視訊資料隨機存取之技術。在一些例項中,此等技術可用於克服WD7之上述問題。更特定言之,本發明提議若干限制用於支援基於各種類型圖像之隨機存取。首先,根據本發明之一技術,RAP圖像之所有TFD圖像應具有一早於RAP之所有DLP之顯示次序值的顯示次序值。此限制可藉由避免圖框速率之突變(choppiness)而改良觀看者之觀看體驗。亦即,若存在不能被正確解碼的一或多個圖像(亦即,TFD圖像)且若此等圖像具有與DLP混合之顯示次序值,則圖框速率將出現突變,其將減損使用者體驗。根據另一技術,本發明亦提議一防止前置圖像與「結尾圖像」在解碼次序方面交錯的限制。亦即,根據本發明之技術,視訊寫碼器可確保所有前置圖像(包括TFD圖像及DLP兩者)具有早於具有大於對應RAP圖像之顯示次序值之顯示次序值的圖像之解碼次序值的解碼次序值。如上文所提及,「結尾圖像」為按解碼次序及按顯示次序兩者皆在RAP圖像之後的圖像。
如上文所介紹,一般而言,視訊資料包括各種類型之圖像。舉例而言,視訊資料包括可用以開始視訊資料之串流的RAP。RAP為經
獨立寫碼為(例如)框內預測經寫碼圖像(I圖像)的圖像。RAP包括IDR圖像、BLA圖像及CRA圖像。
其他類型之圖像包括TFD、DLP及結尾圖像。一般而言,DLP(類似於所有前置圖像)為具有一早於對應RAP圖像之輸出次序之輸出次序但具有一遲於對應RAP之解碼次序之解碼次序的圖像。然而,DLP為在不擷取按解碼次序先於對應RAP圖像之資料情況下可解碼之前置圖像。換言之,DLP為關於包括及/或在對應RAP之後的一或多個圖像之資料而預測的前置圖像。另一方面,結尾圖像具有一遲於對應RAP之輸出次序的輸出次序以及一遲於對應RAP圖像之解碼次序的解碼次序。
當自對應RAP圖像執行隨機存取時為TFD圖像之圖像不能被適當地解碼。此一般而言係歸因於TFD圖像係自按解碼次序先於對應RAP圖像之資料而預測。因為自RAP圖像之隨機存取省略了擷取早於RAP圖像之資料,所以取決於早於RAP圖像之資料的TFD圖像將不能被正確地解碼,且因此可在未解碼情況下被捨棄。
本發明提議若干限制用於支援基於此等各種類型圖像之隨機存取。首先,RAP圖像之所有TFD圖像應具有一早於RAP圖像之所有DLP之顯示次序值的顯示次序值。此限制可改良觀看者之觀看體驗,因為其避免圖框速率之突變。亦即,若存在不能被正確解碼之一或多個圖像(諸如,TFD圖像),若此等圖像具有與DLP混合之顯示次序值,則圖框速率將出現突變,此將減損使用者體驗。
本發明亦提議一防止前置圖像與「結尾圖像」在解碼次序方面交錯的限制。亦即,根據本發明之技術,視訊寫碼器可確保所有前置圖像(包括TFD圖像及DLP兩者)具有早於具有大於對應RAP圖像之顯示次序值之顯示次序值的圖像之解碼次序值的解碼次序值。如上文所提及,「結尾圖像」為按解碼次序及按顯示次序兩者在RAP圖像之後
的圖像。實施本發明之技術,視訊編碼器可經組態以編碼一RAP圖像並編碼RAP圖像之一或多個DLP,使得經標記為捨棄的所有圖像按輸出次序先於與RAP圖像相關聯之DLP。同樣,視訊解碼器無需試圖解碼在一用作隨機存取點之RAP圖像後的TFD圖像。實情為,視訊解碼器可在不試圖解碼用於此等TFD圖像之資料的情況下簡單地剖析該資料。此可為一諸如視訊解碼器之器件提供一資源節省。舉例而言,此等技術可節省電池電力及/或改良處理效率。藉由不在解碼次序方面交錯前置圖像及結尾圖像,系統(諸如MANE或視訊解碼器)可在無需剖析超過在相關聯的RAP圖像之後的第一結尾圖像範圍之圖像的情況下易於識別與RAP圖像相關聯之前置圖像。識別前置圖像可由於前置圖像按顯示次序出現在RAP之前而在決定隨機存取處之輸出時有用,且若中間系統經組態以如此執行,則可用於移除前置圖像。此外,如上文所提及,此等技術可藉由避免圖框速率突變而導致改良之使用者體驗。
圖1為說明可利用用於在切片標頭中發信長期參考圖像的技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所示,系統10包括一提供待在稍後時間由目的地器件14解碼之經編碼視訊資料的源器件12。詳言之,源器件12經由電腦可讀媒體16提供視訊資料至目的地器件14。源器件12及目的地器件14可包含廣泛範圍器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、諸如所謂之「智慧型」電話的電話手機、所謂之「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件,或其類似者。在一些狀況下,源器件12及目的地器件14可為無線通信而裝備。
目的地器件14可經由電腦可讀媒體16接收待被解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移
動至目的地器件14之任何類型之媒體或器件。在一個實例中,電腦可讀媒體16可包含使源器件12能夠即時直接地傳輸經編碼視訊資料至目的地器件14的通信媒體。可根據通信標準(諸如,無線通信協定)調變經編碼之視訊資料,且將經編碼之視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的任何其他設備。
在一些實例中,可將經編碼資料自輸出介面22輸出至儲存器件。類似地,可藉由輸入介面自儲存器件存取經編碼資料。儲存器件可包括多種分散式或本端存取式資料儲存媒體中之任一者,諸如,硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼之視訊資料之任何其他合適的數位儲存媒體。在另一實例中,儲存器件可對應於一檔案伺服器或可儲存由源器件12產生之經編碼視訊的另一中間儲存器件。目的地器件14可經由串流傳輸或下載存取來自儲存器件之所儲存視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地器件14之任何類型之伺服器。實例檔案伺服器包括web伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之結合。經編碼視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸,或其組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支
援諸如以下應用的多種多媒體應用中之任一者的視訊寫碼:空中電視廣播、有線電視傳輸、衛星電視傳輸、諸如HTTP動態自適應性串流(DASH)之網際網路串流視訊傳輸、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於在切片標頭中發信長期參考圖像的技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件建立介面連接,而非包括整合式顯示器件。
圖1之所說明的系統10僅為一實例。用於在切片標頭中發信長期參考圖像的技術可藉由任一數位視訊編碼及/或解碼器件執行。儘管通常藉由視頻編碼器件執行本發明之技術,但亦可藉由視頻編碼器/解碼器(通常稱為「CODEC」)執行該等技術。此外,亦可藉由視訊預處理器來執行本發明之技術。源器件12及目的地器件14僅為此等寫碼器件之實例,在該等寫碼器件中,源器件12產生用於傳輸至目的地器件14之經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱方式進行操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括諸如視訊攝影機之視訊俘獲器件、含有先前俘獲之視訊的視訊封存檔,及/或用以自視訊內容提供者接收視訊之視訊饋入介面。作為另一替代,視訊源18可產生基於電腦圖
形之資料,作為源視訊、或直播視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12及目的器件14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術可大體上適用於視訊寫碼,且可應用於無線及/或有線應用。在每一狀況下,經俘獲、經預先俘獲或電腦產生之視訊可藉由視訊編碼器20來編碼。經編碼視訊資訊接著可由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括暫時性媒體,諸如,無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未圖示)可自源器件12接收經編碼之視訊資料,且(例如)經由網路傳輸將該經編碼視訊資料提供至目的地器件14。類似地,媒體生產設施(諸如,光碟壓印設施)之計算器件可自源器件12接收經編碼之視訊資料且產生含有該經編碼之視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解成包括各種形式之一或多個電腦可讀媒體。
目的地器件14之輸入介面28接收來自電腦可讀媒體16之資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義之語法資訊,其亦由視訊解碼器30使用,該語法資訊包括描述區塊及其他經寫碼單元(例如,GOP)之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中的高效率視訊寫碼(HEVC)標準之視訊寫碼標準而操作,且可遵照HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T
H.264標準或者被稱作MPEG-4第10部分(進階視訊寫碼(AVC)之其他專屬或工業標準或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。儘管未展示於圖1中,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
ITU-T H.264/MPEG-4(AVC)標準由ITU-T視訊寫碼專家群(VCEG)連同ISO/IEC動畫專家群(MPEG)一起制定為被稱為聯合視訊小組(JVT)之集體合作之產品。在一些態樣中,本發明中所描述之技術可應用於大體遵照H.264標準之器件。H.264標準由ITU-T研究小組且在日期為2005年3月描述於ITU-T推薦H.264(用於一般視聽服務之進階視訊寫碼)中,其在本文中可被稱作H.264標準或H.264規範或H.264/AVC標準或規範。聯合視訊小組(JVT)繼續致力於對H.264/MPEG-4 AVC之擴展。
視訊編碼器20及視訊解碼器30可各自實施為多種適合編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地在軟體中實施時,一器件可將用於軟體之指令儲存於適合的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)的部分。
JCT-VC致力於HEVC標準之開發。HEVC標準化努力係基於視訊
寫碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。儘管本發明可出於解釋之目的而有時依賴於HEVC之WD7,但本發明之技術決不限於WD7。HEVC標準繼續演進,且預期本發明之技術可與HEVC之將來版本相容。舉例而言,本發明中之技術可結合「HEVC工作草案10」或「WD10」使用,在ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合協作小組(JCT-VC),2013年1月14日至23日瑞士日內瓦,第12次會議,Bross等人之名為「High Efficiency Video Coding(HEVC)Text Specification Draft 10」的文件JCTVC-L1003_v18中描述「HEVC工作草案10」或「WD10」,自2013年2月5日起,該文件可自http://phenix.it-sudparis.eu/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v18.zip下載。
一般而言,HM之工作模型描述視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹區塊或最大寫碼單元(LCU)序列。位元串流內之語法資料可定義LCU之大小,LCU就像素之數目而言為最大寫碼單元。切片包括按寫碼次序之數個連續樹區塊。可將視訊圖框或圖像分割成一或多個切片。每一樹區塊可根據四分樹而分裂成若干寫碼單元(CU)。一般而言,四分樹資料結構中每CU包括一個節點,其中根節點對應於樹區塊。若將CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該四個葉節點中之每一者對應於該等子CU中之一者。
該四分樹資料結構中之每一節點可提供針對該對應CU之語法資料。舉例而言,在該四分樹中之節點可包括分裂旗標,從而指示是否
將對應於該節點之CU分裂成子CU。可遞歸地定義用於CU之語法元素,且用於CU之語法元素可視CU是否分裂成子CU而定。若一CU未經進一步分裂,則其被稱作一葉CU。在本發明中,即使不存在原始葉CU之明顯分裂,葉CU之四個子CU亦將被稱作葉CU。舉例而言,若一16×16大小之CU未經進一步分裂,則四個8×8子CU亦將被稱作葉CU,儘管該16×16 CU從未經分裂。
除了CU不具有大小區別之外,CU之目的類似於H.264標準之巨集區塊之目的。舉例而言,樹區塊可分裂成四個子代節點(亦被稱作子CU),且每一子代節點又可為父代節點並分裂成另外四個子代節點。被稱作四分樹之葉節點之最終的未分裂子代節點包含一寫碼節點,該寫碼節點亦被稱作葉CU。與一經寫碼的位元串流相關聯之語法資料可定義可分裂一樹區塊之最大次數(其被稱作最大CU深度),且亦可定義該等寫碼節點之最小大小。因此,位元串流亦可定義一最小寫碼單元(SCU)。本發明使用術語「區塊」指代在HEVC之上下文中之CU、PU或TU中的任一者,或在其他標準之上下文中之類似資料結構(例如,在H.264/AVC中之巨集區塊及其子區塊)。
CU包括一寫碼節點及與該寫碼節點相關聯之若干預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小,且形狀必須為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼而不同。PU之形狀可分割成非正方形。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹至一或多個TU之分割。TU之形狀可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,該變換對於不同CU可不同。通
常基於針對經分割LCU所定義之給定CU內之PU的大小而設定TU大小,但可能並非總是如此狀況。TU通常具有與PU相同的大小,或小於PU。在一些實例中,可使用稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本再分成若干較小單元。RQT之葉節點可被稱作變換單元(TU)。可變換與TU相關聯之像素差值以產生可量化之變換係數。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之全部或一部分之空間區域,且可包括用於擷取PU之參考樣本之資料。此外,PU包括與預測有關之資料。舉例而言,當PU經框內模式編碼時,用於PU之資料可包括於殘餘四分樹(RQT)中,殘餘四分樹可包括描述對應於PU之TU之框內預測模式的資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義該PU之一或多個運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。可使用RQT(亦被稱作TU四分樹結構)指定變換單元,如上文所論述。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成其他子TU。當TU不進一步分裂時,其可被稱作葉TU。一般而言,對於框內寫碼,屬於葉CU之所有葉TU共用相同框內預測模式。亦即,一般應用相同框內預測模式來計算一葉CU的所有TU之預測值。對於框內寫碼,視訊編碼器可將使用框內預測模式的每一葉TU之殘餘值計算為在CU之對應於該TU的部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可能大於或小於PU。對於框內寫碼,一PU可與用於同一CU之一對應葉TU共置。在一些實
例中,一葉TU之最大大小可對應於對應葉CU之大小。
此外,葉CU之TU亦可與被稱作殘餘四分樹(RQT)之各別四分樹資料結構相關聯。亦即,葉CU可包括指示如何將葉CU分割成TU之四分樹。TU四分樹之根節點一般對應於葉CU,而CU四分樹之根節點一般對應於樹區塊(或LCU)。RQT之不分裂的TU被稱作葉TU。一般而言,除非另有指示,否則本發明分別使用術語CU及TU來指代葉CU及葉TU。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)通常包含一系列視訊圖像中之一或多者。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括描述包括於GOP中之圖像數目的語法資料。圖像之每一切片可包括描述該各別切片之編碼模式的切片語法資料。視訊編碼器20通常對個別視訊切片內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小方面不同。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小進行框間預測之不對稱分割。在不對稱分割中,CU之一方向未分割,而另一方向分割成25%及75%。CU之對應於25%分割的部分係由「n」後跟著「上」、「下」、「左」或「右」之指示來指示。因此,例如,「2N×nU」指代在水平方向上以頂部2N×0.5N PU及底部2N×1.5N PU分割之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。大體而言,16×16區塊在垂直方向中將具有16個像素(y=16)且
在水平方向中將具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。此外,區塊未必需要在水平方向中與在垂直方向中具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
在使用CU之PU進行框內預測性或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述產生空間域(亦稱作像素域)中之預測性像素資料之方法或模式的語法資料,且TU可在對殘餘視訊資料應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換,或概念上類似之變換)後包含變換域中之係數。殘餘資料可對應於未經編碼之圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在進行任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化一般指代如下程序:將變換係數量化以可能地減少用以表示該等係數之資料之量,從而提供進一步壓縮。該量化程序可減少與該等係數中之一些或全部相關聯的位元深度。舉例而言,可在量化期間將n位元值降值捨位至m位元值,其中n大於m。
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化之變換係數之二維矩陣產生一維向量。掃描可經設計成將較高能量(且因此較低頻率)係數置於陣列前部,且將較低能量(且因此較高頻率)係數置於陣列後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數,以產生可經熵編碼的串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼
(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法而熵編碼該一維向量。視訊編碼器20亦可熵編碼與經編碼之視訊資料相關聯的語法元素以供視訊解碼器30用於解碼視訊資料。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可將VLC中之碼字建構成使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用等長度碼字相比較)。機率判定可基於指派給符號之上下文而進行。
根據本發明之技術,視訊編碼器20及視訊解碼器30可經組態以執行如下之實例函數「GetLSB(poc,len)」,其中poc為整數且len為正整數:
在函數(1)之實例中,「<<」表示按位元左移算子且Floor()返回傳遞至其的自變數之值,該值經降值捨位。
視訊編碼器20及視訊解碼器30可經組態以執行用於導出參考圖像集(RPS)及發信待包括於經寫碼圖像之RPS中之長期參考圖像(LTRP)的一或多個各種技術。一般而言,視訊編碼器20及視訊解碼器30可經組態以單獨地或以任一組合方式執行本發明中描述之實例中的任一者或全部。一般而言,本發明描述與以下編碼及解碼技術有關的技術,其中視訊編碼器20及視訊解碼器30可經組態以結合WD7之其他技術或其他視訊寫碼框架來執行此等技術中之任一者或全部。
在一個實例中,經發信用於待包括於當前圖像之RPS中之特定
LTRP的資訊可為在當前圖像與LTRP之間或在LTRP與按解碼次序之前一RAP圖像之間的增量POC值。作為一替代例,除語法元素delta_poc_msb_cycle_lt[i]總是經發信用於切片標頭中之每一LTRP外,藉由移除語法元素delta_poc_msb_present_flag[i],或藉由針對所有LTRP命令delta_poc_msb_present_flag[i]為1,LTRP發信及導出可保持與WD7中相同。作為另一替代例,經發信用於待包括於當前圖像之RPS中之特定LTRP的資訊可為在LTRP與按解碼次序之前一RAP圖像之間的增量POC值,或可應用上述替代方法。
在一替代例中,按解碼次序在CRA或BLA圖像之後的圖像可經禁止將按解碼次序先於CRA或BLA圖像之圖像用作LTRP。因此,前置圖像可經禁止將按解碼次序先於相關聯之CRA或BLA圖像的圖像參照為LTRP。對於非TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,具有最小POC之圖像未標記為TFD且按解碼次序先於當前圖像,並按解碼次序在按解碼次序的前一RAP圖像之後(包括按解碼次序的前一RAP圖像在內)。對於TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,具有最小POC之圖像按解碼次序先於當前圖像,並按解碼次序在按解碼次序的前一RAP圖像之後(包括按解碼次序的前一RAP圖像在內)。
在一替代例中,與RAP圖像相關聯之TFD圖像可經禁止按解碼次序在與同一RAP圖像相關聯之任一DLP圖像之後。對於非TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,具有最小POC之圖像未標記為TFD圖像且按解碼次序先於當前圖像,並按解碼次序在按解碼次序的前一RAP圖像之後(包括按解碼次序的前一RAP圖像在內)。對於TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,具有最小POC之圖像按解碼次序先於當前圖像,並按輸出次序在按解碼次序在前一RAP圖像之
前的RAP之後(包括在按解碼次序之前一RAP圖像之前的RAP在內)。
在一替代例中,與CRA或BLA圖像相關聯之前置圖像可經禁止以將相關聯之CRA或BLA圖像或與同一CRA或BLA圖像相關聯之其他前置圖像參照為LTRP。發信LTRP LSB所需的位元之數目可藉由按輸出次序先於當前圖像之RAP圖像來判定。
在一替代例中,可強加以下約束。按解碼次序先於CRA或BLA圖像之任何圖像應按輸出次序先於與CRA或BLA圖像相關聯之任一DLP圖像。此外,亦可強加以下約束:與CRA或BLA圖像相關聯之任一TFD圖像應按輸出次序先於與CRA或BLA圖像相關聯之任一DLP圖像。此等實例約束禁止DLP圖像與TFD圖像或按解碼次序早於相關聯之CRA或BLA圖像的圖像在輸出次序方面交錯的狀況。在彼等狀況下,當隨機存取或自CRA或BLA圖像執行串流切換時,開始圖像速率將小於DLP圖像輸出之後的圖像速率。在使用頻繁串流切換的調適串流中(例如,在HTTP動態自適應性串流(DASH)上下文中),圖像速率之此波動可引起不需要之使用者體驗。對於CRA或BLA圖像,WD7規定應不存在按解碼次序先於CRA或BLA圖像且按輸出次序在CRA或BLA圖像之後的圖像。包括彼限制係出於一類似原因。
在一替代例中,與第一圖像相關聯之前置圖像(更特定言之,TFD圖像)經允許以將與一用於框間預測參考之第二圖像相關聯的DLP圖像用作STRP或LTRP,其中該第一圖像為CRA圖像,該第二圖像為CRA或BLA圖像,且該第二圖像及該第一圖像為兩個按解碼次序之連續RAP圖像,其中第一圖像按解碼次序在第二圖像之後。DLP圖像藉由前置圖像的此框間預測參考可藉由允許此等DLP圖像存在於此等前置圖像之參考圖像集中而實現,且可允許前置圖像之更靈活且更高效的寫碼。因此,CRA及BLA圖像之定義可經改變以允許此框間預測。
在一替代例中,與CRA或BLA圖像相關聯的TFD圖像與按解碼次
序及按輸出次序兩者皆在CRA或BLA圖像之後的圖像(亦即,CRA或BLA圖像之結尾圖像)的解碼次序交錯可被禁止。換言之,可需要與CRA或BLA圖像相關聯的任何TFD圖像按解碼次序先於CRA或BLA圖像之任何結尾圖像。
或者,與CRA或BLA圖像相關聯之前置圖像與按解碼次序及按輸出次序兩者皆在CRA或BLA圖像之後的圖像的解碼次序交錯可被禁止。換言之,可需要與CRA或BLA圖像相關聯的任何前置圖像按解碼次序先於按解碼次序及按輸出次序兩者皆在CRA或BLA圖像之後的任何圖像。
實施之以下實例提供上文描述之實例的另外細節。應理解實例實施中描述之各種技術可單獨或以任何組合方式來使用。
第一實例實施提供一用於試圖解決錯誤恢復問題並確信RPS偏差係自含式的(亦即,不取決於DPB狀態)且同時當自CRA圖像執行隨機存取時或當CRA圖像轉換至BLA圖像時係無問題的方法。在此第一實例實施中,經發信用於待包括於當前圖像之RPS中之特定LTRP的資訊為在當前圖像與LTRP之間(模式1)或在LTRP與按解碼次序之前一RAP圖像之間(模式2)的增量POC值。此第一實例實施亦與當前RPS發信及WD7之STRP的導出對準。編碼器(諸如視訊編碼器20)可選擇用於待被發信之每一LTRP的兩種模式中之一者,其將導致較少位元被使用。舉例而言,若LTRP按輸出/顯示次序距離比當前圖像更接近於按解碼次序之前一RAP,則視訊編碼器20可經組態以使用模式2。否則,視訊編碼器20可使用模式1。同樣,視訊解碼器30可接收描述待使用模式之語法資料,且使用由語法資料發信之模式。
為達成第一實例實施,可使用以下語法、語義及寫碼程序之相對於WD7的改變,其中下劃線的文字表示相對於WD7的改變。下文表5提供用於圖像參數集(PPS)之語法的實例集合。
在此第一實例實施中,如表5中所示,PPS語法包括一相對於WD7的額外語法元素poc_lt_idc。其他語法元素之語義可保持相同。在此實例中,poc_lt_idc可用以指示切片標頭中之delta_poc_lt_curr_pic_flag[i]的存在,且當delta_poc_lt_curr_pic_flag[i]未存在於切片標頭中時用以判定切片標頭中之delta_poc_lt_curr_pic_flag[i]的推斷值。在此實例中,若poc_lt_idc等於0或1,則delta_poc_lt_curr_pic_flag[i]不存在於切片標頭中且值經推斷為等於poc_lt_idc。在此實例中,當poc_lt_idc等於2時,delta_poc_lt_curr_pic_flag[i]係在切片標頭中發信。在此實例中,用於poc_lt_idc之值3留作將來使用。
表6提供根據第一實例實施之用於切片標頭之語法的實例集合。
在此實例中,切片標頭包括delta_poc_lt_curr_pic_flag[i]、delta_poc_lt_len[i]及(在一些狀況下)delta_poc_lt[i]之額外語法元素。下文針對此等語法元素描述語義之實例集合。其他語法元素之語義可保持與WD7中相同。
在此第一實例實施中,delta_poc_lt_curr_pic_flag[i]等於1可指定delta_poc_lt[i]表示當前圖像與第i個長期參考圖像之間的圖像次序計數差。delta_poc_lt_curr_pic_flag[i]等於0可指定delta_poc_lt[i]表示按解碼次序之前一RAP圖像與第i個長期參考圖像之間的圖像次序計數差。若(例如,表5之)poc_lt_idc等於0或1,則delta_poc_lt_curr_pic_flag[i]之值可經推斷為等於poc_lt_idc。
在此第一實例實施中,delta_poc_lt_len[i]可用以指定表示delta_poc_lt[i]的位元之數目。若delta_poc_lt_curr_pic_flag[i]等於0,則delta_poc_lt_len[i]之值可在0至24之範圍內(包括0及24)。否則(delta_poc_lt_curr_pic_flag[i]等於1),delta_poc_lt_len[i]之值可在1至24之範圍內(包括1及24)。
變數DeltaPocLtLen[i]可經如下導出:if(i==0) DeltaPocLtLen[i]=delta_poc_lt_len[i] else DeltaPocLtLen[i]=DeltaPocLtLen[i-1]+delta_poc_lt_len[i]
或者,delta_poc_lt_len[i]可改變成poc_lt_len[i],其經固定長度寫碼為(例如)u(N),其中N為5。在此狀況下,語義可為如下。poc_lt_len[i]可指定表示delta_poc_lt[i]的位元之數目。若delta_poc_lt_curr_pic_flag[i]等於0,則poc_lt_len[i]之值可在0至24之範圍內(包括0及24)。否則(delta_poc_lt_curr_pic_flag[i]等於1),poc_lt_len[i]之值可在1至24之範圍內(包括1及24)。變數
DeltaPocLtLen[i]可經設定為等於poc_lt_len[i]。
在此第一實例實施中,delta_poc_lt[i]可指定包括於當前圖像之長期參考圖像集中的第i個長期參考圖像之增量圖像次序計數值。delta_poc_lt[i]之長度可為DeltaPocLtLen[i]。
視訊解碼器30可經組態以根據此第一實例實施執行一用於參考圖像集之解碼程序如下。視訊編碼器20可在編碼視訊資料以產生參考圖像集的同時執行一類似程序。在解碼切片標頭之後但在解碼任一寫碼單元之前且在切片的參考圖像清單構造之解碼程序之前,視訊解碼器30可每一圖像一次地調用此解碼程序,如WD7之子條款8.3.3中指定。該程序可導致將一或多個參考圖像標記為「未用於參考」。來自WD7以「NOTE」開頭的引文應僅被認為直接自WD7得到的引文,且不應認為係本發明之技術所必需的。
NOTE 1-參考圖像集為用於當前及將來寫碼之圖像的解碼程序的參考圖像之絕對描述。參考圖像集發信在包括於參考圖像集中之所有參考圖像經明確地列出且解碼器中不存在取決於經解碼圖像緩衝器之狀態的預設參考圖像集構造程序之意義上是明確的。
參考圖像可藉由其PicOrderCntVal值來識別。
圖像次序計數值之五個清單可經構造以導出參考圖像集-分別具有元素之NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll數目的PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll。
若當前圖像為一為位元串流中之第一經寫碼圖像的CRA圖像、一IDR圖像或一BLA圖像,則PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll全部設定為空,且NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll可全部設定為0。
否則,以下可應用於導出圖像次序計數值的五個清單及條目之數目。
for(i=0,j=0,k=0;i<NumNegativePics[StRpsIdx];i++) if(UsedByCurrPicS0[StRpsIdx][i]) PocStCurrBefore[j++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] else PocStFoll[k++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] NumPocStCurrBefore=j
for(i=0,j=0;i<NumPositivePics[StRpsIdx];i++) if(UsedByCurrPicS1[StRpsIdx][i]) PocStCurrAfter[j++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] else PocStFoll[k++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] NumPocStCurrAfter=j NumPocStFoll=k (8-5)
for(i=0,j=0,k=0;i<num_long_term_pics;i++) if(used_by_curr_pic_lt_flag[i]){ if(delta_poc_lt_curr_pic_flag[i]) PocLtCurr[j]=PicOrderCntVal-delta_poc_lt[i] else PocLtCurr[j]=PrevRapPicPoc+delta_poc_lt[i] j++ } else{ if(delta_poc_lt_curr_pic_flag[i]) PocLtFoll[k]=PicOrderCntVal-delta_poc_lt[i] else PocLtFoll[k]=PrevRapPicPoc+delta_poc_lt[i] k++ } NumPocLtCurr=j NumPocLtFoll=k
其中PicOrderCntVal及PrevRapPicPoc分別為當前圖像及按解碼次序之前一RAP圖像的圖像次序計數值,如子條款8.2.1中所指定。
NOTE 2-範圍在0至num_short_term_ref_pic_sets-1內(包括0及num_short_term_ref_pic_sets-1)的StRpsIdx之值可指示來自作用中序列參數集之短期參考圖像集正被使用,其中StRpsIdx為至按在序列參數集中發信短期參考圖像集的次序之短期參考圖像集之清單的短期參考圖像集之索引。等於num_short_term_ref_pic_sets之StRpsIdx指示在切片標頭中明確發信之短期參考圖像集正被使用。
參考圖像集可包括參考圖像之五個清單-RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll。變數NumPocTotalCurr可經設定為等於NumPocStCurrBefore+NumPocStCurrAfter+NumPocLtCurr。當解碼P或B切片時,為了位元串流符合性,WD7需要NumPocTotalCurr之值應不等於0。
NOTE 3-RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr可含有可用於當前圖像之框間預測且可用於按解碼次序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。RefPicSetStFoll及RefPicSetLtFoll可包括未用於當前圖像之框間預測
但可用於按解碼次序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。
參考圖像之標記可為「未用於參考」、「用於短期參考」或「用於長期參考」,但在WD7中僅可為此等三者中之一者。當參考圖像稱作經標記為「用於參考」時,此共同地指代經標記為「用於短期參考」或「用於長期參考」(但在WD7中並非為兩者)的圖像。經標記為「用於短期參考」的參考圖像稱作短期參考圖像。經標記為「用於長期參考」的參考圖像稱作長期參考圖像。
根據以下定序步驟執行用於參考圖像集及圖像標記的導出程序,其中DPB指代如WD7之附錄C中描述之經解碼圖像緩衝器,其中(#-#)指代WD7之方程編號:
1.以下應用:for(i=0;i<NumPocLtCurr;i++){ if(DPB中存在一像素picX,其中PicOrderCntVal等於PocLtCurr[i]) RefPicSetLtCurr[i]=picX else RefPicSetLtCurr[i]=「無參考圖像」 } (8-6)
for(i=0;i<NumPocLtFoll;i++){ if(DPB中存在圖像picX,其中PicOrderCntVal等於PocLtFoll[i]) RefPicSetLtFoll[i]=picX else RefPicSetLtFoll[i]=「無參考圖像」 }
2.包括於RefPicSetLtCurr及RefPicSetLtFoll中之所有參考圖像經標記為「用於長期參考」
3.以下應用:for(i=0;i<NumPocstCurrBefore;i++) if(DPB中存在圖像picX,其中PicOrderCntVal等於PocStCurrBefore[i]) RefPicSetStCurrBefore[i]=picX else RefPicSetStCurrBefore[i]=「無參考圖像」
for(i=0;i<NumPocStCurrAfter;i++) if(DPB中存在圖像picX,其中PicOrderCntVal等於PocStCurrAfter[i]) RefPicSetStCurrAfter[i]=picX else RefPicSetStCurrAfter[i]=「無參考圖像」 (8-7)
for(i=0;i<NumPocStFoll;i++) if(DPB中存在picX,其中PicOrderCntVal等於PocStFoll[i]) RefPicSetStFoll[i]=picX else RefPicSetStFoll[i]=「無參考圖像」
4.包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll中的所有參考圖像經標記為「用於短期參考」。
經解碼圖像緩衝器中未包括於RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中之所有參考圖像可經標記為「未用於參考」。
NOTE 4-可存在包括於參考圖像集中但不存在於經解碼圖像緩衝器中的一或多個參考圖像。RefPicSetStFoll或RefPicSetLtFoll中之等於「無參考圖像」的條目應忽略。除非以下兩個條件中之任一者為真,否則對於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr中的等於「無參考圖像」之每一條目在WD7中應被推
斷為無意的圖像丟失:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為一與位元串流中的第一經寫碼圖像相關聯之TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經寫碼圖像為一與該BLA圖像相關聯之TFD圖像。
或者,WD7可需要(在上文中)DPB中之每一經識別picX應被標記為「用於參考」。或者,WD7可限制一標記為「未用於參考」之圖像應決不標記為「用於參考」。
或者,上述五個步驟可藉由以下而替代:
1.以下應用:for(i=0;i<NumPocLtCurr;i++){ if(DPB中存在具有等於PocLtCurr[i]之PicOrderCntVal並經標記為「用於參考」的圖像picX) RefPicSetLtCurr[i]=picX else RefPicSetLtCurr[i]=「無參考圖像」 } (8-6)
for(i=0;i<NumPocLtFoll;i++){ if(DPB中存在具有等於PocLtFoll[i]之PicOrderCntVal並經標記為「用於參考」的圖像picX) RefPicSetLtFoll[i]=picX else RefPicSetLtFoll[i]=「無參考圖像」 }
2.包括於RefPicSetLtCurr及RefPicSetLtFoll中之所有參考圖像經標記為「用於長期參考」
3.以下應用:
for(i=0;i<NumPocStCurrBefore;i++) if(DPB中存在具有等於PocStCurrBefore[i]之PicOrderCntVal並經標記為「用於參考」的圖像picX) RefPicSetStCurrBefore[i]=picX else RefPicSetStCurrBefore[i]=「無參考圖像」
for(i=0;i<NumPocStCurrAfter;i++) if(DPB中存在具有等於PocstCurrAfter[i]之PicOrderCntVal並經標記為「用於參考」的圖像picX) RefPicSetStCurrAfter[i]=picX else RefPicSetStCurrAfter[i]=「無參考圖像」 (8-7)
for(i=0;i<NumPocStFoll;i++) if(DPB中存在具有等於PocStFoll[i]之PicOrderCntVal並經標記為「用於參考」的picX) RefPicSetStFoll[i]=picX else RefPicSetStFoll[i]=「無參考圖像」
4. RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll中包括的所有參考圖像經標記為「用於短期參考」。
5.經解碼圖像緩衝器中未包括於RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中的所有參考圖像經標記為「未用於參考」。
NOTE 4-可存在包括於參考圖像集中但未存在於經寫碼圖像緩衝器中的一或多個參考圖像。RefPicSetStFoll或RefPicSetLtFoll中之等於「無參考圖像」的條目根據WD7應被忽略。除非以下兩個條件中
之任一者為真,否則對於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr中的等於「無參考圖像」之每一條目在WD7中應被推斷為無意的圖像丟失:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為一與位元串流中的第一經寫碼圖像相關聯之TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經寫碼圖像為一與該BLA圖像相關聯之TFD圖像。
或者,上述步驟之次序可變成3、4、1、2及5。
在一些實例中,為了位元串流符合性,WD7需要將參考圖像集限制如下:
- 應沒有包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr中的具有大於當前圖像之temporal_id的temporal_id的參考圖像。
- 在當前圖像為TLA圖像時,應沒有包括於參考圖像集中之具有大於或等於當前圖像之temporal_id的temporal_id的參考圖像。
- 應沒有包括於參考圖像集中之按輸出次序先於按解碼次序及輸出次序兩者皆先於當前圖像之任一RAP圖像的參考圖像。
- 除非以下條件中之任一者為真,否則RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetLtCurr中應沒有等於「無參考圖像」之條目:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為與位元串流中的第一經寫碼圖像相關聯之TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經解碼圖像為一與該BLA圖像相關聯之TFD圖像。
NOTE 5-參考圖像不可包括於五個參考圖像集清單中之一個以上者中。
在一些實例中,WD7規定上述限制可為如下:
- 應沒有包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetLtCurr中的具有大於當前圖像之temporal_id的temporal_id的參考圖像。
- 在當前圖像為TLA圖像時,應沒有包括於參考圖像集中之具有大於或等於當前圖像之temporal_id的temporal_id的參考圖像。
- 令prevRapPic為按解碼次序之前一RAP圖像。在當前圖像為RAP圖像或按輸出次序先於prevRapPic時,應沒有包括於參考圖像集中之按輸出次序先於按解碼次序及輸出次序兩者皆先於當前圖像之任一RAP圖像的參考圖像。
- 令prevRapPic為按解碼次序之前一RAP圖像。在當前圖像並非RAP圖像且按輸出次序在prevRapPic之後時,應沒有包括於參考圖像集中之按解碼次序先於prevRapPic的參考圖像,且應沒有包括於參考圖像集中之為TFD圖像的參考圖像。
- 除非以下條件中之任一者為真,否則RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetLtCurr中應沒有等於「無參考圖像」之條目:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為與位元串流中的第一經寫碼圖像相關聯之TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經解碼圖像為一與該BLA圖像相關聯之TFD圖像。
NOTE 5-根據WD7,參考圖像不可包括於五個參考圖像集清單中之一個以上者中。
基於HEVC WD7中之語法結構的第二實例實施包括一用以總是發信LTRP之MSB循環並移除delta_poc_msb_present_flag[i]語法元素的方法。再次,應理解第一實例實施及第二實例實施之各種技術可以任一組合方式組合。視訊編碼器20及視訊解碼器30可經組態以單獨地或以與上文論述之第一實例實施之一或多個技術的任一組合之方式執行
此第二實例實施之技術中的任一者或全部。下文表7提供根據此第二實例實施之用於切片標頭的語法之實例集合。
在表7之實例切片標頭語法中,相對於WD7添加語法元素delta_poc_msb_cycle_lt[i]。除非另有規定,否則此語法元素之語義可如下文所描述,而其他語法元素之語義可保持與WD7中相同。在此第二實例實施中,delta_poc_msb_cycle_lt[i]可用以判定包括於當前圖像之長期參考圖像集中的第i個長期參考圖像之圖像次序計數值的最高有效位元之值。
在此第二實例實施中,變數DeltaPocMSBCycleLt[i]可經如下導出,其中(#-#)指代WD7之方程編號且下劃線的文字表示相對於WD7的改變:if(i==0) DeltaPocMSBCycleLt[i]=delta_poc_msb_cycle_lt[i]; else (7-37) DeltaPocMSBCycleLt[i]=delta_poc_msb_cycle_lt[i]+DeltaPocMSBCycleLt[i-1];
視訊解碼器30可執行用於參考圖像集之以下解碼程序。視訊編
碼器20可經組態以在編碼視訊資料以產生參考圖像集的同時執行實質上類似之程序。在解碼切片標頭之後但在解碼任一寫碼單元之前且在切片之參考圖像清單構造的解碼程序之前,每一圖像一次地調用此程序,如WD7之子條款8.3.3中指定。該程序可導致將一或多個參考圖像標記為「未用於參考」。
NOTE 1-參考圖像集為用於當前及將來經寫碼圖像之解碼程序的參考圖像的絕對描述。參考圖像集發信在包括於參考圖像集中之所有參考圖像經明確地列出且解碼器中不存在取決於經解碼圖像緩衝器之狀態的預設參考圖像集構造程序意義上是明確的。
在此第二實例實施中,參考圖像藉由其PicOrderCntVal值來識別。
圖像次序計數值之五個清單可經構造以導出參考圖像集-分別具有元素之NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll數目的PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll。
- 若當前圖像為一為位元串流中之第一經寫碼圖像的CRA圖像、一IDR圖像或一BLA圖像,則PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll全部設定為空,且NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll全部設定為0。
- 否則,以下應用於導出圖像次序計數值的五個清單及條目之數目。
for(i=0,j=0,k=0;i<NumNegativePics[StRpsIdx];i++) if(UsedByCurrPicS0[StRpsIdx][i]) PocStCurrBefore[j++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] else
PocStFoll[k++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] NumPocStCurrBefore=j
for(i=0,j=0;i<NumPositivePics[StRpsIdx];i++) if(UsedByCurrPicS1[StRpsIdx][i]) PocStCurrAfter[j++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] else PocStFoll[k++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] NumPocStCurrAfter=j NumPocStFoll=k (8-5)
for(i=0,j=0,k=0;i<num_long_term_pics;i++) if(used_by_curr_pic_lt_flag[i]) PocLtCurr[j++]=PicOrderCntVal-DeltaPocMSBCycleLt[i]* MaxPicOrderCntLsb- pic_order_cnt_lsb+poc_lsb_lt[i] else PocLtFoll[k++]=PicOrderCntVal-DeltaPocMSBCycleLt[i]* MaxPicOrderCntLsb- pic_order_cnt_lsb+poc_lsb_lt[i] NumPocLtCurr=j NumPocLtFoll=k
其中PicOrderCntVal為當前圖像之圖像次序計數,如WD7之子條款8.2.1中所指定。
NOTE 2-範圍在0至num_short_term_ref_pic_sets-1內(包括0及num_short_term_ref_pic_sets-1)的StRpsIdx之值在此實例中指
示來自作用中序列參數集之短期參考圖像集正被使用,其中StRpsIdx為至按在序列參數集中發信短期參考圖像集的次序之短期參考圖像集之清單的短期參考圖像集之索引。等於num_short_term_ref_pic_sets之StRpsIdx指示在切片標頭中明確發信之短期參考圖像集正被使用。
參考圖像集可包括參考圖像之五個清單-RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll。變數NumPocTotalCurr可經設定為等於NumPocStCurrBefore+NumPocStCurrAfter+NumPocLtCurr。當解碼P或B切片時,為了位元串流符合性,WD7需要NumPocTotalCurr之值應不等於0。
NOTE 3-RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr可含有可用於當前圖像之框間預測且可用於按解碼次序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。RefPicSetStFoll及RefPicSetLtFoll可包括未用於當前圖像之框間預測但可用於按解碼次序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。
參考圖像之標記可為「未用於參考」、「用於短期參考」或「用於長期參考」,但在WD7中僅可為此等三者中之一者。當參考圖像稱作經標記為「用於參考」時,此共同地指代經標記為「用於短期參考」或「用於長期參考」(但在WD7中並非為兩者)的圖像。經標記為「用於短期參考」的參考圖像稱作短期參考圖像。經標記為「用於長期參考」的參考圖像稱作長期參考圖像。
對於第二實例實施,可以與第一實例實施中相同之方式來執行用於參考圖像集及圖像標記之導出程序。
第三實例實施提供一簡化LTRP發信方法,以及一按解碼次序在CRA或BLA圖像之後的圖像經禁止將按解碼次序先於CRA或BLA圖像
之圖像用作LTRP的限制。因此,前置圖像經禁止將按解碼次序先於相關聯之CRA或BLA圖像的圖像參照為LTRP。對於非TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,該具有最小POC之圖像未標記為TFD且按解碼次序先於當前圖像並按解碼次序在按解碼次序之前一RAP圖像之後(包括按解碼次序之前一RAP圖像在內)。
對於TFD圖像,發信LTRP LSB所需的位元之數目可藉由具有最小POC之圖像來判定,具有最小POC之圖像按解碼次序先於當前圖像並按解碼次序在按解碼次序之前一RAP圖像之後(包括按解碼次序之前一RAP圖像在內)。語法結構係基於2012年4月27日至5月7日,瑞士日內瓦,JCTVC第9次會議,Wang等人之名為「On Reference Picture Set」的稿件JCTVC-I0342,自2013年2月5日起,該稿件可自http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I0342-v1.zip得到,該稿件以引用之方式併入本文中,其中LTRP LSB之長度經發信,繼之以LSB位元自身。語義及參考圖像集之解碼程序相對於HEVC WD7的變化下文在此第三實例實施之描述中加上下劃線。此外,應理解第三實例實施之技術可以任一組合方式與第一及/或第二實例實施之技術組合。
表8提供根據此第三實例實施之用於切片標頭的語法之實例集合。
在表8之實例中,切片標頭包括額外語法元素poe_lsb_len_delta[i]及poc_lsb_lt[i]。下文描述用於此等語法元素之語義,且下文亦描述相對於WD7改變的某些語法元素之語義。除非另外規定,否則其他語法元素之語義可保持與WD7中相同。
在表8之實例中,poc_lsb_len_delta[i]可用以指定表示poc_lsb_lt[i]的位元之數目。
令CurrPicOrderCntVal為當前圖像之PicOrderCntVal。變數PrevLtRefPicPoc及PrevLtRefPicPocForTFD經如下導出。
if(RapPicFlag ∥((CurrPicOrderCntVal<PrevLtRefPicPoc)&&(nal_unit_type!=2))) PrevLtRefPicPoc=CurrPicOrderCntVal
if(RapPicFlag ∥(CurrPicOrderCntVal<PrevLtRefPicPoc)) PrevLtRefPicPocForTFD=CurrPicOrderCntVal
變數MaxPocLsbLtLen可經如下導出。
if(nal_unit_type==2) MaxPocLsbLtLen=Log2(Ceil(CurrPicOrderCntVal-PrevLtRefPicPocForTFD)) else MaxPocLsbLtLen=Log2(Ceil(CurrPicOrderCntVal-PrevLtRefPicPoc))
變數PocLsbLtLen[i]可經設定為等於MaxPocLsbLtLen。
或者,變數variable PocLsbLtLen[i]可經如下導出。
if(i==0) PocLsbLtLen[i]=log2_max_pic_order_cnt_lsb_minus4+4+
poc_lsb_len_delta[i] else PocLsbLtLen[i]=PocLsbLtLen[i-1]+poc_lsb_len_delta[i]
PocLsbLtLen[i]之值可在log2_max_pic_order_cnt_lsb_minus4+4至MaxPocLsbLtLen之範圍內。
或者,語法元素無需經發信,且變數PocLsbLtLen[i]可經設定為等於MaxPocLsbLtLen。
在表8之實例中,poc_lsb_lt[i]可指定包括於當前圖像之長期參考圖像集中的第i個長期參考圖像之圖像次序計數值的最低有效位元。poc_lsb_lt[i]應在0至(1<<PocLsbLtLen[i])-1的範圍內(包括0及(1<<PocLsbLtLen[i])-1)。poc_lsb_lt[i]之長度為PocLsbLtLen[i]。
視訊解碼器30可根據此第三實例實施執行以下用於參考圖像集之解碼程序。視訊編碼器20可經組態以在編碼視訊資料以產生參考圖像集的同時執行實質上類似之程序。在解碼切片標頭之後但在解碼任何寫碼單元之前且在切片之參考圖像清單構造的解碼程序之前,可每一圖像一次地調用此程序,如WD7之子條款8.3.3中指定。該程序可導致將一或多個參考圖像標記為「未用於參考」。
NOTE 1-參考圖像集可為用於當前及將來經寫碼圖像之解碼程序的參考圖像的絕對描述。參考圖像集發信可在包括於參考圖像集中之所有參考圖像經明確地列出且解碼器中不存在取決於經解碼圖像緩衝器之狀態的預設參考圖像集構造程序意義上是明確的。
短期參考圖像可由其PicOrderCntVal值來識別。長期參考圖像可由其PicOrderCntVal值之最低有效位元來識別。
圖像次序計數值的五個清單或圖像次序計數值之最低有效位元可經構造以導出參考圖像集-分別具有元素之NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll
數目的PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll。
- 若當前圖像為一為位元串流中之第一經寫碼圖像的CRA圖像、一IDR圖像或一BLA圖像,則PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll可全部設定為空,且NumPocStCurrBefore、NumPocStCurrAftcr、NumPoeStFoll、NumPocLtCurr及NumPocLtFoll可全部設定為0。
- 否則,以下可應用於導出圖像次序計數值的五個清單及條目之數目。
for(i=0,j=0,k=0;i<NumNegativePics[StRpsIdx];i++) if(UsedByCurrPicS0[StRpsIdx][i]) PocStCurrBefore[j++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] else PocStFoll[k++]=PicOrderCntVal+DeltaPocS0[StRpsIdx][i] NumPocStCurrBefore=j
for(i=0,j=0;i<NumPositivePics[StRpsIdx];i++) if(UsedByCurrPicS1[StRpsIdx][i]) PocStCurrAfter[j++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] else PocStFoll[k++]=PicOrderCntVal+DeltaPocS1[StRpsIdx][i] NumPocStCurrAfter=j NumPocStFoll=k (8-5)
for(i=0,j=0,k=0;i<num_long_term_pics;i++) if(used_by_curr_pic_lt_flag[i]){ PocLtCurr[j]=poc_lsb_lt[i] PocLsbLenCurr[j]=PocLsbLtLen[i] j++ } else{ PocLtFoll[k]=poc_lsb_lt[i] PocLsbLenFoll[k]=PocLsbLtLen[i] k++ } NumPocLtCurr=j NumPocLtFoll=k
其中PicOrderCntVal為當前圖像之圖像次序計數,如WD7之子條款8.2.1中指定。
NOTE 2-範圍在0至num_short_term_ref_pic_sets-1內(包括0及num_short_term_ref_pic_sets-1)的StRpsIdx之值可指示來自作用中序列參數集之短期參考圖像集正被使用,其中StRpsIdx為至按在序列參數集中發信短期參考圖像集的次序之短期參考圖像集之清單的短期參考圖像集之索引。等於num_short_term_ref_pic_sets之StRpsIdx可指示在切片標頭中明確發信之短期參考圖像集正被使用。
參考圖像集可包括參考圖像之五個清單-RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetStFoll、RefPicSetLtCurr及RefPicSetLtFoll。變數NumPocTotalCurr經設定為等於NumPocStCurrBefore+NumPocStCurrAfter+NumPocLtCurr。當解碼P或B切片時,為了位元串流符合性,WD7需要NumPocTotalCurr之值應不等於0。
NOTE 3-RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr可含有可用於當前圖像之框間預測且可用於按解碼次
序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。RefPicSetStFoll及RefPicSetLtFoll可包括未用於當前圖像之框間預測但可用於按解碼次序在當前圖像之後的一或多個圖像之框間預測的所有參考圖像。
參考圖像之標記可為「未用於參考」、「用於短期參考」或「用於長期參考」,但在WD7中僅可為此等三者中之一者。當參考圖像稱作經標記為「用於參考」時,此共同地指代經標記為「用於短期參考」或「用於長期參考」(但在WD7中並非為兩者)的圖像。經標記為「用於短期參考」的參考圖像稱作短期參考圖像。經標記為「用於長期參考」的參考圖像稱作長期參考圖像。
根據以下定序步驟執行用於參考圖像集及圖像標記的導出程序,其中DPB指代如WD7之附錄C中描述之經解碼圖像緩衝器:
1.以下應用:for(i=0;i<NumPocLtCurr;i++){ if(DPB中存在長期參考圖像picX 具有GetLSB(PicOrderCntVal,PocLsbLenCurr[i])等於PocLtCurr[i]的PicOrderCntVal) RefPicSetLtCurr[i]=picX else if(DPB中存在短期參考圖像picY 具有GetLSB(PicOrderCntVal,PocLsbLenCurr[i])等於PocLtCurr[i]之PicOrderCntVal) RefPicSetLtCurr[i]=picY else RefPicSetLtCurr[i]=「無參考圖像」 } (8-6)
for(i=0;i<NumPocLtFoll;i++){
if(DPB中存在長期參考圖像picX 具有GetLSB(PicOrderCntVal,PocLsbLenFoll[i])等於PocLtFoll[i]之PicOrderCntVal) RefPicSetLtFoll[i]=picX else if(DPB中存在短期參考圖像picY 具有GetLSB(PicOrderCntVal,PocLsbLenFoll[i])等於PocLtFoll[i]之PicOrderCntVal) RefPicSetLtFoll[i]=picY else RefPicSetLtFoll[i]=「無參考圖像」 }
2.包括於RefPicSetLtCurr及RefPicSetLtFoll中之所有參考圖像經標記為「用於長期參考」
3.以下應用:for(i=0;i<NumPocStCurrBefore;i++) if(DPB中存在短期參考圖像picX 其中PicOrderCntVal等於PocStCurrBefore[i]) RefPicSetStCurrBefore[i]=picX else RefPicSetStCurrBefore[i]=「無參考圖像」
for(i=0;i<NumPocStCurrAfter;i++) if(DPB中存在短期參考圖像picX 其中PicOrderCntVal等於PocStCurrAfter[i]) RefPicSetStCurrAfter[i]=picX else
RefPicSetStCurrAfter[i]=「無參考圖像」 (8-7)
for(i=0;i<NumPocStFoll;i++) if(DPB中存在短期參考圖像picX 其中PicOrderCntVal等於PocStFoll[i]) RefPicSetStFoll[i]=picX else RefPicSetStFoll[i]=「無參考圖像」
4.包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll中的所有參考圖像經標記為「用於短期參考」。
5.經解碼圖像緩衝器中之未包括於RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中的所有參考圖像經標記為「未用於參考」。
NOTE 4-可存在包括於參考圖像集中但未存在於經解碼圖像緩衝器中之一或多個參考圖像。RefPicSetStFoll或RefPicSetLtFoll中之等於「無參考圖像」的條目根據WD7應忽略。除非以下兩個條件中之任一者為真,否則針對RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr中之等於「無參考圖像」的每一條目可被推斷為無意的圖像丟失:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為與位元串流中之第一經寫碼圖像相關聯的TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經寫碼圖像為一與該BLA圖像相關聯之TFD圖像。
為了位元串流符合性,WD7需要參考圖像集經限制如下,如由此第三實例實施而修訂:
- 應沒有包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr中的具有大於當前圖像之temporal_id的temporal_id的
參考圖像。
- 在當前圖像為TLA圖像時,應沒有包括於參考圖像集中之具有大於或等於當前圖像之temporal_id的temporal_id的參考圖像。
- 應沒有包括於參考圖像集中之按輸出次序先於按解碼次序及輸出次序兩者皆先於當前圖像之任一RAP圖像的參考圖像。
- 除非以下條件中之任一者為真,否則應沒有RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetLtCurr中之等於「無參考圖像」的條目:a)位元串流中之第一經寫碼圖像為CRA圖像且當前經寫碼圖像為與位元串流中的第一經寫碼圖像相關聯之TFD圖像;b)按解碼次序先於當前經寫碼圖像之前一RAP圖像為一BLA圖像且當前經寫碼圖像為一與該BLA圖像相關聯之TFD圖像。
NOTE 5-參考圖像不可包括於五個參考圖像集清單中之一個以上者中。
- 對於在0至NumPocLtCurr-1之範圍內(包括0及NumPocLtCurr-1)的i之每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenCurr[i])等於PocLtCurr[i]之PicOrderCntVal的一個以上參考圖像。對於在0至NumPocLtFoll-1範圍內(包括0及NumPocLtFoll-1)之i的每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenFoll[i])等於PocLtFoll[i]之PicOrderCntVal的一個以上參考圖像。
- 令prevRapPic為按解碼次序之前一RAP圖像。在當前圖像為RAP圖像或按輸出次序先於prevRapPic時,應沒有包括於RefPicSetLtCurr或RefPicSetLtFoll中之按解碼次序先於prevRapPic
的參考圖像。
第四實例實施提供一基於上文論述之第三實例實施中之語法結構的LTRP發信方法,其中LTRP LSB之長度經發信,繼之以LSB位元自身。在此第四實例實施中移除對前置圖像不指代在相關聯RAP前之圖像的限制。與RAP圖像相關聯之TFD圖像經禁止按解碼次序在與此第四實例實施中的同一RAP圖像相關聯之任何DLP圖像之後。對於非TFD圖像,發信LTRP LSB所需之位元的數目可藉由具有最小POC之圖像來判定,最小POC之圖像未經標記為TFD圖像且按解碼次序先於當前圖像並按解碼次序在按解碼次序之前一RAP圖像之後(包括按解碼次序之前一RAP圖像在內)。對於TFD圖像,發信LTRP LSB所需之位元的數目可藉由具有最小POC之圖像來判定,最小POC之圖像按解碼次序先於當前圖像並按輸出次序在按解碼次序在前一RAP圖像之前的RAP之後(包括按解碼次序在前一RAP圖像之前的RAP在內)。下文僅呈現對來自第三實例實施之語義及RPS導出程序的改變。應理解第四實例實施之技術可以任一組合方式與第一、第二及/或第三實例實施之技術中的任一者組合。下劃線的文字表示相對於上文描述之第三實例實施的變化。
在此第四實例實施中,poc_lsb_len_delta[i]可用以指定表示poc_lsb_lt[i]的位元之數目。
令CurrPicOrderCntVal為當前圖像之PicOrderCntVal。令PrevRapPicPoc為按解碼次序先於當前圖像的RAP圖像之PicOrderCntVal。變數PrevPrevLtRefPicPoc及PrevLtRefPicPoc經如下導出。
if(RapPicFlag) PrevPrevLtRefPicPoc=PrevRapPicPoc
if(RapPicFlag ∥((CurrPicOrderCntVal<PrevLtRefPicPoc)&&
(nal_unit_type!=2))) PrevLtRefPicPoc-CurrPicOrderCntVal
變數MaxPocLsbLtLen可經如下導出。
if((nal_unit_type==4)∥(nal_unit_type==5)∥(nal_unit_type==2)) MaxPocLsbLtLen=Log2(Ceil(CurrPicOrderCntVal-PrevPrevLtRefPicPoc)) else MaxPocLsbLtLen=Log2(Ceil(CurrPicOrderCntVal-PrevLtRefPicPoc))
用於PocLsbLtLen[i]之導出程序可以與如上文描述之第三實例實施中相同的方式來執行。
視訊解碼器30可執行以下用於參考圖像集之解碼程序。視訊編碼器20可經組態以在編碼視訊資料以產生參考圖像集的同時執行一實質上類似之程序。在解碼切片標頭之後但在解碼任一寫碼單元之前且在切片的參考圖像清單構造之解碼程序之前,可每一圖像一次地調用此程序,如WD7之子條款8.3.3中指定。該程序可導致將一或多個參考圖像標記為「未用於參考」。
NOTE 1-參考圖像集可為用於當前及將來經寫碼圖像之解碼程序的參考圖像的絕對描述。參考圖像集發信係在包括於參考圖像集中之所有參考圖像經明確地列出且解碼器中不存在取決於經解碼圖像緩衝器之狀態的預設參考圖像集構造程序意義上是明確的。
在此第四實例實施中,參考圖像係由其PicOrderCntVal值來識別。
圖像次序計數值之五個清單可經構造以導出參考圖像集-分別具有元素之NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、
NumPocLtCurr及NumPocLtFoll數目的PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll。
下文省略號表示本文可保持與第三實例實施中及/或WD7之當前版本中相同:
- 若當前圖像為一為位元串流中之第一經寫碼圖像的CRA圖像、一IDR圖像或一BLA圖像,則PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll全部設定為空,且NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll全部設定為0。
- …
- 對於在範圍0至NumPocLtCurr-1內(包括0及NumPocLtCurr-1)的i之每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenCurr[i])等於PocLtCurr[i]之PicOrderCntVal的一個以上參考圖像。對於在範圍0至NumPocLtFoll-1內(包括0及NumPocLtFoll-1)的i之每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenFoll[i])等於PocLtFoll[i]之PicOrderCntVal的一個以上參考圖像。
- 與CRA或BLA圖像相關聯之任一TFD圖像應先於未標記為TFD、按輸出次序先於CRA或BLA圖像並按解碼次序在CRA或BLA圖像之後的任一圖像。
第五實例實施大體上亦基於第三實例實施。此第五實例實施揭示一禁止與CRA或BLA圖像相關聯之前置圖像將相關聯之CRA或BLA圖像或與相同CRA或BLA圖像相關聯之其他前置圖像參照為LTRP的方法。在此第五實例實施中移除在第三實例實施中對前置圖像不將在
相關聯RAP之前的圖像參照為LTRP的限制。發信LTRP LSB所需之位元的數目在此第五實例實施中可藉由按輸出次序先於當前圖像的RAP圖像來判定。此外,應理解此第五實例實施之技術可以任一組合方式與第一、第二、第三及/或第四實例實施之技術中之任一者組合。
在此第五實例實施中,第三實例實施之切片標頭語義可如下文下劃線的文字所指示而改變:令CurrPicOrderCntVal為當前圖像之PicOrderCntVal。令PrevRapPicPoc為按輸出次序先於當前圖像的RAP圖像之PicOrderCntVal。
變數MaxPocLsbLtLen可經如下導出。
MaxPocLsbLtLen=Log2(Ceil(CurrPicOrderCntVal-PrevRapPicPoc))
用於PocLsbLtLen[i]之導出程序可以與第三實例實施中相同之方式來執行。
視訊解碼器30可執行以下用於參考圖像集之解碼程序。視訊編碼器20可經組態以在編碼視訊資料以產生參考圖像集的同時執行一實質上類似之程序。在解碼切片標頭之後但在解碼任一寫碼單元之前且在切片的參考圖像清單構造之解碼程序之前,可每一圖像一次地調用此程序,如WD7之子條款8.3.3中指定。該程序可導致將一或多個參考圖像標記為「未用於參考」。
NOTE 1-參考圖像集可為用於當前及將來經寫碼圖像之解碼程序的參考圖像的絕對描述。參考圖像集發信係在包括於參考圖像集中之所有參考圖像經明確地列出且解碼器中不存在取決於經解碼圖像緩衝器之狀態的預設參考圖像集構造程序意義上是明確的。
在此第五實例實施中,參考圖像係由其PicOrderCntVal值來識別。
圖像次序計數值之五個清單可經構造以導出參考圖像集-分別具
有元素之NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll數目的PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll。
下文省略號表示本文可保持與第三實例實施中及/或WD7之當前版本中相同:
- 若當前圖像為一為位元串流中之第一經寫碼圖像的CRA圖像、一IDR圖像或一BLA圖像,則PocStCurrBefore、PocStCurrAfter、PocStFoll、PocLtCurr及PocLtFoll全部設定為空,且NumPocStCurrBefore、NumPocStCurrAfter、NumPocStFoll、NumPocLtCurr及NumPocLtFoll全部設定為0。
- …
- 對於在範圍0至NumPocLtCurr-1內(包括0及NumPocLtCurr-1)的i之每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenCurr[i])等於PocLtCurr[i]之PicOrderCntVal的一個以上參考圖像。對於在範圍0至NumPocLtFoll-1內(包括0及NumPocLtFoll-1)的i之每一值,DPB中應沒有未包括於RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中且具有GetLSB(PicOrderCntVal,PocLsbLenFoll[i])等於PocLtFoll[i]之PicOrderCntVal的一個以上參考圖像。
- 令prevRapPic為按解碼次序之前一RAP圖像。在當前圖像按輸出次序先於prevRapPic時,應沒有包括於RefPicSetLtCurr或RefPicSetLtFoll中的參考圖像,其為prevRapPic或按輸出次序先於prevRapPic但按解碼次序在prevRapPic之後的任一圖像。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器或解碼器電路中之任一者(在適用時),諸如,一或多個微處理器、數位
信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為組合式視訊編碼器/解碼器(CODEC)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含積體電路、微處理器及/或無線通信器件(諸如,蜂巢式電話)。
圖2為說明可實施用於在切片標頭中發信長期參考圖像之技術的視訊編碼器20之實例的方塊圖。視訊編碼器20可執行視訊切片內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之寫碼模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指代若干基於時間之寫碼模式中的任一者。
如圖2中所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測處理單元46及分割單元48。對於視訊區塊重構,視訊編碼器20亦包括逆量化單元58、逆變換處理單元60及求和器62。解區塊濾波器(圖2中未展示)亦可經包括以濾波區塊邊界以自重構之視訊移除方塊效應假影。若需要,則解區塊濾波器通常將濾波求和器62之輸出。除解區塊濾波器外,亦可使用額外濾波器(迴路內或迴路後)。為簡潔起見未展示此等濾波器,但此等濾波器必要時可對求和器50之輸出進行濾波(作為迴路內濾波器)。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或切
片。可將該圖框或切片劃分成多個視訊區塊。運動估計單元42及運動補償單元44相對於一或多個參考圖框中之一或多個區塊來執行經接收視訊區塊之框間預測性寫碼,以提供時間預測。框內預測處理單元46可替代地相對於與待被寫碼之區塊相同的圖框或切片中之一或多個相鄰區塊執行經接收視訊區塊的框內預測寫碼以提供空間預測。視訊編碼器20可執行多個寫碼遍次(例如)以選擇用於視訊資料之每一區塊之適當寫碼模式。
此外,分割單元48可基於先前寫碼遍次中之先前分割方案之評估而將視訊資料之區塊分割成若干子區塊。舉例而言,分割單元48可初始地將一圖框或切片分割成LCU,且基於位元率-失真分析(例如,位元率-失真最佳化)來將該等LCU中之每一者分割成子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割的四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可選擇寫碼模式(框內或框間)中之一者(例如,基於誤差結果),且將所得的經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62,以重建構經編碼之區塊以便用作參考圖框。模式選擇單元40亦將語法元素(諸如運動向量、框內模式指示符、分割資訊及其他此語法資訊)提供至熵編碼單元56。
運動估計單元42及運動補償單元44可高度整合,但為概念目的而分別說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示在一當前視訊圖框或圖像內之一視訊區塊的一PU相對於在一參考圖框(或其他經寫碼單元)內的一預測性區塊(其關於在該當前圖框(或其他經寫碼單元)內正經寫碼的當前區塊)之位移。預測性區塊為被發現在像素差方面緊密地匹配於待寫碼區塊之區塊,該像素差可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度予以判定。在一些實例中,視
訊編碼器20可計算儲存於參考圖像記憶體64中之參考圖像之次整數像素位置的值。舉例而言,視訊編碼器20可計算參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置之值。因此,運動估計單元42可執行相對於全像素位置及分率像素位置之運動搜尋,且以分率像素精度輸出運動向量。
運動估計單元42藉由比較框間寫碼切片中之視訊區塊的PU之位置與參考圖像之預測性區塊之位置而計算該PU之運動向量。參考圖像可自第一參考圖像清單(清單0)或第二參考圖像清單(清單1)選擇,該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將經計算運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及到基於由運動估計單元42所判定之運動向量來提取或產生該預測性區塊。再次,在一些實例中,運動估計單元42及運動補償單元44可在功能上整合。在接收到當前視訊區塊之PU之運動向量後,運動補償單元44可將運動向量所指向的預測性區塊定位於參考圖像清單中之一者中。求和器50藉由自正被寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值,如下文所論述。一般而言,運動估計單元42相對於明度分量而執行運動估計,且運動補償單元44將基於該等明度分量所計算之運動向量用於色度分量與明度分量兩者。模式選擇單元40亦可產生與視訊區塊及視訊切片相關聯的語法元素以供視訊解碼器30用於解碼視訊切片之視訊區塊。
當自參考圖像記憶體64中選擇參考圖像時,模式選擇單元40可實施本發明之限制。舉例而言,模式選擇單元40可判定特定圖像是否在一經選擇為RAP之圖像之後。若是,則模式選擇單元40可判定該圖像是否為一前置圖像並按輸出次序在一與同一RAP相關聯之DLP圖像
之後。若是,則模式選擇單元40選擇用於該圖像之編碼模式,使得該圖像被視為一DLP圖像。亦即,模式選擇單元40確保當前圖像並非自先於RAP之任何圖像或任何相關聯之TFD圖像而預測,且因此所有TFD圖像按輸出次序先於所有DLP圖像。換言之,若一可能另外經寫碼為TFD圖像之圖像按寫碼次序在另一DLP圖像之後,則該圖像經寫碼為DLP圖像。類似地,模式選擇單元40可選擇寫碼模式以確保所有前置圖像按解碼次序先於RAP之所有結尾圖像。
如上文所描述,作為由運動估計單元42及運動補償單元44執行之框間預測的替代例,框內預測單元46可對當前區塊進行框內預測。詳言之,框內預測處理單元46可判定一用以編碼當前區塊之框內預測模式。在一些實例中,框內預測處理單元46可(例如)在單獨編碼遍次期間使用各種框內預測模式編碼當前區塊,且框內預測處理單元46(或在一些實例中,模式選擇單元40)可自經測試模式選擇將使用的適當框內預測模式。
舉例而言,框內預測處理單元46可使用對各種經測試之框內預測模式之位元率-失真分析而計算位元率-失真值,且在經測試模式當中選擇具有最佳位元率-失真特性之框內預測模式。位元率-失真分析一般判定經編碼區塊與原始未經編碼區塊之間的失真(或誤差)之量以及用以產生經編碼區塊之位元率(亦即,位元數目),該原始未經編碼區塊經編碼以產生該經編碼區塊。框內預測處理單元46可自失真及位元率計算各種經編碼區塊之比率以判定哪一框內預測模式展現區塊之最佳位元率-失真值。
在選擇一框內預測模式用於一區塊後,框內預測處理單元46可將指示用於該區塊之選定框內預測模式的資訊提供至熵編碼單元56。熵編碼單元56可編碼指示選定框內預測模式之資訊。視訊編碼器20可在經傳輸之位元串流組態資料中包括各種區塊之編碼上下文之定義及
將用於該等上下文中之每一者之最有可能的框內預測模式、框內預測模式索引表及經修改之框內預測模式索引表的指示,該位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改之框內預測模式索引表(亦被稱作碼字映射表)。
視訊編碼器20藉由自正被寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成一殘餘視訊區塊。求和器50表示執行此減法運算之一或多個組件。變換處理單元52將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如頻域)。變換處理單元52可將所得的變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減少位元率。該量化程序可減少與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行掃描。
在量化後,熵編碼單元56熵寫碼經量化之變換係數。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼之狀況下,上下文可基於相鄰區塊。在藉由熵編碼單元56進行之熵寫碼之後,可將經編碼之位元串流傳輸至另一器件(例如,視訊解碼器30)或經封存以供稍後傳輸或擷取。
逆量化單元58及逆變換處理單元60分別應用逆量化及逆變換以在像素域中重構殘餘區塊(例如)以供稍後用作參考區塊。運動補償單
元44可藉由將該殘餘區塊添加至參考圖框記憶體64之圖框中之一者的一預測性區塊來計算一參考區塊。運動補償單元44亦可對該經重構的殘餘區塊應用一或多個插值濾波器以計算用於在運動估計中使用之次整數像素值。求和器62將該經重構的殘餘區塊添加至由運動補償單元44產生之經運動補償的預測區塊以產生一經重構的視訊區塊以用於儲存於參考圖框記憶體64中。該經重構的視訊區塊可由運動估計單元42及運動補償單元44用作一參考區塊以框間寫碼在後續視訊圖框中之區塊。
圖2之視訊編碼器20表示可經組態以執行本發明之技術中之任一者的視訊編碼器之實例。舉例而言,視訊編碼器20可經組態以寫碼一RAP圖像並寫碼該RAP圖像之一或多個可解碼前置圖像,使得所有經標記為捨棄之圖像按顯示次序先於與RAP圖像相關聯之DLP。DLP可包括具有早於RAP圖像之顯示次序值之顯示次序值且不指代按解碼次序早於RAP圖像之視訊資料的一或多個圖像。視訊編碼器20亦可相對於RAP圖像寫碼一或多個前置圖像,使得RAP圖像之所有前置圖像按解碼次序先於RAP圖像之所有結尾圖像,其中結尾圖像包括具有大於RAP圖像之顯示次序值之顯示次序值的圖像。RAP圖像可包括(例如)CRA圖像及BLA圖像中之一者。按解碼次序先於CRA或BLA圖像之任一圖像可按顯示次序先於與CRA圖像或BLA圖像相關聯之任一DLP圖像。視訊編碼器20亦可寫碼與RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按顯示次序值先於RAP圖像且按解碼次序在RAP圖像之後,且視訊編碼器20可寫碼與RAP圖像相關聯之一或多個結尾圖像,使得所有前置圖像按解碼次序先於所有結尾圖像,其中結尾圖像按顯示次序值及按解碼次序兩者皆在RAP圖像之後。
視訊編碼器20亦可寫碼與RAP圖像相關聯之一或多個標記為捨棄(TFD)之圖像。該一或多個TFD圖像可按顯示次序值先於RAP圖像並
按解碼次序在RAP圖像之後且指代按解碼次序早於RAP圖像的視訊資料。視訊編碼器20可藉由寫碼與RAP圖像相關聯之該一或多個DLP使得所有TFD圖像按顯示次序先於DLP來寫碼該RAP圖像之該一或多個DLP,其中DLP按顯示次序先於RAP圖像且按解碼次序在RAP圖像之後且不指代按解碼次序早於RAP圖像之視訊資料。
視訊編碼器20亦可寫碼按解碼次序先於RAP圖像之一或多個圖像。視訊編碼器20可藉由寫碼與RAP圖像相關聯之該一或多個DLP使得按解碼次序先於RAP圖像之所有圖像按顯示次序亦先於所有DLP來寫碼該一或多個DLP。DLP可按顯示次序先於RAP圖像並按解碼次序在RAP圖像之後且不指代視訊資料按解碼次序早於RAP圖像之視訊資料。
圖3為說明可實施用於在切片標頭中發信長期參考圖像之技術的視訊解碼器30之實例的方塊圖。在圖3之實例中,視訊解碼器30包括一熵解碼單元70、運動補償單元72、框內預測處理單元74、逆量化單元76、逆變換處理單元78、參考圖像記憶體82及求和器80。在一些實例中,視訊解碼器30可執行大體上與關於視訊編碼器20(圖2)描述之編碼遍次互反的解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量而產生預測資料,而框內預測處理單元74可基於自熵解碼單元70接收之框內預測模式指示符而產生預測資料。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收一表示經編碼視訊切片之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器30之熵解碼單元70熵解碼該位元串流以產生經量化係數、運動向量或框內預測模式指示符,及其他語法元素。熵解碼單元70將運動向量及其他語法元素轉遞至運動補償單元72。視訊解碼器30可接收在視訊切片層級及/或視訊區塊層級之語法元素。
當視訊切片經寫碼為框內寫碼(I)切片時,框內預測處理單元74
可基於所傳信之框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊切片之視訊區塊的預測資料。當視訊圖框經寫碼為框間寫碼(亦即,B、P或GPB)切片時,運動補償單元72基於自熵解碼單元70接收之運動向量及其他語法元素產生用於當前視訊切片之視訊區塊的預測性區塊。可自參考圖像清單中之一者內的參考圖像中之一者產生預測性區塊。視訊解碼器30可基於儲存於參考圖框記憶體92中之參考圖像使用預設構造技術建構參考圖框清單(清單0及清單1)。運動補償單元72藉由剖析運動向量及其他語法元素來判定用於當前視訊切片之視訊區塊的預測資訊,並使用該預測資訊來產生正被解碼之當前視訊區塊的預測性區塊。舉例而言,運動補償單元72使用一些所接收之語法元素來判定用以寫碼視訊切片之視訊區塊之預測模式(例如,框內預測或框間預測)、框間預測切片類型(例如,B切片、P切片或GPB切片)、切片之參考圖像清單中之一或多者的建構資訊、切片之每一框間編碼視訊區塊之運動向量、切片之每一框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊切片中之視訊區塊之其他資訊。
運動補償單元72亦可基於內插濾波器執行內插。運動補償單元72可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元72可根據接收之語法元素判定由視訊編碼器20使用之內插濾波器且使用該等內插濾波器來產生預測性區塊。
逆量化單元76逆量化(亦即,解量化)位元串流中提供並由熵解碼單元80解碼的經量化之變換係數。逆量化程序可包括使用由視訊解碼器30針對視訊切片中之每一視訊區塊而計算的量化參數QPY來判定量化的程度及同樣地應該應用之逆量化的程度。
逆變換處理單元78將逆變換(例如,逆DCT、逆整數變換或概念
上類似的逆變換程序)應用於變換係數以便產生像素域中之殘餘區塊。
在運動補償單元72基於運動向量及其他語法元素產生當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自逆變換處理單元78之殘餘區塊與由運動補償單元72產生之對應預測性區塊求和而形成一經解碼視訊區塊。求和器90表示執行此求和運算之該或該等組件。若需要,亦可應用解區塊濾波器以對經解碼區塊濾波以便移除方塊效應假影。其他迴路濾波器(寫碼迴路中或寫碼迴路之後)亦可用以使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼之視訊區塊儲存於參考圖像記憶體92中,參考圖像記憶體92儲存用於後續運動補償之參考圖像。參考圖像記憶體82亦儲存經解碼之視訊以用於稍後在顯示器件(諸如,圖1之顯示器件32)上呈現。
當實施本發明之技術時,視訊解碼器30可接收一RAP圖像並判定該RAP圖像用作位元串流之隨機存取點。RAP圖像待由視訊解碼器30用作隨機存取點的判定可(例如)基於在位元串流中之發信。對於按寫碼次序在RAP圖像後的圖像,視訊解碼器可判定圖像是否為TFD圖像。若一圖像為TFD圖像,則視訊解碼器30可在不必解碼TFD圖像之情況下剖析與TFD圖像相關聯之語法。舉例而言,基於NAL單元類型,視訊解碼器可識別TFD圖像且不完全解碼TFD圖像。若視訊解碼器30判定圖像為DLP,則視訊解碼器30可解碼圖像。
圖3之視訊解碼器30表示可經組態以執行本發明之技術中之任一者的視訊編碼器之實例。舉例而言,視訊編碼器20可經組態以寫碼一RAP圖像並寫碼該RAP圖像之一或多個可解碼前置圖像DLP,使得經標記為捨棄的所有圖像按顯示次序先於與該RAP圖像相關聯之DLP。DLP可包括具有早於RAP圖像之顯示次序值之顯示次序值且不指代按解碼次序早於該RAP圖像之視訊資料的一或多個圖像。視訊解碼器30
亦可相對於RAP圖像寫碼一或多個前置圖像,使得RAP圖像之所有前置圖像按解碼次序先於RAP圖像之所有結尾圖像,其中結尾圖像包括具有大於RAP圖像之顯示次序值的顯示次序值的圖像。RAP圖像可包括(例如)CRA圖像及BLA圖像中之一者。按解碼次序先於CRA或BLA圖像的任一圖像可按顯示次序先於與CRA圖像或BLA圖像相關聯之任何DLP圖像。視訊編碼器20亦可寫碼與RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按顯示次序值先於RAP圖像且按解碼次序在RAP圖像之後,且視訊解碼器30可寫碼與RAP圖像相關聯之一或多個結尾圖像,使得所有前置圖像按解碼次序先於所有結尾圖像,其中該等結尾圖像按顯示次序值及按解碼次序兩者皆在RAP圖像之後。
視訊解碼器30亦可寫碼與RAP圖像相關聯之一或多個標記為捨棄(TFD)的圖像。該一或多個TFD圖像可按顯示次序值先於RAP圖像且按解碼次序在RAP圖像之後並指代按解碼次序早於RAP圖像之視訊資料。視訊編碼器20可藉由寫碼與RAP圖像相關聯之一或多個DLP使得所有TFD圖像按顯示次序先於DLP而寫碼RAP圖像之一或多個DLP,其中該等DLP按顯示次序先於RAP圖像且按解碼次序在RAP圖像之後且不指代按解碼次序早於RAP圖像之視訊資料。
視訊解碼器30亦可寫碼按解碼次序先於RAP圖像之一或多個圖像。視訊解碼器30可藉由寫碼與RAP圖像相關聯之一或多個DLP使得按解碼次序先於RAP圖像之所有圖像按顯示次序亦先於所有DLP而寫碼該一或多個DLP。DLP可按顯示次序先於RAP圖像且按解碼次序在RAP圖像之後且不指代按解碼次序早於RAP圖像的視訊資料。
圖4為說明經寫碼視訊圖像100至圖像132之序列的概念圖。圖4說明RAP、前置圖像、TFD及結尾圖像之間的關係。圖像係以不同方式劃陰影以指示在階層預測結構內之位置。舉例而言,圖像100、116及132係以黑色來劃陰影以表示圖像100、116及132係在階層預測結構
之頂部。圖像100、116及132可包含(例如)自單一方向上之其他圖像預測的框內寫碼圖像或框間寫碼圖像(例如,P圖像)。當經框內寫碼時,圖像100、116及132僅自相同圖像中之資料而預測。當經框間寫碼時,圖像116(例如)可相對於圖像100之資料而寫碼,如自圖像116至圖像100之虛箭頭所指示。圖像116、132分別形成圖像群組(GOP)134、136中之關鍵圖像。
圖像108、124以暗黑色來劃陰影以指示其在編碼階層中接在圖像100、116及132後。圖像108、124可包含雙向框間模式預測編碼之圖像。舉例而言,圖像108可自圖像100及116之資料而預測,而圖像124可自圖像116及132而預測。圖像104、112、120及128以較淡色來劃陰影以指示其在編碼階層中接在圖像108及124後。圖像104、112、120及128亦可包含雙向框間模式預測編碼之圖像。舉例而言,圖像104可自圖像100及108而預測,圖像112可自圖像108及116而預測,圖像120可自圖像116及124而預測,且圖像128可自圖像124及132而預測。一般而言,階層中較低的圖像可自階層中較高之任何參考圖像而編碼,假定參考圖像仍在經解碼圖像緩衝器中緩衝,且假定參考圖像係早於當前被寫碼之圖像而被寫碼。
最後,圖像102、106、110、114、118、122、126及130以白色來劃陰影以指示此等圖像在編碼階層中之最後。圖像102、106、110、114、118、122、126及130可為雙向框間模式預測編碼之圖像。圖像102可自圖像100及104而預測,圖像106可自圖像104及108而預測,圖像110可自圖像108及112而預測,圖像114可自圖像112及116而預測,圖像118可自圖像116及120而預測,圖像122可自圖像120及124而預測,圖像126可自圖像124及128而預測,且圖像130可自圖像128及132而預測。再次,應理解在寫碼階層中較低之圖像可自寫碼階層中較高的其他圖像而寫碼。舉例而言,另外或在替代例中,圖像102、106、
110或114中之任一者或全部可相對於圖像100、116或108中之任一者而預測。
圖像100至圖像132係按顯示次序來說明。亦即,在解碼之後,圖像100係在圖像102之前顯示,圖像102係在圖像104之前顯示,等等。如上文所論述,POC值大體上描述圖像之顯示次序,該顯示次序實質上亦與原始圖像在被編碼之前被俘獲或產生的次序相同。然而,歸因於編碼階層,圖像100至圖像132可以不同次序來解碼。此外,在被編碼的同時,圖像100至圖像132可按解碼次序配置於一包括圖像100至圖像132之經編碼資料的位元串流中。舉例而言,圖像116可最後顯示於GOP 134之圖像中。然而,歸因於編碼階層,可在GOP 134中首先解碼圖像116。亦即,為了適當地解碼圖像108,例如,圖像116可需要首先被解碼,以便充當圖像108之參考圖像。同樣,圖像108可充當圖像104、106、110及112之參考圖像,且因此可需要在圖像104、106、110及112之前被解碼。
此外,某些圖像可被視為長期參考圖像,而其他圖像可被視為短期參考圖像。舉例而言,假定圖像100及116表示長期參考圖像,而圖像108、104及112表示短期參考圖像。在此實例中,其可能係圖像102及106可相對於圖像100、116、108或104中之任一者而預測但圖像110及114可相對於圖像100、116、108或112中之任一者而預測的狀況。換言之,當寫碼圖像110及114時圖像104可能不可用於參考。作為另一實例,假定圖像100及116表示長期參考圖像且圖像108、104及112表示短期參考圖像,且當寫碼圖像118、122、126及130時圖像108、104及112可能不可用於參考。根據本發明之技術,關於長期參考圖像之資料可在切片之切片標頭中發信以用於圖像100至132中之任一者或全部。
在圖4之實例中,箭頭表示潛在預測關係,其中每一箭頭之尾端
表示一可經預測之圖像,且每一箭頭之頭部表示可預測圖像的圖像(亦即,箭頭頭部指向一潛在參考圖像)。儘管圖像116具有一指向圖像100之箭頭,但出於例證之目的,假定圖像116經框內預測寫碼(亦即,在不參考任何其他圖像情況下寫碼)。此外,假定圖像108參考圖像116而經寫碼為P圖像。此外,假定圖像116被用作隨機存取點,例如用作IDR、BLA或CRA圖像。亦即,以圖像116起始擷取的位元串流將包括按解碼次序之圖像102至132中之每一者,但將不包括圖像100。
在此實例中,在上文所述假定下,圖像102、104及106表示TFD圖像,因為圖像102、104及106直接或間接地取決於圖像100。圖像108至114表示DLP之實例,因為圖像108至114並不直接或間接地取決於圖像100,且具有一早於圖像116之顯示次序,但具有一遲於圖像116之解碼次序。圖像118至132在此實例中表示結尾圖像,因為圖像118至132之顯示次序及解碼次序兩者皆遲於圖像116。根據本發明之技術,當寫碼RAP圖像之一或多個DLP時,可寫碼DLP,使得經標記為捨棄之所有圖像按顯示次序先於與RAP圖像相關聯之DLP。舉例而言,如上文參看圖2所論述,當寫碼圖像108時,模式選擇單元40可判定相對於(例如)圖像116將圖像108寫碼為P圖像。以此方式,圖像108可經分類為DLP。因此,模式選擇單元40可判定亦將圖像110、112、114中之每一者寫碼為DLP而非TFD。類似地,視訊解碼器30可在判定圖像108為DLP之後判定按輸出次序之後續圖像為可解碼的。另一方面,視訊解碼器30可在不解碼情況下簡單地剖析為TFD之任何圖像之資料。在此實例中,視訊解碼器30可判定圖像102、104及106為TFD圖像,且因此在不試圖解碼此等圖像之情況下簡單地剖析該等圖像之資料。對於具有遲於圖像108之輸出次序的圖像,視訊解碼器30可在不判定圖像是為TFD還是DLP的情況下開始正常地解碼,因為根
據本發明中提議之限制,所有TFD圖像按輸出次序先於所有DLP圖像。
如上文所論述,本發明提議若干限制用於支援基於此等各種類型圖像之隨機存取。首先,RAP圖像之所有TFD圖像應具有一早於RAP之所有DLP之顯示次序值的顯示次序值。此限制可改良觀看者之觀看體驗,因為其避免圖框速率之突變。亦即,若存在不能被正確地解碼之一或多個圖像(亦即,TFD圖像),若此等圖像具有與DLP混合之顯示次序值,則圖框速率將出現突變,此將減損使用者體驗。本發明亦提議一防止前置圖像與「結尾圖像」在解碼次序方面交錯的限制。亦即,根據本發明之技術,視訊寫碼器可確保所有前置圖像(包括TFD圖像及DLP兩者)具有早於具有大於對應RAP圖像之顯示次序值之顯示次序值的圖像之解碼次序值的解碼次序值。如上文提及,「結尾圖像」為按解碼次序及按顯示次序兩者皆在RAP圖像之後的圖像。
圖5為說明形成網路150之部分的實例器件集合的方塊圖。在此實例中,網路150包括路由器件154A、154B(路由器件154)及代碼轉換器件156。路由器件154及代碼轉換器件156意欲表示可形成網路150之部分的小數目之器件。其他網路器件(諸如,交換器、集線器、閘道器、防火牆、橋接器及其他此等器件)亦可包括於網路150中。此外,可沿伺服器器件152與用戶端器件158之間的網路路徑提供額外網路器件。在一些實例中,伺服器器件152可對應於源器件12(圖1),而用戶端器件158可對應於目的地器件14(圖1)。
一般而言,路由器件154實施一或多個路由協定以經由網路150交換網路資料。一般而言,路由器件154執行路由協定以發現經由網路150之路由路徑。藉由執行此等路由協定,路由器件154B可發現一經由路由器件154A自其自身至伺服器器件152的網路路由路徑。
圖6為說明本發明之實例技術的流程圖。將參考一般視訊寫碼器
來描述圖6之技術。此一般視訊寫碼器可(例如)對應於視訊編碼器20或視訊解碼器30中之任一者。視訊寫碼器寫碼一RAP圖像(161)。該RAP圖像可包括乾淨隨機存取圖像及中斷連結存取圖像中之一者。視訊寫碼器寫碼RAP圖像之一或多個DLP,使得所有標記為捨棄的圖像按顯示次序先於與RAP圖像相關聯之DLP(162)。DLP可包括具有早於RAP圖像之顯示次序值的顯示次序值且不指代按解碼次序早於RAP圖像的視訊資料的一或多個圖像。
圖7為說明本發明之實例技術的流程圖。將參考一般視訊寫碼器來描述圖7之技術。此一般視訊寫碼器可(例如)對應於視訊編碼器20或視訊解碼器30中之任一者。視訊寫碼器寫碼一RAP圖像(171)。視訊寫碼器寫碼與RAP圖像相關聯之一或多個TFD圖像,其中TFD圖像按顯示次序先於該RAP圖像且按解碼次序在RAP圖像之後並指代按解碼次序早於RAP圖像的視訊資料(172)。視訊寫碼器寫碼與RAP圖像相關聯之一或多個DLP,使得所有TFD圖像按顯示次序先於DLP,其中DLP按顯示次序先於RAP圖像且按解碼次序在RAP圖像之後且不指代按解碼次序早於RAP圖像的視訊資料(173)。
圖8為說明本發明之實例技術的流程圖。將參考一般視訊寫碼器來描述圖8之技術。此一般視訊寫碼器可(例如)對應於視訊編碼器20或視訊解碼器30中之任一者。視訊寫碼器寫碼一RAP圖像(181)。視訊寫碼器寫碼與RAP圖像相關聯之一或多個前置圖像,其中前置圖像按顯示次序先於RAP圖像並按解碼次序在RAP圖像之後(182)。視訊寫碼器寫碼與RAP圖像相關聯之一或多個結尾圖像,使得所有前置圖像按解碼次序先於所有結尾圖像,其中該等結尾圖像按顯示次序及按解碼次序兩者皆在RAP圖像之後(183)。
圖9為說明本發明之實例技術的流程圖。將參考一般視訊寫碼器來描述圖9之技術。此一般視訊寫碼器可(例如)對應於視訊編碼器20
或視訊解碼器30中之任一者。視訊寫碼器寫碼按解碼次序先於一RAP圖像之一或多個圖像(191)。視訊寫碼器寫碼RAP圖像(192)。視訊寫碼器寫碼與RAP圖像相關聯之一或多個DLP,使得按解碼次序先於RAP圖像之所有圖像按顯示次序亦先於所有DLP,其中DLP按顯示次序先於RAP圖像且按解碼次序在RAP圖像之後且不指代按解碼次序早於RAP圖像之視訊資料(193)。
圖10為說明本發明之實例技術的流程圖。圖10之技術可(例如)藉由視訊編碼器20之模式選擇單元40執行。模式選擇單元40可編碼RAP圖像(202)。對於下一圖像,在RAP圖像後,模式選擇單元40可判定是將下一圖像寫碼為TFD還是DLP(204)。若模式選擇單元40將下一圖像編碼為TFD(206),則對於後續圖像,模式選擇單元40可再次判定是將該圖像寫碼為TFD還是DLP(204)。一旦模式選擇單元40將在RAP圖像之後的圖像寫碼為DLP(208),則模式選擇單元便將後續圖像編碼為DLP(210)。在圖10之實例中,「下一圖像」一般指代按輸出次序之後續圖像。仍允許DLP及TFD之解碼次序交錯,而輸出次序交錯可能被禁止。
圖11為說明本發明之實例技術的流程圖。圖11之技術可(例如)藉由視訊解碼器30執行。視訊解碼器30可解碼一RAP圖像並判定該圖像待用於隨機存取一位元串流。對於位元串流中之下一圖像,視訊解碼器30可(例如)基於圖像之NAL單元類型來判定圖像是TFD圖像還是DLP(214)。若圖像為TFD,則視訊解碼器30可跳過TFD圖像之解碼(216)。若圖像為DLP,則視訊解碼器30可解碼DLP(218)。
儘管圖6、圖7、圖8、圖9、圖10及圖11之技術已單獨地呈現,但預期圖6、圖7、圖8、圖9、圖10及圖11中所呈現的技術之態樣可同時實施。亦應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以一不同序列執行、可增添、合併或完全省略(例
如,對於實踐該等技術而言並非所有所描述之動作或事件皆係必要的)。此外,在某些實例中,可(例如)經由多執行緒處理、中斷處理或多個處理器同時而非順序地執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體予以實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纖纜線、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為,係有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁
碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指代前述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。而是,如上文所描述,可將各種單元組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例屬於以下申請專利範圍之範疇內。
Claims (54)
- 一種解碼視訊資料之方法,該方法包含:解碼一隨機存取點(RAP)圖像;解碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及根據所有該一或多個TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以解碼該RAP圖像之該一或多個DLP。
- 如請求項1之方法,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項1之方法,其進一步包含根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像解碼一或多個前置圖像,其中該等結尾圖像包含具有大於該RAP圖像之一輸出次序值的輸出次序值的圖像。
- 如請求項1之方法,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項4之方法,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項1之方法,該方法進一步包含: 解碼與該RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及根據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以解碼與該RAP圖像相關聯之一或多個結尾圖像,其中該等結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之後。
- 如請求項1之方法,其中根據所有該等TFD圖像按輸出次序先於該等DLP之該限制以解碼該RAP圖像之該一或多個DLP包含解碼與該RAP圖像相關聯之該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資料。
- 如請求項1之方法,該方法進一步包含:解碼按一解碼次序先於該RAP圖像之一或多個圖像;且其中根據使得按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之一限制以解碼該一或多個DLP包含解碼與該RAP圖像相關聯之該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項1之方法,其中解碼該RAP圖像係作為一視訊編碼程序之部分而執行。
- 一種用於解碼視訊資料之器件,該器件包含:一記憶體,其經組態以儲存該視訊資料;包含一或多個處理器之一視訊解碼器,其經組態以解碼一隨機存取點(RAP)圖像;解碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之 圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及根據所有該一或多個TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以解碼該RAP圖像之該一或多個DLP。
- 如請求項10之器件,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項10之器件,其中該視訊解碼器經進一步組態以根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像解碼一或多個前置圖像,其中該等結尾圖像包含具有大於該RAP圖像之一顯示次序值的輸出次序值的圖像。
- 如請求項10之器件,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項13之器件,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項10之器件,其中該視訊解碼器經進一步組態以:解碼與該RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及依據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以解碼與該RAP圖像相關聯之一或多個結尾圖像,其中該等 結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之後。
- 如請求項10之器件,其中該視訊解碼器經組態以藉由根據所有該等TFD圖像按輸出次序先於該等DLP之該限制以解碼與該RAP圖像相關聯之該一或多個DLP而解碼該RAP圖像之該一或多個DLP其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資料。
- 如請求項10之器件,其中該視訊解碼器經進一步組態以解碼按一解碼次序先於該RAP圖像之一或多個圖像;且其中該視訊解碼器經組態以藉由根據按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之該限制藉由解碼與該RAP圖像相關聯之該一或多個DLP而解碼該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項10之器件,其中該器件包含以下各者中之至少一者:一積體電路;一微處理器;或一無線通信器件,其包括該視訊解碼器。
- 一種用於解碼視訊資料之裝置,該裝置包含:用於解碼一隨機存取點(RAP)圖像之構件;用於解碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像之構件,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及用於根據所有該一或多個TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以解碼該 RAP圖像之該一或多個DLP的構件。
- 如請求項19之裝置,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項19之裝置,其進一步包含用於根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像解碼一或多個前置圖像的構件,其中該等結尾圖像包含具有大於該RAP圖像之一輸出次序值的輸出次序值的圖像。
- 如請求項19之裝置,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項22之裝置,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項19之裝置,該裝置進一步包含:用於解碼與該RAP圖像相關聯之一或多個前置圖像的構件,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及用於根據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以解碼與該RAP圖像相關聯之一或多個結尾圖像的構件,其中該等結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之後。
- 如請求項19之裝置,其中該用於解碼該RAP圖像之該一或多個DLP之構件包含用於根據所有該等TFD圖像按輸出次序先於該等 DLP之該限制以解碼與該RAP圖像相關聯之該一或多個DLP的構件,其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資料。
- 如請求項19之裝置,該裝置進一步包含:用於解碼按一解碼次序先於該RAP圖像之一或多個圖像的構件;且其中該用於解碼該一或多個DLP之構件包含用於依據按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之一限制以解碼與該RAP圖像相關聯之該一或多個DLP的構件,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 一種儲存指令之電腦可讀儲存媒體,該等指令在由一或多個處理器執行時使該一或多個處理器執行以下操作:解碼一隨機存取點(RAP)圖像;解碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及根據所有該一或多個TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以解碼該RAP圖像之該一或多個DLP。
- 一種編碼視訊資料之方法,該方法包含:編碼一隨機存取點(RAP)圖像;編碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按 解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;根據所有TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以編碼該RAP圖像之該一或多個DLP。
- 如請求項28之方法,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項28之方法,其進一步包含根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像編碼一或多個前置圖像,其中該等結尾圖像包含具有大於該RAP圖像之一輸出次序值的輸出次序值的圖像。
- 如請求項28之方法,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項31之方法,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項28之方法,該方法進一步包含:編碼與該RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及根據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以編碼與該RAP圖像相關聯之一或多個結尾圖像,其中該等結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之 後。
- 如請求項28之方法,其中編碼該RAP圖像之該一或多個DLP包含根據所有該等TFD圖像按輸出次序先於該等DLP之一限制以編碼與該RAP圖像相關聯之該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資料。
- 如請求項28之方法,該方法進一步包含:編碼按一解碼次序先於該RAP圖像之一或多個圖像;且其中編碼該一或多個DLP包含根據按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之一限制以編碼與該RAP圖像相關聯之該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項28之方法,其中編碼該RAP圖像係作為一視訊編碼程序之部分而執行。
- 一種用於編碼視訊資料之器件,該器件包含:一記憶體,其經組態以儲存該視訊資料;包含一或多個處理器之一視訊編碼器,其經組態以編碼一隨機存取點(RAP)圖像;編碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及根據所有TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以編碼該RAP圖像之該一或多個DLP。
- 如請求項37之器件,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項37之器件,其中該視訊編碼器經進一步組態以根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像編碼一或多個前置圖像,其中該等結尾圖像包含具有大於該RAP圖像之一輸出次序值的輸出次序值的圖像。
- 如請求項37之器件,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項40之器件,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項37之器件,其中該視訊編碼器經進一步組態以:編碼與該RAP圖像相關聯之一或多個前置圖像,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及根據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以編碼與該RAP圖像相關聯之一或多個結尾圖像,其中該等結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之後。
- 如請求項37之器件,其中該視訊編碼器經組態以編碼該RAP圖像之該一或多個DLP包含根據所有該等TFD圖像按輸出次序先於該等DLP之該限制以編碼與該RAP圖像相關聯之該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資 料。
- 如請求項37之器件,其中該視訊編碼器經進一步組態以編碼按一解碼次序先於該RAP圖像之一或多個圖像;且其中該視訊編碼器經組態以藉由根據按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之一限制以編碼與該RAP圖像相關聯之該一或多個DLP來編碼該一或多個DLP,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項37之器件,其中該器件包含以下各者中之至少一者:一積體電路;一微處理器;及一無線通信器件,其包括該視訊編碼器。
- 一種用於編碼視訊資料之裝置,該裝置包含:用於編碼一隨機存取點(RAP)圖像之構件;用於編碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像之構件,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;及用於根據所有TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以編碼該RAP圖像之該一或多個DLP的構件。
- 如請求項46之裝置,其中該等DLP包含具有指示一早於該RAP圖像之一輸出次序值之輸出次序的輸出次序值並具有指示一遲於該RAP圖像之一解碼次序值之解碼次序的解碼次序值的一或多個圖像,且其中該一或多個圖像不參照按解碼次序早於該RAP圖像之視訊資料。
- 如請求項46之裝置,其進一步包含用於根據該RAP圖像之所有該等前置圖像按解碼次序先於該RAP圖像之所有結尾圖像之一限制以相對於該RAP圖像編碼一或多個前置圖像的構件,其中該等結尾圖像包含具有大於該RAP圖像之一輸出次序值的輸出次序值的圖像。
- 如請求項46之裝置,其中該RAP圖像包含一乾淨隨機存取(CRA)圖像及一中斷連結存取(BLA)圖像中之一者。
- 如請求項49之裝置,其中按解碼次序先於一CRA或BLA圖像之任一圖像按輸出次序先於與該CRA圖像或該BLA圖像相關聯之任一DLP圖像。
- 如請求項46之裝置,該裝置進一步包含:用於編碼與該RAP圖像相關聯之一或多個前置圖像的構件,其中該等前置圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後;及用於根據所有該等前置圖像按解碼次序先於所有該等結尾圖像之一限制以編碼與該RAP圖像相關聯之一或多個結尾圖像的構件,其中該等結尾圖像按輸出次序值及按解碼次序兩者皆在該RAP圖像之後。
- 如請求項46之裝置,其中該用於編碼該RAP圖像之該一或多個DLP之構件包含用於根據所有該等TFD圖像按輸出次序先於該等DLP之該限制以編碼與該RAP圖像相關聯之該一或多個DLP的構件,其中該等DLP按輸出次序先於該RAP圖像且按該解碼次序在該RAP圖像之後且不參照按該解碼次序早於該RAP圖像之視訊資料。
- 如請求項46之裝置,該裝置進一步包含:用於編碼按一解碼次序先於該RAP圖像之一或多個圖像之構 件;且其中該用於編碼該一或多個DLP之構件包含用於根據按解碼次序先於該RAP圖像之所有圖像按輸出次序亦先於所有該等DLP之一限制以編碼與該RAP圖像相關聯之該一或多個DLP的構件,其中該等DLP按輸出次序先於該RAP圖像且按解碼次序在該RAP圖像之後且不參照按解碼次序早於該RAP圖像之視訊資料。
- 一種儲存指令之電腦可讀儲存媒體,該等指令當由一或多個處理器執行時使該一或多個處理器執行以下操作:編碼一隨機存取點(RAP)圖像;及編碼與該RAP圖像相關聯的一或多個經標記為捨棄(TFD)之圖像,其中該一或多個TFD圖像按輸出次序值先於該RAP圖像且按解碼次序在該RAP圖像之後並參照按該解碼次序早於該RAP圖像之視訊資料;根據所有TFD圖像按輸出次序先於與該RAP圖像相關聯之一或多個可解碼前置圖像(DLP)之一限制以編碼該RAP圖像之該一或多個DLP。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261665862P | 2012-06-28 | 2012-06-28 | |
US201261666688P | 2012-06-29 | 2012-06-29 | |
US13/784,006 US9591303B2 (en) | 2012-06-28 | 2013-03-04 | Random access and signaling of long-term reference pictures in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201406160A TW201406160A (zh) | 2014-02-01 |
TWI532383B true TWI532383B (zh) | 2016-05-01 |
Family
ID=49778157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102123059A TWI532383B (zh) | 2012-06-28 | 2013-06-27 | 在視訊寫碼中長期參考圖像之隨機存取及發信 |
Country Status (22)
Country | Link |
---|---|
US (1) | US9591303B2 (zh) |
EP (1) | EP2868083B1 (zh) |
JP (1) | JP6169689B2 (zh) |
KR (1) | KR101810302B1 (zh) |
CN (1) | CN104396257B (zh) |
AU (1) | AU2013280848B2 (zh) |
CA (1) | CA2875697C (zh) |
DK (1) | DK2868083T3 (zh) |
ES (1) | ES2657494T3 (zh) |
HK (1) | HK1204183A1 (zh) |
HU (1) | HUE037703T2 (zh) |
IL (1) | IL235970B (zh) |
MX (1) | MX346210B (zh) |
MY (1) | MY167919A (zh) |
PH (1) | PH12014502859B1 (zh) |
PL (1) | PL2868083T3 (zh) |
PT (1) | PT2868083T (zh) |
RU (1) | RU2646325C2 (zh) |
SG (2) | SG11201408112XA (zh) |
SI (1) | SI2868083T1 (zh) |
TW (1) | TWI532383B (zh) |
WO (1) | WO2014004201A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130188709A1 (en) * | 2012-01-25 | 2013-07-25 | Sachin G. Deshpande | Video decoder for tiles with absolute signaling |
JP6045222B2 (ja) * | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
US9591303B2 (en) * | 2012-06-28 | 2017-03-07 | Qualcomm Incorporated | Random access and signaling of long-term reference pictures in video coding |
US20140003520A1 (en) * | 2012-07-02 | 2014-01-02 | Cisco Technology, Inc. | Differentiating Decodable and Non-Decodable Pictures After RAP Pictures |
US9648322B2 (en) * | 2012-07-10 | 2017-05-09 | Qualcomm Incorporated | Coding random access pictures for video coding |
JP2014039252A (ja) * | 2012-08-10 | 2014-02-27 | Panasonic Corp | 画像復号方法および画像復号装置 |
KR102381380B1 (ko) * | 2012-11-21 | 2022-04-01 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
US9848199B2 (en) * | 2014-03-17 | 2017-12-19 | Qualcomm Incorporated | Device and method for scalable coding of video information |
US10484711B2 (en) * | 2014-06-18 | 2019-11-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Dependent random access point pictures |
JP2017522767A (ja) * | 2014-06-18 | 2017-08-10 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | ビデオビットストリームにおけるランダムアクセス |
CN105516729B (zh) * | 2014-09-23 | 2019-12-31 | 浙江大学 | 视频编解码方法、装置及生成的视频码流 |
US9826069B2 (en) * | 2015-01-27 | 2017-11-21 | Intel IP Corporation | Wireless device, method, and computer readable media restriction of upload traffic in a high-efficiency wireless local area network |
US10116576B2 (en) * | 2015-10-19 | 2018-10-30 | Samsung Electronics Co., Ltd. | Methods and apparatus for random access of HEVC bitstream for MMT |
BR112021002832A2 (pt) | 2018-08-17 | 2021-05-04 | Huawei Technologies Co., Ltd. | gerenciamento de imagem de referência em codificação de vídeo |
US11463736B2 (en) * | 2018-09-21 | 2022-10-04 | Sharp Kabushiki Kaisha | Systems and methods for signaling reference pictures in video coding |
CN118784867A (zh) * | 2018-12-10 | 2024-10-15 | 夏普株式会社 | 用于在视频编码中发送信号通知参考图片的系统和方法 |
PL3939290T3 (pl) * | 2019-04-03 | 2024-03-11 | Huawei Technologies Co., Ltd. | Kodowanie wideo z przeplotem z obrazami wiodącymi |
US11109041B2 (en) * | 2019-05-16 | 2021-08-31 | Tencent America LLC | Method and apparatus for video coding |
WO2021100724A1 (en) * | 2019-11-21 | 2021-05-27 | Sharp Kabushiki Kaisha | Systems and methods for signaling reference picture lists in video coding |
JP6967653B2 (ja) * | 2019-12-19 | 2021-11-17 | 株式会社Nttドコモ | 動画像予測復号方法 |
JP7460790B2 (ja) * | 2020-03-19 | 2024-04-02 | バイトダンス インコーポレイテッド | 参照ピクチャ順序の制約 |
US11496730B2 (en) * | 2020-04-03 | 2022-11-08 | Electronics And Telecommunications Research Institute | Method, apparatus and storage medium for image encoding/decoding using subpicture |
US11962936B2 (en) | 2020-09-29 | 2024-04-16 | Lemon Inc. | Syntax for dependent random access point indication in video bitstreams |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8300690B2 (en) * | 2002-07-16 | 2012-10-30 | Nokia Corporation | Method for random access and gradual picture refresh in video coding |
WO2006003814A1 (ja) | 2004-07-01 | 2006-01-12 | Mitsubishi Denki Kabushiki Kaisha | ランダムアクセス可能な映像情報記録媒体、及び記録方法、及び再生装置及び再生方法 |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
US7995656B2 (en) * | 2005-03-10 | 2011-08-09 | Qualcomm Incorporated | Scalable video coding with two layer encoding and single layer decoding |
JP5378227B2 (ja) * | 2006-11-14 | 2013-12-25 | クゥアルコム・インコーポレイテッド | チャネルスイッチングのためのシステムと方法 |
CN101389034B (zh) * | 2007-09-14 | 2010-06-09 | 华为技术有限公司 | 一种图像编/解码方法、装置及一种图像处理方法、系统 |
US8416858B2 (en) | 2008-02-29 | 2013-04-09 | Cisco Technology, Inc. | Signalling picture encoding schemes and associated picture properties |
US20090238268A1 (en) | 2008-03-20 | 2009-09-24 | Mediatek Inc. | Method for video coding |
CN102210147B (zh) | 2008-11-12 | 2014-07-02 | 思科技术公司 | 处理具有[aar]单个视频信号的多个处理后的表示的视频[aar]节目以用于重建和输出 |
TW201032597A (en) | 2009-01-28 | 2010-09-01 | Nokia Corp | Method and apparatus for video coding and decoding |
US8976871B2 (en) | 2009-09-16 | 2015-03-10 | Qualcomm Incorporated | Media extractor tracks for file format track selection |
EP3439299A1 (en) * | 2011-07-02 | 2019-02-06 | Samsung Electronics Co., Ltd. | Apparatus for multiplexing and demultiplexing video data to identify reproducing state of video data |
US9351016B2 (en) * | 2012-04-13 | 2016-05-24 | Sharp Kabushiki Kaisha | Devices for identifying a leading picture |
US9532055B2 (en) * | 2012-04-16 | 2016-12-27 | Microsoft Technology Licensing, Llc | Constraints and unit types to simplify video random access |
US9591303B2 (en) * | 2012-06-28 | 2017-03-07 | Qualcomm Incorporated | Random access and signaling of long-term reference pictures in video coding |
-
2013
- 2013-03-04 US US13/784,006 patent/US9591303B2/en active Active
- 2013-06-19 ES ES13737467.4T patent/ES2657494T3/es active Active
- 2013-06-19 PT PT137374674T patent/PT2868083T/pt unknown
- 2013-06-19 DK DK13737467.4T patent/DK2868083T3/en active
- 2013-06-19 AU AU2013280848A patent/AU2013280848B2/en active Active
- 2013-06-19 CN CN201380034282.0A patent/CN104396257B/zh active Active
- 2013-06-19 RU RU2015102596A patent/RU2646325C2/ru active
- 2013-06-19 SG SG11201408112XA patent/SG11201408112XA/en unknown
- 2013-06-19 EP EP13737467.4A patent/EP2868083B1/en active Active
- 2013-06-19 CA CA2875697A patent/CA2875697C/en active Active
- 2013-06-19 PL PL13737467T patent/PL2868083T3/pl unknown
- 2013-06-19 JP JP2015520293A patent/JP6169689B2/ja active Active
- 2013-06-19 SI SI201330922T patent/SI2868083T1/en unknown
- 2013-06-19 MY MYPI2014703546A patent/MY167919A/en unknown
- 2013-06-19 KR KR1020157001833A patent/KR101810302B1/ko active IP Right Grant
- 2013-06-19 WO PCT/US2013/046529 patent/WO2014004201A1/en active Application Filing
- 2013-06-19 MX MX2014015161A patent/MX346210B/es active IP Right Grant
- 2013-06-19 SG SG10201610756PA patent/SG10201610756PA/en unknown
- 2013-06-19 HU HUE13737467A patent/HUE037703T2/hu unknown
- 2013-06-27 TW TW102123059A patent/TWI532383B/zh active
-
2014
- 2014-11-27 IL IL235970A patent/IL235970B/en active IP Right Grant
- 2014-12-22 PH PH12014502859A patent/PH12014502859B1/en unknown
-
2015
- 2015-05-11 HK HK15104443.8A patent/HK1204183A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI532383B (zh) | 在視訊寫碼中長期參考圖像之隨機存取及發信 | |
US9813719B2 (en) | Signaling HRD parameters for bitstream partitions | |
KR101743852B1 (ko) | 비디오 코딩에서의 관심 영역들 및 점진적 디코딩 리프레시의 시그널링 | |
JP6235026B2 (ja) | 誤り耐性のある復号単位関連付け | |
KR101788427B1 (ko) | 비디오 코딩에서 비디오 타이밍을 위한 타이밍 정보 관계들로의 픽처 순서 카운트의 시그널링 | |
TWI558179B (zh) | 對視訊寫碼發信長期參考圖像 | |
TWI566582B (zh) | 用於處理及編碼視訊資料之方法、器件及裝置以及電腦可讀儲存媒體 | |
CA2951522A1 (en) | Extensible design of nesting supplemental enhancement information (sei) messages | |
KR20160034321A (ko) | 인트라 랜덤 액세스 포인트 픽처들의 개선된 교차-계층 정렬 | |
US20190141320A1 (en) | Enhanced reference picture management in video coding |