TW201408082A - 對視訊寫碼發信長期參考圖像 - Google Patents

對視訊寫碼發信長期參考圖像 Download PDF

Info

Publication number
TW201408082A
TW201408082A TW102123363A TW102123363A TW201408082A TW 201408082 A TW201408082 A TW 201408082A TW 102123363 A TW102123363 A TW 102123363A TW 102123363 A TW102123363 A TW 102123363A TW 201408082 A TW201408082 A TW 201408082A
Authority
TW
Taiwan
Prior art keywords
value
msb
poc
long
term reference
Prior art date
Application number
TW102123363A
Other languages
English (en)
Other versions
TWI558179B (zh
Inventor
Adarsh Krishnan Ramasubramonian
Ye-Kui Wang
Rajan Laxman Joshi
Ying Chen
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201408082A publication Critical patent/TW201408082A/zh
Application granted granted Critical
Publication of TWI558179B publication Critical patent/TWI558179B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種視訊解碼器可經組態以:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元值;及對該視訊資料之一當前圖像中的與該第一長期參考圖像及該第二長期參考圖像中之至少一者有關的至少一部分解碼。

Description

對視訊寫碼發信長期參考圖像
本申請案主張2012年6月28日申請之美國臨時申請案第61/665,784號之權益,該臨時申請案之全部內容以引用的方式併入本文中。
本發明係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板型電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型手機」、視訊電傳會議器件、視訊串流器件,及其類似者。數位視訊器件實施視訊寫碼技術,諸如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4部分10進階視訊寫碼(AVC)所定義之標準、目前正在開發中之高效率視訊寫碼(HEVC)標準及此類標準之擴展中所描述的視訊寫碼技術。ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合協作小組(JCT-VC)於2012年4月27日至5月7日在美國加州聖何塞市(San Jose)召開之第9次會議上Bross等人之「High efficiency video coding(HEVC)text specification draft 7」的文件LCTVC-I1003中描述即將到來的HEVC標 準之較新草稿(稱為「HEVC工作草稿7」或「WD7」),自2013年5月13日起,其可自http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zip下載而得。視訊寫碼器件可藉由實施此類視訊寫碼技術來更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊圖塊(例如,視訊圖框或視訊圖框之一部分)分割成視訊區塊,其亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。可使用相對於一圖像中之相鄰區塊中之參考樣本的空間預測來對同一圖像之框內寫碼(I)圖塊中的視訊區塊編碼。圖像之框間寫碼(P或B)圖塊中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間預測或時間預測導致用於區塊之預測性區塊經寫碼。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差之殘餘資料來對框間寫碼區塊編碼。根據框內寫碼模式及殘餘資料來對框內寫碼區塊編碼。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘變換係數,可接著量化殘餘變換係數。可掃描最初配置成二維陣列之經量化變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
大體上,本發明描述用於對視訊寫碼發信長期參考圖像的技術。參考圖像大體上對應於可用於其他圖像之資料之時間預測性寫碼的參考的圖像。大體上,長期參考圖像儲存於經解碼圖像緩衝區中, 比其他參考圖像(例如,短期參考圖像)長。本發明描述與涉及長期參考圖像之發信有關的各種技術,例如在圖像之圖塊的圖塊標頭中發信長期參考圖像。本發明之技術可提供圖塊標頭中的長期參考圖像之發信方法(例如)在效率及/或適用性方面之改良。
在一個實例中,一種方法包括:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
在另一實例中,一種用於對視訊資料解碼的器件包括一視訊解碼器,其經組態以:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
在另一實例中,一種器件包括:用於對一第一值解碼的構件,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一 第一POC值的一第一MSB值之間的一差;用於對一第二值解碼的構件,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及用於對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼的構件。
在另一實例中,一種電腦可讀儲存媒體於其上儲存有指令,該等指令在被執行時使得一處理器執行以下動作:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
在另一實例中,一種對視訊資料編碼的方法包括:對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
在另一實例中,一種用於對視訊資料編碼的器件包括一視訊編碼器,其經組態以:對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
在另一實例中,一種用於對視訊資料編碼的器件包括:用於對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼的構件;用於對一第一值編碼的構件,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及用於對一第二值編碼的構件,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
在另一實例中,一種電腦可讀儲存媒體於其上儲存有指令,該等指令使得一處理器執行以下動作:對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一 POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧逆量化單元
60‧‧‧逆變換單元
62‧‧‧求和器
64‧‧‧參考圖像記憶體
70‧‧‧熵解碼單元
72‧‧‧運動補償單元
74‧‧‧框內預測單元
76‧‧‧逆量化單元
78‧‧‧逆變換單元
80‧‧‧求和器
82‧‧‧參考圖像記憶體
100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132‧‧‧圖像
圖1為說明實例視訊編碼與解碼系統的方塊圖,該視訊編碼與解碼系統可利用用於圖塊標頭中的長期參考圖像之改良式發信的技術。
圖2為說明視訊編碼器之實例的方塊圖,該視訊編碼器可實施用於圖塊標頭中的長期參考圖像之改良式發信的技術。
圖3為說明視訊解碼器之實例的方塊圖,該視訊解碼器可實施用於圖塊標頭中的長期參考圖像之改良式發信的技術。
圖4為說明經寫碼之視訊圖像序列的概念圖。
圖5為根據本發明技術的說明用於對長期參考圖像之圖像次序計數(POC)值編碼之實例方法的流程圖。
圖6為根據本發明技術的說明用於對長期參考圖像之POC值解碼之實例方法的流程圖。
大體上,視訊資料係由經快速連續俘獲或顯示之圖像序列來表示。應理解,在一些實例中,圖像或圖像之一部分可(例如)使用電腦圖形來產生,而非經俘獲(或除俘獲之外)。圖像將經顯示之次序(其可大體上與圖像經俘獲或產生之次序相同)可與圖像經寫碼的次序不同。圖像之顯示次序大體上由圖像次序計數(POC)值表示,而圖像之寫碼次序大體上由圖框數目(frame_num)值表示。
圖像之寫碼大體上涉及利用該等圖像中所出現的冗餘資料。舉例而言,空間寫碼(亦稱為框內預測性寫碼)利用共同圖像之像素值的空間上相鄰區塊之間所出現的冗餘。作為另一實例,時間寫碼(亦稱為框間預測性寫碼)利用在不同時間執行個體俘獲、產生或顯示之不同圖像之間所出現的冗餘。更確切而言,可將圖像劃分為圖塊,該等圖塊可指定用於框內預測或框間預測。此外,可將每一圖塊劃分為區塊(例如,最大寫碼單元(LCU)),且可基於對應圖塊是否已指定用於框內預測或框間預測而進一步分割或寫碼該等區塊中之每一者。
至於框間預測性寫碼之實例,可根據參考圖像預測當前正經寫碼之圖像(亦稱為「當前圖像」)的區塊。WD7將「參考圖像」定義為nal_ref_flag等於1之圖像。nal_ref_flag為網路提取層(NAL)單元中指示包括在NAL單元中之資料是否處理為參考圖像的語法元素。WD7亦提供,參考圖像含有樣本(亦即,像素值),該等樣本可用於按照解碼次序的後續圖像的解碼程序中之框間預測。
此外,WD7區分長期參考圖像與短期參考圖像。舉例而言,WD7將長期參考圖像定義為標記成「用於長期參考」之參考圖像。WD7提供,序列參數集(SPS)中指示是否向經寫碼視訊序列發信全部的長期參考圖像之旗標。根據WD7,視訊寫碼器在圖塊之圖塊標頭中發信長期參考圖像之POC值的最低有效位元(LSB)。相對於發信完整POC值,發信LSB可能達成位元節省。根據WD7,若解碼圖像緩衝區(DPB)中存在具有與長期參考圖像相同LSB位元的一個以上參考圖像,則視訊寫碼器可發信長期參考圖像之POC值的最高有效位元(MSB)。此外,根據WD7,視訊寫碼器可使用旗標以指示經發信之長期參考圖像是否可由當前圖像用於參考。
視訊寫碼器可維持當前圖像之MSB(本文中稱為「基本MSB值」),且使用與基本MSB值有關的偏移值(例如,使用圖像i之語法元 素delta_poc_msb_cycle_lt[i])來發信長期參考圖像i之MSB。此語法元素在下文中稱為「MSB循環」值。換言之,為計算特定圖像之POC值,視訊寫碼器可計算:(基本MSB+圖像之MSB循環)串接(圖像之LSB)。
在WD7中,MSB循環值經寫碼為基本MSB值與經發信的MSB循環之圖像(亦即,圖像i)的MSB之間的差。僅當發信具有相同LSB值之兩個或兩個以上長期參考圖像時,會同樣發信第一個此類長期參考圖像之MSB循環,且將剩餘長期參考圖像的MSB循環值作為彼此之相對偏移而發信。然而,根據WD7,此長期參考圖像之發信可能經歷一或多個缺點。舉例而言,若存在具有不同LSB值但均發信delta_poc_msb_cycle_lt[i]的兩個長期參考圖像,則當前語法將如上文所述(亦即,將delta_poc_msb_cycle_lt[i]作為相對於基本MSB值的偏移)而發信。然而,本發明認識到發信圖像之MSB循環值之間的差可更有效。
根據WD7,在圖塊標頭中發信長期參考圖像之識別資料可能經歷一或多個缺點。舉例而言,若當前圖像的POC值等於MaxPicOrderCntLsb * N-1,且POC值等於MaxPicOrderCntLsb * N之圖像為經發信delta_poc_msb_cycle_lt[i]之第一個長期參考圖像,則WD7不提供用於發信delta_poc_msb_cycle_lt[i]的技術。在此狀況下,delta_poc_msb_cycle_lt[i]之值應為-1(負一),但不可能為-1(負一)。
作為另一實例,若存在具有不同LSB值但均發信delta_poc_msb_cycle_lt[i]之兩個長期參考圖像,則當前語法將同樣發信delta_poc_msb_cycle_lt[i]。然而,本發明認識到對圖像中之一者發信差可更有效。
作為另一實例,當DPB中存在具有與所發信之長期參考圖像相同的LSB之一個以上參考圖像時,WD7委託亦使用 delta_poc_msb_cycle_lt[i]語法元素來發信LTRP之MSB循環。然而,本發明認識到,若DPB中存在將由當前圖像標記為短期參考圖像之一圖像,則於長期參考圖像之候選集中包括該短期參考圖像可能以相比所需要的而發信更多MSB位元而結束。
作為另一實例,當DPB中存在POC LSB等於poc_lsb_lt[i]之n個參考圖像時,且在LSB等於poc_lsb_lt[i]之當前圖像中發信k個長期參考圖像(其中k小於或等於n)的情況下,WD7中所定義的語法委託所有k個圖像將使delta_poc_msb_present_flag[i]設定為1。然而,若k=n,則本發明認識到,視訊寫碼器無需將所有k個長期參考圖像的delta_poc_msb_present_flag[i]設定為1,而是將n_1個圖像之delta_poc_msb_present_flag[i]設定為1便足夠。如下文關於圖式更詳細描述,本發明之技術可克服此等缺點中之任一者或全部。大體上,本發明描述可改良圖塊標頭中之長期參考圖像之發信的各種技術。
圖1為說明實例視訊編碼與解碼系統10的方塊圖,該視訊編碼與解碼系統10可利用用於圖塊標頭中之長期參考圖像之改良式發信的技術。如圖1所示,系統10包括源器件12,該源器件12提供稍後由目的器件14解碼之經編碼的視訊資料。詳言之,源器件12經由電腦可讀媒體16向目的器件14提供視訊資料。源器件12與目的器件14可包含廣泛範圍之器件中之任一者,該等器件包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、諸如所謂「智慧型」手機之電話手機、所謂「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或類似者。在一些狀況下,源器件12及目的器件14可經配備用於無線通信。
目的器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移動至目的器件14之任何類型之媒體或器件。在一個實例中,電腦可讀媒體 16可包含一通信媒體,從而使得源器件12能夠即時地將經編碼視訊資料直接傳輸至目的器件14。可根據通信標準(諸如,無線通信協定)調變經編碼之視訊資料,且將經編碼之視訊資料傳輸至目的器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的器件14之通信的任何其他設備。
在一些實例中,可將經編碼資料自輸出介面22輸出至儲存器件。類似地,可藉由輸入介面自儲存器件存取經編碼之資料。儲存器件可包括多種分散式或本端存取式資料儲存媒體中之任一者,諸如,硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼之視訊資料之任何其他合適的數位儲存媒體。在又一實例中,儲存器件可對應於一檔案伺服器或對應於可儲存源器件12所產生之經編碼視訊的另一中間儲存器件。
目的器件14可經由串流或下載而自儲存器件存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼之視訊資料且將彼經編碼之視訊資料傳輸至目的器件14的任何類型的伺服器。實例檔案伺服器包括網路伺服器(例如,用於網站)、FTP伺服器、網路附接儲存(NAS)器件或本端磁碟機。目的器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之組合。經編碼之視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸,或其組合。
本發明之技術並不限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,該等應用諸如:空中電視 廣播、有線電視傳輸、衛星電視傳輸、諸如HTTP動態自適應串流(DASH)之網際網路串流視訊傳輸、經編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於圖塊標頭中的長期參考圖像之改良式發信的技術。在其他實例中,源器件及目的器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。類似地,目的器件14可與外部顯示器件介接,而非包括整合式顯示器件。
圖1之所說明系統10僅為一個實例。用於圖塊標頭中之長期參考圖像之改良式發信的技術可由任何數位視訊編碼及/或解碼器件執行。雖然大體上藉由視訊編碼器件執行本發明之技術,但亦可藉由視訊編碼器/解碼器(通常被稱為「CODEC(編解碼器)」)執行該等技術。此外,亦可藉由視訊預處理器來執行本發明之技術。源器件12及目的器件14僅僅為此類寫碼器件之實例,在該等寫碼器件中,源器件12產生用於傳輸至目的器件14之經寫碼之視訊資料。在一些實例中,器件12、14可按照實質上對稱之方式進行操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,例如,用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括諸如視訊攝影機之視訊俘獲器件、含有先前俘獲之視訊的視訊存檔,及/或用以自視訊內容提供者接收視訊之視訊饋入介面。作為另一替代,視訊源18可產生基於電腦圖形 之資料作為源視訊、或產生實況視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12及目的器件14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術大體上可適用於視訊寫碼,且可適用於無線及/或有線應用。在每一狀況下,所俘獲的、預先俘獲的或電腦產生之視訊可由視訊編碼器20編碼。經編碼之視訊資訊接著可由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括:暫時性媒體,諸如,無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(圖中未展示)可自源器件12接收經編碼之視訊資料,且(例如經由網路傳輸)將經編碼之視訊資料提供至目的器件14。類似地,媒體生產設施(諸如,光碟壓印設施)之計算器件可自源器件12接收經編碼之視訊資料且產生含有經編碼之視訊資料之光碟。因此,在各種實例中,可將電腦可讀媒體16理解成包括各種形式之一或多個電腦可讀媒體。
目的器件14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義,亦由視訊解碼器30使用之語法資訊,該語法資訊包括描述區塊及其他經寫碼單元(例如GOP)之特性及/或處理的語法元素。顯示器件32向使用者顯示經解碼之視訊資料,且可包含各種顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型的顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中的高效率視訊寫碼(HEVC)標準之視訊寫碼標準而操作,且可符合HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準或者被稱作MPEG-4第10部分進階視訊寫碼(AVC)之其他專屬或工業標準或此類標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。雖然圖1中未展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或獨立資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
ITU-T H.264/MPEG-4(AVC)標準由ITU-T視訊寫碼專家群(VCEG)連同ISO/IEC動畫專家群(MPEG)一起作為被稱為聯合視訊小組(JVT)之集體合作之產物而制定。在一些態樣中,本發明中所描述之技術可應用於大體上符合H.264標準之器件。H.264標準由ITU-T研究小組且在日期為2005年3月描述於ITU-T推薦H.264(用於一般視聽服務之進階視訊寫碼)中,其在本文中可被稱作H.264標準或H.264規範,或H.264/AVC標準或規範。聯合視訊小組(JVT)繼續致力於對H.264/MPEG-4 AVC之擴展。
視訊編碼器20及視訊解碼器30可各自實施為各種合適的編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地在軟體中實施時,一器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合編碼器/解碼器(CODEC)的部分。
JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於視 訊寫碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。
一般而言,HM之工作模型描述視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之序列。位元串流內之語法資料可定義LCU之大小,LCU就像素之數目而言為最大寫碼單元。圖塊包括按寫碼次序之若干連續樹型區塊。可將視訊圖框或圖像分割成一或多個圖塊。每一樹型區塊可根據四分樹而分裂成若干寫碼單元(CU)。一般而言,四分樹資料結構中針對每一CU包括一個節點,其中根節點對應於樹型區塊。若將CU分裂成四個子CU,則對應於該CU之節點包括四個葉節點,該等葉節點中之每一者對應於該等子CU中之一者。
該四分樹資料結構中之每一節點可提供針對對應CU之語法資料。舉例而言,在四分樹中之節點可包括分裂旗標,其指示是否將對應於該節點之CU分裂成子CU。可遞歸地定義用於CU之語法元素,且用於CU之語法元素可取決於CU是否分裂成子CU。若CU未經進一步分裂,則其被稱作葉CU。在本發明中,即使不存在原始葉CU之明顯分裂,一葉CU之四個子CU亦將被稱作葉CU。舉例而言,若16×16大小之CU未經進一步分裂,則四個8×8子CU亦會被稱作葉CU,儘管該16×16 CU從未經分裂。
除了CU不具有大小區別之外,CU具有與H.264標準之巨集區塊類似的用途。舉例而言,樹型區塊可分裂成四個子節點(亦被稱作子CU),且每一子節點可又為上代節點並分裂成另外四個子節點。被稱作四分樹之葉節點之最終的未分裂子節點包含一寫碼節點,該寫碼節點亦被稱作葉CU。與經寫碼之位元串流相關聯的語法資料可定義可 分裂之樹型區塊之最大次數(其被稱作最大CU深度),且亦可定義該等寫碼節點之最小大小。因此,位元串流亦可定義一最小寫碼單元(SCU)。本發明使用術語「區塊」指代在HEVC之上下文中之CU、PU或TU中的任一者,或在其他標準之上下文中之類似資料結構(例如,在H.264/AVC中之巨集區塊及其子區塊)。
CU包括一寫碼節點及與該寫碼節點相關聯之若干預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小,且形狀必須為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹型區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係被跳過或直接模式編碼、框內預測模式編碼抑或框間預測模式編碼而不同。PU可分割成非正方形形狀。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹而分割成一或多個TU。TU之形狀可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,該等變換對於不同CU可不同。通常基於針對經分割LCU所定義之給定CU內之PU的大小而設定TU大小,但可能並非總是如此狀況。TU通常具有與PU相同的大小,或小於PU。在一些實例中,可使用已知為「殘餘四分樹」(RQT)之四分樹結構而將對應於CU之殘餘樣本再分為更小單元。RQT之葉節點可被稱作變換單元(TU)。可變換與TU相關聯之像素差值以產生變換係數,變換係數可被量化。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表示對應於對應CU之全部或一部分之空間區域,且可包括用於擷取PU之參考樣本之資料。此外,PU包括與預測有關之資料。舉例而言,當PU經框內模式編碼時,用於PU之資料可包括於殘餘四分樹(RQT)中,殘餘四分樹可包括描述對應於PU之TU之框內預測模式的資料。作為另一實 例,當PU經框間模式編碼時,PU可包括定義該PU之一或多個運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或用於運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。可使用RQT(亦被稱作TU四分樹結構)指定變換單元,如上文所論述。舉例而言,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成其他子TU。當TU未進一步分裂時,其可被稱作葉TU。一般而言,對於框內寫碼,屬於葉CU之所有葉TU共用相同框內預測模式。亦即,大體上應用相同框內預測模式來計算一葉CU的所有TU之預測值。對於框內寫碼,視訊編碼器可使用框內預測模式將每一葉TU之殘餘值計算為在CU之對應於該TU的部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可能大於或小於PU。對於框內寫碼,一PU可與用於同一CU之一對應葉TU位於相同位置。在一些實例中,葉TU之最大大小可對應於對應葉CU之大小。
此外,葉CU之TU亦可與被稱作殘餘四分樹(RQT)之各別四分樹資料結構相關聯。亦即,葉CU可包括指示如何將葉CU分割成TU之四分樹。TU四分樹之根節點大體上對應於葉CU,而CU四分樹之根節點大體上對應於樹型區塊(或LCU)。RQT之不分裂的TU被稱作葉TU。一般而言,除非另有指示,否則本發明分別使用術語CU及TU來指代葉CU及葉TU。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)大體包含一系列的一或多個視訊圖像。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括描述包括於GOP中之圖像數目的語法資料。圖像之每一圖塊可包括描述該各別圖塊之編碼模式的圖塊語法資 料。視訊編碼器20通常對個別視訊圖塊內之視訊區塊進行操作,以便對視訊資料編碼。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小方面不同。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,以及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小針對框間預測進行不對稱分割。在不對稱分割中,CU之一方向未分割,而另一方向被分割成25%及75%。CU之對應於25%分割區之部分由「n」繼之以「上」、「下」、「左」或「右」之指示來指示。因此,例如,「2N×nU」指代被水平分割而具有2N×0.5N PU頂部及2N×1.5N PU底部之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊在垂直方向中將具有16個像素(y=16)且在水平方向中將具有16個像素(x=16)。類似地,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。另外,區塊未必需要在水平方向中具有與在垂直方向中相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
在使用CU之PU進行框內預測性寫碼或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述於空間域(亦稱為像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可在將變換(例如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換)應用於殘餘視訊資料之後包含變換域中之係數。殘餘資料可對應於未經編碼之圖像之像素與對應於PU之預測值之間的像素 差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在應用任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化大體上指代如下程序:將變換係數量化以可能地減少用以表示該等係數之資料量,從而提供進一步壓縮。該量化程序可減少與該等係數中之一些或所有係數相關聯的位元深度。舉例而言,可在量化期間將n位元值降值捨位至m位元值,其中n大於m
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化之變換係數之二維矩陣產生一維向量。掃描可經設計成將較高能量(且因此較低頻率)係數置於陣列前部,且將較低能量(且因此較高頻率)係數置於陣列後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數,以產生可經熵編碼的序列化向量。在其他實例中,視訊編碼器20可執行自適應掃描。在掃描經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)、基於語法之上下文自適應二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法而對該一維向量熵編碼。視訊編碼器20亦可對與經編碼之視訊資料相關聯的語法元素熵編碼以供視訊解碼器30用於對視訊資料解碼。
為了執行CABAC,視訊編碼器20可將上下文模型內之上下文指派給待傳輸之符號。該上下文可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可建構VLC中之碼字使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用等長度碼字相比較)。機率判定可基於指派給符號之上下文而進行。
根據本發明之技術,視訊編碼器20與視訊解碼器30可經組態以利用用於發信資料以供(例如)在圖塊標頭、參數集(包括圖像參數集(PPS)及序列參數集(SPS))或類似者中識別長期參考圖像的改良式技術。大體上,視訊編碼器20與視訊解碼器30可經組態以單獨地或以任何組合來執行本發明技術中之任一者或全部。在一些實例中,視訊編碼器20與視訊解碼器30可經組態以執行用於對長期參考圖像發信△POC MSB循環之負值的方法。在一些實例中,視訊編碼器20與視訊解碼器30可經組態以使用差分寫碼來執行用於更有效地對具有不同LSB值之長期參考圖像發信△POC MSB循環值的方法。
在一些實例中,可將作為當前圖像之短期參考圖像而發信(或包括在當前圖像之短期參考圖像集中)的參考圖像排除在決定是否對長期參考圖像發送△POC MSB循環值所利用之參考圖像之外,以避免發送不必要的△POC MSB循環值。在一些實例中,當DPB中存在POC LSB等於poc_lsb_lt[i]之n個參考圖像(包括或排除短期參考圖像)時,且當在LSB值等於poc_lsb_lt[i]之當前圖像中發信n個長期參考圖像時,視訊編碼器20可僅對n-1個長期參考圖像發送△POC MSB循環值,且視訊解碼器30可僅對n-1個長期參考圖像接收此資料,但對所有n個長期參考圖像發送此資料係可能的。
上文各種技術中之任一者或全部可根據以下實例實施來實施。如下文所示,可修改WD7中描述長期參考圖像之MSB循環的語法元素。本發明亦描述用於導出陣列DeltaPocMSBCycleLt[]之一實例方法。本發明進一步描述用於參考圖像集之一實例解碼程序。此外,本發明描述語法元素delta_poc_msb_present_flag[i]及poc_lsb_lt[i]之語義。WD7之其他語法元素的語法及語義可保持不變。
表1表示圖塊標頭之語法的一實例集合。加底線文字表示相對於WD7之圖塊標頭語法的改變。在下文論述改變之語法元素的語義以及 其他語法元素的改變之語義。
在表1之實例中,圖塊標頭語法包括額外元素delta_poc_msb_cycle_lt_plus1[i]。在下文描述此語法元素之語義。在一些實例中,poc_lsb_lt[i]可指定包括在當前圖像之長期參考圖像集中之第i個長期參考圖像的圖像次序計數值之最低有效位元的值。poc_lsb_lt[i]語法元素之長度可為log2_max_pic_order_cnt_lsb_minus4+4位元。
在一些實例中,delta_poc_msb_present_flag[i]等於1可指定存在delta_poc_msb_cycle_lt_plus1[i]。delta_poc_msb_present_flag[i]等於0可指定不存在delta_poc_msb_cycle_lt_plus1[i]。當解碼圖像緩衝區在排除由當前圖像標記為「用於短期參考」的彼等圖像之外存在圖像次序計數值之最低有效位元等於poc_lsb_lt[i]的j個參考圖像(其中j為大於1的整數值)時,且當第i個長期參考圖像並非圖像次序計數值之最低有效位元等於由當前圖像發信之poc_lsb_lt[i]的第j個長期參考圖像時,delta_poc_msb_present_flag[i]可設定為等於1。
在一些實例中,delta_poc_msb_cycle_lt_plus1[i]可用以判定包括 在當前圖像之長期參考圖像集中之第i個長期參考圖像的圖像次序計數值之最高有效位元的值。當未被發信時,delta_poc_msb_cycle_lt_plus1[i]可取值為1。
變量DeltaPocMSBCycleLt[i]可根據以下演算法導出,其中(7-37)指代HEVC之一章節,亦即,相對於WD7的所改變章節。應注意,下文的實例導出意味著MSB循環係以其值之遞增次序發送。
DeltaPocMSBCycleLt[i]=delta_poc_msb_present_flag[i]*(delta_poc_msb_cycle_lt_plus1[i]-1);if(i!=0) (7-37)
DeltaPocMSBCycleLt[i]+=DeltaPocMSBCycleLt[i-1];DeltaPocMSBCycleLt[i]* MaxPicOrderCntLsb+pic_order_cnt_lsb-poc_lsb_lt[i]之值可處於1至224-1之範圍中,1與224-1包括在內。或者,可藉由將delta_poc_msb_cycle_lt_plusN[i](而非delta_poc_msb_cycle_lt_plus1[i])作為ue(v)(亦即,作為以左邊位元為先的經無正負號的整數指數哥倫布寫碼(Exp-Golomb-coded)之語法元素)發信來發送MSB循環,其中N為大於1的值。或者,可藉由將delta_poc_msb_cycle_lt[i](而非delta_poc_msb_cycle_lt_plus1[i])作為se(v)(亦即,作為以左邊位元為先的經帶正負號的整數指數哥倫布寫碼之語法元素)發信來發送MSB循環。
換言之,根據本發明之技術,表示圖像i之MSB循環(例如,實際上在位元串流中發信之delta_poc_msb_cycle_lt_plus1[i])的值可關於先前寫碼之長期參考圖像(例如,圖像i-1)之MSB循環,而非關於基本MSB值進行計算。此在數學上等效於將表示圖像i之MSB循環的值作為圖像i之POC值的MSB與圖像i-1之POC值的MSB之間的差來計算,假設此值最終與圖像i-1之MSB循環值相加以表示圖像i之真正的MSB循環值(其為圖像i之MSB與基本MSB之間的差)。此可達成位元串流之 位元節省,此係因為表示連續MSB循環值之間的差的值可小於長期參考圖像之MSB與基本MSB之間的差。
在一些實例中,視訊編碼器20與視訊解碼器30可根據以下有序步驟執行參考圖像集之導出程序及圖像標記,其中DPB指代如WD7之附錄C中所描述之解碼圖像緩衝區。應注意,下文實例中,短期參考圖像與長期參考圖像子集導出之次序相對於WD7中之次序而交換。右邊界(right margin)附近的附帶參考意欲指代WD7之章節。與WD7之演算法有關的此變化與其他變化在下文實例中使用加底線文字指出:
1.以下適用: RefPicSetStFoll[i]="no reference picture"
2.包括在RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll中之所有參考圖像標記為「用於短期參考」。
3.以下適用:
4.包括在RefPicSetLtCurr及RefPicSetStFoll中之所有參考圖像標記為「用於長期參考」。
5.解碼圖像緩衝區中的並不包括在RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中之所有參考圖像標記為「未用於參考」。
可能有包括在參考圖像集中,但不存在於解碼圖像緩衝區中之一或多個參考圖像。應忽略RefPicSetStFo1l或RefPicSetLtFoll中等於「無參考圖像」之條目。除非以下兩條件中之任一者為真,否則應針對RefPicSetStCurrBefore、RefPicSetStCurrAfter與RefPicSetLtCurr中等於「無參考圖像」之每一條目推斷無意的圖像損耗:a)位元串流中之第一經寫碼圖像為CRA圖像,且當前經寫碼圖像為與位元串流中之該第一經寫碼圖像相關聯的TFD圖像;及b)在解碼次序中位於當前經寫碼圖像之前的先前RAP圖像為BLA圖像,且該當前經寫碼圖像為與該BLA圖像相關聯的TFD圖像。
因此,根據本發明之技術,視訊寫碼器(例如,視訊編碼器20及/或視訊解碼器30)可使用差分寫碼來計算具有不同LSB值之圖像的MSB循環值。另外,視訊寫碼器可使用表示MSB循環之值來對與長期參考圖像中之一者(例如,圖像i-1或圖像i)有關的當前圖像寫碼。舉例而言,視訊寫碼器可使用上文所描述之公式(公式7-37)及/或上文所描述之演算法來判定參考圖像之POC值。
因此,視訊編碼器20與視訊解碼器30表示一視訊寫碼器的實例,該視訊寫碼器經組態以:對一第一值寫碼,該第一值表示視訊資料之當前圖像之圖像次序計數(POC)值的基本最高有效位元(MSB)值與該視訊資料之第一長期參考圖像之第一POC值的第一MSB值之間的差;對一第二值寫碼,該第二值表示該視訊資料之第二長期參考圖像之第二POC值的第二MSB值與該第一MSB值之間的差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分寫碼。
舉例而言,視訊編碼器20可針對當前圖像判定是否存在得以發信MSB循環值(亦稱為MSB值)之兩個或兩個以上長期參考圖像,即使當該等長期參考圖像具有不同LSB值時。在存在具有不同LSB值但得以發信MSB循環值之兩個(或兩個以上)長期參考圖像的情況下,視訊編碼器20可將表示第二長期參考圖像之MSB循環值的資料編碼為相對於第一長期參考圖像之MSB循環值的差(或△)。類似地,視訊編碼器20可將表示第一長期參考圖像之MSB循環值的資料編碼為相對於當前圖像之POC值之基本MSB值的差。視訊編碼器20可進一步對當前圖像(例如,一或多個區塊)中與第一長期參考圖像與第二長期參考圖像中之至少一者有關的至少一部分編碼。
因此,當視訊解碼器30接收指示長期參考圖像之MSB循環值的資料時,視訊解碼器30可對表示第一長期參考圖像之POC值的基本MSB之間的差的值解碼,且藉由將該值與該等基本MSB相加來計算第一長期參考圖像之POC值的MSB。視訊解碼器30亦可對表示第二長期參考圖像之POC值的MSB與第一長期參考圖像之POC值的MSB之間的差的值解碼,且藉由將該值與第一長期參考圖像之POC值的該等MSB 相加來計算第二長期參考圖像之該POC值的MSB。類似地,視訊解碼器30可使用長期參考圖像之POC值的MSB來解碼當前圖像中與第一長期參考圖像與第二長期參考圖像中之至少一者有關的至少一部分。
視訊編碼器20及視訊解碼器30可各自實施為多種合適編碼器或解碼器電路中之任一者(在適用時),諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為組合式視訊編碼器/解碼器(CODEC)之部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含一積體電路、一微處理器及/或一無線通信器件(諸如,蜂巢式電話)。
圖2為說明視訊編碼器20之實例的方塊圖,該視訊編碼器20可實施用於圖塊標頭中的長期參考圖像之改良式發信的技術。視訊編碼器20可執行視訊圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之寫碼模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指代若干基於時間之寫碼模式中的任一者。
如圖2中所示,視訊編碼器20接收待編碼之視訊圖框內之當前視訊區塊。在圖2之實例中,視訊編碼器20包括模式選擇單元40、參考圖像記憶體64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。模式選擇單元40又包括運動補償單元44、運動估計單元42、框內預測單元46及分割單元48。為了進行視訊區塊重建構,視訊編碼器20亦包括逆量化單元58、逆變換單元60及求和器62。亦可包括解區塊濾波器(圖2中未展示)以對區塊邊界進行濾波,從而自重建構之視訊 中移除方塊效應假影。若需要,解區塊濾波器通常對求和器62之輸出進行濾波。除解區塊濾波器之外,亦可使用額外濾波器(迴路內或迴路後)。為簡潔起見未展示此類濾波器,但此類濾波器必要時可對求和器50之輸出進行濾波(作為迴路內濾波器)。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖框或圖塊。可將該圖框或圖塊劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行所接收之視訊區塊相對於一或多個參考圖框中之一或多個區塊的框間預測性寫碼,以提供時間預測。框內預測單元46可替代地執行所接收之視訊區塊相對於在與待寫碼之區塊相同之圖框或圖塊中的一或多個相鄰區塊的框內預測性寫碼,以提供空間預測。視訊編碼器20可執行多個寫碼遍次(例如)以選擇用於視訊資料之每一區塊之適當寫碼模式。
此外,分割單元48可基於對先前寫碼遍次中之先前分割方案之評估而將視訊資料之區塊分割成子區塊。舉例而言,分割單元48可最初將一圖框或圖塊分割成LCU,且基於位元率-失真分析(例如,位元率-失真最佳化)來將該等LCU中之每一者分割成子CU。模式選擇單元40可進一步產生指示LCU至子CU之分割的四分樹資料結構。四分樹之葉節點CU可包括一或多個PU及一或多個TU。
模式選擇單元40可(例如)基於誤差結果而選擇寫碼模式(框內或框間)中之一者,且將所得的經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼之區塊以便用作參考圖框。模式選擇單元40亦將語法元素(諸如運動向量、框內模式指示符、分割資訊及其他此類語法資訊)提供至熵編碼單元56。根據本發明之技術,模式選擇單元40可向熵編碼單元56提供參考圖像識別資訊(諸如應將參考圖像處理為長期參考圖像抑或短期參考圖像),以及長期參考圖像之圖像次序計數(POC)值的最低有效位元 (LSB)。根據本發明之技術,視訊編碼器20之熵編碼單元56或另一單元可包括圖塊之圖塊標頭中的此類參考圖像識別資訊。或者,熵編碼單元56可包括諸如圖像參數集(PPS)或序列參數集(SPS)之參數集中的參考圖像識別資訊(例如,以指示哪個參考圖像為長期參考圖像)。
如上文所解釋,可使用長期參考圖像之POC值的LSB來發信長期參考圖像。舉例而言,熵編碼單元56可藉由在圖塊標頭、PPS或SPS中發信一參考圖像之POC值的LSB來指示該參考圖像為長期參考圖像。未以此方式發信之其他參考圖像可經處理為短期參考圖像。
藉由發信長期參考圖像之識別資訊,熵編碼單元56提供資料,該資料指示哪些參考圖像將儲存於視訊解碼器(例如,視訊解碼器30)之解碼圖像緩衝區(DPB)中達相對長期時間以及哪些參考圖像可較早自解碼圖像緩衝區中移除。大體上,長期參考圖像可用作用於對具有相對很晚解碼次序時間之圖像寫碼的參考圖像。因此,發信長期參考圖像之識別資訊為視訊解碼器(例如,視訊解碼器30)提供資訊,使得該視訊解碼器可判定是否自其自身DPB中丟棄參考圖像。
運動估計單元42及運動補償單元44可高度整合,但出於概念目的而分開說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示在當前視訊圖框或圖像內之視訊區塊的PU相對於參考圖框(或其他經寫碼單元)內的預測性區塊(其與該當前圖框(或其他經寫碼單元)內正被寫碼的當前區塊相關)之位移。預測性區塊為被發現在像素差方面緊密地匹配待寫碼區塊之區塊,該像素差可藉由絕對差和(SAD)、平方差和(SSD)或其他差度量予以判定。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中之參考圖像的次整數像素位置之值。舉例而言,視訊編碼器20可內插該參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可 執行相對於全像素位置及分數像素位置之運動搜尋,且以分數像素精度輸出運動向量。
運動估計單元42藉由比較經框間寫碼之圖塊中的視訊區塊的PU之位置與參考圖像之預測性區塊的位置來計算該PU之運動向量。可自第一參考圖像清單(清單0)或第二參考圖像清單(清單1)中選擇參考圖像,該等參考圖像清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。參考圖像記憶體64可儲存長期參考圖像與短期參考圖像兩者。運動估計單元42將所計算之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計單元42判定之運動向量來提取或產生預測性區塊。此外,在一些實例中,運動估計單元42及運動補償單元44可在功能上整合。在接收到當前視訊區塊之PU之運動向量時,運動補償單元44可在參考圖像清單中之一者中定位運動向量所指向的預測性區塊。求和器50藉由自正被寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值,如下文所論述。一般而言,運動估計單元42執行相對於亮度分量之運動估計,且運動補償單元44將基於該等亮度分量所計算之運動向量用於色度分量與亮度分量兩者。
模式選擇單元40亦可產生與視訊區塊及視訊圖塊相關聯的語法元素以供視訊解碼器30用於解碼視訊圖塊之視訊區塊。舉例而言,在計算視訊資料之區塊的運動向量之後(其中運動向量指向參考圖像中之一參考區塊),模式選擇單元40可產生運動參數之值,諸如儲存有參考圖像之參考圖像清單,及對應於參考圖像在該參考圖像清單中之位置的該參考圖像清單之索引。此等及其他運動參數可基於運動向量寫碼模式進行寫碼。舉例而言,使用進階運動向量預測(AMVP),熵編碼單元56可識別運動向量預測符(predictor)(對應於當前區塊在空間 或時間上的相鄰區塊),且明確地發信參考圖像清單、參考圖像索引,及水平與垂直運動向量差值。作為另一實例,藉由使用合併模式,熵編碼單元56可使用合併索引來識別運動向量預測符,且參考圖像清單及參考索引可繼承自運動向量預測符(例如,相鄰區塊之運動資訊為空間相鄰區塊抑或時間相鄰區塊)。
視訊編碼器20發信指示哪些參考圖像為長期參考圖像之資訊,從而既指示不自DPB丟棄此等圖像,又提供可用於參考圖像清單建構程序期間的資訊。以此方式,視訊解碼器(諸如視訊解碼器30)可能能夠準確地再生參考圖像清單,使得用作框間預測區塊之運動資訊的參考索引準確地指代正確的參考圖像。
如上文所指出,可使用長期參考圖像之POC值來發信長期參考圖像。POC值大體上對應於指示圖像之顯示次序(亦稱為輸出次序)的資料,該顯示次序不必與解碼次序(亦稱為位元串流次序)相同。長期參考圖像之POC值可僅使用最低有效位元(LSB)來發信。可不定期發信表示MSB之資料,例如,在兩個或兩個以上長期參考圖像具有相同LSB時發信。在一些情形中,即使當圖像中得以發信MSB資料之至少兩個圖像具有不同LSB時,視訊編碼器20亦可判定需要對兩個(或兩個以上)圖像發信表示MSB之資料。
根據本發明之技術,視訊編碼器20可將表示MSB之資料作為差而發信(例如,一組MSB與另一組MSB之間的差)。舉例而言,如上文關於表1所論述的,視訊編碼器20可計算基本MSB值與長期參考圖像之MSB值之間的差。熵編碼單元56可將此差作為表示長期參考圖像之MSB的值而發信。基本MSB值可對應於當前圖像之POC值的MSB。或者,基本MSB值可對應於另一圖像(諸如瞬時解碼器再新(IDR)圖像)的POC值的MSB。
在對長期參考圖像之差值編碼之後,熵編碼單元56可計算另一 長期參考圖像之POC值的MSB與先前長期參考圖像之POC值的MSB之間的差。類似地,熵編碼單元56可對後續長期參考圖像發信此第二差值,使得諸如視訊解碼器30之視訊解碼器可重建構該後續長期參考圖像之POC值的MSB。以此方式,視訊編碼器20可經組態以將表示長期參考圖像之POC值的MSB的資料編碼為差值,例如相對於基本MSB值或相對於其他長期參考圖像之POC值的先前編碼之MSB。此外,即使在POC值之LSB不同時,視訊編碼器20亦可發信此等差值。
如上文所論述,在一些實例中,視訊編碼器20可經組態以針對表示一或多個長期參考圖像之POC值的MSB與基本MSB值(或其他參考MSB)之間的差的差值編碼負整數值。舉例而言,當熵編碼單元56(或視訊編碼器20之另一單元)判定當前圖像之POC值等於MaxPicOrderCntLsb * N-1,且POC值等於MaxPicOrderCntLsb * N之圖像為得以發信delta_poc_msb_cycle_lt[i]之第一LTRP時,熵編碼單元56可針對LTRP之POC值的MSB寫碼值-1。
另外,或在替代情況中,視訊編碼器20可經組態以至少部分基於當前儲存於參考圖像集(或解碼圖像緩衝區)中之參考圖像的總數目及/或當前儲存於參考圖像集(或解碼圖像緩衝區)中之短期參考圖像的數目來對表示長期參考圖像之POC值的資料編碼。舉例而言,視訊編碼器20可經組態以基於參考圖像集(或解碼圖像緩衝區)中是否存在具有與長期參考圖像相同POC LSB值的任何其他長期參考圖像來判定是否對該長期參考圖像發信POC MSB循環值。因此,當參考圖像集中僅存在具有與該長期參考圖像相同POC LSB的一或多個短期參考圖像時,視訊編碼器20可避免編碼該長期參考圖像的POC MSB循環值。
另外,或在替代情況中,當解碼圖像緩衝區中存在具有與一長期參考圖像之POC值相同LSB的N個長期參考圖像時,且當視訊編碼器20已對該等長期參考圖像中之N-1個圖像的△POC MSB循環值編碼 時,視訊編碼器20可判定不對該長期參考圖像的△POC MSB循環值寫碼。
作為由運動估計單元42及運動補償單元44執行之框間預測(如上文所描述)之替代,框內預測單元46可框內預測當前區塊。詳言之,框內預測單元46可判定待用以對當前區塊編碼之框內預測模式。在一些實例中,框內預測單元46可(例如)在單獨之編碼遍次期間使用各種框內預測模式來對當前區塊編碼,且框內預測單元46(或在一些實例中,模式選擇單元40)可自所測試之模式選擇適當框內預測模式來使用。
舉例而言,框內預測單元46可使用對各種經測試之框內預測模式之位元率-失真分析而計算位元率-失真值,且在經測試模式當中選擇具有最佳位元率-失真特性之框內預測模式。位元率-失真分析大體上判定經編碼區塊與經編碼以產生該經編碼區塊的原始未經編碼區塊之間的失真(或誤差)之量以及用以產生經編碼區塊之位元率(亦即,位元數目)。框內預測單元46可根據失真及位元率而計算各種經編碼區塊之比率來判定哪一框內預測模式展現區塊之最佳位元率-失真值。
在選擇區塊之框內預測模式之後,框內預測單元46可向熵編碼單元56提供指示該區塊之選定框內預測模式的資訊。熵編碼單元56可對指示選定框內預測模式的資訊編碼。視訊編碼器20可在經傳輸之位元串流組態資料中包括各種區塊之編碼上下文之定義以及將用於該等上下文中之每一者之最有可能的框內預測模式、框內預測模式索引表及經修改之框內預測模式索引表的指示,該位元串流組態資料可包括複數個框內預測模式索引表及複數個經修改之框內預測模式索引表(亦被稱作碼字映射表)。
視訊編碼器20藉由自正被寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成一殘餘視訊區塊。求和器50表示執行此減 法運算之一或多個組件。變換處理單元52將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如頻域)。變換處理單元52可將所得的變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減少位元率。該量化程序可減少與該等係數中之一些或所有係數相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56對該經量化之變換係數熵寫碼。舉例而言,熵編碼單元56可執行上下文自適應可變長度寫碼(CAVLC)、上下文自適應二進位算術寫碼(CABAC)、基於語法之上下文自適應二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼之狀況下,上下文可基於相鄰區塊。在藉由熵編碼單元56進行熵寫碼之後,可將經編碼之位元串流傳輸至另一器件(例如,視訊解碼器30)或經封存以供稍後傳輸或擷取。
逆量化單元58及逆變換單元60分別應用逆量化及逆變換以在像素域中重建構殘餘區塊,(例如)以供稍後用作參考區塊。運動補償單元44可藉由將該殘餘區塊添加至參考圖像記憶體64之圖框中之一者的一預測性區塊來計算一參考區塊。運動補償單元44亦可對該經重建構的殘餘區塊應用一或多個內插濾波器以計算用於在運動估計中使用之次整數像素值。求和器62將該經重建構的殘餘區塊添加至由運動補償單元44產生之經運動補償的預測區塊以產生一經重建構的視訊區塊以 用於儲存於參考圖像記憶體64中。該經重建構的視訊區塊可由運動估計單元42及運動補償單元44用作一參考區塊以對隨後視訊圖框中之區塊框間寫碼。
圖2之視訊編碼器20表示視訊編碼器之一實例,該視訊編碼器可經組態以對視訊資料之當前圖像的資料寫碼,其中經寫碼資料表示當前圖像之長期參考圖像的圖像次序計數(POC)最高有效位元(MSB)循環的一負整數值,以及至少部分基於該MSB循環之該負整數值而對當前圖像中與長期參考圖像有關的至少一部分寫碼。
圖2之視訊編碼器20亦表示視訊編碼器之一實例,該視訊編碼器可(另外或作為替代)經組態以:對視訊資料的當前圖像之與第一長期參考圖像有關的至少第一部分及該當前圖像之與第二長期參考圖像有關的至少第二部分編碼;對第一值編碼,該第一值表示該視訊資料之當前圖像之圖像次序計數(POC)值的基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之第一POC值的第一MSB值之間的差;及對第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之第二POC值的第二MSB值與第一MSB值之間的差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
圖2之視訊編碼器20亦表示視訊編碼器之一實例,該視訊編碼器可(另外或作為替代)經組態以:針對當前圖像判定可用參考圖像之總數目中的標記為短期參考圖像之參考圖像的數目;基於參考圖像之該總數目及標記為短期參考圖像之參考圖像的數目而對該當前圖像的長期參考圖像之最高有效位元(MSB)值寫碼;及對該當前圖像中與該等可用參考圖像中之至少一者有關的至少一部分寫碼。
圖2之視訊編碼器20亦表示視訊編碼器之一實例,該視訊編碼器可(另外或作為替代)經組態以:判定當前圖像中圖像次序計數(POC)值具有相等最低有效位元(LSB)值的數目N個參考圖像;判定該當前 圖像之參考圖像集可包括N個長期參考圖像;及基於該等判定而針對該等長期參考圖像中之最多N-1者對△POC最高有效位元(MSB)循環值寫碼。
圖3為說明視訊解碼器30之實例的方塊圖,該視訊解碼器30可實施用於圖塊標頭中的長期參考圖像之改良式發信的技術。在圖3之實例中,視訊解碼器30包括熵解碼單元70、運動補償單元72、框內預測單元74、逆量化單元76、逆變換單元78、參考圖像記憶體82及求和器80。在一些實例中,視訊解碼器30可執行與關於視訊編碼器20(圖2)所描述之編碼遍次大體上互逆之解碼遍次。運動補償單元72可基於自熵解碼單元70接收之運動向量而產生預測資料,而框內預測單元74可基於自熵解碼單元70接收之框內預測模式指示符而產生預測資料。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼之視訊圖塊的視訊區塊以及相關聯語法元素的經編碼之視訊位元串流。視訊解碼器30之熵解碼單元70對該位元串流熵解碼,以產生經量化之係數、運動向量或框內預測模式指示符以及其他語法元素。熵解碼單元70向運動補償單元72轉發運動向量及其他語法元素。視訊解碼器30可接收視訊圖塊層級及/或視訊區塊層級的語法元素。
當視訊圖塊經寫碼為框內寫碼(I)圖塊時,框內預測單元74可基於所發信之框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經寫碼為框間寫碼(亦即B、P或GPB)圖塊時,運動補償單元72基於自熵解碼單元70接收之運動向量及其他語法元素來產生當前視訊圖塊之視訊區塊的預測性區塊。可根據參考圖像清單中之一者內的參考圖像中之一者而產生該等預測性區塊。視訊解碼器30可基於儲存於參考圖像記憶體82中之參考圖像使用預設建構技術來建構該等參考圖像清單,清單0及清單1。
視訊解碼器30可判定參考圖像集,其中視訊解碼器30可自該參考圖像集而建構參考圖像清單。在一些實例中,例如,當視訊解碼器30符合HEVC時,視訊解碼器30可根據HEVC WD7之章節8.3.3而建構參考圖像清單。參考圖像集大體上對應於當前儲存於經解碼圖像緩衝區中(例如,參考圖像記憶體82內)之參考圖像。參考圖像集之某些參考圖像可標記為短期參考圖像,而參考圖像集之其他參考圖像可標記為長期參考圖像。大體上,長期參考圖像標記為(例如)在囊封參考圖像之經寫碼視訊資料之網路提取層(NAL)單元的NAL單元標頭中「用於長期參考」。
根據本發明之技術,視訊解碼器30可經組態以使用差分寫碼來對用於長期參考圖像之識別符解碼。舉例而言,對於第一長期參考圖像(例如,圖像序列中索引值為0的長期參考圖像),視訊解碼器30可對指示長期參考圖像之POC MSB與當前圖像之POC MSB之間的差的差值解碼。當前圖像之POC MSB可稱為「基本MSB」。對於其他長期參考圖像(例如,該圖像序列中索引值大於0的長期參考圖像),視訊解碼器30可對指示長期參考圖像之POC MSB與先前長期參考圖像之POC MSB之間的差的差值解碼。假設POC MSB得以當前正經判定之長期參考圖像的索引值為i,視訊解碼器30可參考索引值為0與i-1之間任一值(0與i-1包括在內)之長期參考圖像的POC MSB來判定該POC MSB。亦即,視訊解碼器30可參考索引值為j之長期參考圖像的POC MSB,其中j介於0與i-1之間(0與i-1包括在內)。在一些情況中,差值可具有一負整數值。
在接收描述一長期參考圖像之POC MSB之間的差的差值之後,視訊解碼器30可判定該差值所應用之一POC MSB值(亦即,將該差值與該POC MSB值相加,以重建構該長期參考圖像之POC MSB)。舉例而言,若長期參考圖像之索引值為0(指示該長期參考圖像為一圖像序 列中的序數第一長期參考圖像),則視訊解碼器30可將當前圖像之POC MSB值用作基本MSB值,且將對長期參考圖像發信之差值與該基本MSB值相加。作為另一實例,若長期參考圖像的索引值大於0(指示該長期參考圖像並非該圖像序列中的序數第一長期參考圖像),假設索引值為i,則視訊解碼器30可將所發信之差值與索引值為i-1之長期參考圖像的POC MSB相加。
以此方式,視訊解碼器30可對第一值解碼,該第一值表示視訊資料之當前圖像之圖像次序計數(POC)值的基本最高有效位元(MSB)值與該視訊資料之第一長期參考圖像之第一POC值的第一MSB值之間的差,以及對一第二值解碼,該第二值表示該視訊資料之第二長期參考圖像之第二POC值的第二MSB值與該第一MSB值之間的差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。類似地,視訊解碼器30可使用該第一值(亦即,第一差值)將第一長期參考圖像之第一MSB循環值計算為DeltaPocMSBCycleLt[i-1],及將第二長期參考圖像之第二MSB循環值計算為DeltaPocMSBCycleLt[i],其中計算該第二MSB循環值包含基於DeltaPocMSBCycleLt[i-1]與該第二值(亦即,第二差值)而計算DeltaPocMSBCycleLt[i]。
另外,視訊解碼器30可對長期參考圖像之POC值的LSB解碼。LSB可在當前圖像之圖塊的圖塊標頭、包括當前圖像之序列的序列參數集(SPS)、當前圖像之圖像參數集(PPS)中或在別處發信。視訊解碼器30可串接長期參考圖像之POC值的MSB與LSB,以判定長期參考圖像之完整POC值。接著,視訊解碼器30可組譯包括POC值所識別之長期參考圖像的參考圖像清單。以此方式,視訊解碼器30可使用運動資訊(例如,識別參考圖像清單與參考索引之資料)以執行框間預測。舉例而言,如下文所解釋,運動補償單元72可至少部分基於對應於參考圖像清單中之一者中的圖像中之一者的識別參考圖像的運動資訊來判 定當前圖像之區塊的參考區塊。該參考圖像可對應於長期參考圖像中之一者,或對應於短期參考圖像。
運動補償單元72藉由剖析運動向量及其他語法元素而判定當前視訊圖塊之視訊區塊之預測資訊,且使用該預測資訊以產生正經解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元72使用所接收之語法元素中的一些以判定用以對視訊圖塊之視訊區塊寫碼的預測模式(例如,框內預測或框間預測)、框間預測圖塊類型(例如,B圖塊、P圖塊或GPB圖塊)、圖塊之參考圖像清單中之一或多者的建構資訊、圖塊之每一經框間編碼之視訊區塊的運動向量、圖塊之每一經框間寫碼之視訊區塊的框間預測狀態,及用以對當前視訊圖塊中之視訊區塊解碼的其他資訊。
運動補償單元72亦可基於內插濾波器而執行內插。運動補償單元72可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元72可根據接收之語法元素來判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。
逆量化單元76對提供於位元串流中且由熵解碼單元70解碼之經量化變換係數逆量化(亦即,解量化)。逆量化程序可包括針對視訊圖塊中之每一視訊區塊使用由視訊解碼器30計算的量化參數QPY,以判定量化程度且類似地判定應應用之逆量化的程度。逆變換單元78將逆變換(例如,逆DCT、逆整數變換或概念上類似之逆變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。
在運動補償單元72基於運動向量及其他語法元素而產生當前視訊區塊的預測性區塊之後,視訊解碼器30藉由對來自逆變換單元78之殘餘區塊與由運動補償單元72產生之對應預測性區塊求和而形成經解碼之視訊區塊。求和器80表示執行此加法運算之一或多個組件。若需 要,亦可應用解區塊濾波器來對經解碼區塊濾波以便移除方塊效應假影。其他迴路濾波器(寫碼迴路中或寫碼迴路後)亦可用以使像素轉變平滑,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼視訊區塊儲存於參考圖像記憶體82中,該參考圖像記憶體82儲存用於後續運動補償之參考圖像。參考圖像記憶體82亦儲存經解碼之視訊,用於稍後呈現於顯示器件上(諸如圖1之顯示器件32)。
以此方式,圖3之視訊解碼器30表示一視訊解碼器的實例,該視訊解碼器經組態以:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
圖3之視訊解碼器30亦表示視訊解碼器之一實例,該視訊解碼器30可(另外或作為替代)經組態以對視訊資料之當前圖像的資料解碼,其中經解碼資料表示與當前圖像有關之長期參考圖像的圖像次序計數(POC)最高有效位元(MSB)循環的一負整數值,且至少部分基於該MSB循環之該負整數值來對當前圖像中與長期參考圖像有關的至少一部分解碼。
圖3之視訊解碼器30亦表示視訊解碼器之一實例,該視訊解碼器可(另外或作為替代)經組態以:針對一當前圖像判定可用參考圖像之總數目中的標記為短期參考圖像之參考圖像的數目;基於參考圖像之該總數目及標記為短期參考圖像之參考圖像的該數目,對該當前圖像 的長期參考圖像之最高有效位元(MSB)值解碼;及對該當前圖像中與該等可用參考圖像中之至少一者有關的至少一部分解碼。
圖3之視訊解碼器30亦表示視訊解碼器之一實例,該視訊解碼器可(另外或作為替代)經組態以:判定一當前圖像中圖像次序計數(POC)值具有相等最低有效位元(LSB)值的數目N個參考圖像;判定參考圖像集可包括N個長期參考圖像;及基於該等判定而針對該等長期參考圖像中之最多N-1者對△POC最高有效位元(MSB)循環值解碼。
圖4為說明經寫碼之視訊圖像序列100-132的概念圖。該等圖像具有不同陰影,以指示階層式預測結構內的位置。舉例而言,圖像100、116及132具有黑色陰影,以表示圖像100、116及132位於階層式預測結構之頂部。圖像100、116及132可包含(例如)以單一方向自其他圖像預測的經框內寫碼之圖像或經框間寫碼之圖像(例如,P圖像)。當進行框內寫碼時,圖像100、116、132僅自同一圖像內的資料中預測。當進行框間寫碼時,如自圖像116至圖像100之虛線箭頭所指示,圖像116(例如)可關於圖像100之資料進行寫碼。圖像116、132分別形成圖像群組(GOP)134、136之關鍵圖像。
圖像108、124具有深陰影,以指示該等圖像接著在編碼階層中位於圖像100、116及132之後。圖像108、124可包含經雙向框間模式預測編碼之圖像。舉例而言,圖像108可自圖像100及116之資料而預測,而圖像124可自圖像116及132而預測。圖像104、112、120及128具有淺陰影,以指示該等圖像接著在編碼階層中位於圖像108與124之後。圖像104、112、120及128亦可包含經雙向框間模式預測編碼之圖像。舉例而言,圖像104可自圖像100及108而預測,圖像112可自圖像108及116而預測,圖像120可自圖像116及124而預測,且圖像128可自圖像124及132而預測。大體上,階層中較低的圖像可自階層中較高的任何參考圖像而編碼,假設該等參考圖像仍在解碼圖像緩衝區中緩 衝,且假設該等參考圖像相比當前正經寫碼之圖像更早地進行寫碼。
最後,圖像102、106、110、114、118、122、126及130具有白色陰影,以指示此等圖像在編碼階層位於最後。圖像102、106、110、114、118、122、126及130可為經雙向框間模式預測編碼之圖像。圖像102可自圖像100及104而預測,圖像106可自圖像104及108而預測,圖像110可自圖像108及112而預測,圖像114可自圖像112及116而預測,圖像118可自圖像116及120而預測,圖像122可自圖像120及124而預測,圖像126可自圖像124及128而預測,且圖像130可自圖像128及132而預測。此外,應理解,寫碼階層中較低的圖像可自寫碼階層中較高的其他圖像而寫碼。舉例而言,另外或在替代情況中,圖像102、106、110或114中之任一者或全部可相對於圖像100、116或108中之任一者而預測。
圖像100至132係以顯示次序進行說明。亦即,繼解碼之後,圖像100顯示於圖像102之前,圖像102顯示於圖像104之前,諸如此類。如上文所論述,POC值大體上描述圖像之顯示次序,該顯示次序亦實質上與原圖像被編碼之前經俘獲或產生之次序相同。然而,歸因於編碼階層,圖像100至132可以不同次序進行解碼。此外,在進行編碼時,圖像100至132可以解碼次序而配置於包括圖像100至132之經編碼資料的位元串流中。舉例而言,在GOP 134之圖像中,圖像116可最後一個顯示。然而,歸因於編碼階層,在GOP 134中,圖像116可第一個解碼。亦即,為了對圖像108適當地解碼,例如,圖像116可能需要第一個解碼,以便充當圖像108之參考圖像。類似地,圖像108可充當圖像104、106、110及112之參考圖像,且因此可能需要在圖像104、106、110及112之前解碼。
另外,某些圖像可經處理為長期參考圖像,而其他圖像可處理為短期參考圖像。舉例而言,假定圖像100及116表示長期參考圖像, 而圖像108、104及112表示短期參考圖像。在此實例中,可能存在以下狀況:圖像102及106可關於圖像100、116、108或104中之任一者進行預測,而圖像110及114可關於圖像100、116、108或112中之任一者進行預測。換言之,圖像104可能無法在對圖像110及114寫碼時用於參考。作為另一實例,假設圖像100及116表示長期參考圖像,且圖像108、104及112表示短期參考圖像,圖像108、104及112可能無法在對圖像118、122、126及130寫碼時用於參考。
根據本發明之技術,可在用於圖像100至132中之任一者或全部的圖塊之圖塊標頭中發信與長期參考圖像有關的資料。或者,可在PPS、SPS或其他資料結構中發信資料。
再次假設,圖像100及116表示長期參考圖像,視訊編碼器20可將圖像100之POC MSB編碼為相對於基本MSB值(例如,諸如圖像102之當前圖像的POC MSB)的差。亦即,視訊編碼器20可計算圖像100之POC MSB與圖像102之POC MSB之間的差,且對圖像100之差值編碼。類似地,視訊編碼器20可計算圖像116之POC MSB與圖像100之POC MSB之間的差,且對圖像116之差值編碼。視訊編碼器20亦可對圖像100及116的LSB值編碼。
因此,視訊解碼器30可藉由對圖像100之差值解碼,且將該差值與圖像102之基本MSB值相加,來重建構圖像100及116之POC值。類似地,視訊解碼器30可對圖像116之差值解碼,且將該差值與圖像100之POC MSB相加。視訊解碼器30亦可對圖像100及116的POC LSB值解碼。視訊解碼30可串接圖像100之POC MSB與圖像100之POC LSB以再生圖像100之POC值。類似地,視訊解碼30可串接圖像116之POC MSB與圖像116之POC LSB以再生圖像116之POC值。
以此方式,視訊編碼器20與視訊解碼器30兩者可經組態以:對一第一值寫碼,該第一值表示視訊資料之一當前圖像之一圖像次序計 數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值寫碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分寫碼。
更確切而言,視訊編碼器20可對表示待包括於當前圖像(例如,圖像102)之參考圖像清單中的長期參考圖像之POC值的資料編碼。大體上,視訊編碼器20可指示在當前圖像之至少一部分關於參考圖像而編碼時,該參考圖像應包括於參考圖像清單中。當圖像之一區塊關於參考圖像而框間編碼,使得該區塊之運動向量指向該參考圖像之參考區塊時,該圖像之一部分可視為關於該參考圖像編碼。該區塊之運動資訊可包括參考圖像清單識別符(例如,清單0或清單1),以及對應於由該參考圖像清單識別符所識別之參考圖像清單中之參考圖像的參考索引。
因此,視訊編碼器20可關於圖像100之參考區塊而對圖像102之區塊編碼。亦即,視訊編碼器20可對區塊執行運動搜尋,且相對於其他參考區塊而判定圖像100之參考區塊產生一可接受之誤差值。類似地,視訊編碼器20可關於圖像116之參考區塊而對圖像102之不同區塊編碼。
圖5為根據本發明技術的說明用於對長期參考圖像之POC值編碼之實例方法的流程圖。出於解釋之目的,圖5之方法關於圖1及圖2之視訊編碼器20及其組件而進行解釋。然而,應理解,其他視訊編碼器件可經組態以執行圖5之方法。
最初,視訊編碼器20可使用一或多個參考圖像來對當前圖像之資料編碼(150)。接著,視訊編碼器20可判定用於對當前圖像編碼之參考圖像(152)。更確切而言,視訊編碼器20可判定一組可用參考圖像中之實際上在對當前圖像編碼時用於參考的參考圖像。在一些實例中,可整合且實質上同時執行步驟150及152。可用參考圖像可包括長期參考圖像(LTRP)及短期參考圖像(STRP)。視訊編碼器20可基於若干各種嘗試寫碼遍歷之後所獲得的寫碼結果來判定將一參考圖像設定為長期參考圖像抑或短期參考圖像。舉例而言,當寫碼結果(例如,位元率-失真最佳化(RDO)度量)在一特定參考圖像被處理為長期參考圖像時大體上更好(潛在地位移儲存參考圖像長期所消耗之記憶體的量)時,視訊編碼器20可將該參考圖像處理為長期參考圖像。
在任何狀況中,在判定一組參考圖像及待處理為長期參考圖像之彼等參考圖像之後,視訊編碼器20可對指示將作為長期參考圖像包括於當前圖像之參考圖像清單中之圖像的資訊編碼。經編碼資訊可包含表示長期參考圖像之POC值的資料。視訊編碼器20可在當前圖像之圖塊的圖塊標頭、對應於當前圖像之PPS、包括當前圖像之序列的SPS中或在別處對此資訊編碼。
視訊編碼器20可對指示序數第一長期參考圖像之POC值之MSB的資料以及指示序數第一長期參考圖像之POC值之LSB的資料編碼(154)。為了對MSB編碼,視訊編碼器20可計算第一長期參考圖像之POC值的MSB與當前圖像之POC值的MSB之間的差,且對此計算出的差值編碼。
接著,視訊編碼器20可判定後續LTRP之POC值的LSB是否等於當前圖像之另一參考圖像之POC值的LSB(156)。當視訊編碼器20判定後續LTRP之POC值的LSB等於當前圖像之另一參考之POC值的LSB(156之「是」分支)時,視訊編碼器20可對表示後續LTRP之POC值的MSB 與先前LTRP(亦即,POC MSB資訊得以編碼之最近LTRP)之POC值的MSB之間的差的資料編碼(158)。最近LTRP之POC值的LSB不必與當前正經編碼之LTRP之POC值的LSB相同。如上文所論述,為計算差值,假設後續LTRP具有索引值i,若LTRP j為POC MSB資訊得以寫碼之先前LTRP,則視訊編碼器20可計算LTRP i之POC值的MSB與LTRP j之POC值的MSB之間的差。接著,視訊編碼器20可對該差值編碼。此差值可對應於delta_poc_msb_cycle_lt[i](或delta_poc_msb_cycle_lt_plus1[i])。
在對差值編碼之後,或當下一LTRP之POC值的LSB不等於另一參考圖像之LSB(156之「否」分支)時,視訊編碼器20可對LTRP之POC值的LSB寫碼(160)。接著,視訊編碼器20可判定是否存在當前圖像之更多LTRP(162)。當存在當前圖像之更多LTRP(162之「是」分支)時,視訊編碼器20可前進,以使用如上文所論述之差分寫碼來對剩餘LTRP之POC值的LSB及(在必要時)MSB編碼。然而,當不存在當前圖像之更多LTRP(162之「否」分支)時,視訊編碼器20可輸出經編碼資料(164),該經編碼資料可包括當前圖像之經編碼區塊、當前圖像之長期參考圖像的經編碼POC值(包括LSB及當LSB並不唯一時,包括MSB之差值),以及類似者。
以此方式,圖5之方法表示方法之一實例,該方法包括:對視訊資料的一當前圖像之與一第一長期參考圖像有關的至少一第一部分及該當前圖像中之與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一 POC值與該第二POC值具有不同的最低有效位元(LSB)值。
圖6為根據本發明技術的說明用於對長期參考圖像之POC值解碼之實例方法的流程圖。出於解釋之目的,圖6之方法關於圖1及圖3之視訊解碼器30及其組件進行解釋。然而,應理解,其他視訊解碼器件可經組態以執行圖6之方法。
最初,視訊解碼器30可對當前圖像之序數第一長期參考圖像(LTRP)之POC值的MSB與LSB解碼(200)。舉例而言,視訊解碼器30可對表示第一LTRP之POC值的MSB與當前圖像之POC值的MSB之間的差的差值解碼。接著,視訊解碼器30可將該差值與當前圖像之POC值的MSB相加,以獲得第一LTRP之MSB。視訊解碼器30亦可對第一LTRP之POC值的LSB解碼,且串接第一LTRP之POC值的MSB與LSB,以再生LTRP之POC值。視訊解碼器30亦可在未發送MSB時僅對第一LTRP之POC值的LSB解碼,且可僅使用LSB值以識別是否不存在具有相同POC LSB值的其他參考圖像。
接著,視訊解碼器30可對下一個LTRP之POC值的LSB解碼(202)。在圖6之實例中,視訊解碼器30判定下一個LTRP之POC值的LSB是否等於當前圖像之另一LTRP的LSB(204)。在(例如)如上文關於表1所解釋的其他實例中,視訊解碼器30可判定旗標值是否指示對下一個LTRP之POC值發信MSB。在任何狀況下,視訊解碼器30可判定是否對下一個LTRP之POC值發信MSB。當對下一個LTRP之POC值發信MSB時(例如,當下一個LTRP之POC值的LSB等於另一參考圖像之LSB(204之「是」分支)時),視訊解碼器30可對相對於先前LTRP之POC值的MSB的MSB差值解碼(206)。亦即,視訊解碼器30可對針對LTRP i發信之差值解碼,且將該差值與LTRP j之POC值的MSB相加,其中LTRP j為MSB資訊得以解碼之先前LTRP。視訊解碼器30可藉由串接下一個LTRP之MSB(隱含地計算或判定)與LSB,來進一步重組譯 下一個LTRP之POC值。
在判定下一個LTRP之POC值的LSB不等於另一參考圖像之LSB(204之「否」分支)之後,或在對下一個LTRP之MSB的差值解碼之後,視訊解碼器30可判定是否存在當前圖像之更多LTRP(210)。若存在當前圖像之更多LTRP(210的「是」分支),則視訊解碼器30可前進以對後續LTRP之POC值解碼,例如,如上文所論述。一旦不存在當前圖像之更多LTRP(210的「否」分支),視訊解碼器30便可組譯包括經發信之LTRP的一或多個參考圖像清單(212)。接著,視訊解碼器30可使用參考圖像清單來對當前圖像解碼(214)。
舉例而言,當區塊進行框間預測時,該區塊可包括參考圖像清單之一指示,及指示該區塊之一參考圖像的該參考圖像清單之參考索引。該區塊可進一步包括用於重建構該區塊之運動向量的資料。因此,視訊解碼器30可使用運動向量而自參考圖像中擷取參考區塊。視訊解碼器30可(例如)藉由對區塊之變換係數解碼、逆量化及逆變換來進一步對區塊之誤差值解碼。接著,視訊解碼器30可組合參考區塊與經重建構之殘餘區塊,以對該區塊解碼。
以此方式,圖6之方法表示方法之一實例,該方法包括:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可按照一不同序列執行、可添加、合併或完全省略(例如,對於實踐該等技術而言並非所有所描述之動作或事件皆係必要的)。此外,在某些實例中,可(例如)經由多執行緒處理、中斷處理或多個處理器同時而非順序地執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體來實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
藉由實例而非限制,此類電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而實情為,係有關非暫時性有形儲存 媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片集)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。實情為,如上文所描述,可將各種單元組合於編解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合且結合合適的軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例屬於以下申請專利範圍之範疇內。

Claims (30)

  1. 一種解碼視訊資料之方法,該方法包含:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
  2. 如請求項1之方法,其進一步包含:使用該第一值將該第一長期參考圖像之一第一MSB循環值計算為DeltaPocMSBCycleLt[i-1];及將該第二長期參考圖像之一第二MSB循環值計算為DeltaPocMSBCycleLt[i],其中計算該第二MSB循環值包含基於DeltaPocMSBCycleLt[i-1]與該第二值而計算DeltaPocMSBCycleLt[i]。
  3. 如請求項1之方法,其中該第一長期參考圖像對應於一索引j,其中該第二長期參考圖像對應於一索引i,其中該第一值包含delta_poc_msb_cycle_lt_plus1[j],其中該第二值包含delta_poc_msb_cycle_lt_plus1[i],且其中j處於0至i-1之範圍中,0與i-1包括在內。
  4. 如請求項1之方法,其中該第一值與該第二值中之至少一者包含一負整數值。
  5. 如請求項1之方法,其進一步包含至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像而判定該第一POC值與該第二POC值中之至少一者。
  6. 一種用於對視訊資料解碼之器件,該器件包含一視訊解碼器,其經組態以:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
  7. 如請求項6之器件,其中該視訊解碼器經進一步組態以:使用該第一值將該第一長期參考圖像之一第一MSB循環值計算為DeltaPocMSBCycleLt[i-1];及將該第二長期參考圖像之一第二MSB循環值計算為DeltaPocMSBCycleLt[i],其中計算該第二MSB循環值包含基於DeltaPocMSBCycleLt[i-1]與該第二值來計算DeltaPocMSBCycleLt[i]。
  8. 如請求項6之器件,其中該第一長期參考圖像對應於一索引i-1,其中該第二長期參考圖像對應於一索引i,其中該第一值包含delta_poc_msb_cycle_lt_plus1[i-1],且其中該第二值包含delta_poc_msb_cycle_lt_plus1[i]。
  9. 如請求項6之器件,其中該第一值與該第二值中之至少一者包含一負整數值。
  10. 如請求項6之器件,其中該視訊解碼器經進一步組態以:至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像來判定該第一POC值與該第二POC值中之至少一者。
  11. 一種用於對視訊資料解碼之器件,該器件包含:用於對一第一值解碼的構件,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;用於對一第二值解碼的構件,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及用於對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼的構件。
  12. 如請求項11之器件,其進一步包含:用於使用該第一值將該第一長期參考圖像之一第一MSB循環值計算為DeltaPocMSBCycleLt[i-1]的構件;及用於將該第二長期參考圖像之一第二MSB循環值計算為DeltaPocMSBCycleLt[i]的構件,其中計算該第二MSB循環值包含基於DeltaPocMSBCycleLt[i-1]與該第二值來計算DeltaPocMSBCycleLt[i]。
  13. 如請求項11之器件,其中該第一長期參考圖像對應於一索引j,其中該第二長期參考圖像對應於一索引i,其中該第一值包含 delta_poc_msb_cycle_lt_plus1[j],其中該第二值包含delta_poc_msb_cycle_lt_plus1[i],且其中j處於0至i-1之範圍中,0與i-1包括在內。
  14. 如請求項11之器件,其中該第一值與該第二值中之至少一者包含一負整數值。
  15. 如請求項11之器件,其進一步包含用於至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像來判定該第一POC值與該第二POC值中之至少一者的構件。
  16. 一種電腦可讀儲存媒體,其上儲存有指令,該等指令在被執行時使得一處理器執行以下動作:對一第一值解碼,該第一值表示視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之一第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;對一第二值解碼,該第二值表示該視訊資料之一第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值;及對該視訊資料之一當前圖像中的與使用該第一值之該第一長期參考圖像及使用該第一值與該第二值之該第二長期參考圖像中的至少一者有關的至少一部分解碼。
  17. 如請求項16之電腦可讀儲存媒體,其進一步包含使得該處理器執行以下動作之指令:使用該第一值將該第一長期參考圖像之一第一MSB循環值計算為DeltaPocMSBCycleLt[i-1];及將該第二長期參考圖像之一第二MSB循環值計算為 DeltaPocMSBCycleLt[i],其中計算該第二MSB循環值包含基於DeltaPocMSBCycleLt[i-1]與該第二值來計算DeltaPocMSBCycleLt[i]。
  18. 如請求項16之電腦可讀儲存媒體,其中該第一長期參考圖像對應於一索引j,其中該第二長期參考圖像對應於一索引i,其中該第一值包含delta_poc_msb_cycle_lt_plus1[j],其中該第二值包含delta_poc_msb_cycle_lt_plus1[i],且其中j處於0至i-1之範圍中,0與i-1包括在內。
  19. 如請求項16之電腦可讀儲存媒體,其中該第一值與該第二值中之至少一者包含一負整數值。
  20. 如請求項16之電腦可讀儲存媒體,其進一步包含使得該處理器執行以下動作之指令:至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像來判定該第一POC值與該第二POC值中之至少一者。
  21. 一種對視訊資料編碼之方法,該方法包含:對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與該第二POC值具有不同的最低有效位元(LSB)值。
  22. 如請求項21之方法,其進一步包含:將該第一值計算為該第一長期參考圖像的作為DeltaPocMSBCycleLt[i-1]之一第一MSB循環值與該基本MSB值之間的一差;及將該第二值計算為該第二長期參考圖像的作為DeltaPocMSBCycleLt[i]之一第二MSB循環值與該第一MSB值之間的一差。
  23. 如請求項21之方法,其中該第一長期參考圖像對應於一索引j,其中該第二長期參考圖像對應於一索引i,其中該第一值包含delta_poc_msb_cycle_lt_plus1[j],其中該第二值包含delta_poc_msb_cycle_lt_plus1[i],且其中j處於0至i-1之範圍中,0與i-1包括在內。
  24. 如請求項21之方法,其中該第一值與該第二值中之至少一者包含一負整數值。
  25. 如請求項21之方法,其中對該第一值編碼與對該第二值編碼包含至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像來對該第一值編碼且對該第二值編碼。
  26. 一種用於對視訊資料編碼之器件,該器件包含一視訊編碼器,其經組態以:對視訊資料的一當前圖像中與一第一長期參考圖像有關的至少一第一部分及該當前圖像中與一第二長期參考圖像有關的至少一第二部分編碼;對一第一值編碼,該第一值表示該視訊資料之一當前圖像之一圖像次序計數(POC)值的一基本最高有效位元(MSB)值與該視訊資料之該第一長期參考圖像之一第一POC值的一第一MSB值之間的一差;及對一第二值編碼,該第二值表示該視訊資料之該第二長期參考圖像之一第二POC值的一第二MSB值與該第一MSB值之間的一差,其中該第一POC值與 該第二POC值具有不同的最低有效位元(LSB)值。
  27. 如請求項26之器件,其中該視訊編碼器經組態以:將該第一值計算為該第一長期參考圖像的作為DeltaPocMSBCycleLt[i-1]之一第一MSB循環值與該基本MSB值之間的一差;及將該第二值計算為該第二長期參考圖像的作為DeltaPocMSBCycleLt[i]之一第二MSB循環值與該第一MSB值之間的一差。
  28. 如請求項26之器件,其中該第一長期參考圖像對應於一索引j,其中該第二長期參考圖像對應於一索引i,其中該第一值包含delta_poc_msb_cycle_lt_plus1[j],其中該第二值包含delta_poc_msb_cycle_lt_plus1[i],且其中j處於0至i-1之範圍中,0與i-1包括在內。
  29. 如請求項26之器件,其中該第一值與該第二值中之至少一者包含一負整數值。
  30. 如請求項26之器件,其中為了對該第一值與該第二值編碼,該視訊編碼器經組態以至少部分基於標記為該當前圖像之短期參考圖像的若干參考圖像來對該第一值與該第二值編碼。
TW102123363A 2012-06-28 2013-06-28 對視訊寫碼發信長期參考圖像 TWI558179B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261665784P 2012-06-28 2012-06-28
US13/924,016 US9332255B2 (en) 2012-06-28 2013-06-21 Signaling long-term reference pictures for video coding

Publications (2)

Publication Number Publication Date
TW201408082A true TW201408082A (zh) 2014-02-16
TWI558179B TWI558179B (zh) 2016-11-11

Family

ID=49778158

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102123363A TWI558179B (zh) 2012-06-28 2013-06-28 對視訊寫碼發信長期參考圖像

Country Status (25)

Country Link
US (1) US9332255B2 (zh)
EP (1) EP2868081B1 (zh)
JP (1) JP6239609B2 (zh)
KR (1) KR101719930B1 (zh)
CN (1) CN104412599B (zh)
AR (1) AR093754A1 (zh)
AU (1) AU2013280659B2 (zh)
BR (1) BR112014032473B1 (zh)
CA (1) CA2875713C (zh)
DK (1) DK2868081T3 (zh)
ES (1) ES2736312T3 (zh)
HK (1) HK1204185A1 (zh)
HU (1) HUE044918T2 (zh)
IL (1) IL235969A (zh)
MY (1) MY181793A (zh)
PH (1) PH12014502731B1 (zh)
PL (1) PL2868081T3 (zh)
PT (1) PT2868081T (zh)
RU (1) RU2642361C2 (zh)
SG (1) SG11201408111UA (zh)
SI (1) SI2868081T1 (zh)
TW (1) TWI558179B (zh)
UA (1) UA116214C2 (zh)
WO (1) WO2014004391A1 (zh)
ZA (1) ZA201500618B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US10051264B2 (en) 2012-04-20 2018-08-14 Qualcomm Incorporated Marking reference pictures in video sequences having broken link pictures
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US10194146B2 (en) 2013-03-26 2019-01-29 Qualcomm Incorporated Device and method for scalable coding of video information
US10356426B2 (en) * 2013-06-27 2019-07-16 Google Llc Advanced motion estimation
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US9848199B2 (en) * 2014-03-17 2017-12-19 Qualcomm Incorporated Device and method for scalable coding of video information
US11595652B2 (en) * 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
US11985318B2 (en) * 2015-12-24 2024-05-14 OP Solultions, LLC Encoding video with extended long term reference picture retention
US11736687B2 (en) 2017-09-26 2023-08-22 Qualcomm Incorporated Adaptive GOP structure with future reference frame in random access configuration for video coding
WO2020112488A1 (en) * 2018-11-30 2020-06-04 Futurewei Technologies, Inc. Signaling of reference picture lists in video coding
US10904545B2 (en) 2018-12-26 2021-01-26 Tencent America LLC Method for syntax controlled decoded picture buffer management
EP3918801A4 (en) * 2019-01-28 2022-06-15 OP Solutions, LLC ONLINE AND OFFLINE CHOICE OF EXTENDED LONG-TERM REFERENCE IMAGE STORAGE
SG11202108105YA (en) * 2019-01-28 2021-08-30 Op Solutions Llc Explicit signaling of extended long term reference picture retention
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001086960A2 (en) 2000-05-10 2001-11-15 Picturetel Corporation Video coding using multiple buffers
TWI249356B (en) * 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
US20050008240A1 (en) * 2003-05-02 2005-01-13 Ashish Banerji Stitching of video for continuous presence multipoint video conferencing
FR2874292B1 (fr) 2004-08-10 2007-01-26 Thales Sa Procede de mise en forme de trames d'une sequence video
CN102761744B (zh) 2006-10-13 2015-10-28 汤姆逊许可公司 用于多视点视频编码的参考图像列表管理语法
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
US9210480B2 (en) 2007-12-20 2015-12-08 Broadcom Corporation Video processing system with layered video coding and methods for use therewith
US9237355B2 (en) * 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
US20120269275A1 (en) 2010-10-20 2012-10-25 Nokia Corporation Method and device for video coding and decoding
WO2013002701A1 (en) 2011-06-30 2013-01-03 Telefonaktiebolaget L M Ericsson (Publ) Absolute or explicit reference picture signaling
CN102256125B (zh) * 2011-07-14 2013-06-05 北京工业大学 面向高效视频编码hevc基于上下文的自适应算数编码方法
US9432665B2 (en) * 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures

Also Published As

Publication number Publication date
PT2868081T (pt) 2019-07-23
SG11201408111UA (en) 2015-01-29
US20140003538A1 (en) 2014-01-02
BR112014032473A2 (pt) 2017-06-27
ZA201500618B (en) 2017-01-25
EP2868081B1 (en) 2019-04-17
JP6239609B2 (ja) 2017-11-29
WO2014004391A1 (en) 2014-01-03
AR093754A1 (es) 2015-06-24
US9332255B2 (en) 2016-05-03
BR112014032473B1 (pt) 2023-04-25
PL2868081T3 (pl) 2019-10-31
TWI558179B (zh) 2016-11-11
RU2015102618A (ru) 2016-08-20
PH12014502731A1 (en) 2015-02-02
HUE044918T2 (hu) 2019-11-28
UA116214C2 (uk) 2018-02-26
ES2736312T3 (es) 2019-12-27
RU2642361C2 (ru) 2018-01-24
CA2875713C (en) 2019-09-24
MY181793A (en) 2021-01-07
KR101719930B1 (ko) 2017-03-24
CN104412599A (zh) 2015-03-11
CA2875713A1 (en) 2014-01-03
PH12014502731B1 (en) 2015-02-02
KR20150036218A (ko) 2015-04-07
IL235969A (en) 2017-04-30
CN104412599B (zh) 2018-02-06
SI2868081T1 (sl) 2019-06-28
HK1204185A1 (zh) 2015-11-06
DK2868081T3 (da) 2019-07-22
EP2868081A1 (en) 2015-05-06
IL235969A0 (en) 2015-01-29
AU2013280659A1 (en) 2015-01-15
JP2015526026A (ja) 2015-09-07
AU2013280659B2 (en) 2017-10-05

Similar Documents

Publication Publication Date Title
TWI558179B (zh) 對視訊寫碼發信長期參考圖像
JP6527877B2 (ja) ビデオコーディングプロセスにおける係数レベルコーディング
KR101600154B1 (ko) 비디오 코딩에서의 모션 벡터 예측
TWI527460B (zh) 於視訊寫碼中發信用於操作點之層識別符
TWI532383B (zh) 在視訊寫碼中長期參考圖像之隨機存取及發信
JP6158422B2 (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
TWI527440B (zh) 在視訊寫碼中針對高效率視訊寫碼(hevc)延伸之多層之低複雜度支援
TW201711464A (zh) 使用一全文自適應二進位算術寫碼設計來寫碼資料
JP2018526881A (ja) ビデオコーディングにおける双予測を制約する方法およびシステム
TWI558174B (zh) 用於寫碼視訊資訊之裝置、方法及非暫時性電腦可讀媒體
TW201509171A (zh) 對多層視訊寫碼之層間預測信令之最佳化
TWI523530B (zh) 導出最末位置寫碼之上下文以供視訊寫碼
CN111295883B (zh) 视频译码中的增强参考图片管理
US9532046B2 (en) Reference picture set prediction for video coding
JP6434044B2 (ja) ビデオ情報のスケーラブルコード化のための機器及び方法
TWI566582B (zh) 用於處理及編碼視訊資料之方法、器件及裝置以及電腦可讀儲存媒體
KR20140139571A (ko) 비디오 코딩을 위한 계층간 텍스처 예측
KR20160064124A (ko) Mv-hevc 에서의 인터-뷰 종속성 타입
JP6479798B2 (ja) マルチレイヤビデオコーディングのためのpoc値設計
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
CN111149361B (zh) 具有在用于视频译码的随机存取配置中的未来参考帧的自适应图片群组结构