TW201408078A - 在視訊寫碼中之參數集 - Google Patents

在視訊寫碼中之參數集 Download PDF

Info

Publication number
TW201408078A
TW201408078A TW102125966A TW102125966A TW201408078A TW 201408078 A TW201408078 A TW 201408078A TW 102125966 A TW102125966 A TW 102125966A TW 102125966 A TW102125966 A TW 102125966A TW 201408078 A TW201408078 A TW 201408078A
Authority
TW
Taiwan
Prior art keywords
video
code
vps
layers
extension
Prior art date
Application number
TW102125966A
Other languages
English (en)
Other versions
TWI533679B (zh
Inventor
Ying Chen
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201408078A publication Critical patent/TW201408078A/zh
Application granted granted Critical
Publication of TWI533679B publication Critical patent/TWI533679B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一視訊參數集(VPS)與一或多個經寫碼之視訊序列(CVS)相關聯。該VPS包括針對一視訊寫碼擴展之一VPS擴展。該VPS擴展包括指示是否針對一位元串流之一組可應用層啟用與該視訊寫碼擴展相關聯之一視訊寫碼工具的一語法元素。當該語法元素指示針對該等可應用層啟用該寫碼工具時,使用該寫碼工具來寫碼與該等CVS相關聯且與該等可應用層相關聯的該視訊資料之至少一部分。當該語法元素指示不針對該等可應用層啟用該寫碼工具時,不使用該寫碼工具來寫碼與該等CVS相關聯且與該等可應用層相關聯的該視訊資料。

Description

在視訊寫碼中之參數集
本申請案主張2012年7月20日申請之美國臨時專利申請案第61/673,918號及2012年8月7日申請之美國臨時專利申請案第61/680,556號之權利,該等案中之每一者之全部內容被以引用的方式併入本文中。
本發明係關於視訊寫碼(亦即,視訊資料之編碼及/或解碼)。
可將數位視訊能力併入至廣泛範圍的器件內,包括數位電視、數位直接廣播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲主機、蜂巢式或衛星無線電電話、所謂的「智慧型手機」、視訊電話會議器件、視訊串流器件及類似者。數位視訊器件實施視訊壓縮技術,諸如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4進階式視訊寫碼(AVC)第10部分、目前在開發中之高效率視訊寫碼(HEVC)標準及此等標準之擴展中描述的技術。視訊器件可藉由實施此等視訊壓縮技術而較有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖片內)預測及/或時間(圖片間)預測以減少或移除視訊序列中所固有的冗餘。對於基於區塊之視訊寫碼,可將視訊片段(亦即,視訊圖框或視訊圖框之一部分)分割成視訊區塊。一 圖片之框內寫碼(I)片段中的視訊區塊係使用關於同一圖片中的相鄰區塊中之參考樣本之空間預測而編碼的。一圖片之框間寫碼(P或B)片段中的視訊區塊可使用關於同一圖片中的相鄰區塊中之參考樣本之空間預測或關於其他參考圖片中的參考樣本之時間預測。圖片可被稱作圖框,且參考圖片可被稱作參考圖框。
空間或時間預測導致用於待寫碼之區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊的參考樣本之區塊的運動向量來編碼框間寫碼之區塊,且殘餘資料指示經寫碼之區塊與預測性區塊之間的差。根據框內寫碼模式及殘餘資料編碼框內寫碼之區塊。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而導致殘餘係數,其接著可被量化。可掃描最初按二維陣列排列的經量化之係數以便產生係數之一維向量,且可應用熵寫碼以達成甚至更多的壓縮。
可藉由編碼(例如)來自多個透視角度之視圖來產生多視圖寫碼位元串流。已開發出使用多視圖寫碼態樣之一些三維(3D)視訊標準。舉例而言,不同視圖可傳輸左眼視圖及右眼視圖以支援3D視訊。或者,一些3D視訊寫碼程序可應用所謂的多視圖加深度寫碼。在多視圖加深度寫碼中,3D視訊位元串流可不僅含有紋理視圖分量,且亦可含有深度視圖分量。舉例而言,每一視圖可包含一個紋理視圖分量及一個深度視圖分量。
一般而言,本發明描述與視訊編碼解碼器(諸如,高效率視訊寫碼(HEVC))之擴展中的視訊參數集(VPS)及序列參數集(SPS)有關之技術。視訊參數集(VPS)與一或多個經寫碼之視訊序列(CVS)相關聯。VPS包括針對視訊寫碼擴展之VPS擴展,該視訊寫碼擴展諸如對HEVC之多視圖視訊寫碼擴展、可調式視訊寫碼(SVC)擴展或3D視訊 寫碼(3DV)擴展。VPS擴展包括用於視訊資料位元串流之每一各別層的各別語法元素。對於視訊資料位元串流之每一各別層,當針對各別層之語法元素指示針對該各別層啟用一寫碼工具時,使用該寫碼工具解碼與一或多個CVS相關聯且與各別層相關聯的視訊資料之至少一部分。當針對各別層之語法元素指示不針對各別層啟用寫碼工具時,不使用該寫碼工具解碼與CVS相關聯且與各別層相關聯的視訊資料。
在一實例中,本發明描述一種解碼視訊資料之方法,該方法包含:自一視訊資料位元串流獲得針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該一或可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在另一實例中,本發明描述一種視訊解碼器件,其包含一或多個處理器,該一或多個處理器經組態以:自一視訊資料位元串流獲得針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具 時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在另一實例中,本發明描述一種視訊解碼器件,其包含:用於自一視訊資料位元串流獲得針對一視訊寫碼擴展之一VPS擴展之構件,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;用於當該語法元素指示針對該組可應用層啟用該寫碼工具時藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分之構件;及用於當該語法元素指示不針對該組可應用層啟用該寫碼工具時不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料之構件。
在另一實例中,本發明描述一種電腦可讀資料儲存媒體,其具有儲存於其上之指令,該等指令當執行時組態一視訊解碼器件以:自一視訊資料位元串流獲得針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在另一實例中,本發明描述一種編碼視訊資料之方法,該方法 包含:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;及當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在另一實例中,本發明描述一種視訊編碼器件,其包含一或多個處理器,該一或多個處理器經組態以:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在另一實例中,本發明描述一種視訊編碼器件,其包含:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一VPS擴展之構件,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元 素;用於當該語法元素指示針對該組可應用層啟用該寫碼工具時藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分之構件;及用於當該語法元素指示不針對該組可應用層啟用該寫碼工具時不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料之構件。
在另一實例中,本發明描述一種電腦可讀資料儲存媒體,其具有儲存於其上之指令,該等指令當執行時組態一視訊編碼器件以:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一VPS擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
在隨附圖式及以下描述中闡明了本發明之一或多個實例的細節。根據描述、圖式及申請專利範圍,其他特徵、目標及優勢將顯而易見。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧當前PU
100‧‧‧預測處理單元
102‧‧‧殘餘產生單元
104‧‧‧變換處理單元
106‧‧‧量化單元
108‧‧‧反量化單元
110‧‧‧反變換處理單元
112‧‧‧重建構單元
114‧‧‧濾波器單元
116‧‧‧解碼之圖片緩衝器
118‧‧‧熵編碼單元
120‧‧‧框間預測處理單元
122‧‧‧運動估計單元
124‧‧‧運動補償單元
126‧‧‧框內預測處理單元
150‧‧‧熵解碼單元
152‧‧‧預測處理單元
154‧‧‧反量化單元
156‧‧‧反變換處理單元
158‧‧‧重建構單元
160‧‧‧濾波器單元
162‧‧‧解碼之圖片緩衝器
164‧‧‧運動補償單元
166‧‧‧框內預測處理單元
200‧‧‧實例操作
250‧‧‧實例操作
300‧‧‧實例操作
圖1為說明可利用本發明中描述之技術的一實例視訊寫碼系統之方塊圖。
圖2為說明相對於當前預測單元的實例空間運動向量鄰居之概念圖。
圖3為說明一實例多視圖解碼次序之概念圖。
圖4為說明用於多視圖寫碼之一實例預測結構之概念圖。
圖5為說明可實施本發明中描述之技術的一實例視訊編碼器之方塊圖。
圖6為說明可實施本發明中描述之技術的一實例視訊解碼器之方塊圖。
圖7為說明根據本發明之一或多個實例技術的視訊編碼器之一實例操作之流程圖。
圖8為說明根據本發明之一或多個實例技術的視訊解碼器之一實例操作之流程圖。
圖9為說明根據本發明之一或多個實例技術的視訊編碼器之一實例操作之流程圖。
圖10為說明根據本發明之一或多個實例技術的視訊解碼器之一實例操作之流程圖。
高效率視訊寫碼(HEVC)為目前在開發中之一視訊寫碼規範。正努力產生HEVC之多視圖寫碼擴展(被稱作MV-HEVC)及HEVC之三維視訊(3DV)擴展(被稱作3D-HEVC)。此外,正努力產生HEVC之可調式視訊寫碼(SVC)擴展(被稱作SHEVC)。
在MV-HEVC、3D-HEVC及SHEVC中,視訊編碼器可產生包含一系列網路抽象層(NAL)單元之位元串流。位元串流之不同NAL單元可與位元串流之不同層相關聯。可將層定義為具有相同層識別符之視訊寫碼層(VCL)NAL單元及相關聯的非VCL NAL單元之一集合。層可等效於多視圖視訊寫碼中之視圖。在多視圖視訊寫碼中,一層可含有同一層之具有不同時間執行個體的所有視圖分量。每一視圖分量可為在一特定時間執行個體屬於一特定視圖的視訊場景之一經寫碼之圖片。 在3D視訊寫碼中,一層可含有一特定視圖之所有經寫碼之深度圖片抑或一特定視圖之經寫碼之紋理圖片。類似地,在可調式視訊寫碼之內容脈絡中,一層通常對應於具有不同於其他層中的經寫碼圖片之視訊特性的經寫碼圖片。此等視訊特性通常包括空間解析度及品質等級(信雜比)。在HEVC及其擴展中,可藉由將具有一特定時間等級之一群圖片定義為一子層來達成時間可調性。
對於位元串流之每一各別層,可在不參考任一較高層中之資料的情況下解碼較低層中之資料。舉例而言,在可調式視訊寫碼中,可在不參考增強層中之資料的情況下解碼基礎層中之資料。NAL單元僅囊封單一層之資料。因此,可自位元串流移除囊封位元串流之最高剩餘層之資料的NAL單元,而不影響位元串流之剩餘層中的資料之可解碼性。在多視圖寫碼及3D-HEVC中,較高層可包括額外視圖分量。在SHEVC中,較高層可包括信雜比(SNR)增強資料、空間增強資料及/或時間增強資料。在3D-HEVC及SHEVC中,若視訊解碼器可在不參考任一其他層之資料的情況下解碼一視圖中之圖片,則可將該視圖稱作「基礎層」。基礎層可符合HEVC基礎規範。
在3D-HEVC及SHEVC中,各種寫碼工具可用以提供進一步資料壓縮。然而,存在此等寫碼工具之使用不合需要之若干原因。舉例而言,此等寫碼工具之使用可增加解碼視訊資料所需之時間量。在另一實例中,能夠使用此等寫碼工具之視訊解碼器可比不能夠使用此等寫碼工具之視訊解碼器顯著複雜。因此,3D-HEVC及SHEVC提供了用於選擇性地指示啟用或停用此等寫碼工具之機制。
在HEVC及其擴展中,視訊編碼器可產生包括一或多個視訊參數集(VPS)之位元串流。VPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫碼視訊序列。經寫碼之視訊序列可包括存取單元序列,其按解碼次序由為位元串流中之第一存取 單元的清潔隨機存取(CRA)存取單元、瞬時解碼再新(IDR)存取單元或斷鏈存取(BLA)存取單元、接著為零或零個以上非IDR且非BLA存取單元(其包括直至但不包括任何隨後IDR或BLA存取單元之所有隨後存取單元)組成。存取單元可為按解碼次序連續且含有在一時間執行個體出現的經寫碼之圖片之一組NAL單元。
此外,在HEVC及其擴展中,視訊編碼器可包括一或多個序列參數集(SPS)。SPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫碼視訊序列。SPS可包括識別可應用於SPS之VPS的語法元素(例如,video_parameter_set_id)。單一VPS可與多個SPS相關聯。與單一VPS相關聯之SPS可包括具有不同值之語法元素。因此,VPS可應用於一或多個經寫碼之視訊序列的第一集合,且包括識別VPS之語法元素的SPS可為可應用於零或零個以上經寫碼之視訊序列的第二集合之語法結構。因此,視訊編碼器可產生比SPS少的VPS。每一SPS可包括將該SPS識別為與一特定VPS相關聯之語法元素。此外,位元串流可包括圖片參數集(PPS)。每一PPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫碼圖片。每一PPS可包括將該PPS識別為與一特定SPS相關聯之語法元素。
不同HEVC擴展(例如,3D-HEVC、SHEVC等)與包括特定針對該等HEVC擴展之語法元素的不同SPS擴展相關聯。舉例而言,當使用3D-HEVC產生位元串流時,SPS可包括一SPS擴展,該SPS擴展包括特定針對該3D-HEVC之一或多個語法元素。在此實例中,SPS擴展可包括:一interview_refs_present_flag,其指示是否可使用視圖間參考;一enable_dmm_flag,其指示是否啟用深度圖模型化模式;一use_mvi_flag,其指示是否啟用自紋理至深度之運動向量繼承;一multi_view_mv_pred_flag,其指示是否啟用視圖間運動向量預測;及 一multi_view_residual_pred_flag,其指示是否啟用視圖間殘餘預測。
以上描述之方案存在若干問題。如上提到,位元串流之基礎層符合基礎HEVC規範。因此,可應用於基礎層之SPS不包括用於HEVC擴展(例如,3D-HEVC、SHEVC等)之SPS擴展。當位元串流符合HEVC擴展且除了基礎層外亦包括一或多個層時,可針對不同層啟用HEVC擴展之不同寫碼工具。因此,視訊編碼器可能需要產生多個SPS,其中之每一者可應用於同一經寫碼之視訊序列的不同層。然而,該等SPS中之每一者可包括與基礎HEVC規範相關聯且不與HEVC擴展相關聯之語法元素。因此,與基礎HEVC規範相關聯之語法元素可在可應用於同一經寫碼之視訊序列的該等層之SPS中之每一者中重複。此可不必要地增大位元串流之大小。此外,因為每一PPS僅與單一SPS相關聯,所以位元串流對於每一層可能需要包括一或多個PPS。因為PPS不包括特定針對HEVC擴展之語法元素,所以除指示相關聯之SPS的語法元素外,該等PPS可為彼此之複本。因此,額外SPS可實際上為位元浪費。
根據本發明之一或多個技術,視訊編碼器可在視訊資料位元串流中包括針對視訊寫碼擴展之VPS擴展。VPS擴展可為VPS內之語法結構。VPS自身可為可應用於一或多個完整的經寫碼視訊序列的一語法結構。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之一寫碼工具的一語法元素。當語法元素指示針對該組可應用層啟用該寫碼工具時,視訊編碼器可藉由使用寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊編碼器可不使用該寫碼工具來編碼與該一或多個經寫碼之視訊序列相關聯且與該組可應用層相關聯的視訊資料。寫碼工具可包括以下中之一或多者:視圖間參考之使用、深度圖模型化模式之 使用、自紋理至深度之運動向量繼承之使用、視圖間運動向量預測之使用及視圖間殘餘預測之使用。
在一實例中,視訊編碼器可產生包括表示一VPS之資料之位元串流,該VPS包括針對HEVC擴展之VPS擴展。對於位元串流之每一層,VPS擴展可包括指示是否啟用與HEVC擴展相關聯之特定寫碼工具,以用於解碼與該層相關聯且與可應用於VPS的經寫碼之視訊序列相關聯的視訊資料。不在用於該等層之SPS擴展中傳訊此等語法元素。
類似地,視訊解碼器可自視訊資料位元串流獲得針對視訊寫碼擴展之VPS擴展。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之一寫碼工具的一語法元素。當語法元素指示針對該一或可應用層啟用該寫碼工具時,視訊解碼器可藉由使用寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊解碼器可不使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該組可應用層相關聯的視訊資料。
在一實例中,VPS擴展可包括針對視訊資料位元串流之每一各別層的各別語法元素。此外,對於視訊資料位元串流之每一各別層,當針對各別層之語法元素指示針對該各別層啟用一寫碼工具時,視訊解碼器可藉由使用該寫碼工具解碼與經寫碼之視訊序列相關聯且與各別層相關聯的視訊資料之至少一部分。當針對各別層之語法元素指示不針對該各別層啟用該寫碼工具時,視訊解碼器可不使用寫碼工具來解碼與該經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料。
因為在VPS擴展而非在SPS之擴展中傳訊指示是否針對特定層啟用寫碼工具之語法元素,所以位元串流可不必包括該等層中之每一者的SPS。因此,該位元串流可至少小了表示SPS之基礎HEVC規範語法 元素所需的位元數目。此外,因為在VPS擴展而非在SPS之擴展中傳訊語法元素,所以可能不必產生同樣多的PPS,從而進一步節省位元。
圖1為說明可利用本發明之技術的一實例視訊寫碼系統10之方塊圖。如本文中所使用,術語「視訊寫碼器」泛指視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」可泛指視訊編碼或視訊解碼。
如圖1中所示,視訊寫碼系統10包括一源器件12及一目的地器件14。源器件12產生經編碼之視訊資料。一般而言,編碼視訊資料指產生視訊資料的經編碼之表示。因此,源器件12可被稱作視訊編碼器件或視訊編碼裝置。目的地器件14可解碼由源器件12產生的經編碼之視訊資料。一般而言,解碼經編碼之視訊資料指基於經編碼之視訊資料判定像素樣本值。因此,目的地器件14可被稱作視訊解碼器件或視訊解碼裝置。源器件12及目的地器件14可為視訊寫碼器件或視訊寫碼裝置之實例。
源器件12及目的地器件14可包含廣泛範圍之器件,包括桌上型電腦、行動計算器件、筆記型(例如,膝上型)電腦、平板電腦、機上盒、電話手機(諸如,所謂的「智慧」手機)、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲主機、車內電腦或類似者。
目的地器件14可經由頻道16自源器件12接收經編碼之視訊資料。頻道16可包含能夠將經編碼之視訊資料自源器件12移動至目的地器件14之一或多個媒體或器件。在一實例中,頻道16可包含使源器件12能夠即時將經編碼之視訊資料直接傳輸至目的地器件14之一或多個通信媒體。在此實例中,源器件12可根據諸如無線通信協定之通信標準調變經編碼之視訊資料,且可將經調變之視訊資料傳輸至目的地器件14。該一或多個通信媒體可包括無線及/或有線通信媒體,諸如, 射頻(RF)頻譜或一或多個實體傳輸線。該一或多個通信媒體可形成諸如區域網路、廣域網路或全球網路(例如,網際網路)的基於封包之網路的部分。該一或多個通信媒體可包括路由器、交換器、基地台或促進自源器件12至目的地器件14之通信的其他設備。
在另一實例中,頻道16可包括儲存由源器件12產生的經編碼之視訊資料之儲存媒體。在此實例中,目的地器件14可(例如)經由磁碟存取或記憶卡存取來存取儲存媒體。儲存媒體可包括各種各樣的本端存取之資料儲存媒體,諸如,Blu-ray光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼之視訊資料的其他合適數位儲存媒體。
在再一實例中,頻道16可包括檔案伺服器或儲存由源器件12產生的經編碼之視訊資料之另一中間儲存器件。在此實例中,目的地器件14可經由串流傳輸或下載來存取儲存於檔案伺服器或其他中間儲存器件處的經編碼之視訊資料。檔案伺服器可為能夠儲存經編碼之視訊資料且將經編碼之視訊資料傳輸至目的地器件14的類型之伺服器。實例檔案伺服器包括網路伺服器(例如,用於網站)、檔案傳輸通訊協定(FTP)伺服器、網路附接式儲存(NAS)器件及本端磁碟機。
目的地器件14可經由標準資料連接(諸如,網際網路連接)存取經編碼之視訊資料。資料連接之實例類型可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之適合於存取儲存於檔案伺服器上的經編碼之視訊資料的組合。經編碼之視訊資料自檔案伺服器之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術不限於無線應用或設定。該等技術可應用於支援各種各樣之多媒體應用(諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸(例如,經由網際網路)、用於在資料儲存媒體上儲存的視訊資料之編碼、儲存於資料儲存媒體上的視訊資料之解碼或其他應用)的視訊寫碼。在一些實例中,視訊寫碼系統10可經組 態以支援單向或雙向視訊傳輸以支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。
圖1僅為一實例,且本發明之技術可應用於未必包括編碼器件與解碼器件之間的任何資料通信之視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料係自本端記憶體擷取、在網路上串流傳輸或類似者。視訊編碼器件可編碼資料且將資料儲存至記憶體,及/或視訊解碼器件可自記憶體擷取資料且解碼資料。在許多實例中,編碼及解碼由不相互通信而僅將資料編碼至記憶體及/或自記憶體擷取資料且解碼資料之器件執行。
在圖1之實例中,源器件12包括一視訊源18、一視訊編碼器20及一輸出介面22。在一些實例中,輸出介面22可包括一調變器/解調變器(數據機)及/或一傳輸器。視訊源18可包括一視訊捕獲器件(例如,視訊攝影機)、含有先前捕獲之視訊資料的視訊存檔、用以接收來自視訊內容提供者之視訊資料的視訊饋入介面及/或用於產生視訊資料之電腦圖形系統,或此等視訊資料源之組合。
視訊編碼器20可編碼來自視訊源18之視訊資料。在一些實例中,源器件12直接經由輸出介面22將經編碼之視訊資料傳輸至目的地器件14。在其他實例中,經編碼之視訊資料亦可儲存至儲存媒體或檔案伺服器上供目的地器件14稍後存取以用於解碼及/或播放。
在圖1之實例中,目的地器件14包括一輸入介面28、一視訊解碼器30及一顯示器件32。在一些實例中,輸入介面28包括一接收器及/或一數據機。輸入介面28可在頻道16上接收經編碼之視訊資料。顯示器件32可與目的地器件14整合或可在目的地器件14外部。一般而言,顯示器件32顯示經解碼之視訊資料。顯示器件32可包含各種各樣之顯示器件,諸如,液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30各自可實施為各種各樣的合適電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。若該等技術部分地以軟體實施,則器件可將用於軟體之指令儲存於合適的穩定式電腦可讀儲存媒體中,且可使用一或多個處理器執行硬體中之指令以執行本發明之技術。前述(包括硬體、軟體、硬體與軟體之組合等)中之任一者可被視為一或多個處理器。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為各別器件中的組合式編碼器/解碼器(CODEC)之部分。
本發明可大體上提到視訊編碼器20將某些資訊「傳訊」至另一器件(諸如,視訊解碼器30)。術語「傳訊」一般可指代語法元素及/或用以解碼經壓縮之視訊資料的其他資料之傳達。此通信可即時或接近即時地發生。或者,此通信可在一時間跨度上發生,諸如,可能當在編碼時以經編碼之位元串流將語法元素儲存至電腦可讀儲存媒體時發生,該等語法元素接著可由解碼器件在儲存至此媒體後的任何時間擷取。
在一些實例中,視訊編碼器20及視訊解碼器30根據諸如ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC)(包括其可調式視訊寫碼(SVC)擴展、多視圖視訊寫碼(MVC)擴展及基於MVC之3DV擴展)之視訊壓縮標準操作。在一些情況下,符合基於MVC之3DV的任何合法位元串流始終含有順應MVC設定檔(例如,立體高設定檔)之子位元串流。H.264/AVC標準之附錄H描述H.264/AVC之MVC擴展。此外,正努力產生H.264/AVC之三維視訊(3DV)寫碼擴展(即,基於AVC之3DV)。在其他實例中,視訊編碼器20及視訊解碼器30可根據ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或 ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264、ISO/IEC Visual操作。
在圖1之實例中,視訊編碼器20及視訊解碼器30可根據目前由ITU-T視訊寫碼專業團體(VCEG)與ISO/IEC動畫專業團體(MPEG)之關於視訊寫碼之聯合合作團隊開發的高效率視訊寫碼(HEVC)標準操作。被稱作「HEVC工作草案7」的即將到來之HEVC標準之草案描述於Bross等人之「High Efficiency Video Coding(HEVC)text specification draft 7」(ITU-T SG16 WP3與ISO/IEC JTC1/SC29/WG11之關於視訊寫碼之聯合合作團隊(JCT-VC),2012年5月瑞士日內瓦第9次會議)中。被稱作「HEVC工作草案8」的即將到來之HEVC標準之另一草案描述於Bross等人之「High Efficiency Video Coding(HEVC)text specification draft 8」(ITU-T SG16 WP3與ISO/IEC JTC1/SC29/WG11之關於視訊寫碼之聯合合作團隊(JCT-VC),2012年7月瑞典斯德哥爾摩第10次會議)中。
此外,正努力產生HEVC之SVC、多視圖寫碼及3DV擴展。HEVC之SVC擴展可被稱作HEVC-SVC或SHEVC。HEVC之多視圖寫碼擴展可被稱作MV-HEVC。HEVC之3DV擴展可被稱作基於HEVC之3DV或3D-HEVC。3D-HEVC至少部分基於在Schwarz等人之「Description of 3D Video Coding Technology Proposal by Fraunhofer HHI(HEVC compatible configuration A)」(ISO/IEC JTC1/SC29/WG11,Doc.MPEG11/M22570,瑞士日內瓦,2011年11月/12月,下文稱為「m22570」)及Schwarz等人之「Description of 3D Video Coding Technology Proposal by Fraunhofer HHI(HEVC compatible configuration B)」(ISO/IEC JTC1/SC29/WG11,Doc.MPEG11/M22571,瑞士日內瓦,2011年11月/12月,下文稱為「m22571」)中提議的解決方案。對於3D-HEVC之參考軟體描述可在 Schwarz等人之「Test Model under Consideration for HEVC based 3D video coding」(ISO/IEC JTC1/SC29/WG11 MPEG2011/N12559,美國San Jose,2012年2月)處獲得。至2013年7月18日為止,參考軟體(即,HTM版本3.0)可自https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-3.0/獲得。
在HEVC及其他視訊寫碼標準中,視訊序列通常包括一系列圖片。圖片亦可被稱作「圖框」。一圖片可包括三個樣本陣列,表示為SL、SCb及SCr。SL為亮度樣本之二維陣列(亦即,區塊)。SCb為Cb色度樣本之二維陣列。SCr為Cr色度樣本之二維陣列。在本文中色度(chrominance)樣本亦可被稱作「色度(chroma)」樣本。在其他情況下,圖片可為單色的,且可僅包括一亮度樣本陣列。
為了產生圖片的經編碼之表示,視訊編碼器20可產生一組寫碼樹型單元(CTU)。CTU中之每一者可包含亮度樣本之寫碼樹型區塊、色度樣本之兩個對應的寫碼樹型區塊及用以寫碼該等寫碼樹型區塊之樣本的語法結構。在單色圖片或包含三個分開的色彩平面之圖片中,一CTU可包含一單一寫碼樹型區塊及用以寫碼該寫碼樹型區塊之樣本的語法結構。寫碼樹型區塊可為N×N樣本區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。HEVC之CTU可寬泛地類似於諸如H.264/AVC的其他視訊寫碼標準之巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。一片段可包括按光柵掃描連續排序之整數數目個CTU。
本發明可使用術語「視訊單元」或「視訊區塊」來指代一或多個樣本區塊及用以寫碼該一或多個樣本區塊中的樣本之語法結構。視訊單元之實例類型可包括CTU、CU、PU、變換單元(TU)、巨集區塊、巨集區塊分割區等等。
為了產生經寫碼之CTU,視訊編碼器20可對一CTU之寫碼樹型區塊遞歸地執行四叉樹分割,以將該等寫碼樹型區塊分成寫碼區塊,因此,名為「寫碼樹型單元」。寫碼區塊為N×N樣本區塊。一CU可包含具有一亮度樣本陣列、一Cb樣本陣列及一Cr樣本陣列之圖片的亮度樣本之寫碼區塊及色度樣本之兩個對應的寫碼區塊,及用以寫碼該等寫碼區塊之樣本的語法結構。在單色圖片或包含三個分開的色彩平面之圖片中,一CU可包含一單一寫碼區塊及用以寫碼該寫碼區塊之樣本的語法結構。視訊編碼器20可將CU之寫碼區塊分割成一或多個預測區塊。預測區塊可為對其應用同一預測的樣本之矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可包含一圖片的亮度樣本之一預測區塊、色度樣本之兩個對應的預測區塊,及用以預測該等預測區塊樣本之語法結構。視訊編碼器20可產生針對CU之每一PU之亮度、Cb及Cr預測區塊的預測性亮度、Cb及Cr區塊。在單色圖片或包含三個分開的色彩平面之圖片中,PU可包含一單一預測區塊及用以寫碼該預測區塊之樣本的語法結構。
視訊編碼器20可使用框內預測或框間預測以產生用於PU之預測性區塊。若視訊編碼器20使用框內預測產生PU之預測性區塊,則視訊編碼器20可基於與PU相關聯的圖片之經解碼樣本產生PU之預測性區塊。
若視訊編碼器20使用框間預測產生PU之預測性區塊,則視訊編碼器20可基於不同於與PU相關聯的圖片之一或多個圖片的經解碼之樣本產生PU之預測性區塊。框間預測可為單向框間預測(亦即,單向預測)或雙向框間預測(亦即,雙向)。為了執行單向或雙向,視訊編碼器20可產生用於當前片段之第一參考圖片清單(RefPicList0)及第二參考圖片清單(RefPicList1)。參考圖片清單中之每一者可包括一或多個參考圖片。當使用單向預測時,視訊編碼器20可搜尋RefPicList0及 RefPicList1中的任一者抑或兩者中之參考圖片,以判定在參考圖片內之參考位置。此外,當使用單向預測時,視訊編碼器20可至少部分基於對應於參考位置之樣本產生用於PU之預測性區塊。此外,當使用單向預測時,視訊編碼器20可產生指示PU之預測性區塊與參考位置之間的空間位移之單一運動向量。為了指示PU之預測性區塊與參考位置之間的空間位移,運動向量可包括指定PU之預測性區塊與參考位置之間的水平位移之水平分量,且可包括指定PU之預測性區塊與參考位置之間的垂直位移之垂直分量。
當使用雙向預測編碼PU時,視訊編碼器20可判定RefPicList0中的參考圖片中之第一參考位置及RefPicList1中的參考圖片中之第二參考位置。視訊編碼器20可接著至少部分基於對應於第一及第二參考位置之樣本產生用於PU之預測性區塊。此外,當使用雙向預測編碼PU時,視訊編碼器20可產生指示PU之樣本區塊與第一參考位置之間的空間位移之第一運動向量,及指示PU之預測區塊與第二參考位置之間的空間位移之第二運動向量。
在視訊編碼器20產生用於CU之一或多個PU的預測性亮度、Cb及Cr區塊後,視訊編碼器20可產生用於該CU之亮度殘餘區塊。CU之亮度殘餘區塊中的每一樣本指示CU之預測性亮度區塊中的一者中之亮度樣本與CU之原始亮度寫碼區塊中之對應樣本之間的差。此外,視訊編碼器20可產生用於該CU之Cb殘餘區塊。CU之Cb殘餘區塊中的每一樣本可指示CU之預測性Cb區塊中的一者中之Cb樣本與CU之原始Cb寫碼區塊中之對應樣本之間的差。視訊編碼器20亦可產生用於該CU之Cr殘餘區塊。CU之Cr殘餘區塊中的每一樣本可指示CU之預測性Cr區塊中的一者中之Cr樣本與CU之原始Cr寫碼區塊中之對應樣本之間的差。
此外,視訊編碼器20可使用四叉樹分割將CU之亮度、Cb及Cr殘 餘區塊分解成一或多個亮度、Cb及Cr變換區塊。變換區塊可為對其應用相同變換的樣本之矩形區塊。CU之變換單元(TU)可包含亮度樣本之一變換區塊、色度樣本之兩個對應的變換區塊,及用以變換該等變換區塊樣本之語法結構。因此,CU之每一TU可與亮度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之亮度變換區塊可為CU之亮度殘餘區塊的子區塊。Cb變換區塊可為CU之Cb殘餘區塊的子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。在單色圖片或包含三個分開的色彩平面之圖片中,一TU可包含一單一變換區塊及用以寫碼該變換區塊之樣本的語法結構。
視訊編碼器20可將一或多個變換應用至TU之亮度變換區塊以產生用於TU之亮度係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。視訊編碼器20可將一或多個變換應用至TU之Cb變換區塊以產生用於TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用至TU之Cr變換區塊以產生用於TU之Cr係數區塊。
在產生了係數區塊(例如,亮度係數區塊、Cb係數區塊或Cr係數區塊)後,視訊編碼器20可量化係數區塊。量化通常指變換係數經量化以可能地減少用以表示變換係數的資料量從而提供進一步壓縮之程序。此外,視訊編碼器20可反量化變換係數,且將反變換應用至變換係數以便重建構圖片之CU之TU的變換區塊。視訊編碼器20可使用CU之TU的重建構之變換區塊及CU之PU的預測性區塊以重建構CU之寫碼區塊。藉由重建構圖片之每一CU的寫碼區塊,視訊編碼器20可重建構圖片。視訊編碼器20可將重建構之圖片儲存於經解碼之圖片緩衝器(DPB)中。視訊編碼器20可將DPB中的重建構之圖片用於框間預測及框內預測。
在視訊編碼器20量化了係數區塊後,視訊編碼器20可熵編碼指示經量化之變換係數的語法元素。舉例而言,視訊編碼器20可對指示 經量化之變換係數的語法元素執行上下文自適應性二進位算術寫碼(CABAC)。視訊編碼器20可在位元串流中輸出經熵編碼之語法元素。
視訊編碼器20可輸出包括一位元序列之位元串流,該位元序列形成經寫碼圖片及相關聯之資料的表示。位元串流可包含網路抽象層(NAL)單元序列。NAL單元中之每一者包括NAL單元標頭且囊封一原始位元組序列有效負載(RBSP)。NAL單元標頭可包括指示NAL單元類型碼之語法元素。由NAL單元之NAL單元標頭指定的NAL單元類型碼指示NAL單元之類型。RBSP可為囊封於NAL單元內的含有整數數目個位元組之語法結構。在一些情況下,RBSP包括零個位元。
不同類型之NAL單元可囊封不同類型之RBSP。舉例而言,第一類型之NAL單元可囊封用於圖片參數集(PPS)之RBSP,第二類型之NAL單元可囊封用於經寫碼片段之RBSP,第三類型之NAL單元可囊封用於補充增強資訊(SEI)之RBSP,等等。PPS為可含有應用至零或零個以上完整的經寫碼圖片的語法元素之語法結構。囊封用於視訊寫碼資料之RBSP(如與用於參數集及SEI訊息之RBSP相反)的NAL單元可被稱作視訊寫碼層(VCL)NAL單元。囊封經寫碼之片段的NAL單元可在本文中被稱作經寫碼片段NAL單元。經寫碼片段的RBSP可包括片段標頭及片段資料。
視訊解碼器30可接收位元串流。此外,視訊解碼器30可剖析位元串流以自位元串流獲得語法元素。視訊解碼器30可至少部分基於自位元串流獲得之語法元素重建構視訊資料之圖片。用以重建構視訊資料之程序可大體上與由視訊編碼器20執行之程序互逆。舉例而言,視訊解碼器30可使用PU之運動向量來判定用於當前CU之PU的預測性區塊。視訊解碼器30可使用PU之一或多個運動向量來產生用於PU之預測性區塊。
此外,視訊解碼器30可反量化與當前CU之TU相關聯的係數區 塊。視訊解碼器30可對係數區塊執行反變換,以重建構與當前CU之TU相關聯的變換區塊。視訊解碼器30可藉由將用於當前CU之PU的預測性樣本區塊之樣本加至當前CU之TU的變換區塊之對應樣本來重建構當前CU之寫碼區塊。藉由重建構用於圖片之每一CU的寫碼區塊,視訊解碼器30可重建構圖片。視訊解碼器30可將經解碼之圖片儲存於經解碼之圖片緩衝器中,用於輸出及/或用於在解碼其他圖片時使用。
位元串流中的NAL單元之標頭可包括nuh_reserved_zero_6bits語法元素。若NAL單元係關於多視圖寫碼、3DV寫碼或可調式視訊寫碼中之基礎層,則NAL單元之nuh_reserved_zero_6bits語法元素等於0。可不參考位元串流之任一其他層中的資料來解碼位元串流之基礎層中的資料。若NAL單元不與多視圖寫碼、3DV寫碼或可調式視訊寫碼中之基礎層有關,則nuh_reserved_zero_6bits語法元素可具有其他非零值。特定言之,若NAL單元不與多視圖寫碼、3DV寫碼或可調式視訊寫碼中之基礎層有關,則NAL單元之nuh_reserved_zero_6bits語法元素可指定一層識別符。
此外,層內之一些圖片可不參考同一層內之其他圖片來解碼。因此,可自位元串流移除囊封層之某些圖片之資料的NAL單元,而不影響該層中的其他圖片之可解碼性。舉例而言,可不參考具有奇數圖片次序計數(POC)值之圖片解碼具有偶數POC值之圖片。POC為與經寫碼之圖片相關聯的變數,且具有隨相對於按解碼次序之先前IDR圖片(若存在)的按輸出次序之圖片位置增大而增大之值。移除囊封此等圖片之資料的NAL單元可減小位元串流之圖框率。可不參考一層內之其他圖片而解碼的該層內之一圖片子集可在本文中被稱作子層。
NAL單元可包括nuh_temporal_id_plus1語法元素。NAL單元之nuh_temporal_id_plus1語法元素可指定NAL單元之時間識別符(亦即, temporal_id)。若第一NAL單元之時間識別符小於第二NAL單元之時間識別符,則可不參考由第二NAL單元囊封之資料解碼由第一NAL單元囊封之資料。
位元串流之操作點各自與一組層識別符(亦即,一組nuh_reserved_zero_6bits值)及一時間識別符相關聯。可將該組層識別符表示為OpLayerIdSet,且可將時間識別符表示為TemporalID。若NAL單元之層識別符在操作點之一組層識別符中且NAL單元之時間識別符小於或等於操作點之時間識別符,則NAL單元與操作點相關聯。操作點表示係與操作點相關聯之位元串流子集(亦即,子位元串流)。操作點之操作點表示可包括與操作點相關聯的每一NAL單元。操作點表示不包括不與操作點相關聯之VCL NAL單元。
外部源或器件可指定用於操作點之一組目標層識別符。舉例而言,諸如媒體感知網路元件(MANE)或內容傳遞網路(CDN)器件之中間網路器件可指定該組目標層識別符。在此實例中,中間網路器件可使用該組目標層識別符來識別操作點。中間網路器件可接著提取操作點之操作點表示,且將操作點表示(而非原始位元串流)轉遞至用戶端器件。提取操作點表示且將其轉遞至用戶端器件可減小位元串流之位元率。
視訊寫碼標準指定視訊緩衝模型。在H.264/AVC及HEVC中,緩衝模型被稱作「假想參考解碼器」或「HRD」。在HEVC工作草案8中,HRD描述於附錄C中。
HRD描述緩衝資料以供解碼之方式及緩衝經解碼之資料以供輸出之方式。舉例而言,HRD描述經寫碼之圖片緩衝器(CPB)、經解碼之圖片緩衝器(DPB)及視訊解碼程序的操作。CPB係由HRD指定之先進先出緩衝器,其含有呈解碼次序的存取單元。DPB為由HRD指定之固持經解碼圖片以用於參考、輸出重排序或輸出延遲的緩衝器。CPB 及DPB之行為可數學地指定。HRD可直接對時序、緩衝器大小及位元率強加約束。此外,HRD可間接對各種位元串流特性及統計資料強加約束。
在H.264/AVC及HEVC中,將位元串流一致性及解碼器一致性指定為HRD規範之部分。換言之,HRD模型指定了用以判定位元串流是否符合標準之測試且指定了用以判定解碼器是否符合標準之測試。雖然將HRD命名為某一種類之解碼器,但視訊編碼器通常使用HRD來保證位元串流一致性,而視訊解碼器通常不需要HRD。
H.264/AVC及HEVC皆指定兩個類型之位元串流或HRD一致性,即,類型I及類型II。類型I位元串流為僅含有位元串流中之所有存取單元的VCL NAL單元及填充資料NAL單元之NAL單元串流。類型II位元串流為除了位元串流中之所有存取單元的VCL NAL單元及填充資料NAL單元外亦含有以下各項中之至少一者的NAL單元串流:不同於填充資料NAL單元之額外非VCL NAL單元;及來自NAL單元串流的形成位元組串流之所有leading_zero_8bits、zero_byte、start_coded_prefix_one_3bytes及trailing_zero_8bits語法元素。
當器件執行判定位元串流是否符合視訊寫碼標準之位元串流一致性測試時,器件可選擇位元串流之操作點。器件可接著判定可應用於選定操作點之一組HRD參數。器件可使用可應用於選定操作點之該組HRD參數來組態HRD之行為。更特定而言,器件可使用該組可應用之HRD參數來組態HRD之特定組件(諸如,假想串流排程器(HSS)、CPB、解碼程序、DPB等等)之行為。隨後,HSS可根據一特定排程將位元串流的經寫碼之視訊資料注入至HRD之CPB內。此外,器件可調用解碼CPB中的經寫碼之視訊資料之解碼程序。解碼程序可將經解碼之圖片輸出至DPB。當器件移動資料經過HRD時,器件可判定是否一直滿足一組特定約束。舉例而言,該器件可當HRD正解碼選定操作點 之操作點表示時判定在CPB或DPB中是否出現溢位或反向溢位條件。器件可按此方式選擇且處理位元串流之每一操作點。若無位元串流之操作點引起違反約束,則器件可判定位元串流符合視訊寫碼標準。
H.264/AVC及HEVC皆指定兩個類型之解碼器一致性,即,輸出時序解碼器一致性及輸出次序解碼器一致性。聲稱符合特定設定檔、層及層級之解碼器能夠成功解碼符合諸如HEVC的視訊寫碼標準之位元串流一致性要求之所有位元串流。在本發明中,「設定檔」可指位元串流語法之一子集。可在每一設定檔內指定「層」及「層級」。一層之層級可為強加於位元串流中的語法元素之值之一組指定約束。此等約束可為對值之簡單限制。或者,該等約束可呈對值之算術組合(例如,圖片寬度乘以圖片高度乘以每秒解碼的圖片之數目)的約束之形式。通常,針對較低層指定之層級比針對較高層指定之層級更受約束。
當器件執行解碼器一致性測試以判定受測解碼器(DUT)是否符合視訊寫碼標準時,器件可將符合視訊寫碼標準之位元串流提供至HRD及DUT兩者。HRD可按以上關於位元串流一致性測試描述之方式處理位元串流。若由DUT輸出的經解碼之圖片之次序匹配由HRD輸出的經解碼之圖片之次序,則器件可判定DUT符合視訊寫碼標準。此外,若DUT輸出經解碼之圖片的時序匹配HRD輸出經解碼之圖片的時序,則器件可判定DUT符合視訊寫碼標準。
在H.264/AVC及HEVC HRD模型中,解碼或CPB移除可基於存取單元。亦即,假定HRD一次性解碼完全的存取單元,且自CPB移除完全的存取單元。此外,在H.264/AVC及HEVC HRD模型中,假定圖片解碼為瞬時的。視訊編碼器20可在圖片時序SEI訊息中傳訊解碼時間以開始存取單元之解碼。在實際應用中,若符合之視訊解碼器嚴格遵照經傳訊以開始存取單元之解碼的解碼時間,則輸出特定經解碼圖片 的最早可能時間等於彼特定圖片之解碼時間加上解碼彼特定圖片所需之時間。然而,在真實世界中,解碼一圖片所需之時間無法等於零。
HRD參數可控制HRD之各種態樣。換言之,HRD可依賴於HRD參數。HRD參數可包括一初始CPB移除延遲、一CPB大小、一位元率、一初始DPB輸出延遲及一DPB大小。視訊編碼器20可在於視訊參數集(VPS)及/或序列參數集(SPS)中指定之hrd_parameters( )語法結構中傳訊此等HRD參數。個別VPS及/或SPS可包括用於不同組之HRD參數的多個hrd_parameters( )語法結構。在一些實例中,視訊編碼器20可在緩衝週期SEI訊息或圖片時序SEI訊息中傳訊HRD參數。
當視訊寫碼器(例如,視訊編碼器20或視訊解碼器30)開始寫碼圖片之當前片段時,視訊寫碼器可初始化第一參考圖片清單(亦即,清單0)。此外,若當前片段為B片段,則視訊寫碼器可初始化第二參考圖片清單(亦即,清單1)。本發明可將清單0稱作「RefPicList0」,且可將清單1稱作「RefPicList1」。在視訊寫碼器已初始化了參考圖片清單(例如,清單0或清單1)後,視訊寫碼器可修改參考圖片清單中的參考圖片之次序。換言之,視訊寫碼器可執行參考圖片清單修改(RPLM)程序。視訊寫碼器可按任一次序修改參考圖片之次序,包括一個特定參考圖片可出現於參考圖片清單中之一個以上位置中的情況。
在一些情況下,視訊寫碼器20可使用合併模式或進階運動向量預測(AMVP)模式傳訊PU之運動資訊。換言之,在HEVC中,存在用於運動參數之預測的兩個模式,一個為合併模式,且另一個為AMVP。PU之運動資訊可包括PU之運動向量及PU之參考索引。當視訊編碼器20使用合併模式傳訊當前PU之運動資訊時,視訊編碼器20產生一合併候選者清單(亦即,運動向量預測子(MVP)候選者清單)。換言之,視訊編碼器20可執行運動向量預測子清單建構程序。合併候選者清單包括一組合併候選者(亦即,MVP候選者)。合併候選者清單 可包括指示空間上或時間上相鄰於當前PU的PU之運動資訊之合併候選者。亦即,在合併模式中,在候選者可來自空間及時間相鄰區塊之情況下,建構運動參數(例如,參考索引、運動向量等)之候選者清單。
此外,在合併模式中,視訊編碼器20可自合併候選者清單中選擇一合併候選者,且可使用由選定合併候選者指示之運動資訊作為當前PU之運動資訊。視訊編碼器20可傳訊選定合併候選者在合併候選者清單中之位置。舉例而言,視訊編碼器20可藉由傳輸在候選者清單內的一索引來傳訊選定運動向量參數。視訊解碼器30可自位元串流獲得在候選者清單內之索引(亦即,候選者清單索引)。此外,視訊解碼器30可產生同一合併候選者清單,且可基於選定合併候選者之位置之指示而判定選定合併候選者。視訊解碼器30可接著使用選定合併候選者之運動資訊產生用於當前PU之預測性區塊。亦即,視訊解碼器30可至少部分基於候選者清單索引而判定候選者清單中之選定候選者,其中該選定候選者指定用於當前PU之運動向量。以此方式,在解碼器側,一旦索引經解碼,則索引指向之對應區塊之所有運動參數將由當前PU繼承。
跳過模式類似於合併模式。在跳過模式中,視訊編碼器20及視訊解碼器30按與視訊編碼器20及視訊解碼器30在合併模式中使用合併候選者清單相同的方式產生且使用合併候選者清單。然而,當視訊編碼器20使用跳過模式傳訊當前PU之運動資訊時,視訊編碼器20不傳訊用於當前PU之任何殘餘資料。因此,視訊解碼器30可使用由合併候選者清單中的選定候選者之運動資訊指示的參考區塊作為PU之預測性區塊。
AMVP模式在以下方面類似於合併模式:視訊編碼器20產生候選者清單且自候選者之清單選擇一候選者。然而,當視訊編碼器20使用 AMVP模式傳訊當前PU之運動資訊時,除了傳訊選定候選者在候選者清單中的位置外,視訊編碼器20亦可傳訊用於當前PU之運動向量差(MVD)及參考索引。用於當前PU之MVD可指示當前PU之運動向量與來自AMVP候選者清單的選定候選者之運動向量之間的差。在單向預測中,視訊編碼器20可傳訊用於當前PU之一MVD及一參考索引。在雙向預測中,視訊編碼器20可傳訊用於當前PU之兩個MVD及兩個參考索引。以此方式,視訊編碼器20可藉由傳輸在候選者清單內的索引來傳訊選定運動向量,且可傳訊參考索引值及MVD。換言之,位元串流中的表示當前PU之運動向量的資料可包括表示參考索引、候選者清單之索引及MVD的資料。
此外,當使用AMVP模式傳訊當前PU之運動資訊時,視訊解碼器30可自位元串流獲得用於當前PU之MVD及候選者清單索引。視訊解碼器30可產生同一AMVP候選者清單,且可基於選定候選者在AMVP候選者清單中的位置之指示而判定選定候選者。視訊解碼器30可藉由將MVD加至由選定候選者指示之運動向量來恢復當前PU之運動向量。亦即,視訊解碼器30可至少部分基於由選定候選者指示之運動向量及MVD判定當前PU之運動向量。視訊解碼器30可接著使用當前PU之該或該等經恢復之運動向量來產生用於當前PU之預測性區塊。
如上指示,用於合併模式或AMVP之候選者清單可包括基於空間上相鄰於當前PU之PU的候選者。本發明可將此等PU稱作空間上相鄰PU或空間運動向量鄰居。圖2為說明相對於當前PU 40的實例空間運動向量鄰居之概念圖。亦即,PU 40與PU 40之空間上相鄰PU之間的一實例關係描繪於圖2中。在圖2之實例中,空間上相鄰PU可為覆蓋指示為A0、A1、B0、B1及B2之位置的PU。當PU之預測性區塊包括一位置時,PU可覆蓋該位置。
關於圖2之實例,亮度位置(xP,yP)可指定相對於當前圖片之左上部亮度樣本的PU 40之左上部亮度樣本。此外,變數nPSW及nPSH可分別表示PU 40之按亮度樣本計的寬度及高度。相對於當前圖片之左上部樣本的PU N之左上部亮度樣本為(xN,yN),其中N表示覆蓋位置A0、A1、B0、B1或B2之PU。對於覆蓋位置A0、A1、B0、B1或B2之PU,可將(xN,yN)分別定義為(xP-1,yP+nPSH)、(xP-1,yP+nPSH-1)、(xP+nPSW,yP-1)、(xP+nPSW-1,yP-1)或(xP-1,yP-1)。
合併候選者清單或AMVP候選者清單中的基於時間上相鄰於當前PU的PU(亦即,在與當前PU不同的時間執行個體中的PU)之運動資訊之候選者可被稱作時間運動向量預測子(TMVP)。為了判定TMVP,視訊寫碼器可首先識別包括與當前PU共同定位之一PU的參考圖片。換言之,視訊寫碼器可識別共同定位之圖片。若當前圖片之當前片段為B片段(亦即,被允許包括雙向框間預測之PU的片段),則視訊編碼器20可在片段標頭中傳訊指示共同定位之圖片來自RefPicList0抑或RefPicList1之語法元素(例如,collocated_from_l0_flag)。在視訊解碼器30識別了包括共同定位之圖片的參考圖片清單後,視訊解碼器30可使用可在片段標頭中傳訊之另一語法元素(例如,collocated_ref_idx)來識別所識別之參考圖片清單中的一圖片(亦即,共同定位之圖片)。
視訊寫碼器可藉由檢查共同定位之圖片來識別共同定位之PU。TMVP可指示含有共同定位之PU的CU之右下部PU之運動資訊,抑或在含有此PU的CU之中心PU內之右下部PU之運動資訊。含有共同定位之PU的CU之右下部PU可為覆蓋緊接在該PU之預測區塊之右下部樣本下方及右邊的位置之PU。換言之,TMVP可指示在參考圖片中且覆蓋與當前PU之右下角共同定位的位置之PU之運動資訊,或TMVP可指示在參考圖片中且覆蓋與當前PU之中心共同定位的位置之PU之運動資訊。
當將由以上程序識別之運動向量用以產生用於合併模式或AMVP模式之運動候選者時,可基於參考圖片之時間位置(由POC值反映)縮放運動向量。舉例而言,當當前圖片之POC值與參考圖片之間的差較大時,視訊寫碼器可將運動向量之量值增大比當當前圖片之POC值與參考圖片之間的差較小時大的量。
在多視圖寫碼中,存在同一場景之來自不同視點的多個視圖。術語「存取單元」用以指代對應於同一時間執行個體的圖片之集合。因此,視訊資料可概念化為一系列隨時間過去而出現之存取單元。「視圖分量」可為單一存取單元中的一視圖之經寫碼表示。在本發明中,「視圖」可指與同一視圖識別符相關聯的一視圖分量序列。
圖3為說明一實例多視圖解碼次序之概念圖。多視圖解碼次序可為位元串流次序。在圖3之實例中,每一正方形對應於一視圖分量。正方形之行對應於存取單元。可定義每一存取單元以含有一時間執行個體之所有視圖的經寫碼圖片。正方形之列對應於視圖。在圖3之實例中,將存取單元標為T0...T8,且將視圖標為S0...S7。因為在解碼一存取單元之每一視圖分量之後才解碼下一個存取單元之任一視圖分量,所以圖3之解碼次序可被稱作時間優先寫碼。存取單元之解碼次序可不與視圖之輸出或顯示次序相同。
多視圖寫碼支援視圖間預測。視圖間預測類似於在H.264/AVC、HEVC或其他視訊寫碼標準中使用之框間預測,且可使用相同的語法元素。然而,當視訊寫碼器對當前視訊單元(諸如,巨集區塊或PU)執行視圖間預測時,視訊寫碼器可使用與當前視訊單元在相同存取單元中但在不同視圖中之圖片作為參考圖片。相對比而言,習知框間預測僅使用在不同存取單元中之圖片作為參考圖片。
在多視圖寫碼中,若視訊解碼器(例如,視訊解碼器30)可不參考任一其他視圖中之圖片來解碼一視圖中之圖片,則可將該視圖稱作 「基礎視圖」。當寫碼在非基礎視圖中之一者中的圖片時,若一圖片在不同視圖中但在與視訊寫碼器當前正寫碼之圖片相同的時間執行個體(亦即,存取單元)內,則視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可將該圖片添加至參考圖片清單(例如,RefPicList0或RefPicList1)內。如同其他框間預測參考圖片,視訊寫碼器可在參考圖片清單中之任一位置處插入視圖間預測參考圖片。
圖4為說明用於多視圖寫碼之一實例預測結構之概念圖。圖4之多視圖預測結構包括時間預測及視圖間預測。在圖4之實例中,每一正方形對應於一視圖分量。標為「I」之正方形為框內預測之視圖分量。標為「P」之正方形為單向框間預測之視圖分量。標為「B」及「b」之正方形為雙向框間預測之視圖分量。標為「b」之正方形可使用標為「B」之正方形作為參考圖片。自第一正方形指向第二正方形之箭頭指示第一正方形可在框間預測中用作為第二正方形之參考圖片。如由圖4中之垂直箭頭指示,在同一存取單元之不同視圖中的視圖分量可用作參考圖片。將一存取單元之一視圖分量用作同一存取單元之另一視圖分量的參考圖片可被稱作視圖間預測。
在H.264/AVC之MVC擴展中,視圖間預測由差異運動補償(其使用H.264/AVC運動補償之語法)支援,但允許將不同視圖中之圖片用作參考圖片。兩個視圖之寫碼亦可由H.264/AVC之MVC擴展支援。H.264/AVC之MVC擴展的優勢中之一者為,MVC編碼器可將兩個以上視圖當作3D視訊輸入,且MVC解碼器可解碼此多視圖表示。因此,具有MVC解碼器之任一轉譯器可預期具有兩個以上視圖之3D視訊內容。
在H.264/AVC之MVC擴展中,允許在相同存取單元(亦即,具有相同時間執行個體)中之圖片間的視圖間預測。當寫碼非基礎視圖中之一者的圖片時,若一圖片在不同視圖中但具有相同時間執行個體 則可將該圖片添加至一參考圖片清單中。可將視圖間預測參考圖片置於參考圖片清單中之任一位置中,正如任一框間預測參考圖片一樣。
3D-HEVC提供同一場景之來自不同視點的多個視圖。對於3D-HEVC的標準化努力之部分包括基於HEVC的多視圖視訊編碼解碼器之標準化。類似地,在基於HEVC之3DV中,啟用基於來自不同視圖的經重建構之視圖分量之視圖間預測。如H.264/AVC中之MVC一樣,3D-HEVC支援視圖間運動預測。在3D-HEVC中,視圖間預測類似於在標準HEVC中使用之運動補償,且可利用相同或類似的語法元素。然而,當視訊寫碼器對一PU執行視圖間運動預測時,視訊寫碼器可使用與該PU在相同的存取單元內但在不同視圖中之圖片作為參考圖片。相對比之下,習知運動補償僅使用在不同存取單元中之圖片作為參考圖片。因此,在3D-HEVC中,基於在同一存取單元之其他視圖中的已寫碼之運動參數來預測或推斷在相依視圖中的區塊之運動參數。
當使用合併模式或AMVP模式傳訊當前PU之運動資訊時,視訊寫碼器可產生一候選者清單(例如,合併候選者清單或AMVP候選者清單)。在3D-HEVC中,候選者清單可包括可按與候選者清單中之其他候選者相同的方式使用之視圖間預測候選者。視圖間預測候選者指定參考圖片之PU(亦即,參考PU)之運動資訊。參考圖片可與當前PU在相同的存取單元中,但與當前PU在不同的視圖中。為了判定參考PU,視訊寫碼器可執行差異向量建構程序以判定當前PU之差異向量。當前PU之差異向量可指示當前PU與參考紋理圖片內之位置之間的水平空間位移。參考PU可為參考紋理圖片之覆蓋由差異向量指示之位置的PU。
此外,視訊編碼器20可產生VPS、SPS及PPS。VPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫 碼視訊序列。SPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫碼視訊序列。單一VPS可與多個SPS相關聯。與單一VPS相關聯之SPS可包括具有不同值之語法元素。因此,視訊編碼器20可產生比SPS少的VPS。每一SPS可包括將該SPS識別為與一特定VPS相關聯之語法元素。每一PPS為包括語法元素之語法結構,該等語法元素之值可應用於零或零個以上完整的經寫碼圖片。每一PPS可包括將該PPS識別為與一特定SPS相關聯之語法元素。
在HEVC中,VPS、SPS、PPS機制將不頻繁改變之資訊的傳輸與經寫碼之區塊資料的傳輸去耦。在一些應用中,可在頻帶外傳送VPS、SPS及PPS。亦即,在一些情況下,不將VPS、SPS及PPS與含有經寫碼之視訊資料的單元一起輸送。頻帶外傳輸可通常為可靠的。
每一VPS、SPS、PPS及調適參數集(APS)可包括一識別符。在HEVC工作草案7中,使用「ue(v)」寫碼VPS、SPS、PPS或APS之識別符。換言之,使用可變長度不帶正負號之整數(其係使用0階指數葛洛姆(Exp-Golomb)寫碼來編碼,其中左邊的位元先開始)寫碼VPS、SPS、PPS或APS之識別符。每一SPS包括一SPS識別符及一VPS識別符,每一PPS包括一PPS識別符及一SPS識別符。每一片段標頭包括一PPS識別符(且在HEVC之一些版本中,可能包括一APS識別符)。
VPS可主要含有用於2維視訊之設定檔/層級及HRD資訊。此外,VPS可包括一或多個擴展(亦即,VPS擴展),其含有與HEVC之擴展(例如,3D-HEVC、SHEVC等)相關聯的語法元素。3D-HEVC VPS擴展及SHEVC VPS擴展可包括與一或多個操作點有關之資訊。此外,VPS可包括針對會話協商所請求之資訊,諸如,位元率。
通常,序列層級資訊參數存在於SPS中。舉例而言,SPS包括啟用或停用在HEVC基礎規範中定義之寫碼工具的語法元素(例如,旗標)。寫碼工具可為用於寫碼視訊資料之程序或技術。如VPS一樣 SPS可包括一或多個擴展(亦即,SPS擴展),其含有與HEVC之擴展(例如,3D-HEVC、SHEVC等)相關聯的語法元素。SPS擴展可包括指示在HEVC擴展中定義之寫碼工具被啟用抑或停用之語法元素。在3D-HEVC中,若干個此等語法元素包括於SPS擴展中。
指示特定寫碼工具是否經啟用之語法元素可包括interview_refs_present_flag、enable_dmm_flag、use_mvi_flag、multi_view_mv_pred_flag及multi_view_residual_pred_flag。interview-refs-present-flag語法元素指示是否可使用視圖間參考。當使用視圖間參考時,視訊寫碼器可至少部分基於與當前圖片在不同視圖中之參考圖片產生用於當前圖片之PU的預測性區塊。enable_dmm_flag語法元素指示深度圖模型化(DMM)模式是否經啟用。DMM模式屬於基於分割區之深度框內寫碼,且經設計以較好地表示深度資訊。此等基於分割區之深度框內寫碼模式包括深度模型化模式(DMM)。在DMM模式中,藉由兩個非矩形分割區來寫碼深度區塊。使用相鄰參考樣本預測每一分割區之DC值,且可進一步寫碼殘餘值以補償預測誤差。分割區之DC值可為分割區之左上部值。
use_mvi_flag語法元素指示自紋理至深度之運動向量繼承(MVI)是否經啟用。當啟用自紋理至深度之運動向量繼承時,視訊寫碼器可至少部分基於紋理視圖分量中的PU之運動向量判定對應的深度視圖分量中之對應PU之運動向量。
multi_view_mv_pred_flag語法元素指示視圖間運動向量預測是否經啟用。當啟用視圖間運動向量預測時,視訊寫碼器可至少部分基於與當前圖片在不同視圖中的圖片之PU之運動向量判定當前圖片之PU之運動向量。
multi-view_residual_pred_flag指示視圖間殘餘預測是否經啟用。當啟用視圖間殘餘預測時,視訊寫碼器可至少部分基於與當前圖片在 不同視圖中的參考圖片之CU之殘餘資料判定當前圖片之CU之殘餘資料。
如在圖4之實例中所示,視圖向量可將其他視圖之視圖分量用於參考。此可被稱作視圖間預測。在多視圖寫碼中,可實現視圖間預測,就如同另一視圖中之視圖分量為框間預測參考圖片一樣。然而,如以下在表1中所示,可在SPS MVC擴展中傳訊潛在視圖間參考圖片。此外,可藉由參考圖片清單建構程序來修改潛在視圖間參考圖片,此允許實現框間預測或視圖間預測參考之靈活排序。下表1為基於AVC之3DV中之SPS MVC擴展的一實例語法。
在以上表1及本發明之其他語法表之實例中,具有類型描述符ue(v)之語法元素可為可變長度不帶正負號之整數(其使用0階指數葛洛姆(Exp-Golomb)寫碼來編碼,其中左邊的位元先開始)。在表1及下列表之實例中,具有形式u(n)(其中n為非負整數)之描述符的語法元素為長度n之不帶正負號的值。
在SPS MVC擴展中,對於每一視圖,傳訊可用以形成參考圖片清單0及參考圖片清單1的視圖之數目。舉例而言,anchor_ref_l0[i][j]指定在解碼具有等於i之視圖階數索引的錨定視圖分量時初始參考圖片清單RefPicList0中之用於視圖間預測的第j個視圖分量之視圖識別符。視圖階數索引指示在基於與視圖相關聯之攝影機位置的視圖之排序中視圖之位置。anchor_ref_l1[i][j]指定在解碼具有等於i之視圖階數索引的錨定視圖分量時初始參考圖片清單RefPicList1中之用於視圖間預測的第j個視圖分量之視圖識別符。non_anchor_ref_l0[i][j]指定在解碼具有等於i之視圖階數索引的非錨定視圖分量時初始參考圖片清單RefPicList0中之用於視圖間預測的第j個視圖分量之視圖識別符。non_anchor_ref_l1[i][j]指定在解碼具有等於i之視圖階數索引的非錨定視圖分量時初始參考圖片清單RefPicList1中之用於視圖間預測的第j個視圖分量之視圖識別符。
如在以上表1中所示,如在SPS MVC擴展中傳訊的針對錨定圖片之預測關係可與針對同一視圖之非錨定圖片之預測關係(在SPS MVC擴展中傳訊)不同。錨定圖片為所有片段僅可參考同一存取單元內之片段的經寫碼之圖片,亦即,可使用視圖間預測,但不使用框間預測,且按輸出次序之所有接下來的經寫碼之圖片不使用根據按解碼次序在經寫碼圖片前的任一圖片的框間預測。
以上描述之方案存在若干問題。如上提到,位元串流之基礎層符合基礎HEVC規範。因此,可應用於基礎層之SPS不包括用於HEVC 擴展(例如,3D-HEVC、SHEVC等)之SPS擴展。當位元串流符合HEVC擴展且除了基礎層外亦包括一或多個層時,可針對不同層啟用HEVC擴展之不同寫碼工具。因此,視訊編碼器20可能需要產生多個SPS,其中之每一者可應用於同一經寫碼之視訊序列的不同層。然而,該等SPS中之每一者可包括與基礎HEVC規範相關聯且不與HEVC擴展相關聯之語法元素。因此,可在可應用於同一經寫碼之視訊序列的該等層之SPS中之每一者中重複與基礎HEVC規範相關聯之語法元素。此可不必要地增大位元串流之大小。此外,因為每一PPS與僅一單一SPS相關聯,所以位元串流對於每一層可能需要包括一或多個PPS。因為PPS不包括特定針對HEVC擴展之語法元素,所以除了指示相關聯之SPS的語法元素外,該等PPS可為彼此之複本。因此,額外SPS可實際上為位元浪費。換言之,指示HEVC擴展(例如,3DV或可調式)中之額外工具的旗標可存在於基於當前HEVC規範之新SPS中,此係由於彼等旗標將在SPS擴展部分中。因此,即使此SPS之所有其他資訊與(例如)基礎層/視圖SPS相同,亦需要新SPS,且因此,需要具有相同內容但不同識別符之新PPS。
根據本發明之一或多個技術,HEVC擴展(例如,多視圖、3DV及SVC)中之VPS擴展可包括工具啟用旗標。工具啟用旗標可為指示是否啟用特定寫碼工具之語法元素。因此,視訊編碼器20不需要在SPS擴展中包括工具啟用旗標。亦即,當針對增強層或視圖引入新的寫碼工具時,啟用/停用彼等工具之旗標可如上所述存在於VPS中,其針對整個操作點或針對整個視圖/層。
舉例而言,視訊編碼器20可在視訊資料位元串流中包括針對視訊寫碼擴展之一VPS擴展。VPS擴展可為VPS內之語法結構。VPS自身可為可應用於一或多個完整的經寫碼視訊序列的一語法結構。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之 一寫碼工具的一語法元素。當語法元素指示針對該組可應用層啟用該寫碼工具時,視訊編碼器20可藉由使用寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊編碼器20可不使用該寫碼工具來編碼與該一或多個經寫碼之視訊序列相關聯且與該組可應用層相關聯的視訊資料。
類似地,視訊解碼器30可自視訊資料位元串流獲得針對視訊寫碼擴展之VPS擴展。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之一寫碼工具的一語法元素。當語法元素指示針對該一或可應用層啟用該寫碼工具時,視訊解碼器30可藉由使用寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊解碼器30可不使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該組可應用層相關聯的視訊資料。
在一些實例中,工具啟用旗標可一度存在於VPS擴展中,且因此,可對於位元串流之所有層適用。在一些此等實例中,以上提到的該組可應用層可包括不包括基礎層的視訊資料位元串流之所有層(或可由該等所有層組成)。在其他此等實例中,以上提到的該組可應用層可包括視訊資料位元串流之所有深度層(或可由該等所有深度層組成)。在其他實例中,一些工具啟用旗標可一度存在於VPS擴展中,且可應用於位元串流之所有層,而其他工具啟用旗標可一度存在於VPS擴展中以用於位元串流之每一層。此外,SPS可在VPS中包括指示針對每一層是否存在基礎HEVC規範之特定寫碼工具的語法元素(例如,旗標)。
在其他實例中,工具啟用旗標可一度存在於VPS擴展中以用於位 元串流之每一層。在一些此等實例中,以上提到之該組可應用層可包括視訊資料位元串流之單一層,但語法元素可在VPS擴展中的複數個語法元素間。複數個語法元素中之指示是否針對複數個層中之單一不同層啟用寫碼工具的每一語法元素。在一些實例中,該複數個層包括視訊資料位元串流之每一層(或可由每一層組成),惟視訊資料位元串流之基礎視圖除外。在其他實例中,該複數個層包括視訊資料位元串流之每一深度層(或可由每一深度層組成)。
因此,在工具啟用旗標可一度存在於VPS擴展中以用於位元串流之每一層的實例中,對於該複數個語法元素中之每一各別語法元素,當該各別語法元素指示針對該複數個層中之一各別層啟用寫碼工具時,視訊編碼器20可藉由使用寫碼工具編碼與一或多個寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分。此外,對於該複數個語法元素中之每一各別語法元素,當該各別語法元素指示不針對該各別層啟用寫碼工具時,視訊編碼器20可不使用該寫碼工具來編碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料。
同樣地,對於該複數個語法元素中之每一各別語法元素,當該各別語法元素指示針對該複數個層中之一各別層啟用寫碼工具時,視訊解碼器30可藉由使用寫碼工具解碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分。此外,對於該複數個語法元素中之每一各別語法元素,當該各別語法元素指示不針對該各別層啟用寫碼工具時,視訊解碼器30可不使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料。
除非另有陳述,否則視訊編碼器20可產生包括一VPS之視訊資料位元串流。VPS包括針對視訊寫碼擴展之VPS擴展。VPS擴展包括用 於視訊資料位元串流之每一各別層的各別語法元素。VPS擴展為可應用於一或多個完整的經寫碼視訊序列的一語法結構。對於視訊資料位元串流之每一各別層,當針對各別層之語法元素指示針對該各別層啟用寫碼工具時,視訊編碼器20可藉由使用寫碼工具編碼與一或多個經寫碼之視訊序列相關聯且與各別層相關聯的視訊資料之至少一部分。編碼視訊資料包括產生視訊資料的經編碼之表示。此外,對於視訊資料位元串流之每一各別層,當針對各別層之語法元素指示未針對該各別層啟用該寫碼工具時,視訊編碼器20可不使用該寫碼工具來編碼與一或多個經寫碼之視訊序列相關聯且與各別層相關聯的視訊資料。
類似地,視訊解碼器30可自視訊資料位元串流獲得針對視訊寫碼擴展之VPS擴展。VPS擴展可包括用於視訊資料位元串流之每一各別層的各別語法元素。此外,對於視訊資料位元串流之每一各別層,當針對各別層之語法元素指示針對該各別層啟用寫碼工具時,視訊解碼器可藉由使用寫碼工具解碼與經寫碼之視訊序列相關聯且與各別層相關聯的視訊資料之至少一部分。解碼視訊資料包括基於經編碼之視訊資料產生經解碼之視訊資料。當針對各別層之語法元素指示未針對該各別層啟用該寫碼工具時,視訊解碼器30可不使用寫碼工具來解碼與該經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料。
因為在VPS擴展而非SPS之擴展中傳訊語法元素,所以位元串流可不必包括用於該等層中之每一者的SPS。因此,該位元串流可至少小了表示SPS之基礎HEVC規範語法元素所需的位元數目。此外,因為在VPS擴展而非SPS之擴展中傳訊語法元素,所以可不必產生同樣多的PPS,從而進一步節省位元。雖然參考HEVC提供本發明之技術之描述,但本發明的技術中之一或多者可應用於其他視訊寫碼規範。
圖5為說明可實施本發明之技術的一實例視訊編碼器20之方塊圖。圖5係為了解釋之目的提供,且不應被考慮為限制如在本發明中 廣泛舉例說明及描述之技術。為了解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。
在圖5之實例中,視訊編碼器20包括一預測處理單元100、一殘餘產生單元102、一變換處理單元104、一量化單元106、一反量化單元108、一反變換處理單元110、一重建構單元112、一濾波器單元114、一解碼之圖片緩衝器116及一熵編碼單元118。預測處理單元100包括一框間預測處理單元120及一框內預測處理單元126。框間預測處理單元120包括一運動估計單元122及一運動補償單元124。在其他實例中,視訊編碼器20可包括更多的、更少的或不同功能組件。
視訊編碼器20可接收視訊資料。視訊編碼器20可編碼視訊資料之圖片之片段中的每一CTU。CTU中之每一者可與圖片之同等大小之亮度寫碼樹型區塊(CTB)及對應的CTB相關聯。作為編碼CTU之部分,預測處理單元100可執行四叉樹分割以將CTU之CTB分成逐漸更小之區塊。較小之區塊可為CU之寫碼區塊。舉例而言,預測處理單元100可將與CTU相關聯之CTB分割成四個同等大小之子區塊,將子區塊中之一或多者分割成四個同等大小之子子區塊,等等。
視訊編碼器20可編碼CTU之CU以產生CU的經編碼之表示(亦即,經寫碼之CU)。作為編碼CU之部分,預測處理單元100可在CU之一或多個PU間分割與CU相關聯之寫碼區塊。因此,每一PU可與一亮度預測區塊及對應的色度預測區塊相關聯。視訊編碼器20及視訊解碼器30可支援具有各種大小之PU。CU之大小可指CU的亮度寫碼區塊之大小,且PU之大小可指PU的亮度預測區塊之大小。假定一特定CU之大小為2N×2N,則視訊編碼器20及視訊解碼器30對於框內預測可支援2N×2N或N×N之PU大小,且對於框間預測可支援2N×2N、2N×N、N×2N、N×N或類似者之對稱PU大小。對於框間預測,視訊編碼器20 及視訊解碼器30亦可支援對於2N×nU、2N×nD、nL×2N及nR×2N之PU大小的非對稱分割。
框間預測處理單元120可藉由對CU之每一PU執行框間預測來產生用於PU之預測資料。用於PU之預測資料可包括PU之預測性區塊及用於PU之運動資訊。框間預測處理單元120可取決於PU在I片段、P片段或是B片段中來執行對於CU之PU的不同操作。在I片段中,所有PU經框內預測。因此,若PU在I片段中,則框間預測處理單元120不對PU執行框間預測。因此,對於在I模式中編碼之視訊區塊,使用根據同一圖框內的先前編碼之相鄰區塊的空間預測來形成預測性區塊。
P片段中之PU可經框內預測或單向框間預測。舉例而言,若PU在P片段中,則運動估計單元122可在參考圖片之清單(例如,「RefPicList0」)中之參考圖片中搜尋用於PU之參考區域。用於PU之參考區域可為參考圖片內的含有最緊密對應於PU之預測區塊的樣本區塊之區域。運動估計單元122可產生參考索引,其指示含有用於PU之參考區域的參考圖片在RefPicList0中之位置。此外,運動估計單元122可產生指示PU之預測區塊與與參考區域相關聯之參考位置之間的空間位移之運動向量。舉例而言,運動向量可為提供自當前圖片中之座標至參考圖片中之座標的偏移之二維向量。運動估計單元122可輸出參考索引及運動向量,作為PU之運動資訊。運動補償單元124可基於與由PU之運動向量指示的參考位置相關聯之實際或內插樣本來產生PU之預測性區塊。
B片段中之PU可經框內預測、單向框間預測或雙向框間預測。因此,若PU在B片段中,運動估計單元122可執行對於PU之單向預測或雙向預測。為了執行對於PU之單向預測,運動估計單元122可在RefPicList0或第二參考圖片清單(「RefPicList1」)之參考圖片中搜尋用於PU之參考區域。運動估計單元122可輸出指示含有參考區域之參 考圖片在RefPicList0或RefPicList1中之位置的參考索引、指示PU之預測區塊與與參考區域相關聯之參考位置之間的空間位移的運動向量及指示參考圖片在RefPicList0或是RefPicList1中的一或多個預測方向指示符作為PU之運動資訊。運動補償單元124可至少部分基於與由PU之運動向量指示的參考位置相關聯之實際或內插樣本產生PU之預測性區塊。
為了執行對於PU之雙向框間預測,運動估計單元122可在RefPicList0中之參考圖片中搜尋用於PU之參考區域,且亦可在RefPicList1中之參考圖片中搜尋用於PU之另一參考區域。運動估計單元122可產生參考索引,其指示含有參考區域之參考圖片在RefPicList0及RefPicList1中之位置。此外,運動估計單元122可產生運動向量,其指示與參考區域相關聯之參考位置與PU之預測區塊之間的空間位移。PU之運動資訊可包括PU之參考索引及運動向量。運動補償單元124可至少部分基於與由PU之運動向量指示的參考位置相關聯之實際或內插樣本來產生PU之預測性區塊。
框內預測處理單元126可藉由對PU執行框內預測產生用於PU之預測性資料。用於PU之預測性資料可包括用於PU之預測性區塊及各種語法元素。框內預測處理單元126可對I片段、P片段及B片段中之PU執行框內預測。
為了對PU執行框內預測,框內預測處理單元126可使用多個框內預測模式產生用於PU之多組預測性資料。不同框內預測模式可與空間上相鄰的PU的不同組樣本相關聯。框內預測處理單元126可使用與框內預測模式相關聯之特定樣本產生用於PU之預測性區塊。空間上相鄰的PU可在PU上方、在PU右上方、在PU左上方或在PU左邊(假定PU、CU及CTU之自左至右、自頂至底編碼次序)。框內預測處理單元126可使用各種數目個框內預測模式,例如,33個定向框內預測模 式。在一些實例中,框內預測模式之數目可取決於PU之預測區塊的大小。
預測處理單元100可自由框間預測處理單元120為PU產生之預測性資料或由框內預測處理單元126為PU產生之預測性資料中選擇用於CU之PU的預測性資料。在一些實例中,預測處理單元100基於該等組預測性資料之速率/失真量度來選擇用於CU之PU的預測性資料。選定預測性資料之預測性區塊可在本文中被稱作選定預測性區塊。
殘餘產生單元102可基於CU之亮度、Cb及Cr寫碼區塊及CU之PU之選定預測性亮度、Cb及Cr區塊產生CU之亮度、Cb及Cr殘餘區塊。舉例而言,殘餘產生單元102可產生CU之殘餘區塊,使得殘餘區塊中之每一樣本具有等於CU之寫碼區塊中的樣本與CU之PU之對應的選定預測性區塊中之對應樣本之間的差之值。
變換處理單元104可執行四叉樹分割以將與CU相關聯之殘餘區塊分割成與CU之TU相關聯的變換區塊。因此,TU可與一亮度變換區塊及兩個色度變換區塊相關聯。CU之TU的亮度及色度變換區塊之大小及位置可基於或可不基於CU之PU的預測區塊之大小及位置。
變換處理單元104可藉由將一或多個變換應用至TU之變換區塊而產生用於CU之每一TU的係數區塊。變換處理單元104可將各種變換應用至與TU相關聯之變換區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、方向變換或概念上類似的變換應用至變換區塊。在一些實例中,變換處理單元104不將變換應用至變換區塊。在此等實例中,可將變換區塊當作係數區塊處理。
量化單元106可量化係數區塊中之變換係數。量化程序可減小與該等變換係數中之一些或所有者相關聯的位元深度。舉例而言,在量化期間可將n位元變換係數捨去至m位元變換係數,其中n大於m。量化單元106可基於與CU相關聯之量化參數(QP)值量化與CU之TU相關 聯的係數區塊。視訊編碼器20可藉由調整與CU相關聯之QP值來調整應用至與CU相關聯的係數區塊之量化程度。量化可引入資訊損失,因此,經量化之變換係數可具有比原始變換係數低的精確度。
反量化單元108及反變換處理單元110可分別將反量化及反變換應用至係數區塊,以自係數區塊重建構殘餘區塊。重建構單元112可將經重建構之殘餘區塊加至來自由預測處理單元100產生之一或多個預測性區塊的對應樣本以產生與TU相關聯之經重建構之變換區塊。藉由以此方式重建構用於CU之每一TU的變換區塊,視訊編碼器20可重建構CU之寫碼區塊。
濾波器單元114可執行一或多個解區塊操作以減少與CU相關聯之寫碼區塊中的區塊假影。解碼之圖片緩衝器116可在濾波器單元114對經重建構之寫碼區塊執行該一或多個解區塊操作後儲存經重建構之寫碼區塊。框間預測處理單元120可使用含有經重建構之寫碼區塊的參考圖片對其他圖片之PU執行框間預測。此外,框內預測處理單元126可使用解碼之圖片緩衝器116中的經重建構之寫碼區塊對與CU在相同圖片中之其他PU執行框內預測。
熵編碼單元118可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊,及可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作以產生經熵編碼之資料。舉例而言,熵編碼單元118可對資料執行上下文自適應性可變長度寫碼(CAVLC)操作、CABAC操作、變數至變數(V2V)長度寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、機率間隔分割熵(PIPE)寫碼操作、指數葛洛姆編碼操作或另一類型之熵編碼操作。視訊編碼器20可輸出包括由熵編碼單元118產生的經熵編碼之資料之位元串流。該位元串流亦可包括未經熵編碼之語法元素。根據本發明之一或多個實例技術,位元串流 可包括一VPS,其包括針對視訊寫碼擴展之VPS擴展。VPS擴展包括用於視訊資料位元串流之每一各別層的各別語法元素。該等語法元素可指示是否針對各別層啟用特定寫碼工具。
圖6為說明可實施本發明中描述之技術的一實例視訊解碼器30之方塊圖。圖6係為了解釋之目的而提供,且不對如在本發明中廣泛舉例說明及描述之技術加以限制。為了解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。
在圖6之實例中,視訊解碼器30包括一熵解碼單元150、一預測處理單元152、一反量化單元154、一反變換處理單元156、一重建構單元158、一濾波器單元160及一解碼之圖片緩衝器162。預測處理單元152包括一運動補償單元164及一框內預測處理單元166。在其他實例中,視訊解碼器30可包括更多、更少或不同的功能組件。
熵解碼單元150可接收NAL單元且剖析NAL單元以自位元串流獲得語法元素。熵解碼單元150可熵解碼NAL單元中的經熵編碼之語法元素。預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158及濾波器單元160可基於自位元串流獲得之語法元素產生經解碼之視訊資料。
位元串流之NAL單元可包括經寫碼之片段NAL單元。作為解碼位元串流之部分,熵解碼單元150可熵解碼經寫碼之片段NAL單元中的某些語法元素。經寫碼之片段中的每一者可包括一片段標頭及片段資料。片段標頭可含有係關於片段之語法元素。片段標頭中之語法元素可包括識別與含有該片段之圖片相關聯的PPS之一語法元素。
除了自位元串流獲得語法元素外,視訊解碼器30可對CU執行重建構操作。為了對CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由針對CU之每一TU執行重建構操作,視訊解 碼器30可重建構CU之殘餘區塊。
作為對CU之TU執行重建構操作之部分,反量化單元154可反量化(亦即,解量化)與TU相關聯之係數區塊。反量化單元154可使用與TU之CU相關聯的QP值判定量化之程度,及同樣地,判定反量化單元154要應用的反量化程度。
在反量化單元154反量化了一係數區塊後,反變換處理單元156可將一或多個反變換應用至係數區塊以便產生與TU相關聯之殘餘區塊。舉例而言,反變換處理單元156可將反DCT、反整數變換、反卡忽南-拉維(Karhunen-Loeve)變換(KLT)、反旋轉變換、反方向變換或另一反變換應用至係數區塊。
若使用框內預測編碼PU,則框內預測處理單元166可執行框內預測以產生用於PU之預測性區塊。框內預測處理單元166可使用框內預測模式基於空間上相鄰的PU之預測區塊產生用於PU之預測性亮度、Cb及Cr區塊。框內預測處理單元166可基於自位元串流獲得之一或多個語法元素判定用於PU之框內預測模式。
預測處理單元152可基於自位元串流獲得之語法元素建構第一參考圖片清單(RefPicList0)及第二參考圖片清單(RefPicList1)。此外,若使用框間預測編碼PU,則熵解碼單元150可獲得用於PU之運動資訊。運動補償單元164可基於PU之運動資訊判定用於PU之一或多個參考區域。運動補償單元164可基於與用於PU之一或多個參考區塊相關聯的樣本產生用於該PU之預測性亮度、Cb及Cr區塊。
重建構單元158可使用與CU之TU相關聯的亮度、Cb及Cr變換區塊及CU之PU的預測性亮度、Cb及Cr區塊(亦即,框內預測資料抑或框間預測資料,當適用時)重建構CU之亮度、Cb及Cr寫碼區塊。舉例而言,重建構單元158可將亮度、Cb及Cr變換區塊之樣本加至預測性亮度、Cb及Cr區塊之對應樣本以重建構CU之亮度、Cb及Cr寫碼區塊。
濾波器單元160可執行解區塊操作以減少與CU之亮度、Cb及Cr寫碼區塊相關聯的區塊假影。視訊解碼器30可將CU之亮度、Cb及Cr寫碼區塊儲存於解碼之圖片緩衝器162中。解碼之圖片緩衝器162可提供用於隨後運動補償、框內預測及在諸如圖1之顯示器件32的顯示器件上呈現之參考圖片。舉例而言,視訊解碼器30可基於解碼之圖片緩衝器162中的亮度、Cb及Cr區塊對其他CU之PU執行框內預測或框間預測操作。以此方式,視訊解碼器30可自位元串流剖析亮度係數區塊之變換係數位準,反量化變換係數位準,將變換應用至變換係數位準以產生變換區塊,至少部分基於變換區塊產生一寫碼區塊,且輸出寫碼區塊以供顯示。
如上指示,視訊編碼器20可產生一VPS,其包括針對HEVC擴展(諸如,多視圖寫碼、3DV及SVC)之VPS擴展。類似地,視訊解碼器30可自位元串流獲得針對HEVC擴展之VPS擴展。VPS擴展可包括工具啟用旗標,其指示與HEVC擴展相關聯之特定寫碼工具是否經啟用。
在本發明之第一實例技術中,VPS擴展可包括可應用於位元串流之所有層的工具啟用旗標。在此第一實例技術中,VPS可具有由下表2展示之語法。
在本發明之第一實例技術中,VPS之語法元素之語意可保持與在HEVC工作草案8中描述的語法元素之語意相同。然而,如在表2中所示,VPS可包括vps_extension( )語法結構。下表3展示根據本發明之第一實例技術的用於vps_extension( )語法結構之語法。
在表3中,interview_refs_present_flag語法元素指示視圖間參考是否經啟用。舉例而言,等於1之interview_refs_present_flag語法元素指定針對參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間參考預測。等於0之interview_refs_present-flag語法元素指定針對參考此VPS的任一層中之任一圖片停用視圖間參考預測。因此,interview_refs_present_flag語法元素為指示是否針對一組可應用層(亦即,不包括基礎視圖之所有層)啟用視圖間參考預測的語法元素。
multi_view_mv_pred_flag語法元素指示視圖間運動向量預測是 否經啟用。舉例而言,等於1之multi_view_mv_pred_flag語法元素指定針對參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間運動預測。等於0之multi_view_mv_pred_flag語法元素指示針對參考此VPS的任一層中之任一圖片停用視圖間運動預測。因此,multi_view_mv_pred_flag語法元素為指示是否針對一組可應用層(亦即,不包括基礎視圖之所有層)啟用視圖間運動預測的語法元素。
multi_view_residual_pred_flag指示視圖間殘餘預測是否經啟用。舉例而言,等於1之multi_view_residual_pred_flag語法元素指定針對參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間殘餘預測。等於0之multi_view_residual_pred_flag語法元素指示針對參考此VPS的任一層中之任一圖片停用視圖間殘餘預測。因此,multi_view_residual_pred_flag語法元素為指示是否針對一組可應用層(亦即,不包括基礎視圖之所有層)啟用視圖間殘餘預測的語法元素。
enable_dmm_flag語法元素指示深度圖模型化(DMM)模式是否經啟用。舉例而言,等於1之enable_dmm_flag語法元素指定針對參考此VPS的所有深度層中之所有圖片啟用DMM模式。等於0之enable_dmm_flag語法元素指示針對參考此VPS的任一層中之任一圖片停用DMM模式。因此,enable_dmm_flag語法元素為指示是否針對一組可應用層(亦即,所有深度層)啟用DMM模式的語法元素。
use_mvi_flag語法元素指示自紋理至深度之運動向量繼承(MVI)是否經啟用。舉例而言,等於1之use_mvi_flag語法元素指定針對參考此VPS的所有深度層中之所有圖片啟用MVI。等於0之use_mvi_flag語法元素指示針對參考此VPS的任一層中之任一圖片停用MVI。因此,use_mvi_flag語法元素為指示是否針對一組可應用層(亦即,所有深度層)啟用MVI的語法元素。
此外,在本發明之第一實例技術中,視訊編碼器20可產生符合 在下表4中展示之語法的SPS。
表4中展示的語法元素之語意可與如在HEVC工作草案8中描述之對應的語法元素相同。表4之已經刪去的部分為HEVC工作草案8中之SPS中所包括的部分,但在本發明之第一實例技術中不存在於SPS中(亦即,被提議在此實例中刪除)。因此,根據本發明之第一實例技術,SPS不包括sps_3DVC_extension_present_flag或sps_3DVC_extension( )語法結構。
此外,在本發明之第一實例技術中,可能不需要SPS擴展3DVC語法結構,或至少存在於VPS中之語法無素不需要進一步存在於SPS中。因此,sps_3DVC_extension( )語法結構可具有在下表5中展示之 語法。
表5之已經刪去的部分為HEVC工作草案8中之SPS 3DVC擴展中所包括的部分,但在本發明之第一實例技術中不存在於SPS 3DVC擴展中。若存在於SPS 3DVC擴展中之所有語法元素存在於VPS中,則可能完全不需要SPS 3DVC擴展。
本發明之第二實例技術類似於本發明之第一實例技術。然而,在本發明之第二實例技術中,視訊編碼器20產生(且視訊解碼器30獲得)用於每一層之工具啟用旗標。相對於第一實例技術,在第二實例技術中僅改變了VPS擴展語法及語意。根據本發明之第二實例技術,VPS擴展可具有由下表6展示之語意。
在表6中,對於紋理層,可得出depthFlag變數為0,且對於深度層,可得出depthFlag變數為1。紋理層中的每一經寫碼之圖片為紋理圖片(亦即,紋理視圖分量)。深度層中的每一經寫碼之圖片為深度圖片(亦即,深度視圖分量)。如表6中所示,VPS擴展包括產生每一層之工具啟用旗標之「for」迴圈。在表6中,interview_refs_present_flag[i]語法元素指示是否針對層i啟用視圖間參考。舉例而言,等於1之interview_refs_present_flag[i]語法元素指定針對在具有等於i之層識別符(亦即,第i層)且參考此VPS的層中的所有圖片啟用視圖間參考預測。等於0之interview_refs_present_flag[i]語法元素指定針對參考此VPS的第i層中之任一圖片停用視圖間參考預測。因此,interview_refs_present_flag語法元素為指示是否針對一組可應用層(亦即,層i)啟用視圖間參考預測的語法元素。
multi_view_mv_pred_flag[i]語法元素指示是否針對層i啟用視圖間運動向量預測。舉例而言,等於1之multi_view_mv_pred_flag[i]語法元素指定針對參考此VPS的第i層中之所有圖片啟用視圖間運動預測。等於0之multi_view_mv_pred_flag[i]語法元素指示針對參考此VPS的第i層中之任一圖片停用視圖間運動預測。因此,multi_view_mv_flag語法元素為指示是否針對一組可應用層(亦即,層i)啟用視圖間運動預測的語法元素。
multi_view_residual_pred_flag[i]指示是否針對層i啟用視圖間殘餘預測。舉例而言,等於1之multi_view_residual_pred_flag[i]語法元素指定針對參考此VPS的第i層中之所有圖片啟用視圖間殘餘預測。等於0之multi_view_residual_pred_flag[i]語法元素指示針對參考此VPS的第i層中之任一圖片停用視圖間殘餘預測。因此,multi_view_residual_flag語法元素為指示是否針對一組可應用層(亦即,層i)啟用視圖間殘餘預測的語法元素。
enable_dmm_flag[i]語法元素指示是否針對層i啟用深度圖模型化模式。舉例而言,等於1之enable_dmm_flag[i]語法元素指定針對參考此VPS的第i層中之所有圖片啟用DMM模式。等於0之enable_dmm_flag[i]語法元素指示針對參考此VPS的第i層中之任一圖片停用DMM模式。因此,enable_dmm_flag語法元素為指示是否針對一組可應用層(亦即,層i)啟用DMM模式的語法元素。
use_mvi_flag[i]語法元素指示是否針對層i啟用自紋理至深度之運動向量繼承。舉例而言,等於1之use_mvi_flag[i]語法元素指定針對參考此VPS的第i層中之所有圖片啟用MVI。等於0之use_mvi_flag[i]語法元素指示針對參考此VPS的第i層中之任一圖片停用MVI。因此,use_mvi_flag語法元素為指示是否針對一組可應用層(亦即,層i)啟用MVI的語法元素。
如在表6之實例中所示,當depthFlag等於1時,VPS擴展包括enable_dmm_flag[i]及use_mvi_flag[i]語法元素。如上指示,對於紋理層,可得出depthFlag變數為0,且對於深度層,可得出depthFlag變數為1。因此,視訊解碼器30可至少部分基於層為紋理層或是深度層來判定VPS擴展是否包括指示是否針對該層啟用寫碼工具的語法元素。寫碼工具可包括視圖間參考之使用,或寫碼工具為深度圖模型化模式之使用。此外,視訊編碼器20可至少部分基於各別層為紋理層或是深度層來判定在VPS擴展中是否包括指示是否針對該各別層啟用寫碼工具的語法元素。寫碼工具可包括視圖間參考之使用,或寫碼工具包括深度圖模型化模式之使用。
在本發明之第三實例技術中,工具啟用旗標與每一操作點相關聯,而非與每一層相關聯,如在第二實例技術中所進行。在第三實例技術中,VPS擴展可符合在下表7中展示之語法。
表7--VPS擴展
在表7中,若當前操作點(亦即,操作點i)包括深度,則得出depthIncluded變數為1,否則,depthIncluded變數為0。此外,在表7中,等於1之interview_refs_present_flag語法元素指定針對當前操作點之參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間參考預測。等於0之interview_refs_present_flag語法元素指定針對當前操作點之參考此VPS的任一層中之任一圖片停用視圖間參考預測。
multi_view_mv_pred_flag語法元素指示視圖間運動向量預測是否經啟用。舉例而言,等於1之multi_view_mv_pred_flag語法元素指定針對當前操作點之參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間運動預測。等於0之multi_view_mv_pred_flag語法元素指示針對當前操作點之參考此VPS的任一層中之任一圖片停用視圖間運動預測。
multi_view_residual_pred_flag指示視圖間殘餘預測是否經啟用。舉例而言,等於1之multi_view_residual_pred_flag語法元素指定針對當前操作點之參考此VPS的所有層中之所有圖片(不包括基礎視圖中之圖片)啟用視圖間殘餘預測。等於0之multi_view_residual_pred_flag語法元素指示針對當前操作點之參考此VPS的任一層中之任一圖片停 用視圖間殘餘預測。
enable_dmm_flag語法元素指示深度圖模型化模式是否經啟用。舉例而言,等於1之enable_dmm_flag語法元素指定針對當前操作點之參考此VPS的所有深度層中之所有圖片啟用DMM模式。等於0之enable_dmm_flag語法元素指示針對當前操作點之參考此VPS的任一層中之任一圖片停用DMM模式。
use_mvi_flag語法元素指示自紋理至深度之運動向量繼承是否經啟用。舉例而言,等於1之use_mvi_flag語法元素指定針對當前操作點之參考此VPS的所有深度層中之所有圖片啟用MVI。等於0之use_mvi_flag語法元素指示針對當前操作點之參考此VPS的任一層中之任一圖片停用MVI。
在HEVC工作草案7中,SPS可含有可由增強視圖及/或增強層共用之大多數語法元素。然而,SPS中存在之一些語法元素不適用於兩種視圖/層。舉例而言,針對設定檔、層級及/或HRD參數之語法元素可不適用於兩種視圖及/或增強層。此外,在具有符合HEVC的基礎視圖之立體位元串流中,可存在SPS之新執行個體,或該等語法元素中之大多數可能需要存在於VPS中。結果,可複製語法元素。
根據本發明之第四實例技術,屬於較低層(例如,基礎視圖)之SPS可由多個層/視圖共用。舉例而言,具有在基礎規範中定義之設定檔/層級之SPS可由增強層處的視圖分量重新使用。此外,即使SPS由較高層或相依視圖參考,亦可忽略基礎層/視圖之SPS中的與設定檔及層級有關之資訊及/或HRD參數,且此資訊可僅存在於VPS中。在此設計中,視訊編碼器20可將增強視圖之視圖相依性作為VPS擴展之部分予以傳訊。
在本發明之第四實例技術中,VPS可具有在下表8中展示之語法。
表8之斜體字部分指示不存在於HEVC工作草案7中之VPS中且根據本發明之一實例添加的部分。在表8中,hrd_parameters( )為包括HRD參數之語法結構。此外,profile_level_info(...)為包括設定檔資訊之語法結構。下表9展示profile_level_info(...)語法結構之一實例語法。
表9中之語法元素可具有與HEVC工作草案7中之對應的SPS語法元素相同的語意。
此外,在本發明之第四實例技術中,SPS可具有在下表10中展示之語法。
表10之刪去部分指示存在於HEVC工作草案7之SPS中但不存在於本發明之第四實例技術中之SPS中的語法元素。在本發明之第四實例技術中,對於具有不等於0之reserved_zero_6bits(layer_id)的參考SPS 之視圖或層,SPS中之profile_space、constraint_flags、level_idc及profile_compatability_flag[i]被含有此視圖或層之操作點忽略。類似地,SPS中包括之HRD參數不適用於含有具有不等於0之reserved_zero_6bits之視圖或層的操作點,即使該操作點參考該SPS亦然。包括設定檔、層級及HRD參數之此資訊可存在於VPS中作為擴展之部分。在一實例中,HEVC立體位元串流僅含有具有等於0之sps_id的一SPS及具有等於0之vps_id的一VPS。sps_id可為SPS中的識別該SPS之語法元素。vps_id可為VPS中的識別該VPS之語法元素。在此實例中,SPS含有符合HEVC主設定檔之一設定檔。此外,在此實例中,所有VCL NAL單元參考具有等於0之sps_id的同一SPS,且該SPS參考具有等於0之vps_id的VPS。在HEVC基礎視圖之VPS擴展部分中,將用於立體視訊的與設定檔有關之資訊與用於立體操作點的HRD一起指定。因此,整個位元串流可含有僅一個VPS、一個SPS及一個PPS。
圖7為說明根據本發明之一或多個實例技術的視訊編碼器20之一實例操作200之流程圖。在圖7之實例中,視訊編碼器20可在視訊資料位元串流中包括一VPS,其包括針對視訊寫碼擴展之VPS擴展(202)。VPS擴展包括用於視訊資料位元串流之每一各別層的各別語法元素。VPS擴展為可應用於一或多個完整的經寫碼視訊序列的一語法結構。
此外,在圖7之實例中,對於視訊資料位元串流之每一各別層,視訊編碼器20可判定針對各別層之語法元素是否指示針對該各別層啟用寫碼工具(204)。當針對各別層之語法元素指示針對該各別層啟用該寫碼工具時(204之「是」),視訊編碼器20可藉由使用寫碼工具編碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料之至少一部分(206)。然而,當針對各別層之語法元素指示未針對該各別層啟用該寫碼工具時(204之「否」),視訊編碼器20可不使 用該寫碼工具來編碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料(208)。
圖8為說明根據本發明之一或多個實例技術的視訊解碼器30之一實例操作250之流程圖。在圖8之實例中,視訊解碼器30自視訊資料位元串流獲得針對視訊寫碼擴展之VPS擴展(252)。VPS擴展包括用於視訊資料位元串流之每一各別層的各別語法元素。VPS擴展為可應用於一或多個完整的經寫碼視訊序列的一語法結構。
對於視訊資料位元串流之每一各別層,視訊解碼器30判定針對各別層之語法元素是否指示針對該各別層啟用寫碼工具(254)。當針對各別層之語法元素指示針對該各別層啟用該寫碼工具時(254之「是」),視訊解碼器30可藉由使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料之至少一部分(256)。然而,當針對各別層之語法元素指示未針對該各別層啟用該寫碼工具時(254之「否」),視訊解碼器30可不使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該各別層相關聯的視訊資料(258)。
圖9為說明根據本發明之一或多個實例技術的視訊編碼器20之一實例操作300之流程圖。在圖9之實例中,視訊編碼器20可在視訊資料位元串流中包括針對視訊寫碼擴展之VPS擴展(302)。VPS擴展可為VPS內之語法結構。VPS可為可應用於一或多個完整的經寫碼視訊序列(CVS)的一語法結構。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之一寫碼工具的一語法元素。
此外,當語法元素指示針對該組可應用層啟用該寫碼工具時,視訊編碼器20可藉由使用寫碼工具編碼與該一或多個完整的CVS相關聯且與該組可應用層相關聯的視訊資料之至少一部分(304)。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊編碼器20可不 使用該寫碼工具來編碼與該一或多個CVS相關聯且與該組可應用層相關聯的視訊資料(306)。以此方式,若語法元素指示針對該組可應用層啟用該寫碼工具,則視訊編碼器20可僅編碼與該一或多個CVS相關聯且與該組可應用層相關聯的視訊資料。
圖10為說明根據本發明之一或多個技術的視訊解碼器30之一實例操作之流程圖。在圖10之實例中,視訊解碼器30可自視訊資料位元串流獲得針對視訊寫碼擴展之VPS擴展(352)。VPS擴展可為VPS內之語法結構。VPS自身可為可應用於一或多個完整的CVS的一語法結構。VPS擴展可包括指示是否針對一組可應用層啟用與視訊寫碼擴展相關聯之一寫碼工具的一語法元素。
當語法元素指示針對該組可應用層啟用該寫碼工具時,視訊解碼器30可藉由使用寫碼工具解碼與該一或多個完整的CVS相關聯且與該組可應用層相關聯的視訊資料之至少一部分(354)。當語法元素指示不針對該組可應用層啟用該寫碼工具時,視訊解碼器30可不使用寫碼工具來解碼與該一或多個經寫碼之視訊序列相關聯且與該組可應用層相關聯的視訊資料。以此方式,若語法元素指示針對該組可應用層啟用該寫碼工具,則視訊編碼器20可僅編碼與該一或多個CVS相關聯且與該組可應用層相關聯的視訊資料。
在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合實施。若以軟體實施,則可將功能作為一或多個指令或程式碼儲存於一電腦可讀媒體上或在一電腦可讀媒體上傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體通常可對應於(1)穩定式的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或 多個電腦或一或多個處理器存取以擷取用於實施在本發明中描述的技術之指令、程式碼及/或資料結構之任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體或可用以儲存呈指令或資料結構之形式之所要的程式碼且可由電腦存取的任何其他媒體。又,將任何連接恰當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自一網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是針對穩定式有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及Blu-ray光碟,其中磁碟通常以磁性之方式再生資料,而光碟藉由雷射以光學之方式再生資料。以上之組合亦應包括於電腦可讀媒體之範疇內。
指令可由一或多個處理器執行,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指前述結構或適合於實施本文中所描述之技術之任何其他結構中的任一者。此外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或被併入組合之編碼解碼器中。同樣,該等技術可完全地實施於一或多個電路或邏輯元件中。
本發明之技術可實施於廣泛的各種各樣之器件或裝置中,包括 無線手機、積體電路(IC)或IC之集合(例如,晶片組)。在本發明中描述了各種組件、模組或單元以強調經組態以執行所揭示之技術的器件之功能態樣,但該等各種組件、模組或單元未必要求藉由不同硬體單元實現。更確切地,如上所述,各種單元可組合於一編碼解碼器硬體單元中或由與合適的軟體及/或韌體相結合的互操作之硬體單元(包括如上所述之一或多個處理器)之集合提供。
已描述各種實例。此等及其他實例處於下列申請專利範圍之範疇內。

Claims (44)

  1. 一種解碼視訊資料之方法,該方法包含:自一視訊資料位元串流獲得針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該一或可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
  2. 如請求項1之方法,其中該組可應用層包括該視訊資料位元串流之不包括一基礎層的所有層。
  3. 如請求項1之方法,其中該組可應用層包括該視訊資料位元串流之所有深度層。
  4. 如請求項1之方法,其中:該組可應用層僅包括該視訊資料位元串流之一單一層,該語法元素在該VPS擴展中之複數個語法元素間,該複數個語法元素中之每一語法元素指示是否針對複數個層中的一單一不同層啟用該寫碼工具,及該方法包含,對於該複數個語法元素中之每一語法元素:當該各別語法元素指示針對該複數個層中的一各別層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整 的經寫碼視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分;及當該各別語法元素指示不針對該複數個層中的該各別層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的該視訊資料。
  5. 如請求項4之方法,其中該複數個層包括該視訊資料位元串流之每一層,惟該視訊資料位元串流之一基礎視圖除外。
  6. 如請求項4之方法,其中該複數個層包括該視訊資料位元串流之每一深度層。
  7. 如請求項3之方法,其進一步包含至少部分基於該各別層為一紋理層或是一深度層來判定該VPS擴展是否包括指示是否針對該各別層啟用該寫碼工具的該語法元素。
  8. 如請求項1之方法,其中:該一或多個完整的經寫碼視訊序列為一或多個完整的經寫碼視訊序列的一第一集合,及該方法進一步包含自該視訊資料位元串流獲得包括識別該VPS之一語法元素的一序列參數集(SPS),其中該SPS為可應用於零或零個以上經寫碼之視訊序列的一第二集合之一語法結構。
  9. 如請求項1之方法,其中該寫碼工具包括以下中之一者:視圖間參考之使用、深度圖模型化模式之使用、自紋理至深度之運動向量繼承之使用、視圖間運動向量預測之使用及視圖間殘餘預測之使用。
  10. 如請求項1之方法,其中該視訊寫碼擴展包含高效率視訊寫碼(HEVC)之一多視圖視訊寫碼擴展、一可調式視訊寫碼(SVC)擴展或一3D視訊寫碼(3DV)擴展中的一者。
  11. 一種視訊解碼器件,其包含一或多個處理器,該一或多個處理器經組態以:自包含複數個層之一視訊資料位元串流獲得針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
  12. 如請求項11之視訊解碼器件,其中該組可應用層包括該視訊資料位元串流之不包括一基礎層的所有層。
  13. 如請求項11之視訊解碼器件,其中該組可應用層包括該視訊資料位元串流之所有深度層。
  14. 如請求項11之視訊解碼器件,其中:該組可應用層僅包括該視訊資料位元串流之一單一層,該語法元素在該VPS擴展中之複數個語法元素間,該複數個語法元素中之每一語法元素指示是否針對複數個層中的一單一不同層啟用該寫碼工具,及該一或多個處理器經組態使得對於該複數個語法元素中之每一語法元素:當該各別語法元素指示針對該複數個層中的一各別層啟用該寫碼工具時,該一或多個處理器藉由使用該寫碼工具解碼 與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分;及當該各別語法元素指示不針對該各別層啟用該寫碼工具時,該一或多個處理器不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的該視訊資料。
  15. 如請求項14之視訊解碼器件,其中該複數個層包括該視訊資料位元串流之每一層,惟該視訊資料位元串流之一基礎視圖除外。
  16. 如請求項14之視訊解碼器件,其中該複數個層包括該視訊資料位元串流之每一深度層。
  17. 如請求項14之視訊解碼器件,其中該一或多個處理器經組態以至少部分基於該各別層為一紋理層或是一深度層來判定該VPS擴展是否包括指示是否針對該各別層啟用該寫碼工具的該語法元素。
  18. 如請求項14之視訊解碼器件,其中:該一或多個完整的經寫碼視訊序列為一或多個完整的經寫碼視訊序列的一第一集合,及該一或多個處理器進一步經組態以自該視訊資料位元串流獲得包括識別該VPS之一語法元素的一序列參數集(SPS),其中該SPS為可應用於零或零個以上經寫碼之視訊序列的一第二集合之一語法結構。
  19. 如請求項14之視訊解碼器件,其中該寫碼工具包括以下中之一者:視圖間參考之使用、深度圖模型化模式之使用、自紋理至深度之運動向量繼承之使用、視圖間運動向量預測之使用及視圖間殘餘預測之使用。
  20. 如請求項14之視訊解碼器件,其中該視訊寫碼擴展包含高效率視訊寫碼(HEVC)之一多視圖視訊寫碼擴展、一可調式視訊寫碼(SVC)擴展或一3D視訊寫碼(3DV)擴展中的一者。
  21. 一種視訊解碼器件,其包含:用於自一視訊資料位元串流獲得針對一視訊寫碼擴展之一視訊參數集(VPS)擴展之構件,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;用於當該語法元素指示針對該組可應用層啟用該寫碼工具時藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分之構件;及用於當該語法元素指示不針對該組可應用層啟用該寫碼工具時不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料之構件。
  22. 一種電腦可讀資料儲存媒體,其具有儲存於其上之指令,該等指令當執行時組態一視訊解碼器件以:自一視訊資料位元串流獲得針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及 當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來解碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
  23. 一種編碼視訊資料之方法,該方法包含:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;及當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
  24. 如請求項23之方法,其中該組可應用層包括該視訊資料位元串流之不包括一基礎層的所有層。
  25. 如請求項23之方法,其中該組可應用層包括該視訊資料位元串流之所有深度層。
  26. 如請求項23之方法,其中:該組可應用層僅包括該視訊資料位元串流之一單一層,該語法元素在該VPS擴展中之複數個語法元素間,該複數個語法元素中之每一語法元素指示是否針對複數個層中的一單一不同層啟用該寫碼工具,及該方法包含,對於該複數個語法元素中之每一各別語法元素: 當該各別語法元素指示針對該複數個層中的一各別層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分;及當該各別語法元素指示不針對該各別層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的該視訊資料。
  27. 如請求項26之方法,其中該複數個層包括該視訊資料位元串流之每一層,惟該視訊資料位元串流之一基礎視圖除外。
  28. 如請求項26之方法,其中該複數個層包括該視訊資料位元串流之每一深度層。
  29. 如請求項26之方法,其進一步包含至少部分基於該各別層為一紋理層或是一深度層來判定是否要在該VPS擴展中包括指示是否針對該各別層啟用該寫碼工具的該語法元素。
  30. 如請求項23之方法,其中:該一或多個完整的經寫碼視訊序列為一或多個完整的經寫碼視訊序列的一第一集合,及該方法進一步包含在該視訊資料位元串流中包括一包括識別該VPS之一語法元素的序列參數集(SPS),其中該SPS為可應用於零或零個以上經寫碼之視訊序列的一第二集合之一語法結構。
  31. 如請求項23之方法,其中該寫碼工具包括以下中之一者:視圖間參考之使用、深度圖模型化模式之使用、自紋理至深度之運動向量繼承之使用、視圖間運動向量預測之使用及視圖間殘餘預測之使用。
  32. 如請求項23之方法,其中該視訊寫碼擴展包含高效率視訊寫碼(HEVC)之一多視圖視訊寫碼擴展、一可調式視訊寫碼(SVC)擴展 或一3D視訊寫碼(3DV)擴展中的一者。
  33. 一種視訊編碼器件,其包含一或多個處理器,該一或多個處理器經組態以:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
  34. 如請求項33之視訊編碼器件,其中該組可應用層包括該視訊資料位元串流之不包括一基礎層的所有層。
  35. 如請求項33之視訊編碼器件,其中該組可應用層包括該視訊資料位元串流之所有深度層。
  36. 如請求項33之視訊編碼器件,其中:該組可應用層僅包括該視訊資料位元串流之一單一層,該語法元素在該VPS擴展中之複數個語法元素間,該複數個語法元素中之每一語法元素指示是否針對複數個層中的一單一不同層啟用該寫碼工具,及該一或多個處理器經組態使得對於該複數個語法元素中之每一語法元素:當該各別語法元素指示針對該複數個層中的一各別層啟用 該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的視訊資料之至少一各別部分;及當該各別語法元素指示不針對該各別層啟用該寫碼工具時,不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該各別層相關聯的該視訊資料。
  37. 如請求項36之視訊編碼器件,其中該複數個層包括該視訊資料位元串流之每一層,惟該視訊資料位元串流之一基礎視圖除外。
  38. 如請求項36之視訊編碼器件,其中該複數個層包括該視訊資料位元串流之每一深度層。
  39. 如請求項36之視訊編碼器件,其進一步包含至少部分基於該各別層為一紋理層或是一深度層來判定是否要在該VPS擴展中包括指示是否針對該各別層啟用該寫碼工具的該語法元素。
  40. 如請求項33之視訊編碼器件,其中:該一或多個完整的經寫碼視訊序列為一或多個完整的經寫碼視訊序列的一第一集合,及該一或多個處理器進一步經組態以在該視訊資料位元串流中包括一包括識別該VPS之一語法元素的序列參數集(SPS),其中該SPS為可應用於零或零個以上經寫碼之視訊序列的一第二集合之一語法結構。
  41. 如請求項33之視訊編碼器件,其中該寫碼工具包括以下中之一者:視圖間參考之使用、深度圖模型化模式之使用、自紋理至深度之運動向量繼承之使用、視圖間運動向量預測之使用及視圖間殘餘預測之使用。
  42. 如請求項33之視訊編碼器件,其中該視訊寫碼擴展包含高效率 視訊寫碼(HEVC)之一多視圖視訊寫碼(MVC)擴展、一可調式視訊寫碼(SVC)擴展或一3D視訊寫碼(3DV)擴展中的一者。
  43. 一種視訊編碼器件,其包含:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一視訊參數集(VPS)擴展之構件,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;用於當該語法元素指示針對該組可應用層啟用該寫碼工具時藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分之構件;及用於當該語法元素指示不針對該組可應用層啟用該寫碼工具時不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料之構件。
  44. 一種電腦可讀資料儲存媒體,其具有儲存於其上之指令,該等指令當執行時組態一視訊編碼器件以:在一視訊資料位元串流中包括針對一視訊寫碼擴展之一視訊參數集(VPS)擴展,該VPS擴展為一VPS內之一語法結構,該VPS為可應用於一或多個完整的經寫碼視訊序列的一語法結構,該VPS擴展包括指示是否針對一組可應用層啟用與該視訊寫碼擴展相關聯之一寫碼工具之一語法元素;當該語法元素指示針對該組可應用層啟用該寫碼工具時,藉由使用該寫碼工具編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的視訊資料之至少一部分;及當該語法元素指示不針對該組可應用層啟用該寫碼工具時, 不使用該寫碼工具來編碼與該一或多個完整的經寫碼視訊序列相關聯且與該組可應用層相關聯的該視訊資料。
TW102125966A 2012-07-20 2013-07-19 在視訊寫碼中之參數集 TWI533679B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261673918P 2012-07-20 2012-07-20
US201261680556P 2012-08-07 2012-08-07
US13/945,618 US9380289B2 (en) 2012-07-20 2013-07-18 Parameter sets in video coding

Publications (2)

Publication Number Publication Date
TW201408078A true TW201408078A (zh) 2014-02-16
TWI533679B TWI533679B (zh) 2016-05-11

Family

ID=49946203

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102125966A TWI533679B (zh) 2012-07-20 2013-07-19 在視訊寫碼中之參數集

Country Status (6)

Country Link
US (1) US9380289B2 (zh)
EP (1) EP2875632A1 (zh)
KR (1) KR101751144B1 (zh)
CN (1) CN104471943B (zh)
TW (1) TWI533679B (zh)
WO (1) WO2014015279A1 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2210421A4 (en) * 2007-10-16 2013-12-04 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING A VIDEO SIGNAL
CA2758104C (en) * 2009-04-07 2015-04-07 Lg Electronics Inc. Broadcast transmitter, broadcast receiver and 3d video data processing method thereof
US9912941B2 (en) 2012-07-02 2018-03-06 Sony Corporation Video coding system with temporal layers and method of operation thereof
US10110890B2 (en) 2012-07-02 2018-10-23 Sony Corporation Video coding system with low delay and method of operation thereof
EP2868092A4 (en) * 2012-07-02 2016-05-04 Nokia Technologies Oy METHOD AND DEVICE FOR VIDEO CODING
US9451256B2 (en) 2012-07-20 2016-09-20 Qualcomm Incorporated Reusing parameter sets for video coding
US9241158B2 (en) 2012-09-24 2016-01-19 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
WO2014050597A1 (ja) * 2012-09-28 2014-04-03 シャープ株式会社 画像復号装置
US10038899B2 (en) * 2012-10-04 2018-07-31 Qualcomm Incorporated File format for video data
US9948939B2 (en) 2012-12-07 2018-04-17 Qualcomm Incorporated Advanced residual prediction in scalable and multi-view video coding
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
WO2015008464A1 (en) * 2013-07-14 2015-01-22 Sharp Kabushiki Kaisha Video parameter set signaling
US10045014B2 (en) * 2013-07-15 2018-08-07 Mediatek Singapore Pte. Ltd. Method of disparity derived depth coding in 3D video coding
KR101709775B1 (ko) * 2013-07-23 2017-02-23 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법 및 장치
CN105580368B (zh) * 2013-09-30 2018-10-19 日本放送协会 图像编码装置和方法以及图像解码装置和方法
US10187662B2 (en) * 2013-10-13 2019-01-22 Sharp Kabushiki Kaisha Signaling parameters in video parameter set extension and decoder picture buffer operation
CA2921759C (en) * 2013-10-17 2018-05-15 Mediatek Inc. Method of motion information prediction and inheritance in multi-view and three-dimensional video coding
US20150189321A1 (en) * 2014-01-02 2015-07-02 Mediatek Inc. Method of Binarization and Context Adaptive Binary Arithmetic Coding of Depth Coding Syntax
WO2015133866A1 (ko) * 2014-03-06 2015-09-11 삼성전자 주식회사 서브 블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브 블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
JP6368795B2 (ja) * 2014-03-14 2018-08-01 ヴィド スケール インコーポレイテッド Rgbビデオコーディングエンハンスメントのためのシステムおよび方法
WO2015152605A1 (ko) * 2014-03-31 2015-10-08 삼성전자 주식회사 깊이 영상을 부호화 또는 복호화 하는 방법 및 장치
US10218957B2 (en) * 2014-06-20 2019-02-26 Hfi Innovation Inc. Method of sub-PU syntax signaling and illumination compensation for 3D and multi-view video coding
CN105519120B (zh) * 2014-06-20 2019-03-22 寰发股份有限公司 用于视频数据的三维或多视图视频编码的分区模式编码方法
WO2015196334A1 (en) * 2014-06-23 2015-12-30 Mediatek Singapore Pte. Ltd. Methods for signaling of sub-pu syntax element in multi-view and 3d video coding
BR112019007423B1 (pt) * 2016-10-11 2022-06-14 Lg Electronics Inc Método de decodificação de vídeo realizado por um dispositivo de decodificação, método de codificação de vídeo realizado por um dispositivo de codificação, e mídia de armazenamento legível por computador não transitória
US10666943B2 (en) * 2017-09-15 2020-05-26 Futurewei Technologies, Inc. Block partition structure in video compression
JP2022510120A (ja) * 2018-12-07 2022-01-26 インターデジタル ヴイシー ホールディングス, インコーポレイテッド コード化ツールの組み合わせおよび制限の管理
KR20200073117A (ko) * 2018-12-13 2020-06-23 에스케이텔레콤 주식회사 코딩 툴 설정 방법 및 영상 복호화 장치
WO2020122574A1 (ko) 2018-12-13 2020-06-18 에스케이텔레콤 주식회사 코딩 툴 설정 방법 및 영상 복호화 장치
CN113906744A (zh) * 2019-03-15 2022-01-07 北京达佳互联信息技术有限公司 视频编解码中无损编解码的信令
BR112021022174A2 (pt) 2019-05-11 2021-12-21 Beijing Bytedance Network Tech Co Ltd Método para processar dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamento e meio de gravação
WO2020256510A1 (ko) * 2019-06-21 2020-12-24 현대자동차주식회사 코딩 툴들을 제어하는 방법 및 장치
CN114128281B (zh) * 2019-06-21 2024-06-18 现代自动车株式会社 用于控制编码工具的方法
JP7200074B2 (ja) * 2019-09-20 2023-01-06 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
EP4022777A4 (en) 2019-09-24 2022-11-23 Huawei Technologies Co., Ltd. DECODED PICTURE BUFFER OPERATION FOR RESOLUTION CHANGES
KR102493125B1 (ko) * 2019-10-10 2023-01-30 삼성전자주식회사 툴 세트를 이용하는 영상 복호화 장치 및 이에 의한 영상 복호화 방법, 및 영상 부호화 장치 및 이에 의한 영상 부호화 방법
EP4029245A4 (en) * 2019-10-12 2022-11-23 Beijing Bytedance Network Technology Co., Ltd. HIGH LEVEL SYNTAX FOR VIDEO CODING TOOLS
WO2021034230A2 (en) * 2019-12-23 2021-02-25 Huawei Technologies Co., Ltd. Method and apparatus of lossless video coding based on refinement of lossy reconstructed signal
US11356706B2 (en) * 2020-01-08 2022-06-07 Qualcomm Incorporated Storage and delivery of video data for video coding
KR20240027893A (ko) * 2020-04-08 2024-03-04 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 비디오 코딩에서의 신택스 요소들의 시그널링을 위한 방법 및 장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7450646B2 (en) * 2002-06-04 2008-11-11 Panasonic Corporation Image data transmitting apparatus and method and image data reproducing apparatus and method
EP2005607B1 (en) * 2006-03-27 2016-09-07 Vidyo, Inc. System and method for management of scalability information in scalable video coding systems using control messages
WO2008005124A2 (en) * 2006-07-05 2008-01-10 Thomson Licensing Methods and apparatus for multi-view video encoding and decoding
WO2008088497A2 (en) 2006-12-21 2008-07-24 Thomson Licensing Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding
US20100266042A1 (en) 2007-03-02 2010-10-21 Han Suh Koo Method and an apparatus for decoding/encoding a video signal
WO2010073513A1 (ja) * 2008-12-26 2010-07-01 日本ビクター株式会社 画像符号化装置、画像符号化方法およびそのプログラム、ならびに画像復号装置、画像復号方法およびそのプログラム
KR20120081022A (ko) * 2009-05-01 2012-07-18 톰슨 라이센싱 3d 비디오 코딩 포맷
US9131033B2 (en) 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
WO2012105265A1 (en) 2011-02-03 2012-08-09 Panasonic Corporation Systems and methods for encoding and decoding video which support compatibility functionality to legacy video players
US20120219069A1 (en) 2011-02-28 2012-08-30 Chong Soon Lim Methods and apparatuses for encoding and decoding images of a plurality of views using multiview video coding standard and mpeg-2 video standard
US20120236115A1 (en) 2011-03-14 2012-09-20 Qualcomm Incorporated Post-filtering in full resolution frame-compatible stereoscopic video coding
US20130188013A1 (en) 2011-07-22 2013-07-25 Qualcomm Incorporated Mvc based 3dvc codec supporting inside view motion prediction (ivmp) mode
WO2013030458A1 (en) 2011-08-31 2013-03-07 Nokia Corporation Multiview video coding and decoding
US9451256B2 (en) 2012-07-20 2016-09-20 Qualcomm Incorporated Reusing parameter sets for video coding

Also Published As

Publication number Publication date
KR101751144B1 (ko) 2017-07-11
KR20150036599A (ko) 2015-04-07
TWI533679B (zh) 2016-05-11
CN104471943B (zh) 2018-02-13
US9380289B2 (en) 2016-06-28
US20140022343A1 (en) 2014-01-23
CN104471943A (zh) 2015-03-25
WO2014015279A1 (en) 2014-01-23
EP2875632A1 (en) 2015-05-27

Similar Documents

Publication Publication Date Title
TWI533679B (zh) 在視訊寫碼中之參數集
TWI781972B (zh) 具有用於視頻寫碼之樣本存取之線性模型預測模式
EP3058743B1 (en) Support of multi-mode extraction for multi-layer video codecs
JP6549145B2 (ja) マルチレイヤコーデックのためのhevc seiメッセージの汎用的な使用
KR102384092B1 (ko) 비디오 코딩에서 파티셔닝 방식들에 대한 가상 참조 디코더 파라미터들의 적합성을 테스트하기 위한 방법 및 디바이스
RU2633100C2 (ru) Применимость битового субпотока к вложенным sei-сообщениям при кодировании видео
US9521393B2 (en) Non-nested SEI messages in video coding
TWI539796B (zh) 視差向量推導
JP5905598B2 (ja) マルチビュービデオコード化(mvc)適合3次元ビデオコード化(3dvc)のためのパラメータセットのアクティブ化
JP6585096B2 (ja) マルチレイヤビデオコーディング
TWI551121B (zh) 視訊寫碼中之視差向量改進
TWI566589B (zh) 三維視訊之視圖合成
JP2016524408A (ja) 隣接ベースの視差ベクトル導出を用いた3dビデオコーディングのための、並列に導出された視差ベクトル
TW201515440A (zh) 多層內容脈絡中之影像塊及波前處理
JP6199320B2 (ja) 3次元ビデオコーディングのためのネットワーク抽象化レイヤ(nal)ユニットヘッダ設計

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees