TW201313027A - 在視訊寫碼中發信畫面大小 - Google Patents

在視訊寫碼中發信畫面大小 Download PDF

Info

Publication number
TW201313027A
TW201313027A TW101125715A TW101125715A TW201313027A TW 201313027 A TW201313027 A TW 201313027A TW 101125715 A TW101125715 A TW 101125715A TW 101125715 A TW101125715 A TW 101125715A TW 201313027 A TW201313027 A TW 201313027A
Authority
TW
Taiwan
Prior art keywords
code unit
size
picture
unit size
pixels
Prior art date
Application number
TW101125715A
Other languages
English (en)
Other versions
TWI502967B (zh
Inventor
Ying Chen
Marta Karczewicz
Ye-Kui Wang
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201313027A publication Critical patent/TW201313027A/zh
Application granted granted Critical
Publication of TWI502967B publication Critical patent/TWI502967B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一視訊編碼器經組態以判定包括於一視訊序列中之一或多個畫面的一畫面大小。與該視訊序列相關聯之該畫面大小可為該視訊序列之一對準寫碼單元大小的一倍數。在一實例中,該視訊序列之該對準寫碼單元大小可包含一最小寫碼單元大小,其中該最小寫碼單元大小係選自對應於該視訊序列中之不同畫面的複數個最小的寫碼單元大小。一視訊解碼器經組態以獲得語法元素以便判定該視訊序列之該畫面大小及該對準寫碼單元大小。該視訊解碼器以該畫面大小解碼包括於該視訊序列中之該等畫面,且將該等經解碼畫面儲存於一經解碼畫面緩衝器中。

Description

在視訊寫碼中發信畫面大小
本發明係關於視訊寫碼之領域。
本申請案主張以下各者之權利:2011年7月17日申請之美國臨時申請案第61/508,659號;2011年9月2日申請之美國臨時申請案第61/530,819號;及2011年10月20日申請之美國臨時申請案第61/549,480號,以上各案中之每一者的全部內容特此以引用之方式併入。
數位視訊能力可併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲機、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4(第10部分、進階視訊寫碼(AVC))所定義之標準、目前正在開發之高效視訊寫碼(HEVC)標準及該等標準之擴展中所描述的彼等視訊壓縮技術。視訊器件可藉由實施該等視訊壓縮技術而更有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(畫面內)預測及/或時間(畫面間)預測以減小或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼而言,可將視訊片段(亦即,視訊圖框或視訊圖框之一部分)分割為視訊區塊,該等視訊區塊亦可稱作樹區塊、寫碼單元(CU)及/或寫碼節點。使用相對於同一畫面中之相鄰區塊中之參考樣本的空間預測來編碼畫面之框內寫碼(I)片段中的視訊區塊。畫面之框間寫碼(P或B)片段中的視訊區塊可使用相對於同一畫面中之相鄰區塊中之參考樣本的空間預測或相對於其他參考畫面中之參考樣本的時間預測。畫面可稱作圖框,且參考畫面可稱作參考圖框。
空間或時間預測導致針對待寫碼之區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。框間寫碼區塊係根據一指向形成預測性區塊之參考樣本之區塊的運動向量進行編碼,且殘餘資料指示經寫碼區塊與預測性區塊之間的差。框內寫碼區塊係根據框內寫碼模式及殘餘資料進行編碼。為了進行進一步壓縮,可將殘餘資料自像素域變換至一變換域,從而導致可接著進行量化之殘餘變換係數。可掃描最初以二維陣列配置的經量化之變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成更進一步之壓縮。
大體而言,本發明描述用於寫碼包括於一視訊序列之畫面或圖框中之視訊資料的技術。詳言之,本發明描述可基 於該視訊序列之一對準寫碼單元大小來寫碼該視訊序列中之一群組之畫面之一畫面大小的技術。該視訊序列之該對準寫碼單元大小可選自該視訊寫碼方案所支援的若干可能寫碼單元大小。本發明之技術包括發信(signaling,即發送)該視訊序列中之該等畫面中之一或多者的一對準寫碼單元大小,且將該一或多個畫面之一大小寫碼為最小寫碼單元之一倍數。
在本發明之一實例中,一種用於編碼視訊資料之方法包含:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
在另一實例中,一種解碼視訊資料之方法包含:獲得一經寫碼之視訊序列,其包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及將該經解碼畫面儲存於一經解碼畫面緩衝器中。
在另一實例中,一種用於編碼視訊資料之裝置包含一視訊編碼器件,該視訊編碼器件經組態以進行以下操作:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
在另一實例中,一種用於解碼視訊資料之裝置包含一視訊解碼器件,該視訊解碼器件經組態以進行以下操作:獲得一經寫碼之視訊序列,其包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及將該經解碼畫面儲存於一經解碼畫面緩衝器中。
在另一實例中,一種用於編碼視訊資料之器件包含:用於判定定義一視訊序列之複數個畫面中之每一者之一最小寫碼單元大小的構件,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;用於基於該複數個可能寫碼單元大小來判定該視訊序 列之一對準寫碼單元大小的構件;用於判定與該視訊序列相關聯之一畫面大小的構件,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及用於在序列層級語法資訊中發信該對準寫碼單元大小值的構件。
在另一實例中,一種用於解碼視訊資料之器件包含:用於獲得一經寫碼之視訊序列的構件,該經寫碼之視訊序列包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;用於獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面之一畫面大小的構件,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及用於將該經解碼畫面儲存於一經解碼畫面緩衝器中的構件。
在另一實例中,一種電腦可讀儲存媒體包含儲存於其上之指令,當執行時,該等指令使得一用於編碼視訊資料之器件的一處理器進行以下操作:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
在另一實例中,一種電腦可讀儲存媒體包含儲存於其上 之指令,當執行時,該等指令使得一用於解碼視訊資料之器件的一處理器進行以下操作:獲得一經寫碼之視訊序列,其包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及將該經解碼畫面儲存於一經解碼畫面緩衝器中。
一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述及圖式以及自申請專利範圍而顯而易見。
視訊序列可包括畫面之群組。畫面之群組中的每一畫面可具有一最小寫碼單元大小。在一實例中,該最小寫碼單元大小可為具有以下像素或樣本尺寸中的一者的矩形或正方形:四個像素、八個像素、16個像素、32個像素及64個像素。為了增大視訊序列之寫碼效率,可為有用的是判定視訊序列之最小寫碼單元大小且指定畫面之群組的畫面大小,其中畫面大小為視訊序列之最小寫碼單元大小之最小值的倍數。
圖1為說明可實施本發明之技術之視訊編碼及解碼系統10之一實例的方塊圖。如圖1中所展示,系統10包括源器件12,源器件12經由通信頻道15將經編碼視訊傳輸至目的地器件16。源器件12及目的地器件16可包含廣泛範圍之器 件中的任一者。在一些情形下,源器件12及目的地器件16可包含無線通信器件手機,諸如,所謂蜂巢式或衛星無線電電話。然而,可將一般應用於編碼及解碼的本發明之技術應用於包括視訊編碼及/或解碼能力之非無線器件。源器件12及目的地器件16僅僅為可支援本文中所描述之技術之寫碼器件的實例。
在圖1之實例中,源器件12可包括一視訊源20、一視訊編碼器22、一調變器/解調變器(數據機)23及一傳輸器24。目的地器件16可包括一接收器26、一數據機27、一視訊解碼器28及一顯示器件30。
視訊源20可包含視訊擷取器件,諸如,視訊攝影機、含有先前所擷取視訊之視訊存檔,來自視訊內容提供者或另一視訊源之視訊饋入。作為另一替代例,視訊源20可產生作為來源視訊的基於電腦圖形之資料,或實況視訊、經存檔視訊及電腦產生之視訊的組合。在一些情形下,若視訊源20為視訊攝影機,則源器件12及目的地器件16可形成所謂照相手機或視訊電話。在每一情形下,可由視訊編碼器22來編碼經擷取、預擷取或電腦產生之視訊。
在一些實例(但非所有情形)中,一旦由視訊編碼器22編碼了視訊資料,經編碼之視訊資訊就可接著由數據機23根據一通信標準進行調變,該通信標準係諸如分碼多重存取(CDMA)、正交分頻多工(OFDM)或任何其他通信標準或技術。經編碼且經調變之資料可接著經由傳輸器24傳輸至目的地器件16。數據機23可包括各種混頻器、濾波器、放大 器或經設計以用於信號調變之其他組件。傳輸器24可包括經設計以用於傳輸資料的電路,該等電路包括放大器、濾波器及一或多個天線。目的地器件16之接收器26經由頻道15接收資訊,且數據機27解調變該資訊。由視訊解碼器28執行之視訊解碼程序可包括與由視訊編碼器22執行之編碼技術互逆的技術。
通信頻道15可包含任何無線或有線通信媒體(諸如射頻(RF)頻譜或一或多個實體傳輸線,或無線與有線媒體之任何組合)。通信頻道15可形成一基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的一部分。通信頻道15大體上代表用於將視訊資料自源器件12傳輸至目的地器件16的任何合適通信媒體或不同通信媒體之集合。此外,圖1僅僅為實例,且本發明之技術可應用於未必包括編碼器件與解碼器件之間的任何資料通信之視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料可自區域記憶體擷取、經由網路串流傳輸等等。編碼器件可編碼資料且將資料儲存至記憶體,及/或解碼器件可自記憶體擷取及解碼資料。在許多情形下,編碼及解碼係由非相關器件執行,該等非相關器件不彼此通信,而是僅將資料編碼至記憶體及/或自記憶體擷取並解碼資料。舉例而言,在已編碼視訊資料之後,視訊資料可經封包化以用於傳輸或儲存。可遵照多種標準中之任一者(諸如,國際標準化組織(ISO)基礎媒體檔案格式及其擴展(諸如AVC))將視訊資料組譯成視訊檔案。
在一些情形下,視訊編碼器22及視訊解碼器28可實質上根據諸如新興HEVC標準的視訊壓縮標準進行操作。然而,本發明之技術亦可在多種其他視訊寫碼標準的內容脈絡中應用,包括一些舊標準或新的或新興標準。雖然未展示於圖1中,但在一些情形下,視訊編碼器22及視訊解碼器28可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器22及視訊解碼器28各自可實施為一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體、或其組合。視訊編碼器22及視訊解碼器28中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別行動器件、用戶器件、廣播器件、伺服器等等中的經組合之編碼器/解碼器(CODEC)的一部分。在本發明中,術語寫碼器指代編碼器、解碼器或CODEC,且術語寫碼器、編碼器、解碼器及CODEC皆指代經設計用於符合本發明之視訊資料之寫碼(編碼及/或解碼)的特定機器。在本發明中,術語「寫碼」可指代編碼及/或解碼中之任一者或兩者。
在一些情形下,源器件12及目的地器件16可以實質上對稱之方式操作。舉例而言,源器件12及目的地器件16中之 每一者可包括視訊編碼及解碼組件。因此,系統10可支援源器件12與目的地器件16之間的單向或雙向視訊傳輸(例如,以用於視訊串流、視訊播放、視訊廣播或視訊電話)。
視訊編碼器22及視訊解碼器28可執行預測性寫碼,其中將正被寫碼之視訊區塊與一或多個預測性候選者進行比較以便識別一預測性區塊。視訊區塊可存在於個別視訊圖框或畫面(或其他獨立定義之視訊單元,諸如,片段)內。可將圖框、片段、圖框之部分、畫面之群組或其他資料結構定義為包括視訊區塊之視訊資訊單元。預測性寫碼之程序可為框內的(在該情形下,預測性資料係基於同一視訊圖框或片段內之相鄰框內資料產生)或框間的(在該情形下,預測性資料係基於先前或後續圖框或片段中之視訊資料產生)。視訊編碼器22及視訊解碼器28可支援若干不同預測性寫碼模式。視訊編碼器22可選擇一所需視訊寫碼模式。在預測性寫碼中,在一預測性區塊經識別之後,正被寫碼之當前視訊區塊與該預測性區塊之間的差被寫碼為一殘餘區塊,且將預測語法(諸如,在框間寫碼之情形下的運動向量,或在框內寫碼之情形下的預測性模式)用以識別預測性區塊。在一些情形下,殘餘區塊可經變換且經量化。變換技術可包含DCT程序或概念上類似之程序、整數變換、小波變換或其他類型之變換。在DCT程序中,作為一實例,變換程序將像素值之集合(例如,殘餘像素值)轉換成變換係數,該等變換係數可表示在頻域中像素值之能 量。視訊編碼器22及視訊解碼器28可將量化應用於變換係數。量化大體上涉及限制與任一給定變換係數相關聯之位元之數目的程序。
在變換及量化之後,視訊編碼器22及視訊解碼器28可對經量化且經變換之殘餘視訊區塊執行熵寫碼。作為編碼程序的一部分,視訊編碼器22可產生將由視訊解碼器28在解碼程序中使用之語法元素。視訊編碼器22亦可熵編碼語法元素且在經編碼之位元串流中包括語法元素。大體而言,熵寫碼包含共同地壓縮經量化之變換係數及/或其他語法資訊之序列的一或多個程序。視訊編碼器22及視訊解碼器28可對經量化之變換係數執行掃描技術以便根據二維視訊區塊定義係數之一或多個串行化一維向量。接著可(例如)經由上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)或另一熵寫碼程序來熵寫碼經掃描之係數連同任何語法資訊。
在一些實例中,作為編碼程序之一部分,視訊編碼器22可解碼經編碼之視訊區塊以便產生用於後續視訊區塊之後續基於預測之寫碼的視訊資料。此時常稱作編碼程序之解碼迴路,且大體上模擬由解碼器器件執行之解碼。在編碼器或解碼器之解碼迴路中,可使用濾波技術以改良視訊品質,且(例如)平滑化像素邊界且有可能自經解碼視訊移除假影。此濾波可為迴路內濾波或迴路後濾波。藉由迴路內濾波,經重建構之視訊資料之濾波發生於寫碼迴路中,此意謂經濾波之資料由編碼器或解碼器儲存以供隨後用於預 測後續影像資料。對比而言,藉由迴路後濾波,經重建構之視訊資料之濾波發生於寫碼迴路之外,此意謂資料之未經濾波版本由編碼器或解碼器儲存以供隨後用於預測後續影像資料。迴路濾波時常在一單獨解區塊濾波程序之後,該解區塊濾波程序通常將濾波應用於在鄰近視訊區塊之邊界上或附近的像素以便移除出現於視訊區塊邊界處的方塊效應假影。
目前正進行努力以開發新的視訊寫碼標準,目前稱作高效視訊寫碼(HEVC)。該即將到來之標準亦稱作H.265。HEVC標準之新近草案(稱作「HEVC工作草案3」或「WD3」)描述於文獻JCTVC-E603,Wiegand等人之「High efficiency video coding(HEVC)text specification draft 3」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合協作團隊(JCT-VC),第五次會議:日內瓦,CH,2011年3月16日至23日)中,該文獻之全部內容特此以引用之方式併入。該等標準化努力係基於稱作HRVC測試模型(HM)的視訊寫碼器件之模型。該HM假定超越經組態以根據ITU-T H.264/AVC來寫碼視訊資料之器件的視訊寫碼器件之若干能力。舉例而言,儘管H.264提供九個框內預測編碼模式,但HM提供多達三十四個框內預測編碼模式。視訊編碼器22可對符合HEVC標準及HEVC測試模型之視訊資料之區塊進行操作。
HEVC標準包括視訊資料之區塊的特定術語及區塊大小。詳言之,HEVC包括以下術語:最大寫碼單元(LCU)、 寫碼單元(CU)、預測單元(PU)及變換單元(TU)。在本發明之意義內,LCU、CU、PU及TU皆為視訊區塊。本發明亦使用術語區塊來指代LCU、CU、PU或TU中之任一者。在HEVC中,語法元素可在LCU層級、CU層級、PU層級及TU層級處定義。在HEVC中,LCU指代最大大小之寫碼單元,其為在給定情況下所支援之就像素數目而言的最大寫碼單元。大體而言,在HEVC中,CU具有與H.264之巨集區塊類似之用途,除了CU不具有大小區別外。因此,可將CU分裂為子CU且可將LCU分割為較小CU。另外,出於預測之目的,可將CU分割為預測單元(PU)。PU可表示對應CU之全部或一部分,且可包括用於擷取PU之參考樣本的資料。PU可具有正方形或矩形形狀。TU表示像素差值或像素殘餘之一集合,其可經變換以產生可經量化之變換係數。在HEVC標準中,變換並非固定,而是根據變換單元(TU)大小進行定義,該等變換單元(TU)大小可為與給定CU相同之大小,或有可能更小。
在HEVC中,LCU可與四元樹資料結構相關聯。另外,在一些實例中,對應於CU之殘餘樣本可使用四元樹分割方案再分為更小單元,該四元樹分割方案包括稱為「殘餘四元樹」(RQT)之四元樹結構。大體而言,四元樹資料結構包括每CU之一個節點,其中根節點可對應於LCU。舉例而言,CU0可指代LCU,且CU1至CU4可包含LCU之子CU。若一CU被分裂為四個子CU,則對應於該CU之節點包括四個葉節點,該四個葉節點中之每一者對應於該等子CU中 之一者。四元樹資料結構之每一節點可提供對應CU之語法資料。舉例而言,四元樹中之節點可包括CU層級語法中之一分裂旗標以指示對應於該節點之CU是否被分裂為子CU。CU之語法元素可遞歸地進行定義,且可視CU是否被分裂為子CU而定。若CU未被進一步分裂,則將其稱作葉CU。在本發明中,亦可將葉CU之4個子CU稱作葉CU,儘管不存在原始葉CU之顯式分裂。舉例而言,若16x16大小之CU不進一步分裂,則四個8x8子CU亦將稱作葉CU,儘管該16x16 CU從未分裂過。
RQT之葉節點或葉CU可對應於TU。亦即,葉CU可包括一四元樹,其指示該葉CU如何分割為TU。葉CU可包括一或多個變換單元(TU)。本發明可將指示LCU如何分割之四元樹稱作CU四元樹,且將指示葉CU如何分割為TU之四元樹稱作TU四元樹。TU四元樹之根節點大體上對應於葉CU,而CU四元樹之根節點大體上對應於LCU。TU四元樹之未經分裂之TU稱作葉TU。分裂旗標可指示葉CU是否分裂為四個變換單元。接著,每一變換單元可進一步分裂為4個子TU。當TU不被進一步分裂時,其可稱作葉TU。
另外,葉節點或葉CU可包括一或多個預測單元(PU)。舉例而言,當PU經框間模式編碼時,PU可包括定義PU之運動向量的資料。定義運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向之參考圖框,及/或運動向量之參考清單(例 如,清單0或清單1)。葉CU之定義PU之資料亦可描述(例如)將CU分割為一或多個PU。分割模式可視CU是否為未寫碼、經編碼之框內預測模式或經編碼之框間預測模式而不同。對於框內寫碼而言,可將PU視為與以下所描述之葉變換單元相同。
大體而言,對於HEVC中之框內寫碼而言,屬於葉CU之所有葉TU共用同一框內預測模式。亦即,同一框內預測模式大體上被應用以計算葉CU之所有TU的預測值。對於框內寫碼而言,視訊編碼器22可使用框內預測模式來計算每一葉TU之殘餘值,作為對應於TU之預測值之部分與原始區塊之間的差。該殘餘值可經變換、經量化且經掃描。對於HEVC中之框間寫碼而言,視訊編碼器22可在PU層級處執行預測,且可計算每一PU之殘餘。對應於葉CU之殘餘值可經變換、經量化且經掃描。對於框間寫碼而言,葉TU可大於或小於PU。對於框內寫碼而言,PU可與對應之葉TU共同定位。在一些實例中,葉TU之最大大小可為對應葉CU之大小。
如以上所描述,HEVC標準允許根據變換單元(TU)之變換,對於不同CU而言該等變換單元(TU)可不同。通常基於針對經分割LCU定義之給定CU內之PU的大小確定TU之大小,儘管可能並非總是如此情形。TU通常為與PU相同大小或小於PU。與TU相關聯之像素差值可經變換以產生變換係數,該等變換係數可經量化。另外,可根據在LCU層級處定義之量化參數(QP)應用量化。因此,可將相同級 別之量化應用於與LCU內之CU之不同PU相關聯的TU中之所有變換係數。然而,不同於發信QP自身,可隨LCU發信QP之改變或差(亦即,差量)以指示相對於先前LCU之QP的QP之改變。
視訊編碼器22可藉由將根據HEVC標準定義之LCU、CU、PU及TU用作視訊寫碼資訊之單元而執行畫面、圖框、片段、圖框之部分、畫面之群組或其他視訊資料的視訊編碼。
舉例而言,視訊編碼器22可編碼包含最大寫碼單元(LCU)之視訊資料的一或多個畫面,其中LCU係根據四元樹分割方案分割為區塊大小之經寫碼單元(CU)的集合。視訊編碼器22及視訊解碼器28可使用具有符合HEVC標準之不同大小的CU。舉例而言,視訊編碼器22可使用64x64、32x32、16x16、8x8及4x4像素之可能CU大小。對於一給定視訊序列而言,視訊編碼器22可針對視訊序列中之所有畫面使用64x64像素之最大CU大小,而同時視訊序列中之一些畫面可使用4x4像素之最小可能CU大小進行編碼而視訊序列中之其他畫面可使用8x8像素之最小CU大小進行編碼。
如以上所描述,本發明中對CU的引用可指代畫面之最大寫碼單元或LCU之子CU。視訊編碼器22可將LCU分裂為子CU,且每一子CU可進一步分裂為子CU。視訊編碼器22可包括用於位元串流之語法資料,該語法資料經定義以指示分割LCU之最大次數。分裂LCU之次數可稱作CU深度。
另外,視訊編碼器22亦可定義用於視訊序列中之每一畫面的最小寫碼單元(SCU)。SCU可指代當若干可能CU大小可用時用以寫碼畫面之最小寫碼單元。舉例而言,視訊編碼器22可經組態以使用可能CU大小64x64、32x32、16x16、8x8及4x4像素中之一者來編碼視訊序列中之畫面。在一實例中,可使用相同SCU大小(例如,4x4像素或8x8像素)來編碼視訊序列中之所有畫面。在其他實例中,可使用4x4像素之SCU大小來編碼視訊序列中之一些畫面,而同時可使用8x8像素之SCU大小來編碼視訊序列中之其他畫面。因此,在此實例中,視訊序列中之畫面可具有4x4像素及8x8像素之各別SCU,亦即,SCU大小可在圖框間改變。視訊編碼器22可判定視訊序列之最小SCU或最大SCU。在此實例中,最小SCU將為4x4,而最大SCU將為8x8。
視訊編碼器22可包括位元串流內之各種層級之語法資料,該語法資料定義LCU、CU、PU、TU及SCU之大小。舉例而言,視訊編碼器22可使用序列層級語法來發信LCU之大小。
除了發信用以編碼視訊序列中之畫面的CU之大小以外,視訊編碼器22亦可使用各種技術發信視訊序列中之畫面之大小。與視訊序列相關聯之畫面之大小可等於儲存於經解碼畫面緩衝器(DPB)中之經解碼畫面之畫面大小。畫面可具有一單位大小,諸如,具有選定高度及寬度之區塊。畫面大小可為由HEVC或另一視訊標準支援的畫面大 小,例如,畫面大小可包括320x240、1920x1080及7680x4320。另外,視訊編碼器22可發信用於寫碼片段標頭中之紋理視圖分量的語法元素。因此,視訊編碼器22可使用各種語法元素來發信與視訊序列相關聯之畫面之大小及/或與該視訊序列相關聯之最小的最小寫碼單元大小。同樣,視訊解碼器28可獲得指示與經寫碼之視訊序列相關聯的畫面之大小及/或與該經寫碼之視訊序列相關聯之最小的最小寫碼單元大小的各種語法元素,且將該等語法元素用於解碼經寫碼之視訊序列。在一實例中,視訊編碼器22可在序列層級語法資訊中發信與視訊序列相關聯之最小的最小寫碼單元大小及畫面的大小,其中該畫面大小為最小的最小寫碼單元大小之倍數。在一實例中,視訊解碼器28可獲得包括一或多個經寫碼畫面的經寫碼之視訊序列及在序列層級語法資訊中之針對該視訊序列之最小的最小寫碼單元大小。視訊解碼器28可解碼經寫碼之視訊序列中的經寫碼畫面,且以等於最小的最小寫碼單元大小之倍數的畫面大小將經解碼畫面儲存於經解碼畫面緩衝器中。
在利用固定大小之巨集區塊(例如,16x16)的一些視訊壓縮技術中,可以巨集區塊為單位來發信畫面之大小。當寬度或高度不等於固定大小之巨集區塊的倍數時,可使用裁剪窗口。舉例而言,1920x1080畫面可在位元串流中寫碼為1920x1088,但裁剪窗口向真實窗口發信以使得該畫面顯示為1920x1080。在其他技術中,可以像素為單位發信畫面之大小。以像素為單位發信畫面之大小的一實例係 由HEVC標準提供。
在一實例中,視訊編碼器22及視訊解碼器28可寫碼視訊資料,其中根據經寫碼單元(CU)之特定類型來定義畫面序列中之經寫碼畫面之大小。如以上所描述,該等特定類型之經寫碼區塊可為畫面之序列中的每一畫面之LCU、SCU、最小的最小CU或最大的最小CU。更具體而言,視訊編碼器22可指示用以相對於畫面之寫碼單元(CU)之大小來發信該畫面之大小的單位。在一實例中,該單位可等於在經寫碼之視訊序列中所允許的最小CU大小之大小。在一些情形下,對於視訊序列中之所有畫面而言,最小CU大小為相同的。在其他情形下,視訊序列中之每一畫面的最小CU大小可不同。在彼情形下,視訊序列中之每一畫面的最小CU大小不得小於該視訊序列之最小可能CU大小。在另一實例中,由視訊編碼器22指示之單位可等於一群組之畫面的最大寫碼單元(LCU)之大小。在一些實例中,可藉由視訊編碼器22或視訊解碼器28將裁剪窗口應用於畫面以減小畫面之大小。舉例而言,裁剪窗口可裁剪畫面之右側或底側中的至少一者。
在另一實例中,視訊編碼器22可相對於對準CU(ACU)大小來發信畫面大小。對準CU大小可為用以指定儲存於經解碼畫面緩衝器(DPB)中之經解碼畫面之畫面大小的CU大小。此畫面大小可具有皆為對準CU大小之寬度及高度之倍增的寬度及高度。類似地,畫面高度可為對準CU之高度之倍增。可以與在其他替代例中相同之方式發信對準 CU之大小(寬度及高度)。舉例而言,視訊編碼器22可在各種語法層級發信對準CU。
可根據以下實例來定義ACU大小:若視訊序列中之所有畫面皆具有相同之SCU大小,則可將ACU定義為SCU大小。另一方面,若視訊序列中之畫面具有不同SCU大小,則可將ACU定義為所有畫面間之最大或最小SCU大小。無關於如何定義ACU,ACU大小可由視訊編碼器22在與視訊序列相關聯之序列參數集合(SPS)或畫面參數集合(PPS)中顯式地發信。在一些情形下,可限制ACU大小以使得其等於或小於視訊序列之LCU大小且等於或大於視訊序列之SCU大小。
另外,在一些實例中,視訊編碼器22可以LCU為單位或以SCU為單位來發信畫面大小。在一些實例中,可在SPS中發信用以發信經編碼畫面之大小的單位。此單位可等於經寫碼之視訊序列所允許的最小CU大小之大小。在PPS中,可由視訊編碼器22來發信參考此PPS的畫面之最小CU大小之相對大小。在視訊序列中之所有畫面皆具有相同SCU大小的情形下,可不必另外在PPS中發信最小CU之相對大小。在最小CU大小在視訊序列中之畫面之間變化的情形下,可在PPS中發信視訊序列中之畫面之一部分的相對最小CU大小,其中該相對最小CU大小大於視訊序列之最小的最小CU。可在PPS中發信相對最小CU大小以作為畫面之該部分的該相對最小CU大小與視訊序列之最小的最小CU大小之間的差。
或者,可由視訊編碼器22在SPS中以LCU為單位發信畫面大小。然而,因為可由視訊編碼器22進一步發信裁剪窗口,所以使用裁剪窗口可幫助視訊解碼器識別畫面大小,只要ACU大小已知即可。
或者,當對於視訊序列中之畫面而言SCU大小變化時,該單位可等於在經寫碼之視訊序列中之畫面中所允許之最大的最小CU大小之大小。在最大CU大小為64x64像素且一些畫面具有4x4像素之CU大小而其他畫面具有8x8像素之最小CU大小的實例中,畫面大小之單位可為8x8像素。在此實例中,若畫面具有64x65像素之大小,則畫面大小將由視訊編碼器22發信為8x8像素乘9x8像素。可使用圖框裁剪語法元素來裁剪畫面中的超過64x65像素大小之像素。
在一些實例中,最大CU大小為64x64像素,且一些畫面具有4x4像素之最小可能CU大小而同時其他畫面具有8x8像素之最小CU大小。對於此實例而言,若特定類型之CU為最小可能的最小CU,則畫面大小之單位為4x4像素。繼續此實例,若特定類型之CU為最大可能的最小CU,則畫面大小之單位為8x8像素。
以下表1至表7提供了可由視訊編碼器22及視訊解碼器28實施以執行本文中所描述之技術的實例語法。實例語法可由視訊編碼器22及視訊解碼器28使用硬體、軟體、韌體或其任何組合來實施。
如以上所描述,視訊編碼器22可在SPS(序列參數集合)中發信用以發信經寫碼畫面之大小的單位。在一實例中, 此單位可等於在經寫碼之視訊序列中所允許的最小CU大小之大小。在此實例中,若最小CU大小可在經寫碼之位元串流中在一群組之畫面中之畫面之間變化,則最小CU大小將不小於此單位之大小。以下表1提供用以發信視訊序列中之經寫碼畫面之最小的最小CU大小的SPS原始位元組序列有效負載(RBSP)語法之實例。在畫面參數集合(PPS)中,可發信參考此PPS之畫面之最小CU大小的相對大小。
在表1中,語法元素log2_max_coding_block_size_minus3可指定寫碼區塊之最大大小。變數Log2MaxCUSize可經設定而等於:log2_max_coding_block_size_minus3+3。
在表1中,語法元素log2_diff_max_pic_alligned_min_coding_block_size可指定整個經寫碼之視訊序列中之寫碼區塊的最小大小與寫碼區塊之最大大小之間的差。在一些情形下,畫面之群組可經定義以使得一群組之畫面中的畫面將不具有小於該差值的最小寫碼CU大小。
變數Log2SeqMinCUSize可經設定而等於:log2_minmax_coding_block_size_minus3+3-
log2_diff_max_pic_alligned_min_coding_block_size。
此值可在自0至log2_max_coding_block_size_minus3的範圍中。變數Log2MaxCUSize及Log2SeqMinCUSize可由視訊編碼器22及視訊解碼器28用以進行用於視訊寫碼的處理。
應注意,表1包括以具有刪除線的形式出現於表1中之語法元素pic_width_in_luma_samplespic_height_in_luma_sampleslog2_min_coding_block_size_minus3。此等語法元素表示一替代實例,其中畫面之大小可由視訊編碼器22以像素為單位發信。在一實例中(如以上所描述,其中畫面大小具有皆為ACU大小之寬度及高度之倍增的寬度及高度,其中ACU大小等於視訊序列之最小SCU),視訊解碼器28可基於pic_width_in_luma_samplespic_height_in_luma_samples之值為log2_min_coding_block_size_minus3之整數倍的條件是否成立而判定位元串流是否合格。
以下表2根據可由視訊編碼器22及視訊解碼器28執行之技術提供SPS RBSP語法之另一實例。
根據表2,畫面之寬度及高度可由視訊編碼器22相對於對準CU之寬度及高度加以指示。如以上所描述,對準CU 可為由視訊編碼器22及視訊解碼器28用以指定畫面大小的CU。亦即,畫面寬度可為對準CU之寬度的倍增。如以上所描述,對準CU大小可為用以指定儲存於經解碼畫面緩衝器(DPB)中之經解碼畫面之畫面大小的大小。在一些實例中,畫面可含有一或多個完整之對準CU。在一些實例中,該對準CU為對準之最小CU(SCU)。
表2將畫面之高度指定為pic_height_in_alligned_scu且將畫面之寬度指定為pic_width_in_alligned_scupic_width_in_alligned_cu可以對準CU為單位指定經寫碼之視訊序列中之畫面的寬度。pic_height_in_alligned_cu可以對準CU為單位指定經寫碼之視訊序列中之畫面的高度。
log2_max_coding_block_size_minus3可指定寫碼區塊之最大大小。變數Log2MaxCUSize可經設定而等於log2_max_coding_block_size_minus3+3。
log2_diff_max_pic_alligned_min_coding_block_size可指定整個經寫碼之視訊序列中之寫碼區塊的最小大小與寫碼區塊之最大大小之間的差。在一些實例中,任何畫面皆不得具有小於彼變數的最小寫碼CU大小。
以下表3提供PPS RBSP之額外語法元素,該等額外語法元素可由視訊編碼器22及視訊解碼器28結合在表1抑或表2中提供之SPS RBSP加以實施。
在表3中,pic_scu_size_delta可指定參考此畫面參數集合之畫面之寫碼單元的最小大小。此值可在自0至log2_diff_max_pic_alligned_min_coding_block_size的範圍中。
變數Log2MinCUSize可經設定而等於Log2SeqMinCUSize+pic_scu_size_delta。或者,若對準CU之大小為所有畫面之最小CU大小的最大者,則變數Log2MinCUSize可經設定而等於Log2SeqMinCUSize-pic_scu_size_delta。或者,若對準CU大小可為任何可能之CU大小,則在此情形下,pic_scu_size_delta可為一帶正負號之值(se(v)),且變數Log2MinCUSize可經設定而等於Log2SeqMinCUSize-pic_scu_size_delta
除了以上所描述之實例以外,在一實例中,可將視訊序列之LCU大小定義為N乘N,且可將根據以上所描述之實例中之一者選定的ACU大小定義為M乘M。在此情形下,畫面大小可由視訊編碼器22以LCU大小為單位發信,該LCU大小可被定義為WL乘HL。因此,相對於對準CU大小之畫面大小可由視訊解碼器28根據以下等式導出:(WLN-crop_right_offset+M-1)/MM乘(HLN-crop_bottom_offset+M-1)/MM,其中crop_right_offset及crop_bottom_offset由視訊編碼器22在裁剪窗口中發信,且分別為自右邊界及底邊界裁剪掉之像素的數目。應注意,在以下表5中,WL可為pic_width_in_LCU之值,且WH為pic_height_in_LCU之值。亦應注意,以上等式中之運算(例如,除法)可為整數計算。
以下表4提供seq_parameter_set_rbsp( )之額外語法元素的另一實例。在此實例中,一或多個畫面之大小可由視訊編碼器22相對於最大寫碼單元(LCU)之大小來發信。舉例而言,一或多個畫面之大小可由視訊編碼器22在序列參數集合中發信。
畫面大小亦可由視訊編碼器22藉由num_right_offset_ACU及num_bottom_offset_ACU發信,因而畫面大小為(WLN-M num_right_offset_ACU)乘(HLN-M num_bottom_offset_ACU)。此等兩個參數可在SPS或PPS中發信。經解碼畫面將以相對於對準CU之畫面儲存於經解碼畫面緩衝器中,大小為(WLN-num_crop_acu_rightM)乘(HLN- num_crop_acu_rightM)。
在一些實例中,可進一步由視訊編碼器22發信裁剪窗口。裁剪窗口可定義待裁剪之畫面或其他者的至少右側或底側。然而,因為可進一步發信裁剪窗口,所以當對準CU大小已知時裁剪窗口可用以識別畫面大小。
在表4中所展示之實例中,根據最大寫碼單元(LCU)給出畫面的寬度及高度方面的大小。亦即,pic_width_in_LCU可指定一或多個畫面的相對於LCU的以像素計的大小。類似地,pic_height_in_LCU可指定一或多個畫面的相對於LCU的以像素計的大小。語法元素num_crop_acu_right可在裁剪窗口中發信且定義將在畫面或其他視訊區塊之右側上裁剪的像素之數目。類似地,語法元素num_crop_acu_bottom可在裁剪窗口中發信且定義將在畫面或其他視 訊區塊之底側上裁剪的像素之數目。在其他實例中,發信裁剪窗口之其他側。
僅僅出於說明目的而提供一實例。在此實例中,LCU大小為N乘N,且對準CU大小為M乘M。畫面大小係以LCU大小為單位發信,該LCU大小被給定為WL乘HL。在此實例中,WL為pic_width_in_LCU之值,且HL為pic_height_in_LCU之值。Crop_right_offset可定義將在右側上裁剪之像素之數目,且可等於num_crop_acu_rightCrop_bottom_offset可定義將在底側上裁剪之像素之數目,且可等於num_crop_acu_bottom
根據相對於LCU大小的畫面大小及對準CU大小,可自以下等式來判定相對於對準CU(ACU)大小的畫面大小:
應注意,等式1及2中之運算可為整數計算。
表5提供pic_parameter_set_rbsp( )之額外語法元素的另一實例。在此實例中,可發信num_right_offset_ACUnum_bottom_offset_ACU中之至少一者。表6展示在SPS中發信num_right_offset_ACUnum_bottom_offset_ACU,然而,可於別處發信此等值。舉例而言,可在PPS中發信num_right_offset_ACU及num_bottom_offset_ACU中之至少一者。
表5中之值num_crop_acu_right可指定將自右邊自LCU對準畫面裁剪掉的對準CU大小之數目。經裁剪畫面可儲存於DPB中。值num_crop_acu_bottom可指定將自底部自LCU對準畫面裁剪掉以獲得待儲存於DPB中之畫面的對準CU大小之數目。
在對應於表5之實例中,亦可藉由num_right_offset_ACUnum_bottom_offset_ACU發信畫面大小。可將畫面大小判定為:相對於ACU的圖片寬度=WL(N-M)(num_right_offset_ACU) (3)
相對於ACU的圖片高度=WL(N-M)(num_bottom_offset_ACU) (4)
可如下給定可儲存於經解碼畫面緩衝器中的具有相對於對準CU之畫面大小的經解碼畫面: (WL N-num_crop_acu_right M)乘(HL N-num_crop_acu_bottom M)(5)
因此,可以與上文關於畫面大小之實例中相同的方式來發信對準CU的大小(以像素計之高度及寬度)。舉例而言,若所有畫面皆具有相同之最小CU(SCU)大小,則對準CU之大小可為SCU大小。作為另一實例,若該等畫面具有不同SCU大小,則對準CU大小可為所有畫面中的最大或最小SCU大小。可在SPS或PPS中之至少一者中顯式地發信對準CU大小。對準CU大小可等於或小於LCU之大小且等於或大於SCU之大小。
以下表6提供圖框裁剪語法之一實例,該圖框裁剪語法可結合上文所描述之實例實施例中的任一者使用。在一實例中,裁剪窗口可在序列參數集合中且遵循與H.264/AVC中之語義相同的語義。
圖2為說明可經組態以執行本發明中所描述之技術之實例視訊編碼器的方塊圖。視訊編碼器50可經組態以判定定義一視訊序列之複數個畫面中之每一者的最小寫碼單元大小,其中最小寫碼單元大小選自複數個可能寫碼單元大 小。另外,視訊編碼器50可經組態以基於針對定義視訊序列之複數個畫面中之每一者所判定的最小寫碼單元來判定視訊序列之最小寫碼單元大小。另外,視訊編碼器50可經組態以判定與視訊序列相關聯之畫面大小,其中與視訊序列相關聯之畫面大小為最小寫碼單元大小值的倍數。此外,視訊編碼器50可經組態以在序列層級語法資訊中發信最小寫碼單元大小值。
視訊編碼器50可對應於器件20之視訊編碼器22,或不同器件之視訊編碼器。如圖2中所展示,視訊編碼器50可包括預測編碼模組32、四元樹分割模組31、加法器48及51,及記憶體34。視訊編碼器50亦可包括變換模組38及量化模組40,以及反量化模組42及反變換模組44。視訊編碼器50亦可包括熵寫碼模組46及濾波器模組47,該濾波器模組47可包括解區塊濾波器及迴路後及/或迴路中濾波器。經編碼之視訊資料及定義編碼之方式的語法資訊可被傳達至熵編碼模組46,該熵編碼模組46對位元串流執行熵編碼。
如圖2中所展示,預測編碼模組32可支援用於視訊區塊之編碼的複數個不同寫碼模式35。預測編碼模組32亦可包含一運動估計(ME)模組36及一運動補償(MC)模組37。
在編碼程序期間,視訊編碼器50接收輸入視訊資料。四元樹分割模組31可將視訊資料之單元分割為更小單元。舉例而言,四元樹分割模組31可根據上文所描述之HEVC分割將LCU分解為更小之CU及PU。預測編碼模組32對視訊區塊(例如,CU及PU)執行預測性寫碼技術。對於框間寫 碼而言,預測編碼模組32比較CU或PU與一或多個視訊參考圖框或片段(例如,參考資料之一或多個「清單」)中的各種預測性候選者以便定義一預測性區塊。對於框內寫碼而言,預測編碼模組32基於同一視訊圖框或片段內之相鄰資料產生預測性區塊。預測編碼模組32輸出該預測區塊,且加法器48自正被寫碼之CU或PU減去該預測區塊以便產生一殘餘區塊。可使用HEVC中所描述之進階運動向量預測(AMVP)來寫碼至少一些視訊區塊。
在一些情形中,預測編碼模組可包括速率-失真(R-D)模組,其比較不同模式下的視訊區塊(例如,CU或PU)之寫碼結果。在此情形下,預測編碼模組32亦可包括一模式選擇模組,該模式選擇模組用以依據寫碼速率(亦即,區塊所需之寫碼位元)及失真(例如,表示經寫碼區塊相對於原始區塊的視訊品質)分析寫碼結果以便進行針對視訊區塊之模式選擇。以此方式,R-D模組可提供不同模式之結果的分析以允許模式選擇模組選擇不同視訊區塊之所要模式。
再次參看圖2,在預測編碼模組32輸出預測區塊之後,且在加法器48自正被寫碼之視訊區塊減去預測區塊以便產生殘餘像素值之殘餘區塊之後,變換模組38將變換應用於殘餘區塊。該變換可包含離散餘弦變換(DCT)或概念上類似之變換(諸如,由ITU H.264標準或HEVC標準定義之變換)。可定義所謂的「蝶形」結構以執行該等變換,或亦可使用基於矩陣之倍增。在一些實例中,在符合HEVC標 準的情況下,變換之大小可針對不同CU而不同,例如,視關於給定LCU發生之分割之級別而定。可定義變換單元(TU)以便設定由變換模組38應用之變換大小。亦可使用小波變換、整數變換、子頻帶變換或其他類型之變換。在任何情形下,變換模組38將變換應用於殘餘區塊,進而產生殘餘變換係數之區塊。大體而言,該變換可將殘餘資訊自像素域轉換至頻域。
量化模組40接著量化該等殘餘變換係數以進一步減小位元率。舉例而言,量化模組40可限制用以寫碼該等係數中之每一者的位元之數目。詳言之,量化模組40可應用針對LCU定義之QP差量,以便定義待應用之量化之級別(諸如,藉由組合QP差量與先前LCU之QP或某一其他已知QP)。在對殘餘樣本執行了量化之後,熵寫碼模組46可掃描且熵編碼資料。
CAVLC為由ITU H.264標準及新興HEVC標準支援之一種類型的熵寫碼技術,其可由熵寫碼模組46基於向量化來應用。CAVLC以有效地壓縮係數及/或語法元素之串行化「延行(run)」的方式使用可變長度寫碼(VLC)表。CABAC為由ITU H.264標準或HEVC標準支援之另一類型的熵寫碼技術,其可由熵寫碼模組46基於向量化來應用。CABAC可涉及若干階段,包括二進位化、上下文模型選擇及二進位算術寫碼。在此情形下,熵寫碼模組46根據CABAC寫碼係數及語法元素。許多其他類型之熵寫碼技術亦存在,且新的熵寫碼技術將很可能在未來出現。本發明不限於任 何特定熵寫碼技術。
在藉由熵編碼模組46進行熵寫碼之後,可將經編碼之視訊傳輸至另一器件或存檔以供稍後傳輸或擷取。經編碼視訊可包含經熵寫碼之向量及各種語法資訊。該資訊可由解碼器用以適當地組態解碼程序。反量化模組42及反變換模組44分別應用反量化及反變換,以在像素域中重建構殘餘區塊。求和器51將經重建構之殘餘區塊加至由預測編碼模組32產生的預測區塊,以產生重建構之視訊區塊以儲存於記憶體34中。記憶體34可包括經解碼之畫面緩衝器,且經重建構之視訊區塊可形成經解碼畫面。然而,在該儲存之前,濾波器模組47可將濾波應用至視訊區塊以改良視訊品質。由濾波器模組47應用之濾波可減小假影並平滑化像素邊界。此外,濾波可藉由產生包含被寫碼之視訊區塊之緊密匹配的預測性視訊區塊而改良壓縮。
圖3為說明可由視訊編碼器22或視訊編碼器50執行的用於編碼視訊資料之實例技術的流程圖。視訊編碼器20或視訊編碼器50可判定定義一視訊序列之複數個畫面中之每一者的最小寫碼單元大小(302)。在一些情形下,最小寫碼單元大小可選自複數個可能寫碼單元大小。舉例而言,最小寫碼單元可為4x4、8x8、16x16、32x32或64x64中的一者,其中64x64為最大的可能寫碼單元大小。視訊編碼器20或視訊編碼器50可根據經判定之最小寫碼單元判定視訊序列之對準寫碼單元大小(304)。視訊編碼器50之視訊編碼器20可基於上文所描述之技術判定對準寫碼大小。視訊編 碼器20或視訊編碼器50判定與視訊序列相關聯之畫面大小,其中與視訊序列相關聯之畫面大小為對準寫碼單元大小值的倍數(306)。在一些情形下,與視訊序列相關聯之畫面大小可為儲存於經解碼畫面緩衝器中之經解碼畫面的畫面大小。視訊編碼器20或視訊編碼器50可在序列層級語法資訊中發信對準寫碼單元大小值(308)。
圖4為說明視訊解碼器60之一實例之方塊圖,該視訊解碼器60解碼以本文中所述方式編碼之視訊序列。在一些實例中,本發明之技術可由視訊解碼器60執行。視訊解碼器60可經組態以獲得一經寫碼之視訊序列,其包括使用第一最小寫碼單元大小寫碼之第一畫面及使用第二最小寫碼單元大小寫碼之第二畫面。另外,視訊解碼器60可經組態以獲得待儲存於經解碼畫面緩衝器中之經解碼畫面的畫面大小,其中該畫面大小為第一寫碼單元大小及第二寫碼單元大小中之一者的倍數。另外,視訊解碼器60可經組態以將經解碼畫面儲存於經解碼畫面緩衝器中。
視訊解碼器60包括一熵解碼模組52,該熵解碼模組52執行與由圖2之熵編碼模組46所執行之編碼互逆的解碼功能。詳言之,熵解碼模組52可執行CAVLC或CABAC解碼,或由視訊編碼器50所使用之任何其他類型之熵解碼。視訊解碼器60亦包括一預測解碼模組54、一反量化模組56、一反變換模組58、一記憶體62及一求和器64。詳言之,如同視訊編碼器50,視訊解碼器60包括一預測解碼模組54及一濾波器模組57。視訊解碼器60之預測解碼模組54 可包括運動補償模組86,該運動補償模組86解碼經框間寫碼之區塊,且有可能包括一或多個內插濾波器以用於運動補償程序中的子像素內插。預測解碼模組54亦可包括一用於解碼框內模式之框內預測模組。預測解碼模組54可支援複數個模式35。濾波器模組57可濾波求和器64之輸出,且可接收經熵解碼之濾波器資訊以便定義在迴路濾波中所應用之濾波器係數。
在接收到經編碼之視訊資料之後,熵解碼模組52即執行與由(圖2中之編碼器50的)熵編碼模組46執行之編碼互逆的解碼。在解碼器處,熵解碼模組52剖析位元串流以判定LCU及與LCU相關聯之對應分割。在一些實例中,LCU或LCU之CU可定義所使用之寫碼模式,且此等寫碼模式可包括雙向預測性合併模式。因此,熵解碼模組52可將語法資訊轉遞至識別雙向預測性合併模式之預測單元。記憶體62可包括一經解碼畫面緩衝器。經解碼畫面緩衝器可儲存經解碼畫面。經解碼畫面可與視訊序列相關聯,使得在預測解碼期間參考該經解碼畫面。視訊解碼器60可使用語法資訊根據本文中所描述之技術來判定待儲存於經解碼畫面緩衝器中之經解碼畫面的大小。
圖5為說明可由視訊解碼器28或視訊解碼器60執行的用於解碼視訊資料之實例技術的流程圖。視訊解碼器28或視訊解碼器60可獲得一經寫碼之視訊序列,其包括使用第一最小寫碼單元大小寫碼之第一畫面及使用第二最小寫碼單元大小寫碼之第二畫面(502)。在一實例中,可使用4x4之 最小寫碼單元大小來寫碼第一畫面,且可使用8x8之最小寫碼單元大小來寫碼第二畫面。視訊解碼器28或視訊解碼器60可獲得待儲存於經解碼畫面緩衝器中之經解碼畫面的畫面大小,其中該畫面大小為第一寫碼單元大小、第二寫碼單元大小或最大寫碼單元大小中之一者的倍數(504)。在一實例中,畫面大小可為1920x1080。視訊解碼器28或視訊解碼器60可將經解碼畫面儲存於經解碼畫面緩衝器中(506)。另外,視訊解碼器28或視訊解碼器60可基於所獲得之畫面大小是否為對準寫碼單元大小之倍數來判定包括視訊序列之位元串流是否為合格位元串流。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合予以實施。若以軟體予以實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如,根據通信協定)促進將電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體一般可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,該等電腦可讀儲存媒體可包含 RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件,快閃記憶體,或可用以儲存呈指令或資料結構之形式之所要程式碼且可由電腦存取的任何其他媒體。又,將任何連接適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是針對非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可藉由一或多個處理器來執行指令,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用,術語「處理器」可指代前述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或一組IC(例如,晶片組)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件之功能態樣,但未必需要藉由不同硬體單元予以實現。實情為,如以上所描述,可將各種單元組合於編碼解碼器硬體單元中,或由互操作性硬體單元(包括如以上所描述之一或多個處理器)之集合結合合適軟體及/或韌體來提供該等單元。
已描述了本發明之各種態樣。此等及其他態樣係在以下申請專利範圍之範疇內。
10‧‧‧視訊編碼及解碼系統/系統
12‧‧‧源器件
15‧‧‧通信頻道/頻道
16‧‧‧目的地器件
20‧‧‧視訊源/器件
22‧‧‧視訊編碼器
23‧‧‧調變器/解調變器(數據機)/數據機
24‧‧‧傳輸器
26‧‧‧接收器
27‧‧‧數據機
28‧‧‧視訊解碼器
30‧‧‧顯示器件
31‧‧‧四元樹分割模組
32‧‧‧預測編碼模組
34‧‧‧記憶體
35‧‧‧寫碼模式
36‧‧‧運動估計(ME)模組
37‧‧‧運動補償(MC)模組
38‧‧‧變換模組
40‧‧‧量化模組
42‧‧‧反量化模組
44‧‧‧反變換模組
46‧‧‧熵寫碼模組
48‧‧‧加法器
50‧‧‧視訊編碼器/編碼器
51‧‧‧加法器/求和器
52‧‧‧熵解碼模組
54‧‧‧預測解碼模組
56‧‧‧反量化模組
58‧‧‧反變換模組
60‧‧‧視訊解碼器
62‧‧‧記憶體
64‧‧‧求和器
86‧‧‧運動補償模組
圖1為說明實例視訊編碼及解碼系統之方塊圖。
圖2為說明可實施本發明中所描述之技術之實例視訊編碼器的方塊圖。
圖3為說明用於根據本發明之技術來編碼視訊資料之實例技術的流程圖。
圖4為說明可實施本發明中所描述之技術之實例視訊解碼器的方塊圖。
圖5為說明用於根據本發明之技術來解碼視訊資料之實例技術的流程圖。

Claims (40)

  1. 一種編碼視訊資料之方法,其包含:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
  2. 如請求項1之方法,其中該對準寫碼單元大小為該最大之可能寫碼單元大小。
  3. 如請求項2之方法,其中該複數個可能寫碼單元大小包括一為64x64像素之最大寫碼單元大小。
  4. 如請求項1之方法,其中判定該複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該對準寫碼單元大小為4x4像素。
  5. 如請求項1之方法,其中判定該複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為 8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該對準寫碼單元大小為8x8像素。
  6. 如請求項1之方法,其中該畫面大小指定儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小。
  7. 一種經組態以編碼視訊資料之器件,其包含:用於判定定義一視訊序列之複數個畫面中之每一者之一最小寫碼單元大小的構件,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;用於基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小的構件;用於判定與該視訊序列相關聯之一畫面大小的構件,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及用於在序列層級語法資訊中發信該對準寫碼單元大小值的構件。
  8. 如請求項7之器件,其中該對準寫碼單元大小為該最大之可能寫碼單元大小。
  9. 如請求項7之方法,其中該複數個可能寫碼單元大小包括一為64x64像素之最大寫碼單元大小。
  10. 如請求項7之器件,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之 該對準寫碼單元大小為4x4像素。
  11. 如請求項7之器件,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該對準寫碼單元大小為8x8像素。
  12. 如請求項7之器件,其中該畫面大小指定儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小。
  13. 一種包含一視訊編碼器之器件,該視訊編碼器經組態以:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
  14. 如請求項13之器件,其中該對準寫碼單元大小為該最大之可能寫碼單元大小。
  15. 如請求項14之器件,其中該複數個可能寫碼單元大小包括一為64x64像素之最大寫碼單元大小。
  16. 如請求項13之器件,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該對準寫碼單元大小為4x4像素。
  17. 如請求項13之器件,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該對準寫碼單元大小為8x8像素。
  18. 如請求項13之器件,其中該畫面大小指定儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小。
  19. 一種包含儲存於其上之指令的電腦可讀媒體,當執行時,該等指令使得一處理器:判定定義一視訊序列之複數個畫面中之每一者的一最小寫碼單元大小,其中一最小寫碼單元大小係選自包括一最大之可能寫碼單元大小的複數個可能寫碼單元大小;基於該複數個可能寫碼單元大小來判定該視訊序列之一對準寫碼單元大小;判定與該視訊序列相關聯之一畫面大小,其中與該視訊序列相關聯之該畫面大小為該對準寫碼單元大小之一倍數;及在序列層級語法資訊中發信該對準寫碼單元大小值。
  20. 如請求項19之電腦可讀媒體,其中該對準寫碼單元大小為該最大之可能寫碼單元大小。
  21. 如請求項20之電腦可讀媒體,其中該複數個可能寫碼單元大小包括一為64x64像素之最大寫碼單元大小。
  22. 如請求項19之電腦可讀媒體,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該最小寫碼單元大小為4x4像素。
  23. 如請求項19之電腦可讀媒體,其中判定複數個畫面中之每一者的一最小寫碼單元大小包括判定一第一畫面之為4x4像素的一第一最小寫碼單元大小及判定一第二畫面之為8x8像素的一第二最小寫碼單元大小;且其中該視訊序列之該最小寫碼單元大小為8x8像素。
  24. 如請求項19之器件,其中該畫面大小指定儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小。
  25. 一種解碼視訊資料之方法,其包含:獲得一經寫碼之視訊序列,其包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及 將該經解碼畫面儲存於一經解碼畫面緩衝器中。
  26. 如請求項25之方法,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第一寫碼單元大小之一倍數。
  27. 如請求項25之方法,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第二寫碼單元大小之一倍數。
  28. 如請求項25之方法,其中該最大寫碼單元大小為64x64像素,且該畫面大小為該最大寫碼單元大小之一倍數。
  29. 一種經組態以解碼視訊資料之器件,其包含:用於獲得一經寫碼之視訊序列的構件,該經寫碼之視訊序列包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;用於獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面之一畫面大小的構件,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及用於將該經解碼畫面儲存於一經解碼畫面緩衝器中的構件。
  30. 如請求項29之器件,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第一寫碼單元大小之一倍數。
  31. 如請求項29之器件,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面 大小為該第二寫碼單元大小之一倍數。
  32. 如請求項29之器件,其中該最大寫碼單元大小為64x64像素,且該畫面大小為該最大寫碼單元大小之一倍數。
  33. 一種包含一視訊解碼器之器件,該視訊解碼器經組態以:獲得一經寫碼之視訊序列,其包括使用一第一最小寫碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及將該經解碼畫面儲存於一經解碼畫面緩衝器中。
  34. 如請求項33之器件,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第一寫碼單元大小之一倍數。
  35. 如請求項33之器件,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第二寫碼單元大小之一倍數。
  36. 如請求項33之器件,其中該最大寫碼單元大小為64x64像素,且該畫面大小為該最大寫碼單元大小之一倍數。
  37. 一種包含儲存於其上之指令的電腦可讀媒體,當執行時,該等指令使得一處理器:獲得一經寫碼之視訊序列,其包括使用一第一最小寫 碼單元大小寫碼之一第一畫面及使用第二最小寫碼單元大小寫碼之一第二畫面;獲得待儲存於一經解碼畫面緩衝器中之一經解碼畫面的一畫面大小,其中該畫面大小為該第一寫碼單元大小、該第二寫碼單元大小或一最大寫碼單元大小中之一者的一倍數;及將該經解碼畫面儲存於一經解碼畫面緩衝器中。
  38. 如請求項37之電腦可讀媒體,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第一寫碼單元大小之一倍數。
  39. 如請求項37之電腦可讀媒體,其中該第一最小寫碼單元大小為4x4像素,且該第二寫碼單元大小為8x8像素,且該畫面大小為該第一寫碼單元大小之一倍數。
  40. 如請求項37之電腦可讀媒體,其中該最大寫碼單元大小為64x64像素,且該畫面大小為該最大寫碼單元大小之一倍數。
TW101125715A 2011-07-17 2012-07-17 在視訊寫碼中發信畫面大小 TWI502967B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161508659P 2011-07-17 2011-07-17
US201161530819P 2011-09-02 2011-09-02
US201161549480P 2011-10-20 2011-10-20
US13/550,384 US20130016769A1 (en) 2011-07-17 2012-07-16 Signaling picture size in video coding

Publications (2)

Publication Number Publication Date
TW201313027A true TW201313027A (zh) 2013-03-16
TWI502967B TWI502967B (zh) 2015-10-01

Family

ID=47518908

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101125715A TWI502967B (zh) 2011-07-17 2012-07-17 在視訊寫碼中發信畫面大小

Country Status (20)

Country Link
US (3) US20130016769A1 (zh)
EP (1) EP2732629B1 (zh)
JP (1) JP5792388B2 (zh)
KR (1) KR101497882B1 (zh)
CN (1) CN103718551B (zh)
AU (1) AU2012284120B2 (zh)
BR (1) BR112014000941B1 (zh)
CA (1) CA2841953C (zh)
DK (1) DK2732629T3 (zh)
ES (1) ES2639030T3 (zh)
HU (1) HUE030661T2 (zh)
IL (1) IL230248A (zh)
MX (1) MX2014000720A (zh)
MY (1) MY165045A (zh)
PL (1) PL2732629T3 (zh)
PT (1) PT2732629T (zh)
RU (1) RU2586027C2 (zh)
SI (1) SI2732629T1 (zh)
TW (1) TWI502967B (zh)
WO (1) WO2013012864A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658014B (zh) * 2011-06-30 2021-01-08 三菱电机株式会社 图像编码装置及方法、图像解码装置及方法
US20130016769A1 (en) 2011-07-17 2013-01-17 Qualcomm Incorporated Signaling picture size in video coding
JP2013085096A (ja) * 2011-10-07 2013-05-09 Sony Corp 画像処理装置および方法
CN113810688B (zh) * 2015-05-12 2023-07-18 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
WO2016205999A1 (en) * 2015-06-23 2016-12-29 Mediatek Singapore Pte. Ltd. Adaptive coding group for image/video coding
US10212444B2 (en) * 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
CN107820077B (zh) * 2016-09-14 2019-06-28 北京金山云网络技术有限公司 一种最大可用编码单元尺寸确定方法及装置
CN117201818A (zh) 2017-05-26 2023-12-08 Sk电信有限公司 对视频数据进行编码或解码的方法和发送比特流的方法
KR102435881B1 (ko) * 2017-05-26 2022-08-24 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
WO2018221368A1 (ja) * 2017-05-31 2018-12-06 シャープ株式会社 動画像復号装置、及び動画像符号化装置
WO2019009473A1 (ko) * 2017-07-04 2019-01-10 엘지전자 주식회사 360도 비디오의 영역 기반 처리 방법 및 장치
WO2019172202A1 (ja) * 2018-03-05 2019-09-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
US11290734B2 (en) * 2019-01-02 2022-03-29 Tencent America LLC Adaptive picture resolution rescaling for inter-prediction and display
JP7404373B2 (ja) * 2019-01-09 2023-12-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオエンコーダ、ビデオデコーダ、および対応する方法
US11159795B2 (en) * 2019-03-04 2021-10-26 Tencent America LLC Max transform size control
US11012710B2 (en) 2019-03-06 2021-05-18 Tencent America LLC Techniques for intra prediction for 360 image and video coding
US20200314423A1 (en) * 2019-03-25 2020-10-01 Qualcomm Incorporated Fixed filters with non-linear adaptive loop filter in video coding
US11438611B2 (en) 2019-12-11 2022-09-06 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US11445176B2 (en) * 2020-01-14 2022-09-13 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US11575941B2 (en) * 2021-03-23 2023-02-07 Tencent America LLC Parallel processing in video coding

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3844844B2 (ja) 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
WO2003053066A1 (en) 2001-12-17 2003-06-26 Microsoft Corporation Skip macroblock coding
US7170937B2 (en) 2002-05-01 2007-01-30 Texas Instruments Incorporated Complexity-scalable intra-frame prediction technique
WO2003105070A1 (en) 2002-06-01 2003-12-18 Nokia Corporation Spatial prediction based intra coding
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
EP1604530A4 (en) 2003-03-03 2010-04-14 Agency Science Tech & Res FAST-DECISION ALGORITHM FOR INTRAPRADICTION FOR ADVANCED VIDEO CODING
US7852919B2 (en) 2003-09-07 2010-12-14 Microsoft Corporation Field start code for entry point frames with predicted first field
US7822123B2 (en) * 2004-10-06 2010-10-26 Microsoft Corporation Efficient repeat padding for hybrid video sequence with arbitrary video resolution
EP1558039A1 (en) 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
US7586924B2 (en) 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
JP4501631B2 (ja) 2004-10-26 2010-07-14 日本電気株式会社 画像符号化装置及び方法、画像符号化装置のコンピュータ・プログラム、並びに携帯端末
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US20080095228A1 (en) 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
FR2908007A1 (fr) 2006-10-31 2008-05-02 Thomson Licensing Sas Procede de codage d'une sequence d'images
FR2916931A1 (fr) 2007-05-29 2008-12-05 Thomson Licensing Sas Procede de selection d'une donnee de codage et dispositif de codage implementant ledit procede
JP4523625B2 (ja) 2007-08-07 2010-08-11 パナソニック株式会社 画像符号化装置および方法
TW200910971A (en) 2007-08-22 2009-03-01 Univ Nat Cheng Kung Direction detection algorithms for H.264 intra prediction
DE102007049351A1 (de) 2007-10-15 2009-04-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen eines kodierten Ausgangsvideostroms aus mindestens zwei kodierten Eingangsvideoströmen, sowie Verwendung der Vorrichtung und kodierter Eingangsvideostrom
US8121197B2 (en) 2007-11-13 2012-02-21 Elemental Technologies, Inc. Video encoding and decoding using parallel processors
KR101306834B1 (ko) 2008-09-22 2013-09-10 에스케이텔레콤 주식회사 인트라 예측 모드의 예측 가능성을 이용한 영상 부호화/복호화 장치 및 방법
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US20100098156A1 (en) 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
JP5169978B2 (ja) 2009-04-24 2013-03-27 ソニー株式会社 画像処理装置および方法
WO2011031332A1 (en) 2009-09-14 2011-03-17 Thomson Licensing Methods and apparatus for efficient video encoding and decoding of intra prediction mode
KR101457894B1 (ko) 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
US9100649B2 (en) 2010-02-10 2015-08-04 Lg Electronics Inc. Method and apparatus for processing a video signal
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
KR101789634B1 (ko) 2010-04-09 2017-10-25 엘지전자 주식회사 비디오 데이터 처리 방법 및 장치
US8902978B2 (en) 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
US8654860B2 (en) * 2010-11-01 2014-02-18 Mediatek Inc. Apparatus and method for high efficiency video coding using flexible slice structure
CN103229507B (zh) 2010-11-25 2017-09-08 Lg电子株式会社 使用信号通知图像信息的方法和使用该方法来解码图像信息的方法
KR20120070479A (ko) 2010-12-21 2012-06-29 한국전자통신연구원 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치
BR112013014371B8 (pt) 2011-01-07 2022-05-24 Hfi Innovation Inc Método e aparelho de codificação aperfeiçoada de modo de predição intra crominância
WO2012092763A1 (en) 2011-01-07 2012-07-12 Mediatek Singapore Pte. Ltd. Method and apparatus of improved intra luma prediction mode coding
JP5781313B2 (ja) 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
JP2012147332A (ja) 2011-01-13 2012-08-02 Sony Corp 符号化装置および符号化方法、並びに復号装置および復号方法
CN102595121A (zh) 2011-01-15 2012-07-18 华为技术有限公司 帧内预测模式二进制化的方法、解码方法、装置和系统
CN102685474B (zh) 2011-03-10 2014-11-05 华为技术有限公司 预测模式的编解码方法、编解码设备及网络系统
AU2011201336B2 (en) 2011-03-23 2013-09-05 Canon Kabushiki Kaisha Modulo embedding of video parameters
US9872015B2 (en) 2011-04-21 2018-01-16 Hfi Innovation Inc. Method and apparatus for improved in-loop filtering
KR101383775B1 (ko) 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
WO2012164902A1 (ja) 2011-05-30 2012-12-06 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号装置、画像復号方法及び画像復号プログラム
EP2533537A1 (en) 2011-06-10 2012-12-12 Panasonic Corporation Transmission of picture size for image or video coding
US20130016769A1 (en) 2011-07-17 2013-01-17 Qualcomm Incorporated Signaling picture size in video coding

Also Published As

Publication number Publication date
KR20140024482A (ko) 2014-02-28
CN103718551B (zh) 2017-06-30
JP2014521281A (ja) 2014-08-25
RU2586027C2 (ru) 2016-06-10
US20140341275A1 (en) 2014-11-20
IL230248A (en) 2016-12-29
US11700384B2 (en) 2023-07-11
WO2013012864A1 (en) 2013-01-24
JP5792388B2 (ja) 2015-10-14
SI2732629T1 (sl) 2016-12-30
RU2014105655A (ru) 2015-08-27
MY165045A (en) 2018-02-28
CA2841953C (en) 2017-01-03
US20220295076A1 (en) 2022-09-15
AU2012284120B2 (en) 2016-03-03
AU2012284120A1 (en) 2014-02-13
DK2732629T3 (da) 2017-01-02
MX2014000720A (es) 2014-02-27
ES2639030T3 (es) 2017-10-25
CA2841953A1 (en) 2013-01-24
EP2732629B1 (en) 2016-10-05
EP2732629A1 (en) 2014-05-21
BR112014000941A2 (pt) 2017-02-14
PL2732629T3 (pl) 2017-07-31
HUE030661T2 (en) 2017-05-29
KR101497882B1 (ko) 2015-03-02
BR112014000941B1 (pt) 2022-06-07
TWI502967B (zh) 2015-10-01
CN103718551A (zh) 2014-04-09
PT2732629T (pt) 2017-01-13
US20130016769A1 (en) 2013-01-17

Similar Documents

Publication Publication Date Title
TWI502967B (zh) 在視訊寫碼中發信畫面大小
JP7422684B2 (ja) ブロックベースの適応ループフィルタ(alf)の設計およびシグナリング
CN109964482B (zh) 视频译码中指示双边滤波器使用的方法
KR101825262B1 (ko) B 슬라이스에서의 예측 유닛의 단방향성 인터 예측으로의 제한
KR101651759B1 (ko) 메모리 효율적인 컨텍스트 모델링
US9288501B2 (en) Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US8942282B2 (en) Variable length coding of coded block pattern (CBP) in video compression
JP6266605B2 (ja) 映像コーディングにおけるロスレスコーディングモード及びパルスコード変調(pcm)モードのシグナリングの統一
CN109792525B (zh) 峰值样本自适应偏移
EP2984827B1 (en) Sample adaptive offset scaling based on bit-depth
US20140198855A1 (en) Square block prediction
KR20140017019A (ko) 비디오 코딩을 위한 병렬화 친화적인 병합 후보들
KR20130135362A (ko) 비디오 코딩에서 단예측 인접자들에 기초한 양예측 머지 모드
KR20130105894A (ko) 비디오 데이터의 블록의 계수들의 모드 의존 스캐닝
WO2012088459A1 (en) Transform coefficient scan
TW201424403A (zh) 於視訊寫碼中發信用於操作點之層識別符
CN103283230A (zh) 使用一维切换滤波器与一维自适应滤波器的组合的视频滤波
WO2019200277A1 (en) Hardware-friendly sample adaptive offset (sao) and adaptive loop filter (alf) for video coding
WO2018066242A1 (en) Systems and methods for adaptively clipping sample values