TWI493964B - 在視訊編碼中的區塊類型發信號 - Google Patents

在視訊編碼中的區塊類型發信號 Download PDF

Info

Publication number
TWI493964B
TWI493964B TW100105533A TW100105533A TWI493964B TW I493964 B TWI493964 B TW I493964B TW 100105533 A TW100105533 A TW 100105533A TW 100105533 A TW100105533 A TW 100105533A TW I493964 B TWI493964 B TW I493964B
Authority
TW
Taiwan
Prior art keywords
syntax element
prediction
video
video block
data
Prior art date
Application number
TW100105533A
Other languages
English (en)
Other versions
TW201143447A (en
Inventor
Rahul P Panchal
Marta Karczewicz
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201143447A publication Critical patent/TW201143447A/zh
Application granted granted Critical
Publication of TWI493964B publication Critical patent/TWI493964B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

在視訊編碼中的區塊類型發信號
本發明係關於視訊編碼,且更特定而言係關於使用雙向預測之視訊編碼技術。
本申請案主張2010年2月19日申請之美國臨時申請案第61/306,261號之權利,該案之全文以引用的方式併入本文中。
數位多媒體能力可併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線通信器件、無線廣播系統、個人數位助理(PDA)、膝上型電腦或桌上型電腦、平板型電腦(tablet computer)、數位相機、數位記錄器件、視訊遊戲器件、視訊遊戲控制台、蜂巢式電話或衛星無線電電話、數位媒體播放器及其類似者。數位多媒體器件可實施視訊編碼技術,諸如MPEG-2、ITU-H.263、MPEG-4或ITU-H.264/MPEG-4第10部分(進階視訊編碼(AVC)),以更有效地傳輸及接收或儲存及擷取數位視訊資料。視訊編碼技術可經由空間及時間預測執行視訊壓縮以減少或移除視訊序列中所固有之冗餘。藉由ISO/IEC動畫專家群組(MPEG)及ITU-T視訊編碼專家群組(VCEG)建立之視訊編碼聯合合作小組(JCT-VC)所開發的新視訊標準(諸如,高效率視訊編碼(HEVC)標準)繼續出現並演進。
在視訊編碼中,壓縮常包括空間預測、運動估計及運動補償。框內編碼依賴於空間預測及諸如離散餘弦變換(DCT)之變換編碼來減少或移除給定視訊圖框內的視訊區塊之間的空間冗餘。框間編碼依賴於時間預測及變換編碼來減少或移除視訊序列的連續視訊圖框之視訊區塊之間的時間冗餘。經框內編碼之圖框(「I圖框」)常用作隨機存取點以及用於其他圖框之框間編碼之參考。然而,I圖框通常展現比其他圖框少之壓縮。
對於框間編碼,視訊編碼器執行運動估計以追蹤兩個或兩個以上相鄰圖框或包括經編碼之視訊區塊的具有視訊資訊之其他單元(諸如,圖框之片段)之間的匹配視訊區塊之移動。經框間編碼之圖框可包括:預測性圖框(「P圖框」),其可包括自前一圖框預測之視訊區塊;及雙向預測性圖框(「B圖框」),其可包括自視訊序列之前一圖框及後一圖框預測之視訊區塊。術語「P圖框」及「B圖框」在早期編碼技術將預測限於特定方向的意義上為稍具歷史性的。較新編碼格式及標準可不限制P圖框或B圖框之預測方向。因此,術語「雙向」現指代基於參考資料之兩個或兩個以上清單之預測,而不管此參考資料相對於正編碼之資料之時間關係。
與諸如ITU H.264之較新視訊標準一致,例如,雙向預測可基於未必需要具有在時間上駐留於當前視訊區塊之前及之後的資料的兩個不同清單。換言之,可自兩個資料清單預測B視訊區塊,該兩個資料清單可對應於來自兩個先前圖框、兩個後續圖框,或一個先前圖框及一個後續圖框之資料。相比之下,基於一個清單(亦即,一個資料結構)預測P視訊圖框,該一個清單可對應於一個預測性圖框(例如,一個先前圖框或一個後續圖框)。
對於P視訊圖框及B視訊圖框,運動估計產生運動向量,該等運動向量指示視訊區塊相對於(多個)預測性參考圖框或(多個)其他參考單元中之對應預測視訊區塊之位移。運動補償使用該等運動向量自該(等)預測性參考圖框或該(等)參考單元產生預測視訊區塊。在運動補償之後,藉由自待編碼之原始視訊區塊減去預測視訊區塊來形成殘餘視訊區塊。視訊編碼器通常應用變換、量化及熵編碼程序來進一步減小與殘餘區塊之傳達相關聯的位元速率。通常使用I單元及P單元定義用於P單元及B單元之框間編碼之參考區塊。
本發明描述適用於雙向預測之視訊編碼及解碼技術。在雙向預測中,基於預測性參考資料之兩個不同清單來預測性地編碼及解碼一視訊區塊。在本發明之一態樣中,描述用於將一視訊區塊之區塊類型自一編碼器用信號發送至一解碼器之技術,其中該區塊類型之發信號包括分開地用信號發送用於該視訊區塊之一分割區大小、用於該視訊區塊之一第一預測方向,及(在一些情形中)用於該視訊區塊之一第二預測方向。本發明之技術可將單獨語法元素用於用信號發送該分割區大小、該第一預測方向及該第二預測方向。另外,描述用於將一子區塊類型自一編碼器用信號發送至一解碼器之技術,其中用信號發送該子區塊類型亦可包括使用單獨語法元素分開地用信號發送一分割區大小及一預測方向。該等單獨語法元素可經個別地編碼且自該編碼器傳輸至該解碼器。
在一實例中,本發明描述一種編碼一雙向視訊區塊(B視訊區塊)之方法。該方法包含:產生用於該B視訊區塊之第一預測資料;產生用於該B視訊區塊之第二預測資料;基於一或多個速率-失真度量選擇該第一預測資料及該第二預測資料中之一者;基於該選定預測資料,產生指示用於該B視訊區塊之一分割區大小的一第一語法元素;基於該選定預測資料,產生與該第一語法元素分開且指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素;及輸出該第一語法元素及該第二語法元素。
在另一實例中,本發明描述一種用於編碼一雙向視訊區塊(B視訊區塊)之視訊編碼器。該視訊編碼器包含:一或多個預測單元,該一或多個預測單元經組態以產生用於該B視訊區塊之第一預測資料及用於該B視訊區塊之第二預測資料;一速率-失真分析單元,其經組態以選擇該第一預測資料及該第二預測資料中之待包括於位元串流中之一者;及一或多個預測單元,該一或多個預測單元經組態以基於該選定預測資料產生指示用於該B視訊區塊之一分割區大小的一第一語法元素,且基於該選定預測資料產生指示用於該B視訊區塊之一預測方向的一第一語法元素。
在另一實例中,本發明描述一種包含指令之電腦可讀儲存媒體,該等指令在一處理器中執行時使該處理器執行一雙向視訊區塊(B視訊區塊)之編碼。該編碼包含:產生用於該B視訊區塊之第一預測資料;產生用於該B視訊區塊之第二預測資料;基於一或多個速率-失真度量選擇該第一預測資料及該第二預測資料中之一者;基於該選定預測資料產生指示用於該B視訊區塊之一分割區大小的一第一語法元素;基於該選定預測資料產生與該第一語法元素分開且指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素;及輸出該第一語法元素及該第二語法元素。
在另一實例中,本發明描述一種用於編碼一雙向視訊區塊(B視訊區塊)之器件。該器件包含:用於產生用於該B視訊區塊之第一預測資料的構件;用於產生用於該B視訊區塊之第二預測資料的構件;用於基於一或多個速率-失真度量選擇該第一預測資料及該第二預測資料中之一者的構件;用於基於該選定預測資料產生指示用於該B視訊區塊之一分割區大小的一第一語法元素的構件;及用於基於該選定預測資料產生與該第一語法元素分開且指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素的構件;及用於輸出該第一語法元素及該第二語法元素的構件。
在另一實例中,本發明描述一種解碼一雙向視訊區塊(B視訊區塊)之方法。該方法包含:接收經編碼之視訊資料;在該經編碼之視訊資料中接收指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素分開;及至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
在另一實例中,本發明描述一種用於解碼一雙向視訊區塊(B視訊區塊)之視訊解碼器。該視訊解碼器包含:一預測單元,其經組態以接收經編碼之視訊資料,該經編碼之視訊資料包含指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素分開;一運動補償單元,其經組態以基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
在另一實例中,本發明描述一種包含指令之電腦可讀儲存媒體,該等指令在一處理器中執行時使該處理器執行一雙向視訊區塊(B視訊區塊)之解碼。該解碼包含:接收經編碼之視訊資料;在該經編碼之視訊資料中接收指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素分開;及至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
在另一實例中,本發明描述一種用於解碼一雙向視訊區塊(B視訊區塊)之器件。該器件包含:用於接收經編碼之視訊資料的構件;用於接收指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及指示用以編碼該B視訊區塊之一預測方向之一第二語法元素的構件,其中該第一語法元素與該第二語法元素分開;及用於至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊的構件。
可以硬體、軟體、韌體或其組合來實施本發明中所描述之技術。若以硬體來實施,則一裝置可實現為一積體電路、一處理器、離散邏輯或其任何組合。若以軟體來實施,則軟體可執行於一或多個處理器(諸如,微處理器、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或數位信號處理器(DSP))中。執行該等技術之軟體可最初儲存於有形電腦可讀儲存媒體中且載入於處理器中並在處理器中執行。
在隨附圖式及下文之描述中闡述本發明之一或多個態樣之細節。本發明中所描述之技術之其他特徵、目標及優點將自該描述及圖式以及自申請專利範圍變得顯而易見。
本發明描述適用於雙向預測之視訊編碼及解碼技術。在雙向預測中,基於預測性參考資料之兩個不同清單預測性地編碼及解碼視訊區塊。在本發明之一態樣中,描述用於將一視訊區塊之區塊類型自一編碼器用信號發送至一解碼器之技術,其中該區塊類型之發信號包括分開地用信號發送用於該視訊區塊之分割區大小、用於該視訊區塊之第一預測方向,及(在一些情形中)用於該視訊區塊之第二預測方向。本發明之技術可將單獨語法元素用於用信號發送分割區大小、第一預測方向及第二預測方向。另外,描述用於將一子區塊類型自一編碼器用信號發送至一解碼器之技術,其中用信號發送該子區塊類型亦可包括使用單獨語法元素分開地用信號發送分割區大小及預測方向。該等單獨語法元素可經個別地編碼且自編碼器傳輸至解碼器。
如本發明中所使用之單獨語法元素一般指代用以將複數筆資訊(諸如,分割區大小及預測方向)自編碼器用信號發送至解碼器的複數個語法元素。相比之下,聯合語法元素指代用以將複數筆資訊自編碼器用信號發送至解碼器的單一語法元素。舉例而言,與聯合語法元素可用以用信號發送分割區大小及預測方向兩者的現有編碼方案相比,本發明之技術包括使用第一語法元素來用信號發送分割區大小,且使用單獨的第二語法元素來用信號發送預測方向。在一些情形中,聯合語法元素亦可為相對於另一語法元素之單獨語法元素。舉例而言,用於用信號發送第一預測方向及第二預測方向之聯合語法元素可為相對於用以用信號發送分割區大小之語法元素的單獨語法元素。如將在下文更詳細地論述的,單獨語法元素可彼此獨立地編碼及處理。舉例而言,兩個單獨語法元素可在傳輸之前經歷兩個不同之熵編碼程序。
與使用聯合語法元素之編碼方案相比較,將單獨語法元素用於用信號發送分割區大小及預測方向之編碼方案可更易於擴展以用於供較大視訊區塊大小使用。舉例而言,如本發明中所描述,與分開地用信號發送分割區大小及預測方向之編碼方案相比較,將新視訊區塊大小或新分割區大小引入至利用聯合語法元素之編碼方案中可能需要引入更多新語法元素。另外,與使用聯合語法元素相比較,在一些例子中,使用單獨語法元素可歸因於改良之熵編碼而產生編碼效率增益。
圖1為說明可實施本發明之技術的一例示性視訊編碼及解碼系統10的方塊圖。如圖1中所示,系統10包括經由通信頻道15將經編碼之視訊傳輸至目的地器件16之源器件12。源器件12及目的地器件16可包含廣泛範圍之器件中的任一者。在一些狀況下,源器件12及目的地器件16包含無線通信器件,諸如無線手機、所謂的蜂巢式或衛星無線電電話或可經由通信頻道15傳達視訊資訊之任何器件,通信頻道15可為或可不為無線的。然而,關於將用於B單元之區塊類型及子區塊類型自編碼器用信號發送至解碼器的本發明之技術不必限於無線應用或設定(setting)。
在圖1之實例中,源器件12可包括視訊源20、視訊編碼器22、調變器/解調變器(數據機)23及傳輸器24。目的地器件16可包括接收器26、數據機27、視訊解碼器28及顯示器件30。根據本發明,源器件12之視訊編碼器22可經組態以產生用以指示用於視訊區塊之分割區大小、第一預測方向及第二方向的單獨語法元素,且另外產生用以指示用於子區塊之分割區大小及預測方向之單獨語法元素。該等單獨語法元素可經個別地編碼且自視訊編碼器22傳輸至視訊解碼器28。視訊解碼器28可接收指示選擇之單獨語法元素。因此,視訊解碼器28可基於所接收之語法元素來執行適當視訊解碼。
圖1之所說明之系統10僅為一實例。本發明之發信號技術可由支援雙向運動補償預測之任何編碼器件執行。源器件12及目的地器件16僅為此等編碼器件之實例,其中源器件12產生用於傳輸至目的地器件16的經編碼之視訊資料。在一些狀況下,器件12、16可以實質上對稱之方式操作,使得器件12、16中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、16之間的單向或雙向視訊傳輸(例如)以用於視訊串流傳輸、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源20可包括諸如視訊相機之視訊俘獲器件、含有先前俘獲之視訊之視訊封存檔,或來自視訊內容提供者之視訊饋入。作為另一替代例,視訊源20可產生基於電腦圖形之資料作為源視訊,或實況視訊、經封存之視訊與電腦產生之視訊的組合。在一些狀況下,若視訊源20為視訊相機,則源器件12與目的地器件16可形成所謂的相機電話或視訊電話。在每一狀況下,可藉由視訊編碼器22編碼經俘獲之視訊、經預先俘獲之視訊或電腦產生之視訊。經編碼之視訊資訊可接著由數據機23根據通信標準(諸如,分碼多重存取(CDMA)、正交分頻多工(OFDM)或另一通信技術或標準)進行調變,且經由傳輸器24傳輸至目的地器件16。數據機23可包括各種混頻器、濾波器、放大器或經設計以用於信號調變之其他組件。傳輸器24可包括經設計以用於傳輸資料之電路,包括放大器、濾波器及一或多個天線。
目的地器件16之接收器26經由頻道15接收資訊,且數據機27解調變該資訊。經由頻道15傳達之資訊可包括由視訊編碼器22定義之資訊,該資訊亦可由與本發明一致之視訊解碼器28使用。顯示器件30向使用者顯示經解碼之視訊資料,且可包含多種顯示器件中之任一者,諸如,陰極射線管、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
在圖1之實例中,通信頻道15可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線,或無線媒體與有線媒體之任何組合。因此,數據機23及傳輸器24可支援許多可能的無線協定、有線協定,或有線及無線協定。通信頻道15可形成諸如區域網路(LAN)、廣域網路(WAN)或全球網路(諸如,包含一或多個網路之互連之網際網路)之基於封包之網路的一部分。通信頻道15一般表示用於將視訊資料自源器件12傳輸至目的地器件16之任何合適通信媒體或不同通信媒體之集合。通信頻道15可包括路由器、交換器、基地台或可用於促進自源器件12至目的地器件16之通信的任何其他設備。
視訊編碼器22及視訊解碼器28可根據視訊壓縮標準(諸如,新興ITU-T H.265標準)而操作。然而,本發明之技術不限於任何特定編碼標準。儘管未在圖1中展示,但在一些態樣中,視訊編碼器22及視訊解碼器28可各自與音訊編碼器及解碼器整合,且可包括適當多工器-解多工器(MUX-DEMUX)單元或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者的編碼。若適用,則MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器22及視訊解碼器28可各自實施為一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。視訊編碼器22及視訊解碼器28中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別行動器件、用戶器件、廣播器件、伺服器或其類似者中的組合之編碼器/解碼器(CODEC)之部分。
一視訊序列通常包括一系列視訊圖框。視訊編碼器20對個別視訊圖框內之視訊區塊進行操作以便編碼視訊資料。在一實例中,視訊區塊可對應於巨集區塊或巨集區塊之分割區。巨集區塊為藉由ITU H.264標準及其他標準定義之類型的視訊區塊。巨集區塊通常指代16×16資料區塊,但該術語亦通常用以一般指代具有N×N大小之任何視訊區塊。ITU-T H.264標準支援各種區塊大小(諸如,關於明度分量之16×16、8×8或4×4及關於色度分量之8×8)之框內預測,以及各種區塊大小(諸如,關於明度分量之16×16、16×8、8×16、8×8、8×4、4×8及4×4及關於色度分量之對應按比例調整之大小)之框間預測。在本發明中,「N×N」指代依據垂直尺寸與水平尺寸之區塊之像素尺寸(例如,16×16像素)。一般而言,16×16區塊將在垂直方向上具有16個像素且在水平方向上具有16個像素。同樣地,N×N區塊一般在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示正整數值。區塊中之像素可排列成列及行。
新興ITU H.265標準定義用於視訊區塊之新術語。詳言之,在使用ITU H.265之情況下,視訊區塊(或其分割區)可被稱為「經編碼之單元」。在使用ITU-T H.265標準之情況下,可根據四元樹分割方案(quadtree partitioning scheme)將最大經編碼之單元(LCU)劃分成愈來愈小之經編碼之單元(CU),且可將在該方案中定義之不同CU進一步分割成所謂的預測單元(PU)。LCU、CU及PU為在本發明之意義內之所有視訊區塊。亦可使用與ITU H.265標準或其他視訊編碼標準一致的其他類型之視訊區塊。因此,片語「視訊區塊」指代任何大小之視訊區塊。
視訊區塊可具有固定或變化之大小,且可根據指定編碼標準而在大小上不同。每一視訊圖框可包括複數個片段。每一片段可包括複數個視訊區塊,視訊區塊可配置成分割區(亦被稱為子區塊)。根據上文提及之四元樹分割方案,N/2×N/2第一CU可為N×N LCU之子區塊,且N/4×N/4第二CU亦可為第一CU之子區塊。N/8×N/8 PU可為第二CU之子區塊。類似地,作為另一實例,小於16×16之區塊大小可被稱為16×16視訊區塊之分割區,或被稱為16×16視訊區塊之子區塊。同樣地,對於N×N區塊,小於N×N之區塊大小可被稱為N×N區塊之分割區或子區塊。視訊區塊可包含像素域中之像素資料之區塊,或(例如)在將諸如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換的變換應用於殘餘視訊區塊資料之後的變換域中之變換係數之區塊,該殘餘視訊區塊資料表示經編碼之視訊區塊與預測性視訊區塊之間的像素差。在一些狀況下,視訊區塊可包含變換域中之經量化之變換係數的區塊。
較小視訊區塊可提供較好解析度,且可用於包括高層級細節之視訊圖框的定位。較大視訊區塊可提供較大編碼效率,且可用於包括低層級細節之視訊圖框的定位。可將片段視為複數個視訊區塊及/或子區塊。每一片段可為視訊圖框之可獨立解碼之視訊區塊系列。或者,圖框自身可為可解碼之視訊區塊系列,或可將圖框之其他部分定義為可解碼之視訊區塊系列。術語「視訊區塊系列」可指代視訊圖框之任何可獨立解碼之部分,諸如,整個圖框、圖框之片段、圖像群組(GOP)(亦被稱為序列),或根據適用編碼技術定義之另一可獨立解碼之單元。
在基於框間之預測性編碼之後且在任何變換(諸如,4×4或8×8整數變換或離散餘弦變換或DCT)之後,可執行量化。量化一般指代將係數量化以可能地減少用以表示該等係數之資料之量的程序。該量化程序可減小與該等係數中之一些或全部相關聯之位元深度。在量化之後,可(例如)根據內容適應性可變長度編碼(CAVLC)、內容脈絡適應性二進位算術編碼(CABAC)或另一熵編碼方法來執行熵編碼。
本發明之技術尤其適用於利用雙向預測之B視訊區塊,雙向預測可包括加權雙向預測及非加權雙向預測兩者。在本發明中,術語「B單元」將用於一般指代任何類型之B單元,其可包括B圖框、B片段,或包括至少一些B視訊區塊之可能的其他視訊單元。
如上文提及,雙向預測為所謂的「B視訊區塊」基於兩個不同資料清單之預測。B視訊區塊使用先前編碼之參考圖像之兩個清單(清單0及清單1)。此等兩個清單可各自含有按時間次序之過去及/或未來經編碼之圖像。可按以下若干種方式中之一者預測B視訊區塊:自清單0參考圖像之運動補償預測、自清單1參考圖像之運動補償預測,或自清單0參考圖像及清單1參考圖像兩者之運動補償預測。為得到清單0參考圖像與清單1參考圖像兩者之組合,分別自清單0參考圖像及清單1參考圖像獲得兩個運動補償參考區域。
可自來自兩個先前圖框之資料的兩個清單、來自後續圖框之資料的兩個清單或來自前一圖框之資料的一個清單及來自後一圖框之資料的一個清單來預測B視訊區塊。即使清單0及清單1未必與一特定時間方向相關,是執行藉由清單0、清單1抑或清單0及清單1兩者之運動補償的選擇仍通常被稱為預測方向。與B視訊區塊相比,基於一個清單預測P視訊圖框,該一個清單可對應於一個預測性圖框(例如,一個先前圖框或一個後續圖框)。B圖框及P圖框可更一般地被稱為P單元及B單元。P單元及B單元亦可以諸如圖框之片段或圖框之部分的較小單元來實現。B單元可包括B視訊區塊、P視訊區塊或I視訊區塊。P單元可包括P視訊區塊或I視訊區塊。I單元可僅包括I視訊區塊。
可使用加權雙向預測或非加權雙向預測來編碼利用雙向預測(亦即,清單0及清單1兩者)之B視訊區塊。加權雙向預測指代允許將加權因數指派給兩個不同清單之雙向預測。每一清單可包含與一預測性圖框或其他視訊區塊系列相關聯之一資料集合。在加權雙向預測中,在產生預測性資料時一個清單可較重地加權。舉例而言,若該等清單中之一者具有較類似於正編碼之視訊區塊之資料,則該清單可比另一清單更重地加權。
對於根據(例如)ITU-T H.264之不同類型之加權雙向預測,視訊編碼器22及視訊解碼器28可一般支援三種不同類型之預測模式。第一預測模式(被稱為「預設加權預測」)指代藉由一些預設之設定來預定義與兩個或兩個以上不同清單相關聯之加權因數的加權預測。在一些狀況下,預設加權預測可將相等加權指派給該等清單中之每一者,但針對預設加權預測模式亦可預定義不相等加權。
第二預測模式(被稱為「隱含加權預測」)指代基於與資料相關聯之一些隱含因數定義與兩個或兩個以上不同清單相關聯之加權因數的加權預測。舉例而言,可藉由兩個不同清單中之資料相對於正預測性地編碼之資料的相對時間位置來定義隱含加權因數。在預設加權預測及隱含加權預測兩者中,加權因數不包括於位元串流中。實情為,視訊解碼器28可經程式化以知曉加權因數(對於預設),或可經程式化以知曉導出加權因數之方式(對於隱含)。
第三預測模式(被稱為「顯式加權預測」)指代作為編碼程序之部分動態地定義加權因數且將加權因數編碼至位元串流中的加權預測。就此而言,顯式加權預測不同於預設加權預測及隱含加權預測,例如,顯式加權預測產生經編碼為位元串流之部分的加權因數。
僅呈現此等三個加權雙向預測模式以提供用於本發明中所描述之發信號技術之背景。然而,預期本發明之技術亦可結合非加權雙向預測或除所描述之彼等加權雙向預測模式之外的加權雙向預測模式來實施。舉例而言,預期可使用包括於H.265標準中之所有各種雙向預測模式來實施本發明之技術。
視訊編碼器22可選擇得到有利速率-失真度量之視訊區塊大小及分割區大小。根據本發明之態樣,視訊編碼器22可判定用於視訊區塊之分割區之預測方向。若選取雙向預測,則視訊編碼器22可進一步判定以上加權雙向預測模式中之一者以用於視訊區塊之分割區。為了選擇得到有利速率-失真度量之視訊區塊大小,可針對具有不同分割方案(亦即,不同分割區大小)之大視訊區塊(例如,32×32、64×64或更大)及小視訊區塊(例如,16×16或更小)兩者分析速率-失真度量。如下文將更多說明的,可將N×N視訊區塊分割成單一N×N分割區、兩個N/2×N分割區、兩個N×N/2分割區或四個N/2×N/2分割區。在一些情形中,一分割區可進一步加以分割。
對於經編碼之視訊區塊系列(諸如,圖框或片段),編碼器可比較具有不同大小及分割方案之視訊區塊(諸如,具有多種分割方案之16×16視訊區塊、具有多種分割方案之32×32視訊區塊,及具有多種分割方案之64×64視訊區塊)之間的速率-失真度量。編碼器可接著選擇產生最好速率-失真之視訊區塊大小及分割方案,且使用選定視訊區塊大小(亦即,具有最好速率-失真之視訊區塊大小)編碼該視訊區塊。
該選擇可基於以三個或三個以上遍次(例如,使用16×16像素視訊區塊之第一遍次、使用32×32像素視訊區塊之第二遍次,及使用64×64像素視訊區塊之第三遍次)編碼圖框或片段,且比較每一遍次之速率-失真度量。以此方式,對於給定視訊區塊系列(諸如,片段或圖框),編碼器可藉由變化視訊區塊大小及分割方案且選擇產生最好或最佳速率-失真之視訊區塊大小及分割方案來改良速率-失真。編碼器可進一步傳輸用於視訊區塊系列之語法資訊(例如,作為圖框標頭或片段標頭之部分),該語法資訊識別用於視訊區塊系列中之視訊區塊之大小。在區塊標頭中,編碼器可進一步傳輸識別所使用之分割方案及用於區塊之每一分割區之預測方向的單獨語法元素。若將一區塊分割成4個子區塊,則編碼器可在子區塊標頭中傳輸識別用於子區塊之分割方案及預測方向之單獨語法元素。
將此等概念擴展至針對H.265而出現之術語,該選擇可基於以三個或三個以上遍次(例如,使用16×16 LCU之第一遍次、使用32×32 LCU之第二遍次,及使用64×64 LCU之第三遍次)編碼圖框或片段,且比較每一遍次之速率-失真度量。以此方式,對於給定視訊區塊系列(諸如,片段或圖框),編碼器可藉由變化LCU大小及分割方案且選擇產生最好或最佳速率-失真之LCU大小及分割方案來改良速率-失真。編碼器可進一步傳輸用於視訊區塊系列之語法資訊(例如,作為圖框標頭或片段標頭之部分),該語法資訊識別用於視訊區塊系列中之LCU大小。在LCU標頭中,編碼器可進一步傳輸識別用於LCU之分割方案及用於LCU之每一分割區之預測方向的單獨語法元素。若將一LCU分割成4個CU,則編碼器可在CU標頭中傳輸識別用於CU之分割方案及預測方向之單獨語法元素。
對於一些視訊圖框或片段,大視訊區塊可呈現實質的位元速率節省且藉此在給定相對較低失真之情況下產生最好的速率-失真結果。然而,對於其他視訊圖框或片段,較小視訊區塊可呈現較小失真,勝過速率-失真成本分析中之位元速率。因此,在不同狀況下,(例如)取決於視訊內容及複雜性,64×64、32×32或16×16可適用於不同視訊圖框或片段。類似地,取決於視訊內容及複雜性,不同分割方案亦可適用於不同視訊區塊。
可產生兩個或兩個以上單獨語法元素且將該兩個或兩個以上單獨語法元素編碼至位元串流中,以便識別用於視訊區塊之分割區大小及用於分割區之一或多個預測方向。器件12將該兩個或兩個以上單獨語法元素傳輸至解碼器28。解碼器28可解碼並解譯該(等)語法元素,且基於該(等)語法元素,解碼器28可重建構視訊區塊。
圖2為說明與本發明一致的可執行技術之視訊編碼器50之實例的方塊圖。視訊編碼器50可對應於源器件12之視訊編碼器22或不同器件之視訊編碼器。視訊編碼器50可執行視訊圖框內之區塊的框內編碼及框間編碼,但為了說明容易起見,框內編碼組件未展示於圖2中。框內編碼依賴於空間預測以減小或移除給定視訊圖框內之視訊的空間冗餘。框間編碼依賴於時間預測以減小或移除視訊序列之相鄰圖框內之視訊的時間冗餘。框內模式(I模式)可指代基於空間之壓縮模式,且諸如預測(P模式)或雙向(B模式)之框間模式可指代基於時間之壓縮模式。
如圖2中所展示,視訊編碼器50接收待編碼之視訊圖框或片段內之當前視訊區塊。在圖2之實例中,視訊編碼器50包括預測單元31(包括運動估計單元32及運動補償單元35)、記憶體34、加法器48、變換單元38、量化單元40及熵編碼單元46。對於視訊區塊重建構,視訊編碼器50亦包括逆量化單元42、逆變換單元44及加法器51。視訊編碼器50亦可包括解區塊濾波器(未圖示)以對區塊邊界進行濾波,從而自經重建構之視訊移除方塊效應假影。必要時,解區塊濾波器將通常對加法器51之輸出進行濾波。
在編碼程序期間,視訊編碼器50接收待編碼之視訊區塊,且運動估計單元32及運動補償單元35執行框間預測性編碼。運動估計單元32與運動補償單元35可在預測單元31內高度地整合,但出於說明目的而分開地展示。通常將運動估計視為產生估計視訊區塊之運動的運動向量的程序。舉例而言,運動向量可指示預測性圖框(或其他視訊區塊系列)內之預測性區塊相對於在當前圖框(或其他視訊區塊系列)內正編碼之當前區塊的位移。通常將運動補償視為基於由運動估計判定之運動向量提取或產生預測性區塊之程序。再次,運動估計單元32與運動補償單元35可在功能上整合。出於示範之目的,本發明中所描述之技術經描述為由運動補償單元35執行,但更一般地可由預測單元31之任何部分執行。
運動估計單元32藉由比較待編碼之視訊區塊與一或多個預測性視訊區塊系列(例如,依據時間或在時間上的先前及/或未來圖框)之視訊區塊來選擇待編碼之視訊區塊的適當運動向量。作為一實例,運動估計單元32可以許多方式來選擇B圖框之運動向量。在一方式中,運動估計單元32可自第一圖框集合(被稱為清單0)選擇先前或未來圖框,且僅使用來自清單0之此先前或未來圖框來判定運動向量。或者,運動估計單元32可自第二圖框集合(被稱為清單1)選擇先前或未來圖框,且僅使用來自清單1之此先前或未來圖框來判定運動向量。在又一實例中,運動估計單元32可自清單0選擇第一圖框及自清單1選擇第二圖框,且自清單0之第一圖框及清單1之第二圖框選擇一或多個運動向量。此第三種形式之預測可被稱為雙向預測性運動估計。用於任何給定清單之選定運動向量可指向最類似於正編碼之視訊區塊(例如,如由諸如預測性區塊之像素值相對於正編碼之區塊之像素值的絕對差和(SAD)或平方差和(SSD)之度量所定義)的預測性視訊區塊。
在一實例中,若運動估計單元32選擇雙向運動估計以用於視訊區塊,則可使用三種運動補償雙向預測性演算法或模式來預測B圖框或其部分(諸如,視訊區塊、巨集區塊、LCU、CU及PU,或B圖框之任何其他離散及/或連續部分)。第一運動補償雙向預測性演算法或模式(其通常被稱為預設加權預測)可涉及將預設權重施加至清單0之第一圖框及清單1之第二圖框的每一經識別之視訊區塊。預設權重可根據標準來程式化,且常針對預設加權預測而選定為相等的。接著將第一圖框之加權區塊與第二圖框之加權區塊加在一起且除以用以預測B圖框之圖框的總數目(例如,在此例子中為二)。
B單元使用先前編碼之參考圖像之兩個清單(清單0及清單1)。此等兩個清單可各自含有按時間次序之過去及/或未來經編碼之圖像。可按以下若干種方式中之一者預測B單元中之區塊:自清單0參考圖像之運動補償預測、自清單1參考圖像之運動補償預測,或自清單0參考圖像及清單1參考圖像兩者之運動補償預測。為得到清單0參考圖像與清單1參考圖像兩者之組合,分別自清單0參考圖像及清單1參考圖像獲得兩個運動補償參考區域。將使用其組合來預測當前區塊。
如所提及,B單元可允許三種類型之加權預測。為簡單起見,在下文僅展示單向預測中之前向預測,但亦可使用後向預測。預設加權預測可藉由分別用於單向預測及雙向預測之以下方程式定義。
單向預測:pred(i,j)=pred0(i,j)
雙向預測:pred(i,j)=(pred0(i,j)+pred1(i,j)+1)>>1
其中pred0(i,j)及pred1(i,j)為來自清單0及清單1之預測資料。
隱含加權預測可藉由分別用於單向預測及雙向預測之以下方程式定義。
單向預測:pred(i,j)=pred0(i,j)
雙向預測:pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+32)>>6
在此狀況下,藉由加權因數w0或w1按比例調整每一預測,其中基於清單0參考圖像及清單1參考圖像之相對時間位置來計算w0及w1。
顯式加權預測可藉由分別用於單向預測及雙向預測之以下方程式定義。
單向預測:pred(i,j)=(pred0(i,j)*w0+2r-1 )>>r+o1
雙向預測:pred(i,j)=(pred0(i,j)*w0+pred1(i,j)*w1+2r )>>(r+1)+((o1+o2+1)>>1)
在此狀況下,加權因數藉由編碼器判定且在片段標頭中傳輸,且o1及o2為分別針對清單0參考圖像及清單1參考圖像之圖像偏移。
下文之表1展示用於編碼B單元之16×16視訊區塊之23種不同區塊類型(標示為0至22),但相同概念可擴展至N×N視訊區塊。標示為「區塊類型」之行展示與用於識別區塊類型之區塊類型編號分開的速記記法。標示為「分割區大小」之行識別分割視訊區塊之方式(D-16×16、16×16、8×16、16×8或8×8)。對於使用直接模式(D-16×16)之區塊類型,因為在解碼器處基於相鄰視訊區塊來判定運動向量,所以無運動向量且因此無預測方向自編碼器用信號發送至解碼器。對於包括一個分割區(亦即,分割區大小為16×16)之區塊類型,標示為「預測方向0」之行識別用於該一個分割區之預測方向。對於包括兩個分割區(亦即,分割區大小為8×16及16×8)之區塊類型,標示為「預測方向0」之行識別用於第一分割區之預測方向,且標示為「預測方向1」之行識別用於第二分割區之預測方向。如上文所論述,預測方向包括僅使用清單0(L0)、僅使用清單1(L0),及使用清單0及清單1兩者的雙向預測性運動估計(Bi)。
替代具有單一唯一語法元素之上文的23種區塊類型中之每一者(亦即,23個不同語法元素),本發明之技術包括將單獨語法元素用於分割區大小、預測方向0及預測方向1中之每一者。因此,可將上文之23種區塊類型表示為5個分割區大小(D-16×16、16×16、8×16、16×8及8×8)與3個預測方向(L0、L1及Bi)之組合。因此,使用選項12作為一實例,對於使用16×8分割之視訊區塊(其中使用清單0預測第一分割區及使用清單0及清單1兩者預測第二分割區),可產生三個單獨語法元素。第一語法元素可識別16×8分割;第二語法元素可識別清單0(L0),且第三語法元素可識別雙向預測(Bi)。
表1之區塊類型22對應於分割成4個8×8子區塊之16×16視訊區塊,在該狀況下,每一子區塊可使用其自身之分割方案。因此,回應於接收指示用於16×16視訊區塊之8×8分割的語法元素,視訊編碼器將知曉尋找子區塊標頭中用以指示子區塊類型之額外語法。如同上文之區塊類型實例,可使用兩個或兩個以上單獨語法元素來用信號發送子區塊類型。對於8×8子區塊,在指示分割區大小及用於子區塊之分割區之預測方向方面,第一語法元素可識別分割區大小,且第二語法元素可識別預測方向。下文之表2展示可用於8×8子區塊之子區塊類型(標示為0至13)之實例。標示為「子區塊類型編號」之行給出用於每一子區塊類型之編號,而標示為「子區塊類型」之行給出用於子區塊類型之速記記法。標示為「分割區大小」之行識別用於子區塊之分割方案,且標示為「預測方向」之行識別用於子區塊之分割區之預測方向。
在一些實施中,如在表2之實例中,子區塊之兩個8×4分割區可使用相同預測方向。舉例而言,表2之子區塊類型4之兩個分割區具有相同預測方向(L0)。然而,在其他實施中,子區塊之不同分割區可各自具有唯一預測方向,此情形類似於表1但具有較小分割區。
一視訊區塊可具有多個分割層級。舉例而言,片段或圖框可在片段標頭或圖框標頭中含有指示片段或圖框具有為64×64之LCU大小的語法元素。每一LCU(在LCU標頭中發信號)可具有指示分割區大小及用於LCU之分割區之一個或兩個預測方向的單獨語法元素,或LCU標頭可具有指示LCU分割成4個32×32 CU的語法元素。每一32×32 CU(在CU標頭中發信號)可具有指示分割區大小及分割區之一個或兩個預測方向的單獨語法元素,或可具有指示32×32 CU進一步分割成4個16×16 CU的語法元素。同樣地,每一16×16 CU標頭可具有指示分割區大小及一個或兩個預測方向之單獨語法元素,或指示進一步分割之語法元素。
如同在表1中論述之區塊類型,可使用單獨語法元素來用信號發送表2之子區塊類型。替代具有單一唯一語法元素之上文的13種區塊類型中之每一者(亦即,13個不同語法元素),本發明之技術包括將單獨語法元素用於分割區大小及預測方向中之每一者。因此,可將上文之13種區塊類型表示為5個分割區大小(D-8×8、8×8、4×8、8×4及4×4)與3個預測方向(L0、L1及Bi)之組合。因此,使用選項7作為一實例,對於使用4×8分割之視訊子區塊(其中分割區使用清單1預測),可產生兩個單獨語法元素。第一單獨元素可識別4×8分割,且第二單獨元素可識別清單1(L1)。
如本文中所描述,一旦藉由運動補償單元35識別所要預測資料,視訊編碼器50便接著藉由自正編碼之原始視訊區塊減去預測資料來形成殘餘視訊區塊。加法器48表示執行此減法運算之一或多個組件。變換單元38將諸如離散餘弦變換(DCT)或概念上類似之變換的變換應用於殘餘區塊,從而產生包含殘餘變換區塊係數之視訊區塊。舉例而言,變換單元38可執行概念上類似於DCT之其他變換,諸如由編碼標準所定義之變換。亦可使用小波變換、整數變換、次頻帶變換或其他類型之變換。在任何狀況下,變換單元38將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。變換可將殘餘資訊自像素域轉換至頻域。
量化單元40量化殘餘變換係數以進一步減小位元速率。在量化之後,熵編碼單元46熵編碼經量化之變換係數。熵編碼單元46進一步熵編碼藉由運動補償單元35產生之語法元素。舉例而言,熵編碼單元46可執行內容適應性可變長度編碼(CAVLC)、內容脈絡適應性二進位算術編碼(CABAC)或另一熵編碼方法。由於藉由運動補償單元35產生之語法元素為單獨語法元素,因此每一語法元素可經歷不同熵編碼程序。舉例而言,熵編碼單元46可維持用於應用CAVLC至用於分割區大小之語法元素的統計及用於應用CAVLC至用於預測方向之語法元素的單獨統計。在藉由熵編碼單元46進行之熵編碼之後,可將經編碼之視訊傳輸至另一器件或經封存以供稍後傳輸或擷取。經編碼之位元串流可包括經熵編碼之殘餘區塊、此等區塊之運動向量,及諸如本文中所描述之語法之其他語法。
逆量化單元42及逆變換單元44分別應用逆量化及逆變換以在像素域中重建構殘餘區塊,以(例如)用於按上文所描述之方式而稍後用作參考區塊。加法器51將經重建構之殘餘區塊加至藉由運動補償單元35產生之經運動補償之預測區塊以產生經重建構之視訊區塊,以供儲存於記憶體34中。該經重建構之視訊區塊可藉由運動估計單元32及運動補償單元35用作框間編碼後續視訊圖框中之區塊的參考區塊。
圖3為更詳細地說明圖2之運動補償單元35之實例的方塊圖。如上文所論述,運動補償單元35很可能在預測單元31內與運動估計單元32高度地整合。因此,應理解,在本發明中運動估計單元32與運動補償單元35之功能性之劃分係僅出於解釋之目的。如圖3之實例中所展示,運動補償單元35耦接至記憶體34,記憶體34將參考單元或參考圖框之第一集合及參考單元或參考圖框之第二集合儲存為清單0 52A及清單1 52B。另外,記憶體34可儲存經編碼之當前視訊資料53。記憶體34可包含共用記憶體結構,或可能包含若干不同記憶體、儲存單元、緩衝器,或促進本文中所論述之任何資料之儲存的其他類型之儲存器。清單0 52A及清單1 52B為根據雙向預測與兩個不同預測性單元相關聯之資料,例如,來自兩個不同圖框或片段或巨集區塊之資料。再次,雙向預測未必限於任何預測方向,且因此清單0 52A及清單1 52B可儲存來自兩個先前圖框或片段、兩個後續圖框或片段,或一個先前圖框或片段及一個後續圖框或片段的資料。此外,在一些狀況下,清單0 52A及/或清單1 52B可各自包括與多個圖框、片段或視訊區塊相關聯之資料。清單0 52A及/或清單1 52B簡單地為可能預測性資料之兩個不同集合,且每一清單可包括一個圖框或片段,或若干圖框、片段,或相對於正編碼之當前視訊區塊的在任何方向上之視訊區塊。
如圖3中所展示,運動補償單元35包括用於判定待用於編碼視訊區塊之分割區的雙向預測之類型的預設加權預測單元54、隱含加權預測單元56及顯式加權預測單元58。運動補償單元35進一步包括用於判定應將前向預測(例如,清單0)抑或後向預測(例如,清單1)用於編碼視訊區塊之清單0預測單元60及清單1預測單元62。如先前所提及,雙向預測可不限於特定時間方向。因此,雖然術語「前向」及「後向」在論述預測時仍通常用以指代兩個不同清單,但該兩個清單未必具有任何特定時間方向。單元54、56及58分別可執行如本文中所描述之預設加權預測、隱含加權預測及顯式加權預測。速率-失真(R-D)分析單元64可選擇此等可能性中之加權預測資料中之一者,或可選擇清單0預測資料或清單1預測資料中之一者,且可實施本發明之技術以促進選擇程序。
運動補償單元35亦可包括:捨位單元,其使單元54、56、58、60及62中之一或多者產生各別加權預測資料之捨位版本及未捨位版本兩者;及偏移計算單元,其計算作為正編碼之區塊之視訊區塊值的平均值與預測區塊之視訊區塊值的平均值之間的差的偏移。出於簡單性目的,未在圖3中展示捨位單元及偏移單元。
R-D分析單元64可分析單元54、56、58、60及62之不同預測性資料,且可依據品質或依據速率及失真來選擇產生最好結果之預測性資料。取決於各種實施偏好,R-D分析單元可經組態以平衡編碼速率(亦即,位元數目)與影像品質等級之競爭利益。R-D分析單元64輸出選定預測性資料,可經由加法器48(圖2)自經編碼之視訊區塊減去該選定預測性資料。如上文所論述,除了分析哪種類型之預測資料產生最好結果之外,R-D分析單元64亦可分析經編碼之單元的哪個大小及用於經編碼之單元的哪種類型之分割產生最好結果。
語法元素可用以告知解碼器運動補償單元35使用以編碼資料之方式或方法,及因此解碼器應使用以產生加權預測性資料的方式及方法。根據本發明,語法元素可包括用於用信號發送分割區大小及預測方向之單獨語法元素。若選擇雙向預測,則語法元素(例如)可進一步指示是應使用預設加權預測、隱含加權預測抑或顯式加權預測。若應使用顯式加權預測,則語法元素可進一步識別加權因數及偏移,加權因數及偏移再次可為與顯式加權預測相關聯之加權因數及偏移,或可為實際上藉由預設加權預測單元54或隱含加權預測單元56定義之加權因數外加來自偏移計算單元62之偏移。
圖4為說明例示性視訊解碼器70之方塊圖,視訊解碼器70可執行與上文所描述之編碼技術互逆的解碼技術。視訊解碼器70可包括熵解碼單元72、預測單元75、逆量化單元76、逆變換單元78、記憶體74及加法器79。預測單元75可包括運動補償(MC)單元88以及空間預測組件,出於說明之簡單及容易起見未展示空間預測組件。
視訊解碼器70可接收經編碼之視訊資料,及指示分割區大小及預測方向之兩個或兩個以上單獨語法元素。如本文中所描述,基於該兩個或兩個以上單獨語法元素,預測單元75之MC單元86可產生取決於兩個或兩個以上資料清單之加權預測資料。視訊解碼器70可使用加權預測資料解碼視訊資料,例如,藉由調用加法器79來將加權預測資料(例如,預測區塊)加至殘餘資料(例如,殘餘區塊)。
一般而言,熵解碼單元72接收經編碼之位元串流且熵解碼該位元串流以產生經量化之係數、運動資訊及其他語法元素。根據本發明之技術,其他語法元素可包括用信號發送分割區大小及預測方向之兩個或兩個以上單獨語法元素。將運動資訊(例如,運動向量)及其他語法轉發至預測單元75以供產生預測性資料。預測單元75執行與本發明一致之雙向預測,且根據所接收之語法元素可能地實施預設加權預測、隱含加權預測或顯式加權預測。該等語法元素可識別待使用之加權預測之類型、在使用顯式加權預測之情況下之係數及偏移,且如先前所論述,可包括識別分割區大小及預測方向之兩個或兩個以上單獨語法元素。
將經量化之係數自熵解碼單元72發送至逆量化單元76,逆量化單元76執行逆量化。逆變換單元78接著將經解量化之係數逆變換回至像素域以產生殘餘區塊。加法器79組合藉由預測單元75產生之預測資料(例如,預測區塊)與來自逆變換單元78之殘餘區塊以產生經重建構之視訊區塊,該經重建構之視訊區塊可儲存於記憶體74中及/或自視訊解碼器70輸出作為經解碼之視訊輸出。
圖5為說明與本發明一致的藉由視訊編碼器執行之實例程序的流程圖。將自圖2之視訊編碼器50之觀點來描述圖5。如圖5中所展示,運動補償單元35產生第一加權預測資料(501),且產生第二加權預測資料(502)。運動補償單元35接著基於速率-失真分析自第一加權預測資料及第二加權預測資料選擇預測資料(503)。詳言之,運動補償單元35可判定量化及平衡與第一加權預測資料及第二加權預測資料相關聯之編碼速率及編碼品質的用於第一加權預測資料及第二加權預測資料之成本度量,且可依據速率及失真兩者選擇具有最低成本之預測資料。視訊編碼器50可接著基於選定預測資料編碼視訊資料(504)。舉例而言,視訊編碼器50可調用加法器48以自正編碼之視訊資料減去選定預測資料,且接著調用變換單元38以用於變換、調用量化單元40以用於量化,及調用熵編碼單元46以用於熵編碼經量化且經變換之殘餘係數。在此狀況下,運動補償單元35可產生用以指示用於預測資料之分割區大小及預測方向之兩個或兩個以上單獨語法元素,且可將此等語法元素轉遞至熵編碼單元46以包括於經編碼之位元串流中(505)。圖5之程序可針對片段或圖框內之複數個B視訊區塊或其他視訊區塊系列而執行,且亦可針對B視訊區塊之子區塊而執行。舉例而言,圖5之程序可針對LCU、CU或PU中之任一者而執行。
圖6為說明與本發明一致的藉由視訊解碼器執行之實例程序的流程圖。將自圖4之視訊解碼器70之觀點來描述圖6。如圖6中所展示,視訊解碼器接收經編碼之視訊資料(601),且接收指示用以編碼視訊資料之分割區大小及預測方向之兩個或兩個以上單獨語法元素(602)。詳言之,熵解碼單元72可接收經編碼之位元串流,該經編碼之位元串流包括視訊資料及該兩個或兩個以上單獨語法元素。在熵解碼之後,熵解碼單元72可輸出視訊資料作為經量化之變換係數,經量化之變換係數藉由單元76逆量化且藉由單元78逆變換。熵解碼單元72可將語法元素輸出至預測單元75,語法元素包括指示用以編碼視訊資料之分割區大小及預測方向之該兩個或兩個以上單獨語法元素、運動向量及可能其他語法。
預測單元75調用運動補償單元86以進行基於區塊之預測性解碼。在進行此操作時,運動補償單元86基於指示分割區大小及預測方向之該兩個或兩個以上單獨語法元素產生加權預測資料(603)。視訊解碼器70可接著使用加權預測資料解碼視訊資料(604)。詳言之,視訊解碼器70可調用加法器79以組合加權預測資料(例如,預測區塊)與殘餘視訊資料(例如,殘餘區塊),以便產生視訊資料之重建構(例如,經重建構之視訊區塊)。圖6之程序可針對片段或圖框內之複數個B視訊區塊或其他視訊區塊系列而執行,且亦可針對B視訊區塊之子區塊而執行。舉例而言,圖5之程序可針對LCU、CU或PU中之任一者而執行。
本發明之技術可實施於廣泛多種器件或裝置中,包括無線手機及積體電路(IC)或一組IC(亦即,晶片組)。任何組件、模組或單元已描述為經提供以強調功能態樣,且未必需要由不同硬體單元實現。亦可以硬體、軟體、韌體或其任何組合來實施本文中所描述之技術。可將被描述為模組、單元或組件之任何特徵一起實施於整合式邏輯器件中或分開地實施為離散但可交互操作之邏輯器件。在一些狀況下,可將各種特徵實施為積體電路器件(諸如,積體電路晶片或晶片組)。
若以軟體來實施,則該等技術可至少部分地藉由電腦可讀媒體來實現,該電腦可讀媒體包含在處理器中執行時執行上述方法中之一或多者的指令。該電腦可讀媒體可包含電腦可讀儲存媒體且可形成電腦程式產品之部分,該電腦程式產品可包括封裝材料。該電腦可讀儲存媒體可包含隨機存取記憶體(RAM)(諸如,同步動態隨機存取記憶體(SDRAM))、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯讀記憶體(EEPROM)、快閃記憶體、磁性或光學資料儲存媒體,及其類似者。或者或另外,該等技術可至少部分地藉由攜載或傳達呈指令或資料結構之形式的程式碼且可由電腦存取、讀取及/或執行的電腦可讀通信媒體來實現。
程式碼或指令可藉由諸如以下各者之一或多個處理器來執行:一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA),或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態以用於編碼及解碼之專用軟體模組或硬體模組內,或併入於組合之視訊編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明亦預期多種積體電路器件中之任一者,該等積體電路器件包括用以實施本發明中所描述之技術中的一或多者的電路。可將此電路提供於單一積體電路晶片中或提供於位於所謂的晶片組中之多個可交互操作之積體電路晶片中。可將此等積體電路器件用於多種應用中,該等應用中之一些可包括在無線通信器件(諸如,行動電話手機)中之使用。
已描述本發明之各種實施例。此等及其他實施例係在以下申請專利範圍之範疇內。
10...視訊編碼及解碼系統
12...源器件/視訊器件
15...通信頻道
16...目的地器件/視訊器件
20...視訊源
22...視訊編碼器
23...調變器/解調變器(數據機)
24...傳輸器
26...接收器
27...數據機
28...視訊解碼器
30...顯示器件
31...預測單元
32...運動估計單元
34...記憶體
35...運動補償單元
38...變換單元
40...量化單元
42...逆量化單元
44...逆變換單元
46...熵編碼單元
48...加法器
50...視訊編碼器
51...加法器
52A...清單0
52B...清單1
53...當前視訊資料
54...預設加權預測單元
56...隱含加權預測單元
58...顯式加權預測單元
60...清單0預測單元
62...清單1預測單元
64...速率-失真(R-D)分析單元
70...視訊解碼器
72...熵解碼單元
74...記憶體
75...預測單元
76...逆量化單元
78...逆變換單元
79...加法器
86...運動補償(MC)單元
圖1為說明可實施本發明之技術的一實例視訊編碼及解碼系統的方塊圖。
圖2為說明與本發明一致的可執行技術之視訊編碼器之實例的方塊圖。
圖3為更詳細地說明運動補償單元之實例的方塊圖。
圖4為說明與本發明一致的可執行技術之視訊解碼器之實例的方塊圖。
圖5為說明與本發明一致的藉由視訊編碼器執行之程序之實例的流程圖。
圖6為說明與本發明一致的藉由視訊解碼器執行之程序之實例的流程圖。
(無元件符號說明)

Claims (54)

  1. 一種編碼一雙向視訊區塊(B視訊區塊)之方法,該方法包含:產生用於該B視訊區塊之第一預測資料;產生用於該B視訊區塊之第二預測資料;基於一或多個速率-失真度量來選擇該第一預測資料及該第二預測資料中之一者;基於該選定預測資料,產生僅指示用於該B視訊區塊之一分割區大小的一第一語法元素,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小;基於該選定預測資料,產生與該第一語法元素分開且僅指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素,其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵編碼程序,其中對該第一語法元素執行該第一熵編碼程序包含基於第一統計執行一內容脈絡適應性熵編碼程序;對該第二語法元素執行一第二熵編碼程序,其中對該第二語法元素執行該第二熵編碼程序包含基於第二單獨統計執行該內容脈絡適應性熵編碼程序;輸出該第一語法元素及該第二語法元素;及至少部分地基於該第一語法元素及該第二語法元素之 值而編碼該B視訊區塊。
  2. 如請求項1之方法,其中選擇該第一預測資料及該第二預測資料中之該一者包含:針對關於該第一預測資料及該第二預測資料中之每一者評估該一或多個速率-失真度量,且其中該一或多個速率-失真度量係至少部分地基於與該第一預測資料及該第二預測資料中之每一者相關聯的一編碼速率及一編碼品質。
  3. 如請求項1之方法,其中產生該第一預測資料包含判定一第一運動向量,且產生該第二預測資料包含判定一第二運動向量。
  4. 如請求項3之方法,其中產生該第二語法元素係至少部分地基於該第一運動向量或該第二運動向量中之哪一者對應於該選定預測資料。
  5. 如請求項1之方法,其中產生該第一預測資料包含判定一第一分割區大小,且產生該第二預測資料包含判定一第二分割區大小。
  6. 如請求項5之方法,其中產生該第一語法元素係至少部分地基於該第一分割區大小或該第二分割區大小中之哪一者對應於該選定預測資料。
  7. 如請求項1之方法,其中輸出該第一語法元素及該第二語法元素包含:輸出指示該第一語法元素之第一複數個位元;及輸出指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  8. 如請求項1之方法,其進一步包含:基於該選定預測資料,產生指示用於該B視訊區塊之一第二分割區之一第二預測方向的一第三語法元素。
  9. 如請求項1之方法,其中該內容脈絡適應性熵編碼程序包含內容適應性可變長度編碼或內容脈絡適應性二進位算術編碼中之一者。
  10. 一種用於編碼一雙向視訊區塊(B視訊區塊)之視訊編碼器,該視訊編碼器包含:一記憶體,其經組態以儲存該B視訊區塊;及一處理器,其經組態以:產生用於該B視訊區塊之第一預測資料及用於該B視訊區塊之第二預測資料;選擇該第一預測資料及該第二預測資料中之待包括於位元串流中之一者;基於該選定預測資料產生僅指示用於該B視訊區塊之一分割區大小的一第一語法元素,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小,且基於該選定預測資料產生僅指示用於該B視訊區塊之一預測方向的一第二語法元素,其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵編碼程序,其中為了對該第一語法元素執行該第一熵編碼程序,該處理器經 組態以基於第一統計執行一內容脈絡適應性熵編碼程序;對該第二語法元素執行一第二熵編碼程序,其中為了對該第二語法元素執行該第二熵編碼程序,該處理器經組態以基於第二單獨統計執行該內容脈絡適應性熵編碼程序;輸出該第一語法元素及該第二語法元素;及至少部分地基於該第一語法元素及該第二語法元素之值而編碼該B視訊區塊。
  11. 如請求項10之視訊編碼器,其中該處理器經進一步組態以基於針對該第一預測資料及該第二預測資料中之每一者評估一或多個速率-失真度量而選擇該第一預測資料及該第二預測資料中之該一者,且其中該一或多個速率-失真度量係至少部分地基於與該第一預測資料及該第二預測資料中之每一者相關聯的一編碼速率及一編碼品質。
  12. 如請求項10之視訊編碼器,其中為了產生該第一預測資料,該處理器經進一步組態以判定一第一運動向量,且其中為了產生該第二預測資料,該處理器經進一步組態以判定一第二運動向量。
  13. 如請求項12之視訊編碼器,其中該處理器經組態以至少部分地基於該第一運動向量或該第二運動向量中之哪一者對應於該選定預測資料而產生該第二語法元素。
  14. 如請求項10之視訊編碼器,其中為了產生該第一預測資料,該處理器經進一步組態以判定一第一分割區大小, 且其中為了產生該第二預測資料,該處理器經進一步組態以判定一第二分割區大小。
  15. 如請求項14之視訊編碼器,其中該處理器經組態以至少部分地基於該第一分割區大小或該第二分割區大小中之哪一者對應於該選定預測資料而產生該第一語法元素。
  16. 如請求項10之視訊編碼器,其中為了產生該第一語法元素及該第二語法元素,該處理器經進一步組態以輸出指示該第一語法元素之第一複數個位元且輸出指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  17. 如請求項10之視訊編碼器,其中為了產生該第一語法元素及該第二語法元素,該處理器經進一步組態以基於該選定預測資料產生指示用於該B視訊區塊之一第二分割區之一第二預測方向的一第三語法元素。
  18. 如請求項10之視訊編碼器,其進一步包含經組態以產生該B視訊區塊之像素資料之一相機。
  19. 如請求項10之視訊編碼器,其中該內容脈絡適應性熵編碼程序包含內容適應性可變長度編碼或內容脈絡適應性二進位算術編碼中之一者。
  20. 一種儲存指令之非暫時性電腦可讀儲存媒體,該等指令被一或多個處理器執行時使該一或多個處理器執行一雙向視訊區塊(B視訊區塊)之編碼,該編碼包含:產生用於該B視訊區塊之第一預測資料;產生用於該B視訊區塊之第二預測資料; 基於一或多個速率-失真度量來選擇該第一預測資料及該第二預測資料中之一者;基於該選定預測資料產生僅指示用於該B視訊區塊之一分割區大小的一第一語法元素,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小;基於該選定預測資料產生與該第一語法元素分開且僅指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素,其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵編碼程序,其中對該第一語法元素執行該第一熵編碼程序包含基於第一統計執行一內容脈絡適應性熵編碼程序;對該第二語法元素執行一第二熵編碼程序,其中對該第二語法元素執行該第二熵編碼程序包含基於第二單獨統計執行該內容脈絡適應性熵編碼程序;輸出該第一語法元素及該第二語法元素;及至少部分地基於該第一語法元素及該第二語法元素之值而編碼該B視訊區塊。
  21. 如請求項20之非暫時性電腦可讀儲存媒體,其中選擇該第一預測資料及該第二預測資料中之該一者包含針對該第一預測資料及該第二預測資料中之每一者評估該一或多個速率-失真度量,且其中該一或多個速率-失真度量 係至少部分地基於與該第一預測資料及該第二預測資料中之每一者相關聯的一編碼速率及一編碼品質。
  22. 如請求項20之非暫時性電腦可讀儲存媒體,其中產生該第一預測資料包含判定一第一運動向量,且產生該第二預測資料包含判定一第二運動向量。
  23. 如請求項22之非暫時性電腦可讀儲存媒體,其中產生該第二語法元素係至少部分地基於該第一運動向量或該第二運動向量中之哪一者對應於該選定預測資料。
  24. 如請求項20之非暫時性電腦可讀儲存媒體,其中產生該第一預測資料包含判定一第一分割區大小且產生該第二預測資料包含判定一第二分割區大小。
  25. 如請求項24之非暫時性電腦可讀儲存媒體,其中產生該第一語法元素係至少部分地基於該第一分割區大小或該第二分割區大小中之哪一者對應於該選定預測資料。
  26. 如請求項20之非暫時性電腦可讀儲存媒體,其中輸出該第一語法元素及該第二語法元素包含:輸出指示該第一語法元素之第一複數個位元;及輸出指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  27. 如請求項20之非暫時性電腦可讀儲存媒體,其進一步包含:基於該選定預測資料,產生指示用於該B視訊區塊之一第二分割區之一第二預測方向的一第三語法元素。
  28. 一種用於編碼一雙向視訊區塊(B視訊區塊)之器件,該器 件包含:用於產生用於該B視訊區塊之第一預測資料的構件;用於產生用於該B視訊區塊之第二預測資料的構件;用於基於一或多個速率-失真度量選擇該第一預測資料及該第二預測資料中之一者的構件;用於基於該選定預測資料產生僅指示用於該B視訊區塊之一分割區大小的一第一語法元素的構件,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小;用於基於該選定預測資料產生與該第一語法元素分開且僅指示用於該B視訊區塊之一分割區之一預測方向的一第二語法元素的構件,其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;用於對該第一語法元素執行一第一熵編碼程序的構件,其中該用於對該第一語法元素執行該第一熵編碼程序的構件包含用於基於第一統計執行一內容脈絡適應性熵編碼程序的構件;用於對該第二語法元素執行一第二熵編碼程序的構件,其中該用於對該第二語法元素執行該第二熵編碼程序的構件包含用於基於第二單獨統計執行該內容脈絡適應性熵編碼程序的構件;用於輸出該第一語法元素及該第二語法元素的構件;及用於至少部分地基於該第一語法元素及該第二語法元 素之值而編碼該B視訊區塊的構件。
  29. 如請求項28之器件,其中該用於選擇該第一預測資料及該第二預測資料中之該一者的構件包含用於針對該第一預測資料及該第二預測資料中之每一者評估該一或多個速率-失真度量的構件,且其中該一或多個速率-失真度量係至少部分地基於與該第一預測資料及該第二預測資料中之每一者相關聯的一編碼速率及一編碼品質。
  30. 如請求項28之器件,其中該用於產生該第一預測資料的構件包含用於判定一第一運動向量的構件,且該用於產生該第二預測資料的構件包含用於判定一第二運動向量的構件。
  31. 如請求項30之器件,其中該用於產生該第二語法元素的構件至少部分地基於該第一運動向量或該第二運動向量中之哪一者對應於該選定預測資料來產生該第二語法元素。
  32. 如請求項28之器件,其中該用於產生該第一預測資料的構件包含用於判定一第一分割區大小的構件,且該用於產生該第二預測資料的構件包含用於判定一第二分割區大小的構件。
  33. 如請求項32之器件,其中該用於產生該第一語法元素的構件至少部分地基於該第一分割區大小或該第二分割區大小中之哪一者對應於該選定預測資料來產生該第一語法元素。
  34. 如請求項28之器件,其中該用於輸出該第一語法元素及 該第二語法元素的構件經組態以輸出指示該第一語法元素之第一複數個位元且輸出指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  35. 如請求項28之器件,其進一步包含:用於基於該選定預測資料產生指示用於該B視訊區塊之一第二分割區之一第二預測方向的一第三語法元素的構件。
  36. 一種解碼一雙向視訊區塊(B視訊區塊)之方法,該方法包含:在經編碼之視訊資料中接收僅指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及僅指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素分開,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小,及其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵解碼程序,其中對該第一語法元素執行該第一熵解碼程序包含基於第一統計執行一內容脈絡適應性熵解碼程序;對該第二語法元素執行一第二熵解碼程序,其中對該第二語法元素執行該第二熵解碼程序包含基於第二單獨統計執行該內容脈絡適應性熵解碼程序;及 至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
  37. 如請求項36之方法,其中解碼該B視訊區塊包含至少部分地基於該第一語法元素及該第二語法元素產生預測資料。
  38. 如請求項36之方法,其中接收該第一語法元素及該第二語法元素包含:接收指示該第一語法元素之第一複數個位元;及接收指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  39. 如請求項36之方法,其進一步包含:在該經編碼之視訊資料中接收指示用以編碼該B視訊區塊之一第二預測方向的一第三語法元素。
  40. 如請求項36之方法,其中該內容脈絡適應性熵解碼程序包含內容適應性可變長度解碼或內容脈絡適應性二進位算術解碼中之一者。
  41. 一種用於解碼一雙向視訊區塊(B視訊區塊)之視訊解碼器,該視訊解碼器包含:一記憶體,其經組態以儲存經編碼之視訊資料;一處理器,其經組態以:接收該經編碼之視訊資料,該經編碼之視訊資料包含指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素 分開,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小,及其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵解碼程序,其中為了對該第一語法元素執行該第一熵解碼程序,該處理器經組態以基於第一統計執行一內容脈絡適應性熵解碼程序;對該第二語法元素執行一第二熵解碼程序,其中為了對該第二語法元素執行該第二熵解碼程序,該處理器經組態以基於第二單獨統計執行該內容脈絡適應性熵解碼程序;及一運動補償單元,其經組態以基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
  42. 如請求項41之視訊解碼器,其中該處理器經進一步組態以至少部分地基於該第一語法元素及該第二語法元素產生預測資料。
  43. 如請求項41之視訊解碼器,其中該處理器經組態以接收指示該第一語法元素之第一複數個位元且接收指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  44. 如請求項41之視訊解碼器,其中該處理器經進一步組態以接收指示用於該B視訊區塊之一第二分割區之一第二 預測方向的一第三語法元素。
  45. 如請求項41之視訊解碼器,其進一步包含經組態以顯示該B視訊區塊之一顯示器。
  46. 如請求項41之視訊解碼器,其中該內容脈絡適應性熵解碼程序包含內容適應性可變長度解碼或內容脈絡適應性二進位算術解碼中之一者。
  47. 一種儲存指令之非暫時性電腦可讀儲存媒體,該等指令被一或多個處理器執行時使該一或多個處理器執行一雙向視訊區塊(B視訊區塊)之解碼,該解碼包含:接收經編碼之視訊資料;在該經編碼之視訊資料中接收僅指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及僅指示用以編碼該B視訊區塊之一預測方向之一第二語法元素,其中該第一語法元素與該第二語法元素分開,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小,及其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清單,及該第一清單及該第二清單兩者;對該第一語法元素執行一第一熵解碼程序,其中對該第一語法元素執行該第一熵解碼程序包含基於第一統計執行一內容脈絡適應性熵解碼程序;對該第二語法元素執行一第二熵解碼程序,其中對該第二語法元素執行該第二熵解碼程序包含基於第二單獨統計執行該內容脈絡適應性熵解碼程序;及 至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊。
  48. 如請求項47之非暫時性電腦可讀儲存媒體,其中解碼該B視訊區塊包含至少部分地基於該第一語法元素及該第二語法元素產生預測資料。
  49. 如請求項47之非暫時性電腦可讀儲存媒體,其中接收該第一語法元素及該第二語法元素包含:接收指示該第一語法元素之第一複數個位元;及接收指示該第二語法元素之第二複數個位元,該第一複數個位元與該第二複數個位元彼此獨立。
  50. 如請求項47之非暫時性電腦可讀儲存媒體,其中該解碼進一步包含:在該經編碼之視訊資料中接收指示用以編碼該B視訊區塊之一第二預測方向的一第三語法元素。
  51. 一種用於解碼一雙向視訊區塊(B視訊區塊)之器件,該器件包含:用於接收經編碼之視訊資料的構件;用於接收僅指示用以編碼該B視訊區塊之一分割區大小之一第一語法元素及僅指示用以編碼該B視訊區塊之一預測方向之一第二語法元素的構件,其中該第一語法元素與該第二語法元素分開,其中該分割區大小等於N×N、N×N/2、N/2×N或N/2×N/2,其中N係該B視訊區塊之像素之尺寸大小,及其中該預測方向係選自由以下各者組成之預測方向之一群組:一第一清單、一第二清 單,及該第一清單及該第二清單兩者;用於對該第一語法元素執行一第一熵解碼程序的構件,其中該用於對該第一語法元素執行該第一熵解碼程序的構件包含用於基於第一統計執行一內容脈絡適應性熵解碼程序的構件;用於對該第二語法元素執行一第二熵解碼程序的構件,其中該用於對該第二語法元素執行該第二熵解碼程序的構件包含用於基於第二單獨統計執行該內容脈絡適應性熵解碼程序的構件;及用於至少部分地基於該所接收之第一語法元素及該第二語法元素來解碼該B視訊區塊的構件。
  52. 如請求項51之器件,其中該用於解碼該B視訊區塊的構件包含用於至少部分地基於該第一語法元素及該第二語法元素產生預測資料的構件。
  53. 如請求項51之器件,其中該用於接收該第一語法元素及該第二語法元素的構件包含:用於接收指示該第一語法元素之第一複數個位元的構件;及用於接收指示該第二語法元素之第二複數個位元的構件,該第一複數個位元與該第二複數個位元彼此獨立。
  54. 如請求項51之器件,其進一步包含:用於接收指示用以編碼該B視訊區塊之一第二預測方向的一第三語法元素的構件。
TW100105533A 2010-02-19 2011-02-18 在視訊編碼中的區塊類型發信號 TWI493964B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US30626110P 2010-02-19 2010-02-19
US13/029,967 US8995527B2 (en) 2010-02-19 2011-02-17 Block type signalling in video coding

Publications (2)

Publication Number Publication Date
TW201143447A TW201143447A (en) 2011-12-01
TWI493964B true TWI493964B (zh) 2015-07-21

Family

ID=44476475

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100105533A TWI493964B (zh) 2010-02-19 2011-02-18 在視訊編碼中的區塊類型發信號

Country Status (11)

Country Link
US (1) US8995527B2 (zh)
EP (1) EP2537344B1 (zh)
JP (1) JP5642806B2 (zh)
KR (1) KR101384077B1 (zh)
CN (1) CN102783150B (zh)
BR (1) BR112012020733B1 (zh)
DK (1) DK2537344T3 (zh)
ES (1) ES2757703T3 (zh)
HU (1) HUE047076T2 (zh)
TW (1) TWI493964B (zh)
WO (1) WO2011103482A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
US9307262B2 (en) * 2011-01-13 2016-04-05 Texas Instruments Incorporated Methods and systems for facilitating multimedia data encoding utilizing configured buffer information
US10362327B2 (en) 2011-01-14 2019-07-23 Sony Corporation B-picture syntax change for generalized bi-prediction in high efficiency video coding (HEVC)
WO2012140821A1 (ja) 2011-04-12 2012-10-18 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置
US9247266B2 (en) 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
EP3337172B1 (en) 2011-05-24 2020-09-09 Velos Media International Limited Image encoding method, image encoding apparatus
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
KR101539312B1 (ko) 2011-05-27 2015-07-24 미디어텍 인크. 비디오 프로세싱에 대한 라인 버퍼 감소를 위한 방법 및 장치
EP2717575B1 (en) 2011-05-27 2018-10-10 Sun Patent Trust Image decoding method and image decoding device
ES2779226T3 (es) 2011-05-31 2020-08-14 Sun Patent Trust Procedimiento de descodificación de vídeo y dispositivo de descodificación de vídeo
SG194746A1 (en) 2011-05-31 2013-12-30 Kaba Gmbh Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
WO2013001818A1 (ja) 2011-06-30 2013-01-03 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、および、画像符号化復号装置
IN2014CN00729A (zh) 2011-08-03 2015-04-03 Panasonic Corp
DK2744204T3 (en) * 2011-09-14 2019-01-14 Samsung Electronics Co Ltd PROCEDURE FOR DECODING A PREVIEW UNIT (PU) BASED ON ITS SIZE.
CN103797794B (zh) * 2011-09-16 2017-11-03 寰发股份有限公司 用于编码的方法和装置
US9332283B2 (en) * 2011-09-27 2016-05-03 Broadcom Corporation Signaling of prediction size unit in accordance with video coding
CN108881903B (zh) 2011-10-19 2022-01-04 太阳专利托管公司 图像编码方法及装置、图像解码方法及装置、编解码装置
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
US9247258B2 (en) 2011-10-26 2016-01-26 Qualcomm Incorporated Unified design for picture partitioning schemes
MX2014005115A (es) 2011-10-28 2014-08-27 Samsung Electronics Co Ltd Metodo para inter-prediccion y dispositivo para el mismo, y metodo para compensacion de movimiento y dispositivo para el mismo.
US9077998B2 (en) * 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units
JP2013102297A (ja) * 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
TWI523497B (zh) * 2011-11-10 2016-02-21 Sony Corp Image processing apparatus and method
US9386305B2 (en) 2011-11-28 2016-07-05 Qualcomm Incorporated Largest coding unit (LCU) or partition-based syntax for adaptive loop filter and sample adaptive offset in video coding
BR112014016291A8 (pt) * 2012-01-19 2017-07-04 Mitsubishi Electric Corp dispositivos e métodos de decodificação e codificação de vídeo
CA2898154C (en) 2012-01-30 2018-07-31 Samsung Electronics Co., Ltd. Method and apparatus for video encoding for each spatial sub-area, and method and apparatus for video decoding for each spatial sub-area
US20130195169A1 (en) * 2012-02-01 2013-08-01 Vidyo, Inc. Techniques for multiview video coding
JP6012014B2 (ja) * 2012-03-30 2016-10-25 サン パテント トラスト 画像符号化方法および画像復号方法
BR112014025617A2 (pt) * 2012-04-15 2017-09-19 Samsung Electronics Co Ltd método para determinar uma imagem de referência para previsão inter, e aparelho para determinar uma imagem de referência
KR102304687B1 (ko) * 2013-07-22 2021-09-27 소니그룹주식회사 정보 처리 장치 및 방법
WO2015062002A1 (en) * 2013-10-31 2015-05-07 Mediatek Singapore Pte. Ltd. Methods for sub-pu level prediction
US10574986B2 (en) 2014-03-31 2020-02-25 Samsung Electronics Co., Ltd. Interlayer video decoding method for performing sub-block-based prediction and apparatus therefor, and interlayer video encoding method for performing sub-block-based prediction and apparatus therefor
US10085027B2 (en) * 2015-03-06 2018-09-25 Qualcomm Incorporated Adaptive mode checking order for video encoding
CN107787582A (zh) * 2015-06-10 2018-03-09 三星电子株式会社 使用用于自适应加权预测的语法信令对图像进行编码或解码的方法和设备
US10244249B2 (en) 2015-09-21 2019-03-26 Qualcomm Incorporated Fixed point implementation of range adjustment of components in video coding
US10630992B2 (en) 2016-01-08 2020-04-21 Samsung Electronics Co., Ltd. Method, application processor, and mobile terminal for processing reference image
CN114827599A (zh) * 2016-02-03 2022-07-29 Oppo广东移动通信有限公司 运动图像解码装置、编码装置、以及预测图像生成装置
US11095892B2 (en) * 2016-09-20 2021-08-17 Kt Corporation Method and apparatus for processing video signal
CN110832859B (zh) * 2017-07-11 2022-02-25 华为技术有限公司 一种基于模板匹配的解码方法及装置
WO2019167849A1 (en) * 2018-02-28 2019-09-06 Sharp Kabushiki Kaisha Systems and methods for partitioning regions of a picture for video coding using different coding unit sizes
TW202029755A (zh) * 2018-09-26 2020-08-01 美商Vid衡器股份有限公司 視訊編碼雙預測
EP3861740A1 (en) * 2018-10-02 2021-08-11 InterDigital VC Holdings, Inc. Generalized bi-prediction and weighted prediction
WO2020185009A1 (ko) * 2019-03-12 2020-09-17 현대자동차주식회사 잔차블록을 효율적으로 코딩하는 방법 및 장치
CN112004091B (zh) * 2020-07-31 2021-08-03 浙江大华技术股份有限公司 帧间预测方法及其相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050094726A1 (en) * 2003-10-10 2005-05-05 Samsung Electronics Co., Ltd. System for encoding video data and system for decoding video data
US20080084927A1 (en) * 2006-09-18 2008-04-10 Elemental Technologies, Inc. Real-time network adaptive digital video encoding/decoding
US7453938B2 (en) * 2004-02-06 2008-11-18 Apple Inc. Target bitrate estimator, picture activity and buffer management in rate control for video coder
US20090041122A1 (en) * 2004-03-29 2009-02-12 Kabushiki Kaisha Toshiba Image coding apparatus, image coding method and image coding program
US20090245373A1 (en) * 2002-01-25 2009-10-01 Microsoft Corporation Video coding
US20090257492A1 (en) * 2006-07-07 2009-10-15 Kenneth Andersson Video data management

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0413988A (pt) 2003-08-26 2006-11-07 Thomson Licensing método e aparelho para decodificar blocos intra-inter codificador hìbridos
US7894530B2 (en) * 2004-05-07 2011-02-22 Broadcom Corporation Method and system for dynamic selection of transform size in a video decoder based on signal content
JP4889231B2 (ja) 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
KR100728031B1 (ko) 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
EP2036360B1 (en) * 2006-06-30 2019-11-13 Telecom Italia S.p.A. Method, apparatus and system for robust video transmission with auxiliary information channel
FR2906433B1 (fr) * 2006-09-22 2009-02-27 Canon Kk Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre
US8213511B2 (en) * 2007-04-30 2012-07-03 Texas Instruments Incorporated Video encoder software architecture for VLIW cores incorporating inter prediction and intra prediction
US8422803B2 (en) * 2007-06-28 2013-04-16 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US8432968B2 (en) * 2007-10-15 2013-04-30 Qualcomm Incorporated Scalable video coding techniques for scalable bitdepths
KR101579394B1 (ko) * 2007-10-16 2015-12-21 톰슨 라이센싱 기하학적으로 분할된 수퍼 블록들의 비디오 인코딩 및 디코딩 방법 및 장치
US9967590B2 (en) * 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US8811484B2 (en) * 2008-07-07 2014-08-19 Qualcomm Incorporated Video encoding by filter selection
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090245373A1 (en) * 2002-01-25 2009-10-01 Microsoft Corporation Video coding
US20050094726A1 (en) * 2003-10-10 2005-05-05 Samsung Electronics Co., Ltd. System for encoding video data and system for decoding video data
US7453938B2 (en) * 2004-02-06 2008-11-18 Apple Inc. Target bitrate estimator, picture activity and buffer management in rate control for video coder
US20090041122A1 (en) * 2004-03-29 2009-02-12 Kabushiki Kaisha Toshiba Image coding apparatus, image coding method and image coding program
US20090257492A1 (en) * 2006-07-07 2009-10-15 Kenneth Andersson Video data management
US20080084927A1 (en) * 2006-09-18 2008-04-10 Elemental Technologies, Inc. Real-time network adaptive digital video encoding/decoding

Also Published As

Publication number Publication date
WO2011103482A1 (en) 2011-08-25
EP2537344A1 (en) 2012-12-26
JP5642806B2 (ja) 2014-12-17
EP2537344B1 (en) 2019-08-21
BR112012020733B1 (pt) 2021-12-21
HUE047076T2 (hu) 2020-04-28
ES2757703T3 (es) 2020-04-29
BR112012020733A2 (pt) 2016-04-26
JP2013520882A (ja) 2013-06-06
CN102783150B (zh) 2015-11-25
KR20120118507A (ko) 2012-10-26
CN102783150A (zh) 2012-11-14
TW201143447A (en) 2011-12-01
US20110206123A1 (en) 2011-08-25
US8995527B2 (en) 2015-03-31
DK2537344T3 (da) 2019-11-11
KR101384077B1 (ko) 2014-04-10

Similar Documents

Publication Publication Date Title
TWI493964B (zh) 在視訊編碼中的區塊類型發信號
KR101355332B1 (ko) 비디오 코딩에서 단방향성 예측 및 양방향성 예측을 위한 상이한 가중치들
ES2663691T3 (es) Selección eficiente de modo de predicción
KR101377883B1 (ko) 비디오 인코딩에서 넌-제로 라운딩 및 예측 모드 선택 기법들
TWI413419B (zh) 視訊編碼中之非零修整與預測模式選擇技術
EP2449786B1 (en) Template matching for video coding
US8665964B2 (en) Video coding based on first order prediction and pre-defined second order prediction mode
JP2013520875A (ja) ビデオコーディングのための適応動き解像度
TW201141239A (en) Temporal and spatial video block reordering in a decoder to improve cache hits
US20150103909A1 (en) Multi-threaded video encoder