TWI493945B - 使用分割區選擇之重要地圖編碼及解碼 - Google Patents

使用分割區選擇之重要地圖編碼及解碼 Download PDF

Info

Publication number
TWI493945B
TWI493945B TW101139364A TW101139364A TWI493945B TW I493945 B TWI493945 B TW I493945B TW 101139364 A TW101139364 A TW 101139364A TW 101139364 A TW101139364 A TW 101139364A TW I493945 B TWI493945 B TW I493945B
Authority
TW
Taiwan
Prior art keywords
context
bit
transform unit
important map
block
Prior art date
Application number
TW101139364A
Other languages
English (en)
Other versions
TW201325241A (zh
Inventor
Gergely Ferenc Korodi
Jinwen Zan
Dake He
Original Assignee
Blackberry Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blackberry Ltd filed Critical Blackberry Ltd
Publication of TW201325241A publication Critical patent/TW201325241A/zh
Application granted granted Critical
Publication of TWI493945B publication Critical patent/TWI493945B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

使用分割區選擇之重要地圖編碼及解碼
本申請案一般而言係關於資料壓縮,且特定而言係關於用於使用分割區選擇編碼及解碼用於視訊之重要地圖之方法及裝置。
本文件之揭示內容及隨附材料之一部分含有對其主張版權所有之材料。如同專利與商標局檔案或記錄中所顯現,版權所有者不反對任何人對本專利文件或本專利揭示內容進行拓製,但另外保留所有其他版權。
資料壓縮發生於若干個上下文中。其極常用於通信及電腦網路連線中以高效地儲存、傳輸及重現資訊。其在影像、音訊及視訊之編碼中具有特定應用。視訊由於每一視訊圖框所需之大量資料以及編碼及解碼通常需要發生之速度而對資料壓縮提出一重要挑戰。用於視訊編碼之當前最佳技術係ITU-T H.264/AVC視訊編碼標準。其針對不同應用定義若干個不同設定檔,包含主要設定檔、基線設定檔及其他。當前正透過MPEG-ITU之一聯合倡議開發一下一代視訊編碼標準:高效視訊編碼(HEVC)。
存在用於編碼/解碼影像及視訊之若干個標準,包含使用基於區塊之編碼程序之H.264。在此等程序中,將影像或圖框劃分成若干區塊(通常4×4或8×8),且將該等區塊光譜地變換成經量化且經熵編碼之係數。在諸多情形中,經變換之資料並非實際像素資料,而是在一預測操作之後的 殘餘資料。預測可係圖框內的(亦即,在圖框/影像內之區塊至區塊)或圖框間的(亦即,在圖框之間)(亦稱為運動預測)。預期HEVC(亦稱為H.265)亦將具有此等特徵。
當光譜地變換殘餘資料時,此等標準中之諸多標準規定使用一離散餘弦變換(DCT)或對其之某一變化形式。然後使用一量化器量化所得DCT係數以產生經量化變換域係數或索引。
然後使用一特定上下文模型將經量化變換域係數之區塊或矩陣(有時稱作一「變換單元」)熵編碼。在H.264/AVC及HEVC之當前開發工作中,藉由以下操作編碼經量化變換係數:(a)編碼指示區塊中之最後非零係數之位置之一最後有效係數位置;(b)編碼指示含有非零係數的區塊中之位置(除最後有效係數位置之外)之一重要地圖;(c)編碼非零係數之量值;及(d)編碼非零係數之正負號。經量化變換係數之此編碼通常佔據位元串流中之經編碼資料之30%至80%。
重要地圖中之符號之熵編碼基於一上下文模型。在一4×4亮度或色度區塊或變換單元(TU)之情形中,一單獨上下文與TU中之每一係數位置相關聯。亦即,編碼器及解碼器針對4×4亮度及色度TU追蹤總共30個(不包含右底部角位置)單獨上下文。將8×8 TU分割(在概念上出於上下文相關聯之目的)成2×2區塊以使得一個不同上下文與8×8 TU中之每一2×2區塊相關聯。因此,編碼器及解碼器針對8×8亮度及色度TU追蹤總共16+16=32個上下文。此意指在重要 地圖之編碼及解碼期間編碼器及解碼器追蹤且查找62個不同上下文。當計及16×16 TU及32×32 TU時,所涉及之不同上下文之總數目係88個。亦意欲以高計算速度實施此操作。
本申請案闡述用於藉助上下文自適應編碼或解碼來編碼及解碼重要地圖之方法及編碼器/解碼器。編碼器及解碼器以將地圖分割成若干部分之一非空間均勻分割為特徵,其中每一部分內之位元位置與一給定上下文相關聯。下文闡述實例性分割區集合及用於自預定分割區集合當中進行選擇且將該選擇傳遞至解碼器之程序。
在一項態樣中,本申請案闡述一種解碼經編碼資料之一位元串流以重新建構一變換單元之一重要地圖之方法。該方法包含:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文;基於該經判定上下文解碼該經編碼資料以重新建構一位元值;及基於彼經重新建構位元值更新該上下文,其中該等經重新建構位元值形成該經解碼重要地圖。
在另一態樣中,本申請案闡述一種對一變換單元之一重要地圖之編碼。該方法包含:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文;基於該經判定上下文編碼彼位元位置處之一位元值以產生經編碼資料;及基於彼位元值更新該上下文,其中該經編碼資料形成一經編碼重要地圖。
在某些實例性實施例中,變換單元係4×4。在某些實例性實施例中,變換單元係8×8。在一項實施例中,分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,3,4,5,2,3,6,6,7,7,8,8,7,以上整數表示指派至一4×4區塊重要地圖之位元位置之上下文。
在另一實例中,分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,2,3,3,4,4,1,1,2,2,3,3,4,4, 5,5,6,6,7,7,4,4, 5,5,6,6,7,7,4,4, 8,8,9,9,6,7,10,10, 8,8,9,9,9,10,10,10, 11,11,11,11,10,10,10,10,11,11,11,11,10,10,10
本文中闡述其他實例性分割區集合。
在又一態樣中,本申請案闡述經組態以實施此等編碼及解碼方法之編碼器及解碼器。
在再一態樣中,本申請案闡述儲存電腦可執行程式指令之非暫時性電腦可讀媒體,該等電腦可執行程式指令在執行時組態一處理器以執行所闡述之編碼及/或解碼方法。
依據連同附圖一起對實例之以下說明之一審閱,熟習此項技術者將理解本申請案之其他態樣及特徵。
現在將以實例方式參考展示本申請案之實例性實施例之隨附圖式。
在不同圖中可能已使用類似元件符號來表示類似組件。
在以下說明中,參考用於視訊編碼之H.264標準及/或在開發中之HEVC標準闡述某些實例性實施例。熟習此項技術者將理解,本申請案並不限於H.264/AVC或HEVC,而是可適用於其他視訊編碼/解碼標準,包含可能的未來標準、多視角編碼標準、可擴縮視訊編碼標準及可重新組態視訊編碼標準。
在以下說明中,當提及視訊或影像時,可在某種程度上可互換地使用術語圖框、圖像、圖塊(slice)、影像塊(tile)及矩形圖塊群組。熟習此項技術者將瞭解,在H.264標準之情形中,一圖框可含有一或多個圖塊。亦將瞭解,某些編碼/解碼操作在一逐圖框基礎上執行,某些在一逐圖塊基礎上執行,某些在逐圖像基礎上執行,某些在逐影像塊基礎上執行且某些在逐矩形圖塊群組基礎上執行,此取決於適用影像或視訊編碼標準之特定要求或術語。視情形而定,在任何特定實施例中,適用影像或視訊編碼標準可判定連同以下各項中之哪一者來執行下文所闡述之操作:圖框及/或圖塊及/或圖像及/或影像塊及/或矩形圖塊群組。因此,根據本發明,熟習此項技術者將理解,本文中所闡述之特定操作或程序及對圖框、圖塊、圖像、影像塊、矩形圖塊群組之特定參考是否適用於一給定實施例之圖框、圖塊、圖像、影像塊、矩形圖塊群組或者彼等中之某些或 所有。如根據下文之說明將顯而易見,此亦適用於變換單元、編碼單元、編碼單元群組等。
現在參考圖1,其以方塊圖形式展示用於編碼視訊之一編碼器10。亦參考圖2,其展示用於解碼視訊之一解碼器50之一方塊圖。應瞭解,本文中所闡述之編碼器10及解碼器50可各自實施於含有一或多個處理元件及記憶體之一特殊應用或一般用途計算裝置上。視情形而定,可(舉例而言)藉助於特殊應用積體電路或藉助於可由一一般用途處理器執行之所儲存程式指令來實施由編碼器10或解碼器50執行之操作。該裝置可包含額外軟體,包含(舉例而言)用於控制基本裝置功能之一作業系統。慮及以下說明之熟習此項技術者將瞭解在其內可實施編碼器10或解碼器50之裝置及平臺之範圍。
編碼器10接收一視訊源12且產生一經編碼位元串流14。解碼器50接收經編碼位元串流14且輸出一經解碼視訊圖框16。編碼器10及解碼器50可經組態以符合若干個視訊壓縮標準而操作。舉例而言,編碼器10及解碼器50可符合H.264/AVC。在其他實施例中,編碼器10及解碼器50可符合其他視訊壓縮標準,包含H.264/AVC標準之演進(如HEVC)。
編碼器10包含一空間預測器21、一編碼模式選擇器20、變換處理器22、量化器24及熵編碼器26。如熟習此項技術者將瞭解,編碼模式選擇器20判定視訊源之適當編碼模式,舉例而言,判定對象圖框/圖塊是I型、P型還是B型及 圖框/圖塊內之特定編碼單元(例如,巨集區塊)是圖框間編碼還是圖框內編碼的。變換處理器22對空間域資料執行一變換。特定而言,變換處理器22應用一基於區塊之變換以將空間域資料轉換成光譜分量。舉例而言,在諸多實施例中使用一離散餘弦變換(DCT)。在某些例項中可使用諸如一離散正弦變換或其他之其他變換。取決於巨集區塊之大小,在一巨集區塊或子區塊基礎上執行基於區塊之變換。舉例而言,在H.264標準中,一典型16×16巨集區塊含有十六個4×4變換區塊且對4×4區塊執行DCT程序。在某些情形中,變換區塊可係8×8,此意指每巨集區塊存在四個變換區塊。在再一些情形中,變換區塊可係其他大小。在某些情形中,一16×16巨集區塊可包含4×4變換區塊與8×8變換區塊之一非重疊組合。
將基於區塊之變換應用至一像素資料區塊產生一變換域係數集合。在此上下文中,一「集合」係其中係數具有係數位置之一有序集合。在某些例項中,可將變換域係數集合視為一係數「區塊」或矩陣。在本文中之說明中,片語一「變換域係數集合」或一「變換域係數區塊」可互換地使用且意欲指示一有序變換域係數集合。
由量化器24量化變換域係數集合。然後由熵編碼器26編碼經量化係數及相關聯資訊。
經圖框內編碼圖框/圖塊(亦即,類型I)係在不參考其他圖框/圖塊之情況下編碼。換言之,其不採用時間預測。然而,經圖框內編碼圖框確實依賴於圖框/圖塊內之空間 預測,如圖1中藉由空間預測器21所圖解說明。亦即,當編碼一特定區塊時,可比較該區塊中之資料與已針對彼圖框/圖塊編碼之區塊內之附近像素之資料。使用一預測演算法,可將區塊之源資料轉換成殘餘資料。變換處理器22然後編碼殘餘資料。舉例而言,H.264針對4×4變換區塊規定九個空間預測模式。在某些實施例中,可使用九個模式中之每一者來獨立地處理一區塊,且然後使用壓縮率失真最佳化來選擇最佳模式。
H.264標準亦規定使用運動預測/補償來利用時間預測。因此,編碼器10具有一回饋環路,該回饋環路包含一解量化器28、逆變換處理器30及去區塊處理器32。去區塊處理器32可包含一去區塊處理器及一濾波處理器。此等元件反映由解碼器50實施之解碼程序以重現圖框/圖塊。一圖框儲存器34用以儲存經重現圖框。以此方式,運動預測基於將成為解碼器50處之經重新建構圖框之圖框而非基於原始圖框,原始圖框可由於編碼/解碼中所涉及之有損壓縮而不同於經重新建構圖框。出於識別類似區塊之目的,一運動預測器36使用儲存於圖框儲存器34中之圖框/圖塊作為源圖框/圖塊以供與一當前圖框比較。因此,針對對其應用運動預測之巨集區塊,變換處理器22編碼之「源資料」係由運動預測程序產生之殘餘資料。舉例而言,其可包含關於參考圖框、一空間位移或「運動向量」及表示參考區塊與當前區塊之間的差異(若存在)之殘餘像素資料之資訊。關於參考圖框及/或運動向量之資訊可不由變換處理 器22及/或量化器24處理,而是替代地可與經量化係數一起作為位元串流之部分供應至熵編碼器26以供進行編碼。
熟習此項技術者將瞭解用於實施H.264編碼器之細節及可能的變化。
解碼器50包含一熵解碼器52、解量化器54、逆變換處理器56、空間補償器57及去區塊處理器60。去區塊處理器60可包含去區塊處理器及濾波處理器。一圖框緩衝器58供應經重新建構圖框以供由一運動補償器62用於應用運動補償。空間補償器57表示自一先前經解碼區塊恢復一特定經圖框內編碼區塊之視訊資料之操作。
由熵解碼器52接收且解碼位元串流14以恢復經量化係數。在熵解碼程序期間亦可恢復側資訊,若適用,則可將某些側資訊供應至運動補償環路以供在運動補償中使用。舉例而言,熵解碼器52可恢復經圖框間編碼巨集區塊之運動向量及/或參考圖框資訊。
然後由解量化器54解量化經量化係數以產生變換域係數,該等變換域係數然後經受藉由逆變換處理器56之一逆變換以重新形成「視訊資料」。應瞭解,在某些情形中(諸如在一經圖框內編碼巨集區塊之情況下),經重新形成「視訊資料」係供在相對於圖框內之一先前經解碼區塊之空間補償中使用之殘餘資料。空間補償器57自殘餘資料產生視訊資料且自一先前經解碼區塊產生像素資料。在其他情形中(諸如經圖框間編碼巨集區塊),來自逆變換處理器56之經重新形成「視訊資料」係供在相對於來自一不同圖 框之一參考區塊之運動補償中使用之殘餘資料。空間補償及運動補償兩者在本文中皆可稱作「預測操作」。
運動補償器62將一參考區塊定位於指定用於一特定經圖框間編碼巨集區塊之圖框緩衝器58內。其基於指定用於經圖框間編碼巨集區塊之參考圖框資訊及運動向量而如此進行。其然後供應參考區塊像素資料以供與殘餘資料組合以達成用於彼巨集區塊之經重新建構視訊資料。
然後可將一去區塊/濾波程序應用至一經重新建構圖框/圖塊,如藉由去區塊處理器60所指示。在去區塊/濾波之後,將圖框/圖塊作為經解碼視訊圖框16輸出,(舉例而言)以供在一顯示裝置上顯示。應理解,諸如一電腦、機上盒、DVD或藍光播放器及/或行動手持式裝置之視訊回放機器可在於一輸出裝置上顯示之前緩衝一記憶體中之經解碼圖框。
預期,符合HEVC之編碼器及解碼器將具有此等相同或類似特徵中之諸多特徵。
重要地圖編碼
如上文所提及,一經量化變換域係數區塊或集合之熵編碼包含針對彼經量化變換域係數區塊或集合編碼重要地圖。重要地圖係指示非零係數顯現於哪些位置(除最後位置之外)中之一個二進制區塊映射。區塊可具有其與之相關聯之某些特性。舉例而言,其可來自一經圖框內編碼圖塊或一經圖框間編碼圖塊。其可係一亮度區塊或一色度區塊。圖塊之QP值可在圖塊之間有所變化。所有此等因素可 對熵編碼重要地圖之最佳方式具有一影響。
根據掃描次序(其可係垂直、水平、對角線、鋸齒狀或由適用編碼標準規定之任何其他掃描次序)將重要地圖轉換成一向量。然後使用適用上下文自適應編碼方案熵編碼每一有效位元。舉例而言,在諸多應用中可使用一上下文自適應二進制算術編碼(CABAC)方案。其他實施方案可使用藉助二進制化之其他上下文自適應編解碼器。實例包含二進制算術編碼(BAC)、可變至可變(V2V)長度編碼及可變至固定(V2F)長度編碼。針對每一位元位置,指派一上下文。當編碼彼位元位置中之位元時,經指派上下文及至彼點之上下文之歷史判定一最不可能符號(LPS)(或在某些實施方案中一最大可能符號(MPS))之估計之機率。
在現有視訊編碼器中,針對編碼器及解碼器兩者預定上下文指派。舉例而言,在一4×4亮度區塊之情況下,當前HEVC標準草案規定4×4重要地圖中之每一位元位置具有一唯一上下文。排除最後位置在外,彼意指追蹤15個上下文以用於4×4亮度重要地圖之編碼。針對每一位元位置,指派至彼位置之上下文判定與彼位置中之一LPS相關聯之估計之機率。然後使用彼估計之機率編碼實際位元值。最後,基於實際位元值更新指派至彼位置之上下文。在解碼器處,使用相同上下文模型解碼經編碼資料。追蹤每一位元位置之一上下文且使用該上下文來判定解碼資料以恢復彼位置之位元之估計之機率。
可將上下文指派視為分割資料區塊及將一不同上下文映 射至每一部分。在數學上,可使用P:{0,...,n-1}×{0,...,n-1}→{0,...,m-1}作為一分割區集合來定義映射。將位元位置索引為{0,...,n-1}×{0,...,n-1}。數字0、...、m-1識別不同分割區。每一分割區具有與其相關聯之一個經指定上下文。可針對彼分割區排他性地使用此上下文(在某些情形中,一上下文可用於亮度型區塊及色度型區塊兩者)。
針對任何兩個分割區集合P及Q,若存在一映射T以使得對於所有i及j,T(P(i,j))=Q(i,j),則稱Q係P之一子集或P係Q之一細化。
編碼工作如下:將一分割區集合P指派給大小為n×n之TU。可將重要地圖視為一矩陣M(i,j)。以水平掃描次序讀取之矩陣M可表示為M(0,0)、M(0,1)、...、M(0,n-1)、M(1,0)、M(1,1)、...、M(1,n-1)、...、M(n-1,n-1)。掃描次序定義自矩陣表示至一向量表示之一個一對一映射。以向量形式,掃描次序對應於數字0、1、...、n2 -2之一排列。在實際實施方案中,索引可基於單個值向量索引或矩陣型雙索引(更便利之任一者)。M(i,j)係編碼於對應於P(i,j)之BAC上下文中,且使用M(i,j)更新彼上下文。以一直截了當方式自解碼程序推導解碼。
此框架可用以闡述當前針對HEVC提出之重要地圖編碼方案。4×4及8×8 TU中之每一者分別與稱為P4及P8之一單獨分割區集合相關聯。此等分割區集合係給出為: P4(i,j)=4*i+j i,j=0,1,2,3 [總共15個上下文]P8(i,j)=4*[i/2]+[j/2] i,j=0,1,2,3,4,5,6,7 [總共16個上下文]
相同映射用於亮度及色度,但用於亮度及色度之上下文係單獨的。因此,此等TU之所使用上下文之總數目係15+15+16+16=62。
應注意,重要地圖之分割係均勻分佈的。亦即,指派至右下部象限之位元位置之上下文與指派至左上部象限之上下文恰好同樣多。對於諸多實施例而言,上下文之一均勻分佈可能並非最佳的。與右底部象限中之上下文相比,更頻繁地使用與左上部象限相關聯之上下文(此乃因重要地圖通常在到達此等右底部位元位置之前結束)。因此,存在較少可用於此等上下文之資料,從而使得此等上下文較不迅速地適應,且更一般而言,不太有效。
如下文將闡述,經改良分割及映射將在準確度(此趨向於每上下文較少位元位置)與自適應性(此趨向於每上下文較多位元位置以便提供較多資料且依據一最佳機率估計較迅速地會聚)之目標之間達成一較佳平衡。一良好分割區集合將在壓縮效率與分割區之數目m之間達成平衡。當在此兩個約束下最佳化分割區集合時,在理論上應針對一給定TU大小評估P之所有可能例項。
為理解此任務之複雜性,可針對任何給定TU大小n×n及分割區計數m計算基本上唯一之分割區集合之數目。應注意,分割區之矩陣配置係任意的,且使用(舉例而言)一水平掃描次序可利用呈向量形式之一等效表示。由Pv :{0,..., N-1}→{0,...,m-1}表示所得映射,其中N=n2 -1(亦即,不包含右底部位元位置)。令C(N,m)為此等滿射映射之數目,此意指Pv 之範圍係{0,...,m-1},從而省略係已經計數映射之簡單排列(亦即,可經重新標記以產生另一已經計數映射之分割區)之彼等映射。注意,對於任何N1,C(N,1)=1且C(N,N)=1。對於m>1,所有Pv 映射可分成兩個類別。在第一類別中,令Pv (0){Pv (1),...,Pv (N-1)};由於值1、...、N-1係現在映射至{1,...,Pv (0)-1,Pv (0)+1,...,m-1}上,因此此等映射之數目係C(N-1,m-1)。在第二類別中,Pv (0){Pv (1),...,Pv (N-1)};值1、...、N-1係映射至0、...、m-1上(此可以C(N-1,m)方式完成)且Pv (0)可插入於m個分割區中之任一者中,從而得到m×C(N-1,m)個可能性。因此,得到遞迴C(N,m)=C(N-1,m-1)+m×C(N-1,m)。注意,藉此C(N,m)數與第二種類之斯特林數(Stirling number)吻合。
使用此公式,可計算4×4 TU之分割區集合之總數目(亦即,15個係數或位元位置)係1382958545;具有恰好5個部分之分割區集合之數目係210766920;且具有恰好10個部分之彼等分割區集合之數目係12662650。8×8 TU(63個係數)之對應數目較佳地以指數形式表達:不同分割區集合之總數目係8.2507717×1063 ;具有不超過16個部分之集合之數目係3.5599620×1062 ;具有恰好5個部分之集合之數目係9.0349827×1041 ;且具有恰好10個部分之彼等集合之數目係2.7197285×1056 。由於此等分割區集合中之任一者形 成用於視訊壓縮之合理分割區集合,因此自如此多候選者中選擇最佳者係一重要且困難任務。
實例性分割區集合
透過經驗測試及分析,以下實例性分割區集合及上下文映射似乎產生計算速度與壓縮效率之一有利平衡。
現在參考圖3,其圖解性地圖解說明將一4×4區塊分割成個別地標記為P1 、P2 、...、P6 之六個部分之一分割。舉例而言,此可用於4×4區塊之情形中之重要地圖。在區塊100中展示與每一位元位置相關聯之上下文(C0 ,C1 ,...,C5 )。相同部分內之位元位置全部共用相同上下文。應注意,部分P4 包含兩個非連續區域。將部分P4 中之四個位元位置各自地指派至上下文C3 。圖3中所展示之分割可表示為P4-6以指示該分割係關於一4×4區塊且以6個部分為特徵。
圖4圖解性地展示P4-6之一細化,其中進一步分割將部分P2 劃分成三個個別部分;彼等個別部分標記為P2 、P5 及P6 。亦應注意,已將部分P4 劃分成兩半以使得兩個非連續區域現在係在此實例性圖解說明中標記為P4 及P9 之單獨部分。此分割結構可表示為P4-9以表示其將9個上下文指派至4×4區塊之9個不同部分。
圖5圖解說明將一8×8區塊分割成標記為P1 至P4 之4個單獨部分之一分割。如所展示,將上下文C0 至C3 中之一各別者指派至該等部分中之每一者。此分割可表示為P8-4。
圖6將P8-4之一細化圖解說明為P8-12。在此情形中,進一步細分P8-4之分割以使得將該四個部分細分成總共12個 部分,如圖式中所圖解說明。因此,在此分割中存在12個上下文C0 、...、C11
在所有前述實例中,應注意,分割及因此上下文之分配/指派並非遍及區塊均勻地分佈。亦即,分割中之較小部分趨向於朝向左上部象限叢集且分割中之較大部分趨向於朝向區塊之底部及右側定位。因此,指派至左上部象限之上下文趨向於具有與其相關聯之較少位元位置(一般而言,但並非總如此),且指派至底部或右側之上下文趨向於具有與其相關聯之較多位元位置。隨時間,此將趨向於產生上下文之一較均勻使用。亦即,此非均勻空間分配趨向於位元至每一上下文之一更均勻分配。
亦應注意,P4-6分割係P4-9分割之一子集,且P8-4分割係P8-12分割之一子集。如下文將解釋,此特性與某些分割區集合選擇程序相關。
在一項應用中,可藉由一表查找獲得4×4及8×8分割區集合之上下文索引推導。在另一應用中,可藉由邏輯運算判定上下文索引。舉例而言,針對P4-6集合,上下文索引推導可獲得為:(x&2)?((y&2)?5:x):((y&2)?(y&1?3:4): (x|y)); 應瞭解,上文所闡述之四個實例性分割區集合係實例。在下文所闡述之選擇程序中可使用其他(或額外)分割區集合。
分割區集合選擇-靜態指派
本申請案詳細闡述四個實例性選擇程序。第一個實例性選擇程序係靜態指派。在此實例性程序中,編碼器及解碼器經預組態以針對具有特定特性之重要地圖使用一特定分割區集合。舉例而言,指派可基於TU大小、文字類型(亮度或色度)及/或基於QP值。此指派可由編碼器指定於在視訊資料之前的一標頭中,或可預組態於編碼器及解碼器兩者中。
在某些實施方案中,指派可(部分地)基於色度二次取樣。針對4:2:0及4:1:1二次取樣,色度分量含有與亮度分量相比相當少之資訊,此表明與亮度相比,針對色度使用較多粗略分割區集合。舉例而言,P4-9可用於4×4亮度,P4-6用於4×4色度,P8-12用於8×8亮度且P8-4用於8×8色度。此將產生31個上下文。
針對4:4:4二次取樣情形,色度值具有相對提高之重要性,此促使針對色度使用一較細化之分割區集合。因此,在一項實例中,P4-9可用於4×4亮度及色度兩者,且P8-12可用於8×8亮度及色度。此將產生42個上下文。
然而,注意,在某些實施方案中可在文字類型之間共用上下文。舉例而言,4×4亮度及4×4色度兩者皆可使用一P4-9分割區集合,但彼集合中之上下文用於亮度及色度兩者。在另一實施例中,4×4亮度及4×4色度兩者皆可使用一P4-9分割區集合,但兩者可使用單獨上下文。
現在參考圖7,其以流程圖形式展示一種用於解碼經編碼資料之一位元串流以重新建構一重要地圖之實例性方法 100。方法100以在操作102中判定重要地圖之大小開始。此判定基於在位元串流中指定之最後有效係數。在某些實施例中,可針對在最後有效係數之前的所有位元位置(以掃描次序)及最後有效係數之位元位置處之一者使用一串零來以二進制形式將最後有效係數發訊號。另一選擇係,可使用指示位元位置之一對索引(x,y)來將其發訊號。在另一實施例中,可使用以掃描次序指示位元位置之一單個索引來將其發訊號。亦可使用將最後有效係數發訊號之其他機制。在任何情況中,最後有效係數將重要地圖之大小通知給解碼器。
針對重要地圖中之每一位元位置以編碼器本應已編碼每一位元位置之相同次序執行操作104、106及108。在某些實施例中,此可能意指以掃描次序。在某些實施例中,此可能意指以反向掃描次序。假設編碼器與解碼器使用相同次序,則其可係任何任意次序。
在操作104中,依據一所儲存分割區集合判定當前位元位置之上下文。在此實例性方法之情形中,可使用一分割區集合之靜態指派。因此,文字類型及變換單元大小判定指定用於彼位元位置之經指派上下文之所儲存分割區集合。作為一實例,所儲存分割區集合可係本文中所闡述之P4-6、P4-9、P8-4及P8-12分割區集合。
在操作106中,基於經判定上下文解碼經編碼資料以重新建構彼位元位置之一位元值。舉例而言,該上下文可提供一LPS之一估計之機率,自該估計之機率CABAC引擎依 據經編碼資料產生一位元值。在操作108中,然後基於該位元值更新該經判定上下文。
在操作110中,解碼器評價在重要地圖中是否仍存在其他位元位置,且若如此,則針對下一位元位置重複操作104、106及108。
分割區集合選擇-序列特定指派
第二實例性選擇程序係序列特定指派。在此實例性程序中,編碼器基於(舉例而言)TU大小、文字類型、QP值或其他特性判定針對TU之特定類別使用哪一分割區集合。此判定適用於整個視訊序列。將選定分割區集合指定於序列標頭中。因此,解碼器讀取序列標頭且此後知曉針對解碼特定情境中之重要地圖使用哪些分割區集合。若與一個以上文字類型(例如,針對4×4亮度及4×4色度兩者)一起使用相同分割區集合,則編碼器亦可指定是否共用上下文或兩個文字類型是否使用單獨上下文。
在一項實例性語法中,編碼器可針對將使用之每一分割區集合列示一識別符,其中若相同分割區集合之分割區結構適用於一種以上情況中且若意欲區別用於該一種以上情況之上下文,則可將相同分割區集合列示一次以上。編碼器然後以一預定次序將經列示分割區集合中之一者指派至重要地圖之每一「類別」(例如,4×4亮度、4×4色度、8×8亮度、8×8色度等)。在某些實施例中,QP值亦可係判定重要地圖之「類別」之一因素。
為圖解說明此實例性語法,考量四個分割區集合,諸如 上文所給出之P4-6、P4-9、P8-4及P8-12實例。可使用分別對應於P4-6、P4-9、P8-4及P8-12之四個位元(諸如00、01、10、11)索引四個集合。
若編碼器判定P4-9應用於具有單獨上下文之4×4亮度及4×4色度兩者,且P8-12應用於具有共用上下文之8×8亮度及8×8色度兩者,則編碼器產生包含二進制指示符之一序列標頭:01011100011010。
在自序列標頭讀取此指示符後,解碼器旋即將認識到將使用集合P4-9(01)、P4-9(01)及P8-12(11)。解碼器亦將認識到,由於已以此方式列示集合,因此現在將把第一P4-9集合稱作「00」,把第二P4-9集合稱作「01」且把P8-12集合稱作「10」。
解碼器然後讀取「00011010」,其中每兩個位元部分指定將用於4×4亮度、4×4色度、8×8亮度及8×8色度中之每一者之分割區集合。位元按分割區集合在先前剛讀取之清單中之次序為分割區集合編索引。因此,解碼器讀取00且知曉此指代第一P4-9集合。其然後讀取指代第二P4-9集合之01。最後四個位元「10」及「10」告知解碼器相同P8-12集合將用於具有共用上下文之8×8亮度及8×8色度兩者。
應理解,其他語法可用以將序列標頭中之分割區集合選擇發訊號,且前述內容僅係一項實例性實施方案。
編碼器可使用一表、一常數函數或其他機制來選擇分割區集合。函數及/或表可計及TU大小、文字類型(亮度或色度)、QP值、圖塊/序列中之像素之數目或其他因素。
分割區集合選擇-圖塊特定指派
第三實例性選擇程序係圖塊特定指派。
已注意到,自適應性與準確度之間的平衡在經編碼圖塊大小係相對小時偏向於粗略分割區且在經編碼圖塊大小係相對大時偏向於精細分割區。因此,將編碼之位元之數目(或更特定而言,自編碼程序產生之經編碼位元之數目)可係判定最適合分割區集合之一重要因素。
現在參考圖8,其展示針對各種經編碼圖塊大小之粗略分割對精細分割之相對功效之一實例性圖形200。沿著水平軸線之每一經編碼圖塊大小展示兩行,一個針對一粗略分割區集合202且一個針對一精細分割區集合204。行高度基於針對一測試圖塊給定分割區集合產生比替代集合更佳之壓縮效率之次數除以測試圖塊之總數目。應注意,針對小的大小之圖塊粗略分割區集合202勝過精細分割區集合204,且針對較大大小之圖塊精細分割區集合204勝過粗略分割區集合202。
因此,可設定一或多個臨限值以用於自一較粗略分割區集合切換至下一較精細分割區集合。在上文所闡述之實例性集合之情況下,針對每一TU大小存在僅兩個分割區集合(一個粗略,一個精細),因此可將臨限值設定在(舉例而言)64 k或約64 k。在其中針對一給定TU大小預定義較多分割區集合之情形中,可建立額外或其他臨限值。
在圖塊特定指派程序中,編碼器針對每一圖塊之TU選擇一分割區集合。可在圖塊標頭中將該選擇傳遞至解碼 器。諸如上文所概述之彼語法之一語法可用以傳遞TU之特定類別之選定分割區集合。以此方式,編碼器可使分割區集合之選擇適合一特定圖塊之特性。然而,為此,編碼器將需要使用一預設分割區選擇來編碼圖塊、分析圖塊特性(如經編碼圖塊大小)且然後藉助一新分割區選擇(若其與該預設不同)重新編碼。在某些實施方案中,對編碼器之此額外計算負擔可係可接受的,諸如其中編碼發生一次(亦即,在編碼一視訊以用於儲存於諸如DVD/藍光之分佈媒體上時)且非即時回放稍後可能發生多次。在其他實施方案中(如視訊會議或手持式視訊記錄),對編碼器之兩次編碼負擔可係不可接受的。
一個選項係將分割區集合選擇基於具有相同QP值及圖塊類型(圖框內或圖框間)之先前經編碼圖塊之統計資料。若針對視訊存在此一先前圖塊,則編碼器可基於先前類似圖塊之統計資料(例如,經編碼大小)將分割區集合指派至TU。若不存在一先前圖塊,則編碼器可使用預設分割區集合選擇。
分割區集合選擇-動態指派
第四實例性選擇程序針對每一TU使用一分割區集合序列,其中該序列中之每一連續分割區集合係其前導集合之一更精細版本。每一TU以其清單上之第一分割區集合開始,然後在每一LCU邊界處,其檢查經編碼大小目前是否已超過一特定限制。當彼情況發生時,將來自彼清單之下一分割區集合指派至TU。關於何時切換之決定基於當前 圖塊,因此其可由解碼器以與曾由編碼器完成之相同方式判定,且不需要在視訊序列中指定進一步資訊。
在此實例性程序中,自一個分割區集合Q切換至另一集合P利用Q係P之一子集之事實。將與每一部分P(i,j)相關聯之BAC上下文自Q初始化至T(P(i,j));且子集性質確證此初始化係經明確定義的。若針對兩個位元位置(i1 ,j1 )及(i2 ,j2 ),P(i1 ,j1 )≠P(i2 ,j2 )但T(P(i1 ,j1 )=T(P(i2 ,j2 )),則將(i1 ,j1 )及(i2 ,j2 )之部分初始化至相同BAC狀態,但自彼時起,對應於此兩個分割區之兩個上下文獨立地工作且可分歧。
為給出一實例,假設分割區P4-6及P4-9兩者皆用於4×4亮度重要地圖之編碼,且分割區P8-4及P8-12兩者皆用於8×8亮度重要地圖之編碼。假定在此情形中色度分割區係固定的。注意,P4-9係P4-6之一細化,且P8-12係P8-4之一細化。切換準則係在當前圖塊中二進制算術編碼器目前已編碼之值格(bin)之數目之兩個臨限值(一個針對4×4且另一個針對8×8)。分割區P4-6經初始化且用於亮度4×4重要地圖,且分割區P8-4經初始化且用於亮度8×8重要地圖(兩者分別進行)。在已編碼每一LCU之後,檢查BAC已編碼之值格之數目且比較其與4×4臨限值及8×8臨限值。若超過4×4臨限值,則分割區集合P4-9用於亮度4×4重要地圖,且類似地,若超過8×8臨限值,則分割區P8-12用於亮度8×8重要地圖,此針對所有後續LCU。將如下自P4-6分割區(如下文所展示定義為C4-6[i])之值複製P4-9分割區(如下文所展 示定義為C4-9[i])之初始化值:C4-9:{C4-6[0],C4-6[1],C4-6[2],C4-6[3],C4-6[1],C4-6[1],C4-6[4],C4-6[5],C4-6[3]}
將如下自P8-4(如下文所展示定義為C8-4[i])之值複製P8-12分割區(如下文所展示定義為C8-12[i])之初始化值:C8-12:[C8-4[0],C8-4[0],C8-4[1],C8-4[21,C8-4[31,C8-4[1],C8-4[1],C8-4[2],C8-4[2],C8-4[2],C8-4[3],C8-4[3]}
自下一LCU開始,P4-9及P8-12中之每一分割區/上下文獨立於任何其他上下文而操作及更新。
由於解碼器可計數以相同方式解碼之值格之數目,因此可在解碼器側處重複以上程序,而不自經編碼圖塊標頭明確發訊號。
分割區初始化
由於一分割區集合內之每一部分對應於用於編碼及解碼彼分割區中之位元之一BAC狀態,因此在每一圖塊之開始處需要判定彼狀態之初始值。初始值係一BAC狀態,其在當前HEVC術語中係區間{1,...,126}中之一整數值。此值之最低有效位元指定MPS,且剩餘6個位元識別LPS之機率。其中MPS=1且p(LPS)=0.5之均勻狀態藉由值64來識別。
已選擇上文所闡述之分割區集合以使得在某些實施例中可在無壓縮效能之顯著損失之情況下免除狀態初始化。因此,每當需要初始化一分割區時,可將其設定至均勻狀態。
在另一實施例中,可提供初始化值。在一項實施方案中,所提供之初始化值係針對圖塊間的。然而,在一項實施例中,並非針對每一部分、圖塊類型(I、P、B)及文字類型(亮度、色度)指定QP之一線性函數,而是本申請案提出用於每一分割區之一單個值。
作為一實例,以下初始化值可用於上文所闡述之分割區。注意,為視覺清晰起見,以矩陣表示法展示此等初始化值,其中針對其中上下文用於彼分割區集合中之每一位置展示上下文之初始化值;然而,在實際實施方案中,一向量表示法(其中針對每一上下文而非每一位元位置展示初始化值(以一已知次序))可係更緊湊的。
用於P4-9之圖框內初始化值:[77 71 66 61 71 67 66 61 66 66 65 65 61 61 65],用於P4-6之圖框內初始化值:[67 60 55 46 60 60 55 46 55 55 54 54 46 46 54],用於P8-12之圖框內初始化值:[71 67 59 59 53 53 45 45 67 67 59 59 53 53 45 45 59 59 55 55 51 51 45 45 59 59 55 55 51 51 45 45 53 53 51 51 55 51 42 42 53 53 51 51 51 42 42 42 45 45 45 45 42 42 42 42 45 45 45 45 42 42 42],用於P8-4之圖框內初始化值: [62 62 48 48 41 41 33 33 62 62 48 48 41 41 33 33 48 48 48 48 41 41 33 33 48 48 48 48 41 41 33 33 41 41 41 41 48 41 33 33 41 41 41 41 41 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33],用於P4-9之圖框間(B)初始化值:[61 56 52 51 56 54 52 51 52 52 55 55 51 51 55],用於P4-6之圖框間(B)初始化值:[60 49 43 36 49 49 43 36 43 43 48 48 36 36 48],用於P8-12之圖框間(B)初始化值:[59 52 45 45 38 38 37 37 52 52 45 45 38 38 37 37 45 45 40 40 37 37 37 37 45 45 40 40 37 37 37 37 38 38 37 37 40 37 40 40 38 38 37 37 37 40 40 40 37 37 37 37 40 40 40 40 37 37 37 37 40 40 40],用於P8-4之圖框間(B)初始化值:[56 56 37 37 27 27 25 25 56 56 37 37 27 27 25 25 37 37 37 37 27 27 25 25 37 37 37 37 27 27 25 25 27 27 27 27 37 27 25 25 27 27 27 27 27 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25],用於P4-9之圖框間(P)初始化值: [62 57 54 51 57 55 54 51 54 54 55 55 51 51 55],用於P4-6之圖框間(P)初始化值:[61 51 43 34 51 51 43 34 43 43 48 48 34 34 48],用於P8-12之圖框間(P)初始化值:[60 54 47 47 42 42 39 39 54 54 47 47 42 42 39 39 47 47 43 43 41 41 39 39 47 47 43 43 41 41 39 39 42 42 41 41 43 41 41 41 42 42 41 41 41 41 41 41 39 39 39 39 41 41 41 41 39 39 39 39 41 41 41],用於P8-4之圖框間(P)初始化值:[55 55 37 37 27 27 21 21 55 55 37 37 27 27 21 21 37 37 37 37 27 27 21 21 37 37 37 37 27 27 21 21 27 27 27 27 37 27 21 21 27 27 27 27 27 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21 21]。
掃描次序
如上文所解釋,使用掃描次序判定最後有效係數(LSC)之位置。實例性經定義掃描次序包含水平、垂直、對角線及鋸齒狀。重要地圖之編碼及解碼以自LSC往回之反向指定掃描次序進行。
在某些實施方案中(舉例而言,在以硬體完成之彼等實施方案中),最小化編碼器或解碼器必須載入一新上下文之次數可係有利的。由於分割區集合之一給定部分中之每 一位置使用相同上下文,因此此意指在進行至下一部分之前處理一個部分中之所有位置可係更高效的。因此,在某些實施例中,與用於判定LSC不同之一掃描次序可用於編碼重要地圖。
在一n×n TU中,編碼掃描次序係數字0、1、...、n2 -2之一任意排列。將該排列應用至以水平掃描次序列示之矩陣位置。可使用任何排列,只要編碼器與解碼器就用於每一分割區集合之相同排列達成一致即可。舉例而言,可設計該排列以使得其將最小化上下文之間的切換數目。
為使用一實例,重新叫用P4-6之分割區集合由以下給出:0 1 2 3 1 1 2 3 4 4 5 5 3 3 5
若使用對角線掃描,則該排列由以下給出0,4,1,8,5,2,12,9,6,3,13,10,7,14,11 (1)其中數字0、1、...、14指代呈水平次序之4×4位元位置。因此,在此對角線掃描排列中,按以下次序使用上下文:0,1,1,4,1,2,3,4,2,3,3,5,3,5,5 (2)
針對重要地圖之編碼及解碼,以自LSC之前的位置往回讀取之一次序使用此等上下文。此產生比以下掃描次序或排列更多之上下文改變:0,4,1,5,2,6,3,7,12,13,8,9,10,11,14 (3)
此產生按以下次序使用之上下文:0,1,1,1,2,2,3,3,3,3,4,4,5,5,5 (4)
因此,當處理重要地圖時可預定義掃描次序(3)以替代對角線掃描(1)而與P4-6一起使用,此產生上下文序列(4)(替代(2)),從而產生係數之間的較少上下文改變。
在某些硬體實施方案中,用以最小化上下文改變之用於重要地圖之經重新排序掃描次序可係有利的。儘管可能在一單個時脈循環中處理來自兩個不同上下文之位元,但較容易在一單個時脈循環中實施對來自相同上下文之位元之處理。藉由重新排序值格以按上下文將其分組,較容易每時脈循環處理多個值格。若在一單個時脈循環中處置之兩個上下文係不同的,則編碼器/解碼器必須讀取兩個不同上下文且更新兩個不同上下文。與讀取且更新兩個上下文相比,可較容易產生在一個時脈循環中更新一單個上下文兩次之一硬體實施方案。
詳細語法實例-靜態指派實施例
建基於HEVC中之當前在開發中之語法,在某些實例性實施例中,可對語法做出以下修改及/或添加以促進靜態指派之使用。在以下實例中,該語法基於其中分別儲存且指派上文所闡述之四個實例性分割區集合P4-6、P4-9、P8-4及P8-12以供與4×4色度、4×4亮度、8×8色度及8×8亮度一起使用之一實施方案。
至此程序之輸入係色彩分量索引cIdx、當前係數掃描位置(xC,yC)(亦即,位元位置)及變換區塊大小 log2TrafoSize。此程序之輸出係ctxIdxInc。變數sigCtx取決於當前位置(xC,yC)、色彩分量索引cIdx、變換區塊大小及語法元素significant_coeff_flag之先前經解碼值格。對於sigCtx之推導,以下程序適用:若log2TrafoSize等於2,則如下推導sigCtx:sigCtx=CTX_IND_MAP_4x4[cIdx][(yC<<2)+xC]
否則,若log2TrafoSize等於3,則如下推導sigCtx:sigCtx=CTX_IND_MAP_8x8[cIdx][(yC<<3)+xC]
可如下針對亮度及色度定義常數CTX_IND_MAP_4×4及CTX_IND_MAP_8×8:
如下使用色彩分量索引cIdx、變換區塊大小log2TrafoSize、sigCtx及分割區集合推導上下文索引增量ctxIdxInc。
ctxOffset[max(log2TrafoSize-2,2)][cIdx]之值係定義於下表中:
舉例而言,若分割區集合P4-9用於亮度4×4區塊、P4-6用於色度4×4區塊、P8-12用於亮度8×8區塊且P8-4用於色度8×8區塊,則上表取以下值:
應注意,ctxIdxInc指代分量cIdx之4×4區塊之開始位置。如下推導值ctxIdxInc:ctxIdxInc=ctxOffset[max(log2TrafoSize-2,2)][cIdx]+sigCtx
就上下文變數之初始化而言,可由下表指定ctxIdx與每一圖塊類型之語法元素之間的關聯:
假定一均勻初始化實施例,可由下表給出上文針對語法元素significant_coeff_flag參考之ctxIdxTable:
然而,若替代一均勻初始化而實施一常數初始化,則可如下文所展示修改語法元素與ctxIdx之間的關聯:
然後可由下表給出上文針對語法元素significant_coeff_flag(I)參考之ctxIdxTable表I:
然後可由下表給出上文針對語法元素significant_coeff_flag(B)參考之ctxIdxTable表B:
然後可由下表給出上文針對語法元素significant_coeff_flag(P)參考之ctxIdxTable表P:
轉至演算法軟體實施方案,可將又一常數定義為任一 4×4集合中之分割區之最大數目:const UInt NUM_SIG_FLAG_CTX_4x4=9;使用此常數及上文所定義之分割區集合常數,對TComTrQuant::getSigCtxInc函數之修改可展示為:
現在參考圖9,其展示一編碼器900之一實例性實施例之一簡化方塊圖。編碼器900包含一處理器902、記憶體904及一編碼應用程式906。編碼應用程式906可包含儲存於記憶體904中且含有用於組態處理器902以執行諸如本文中所闡述之彼等步驟或操作之步驟或操作之指令的一電腦程式或應用程式。舉例而言,編碼應用程式906可編碼及輸出根據本文中所闡述之自適應重新建構位階程序編碼之位元串流。輸入資料點可與音訊、影像、視訊或可經受一有損資料壓縮方案之其他資料相關。編碼應用程式906可包含經組態以針對一分割區結構之每一索引判定一自適應重新建構位階之一量化模組908。編碼應用程式906可包含經組態以熵編碼自適應重新建構位階或RSP資料及其他資料之一熵編碼器。應理解,編碼應用程式906可儲存於一電腦可讀媒體中,諸如一光碟、快閃記憶體裝置、隨機存取記憶體、硬碟機等。
現在亦參考圖10,其展示一解碼器1000之一實例性實施例之一簡化方塊圖。解碼器1000包含一處理器1002、一記憶體1004及一解碼應用程式1006。解碼應用程式1006可包含儲存於記憶體1004中且含有用於組態處理器1002以執行諸如本文中所闡述之彼等步驟或操作之步驟或操作之指令的一電腦程式或應用程式。解碼應用程式1006可包含一熵解碼器及經組態以獲得RSP資料或自適應重新建構位階且使用彼所獲得資料來重新建構變換域係數或其他此等資料點之一解量化模組1010。應理解,解碼應用程式1006可儲存於一電腦可讀媒體中,諸如一光碟、快閃記憶體裝置、隨機存取記憶體、硬碟機等。
應瞭解,根據本申請案之解碼器及/或編碼器可實施於若干種計算裝置中,包含(但不限於)伺服器、經適合地程式化之一般用途電腦、音訊/視訊編碼及回放裝置、電視機上盒、電視廣播設備及行動裝置。可藉助於含有用於組態一處理器以實施本文中所闡述之功能之指令之軟體來實施解碼器或編碼器。該等軟體指令可儲存於任何適合非暫時性電腦可讀記憶體上,包含CD、RAM、ROM、快閃記憶體等。
應理解,可使用標準電腦程式化技術及語言來達成本文中所闡述之編碼器及模組、例行程式、處理程序、執行緒或實施用於組態編碼器之所闡述方法/程序之其他軟體組件。本申請案不限於特定處理器、電腦語言、電腦程式化慣例、資料結構、其他此等實施方案細節。熟習此項技術 者將認識到,所闡述之程序可實施為儲存於揮發性或非揮發性記憶體中之電腦可執行碼之一部分、一特殊應用整合式晶片(ASIC)之部分等。
可對所闡述之實施例做出某些更改及修改。因此,將上文所論述之實施例視為說明性而非限制性。
10‧‧‧編碼器
12‧‧‧視訊源
14‧‧‧經編碼位元串流/位元串流
16‧‧‧經解碼視訊圖框
20‧‧‧編碼模式選擇器
21‧‧‧空間預測器
22‧‧‧變換處理器
24‧‧‧量化器
26‧‧‧熵編碼器
28‧‧‧解量化器
30‧‧‧逆變換處理器
32‧‧‧去區塊處理器
34‧‧‧圖框儲存器
36‧‧‧運動預測器
50‧‧‧解碼器
52‧‧‧熵解碼器
54‧‧‧解量化器
56‧‧‧逆變換處理器
57‧‧‧空間補償器
58‧‧‧圖框緩衝器
60‧‧‧去區塊處理器
62‧‧‧運動補償器
202‧‧‧粗略分割區集合
204‧‧‧精細分割區集合
900‧‧‧編碼器
902‧‧‧處理器
904‧‧‧記憶體
906‧‧‧編碼應用程式
1000‧‧‧解碼器
1002‧‧‧處理器
1004‧‧‧記憶體
1006‧‧‧解碼應用程式
P1 -P12 ‧‧‧區塊部分
圖1以方塊圖形式展示用於編碼視訊之一編碼器;圖2以方塊圖形式展示用於解碼視訊之一解碼器;圖3圖解性地圖解說明將一4×4區塊分割成六個部分之一分割,其中每一部分中之位元位置係映射至一上下文;圖4展示圖3中之分割之一細化,從而產生九個部分;圖5圖解性地圖解說明將一8×8區塊分割成四個部分之一分割,其中每一部分中之位元位置係映射至一上下文;圖6展示圖5中之分割之一細化,從而產生十二個部分;圖7以流程圖形式展示用於解碼經編碼資料以重新建構一重要地圖之一實例性方法;圖8展示圖解說明粗略分割區與精細分割區之相對功效及其對經編碼圖塊大小之相依性之一圖表;圖9展示一編碼器之一實例性實施例之一簡化方塊圖;及圖10展示一解碼器之一實例性實施例之一簡化方塊圖。

Claims (8)

  1. 一種解碼經編碼資料之一位元串流以重新建構一變換單元之一重要地圖之方法,該方法包括:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文;基於該經判定上下文解碼該經編碼資料以重新建構一位元值,其中各位元值均為一指示該變換單元中之一對應位置是否包含一非零係數之旗標(flag);及基於彼經重新建構位元值更新該上下文,其中該等經重新建構位元值形成該經解碼重要地圖,其中該變換單元之大小係4×4,且其中該分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,3, 4,5,2,3, 6,6,7,7, 8,8,7,且其中以上整數表示指派至一4×4區塊重要地圖之該等位元位置之該等上下文。
  2. 如請求項1之方法,其中判定包含基於文字類型及變換單元大小自複數個分割區集合當中選擇該分割區集合,且其中該文字類型係亮度且該變換單元大小係4×4。
  3. 一種解碼經編碼資料之一位元串流以重新建構一變換單元之一重要地圖之方法,該方法包括:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文; 基於該經判定上下文解碼該經編碼資料以重新建構一位元值,其中各位元值均為一指示該變換單元中之一對應位置是否包含一非零係數之旗標(flag);及基於彼經重新建構位元值更新該上下文,其中該等經重新建構位元值形成該經解碼重要地圖,其中該變換單元之大小係4×4,且其中該分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,3, 1,1,2,3, 4,4,5,5, 3,3,5,且其中以上整數表示指派至一4×4區塊重要地圖之該等位元位置之該等上下文。
  4. 一種用於解碼經編碼資料之一位元串流以重新建構一變換單元之一重要地圖之解碼器,該解碼器包括:一處理器;一記憶體;及一解碼應用程式,其儲存於記憶體中且含有用於組態該處理器以執行如請求項1至3中任一項之方法之指令。
  5. 一種用於編碼一變換單元之一重要地圖之方法,該方法包括:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文; 基於該經判定上下文編碼彼位元位置處之一位元值以產生經編碼資料,其中各位元值均為一指示該變換單元中之一對應位置是否包含一非零係數之旗標(flag);及基於彼位元值更新該上下文,其中該經編碼資料形成一經編碼重要地圖,其中該變換單元之大小係4×4,且其中該分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,3, 4,5,2,3, 6,6,7,7, 8,8,7,且其中以上整數表示指派至一4×4區塊重要地圖之該等位元位置之該等上下文。
  6. 一種用於編碼一變換單元之一重要地圖之方法,該方法包括:針對該重要地圖中之每一位元位置,基於一分割區集合判定彼位元位置之一上下文;基於該經判定上下文編碼彼位元位置處之一位元值以產生經編碼資料,其中各位元值均為一指示該變換單元中之一對應位置是否包含一非零係數之旗標(flag);及基於該位元值更新該上下文,其中該經編碼資料形成一經編碼重要地圖,其中該 變換單元之大小係4×4,且其中該分割區集合根據由以下給出之一基於區塊之映射而將上下文指派至位元位置:0,1,2,3, 1,1,2,3, 4,4,5,5, 3,3,5,且其中以上整數表示指派至一4×4區塊重要地圖之該等位元位置之該等上下文。
  7. 一種用於編碼一變換單元之一重要地圖之編碼器,該編碼器包括:一處理器;一記憶體,其儲存該重要地圖;及一編碼應用程式,其儲存於記憶體中且含有用於組態該處理器以執行如請求項5或6之方法之指令。
  8. 一種非暫時性處理器可讀媒體,其儲存在執行時組態一或多個處理器以執行如請求項1至3、5及6中任一項之方法之處理器可執行指令。
TW101139364A 2011-10-24 2012-10-24 使用分割區選擇之重要地圖編碼及解碼 TWI493945B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP11186392.4A EP2587802B1 (en) 2011-10-24 2011-10-24 Significance map encoding and decoding using partition selection

Publications (2)

Publication Number Publication Date
TW201325241A TW201325241A (zh) 2013-06-16
TWI493945B true TWI493945B (zh) 2015-07-21

Family

ID=44883121

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101139364A TWI493945B (zh) 2011-10-24 2012-10-24 使用分割區選擇之重要地圖編碼及解碼

Country Status (11)

Country Link
EP (3) EP2773047A3 (zh)
JP (1) JP5529236B2 (zh)
KR (1) KR101418649B1 (zh)
CN (2) CN105791847B (zh)
AU (1) AU2012244143B2 (zh)
BR (1) BR102012027259B1 (zh)
CA (1) CA2795414C (zh)
ES (1) ES2496365T3 (zh)
HK (1) HK1201646A1 (zh)
SG (1) SG189659A1 (zh)
TW (1) TWI493945B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111683255B (zh) * 2012-01-20 2022-08-02 索尼公司 有效度图编码的复杂度降低
US10448058B2 (en) 2015-05-21 2019-10-15 Qualcomm Incorporated Grouping palette index at the end and index coding using palette size and run value
KR20180045530A (ko) 2016-10-26 2018-05-04 디지털인사이트 주식회사 임의의 블록 분할을 사용하는 비디오 코딩 방법 및 장치
WO2019111012A1 (en) * 2017-12-06 2019-06-13 V-Nova International Ltd Method and apparatus for decoding a received set of encoded data
CN111699681B (zh) * 2019-06-25 2023-11-14 北京大学 一种视频图像处理方法、设备及存储介质
CN114827609B (zh) 2019-06-25 2023-09-12 北京大学 视频图像编码和解码方法、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI334278B (en) * 2007-01-08 2010-12-01 Mediatek Inc Efm/efm+ encoder and method of digital sum value protection used thereof
TWI334719B (en) * 2005-06-24 2010-12-11 Broadcom Corp Programmable transmitter
TWI335147B (en) * 2006-11-14 2010-12-21 Nippon Telegraph & Telephone Image encoding method and decoding method, source encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
TWI335150B (en) * 2005-06-16 2010-12-21 Qualcomm Inc Wireless communication network with extended coverage range
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW420935B (en) * 1998-05-07 2001-02-01 Sarnoff Corp Method and apparatus for increasing memory resource utilization in an information stream decoder
EP1483918A2 (en) * 2002-03-05 2004-12-08 Koninklijke Philips Electronics N.V. Method and system for layered video encoding
CN101132529A (zh) * 2006-08-22 2008-02-27 中兴通讯股份有限公司 基于快速逐次逼近量化的小波图像压缩方法
KR101356733B1 (ko) * 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
CN101609547B (zh) * 2009-07-16 2011-12-07 复旦大学 基于累积能量的无缝拼接图像处理方法
EP2569944A1 (en) * 2010-05-12 2013-03-20 Thomson Licensing Methods and apparatus for unified significance map coding
CN102063258B (zh) * 2010-12-31 2012-07-04 山东大学 一种针对不同尺寸显示终端的图像自适应显示方法
US8687904B2 (en) * 2011-01-14 2014-04-01 Panasonic Corporation Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus which include arithmetic coding or arithmetic decoding
CN102129698A (zh) * 2011-03-08 2011-07-20 华中科技大学 一种基于感兴趣区域的图像编码方法
CN103129698A (zh) * 2011-11-29 2013-06-05 刘增勇 一种全回转拖船

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI335150B (en) * 2005-06-16 2010-12-21 Qualcomm Inc Wireless communication network with extended coverage range
TWI334719B (en) * 2005-06-24 2010-12-11 Broadcom Corp Programmable transmitter
TWI335147B (en) * 2006-11-14 2010-12-21 Nippon Telegraph & Telephone Image encoding method and decoding method, source encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
TWI334278B (en) * 2007-01-08 2010-12-01 Mediatek Inc Efm/efm+ encoder and method of digital sum value protection used thereof
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks

Also Published As

Publication number Publication date
CN103067701B (zh) 2016-06-08
CN103067701A (zh) 2013-04-24
JP5529236B2 (ja) 2014-06-25
EP2773047A2 (en) 2014-09-03
CN105791847B (zh) 2018-12-11
EP2587802B1 (en) 2014-07-16
AU2012244143B2 (en) 2014-11-13
CA2795414C (en) 2015-07-14
CA2795414A1 (en) 2013-04-24
HK1201646A1 (zh) 2015-09-04
CN105791847A (zh) 2016-07-20
EP2587802A1 (en) 2013-05-01
ES2496365T3 (es) 2014-09-18
EP3621206A1 (en) 2020-03-11
EP2773047A3 (en) 2015-01-14
BR102012027259A2 (pt) 2014-09-16
TW201325241A (zh) 2013-06-16
AU2012244143A1 (en) 2013-05-09
SG189659A1 (en) 2013-05-31
BR102012027259B1 (pt) 2022-04-12
EP2587802A9 (en) 2013-07-03
KR20130048153A (ko) 2013-05-09
JP2013093848A (ja) 2013-05-16
KR101418649B1 (ko) 2014-07-30

Similar Documents

Publication Publication Date Title
US11627338B2 (en) Significance map encoding and decoding using partition selection
KR101538832B1 (ko) 다중-레벨 유효성 맵 스캐닝
WO2013116849A1 (en) Devices and methods for context reduction in last significant coefficient position coding
KR20220008395A (ko) 엔트로피 디코딩 방법 및 이를 이용하는 디코딩 장치
EP2805495A2 (en) Devices and methods for context reduction in last significant coefficient position coding
TWI493945B (zh) 使用分割區選擇之重要地圖編碼及解碼
KR101407755B1 (ko) 인코딩 및 디코딩을 위한 멀티레벨 유의성 맵
CN112335251B (zh) 以分组的旁路位元的系数编码