TW202013961A - 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統 - Google Patents

用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統 Download PDF

Info

Publication number
TW202013961A
TW202013961A TW108123622A TW108123622A TW202013961A TW 202013961 A TW202013961 A TW 202013961A TW 108123622 A TW108123622 A TW 108123622A TW 108123622 A TW108123622 A TW 108123622A TW 202013961 A TW202013961 A TW 202013961A
Authority
TW
Taiwan
Prior art keywords
chroma
block
coding tree
segmentation
image frame
Prior art date
Application number
TW108123622A
Other languages
English (en)
Other versions
TWI820165B (zh
Inventor
克里斯多福 羅斯沃恩
Original Assignee
日商佳能股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商佳能股份有限公司 filed Critical 日商佳能股份有限公司
Publication of TW202013961A publication Critical patent/TW202013961A/zh
Application granted granted Critical
Publication of TWI820165B publication Critical patent/TWI820165B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Abstract

一種從位元流解碼影像圖框中的編碼樹單元的編碼塊的系統和方法。該方法包括接收影像圖框,該影像圖框具有色度格式(chroma format),其中,影像圖框的色度通道相對於影像圖框的亮度通道(luma channel)進行次取樣;並且,根據編碼樹單元的區域的尺寸確定編碼樹單元的亮度通道的亮度分割選項。該方法還包含根據區域的尺寸確定編碼樹單元的色度通道的色度分割選項,色度分割選項與亮度分割選項不同,允許的色度分割選項導致色度內預測的塊,最小尺寸為16個樣本;並且透過從位元流確定旗標來解碼編碼樹單元的編碼塊,以選擇所確定的亮度分割選項之一和所確定的色度分割選項之一。

Description

用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統
本申請案依35U.S.C第119條主張於2018年9月21日提出申請的澳洲專利第2018233042號申請案的權益,在此透過引用將其全文併入,如同於本文中完整陳述一般。
本發明一般有關數位視訊信號處理,尤其有關編碼與解碼視訊樣本塊的樹的方法、設備及系統。本發明亦有關一種電腦程式產品,包括電腦可讀媒體,其上記錄有用於編碼和解碼視訊樣本塊的樹的電腦程式。
目前存在許多用於視訊編碼的應用,包括用於視訊資料的傳輸和儲存的應用。還開發許多視訊編碼標準,其他標準目前正在開發中。視訊編碼標準化的近期發展導致一個名為「聯合視訊專家組」(JVET)之組織的形成。聯合視訊專家組(JVET)包括國際電信聯盟(ITU)電信標準化部門(ITU-T)第16研究組,第6議題(SG16/Q6)的成員,也稱為「視訊編碼專家群組」「(VCEG),國際標準化組織/國際電工委員會聯合技術委員會1 /小組委員會29 /工作組11(ISO/IEC JTC1/SC29/WG11)的成員,也稱為「動態影像專家群組」(MPEG)。
聯合視頻專家組(JVET)發布徵求提案(CfP),並在美國聖地亞哥舉行的第10次會議上分析回應。提交的回應證明視頻壓縮能力顯著優於目前最先進的視頻壓縮標準,即:「高效視訊編碼」(high efficiency video coding, HEVC)。在這種優異性能的基礎上,決定開始一個專案來開發一種新的視訊壓縮標準,命名為「多功能視訊編碼」(versatile video coding, VVC)。VVC預計將滿足對更高壓縮性能的持續需求,特別是當視訊格式的能力增加時(例如,具有更高的解析度和更高的圖框率)並且解決在WAN上的服務傳送的市場需求增加,其中頻寬成本相對較高。同時,VVC必須能夠在當代矽製程中實施,並且在實施的性能與實施成本之間提供可接受的折衷(例如,在矽面積、CPU處理器負載、記憶體利用率和頻寬方面)。
視訊資料包括一系列影像資料圖框,每個圖框包括一或多個顏色通道。通常需要一個主要顏色通道和兩個次要顏色通道。主要顏色通道通常被稱為「亮度」通道,而次要顏色通道通常被稱為「色度」通道。儘管視訊資料通常以RGB(紅-綠-藍)顏色空間顯示,但是該顏色空間在三個對應組件之間具有高度相關性。由編碼器或解碼器看到的視訊資料表示通常使用諸如YCbCr的顏色空間。YCbCr在Y(主)通道中集中亮度,根據傳遞函數映射到「亮度」,在Cb和Cr(次級)通道中整合色度。此外,與亮度通道相比,Cb和Cr通道可以以較低的速率在空間上進行取樣,例如水平的一半和垂直的一半-稱為「4:2:0色度格式」。4:2:0色度格式通常用於「消費者」應用,例如網際網路視訊流、廣播電視和Blu-RayTM 光碟上的儲存。以水平半速率對Cb和Cr通道進行次取樣而不是垂直次取樣被稱為「4:2:2色度格式」。4:2:2色度格式通常用於專業應用,包括擷取用於電影製作的資料片等。4:2:2色度格式的較高取樣率使得產生的視訊對諸如顏色分級之類的編輯操作更具彈性。在分發給消費者之前,4:2:2色度格式材料通常被轉換為4:2:0色度格式,然後在分發給消費者之前進行編碼。除色度格式之外,視訊還以解析度和圖框率為特徵。示例解析度為超高畫質(UHD),解析度為3840x2160或「8K」,解析度為7680x4320,示例圖框率為60或120Hz。亮度取樣率可以從每秒約500兆樣本到每秒幾千兆樣本。對於4:2:0色度格式,每個色度通道的取樣率是亮度取樣率的四分之一,對於4:2:2色度格式,每個色度通道的取樣率是亮度取樣率的一半。
VVC標準是「基於塊」的編解碼器,其中圖框首先被劃分成稱為「編碼樹單元」(CTU)的區域的正方形陣列。CTU通常佔據相對較大的區域,例如128×128亮度樣本。但是,每個圖框的右邊緣和底邊緣的CTU的面積可能較小。與每個CTU相關聯的是用於亮度通道的「編碼樹」和用於色度通道的附加編碼樹。編碼樹將CTU區域的分解定義為一組塊,也稱為「編碼塊」(CB)。單一編碼樹也可以為亮度通道和色度通道指定塊,在這種情況下,這些塊被稱為「編碼單元」(CU),每個CU具有用於每個顏色通道的編碼塊。處理CB以便以特定順序進行編碼或解碼。作為使用4:2:0色度格式的結果,具有用於128×128亮度樣本區域的亮度編碼樹的CTU具有用於64×64色度樣本區域的對應色度編碼樹,與128×128亮度樣本區域並置。當單一編碼樹用於亮度通道和色度通道時,給定區域的並置塊的集合通常被稱為「單元」,例如上述CU,以及「預測單元」(PU)和「變換單位」(TU)。當對給定區域使用單獨的編碼樹時,使用上述CB,以及「預測塊」(PB)和「變換塊」(TB)。
儘管「單元」和「塊」之間存在上述區別,但術語「塊」可以用作圖框的區域或區的通用術語,對於該區域或區,操作施加於所有顏色通道。
對於每個CU,產生對應的圖框資料區域的內容(樣本值)的預測(PU)(「預測單元」)。此外,形成在編碼器的輸入處看到的預測與區域內容之間的差異(或空間域中的「殘餘」)的表示。可以將每個顏色通道中的差異變換編碼為殘餘係數序列,從而形成給定CU的一或多個TU。施加的變換可以是離散餘弦變換(DCT)或其他變換,應用於每個殘餘值塊。該主要變換可分離地施加,即,二維變換於兩次通過中執行。首先透過對塊中的每列樣本施加一維變換來變換塊。然後,透過對部分結果的每行施加一維變換來變換部分結果,以產生對殘餘樣本實質去相關的變換係數的最終塊。VVC標準支援各種大小的變換,包括矩形塊的變換,每個側面尺寸為2的冪。量化變換係數以用於熵編碼到位元流中。
當使用空間預測(「圖框內預測」)來產生PB時,使用一組參考樣本來產生目前PB的預測樣本。參考樣本包括與PB相鄰之已經「重建」的樣本(對圖框內預測樣本添加殘餘樣本)。這些相鄰的樣本在PB上方形成一列,在PB的左側形成一行。列和行也延伸超過PB邊界以包括附近的附加樣本。由於Z次掃描中的掃描塊,一些參考樣本將在緊接在前一個塊中重建。來自緊接在前的塊的樣本的使用導致反饋依賴性,其可能會透過視訊編碼器或解碼器限制塊的輸出量。
本發明的目的為實質克服或至少改善現有配置的一或多個缺點。
本發明的一個態樣提供一種從位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該方法包含:接收影像圖框,該影像圖框具有色度格式,其中,影像圖框的色度通道相對於影像圖框的亮度通道進行次取樣;根據編碼樹單元的區域的尺寸確定編碼樹單元的亮度通道的亮度分割選項;根據區域的尺寸確定編碼樹單元的色度通道的色度分離選項,色度分離選項與亮度分割選項不同,允許的色度分割選項導致色度圖框內預測塊,最小尺寸為16個樣本;以及透過從位元流確定旗標來解碼編碼樹單元的編碼塊,以選擇所確定的亮度分割選項之一和所確定的色度分割選項之一。
根據另一態樣,色度塊大小是影像圖框的色度通道的16個樣本的倍數。
根據另一態樣,所確定的亮度分割選項導致亮度塊大小,其是影像圖框的亮度通道的16個樣本的倍數。
根據另一態樣,使用塊劃分成子塊來編碼具有兩個樣本的寬度的色度塊,每個子塊的大小為2乘8個樣本。
根據另一態樣,使用塊劃分成子塊來編碼具有兩個樣本的高度的色度塊,每個子塊的大小為8乘2個樣本。
本發明的另一態樣提供一種非暫態性電腦可讀媒體,其上儲存有電腦程式,以實施從位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該程式包含:用於接收影像圖框的碼,該影像圖框具有色度格式,其中,影像圖框的色度通道相對於影像圖框的亮度通道進行次取樣;用於根據編碼樹單元的區域的尺寸確定編碼樹單元的亮度通道的亮度分割選項的碼;用於根據區域的尺寸確定編碼樹單元的色度通道的色度分離選項的碼,色度分割選項與亮度分割選項不同,允許的色度分割選項導致最小尺寸為16個樣本的色度圖框內預測的塊;以及用於透過從位元流確定旗標來解碼編碼樹單元的編碼塊的碼,以選擇所確定的亮度分割選項之一和所確定的色度分割選項之一。
本發明的另一態樣提供一種視訊解碼器,被配置用以:從位元流接收影像圖框的編碼樹單元,該影像圖框具有色度格式,其中,影像圖框的色度通道相對於影像圖框的亮度通道進行次取樣;根據編碼樹單元的區域的尺寸確定編碼樹單元的亮度通道的亮度分割選項;根據區域的尺寸確定編碼樹單元的色度通道的色度分割選項,色度分割選項與亮度分割選項不同,允許的色度分割選項導致色度圖框內預測塊,最小尺寸為16個樣本;以及透過從位元流確定旗標來解碼編碼樹單元的編碼塊,以選擇所確定的亮度分割選項之一和所確定的色度分割選項之一。
本發明的另一態樣提供一種系統,包含:記憶體;處理器,其中,處理器被配置為用以執行儲存在記憶體中的碼,用於實施從位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該方法包含:接收影像圖框,影像圖框具有色度格式,其中,影像圖框的色度通道相對於影像圖框的亮度通道進行次取樣;根據編碼樹單元的區域的尺寸確定編碼樹單元的亮度通道的亮度分割選項;根據區域的尺寸確定編碼樹單元的色度通道的色度分離選項,色度分割選項與亮度分割選項不同,允許的色度分割選項產生最小尺寸為16個樣本的色度塊;以及透過從位元流確定旗標來解碼編碼樹單元的編碼塊,以選擇所確定的亮度分割選項之一和所確定的允許色度分割選項之一。
其他態樣亦予以揭示。
當在任何一或多個附圖中參照具有相同附圖標記的步驟及/或特徵時,那些步驟及/或特徵對於本說明書的目的而言具有相同的功能或者操作,除非出現相反的意圖。
如上所述,使用來自緊接在前的塊的樣本導致反饋依賴性,其可以透過視訊編碼器或解碼器限制塊的輸出量。減輕所得反饋依賴性迴路的嚴重性的方法是期望的,以確保可以維持高速率的處理塊,如典型的即時編碼和解碼應用所需要的。反饋依賴性迴路對於當代視訊格式的高取樣率特別成問題,例如每秒500-4000個樣本,而ASIC(專用積體電路)時脈頻率通常在幾百MHz。
圖1是顯示視訊編碼和解碼系統100的功能模組的示意方塊圖。系統100可以利用不同的規則來允許亮度和色度編碼樹中的區域的子區域,以減少遇到最壞情況塊處理率。例如,系統100可以操作使得無論塊的縱橫比如何,塊的大小總是為16(十六)個樣本的倍數。殘餘係數編碼還可以利用16塊大小的倍數,包括在具有二個樣本的寬度或高度的塊的情況下。
系統100包括源裝置110和目的地裝置130。通訊通道120用以將編碼的視訊資訊從源裝置110傳送到目的地裝置130。在一些配置中,源裝置110和目的地裝置130可以是任一者或兩者包括對應的行動電話手機或「智慧型電話」,在這種情況下,通訊通道120是無線通道。在其他配置中,源裝置110和目的地裝置130可以包括視訊會議裝備,在這種情況下,通訊通道120通常是有線通道,例如網際網路連接。此外,源裝置110和目的地裝置130可以包括多種裝置中的任何一種,包括支援空中電視廣播的裝置、有線電視應用、網際網路視訊應用(包括串流)以及編碼視訊資料是在某些電腦可讀儲存媒體(例如,檔案伺服器中的硬碟驅動器)上擷取的應用。
如圖1所示,源裝置110包括視訊源112、視訊編碼器114和發射器116。視訊源112通常包括擷取的視訊圖框資料源(如113所示),例如影像擷取感測器、儲存在非暫態性記錄媒體上之先前擷取的視訊序列、或來自遠程影像擷取感測器的視訊饋送。視訊源112亦可是電腦圖形卡的輸出,例如顯示作業系統的視訊輸出和在計算裝置(例如平板電腦)上執行的各種應用。可以包括作為視訊源112的影像擷取感測器的源裝置110的示例包括智慧型電話、視訊攝錄機、專業視訊相機和網路視訊相機。
視訊編碼器114將所擷取的圖框資料(由箭頭113所指)從視訊源112轉換(或「編碼」)為位元流(由箭頭115所指),如參考圖3進一步所描述者。位元流115由發送器116透過通訊通道120作為編碼視訊資料(或「編碼視訊資訊」)發送。位元流115也可以儲存在非暫態性儲存裝置122中,例如「快閃」記憶體或硬碟驅動器,直到稍後透過通訊通道120傳輸,或者透過通訊通道120代替傳輸。
目的地裝置130包括接收器132、視訊解碼器134和顯示裝置136。接收器132從通訊通道120接收編碼的視訊資料,並將接收的視訊資料作為位元流(由箭頭133所指)傳遞到視訊解碼器134。視訊解碼器134然後將解碼的圖框資料(由箭頭135所指)輸出到顯示裝置136。解碼的圖框資料135具有與圖框資料113相同的色度格式。顯示裝置136的示例包括陰極射線管、液晶顯示器,例如智慧型手機、平板電腦、電腦顯示器或獨立電視機。源裝置110和目的地裝置130中的每一個的功能也可以體現在單一裝置中,其示例包括行動電話手機和平板電腦。
儘管有上述示例裝置,但是源裝置110和目的地裝置130中的每一個可以配置在通用計算系統內,通常透過硬體和軟體組件的組合。圖2A顯示這樣的電腦系統200,其包括:電腦模組201;輸入裝置,例如鍵盤202、滑鼠指示器裝置203、掃描器226、相機227,其可以配置為視訊源112,以及麥克風280;以及輸出裝置,包括印表機215、顯示裝置214,其可以被配置為顯示裝置136,以及揚聲器217。電腦模組201可以使用外部調變器-解調器(數據機)收發器裝置216來透過連接221與通訊網路220往來通訊。通訊網路220可以代表通訊通道120,可以是廣域網路(WAN),例如網際網路、蜂巢式電信網路或私有WAN。在連接221是電話線的情況下,數據機216可以是傳統的「撥號」數據機。或者,在連接221是高容量(例如,纜線或光學)連接的情況下,數據機216可以是寬頻數據機。無線數據機還可以用於到通訊網路220的無線連接。收發器裝置216可以提供發送器116和接收器132的功能,並且通訊通道120可以在連接221中實施。
電腦模組201通常包括至少一個處理器單元205和記憶體單元206。例如,記憶體單元206可以具有半導體隨機存取記憶體(RAM)和半導體唯讀記憶體(ROM)。電腦模組201還包括多個輸入/輸出(I/O)介面,包括:耦合到視訊顯示器214的音訊-視訊介面207、揚聲器217和麥克風280;I/O介面213,其耦合到鍵盤202、滑鼠203、掃描器226、相機227和可選的操縱桿或其他人機介面裝置(未顯示);外部數據機216和印表機215的介面208。從音訊-視訊介面207到電腦監視器214的信號通常是電腦圖形卡的輸出。在一些實施中,數據機216可以包含在電腦模組201內,例如在介面208內。電腦模組201還具有本地網路介面211,其允許經由連接223將電腦系統200耦合到本地區域通訊網路222,稱為區域網路(LAN)。如圖2A所示,本地通訊網路222還可以經由連接224耦合到廣域網路220,連接224通常包括所謂的「防火牆」裝置或具有類似功能的裝置。本地網路介面211可以包括乙太網路(EthernetTM )電路卡、藍牙(BluetoothTM )無線配置或IEEE 802.11無線配置;然而,可以為介面211實施許多其他類型的介面。本地網路介面211還可以提供發送器116和接收器132的功能,並且通訊通道120也可以在本地通訊網路222中實施。
I/O介面208和213可以提供串列和並列連接中的任一個或兩者,前者通常根據通用串列匯流排(USB)標準實施並且具有對應的USB連接器(未顯示)。提供儲存裝置209且通常包括硬碟驅動器(HDD)210。也可以使用其他儲存裝置,例如軟碟驅動器和磁帶驅動器(未顯示)。通常提供光碟驅動器212以用作非揮發性的資料源。可攜式儲存裝置,例如光碟(例如CD-ROM、DVD、Blu ray DiscTM (藍光光碟))、USB-RAM、可攜式、外部硬碟驅動器和軟碟,可以用作電腦系統200的適當資料源。通常,HDD 210、光學驅動器212、網路220和222中的任何一者也可以被配置為操作為視訊源112,或者被配置為用於經由顯示器214儲存以供再生的解碼視訊資料的目的地。源裝置110和系統100的目的地裝置130可以在電腦系統200中實施。
電腦模組201的組件205至213通常經由互連匯流排204進行通訊,並且以導致相關技術領域人士已知的電腦系統200的傳統操作模式的方式進行通訊。例如,處理器205使用連接218耦合到系統匯流排204。同樣地,記憶體206和光碟驅動器212透過連接219耦合到系統匯流排204。可以在其上實施所描述的配置的電腦的示例包括IBM-PC和相容機,Sun SPARCstations、Apple MacTM 或類似的電腦系統。
在適當或期望的情況下,視訊編碼器114和視訊解碼器134以及以下描述的方法可以使用電腦系統200來實施。具體而言,要被描述的視訊編碼器114、視訊解碼器134和方法,可以被實施為在電腦系統200內可執行的一或多個軟體應用程式233。具體而言,視訊編碼器114、視訊解碼器134和所描述的方法的步驟由電腦系統200內執行的軟體233中之指令231實施(參見圖2B)。軟體指令231可以形成為一或多個碼模組,每個碼模組用於執行一或多個特定任務。軟體還可以分成兩個單獨的部分,其中第一部分和對應的碼模組執行所描述的方法,第二部分和對應的碼模組管理第一部分和用戶之間的用戶介面。
舉例來說,軟體可以儲存在電腦可讀媒體中,包括以下描述的儲存裝置。軟體從電腦可讀媒體載入到電腦系統200中,接著由電腦系統200執行。具有記錄在電腦可讀媒體上的這種軟體或電腦程式的電腦可讀媒體是電腦程式產品。電腦系統200中電腦程式產品的使用較佳地實施用於實施視訊編碼器114、視訊解碼器134和所描述的方法的有利設備。
軟體233通常儲存在HDD 210或記憶體206中。軟體從電腦可讀媒體載入到電腦系統200中,並由電腦系統200執行。因此,例如,軟體233可以儲存在由光碟驅動器212讀取的光學可讀碟儲存媒體(例如,CD-ROM) 225上。
在一些情況下,應用程式233可以被提供給用戶在一或多個CD-ROM 225上編碼且經由對應的驅動器212讀取,或者可選地可以由用戶從網路220或222讀取。此外,軟體還可以從其他電腦可讀媒體載入到電腦系統200中。電腦可讀儲存媒體是指對電腦系統200提供記錄的指令及/或資料以供執行及/或處理的任何非暫態性有形儲存媒體。這種儲存媒體的示例包括軟碟、磁帶、CD-ROM、DVD、Blu-ray DiscTM (藍光光碟)、硬碟驅動器、ROM或積體電路、USB記憶體、磁光碟或諸如PCMCIA卡等電腦可讀卡,無論這些裝置是在電腦模組201的內部還是外部。亦可參與提供軟體、應用程式、指令及/或視頻資料或編碼視頻資料到電腦模組401的暫態性或非有形電腦可讀傳輸媒體的示例包括無線電或紅外線傳輸通道,以及與另一電腦或聯網裝置的網路連接,以及包括電子郵件傳輸和記錄在網站等上的資訊的網際網路或內部網路。
可以執行應用程式233的第二部分和以上提到的對應碼模組以實施要在顯示器214上呈現或以其他方式表示的一或多個圖形用戶介面(GUI)。通常透過操縱鍵盤202以及滑鼠203,電腦系統200的用戶和應用程式可以以功能上可適應的方式操縱介面,以對與GUI相關聯的應用程式提供控制命令及/或輸入。亦可實施其他形式的功能自適應用戶介面,例如利用經由揚聲器217輸出的語音提示和經由麥克風280輸入的用戶語音命令的音訊介面。
圖2B是處理器205和「記憶體」234的詳細示意性方塊圖。記憶體234表示可以由圖2A中的電腦模組201存取的所有記憶體模組(包括HDD 209和半導體記憶體206)的邏輯集合。
當電腦模組201最初被供電時,執行開機自我測試(power-on self-test, POST)程式250。POST程式250通常儲存在圖2A的半導體記憶體206的ROM 249中。諸如儲存軟體的ROM 249之類的硬體裝置有時被稱為韌體。為了正確操作,POST程式250檢查電腦模組201內的硬體以確保正常運行並且通常檢查處理器205、記憶體234(209,206)和基本輸入-輸出系統軟體(BIOS)模組251,其通常也儲存在ROM 249。一旦POST程式250成功運行,BIOS 251就啟動圖2A的硬碟驅動器210。啟動硬碟驅動器210使得駐留在硬碟驅動器210上的啟動載入程式252透過處理器205執行。這將作業系統253載入到RAM記憶體206中,此時作業系統253開始操作。作業系統253是可由處理器205執行的系統級應用程式,以實施各種高級功能,包括處理器管理、記憶體管理、裝置管理、儲存管理、軟體應用程式介面和通用用戶介面。
作業系統253管理記憶體234(209、206)以確保在電腦模組201上運行的每個進程或應用程式具有足夠的記憶體,在該記憶體中執行而不與分配給另一進程的記憶體衝突。此外,必須正確使用圖2A的電腦系統200中可用的不同類型的記憶體,以便每個進程可以有效地運行。因此,聚合記憶體234不旨在顯示如何分配特定記憶體段(除非另有說明),而是提供電腦系統200可存取的記憶體的概觀以及如何使用這些記憶體。
如圖2B所示,處理器205包括多個功能模組,包括控制單元239、算術邏輯單元(ALU)240、以及有時稱為快取記憶體的本地或內部記憶體248。快取記憶體248通常包括暫存器部分中的多個儲存暫存器244-246。一或多個內部匯流排241在功能上互連這些功能模組。處理器205通常還具有一或多個介面242,用於使用連接218經由系統匯流排204與外部裝置通訊。記憶體234使用連接219耦合到匯流排204。
應用程式233包括指令序列231,其可包括條件分支和迴路指令。程式233還可以包括用於執行程式233的資料232。指令231和資料232分別儲存在記憶體位置228、229、230和235、236、237中。取決於指令231和記憶體位置228-230的相對大小,特定指令可以儲存在單一記憶體位置中,如記憶體位置230中所示的指令所示。或者,指令可以被分段為多個部分,每個部分儲存在單獨的記憶體位置中,如記憶體位置228和229中所示的指令段所示。
通常,處理器205被給予在其中執行的一組指令。處理器205等待後續輸入,處理器205透過執行另一組指令對其作出反應。每個輸入可以從多個源中的一或多個提供,包括由一或多個輸入裝置202、203產生的資料、經由網路220、202之一從外部源接收的資料、從儲存裝置206、209其中之一獲取的資料、或從插入對應讀取器212的儲存媒體225中擷取的資料,全部在圖2A中顯示。在一些情況下,執行一組指令可以導致資料的輸出。執行還可以牽涉到將資料或變數儲存到記憶體234。
視訊編碼器114、視訊解碼器134和所描述的方法可使用輸入變數254,其儲存在記憶體234中的對應記憶體位置255、256、257中。視訊編碼器114、視訊解碼器134和所描述的方法產生輸出變數261,其儲存在記憶體234中的對應記憶體位置262、263、264中。中間變數258可以儲存在記憶體位置259、260、266和267中。
參考圖2B的處理器205,暫存器244、245、246、算術邏輯單元(ALU)240和控制單元239一起工作以針對構成程式233的指令集中的每個指令執行執行「提取、解碼和執行」循環所需的微運算序列。每個提取、解碼和執行循環包含: 提取操作,其從記憶體位置228、229、230獲取或讀取指令231; 解碼操作,其中控制單元239確定已經取出哪個指令;以及 控制單元239及/或ALU 240執行指令的執行操作。
此後,可以執行下一指令的進一步提取、解碼和執行循環。類似地,可以執行儲存循環,控制單元239透過該儲存周期將值儲存或寫入記憶體位置232。
將要描述圖10至13的方法中的每個步驟或子進程,與程式233的一或多個段相關聯,並且通常由處理器205中的暫存器部分244、245、247、ALU 240和控制單元239一起執行以執行用於程式233的該段的指令集中的每個指令的提取、解碼和執行循環。
圖3是顯示視訊編碼器114的功能模組的示意方塊圖。圖4是顯示視訊解碼器134的功能模組的示意方塊圖。一般而言,資料在樣本或係數組(例如,將塊劃分成固定大小的子塊,或者作為陣列)中的視訊編碼器114與視訊解碼器134內的功能模組之間傳遞。視訊編碼器114和視訊解碼器134可以使用通用電腦系統200來實施,如圖2A和2B所示,其中可以由電腦系統200內的專用硬體透過電腦系統200內可執行的軟體(例如駐留在硬碟驅動器205上於執行中由處理器205控制的軟體應用程式233的一或多個軟體碼模組)實施各種功能模組。或是,視訊編碼器114和視訊解碼器134可以透過電腦系統200內可執行的專用硬體和軟體的組合來實施。視訊編碼器114、視訊解碼器134和所描述的方法可以或者在專用硬體(例如實施所描述方法的功能或子功能的一或多個積體電路)中實施。這種專用硬體可以包括圖形處理單元(GPU)、數位信號處理器(DSP)、專用標準產品(ASSP)、特定應用積體電路(ASIC)、現場可編程閘陣列(FPGA)或一或多個微處理器及相關記憶體。特別地,視訊編碼器114包括模組310-386,且視訊解碼器134包括模組420-496,每個模組可以實施為軟體應用程式233的一或多個軟體碼模組。
儘管圖3的視訊編碼器114是多功能視訊編碼(VVC)視訊編碼管線的例子,但是其它視訊編解碼器也可用於執行本文所述的處理階段。視訊編碼器114接收擷取的圖框資料113,例如一系列圖框,每個圖框包括一或多個顏色通道。圖框資料113可以是4:2:0色度格式或4:2:2色度格式。塊分割器310首先將圖框資料113劃分成CTU,通常為方形並且配置成使得針對CTU使用特定的大小。例如,CTU的大小可以是64×64、128×128或256×256亮度樣本。塊分割器310還根據亮度編碼樹和色度編碼樹將每個CTU劃分成一或多個CB。CB具有各種大小,並且可以包括正方形和非正方形縱橫比。參考圖10進一步描述塊分割器310的操作。然而,在VVC標準中,CB、CU、PU和TU總是具有2的冪的邊長。因此,根據CTU的亮度編碼樹和色度編碼樹,從塊分割器310輸出表示為312的目前CB,其根據CTU的一或多個塊上的迭代而進展。以下參考圖5和6進一步描述用於將CTU劃分成CB的選項。
可以依光柵掃描順序掃描由圖框資料113的第一次劃分產生的CTU,並且可以將其分組為一或多個「切片」。切片可以是「圖框內」(或「I」)切片。切片內(I切片)指示切片中的每個CU是圖框內預測的。或者,切片可以是單向或雙向預測(分別為「P」或「B」切片),分別指示切片中的單向和雙向預測的附加可用性。
對於每個CTU,視訊編碼器114以兩個階段操作。在第一階段(稱為「搜尋」階段),塊分割器310測試編碼樹的各種潛在配置。編碼樹的每個潛在配置具有關聯的「候選」CB。第一階段涉及測試各種候選CB以選擇提供高壓縮效率和低失真的CB。測試通常涉及拉格朗日最佳化(Lagrangian optimisation),由此基於速率(編碼成本)和失真(關於輸入圖框資料113的誤差)的加權組合來評估候選CB。選擇「最佳」候選CB(具有最低評估速率/失真的CB)用於隨後編碼入位元流115中。在候選CB的評估中包括對於給定區域使用CB或者根據各種分割選項進一步分割該區域並且使用更多CB對每個較小的結果區域進行編碼,或者甚至進一步分割區域的選項。結果,在搜尋階段中選擇CB和編碼樹本身。
視訊編碼器114為每個CB(例如CB 312)產生由箭頭320所指的預測塊(PB)。PB 320是相關CB 312的內容的預測。減法器模組322產生差,在PB 320與CB 312之間表示為324(或「殘餘」,指的是在空間域中的差)。差324是PB 320與CB 312中的對應樣本之間的塊大小差異。差324被變換、量化並表示為變換塊(TB),由箭頭336所指。例如基於評估的成本或失真,PB 320和相關聯的TB 336通常從許多可能的候選CB中的一個中選擇。
候選編碼塊(CB)是從視頻編碼器114可用於關聯PB的其中一個預測模式和所得殘餘得到的CB。每個候選CB產生一或多個對應的TB,如下文參考圖8所述。TB 336是差值324的量化和變換表示。當與視訊解碼器114中的預測PB組合時,TB 336減少解碼的CB與原始CB 312之間的差異,代價是位元流中的附加信令。
因此,每個候選編碼塊(CB),即預測塊(PB)與變換塊(TB)的組合,具有相關的編碼成本(或「速率」)和相關的差異(或「失真」)。速率通常以位元來測量。通常將CB的失真估計為樣本值的差異,例如絕對差之和(SAD)或平方差之和(SSD)。由每個候選PB產生的估計由模式選擇器386使用差324來確定圖框內預測模式(由箭頭388表示)。可以以比殘餘的熵編碼低得多的成本來執行與每個候選預測模式和對應的殘餘編碼相關聯的編碼成本的估計。因此,可以評估多個候選模式以確定速率-失真意義上的最佳模式。
通常使用拉格朗日最佳化的變化來達到在速率-失真方面確定最佳模式。圖框內預測模式388的選擇通常涉及確定由應用特定圖框內預測模式產生的殘餘資料的編碼成本。可以藉由使用「絕對變換差之和」(SATD)來近似編碼成本,由此使用相對簡單的變換(例如Hadamard變換)來獲得估計的變換後的殘餘成本。在使用相對簡單的變換的一些實施中,由簡化的估計方法產生的成本與否則將從完全評估確定的實際成本單調相關。在具有單調相關估計成本的實施中,簡化估計方法可用於在視訊編碼器114中進行相同決定(即圖框內預測模式)並降低複雜度。為允許估計與實際成本之間的關係中的可能的非單調性,可使用簡化估計方法以產生最佳候選者列表。例如,非單調性可以由可用於殘餘資料編碼的進一步模式決定產生。最佳候選人名單可以是任意數字。可以使用最佳候選來執行更完整的搜尋,以建立用於對每個候選者的殘餘資料進行編碼的最佳模式選擇,從而允許最終選擇圖框內預測模式以及其他模式決定。
其他模式決定包括跳過順向變換的能力,稱為「變換跳過」。跳過變換適合於透過表達作為變換基函數而缺少足夠的相關性以減少編碼成本的殘餘資料。某些類型的內容,例如相對簡單的電腦產生的圖形可能表現出類似的行為。對於「跳過變換」,即使不執行變換本身,殘留係數仍然被編碼。
可以採用拉格朗日或類似的最佳化處理來選擇CTU的最佳分割成CB(透過塊分割器310)以及從多種可能性中選擇最佳預測模式。透過在模式選擇器模組386中應用候選模式的拉格朗日最佳化過程,具有最低成本測量的圖框內預測模式被選擇作為「最佳」模式。「最佳」模式是所選擇的圖框內預測模式388,並且亦由熵編碼器338在位元流115中編碼。透過模式選擇器模組386的操作選擇圖框內預測模式388延伸到塊分割器310的操作。例如,用於選擇圖框內預測模式388的候選者可包括適用於給定塊的模式以及適用於共同與給定塊並置的多個較小塊的模式。在包括適用於給定塊和較小並置塊的模式的情況下,隱含地選擇候選的過程也是確定CTU到CB的最佳階層分解的過程。
在視訊編碼器114的第二操作階段(稱為「編碼」階段)中,在視訊編碼器114中執行對所選擇的亮度編碼樹和所選擇的色度編碼樹的迭代,且因而在每個所選擇的CB中執行迭代。在迭代中,CB被編碼到位元流115中,如本文進一步所描述。
熵編碼器338支援語法元素的可變長度編碼和語法元素的算術編碼。使用上下文自適應二進位算術編碼處理來支援算術編碼。算術編碼的語法元素由一或多個「位元子」(bin)的序列組成。像位元一樣,位元子的值為「0」或「1」。然而,不在位元流115中將位元子編碼為離散位元。位元子具有相關聯的預測(或「可能」或「最可能」)值和相關機率,稱為「上下文」。當要編碼的實際位元子與預測值匹配時,編碼「最可能符號」(MPS)。在消耗的位元方面,編碼最可能的符號相對不昂貴。當要編碼的實際位元子不匹配可能值時,編碼「最不可能符號」(LPS)。對消耗的位元進行編碼最不可能的符號具有相對高的成本。位元子編碼技術實施位元子的有效編碼,其中「0」與「1」的機率是傾斜的。對於具有兩個可能值(即「旗標」)的語法元素,單一位元子就足夠。對於具有許多可能值的語法元素,需要一系列的位元子。
可以基於序列中較早的位元子的值來確定序列中後來位元子的存在。另外,每個位元子可以與多於一個上下文相關聯。特定上下文的選擇可以取決於語法元素中的較早的位元子,相鄰語法元素的位元子值(即來自相鄰塊的位元子值)等。每次對上下文編碼的位元子進行編碼時,以反映新位元子值的方式更新為該位元子選擇的上下文(如果有的話)。因此,二進位算術編碼方案被認為是自適應的。
視訊編碼器114還支援缺少上下文(「旁路位元子」)的位元子。假設在「0」和「1」之間存在等機率分佈,對旁路位元子進行編碼。因此,每個位元子佔據位元流115中的一個位元。缺少上下文節省記憶體並降低複雜性,因而在特定位元子的值的分佈不偏斜的情況下使用旁路位元子。採用上下文和自適應的熵編碼器的一個示例在本技術領域中稱為CABAC(上下文自適應二進位算術編碼器),並且該編碼器的許多變體已用於視訊編碼中。
熵編碼器338使用上下文編碼和旁路編碼位元子的組合對圖框內預測模式388進行編碼。通常,在視訊編碼器114中產生「最可能模式」的列表。最可能模式的列表通常具有固定長度,例如三個或六個模式,並且可包括在較早塊中遇到的模式。上下文編碼的位元子對指示圖框內預測模式是否是最可能模式之一的旗標進行編碼。如果圖框內預測模式388是最可能模式之一,則使用經旁路的位元子進一步編碼發信令。編碼的另外的信令指示哪個最可能的模式與圖框內預測模式388相對應,例如使用截斷的一元位元子字串。否則,圖框內預測模式388被編碼為「剩餘模式」。作為剩餘模式的編碼使用替代語法,例如也使用經旁路編碼的位元子編碼的固定長度碼,以表達除了最可能模式列表中存在的圖框內預測模式之外的圖框內預測模式。
多工器模組384根據所確定的最佳圖框內預測模式388輸出PB 320,從每個候選CB的測試預測模式中選擇。候選預測模式不需要包括由視訊編碼器114支援的每個可想到的預測模式。
預測模式大致分為兩類。第一類是「圖框內預測」(「intra-frame prediction」,也稱為「intra prediction」)。在圖框內預測中,產生對塊的預測,並且產生方法可以使用從目前圖框獲得的其他樣本。對於圖框內預測的PB,可以將不同的圖框內預測模式用於亮度和色度,因此主要根據對PB的操作來描述圖框內預測。
第二類預測模式是「圖框間預測」(「inter-frame prediction」,也稱為間預測「inter prediction」)。在圖框間預測中,使用來自位元流中依編碼圖框的順序的目前圖框之前的一個或兩個圖框的樣本來產生塊的預測。此外,對於圖框間預測,單一編碼樹通常用於亮度通道和色度通道。位元流中的編碼圖框的順序可以與擷取或顯示時的圖框的順序不同。當一圖框用於預測時,該塊被稱為「單一預測」並且具有一個相關聯的運動向量。當兩個圖框用於預測時,該塊被稱為「雙預測」並且具有兩個相關聯的運動向量。對於P切片,每個CU可以是圖框內預測的或單一預測的。對於B切片,每個CU可以是圖框內預測的、單一預測的、或雙預測的。通常使用「圖片組」結構對圖框進行編碼,從而實施圖框的時間層次。圖框的時間層次允許圖框以顯示圖框的順序參考前一影像和後一影像。為確保滿足解碼每個圖框的依賴性,以必需的順序對影像進行編碼。
圖框間預測的子類別被稱為「跳過模式」。圖框間預測和跳過模式被描述為兩種不同的模式。然而,圖框間預測模式和跳過模式都涉及參考來自先前圖框的樣本塊的運動向量。圖框間預測涉及編碼運動向量差量(delta),指定相對於運動向量預測器的運動向量。從用「合併索引」選擇的一或多個候選運動向量的列表獲得運動向量預測器。編碼運動向量差量為所選運動向量預測提供空間偏移。圖框間預測還使用位元流133中的編碼殘餘。跳過模式僅使用索引(也稱為「合併索引」)來從若干運動向量候選中選擇一個。使用所選候選者而沒有任何進一步的信令。此外,跳過模式不支援任何殘餘係數的編碼。當使用跳過模式時不存在編碼殘餘係數意味著不需要對跳過模式執行變換。因此,跳過模式通常不會導致管線處理問題。管線處理問題可能是圖框內預測的CU和圖框間預測的CU的情況。由於跳過模式的有限信令,當相對高品質的參考圖框可用時,跳過模式對於達到非常高的壓縮性能是有用的。隨機存取影像組結構的較高時間層中的雙預測CU通常具有高品質參考影像以及準確反映下面運動的運動向量候選。
根據運動向量和參考圖片索引來選擇樣本。運動向量和參考圖片索引適用於所有顏色通道,因此主要根據對PU而不是PB的操作來描述圖框間預測。在每個類別內(即,圖框內和圖框間預測),可以應用不同的技術來產生PU。例如,圖框內預測可以使用來自先前的重建樣本的相鄰列和行的值,結合根據規定的過濾和產生過程產生PU的方向。或者,可以使用少量參數來描述PU。圖框間預測方法可以在運動參數的數量和它們的準確度上變化。運動參數通常包含參考圖框索引,指示將使用來自參考圖框列表的哪些參考圖框加上每個參考圖框的空間轉換,但是可包括更多圖框、特殊圖框或諸如縮放和旋轉的複雜仿射參數。另外,可以應用預定的運動細化過程以基於參考的樣本塊產生密集運動估計。
在確定並選擇「最佳」PB 320,並在減法器322處從原始樣本塊中減去PB 320之後,獲得具有最低編碼成本的殘餘,表示為324,並進行有損壓縮(lossy compression)。有損壓縮過程包括變換、量化和熵編碼的步驟。變換模組326將順向變換施加於差324,將差324轉換到頻域,並產生由箭頭332表示的變換係數。順向變換通常是可分離的,變換每個塊的一組列,然後變換一組行。透過首先將一維變換施用於塊的每一列以產生部分結果且接著施用於部分結果的每一行以產生最終結果來執行每組列和行的變換。
變換係數332被傳遞到量化器模組334。在模組334處,執行根據「量化參數」的量化以產生殘餘係數,由箭頭336表示。量化參數對於給定TB是恆定的且因而導致用於TB的殘餘係數的產生的均勻縮放。透過應用「量化矩陣」也可以實施非均勻縮放,藉以施用於每個殘餘係數的縮放因子是從量化參數和縮放矩陣中的對應項目的組合導出的,縮放矩陣通常具有等於TB的大小。殘餘係數336被提供給熵編碼器338以在位元流115中進行編碼。通常,根據掃描模式,掃描具有至少一個TU的顯著殘餘係數的每個TB的殘餘係數以產生有序的值列表。掃描模式通常將TB掃描為4×4’子塊序列,以4×4組殘餘係數的粒度提供常規掃描操作,子塊的配置取決於TB的大小。另外,預測模式388和對應的塊分割也在位元流115中編碼。
如上所述,視訊編碼器114需要存取對應於在視訊解碼器134中看到的圖框表示的圖框表示。因此,殘餘係數336也由去量化器模組340進行逆量化以產生逆變換係數以箭頭342表示。逆變換係數342被傳遞到逆變換模組348以產生TU的箭頭350表示的殘餘樣本。求和模組352將殘餘樣本350和PU 320相加以產生CU的重建樣本(由箭頭354所指)。
重建樣本354被傳遞到參考樣本快取356和迴路濾波器模組368。通常使用ASIC上的靜態RAM實施的參考樣本快取356(因此避免昂貴的晶片外記憶體存取)提供滿足用於為圖框中的後續CU產生圖框內PB的依賴性所需的最小樣本儲存。最小依賴性通常包括沿著一列CTU的底部的樣本的「行緩衝器」,供下一列CTU使用,並且行緩衝的範圍由CTU的高度設定。參考樣本快取356將參考樣本(由箭頭358表示)提供給參考樣本濾波器360。樣本濾波器360應用平滑操作以產生過濾的參考樣本(由箭頭362所指)。經濾波的參考樣本362由圖框內預測模組364使用以產生圖框內預測的樣本塊,由箭頭366表示。對於每個候選圖框內預測模式,圖框內預測模組364產生樣本塊,即366。
迴路濾波器模組368將若干濾波級應用於重建樣本354。濾波級包括「去塊濾波器」(DBF),其應用與CU邊界對齊的平滑以減少由不連續性導致的偽影。存在於迴路濾波器模組368中的另一個濾波級是「自適應迴路濾波器」(ALF),其應用基於維納的自適應濾波器以進一步減少失真。迴路濾波器模組368中的另一可用濾波級是「取樣自適應偏移」(SAO)濾波器。SAO濾波器透過首先將重建樣本分類為一或多個類別來操作,並且根據分配的類別,在樣本級別施用偏移。
從迴路濾波器模組368輸出由箭頭370表示的濾波樣本。濾波後的樣本370儲存在圖框緩衝器372中。圖框緩衝器372通常具有儲存若干(例如達到16)圖像的容量且因而儲存在記憶體206中。因為需要大的記憶體消耗,所以圖框緩衝器372通常不使用晶片上記憶體來儲存。因此,就記憶體頻寬而言,對圖框緩衝器372的存取是昂貴的。圖框緩衝器372提供參考圖框(由箭頭374表示)給運動估計模組376和運動補償模組380。
運動估計模組376估計多個「運動向量」(表示為378),每個「運動向量」是從目前CB的位置起的笛卡爾空間偏移,參考圖框緩衝器372中的一個參考圖框中的塊。為每個運動向量產生濾波的參考樣本塊(表示為382)。經濾波的參考樣本382形成可供模式選擇器386進行潛在選擇的其他候選模式。此外,對於給定CU,可使用一個參考塊(「單預測」)形成PU 320,或者可使用兩個參考塊形成PU 320(「雙預測」)。對於所選擇的運動向量而言,運動補償模組380根據支援運動向量中的子像素準確度的濾波處理來產生PB 320。因此,運動估計模組376(其對許多候選運動向量進行操作)可以與運動補償模組380(僅對所選擇的候選者進行操作)相比執行簡化的濾波處理,以實施降低的計算複雜度。
儘管參照多功能視訊編碼(VVC)說明圖3的視訊編碼器114,但是其他視訊編碼標準或實施方案也可以採用模組310-386的處理階段。圖框資料113(以及位元流115)也可以從記憶體206、硬碟驅動器210、CD-ROM、Blu-ray diskTM (藍光光碟)或其他電腦可讀儲存媒體中讀取(或寫入)。另外,圖框資料113(和位元流115)可以從外部源接收(或發送到),例如連接到通訊網路220的伺服器或射頻接收器。
圖4中顯示視訊解碼器134。儘管圖4的視訊解碼器134是多功能視訊編碼(VVC)視訊解碼管線的示例,但是也可以使用本文描述的其他視訊編解碼器來執行處理階段。如圖4所示,位元流133被輸入到視訊解碼器134。位元流133可以從記憶體206、硬碟驅動器210,CD-ROM、Blu-ray diskTM (藍光光碟)或其他非暫態性電腦可讀儲存媒體中讀取。或者,可以從諸如連接到通訊網路220的伺服器或射頻接收器的外部源接收位元流133。位元流133包含代表要被解碼的擷取圖框資料的編碼語法元素。
位元流133被輸入到熵解碼器模組420。熵解碼器模組420從位元流133中提取語法元素,並將語法元素的值傳遞到視訊解碼器134中的其他模組。熵解碼器模組420應用CABAC演算法以解碼來自位元流133的語法元素。經解碼的語法元素用於在視訊解碼器134內重建參數。參數包括殘餘係數(以箭頭424表示)和模式選擇資訊(例如圖框內預測模式,以箭頭458表示)。模式選擇資訊還包括諸如運動向量之類的資訊,以及每個CTU分割成一或多個CB的資訊。參數用於產生PB,通常與來自先前解碼的CB的樣本資料組合。
殘餘係數424被輸入到去量化器模組428。去量化器模組428對殘餘係數424執行逆量化(或「縮放」)以根據量化參數創建由箭頭440表示的重建變換係數。如果在位元流133中指示使用非均勻逆量化矩陣,則視訊解碼器134從位元流133讀取量化矩陣作為縮放因子序列,並將縮放因子排列成矩陣。逆縮放使用量化矩陣結合量化參數來創建重建的變換係數440。
重建的變換係數440被傳遞到逆變換模組444。模組444將係數從頻域變換回空間域。TB有效地基於顯著的殘餘係數和非顯著的殘餘係數值。模組444的操作結果是殘餘樣本塊,由箭頭448表示。殘餘樣本448的大小與對應的CU相等。殘餘樣本448被提供給求和模組450。在求和模組450處,將殘餘樣本448加到解碼的PB(表示為452)以產生重建樣本塊,由箭頭456表示。重建樣本456 被提供給重建樣本快取460以及迴路濾波模塊488。迴路濾波模組488產生重建的圖框樣本塊,表示為492。圖框樣本492被寫入圖框緩衝器496。
重建樣本快取460與視訊編碼器114的重建樣本快取356類似地操作。重建樣本快取460為在沒有記憶體206的情況下圖框內預測後續CB所需的重建樣本提供儲存(例如透過反而使用資料232,其通常是晶片上記憶體)。由重建樣本快取460獲得由箭頭464表示的參考樣本,並將其提供給參考樣本濾波器468,以產生由箭頭472所指的經濾波的參考樣本。經濾波的參考樣本472被提供給圖框內預測模組476。模組476根據在位元流133中用信號通知並由熵解碼器420解碼的圖框內預測模式參數458,產生由箭頭480表示的圖框內預測樣本塊。
當在位元流133中針對目前CB指示圖框內預測時,圖框內預測樣本480經由多工器模組484形成經解碼的PB 452。
當在位元流133中針對目前CB指示圖框間預測時,運動補償模組434使用運動向量和參考圖框索引來產生圖框間預測樣本(表示為438)的塊,以選擇並過濾來自圖框緩衝器496的樣本塊498。樣本塊498從儲存在圖框緩衝器496中的先前解碼的圖框獲得。對於雙預測,產生兩個樣本塊並將它們混合在一起以產生用於解碼的PB 452的樣本。圖框緩衝器496填充有來自迴路濾波模組488的濾波塊資料492。與視訊編碼器114的迴路濾波模組368一樣,迴路濾波模組488應用任何,至少或全部DBF、ALF和SAO來過濾操作。迴路濾波模組368從重建樣本456產生濾波塊資料492。
圖5是顯示在多功能視訊編碼的樹結構中將區域可用的劃分或分割為一或多個子區域的集合500的示意性方塊圖。如參考圖3所描述的,集合500中顯示的劃分可用於編碼器114的塊分割器310,以根據編碼樹將每個CTU劃分成一或多個CU或CB,如透過拉格朗日最佳化所確定者。
儘管集合500僅顯示被劃分成其他可能是非正方形子區域的正方形區域,但是應該理解,圖500顯示潛在的劃分但不要求包含區域是正方形的。如果包含區域是非正方形,則根據包含塊的縱橫比來縮放由分割產生的塊的尺寸。一旦區域未被進一步分割,即,在編碼樹的葉節點處,CU佔據該區域。由塊分割器310將CTU特定細分為一或多個CU被稱為CTU的「編碼樹」。當所得子區域達到最小CU大小時,必須終止將區域細分為子區域的過程。除約束CU以禁止小於例如4×4的大小之外,CU被約束為具有最小寬度或高度4。其他最小值,包括寬度和高度,或者寬度或高度也是可能的。細分過程也可以在最深層次的分解之前終止,導致CU大於最小CU的大小。可能不會發生分割,導致單一CU佔據整個CTU。佔據整個CTU的單一CU是最大可用編碼單元大小。此外,不發生分割的CU大於處理區域大小。作為在編碼樹的最高級別進行二進位或三進位分割的結果,諸如64x128、128x64、32x128和128x32的CU大小是可能的,每個CU大小也大於處理區域大小。CUS的示例大於參考圖10進一步說明的處理區域大小。
在編碼樹的葉節點處存在CU,沒有進一步的細分。例如,葉節點510包含一個CU。在編碼樹的非葉節點處存在被分成兩個或更多個另外的節點,每個節點可以包含葉節點,因此一個CU或者包含進一步分割成更小的區域。
四元樹分割512將包含區域劃分成四個相等大小的區域,如圖5所示。與HEVC相比,多功能視訊編碼(VVC)透過添加水平二元分割514和垂直二元分割516來達到額外的彈性。每個分割514和516將包含區域劃分成兩個相等大小的區域。劃分沿著包含塊內的水平邊界(514)或垂直邊界(516)。
透過添加三元水平分割518和三元垂直分割520,在多功能視訊編碼中達進一步的彈性。三元分割518和520將塊分成三個區域,水平(518)或垂直(520)地包含區域寬度或高度的1/4和3/4。四元樹、二元樹和三元樹的組合稱為「QTBTTT」。樹的根包括零或多個四元樹分割(樹的「QT」部分)。一旦QT部分終止,就可能發生零或多個二元或三元分割(樹的「多樹」或「MT」部分),最終以樹的葉節點處的CB或CU結束。在樹描述所有顏色通道的情況下,樹葉節點是CU。在樹描述亮度通道或色度通道的情況下,樹葉節點是CB。
相較於僅支援四元樹並因而僅支援方塊的HEVC,QTBTTT導致更多可能的CU大小,特別是考慮到二元樹及/或三元樹分割的可能的遞歸應用。透過約束分割選項來消除可能導致塊寬度或高度小於四個樣本或不是四個樣本的倍數的分割,可以減少異常(非方形)塊大小的可能性。通常,約束會適用於考慮亮度樣本。然而,在所描述的配置中,約束可以分別應用於色度通道的塊。將約束分割選項應用於色度通道可以導致亮度與色度的不同最小塊大小,例如當圖框資料是4:2:0色度格式或4:2:2色度格式時。每個分割產生相對於包含區域具有側面尺寸不變、減半或四分之一的子區域。接著,由於CTU大小是2的冪,所以所有CU的側面尺寸也是2的冪。
圖6是顯示在多功能視訊編碼中使用的QTBTTT(或「編碼樹」)結構的資料流600的示意流程圖。QTBTTT結構用於每個CTU以定義CTU劃分成一或多個CU。每個CTU的QTBTTT結構由視訊編碼器114中的塊分割器310確定,並由視訊解碼器134中的熵解碼器420編碼到位元流115中或從位元流133解碼。資料流600進一步根據圖5中所示的劃分來表徵塊分割器310可用於將CTU劃分成一或多個CU的可允許的組合。
從階層的頂層開始,即在CTU處,首先執行零或多個四元樹劃分。具體地,由塊分割器310進行四元樹(QT)分割決定610。在610處返回「1」符號的決定表示根據四元樹512分割將目前節點分成四個子節點的決定。結果是產生四個新節點,例如在620,並且對於每個新節點,遞歸回到QT分割決定610。每個新節點以光柵(或Z掃描)順序被考慮。或者,如果QT分割決定610指示不執行進一步分割(返回「0」符號),則停止四元樹分割並且隨後考慮多樹(MT)分割。
首先,由塊分割器310進行MT分割決定612。在612,指示執行MT分割的決定。在決定612處返回「0」符號表示不執行將節點進一步分割成子節點。如果不執行節點的進一步分割,則該節點是編碼樹的葉節點並且對應於CU。葉節點在622輸出。或者,如果MT分割612指示執行MT分割的決定(返回「1」符號),則塊分割器310進展到方向決定614。
方向決定614指示MT分割的方向為水平(「H」或「0」)或垂直(「V」或「1」)。如果決定614返回指示水平方向的「0」,則塊分割器310進展到決定616。如果決定614返回指示垂直方向的「1」,則塊分割器310進展到決定618。
在決定616和618中的每一個處,MT分割的分區的數量在BT/TT分割處被指示為兩個(二元分割或「BT」節點)或三個(三元分割或「TT」)。也就是說,當來自614的指示方向是水平時,塊分割器310做出BT/TT分割決定616,並且當來自614的指示方向是垂直時,塊分割器310做出BT/TT分割決定618。
BT/TT分割決定616指示水平分割是否是透過返回「0」指示的二元分割514,或透過返回「1」指示的三元分割518。當BT/TT分割決定616指示二元分割時,在產生HBT CTU節點步驟625,根據二元水平分割514由塊分割器310產生兩個節點。當BT/TT分割616指示三元分割時,在產生HTT CTU節點的步驟626,根據三元水平分割518由塊分割器310產生三個節點。
BT/TT分割決定618指示垂直分割是否是透過返回「0」指示的二元分割516,或透過返回「1」指示的三元分割520。當BT/TT分割618指示二元分割時,在產生VBT CTU節點步驟627,根據垂直二元分割516,由塊分割器310產生兩個節點。當BT/TT分割618指示三元分割時,在產生VTT CTU節點的步驟628根據垂直三元分割520,由塊分割器310產生三個節點。對於從步驟625-628得到的每個節點,取決於方向614,以從左到右或從上到下的順序應用資料流600的遞歸回到MT分割決定612。結果,可以應用二元樹和三元樹分割來產生具有各種大小的CU。
參考圖9進一步描述在編碼樹的每個節點處的允許和不允許分割的集合。
圖7A和7B提供CTU 710到多個CU或CB的示例劃分700。示例CU 712在圖7A中顯示。圖7A顯示CTU 710中的CU的空間配置。示例劃分700也被示為圖7B中的編碼樹720。
在圖7A的CTU 710中的每個非葉節點處,例如節點714、716和718,包含的節點(其可以進一步劃分或可以是CU)以「Z順序」被掃描或遍歷以創建節點列表,表示為編碼樹720中的行。對於四元樹分割,Z順序掃描導致從左上到右,接著從左下到右的順序。對於水平和垂直分割,Z順序掃描(遍歷)分別簡化為從上到下掃描和從左到右掃描。圖7B的編碼樹720根據所應用的掃描順序列出所有節點和CU。每個分割在樹的下一級產生兩個、三個或四個新節點的列表,直到到達葉節點(CU)。
已經藉由塊分割器310將影像分解成CTU並且進一步分解成CU,並且如參考圖3所描述的那樣使用CU來產生每個殘餘塊(324),殘餘塊經歷視頻編碼器114的順向變換和量化。隨後掃描所得到的TB 336以形成殘餘係數的順序列表,作為熵編碼模組338的操作的一部分。在視訊解碼器134中執行等效程序以從位元流133獲得TB。
圖7A和7B的示例描述適用於亮度通道和色度通道的編碼樹。然而,圖7A和7B的示例還顯示在僅適用於亮度通道的編碼樹或僅適用於色度通道的編碼樹的遍歷方面的行為。對於具有許多巢式分割的編碼樹,較深級別的可用分割選項受到對對應小區域的可用塊大小的限制的約束。對小區域的可用塊大小的限制被強加以防止塊處理速率的最壞情況如此高以至於對實施施加不合理的負擔。特別是,塊大小的約束是色度中的16(十六)個樣本的倍數使得實施能夠以16(十六)個樣本的粒度處理樣本。將塊大小約束為16個樣本的倍數與「圖框內重建」反饋迴路特別相關,即圖4的視訊解碼器134中涉及模組450、460、468、476和484的路徑,以及視訊編碼器114中的等效路徑。特別地,將塊大小約束為16(十六)個樣本的倍數有助於維持圖框內預測模式中的輸出量。例如,「同時資料多指令」(SIMD)微處理器架構通常在可能包含16個樣本的寬字上操作。而且,硬體架構可以使用寬匯流排,例如具有16個樣本寬度的匯流排,以沿著圖框內重建反饋迴路傳送樣本。如果使用較小的塊大小,例如四個樣本,則匯流排將未充分利用,例如僅包含樣本資料的匯流排寬度的四分之一。儘管未充分利用的匯流排可以處理較小的塊(即少於16個樣本),但在最壞的情況下,例如許多或所有塊的尺寸相對較小,未充分利用可能導致阻止編碼器(114)或解碼器(134)的即時操作。對於圖框間預測,每個塊取決於從圖框緩衝器(例如緩衝器372或496)獲得的參考樣本。由於在處理前一圖框時用參考樣本填充圖框緩衝器,因此不存在影響用於產生圖框間預測塊的逐塊操作的反饋依賴性迴路。除了有關圖框內重建的反饋依賴性迴路之外,存在與圖框內預測模式458的確定相關的附加和並發反饋迴路。透過從最可能模式列表中選擇模式來確定圖框內預測模式458,或從剩餘模式列表中選擇一種模式。確定最可能模式列表和剩餘模式列表需要相鄰塊的圖框內預測模式。當使用相對小的塊大小時,需要更頻繁地確定最可能的模式列表和剩餘的模式列表,即,在由樣本中的塊大小和通道的取樣率控制的頻率處。
圖8是顯示由使用4:2:0色度格式產生的色度通道的變換塊大小和相關掃描模式的集合800的圖。集合800還可以用於4:2:2色度格式。所描述的配置適用於具有色度格式的影像圖框,其中影像圖框的色度通道相對於影像圖框的亮度通道進行次取樣,特別是對於4:2:0和4:2:2格式。集合800不包括所有可能的色度變換塊大小。圖8中僅顯示寬度小於或等於十六或小於或等於八的高度的色度變換塊。可能出現具有更大寬度和高度的色度塊,但是為方便參考起見未在圖8中顯示。對於在亮度和色度通道之間共享編碼樹的情況,附加色度變換大小是2×16、4×16、8×16、16×16和32×32。對於色度通道的編碼樹與亮度通道的編碼樹(「雙編碼樹」)分離的情況,還可以使用以下附加色度變換尺寸:2×32、4×32、8×32、16×32、32×2、32×4、32×8和32×16。然而,集合800顯示用於掃描TB的方法,其可以類似地應用於掃描較大的TB。
一組禁止變換大小810包括變換塊大小2×2、2×4和4×2,所有變換塊大小具有少於十六個樣本的區域。換句話說,16(十六)個色度樣本的最小變換大小由所描述的配置的操作產生,特別是對於圖框內預測的CB。透過確定如參考圖9所述的分割選項來避免禁止變換大小810的實例。變換中的殘餘係數以兩層方法掃描,其中變換被分成「子塊」(或「係數組」))。掃描沿著掃描路徑從最後有效(非零)係數返回到DC(左上)係數。掃描路徑被定義為每個子塊(「下層」)內的進展和從一個子塊到下一個子塊(「上層」)的進展。在集合800中,8×2TB 820使用8×2子塊,即包含16個殘餘係數的子塊。2×8TB 822使用2×8子塊,即也包含16個殘餘係數。
寬度或高度為2,另一個尺寸為8的倍數的TB使用多個2×8或8×2子塊。因此,在一些情況下具有兩個樣本的寬度的色度塊使用塊劃分成子塊來編碼,每個大小為2×8的樣本以及在一些情況下具有兩個樣本的高度的色度塊使用塊劃分成子塊來編碼,每個大小為8×2的樣本。。例如,16×2TB 816具有兩個8×2子塊,每個子塊如圖所示被掃描到TB 820。掃描從一個子塊到下一個子塊,如子塊進展817所示。
2×32TB(圖8中未顯示)使用四個2×8子塊,排列為一乘四之陣列。如針對2×8TB 822所示掃描每個子塊中的殘餘係數,其中子塊從一乘四陣列的最低子塊一直到最高的子塊。
較大的TB遵循類似的掃描進展。對於寬度和高度均大於或等於4的所有TB,使用4×4子塊掃描。例如,4×8TB 823使用4×4子塊掃描824,具有從下子塊到上子塊的進展。可以以類似的方式掃描4x4 TB 825。8×8TB 829對四個4×4子塊使用進展830。在所有情況下,子塊內的掃描和子塊到子塊的進展遵循後向對角掃描,即掃描從「最後」有效殘餘係數返回到TB的左上殘留係數。圖8還顯示例如8x4 TB 832、16x4 TB 834和16x8 TB 836的掃描順序。此外,取決於沿掃描路徑的最後有效係數的位置,僅包含從最後有效係數位置返回到子塊的左上殘餘係數的最後有效殘餘係數的子塊的部分需要被掃描。不需要掃描沿前向方向(即,更靠近塊的右下方)的掃描路徑的子塊。如參考圖9所述,集合800並且特別是禁止變換大小810對將編碼樹的區域(或節點)劃分成子區域(或子節點)的能力施加限制。
在使用2×2、2×4和4×2TB(TB組810)的VVC系統中,2×2子塊可以用於兩個樣本的寬度及/或高度的TB。如上所述,TB 810的使用增加圖框內重建反饋依賴性迴路中的輸出量約束。此外,使用僅具有四個係數的子塊增加在更高輸出量下解析殘餘係數的難度。特別地,對於每個子塊,「有效圖」表示其中包含的每個殘餘係數的重要性。一值有效旗標的編碼將殘餘係數的幅度確定為至少為一,並且零值旗標的編碼將殘餘係數的幅度確定為零。剩餘係數幅度(從一開始)和符號僅針對「有效」殘餘係數進行編碼。沒有對有效位進行編碼,並且總是為DC係數編碼幅度(從零開始)。高輸出量編碼器和解碼器可能需要在每個時脈週期對多個有效映射區進行編碼或解碼以維持即時操作。當圖框間依賴性更大時,例如當使用更小的子塊大小時,增加每個週期的多位元子編碼和解碼的難度。在系統100中,子塊大小為16(儘管包含最後有效係數的子塊除外),與塊大小無關。
圖9是顯示用於在使用圖框內預測時產生亮度編碼樹和色度編碼樹中的允許分割的列表的一組規則900的圖。對於特定圖框,包括圖框序列的第一圖框,所有塊都使用圖框內預測。其他圖框可以允許圖框間預測和圖框內預測塊的混合。儘管已經參考圖6描述編碼樹的整組可用分割,但是對可用變換大小的限制對給定區域大小的特定分割選項施加約束。如下所述,根據對應編碼樹單元的區域的尺寸確定每個亮度和色度通道的分割選項。
由於VVC允許對亮度和色度樣本使用不同的編碼樹,因此色度樣本允許的分割選項與亮度樣本的分割選項不同。因此,規則組900被劃分成用於色度區域的一組規則920和用於亮度區域的一組規則910。針對亮度編碼樹和色度編碼樹顯示單獨的規則,使得能夠將不同的變換塊集合用於亮度通道和色度通道。特別地,不要求可用於亮度通道和色度通道的塊的集合透過色度格式相關。在遍歷編碼樹的節點時,透過檢查具有區域大小的一組分割選項的可用性來獲得允許分割的列表。導致可以使用CB編碼的區域的分割選項被添加到允許分割列表中。對於使用CB編碼的區域,區域大小必須能夠使用來自集合800的特定大小的整數變換進行編碼。特定大小被選擇為不超過區域大小的最大大小(考慮寬度和高度)。因此,對於較小的區域,使用單一變換,並且在區域大小超過最大可用變換的區域大小的情況下,最大可用變換被平鋪以佔據整個區域。
當利用組920處理色度區域時,產生分割選項的初始分割列表。針對區域大小測試每個分割選項以確定分割選項是否將導致禁止大小的子區域,該子區域小於集合800的變換的大小。導致允許大小的子區域的分割選項被添加到允許的色度分割列表970,該子區域與集合800的最小變換大小的整數相匹配。
例如,如果處於QT模式(對應於圖6的決定610),如果該區域具有4:2:0格式的8×8大小或4:2:2格式的8×16,則不允許四元樹分割,對於色度通道,分割將導致分別為2x2或2x4的變換大小。允許的區域尺寸由箭頭921所指。類似地,用於色度規則組920的其他允許的分割由箭頭922、923、924、925和926所指並且如關於以下圖10和11所討論的那樣。
根據亮度樣本網格說明色度通道的區域大小。例如,當使用4:2:0色度格式時,8×4區域對應於色度通道的4×2變換。當使用4:2:2色度格式時,8×4區域對應於色度中的4×4變換。當使用4:4:4色度格式時,色度不針對亮度進行次取樣,因此色度中的變換大小對應於區域大小。
允許的亮度變換分割有關不同的最小尺寸約束,不允許4x4。儘管4x4亮度PB滿足16個樣本的倍數的要求,但亮度的取樣率是4:2:0色度格式的視訊的每個色度通道的取樣率的四倍。儘管4x4亮度預測塊不會導致匯流排利用不足(例如,在SIMD架構或寬度為16個樣本的匯流排架構中),但是圖框內重建反饋迴路和圖框內預測模式確定反饋迴路難以適應相對高取樣率的操作。禁止亮度通道中的4x4塊將反饋迴路的嚴重性降低到高取樣率下可實施的位準。類似於規則組920,組910中允許的分割由箭頭901至906顯示,並用於產生允許的分割的列表972。允許的分割選項進一步關於以下的圖10和11予以描述。
圖10顯示將影像圖框的編碼樹編碼為視訊位元流的方法1000。如參考圖12所述,對亮度編碼樹和色度編碼樹中的每一個執行方法1000,導致確定CTU的每個編碼樹並將得到的編碼樹編碼到位元流115中。方法1000可以透過諸如配置的FPGA、ASIC或ASSP之類的設備來實施。另外,方法1000可以由視訊編碼器114在處理器205的執行下實施。因此,方法1000可以儲存在電腦可讀儲存媒體上及/或記憶體206中。針對每個CTU的亮度編碼樹和色度編碼樹調用的方法1000在產生初始分割選項步驟1010開始,其中「目前節點」(或目前區域)是亮度或編碼樹的根,即佔據整個CTU的區域。當塊分割器310接收到圖框資料113時,方法1000由編碼器114針對每個亮度和色度編碼樹實施。
在產生初始分割選項步驟1010,處理器205為編碼樹的目前節點產生分割選項。根據方法1000的迭代,為亮度通道或色度通道產生分割選項。最初,編碼樹處於四元樹(QT)階段,其中唯一允許的分割是四元樹分割(見圖5的分割512)或分割停止(見圖5的510)。此外,對於編碼為僅使用圖框內預測塊的圖框或切片,亮度和色度編碼樹包括在其根節點處的四元樹分割。因此,對於128x128 CTU,當使用4:2:0色度格式時,最大亮度圖框內預測CB是64x64並且最大色度圖框內預測CB是32x32。對於被編碼為使用圖框內預測塊和圖框間預測塊中的任一者或兩者的切片的圖框,亮度和色度編碼樹不需要在其根節點處包括四元樹分割。但是,不允許圖框內預測的CB跨越64x64亮度樣本網格的邊界。當四元樹分割停止時,編碼樹被稱為處於多樹(MT)階段,對應於圖6的決定312。在多樹階段,分割選項是(i)停止分割(即510),在這種情況下,使用CB對與目前節點對應的區域進行編碼,或者(ii)繼續分割。作為初始分割選項,可以使用水平和垂直方向上的二元和三元分割(參見圖5的514-520)。作為步驟1010的結果,創建用於編碼樹階段(即QT或MT)的所有可能分割的列表。處理器205中的控制從步驟1010進展到確定色度格式步驟1020。
在確定色度格式步驟1020,處理器205將圖框資料113的色度格式確定為4:2:0色度格式或4:2:2色度格式之一。色度格式是圖框資料的屬性,並且在操作期間不會改變。因此,色度格式透過諸如配置檔案或暫存器之類的配置提供給視訊編碼器113。確定的色度格式在位元流113中被編碼,例如使用「chroma_format_idc」語法元素,僅針對視訊編碼一次。處理器205中的控制從步驟1020進展到產生允許分割步驟1030。
在產生允許分割步驟1030,處理器205應用規則以將允許的分割類型約束到步驟1010的每個分割選項以產生允許的分割列表。當處理亮度編碼樹時,透過執行步驟1030創建允許的亮度分割列表972。當處理色度編碼樹時,在執行步驟1030時創建允許的色度分割列表970。約束允許的分割類型的規則考慮每個亮度通道和色度通道中的可用變換大小。
一般來說,對於亮度通道中的N×M變換,當使用4:2:0色度格式存在可用於色度通道的N/2×M/2變換或當使用4:2:2色度格式時,存在可用於色度通道的N/2×M變換時。因此,分割規則通常對於亮度和色度通道是等效的。但是,針對小塊大小也有例外。尤其是,4×8和8×4亮度變換在色度上沒有對應的2×4和4×2變換。同樣不允許的是導致4×4亮度變換或2×2色度變換的分割。規則在亮度通道和色度通道中是等效的,因為2×2色度變換的區域大小是4:2:0色度格式的4×4亮度樣本。
在亮度變換集與色度變換集不同的程度上,亮度和色度之間的允許分割選項存在差異。當在編碼樹中處理亮度節點時,對於每個分割選項(如圖9中所示的510-520),評估亮度節點的區域大小。總是允許無分割情況(510),因此總是將其添加到允許的亮度分割列表972,如箭頭912所示。當區域大小為8×8時,不允許使用四元樹分割(512),避免使用不允許的4×4亮度變換大小。對於較大的區域大小,允許四元樹分割並且將其添加到允許的亮度分割列表972,如箭頭911所示。當在亮度編碼樹的MT階段中,不允許以下分割以防止使用4×4亮度變換: - 4×8區域的水平二元分割(避免一對4×4塊)。允許剩餘分割,如箭頭913所示。 - 8×4區域的垂直二元分割(避免一對4×4塊)。允許剩餘分割,如箭頭914所示。 - 4×16或更小區域的水平三元分割(避免第一和第三分割塊為4×4塊)。允許剩餘分割,如箭頭915所示。 - 16x4或更小區域的垂直三元分割(避免第一和第三分割塊為4×4塊)。允許剩餘分割,如箭頭916所示。
另外,禁止任何導致高度寬度小於4的塊的亮度分割。如果不遇到由於避免寬度或高度小於4並且塊大小為4×4而對分割的限制,則將分割添加到允許的亮度分割列表972中。
當在色度編碼樹中處理色度節點時,對於每個分割選項,查閱關於節點的區域大小的對應規則以確定是否將分割選項添加到允許的色度分割列表970。與亮度編碼樹一樣,色度編碼樹在「QT」階段(對應於圖6的決定610)開始,其中允許四元樹分割512或不分割510。一旦發生無分割510,編碼樹就進入「MT」階段(對應於圖6的決定612)。在MT階段,(i)不分割表示存在佔據與節點相關聯的區域的CB,或者(ii)分割514-520中的其中之一者出現。分割514-520中的其中之一者出現。分割514-520中的其中之一者的出現將該區域劃分成子區域。還評估每個得到的子區域以確定允許的分割選項。
如果在編碼樹的QT階段並且使用4:2:0色度格式,則節點具有已經達到8×8的區域大小(即,4×4色度變換),則不可能進一步進行四元樹分割。此外,沒有其他分割選項可用。可用選項是針對節點的允許色度分割添加「無分割」。因此,節點處存在單一4×4 CB。
如果在編碼樹的QT階段並且使用4:2:2色度格式,該節點具有8×16的區域大小(即4×8色度變換),則不再有四元樹分割是可能的,並且步驟1030進入編碼樹的MT階段。MT階段中的8×16區域可以具有單一4×8色度變換或者可以具有導致兩個8×8區域且因而一對4×4色度變換水平分割,或是可以具有導致兩個4×16個區域且因而一對2×8色度變換的垂直分割。在MT階段的色度編碼樹中,將導致大小為4×4、4×8和8×4的區域且因而引入大小為2×2、2×4和4×2的變換的分割被禁止,並且列出如下: - 8×8區域的水平二元分割(避免一對4×2色度變換)或4×16區域(避免一對2×4色度變換)。允許剩餘分割,如箭頭923所示。 - 8×8區域的垂直二元分割(避免一對2×4色度變換)或16×4區域(避免一對4×2色度變換)。允許剩餘分割,如箭頭924所示。 - 4×16區域的水平三元分割(避免使用2×2色度變換的第一和第三子區域以及使用色度變換的中心2×4子區域)或8×16區域(避免第一和第三子區域中的2×4色度變換)。允許剩餘分割,如箭頭925所示。
16×4區域的垂直三元分割(避免使用2×2色度變換的第一和第三子區域以及使用色度變換的中心4×2子區域)或16×8區域(避免第一和第三子區域中的4×2色度變換)。允許剩餘分割,如箭頭926所示。
除上述約束之外,禁止導致具有小於2的寬度或高度的子區域的分割。考慮步驟1010的每個分割選項,參考上述規則,並且在執行步驟1030時將未禁止的分割選項添加到色度分割選項列表970中。一旦初始分割選項被細化為允許分割的列表 (用於色度的列表970和用於亮度的列表972),塊分割器310藉由根據拉格朗日最佳化來評估預測模式和編碼成本來選擇允許的分割之一。處理器205中的控制從步驟1030進展到零允許分割測試1040。
在零允許分割測試1040處,處理器205測試分割選項列表(970或972)是否僅包含「無分割」項目(分割510)。如果如此(步驟1040為「是」),則不可能進一步分割。CB存在於目前節點處,並且處理器205中的控制進展到編碼編碼塊步驟1070。如果分割是可能的(步驟1040處的「否」),則處理器205中的控制進展到編碼樹階段測試步驟1050。
在編碼樹階段測試步驟1050,處理器205檢查編碼樹中的目前節點的階段,即階段是QT還是MT。如果節點處於QT階段,則塊分割器310的決定將保持在QT階段,並且處理器205中的控制進展到編碼QT分割步驟1055。如果節點處於MT階段或塊分割器310的決定是將從QT階段轉換到用於編碼樹的目前節點的MT階段,則處理器205中的控制進展到編碼MT分割步驟1060。
在編碼QT分割步驟1055,熵編碼器338在處理器205的執行下,將值為「1」的QT分割旗標(如關於圖6的決定610所描述者)編碼進位元流115。具有值1的QT分割旗標指示目前節點劃分成四個子模式,即四元樹分割512。處理器205中的控制從步驟1055進展到遞歸子區域步驟10100。
在編碼MT分割步驟1060,熵編碼器338在處理器205的執行下,將另外的旗標編碼到位元流115中以指示MT分割的類型。如果目前節點處於從編碼樹的QT階段到MT階段的轉變,則將具有值「0」的QT分割旗標(如關於圖6的決定610所描述者)編碼到位元流115中。如果在步驟1030中確定允許除「無分割」情況之外的至少一個分割,則MT分割旗標指示選擇無分割510(對於MT分割旗標編碼「0」,參見圖6的決定612)。步驟1060返回「否」,並且處理器205中的控制進展到編碼編碼塊步驟1070。
否則,透過對用於MT分割旗標(即612)的「1」進行編碼來指示塊分割器310對分割514-520之一的選擇。步驟1060返回「是」且在處理器205中控制進展到編碼B/T H/V分割步驟1090。
在編碼編碼塊步驟1070,熵編碼器338在處理器205的執行下將編碼塊的預測模式和殘餘係數編碼到位元流115中。對於圖框內預測的CB,編碼圖框內預測模式且對於圖框間預測的CB,運動向量被編碼。根據從掃描路徑中的最後有效殘餘係數返回到塊的DC係數的掃描對殘餘係數進行編碼。
此外,係數被分組為「子塊」,對於該子塊,如果適當地指示子塊中存在至少一個有效殘餘係數,則對該子塊旗標進行編碼。如果子塊中不存在有效殘餘係數,則不需要為子塊中的每個殘餘係數編碼單獨的有效旗標。包含最後有效殘餘係數的子塊不需要編碼子塊旗標。對於包含DC(塊的左上方)殘餘係數的子塊,不編碼編碼子塊旗標。子塊大小總是4×4(亮度),色度是給定塊的2×8或4×4或8×2之一,如圖8所示。因此,子塊大小始終為16,與集合800中的情況一樣,其符合總是16的倍數的塊大小。處理器205中的控制進展到從步驟1070到最後的編碼塊測試步驟1080。
在最後的編碼塊測試1080處,處理器205確定目前編碼塊是否是編碼樹中的最後一個CB。憑藉分層Z順序掃描,最後一個CB是佔據CTU右下角的CB。如果目前CB是編碼樹中的最後一個(步驟1080處的「是」),則方法1000終止。一旦方法1000處理亮度編碼樹,就調用方法1000來處理色度編碼樹。處理器205可並行執行方法1000的兩個實例以處理亮度編碼樹和色度編碼樹。如果方法1000的兩個實例並行執行,則熵編碼器338以串列化方式對亮度和色度執行操作以產生確定性位元流。也就是說,並列編碼器產生的位元流必須可由串列解碼器解碼。否則,如果步驟1080返回「否」,則目前節點根據分層Z順序掃描進展到下一個節點,如圖7A和7B所示。處理器205中的控制進展到產生初始分割選項步驟1010。
在編碼B/T H/V分割步驟1090,熵編碼器338在處理器205的執行下,將附加旗標編碼到位元流115中,指示塊分割器310選擇允許分割列表的哪個分割。如果允許的分割列表僅包括除「無分割」情況之外的一個分割,塊分割器310必須已經選擇一個分割,並且不需要編碼額外的旗標來識別分割。如果允許的分割列表包括水平和垂直方向上的分割,則熵編碼器338對指示由塊分割器310選擇的分割的方向的旗標進行編碼。如果允許的分割列表包括二元和三元分割,熵編碼器338對指示由塊分割器310選擇的分割的類型(即二元或三元)的旗標進行編碼。處理器205中的控制從步驟1090進展到遞歸子區域步驟10100。
在遞歸子區域步驟10100,處理器205根據所確定的步驟1030的分割產生子區域。對於每個產生的子區域或節點遞歸地調用方法1000,從而導致整個編碼樹的遞歸。根據編碼樹的分層Z順序掃描,方法1000的遞歸調用從一個子區域或節點進展到下一個子區域或節點,如圖7A和7B所示。當由方法1000處理由分割產生的子節點以產生子區域時,遞歸進展到編碼樹中的下一個兄弟節點。如果沒有其他兄弟節點,則遞歸進展到父節點,此時選擇下一個節點(例如,父節點的兄弟節點)作為要為其產生子區域的下一個節點。在父節點處於編碼樹的QT階段的情況下,返回父節點導致返回到編碼樹的QT階段。
因此,步驟1055、1060、1090和1070中的每一個操作以將所確定的允許的分割選項的旗標編碼到位元流。針對色度或亮度通道之一確定每個分割選項。可以基於編碼樹的區域的尺寸來確定分割選項。
圖11顯示用於從視訊位元流解碼影像圖框中的編碼樹的方法1100。如參考圖13所述,對亮度編碼樹和色度編碼樹中的每一個執行方法1100,導致對CTU和位元流133的每個編碼樹進行解碼。方法1100可以由設備(諸如配置的FPGA、ASIC或ASSP)實施。另外,方法1100可以在處理器205的執行下由視訊解碼器134執行。因此,方法1100可以儲存在電腦可讀儲存媒體上及/或記憶體206中。針對每個CTU的亮度編碼樹和色度編碼樹調用的方法1100在產生初始分割選項步驟1110開始,其中「目前節點」(或目前區域)是亮度或編碼樹的根,亦即佔據整個CTU的區域。
在產生初始分割選項步驟1110,處理器205為編碼樹的目前節點產生分割選項。最初,編碼樹處於四元樹(QT)階段,其中唯一允許的分割是四元樹分割(分割512),或者分割停止(分割510)。此外,對於編碼為僅使用圖框內預測塊的圖框或切片,亮度和色度編碼樹包括在其根節點處的四元樹分割。當四元樹分割停止時,編碼樹被稱為處於多樹(MT)階段。在多樹階段中,分割選項將停止分割(使用510),在這種情況下,使用CB對與目前節點對應的區域進行編碼,或者繼續分割。作為初始分割選項,水平和垂直方向上的二進位和三元分割(分割514-520)是可用的。作為步驟1110的結果,創建用於編碼樹階段(即QT或MT)的所有可能分割的列表。處理器205中的控制進展到確定色度格式步驟1120。
在確定色度格式步驟1120,處理器205將圖框資料135的色度格式確定為4:2:0色度格式或4:2:2色度格式之一。例如,在處理器205的執行下,熵解碼器420可以從位元流113讀取「chroma_format_idc」語法元素,以確定色度格式。處理器205中的控制從步驟1120進展到產生允許分割步驟1130。
在產生允許分割步驟1130,處理器205應用規則以將允許的分割類型約束到步驟1110的每個分割選項,以產生允許的分割列表。當處理亮度編碼樹時,創建允許的亮度分割列表972。步驟1130以與方法100的步驟1030相同的方式操作,因此視訊解碼器134中的亮度和色度編碼樹中的節點的允許分割列表與視訊編碼器114中的亮度和色度編碼樹中的節點的允許分割列表相同。步驟1030操作以用於根據是否正在處理亮度或色度編碼樹來產生允許的分割列表970和972中的其中一者。如關於步驟1030和圖9所描述的,色度分割選項與亮度分割選項不同,並且色度分割選項導致具有16個樣本的最小尺寸的塊。處理器205中的控制進展到QT/MT測試步驟1140。
在QT/MT測試步驟1140,處理器205測試目前節點(區域)是否處於編碼樹的QT階段或編碼樹的MT階段。如果目前節點處於編碼樹的QT階段並且允許的分割列表包括「四元分割」選項(分割512),則處理器中的控制進展到解碼QT分割步驟1155。如果目前節點是在編碼樹的QT階段並且允許的分割列表中不包括「四分割」選項,即只允許「無分割」選項,則編碼樹階段轉移到「MT」階段並且在處理器205中的控制進展到零允許分割測試1150。如果編碼樹已經在MT階段,則處理器205中的控制進展到零允許分割測試1150。
在零允許分割測試1150處,處理器205測試分割選項列表(即,分別針對色度和亮度編碼樹的970或972)是否僅包含「無分割」項目(510)。如果分割選項列表僅包含無分割項目,則不可能進一步分割,並且目前節點上存在CB。步驟1150返回「是」,並且處理器中的控制進展到解碼編碼塊步驟1170。如果進一步分割是可能的(步驟1150為「否」),則處理器中的控制進展到解碼MT分割步驟1160。
在解碼QT分割步驟1055,熵解碼器420在處理器205的執行下,對來自位元流133的QT分割旗標(即,610)進行解碼,該旗標指示目前節點是否劃分成四個子模式,即,將發生四元樹分割512。如果不發生四元樹分割(步驟1155為「否」),則處理器205中的控制進展到零允許分割測試1150。如果要發生四元樹分割(步驟1155為「是」),則在處理器205中的控制進展到遞歸子區域步驟11100。
在解碼MT分割步驟1060,熵解碼器420在處理器205的執行下,對來自位元流133的進一步旗標進行解碼以指示MT分割的類型。如果在步驟1130確定允許除「無分割」情況之外的至少一個分割,則MT分割旗標指示選擇無分割510(對於MT分割旗標解碼「0」,即612)。步驟1060返回「否」,並且處理器205中的控制進展到解碼編碼塊步驟1170。否則,透過解碼用於MT分割旗標的「1」,即612來指示選擇允許分割(970或972)的分割514-520之一的需要。步驟1060返回「是」,並且處理器205中的控制進展到解碼B/T H/V分割步驟1190。
在解碼編碼塊步驟1170,熵解碼器420在處理器205的執行下,對來自位元流133的編碼塊的預測模式和殘餘係數進行解碼。對於圖框內預測的CB,解碼圖框內預測模式並且對於圖框間預測的CB,解碼運動向量。根據從掃描路徑中的最後有效殘餘係數返回到塊的DC係數的掃描來對殘餘係數進行解碼。此外,係數被分組為「子塊」,對於該子塊,可以對編碼的子塊旗標進行解碼,以指示子塊中存在至少一個有效殘餘係數。如果子塊中不存在有效殘餘係數,則不需要為子塊中的每個殘餘係數解碼各個有效旗標。包含最後有效殘餘係數的子塊不需要解碼子塊旗標,並且對於包含DC(塊的左上方)殘餘係數的子塊不解碼編碼子塊旗標。子塊大小總是4×4(亮度),色度是給定塊的2×8或4×4或8×2之一,如圖8所示。因此,子塊大小始終為16與集合800中的情況一樣,其符合總是16的倍數的塊大小。處理器205中的控制進展到最後的編碼塊測試步驟1180。
在最後的編碼塊測試1180,處理器205確定目前編碼塊是否是編碼樹中的最後一個CB。憑藉分層Z順序掃描,最後一個CB是佔據CTU右下角的CB。如果目前CB是編碼樹中的最後一個,則步驟1180返回「是」,並且方法1100終止。一旦方法1100解碼亮度編碼樹,就調用方法1100來解碼色度編碼樹。否則,目前節點根據分層Z順序掃描進展到下一個節點,如圖7A和7B所示。步驟1180返回「否」,並且處理器205中的控制進展到產生初始分割選項步驟1110。為正確地解析位元流133,視訊解碼器134通常以與它們被視訊編碼器114寫入的順序相同的順序讀取旗標和其他語法元素。然而,如果滿足它們的依賴性,則可以以不同的順序及/或同時地執行其他操作。例如,可以並行執行諸如用於亮度和色度圖框內重建的那些操作集合。
在解碼B/T H/V分割步驟1190,熵解碼器420在處理器205的執行下,對來自位元流133的附加旗標進行解碼,指示視訊解碼器134將執行允許分割列表的哪個分割。當允許的分割列表僅包括除「無分割」情況之外的一個分割時,需要執行一個分割,因為沒有其他替代方案。因此,不需要解碼附加旗標來識別分割。然後,處理器205中的控制進展到遞歸子區域步驟11100。當允許的分割列表包括水平和垂直方向上的分割時,從位元流133解碼指示分割方向的旗標。如果允許分割列表包括在二元和三元分割中,從位元流133確定指示分割的類型(即二進製或三進制)的旗標。處理器205中的控制進展到遞歸子區域步驟11100。
在遞歸子區域步驟11100,產生根據所確定的步驟1190或1155的劃分的處理器205子區域,並且針對這些子區域或節點中的每一個調用方法1100,從而導致整個編碼樹的遞歸。方法1100的遞歸調用根據編碼樹的分層Z順序掃描從一個子區域或節點進展到下一個子區域或節點,如圖7A和7B所示。如果已經處理由分割產生的子節點以產生塊或子區域,則遞歸進展到編碼樹中的下一個兄弟節點。如果沒有其他兄弟節點,則遞歸進展到父節點或區域。選擇下一個節點(例如,父節點的兄弟節點)作為要處理的下一個節點。如果父節點處於編碼樹的QT階段,則返回父節點導致返回到編碼樹的QT階段。
因此,步驟1155、1160、1190和1170用於透過從位元流133確定旗標來解碼編碼樹單元的編碼單元,以選擇亮度分割選項之一和在步驟1130確定的色度分割選項之一。
作為方法1000和1100並且特別是步驟1030和1130的結果,避免在圖框內重建迴路中難以以高速率處理的色度通道的相對小的圖框內預測塊。避免小塊有利於以高解析度及/或圖框率實施,其中「像素速率」(需要處理的每秒像素)高而沒有不可接受的品質下降。
圖12顯示用於將影像圖框的亮度和色度編碼樹編碼為視訊位元流的方法1200。方法1200可以由諸如配置的FPGA、ASIC或ASSP的設備來體現。另外,方法1200可以由視訊解碼器114在處理器205的執行下實施。因此,方法1200可以儲存在電腦可讀儲存媒體上及/或記憶體206中。方法1200在劃分圖框成CTU步驟1210開始。
在劃分圖框到CTU步驟1210中,塊分割器310在處理器205的執行下將圖框資料113的目前圖框劃分成CTU陣列。開始由分割產生的CTU的編碼進程。處理器中的控制從步驟1210進展到編碼亮度編碼樹步驟1220。
在編碼亮度編碼樹步驟1220,視訊編碼器114在處理器205的執行下實施方法1000以確定目前CTU的亮度編碼樹並將其編碼到位元流115中。目前CTU是由執行步驟1210得到的一個CTU中選定的一個。處理器205中的控制從步驟1220進展到編碼色度編碼樹步驟1230。
在編碼色度編碼樹步驟1230,視訊編碼器114在處理器205的執行下執行方法1000以確定目前CTU的色度編碼樹並將其編碼到位元流115中。處理器205中的控制從步驟1230進展到最後的CTU測試步驟1240。
在最後的CTU測試步驟1240,處理器205測試目前CTU是否是切片或圖框中的最後一個。如果不是(步驟1240處的「否」),則視訊編碼器114進展到圖框中的下一個CTU,並且處理器205中的控制從步驟1240返回到步驟1220以繼續處理圖框中的剩餘CTU。如果CTU是圖框或片中的最後一個,則步驟1240返回「是」,並且方法1200終止。
圖13是用於從視訊位元流解碼影像圖框的亮度和色度編碼樹的方法1300的流程圖。方法1300可以由諸如配置的FPGA、ASIC或ASSP的設備實施。另外,方法1300可以由視訊解碼器134在處理器205的執行下執行。因此,方法1300可以儲存在電腦可讀儲存媒體上及/或記憶體206中。方法1300在劃分圖框成CTU步驟1310開始。
在劃分圖框成CTU步驟1310,視訊解碼器134在處理器205的執行下,確定要被解碼成CTU陣列的圖框資料133的目前圖框的劃分。開始由確定的劃分產生的CTU上的解碼進程。處理器中的控制從步驟1310進展到解碼亮度編碼樹步驟1320。
在解碼亮度編碼樹步驟1320,視訊解碼器134在處理器205的執行下,第一次執行方法1100,以使目前CTU從位元流133解碼目前CTU的亮度編碼樹。目前CTU是從步驟1310的執行得到的CTU中選定的一個。處理器205中的控制從步驟1320進展到解碼色度編碼樹步驟1330。
在解碼色度編碼樹步驟1330,視訊解碼器134在處理器205的執行下,第二次執行方法1100,以使目前CTU從位元流133解碼目前CTU的色度編碼樹。在處理器205中的控制從步驟1330進展到最後的CTU測試步驟1340。
在最後的CTU測試步驟1340,處理器205測試目前CTU是否是切片或圖框中的最後一個。如果不是(步驟1340為「否」),則視訊解碼器134進展到圖框中的下一個CTU,並且處理器205中的控制從步驟1340進展到步驟1320,以繼續從位元流解碼CTU。如果CTU是圖框或片中的最後一個,則步驟1340返回「是」並且方法1300終止。
將殘餘係數分組為大小為16(十六)的子塊有助於實施熵編碼器338和熵解碼器420,例如使用如關於圖8的TB 816和823所描述者。特別是,將殘餘係數分組為大小為16的子塊有助於實施上下文編碼的位元子的算術編碼,例如對於有效圖以允許在每個子塊內使用固定的上下文模式。 產業可應用性
所描述的配置適用於電腦和資料處理工業,特別是用於編碼諸如視訊和影像信號的信號的解碼的數位信號處理,從而實施高壓縮效率。
與HEVC相反,VVC系統允許對亮度和色度通道使用單獨的編碼樹以增加彈性。然而,如上所述,由於使用影響輸出量的較小色度塊,可能發生結果問題。這裡描述的配置確定適當的規則,因為每個編碼樹單元被處理以幫助避免輸出量問題。另外,如上所述,給定用於避免輸出量問題的規則,所描述的配置可以有助於提供用於描述每個編碼樹的上下文編碼位元子的算術編碼的改進的效率和準確度。
以上僅描述本發明的一些實施例,並且可以在不脫離本發明的範圍和精神的情況下對其進行修改及/或改變,這些實施例是說明性的而非限制性的。
100:系統 110:源裝置 112:視訊源 113:圖框資料 114:視訊編碼器 115:位元流 116:發送器 120:通訊通道 122:儲存裝置/儲存器 130:目的地裝置 132:接收器 133:位元流 134:視訊解碼器 135:解碼的圖框資料 136:顯示裝置 200:電腦系統 201:電腦模組 202:鍵盤 203:滑鼠指示器裝置 204:系統匯流排 205:處理器單元 206:記憶體單元 207:音訊-視訊介面 208:介面 209:儲存裝置 210:硬碟驅動器(HDD) 211:I/O介面 212:光學驅動器 213:I/O介面 214:顯示裝置 215:印表機 216:收發器裝置 217:揚聲器 218:連接 219:連接 220:通訊網路 221:連接 222:網路 223:連接 224:連接 225:光學可讀碟儲存媒體/CD-ROM 226:掃描器 227:相機 228:記憶體位置 229:記憶體位置 230:記憶體位置 231:指令 232:資料 233:程式/軟體 234:記憶體 235:記憶體位置 236:記憶體位置 237:記憶體位置 239:控制單元 240:算術邏輯單元(ALU) 241:內部匯流排 242:介面 244:暫存器 245:暫存器 246:暫存器 247:暫存器 248:記憶體 249:ROM 250:開機自我測試(power-on: self-test, POST)程式 251:基本輸入-輸出系統軟體(BIOS)模組 252:啟動載入程式 253:作業系統 254:輸入變數 255:記憶體位置 256:記憶體位置 257:記憶體位置 258:中間變數 259:記憶體位置 260:記憶體位置 261:輸出變數 262:記憶體位置 263:記憶體位置 264:記憶體位置 266:記憶體位置 267:記憶體位置 310:塊分割器 312:編碼塊(CB) 320:預測塊(PB) 322:減法器模組/減法器 324:差 326:變換模組 332:變換係數 334:量化器模組 336:殘餘係數 338:熵編碼器 340:去量化器模組 342:逆變換係數 348:逆變換模組 350:殘餘樣本 352:求和模組 354:重建樣本 356:參考樣本快取 358:參考樣本 360:參考樣本濾波器 362:經濾波的參考樣本 364:圖框內預測模組 366:樣本塊 368:迴路濾波器模組 370:濾波後的樣本 372:圖框緩衝器 374:參考圖框 376:運動估計模組 378:運動向量 380:運動補償模組 382:濾波的參考樣本塊 384:多工器模組 386:模式選擇器 388:圖框內預測模式 420:熵解碼器模組 424:殘餘係數 428:去量化器模組 434:運動補償模組 438:圖框間預測樣本 440:重建變換係數 444:逆變換模組 448:殘餘樣本 450:求和模組 452:解碼的PB 456:重建樣本 458:圖框內預測模式 460:重建樣本快取 464:參考樣本 468:參考樣本濾波器 472:經濾波的參考樣本 476:圖框內預測模組 480:圖框內預測樣本塊 484:多工器模組 488:迴路濾波模組 492:濾波塊資料 496:圖框緩衝器 498:樣本塊 500:集合 510:葉節點 512:四元樹分割 514:水平二元分割 516:垂直二元分割 518:三元分割 520:三元分割 600:資料流 610:四元樹(QT)分割決定 612:多元樹(MT)分割決定 614:方向決定 616:決定 618:決定 620:產生四個新節點 622:葉節點 625:產生HBT CTU節點 626:產生HTT CTU節點 627:產生VBT CTU節點 628:產生VTT CTU節點 700:示例劃分 710:編碼樹單元(CTU) 712:示例CU 714:節點 716:節點 718:節點 720:編碼樹 800:集合 810:禁止變換大小 816:變換塊(TB) 817:子塊進展 820:變換塊(TB) 822:變換塊(TB) 823:變換塊(TB) 824:子塊掃描 825:變換塊(TB) 829:變換塊(TB) 830:進展 832:變換塊(TB) 834:變換塊(TB) 836:變換塊(TB) 900:規則 910:亮度區域的規則 911:箭頭 912:箭頭 913:箭頭 914:箭頭 915:箭頭 916:箭頭 920:色度規則 921:箭頭 922:箭頭 923:箭頭 924:箭頭 925:箭頭 926:箭頭 970:允許的色度分割列表 972:允許的亮度分割列表 1000:方法 1010:產生初始分割選項步驟 1020:確定色度格式步驟 1030:產生允許分割步驟 1040:零允許分割測試 1050:編碼樹階段測試步驟 1055:編碼QT分割步驟 1060:編碼MT分割步驟 1070:編碼編碼塊步驟 1080:最後的編碼塊測試步驟 1090:編碼B/T H/V分割步驟 10100:遞歸子區域步驟 1100:方法 1110:產生初始分割選項步驟 1120:確定色度格式步驟 1130:產生允許分割步驟 1140:QT/MT測試步驟 1150:零允許分割測試 1155:解碼QT分割步驟 1160:解碼MT分割步驟 1170:解碼編碼塊步驟 1180:最後的編碼塊測試步驟 1190:解碼B/T H/V分割步驟 11100:遞歸子區域步驟 1200:方法 1210:劃分圖框成CTU步驟 1220:編碼亮度編碼樹步驟 1230:編碼色度編碼樹步驟 1240:最後的CTU測試步驟 1300:方法 1310:劃分圖框成CTU步驟 1320:解碼亮度編碼樹步驟 1330:解碼色度編碼樹步驟 1340:最後的CTU測試步驟
現在將參考以下圖式和附錄來說明本發明的至少一個實施例,其中:
圖1是顯示視訊編碼和解碼系統的示意方塊圖;
圖2A和2B形成通用電腦系統的示意方塊圖,在該通用電腦系統上可以實施圖1的視訊編碼和解碼系統中的一者或兩者;
圖3是顯示視訊編碼器的功能模組的示意方塊圖;
圖4是顯示視訊解碼器的功能模組的示意方塊圖;
圖5是顯示在多功能視訊編碼的樹結構中塊的可用劃分成一或多個塊的示意方塊圖;
圖6是用於達到塊的允許劃分成多功能視訊編碼的樹結構中的一或多個塊的資料流的示意圖;
圖7A和7B顯示編碼樹單元(CTU)劃分成多個編碼單元的示例;
圖8是顯示變換塊大小以及相關掃描模式的集合的圖;
圖9是顯示用於在亮度編碼樹和色度編碼樹中產生允許分割的列表的規則的圖;
圖10是用於將影像圖框的編碼樹編碼為視訊位元流的方法的流程圖;
圖11是用於從視訊位元流解碼影像圖框的編碼樹的方法的流程圖;
圖12是用於將影像圖框的亮度和色度編碼樹編碼為視訊位元流的方法的流程圖;以及
圖13是用於從視訊位元流解碼影像圖框的亮度和色度編碼樹的方法的流程圖。

Claims (8)

  1. 一種從位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該方法包含: 接收影像圖框,該影像圖框具有色度格式,其中,該影像圖框的色度通道相對於該影像圖框的亮度通道進行次取樣,根據該編碼樹單元的區域的尺寸確定該編碼樹單元的該亮度通道的亮度分割選項; 根據該區域的尺寸確定該編碼樹單元的色度通道的色度分割選項,該色度分割選項與該亮度分割選項不同,允許的色度分割選項導致最小尺寸為16個樣本的色度圖框內預測塊;以及 透過從該位元流確定旗標來解碼該編碼樹單元的編碼塊,以選擇該確定的亮度分割選項之一和該確定的色度分割選項之一。
  2. 如請求項1所述的方法,其中,該色度塊大小是該影像圖框的色度通道的16個樣本的倍數。
  3. 如請求項1所述的方法,其中,該確定的亮度分割選項導致亮度塊大小,該亮度塊大小是該影像圖框的亮度通道的16個樣本的倍數。
  4. 如請求項1所述的方法,其中,該確定的亮度分割選項導致亮度塊大小,其是該影像圖框的亮度通道的16個樣本的倍數,並且具有兩個樣本的寬度的色度塊使用塊劃分成子塊來編碼,每個子塊大小為2乘8個樣本。
  5. 如請求項1所述的方法,其中,該確定的亮度分割選項導致亮度塊大小,其是該影像圖框的亮度通道的16個樣本的倍數,並且,具有兩個樣本的高度的色度塊使用塊劃分成子塊來編碼,每個子塊大小為8乘2個樣本。
  6. 一種非暫態性電腦可讀媒體,其上儲存有電腦程式,用於實施從位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該程式包含: 用於接收影像圖框的碼,該影像圖框具有色度格式,其中,該影像圖框的色度通道相對於該影像圖框的亮度通道進行次取樣; 用於根據編碼樹單元的區域的尺寸確定該編碼樹單元的該亮度通道的亮度分割選項的碼; 用於根據區域的尺寸確定編碼樹單元的色度通道的色度分割選項的碼,該色度分割選項與該亮度分割選項不同,允許的色度分割選項導致具有最小尺寸為16個樣本的色度圖框內預測的塊;以及 用於透過從位元流確定旗標來解碼該編碼樹單元的編碼塊的碼,以選擇該確定的亮度分割選項之一和該確定的色度分割選項之一。
  7. 一種視訊解碼器,經配置用以: 從位元流接收影像圖框的編碼樹單元,該影像圖框具有色度格式,其中,該影像圖框的色度通道相對於該影像圖框的亮度通道進行次取樣; 根據該編碼樹單元的區域的尺寸,確定該編碼樹單元的該亮度通道的亮度分割選項; 根據區域的尺寸確定該編碼樹單元的該色度通道的色度分割選項,該色度分割選項與該亮度分割選項不同,允許的色度分割選項導致最小尺寸為16個樣本的色度圖框內預測塊;以及 透過從該位元流確定旗標來解碼該編碼樹單元的編碼塊,以選擇該確定的亮度分割選項之一和該確定的色度分割選項之一。
  8. 一種系統,包括: 記憶體;以及 處理器,其中,該處理器被配置為用以執行儲存在該記憶體上的碼,用於實施從該位元流解碼影像圖框中的編碼樹單元的編碼塊的方法,該方法包含: 接收影像圖框,該影像圖框具有色度格式,其中,該影像圖框的色度通道相對於該影像圖框的該亮度通道進行次取樣; 根據編碼樹單元的區域的尺寸確定該編碼樹單元的該亮度通道的亮度分割選項; 根據區域的尺寸確定該編碼樹單元的該色度通道的色度分割選項,該色度分割選項與該亮度分割選項不同,允許的色度分割選項產生最小尺寸為16個樣本的色度塊;以及 透過從該位元流確定旗標來解碼該編碼樹單元的編碼塊,以選擇該確定的亮度分割選項之一和該確定的允許的色度分割選項之一。
TW108123622A 2018-09-21 2019-07-04 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統 TWI820165B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU2018233042A AU2018233042A1 (en) 2018-09-21 2018-09-21 Method, apparatus and system for encoding and decoding a tree of blocks of video samples
AU2018233042 2018-09-21

Publications (2)

Publication Number Publication Date
TW202013961A true TW202013961A (zh) 2020-04-01
TWI820165B TWI820165B (zh) 2023-11-01

Family

ID=69886764

Family Applications (2)

Application Number Title Priority Date Filing Date
TW108123622A TWI820165B (zh) 2018-09-21 2019-07-04 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統
TW111118620A TWI820714B (zh) 2018-09-21 2019-07-04 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW111118620A TWI820714B (zh) 2018-09-21 2019-07-04 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統

Country Status (10)

Country Link
US (5) US11595699B2 (zh)
EP (1) EP3854091A4 (zh)
JP (2) JP7191211B2 (zh)
KR (1) KR20210050572A (zh)
CN (1) CN112771866A (zh)
AU (1) AU2018233042A1 (zh)
BR (1) BR112021003783A2 (zh)
MX (1) MX2021003054A (zh)
TW (2) TWI820165B (zh)
WO (1) WO2020056452A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240017109A (ko) 2018-08-28 2024-02-06 후아웨이 테크놀러지 컴퍼니 리미티드 픽처 분할 방법 및 장치
AU2020205376A1 (en) * 2019-01-08 2021-08-12 Huawei Technologies Co., Ltd. Image prediction method, device, apparatus and system and storage medium
WO2020156573A1 (en) * 2019-02-03 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Condition-dependent unsymmetrical quad-tree partitioning
AU2019201649A1 (en) 2019-03-11 2020-10-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a tree of blocks of video samples
MX2022001244A (es) 2019-08-06 2022-02-22 Beijing Bytedance Network Tech Co Ltd Restricción de tamaño basada en formato de color.
BR112022003656A2 (pt) 2019-09-02 2022-05-24 Beijing Bytedance Network Tech Co Ltd Método e aparelho de processamento de dados de vídeo, e, meios de armazenamento e de gravação legíveis por computador não transitórios
BR112022005109A2 (pt) 2019-09-21 2023-03-14 Beijing Bytedance Network Tech Co Ltd Método de processamento de vídeo, aparelho para processamento de dados de vídeo, e, meios de armazenamento e de gravação legíveis por computador não transitórios
US11432018B2 (en) * 2020-05-11 2022-08-30 Tencent America LLC Semi-decoupled partitioning for video coding
CN111598186B (zh) * 2020-06-05 2021-07-16 腾讯科技(深圳)有限公司 基于纵向联邦学习的决策模型训练方法、预测方法及装置
DE102021116357A1 (de) 2020-06-29 2021-12-30 Tyco Electronics Amp Korea Co., Ltd. Steckeranordnung
KR20230002091A (ko) * 2021-06-29 2023-01-05 주식회사 케이티 화면내 예측 기반의 비디오 신호 부호화/복호화 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2390072C (en) * 2002-06-28 2018-02-27 Adrian Gh Podoleanu Optical mapping apparatus with adjustable depth resolution and multiple functionality
US20100220215A1 (en) * 2009-01-12 2010-09-02 Jorge Rubinstein Video acquisition and processing systems
JP2013502150A (ja) 2009-08-12 2013-01-17 トムソン ライセンシング 改善されたイントラ・クロマ符号化および復号のための方法および装置
PL2728869T3 (pl) 2011-06-30 2022-02-28 Sun Patent Trust Sposób dekodowania obrazów
US9807401B2 (en) 2011-11-01 2017-10-31 Qualcomm Incorporated Transform unit partitioning for chroma components in video coding
US8964849B2 (en) 2011-11-01 2015-02-24 Blackberry Limited Multi-level significance maps for encoding and decoding
EP2595380B1 (en) 2011-11-19 2015-10-21 BlackBerry Limited Multi-level significance map scanning
WO2013102293A1 (en) * 2012-01-04 2013-07-11 Mediatek Singapore Pte. Ltd. Improvements of luma-based chroma intra prediction
AU2012200319B2 (en) * 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
CN110602509A (zh) 2012-02-04 2019-12-20 谷歌技术控股有限责任公司 用于最末重要系数位置编码中的上下文减少的设备和方法
WO2013152736A1 (en) * 2012-04-12 2013-10-17 Mediatek Singapore Pte. Ltd. Method and apparatus for block partition of chroma subsampling formats
CN104350753B (zh) * 2012-06-01 2019-07-09 威勒斯媒体国际有限公司 算术解码装置、图像解码装置、算术编码装置以及图像编码装置
US9538175B2 (en) 2012-09-26 2017-01-03 Qualcomm Incorporated Context derivation for context-adaptive, multi-level significance coding
AU2012232992A1 (en) 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
CN104782125B (zh) 2012-11-08 2019-03-15 佳能株式会社 对编码单位的变换单位编码和解码的方法、设备和系统
US11284103B2 (en) * 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
EP2908524A1 (en) * 2014-02-14 2015-08-19 France Brevets An apparatus for encoding an ultra-high definition video sequence
JP2014143716A (ja) * 2014-03-12 2014-08-07 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
WO2016074147A1 (en) * 2014-11-11 2016-05-19 Mediatek Singapore Pte. Ltd. Separated coding tree for luma and chroma
US10362310B2 (en) * 2015-10-21 2019-07-23 Qualcomm Incorporated Entropy coding techniques for display stream compression (DSC) of non-4:4:4 chroma sub-sampling
CN105472389B (zh) * 2015-12-01 2018-11-16 上海交通大学 一种用于超高清视频处理系统的片外缓存压缩方法
WO2017137311A1 (en) 2016-02-11 2017-08-17 Thomson Licensing Method and device for encoding/decoding an image unit comprising image data represented by a luminance channel and at least one chrominance channel
US11095892B2 (en) * 2016-09-20 2021-08-17 Kt Corporation Method and apparatus for processing video signal
US10368080B2 (en) * 2016-10-21 2019-07-30 Microsoft Technology Licensing, Llc Selective upsampling or refresh of chroma sample values
WO2018236028A1 (ko) * 2017-06-21 2018-12-27 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
KR20240017109A (ko) 2018-08-28 2024-02-06 후아웨이 테크놀러지 컴퍼니 리미티드 픽처 분할 방법 및 장치

Also Published As

Publication number Publication date
CN112771866A (zh) 2021-05-07
US20230156243A1 (en) 2023-05-18
BR112021003783A2 (pt) 2021-05-18
EP3854091A1 (en) 2021-07-28
KR20210050572A (ko) 2021-05-07
US20230164363A1 (en) 2023-05-25
US11910028B2 (en) 2024-02-20
TW202234885A (zh) 2022-09-01
JP2023025180A (ja) 2023-02-21
JP7391175B2 (ja) 2023-12-04
TWI820165B (zh) 2023-11-01
US20230164365A1 (en) 2023-05-25
US20220046288A1 (en) 2022-02-10
EP3854091A4 (en) 2022-08-31
US20230156242A1 (en) 2023-05-18
MX2021003054A (es) 2021-05-27
WO2020056452A1 (en) 2020-03-26
AU2018233042A1 (en) 2020-04-09
JP2022500926A (ja) 2022-01-04
US20230164364A1 (en) 2023-05-25
US11595699B2 (en) 2023-02-28
US11930224B2 (en) 2024-03-12
JP7191211B2 (ja) 2022-12-16
TWI820714B (zh) 2023-11-01

Similar Documents

Publication Publication Date Title
TWI820714B (zh) 用於編碼和解碼視訊樣本區塊的樹的方法、設備及系統
KR102579286B1 (ko) 비디오 샘플들의 변환된 블록을 인코딩 및 디코딩하기 위한 방법, 장치 및 시스템
TWI813922B (zh) 從視訊位元流解碼影像和編碼影像為視訊位元流的方法及其解碼設備和編碼設備以及非暫態電腦可讀取媒體
WO2020033991A1 (en) Method, apparatus and system for encoding and decoding a transformed block of video samples
US20240146913A1 (en) Method, apparatus and system for encoding and decoding a tree of blocks of video samples
TWI786392B (zh) 用於編碼及解碼視訊樣本的區塊的方法、設備和系統
TWI788262B (zh) 用以編碼和解碼視頻樣本之區塊樹的方法、設備及系統
TW202126050A (zh) 用於編碼及解碼視訊取樣區段的方法, 設備及系統
WO2020033992A1 (en) Method, apparatus and system for encoding and decoding a transformed block of video samples
US12003787B2 (en) Method, apparatus and system for encoding and decoding a tree of blocks of video samples
TWI836542B (zh) 用以編碼及解碼視訊取樣之轉換區塊的方法、設備和非暫態電腦可讀取儲存媒體
AU2020202285A1 (en) Method, apparatus and system for encoding and decoding a block of video samples
KR20230010707A (ko) 비디오 샘플들의 블록을 인코딩 및 디코딩하기 위한 방법, 장치 및 시스템