TWI821112B - 視頻編解碼系統中跨分量線性模型預測的方法和裝置 - Google Patents

視頻編解碼系統中跨分量線性模型預測的方法和裝置 Download PDF

Info

Publication number
TWI821112B
TWI821112B TW112102683A TW112102683A TWI821112B TW I821112 B TWI821112 B TW I821112B TW 112102683 A TW112102683 A TW 112102683A TW 112102683 A TW112102683 A TW 112102683A TW I821112 B TWI821112 B TW I821112B
Authority
TW
Taiwan
Prior art keywords
syntax
cclm
color
block
current block
Prior art date
Application number
TW112102683A
Other languages
English (en)
Other versions
TW202339502A (zh
Inventor
蔡佳銘
陳俊嘉
徐志瑋
陳慶曄
莊子德
Original Assignee
聯發科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 聯發科技股份有限公司 filed Critical 聯發科技股份有限公司
Publication of TW202339502A publication Critical patent/TW202339502A/zh
Application granted granted Critical
Publication of TWI821112B publication Critical patent/TWI821112B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公開了一種用於視頻編解碼的方法和設備。根據解碼器側的方法,從包括當前塊的編碼資料的位元流中解析出與當前塊是否以CCLM相關模式編碼有關的第一語法。如果第一語法指示當前塊正以CCLM相關模式編碼,則從位元流中解析出第二語法,其中第二語法與是否使用多模型CCLM模式或一個或多個模型參數是否被明確地用信號發送或隱式導出有關。如果第一語法指示當前塊正在以CCLM相關模式編碼,則確定第二顔色塊的模型參數。然後使用包括用於第二顔色塊的跨色預測的預測資料解碼與第二顔色塊相關聯的編碼資料。

Description

視頻編解碼系統中跨分量線性模型預測的方法和裝置
本發明涉及視頻編解碼系統。特別地,本發明涉及視頻編解碼系統中的跨顏色分量線性預測預測(Cross-Colour Linear Prediction,CCLM)。
通用視頻編碼(VVC)是由ITU-T視頻編碼專家組(VCEG)的聯合視頻專家組(JVET)和ISO/IEC運動圖像專家組(MPEG)共同製定的最新國際視頻編碼標準,該標準已作為ISO標準發布:ISO/IEC 23090-3:2021,信息技術-沉浸式媒體的編碼表示-第3部分:通用視頻編碼,2021年2月發布。VVC是在其前身HEVC(High Efficiency Video Coding)通過添加更多的編解碼工具來提高編解碼效率,還可以處理各種類型的視頻源,包括3維(3D)視頻信號。
第1A圖說明了包含循環處理的示例性自適應幀間/幀內視頻編碼系統。對於幀內預測,預測資料是根據當前圖片中先前編碼的視頻資料導出的。對於幀間預測112,在編碼器側執行運動估計(ME)並且基於ME的結果執行運動補償(MC)以提供從其他圖片和運動資料導出的預測資料。開關114選擇幀內預測110或幀間預測112並且所選擇的預測資料被提供給加法器116以形成預測誤差,也稱為殘差。預測誤差然後由變換(T)118和隨後的量化(Q)120處理。變換和 量化的殘差然後由熵編碼器122編碼以包括在對應於壓縮視頻資料的視頻位元流中。與變換係數相關聯的位元流然後與輔助信息(例如與幀內預測和幀間預測相關聯的運動和編碼模式)以及其他信息(例如與應用於底層圖像區域的環路濾波器相關聯的參數)一起打包。與幀內預測110、幀間預測112和環內濾波器130相關聯的輔助信息被提供給熵編碼器122,如第1A圖所示。當使用幀間預測模式時,也必須在編碼器端重建一個或多個參考圖片。因此,經變換和量化的殘差由逆量化(IQ)124和逆變換(IT)126處理以恢復殘差。然後在重建(REC)128處將殘差加回到預測資料136以重建視頻資料。重建的視頻資料可以存儲在參考圖片緩衝器134中並用於預測其他幀。
如第1A圖所示,輸入的視頻資料在編碼系統中經過一系列處理。由於一系列處理,來自REC128的重建視頻資料可能會受到各種損害。因此,環路濾波器130經常在重構視頻資料被存儲在參考圖片緩衝器134中之前應用於重構視頻資料以提高視頻質量。例如,可以使用去塊濾波器(DF)、樣本自適應偏移(SAO)和自適應環路濾波器(ALF)。可能需要將環路濾波器信息合併到位元流中,以便解碼器可以正確地恢復所需的信息。因此,環路濾波器信息也被提供給熵編碼器122以合併到位元流中。第1A圖中,環路濾波器130在重構樣本被存儲在參考圖片緩衝器134中之前被應用於重構視頻。第1A圖中的系統旨在說明典型視頻編碼器的示例性結構。它可能對應於高效視頻編碼(HEVC)系統、VP8、VP9、H.264或VVC。
如第1B圖所示,解碼器可以使用與編碼器相似或相同的功能塊,除了變換118和量化120之外,因為解碼器只需要逆量化124和逆變換126。替代熵編碼器122,解碼器使用熵解碼器140將視頻位元流解碼為量化的變換係 數和所需的編碼信息(例如ILPF信息、幀內預測信息和幀間預測信息)。解碼器側的幀內預測150不需要執行模式搜索。相反,解碼器僅需要根據從熵解碼器140接收的幀內預測信息生成幀內預測。此外,對於幀間預測,解碼器僅需要根據從熵解碼器140接收的幀間預測信息執行運動補償(MC152)而無需運動估計。
根據VVC,類似於HEVC,輸入圖片被劃分為稱為CTU(編碼樹單元)的非重疊方形塊區域。每個CTU都可以劃分為一個或多個較小尺寸的編碼單元(CU)。生成的CU分區可以是正方形或矩形。此外,VVC將CTU劃分為預測單元(PU),作為應用預測過程的單元,例如幀間預測、幀內預測等。
VVC標準合併了各種新的編碼工具以進一步提高超過HEVC標準的編碼效率。例如,為了減少跨分量冗餘,在VVC中使用跨分量線性模型(CCLM)預測模式,其中使用線性模型基於相同CU的重建亮度樣本預測色度樣本。
雖然CCLM模式可以提高編碼效率,但該模式還需要用信號發送附加信息,例如為塊選擇的特定CCLM模式和模型參數。需要開發技術來提高用信號通知CCLM相關信息的效率。
公開了一種用於視頻編碼的方法和設備。根據解碼器側的方法,接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的編碼資料。從包括當前塊的編碼資料的位元流中解析第一語法,其中第一語法與當前塊是否以所述一個或多個CCLM相關模式編碼有關。如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則從位元流解析第二語法,其中第二語法與是否使用多 模型CCLM模式或一個或多個模型參數顯式信號傳送或隱式導出有關。如果第一語法指示當前塊以所述一個或多個CCLM相關模式編碼,則確定第二顔色塊的所述一個或多個模型參數,其中通過應用一個或多個跨顔色模型使用所述一個或多個模型參數重建或預測第一顔色塊,生成第二顔色塊的跨色預測。然後使用包括用於第二顔色塊的跨色預測的預測資料解碼與第二顔色塊相關聯的編碼資料。
在一個實施例中,解碼過程還包括如果第二語法與是否使用多模型CCLM模式有關,則解碼過程還包括從位元流解析第三語法,其中第三語法與所述一個或多個模型參數是否被明確地用信號發送或隱式導出有關。如果第三語法指示所述一個或多個模型參數是隱式導出的,則為當前塊選擇同時使用頂部和左模板的LM_LA模式,或者解析另一語法以指示當前塊的所述一個或多個CCLM相關中的特定CCLM模式。
在一個實施例中,解碼過程還包括如果第二語法與是否使用多模型CCLM模式有關,則從位元流解析第三語法,其中第三語法指示所述一個或多個CCLM相關模式中的特定CCLM模式。
在一個實施例中,解碼過程還包括如果第二語法指示所述一個或多個模型參數被明確地用信號通知,則從位元流解析第三語法,其中第三語法與是否使用多模型CCLM模式有關。
在一個實施例中,如果第二語法指示所述一個或多個模型參數是隱式導出的,則為當前塊選擇同時使用頂部模板和左模板的LM_LA模式,或者解析另一語法以指示當前塊的CCLM相關模式中的特定CCLM模式。
在一個實施例中,解碼過程還包括從位元流中解析出與縮放參數 相關的可行範圍和/或步數。例如,可以在位元流的SPS(序列參數集)、PPS(圖片參數集)、APS(自適應參數集)、PH(圖片頭)或SH(切片頭)中解析出與縮放參數相關的可行範圍和/或步數。在一個實施例中,可行範圍包括與縮放參數相關的上限和下限,步數與上限和下限之間的步數相關。進一步地,可以從位元流的PH或SH中解析出一個標識,表示SPS或PPS中與縮放參數相關的可行範圍和步數是否被複寫。
還公開了相應的編碼器側方法和裝置。根據該方法,接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的像素資料。第一語法在包括當前塊的編碼資料的位元流中用信號發送,其中第一語法與當前塊是否以所述一個或多個CCLM相關模式編碼有關。如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則為第二顔色塊確定一個或多個模型參數,其中通過使用所述一個或多個跨色模型應用一個或多個模型參數來重建或預測第一顔色塊,生成第二顔色塊的跨色預測。如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則用信號通知位元流中的第二語法,其中第二語法與是否使用多模型CCLM模式或是否使用所述一個或多個模型參數顯式信號傳送或隱式導出有關。
112:幀間預測
114:開關
110、150:幀內預測
116:加法器
118:變換(T)
120:量化(Q)
122:熵編碼器
130:環內濾波器
124:逆量化(IQ)
126:逆變換(IT)
128:重建(REC)
136:預測資料
134:參考圖片緩衝器
140:熵解碼器
152:MC
210:垂直二元分區(SPLIT_BT_VER)
220:水平二元分區(SPLIT_BT_HOR)
230:垂直三元分區(SPLIT_TT_VER)
240:水平三元分區(SPLIT_TT_HOR)
510-580:不允許分區
810:色度塊
820:亮度塊
1110-1150、1210-1240:步驟
第1A圖說明了包含循環處理的示例性自適應幀間/幀內視頻編碼系統。
第1B圖圖示了第1A圖中的編碼器的相應解碼器。
第2圖示出了對應於垂直二元分區(SPLIT_BT_VER)、水平二元分區 (SPLIT_BT_HOR)、垂直三元分區(SPLIT_TT_VER)和水平三元分區(SPLIT_TT_HOR)的多類型樹結構的示例。
第3圖圖示了具有嵌套多類型樹編碼樹結構的四叉樹中的分區分區信息的信令機制的示例。
第4圖顯示了一個CTU被分成多個具有四叉樹和嵌套多樹編碼塊結構的CU的示例,其中粗體塊邊緣表示四叉樹分區,其餘邊緣表示多樹分區。
第5圖顯示了當亮度編碼塊的寬度或高度大於64時禁止TT拆分的一些示例。
第6圖顯示了VVC視頻編碼標准採用的幀內預測模式。
第7A-B圖示了廣角幀內預測的示例,塊具有寬度大於高度(第7A圖)和高度大於寬度(第7B圖)。
第8圖給出了LM_LA模式涉及的左側樣本與上方樣本和當前塊樣本的位置示例。
第9圖顯示了根據多模式CCLM將相鄰樣本分為兩組的示例。
第10圖顯示了推導模型參數的各種亮度採樣相位的示例,其中圓圈位置是整數亮度採樣相位位置,三角形位置是色度採樣相位位置。
第11圖圖示了根據本發明實施例的併入CCLM(跨色線性模型)相關模式的示例性視頻解碼系統的流程圖。
第12圖圖示了根據本發明實施例的併入CCLM(跨色線性模型)相關模式的示例性視頻編碼系統的流程圖。
將容易理解的是,如本文附圖中大體描述和圖示的本發明的組件可以以多種不同的配置來佈置和設計。因此,以下對如圖所示的本發明的系統 和方法的實施例的更詳細描述並不旨在限制所要求保護的本發明的範圍,而僅代表本發明的選定實施例.貫穿本說明書對“一個實施例”、“一個實施例”或類似語言的引用意味著結合該實施例描述的特定特徵、結構或特性可以包括在本發明的至少一個實施例中。因此,貫穿本說明書各處出現的短語“在一個實施例中”或“在一個實施例中”不一定都指代相同的實施例。
此外,所描述的特徵、結構或特性可以以任何合適的方式組合在一個或多個實施例中。然而,相關領域的技術人員將認識到,本發明可以在沒有一個或多個特定細節的情況下,或使用其他方法、組件等來實踐。在其他情況下,未顯示或未顯示眾所周知的結構或操作詳細描述以避免模糊本發明的方面。參考附圖將最好地理解本發明的所示實施例,其中相同的部分自始至終由相同的數字表示。下面的描述僅旨在作為示例,並且簡單地說明與如本文要求保護的本發明一致的設備和方法的某些選定實施例。
使用樹結構劃分CTU
在HEVC中,通過使用表示為編碼樹的四叉樹(QT)結構將CTU分成CU以適應各種局部特性。使用圖片間(時間)或圖片內(空間)預測對圖片區域進行編碼的決定是在葉CU級別做出的。每個葉CU可以根據PU分區類型進一步分區成一個、兩個或四個PU。在一個PU內部,應用相同的預測過程,並將相關信息以PU為基礎傳輸到解碼器。在通過應用基於PU分區類型的預測過程獲得殘差塊之後,葉CU可以根據類似於CU的編碼樹的另一種四叉樹結構被劃分為變換單元(TU)。HEVC結構的關鍵特徵之一是它具有多個分區概念,包括CU、PU和TU。
在VVC中,使用二元和三元分區結構的具有嵌套多類型樹的四 叉樹取代了多分區單元類型的概念,即它除了對於具有對於最大變換長度來說尺寸太大的CU來說,去除了CU、PU和TU概念的分離,並且支持更靈活的CU分區形狀。在編碼樹結構中,CU可以是正方形或長方形。編碼樹單元(CTU)首先按四叉樹(quaternary tree)(也稱為quadtree)結構進行分區。然後四叉樹葉節點可以進一步劃分為多類型樹結構。如第2圖所示,多類型樹結構中有四種分區類型,垂直二元分區(SPLIT_BT_VER 210),水平二元分區(SPLIT_BT_HOR 220),垂直三元分區(SPLIT_TT_VER 230),水平三元分區(SPLIT_TT_HOR 240)。多類型樹葉節點稱為編碼單元(CU),除非CU對於最大變換長度來說太大,否則此分段將用於預測和變換處理,而無需進一步劃分。這意味著,在大多數情況下,CU、PU和TU在具有嵌套多類型樹編碼塊結構的四叉樹中具有相同的塊大小。當支持的最大變換長度小於CU顏色分量的寬度或高度時會發生異常。
第3圖示出了具有嵌套多類型樹編碼樹結構的四叉樹中的分區分區信息的信令機制。編碼樹單元(CTU)被視為四叉樹的根,並且首先由四叉樹結構劃分。每個四叉樹葉節點(當足夠大以允許它時)然後由多類型樹結構進一步劃分。在四叉樹結構中,對於每一CU節點,發送第一標誌(split_cu_flag)以指示節點是否被進一步劃分;如果當前CU節點是四叉樹嵌套多類型樹節點,發送第二個標誌(split_qt_flag),其指示其是QT分區或者MTT分區模式。當一個節點是使用MTT分區模式進行分區,第三標誌(mtt_split_cu_vertical_flag)被發送以指示分區方向,然後第四個標誌(mtt_split_cu_binary_flag)被發送以指示分區是二元分區還是三元分區。根據mtt_split_cu_vertical_flag和mtt_split_cu_binary_flag的值,推導出一個CU的多類型樹分區模式(MttSplitMode),如表1所示。
Figure 112102683-A0305-02-0011-1
第4圖示出了CTU被劃分為具有四叉樹和嵌套多類型樹編碼塊結構的多個CU,其中粗體塊邊緣表示四叉樹分區,其餘邊緣表示多類型樹分區。具有嵌套多類型樹分區的四叉樹提供了由CU組成的內容自適應編碼樹結構。CU的大小可以與CTU一樣大,也可以以亮度樣本為單位小至4×4。對於4:2:0色度格式,最大色度CB大小為64×64,最小色度CB大小由16個色度樣本組成。
在VVC中,支持的最大亮度變換大小為64×64,支持的最大色度變換大小為32×32。當CB的寬度或高度大於最大變換寬度或高度時,CB會自動在水平和/或垂直方向上拆分以滿足該方向上的變換大小限制。
以下參數用於具有嵌套多類型樹編碼樹方案的四叉樹。這些參數由SPS語法元素指定并且可以由圖像頭語法元素進一步細化。
- CTU尺寸:四叉樹的根節點大小
- MinQTSize:允許的最小四叉樹葉節點大小
- MaxBtSize:允許的最大二叉樹根節點大小
- MaxTtSize:最大允許的三叉樹根節點大小
- MaxMttDepth:從四叉樹葉節點分區出的多類型樹的最大允許深度
- MinCbSize:允許的最小編碼區塊節點大小
在具有嵌套多類型樹編碼樹結構的四叉樹的一個示例中,CTU 大小被設置為128×128亮度樣本和兩個對應的64×64塊的4:2:0色度樣本,MinQTSize被設置為16×16,MaxBtSize設置為128×128,MaxTtSize設置為64×64,MinCbSize(寬度和高度)設置為4×4,MaxMttDepth設置為4。樹劃分首先應用於CTU以生成四叉樹葉節點。四叉樹葉節點的大小可以從16×16(即MinQTSize)到128×128(即CTU大小)。如果葉QT節點為128×128,由於大小超過了MaxBtSizeMaxTtSize(即64×64),二叉樹將不再進一步分區。否則,四叉樹葉節點可能會被多類型樹進一步劃分。因此,四叉樹葉節點也是多元樹的根節點,其多元樹深度(mttDepth)為0。當多元樹深度達到MaxMttDepth(即4)時,被認為不再進一步分區。當多類型樹節點的寬度等於MinCbSize時,不再考慮進一步水平分區。類似地,當多類型樹節點的高度等於MinCbSize時,不考慮進一步的垂直分區。
在VVC中,編碼樹方案支持亮度和色度具有單獨的塊樹結構的能力。對於P和B切片,一個CTU中的亮度和色度CTB必須共享相同的編碼樹結構。然而,對於I切片,亮度和色度可以具有單獨的塊樹結構。當應用分別的塊樹模式時,亮度CTB被一種編碼樹結構分區成CU,色度CTB被另一種編碼樹結構分區成色度CU。這意味著I切片中的CU可能由亮度分量的編碼塊或兩個色度分量的編碼塊組成,而P或B切片中的CU總是由所有三種顏色分量的編碼塊組成,除非視頻是單色。
虛擬管道資料單元(Virtual Pipeline Data Units,VPDU)
虛擬流水線資料單元(VPDU)被定義為畫面中的非重疊單元。在硬體解碼器中,連續的VPDU由多個流水線級同時處理。在大多數流水線階段,VPDU大小與緩衝區大小大致成正比,因此保持VPDU大小較小很重要。在大多 數硬體解碼器中,VPDU大小可以設置為最大變換塊(TB)大小。然而,在VVC中,三叉樹(TT)和二叉樹(BT)分區可能會導致VPDU大小增加。
為了將VPDU大小保持為64x64亮度樣本,在VTM中應用以下規範分區限制(具有語法信令修改),如第5圖所示:
- 對於寬度或高度或寬度和高度均等於128的CU,不允許進行TT拆分(如第5圖中的“X”所示)。
- 對於N
Figure 112102683-A0305-02-0013-15
64的128xNCU(即寬度等於128且高度小於128),不允許水平BT。
對於N
Figure 112102683-A0305-02-0013-17
64(即高度等於128且寬度小於128)的Nx128 CU,不允許垂直BT。在第5圖中,亮度塊大小為128x128。虛線表示塊大小為64x64。根據上述約束條件,不允許分區的示例用“X”表示,如第5圖中的各種示例(510-580)所示。
幀內色度分區和預測限制
在典型的硬體視頻編碼器和解碼器中,由於相鄰幀內塊之間的樣本處理資料依賴性,當圖片具有較小的幀內塊時,處理吞吐量會下降。幀內塊的預測器生成需要來自相鄰塊的頂部和左側邊界重構樣本。因此,必須逐塊順序地處理幀內預測。
在HEVC中,最小的內部CU是8x8亮度樣本。最小幀內CU的亮度分量可以進一步拆分為四個4x4亮度幀內預測單元(PU),但最小色度分量幀內CU的不能進一步拆分。因此,當處理4x4色度幀內塊或4x4亮度幀內塊時,會出現最壞情況的硬體處理吞吐量。在VVC中,為了提高最壞情況下的吞吐量,小於16色度樣本(尺寸為2x2、4x2與2x4)的色度幀內CB以及寬度小於4色度樣本(尺寸為2xN)的色度幀內CB通過約束色度幀內CB的分區被禁止使用。
在單個編碼樹中,最小色度幀內預測單元(SCIPU)被定義為一個編碼樹節點,其色度塊大小大於或等於16個色度樣本,並且至少有一個子亮度塊小於64個亮度樣本,或者具有一個色度塊大小不是2xN且至少有一個子亮度塊4xN亮度樣本的編碼樹節點。要求在每個SCIPU中,所有CB都是內部的,或者所有的CB都是非內部的,即內部或內部塊複製(intra block copy,IBC)。在非幀間SCIPU的情況下,還要求非幀間SCIPU的色度不應該被進一步分區並且SCIPU的亮度被允許進一步分區。這樣,大小小於16個色度樣本或大小為2xN的小色度幀內CB被移除。此外,在非幀內SCIPU的情況下不應用色度縮放。這裡,沒有額外的語法用信號通知,並且SCIPU是否是非幀間的可以通過SCIPU中的第一個亮度CB的預測模式來導出。如果當前切片(slice)是I-切片,或者當前SCIPU在進一步分區一次後有4x4亮度分區,則推斷SCIPU的類型為非幀間(因為VVC不允許幀間4x4);否則,在解析SCIPU中的CU之前,SCIPU的類型(幀間或非幀間)由一個標誌指示。
對於幀內圖片中的二叉樹,通過分別禁用4xN和8xN色度分區的垂直二叉分區和垂直三叉分區來移除2xN幀內色度塊。大小為2x2、4x2和2x4的小色度塊也通過分區限制被刪除。
此外,考慮對圖片尺寸的限制,通過考慮圖片寬度和高度是最大(8,MinCbSizeY)的倍數來避免圖片角落處的2x2/2x4/4x2/2xN幀內色度塊。
具有67種幀內預測模式的幀內模式編碼
為了捕獲自然視頻中呈現的任意邊緣方向,VVC中的方向幀內模式的數量從HEVC中使用的33個擴展到65個。HEVC中沒有的新方向模式在第6圖中被描繪為虛線箭頭、平面和DC模式保持不變。這些更密集的方向幀內預測 模式適用於所有塊大小以及亮度和色度幀內預測。
在VVC中,針對非正方形塊,幾種傳統的角度幀內預測模式被自適應地替換為廣角(wide-angle)幀內預測模式。
在HEVC中,每個幀內編碼塊具有正方形形狀並且其每條邊的長度是2的冪。因此,不需要除法運算來使用DC模式生成幀內預測器。在VVC中,塊可以具有矩形形狀,這在一般情況下需要對每個塊使用除法運算。為了避免DC預測的除法操作,只有較長的邊用於計算非方形塊的平均值。
為了保持最可能模式(MPM)列表生成的複雜度較低,通過考慮兩個可用的相鄰幀內模式,使用具有6個MPM的幀內模式編碼方法。構建MPM列表考慮以下三個方面:
- 默認幀內模式
- 相鄰幀內模式
- 導出的幀內模式。
統一的6-MPM列表用於幀內塊,而不管是否應用MRL和ISP編碼工具。MPM列表是基於左側和上方相鄰塊的幀內模式構建的。假設左邊的模式記為Left,上方塊的模式記為Above,則統一的MPM列表構造如下:
- 當相鄰塊不可用時,其幀內模式默認設置為平面。
- 如果Left和Above兩種模式都是非角度模式:
- MPM列表→{平面,DC,V,H,V-4,V+4}
- 如果Left和Above模式之一是角度模式,另一個是非角度模式:
- 將模式Max設置為Left和Above中的較大模式
- MPM列表→{平面,Max,Max-1,Max+1,Max-2,Max+2}
- 如果Left和Above都是有角度的並且它們不同:
- 將模式Max設置為Left和Above中的較大模式
- 如果Max-Min=1,
˙MPM列表→{平面,Left,Above,Min-1,Max+1,Min-2}
- 否則,如果Max-Min大於或者等於62:
˙MPM列表→{平面,Left,Above,Min+1,Max-1,Min+2}
- 否則,如果Max-Min等於2:
˙MPM列表→{平面,Left,Above,Min+1,Min-1,Max+1}
否則:
˙MPM列表→{平面,Left,Above,Min-1,Min+1,Max-1}
- 如果Left和Above都是有角度的並且它們是相同的:
- MPM列表→{平面,Left,Left-1,Left+1,Left-2,Left+2}
此外,MPM索引碼字的第一個二進制碼(bin)是CABAC上下文編碼的。總共使用了三個上下文,對應於當前幀內塊是啟用MRL、啟用ISP還是正常幀內塊。
在6 MPM列表生成過程中,修剪用於去除重複的模式,使得只有獨特的模式可以被包括到MPM列表中。對於61種非MPM模式的熵編碼,使用截斷二進制代碼(Truncated Binary Code,TBC)。
非方形塊的廣角幀內預測
常規角度幀內預測方向被定義為順時針方向從45度到-135度。在VVC中,幾種傳統的角度幀內預測模式被自適應地替換為非方形塊的廣角幀內預測模式。替換的模式使用原始模式索引發出信號,原始模式索引在解析後重 新映射到廣角模式的索引。幀內預測模式總數不變,即67,幀內模式編碼方式不變。
為了支持這些預測方向,分別如第7A圖和第7B圖所示定義了長度為2W+1的頂部參考和長度為2H+1的左側參考。
廣角方向模式中替換模式的數量取決於塊的縱橫比。替換的幀內預測模式如表2所示。
Figure 112102683-A0305-02-0017-2
在VVC中,支持4:2:2、4:4:4以及4:2:0色度格式。4:2:2色度格式的色度導出模式(derived mode,DM)推導表最初是從HEVC移植的,將條目數從35擴展到67,以與幀內預測模式的擴展保持一致。由於HEVC規範不支持-135°以下和45°以上的預測角度,亮度幀內預測模式從2到5映射到2。因此,4:2:2色度格式的色度DM推導表更新方式是替換映射表條目的一些值,以更精確地轉換色度塊的預測角度。
跨分量線性模型(CCLM)預測
為了減少跨分量冗餘,在VVC中使用了跨分量線性模型(CCLM)預測模式,其中使用線性模型基於相同CU的重構亮度樣本預測色度樣本如下:predC(i,j)=α.recL '(i,j)+β (1)
其中predC(i,j)表示CU中的預測色度樣本,recL '(i,j)表示同一CU的下採樣重建亮度樣本。
CCLM參數(α和β)由最多四個相鄰色度樣本及其相應的下採樣亮度樣本導出。假設當前色度塊維度為W×H,則W'和H'設置為- 當應用LM_LA模式時,W'=W,H'=H;- 當應用LM_A模式時,W’=W+H;- 當應用LM_L模式時,H’=H+W。
上面的相鄰位置表示為S[0,-1]...S[W'-1,-1],左邊的相鄰位置表示為S[-1,0]...S[-1,H'-1]。然後選擇四個樣本為:- S[W'/4,-1],S[3 * W'/4,-1],S[-1,H'/4],S[-1,3 * H'/4],當LM模式被應用並且上方和左側的相鄰樣本都可用;- S[W'/8,-1],S[3 * W'/8,-1],S[5 * W'/8,-1],S[7 * W'/8,-1],當應用LM-A模式或只有上方相鄰樣本可用;- S[-1,H'/8],S[-1,3 * H'/8],S[-1,5 * H'/8],S[-1,7 * H'/8],當應用LM-L模式或只有左相鄰樣本可用。
所選位置的四個相鄰亮度樣本被下採樣並比較四次以找到兩個較大的值:x 0 A x 1 A ,以及兩個較小的值:x 0 B x 1 B 。它們對應的色度樣本值表示為y 0 A ,y 1 A ,y 0 B y 1 B 。然後x A ,x B ,y A y B 導出為:x A =(x 0 A +x 1 A +1)>>1; x B =(x 0 B +x 1 B +1)>>1;y A =(y 0 A +y 1 A +1)>>1;y B =(y 0 B +y 1 B +1)>>1 (2)
最後,根據以下等式獲得線性模型參數α和β。
Figure 112102683-A0305-02-0019-4
β=Y b -α.X b (3)
第8圖給出了LM_LA模式(綫性模式_左側與上方)涉及的左上方樣本和當前塊樣本的位置示例。第8圖顯示了N×N色度塊810、相應的2N×2N亮度塊820及其相鄰樣本(顯示為實心圓)的相對樣本位置。
計算參數α的除法運算是通過查找表實現的。為了減少存儲表所需的內存,diff值(最大值和最小值之間的差)和參數α用指數表示法表示。例如,diff由一個4位有效部分和一個指數來近似。因此,對於16個有效數值,1/diff的表被簡化為16個元素,如下所示:DivTable[ ]={0,7,6,5,5,4,4,3,3,2,2,1,1,1,1,0} (5)
這將有利於降低計算的複雜性以及存儲所需表格所需的內存大小。
除了上部模板和左模板可以一起用於計算線性模型係數外,它們還可以在其他2種LM模式中交替使用,稱為LM_A和LM_L模式。
在LM_A模式下,僅使用上部模板計算線性模型係數。為了獲得更多樣本,將上部模板擴展為(W+H)個樣本。在LM_L模式下,只使用左模板計算線性模型係數。為了獲得更多樣本,將左模板擴展為(H+W)個樣本。
在LM_LA模式下,左側和上方模板用於計算線性模型係數。
為了匹配4:2:0視頻序列的色度樣本位置,將兩種類型的下採樣濾 波器應用於亮度樣本,以在水平和垂直方向上實現2:1的下採樣率。下採樣濾波器的選擇由SPS級別標誌指定。兩個下採樣濾波器如下,分別對應“類型-0”和“類型-2”內容。
RecL '(i,j)=[recL(2i-1,2j-1)+2.recL(2i-1,2j-1)+recL(2i+1,2j-1)+recL(2i-1,2j)+2.recL(2i,2j)+recL(2i+1,2j)+4]>>3 (6)
RecL '(i,j)=recL(2i,2j-1)+recL(2i-1,2j)+4.recL(2i,2j)+recL(2i+1,2j)+recL(2i,2j+1)+4]>>3 (7)
請注意,當上參考線(line)位於CTU邊界時,只有一條亮度線(幀內預測中的一般線緩衝區)用於進行下採樣。
該參數計算作為解碼過程的一部分執行,而不僅僅是作為編碼器搜索操作。因此,沒有語法用於將α和β值傳送給解碼器。
對於色度幀內模式編碼,總共允許8種幀內模式用於色度幀內模式編碼。這些模式包括五種傳統幀內模式和三種跨分量線性模型模式(LM_LA、LM_A和LM_L)。色度模式信令和推導過程如表3所示。色度模式編碼直接取決於相應亮度塊的幀內預測模式。由於在I切片中啟用了用於亮度和色度分量的單獨塊劃分結構,所以一個色度塊可以對應於多個亮度塊。因此,對於色度導出(Chroma DM)模式,直接繼承複寫當前色度塊中心位置的對應亮度塊的幀內預測模式。
Figure 112102683-A0305-02-0020-5
Figure 112102683-A0305-02-0021-6
如表4所示,無論sps_cclm_enabled_flag的值,使用一單獨的二進制表。
Figure 112102683-A0305-02-0021-7
在表4中,第一個二進制碼表示它是常規(0)還是CCLM模式(1)。如果是LM模式,則下一個二進制碼表示是否為LM_LA(0)。如果不是LM_LA,則下一個二進制碼表示是LM_L(0)還是LM_A(1)。對於這種情況,當sps_cclm_enabled_flag為0時,可以在熵編碼之前丟棄相應intra_chroma_pred_mode的二值化表的第一個二進制碼。或者,換句話說,第一個二進制碼被推斷為0,因此未被編碼。此單個二值化表用於sps_cclm_enabled_flag等於0和1的情況。表4中的前兩個二進制碼使用其自己的上下文模型進行上下文編碼,其餘二進制碼進行旁路編碼。
此外,為了減少雙樹中的亮度色度延遲,當64x64亮度編碼樹節 點使用不分區(Not Split)(並且ISP不用於64x64 CU)或QT進行分區時,32x32/32x16色度編碼中的色度CU樹節點可以通過以下方式使用CCLM:- 如果32x32色度節點不分區或分區QT分區,則32x32節點中的所有色度CU都可以使用CCLM;- 如果32x32色度節點採用水平BT劃分,32x16子節點不分區或使用垂直BT分區,則32x16色度節點中的所有色度CU都可以使用CCLM。
在所有其他亮度和色度編碼樹分區條件下,CCLM不允許用於色度CU。
多模型CCLM(MMLM)
在JEM(J.Chen、E.Alshina、G.J.Sullivan、J.-R.Ohm和J.Boyce,聯合探索測試模型7的算法描述,文件JVET-G1001,ITU-T/ISO/IEC聯合視頻開發小組(JVET),2017年7月),提出了多模型CCLM模式(multiple model CCLM mode,MMLM),用於使用兩個模型從整個CU的亮度樣本預測色度樣本。在MMLM中,將當前塊的相鄰亮度樣本和相鄰色度樣本分為兩組,每組作為訓練集推導線性模型(即針對特定組推導特定的α和β)。此外,當前亮度塊的樣本也基於與相鄰亮度樣本的分類相同的規則進行分類。
第9圖顯示了將相鄰樣本分為兩組的示例。閾值計算為相鄰重建亮度樣本的平均值。Rec' L [x,y]<=閾值的相鄰樣本被分類為第1組;而Rec' L [x,y]>閾值的相鄰樣本被分類為第2組。
Figure 112102683-A0305-02-0022-8
提出了以下方法來提高跨分量預測精度或編解碼性能。
提出了一種通過顯式信令參數的新編解碼模式。線性模型參數在 編碼器側導出並用信號通知解碼器側以便減輕解碼器複雜度或編碼依賴性。例如,根據所提出的方法的色度預測是pred_C(i,j)=α'.rec_L'(i,j)+β,其中α'和β在位元流中明確表示,而α'對應於更新的α是隱式導出的。在一個實施例中,僅用信號通知α',但從相鄰的(L形)重構樣本隱含地導出β。在另一個實施例中,多於一組的線性模型參數被用信號通知給解碼器側。例如,等式(8)中的兩組線性模型參數(例如,α 1 、α 2β 1β 2;或僅α 1α 2)被發送到解碼器側。在又一個實施例中,多於一組的線性模型參數被用信號通知給解碼器側,但是只有部分模型參數被用信號通知,而剩餘的模型參數被隱式導出。例如,如果當前塊使用兩個線性模型,則用信號通知一組線性模型參數,而另一組模型參數隱式地從相鄰樣本導出。
在一個實施例中,如果用信號通知α',則可以從相鄰的(L形)重構樣本隱含地導出β。例如,在VVC中,可以選擇四個相鄰的亮度和色度重建樣本來導出模型參數。假設所選擇的相鄰亮度和色度樣本的平均值為lumaAvg和chromaAvg,則推導出β為β=chromaAvg-α'.lumaAvg。相鄰亮度樣本的平均值(lumaAvg)可以根據所有選擇的亮度樣本,當前亮度CB的亮度DC模式值,或最大和最小亮度樣本的平均值(例如,
Figure 112102683-A0305-02-0023-9
1)>>1或者
Figure 112102683-A0305-02-0023-11
同理,可以根據所有選中的色度樣本,當前色度CB的色度DC模式值,或者最大和最小色度樣本的平均值(如,
Figure 112102683-A0305-02-0023-12
或chromaAvg=
Figure 112102683-A0305-02-0023-13
)。注意,對於非4:4:4顏色子採樣格式,所選的相鄰亮度重構樣本可以來自CCLM下採樣過程的輸出。
所提出的編碼模式可以設計為色度編碼模式之一。模式語法設計 的可能實施例如下。
模式語法設計的實施例A
在一個實施例中,第一語法用於指示當前色度模式是否為CCLM相關模式。如果當前色度模式是CCLM相關模式,則第二語法用於指示是否使用多模型CCLM模式。CCLM相關模式指的是CCLM模式的任何變體,例如LM_LA、LM_A、LM_L、多模式CCLM等。然後發送第三語法以指示CCLM參數是隱式還是顯式導出。如果明確指示CCLM參數,則進一步指示模型參數(例如,比例和偏移參數,或僅指示比例參數)。如果CCLM參數是隱式導出的,則不再用信號通知進一步的語法,並且隱式應用LM_LA,或者進一步指示CCLM預測模式(例如,LM_LA、LM_A或LM_L)。如果當前色度模式不是CCLM相關模式,則指示非CCLM模式。
模式語法設計實施例B
在另一實施例中,第一語法用於指示當前色度模式是否為CCLM相關模式。如果當前色度模式是CCLM相關模式,則第二語法用於指示CCLM參數是隱式還是顯式導出。如果CCLM參數被顯式通知,則第三語法被通知以指示是否使用多模型CCLM模式。此外,還進一步指示了模型參數(例如,比例和偏移參數,或僅比例參數)。如果CCLM參數被隱含地用信號通知,則不再用信號通知進一步的語法並且隱含地應用LM_LA,或者進一步指示CCLM預測模式(例如,LM_LA、LM_A或LM_L)。如果當前色度模式不是CCLM相關模式,則指示非CCLM模式。
模式語法設計的實施例C
在另一實施例中,第一語法用於指示當前色度模式是否為CCLM 相關模式。如果當前色度模式是CCLM相關模式,則第二語法用於指示是否使用多模型CCLM模式。此外,還進一步指示了模型參數(例如,比例和偏移參數,或僅比例參數)。如果當前通道亮度模式不是CCLM相關模式,則指示非CCLM模式。
CCLM可行範圍(Feasible Range)和步數(Step Number)的信號
在又一實施例中,CCLM參數的可行範圍和步數在SPS(序列參數集)、PPS(圖片參數集)、APS(自適應參數集)、PH(圖片頭)或SH(切片頭)中指示。例如,在SPS、PPS、APS、PH或SH中標示縮放參數的可行範圍和步長,表示縮放參數的上限、縮放參數的下限、縮放參數的上下限之間的步數。例如,標示的縮放參數上限為α' max ,標示的標定下限為α' min ,標示的步數為n。那麼,用所提出的編碼模式編碼的當前塊的縮放參數可以是{(α' min +(α' max -α' min )×0/n),(α' min +(α' max -α' min )×1/n),(α' min +(α' max -α' min )×2/n),...,(α' min +(α' max -α' min )×(k-1)/n),(α' min +(α' max -α' min k/n)},其中0<k
Figure 112102683-A0305-02-0025-18
n。如果選擇了建議的編碼模式,則使用語法來指示所選縮放參數的索引。在另一實施例中,如果在SPS或PPS中用信號通知縮放參數的可行範圍和步數,則在PH或SH中用信號發送標誌以指示在SPS或PPS中縮放參數的可行範圍和步數是否被複寫。如果SPS或PPS中縮放參數的可行範圍和步數被複寫,則還可以為相應的圖片或切片指示PH或SH中縮放參數的可行範圍和步數。類似地,如果用信號通知偏移參數,則偏移參數也可以應用相同的方法。
對於又一個實施例,可行的CCLM參數可以在表中指示。當用信號通知比例參數或偏移參數時,用信號通知對應表的索引。該表可以在編碼器端和解碼器端預定義。
當編碼器側推導縮放參數或偏移參數時,它可以使用當前亮度重建樣本和當前源色度樣本來推導模型參數並在位元流中發信號。在一個實施例中,如果通過用信號通知候選縮放值的索引來指示縮放參數,則通過這些候選之間的率失真優化(RDO)比較來選擇最終的最佳縮放參數。類似地,如果通過用信號通知候選偏移值的索引來指示偏移參數,則通過這些候選之間的率失真優化(RDO)比較來選擇最終的最佳偏移參數。在另一個實施例中,它可以嘗試各種亮度樣本相位來導出模型參數。如第10圖所示,圓圈位置為整數亮度採樣相位,三角形位置為色度採樣相位。候選者可以使用來自Y0、Y1、Y2、Y3處亮度相位位置的重構色度樣本和相應的重構亮度樣本,或者組合多個亮度相位(例如,(Y0+Y1+1)>>1、(Y0+Y2+1)>>1、(Y0+Y3+1)>>1、(Y1+Y2+1)>>1、(Y1+Y3+1)>>1、(Y2+Y3+1)>>1或(Y0+Y1+Y2+Y3+2)>>2推導模型參數。最終的最佳模型參數是基於這些候選者之間的率失真優化(RDO)比較來發出信號的(即,與對應於Y0、Y1、Y2、Y3、(Y0+Y1+1)>>1、(Y0+Y2+1)>>1、(Y0+Y3+1)>>1、(Y1+Y2+1)>>1、(Y1+Y3+1)>>1、(Y2+Y3+1)>>1、或者(Y0+Y1+Y2+Y3+2)>>2的每個色度樣本相關聯的相應亮度樣本之間的RDO比較,其中對應的亮度樣本可以指重構的亮度樣本,色度樣本可以指重構的色度樣本)。
如上所述的CCLM(跨顔色線性模型)可以在編碼器側或解碼器側實現。例如,所提出的任何CCLM方法都可以在解碼器的幀內編碼模塊(例如第1B圖中的幀內預測150)中實現,或者幀內編碼模塊是編碼器(例如第1A圖中的幀內預測110)。任何提出的CCLM方法也可以作為耦合到解碼器或編碼器處的幀內編碼模塊的電路來實現。然而,解碼器或編碼器也可以使用額外的處理 單元來實現所需的CCLM處理。而幀內預測單元(第1A圖中的110和第1B圖中的MC 150)被示為單獨的處理單元,它們可以對應於存儲在媒體(例如硬盤或閃存)上的可執行軟體或軔體代碼,用於CPU(中央處理單元)或可編程設備(例如DSP(數字信號處理器)或FPGA(現場可編程門陣列))。
第11圖圖示了根據本發明實施例的併入CCLM(跨色線性模型)相關模式的示例性視頻解碼系統的流程圖。流程圖中所示的步驟可以實現為可在編碼器側的一個或多個處理器(例如,一個或多個CPU)上執行的程序代碼。流程圖中所示的步驟也可以基於硬體來實現,諸如被佈置為執行流程圖中的步驟的一個或多個電子設備或處理器。根據該方法,在步驟1110中接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的編碼資料。在步驟1120中從包括用於當前塊的編碼資料的位元流解析第一語法,其中第一語法與當前塊是否以所述一個或多個CCLM相關模式編碼有關。在步驟1130中,如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則從位元流解析第二語法,其中第二語法與是否使用多模型CCLM模式或一個或多個模型參數是顯式信號或隱式導出的。在步驟1140中,如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則為第二顔色塊確定所述一個或多個模型參數,其中通過使用所述一個或多個模型參數將一個或多個跨色模型應用於重構或預測的第一顔色塊,生成第二顔色塊的跨色預測。在步驟1150中,使用包括用於第二顔色塊的跨色預測的預測資料來解碼與第二顔色塊相關聯的編碼資料。
第12圖圖示了根據本發明實施例的併入CCLM(跨色線性模型)相關模式的示例性視頻編碼系統的流程圖。根據該方法,在步驟1210中接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的像素資料。在步驟1220中在包 括用於當前塊的編碼資料的位元流中發送第一語法,其中第一語法與當前塊是否以所述一個或多個CCLM相關模式編碼有關。在步驟1230中,如果第一語法指示當前塊正以所述一個或多個CCLM相關模式編碼,則確定第二顔色塊的一個或多個模型參數,其中使用所述一個或多個模型參數將一個或多個跨色模型應用於重構或預測的第一顔色塊,生成第二顔色塊的跨色預測。在步驟1240中,如果第一語法指示當前塊正以所述一個或多個CCLM相關模式被編碼,則在位元流中用信號通知第二語法,其中第二語法與是否使用多模型CCLM模式或所述一個或多個模型參數被明確地發出信號或隱式地導出有關。
所示流程圖旨在說明根據本發明的視頻編碼的示例。在不脫離本發明的精神的情況下,本領域的技術人員可以修改每個步驟、重新安排步驟、拆分步驟或組合步驟來實施本發明。在本公開中,已經使用特定語法和語義來說明示例以實現本發明的實施例。在不脫離本發明的精神的情況下,技術人員可以通過用等同的語法和語義替換語法和語義來實施本發明。
提供以上描述是為了使本領域普通技術人員能夠實踐在特定應用及其要求的上下文中提供的本發明。對所描述的實施例的各種修改對於本領域技術人員而言將是顯而易見的,並且本文定義的一般原理可以應用於其他實施例。因此,本發明並不旨在限於所示出和描述的特定實施例,而是符合與本文公開的原理和新穎特徵一致的最寬範圍。在以上詳細描述中,舉例說明了各種具體細節以提供對本發明的透徹理解。然而,本領域的技術人員將理解可以實施本發明。
如上所述的本發明的實施例可以以各種硬體、軟體代碼或兩者的組合來實現。例如,本發明的一個實施例可以是集成到視頻壓縮芯片中的一個 或多個電路電路或者集成到視頻壓縮軟體中的程序代碼以執行這裡描述的處理。本發明的實施例還可以是要在數字信號處理器(DSP)上執行以執行這裡描述的處理的程序代碼。本發明還可以涉及由計算機處理器、數字信號處理器、微處理器或現場可編程門陣列(FPGA)執行的許多功能。這些處理器可以被配置為通過執行定義由本發明體現的特定方法的機器可讀軟體代碼或軔體代碼來執行根據本發明的特定任務。軟體代碼或軔體代碼可以以不同的編程語言和不同的格式或風格來開發。也可以為不同的目標平台編譯軟體代碼。然而,軟體代碼的不同代碼格式、風格和語言以及配置代碼以執行根據本發明的任務的其他方式都不會脫離本發明的精神和範圍。
本發明可以在不脫離其精神或基本特徵的情況下以其他特定形式體現。所描述的示例在所有方面都應被視為說明性而非限制性的。因此,本發明的範圍由所附權利要求而不是由前述描述來指示。落入權利要求等同物的含義和範圍內的所有變化都應包含在其範圍內。
1110-1150                             步驟

Claims (22)

  1. 一種使用包括一種或多種跨顔色線性模型(CCLM)相關模式的編解碼工具對彩色圖片進行解碼的方法,該方法包括: 接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的編碼資料; 從包括所述當前塊的編碼資料的位元流解析第一語法,其中第一語法與所述當前塊是否以所述一個或多個CCLM相關模式編碼有關; 如果所述第一語法指示所述當前塊正以所述一個或多個CCLM相關模式編碼,則從所述位元流解析第二語法,其中所述第二語法與是否使用多模型CCLM模式或一個或多個模型參數是否明確使用信號傳送或隱式導出相關; 如果所述第一語法指示所述當前塊正在以所述一個或多個CCLM相關模式編碼,則確定所述第二顔色塊的所述一個或多個模型參數,其中通過應用一個或多個跨顔色模型以使用所述一個或多個模型參數重建或預測所述第一顔色塊,生成所述第二顔色塊的跨色預測;以及 使用包括用於所述第二顔色塊的跨色預測的預測資料解碼與所述第二顔色塊相關聯的編碼資料。
  2. 如請求項1所述的方法,包括如果所述第二語法與是否使用多模型CCLM模式有關,則從位元流解析第三語法,其中,所述第三語法與所述一個或多個模型參數是否被明確地發信號通知或隱式導出有關。
  3. 如請求項2所述的方法,其中如果所述第三語法指示所述一個或多個模型參數是隱式導出的,則為所述當前塊選擇同時使用頂部模板和左模板的LM_LA模式或者解析另一語法以指示表示當前塊的一種或多種CCLM相關模式中特定的CCLM模式。
  4. 如請求項1所述的方法,包括如果所述第二語法與是否使用多模型CCLM模式有關則從位元流解析第三語法,其中所述第三語法指示所述一個或多個CCLM相關模式中的特定CCLM模式。
  5. 如請求項1所述的方法,包括如果所述第二語法指示所述一個或多個模型參數被明確地用信號通知,則從所述位元流解析第三語法,其中所述第三語法與是否使用多模型CCLM模式有關。
  6. 如請求項1所述的方法,其中如果所述第二語法指示所述一個或多個模型參數是隱式導出的,則為所述當前塊選擇同時使用頂部模板和左模板的LM_LA模式或者解析另一語法以指示表示當前塊的一種或多種CCLM相關模式中特定的CCLM模式。
  7. 如請求項1所述的方法,包括從所述位元流中解析與縮放參數相關的可行範圍和/或步數。
  8. 如請求項7所述的方法,其中在所述位元流的序列參數集(SPS)、圖片參數集(PPS)、自適應參數集(APS)、圖片頭(PH)或切片頭(SH)中解析與所述縮放參數相關的可行範圍和/或步數。
  9. 如請求項7所述的方法,其中,所述可行範圍包括與縮放參數相關的上限和下限,所述步數與上限和下限之間的步數相關。
  10. 如請求項7所述的方法,其中,從所述位元流的PH或SH中解析出標誌位,以指示SPS或PPS中與所述縮放參數相關的可行範圍和步數是否被複寫。
  11. 一種使用包括一種或多種跨顔色線性模型(CCLM)相關模式的編解碼工具對彩色圖片進行編碼的方法,該方法包括: 接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的像素資料; 在包括所述當前塊的編碼資料的位元流中用信號通知第一語法,其中所述第一語法與所述當前塊是否以所述一個或多個CCLM相關模式編碼有關; 如果所述第一語法指示所述當前塊正以所述一個或多個CCLM相關模式編碼,則確定所述第二顔色塊的一個或多個模型參數,其中通過應用一個或多個跨色模型使用所述一個或多個模型參數來重構或預測所述第一顔色塊,以生成所述第二顔色塊的跨色預測;以及 如果所述第一語法指示所述當前塊正在以所述一個或多個CCLM相關模式編碼,則在所述位元流中用信號通知第二語法,其中第二語法與是否使用多模型CCLM模式或所述一個或多個模型參數顯式信號傳送或隱式導出有關。
  12. 如請求項11所述的方法,包括如果所述第二語法與多模型CCLM模式是否使用相關,則從所述位元流解析第三語法,其中所述第三語法與所述一個或多個模型參數是顯式信號傳送還是隱式導出有關。
  13. 如請求項12所述的方法,其中如果所述第三語法指示所述一個或多個模型參數是隱式導出的,則為所述當前塊選擇同時使用頂部模板和左模板的LM_LA模式或者用信號通知另一語法以指示所述當前塊的一種或多種CCLM相關模式中特定的CCLM模式。
  14. 如請求項11所述的方法,包括如果所述第二語法與是否使用多模型CCLM模式相關,則用信號通知來自所述位元流的第三語法,其中所述第三語法指示所述一個或多個CCLM相關模式中的特定CCLM模式。
  15. 如請求項11所述的方法,包括如果所述第二語法指示所述一個或多個模型參數被明確地用信號發送,則從所述位元流中用信號發送第三語法,其中所述第三語法與是否使用多模型CCLM模式有關。
  16. 如請求項11所述的方法,其中如果所述第二語法指示所述一個或多個模型參數是隱式導出的,則為所述當前塊選擇同時使用頂部模板和左模板的LM_LA模式或者用信號通知另一語法以指示所述當前塊的一種或多種CCLM相關模式中特定的CCLM模式。
  17. 如請求項11所述的方法,包括用信號通知與來自所述位元流的縮放參數相關的可行範圍和/或步數。
  18. 如請求項17所述的方法,其中,與所述縮放參數相關的可行範圍和/或步數是在所述位元流的序列參數集(SPS)、圖片參數集 (PPS)、 自適應參數集(APS)、圖片頭(PH)或切片頭(SH)中使用信號傳送的。
  19. 如請求項17所述的方法,其中,所述可行範圍包括與所述縮放參數相關的上限和下限,並且所述步數與所述上限和所述下限之間的步數相關。
  20. 如請求項17所述的方法,其中一標誌是來自位元流的PH或SH的信號,以指示與SPS或PPS中的縮放參數相關的可行範圍和步數是否被複寫。
  21. 一種使用包括一個或多個跨顔色線性模型(CCLM)相關模式的編碼工具對彩色圖片進行解碼的裝置,該裝置包括一個或多個電子設備或處理器,其被佈置成: 接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的編碼資料; 從包括所述當前塊的編碼資料的位元流解析第一語法,其中所述第一語法與所述當前塊是否以所述一個或多個CCLM相關模式編碼有關; 如果所述第一語法指示所述當前塊正以所述一個或多個CCLM相關模式編碼,則從所述位元流解析第二語法,其中所述第二語法與是否使用多模型CCLM模式或一個或多個模型參數是否被顯式信號傳送或隱式導出相關; 如果所述第一語法指示所述當前塊正在以所述一個或多個CCLM相關模式編碼,則確定所述第二顔色塊的所述一個或多個模型參數,其中通過應用一個或多個跨色模型使用所述一個或多個模型參數重建或預測第一顔色塊,生成所述第二顔色塊的跨色預測;以及 使用包括用於所述第二顔色塊的所述跨色預測的預測資料解碼與所述第二顔色塊相關聯的編碼資料。
  22. 一種使用包括一個或多個跨顔色線性模型(CCLM)相關模式的編解碼工具對彩色圖片進行編碼的裝置,該裝置包括一個或多個電子設備或處理器,用於: 接收與包括第一顔色塊和第二顔色塊的當前塊相關聯的像素資料; 在包括所述當前塊的編碼資料的位元流中用信號通知第一語法,其中所述第一語法與所述當前塊是否以所述一個或多個CCLM相關模式編碼有關; 如果所述第一語法指示所述當前塊正以所述一個或多個CCLM相關模式編碼,則確定所述第二顔色塊的一個或多個模型參數,其中通過應用一個或多個跨色模型使用所述一個或多個模型參數來重構或預測第一顔色塊,來生成所述第二顔色塊的跨色預測;以及 如果所述第一語法指示所述當前塊正以所述一個或多個CCLM相關模式編碼,則在所述位元流中用信號通知第二語法,其中所述第二語法與是否使用多模型CCLM模式或所述一個或多個模型參數顯式信號傳送或隱式導出有關。
TW112102683A 2022-01-21 2023-01-19 視頻編解碼系統中跨分量線性模型預測的方法和裝置 TWI821112B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US202263301518P 2022-01-21 2022-01-21
US202263301515P 2022-01-21 2022-01-21
US63/301,518 2022-01-21
US63/301,515 2022-01-21
PCT/CN2023/072970 WO2023138628A1 (en) 2022-01-21 2023-01-18 Method and apparatus of cross-component linear model prediction in video coding system
WOPCT/CN2023/072970 2023-01-18

Publications (2)

Publication Number Publication Date
TW202339502A TW202339502A (zh) 2023-10-01
TWI821112B true TWI821112B (zh) 2023-11-01

Family

ID=87347897

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112102683A TWI821112B (zh) 2022-01-21 2023-01-19 視頻編解碼系統中跨分量線性模型預測的方法和裝置

Country Status (2)

Country Link
TW (1) TWI821112B (zh)
WO (1) WO2023138628A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106664425A (zh) * 2014-06-20 2017-05-10 高通股份有限公司 视频译码中的跨分量预测
US20200296382A1 (en) * 2019-03-12 2020-09-17 Tencent America LLC Method and apparatus for video encoding or decoding
CN112997484A (zh) * 2018-11-06 2021-06-18 北京字节跳动网络技术有限公司 基于多参数的帧内预测
CN113273213A (zh) * 2018-12-31 2021-08-17 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
CN113853798A (zh) * 2019-05-17 2021-12-28 北京字节跳动网络技术有限公司 根据色度格式信令通知语法元素
CN113892267A (zh) * 2019-05-30 2022-01-04 字节跳动有限公司 使用编解码树结构类型控制编解码模式

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106664425A (zh) * 2014-06-20 2017-05-10 高通股份有限公司 视频译码中的跨分量预测
CN112997484A (zh) * 2018-11-06 2021-06-18 北京字节跳动网络技术有限公司 基于多参数的帧内预测
CN113273213A (zh) * 2018-12-31 2021-08-17 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
US20200296382A1 (en) * 2019-03-12 2020-09-17 Tencent America LLC Method and apparatus for video encoding or decoding
CN113853798A (zh) * 2019-05-17 2021-12-28 北京字节跳动网络技术有限公司 根据色度格式信令通知语法元素
CN113892267A (zh) * 2019-05-30 2022-01-04 字节跳动有限公司 使用编解码树结构类型控制编解码模式

Also Published As

Publication number Publication date
TW202339502A (zh) 2023-10-01
WO2023138628A1 (en) 2023-07-27

Similar Documents

Publication Publication Date Title
TWI720584B (zh) 視訊處理系統中色度量化參數導出的方法以及裝置
TW201904285A (zh) 在視訊寫碼中之增強的解塊濾波設計
CN113615185B (zh) 用于视频编解码的方法和装置
RU2595515C2 (ru) Способы и устройство для внутреннего кодирования блока, имеющего пиксели, распределенные по группам
TW201309026A (zh) 用於視訊編碼之濾波區塊效應之人為誤差
JP7317973B2 (ja) 画像予測方法、機器、及びシステム、装置、及び記憶媒体
TW202114416A (zh) 視訊編解碼之方法和裝置
WO2013102299A1 (en) Residue quad tree depth for chroma components
TWI821103B (zh) 在視訊編解碼系統中使用邊界匹配進行重疊塊運動補償的方法和裝置
TWI821112B (zh) 視頻編解碼系統中跨分量線性模型預測的方法和裝置
CN113841390B (zh) 用于视频编解码的方法和设备
TW202406342A (zh) 使用交叉分量預測對彩色圖片進行視訊編解碼的方法和裝置
WO2023138627A1 (en) Method and apparatus of cross-component linear model prediction with refined parameters in video coding system
TW202344053A (zh) 使用梯度和模板改進幀內模式推導和預測的方法和裝置
WO2024088058A1 (en) Method and apparatus of regression-based intra prediction in video coding system
WO2023246901A1 (en) Methods and apparatus for implicit sub-block transform coding
TW202406341A (zh) 使用交叉分量預測對彩色圖片進行視訊編解碼的方法和裝置
WO2024017179A1 (en) Method and apparatus of blending prediction using multiple reference lines in video coding system
WO2024104086A1 (en) Method and apparatus of inheriting shared cross-component linear model with history table in video coding system
CN113286152B (zh) 视频解码方法、装置、计算机设备及存储介质
CN114175653B (zh) 用于视频编解码中的无损编解码模式的方法和装置
WO2024074131A1 (en) Method and apparatus of inheriting cross-component model parameters in video coding system
WO2024017187A1 (en) Method and apparatus of novel intra prediction with combinations of reference lines and intra prediction modes in video coding system
WO2024074129A1 (en) Method and apparatus of inheriting temporal neighbouring model parameters in video coding system
WO2023193516A1 (en) Method and apparatus using curve based or spread-angle based intra prediction mode in video coding system