JP7492066B2 - Image or video coding based on scaling list data - Google Patents

Image or video coding based on scaling list data Download PDF

Info

Publication number
JP7492066B2
JP7492066B2 JP2023102553A JP2023102553A JP7492066B2 JP 7492066 B2 JP7492066 B2 JP 7492066B2 JP 2023102553 A JP2023102553 A JP 2023102553A JP 2023102553 A JP2023102553 A JP 2023102553A JP 7492066 B2 JP7492066 B2 JP 7492066B2
Authority
JP
Japan
Prior art keywords
aps
scaling
information
list
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023102553A
Other languages
Japanese (ja)
Other versions
JP2023112125A (en
Inventor
シタル パルリ
スンファン キム
チエ チャオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2023112125A publication Critical patent/JP2023112125A/en
Application granted granted Critical
Publication of JP7492066B2 publication Critical patent/JP7492066B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本技術は、ビデオまたは画像コーディングに関し、例えば、スケーリングリストデータに基づくコーディング技術に関する。 This technology relates to video or image coding, for example coding techniques based on scaling list data.

近年、4Kまたは8K以上のUHD(Ultra High Definition)画像/ビデオのような高解像度、高品質の画像/ビデオに対する需要が様々な分野で増加している。画像/ビデオデータが高解像度、高品質になるほど、既存の画像/ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像/ビデオデータを格納する場合、送信費用と格納費用が増加される。 In recent years, the demand for high-resolution, high-quality images/videos, such as 4K or 8K or higher UHD (Ultra High Definition) images/videos, has been increasing in various fields. As the image/video data has higher resolution and quality, the amount of information or bits transmitted increases relatively compared to existing image/video data. Therefore, when image data is transmitted using a medium such as an existing wired or wireless broadband line, or when image/video data is stored using an existing storage medium, the transmission and storage costs increase.

また、近年、VR(Virtual Reality)、AR(Artificial Realtiy)コンテンツやホログラムなどの実感メディア(Immersive Media)に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像/ビデオに対する放送が増加している。 In addition, in recent years, interest in and demand for immersive media such as virtual reality (VR) and artificial reality (AR) content and holograms has increased, and the broadcast of images/videos with different image characteristics from real images, such as game images, has increased.

これにより、上記のような様々な特性を有する高解像度・高品質の画像/ビデオの情報を効果的に圧縮して送信するか、格納し、再生するために高効率の画像/ビデオ圧縮技術が求められる。 This calls for highly efficient image/video compression technologies to effectively compress and transmit, store, and play back high-resolution, high-quality image/video information with the various characteristics described above.

また、圧縮効率を向上させて主観的/客観的ビジュアル品質を高めるために、スケーリング過程での適応的周波数別加重量子化(adaptive frequency weighting quantization)技術に関する議論がある。このような技術を効率的に適用するために関連した情報をシグナリングする方法が必要である。 There is also discussion of adaptive frequency weighting quantization techniques during the scaling process to improve compression efficiency and enhance subjective/objective visual quality. A method for signaling relevant information to efficiently apply such techniques is needed.

本文書の技術的課題は、ビデオ/画像コーディング効率を上げる方法及び装置を提供することにある。 The technical problem of this document is to provide a method and apparatus for improving video/image coding efficiency.

本文書の他の技術的課題は、スケーリング過程でのコーディング効率を上げる方法及び装置を提供することにある。 Another technical problem of this document is to provide a method and apparatus for improving coding efficiency during the scaling process.

本文書の他の技術的課題は、スケーリング過程で使われるスケーリングリストを効率的に構成する方法及び装置を提供することにある。 Another technical problem of this document is to provide a method and apparatus for efficiently constructing a scaling list used in the scaling process.

本文書の他の技術的課題は、スケーリング過程で使われるスケーリングリスト関連情報を階層的にシグナリングする方法及び装置を提供することにある。 Another technical problem of this document is to provide a method and apparatus for hierarchically signaling scaling list related information used in the scaling process.

本文書の他の技術的課題は、スケーリングリストベースのスケーリング過程を効率的に適用する方法及び装置を提供することにある。 Another technical problem of this document is to provide a method and apparatus for efficiently applying a scaling list-based scaling process.

本文書の一実施形態によれば、APS(adaptation parameter set)を介してスケーリングリストデータがシグナリングされ得る。また、APSに含まれたAPS ID情報に基づいてAPSが識別され得るし、APSに含まれたスケーリングリストデータに関するAPSであることを表すAPSタイプ情報に基づいてAPSがスケーリングリストデータを含むことができる。また、スケーリングリストデータに関するAPSであることを表すAPSタイプ情報に対して、APS ID情報の値は、特定の範囲内の値を有することができる。 According to one embodiment of this document, scaling list data may be signaled via an adaptation parameter set (APS). In addition, the APS may be identified based on APS ID information included in the APS, and the APS may include scaling list data based on APS type information indicating that the APS is an APS related to the scaling list data included in the APS. In addition, for the APS type information indicating that the APS is an APS related to the scaling list data, the value of the APS ID information may have a value within a specific range.

本文書の一実施形態によれば、スケーリングリストデータの可用可否を表す可用フラグ情報が階層的にシグナリングされ得るし、上位レベルシンタックス(例えば、SPS)でシグナリングされる可用フラグ情報に基づいて下位レベルシンタックス(例えば、ピクチャヘッダ/スライスヘッダ/タイプグループヘッダ等)での可用フラグ情報がシグナリングされ得る。 According to one embodiment of this document, availability flag information indicating the availability of scaling list data may be signaled hierarchically, and availability flag information in a lower level syntax (e.g., picture header/slice header/type group header, etc.) may be signaled based on availability flag information signaled in a higher level syntax (e.g., SPS).

本文書の一実施形態によれば、SPSまたはPPSレベルで直接的にスケーリングリストデータシンタックスをシグナリングしないようにSPSシンタックスとPPSシンタックスとを構成できる。これにより、SPSでの可用フラグ情報に基づいてAPSで個別的にスケーリングリストデータをパーシング/シグナリングすることによりコーディング効率を向上させることができる。 According to one embodiment of this document, the SPS syntax and PPS syntax can be configured to not signal scaling list data syntax directly at the SPS or PPS level. This can improve coding efficiency by parsing/signaling scaling list data individually in the APS based on availability flag information in the SPS.

本文書の一実施形態によれば、デコード装置によって行われるビデオ/画像デコード方法を提供する。前記ビデオ/画像デコード方法は、本文書の実施形態で開示された方法を含むことができる。 According to one embodiment of the present document, there is provided a video/image decoding method performed by a decoding device. The video/image decoding method may include the methods disclosed in the embodiments of the present document.

本文書の一実施形態によれば、ビデオ/画像デコードを行うデコード装置を提供する。前記デコード装置は、本文書の実施形態で開示された方法を行うことができる。 According to one embodiment of the present document, there is provided a decoding device for performing video/image decoding. The decoding device is capable of performing the method disclosed in the embodiment of the present document.

本文書の一実施形態によれば、エンコード装置によって行われるビデオ/画像エンコード方法を提供する。前記ビデオ/画像エンコード方法は、本文書の実施形態で開示された方法を含むことができる。 According to one embodiment of the present document, there is provided a video/image encoding method performed by an encoding device. The video/image encoding method may include the methods disclosed in the embodiments of the present document.

本文書の一実施形態によれば、ビデオ/画像エンコードを行うエンコード装置を提供する。前記エンコード装置は、本文書の実施形態で開示された方法を行うことができる。 According to one embodiment of the present document, there is provided an encoding device for performing video/image encoding. The encoding device is capable of performing the method disclosed in the embodiment of the present document.

本文書の一実施形態によれば、本文書の実施形態のうち、少なくとも1つに開示されたビデオ/画像エンコード方法によって生成されたエンコードされたビデオ/画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。 According to one embodiment of the present document, there is provided a computer-readable digital storage medium having encoded video/image information generated by the video/image encoding method disclosed in at least one of the embodiments of the present document.

本文書の一実施形態によれば、デコード装置によって本文書の実施形態のうち、少なくとも1つに開示されたビデオ/画像デコード方法を行うように引き起こすエンコードされた情報またはエンコードされたビデオ/画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。 According to one embodiment of the present document, there is provided a computer-readable digital storage medium having encoded information or encoded video/image information stored thereon that causes a decoding device to perform the video/image decoding method disclosed in at least one of the embodiments of the present document.

本文書は、様々な効果を有することができる。例えば、本文書の一実施形態によれば、全般的な画像/ビデオ圧縮効率を上げることができる。また、本文書の一実施形態によれば、効率的なスケーリング過程を適用することによってコーディング効率を上げ、主観的/客観的ビジュアル品質を向上させることができる。また、本文書の一実施形態によれば、スケーリング過程で使用されるスケーリングリストを効率的に構成することができ、これを介してスケーリングリスト関連情報を階層的にシグナリングすることができる。また、本文書の一実施形態によれば、スケーリングリストに基づくスケーリング過程を効率的に適用することによってコーディング効率が増加され得る。また、本文書の一実施形態によれば、スケーリング過程で使用されるスケーリングリストマトリックスに対する制限をおくことによって、実現を容易にし、最大メモリ要求事項(worst case memory requirement)を制限するという効果を得ることができる。 This document may have various advantages. For example, according to an embodiment of this document, the overall image/video compression efficiency may be increased. According to an embodiment of this document, the coding efficiency may be increased by applying an efficient scaling process, and the subjective/objective visual quality may be improved. According to an embodiment of this document, the scaling list used in the scaling process may be efficiently configured, and the scaling list-related information may be hierarchically signaled therethrough. According to an embodiment of this document, the coding efficiency may be increased by efficiently applying a scaling process based on the scaling list. According to an embodiment of this document, the effect of facilitating implementation and limiting the worst case memory requirement may be obtained by placing restrictions on the scaling list matrix used in the scaling process.

本文書の具体的な実施形態を介して得ることができる効果は、以上で並べられた効果に制限されない。例えば、関連した技術分野の通常の知識を有する者(a person having ordinary skill in the related art)が本文書から理解したり、導くことのできる様々な技術的効果が存在しうる。これにより、本文書の具体的な効果は、本文書に明示的に記載されたことに制限されず、本文書の技術的特徴から理解されるか、導かれることができる様々な効果を含むことができる。 The effects that can be obtained through the specific embodiments of this document are not limited to the effects listed above. For example, there may be various technical effects that a person having ordinary skill in the related art can understand or derive from this document. Thus, the specific effects of this document are not limited to those explicitly described in this document, but may include various effects that can be understood or derived from the technical features of this document.

本文書の実施形態が適用され得るビデオ/画像コーディングシステムの例を概略的に示す。1 illustrates generally an example of a video/image coding system in which embodiments of the present document may be applied; 本文書の実施形態が適用され得るビデオ/画像エンコード装置の構成を概略的に説明する図である。FIG. 1 is a diagram illustrating a schematic configuration of a video/image encoding device to which embodiments of the present document can be applied. 本文書の実施形態が適用され得るビデオ/画像デコード装置の構成を概略的に説明する図である。FIG. 1 is a diagram illustrating the configuration of a video/image decoding device to which the embodiments of the present document can be applied. 本文書の実施形態が適用可能な概略的なビデオ/画像エンコード方法の一例を示す。1 shows an example of a general video/image encoding method to which embodiments of this document can be applied. 本文書の実施形態が適用可能な概略的なビデオ/画像デコード方法の一例を示す。1 shows an example of a schematic video/image decoding method to which embodiments of the present document can be applied. コーディングされた画像/ビデオに対する階層構造を例示的に示す。1 shows an exemplary hierarchical structure for coded images/videos. 本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。1 illustrates generally an example of a video/image encoding method and associated components according to embodiments (etc.) of the present document; 本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。1 illustrates generally an example of a video/image encoding method and associated components according to embodiments (etc.) of the present document; 本文書の実施形態(等)に係るビデオ/画像デコード方法及び関連コンポーネントの一例を概略的に示す。1 illustrates generally an example of a video/image decoding method and associated components according to embodiments (etc.) of the present document; 本文書の実施形態(等)に係るビデオ/画像デコード方法及び関連コンポーネントの一例を概略的に示す。1 illustrates generally an example of a video/image decoding method and associated components according to embodiments (etc.) of the present document; 本文書において開示された実施形態が適用され得るコンテンツストリーミングシステムの例を示す。1 illustrates an example of a content streaming system in which the embodiments disclosed herein may be applied.

本開示は、様々な変更を加えることができ、様々な実施形態を有することができるところ、特定の実施形態を図面に例示し、詳細に説明しようとする。しかし、これは、本開示を特定の実施形態に限定しようとするものではない。本文書において常用する用語は、単に特定の実施形態を説明するために使用されたものであって、本開示の技術的思想を限定しようとする意図で使用されるものではない。単数の表現は、文脈上明らかに異なるように意味しない限り、複数の表現を含む。本明細書において、「含む」又は「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、又はこれらを組み合わせたものが存在することを指定しようとするものであり、1つ又はそれ以上の他の特徴や、数字、ステップ、動作、構成要素、部品、又はこれらを組み合わせたものの存在又は付加可能性を予め排除しないことと理解されるべきである。 The present disclosure may be modified in various ways and may have various embodiments, and a specific embodiment will be illustrated in the drawings and described in detail. However, this is not intended to limit the present disclosure to a specific embodiment. Terms commonly used in this document are used merely to describe a specific embodiment and are not intended to limit the technical ideas of the present disclosure. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this specification, terms such as "include" or "have" are intended to specify the presence of features, numbers, steps, operations, components, parts, or combinations thereof described in the specification, and should be understood not to preclude the presence or addition of one or more other features, numbers, steps, operations, components, parts, or combinations thereof.

一方、本開示において説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の都合上独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち、2つ以上の構成を合わせて1つの構成をなすことがあり、1つの構成が複数の構成に分けられることもある。各構成が統合及び/又は分離された実施形態も、本文書の本質から逸脱しない限り、本開示の権利範囲に含まれる。 Meanwhile, each configuration in the drawings described in this disclosure is illustrated independently for the convenience of explaining the different characteristic functions, and does not mean that each configuration is realized by separate hardware or software. For example, two or more of the configurations may be combined to form one configuration, and one configuration may be divided into multiple configurations. Embodiments in which each configuration is integrated and/or separated are also included in the scope of the present disclosure as long as they do not deviate from the essence of this document.

本文書において“AまたはB(A or B)”は“ただA”、“ただB”または“AとBの両方とも”を意味することができる。また、本文書において“AまたはB(A or B)”は“A及び/又はB(A and/or B)”と解釈されることができる。例えば、本文書において“A、BまたはC(A、B or C)”は“ただA”、“ただB”、“ただC”、または“A、B及びCの任意の全ての組み合わせ(any combination of A、B and C)”を意味することができる。 In this document, "A or B" can mean "only A", "only B", or "both A and B". Also, in this document, "A or B" can be interpreted as "A and/or B". For example, in this document, "A, B or C" can mean "only A", "only B", "only C", or "any combination of A, B and C".

本文書において使われるスラッシュ(/)や読点(comma)は“及び/又は(and/or)”を意味することができる。例えば、“A/B”は“A及び/又はB”を意味することができる。それによって、“A/B”は“ただA”、“ただB”、または“AとBの両方とも”を意味することができる。例えば、“A、B、C”は“A、BまたはC”を意味することができる。 The slash (/) and comma used in this document can mean "and/or." For example, "A/B" can mean "A and/or B." Thus, "A/B" can mean "only A," "only B," or "both A and B." For example, "A, B, C" can mean "A, B, or C."

本文書において“少なくとも1つのA及びB(at least one of A and B)”は、“ただA”、“ただB”または“AとBの両方とも”を意味することができる。また、本文書において“少なくとも1つのAまたはB(at least one of A or B)”や“少なくとも1つのA及び/又はB(at least one of A and/or B)”という表現は“少なくとも1つのA及びB(at least one of A and B)”と同じく解釈されることができる。 In this document, "at least one of A and B" can mean "only A", "only B", or "both A and B". Also, in this document, the expressions "at least one of A or B" and "at least one of A and/or B" can be interpreted as "at least one of A and B".

また、本文書において“少なくとも1つのA、B及びC(at least one of A、B and C)”は、“ただA”、“ただB”、“ただC”、または“A、B及びCの任意の全ての組み合わせ(any combination of A、B and C)”を意味することができる。また、“少なくとも1つのA、BまたはC(at least one of A、B or C)”や“少なくとも1つのA、B及び/又はC(at least one of A、B and/or C)”は“少なくとも1つのA、B及びC(at least one of A、B and C)”を意味することができる。 In this document, "at least one of A, B and C" can mean "only A", "only B", "only C", or "any combination of A, B and C". Also, "at least one of A, B or C" and "at least one of A, B and/or C" can mean "at least one of A, B and C".

また、本文書において使われる括弧は“例えば(for example)”を意味することができる。具体的に、“予測(イントラ予測)”で表示された場合、“予測”の一例として“イントラ予測”が提案されたものである。他の表現としては、本文書の“予測”は“イントラ予測”に制限(limit)されるものではなく、“イントラ予測”が“予測”の一例として提案されたものである。また、“予測(即ち、イントラ予測)”で表示された場合も、“予測”の一例として“イントラ予測”が提案されたものである。 Furthermore, parentheses used in this document may mean "for example." Specifically, when "prediction (intra prediction)" is displayed, "intra prediction" is proposed as an example of "prediction." In other words, "prediction" in this document is not limited to "intra prediction," and "intra prediction" is proposed as an example of "prediction." Also, when "prediction (i.e., intra prediction)" is displayed, "intra prediction" is proposed as an example of "prediction."

本文書は、ビデオ/画像コーディングに関する。例えば、本文書に開示された方法/実施形態は、VVC(Versatile Video Coding)標準に開示される方法に適用されることができる。また、本文書に開示された方法/実施形態は、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)または次世代ビデオ/画像コーディング標準(例えば、H.267またはH.267)に開示される方法に適用されることができる。 This document relates to video/image coding. For example, the methods/embodiments disclosed in this document may be applied to methods disclosed in the Versatile Video Coding (VVC) standard. Also, the methods/embodiments disclosed in this document may be applied to methods disclosed in the essential video coding (EVC) standard, the AOMedia Video 1 (AV1) standard, the 2nd generation of audio video coding standard (AVS2) or the next generation video/image coding standard (e.g., H.267 or H.267).

本文書においてはビデオ/画像コーディングに関する多様な実施形態を提示し、他の言及がない限り、前記実施形態は、互いに組み合わせて実行されることもできる。 This document presents various embodiments relating to video/image coding, which may be implemented in combination with one another unless otherwise stated.

本文書において、ビデオ(video)は、時間の流れによる一連の画像(image)の集合を意味することができる。ピクチャ(picture)は、一般的に特定時間帯の1つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、コーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含むことができる。1つのピクチャは、1つ以上のスライス/タイルで構成されることができる。タイルは、ピクチャ内の特定タイル列及び特定タイル列以内のCTUの四角領域である(A tile is a rectangular region of CTUs within a particular tile column and particular tile row in a picture)。前記タイル列は、CTUの四角領域であり、前記四角領域は、前記ピクチャの高さと同じ高さを有し、幅は、ピクチャパラメータセット内のシンタックス要素により明示されることができる(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set)。前記タイル行は、CTUの四角領域であり、前記四角領域は、ピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは、前記ピクチャの高さと同じである(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture)。タイルスキャンは、ピクチャをパーティショニングするCTUの特定の順次的オーダリングを示すことができ、前記CTUは、タイル内のCTUラスタースキャンで連続的に整列されることができ、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタースキャンで連続的に整列されることができる(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。スライスは、単一NALユニットに排他的に含まれることができる、整数個の完全なタイルまたはピクチャのタイル内の整数個の連続的な完全なCTU行を含むことができる(A slice includes an integer number of complete tiles or an integer number of consecutive complete CTU rows within a tile of a picture that may be exclusively contained in a single NAL unit)。 In this document, video may refer to a collection of a series of images over time. A picture generally refers to a unit that indicates one image at a specific time, and a slice/tile is a unit that constitutes a part of a picture in coding. A slice/tile may include one or more coding tree units (CTUs). A picture may be composed of one or more slices/tiles. A tile is a rectangular region of a particular tile column and a particular tile row in a picture. The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set. The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture. A tile scan can indicate a specific sequential ordering of CTUs partitioning a picture, where the CTUs are ordered consecutively in a raster scan of the CTUs in a tile, and the tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture. A slice includes an integer number of complete tiles or an integer number of consecutive complete CTU rows within a tile of a picture that may be exclusively contained in a single NAL unit.

一方、1つのピクチャは、2つ以上のサブピクチャに区分されることができる。サブピクチャは、ピクチャ内の1つ以上のスライスの四角領域である(an rectangular region of one or more slices within a picture)。 On the other hand, a picture can be divided into two or more subpictures. A subpicture is a rectangular region of one or more slices within a picture.

ピクセル(pixel)またはペル(pel)は、1つのピクチャ(または、画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用され得る。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。または、サンプルは、空間ドメインでのピクセル値を意味することもでき、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもできる。 A pixel or pel can refer to the smallest unit that constitutes one picture (or image). A term corresponding to a pixel can also be used as a "sample." A sample can generally refer to a pixel or a pixel value, can refer to only a pixel/pixel value of a luma component, or can refer to only a pixel/pixel value of a chroma component. Alternatively, a sample can refer to a pixel value in the spatial domain, or, when such a pixel value is transformed into the frequency domain, can refer to a transform coefficient in the frequency domain.

ユニット(unit)は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関連した情報のうち少なくとも1つを含むことができる。1つのユニットは、1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含むことができる。ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(または、サンプルアレイ)、または変換係数(transform coefficient)の集合(または、アレイ)を含むことができる。 A unit may refer to a basic unit of image processing. A unit may include at least one of a specific region of a picture and information related to the region. A unit may include one luma block and two chroma (e.g., cb, cr) blocks. A unit may be used interchangeably with terms such as block or area, depending on the case. In general, an M×N block may include a sample (or sample array) or a set (or array) of transform coefficients consisting of M columns and N rows.

また、本文書において、量子化/逆量子化及び/又は変換/逆変換のうち少なくとも1つは、省略されることができる。量子化/逆量子化が省略される場合、量子化された変換係数は、変換係数と呼ばれることができる。変換/逆変換が省略される場合、変換係数は、係数またはレジデュアル係数と呼ばれることもでき、または、表現の統一性のために、 依然として変換係数と呼ばれることもできる。 Also, in this document, at least one of quantization/dequantization and/or transform/inverse transform may be omitted. If quantization/dequantization is omitted, the quantized transform coefficients may be referred to as transform coefficients. If transform/inverse transform is omitted, the transform coefficients may also be referred to as coefficients or residual coefficients, or may still be referred to as transform coefficients for uniformity of representation.

本文書において、量子化された変換係数及び変換係数は、各々、変換係数及びスケーリングされた(scaled)変換係数と呼ばれることができる。この場合、レジデュアル情報は、変換係数(ら)に関する情報を含むことができ、変換係数(ら)に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。レジデュアル情報(または、変換係数(ら)に関する情報)に基づいて変換係数が導出されることができ、変換係数に対する逆変換(スケーリング)を介してスケーリングされた変換係数が導出されることができる。スケーリングされた変換係数に対する逆変換(変換)に基づいて、レジデュアルサンプルが導出されることができる。これは本文書の他の部分でも同様に適用/表現されることができる。 In this document, the quantized transform coefficients and the transform coefficients may be referred to as transform coefficients and scaled transform coefficients, respectively. In this case, the residual information may include information about the transform coefficient(s), and the information about the transform coefficient(s) may be signaled via a residual coding syntax. Based on the residual information (or information about the transform coefficient(s), transform coefficients may be derived, and scaled transform coefficients may be derived via an inverse transform (scaling) on the transform coefficients. Residual samples may be derived based on an inverse transform (transform) on the scaled transform coefficients. This may be similarly applied/expressed in other parts of this document.

本文書において、1つの図面内で個別的に説明される技術的特徴は、個別的で実現されることもでき、同時で実現されることもできる。 In this document, technical features described individually in one drawing may be realized individually or simultaneously.

以下、添付図面を参照して、本文書の好ましい実施形態をより詳細に説明する。以下、図面上の同じ構成要素に対しては、同じ参照符号を使用し、同じ構成要素に対して重複した説明は、省略されることができる。 The preferred embodiments of the present invention will now be described in more detail with reference to the accompanying drawings. Hereinafter, the same reference numerals will be used for the same components in the drawings, and duplicated descriptions of the same components may be omitted.

図1は、本文書の実施形態に適用されることができるビデオ/画像コーディングシステムの例を概略的に示す。 Figure 1 illustrates a schematic diagram of an example video/image coding system that can be applied to embodiments of this document.

図1を参照すると、ビデオ/画像コーディングシステムは、第1の装置(ソースデバイス)及び第2の装置(受信デバイス)を含むことができる。ソースデバイスは、エンコードされたビデオ(video)/画像(image)情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達できる。 Referring to FIG. 1, a video/image coding system may include a first device (source device) and a second device (receiving device). The source device may transmit encoded video/image information or data in a file or streaming form to the receiving device via a digital storage medium or a network.

前記ソースデバイスは、ビデオソース、エンコード装置、送信部を含むことができる。前記受信デバイスは、受信部、デコード装置、及びレンダラを含むことができる。前記エンコード装置は、ビデオ/画像エンコード装置と呼ばれることができ、前記デコード装置は、ビデオ/画像デコード装置と呼ばれることができる。送信機は、エンコード装置に含まれることができる。受信機は、デコード装置に含まれることができる。レンダラは、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。 The source device may include a video source, an encoding device, and a sending unit. The receiving device may include a receiving unit, a decoding device, and a renderer. The encoding device may be referred to as a video/image encoding device, and the decoding device may be referred to as a video/image decoding device. The transmitter may be included in the encoding device. The receiver may be included in the decoding device. The renderer may also include a display unit, which may be a separate device or an external component.

ビデオソースは、ビデオ/画像のキャプチャ、合成または生成過程などを介してビデオ/画像を取得することができる。ビデオソースは、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、1つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ/画像が生成されることができ、この場合、関連データが生成される過程にビデオ/画像キャプチャ過程が代替されることができる。 A video source can acquire video/images through a video/image capture, synthesis, or generation process, etc. A video source can include a video/image capture device and/or a video/image generation device. A video/image capture device can include, for example, one or more cameras, a video/image archive containing previously captured video/images, etc. A video/image generation device can include, for example, a computer, a tablet, a smartphone, etc., and can (electronically) generate video/images. For example, a virtual video/image can be generated through a computer, etc., in which case the video/image capture process can be replaced by a process in which the associated data is generated.

エンコード装置は、入力ビデオ/画像をエンコードすることができる。エンコード装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を実行することができる。エンコードされたデータ(エンコードされたビデオ/画像情報)は、ビットストリーム(bitstream)形態で出力されることができる。 An encoding device can encode an input video/image. The encoding device can perform a series of steps such as prediction, transformation, and quantization for compression and coding efficiency. The encoded data (encoded video/image information) can be output in the form of a bitstream.

送信部は、ビットストリーム形態で出力されたエンコードされたビデオ/画像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達できる。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。送信部は、あらかじめ決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介した送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信/抽出してデコード装置に伝達できる。 The transmitting unit can transmit the encoded video/image information or data output in the form of a bitstream to a receiving unit of a receiving device via a digital storage medium or a network in the form of a file or streaming. The digital storage medium can include various storage media such as USB, SD, CD, DVD, Blu-ray, HDD, SSD, etc. The transmitting unit can include elements for generating a media file via a predetermined file format and can include elements for transmission via a broadcasting/communication network. The receiving unit can receive/extract the bitstream and transmit it to a decoding device.

デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を実行してビデオ/画像をデコードすることができる。 The decoding device can decode the video/image by performing a series of steps such as inverse quantization, inverse transformation, and prediction that correspond to the operations of the encoding device.

レンダラは、デコードされたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介してディスプレイされることができる。 The renderer can render the decoded video/image. The rendered video/image can be displayed via the display unit.

図2は、本文書の実施形態が適用され得るビデオ/画像エンコード装置の構成を概略的に説明する図である。以下、エンコード装置とは、画像エンコード装置及び/又はビデオエンコード装置を含むことができる。 Figure 2 is a diagram that illustrates the configuration of a video/image encoding device to which the embodiments of this document can be applied. Hereinafter, the encoding device can include an image encoding device and/or a video encoding device.

図2を参照すると、エンコード装置200は、画像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコード部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260、及びメモリ(memory)270を含んで構成されることができる。予測部220は、インター予測部221及びイントラ予測部222を含むことができる。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を含むことができる。レジデュアル処理部230は、減算部(subtractor)231をさらに含むことができる。加算部250は、復元部(reconstructor)または復元ブロック生成部(recontructged block generator)と呼ばれることができる。前述した画像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコード部240、加算部250、及びフィルタリング部260は、実施形態によって1つ以上のハードウェアコンポーネント(例えば、エンコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ270は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ270を内/外部コンポーネントとしてさらに含むこともできる。 Referring to FIG. 2, the encoding device 200 may include an image partitioner 210, a prediction unit 220, a residual processor 230, an entropy encoder 240, an adder 250, a filtering unit 260, and a memory 270. The prediction unit 220 may include an inter prediction unit 221 and an intra prediction unit 222. The residual processor 230 may include a transformer 232, a quantizer 233, a dequantizer 234, and an inverse transformer 235. The residual processing unit 230 may further include a subtractor 231. The adder 250 may be called a reconstruction unit or a reconstruction block generator. The image division unit 210, the prediction unit 220, the residual processing unit 230, the entropy encoding unit 240, the addition unit 250, and the filtering unit 260 may be configured by one or more hardware components (e.g., an encoder chip set or a processor) according to an embodiment. In addition, the memory 270 may include a decoded picture buffer (DPB) and may be configured by a digital storage medium. The hardware components may further include the memory 270 as an internal/external component.

画像分割部210は、エンコード装置200に入力された入力画像(または、ピクチャ、フレーム)を1つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)または最大コーディングユニット(largest coding unit、LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造によって再帰的に(recursively)分割されることができる。例えば、1つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/又はターナリ構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/又はターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本文書によるコーディング手順が実行されることができる。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)をさらに含むことができる。この場合、前記予測ユニット及び前記変換ユニットは、各々前述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であり、前記変換ユニットは、変換係数を誘導する単位及び/又は変換係数からレジデュアル信号(residual signal)を誘導する単位である。 The image division unit 210 may divide an input image (or picture, frame) input to the encoding device 200 into one or more processing units. As an example, the processing unit may be called a coding unit (CU). In this case, the coding unit may be recursively divided from a coding tree unit (CTU) or a largest coding unit (LCU) according to a QTBTTT (quad-tree binary-tree ternary-tree) structure. For example, one coding unit may be divided into multiple coding units of deeper depths based on a quad-tree structure, a binary tree structure, and/or a ternary structure. In this case, for example, a quad tree structure may be applied first, and a binary tree structure and/or a ternary structure may be applied thereafter. Alternatively, the binary tree structure may be applied first. The coding procedure according to this document may be performed based on a final coding unit that is not further divided. In this case, based on coding efficiency according to image characteristics, the largest coding unit may be used as the final coding unit, or the coding unit may be recursively divided into coding units of lower depths as necessary, and a coding unit of an optimal size may be used as the final coding unit. Here, the coding procedure may include procedures such as prediction, transformation, and restoration, which will be described later. As another example, the processing unit may further include a prediction unit (PU) or a transform unit (TU). In this case, the prediction unit and the transform unit may each be divided or partitioned from the final coding unit described above. The prediction unit is a unit of sample prediction, and the transform unit is a unit for deriving transform coefficients and/or a unit for deriving a residual signal from the transform coefficients.

ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプルまたは変換係数(transform coefficient)の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すこともでき、輝度(luma)成分のピクセル/ピクセル値のみを示すこともでき、彩度(chroma)成分のピクセル/ピクセル値のみを示すこともできる。サンプルは、1つのピクチャ(または、画像)をピクセル(pixel)またはペル(pel)に対応する用語として使用することができる。 The unit may be used interchangeably with terms such as block or area. In the general case, an M×N block may refer to a set of samples or transform coefficients consisting of M columns and N rows. A sample may generally refer to a pixel or pixel value, or may refer to only a pixel/pixel value of a luma component, or may refer to only a pixel/pixel value of a chroma component. A sample may be used as a term corresponding to a pixel or pel of a picture (or image).

エンコード装置200は、入力画像信号(原本ブロック、原本サンプルアレイ)からインター予測部221またはイントラ予測部222から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算してレジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができ、生成されたレジデュアル信号は、変換部232に送信される。この場合、図示されたように、エンコーダ200内において入力画像信号(原本ブロック、原本サンプルアレイ)から予測信号(予測ブロック、予測サンプルアレイ)を減算するユニットは、減算部231と呼ばれることができる。予測部は、処理対象ブロック(以下、現在ブロックという)に対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロックまたはCU単位でイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する多様な情報を生成してエントロピーエンコード部240に伝達することができる。予測に関する情報は、エントロピーエンコード部240でエンコードされてビットストリーム形態で出力されることができる。 The encoding device 200 may generate a residual signal (residual block, residual sample array) by subtracting a prediction signal (predicted block, prediction sample array) output from the inter prediction unit 221 or the intra prediction unit 222 from an input image signal (original block, original sample array), and the generated residual signal is transmitted to the conversion unit 232. In this case, as shown in the figure, a unit in the encoder 200 that subtracts a prediction signal (predicted block, prediction sample array) from an input image signal (original block, original sample array) may be called a subtraction unit 231. The prediction unit may perform prediction on a block to be processed (hereinafter, referred to as a current block) and generate a predicted block including prediction samples for the current block. The prediction unit may determine whether intra prediction or inter prediction is applied on a current block or CU basis. The prediction unit may generate various information related to prediction, such as prediction mode information, as described below in the description of each prediction mode, and transmit the information to the entropy encoding unit 240. The prediction information may be encoded by the entropy encoding unit 240 and output in the form of a bitstream.

イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することもでき、または、離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、DCモード及びプラナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、33個の方向性予測モードまたは65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部222は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。 The intra prediction unit 222 may predict the current block by referring to samples in the current picture. The referenced samples may be located adjacent to the current block or may be located away from the current block depending on the prediction mode. Prediction modes in intra prediction may include a plurality of non-directional modes and a plurality of directional modes. The non-directional modes may include, for example, a DC mode and a planar mode. The directional modes may include, for example, 33 directional prediction modes or 65 directional prediction modes depending on the fineness of the prediction direction. However, this is merely an example, and more or less directional prediction modes may be used depending on the settings. The intra prediction unit 222 may also determine a prediction mode to be applied to the current block using a prediction mode applied to a neighboring block.

インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは、同じであってもよく、異なってもよい。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、インター予測部221は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、インター予測部221は、隣接ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは違ってレジデュアル信号が送信されない場合がある。動き情報予測(motion vector prediction、MVP)モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)をシグナリングすることによって、現在ブロックの動きベクトルを指示することができる。 The inter prediction unit 221 may derive a predicted block for the current block based on a reference block (reference sample array) identified by a motion vector on the reference picture. In this case, in order to reduce the amount of motion information transmitted in the inter prediction mode, the motion information may be predicted in units of blocks, sub-blocks, or samples based on the correlation of the motion information between the neighboring blocks and the current block. The motion information may include a motion vector and a reference picture index. The motion information may further include inter prediction direction (L0 prediction, L1 prediction, Bi prediction, etc.) information. In the case of inter prediction, the neighboring blocks may include a spatial neighboring block present in the current picture and a temporal neighboring block present in the reference picture. The reference picture including the reference block and the reference picture including the temporal neighboring block may be the same or different. The temporally neighboring blocks may be referred to as collocated reference blocks, collocated CUs, etc., and a reference picture including the temporally neighboring blocks may be referred to as a collocated picture (colPic). For example, the inter prediction unit 221 may generate information indicating which candidate is used to derive a motion vector and/or a reference picture index of the current block by forming a motion information candidate list based on the neighboring blocks. Inter prediction may be performed based on various prediction modes, and for example, in the case of a skip mode and a merge mode, the inter prediction unit 221 may use motion information of neighboring blocks as motion information of the current block. In the case of the skip mode, unlike the merge mode, a residual signal may not be transmitted. In the case of motion vector prediction (MVP) mode, the motion vector of the neighboring block can be used as a motion vector predictor, and the motion vector of the current block can be indicated by signaling the motion vector difference.

予測部220は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することもできる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)予測モードに基づくこともでき、または、パレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ画像/動画像コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と類似するように実行されることができる。即ち、IBCは、本文書において説明されるインター予測技法のうち少なくとも1つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。 The prediction unit 220 may generate a prediction signal based on various prediction methods described below. For example, the prediction unit may apply intra prediction or inter prediction for prediction of one block, and may simultaneously apply intra prediction and inter prediction. This may be called combined inter and intra prediction (CIIP). The prediction unit may also be based on an intra block copy (IBC) prediction mode or a palette mode for prediction of a block. The IBC prediction mode or palette mode may be used for content image/video coding such as games, for example, screen content coding (SCC). IBC basically performs prediction within a current picture, but may be performed similarly to inter prediction in deriving a reference block within the current picture. That is, IBC can utilize at least one of the inter prediction techniques described in this document. Palette mode can be considered as an example of intra coding or intra prediction. When palette mode is applied, sample values in a picture can be signaled based on information about a palette table and a palette index.

前記予測部(インター予測部221及び/又は前記イントラ予測部222を含む)を介して生成された予測信号は、復元信号を生成するために用いられ、またはレジデュアル信号を生成するために用いられることができる。変換部232は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、またはCNT(Conditionally Non-linear Transform)のうち少なくとも1つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとき、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を利用して予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じサイズを有するピクセルブロックに適用されることもでき、正方形でない可変サイズのブロックに適用されることもできる。 The prediction signal generated through the prediction unit (including the inter prediction unit 221 and/or the intra prediction unit 222) may be used to generate a restored signal or may be used to generate a residual signal. The transform unit 232 may generate transform coefficients by applying a transform technique to the residual signal. For example, the transform technique may include at least one of a discrete cosine transform (DCT), a discrete sine transform (DST), a Karhunen-Loeve transform (KLT), a graph-based transform (GBT), or a conditionally non-linear transform (CNT). Here, GBT refers to a transform obtained from a graph when the relationship information between pixels is expressed as a graph. CNT refers to a transformation that is obtained based on a prediction signal generated using all previously reconstructed pixels. The transformation process can be applied to pixel blocks having the same square size, or to non-square blocks of variable size.

量子化部233は、変換係数を量子化してエントロピーエンコード部240に送信し、エントロピーエンコード部240は、量子化された信号(量子化された変換係数に関する情報)をエンコードしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトル形態で再整列することができ、前記1次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などのような多様なエンコード方法を実行することができる。エントロピーエンコード部240は、量子化された変換係数外に、ビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値等)を共にまたは別にエンコードすることもできる。エンコードされた情報(例えば、エンコードされたビデオ/画像情報)は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信または格納されることができる。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)等、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本文書において、エンコード装置からデコード装置に伝達/シグナリングされる情報及び/又はシンタックス要素は、ビデオ/画像情報に含まれることができる。前記ビデオ/画像情報は、前述したエンコード手順を介してエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、または、デジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。エントロピーエンコード部240から出力された信号は、送信する送信部(図示せず)及び/又は格納する格納部(図示せず)がエンコード装置200の内/外部エレメントとして構成されることができ、または、送信部は、エントロピーエンコード部240に含まれることもできる。 The quantization unit 233 quantizes the transform coefficients and transmits them to the entropy encoding unit 240, and the entropy encoding unit 240 may encode the quantized signal (information about the quantized transform coefficients) and output it to a bitstream. The information about the quantized transform coefficients may be called residual information. The quantization unit 233 may rearrange the quantized transform coefficients in a block form into a one-dimensional vector form based on a coefficient scan order, and may generate information about the quantized transform coefficients based on the quantized transform coefficients in the one-dimensional vector form. The entropy encoding unit 240 may perform various encoding methods, such as, for example, exponential Golomb, context-adaptive variable length coding (CAVLC), and context-adaptive binary arithmetic coding (CABAC). The entropy encoding unit 240 may also encode information required for video/image restoration (e.g., syntax element values, etc.) together with or separately from the quantized transform coefficients. The encoded information (e.g., encoded video/image information) may be transmitted or stored in the form of a bitstream in network abstraction layer (NAL) units. The video/image information may further include information on various parameter sets, such as an adaptation parameter set (APS), a picture parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS). In addition, the video/image information may further include general constraint information. In this document, information and/or syntax elements transmitted/signaled from an encoding device to a decoding device may be included in the video/image information. The video/image information may be encoded through the above-mentioned encoding procedure and included in the bitstream. The bitstream may be transmitted via a network or stored in a digital storage medium. Here, the network may include a broadcasting network and/or a communication network, and the digital storage medium may include various storage media such as USB, SD, CD, DVD, Blu-ray, HDD, SSD, etc. A transmitting unit (not shown) for transmitting the signal output from the entropy encoding unit 240 and/or a storing unit (not shown) for storing the signal may be configured as an internal/external element of the encoding device 200, or the transmitting unit may be included in the entropy encoding unit 240.

量子化部233から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することによって、レジデュアル信号(レジデュアルブロックまたはレジデュアルサンプル)を復元することができる。加算部155は、復元されたレジデュアル信号をインター予測部221またはイントラ予測部222から出力された予測信号に加えることによって、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)が生成され得る。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部250は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。 The quantized transform coefficients output from the quantizer 233 may be used to generate a prediction signal. For example, a residual signal (residual block or residual sample) may be restored by applying inverse quantization and inverse transform to the quantized transform coefficients via the inverse quantizer 234 and the inverse transformer 235. The adder 155 may generate a reconstructed signal (reconstructed picture, reconstructed block, reconstructed sample array) by adding the reconstructed residual signal to the prediction signal output from the inter prediction unit 221 or the intra prediction unit 222. When there is no residual for the current block, such as when a skip mode is applied, the predicted block may be used as the reconstructed block. The adder 250 may be referred to as a reconstruction unit or a reconstructed block generator. The generated reconstructed signal may be used for intra prediction of the next current block in the current picture, and may also be used for inter prediction of the next picture after filtering, as described below.

一方、ピクチャエンコード及び/又は復元過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。 Meanwhile, LMCS (luma mapping with chroma scaling) can also be applied during picture encoding and/or restoration.

フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ270、具体的に、メモリ270のDPBに格納することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部260は、各フィルタリング方法に対する説明で後述するように、フィルタリングに関する多様な情報を生成してエントロピーエンコード部240に伝達することができる。フィルタリングに関する情報は、エントロピーエンコード部240でエンコードされてビットストリーム形態で出力されることができる。 The filtering unit 260 may apply filtering to the reconstructed signal to improve subjective/objective image quality. For example, the filtering unit 260 may apply various filtering methods to the reconstructed picture to generate a modified reconstructed picture, and store the modified reconstructed picture in the memory 270, specifically, in the DPB of the memory 270. The various filtering methods may include, for example, deblocking filtering, sample adaptive offset, adaptive loop filter, bilateral filter, etc. The filtering unit 260 may generate various information related to filtering and transmit it to the entropy encoding unit 240, as described below in the description of each filtering method. The filtering information may be encoded by the entropy encoding unit 240 and output in the form of a bitstream.

メモリ270に送信された修正された復元ピクチャは、インター予測部221で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置100とデコード装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。 The modified reconstructed picture transmitted to the memory 270 can be used as a reference picture in the inter prediction unit 221. When inter prediction is applied through this, the encoding device can avoid prediction mismatch between the encoding device 100 and the decoding device, and can also improve encoding efficiency.

メモリ270のDPBは、修正された復元ピクチャをインター予測部221における参照ピクチャとして使用するために格納することができる。メモリ270は、現在ピクチャ内の動き情報が導出された(または、エンコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部221に伝達することができる。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部222に伝達することができる。 The DPB of the memory 270 may store the modified reconstructed picture for use as a reference picture in the inter prediction unit 221. The memory 270 may store motion information of a block from which motion information in the current picture is derived (or encoded) and/or motion information of a block in an already reconstructed picture. The stored motion information may be transmitted to the inter prediction unit 221 to be used as motion information of a spatial neighboring block or motion information of a temporal neighboring block. The memory 270 may store reconstructed samples of reconstructed blocks in the current picture and transmit them to the intra prediction unit 222.

図3は、本文書の実施形態が適用され得るビデオ/画像デコード装置の構成を概略的に説明する図である。以下、デコード装置とは、画像デコード装置及び/又はビデオデコード装置を含むことができる。 Figure 3 is a diagram that illustrates the configuration of a video/image decoding device to which the embodiments of this document can be applied. Hereinafter, a decoding device can include an image decoding device and/or a video decoding device.

図3を参照すると、デコード装置300は、エントロピーデコード部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350、及びメモリ(memoery)360を含んで構成されることができる。予測部330は、インター予測部331及びイントラ予測部332を含むことができる。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を含むことができる。前述したエントロピーデコード部310、レジデュアル処理部320、予測部330、加算部340、及びフィルタリング部350は、実施形態によって1つのハードウェアコンポーネント(例えば、デコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ360は、DPB(decoded picture buffer)を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ360を内/外部コンポーネントとしてさらに含むこともできる。 Referring to FIG. 3, the decoding device 300 may be configured to include an entropy decoder 310, a residual processor 320, a predictor 330, an adder 340, a filtering unit 350, and a memory 360. The predictor 330 may include an inter prediction unit 331 and an intra prediction unit 332. The residual processor 320 may include a dequantizer 321 and an inverse transformer 321. The entropy decoder 310, the residual processor 320, the predictor 330, the adder 340, and the filtering unit 350 may be configured as one hardware component (e.g., a decoder chipset or processor) according to an embodiment. The memory 360 may also include a decoded picture buffer (DPB) and may be configured with a digital storage medium. The hardware components may further include the memory 360 as an internal/external component.

ビデオ/画像情報を含むビットストリームが入力されると、デコード装置300は、図2のエンコード装置でビデオ/画像情報が処理されたプロセスに対応して画像を復元することができる。例えば、デコード装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出できる。デコード装置300は、エンコード装置で適用された処理ユニットを利用してデコードを実行することができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであり、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び/又はターナリツリー構造にしたがって分割されることができる。コーディングユニットから1つ以上の変換ユニットが導出されることができる。そして、デコード装置300を介してデコード及び出力された復元画像信号は、再生装置を介して再生されることができる。 When a bitstream including video/image information is input, the decoding device 300 can restore an image corresponding to the process in which the video/image information was processed in the encoding device of FIG. 2. For example, the decoding device 300 can derive a unit/block based on block division related information obtained from the bitstream. The decoding device 300 can perform decoding using a processing unit applied in the encoding device. Thus, the processing unit for decoding is, for example, a coding unit, and the coding unit can be divided from a coding tree unit or a maximum coding unit according to a quad tree structure, a binary tree structure, and/or a ternary tree structure. One or more transform units can be derived from the coding unit. Then, the restored image signal decoded and output via the decoding device 300 can be reproduced via a reproduction device.

デコード装置300は、図2のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコード部310を介してデコードされることができる。例えば、エントロピーデコード部310は、前記ビットストリームをパーシングして画像復元(または、ピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出できる。前記ビデオ/画像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)など、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。デコード装置は、前記パラメータセットに関する情報及び/又は前記一般制限情報にも基づいてピクチャをデコードすることができる。本文書において後述されるシグナリング/受信される情報及び/又はシンタックス要素は、前記デコード手順を介してデコードされ、前記ビットストリームから取得されることができる。例えば、エントロピーデコード部310は、指数ゴロム符号化、CAVLC、またはCABACなどのコーディング方法を基づいてビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳しく、CABACエントロピーデコード方法は、ビットストリームで各シンタックス要素に該当するbinを受信し、デコード対象のシンタックス要素情報と隣接及びデコード対象ブロックのデコード情報または以前ステップでデコードされたシンボル/binの情報を利用して文脈(context)モデルを決定し、決定された文脈モデルによってbinの発生確率を予測してbinの算術デコード(arithmetic decoding)を実行することで、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピーデコード方法は、文脈モデル決定後、次のシンボル/binの文脈モデルのためにデコードされたシンボル/binの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコード部310でデコードされた情報のうち、予測に関する情報は、予測部(インター予測部332及びイントラ予測部331)に提供され、エントロピーデコード部310でエントロピーデコードが実行されたレジデュアル値、即ち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部320に入力されることができる。レジデュアル処理部320は、レジデュアル信号(レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ)を導出できる。また、エントロピーデコード部310でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部350に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部(図示せず)がデコード装置300の内/外部エレメントとしてさらに構成されることができ、または、受信部は、エントロピーデコード部310の構成要素であることもある。一方、本文書によるデコード装置は、ビデオ/画像/ピクチャデコード装置と呼ばれることができ、前記デコード装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)に区分することもできる。前記情報デコーダは、前記エントロピーデコード部310を含むことができ、前記サンプルデコーダは、前記逆量子化部321、逆変換部322、加算部340、フィルタリング部350、メモリ360、インター予測部332、及びイントラ予測部331のうち少なくとも1つを含むことができる。 The decoding device 300 may receive a signal output from the encoding device of FIG. 2 in the form of a bitstream, and the received signal may be decoded via the entropy decoding unit 310. For example, the entropy decoding unit 310 may derive information (e.g., video/image information) required for image restoration (or picture restoration) by parsing the bitstream. The video/image information may further include information on various parameter sets, such as an adaptation parameter set (APS), a picture parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS). In addition, the video/image information may further include general constraint information. The decoding device may decode a picture based on information on the parameter set and/or the general constraint information. Signaling/received information and/or syntax elements described later in this document may be decoded via the decoding procedure and obtained from the bitstream. For example, the entropy decoding unit 310 may decode information in a bitstream based on a coding method such as exponential Golomb coding, CAVLC, or CABAC, and output the value of a syntax element required for image restoration and the quantized value of a transform coefficient related to the residual. More specifically, the CABAC entropy decoding method receives a bin corresponding to each syntax element in the bitstream, determines a context model using the syntax element information to be decoded and the decode information of the adjacent and decoded blocks or the symbol/bin information decoded in the previous step, predicts the occurrence probability of the bin according to the determined context model, and performs arithmetic decoding of the bin to generate a symbol corresponding to the value of each syntax element. In this case, the CABAC entropy decoding method may update the context model using the decoded symbol/bin information for the context model of the next symbol/bin after determining the context model. Among the information decoded by the entropy decoding unit 310, information related to prediction is provided to a prediction unit (inter prediction unit 332 and intra prediction unit 331), and residual values entropy-decoded by the entropy decoding unit 310, i.e., quantized transform coefficients and related parameter information, may be input to the residual processing unit 320. The residual processing unit 320 may derive a residual signal (residual block, residual sample, residual sample array). Also, among the information decoded by the entropy decoding unit 310, information related to filtering may be provided to the filtering unit 350. Meanwhile, a receiving unit (not shown) that receives a signal output from the encoding device may be further configured as an internal/external element of the decoding device 300, or the receiving unit may be a component of the entropy decoding unit 310. Meanwhile, the decoding device according to this document may be called a video/image/picture decoding device, and the decoding device may be divided into an information decoder (video/image/picture information decoder) and a sample decoder (video/image/picture sample decoder). The information decoder may include the entropy decoding unit 310, and the sample decoder may include at least one of the inverse quantization unit 321, the inverse transform unit 322, the addition unit 340, the filtering unit 350, the memory 360, the inter prediction unit 332, and the intra prediction unit 331.

逆量子化部321では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部321は、量子化された変換係数を2次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコード装置で実行された係数スキャン順序に基づいて再整列を実行することができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を利用して量子化された変換係数に対する逆量子化を実行し、変換係数(transform coefficient)を取得することができる。 The inverse quantization unit 321 may inverse quantize the quantized transform coefficients to output the transform coefficients. The inverse quantization unit 321 may rearrange the quantized transform coefficients in a two-dimensional block form. In this case, the rearrangement may be performed based on a coefficient scan order performed in the encoding device. The inverse quantization unit 321 may perform inverse quantization on the quantized transform coefficients using a quantization parameter (e.g., quantization step size information) to obtain transform coefficients.

逆変換部322では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得するようになる。 The inverse transform unit 322 inversely transforms the transform coefficients to obtain a residual signal (residual block, residual sample array).

予測部は、現在ブロックに対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピーデコード部310から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モードを決定することができる。 The prediction unit may perform prediction on the current block and generate a predicted block including prediction samples for the current block. The prediction unit may determine whether intra prediction or inter prediction is applied to the current block based on information about the prediction output from the entropy decoding unit 310, and may determine a specific intra/inter prediction mode.

予測部320は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー(intra block copy、IBC)予測モードに基づくこともでき、または、パレットモード(palette mode)に基づくこともできる。前記IBC予測モードまたはパレットモードは、例えば、SCC(screen content coding)などのように、ゲームなどのコンテンツ画像/動画像コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点でインター予測と類似するように実行されることができる。即ち、IBCは、本文書において説明されるインター予測技法のうち少なくとも1つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ/画像情報に含まれてシグナリングされることができる。 The prediction unit 320 may generate a prediction signal based on various prediction methods described below. For example, the prediction unit may apply intra prediction or inter prediction for prediction of one block, or may simultaneously apply intra prediction and inter prediction. This may be called combined inter and intra prediction (CIIP). The prediction unit may also be based on an intra block copy (IBC) prediction mode or a palette mode for prediction of a block. The IBC prediction mode or palette mode may be used for content image/video coding such as games, for example, screen content coding (SCC). IBC basically performs prediction within a current picture, but may be performed similarly to inter prediction in that it derives a reference block within the current picture. That is, IBC may utilize at least one of the inter prediction techniques described in this document. Palette mode may be considered as an example of intra coding or intra prediction. When palette mode is applied, information regarding a palette table and a palette index may be included in the video/image information and signaled.

イントラ予測部331は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することもでき、または離れて位置することもできる。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部331は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。 The intra prediction unit 331 may predict the current block by referring to samples in the current picture. The referenced samples may be located neighbors of the current block or may be located far away depending on the prediction mode. Prediction modes in intra prediction may include a plurality of non-directional modes and a plurality of directional modes. The intra prediction unit 331 may also determine the prediction mode to be applied to the current block using the prediction modes applied to the neighboring blocks.

インター予測部332は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。例えば、インター予測部332は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出できる。多様な予測モードに基づいてインター予測が実行されることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。 The inter prediction unit 332 may derive a predicted block for the current block based on a reference block (reference sample array) identified by a motion vector on a reference picture. In this case, in order to reduce the amount of motion information transmitted in the inter prediction mode, the motion information may be predicted in units of blocks, sub-blocks, or samples based on the correlation of motion information between neighboring blocks and the current block. The motion information may include a motion vector and a reference picture index. The motion information may further include inter prediction direction (L0 prediction, L1 prediction, Bi prediction, etc.) information. In the case of inter prediction, the neighboring block may include a spatial neighboring block present in the current picture and a temporal neighboring block present in the reference picture. For example, the inter prediction unit 332 may construct a motion information candidate list based on the neighboring blocks, and derive a motion vector and/or a reference picture index for the current block based on the received candidate selection information. Inter prediction can be performed based on various prediction modes, and the information regarding the prediction can include information indicating the mode of inter prediction for the current block.

加算部340は、取得されたレジデュアル信号を予測部(インター予測部332及び/又はイントラ予測部331を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。 The adder 340 can generate a reconstructed signal (reconstructed picture, reconstructed block, reconstructed sample array) by adding the acquired residual signal to a prediction signal (predicted block, predicted sample array) output from a prediction unit (including the inter prediction unit 332 and/or the intra prediction unit 331). When there is no residual for the block to be processed, such as when a skip mode is applied, the predicted block can be used as the reconstructed block.

加算部340は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることもでき、または、次のピクチャのインター予測のために使用されることもできる。 The adder 340 may be referred to as a reconstruction unit or a reconstruction block generator. The generated reconstruction signal may be used for intra prediction of the next block to be processed in the current picture, may be output after filtering as described below, or may be used for inter prediction of the next picture.

一方、ピクチャデコード過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。 Meanwhile, LMCS (luma mapping with chroma scaling) can also be applied during the picture decoding process.

フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ360、具体的に、メモリ360のDPBに送信することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。 The filtering unit 350 may apply filtering to the reconstructed signal to improve subjective/objective image quality. For example, the filtering unit 350 may apply various filtering methods to the reconstructed picture to generate a modified reconstructed picture, and may transmit the modified reconstructed picture to the memory 360, specifically, to the DPB of the memory 360. The various filtering methods may include, for example, deblocking filtering, sample adaptive offset, adaptive loop filter, bilateral filter, etc.

メモリ360のDPBに格納された(修正された)復元ピクチャは、インター予測部332で参照ピクチャとして使用されることができる。メモリ360は、現在ピクチャ内の動き情報が導出された(または、デコードされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ360は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部331に伝達することができる。 The (modified) reconstructed picture stored in the DPB of the memory 360 can be used as a reference picture in the inter prediction unit 332. The memory 360 can store motion information of a block from which motion information in the current picture is derived (or decoded) and/or motion information of a block in an already reconstructed picture. The stored motion information can be transmitted to the inter prediction unit 260 to be used as motion information of a spatial neighboring block or motion information of a temporal neighboring block. The memory 360 can store reconstructed samples of reconstructed blocks in the current picture and transmit them to the intra prediction unit 331.

本文書において、エンコード装置200のフィルタリング部260、インター予測部221、及びイントラ予測部222で説明された実施形態は、各々、デコード装置300のフィルタリング部350、インター予測部332、及びイントラ予測部331にも同一または対応するように適用されることができる。 In this document, the embodiments described for the filtering unit 260, inter prediction unit 221, and intra prediction unit 222 of the encoding device 200 can be applied identically or correspondingly to the filtering unit 350, inter prediction unit 332, and intra prediction unit 331 of the decoding device 300, respectively.

前述したように、ビデオコーディングを実行するにあたって、圧縮効率を上げるために予測を実行する。これを介してコーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、予測されたブロックは、空間ドメイン(または、ピクセルドメイン)での予測サンプルを含む。予測されたブロックは、エンコード装置及びデコード装置で同じく導出され、エンコード装置は、原本ブロックの原本サンプル値自体でない原本ブロックと予測されたブロックとの間のレジデュアルに関する情報(レジデュアル情報)をデコード装置にシグナリングすることで画像コーディング効率を上げることができる。デコード装置は、レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、レジデュアルブロックと予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。 As described above, prediction is performed to improve compression efficiency when performing video coding. Through this, a predicted block including predicted samples for a current block, which is a block to be coded, can be generated. Here, the predicted block includes predicted samples in the spatial domain (or pixel domain). The predicted block is derived in the same manner by the encoding device and the decoding device, and the encoding device can improve image coding efficiency by signaling information (residual information) regarding the residual between an original block and a predicted block, which is not the original sample value of the original block itself, to the decoding device. The decoding device can derive a residual block including residual samples based on the residual information, combine the residual block with the predicted block to generate a restored block including restored samples, and generate a restored picture including the restored block.

前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコード装置は、原本ブロックと予測されたブロックとの間のレジデュアルブロックを導出し、レジデュアルブロックに含まれているレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を実行して変換係数を導出し、変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を(ビットストリームを介して)デコード装置にシグナリングされることができる。ここで、レジデュアル情報は、量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、レジデュアル情報に基づいて逆量子化/逆変換手順を実行してレジデュアルサンプル(または、レジデュアルブロック)を導出できる。デコード装置は、予測されたブロックとレジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコード装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。 The residual information may be generated through a transform and quantization procedure. For example, the encoding device may derive a residual block between an original block and a predicted block, perform a transform procedure on the residual samples (residual sample array) included in the residual block to derive transform coefficients, and perform a quantization procedure on the transform coefficients to derive quantized transform coefficients, thereby signaling the related residual information to the decoding device (via a bitstream). Here, the residual information may include information such as value information, position information, transform technique, transform kernel, and quantization parameter of the quantized transform coefficients. The decoding device may derive a residual sample (or a residual block) by performing an inverse quantization/inverse transform procedure based on the residual information. The decoding device may generate a reconstructed picture based on the predicted block and the residual block. In addition, the encoding device may derive a residual block by inverse quantizing/inverse transforming the quantized transform coefficients for reference for inter-prediction of a future picture, and generate a reconstructed picture based on the residual block.

イントラ予測は、現在ブロックが属するピクチャ(以下、現在ピクチャという)内の参照サンプルに基づいて現在ブロックに対する予測サンプルを生成する予測を示すことができる。現在ブロックにイントラ予測が適用される場合、現在ブロックのイントラ予測に使用する隣接参照サンプルが導出されることができる。現在ブロックの隣接参照サンプルは、nW×nHサイズの現在ブロックの左側(left)境界に隣接したサンプル及び左下側(bottom-left)に隣接した総2×nH個のサンプル、現在ブロックの上側(top)境界に隣接したサンプル及び右上側(top-right)に隣接した総2×nW個のサンプル及び現在ブロックの左上側(top-left)に隣接した1個のサンプルを含むことができる。または、現在ブロックの隣接参照サンプルは、複数列の上側隣接サンプル及び複数行の左側隣接サンプルを含むこともできる。また、現在ブロックの隣接参照サンプルは、nW×nHサイズの現在ブロックの右側(right)境界に隣接した総nH個のサンプル、現在ブロックの下側(bottom)境界に隣接した総nW個のサンプル及び現在ブロックの右下側(bottom-right)に隣接した1個のサンプルを含むこともできる。 Intra prediction may refer to a prediction that generates a prediction sample for a current block based on a reference sample in a picture to which the current block belongs (hereinafter, referred to as a current picture). When intra prediction is applied to the current block, neighboring reference samples used for intra prediction of the current block may be derived. The neighboring reference samples of the current block may include a total of 2×nH samples adjacent to the left boundary and bottom-left of the current block having a size of nW×nH, a total of 2×nW samples adjacent to the top boundary and top-right of the current block, and one sample adjacent to the top-left of the current block. Alternatively, the neighboring reference samples of the current block may include upper neighboring samples of multiple columns and left neighboring samples of multiple rows. In addition, the neighboring reference samples of the current block may include a total of nH samples adjacent to the right boundary of the current block having a size of nW x nH, a total of nW samples adjacent to the bottom boundary of the current block, and one sample adjacent to the bottom-right side of the current block.

ただし、現在ブロックの隣接参照サンプルのうち一部は、まだデコードされない、または利用可能でない場合がある。この場合、デコーダは、利用可能なサンプルとして利用可能でないサンプルを代替(substitution)して予測に使用する隣接参照サンプルを構成することができる。または、利用可能なサンプルの補間(interpolation)を介して予測に使用する隣接参照サンプルを構成することができる。 However, some of the neighboring reference samples of the current block may not yet be decoded or available. In this case, the decoder may construct neighboring reference samples to be used for prediction by substituting unavailable samples as available samples. Alternatively, the decoder may construct neighboring reference samples to be used for prediction through interpolation of available samples.

隣接参照サンプルが導出された場合、(i)現在ブロックの隣接(neighboring)参照サンプルの平均(average)または補間(interpolation)に基づいて予測サンプルを誘導することができ、(ii)現在ブロックの隣接参照サンプルのうち、予測サンプルに対して特定(予測)方向に存在する参照サンプルに基づいて予測サンプルを誘導することもできる。(i)の場合は、非方向性(non-directional)モードまたは非角度(non-angular)モードと呼ばれ、(ii)の場合は、方向性(directional)モードまたは角度(angular)モードと呼ばれることができる。 When the neighboring reference samples are derived, (i) the prediction sample can be derived based on an average or an interpolation of the neighboring reference samples of the current block, or (ii) the prediction sample can be derived based on a reference sample that exists in a specific (prediction) direction with respect to the prediction sample among the neighboring reference samples of the current block. Case (i) can be called a non-directional mode or a non-angular mode, and case (ii) can be called a directional mode or an angular mode.

また、隣接参照サンプルのうち現在ブロックの予測サンプルを基準にして、現在ブロックのイントラ予測モードの予測方向に位置する第1の隣接サンプルと前記予測方向の反対方向に位置する第2の隣接サンプルとの補間を介して予測サンプルが生成されることもできる。前述した場合は、線形補間イントラ予測(Linear interpolation intra prediction、LIP)と呼ばれることができる。また、線形モデル(linear model、LM)を利用してルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、LMモードまたはCCLM(chroma component LM)モードと呼ばれることができる。 In addition, a prediction sample may be generated by interpolating a first adjacent sample located in a prediction direction of an intra prediction mode of the current block and a second adjacent sample located in an opposite direction to the prediction direction based on a prediction sample of the current block among the adjacent reference samples. This may be called linear interpolation intra prediction (LIP). In addition, a chroma prediction sample may be generated based on a luma sample using a linear model (LM). In this case, it may be called an LM mode or a CCLM (chroma component LM) mode.

また、フィルタリングされた隣接参照サンプルに基づいて現在ブロックの臨時予測サンプルを導出し、既存の隣接参照サンプル、即ち、フィルタリングされない隣接参照サンプルのうち、前記イントラ予測モードによって導出された少なくとも1つの参照サンプルと臨時予測サンプルとを加重和(weighted sum)して現在ブロックの予測サンプルを導出することもできる。前述した場合は、PDPC(Position dependent intra prediction)と呼ばれることができる。 In addition, a temporary prediction sample of the current block may be derived based on the filtered neighboring reference sample, and a prediction sample of the current block may be derived by taking a weighted sum of at least one reference sample derived according to the intra prediction mode among existing neighboring reference samples, i.e., non-filtered neighboring reference samples, and the temporary prediction sample. The above case may be called position dependent intra prediction (PDPC).

また、現在ブロックの隣接多重参照サンプルラインの中から最も予測正確度が高い参照サンプルラインを選択して該当ラインで予測方向に位置する参照サンプルを利用して予測サンプルを導出し、このときに使用された参照サンプルラインをデコード装置に指示(シグナリング)する方法でイントラ予測符号化を実行することができる。前述した場合は、多重参照ライン(multi-reference line)イントラ予測またはMRLベースのイントラ予測と呼ばれることができる。 In addition, intra prediction coding can be performed by selecting a reference sample line with the highest prediction accuracy from among the adjacent multiple reference sample lines of the current block, deriving a prediction sample using a reference sample located in the prediction direction on the corresponding line, and signaling the reference sample line used at this time to a decoding device. The above case can be called multi-reference line intra prediction or MRL-based intra prediction.

また、現在ブロックを垂直または水平のサブパーティションに分けて同じイントラ予測モードに基づいてイントラ予測を実行し、サブパーティション単位で隣接参照サンプルを導出して利用できる。即ち、この場合、現在ブロックに対するイントラ予測モードがサブパーティションに同じく適用され、サブパーティション単位で隣接参照サンプルを導出して利用することによって、場合によって、イントラ予測性能を高めることができる。このような予測方法は、ISP(intra sub-partitions)ベースのイントラ予測と呼ばれることができる。 In addition, the current block may be divided into vertical or horizontal sub-partitions, and intra prediction may be performed based on the same intra prediction mode, and adjacent reference samples may be derived and used on a sub-partition basis. That is, in this case, the intra prediction mode for the current block is equally applied to the sub-partitions, and adjacent reference samples may be derived and used on a sub-partition basis, thereby improving intra prediction performance in some cases. Such a prediction method may be called ISP (intra sub-partitions) based intra prediction.

前述したイントラ予測方法は、イントラ予測モードと区分してイントラ予測タイプと呼ばれることができる。イントラ予測タイプは、イントラ予測技法または付加イントラ予測モードなど、多様な用語で呼ばれることができる。例えば、イントラ予測タイプ(または、付加イントラ予測モードなど)は、前述したLIP、PDPC、MRL、ISPのうち少なくとも1つを含むことができる。前記LIP、PDPC、MRL、ISPなどの特定イントラ予測タイプを除いた一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、前記のような特定イントラ予測タイプが適用されない場合、一般的に適用されることができ、前述したイントラ予測モードに基づいて予測が実行されることができる。一方、必要によって、導出された予測サンプルに対する後処理フィルタリングが実行されることもできる。 The intra prediction methods described above may be called intra prediction types, distinguished from intra prediction modes. The intra prediction types may be called by various terms, such as intra prediction techniques or additional intra prediction modes. For example, the intra prediction types (or additional intra prediction modes, etc.) may include at least one of the above-mentioned LIP, PDPC, MRL, and ISP. A general intra prediction method other than the specific intra prediction types, such as the LIP, PDPC, MRL, and ISP, may be called a normal intra prediction type. The normal intra prediction type may be generally applied when the above-mentioned specific intra prediction types are not applied, and prediction may be performed based on the above-mentioned intra prediction modes. Meanwhile, post-processing filtering may be performed on the derived prediction samples, if necessary.

具体的に、イントラ予測手順は、イントラ予測モード/タイプ決定ステップ、隣接参照サンプル導出ステップ、イントラ予測モード/タイプベースの予測サンプル導出ステップを含むことができる。また、必要によって、導出された予測サンプルに対する後処理フィルタリング(post-filtering)ステップが実行されることもできる。 Specifically, the intra prediction procedure may include an intra prediction mode/type determination step, an adjacent reference sample derivation step, and an intra prediction mode/type-based prediction sample derivation step. In addition, if necessary, a post-processing filtering step may be performed on the derived prediction sample.

イントラ予測が適用される場合、周辺ブロックのイントラ予測モードを用いて現在ブロックに適用されるイントラ予測モードが決定され得る。例えば、デコード装置は、現在ブロックの周辺ブロック(ex.左側及び/又は上側周辺ブロック)のイントラ予測モード及び追加的な候補モードに基づいて導出されたMPM(most probable mode)リスト内のMPM候補のうち1つを受信されたMPMインデックスに基づいて選択することができ、または、MPM候補(及びプラナーモード)に含まれなかった残りのイントラ予測モードのうち1つをリメイニングイントラ予測モード情報に基づいて選択することができる。MPMリストは、プラナーモードを候補として含むか、含まないように構成されることができる。例えば、MPMリストがプラナーモードを候補として含む場合、MPMリストは、6個の候補を有することができ、MPMリストがプラナーモードを候補として含まない場合、MPMリストは、5個の候補を有することができる。MPMリストがプラナーモードを候補として含まない場合、現在ブロックのイントラ予測モードがプラナーモードでないか表すnotプラナーフラグ(ex.intra_luma_not_planar_flag)がシグナリングされ得る。例えば、MPMフラグが先にシグナリングされ、MPMインデックス及びnotプラナーフラグは、MPMフラグの値が1である場合、シグナリングされることができる。また、MPMインデックスは、notプラナーフラグの値が1である場合、シグナリングされることができる。ここで、MPMリストがプラナーモードを候補として含まないように構成されることは、プラナーモードがMPMでないというよりは、MPMとして常にプラナーモードが考慮されるので、先にフラグ(not planar flag)をシグナリングしてプラナーモードであるか否かを先に確認するためである。 When intra prediction is applied, the intra prediction mode applied to the current block may be determined using the intra prediction mode of the surrounding block. For example, the decoding device may select one of the MPM candidates in the MPM (most probable mode) list derived based on the intra prediction modes of the surrounding blocks (ex. left and/or upper surrounding blocks) of the current block and additional candidate modes based on the received MPM index, or may select one of the remaining intra prediction modes not included in the MPM candidates (and the planar mode) based on the remaining intra prediction mode information. The MPM list may be configured to include or not include the planar mode as a candidate. For example, if the MPM list includes the planar mode as a candidate, the MPM list may have six candidates, and if the MPM list does not include the planar mode as a candidate, the MPM list may have five candidates. If the MPM list does not include the planar mode as a candidate, a not planar flag (ex. intra_luma_not_planar_flag) indicating that the intra prediction mode of the current block is not a planar mode may be signaled. For example, the MPM flag may be signaled first, and the MPM index and the not planar flag may be signaled if the value of the MPM flag is 1. Also, the MPM index may be signaled if the value of the not planar flag is 1. Here, the reason why the MPM list is configured not to include the planar mode as a candidate is that the planar mode is always considered as an MPM, rather than the planar mode being not an MPM, so the flag (not planar flag) is signaled first to first check whether the mode is a planar mode.

例えば、現在ブロックに適用されるイントラ予測モードがMPM候補(及びプラナーモード)の中にあるか、それとも、リメイニングモードの中にあるかは、MPMフラグ(ex.intra_luma_mpm_flag)に基づいて指示されることができる。MPMフラグの値1は、現在ブロックに対するイントラ予測モードがMPM候補(及びプラナーモード)内にあることを表すことができ、MPM flagの値0は、現在ブロックに対するイントラ予測モードがMPM候補(及びプラナーモード)内にないことを表すことができる。notプラナーフラグ(ex.intra_luma_not_planar_flag)値0は、現在ブロックに対するイントラ予測モードがプラナーモードであることを表すことができ、notプラナーフラグ値1は、現在ブロックに対するイントラ予測モードがプラナーモードでないことを表すことができる。MPMインデックスは、mpm_idxまたはintra_luma_mpm_idxシンタックス要素の形態でシグナリングされることができ、リメイニングイントラ予測モード情報は、rem_intra_luma_pred_modeまたはintra_luma_mpm_remainderシンタックス要素の形態でシグナリングされることができる。例えば、リメイニングイントラ予測モード情報は、全体イントラ予測モードのうち、MPM候補(及びプラナーモード)に含まれない残りのイントラ予測モードを予測モード番号順にインデクシングして、そのうち1つを指すことができる。イントラ予測モードは、ルマ成分(サンプル)に対するイントラ予測モードであることができる。以下、イントラ予測モード情報は、MPM flag(ex.intra_luma_mpm_flag)、not planar flag(ex.intra_luma_not_planar_flag)、MPMインデックス(ex.mpm_idxまたはintra_luma_mpm_idx)、リメイニングイントラ予測モード情報(rem_intra_luma_pred_modeまたはintra_luma_mpm_remainder)のうち、少なくとも1つを含むことができる。本文書においてMPMリストは、MPM候補リスト、candModeListなど、様々な用語と呼ばれることができる。MIP(matrix-based intra prediction)が現在ブロックに適用される場合、MIPのための別のmpm flag(ex.intra_mip_mpm_flag)、mpmインデックス(ex.intra_mip_mpm_idx)、リメイニングイントラ予測モード情報(ex.intra_mip_mpm_remainder)がシグナリングされ得るし、not planar flagは、シグナリングされない。 For example, whether the intra prediction mode applied to the current block is among the MPM candidates (and planar mode) or among the remaining mode can be indicated based on the MPM flag (ex.intra_luma_mpm_flag). A value of 1 of the MPM flag can indicate that the intra prediction mode for the current block is among the MPM candidates (and planar mode), and a value of 0 of the MPM flag can indicate that the intra prediction mode for the current block is not among the MPM candidates (and planar mode). A value of 0 of the not planar flag (ex.intra_luma_not_planar_flag) can indicate that the intra prediction mode for the current block is planar mode, and a value of 1 of the not planar flag can indicate that the intra prediction mode for the current block is not planar mode. The MPM index may be signaled in the form of an mpm_idx or intra_luma_mpm_idx syntax element, and the remaining intra prediction mode information may be signaled in the form of a rem_intra_luma_pred_mode or intra_luma_mpm_reminder syntax element. For example, the remaining intra prediction mode information may index the remaining intra prediction modes not included in the MPM candidates (and planar modes) among all intra prediction modes in order of prediction mode numbers, and may indicate one of them. The intra prediction mode may be an intra prediction mode for a luma component (sample). Hereinafter, the intra prediction mode information may include at least one of an MPM flag (ex.intra_luma_mpm_flag), a not planar flag (ex.intra_luma_not_planar_flag), an MPM index (ex.mpm_idx or intra_luma_mpm_idx), and remaining intra prediction mode information (rem_intra_luma_pred_mode or intra_luma_mpm_reminder). In this document, the MPM list may be referred to by various terms such as an MPM candidate list, a candModeList, etc. If matrix-based intra prediction (MIP) is applied to the current block, a separate mpm flag for MIP (ex.intra_mip_mpm_flag), mpm index (ex.intra_mip_mpm_idx), and remaining intra prediction mode information (ex.intra_mip_mpm_reminder) may be signaled, and the not planar flag is not signaled.

言い換えれば、一般的に、画像に対するブロック分割になると、コーディングしようとする現在ブロックと周辺(neighboring)ブロックとは、類似した画像特性を有するようになる。したがって、現在ブロックと周辺ブロックとは、互いに同一であるか、類似したイントラ予測モードを有する確率が高い。したがって、エンコーダは、現在ブロックのイントラ予測モードをエンコードするために、周辺ブロックのイントラ予測モードを用いることができる。 In other words, in general, when an image is divided into blocks, the current block to be coded and the neighboring blocks have similar image characteristics. Therefore, the current block and the neighboring blocks are highly likely to have the same or similar intra prediction modes. Therefore, the encoder can use the intra prediction modes of the neighboring blocks to encode the intra prediction mode of the current block.

例えば、エンコーダ/デコーダは、現在ブロックに対するMPM(most probable modes)リストを構成できる。MPMリストは、MPM候補リストと表すこともできる。ここで、MPMとは、イントラ予測モードコーディングの際、現在ブロックと周辺ブロックとの類似性を考慮して、コーディング効率を向上させるために用いられるモードを意味することができる。上述したように、MPMリストは、プラナーモードを含んで構成されることができ、またはプラナーモードを除いて構成されることができる。例えば、MPMリストがプラナーモードを含む場合、MPMリストの候補の個数は、6個であることができる。そして、MPMリストがプラナーモードを含まない場合、MPMリストの候補の個数は、5個であることができる。エンコーダ/デコーダは、5個または6個のMPMを含むMPMリストを構成できる。 For example, the encoder/decoder may configure a most probable modes (MPM) list for the current block. The MPM list may also be referred to as an MPM candidate list. Here, MPM may refer to a mode used to improve coding efficiency in consideration of similarity between the current block and a neighboring block during intra prediction mode coding. As described above, the MPM list may be configured to include a planar mode or may be configured to exclude a planar mode. For example, if the MPM list includes a planar mode, the number of candidates in the MPM list may be six. And, if the MPM list does not include a planar mode, the number of candidates in the MPM list may be five. The encoder/decoder may configure an MPM list including five or six MPMs.

MPMリストを構成するために、デフォルトイントラモード(Default intra modes)、周辺イントラモード(Neighbour intra modes)、及び導出されたイントラモード(Derved intra modes)の3つの種類のモードが考慮され得る。このとき、周辺イントラモードのために、2つの周辺ブロック、すなわち、左側周辺ブロック及び上側周辺ブロックが考慮され得る。 To construct the MPM list, three types of modes may be considered: default intra modes, neighborhood intra modes, and derived intra modes. For the neighborhood intra modes, two neighboring blocks, i.e., the left neighboring block and the top neighboring block, may be considered.

上述したように、仮りに、MPMリストがプラナーモードを含まないように構成する場合、前記リストからプラナー(planar)モードが除かれ、前記MPMリスト候補の個数は、5個に設定されることができる。 As described above, if the MPM list is configured not to include planar mode, planar mode is removed from the list and the number of MPM list candidates can be set to five.

また、イントラ予測モードのうち、非方向性モード(または、非角度モード)は、現在ブロックの周辺(neighboring)参照サンプルの平均(average)に基づくDCモードまたは補間(interpolation)に基づくプラナー(planar)モードを含むことができる。 Furthermore, among the intra prediction modes, the non-directional mode (or non-angular mode) may include a DC mode based on the average of neighboring reference samples of the current block or a planar mode based on interpolation.

インター予測が適用される場合、エンコード装置/デコード装置の予測部は、ブロック単位でインター予測を実行して予測サンプルを導出できる。インター予測は、現在ピクチャ以外のピクチャ(ら)のデータ要素(例えば、サンプル値、または動き情報)に依存した方法で導出される予測を示すことができる(Inter prediction can be a prediction derived in a manner that is dependent on data elements(例えば、sample values or motion information)of picture(s) other than the current picture)。現在ブロックにインター予測が適用される場合、参照ピクチャインデックスが指す参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロック(予測サンプルアレイ)を誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、現在ブロックの動き情報をブロック、サブブロックまたはサンプル単位で予測できる。動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。また、動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測が適用される場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。参照ブロックを含む参照ピクチャと時間的隣接ブロックを含む参照ピクチャは、同じであってもよく、異なってもよい。時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(colCU)などの名称で呼ばれることができ、時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、現在ブロックの隣接ブロックに基づいて動き情報候補リストが構成されることができ、現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が選択(使用)されるかを指示するフラグまたはインデックス情報がシグナリングされることができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、現在ブロックの動き情報は、選択された隣接ブロックの動き情報と同じである。スキップモードの場合、マージモードとは違って、レジデュアル信号が送信されない。動き情報予測(motion vector prediction、MVP)モードの場合、選択された隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用し、動きベクトル差分(motion vector difference)はシグナリングされることができる。この場合、前記動きベクトル予測子及び動きベクトル差分の和を利用して現在ブロックの動きベクトルを導出できる。 When inter prediction is applied, the prediction unit of the encoding device/decoding device can perform inter prediction on a block-by-block basis to derive a prediction sample. Inter prediction can refer to a prediction derived in a manner that is dependent on data elements (e.g., sample values or motion information) of picture(s) other than the current picture. When inter prediction is applied to the current block, a predicted block (prediction sample array) for the current block may be derived based on a reference block (reference sample array) identified by a motion vector on a reference picture pointed to by a reference picture index. In this case, in order to reduce the amount of motion information transmitted in the inter prediction mode, the motion information of the current block may be predicted in units of blocks, sub-blocks, or samples based on the correlation of motion information between neighboring blocks and the current block. The motion information may include a motion vector and a reference picture index. In addition, the motion information may further include inter prediction type (L0 prediction, L1 prediction, Bi prediction, etc.) information. When inter prediction is applied, the neighboring blocks may include a spatial neighboring block present in the current picture and a temporal neighboring block present in the reference picture. The reference picture including the reference block and the reference picture including the temporal neighboring block may be the same or different. A temporally adjacent block may be called a collocated reference block, a collocated CU (colCU), etc., and a reference picture including a temporally adjacent block may be called a collocated picture (colPic). For example, a motion information candidate list may be constructed based on the neighboring blocks of the current block, and flag or index information indicating which candidate is selected (used) to derive a motion vector and/or a reference picture index of the current block may be signaled. Inter prediction may be performed based on various prediction modes, for example, in the case of skip mode and merge mode, the motion information of the current block is the same as the motion information of the selected neighboring block. In the case of skip mode, unlike the merge mode, a residual signal is not transmitted. In the case of a motion vector prediction (MVP) mode, the motion vector of the selected neighboring block is used as a motion vector predictor, and a motion vector difference can be signaled. In this case, the motion vector of the current block can be derived using the sum of the motion vector predictor and the motion vector difference.

動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測等)によってL0動き情報及び/又はL1動き情報を含むことができる。L0方向の動きベクトルは、L0動きベクトルまたはMVL0と呼ばれることができ、L1方向の動きベクトルは、L1動きベクトルまたはMVL1と呼ばれることができる。L0動きベクトルに基づく予測はL0予測と呼ばれることができ、L1動きベクトルに基づく予測はL1予測と呼ばれることができ、L0動きベクトル及びL1動きベクトルの両方ともに基づく予測は対(Bi)予測と呼ばれることができる。ここで、L0動きベクトルは、参照ピクチャリストL0(L0)に関連した動きベクトルを示すことができ、L1動きベクトルは、参照ピクチャリストL1(L1)に関連した動きベクトルを示すことができる。参照ピクチャリストL0は、現在ピクチャより出力順序上以前ピクチャを参照ピクチャとして含むことができ、参照ピクチャリストL1は、現在ピクチャより出力順序上以後ピクチャを含むことができる。以前ピクチャは、順方向(参照)ピクチャと呼ばれることができ、以後ピクチャは、逆方向(参照)ピクチャと呼ばれることができる。参照ピクチャリストL0は、現在ピクチャより出力順序上以後ピクチャを参照ピクチャとしてさらに含むことができる。この場合、参照ピクチャリストL0内で以前ピクチャが先にインデクシングされ、以後ピクチャは、その次にインデクシングされることができる。参照ピクチャリストL1は、現在ピクチャより出力順序上以前ピクチャを参照ピクチャとしてさらに含むことができる。この場合、参照ピクチャリストL1内で以後ピクチャが先にインデクシングされ、以前ピクチャは、その次にインデクシングされることができる。ここで、出力順序は、POC(picture order count)順序(order)に対応されることができる。 The motion information may include L0 motion information and/or L1 motion information depending on the inter prediction type (L0 prediction, L1 prediction, Bi prediction, etc.). A motion vector in the L0 direction may be referred to as an L0 motion vector or MVL0, and a motion vector in the L1 direction may be referred to as an L1 motion vector or MVL1. A prediction based on an L0 motion vector may be referred to as an L0 prediction, a prediction based on an L1 motion vector may be referred to as an L1 prediction, and a prediction based on both an L0 motion vector and an L1 motion vector may be referred to as a pairwise (Bi) prediction. Here, the L0 motion vector may indicate a motion vector associated with a reference picture list L0 (L0), and the L1 motion vector may indicate a motion vector associated with a reference picture list L1 (L1). The reference picture list L0 may include a previous picture in the output order from the current picture as a reference picture, and the reference picture list L1 may include a subsequent picture in the output order from the current picture. The previous picture may be referred to as a forward (reference) picture, and the subsequent picture may be referred to as a backward (reference) picture. The reference picture list L0 may further include pictures that are later in the output order than the current picture as reference pictures. In this case, the previous picture may be indexed first in the reference picture list L0, and the later picture may be indexed next. The reference picture list L1 may further include pictures that are earlier in the output order than the current picture as reference pictures. In this case, the later picture may be indexed first in the reference picture list L1, and the previous picture may be indexed next. Here, the output order may correspond to a picture order count (POC) order.

図4は、本文書の実施形態が適用可能な概略的なビデオ/画像エンコード方法の一例を示す。 Figure 4 shows an example of a schematic video/image encoding method to which embodiments of this document can be applied.

図4に開示された方法は、上述した図2のエンコード装置200によって行われることができる。具体的に、S400は、エンコード装置200のインター予測部221またはイントラ予測部222によって行われることができ、S410、S420、S430、S440は、それぞれエンコード装置200の減算部231、変換部232、量子化部233、エントロピーエンコード部240によって行われることができる。 The method disclosed in FIG. 4 may be performed by the encoding device 200 of FIG. 2 described above. Specifically, S400 may be performed by the inter prediction unit 221 or the intra prediction unit 222 of the encoding device 200, and S410, S420, S430, and S440 may be performed by the subtraction unit 231, the transformation unit 232, the quantization unit 233, and the entropy encoding unit 240 of the encoding device 200, respectively.

図4に示すように、エンコード装置は、現在ブロックに対する予測を介して予測サンプルを導出できる(S400)。エンコード装置は、現在ブロックにインター予測を行うか、またはイントラ予測を行うかの可否を決定することができ、具体的なインター予測モードまたは具体的なイントラ予測モードをRDコストに基づいて決定することができる。決定されたモードによってエンコード装置は、現在ブロックに対する予測サンプルを導出できる。 As shown in FIG. 4, the encoding device may derive a prediction sample through prediction for a current block (S400). The encoding device may determine whether to perform inter prediction or intra prediction for the current block, and may determine a specific inter prediction mode or a specific intra prediction mode based on the RD cost. Depending on the determined mode, the encoding device may derive a prediction sample for the current block.

エンコード装置は、現在ブロックに対する原本サンプルと予測サンプルとを比較してレジデュアルサンプルを導出できる(S410)。 The encoding device can derive a residual sample by comparing the original sample and the predicted sample for the current block (S410).

エンコード装置は、レジデュアルサンプルに対する変換手順を介して変換係数を導出し(S420)、導出された変換係数を量子化して、量子化された変換係数を導出できる(S430)。 The encoding device can derive transform coefficients through a transform procedure on the residual samples (S420) and quantize the derived transform coefficients to derive quantized transform coefficients (S430).

エンコード装置は、予測情報及びレジデュアル情報を含む画像情報をエンコードし、エンコードされた画像情報をビットストリーム形態で出力することができる(S440)。予測情報は、予測手順に関連した情報であって、予測モード情報及び動き情報に関する情報(ex.インター予測が適用される場合)などを含むことができる。レジデュアル情報は、量子化された変換係数に関する情報を含むことができる。レジデュアル情報は、エントロピーコーディングされることができる。 The encoding device may encode image information including prediction information and residual information, and output the encoded image information in the form of a bitstream (S440). The prediction information is information related to a prediction procedure, and may include prediction mode information and information related to motion information (e.g., when inter prediction is applied). The residual information may include information related to quantized transform coefficients. The residual information may be entropy coded.

出力されたビットストリームは、格納媒体またはネットワークを介してデコード装置に伝達されることができる。 The output bitstream can be transmitted to a decoding device via a storage medium or a network.

図5は、本文書の実施形態が適用可能な概略的なビデオ/画像デコード方法の一例を示す。 Figure 5 shows an example of a general video/image decoding method to which embodiments of this document can be applied.

図5に開示された方法は、上述した図3のデコード装置300によって行われることができる。具体的に、S500は、デコード装置300のインター予測部332またはイントラ予測部331によって行われることができる。S500でビットストリームに含まれた予測情報をデコードして関連シンタックス要素の値を導出する手順は、デコード装置300のエントロピーデコード部310によって行われることができる。S510、S520、S530、S540は、それぞれデコード装置300のエントロピーデコード部310、逆量子化部321、逆変換部322、加算部340によって行われることができる。 The method disclosed in FIG. 5 may be performed by the decoding device 300 of FIG. 3 described above. Specifically, S500 may be performed by the inter prediction unit 332 or the intra prediction unit 331 of the decoding device 300. The procedure of decoding prediction information included in the bitstream in S500 and deriving values of related syntax elements may be performed by the entropy decoding unit 310 of the decoding device 300. S510, S520, S530, and S540 may be performed by the entropy decoding unit 310, the inverse quantization unit 321, the inverse transform unit 322, and the addition unit 340 of the decoding device 300, respectively.

図5に示すように、デコード装置は、エンコード装置で行われた動作と対応する動作を行うことができる。デコード装置は、受信された予測情報に基づいて現在ブロックに対するインター予測またはイントラ予測を行い、予測サンプルを導出できる(S500)。 As shown in FIG. 5, the decoding device may perform operations corresponding to those performed by the encoding device. The decoding device may perform inter prediction or intra prediction on the current block based on the received prediction information and derive a prediction sample (S500).

デコード装置は、受信されたレジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出できる(S510)。デコード装置は、エントロピーデコードを介してレジデュアル情報から量子化された変換係数を導出できる。 The decoding device may derive quantized transform coefficients for the current block based on the received residual information (S510). The decoding device may derive the quantized transform coefficients from the residual information through entropy decoding.

デコード装置は、量子化された変換係数を逆量子化して変換係数を導出できる(S520)。 The decoding device can dequantize the quantized transform coefficients to derive the transform coefficients (S520).

デコード装置は、変換係数に対する逆変換手順を介してレジデュアルサンプルを導出する(S530)。 The decoding device derives residual samples through an inverse transform procedure on the transform coefficients (S530).

デコード装置は、予測サンプル及びレジデュアルサンプルに基づいて現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成できる(S540)。その後、復元ピクチャにインループフィルタリング手順がさらに適用され得ることは、上述したとおりである。 The decoding device may generate a reconstructed sample for the current block based on the predicted sample and the residual sample, and generate a reconstructed picture based on the reconstructed sample (S540). As described above, an in-loop filtering procedure may then be further applied to the reconstructed picture.

一方、前述したように、エンコード装置の量子化部は、変換係数に量子化を適用して量子化された変換係数を導出でき、エンコード装置の逆量子化部またはデコード装置の逆量子化部は、量子化された変換係数に逆量子化を適用して変換係数を導出できる。 Meanwhile, as described above, the quantization unit of the encoding device can apply quantization to the transform coefficients to derive the quantized transform coefficients, and the inverse quantization unit of the encoding device or the inverse quantization unit of the decoding device can apply inverse quantization to the quantized transform coefficients to derive the transform coefficients.

一般的に、ビデオ/画像コーディングでは、量子化率を変化させることができ、変化された量子化率を利用して圧縮を調節することができる。実現観点では、複雑度を考慮して量子化率を直接使用する代わりに量子化パラメータ(QP、quantization parameter)を使用することができる。例えば、0から63までの整数値の量子化パラメータを使用することができ、各量子化パラメータ値は、実際量子化率に対応されることができる。ルマ成分(ルマサンプル)に対する量子化パラメータ(QP)とクロマ成分(クロマサンプル)に対する量子化パラメータ(QP)は、異なるように設定されることができる。 Generally, in video/image coding, a quantization rate can be changed, and the compression can be adjusted using the changed quantization rate. In terms of implementation, a quantization parameter (QP) can be used instead of directly using the quantization rate in consideration of complexity. For example, an integer value quantization parameter from 0 to 63 can be used, and each quantization parameter value can correspond to an actual quantization rate. A quantization parameter (QP Y ) for a luma component (luma sample) and a quantization parameter (QP C ) for a chroma component (chroma sample) can be set differently.

量子化過程は、変換係数(C)を入力とし、量子化率(Qstep)に分けて、これに基づいて量子化された変換係数(C`)を得ることができる。このとき、計算複雑度を考慮して量子化率にスケールを掛け算して整数形態にし、スケール値に該当する値ほどシフト演算を実行することができる。量子化率とスケール値の掛け算に基づいて量子化スケール(quantization scale)が導出されることができる。即ち、QPによって量子化スケールが導出されることができる。変換係数(C)に量子化スケールを適用し、これに基づいて量子化された変換係数(C`)を導出することもできる。 In the quantization process, a transform coefficient (C) is input, and divided into a quantization rate (Q step ), and a quantized transform coefficient (C') can be obtained based on the quantization rate. In this case, the quantization rate is multiplied by a scale to obtain an integer form in consideration of the computational complexity, and a shift operation can be performed by a value corresponding to the scale value. A quantization scale can be derived based on the multiplication of the quantization rate and the scale value. That is, the quantization scale can be derived according to the QP. A quantization scale can also be applied to the transform coefficient (C), and a quantized transform coefficient (C') can be derived based on the quantization scale.

逆量子化過程は、量子化過程の逆過程で量子化された変換係数(C`)に量子化率(Qstep)を掛け算して、これに基づいて復元された変換係数(C``)を得ることができる。この場合、量子化パラメータによってレベルスケール(level scale)が導出されることができ、量子化された変換係数(C`)にレベルスケールを適用し、これに基づいて復元された変換係数(C``)を導出できる。復元された変換係数(C``)は、変換及び/又は量子化過程での損失(loss)によって最初変換係数(C)と多少差がある。したがって、エンコード装置でもデコード装置と同じく逆量子化を実行する。 In the inverse quantization process, the quantized transform coefficient (C') is multiplied by a quantization rate (Q step ) in the inverse process of the quantization process, and a restored transform coefficient (C'') can be obtained based on the multiplication. In this case, a level scale can be derived according to the quantization parameter, and the level scale can be applied to the quantized transform coefficient (C') to derive a restored transform coefficient (C'') based on the multiplication. The restored transform coefficient (C'') is slightly different from the original transform coefficient (C) due to loss in the transformation and/or quantization process. Therefore, the encoding device also performs inverse quantization in the same way as the decoding device.

また、周波数によって量子化強度を調節する適応的周波数別加重量子化(adaptive frequency weighting quantization)技術が適用され得る。適応的周波数別加重量子化技術は、周波数別に量子化強度を異なるように適用する方法である。適応的周波数別加重量子化は、あらかじめ定義された量子化スケーリングマトリクスを利用して各周波数別量子化強度を異なるように適用できる。即ち、前述した量子化/逆量子化の過程は、量子化スケーリングマトリクスに基づいてさらに実行されることができる。例えば、現在ブロックのサイズ及び/又は現在ブロックのレジデュアル信号を生成するために、現在ブロックに適用された予測モードがインター予測であるか、または、イントラ予測であるかによって、異なる量子化スケーリングマトリクスが使われることができる。量子化スケーリングマトリクスは、量子化マトリクスまたはスケーリングマトリクスと呼ばれることができる。量子化スケーリングマトリクスは、あらかじめ定義されることができる。また、周波数適応的スケーリングのために、量子化スケーリングマトリクスに対する周波数別量子化スケール情報がエンコード装置で構成/エンコードされてデコード装置にシグナリングされることができる。周波数別量子化スケール情報は、量子化スケーリング情報と呼ばれることができる。周波数別量子化スケール情報は、スケーリングリストデータ(scaling_list_data)を含むことができる。スケーリングリストデータに基づいて(修正された)量子化スケーリングマトリクスが導出されることができる。また、周波数別量子化スケール情報は、スケーリングリストデータの存否可否を指示する存否フラグ(present flag)情報を含むことができる。または、スケーリングリストデータが上位レベル(例えば、SPS)でシグナリングされた場合、より下位レベル(例えば、PPS or tile group header etc)でスケーリングリストデータが修正されるかどうかを指示する情報などがさらに含まれることができる。 In addition, an adaptive frequency weighting quantization technique that adjusts the quantization strength according to frequency may be applied. The adaptive frequency weighting quantization technique is a method of applying quantization strength differently according to frequency. The adaptive frequency weighting quantization may apply quantization strength for each frequency differently using a predefined quantization scaling matrix. That is, the above-mentioned quantization/dequantization process may be further performed based on the quantization scaling matrix. For example, a different quantization scaling matrix may be used depending on the size of the current block and/or whether the prediction mode applied to the current block is inter prediction or intra prediction to generate a residual signal of the current block. The quantization scaling matrix may be referred to as a quantization matrix or a scaling matrix. The quantization scaling matrix may be predefined. In addition, for frequency adaptive scaling, frequency-specific quantization scale information for the quantization scaling matrix may be configured/encoded in the encoding device and signaled to the decoding device. The frequency-specific quantization scale information may be referred to as quantization scaling information. The frequency-specific quantization scale information may include scaling list data (scaling_list_data). A (modified) quantization scaling matrix may be derived based on the scaling list data. In addition, the frequency-specific quantization scale information may include present flag information indicating whether scaling list data is present or absent. Alternatively, when scaling list data is signaled at a higher level (e.g., SPS), information indicating whether the scaling list data is modified at a lower level (e.g., PPS or tile group header, etc.) may further be included.

前述したように、スケーリングリストデータは、量子化/逆量子化に使われる(周波数ベースの量子化)スケーリングマトリクスを示すためにシグナリングされることができる。 As mentioned above, scaling list data can be signaled to indicate the scaling matrix used for quantization/dequantization (frequency-based quantization).

デフォルト及びユーザ定義スケーリングマトリクスのシグナリング支援は、HEVC標準に存在し、現在VVC標準に採択された。しかし、VVC標準の場合、下記の機能のシグナリングのための追加的支援が統合された。 Support for signaling default and user-defined scaling matrices exists in the HEVC standard and has now been adopted into the VVC standard. However, for the VVC standard, additional support for signaling the following features has been integrated:

-スケーリングマトリクスのための3つモード:OFF、DEFAULT、USER_DEFINED - 3 modes for scaling matrix: OFF, DEFAULT, USER_DEFINED

-ブロックに対するさらに大きいサイズ範囲(ルマの場合、4×4~64×64、クロマの場合、2×2~32×32) - Larger size range for blocks (4x4 to 64x64 for luma, 2x2 to 32x32 for chroma)

-四角形変換ブロック(TBs) - Quadrilateral transformation blocks (TBs)

-依存的量子化(Dependent quantization) -Dependent quantization

-多重変換選択(Multiple Tranform Selection;MTS) -Multiple Transform Selection (MTS)

-高周波係数をゼロにする変換(Large transforms with zeroing-out high frequency coefficients) - Large transforms with zeroing-out high frequency coefficients

-イントラサブブロックパーティショニング(Intra sub-block partitioning;ISP) - Intra sub-block partitioning (ISP)

-イントラブロックコピー(Intra Block Copy;IBC)(現在ピクチャ参照(current picture referencing;CPR)ともいう) - Intra Block Copy (IBC) (also called current picture referencing (CPR))

-全てのTBサイズに対するDEFAULTスケーリングマトリクス、デフォルト値は16 - DEFAULT scaling matrix for all TB sizes, default value is 16

スケーリングマトリクスは、全てのサイズに対する変換スキップ(Transform Skip;TS)及び二次変換(Secondary Transform;ST)に適用されてはならないという点に留意しなければならない。 It should be noted that the scaling matrix should not be applied to the Transform Skip (TS) and Secondary Transform (ST) for all sizes.

以下では、VVC標準でスケーリングリストを支援するための上位レベルシンタックス(High Level Syntax;HSL)構造が詳細に説明される。まず、スケーリングリストがデコードされる現在CVS(coded video sequence)に対して可用であるということを指示するために、フラグがシーケンスパラメータセット(Sequence Parameter Set;SPS)を介してシグナリングされることができる。その次に、前記フラグが可用な場合、SPSでスケーリングリストに特定データが存在するかを示すために追加フラグがパーシングされることができる。これは表1のように示すことができる。 Below, the High Level Syntax (HSL) structure for supporting scaling lists in the VVC standard will be described in detail. First, a flag can be signaled via a Sequence Parameter Set (SPS) to indicate that a scaling list is available for the current coded video sequence (CVS) being decoded. Then, if the flag is available, an additional flag can be parsed in the SPS to indicate whether specific data is present in the scaling list. This can be shown in Table 1.

表1は、CVSに対するスケーリングリストを説明するためにSPSから抄出したものである。 Table 1 is taken from the SPS to illustrate the scaling list for CVS.

Figure 0007492066000001
Figure 0007492066000001

前記表1のSPSシンタックスに含まれているシンタックス要素のセマンティクス(semantics)は、以下の表2のように示すことができる。 The semantics of the syntax elements included in the SPS syntax in Table 1 can be shown in Table 2 below.

Figure 0007492066000002
Figure 0007492066000002

前記表1及び表2を参照すると、SPSからscaling_list_enabled_flagがシグナリングされることができる。例えば、scaling_list_enabled_flagの値が1である場合、スケーリングリストが変換係数に対するスケーリング過程に使われることを示すことができ、scaling_list_enabled_flagの値が0である場合、スケーリングリストが変換係数に対するスケーリング過程に使用されないことを示すことができる。このとき、scaling_list_enabled_flagの値が1である場合、sps_scaling_list_data_present_flagがSPSからさらにシグナリングされることができる。例えば、sps_scaling_list_data_present_flagの値が1である場合、scaling_list_data()シンタックス構造がSPSに存在することを示し、sps_scaling_list_data_present_flagの値が0である場合、scaling_list_data()シンタックス構造がSPSに存在しないことを示すことができる。sps_scaling_list_data_present_flagが存在しない場合、sps_scaling_list_data_present_flagの値は、0に類推されることができる。 Referring to Tables 1 and 2, scaling_list_enabled_flag can be signaled from the SPS. For example, if the value of scaling_list_enabled_flag is 1, it can indicate that the scaling list is used in the scaling process for the transform coefficients, and if the value of scaling_list_enabled_flag is 0, it can indicate that the scaling list is not used in the scaling process for the transform coefficients. In this case, if the value of scaling_list_enabled_flag is 1, sps_scaling_list_data_present_flag can be further signaled from the SPS. For example, if the value of sps_scaling_list_data_present_flag is 1, it indicates that the scaling_list_data() syntax structure is present in the SPS, and if the value of sps_scaling_list_data_present_flag is 0, it may indicate that the scaling_list_data() syntax structure is not present in the SPS. If sps_scaling_list_data_present_flag is not present, the value of sps_scaling_list_data_present_flag may be inferred to be 0.

また、ピクチャパラメータセット(Picture Parameter Set;PPS)でフラグ(例:pps_scaling_list_data_present_flag)が先にパーシングされることができる。このフラグが可用な場合、PPSでscaling_list_data()がパーシングされることができる。scaling_list_data()が先にSPSで存在し、後にPPSでパーシングされる場合、PPSでのデータがSPSでのデータに優先することができる。以下の表3は、スケーリングリストデータを説明するためにPPSから抄出したものである。 Also, a flag (e.g., pps_scaling_list_data_present_flag) can be parsed first in the Picture Parameter Set (PPS). If this flag is available, scaling_list_data() can be parsed in the PPS. If scaling_list_data() is present first in the SPS and parsed later in the PPS, the data in the PPS can take precedence over the data in the SPS. Table 3 below is excerpted from the PPS to explain the scaling list data.

Figure 0007492066000003
Figure 0007492066000003

前記表3のPPSシンタックスに含まれているシンタックス要素のセマンティクス(semantics)は、以下の表4のように示すことができる。 The semantics of the syntax elements included in the PPS syntax in Table 3 can be shown in Table 4 below.

Figure 0007492066000004
Figure 0007492066000004

前記表3及び表4を参照すると、PPSからpps_scaling_list_data_present_flagがシグナリングされることができる。例えば、pps_scaling_list_data_present_flagの値が1である場合、PPSを参照するピクチャに使用されたスケーリングリストデータが、活性SPSにより特定されたスケーリングリスト及びPPSにより特定されたスケーリングリストに基づいて導出されることを示すことができる。pps_scaling_list_data_present_flagの値が0である場合、PPSを参照するピクチャに使用されたスケーリングリストデータが、活性SPSにより特定されたスケーリングリストと同じであると類推されることを示すことができる。このとき、scaling_list_enabled_flagの値が0である場合、pps_scaling_list_data_present_flagの値は、0にならなければならない。scaling_list_enabled_flagの値が1であり、sps_scaling_list_data_present_flagの値が0であり、pps_scaling_list_data_present_flagの値が0である場合、スケーリングリストデータセマンティクスで説明されたように、デフォルトスケーリングリストデータがスケーリングファクタ(Scaling Factor)配列を導出するのに使われることができる。 Referring to Tables 3 and 4, pps_scaling_list_data_present_flag can be signaled from the PPS. For example, if the value of pps_scaling_list_data_present_flag is 1, it can indicate that the scaling list data used for the picture referencing the PPS is derived based on the scaling list specified by the active SPS and the scaling list specified by the PPS. If the value of pps_scaling_list_data_present_flag is 0, it can indicate that the scaling list data used for the picture referencing the PPS is inferred to be the same as the scaling list specified by the active SPS. In this case, if the value of scaling_list_enabled_flag is 0, the value of pps_scaling_list_data_present_flag must be 0. If the value of scaling_list_enabled_flag is 1, the value of sps_scaling_list_data_present_flag is 0, and the value of pps_scaling_list_data_present_flag is 0, the default scaling list data can be used to derive the scaling factor array as described in the scaling list data semantics.

スケーリングリストは、次の量子化マトリクスサイズに対してVVC標準で定義されることができる。これは、以下の表5のように示すことができる。量子化マトリクスに対する支援範囲は、HEVC標準で4×4、8×8、16×16及び32×32で2×2と64×64を含むように拡張された。 Scaling lists can be defined in the HEVC standard for the following quantization matrix sizes, which can be seen in Table 5 below. The supported range for quantization matrices has been extended to include 2x2 and 64x64 in the HEVC standard, with 4x4, 8x8, 16x16 and 32x32.

Figure 0007492066000005
Figure 0007492066000005

前記表5は、使用された全ての量子化マトリクスサイズに対するsizeIdを定義している。前述した組み合わせを使用して、sizeId、コーディングユニットの予測モード(CuPredMode)、及びカラー成分の相異なる組み合わせに対してmatrixIdが割り当てられることができる。ここで、考慮されることができるCuPredModeは、インター、イントラ、及びIBC(Intra Block Copy)である。イントラモードとIBCモードは、同じく扱われることができる。したがって、与えられたカラー成分に対して同じmatrixId(s)が共有されることができる。ここで、考慮されることができるカラー成分は、ルマ(Luma(Y))及び二つのカラー成分(Cb及びCr)である。割り当てられたmatrixIdは、以下の表6のように示すことができる。 Table 5 defines sizeId for all quantization matrix sizes used. Using the above combinations, matrixIds can be assigned for different combinations of sizeId, coding unit prediction mode (CuPredMode), and color components. Here, CuPredModes that can be considered are inter, intra, and IBC (Intra Block Copy). Intra mode and IBC mode can be treated the same. Therefore, the same matrixId(s) can be shared for a given color component. Here, color components that can be considered are luma (Luma(Y)) and two color components (Cb and Cr). The assigned matrixIds can be shown as shown in Table 6 below.

表6は、sizeId、予測モード、及びカラー成分によるmatrixIdを示す。 Table 6 shows the matrixId by sizeId, prediction mode, and color component.

Figure 0007492066000006
Figure 0007492066000006

以下の表7は、スケーリングリストデータ(例:scaling_list_data())に対するシンタックス構造の一例を示す。 Table 7 below shows an example of a syntax structure for scaling list data (e.g., scaling_list_data()).

Figure 0007492066000007
Figure 0007492066000007

前記表7のシンタックスに含まれているシンタックス要素のセマンティクスは、以下の表8のように示すことができる。 The semantics of the syntax elements included in the syntax of Table 7 can be shown as shown in Table 8 below.

Figure 0007492066000008
Figure 0007492066000008

Figure 0007492066000009
Figure 0007492066000009

前記表7及び表8を参照すると、スケーリングリストデータ(例:scaling_list_data())を抽出するために、1から始めて6までの全てのsizeId及び0から5までのmatrixIdに対し、スケーリングリストデータは、2×2クロマ成分及び64×64ルマ成分に適用されることができる。その次に、スケーリングリストの値が参照スケーリングリストの値と同じであるかどうか示すためにフラグ(例:scaling_list_pred_mode_flag)がパーシングされることができる。参照スケーリングリストは、scaling_list_pred_matrix_id_delta[sizeId][matrixId]により示される。しかし、scaling_list_pred_mode_flag[sizeId][matrixId]が1である場合、スケーリングリストデータは、明示的にシグナリングされることができる。scaling_list_pred_matrix_id_deltaが0である場合、表9乃至表12に示すように、デフォルト値を有するDEFAULTモードが使われることができる。scaling_list_pred_matrix_id_deltaの他の値である場合、前記表8のセマンティクスに示すようにrefMatrixIdが先に決定されることができる。 Referring to Tables 7 and 8, to extract the scaling list data (e.g., scaling_list_data()), for all sizeIds from 1 to 6 and matrixIds from 0 to 5, the scaling list data can be applied to the 2x2 chroma components and 64x64 luma components. Then, a flag (e.g., scaling_list_pred_mode_flag) can be parsed to indicate whether the values of the scaling list are the same as the values of the reference scaling list. The reference scaling list is indicated by scaling_list_pred_matrix_id_delta[sizeId][matrixId]. However, if scaling_list_pred_mode_flag[sizeId][matrixId] is 1, the scaling list data can be explicitly signaled. If scaling_list_pred_matrix_id_delta is 0, the DEFAULT mode with the default value may be used as shown in Tables 9 to 12. For other values of scaling_list_pred_matrix_id_delta, the refMatrixId may be determined first as shown in the semantics of Table 8.

明示的シグナリングにおいて、即ち、USER_DEFINEDモードで、シグナリングされる係数の最大個数が先に決定されることができる。量子化ブロックサイズ2×2、4×4及び8×8の場合、全ての係数がシグナリングされることができる。8×8より大きいサイズの場合、即ち、16×16、32×32及び64×64の場合、64個の係数のみがシグナリングされることができる。即ち、8×8基本マトリクスがシグナリングされ、残りの係数は、基本マトリクスからアップサンプリングされることができる。 In explicit signaling, i.e. in USER_DEFINED mode, the maximum number of coefficients to be signaled can be determined in advance. For quantization block sizes 2x2, 4x4 and 8x8, all coefficients can be signaled. For sizes larger than 8x8, i.e. 16x16, 32x32 and 64x64, only 64 coefficients can be signaled. That is, an 8x8 base matrix is signaled and the remaining coefficients can be upsampled from the base matrix.

以下の表9は、ScalingList[1][matrixId][i](i=0..3)のデフォルト値を示す一例である。 Table 9 below is an example showing the default values of ScalingList[1][matrixId][i] (i = 0..3).

Figure 0007492066000010
Figure 0007492066000010

以下の表10は、ScalingList[2][matrixId][i](i=0..15)のデフォルト値を示す一例である。 Table 10 below is an example showing the default values of ScalingList[2][matrixId][i] (i = 0..15).

Figure 0007492066000011
Figure 0007492066000011

以下の表11は、ScalingList[3..5][matrixId][i](i=0..63)のデフォルト値を示す一例である。 The following Table 11 is an example showing the default values of ScalingList[3..5][matrixId][i] (i = 0..63).

Figure 0007492066000012
Figure 0007492066000012

以下の表12は、ScalingList[6][matrixId][i](i=0..63)のデフォルト値を示す一例である。 The following Table 12 is an example showing the default values of ScalingList[6][matrixId][i] (i = 0..63).

Figure 0007492066000013
Figure 0007492066000013

前述したように、デフォルトスケーリングリストデータは、スケーリングファクタ(Scaling Factor)を導出するのに使われることができる。 As mentioned above, the default scaling list data can be used to derive a scaling factor.

5次元配列のスケーリングファクタScalingFactor[sizeId][sizeId][matrixId][x][y](ここで、x、y=0..(1<<sizeId)-1)は、前記表5に示す変数sizeId及び前記表6に示す変数matrixIdによって、スケーリングファクタの配列を示すことができる。 The five-dimensional array scaling factor ScalingFactor[sizeId][sizeId][matrixId][x][y] (where x, y = 0..(1<<sizeId)-1) can indicate the array of scaling factors using the variable sizeId shown in Table 5 and the variable matrixId shown in Table 6.

以下の表13は、前述したデフォルトスケーリングリストに基づいて量子化マトリクスサイズによってスケーリングファクタを導出する例示を示す。 Table 13 below shows an example of deriving a scaling factor based on the quantization matrix size based on the default scaling list described above.

Figure 0007492066000014
Figure 0007492066000014

Figure 0007492066000015
Figure 0007492066000015

四角形サイズの量子化マトリクスに対して、5次元配列のスケーリングファクタScalingFactor[sizeIdW][sizeIdH][matrixId][x][y](ここで、x=0..(1<<sizeIdW)-1、y=0..(1<<sizeIdH)-1、sizeIdW!=sizeIdH)は、以下の表15に示す変数sizeIdW及びsizeIdHによってスケーリングファクタの配列を示すことができ、以下の表14のように導出されることができる。 For a rectangular sized quantization matrix, the 5-dimensional array of scaling factors ScalingFactor[sizeIdW][sizeIdH][matrixId][x][y] (where x = 0..(1<<sizeIdW)-1, y = 0..(1<<sizeIdH)-1, sizeIdW!=sizeIdH) can indicate the array of scaling factors using the variables sizeIdW and sizeIdH shown in Table 15 below, and can be derived as shown in Table 14 below.

Figure 0007492066000016
Figure 0007492066000016

四角形サイズの量子化マトリクスは、下記の条件を満たすサンプルに対してゼロにしなければならない。 The tile size quantization matrix must be zero for samples that meet the following conditions:

-x>32 -x>32

-y>32 -y>32

-デコードされたTUは、デフォルト変換モードにコーディングされずに、(1<<sizeIdW)==32及びx>16 - The decoded TU is not coded in the default transformation mode, (1<<sizeIdW)==32 and x>16

-デコードされたTUは、デフォルト変換モードにコーディングされずに、(1<<sizeIdH)==32及びy>16 - The decoded TU is not coded in the default transformation mode, (1<<sizeIdH)==32 and y>16

以下の表15は、量子化マトリクスサイズによってsizeIdW及びsizeIdHを示す一例である。 Table 15 below is an example showing sizeIdW and sizeIdH depending on the quantization matrix size.

Figure 0007492066000017
Figure 0007492066000017

また、一例として、上述したスケーリングリストデータ(例:scaling_list_data())は、次の表16のようなシンタックス構造及び次の表17のようなセマンティクスに基づいて説明されることができる。表16及び表17に開示されたスケーリングリストデータ(例:scaling_list_data())に含まれたシンタックス要素に基づいて上述したように、スケーリングリスト、スケーリングマトリックス、スケーリングファクタなどが導出され得るし、この過程は、上述した表5ないし表15と同一であるか、類似した手順が適用され得る。 Further, as an example, the above-mentioned scaling list data (e.g., scaling_list_data()) can be described based on the syntax structure as shown in Table 16 below and the semantics as shown in Table 17 below. As described above, the scaling list, scaling matrix, scaling factor, etc. can be derived based on the syntax elements included in the scaling list data (e.g., scaling_list_data()) disclosed in Tables 16 and 17, and this process may be the same as or similar to the above-mentioned Tables 5 to 15.

Figure 0007492066000018
Figure 0007492066000018

Figure 0007492066000019
Figure 0007492066000019

Figure 0007492066000020
Figure 0007492066000020

以下、本文書では量子化/逆量子化の過程で適応的周波数別加重量子化技術を適用するにあたって、スケーリングリストデータを効率的にシグナリングする方法に関して提案する。 In the following, this document proposes a method for efficiently signaling scaling list data when applying adaptive frequency-specific weighting techniques during the quantization/dequantization process.

図6は、コーディングされた画像/ビデオに対する階層構造を例示的に示す。 Figure 6 shows an example of a hierarchical structure for coded images/video.

図6に示すように、コーディングされた画像/ビデオは、画像/ビデオのデコード処理及びその自体を扱うVCL(video coding layer、ビデオコーディング階層)、符号化された情報を送信し、格納する下位システム、及びVCLと下位システムとの間に存在し、ネットワーク適応機能を担当するNAL(network abstraction layer、ネットワーク抽象階層)に区分されている。 As shown in FIG. 6, the coded image/video is divided into a VCL (video coding layer) that handles the image/video decoding process and the image/video itself, a lower system that transmits and stores the coded information, and a NAL (network abstraction layer) that exists between the VCL and the lower system and is responsible for network adaptation functions.

VCLでは、圧縮された画像データ(スライスデータ)を含むVCLデータを生成し、または、ピクチャパラメータセット(Picture Parameter Set:PPS)、シーケンスパラメータセット(Sequence Parameter Set:SPS)、ビデオパラメータセット(Video Parameter Set:VPS)などの情報を含むパラメータセットまたは画像のデコード過程に付加的に必要なSEI(Supplemental Enhancement Information)メッセージを生成することができる。 The VCL can generate VCL data including compressed image data (slice data), or generate parameter sets including information such as a Picture Parameter Set (PPS), a Sequence Parameter Set (SPS), and a Video Parameter Set (VPS), or a Supplemental Enhancement Information (SEI) message that is additionally required for the image decoding process.

NALでは、VCLで生成されたRBSP(Raw Byte Sequence Payload)にヘッダ情報(NALユニットヘッダ)を付加してNALユニットを生成することができる。このとき、RBSPは、VCLで生成されたスライスデータ、パラメータセット、SEIメッセージなどを意味する。NALユニットヘッダには当該NALユニットに含まれるRBSPデータによって特定されるNALユニットタイプ情報を含むことができる。 In the NAL, a NAL unit can be generated by adding header information (NAL unit header) to the RBSP (Raw Byte Sequence Payload) generated in the VCL. In this case, the RBSP means slice data, parameter set, SEI message, etc. generated in the VCL. The NAL unit header can include NAL unit type information identified by the RBSP data included in the NAL unit.

また、NALユニットは、VCLで生成されたRBSPのよってVCL NALユニットとNon-VCL NALユニットとに区分されることができる。VCL NALユニットは、画像に対する情報(スライスデータ)を含んでいるNALユニットを意味することができ、Non-VCL NALユニットは、画像をデコードするために必要な情報(パラメータセットまたはSEIメッセージ)を含んでいるNALユニットを意味することができる。 In addition, NAL units can be classified into VCL NAL units and non-VCL NAL units according to the RBSP generated by the VCL. A VCL NAL unit can refer to a NAL unit that contains information about an image (slice data), and a non-VCL NAL unit can refer to a NAL unit that contains information required to decode an image (parameter set or SEI message).

VCL NALユニット、Non-VCL NALユニットは、下位システムのデータ規格によってヘッダ情報を付けてネットワークを介して送信されることができる。例えば、NALユニットは、H.266/VVCファイルフォーマット、RTP(Real-time Transport Protocol)、TS(Transport Stream)などのような所定規格のデータ形態で変形されて多様なネットワークを介して送信されることができる。 VCL NAL units and non-VCL NAL units can be transmitted over a network with header information according to the data standard of the lower system. For example, NAL units can be transformed into a data format of a specific standard such as H.266/VVC file format, RTP (Real-time Transport Protocol), TS (Transport Stream), etc., and transmitted over various networks.

前述したように、NALユニットは、当該NALユニットに含まれるRBSPデータ構造(structure)によってNALユニットタイプが特定されることができ、このようなNALユニットタイプに対する情報は、NALユニットヘッダに格納されてシグナリングされることができる。 As mentioned above, the NAL unit type of a NAL unit can be identified by the RBSP data structure included in the NAL unit, and information about the NAL unit type can be stored and signaled in the NAL unit header.

例えば、NALユニットが画像に対する情報(スライスデータ)を含むかどうかによって、大別して、VCL NALユニットタイプとNon-VCL NALユニットタイプとに分類されることができる。VCL NALユニットタイプは、VCL NALユニットが含むピクチャの性質及び種類などによって分類されることができ、Non-VCL NALユニットタイプは、パラメータセットの種類などによって分類されることができる。 For example, NAL units can be broadly classified into VCL NAL unit types and non-VCL NAL unit types depending on whether the NAL unit contains information about an image (slice data). VCL NAL unit types can be classified according to the nature and type of the picture that the VCL NAL unit contains, and non-VCL NAL unit types can be classified according to the type of parameter set.

下記は、Non-VCL NALユニットタイプが含むパラメータセットの種類などによって特定されたNALユニットタイプの一例である。 Below is an example of a NAL unit type identified by the type of parameter set that the Non-VCL NAL unit type contains.

-APS(Adaptation Parameter Set)NAL unit:APSを含むNALユニットに対するタイプ -APS (Adaptation Parameter Set) NAL unit: Type for NAL units that contain APS

-DPS(Decoding Parameter Set)NAL unit:DPSを含むNALユニットに対するタイプ -DPS (Decoding Parameter Set) NAL unit: Type for NAL unit containing DPS

-VPS(Video Parameter Set)NAL unit:VPSを含むNALユニットに対するタイプ -VPS (Video Parameter Set) NAL unit: Type for NAL unit containing VPS

-SPS(Sequence Parameter Set)NAL unit:SPSを含むNALユニットに対するタイプ - SPS (Sequence Parameter Set) NAL unit: Type for NAL unit containing SPS

-PPS(Picture Parameter Set)NAL unit:PPSを含むNALユニットに対するタイプ -PPS (Picture Parameter Set) NAL unit: Type for NAL units that contain PPS

-PH(Picture header)NAL unit:PHを含むNALユニットに対するタイプ -PH (Picture header) NAL unit: Type for NAL unit containing PH

前述したNALユニットタイプは、NALユニットタイプのためのシンタックス情報を有し、シンタックス情報は、NALユニットヘッダに格納されてシグナリングされることができる。例えば、前記シンタックス情報は、nal_unit_typeであり、NALユニットタイプは、nal_unit_type値に特定されることができる。 The above-mentioned NAL unit type has syntax information for the NAL unit type, and the syntax information can be stored in the NAL unit header and signaled. For example, the syntax information is nal_unit_type, and the NAL unit type can be specified by the nal_unit_type value.

一方、前述したように、一つのピクチャは、複数のスライスを含むことができ、一つのスライスは、スライスヘッダ及びスライスデータを含むことができる。この場合、一つのピクチャ内の複数のスライス(スライスヘッダ及びスライスデータ集合)に対して一つのピクチャヘッダがさらに付加されることができる。ピクチャヘッダ(ピクチャヘッダシンタックス)は、ピクチャに共通的に適用できる情報/パラメータを含むことができる。本文書において、タイルグループは、スライスまたはピクチャに混用または代替されることができる。また、本文書において、タイルグループヘッダは、スライスヘッダまたはピクチャヘッダに混用または代替されることができる。 Meanwhile, as described above, one picture may include multiple slices, and one slice may include a slice header and slice data. In this case, one picture header may be added for multiple slices (slice header and slice data set) in one picture. The picture header (picture header syntax) may include information/parameters that are commonly applicable to pictures. In this document, a tile group may be mixed with or substituted for a slice or a picture. Also, in this document, a tile group header may be mixed with or substituted for a slice header or a picture header.

スライスヘッダ(スライスヘッダシンタックス)は、スライスに共通的に適用できる情報/パラメータを含むことができる。APS(APSシンタックス)またはPPS(PPSシンタックス)は、一つ以上のスライスまたはピクチャに共通的に適用できる情報/パラメータを含むことができる。SPS(SPSシンタックス)は、一つ以上のシーケンスに共通的に適用できる情報/パラメータを含むことができる。VPS(VPSシンタックス)は、多重レイヤに共通的に適用できる情報/パラメータを含むことができる。DPS(DPSシンタックス)は、ビデオ全般に共通的に適用できる情報/パラメータを含むことができる。DPSは、CVS(coded video sequence)の接合(concatenation)に関連した情報/パラメータを含むことができる。本文書において、上位レベルシンタックス(High level syntax、HLS)とは、前記APSシンタックス、PPSシンタックス、SPSシンタックス、VPSシンタックス、DPSシンタックス、ピクチャヘッダシンタックス、スライスヘッダシンタックスのうち少なくとも一つを含むことができる。 A slice header (slice header syntax) may include information/parameters commonly applicable to slices. An APS (APS syntax) or a PPS (PPS syntax) may include information/parameters commonly applicable to one or more slices or pictures. An SPS (SPS syntax) may include information/parameters commonly applicable to one or more sequences. A VPS (VPS syntax) may include information/parameters commonly applicable to multiple layers. A DPS (DPS syntax) may include information/parameters commonly applicable to video in general. A DPS may include information/parameters related to concatenation of a coded video sequence (CVS). In this document, high level syntax (HLS) may include at least one of the APS syntax, PPS syntax, SPS syntax, VPS syntax, DPS syntax, picture header syntax, and slice header syntax.

本文書において、エンコード装置からデコード装置にエンコードされてビットストリーム形態でシグナリングされる画像/ビデオ情報は、ピクチャ内のパーティショニング関連情報、イントラ/インター予測情報、レジデュアル情報、インループフィルタリング情報などを含むだけでなく、スライスヘッダに含まれている情報、ピクチャヘッダに含まれている情報、APSに含まれている情報、PPSに含まれている情報、SPSに含まれている情報、VPSに含まれている情報、及び/又はDPSに含まれている情報を含むことができる。また、前記画像/ビデオ情報は、NALユニットヘッダの情報をさらに含むことができる。 In this document, the image/video information encoded from the encoding device to the decoding device and signaled in the form of a bitstream may include not only partitioning-related information within a picture, intra/inter prediction information, residual information, in-loop filtering information, etc., but also information contained in a slice header, information contained in a picture header, information contained in an APS, information contained in a PPS, information contained in an SPS, information contained in a VPS, and/or information contained in a DPS. In addition, the image/video information may further include information of a NAL unit header.

一方、APS(Adaptation Parameter Set)は、VVC標準でALF(Adaptive Loop Filter)とLMCS(Luma Mapping with Chroma Scaling)手順のための情報を送信するのに使用されている。また、APSは、他のデータ構造(即ち、他のシンタックス構造)を送信するのに使われることができるように拡張可能な構造を有している。これにより、本文書は、周波数別加重量子化のために使われるスケーリングリストデータをAPSを介してパーシング/シグナリングする方法を提案する。 Meanwhile, the Adaptation Parameter Set (APS) is used in the VVC standard to transmit information for the Adaptive Loop Filter (ALF) and Luma Mapping with Chroma Scaling (LMCS) procedures. The APS also has an extensible structure so that it can be used to transmit other data structures (i.e., other syntax structures). Therefore, this document proposes a method of parsing/signaling scaling list data used for frequency-specific weighting via the APS.

スケーリングリストデータは、前述したように、量子化/逆量子化の過程で適用されることができる周波数別加重量子化のための量子化スケール情報であり、スケールファクタと各周波数インデックスを関連させるリストである。 As described above, the scaling list data is quantization scale information for frequency-specific weighting that can be applied during the quantization/dequantization process, and is a list that associates scale factors with each frequency index.

一実施形態として、以下の表18は、スケーリングリストデータを送信するのに使われるAPS(adaptation parameter set)構造の一例を示す。 As one embodiment, Table 18 below shows an example of an adaptation parameter set (APS) structure used to transmit scaling list data.

Figure 0007492066000021
Figure 0007492066000021

前記表18のAPSシンタックスに含まれているシンタックス要素のセマンティクス(semantics)は、以下の表19のように示すことができる。 The semantics of the syntax elements included in the APS syntax in Table 18 can be shown in Table 19 below.

Figure 0007492066000022
Figure 0007492066000022

前記表18及び表19を参照すると、APSでadaptation_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。adaptation_parameter_set_idは、他のシンタックス要素の参照のためのAPSに対する識別子を提供する。即ち、APSは、adaptation_parameter_set_idシンタックス要素に基づいて識別されることができる。adaptation_parameter_set_idシンタックス要素は、APS ID情報と呼ばれることができる。APSは、ピクチャ間に共有されることができ、ピクチャ内の他のタイルグループでは異なる場合がある。 Referring to Tables 18 and 19, the adaptation_parameter_set_id syntax element can be parsed/signaled in the APS. The adaptation_parameter_set_id provides an identifier for the APS for reference in other syntax elements. That is, the APS can be identified based on the adaptation_parameter_set_id syntax element. The adaptation_parameter_set_id syntax element can be referred to as APS ID information. The APS can be shared between pictures and may be different for different tile groups within a picture.

また、APSでaps_params_typeシンタックス要素がパーシング/シグナリングされることができる。aps_params_typeは、以下の表18に示すように、APSで送信されるAPSパラメータのタイプを示すことができる。aps_params_typeシンタックス要素は、APSパラメータタイプ情報またはAPSタイプ情報と呼ばれることができる。 In addition, the aps_params_type syntax element can be parsed/signaled in the APS. The aps_params_type can indicate the type of APS parameters sent in the APS as shown in Table 18 below. The aps_params_type syntax element can be referred to as APS parameter type information or APS type information.

例えば、以下の表20は、APSを介して送信されることができるAPSパラメータのタイプを示す例示であり、各APSパラメータタイプは、aps_params_typeの値に対応して示すことができる。 For example, the following Table 20 is an example showing the types of APS parameters that can be sent via APS, and each APS parameter type can be indicated corresponding to the value of aps_params_type.

Figure 0007492066000023
Figure 0007492066000023

前記表20を参照すると、aps_params_typeは、当該APSのタイプを分類するためのシンタックス要素である。aps_params_typeの値が0である場合、当該APSタイプは、ALF_APSであり、当該APSは、ALFデータを運ぶことができ、ALFデータは、フィルタ/フィルタ係数を導出するためのALFパラメータを含むことができる。aps_params_typeの値が1である場合、当該APSタイプは、LMCS_APSであり、当該APSは、LMCSデータを運ぶことができ、LMCSデータは、LMCSモデル/bin/マッピングインデックスを導出するためのLMCSパラメータを含むことができる。aps_params_typeの値が2である場合、当該APSタイプは、SCALING_APSであり、当該APSは、SCALINGリストデータを運ぶことができ、SCALINGリストデータは、周波数ベースの量子化スケーリングマトリクス/スケーリングファクタ/スケーリングリストの値を導出するためのスケーリングリストデータパラメータを含むことができる。 Referring to Table 20, aps_params_type is a syntax element for classifying the type of the APS. If the value of aps_params_type is 0, the APS type is ALF_APS, and the APS can carry ALF data, which can include ALF parameters for deriving filters/filter coefficients. If the value of aps_params_type is 1, the APS type is LMCS_APS, and the APS can carry LMCS data, which can include LMCS parameters for deriving LMCS model/bin/mapping indexes. If the value of aps_params_type is 2, the APS type is SCALING_APS, and the APS can carry SCALING list data, which can include scaling list data parameters for deriving frequency-based quantization scaling matrix/scaling factor/scaling list values.

例えば、前記表18のように、APSでaps_params_typeシンタックス要素がパーシング/シグナリングされることができ、このとき、aps_params_typeの値が0を示す場合(即ち、aps_params_typeがALF_APSを示す場合)、ALFデータ(即ち、alf_data())がパーシング/シグナリングされることができる。または、aps_params_typeの値が1を示す場合(即ち、aps_params_typeがLMCS_APSを示す場合)、LMCSデータ(即ち、lmcs_data())がパーシング/シグナリングされることができる。または、aps_params_typeの値が2を示す場合(即ち、aps_params_typeがSCALING_APSを示す場合)、スケーリングリストデータ(即ち、scaling_list_data())がパーシング/シグナリングされることができる。 For example, as shown in Table 18, the aps_params_type syntax element can be parsed/signaled in APS, and in this case, if the value of aps_params_type indicates 0 (i.e., if aps_params_type indicates ALF_APS), ALF data (i.e., alf_data()) can be parsed/signaled. Or, if the value of aps_params_type indicates 1 (i.e., if aps_params_type indicates LMCS_APS), LMCS data (i.e., lmcs_data()) can be parsed/signaled. Alternatively, if the value of aps_params_type indicates 2 (i.e., if aps_params_type indicates SCALING_APS), scaling list data (i.e., scaling_list_data()) can be parsed/signaled.

また、前記表18及び表19を参照すると、APSでaps_extension_flagシンタックス要素がパーシング/シグナリングされることができる。aps_extension_flagは、APS拡張データフラグ(aps_extension_data_flag)シンタックス要素が存在するかどうかを指示することができる。aps_extension_flagは、例えば、VVC標準の以後バージョンのための拡張ポイントを提供するために使われることができる。aps_extension_flagシンタックス要素は、APS拡張フラグと呼ばれることができる。例えば、aps_extension_flagの値が0である場合、APS拡張データフラグ(aps_extension_data_flag)がAPS RBSPシンタックス構造に存在しないことを示すことができる。または、aps_extension_flagの値が1である場合、APS拡張データフラグ(aps_extension_data_flag)がAPS RBSPシンタックス構造に存在することを示すことができる。 Also, referring to Tables 18 and 19, the aps_extension_flag syntax element can be parsed/signaled in APS. The aps_extension_flag can indicate whether the APS extension data flag (aps_extension_data_flag) syntax element is present. The aps_extension_flag can be used, for example, to provide an extension point for a later version of the VVC standard. The aps_extension_flag syntax element can be referred to as an APS extension flag. For example, if the value of aps_extension_flag is 0, it can indicate that the APS extension data flag (aps_extension_data_flag) is not present in the APS RBSP syntax structure. Alternatively, if the value of aps_extension_flag is 1, it may indicate that the APS extension data flag (aps_extension_data_flag) is present in the APS RBSP syntax structure.

aps_extension_flagシンタックス要素に基づいてaps_extension_data_flagシンタックス要素がパーシング/シグナリングされることができる。aps_extension_data_flagシンタックス要素は、APS拡張データフラグと呼ばれることができる。例えば、aps_extension_flagの値が1である場合、aps_extension_data_flagがパーシング/シグナリングされることができ、このとき、aps_extension_data_flagは、任意の値を有することができる。 The aps_extension_data_flag syntax element can be parsed/signaled based on the aps_extension_flag syntax element. The aps_extension_data_flag syntax element can be referred to as an APS extension data flag. For example, if the value of aps_extension_flag is 1, aps_extension_data_flag can be parsed/signaled, and in this case, aps_extension_data_flag can have any value.

前述したように、本文書の一実施形態によると、スケーリングリストデータを示すためのデータタイプ(例:SCALING_APS)を割り当て、データタイプを示すシンタックス要素(例:aps_params_type)をパーシング/シグナリングすることで効率的にスケーリングリストデータを運ぶことができる。即ち、本文書の一実施形態によると、スケーリングリストデータを統合したAPSの構造を使用することができる。 As described above, according to one embodiment of this document, the scaling list data can be efficiently transported by assigning a data type (e.g., SCALING_APS) to indicate the scaling list data and parsing/signaling a syntax element (e.g., aps_params_type) that indicates the data type. That is, according to one embodiment of this document, an APS structure that integrates the scaling list data can be used.

一方、現在VVC標準でスケーリングリストデータ(即ち、scaling_list_data())の使用は、まず、SPS(Sequence Parameter Set)でスケーリングリストデータの可用可否を示すフラグ(即ち、sps_scaling_list_enabled_flag)が存在するかに基づいて指示されることができる。もし、前記フラグ(即ち、sps_scaling_list_enabled_flag)がイネイブルされる場合(即ち、スケーリングリストデータが可用であることを示す場合であって、1または真である場合)、他のフラグ(即ち、sps_scaling_list_data_present_flag)がパーシングされることができる。また、sps_scaling_list_data_present_flagがイネイブルされる場合(即ち、スケーリングリストデータがSPSに存在することを示す場合であって、1または真である場合)、スケーリングリストデータ(即ち、scaling_list_data())がパーシングされることができる。即ち、現在VVC標準ではスケーリングリストデータをSPSでシグナリングしている。この場合、SPSがセッション交渉を可能にして一般的に帯域外に送信されるため、デコードプロセスの間に使われることができ、変換ブロックのスケーリングファクタの決定と関連した情報でスケーリングリストデータを送信することが不要である。デコーダがSPSでスケーリングリストデータを送信すると、デコーダは、スケーリングリストデータから取得された情報を格納するために相当な量のメモリを確保する必要があり、また、変換ブロックデコードで使われる時まで前記情報を維持する必要がある。したがって、このような過程は、SPSレベルで不要であり、下位レベルでパーシング/シグナリングされることがより効果的である。これにより、本文書は、スケーリングリストデータを効果的にパーシング/シグナリングするために階層的構造を提案する。 Meanwhile, in the current VVC standard, the use of scaling list data (i.e., scaling_list_data()) can first be indicated based on the presence of a flag (i.e., sps_scaling_list_enabled_flag) indicating the availability of scaling list data in the SPS (Sequence Parameter Set). If the flag (i.e., sps_scaling_list_enabled_flag) is enabled (i.e., 1 or true indicating that scaling list data is available), another flag (i.e., sps_scaling_list_data_present_flag) can be parsed. In addition, if sps_scaling_list_data_present_flag is enabled (i.e., if the scaling list data is present in the SPS and is 1 or true), the scaling list data (i.e., scaling_list_data()) can be parsed. That is, currently, the VVC standard signals the scaling list data in the SPS. In this case, since the SPS enables session negotiation and is generally transmitted out-of-band, it is not necessary to transmit the scaling list data with information related to determining the scaling factor of the transform block, which can be used during the decoding process. When the decoder transmits the scaling list data in the SPS, the decoder needs to reserve a significant amount of memory to store information obtained from the scaling list data, and also needs to maintain the information until it is used in transform block decoding. Therefore, such a process is not necessary at the SPS level, and it is more effective to parse/signal the scaling list data at a lower level. Therefore, this document proposes a hierarchical structure to effectively parse/signal the scaling list data.

一実施形態として、スケーリングリストデータを上位レベルシンタックスであるSPSからパーシング/シグナリングせずに、より下位レベルシンタックスであるPPS、タイルグループヘッダ、スライスヘッダ、及び/又は他の適切なヘッダでパーシング/シグナリングできるようにする。 In one embodiment, scaling list data is not parsed/signaled from a higher level syntax, SPS, but is parsed/signaled in a lower level syntax, PPS, tile group header, slice header, and/or other appropriate header.

例えば、以下の表21のようにSPSシンタックスを修正することができる。以下の表19は、CVSに対するスケーリングリストを説明するためのSPSシンタックスの一例を示す。 For example, the SPS syntax can be modified as shown in Table 21 below. Table 19 below shows an example of SPS syntax to describe a scaling list for a CVS.

Figure 0007492066000024
Figure 0007492066000024

前記表21のSPSシンタックスに含まれているシンタックス要素のセマンティクスは、以下の表22のように示すことができる。 The semantics of the syntax elements included in the SPS syntax in Table 21 can be shown in Table 22 below.

Figure 0007492066000025
Figure 0007492066000025

前記表21及び表22を参照すると、SPSでscaling_list_enabled_flagシンタックス要素がパーシング/シグナリングされることができる。scaling_list_enabled_flagシンタックス要素は、その値が0であるか、または、1であるかに基づいてスケーリングリストが可用であるかどうかを示すことができる。例えば、scaling_list_enabled_flagの値が1である場合、スケーリングリストが変換係数に対するスケーリング過程に使われることを示し、scaling_list_enabled_flagの値が0である場合、スケーリングリストが変換係数に対するスケーリング過程に使用されないことを示すことができる。 Referring to Tables 21 and 22, the scaling_list_enabled_flag syntax element can be parsed/signaled in the SPS. The scaling_list_enabled_flag syntax element can indicate whether a scaling list is available based on whether its value is 0 or 1. For example, if the value of scaling_list_enabled_flag is 1, it can indicate that the scaling list is used in the scaling process for the transform coefficients, and if the value of scaling_list_enabled_flag is 0, it can indicate that the scaling list is not used in the scaling process for the transform coefficients.

即ち、scaling_list_enabled_flagシンタックス要素は、スケーリングリスト可用フラグと呼ばれることができ、SPS(または、SPSレベル)でシグナリングされることができる。即ち、SPSレベルでシグナリングされるscaling_list_enabled_flagの値に基づいて、当該SPSを参照するCVS内のピクチャに対して基本的にスケーリングリストが可用であるように決定されることができる。そして、SPSより下位レベル(例:PPS、タイルグループヘッダ、スライスヘッダ、及び/又は他の適切なヘッダ)で追加的な可用フラグをシグナリングしてスケーリングリストを取得することができる。 That is, the scaling_list_enabled_flag syntax element can be referred to as a scaling list availability flag and can be signaled at the SPS (or SPS level). That is, based on the value of scaling_list_enabled_flag signaled at the SPS level, it can be determined that a scaling list is essentially available for pictures in the CVS that reference the SPS. Then, an additional availability flag can be signaled at a level lower than the SPS (e.g., PPS, tile group header, slice header, and/or other appropriate header) to obtain the scaling list.

また、SPSでsps_scaling_list_data_present_flagシンタックス要素がパーシング/シグナリングされないことができる。すなわち、SPSでsps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないようにすることができる。sps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がSPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてSPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、SPSレベルでは、スケーリングリストデータをパーシング/シグナリングしないことができる。 In addition, the sps_scaling_list_data_present_flag syntax element may not be parsed/signaled in the SPS. That is, by removing the sps_scaling_list_data_present_flag syntax element in the SPS, this flag information may not be parsed/signaled. The sps_scaling_list_data_present_flag syntax element is flag information indicating whether or not the syntax structure of the scaling list data exists in the SPS, and the scaling list data specified by the SPS may be parsed/signaled according to this flag information. However, by removing the sps_scaling_list_data_present_flag syntax element, the scaling list data may not be parsed/signaled at the SPS level.

前述したように、本文書の一実施形態によると、SPSレベルではスケーリングリスト(scaling_list_data())を直接シグナリングせずに、スケーリングリスト可用フラグ(scaling_list_enabled_flag)のみを明示的にシグナリングするように構成されることができる。以後、SPSでの可用フラグ(scaling_list_enabled_flag)に基づいて下位レベルシンタックスで個別的にスケーリングリスト(scaling_list_data())をパーシングすることができる。したがって、本文書の一実施形態によると、スケーリングリストデータが階層的構造によってパーシング/シグナリングされることができるため、よりコーディング効率を向上させることができる。 As described above, according to one embodiment of this document, the SPS level may be configured to explicitly signal only the scaling list availability flag (scaling_list_enabled_flag) without directly signaling the scaling list (scaling_list_data()). Thereafter, the scaling list (scaling_list_data()) may be parsed individually in the lower level syntax based on the availability flag (scaling_list_enabled_flag) in the SPS. Therefore, according to one embodiment of this document, the scaling list data may be parsed/signaled according to a hierarchical structure, thereby improving coding efficiency.

一方、スケーリングリストデータの存在有無及び使用有無は、ツールイネイブリングフラグ(tool enabling flag)の存在を条件とする。ここで、ツールイネイブリングフラグは、該当ツールをイネイブリングするかどうかを示す情報であって、例えば、scaling_list_enabled_flagシンタックス要素を含むことができる。即ち、scaling_list_enabled_flagシンタックス要素は、スケーリングリストデータの可用可否を示すことによって、スケーリングリストをイネイブリングするかを指示するのに使われることができる。しかし、このツールは、デコーダに対する構文上制約があるべきである。即ち、このツールは、現在CVS(coded video sequence)のデコードに使用されていないということをデコーダに知らせる制限フラグ(constraint flag)があるべきである。したがって、本文書は、スケーリングリストデータに対する制限フラグが適用される方法を提案する。 Meanwhile, the existence and use of scaling list data is conditioned on the existence of a tool enabling flag. Here, the tool enabling flag is information indicating whether the corresponding tool is enabled, and may include, for example, a scaling_list_enabled_flag syntax element. That is, the scaling_list_enabled_flag syntax element can be used to indicate whether the scaling list is enabled by indicating whether the scaling list data is available. However, this tool should have a syntactic constraint for the decoder. That is, there should be a constraint flag that informs the decoder that this tool is not currently used for decoding a CVS (coded video sequence). Therefore, this document proposes a method for applying a constraint flag to the scaling list data.

一実施形態として、以下の表23は、制限フラグを使用してスケーリングリストデータをシグナリングするシンタックス(例:一般制限情報シンタックス)の一例を示す。 As one embodiment, Table 23 below shows an example of syntax (e.g., general restriction information syntax) for signaling scaling list data using restriction flags.

Figure 0007492066000026
Figure 0007492066000026

前記表23のシンタックスに含まれているシンタックス要素のセマンティクス(semantics)は、以下の表22のように示すことができる。 The semantics of the syntax elements included in the syntax of Table 23 can be shown in Table 22 below.

Figure 0007492066000027
Figure 0007492066000027

前記表23及び表24を参照すると、制限フラグがgeneral_constraint_info()を介してパーシング/シグナリングされることができる。general_constraint_info()は、一般制限情報フィールドまたは制限フラグに関する情報と呼ばれる。例えば、制限フラグとしてno_scaling_list_constraint_flagシンタックス要素が使われることができる。ここで、制限フラグは、適合したビットストリーム属性(conformance bitstream properties)を指定するのに使われることができる。例えば、no_scaling_list_constraint_flagシンタックス要素の値が1である場合、scaling_list_enabled_flagが0に指定されるべきビットストリーム適合(bitstream conformance)要求事項を示し、no_scaling_list_constraint_flagシンタックス要素の値が0である場合、制限が無いことを示すことができる。 Referring to Tables 23 and 24, the constraint flag can be parsed/signaled via general_constraint_info(). general_constraint_info() is referred to as the general constraint information field or information on the constraint flag. For example, the no_scaling_list_constraint_flag syntax element can be used as the constraint flag. Here, the constraint flag can be used to specify conformance bitstream properties. For example, if the value of the no_scaling_list_constraint_flag syntax element is 1, it indicates a bitstream conformance requirement where scaling_list_enabled_flag should be set to 0, and if the value of the no_scaling_list_constraint_flag syntax element is 0, it can indicate that there is no restriction.

一方、前述したように、本文書の一実施形態によると、スケーリングリストデータは、階層的構造を介して伝達されることができる。これによって、本文書は、スライスヘッダを介してパーシング/シグナリングされることができるスケーリングリストデータの構造を提案する。ここで、スライスヘッダは、タイルグループヘッダと呼ばれることもでき、またはピクチャヘッダに混用または代替されることもできる。 Meanwhile, as mentioned above, according to one embodiment of this document, the scaling list data can be transmitted via a hierarchical structure. Accordingly, this document proposes a structure of scaling list data that can be parsed/signaled via a slice header. Here, the slice header can also be referred to as a tile group header, or can be mixed with or substituted for the picture header.

一実施形態として、以下の表25は、スケーリングリストデータをシグナリングするためのスライスヘッダシンタックスの一例を示す。 As one embodiment, Table 25 below shows an example of slice header syntax for signaling scaling list data.

Figure 0007492066000028
Figure 0007492066000028

前記表25のスライスヘッダシンタックスに含まれているシンタックス要素のセマンティクスは、以下の表26のように示すことができる。 The semantics of the syntax elements included in the slice header syntax in Table 25 can be shown in Table 26 below.

Figure 0007492066000029
Figure 0007492066000029

前記表25及び表26を参照すると、スライスヘッダでslice_pic_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。slice_pic_parameter_set_idシンタックス要素は、使用中であるPPSに対する識別子を示すことができる。即ち、slice_pic_parameter_set_idシンタックス要素は、当該スライスで参照するPPSを識別するための情報であって、pps_pic_parameter_set_idの値を示すことができる。slice_pic_parameter_set_idの値は、0乃至63の範囲内でなければならない。slice_pic_parameter_set_idシンタックス要素は、スライスで参照するPPS識別情報またはPPS ID情報ということができる。 Referring to Tables 25 and 26, the slice_pic_parameter_set_id syntax element can be parsed/signaled in the slice header. The slice_pic_parameter_set_id syntax element can indicate an identifier for the PPS in use. That is, the slice_pic_parameter_set_id syntax element is information for identifying the PPS referenced in the slice, and can indicate the value of pps_pic_parameter_set_id. The value of slice_pic_parameter_set_id must be within the range of 0 to 63. The slice_pic_parameter_set_id syntax element can be referred to as PPS identification information or PPS ID information referenced in the slice.

また、スライスヘッダでslice_scaling_list_enabled_flagシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_enabled_flagシンタックス要素は、現在スライスでスケーリングリストが可用であるかどうかを示すことができる。例えば、slice_scaling_list_enabled_flagの値が1である場合、スケーリングリストが現在スライスで可用であることを示すことができ、slice_scaling_list_enabled_flagの値が0である場合、スケーリングリストが現在スライスで可用でないことを示すことができる。または、スライスヘッダでslice_scaling_list_enabled_flagが存在しない場合、その値は、0に類推されることができる。 In addition, a slice_scaling_list_enabled_flag syntax element may be parsed/signaled in the slice header. The slice_scaling_list_enabled_flag syntax element may indicate whether a scaling list is available in the current slice. For example, if the value of slice_scaling_list_enabled_flag is 1, it may indicate that a scaling list is available in the current slice, and if the value of slice_scaling_list_enabled_flag is 0, it may indicate that a scaling list is not available in the current slice. Alternatively, if slice_scaling_list_enabled_flag is not present in the slice header, its value may be inferred to 0.

このとき、slice_scaling_list_enabled_flagシンタックス要素は、上位レベルシンタックス(即ち、SPS)でシグナリングされるscaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定されることができる。例えば、SPSでシグナリングされたscaling_list_enabled_flagの値が1である場合(即ち、上位レベルでスケーリングリストデータが可用であるように決定された場合)、スライスヘッダでslice_scaling_list_enabled_flagをパーシングし、当該スライスでスケーリングリストを使用してスケーリング過程を実行するかどうかを決定することができる。 In this case, the slice_scaling_list_enabled_flag syntax element can be parsed or not based on the scaling_list_enabled_flag syntax element signaled in the upper level syntax (i.e., SPS). For example, if the value of the scaling_list_enabled_flag signaled in the SPS is 1 (i.e., if it is determined that the scaling list data is available at the upper level), the slice_scaling_list_enabled_flag can be parsed in the slice header to determine whether to perform a scaling process using the scaling list in the slice.

また、スライスヘッダでslice_scaling_list_aps_idシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するAPSに対する識別子を示すことができる。即ち、slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するスケーリングリストデータを含んでいるAPSのID情報(adaptation_parameter_set_id)を示すことができる。一方、slice_scaling_list_aps_idと同じAPS ID情報(adaptation_parameter_set_id)を有するAPS NALユニット(即ち、スケーリングリストデータを含むAPS NALユニット)のTemporalId(即ち、TemporalID)が、コーディングされるスライスNALユニットのTemporalId(即ち、TemporalID)より小さいまたは同じでなければならない。 In addition, a slice_scaling_list_aps_id syntax element can be parsed/signaled in the slice header. The slice_scaling_list_aps_id syntax element can indicate an identifier for the APS referenced in the slice. That is, the slice_scaling_list_aps_id syntax element can indicate ID information (adaptation_parameter_set_id) of the APS containing the scaling list data referenced in the slice. Meanwhile, the TemporalId (i.e., TemporalID) of an APS NAL unit (i.e., an APS NAL unit containing scaling list data) having the same APS ID information (adaptation_parameter_set_id) as slice_scaling_list_aps_id must be smaller than or equal to the TemporalId (i.e., TemporalID) of the slice NAL unit being coded.

また、slice_scaling_list_aps_idシンタックス要素は、slice_scaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定されることができる。例えば、slice_scaling_list_aps_idの値が1である場合(即ち、スライスヘッダでスケーリングリストが可用であるように決定された場合)、slice_scaling_list_aps_idをパーシングすることができる。以後、前記パーシングされたslice_scaling_list_aps_idが指示するAPSからスケーリングリストデータを取得することができる。 In addition, whether the slice_scaling_list_aps_id syntax element can be parsed can be determined based on the slice_scaling_list_enabled_flag syntax element. For example, if the value of slice_scaling_list_aps_id is 1 (i.e., if it is determined that the scaling list is available in the slice header), slice_scaling_list_aps_id can be parsed. Thereafter, scaling list data can be obtained from the APS indicated by the parsed slice_scaling_list_aps_id.

また、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APS(スケーリングリストデータを含む複数のAPS)が同一ピクチャ内の二つ以上のスライスにより参照される場合、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APSは、同じ内容を含まなければならない。 In addition, when multiple SCALING DATA APS (multiple APS including scaling list data) with the same APS ID information (adaptation_parameter_set_id) value are referenced by two or more slices in the same picture, the multiple SCALING DATA APS with the same APS ID information (adaptation_parameter_set_id) value must contain the same content.

また、前述したシンタックス要素が存在する場合、スライスヘッダシンタックス要素slice_pic_parameter_set_id、slice_pic_order_cnt_lsb、及びslice_temporal_mvp_enabled_flagの各々の値は、コーディングされるピクチャ内の全てのスライスヘッダで同じでなければならない。 In addition, if the aforementioned syntax elements are present, the values of the slice header syntax elements slice_pic_parameter_set_id, slice_pic_order_cnt_lsb, and slice_temporal_mvp_enabled_flag must be the same in all slice headers within the picture being coded.

前述したように、本文書の一実施形態によると、スケーリングリストデータを効率的にシグナリングするために階層的構造を使用することができる。即ち、上位レベル(SPSシンタックス)でスケーリングリストデータの可用可否を示す可用フラグ(例:scaling_list_enabled_flag)を先にシグナリングし、以後、下位レベル(例:スライスヘッダ、ピクチャヘッダ等)で追加的な可用フラグ(例:slice_scaling_list_enabled_flag)をシグナリングすることで各下位レベルでスケーリングリストデータを使用するかを決定することができる。また、下位レベル(例:スライスヘッダ、ピクチャヘッダ等)を介して当該スライスまたはタイルグループで参照するAPS ID情報(例:slice_scaling_list_aps_id)をシグナリングし、APS ID情報により識別されるAPSからスケーリングリストデータを導出できる。 As described above, according to one embodiment of this document, a hierarchical structure can be used to efficiently signal scaling list data. That is, an availability flag (e.g., scaling_list_enabled_flag) indicating whether scaling list data is available at a higher level (SPS syntax) is first signaled, and then an additional availability flag (e.g., slice_scaling_list_enabled_flag) is signaled at a lower level (e.g., slice header, picture header, etc.) to determine whether scaling list data is to be used at each lower level. In addition, APS ID information (e.g., slice_scaling_list_aps_id) referenced by the slice or tile group can be signaled via a lower level (e.g., slice header, picture header, etc.), and the scaling list data can be derived from the APS identified by the APS ID information.

また、本文書は、階層的構造によってスケーリングリストデータをシグナリングするにあたって、前述した表23及び表24で提案された方法のように適用されることもでき、以下の表25のようなスライスヘッダの構造を介してスケーリングリストデータを伝達することもできる。 In addition, this document can be applied to signal scaling list data using a hierarchical structure as proposed in Tables 23 and 24 above, or the scaling list data can be transmitted via a slice header structure as shown in Table 25 below.

一実施形態として、以下の表27は、スケーリングリストデータをシグナリングするためのスライスヘッダシンタックスの一例を示す。ここで、スライスヘッダは、タイルグループヘッダと呼ばれることもでき、またはピクチャヘッダに混用または代替されることもできる。 As one embodiment, Table 27 below shows an example of slice header syntax for signaling scaling list data. Here, the slice header may also be referred to as a tile group header, or may be mixed with or substituted for the picture header.

Figure 0007492066000030
Figure 0007492066000030

前記表27のスライスヘッダシンタックスに含まれているシンタックス要素のセマンティクスは、以下の表28のように示すことができる。 The semantics of the syntax elements included in the slice header syntax in Table 27 can be shown in Table 28 below.

Figure 0007492066000031
Figure 0007492066000031

前記表27及び表28を参照すると、スライスヘッダでslice_pic_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。slice_pic_parameter_set_idシンタックス要素は、使用中であるPPSに対する識別子を示すことができる。即ち、slice_pic_parameter_set_idシンタックス要素は、当該スライスで参照するPPSを識別するための情報であって、pps_pic_parameter_set_idの値を示すことができる。slice_pic_parameter_set_idの値は、0乃至63の範囲内でなければならない。slice_pic_parameter_set_idシンタックス要素は、スライスで参照するPPS識別情報またはPPS ID情報ということができる。 Referring to Tables 27 and 28, the slice_pic_parameter_set_id syntax element can be parsed/signaled in the slice header. The slice_pic_parameter_set_id syntax element can indicate an identifier for the PPS in use. That is, the slice_pic_parameter_set_id syntax element is information for identifying the PPS referenced in the slice, and can indicate the value of pps_pic_parameter_set_id. The value of slice_pic_parameter_set_id must be within the range of 0 to 63. The slice_pic_parameter_set_id syntax element can be referred to as PPS identification information or PPS ID information referenced in the slice.

また、スライスヘッダでslice_scaling_list_aps_idシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するAPSに対する識別子を示すことができる。即ち、slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するスケーリングリストデータを含んでいるAPSのID情報(adaptation_parameter_set_id)を示すことができる。一例として、slice_scaling_list_aps_idと同じAPS ID情報(adaptation_parameter_set_id)を有するAPS NALユニット(即ち、スケーリングリストデータを含むAPS NALユニット)のTemporalId(即ち、TemporalID)が、コーディングされるスライスNALユニットのTemporalId(即ち、TemporalID)より小さいまたは同じでなければならない。 In addition, a slice_scaling_list_aps_id syntax element can be parsed/signaled in the slice header. The slice_scaling_list_aps_id syntax element can indicate an identifier for the APS referenced in the slice. That is, the slice_scaling_list_aps_id syntax element can indicate the ID information (adaptation_parameter_set_id) of the APS containing the scaling list data referenced in the slice. As an example, the TemporalId (i.e., TemporalID) of an APS NAL unit (i.e., an APS NAL unit containing scaling list data) having the same APS ID information (adaptation_parameter_set_id) as slice_scaling_list_aps_id must be smaller than or equal to the TemporalId (i.e., TemporalID) of the slice NAL unit being coded.

このとき、slice_scaling_list_aps_idシンタックス要素は、上位レベルシンタックス(即ち、SPS)でシグナリングされるscaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定されることができる。例えば、SPSでシグナリングされたscaling_list_enabled_flagの値が1である場合(即ち、上位レベルでスケーリングリストデータが可用であるように決定された場合)、スライスヘッダでslice_scaling_list_aps_idをパーシングすることができる。以後、前記パーシングされたslice_scaling_list_aps_idが指示するAPSからスケーリングリストデータを取得することができる。 In this case, the slice_scaling_list_aps_id syntax element can be parsed or not based on the scaling_list_enabled_flag syntax element signaled in the upper level syntax (i.e., SPS). For example, if the value of scaling_list_enabled_flag signaled in the SPS is 1 (i.e., if it is determined that scaling list data is available at the upper level), slice_scaling_list_aps_id can be parsed in the slice header. Thereafter, scaling list data can be obtained from the APS indicated by the parsed slice_scaling_list_aps_id.

即ち、本実施形態によると、スケーリングリストデータを含むAPS IDは、SPS内の対応するフラグ(例:scaling_list_enabled_flag)がイネイブルされる場合、パーシングされることができるため、前述した表25に示すように、上位レベルシンタックス(即ち、SPS)でシグナリングされるscaling_list_enabled_flagシンタックス要素に基づいて該当下位レベル(例えば、スライスヘッダまたはピクチャヘッダ)で参照するスケーリングリストデータを含むAPS ID(例:slice_scaling_list_aps_id)情報をパーシングすることができる。 That is, according to this embodiment, the APS ID including the scaling list data can be parsed if the corresponding flag (e.g., scaling_list_enabled_flag) in the SPS is enabled, so that, as shown in Table 25 above, the APS ID (e.g., slice_scaling_list_aps_id) information including the scaling list data referenced at the corresponding lower level (e.g., slice header or picture header) can be parsed based on the scaling_list_enabled_flag syntax element signaled in the higher level syntax (i.e., SPS).

また、本文書は、スケーリングリストデータをシグナリングするために複数のAPSを使用する方法に関して提案する。以下では、本文書の一実施形態によってスケーリングリストデータを含む複数のAPS IDを効率的にシグナリングする方法を説明する。この方法は、ビットストリームマージ(merge)の間に有用である。 This document also proposes a method for using multiple APSs to signal scaling list data. In the following, a method for efficiently signaling multiple APS IDs with scaling list data according to one embodiment of this document is described. This method is useful during bitstream merge.

一実施形態として、以下の表29は、複数のAPSを使用してスケーリングリストデータをシグナリングするためのスライスヘッダシンタックスの一例を示す。ここで、スライスヘッダは、タイルグループヘッダと呼ばれることもでき、または、ピクチャヘッダに混用または代替されることもできる。 As one embodiment, Table 29 below shows an example of slice header syntax for signaling scaling list data using multiple APS. Here, the slice header may also be referred to as a tile group header, or may be mixed with or substituted for the picture header.

Figure 0007492066000032
Figure 0007492066000032

前記表29のスライスヘッダシンタックスに含まれているシンタックス要素のセマンティクスは、以下の表30のように示すことができる。 The semantics of the syntax elements included in the slice header syntax in Table 29 can be shown in Table 30 below.

Figure 0007492066000033
Figure 0007492066000033

前記表29及び表30を参照すると、スライスヘッダでslice_pic_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。slice_pic_parameter_set_idシンタックス要素は、slice_pic_parameter_set_idシンタックス要素は使用中であるPPSに対する識別子を示すことができる。即ち、slice_pic_parameter_set_idシンタックス要素は、当該スライスで参照するPPSを識別するための情報であって、pps_pic_parameter_set_idの値を示すことができる。slice_pic_parameter_set_idの値は、0乃至63の範囲内でなければならない。slice_pic_parameter_set_idシンタックス要素は、スライスで参照するPPS識別情報またはPPS ID情報ということができる。 Referring to Tables 29 and 30, the slice_pic_parameter_set_id syntax element can be parsed/signaled in the slice header. The slice_pic_parameter_set_id syntax element can indicate an identifier for the PPS in use. That is, the slice_pic_parameter_set_id syntax element is information for identifying the PPS referenced in the slice, and can indicate the value of pps_pic_parameter_set_id. The value of slice_pic_parameter_set_id must be within the range of 0 to 63. The slice_pic_parameter_set_id syntax element can be said to be the PPS identification information or PPS ID information referenced by the slice.

また、スライスヘッダでslice_scaling_list_enabled_flagシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_enabled_flagシンタックス要素は、現在スライスでスケーリングリストが可用であるかどうかを示すことができる。例えば、slice_scaling_list_enabled_flagの値が1である場合、スケーリングリストが現在スライスで可用であることを示すことができ、slice_scaling_list_enabled_flagの値が0である場合、スケーリングリストが現在スライスで可用でないことを示すことができる。または、スライスヘッダでslice_scaling_list_enabled_flagが存在しない場合、その値は、0に類推されることができる。 In addition, a slice_scaling_list_enabled_flag syntax element may be parsed/signaled in the slice header. The slice_scaling_list_enabled_flag syntax element may indicate whether a scaling list is available in the current slice. For example, if the value of slice_scaling_list_enabled_flag is 1, it may indicate that a scaling list is available in the current slice, and if the value of slice_scaling_list_enabled_flag is 0, it may indicate that a scaling list is not available in the current slice. Alternatively, if slice_scaling_list_enabled_flag is not present in the slice header, its value may be inferred to 0.

このとき、slice_scaling_list_enabled_flagシンタックス要素は、上位レベルシンタックス(即ち、SPS)でシグナリングされるscaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定されることができる。例えば、SPSでシグナリングされたscaling_list_enabled_flagの値が1である場合(即ち、上位レベルでスケーリングリストデータが可用であるように決定された場合)、スライスヘッダでslice_scaling_list_enabled_flagをパーシングし、当該スライスでスケーリングリストを使用してスケーリング過程を実行するかどうかを決定することができる。 In this case, the slice_scaling_list_enabled_flag syntax element can be parsed or not based on the scaling_list_enabled_flag syntax element signaled in the upper level syntax (i.e., SPS). For example, if the value of the scaling_list_enabled_flag signaled in the SPS is 1 (i.e., if it is determined that the scaling list data is available at the upper level), the slice_scaling_list_enabled_flag can be parsed in the slice header to determine whether to perform a scaling process using the scaling list in the slice.

また、スライスヘッダでnum_scaling_list_aps_ids_minus1シンタックス要素がパーシング/シグナリングされることができる。num_scaling_list_aps_ids_minus1シンタックス要素は、当該スライスにより参照されるスケーリングリストデータを含むAPSの個数を指示するための情報である。例えば、num_scaling_list_aps_ids_minus1シンタックス要素の値に1を加えた値がAPS個数である。num_scaling_list_aps_ids_minus1の値は、0乃至7の範囲内でなければならない。 In addition, the num_scaling_list_aps_ids_minus1 syntax element can be parsed/signaled in the slice header. The num_scaling_list_aps_ids_minus1 syntax element is information for indicating the number of APSs including scaling list data referenced by the slice. For example, the value of the num_scaling_list_aps_ids_minus1 syntax element plus 1 is the number of APSs. The value of num_scaling_list_aps_ids_minus1 must be in the range of 0 to 7.

ここで、num_scaling_list_aps_ids_minus1シンタックス要素は、slice_scaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定されることができる。例えば、slice_scaling_list_enabled_flagの値が1である場合(即ち、当該スライスでスケーリングリストデータが可用であるように決定された場合)、num_scaling_list_aps_ids_minus1をパーシングすることができる。この場合、num_scaling_list_aps_ids_minus1の値に基づいてslice_scaling_list_aps_id[i]シンタックス要素がパーシング/シグナリングされることができる。 Here, the parsing of the num_scaling_list_aps_ids_minus1 syntax element can be determined based on the slice_scaling_list_enabled_flag syntax element. For example, if the value of slice_scaling_list_enabled_flag is 1 (i.e., it is determined that scaling list data is available in the slice), num_scaling_list_aps_ids_minus1 can be parsed. In this case, the slice_scaling_list_aps_id[i] syntax element can be parsed/signaled based on the value of num_scaling_list_aps_ids_minus1.

即ち、slice_scaling_list_aps_id[i]は、i番目のスケーリングリストデータを含むAPS(即ち、i番目のSCALING LIST APS)の識別子(adaptation_parameter_set_id)を示すことができる。即ち、num_scaling_list_aps_ids_minus1シンタックス要素により指示されるAPS個数ほどAPS ID情報がシグナリングされることができる。一方、slice_scaling_list_aps_id[i]と同じAPS ID情報(adaptation_parameter_set_id)を有するAPS NALユニット(即ち、スケーリングリストデータを含むAPS NALユニット)のTemporalId(即ち、TemporalID)が、コーディングされるスライスNALユニットのTemporalId(即ち、TemporalID)より小さいまたは同じでなければならない。 That is, slice_scaling_list_aps_id[i] may indicate the identifier (adaptation_parameter_set_id) of the APS (i.e., the i-th SCALING LIST APS) including the i-th scaling list data. That is, APS ID information may be signaled for the number of APSs indicated by the num_scaling_list_aps_ids_minus1 syntax element. Meanwhile, the TemporalId (i.e., TemporalID) of an APS NAL unit (i.e., an APS NAL unit containing scaling list data) having the same APS ID information (adaptation_parameter_set_id) as slice_scaling_list_aps_id[i] must be smaller than or equal to the TemporalId (i.e., TemporalID) of the slice NAL unit being coded.

また、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APS(スケーリングリストデータを含む複数のAPS)が同一ピクチャ内の二つ以上のスライスにより参照される場合、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APSは、同じ内容を含まなければならない。 In addition, when multiple SCALING DATA APS (multiple APS including scaling list data) with the same APS ID information (adaptation_parameter_set_id) value are referenced by two or more slices in the same picture, the multiple SCALING DATA APS with the same APS ID information (adaptation_parameter_set_id) value must contain the same content.

また、本文書は、階層的構造によってスケーリングリストデータをシグナリングするにあたり、重複的にシグナリングされないようにする方案を提案する。一実施形態として、PPS(Picture Parameter Set)でスケーリングリストデータのシグナリングを除去できる。スケーリングリストデータは、SPS、またはAPS、及び/又は他の適切なヘッダセットで十分にシグナリングされることができる。 This document also proposes a method for signaling scaling list data in a hierarchical structure to avoid redundant signaling. In one embodiment, signaling of scaling list data in PPS (Picture Parameter Set) can be eliminated. The scaling list data can be fully signaled in SPS, or APS, and/or other suitable header sets.

一実施形態として、次の表31は、PPSでスケーリングリストデータをシグナリングしないPPSシンタックスの一例を示す。 As one embodiment, Table 31 below shows an example of PPS syntax that does not signal scaling list data in the PPS.

Figure 0007492066000034
Figure 0007492066000034

次の表32は、前記表31のPPSシンタックスでスケーリングリストデータの重複的なシグナリングを避けるために除去され得るシンタックス要素(例:pps_scaling_list_data_present_flag)に対するセマンティクスを表した一例である。 The following Table 32 is an example showing the semantics of syntax elements (e.g., pps_scaling_list_data_present_flag) that can be removed to avoid redundant signaling of scaling list data in the PPS syntax of Table 31.

Figure 0007492066000035
Figure 0007492066000035

前記表31及び表32を参照すれば、PPSでスケーリングリストデータをシグナリングするための情報、例えば、pps_scaling_list_data_present_flagシンタックス要素を除去できる。pps_scaling_list_data_present_flagシンタックス要素は、その値が0であるか、1であるかの可否に基づいてPPSでスケーリングリストデータをシグナリングするか否かを表すことができる。例えば、pps_scaling_list_data_present_flagシンタックス要素の値が1である場合、PPSを参照するピクチャに使用されるスケーリングリストデータは、活性SPSにより指定されたスケーリングリスト及びPPSにより指定されたスケーリングリストデータに基づいて導出されることを表すことができる。pps_scaling_list_data_present_flagシンタックス要素の値が0である場合、PPSを参照するピクチャに使用されるスケーリングリストデータは、活性SPSにより指定されたことと同一に類推されることを表すことができる。すなわち、pps_scaling_list_data_present_flagシンタックス要素は、PPSからシグナリングされるスケーリングリストデータが存在するか否かを表す情報であることができる。 With reference to Tables 31 and 32, information for signaling scaling list data in the PPS, for example, the pps_scaling_list_data_present_flag syntax element, can be removed. The pps_scaling_list_data_present_flag syntax element can indicate whether scaling list data is signaled in the PPS based on whether its value is 0 or 1. For example, if the value of the pps_scaling_list_data_present_flag syntax element is 1, it can indicate that the scaling list data used for a picture referencing the PPS is derived based on the scaling list specified by the active SPS and the scaling list data specified by the PPS. If the value of the pps_scaling_list_data_present_flag syntax element is 0, it may indicate that the scaling list data used for a picture that references a PPS is inferred to be the same as that specified by the active SPS. That is, the pps_scaling_list_data_present_flag syntax element may be information indicating whether or not scaling list data signaled from the PPS is present.

すなわち、本実施形態では、重複的にスケーリングリストデータをシグナリングすることを防止するために、前記表31のように、pps_scaling_list_data_present_flagシンタックス要素を除去することにより(すなわち、pps_scaling_list_data_present_flagシンタックス要素をシグナリングしないことにより)、PPSによりスケーリングリストデータをパーシング/シグナリングさせないことができる。 In other words, in this embodiment, in order to prevent redundant signaling of scaling list data, the pps_scaling_list_data_present_flag syntax element is removed (i.e., the pps_scaling_list_data_present_flag syntax element is not signaled) as shown in Table 31, thereby preventing the scaling list data from being parsed/signaled by the PPS.

また、本文書は、APSでスケーリングリストマトリックスをシグナリングするための方案を提案する。既存の方案は、3つのモード(すなわち、OFF、DEFAULT、USER_DEFINEDモード)を使用している。OFFモードは、スケーリングリストデータが変換ブロックに適用されないことを表す。DEFAULTモードは、スケーリングマトリックスを生成するのに固定値が使用されることを表す。USER_DEFINEDモードは、ブロックサイズ、予測モード、及びカラー成分に基づいてスケーリングマトリックスが使用されることを表す。現在VVCで支援されるスケーリングマトリックスの総個数は、44個であり、これは、HEVCでの28個より大きく増加されたものである。現在スケーリングリストデータは、SPSでシグナリングされ、PPSで条件的に存在することができる。APSでスケーリングリストデータをシグナリングすることにより、SPS及びPPSで同じデータの重複的なシグナリング(redundant signaling)は不要であるので、除去されることができる。 This document also proposes a method for signaling the scaling list matrix in the APS. Existing methods use three modes (i.e., OFF, DEFAULT, and USER_DEFINED modes). The OFF mode indicates that the scaling list data is not applied to the transform block. The DEFAULT mode indicates that a fixed value is used to generate the scaling matrix. The USER_DEFINED mode indicates that a scaling matrix is used based on the block size, prediction mode, and color components. Currently, the total number of scaling matrices supported in VVC is 44, which is an increase from 28 in HEVC. Currently, the scaling list data is signaled in the SPS and can be conditionally present in the PPS. By signaling the scaling list data in the APS, redundant signaling of the same data in the SPS and PPS is unnecessary and can be eliminated.

例えば、現在VVCで定義されたスケーリングマトリックスは、scaling_list_enabled_flagを使用してSPSで可用であるか(enabled)否かを表す。このフラグが可用であることを表す場合、変換係数に対するスケーリング過程でスケーリングリストが使用され、このフラグが可用でないことを表す場合、変換係数に対するスケーリング過程でスケーリングリストが使用されない(例:OFFモード)。また、スケーリングリストデータがSPSに存在するか否かを表すsps_scaling_list_data_present_flagがパーシングされ得る。SPSでのシグナリング以外に、スケーリングリストデータは、さらにPPSに存在することができる。pps_scaling_list_data_present_flagがPPSで可用であることを表す場合、スケーリングリストデータがPPSに存在することができる。スケーリングリストデータがSPS及びPPSで共に存在する場合、PPSからのスケーリングリストデータが活性PPSを参照するフレームに使用されることができる。scaling_list_enable_flagが可用であることを表すが、スケーリングリストデータがSPSにのみ存在し、PPSには存在しない場合、SPSからのスケーリングリストデータは、フレームにより参照されることができる。scaling_list_enable_flagが可用であることを表し、スケーリングリストデータがSPSまたはPPSに存在しない場合、DEFAULTモードが使用され得る。また、DEFAULTモードの使用は、スケーリングリストデータ自体内でシグナリングされることもできる。スケーリングリストデータが明示的にシグナリングされる場合、USER DEFINEDモードが使用され得る。与えられた変換ブロックに対するスケーリングファクタ(Scaling Factor)は、スケーリングリストでシグナリングされる情報を使用して決定されることができる。これは、APSでスケーリングリストデータをシグナリングするように提案される。 For example, the scaling matrix currently defined in VVC indicates whether it is available (enabled) in the SPS using scaling_list_enabled_flag. If this flag indicates that it is available, the scaling list is used in the scaling process for the transform coefficients, and if this flag indicates that it is not available, the scaling list is not used in the scaling process for the transform coefficients (e.g., OFF mode). In addition, sps_scaling_list_data_present_flag, which indicates whether scaling list data exists in the SPS, can be parsed. In addition to signaling in the SPS, the scaling list data can also exist in the PPS. If pps_scaling_list_data_present_flag indicates that it is available in the PPS, the scaling list data can exist in the PPS. If the scaling list data exists in both the SPS and the PPS, the scaling list data from the PPS can be used for frames that refer to the active PPS. If the scaling_list_enable_flag indicates availability, but the scaling list data exists only in the SPS and not in the PPS, the scaling list data from the SPS can be referenced by the frame. If the scaling_list_enable_flag indicates availability and the scaling list data does not exist in the SPS or the PPS, the DEFAULT mode can be used. The use of the DEFAULT mode can also be signaled within the scaling list data itself. If the scaling list data is explicitly signaled, the USER DEFINED mode can be used. The scaling factor for a given transform block can be determined using the information signaled in the scaling list. It is proposed to signal the scaling list data in the APS.

現在VVCでは、スケーリングリストデータを採択して使用しており、VVCで支援されるスケーリングマトリックスは、HEVCより広範である。VVCで支援されるスケーリングマトリックスは、ルマの場合、4×4から64×64まで、クロマの場合、2×2から32×32までのブロックサイズを選択できるようにする。また、長方形変換ブロック(TB)サイズ、従属的な量子化(dependent quantization)、多重変換選択(multiple transform selection)、大きいサイズの変換ブロックに対する高周波係数のゼロイングアウト(large transform with zeroing out high frequency coefficients)、イントラサブブロックパーティショニング(intra subblock partitioning;ISP)、イントラブロックコピー(intra block copy;IBC)を統合できる。イントラブロックコピー(IBC)とイントラコーディングモードとは、同じスケーリングマトリックスを共有できる。 Currently, VVC adopts and uses scaling list data, and the scaling matrices supported by VVC are wider than those supported by HEVC. The scaling matrices supported by VVC allow block sizes to be selected from 4x4 to 64x64 for luma and from 2x2 to 32x32 for chroma. In addition, rectangular transform block (TB) size, dependent quantization, multiple transform selection, large transform with zeroing out high frequency coefficients for large transform blocks, intra subblock partitioning (ISP), and intra block copy (IBC) can be integrated. Intra block copy (IBC) and intra coding modes can share the same scaling matrix.

したがって、USER_DEFINEDモードの場合、シグナリングされるマトリックスの個数は、次のとおりであることができる。 Therefore, for USER_DEFINED mode, the number of matrices signaled can be:

・MatrixType:30=2(2 for intra & IBC/inter)×3(Y/Cb/Cr components)×5(square TB size:from 4×4 to 64×64 for luma、from 2×2 to 32×32 for chroma) ・MatrixType: 30 = 2 (2 for intra & IBC/inter) x 3 (Y/Cb/Cr components) x 5 (square TB size: from 4 x 4 to 64 x 64 for luma, from 2 x 2 to 32 x 32 for chroma)

・MatrixType_DC:14=2(2 for intra & IBC/inter×1 for Y component)×3(TB size:16×16、32×32、64×64)+4(2 for intra & IBC/inter×2 for Cb/Cr components)×2(TB size:16×16、32×32) ・MatrixType_DC: 14 = 2 (2 for intra & IBC/inter x 1 for Y component) x 3 (TB size: 16 x 16, 32 x 32, 64 x 64) + 4 (2 for intra & IBC/inter x 2 for Cb/Cr components) x 2 (TB size: 16 x 16, 32 x 32)

DC値は、16×16、32×32、及び64×64サイズのスケーリングマトリックスに対して別にコーディングされることができる。変換ブロック(TB)サイズが8×8より小さい場合、1つのスケーリングマトリックス内に全ての要素に対してシグナリングされることができる。変換ブロック(TB)サイズが8×8より大きいか、同じ場合、1つの8×8スケーリングマトリックス内に64個要素に対してのみ基本スケーリングマトリックスとしてシグナリングされることができる。8×8より大きい正方形マトリックスを取得するために、基本8×8マトリックスは、必要なサイズに対応してアップサンプリングされることができる。DEFAULTモードが使用される場合、スケーリングマトリックスは、16に設定されることができる。したがって、VVCでは、44個の互いに異なるマトリックスを支援することに対し、HEVCでは、28個のマトリックスのみ支援する。VVCで支援されるスケーリングマトリックスの数がHEVCより広範であるので、SPS及び/又はPPSで重複的なシグナリングを避けるために、スケーリングリストデータのシグナリングのためのより実用的な選択としてAPSを使用できる。これは、スケーリングリストデータの不要で重複的なシグナリングを避けることができる。 DC values can be coded separately for scaling matrices of sizes 16x16, 32x32, and 64x64. If the transform block (TB) size is smaller than 8x8, all elements can be signaled in one scaling matrix. If the transform block (TB) size is greater than or equal to 8x8, only 64 elements in one 8x8 scaling matrix can be signaled as the base scaling matrix. To obtain a square matrix larger than 8x8, the base 8x8 matrix can be upsampled to the required size. If the DEFAULT mode is used, the scaling matrix can be set to 16. Thus, VVC supports 44 different matrices, whereas HEVC supports only 28 matrices. Since the number of scaling matrices supported in VVC is more extensive than HEVC, APS can be used as a more practical choice for signaling scaling list data to avoid redundant signaling in SPS and/or PPS. This avoids unnecessary and redundant signaling of scaling list data.

上述したような問題を解決しようとして、本文書は、APSでスケーリングマトリックスをシグナリングする方案を提案する。このために、スケーリングリストデータは、SPSでシグナリングされるか、PPSで条件的に存在する必要なしに、APSでのみシグナリングされることができる。また、スライスヘッダでAPS IDをシグナリングすることができる。 In an attempt to solve the above problems, this document proposes a method of signaling a scaling matrix in the APS. For this purpose, the scaling list data can be signaled only in the APS, without the need to be signaled in the SPS or conditionally present in the PPS. In addition, the APS ID can be signaled in the slice header.

一実施形態として、SPSでスケーリングリストデータが可用であるか否かを表すフラグ(例:scaling_list_enable_flag)をシグナリングし、PPSでスケーリングリストデータが存在するか否かを表すフラグ(例:pps_scaling_list_data_present_flag)を除去することによりシグナリングせずに、APSでスケーリングリストデータをシグナリングすることができる。また、スライスヘッダでAPS IDをシグナリングすることができる。このとき、SPSでシグナリングされたscaling_list_enable_flagの値が1であり(すなわち、スケーリングリストデータが可用なことと表す場合)、APS IDがスライスヘッダでシグナリングされない場合、DEFAULTスケーリングマトリックスが使用され得る。このような本文書の一実施形態は、次の表33ないし表41のようなシンタックス及びセマンティクスで実現されることができる。 In one embodiment, a flag (e.g., scaling_list_enable_flag) indicating whether scaling list data is available in the SPS is signaled, and a flag (e.g., pps_scaling_list_data_present_flag) indicating whether scaling list data is present in the PPS is removed, so that scaling list data can be signaled in the APS without signaling. Also, the APS ID can be signaled in the slice header. In this case, if the value of the scaling_list_enable_flag signaled in the SPS is 1 (i.e., indicating that the scaling list data is available) and the APS ID is not signaled in the slice header, the DEFAULT scaling matrix may be used. One embodiment of this document can be realized with the syntax and semantics shown in Tables 33 to 41 below.

次の表33は、スケーリングリストデータをシグナリングするために使用されるAPS構造の一例を表す。 The following Table 33 shows an example of an APS structure used to signal scaling list data.

Figure 0007492066000036
Figure 0007492066000036

前記表33のAPSシンタックスに含まれたシンタックス要素のセマンティクス(semantics)は、次の表34のように表すことができる。 The semantics of the syntax elements included in the APS syntax in Table 33 can be expressed as shown in Table 34 below.

Figure 0007492066000037
Figure 0007492066000037

前記表33及び表34を参照すれば、APSでadaptation_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。adaptation_parameter_set_idは、他のシンタックス要素の参照のためのAPSに対する識別子を提供する。すなわち、APSは、adaptation_parameter_set_idシンタックス要素に基づいて識別されることができる。adaptation_parameter_set_idシンタックス要素は。APS ID情報と呼ばれることができる。APSは、ピクチャ間に共有されることができ、ピクチャ内の他のスライスでは異なることができる。 Referring to Tables 33 and 34, the adaptation_parameter_set_id syntax element can be parsed/signaled in the APS. The adaptation_parameter_set_id provides an identifier for the APS for reference in other syntax elements. That is, the APS can be identified based on the adaptation_parameter_set_id syntax element. The adaptation_parameter_set_id syntax element can be referred to as APS ID information. The APS can be shared between pictures and can be different in different slices within a picture.

また、APSでaps_params_typeシンタックス要素がパーシング/シグナリングされることができる。aps_params_typeは、次の表35に表したように、APSから送信されるAPSパラメータのタイプを表すことができる。aps_params_typeシンタックス要素は、APSパラメータタイプ情報またはAPSタイプ情報と呼ばれることができる。 In addition, the aps_params_type syntax element can be parsed/signaled in the APS. The aps_params_type can indicate the type of APS parameters sent from the APS as shown in Table 35 below. The aps_params_type syntax element can be referred to as APS parameter type information or APS type information.

例えば、次の表35は、APSを介して送信されることができるAPSパラメータのタイプを表す例示であり、各APSパラメータタイプは、aps_params_typeの値に対応して表すことができる。 For example, the following Table 35 shows an example of the types of APS parameters that can be sent via APS, and each APS parameter type can be represented corresponding to the value of aps_params_type.

Figure 0007492066000038
Figure 0007492066000038

前記表35を参照すれば、aps_params_typeは、当該APSのタイプを分類するためのシンタックス要素であることができる。aps_params_typeの値が0である場合、当該APSタイプは、ALF_APSであることができ、当該APSは、ALFデータを運ぶことができ、ALFデータは、フィルタ/フィルタ係数を導出するためのALFパラメータを含むことができる。aps_params_typeの値が1である場合、当該APSタイプは、LMCS_APSであることができ、当該APSは、LMCSデータを運ぶことができ、LMCSデータは、LMCSモデル/ビン/マッピングインデックスを導出するためのLMCSパラメータを含むことができる。aps_params_typeの値が2である場合、当該APSタイプは、SCALING_APSであることができ、当該APSは、SCALINGリストデータを運ぶことができ、SCALINGリストデータは、周波数に基づく量子化スケーリングマトリックス/スケーリング、ファクタ/スケーリングリストの値を導出するためのスケーリングリストデータパラメータを含むことができる。 Referring to Table 35, aps_params_type may be a syntax element for classifying the type of the APS. If the value of aps_params_type is 0, the APS type may be ALF_APS, and the APS may carry ALF data, which may include ALF parameters for deriving filters/filter coefficients. If the value of aps_params_type is 1, the APS type may be LMCS_APS, and the APS may carry LMCS data, which may include LMCS parameters for deriving LMCS model/bin/mapping indexes. If the value of aps_params_type is 2, the APS type can be SCALING_APS, and the APS can carry SCALING list data, which can include frequency-based quantization scaling matrix/scaling, scaling list data parameters for deriving factor/scaling list values.

例えば、前記表33のように、APSでaps_params_typeシンタックス要素がパーシング/シグナリングされることができ、このとき、aps_params_typeの値が0を表す場合(すなわち、aps_params_typeがALF_APSを表す場合)、ALFデータ(すなわち、alf_data())がパーシング/シグナリングされることができる。または、aps_params_typeの値が1を表す場合(すなわち、aps_params_typeがLMCS_APSを表す場合)、LMCSデータ(すなわち、lmcs_data())がパーシング/シグナリングされることができる。または、aps_params_typeの値が2を表す場合(すなわち、aps_params_typeがSCALING_APSを表す場合)、スケーリングリストデータ(すなわち、scaling_list_data())がパーシング/シグナリングされることができる。 For example, as shown in Table 33, the aps_params_type syntax element can be parsed/signaled in APS, and in this case, if the value of aps_params_type represents 0 (i.e., if aps_params_type represents ALF_APS), ALF data (i.e., alf_data()) can be parsed/signaled. Or, if the value of aps_params_type represents 1 (i.e., if aps_params_type represents LMCS_APS), LMCS data (i.e., lmcs_data()) can be parsed/signaled. Alternatively, if the value of aps_params_type represents 2 (i.e., if aps_params_type represents SCALING_APS), scaling list data (i.e., scaling_list_data()) can be parsed/signaled.

また、前記表33及び表34を参照すれば、APSでaps_extension_flagシンタックス要素がパーシング/シグナリングされることができる。aps_extension_flagは、APS拡張データフラグ(aps_extension_data_flag)シンタックス要素が存在するか否かを指示できる。aps_extension_flagは、例えば、VVC標準の以後バージョンのための拡張ポイントを提供するために使用されることができる。aps_extension_flagシンタックス要素は、APS拡張フラグと呼ばれることができる。例えば、aps_extension_flagの値が0である場合、APS拡張データフラグ(aps_extension_data_flag)がAPS RBSPシンタックス構造に存在しないことを表すことができる。または、aps_extension_flagの値が1である場合、APS拡張データフラグ(aps_extension_data_flag)がAPS RBSPシンタックス構造に存在することを表すことができる。 Also, referring to Tables 33 and 34, the aps_extension_flag syntax element can be parsed/signaled in APS. The aps_extension_flag can indicate whether the APS extension data flag (aps_extension_data_flag) syntax element is present or not. The aps_extension_flag can be used, for example, to provide an extension point for a later version of the VVC standard. The aps_extension_flag syntax element can be referred to as an APS extension flag. For example, if the value of aps_extension_flag is 0, it can indicate that the APS extension data flag (aps_extension_data_flag) is not present in the APS RBSP syntax structure. Alternatively, if the value of aps_extension_flag is 1, it may indicate that the APS extension data flag (aps_extension_data_flag) is present in the APS RBSP syntax structure.

aps_extension_flagシンタックス要素に基づいてaps_extension_data_flagシンタックス要素がパーシング/シグナリングされることができる。aps_extension_data_flagシンタックス要素は、APS拡張データフラグと呼ばれることができる。例えば、aps_extension_flagの値が1である場合、aps_extension_data_flagがパーシング/シグナリングされることができ、このとき、aps_extension_data_flagは、任意の値を有することができる。 The aps_extension_data_flag syntax element can be parsed/signaled based on the aps_extension_flag syntax element. The aps_extension_data_flag syntax element can be referred to as an APS extension data flag. For example, if the value of aps_extension_flag is 1, aps_extension_data_flag can be parsed/signaled, and in this case, aps_extension_data_flag can have any value.

上述したように、本文書の一実施形態によれば、スケーリングリストデータを表すためのデータタイプ(例:SCALING_APS)を割り当て、データタイプを表すシンタックス要素(例:aps_params_type)をパーシング/シグナリングすることにより、効率的にスケーリングリストデータを運ぶことができる。すなわち、本文書の一実施形態によれば、スケーリングリストデータを統合したAPSの構造を使用することができる。 As described above, according to one embodiment of this document, scaling list data can be efficiently transported by assigning a data type (e.g., SCALING_APS) to represent the scaling list data and parsing/signaling a syntax element (e.g., aps_params_type) that represents the data type. In other words, according to one embodiment of this document, an APS structure that integrates scaling list data can be used.

また、APSでスケーリングリストデータをシグナリングするにあたり、SPSでスケーリングリストデータが可用であるか否かをシグナリングし、これに基づいてAPSでAPSパラメータタイプ(例:aps_params_type)によってスケーリングリストデータをパーシング/シグナリングすることができる。また、本文書の一実施形態では、上位レベルシンタックスで重複的なスケーリングリストデータのシグナリングを避けるために、スケーリングリストデータシンタックス構造(例:scaling_list_data())がSPSまたはPPSで存在するか否かを表すフラグ情報をSPSまたはPPSからパーシング/シグナリングさせないことにより、SPSまたはPPSでスケーリングリストデータをシグナリングしないことができる。これは、次の表36ないし表39のようなシンタックス及びセマンティクスで実現されることができる。 In addition, when signaling scaling list data in the APS, the SPS may signal whether or not the scaling list data is available, and based on this, the APS may parse/signal the scaling list data according to the APS parameter type (e.g., aps_params_type). In addition, in one embodiment of this document, in order to avoid signaling redundant scaling list data in higher level syntax, flag information indicating whether or not the scaling list data syntax structure (e.g., scaling_list_data()) is present in the SPS or PPS may not be parsed/signaled from the SPS or PPS, so that the scaling list data may not be signaled in the SPS or PPS. This may be achieved by the syntax and semantics shown in Tables 36 to 39 below.

例えば、次の表36のようにSPSシンタックスを修正できる。次の表36は、SPSでスケーリングリストデータのシグナリングをしないSPSシンタックス構造の一例を表す。 For example, the SPS syntax can be modified as shown in Table 36 below. Table 36 below shows an example of an SPS syntax structure that does not signal scaling list data in the SPS.

Figure 0007492066000039
Figure 0007492066000039

前記表36のSPSシンタックスに含まれたシンタックス要素のセマンティクスは、次の表37のように修正されることができる。一例として、表36及び表37では、スケーリングリストデータの重複的なシグナリングを避けるために、SPSに含まれたシンタックス要素のうち、一部シンタックス要素(例:sps_scaling_list_data_present_flag)が除去され得る。 The semantics of the syntax elements included in the SPS syntax of Table 36 may be modified as shown in Table 37 below. As an example, in Tables 36 and 37, some syntax elements (e.g., sps_scaling_list_data_present_flag) may be removed from the syntax elements included in the SPS to avoid redundant signaling of scaling list data.

Figure 0007492066000040
Figure 0007492066000040

前記表36及び表37を参照すれば、SPSでscaling_list_enabled_flagシンタックス要素がパーシング/シグナリングされることができる。scaling_list_enabled_flagシンタックス要素は、その値が0であるか、1であるかの可否に基づいてスケーリングリストが可用であるか否かを表すことができる。例えば、scaling_list_enabled_flagの値が1である場合、スケーリングリストが変換係数に対するスケーリング過程に使用されることを表し、scaling_list_enabled_flagの値が0である場合、スケーリングリストが変換係数に対するスケーリング過程に使用されないことを表すことができる。 Referring to Tables 36 and 37, the scaling_list_enabled_flag syntax element can be parsed/signaled in the SPS. The scaling_list_enabled_flag syntax element can indicate whether a scaling list is available or not based on whether its value is 0 or 1. For example, if the value of scaling_list_enabled_flag is 1, it indicates that the scaling list is used in the scaling process for the transform coefficients, and if the value of scaling_list_enabled_flag is 0, it indicates that the scaling list is not used in the scaling process for the transform coefficients.

すなわち、scaling_list_enabled_flagシンタックス要素は、スケーリングリスト可用フラグと呼ばれることができ、SPS(または、SPSレベル)でシグナリングされることができる。言い換えれば、SPSレベルでシグナリングされるscaling_list_enabled_flagの値に基づいて、当該SPSを参照するCVS内のピクチャに対して基本的にスケーリングリストが可用なように決定されることができる。そして、SPSより下位レベル(例:PPS、タイルグループヘッダ、スライスヘッダ、及び/又は他の適切なヘッダ)で追加的な可用フラグをシグナリングしてスケーリングリストを取得できる。 That is, the scaling_list_enabled_flag syntax element can be referred to as a scaling list availability flag and can be signaled at the SPS (or SPS level). In other words, based on the value of scaling_list_enabled_flag signaled at the SPS level, it can be determined that a scaling list is essentially available for pictures in the CVS that reference the SPS. Then, an additional availability flag can be signaled at a level lower than the SPS (e.g., PPS, tile group header, slice header, and/or other appropriate header) to obtain the scaling list.

また、SPSでsps_scaling_list_data_present_flagシンタックス要素がパーシング/シグナリングされないことができる。すなわち、SPSでsps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないようにすることができる。sps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がSPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてSPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、SPSレベルでは、スケーリングリストデータを直接シグナリングせずに、スケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングするように構成されることができる。 In addition, the sps_scaling_list_data_present_flag syntax element may not be parsed/signaled in the SPS. That is, by removing the sps_scaling_list_data_present_flag syntax element in the SPS, this flag information may not be parsed/signaled. The sps_scaling_list_data_present_flag syntax element is flag information indicating whether or not the syntax structure of the scaling list data exists in the SPS, and the scaling list data specified by the SPS may be parsed/signaled according to this flag information. However, by removing the sps_scaling_list_data_present_flag syntax element, the SPS level can be configured to explicitly signal only the scaling list available flag (scaling_list_enabled_flag) without directly signaling the scaling list data.

また、PPSでスケーリングリストデータのシグナリングは、次の表38のように除去されることができる。例えば、次の表38は、PPSでスケーリングリストデータのシグナリングをしないPPSシンタックス構造の一例を表す。 Furthermore, the signaling of scaling list data in the PPS can be removed as shown in Table 38 below. For example, Table 38 below shows an example of a PPS syntax structure that does not signal scaling list data in the PPS.

Figure 0007492066000041
Figure 0007492066000041

前記表38のPPSシンタックスに含まれたシンタックス要素のセマンティクスは、次の表39のように修正されることができる。一例として、次の表39は、PPSシンタックスでスケーリングリストデータの重複的なシグナリングを避けるために除去され得るシンタックス要素(例:pps_scaling_list_data_present_flag)に対するセマンティクスを表す。 The semantics of the syntax elements included in the PPS syntax of Table 38 can be modified as shown in Table 39 below. As an example, Table 39 below shows the semantics for syntax elements (e.g., pps_scaling_list_data_present_flag) that can be removed to avoid redundant signaling of scaling list data in the PPS syntax.

Figure 0007492066000042
Figure 0007492066000042

前記表38及び表39を参照すれば、PPSでpps_scaling_list_data_present_flagシンタックス要素がパーシング/シグナリングされないことができる。すなわち、PPSでpps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないように構成することができる。pps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がPPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてPPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、pps_scaling_list_data_present_flagシンタックス要素を除去することにより、PPSレベルでは、スケーリングリストデータを直接シグナリングしないことができる。 Referring to Tables 38 and 39, the pps_scaling_list_data_present_flag syntax element may not be parsed/signaled in the PPS. That is, by removing the pps_scaling_list_data_present_flag syntax element in the PPS, this flag information may be configured not to be parsed/signaled. The pps_scaling_list_data_present_flag syntax element is flag information indicating whether or not the syntax structure of the scaling list data exists in the PPS, and the scaling list data specified by the PPS may be parsed/signaled according to this flag information. However, by removing the pps_scaling_list_data_present_flag syntax element, the scaling list data may not be directly signaled at the PPS level.

上述したように、SPSまたはPPSレベルでスケーリングリストデータが存在するか否かを表すフラグ情報を除去することにより、SPSまたはPPSレベルで直接的にスケーリングリストデータシンタックスをシグナリングしないようにSPSシンタックスとPPSシンタックスとを構成できる。SPSでスケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングし、以後SPSでの可用フラグ(scaling_list_enabled_flag)に基づいて下位レベルシンタックス(例:APS)で個別的にスケーリングリスト(scaling_list_data())をパーシングすることができる。したがって、本文書の一実施形態によれば、スケーリングリストデータが階層的構造によってパーシング/シグナリングされることができるので、よりコーディング効率を向上させることができる。 As described above, by removing the flag information indicating whether scaling list data is present at the SPS or PPS level, the SPS syntax and the PPS syntax can be configured so that the scaling list data syntax is not directly signaled at the SPS or PPS level. Only the scaling list availability flag (scaling_list_enabled_flag) is explicitly signaled in the SPS, and thereafter, the scaling list (scaling_list_data()) can be parsed individually in the lower level syntax (e.g., APS) based on the availability flag (scaling_list_enabled_flag) in the SPS. Therefore, according to one embodiment of this document, the scaling list data can be parsed/signaled according to a hierarchical structure, thereby improving coding efficiency.

また、APSでスケーリングリストデータをシグナリングするにあたり、スライスヘッダでAPS IDをシグナリングし、スライスヘッダから取得されたAPS IDに基づいてAPSを識別し、識別されたAPSからスケーリングリストデータをパーシング/シグナリングすることができる。ここで、スライスヘッダは、1つの例として説明するだけであり、スライスヘッダは、タイルグループヘッダまたはピクチャヘッダなどの様々なヘッダと混用または代替されることもできる。 In addition, when signaling scaling list data in the APS, the APS ID can be signaled in the slice header, the APS can be identified based on the APS ID obtained from the slice header, and the scaling list data can be parsed/signaled from the identified APS. Here, the slice header is described only as one example, and the slice header can be mixed with or substituted for various headers such as a tile group header or a picture header.

例えば、次の表40は、APSでスケーリングリストデータをシグナリングするために、APS IDシンタックス要素を含むスライスヘッダシンタックスの一例を表す。 For example, Table 40 below shows an example of slice header syntax including an APS ID syntax element to signal scaling list data in the APS.

Figure 0007492066000043
Figure 0007492066000043

前記表40のスライスヘッダシンタックスに含まれたシンタックス要素のセマンティクスは、次の表41のように表すことができる。 The semantics of the syntax elements included in the slice header syntax in Table 40 can be expressed as shown in Table 41 below.

Figure 0007492066000044
Figure 0007492066000044

前記表40及び表41を参照すれば、スライスヘッダでslice_pic_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。slice_pic_parameter_set_idシンタックス要素は、使用中のPPSに対する識別子を表すことができる。すなわち、slice_pic_parameter_set_idシンタックス要素は、当該スライスで参照するPPSを識別するための情報であって、pps_pic_parameter_set_idの値を表すことができる。slice_pic_parameter_set_idの値は、0~63の範囲内にあるべきである。slice_pic_parameter_set_idシンタックス要素は、スライスで参照するPPS識別情報またはPPSID情報といえる。 Referring to Tables 40 and 41, the slice_pic_parameter_set_id syntax element can be parsed/signaled in the slice header. The slice_pic_parameter_set_id syntax element can represent an identifier for the PPS in use. That is, the slice_pic_parameter_set_id syntax element is information for identifying the PPS referenced in the slice, and can represent the value of pps_pic_parameter_set_id. The value of slice_pic_parameter_set_id should be in the range of 0 to 63. The slice_pic_parameter_set_id syntax element can be said to be PPS identification information or PPSID information referenced in the slice.

また、スライスヘッダでslice_scaling_list_present_flagシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_present_flagシンタックス要素は、現在スライスに対してスケーリングリストマトリックスが存在するか否かを表す情報であることができる。例えば、slice_scaling_list_present_flagの値が1である場合、スケーリングリストマトリックスが現在スライスに対して存在することを表すことができ、slice_scaling_list_present_flagの値が0である場合、デフォルトスケーリングリストデータがスケーリングファクタ(ScalingFactor)アレイを導出するのに使用されることを表すことができる。または、スライスヘッダでslice_scaling_list_present_flagが存在しない場合、その値は、0に類推されることができる。 In addition, a slice_scaling_list_present_flag syntax element may be parsed/signaled in the slice header. The slice_scaling_list_present_flag syntax element may be information indicating whether a scaling list matrix exists for the current slice. For example, if the value of slice_scaling_list_present_flag is 1, it may indicate that a scaling list matrix exists for the current slice, and if the value of slice_scaling_list_present_flag is 0, it may indicate that default scaling list data is used to derive a scaling factor (ScalingFactor) array. Alternatively, if slice_scaling_list_present_flag is not present in the slice header, its value may be inferred to 0.

このとき、slice_scaling_list_present_flagシンタックス要素は、上位レベルシンタックス(すなわち、SPS)でシグナリングされるscaling_list_enabled_flagシンタックス要素に基づいてパーシング可否が決定され得る。例えば、SPSでシグナリングされたscaling_list_enabled_flagの値が1である場合(すなわち、上位レベルでスケーリングリストデータが可用なように決定された場合)、スライスヘッダでslice_scaling_list_present_flagをパーシングして、当該スライスでスケーリングリストを使用してスケーリング過程を行うか否かを決定できる。 In this case, the slice_scaling_list_present_flag syntax element may be parsed or not based on the scaling_list_enabled_flag syntax element signaled in the higher level syntax (i.e., SPS). For example, if the value of the scaling_list_enabled_flag signaled in the SPS is 1 (i.e., if it is determined that scaling list data is available at the higher level), the slice_scaling_list_present_flag can be parsed in the slice header to determine whether to perform a scaling process using the scaling list in the slice.

また、スライスヘッダでslice_scaling_list_aps_idシンタックス要素がパーシング/シグナリングされることができる。slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するAPSに対する識別子を表すことができる。すなわち、slice_scaling_list_aps_idシンタックス要素は、当該スライスで参照するスケーリングリストデータを含んでいるAPSのID情報(adaptation_parameter_set_id)を表すことができる。一方、slice_scaling_list_aps_idと同じAPS ID情報(adaptation_parameter_set_id)を有するAPS NALユニット(すなわち、スケーリングリストデータを含むAPS NALユニット)のTemporalId(すなわち、Temporal ID)は、コーディングされるスライスNALユニットのTemporalId(すなわち、Temporal ID)より小さいか、同じでなければならない。 In addition, a slice_scaling_list_aps_id syntax element can be parsed/signaled in the slice header. The slice_scaling_list_aps_id syntax element can represent an identifier for an APS referenced in the slice. That is, the slice_scaling_list_aps_id syntax element can represent ID information (adaptation_parameter_set_id) of an APS containing scaling list data referenced in the slice. On the other hand, the TemporalId (i.e., Temporal ID) of an APS NAL unit (i.e., an APS NAL unit containing scaling list data) having the same APS ID information (adaptation_parameter_set_id) as slice_scaling_list_aps_id must be smaller than or equal to the TemporalId (i.e., Temporal ID) of the slice NAL unit being coded.

また、slice_scaling_list_aps_idシンタックス要素は、slice_scaling_list_present_flagシンタックス要素に基づいてパーシング可否が決定され得る。例えば、slice_scaling_list_present_flagの値が1である場合(すなわち、スライスヘッダでスケーリングリストが存在する場合)、slice_scaling_list_aps_idをパーシングすることができる。その後、前記パーシングされたslice_scaling_list_aps_idが指示するAPSからスケーリングリストデータを取得できる。 In addition, whether the slice_scaling_list_aps_id syntax element can be parsed can be determined based on the slice_scaling_list_present_flag syntax element. For example, if the value of slice_scaling_list_present_flag is 1 (i.e., if a scaling list is present in the slice header), slice_scaling_list_aps_id can be parsed. Then, scaling list data can be obtained from the APS indicated by the parsed slice_scaling_list_aps_id.

また、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APS(スケーリングリストデータを含む複数のAPS)が同一ピクチャ内の2つ以上のスライスにより参照される場合、同じ値のAPS ID情報(adaptation_parameter_set_id)を有する複数のSCALING DATA APSは、同じ内容を含まなければならない。 In addition, when multiple SCALING DATA APS (multiple APS including scaling list data) with the same APS ID information (adaptation_parameter_set_id) value are referenced by two or more slices in the same picture, the multiple SCALING DATA APS with the same APS ID information (adaptation_parameter_set_id) value must contain the same content.

上述した表40及び表41によれば、スライスヘッダでAPS IDをシグナリングすることと説明したが、これは、1つの例示であり、本文書では、ピクチャヘッダまたはタイルグループヘッダなどでAPS IDをシグナリングすることができる。 In Tables 40 and 41 above, it has been described that the APS ID is signaled in the slice header, but this is just one example, and in this document, the APS ID can be signaled in the picture header or tile group header, etc.

また、本文書は、スケーリングリストデータを他のヘッダセットで再配置(reposition)する一般的な方案を提案する。一実施形態として、ヘッダセットでスケーリングリストデータを含む一般的な構造を提案する。現在VVCの場合、適切なヘッダセットとしてAPSを使用しているが、Nal Unit Type(NUT)により識別されるスケーリングリストデータを自分のヘッダセットでカプセル化することも可能でありうる。次の表42及び表43のように実現されることができる。 This document also proposes a general method for repositioning scaling list data in other header sets. As an embodiment, a general structure is proposed that includes scaling list data in a header set. Currently, for VVC, APS is used as the appropriate header set, but it may also be possible to encapsulate scaling list data identified by Nal Unit Type (NUT) in its own header set. This can be realized as shown in Tables 42 and 43 below.

例えば、次の表42は、NALユニットタイプと、それによるRBSPシンタックス構造を表した一例である。ここで、上述したように、NALユニットは、当該NALユニットに含まれるRBSPデータ構造(structure)によってNALユニットタイプが特定され得るし、このようなNALユニットタイプに関する情報は、NALユニットヘッダに格納されてシグナリングされることができる。 For example, the following Table 42 shows an example of NAL unit types and the corresponding RBSP syntax structures. As described above, the NAL unit type of a NAL unit can be identified by the RBSP data structure included in the NAL unit, and information regarding such a NAL unit type can be stored and signaled in the NAL unit header.

Figure 0007492066000045
Figure 0007492066000045

Figure 0007492066000046
Figure 0007492066000046

前記表42で表すように、スケーリングリストデータを1つのNALユニットタイプ(例:SCALING_NUT)と定義することができ、SCALING_NUTに対するNALユニットタイプの値で特定値(例:21、またはNALユニットタイプに指定されなかった予約された値のうち1つの値)を指定することができる。SCALING_NUTは、スケーリングリストデータパラメータセット(例:Scaling_list_data_parameter set)を含むNALユニットに対するタイプであることができる。 As shown in Table 42, the scaling list data can be defined as one NAL unit type (e.g., SCALING_NUT), and a specific value (e.g., 21, or one of the reserved values not specified in the NAL unit type) can be specified as the value of the NAL unit type for SCALING_NUT. SCALING_NUT can be a type for a NAL unit that includes a scaling list data parameter set (e.g., Scaling_list_data_parameter set).

また、SCALING_NUTの可用可否は、APS、PPS、及び/又は他の適切なヘッダより上位レベルで決定されることができ、または、他のNALユニットタイプより下位レベルで決定されることもできる。 Additionally, the availability of SCALING_NUT may be determined at a higher level than APS, PPS, and/or other appropriate headers, or may be determined at a lower level than other NAL unit types.

例えば、次の表43は、スケーリングリストデータをシグナリングするために使用されるスケーリングリストデータパラメータセットのシンタックスを表す。 For example, the following Table 43 shows the syntax of a scaling list data parameter set used to signal scaling list data.

Figure 0007492066000047
Figure 0007492066000047

前記表43のスケーリングリストデータパラメータセットシンタックスに含まれたシンタックス要素のセマンティクスは、次の表44のように表すことができる。 The semantics of the syntax elements included in the scaling list data parameter set syntax in Table 43 can be expressed as shown in Table 44 below.

Figure 0007492066000048
Figure 0007492066000048

前記表43及び表44を参照すれば、スケーリングリストデータパラメータセット(例:scaling_list_data_parameter_set)は、SCALING_NUTに対するNALユニットタイプの値(例:21)により特定されたヘッダセットであることができる。スケーリングリストデータパラメータセットでscaling_list_data_parameter_set_idシンタックス要素がパーシング/シグナリングされることができる。scaling_list_data_parameter_set_idシンタックス要素は、他のシンタックス要素の参照のためのスケーリングリストデータに対する識別子を提供する。すなわち、スケーリングリストパラメータセットは、scaling_list_data_parameter_set_idシンタックス要素に基づいて識別されることができる。scaling_list_data_parameter_set_idシンタックス要素は、スケーリングリストデータパラメータセットID情報と呼ばれることができる。スケーリングリストデータパラメータセットは、ピクチャ間に共有されることができ、ピクチャ内の他のスライスでは異なることができる。 Referring to Tables 43 and 44, the scaling list data parameter set (e.g., scaling_list_data_parameter_set) can be a header set identified by the NAL unit type value for SCALING_NUT (e.g., 21). In the scaling list data parameter set, the scaling_list_data_parameter_set_id syntax element can be parsed/signaled. The scaling_list_data_parameter_set_id syntax element provides an identifier for the scaling list data for reference to other syntax elements. That is, the scaling list parameter set can be identified based on the scaling_list_data_parameter_set_id syntax element. The scaling_list_data_parameter_set_id syntax element may be referred to as scaling list data parameter set ID information. Scaling list data parameter sets may be shared between pictures and may be different for other slices within a picture.

scaling_list_data_parameter_set_idにより識別されたスケーリングリストデータパラメータセットからスケーリングリストデータ(例:scaling_list_dataシンタックス)をパーシング/シグナリングすることができる。 Scaling list data (e.g., scaling_list_data syntax) can be parsed/signaled from the scaling list data parameter set identified by scaling_list_data_parameter_set_id.

また、スケーリングリストデータパラメータセットでscaling_list_data_extension_flagシンタックス要素がパーシング/シグナリングされることができる。scaling_list_data_extension_flagシンタックス要素は、スケーリングリストデータ拡張フラグ(scaling_list_data_extension_flag)シンタックス要素がスケーリングリストデータRBSPシンタックス構造に存在するか否かを表すことができる。例えば、scaling_list_data_extension_flagの値が1である場合、スケーリングリストデータ拡張フラグ(scaling_list_data_extension_flag)シンタックス要素がスケーリングリストデータRBSPシンタックス構造に存在することを表すことができる。または、scaling_list_data_extension_flagの値が0である場合、スケーリングリストデータ拡張フラグ(scaling_list_data_extension_flag)シンタックス要素がスケーリングリストデータRBSPシンタックス構造に存在しないことを表すことができる。 In addition, a scaling_list_data_extension_flag syntax element can be parsed/signaled in the scaling list data parameter set. The scaling_list_data_extension_flag syntax element can indicate whether the scaling list data extension flag (scaling_list_data_extension_flag) syntax element is present in the scaling list data RBSP syntax structure. For example, if the value of scaling_list_data_extension_flag is 1, it can indicate that the scaling list data extension flag (scaling_list_data_extension_flag) syntax element is present in the scaling list data RBSP syntax structure. Alternatively, if the value of scaling_list_data_extension_flag is 0, this may indicate that the scaling list data extension flag (scaling_list_data_extension_flag) syntax element is not present in the scaling list data RBSP syntax structure.

scaling_list_data_extension_flagシンタックス要素に基づいてscaling_list_data_extension_data_flagシンタックス要素がパーシング/シグナリングされることができる。scaling_list_data_extension_data_flagシンタックス要素は、スケーリングリストデータに対する拡張データフラグと呼ばれることができる。例えば、scaling_list_data_extension_flagの値が1である場合、scaling_list_data_extension_data_flagがパーシング/シグナリングされることができ、このとき、scaling_list_data_extension_data_flagは、任意の値を有することができる。 The scaling_list_data_extension_data_flag syntax element may be parsed/signaled based on the scaling_list_data_extension_flag syntax element. The scaling_list_data_extension_data_flag syntax element may be referred to as an extension data flag for the scaling list data. For example, if the value of scaling_list_data_extension_flag is 1, scaling_list_data_extension_data_flag may be parsed/signaled, and in this case, scaling_list_data_extension_data_flag may have any value.

上述したように、本文書の一実施形態によれば、スケーリングリストデータのための1つのヘッダセット構造を定義して使用することができ、スケーリングリストデータのためのヘッダセットは、NALユニットタイプ(例:SCALING_NUT)に特定することができる。この場合、スケーリングリストデータのためのヘッダセットは、スケーリングリストデータパラメータセット(例:scaling_list_data_parameter_set)と定義されることができ、これからスケーリングリストデータを取得できる。 As described above, according to one embodiment of this document, one header set structure for scaling list data can be defined and used, and the header set for the scaling list data can be specified for a NAL unit type (e.g., SCALING_NUT). In this case, the header set for the scaling list data can be defined as a scaling list data parameter set (e.g., scaling_list_data_parameter_set), from which the scaling list data can be obtained.

一方、本文書は、スケーリングリストデータに含まれたシンタックス要素scaling_lsit_pred_matrix_id_deltaを効果的にコーディングするための方案を提案する。 Meanwhile, this document proposes a method for effectively coding the syntax element scaling_lsit_pred_matrix_id_delta included in the scaling list data.

現在VVCの場合、scaling_lsit_pred_matrix_id_deltaシンタックス要素は、左側ビット優先で符号なしの整数0次Exp-Golombコーディングされたシンタックス要素(an unsigned integer 0-th order Exp-Golomb-coded syntax element with the left bit first)を使用してコーディングされる。しかし、コーディング効率を向上させるために、本文書の一実施形態では、次の表45のように、0~5の範囲を有するscaling_lsit_pred_matrix_id_deltaシンタックス要素に対して固定長さコード(例:u(3))を使用してコーディングする方案を提案する。このとき、全体範囲に対して効率性を向上させるために、3ビットのみ使用してコーディングすることで十分であることができる。 Currently, in the case of VVC, the scaling_lsit_pred_matrix_id_delta syntax element is coded using an unsigned integer 0-th order Exp-Golomb-coded syntax element with the left bit first. However, in order to improve coding efficiency, in one embodiment of this document, a method is proposed in which the scaling_lsit_pred_matrix_id_delta syntax element having a range of 0 to 5 is coded using a fixed length code (e.g., u(3)) as shown in Table 45 below. In this case, it may be sufficient to code using only 3 bits to improve efficiency for the entire range.

例えば、次の表45は、スケーリングリストデータシンタックス構造の一例を表す。 For example, the following Table 45 shows an example of a scaling list data syntax structure.

Figure 0007492066000049
Figure 0007492066000049

前記表45のスケーリングリストデータシンタックスに含まれたシンタックス要素のセマンティクスは、次の表46のように表すことができる。 The semantics of the syntax elements included in the scaling list data syntax in Table 45 can be expressed as shown in Table 46 below.

Figure 0007492066000050
Figure 0007492066000050

Figure 0007492066000051
Figure 0007492066000051

前記表45及び表46で表すように、スケーリングリストデータシンタックスからscaling_list_pred_matrix_id_deltaシンタックス要素がパーシング/シグナリングされることができる。scaling_list_pred_matrix_id_deltaシンタックス要素は、スケーリングリストを導出するのに使用される参照スケーリングリストを表すことができる。このとき、scaling_list_pred_matrix_id_deltaをパーシングするにあたり、固定長さコード(例:u(3))を使用してパーシングすることができる。 As shown in Tables 45 and 46, the scaling_list_pred_matrix_id_delta syntax element can be parsed/signaled from the scaling list data syntax. The scaling_list_pred_matrix_id_delta syntax element can represent a reference scaling list used to derive the scaling list. In this case, when parsing scaling_list_pred_matrix_id_delta, a fixed length code (e.g., u(3)) can be used for parsing.

一方、APSでスケーリングリストデータをシグナリングするにあたり、スケーリングリストマトリックスに対して制限をおくことができる。これに、本文書では、スケーリングリストマトリックスの個数を制限する方法に関して提案する。本文書において提案する方法によれば、実現を容易にし、最大メモリ要求事項(worst case memory requirement)を制限する効果を得ることができる。 On the other hand, when signaling scaling list data in APS, restrictions can be placed on the scaling list matrices. In response to this, this document proposes a method for limiting the number of scaling list matrices. The method proposed in this document has the effect of making implementation easier and limiting worst case memory requirements.

一実施形態として、スケーリングリストデータを含んでいるAPS(すなわち、スケーリングリストデータシンタックスをシグナリングするAPS)の個数を制限できる。このために、次のような制約条件を追加できる。このような制約条件は、ホルダーをおくためのことであって、すなわち、相違した値が使用され得る(It should be noted that these constraints are meant to place holders i.e.、different values can be used。)。 In one embodiment, the number of APSs that contain scaling list data (i.e., APSs that signal scaling list data syntax) can be limited. To this end, the following constraint can be added: This constraint is for placing holders, i.e., different values can be used.

説明の都合上、スケーリングリストデータを含んでいるAPS(すなわち、スケーリングリストデータシンタックスをシグナリングするAPS)は、SCALING LIST APSと称することができる。言い換えれば、上述したように、APSから送信されるAPSパラメータタイプ(例:aps_params_type)がスケーリングリストデータパラメータを表すタイプ(例:SCALING_APS)である場合、APSから送信されるスケーリングリストデータをSCALING LIST APSと表すことができる。 For ease of explanation, an APS that includes scaling list data (i.e., an APS that signals scaling list data syntax) may be referred to as a SCALING LIST APS. In other words, as described above, if the APS parameter type (e.g., aps_params_type) transmitted from the APS is a type that represents scaling list data parameters (e.g., SCALING_APS), the scaling list data transmitted from the APS may be referred to as a SCALING LIST APS.

例えば、スケーリングリストデータを含んでいるAPS(すなわち、SCALING LIST APS)の総個数が3より小さいことができる。もちろん、他の適切な値が使用されることもできる。例えば、0~7の範囲内に適切な値が使用され得る。すなわち、スケーリングリストデータを含んでいるAPS(すなわち、SCALING LIST APS)の総個数が0~7の範囲に決められることができる。 For example, the total number of APS containing scaling list data (i.e., SCALING LIST APS) may be less than 3. Of course, other suitable values may be used. For example, a suitable value within the range of 0 to 7 may be used. That is, the total number of APS containing scaling list data (i.e., SCALING LIST APS) may be set to a range of 0 to 7.

また、例えば、スケーリングリストデータを含んでいるAPS(すなわち、SCALING LIST APS)は、ピクチャ当り1個のSCALING LIST APSのみ許容されることができる。 Also, for example, APS that contain scaling list data (i.e., SCALING LIST APS) are only allowed one SCALING LIST APS per picture.

次の表47は、上述したようなスケーリングリストデータを含むAPSを制限するための制約条件を表すシンタックス要素及びそれに対するセマンティクスを表した一例である。 The following table 47 shows an example of syntax elements and their corresponding semantics that represent constraints for limiting an APS that includes the scaling list data described above.

Figure 0007492066000052
Figure 0007492066000052

前記表47を参照すれば、SCALING LIST APSのAPS識別情報(すなわち、APS ID情報)を表すシンタックス要素(例:slice_scaling_list_aps_id)に基づいてスケーリングリストデータを含んでいるAPS(すなわち、SCALING LIST APS)の個数を制限できる。 Referring to Table 47, the number of APSs (i.e., SCALING LIST APSs) that include scaling list data can be limited based on a syntax element (e.g., slice_scaling_list_aps_id) that represents the APS identification information (i.e., APS ID information) of the SCALING LIST APS.

例えば、シンタックス要素slice_scaling_list_aps_idは、スライスが参照するSCALING LIST APSのAPS識別情報(すなわち、APS ID情報)を表すことができる。このとき、シンタックス要素slice_scaling_list_aps_idの値は、特定の値に制限することができる。一例として、シンタックス要素slice_scaling_list_aps_idの値は、0~3の範囲にあるように制限することができる。これは、1つの例示であり、他の値を有するように制限することができ、他の例として、シンタックス要素slice_scaling_list_aps_idの値は、0~7の範囲にあるように制限することもできる。 For example, the syntax element slice_scaling_list_aps_id may represent APS identification information (i.e., APS ID information) of the SCALING LIST APS referenced by the slice. In this case, the value of the syntax element slice_scaling_list_aps_id may be limited to a specific value. As an example, the value of the syntax element slice_scaling_list_aps_id may be limited to a range of 0 to 3. This is one example, and the value may be limited to have other values, and as another example, the value of the syntax element slice_scaling_list_aps_id may be limited to a range of 0 to 7.

また、例えば、slice_lmcs_aps_idのようなAPS ID(adaptation_parameter_set_id)を有するSCALING LIST APS NALユニットのTemporalId(すなわち、Temporal ID)は、コーディングされたスライスNALユニットのTemporalId(すなわち、Temporal ID)より小さいか、同じでなければならない。 Furthermore, the TemporalId (i.e., Temporal ID) of a SCALING LIST APS NAL unit having an APS ID (adaptation_parameter_set_id) such as slice_lmcs_aps_id must be less than or equal to the TemporalId (i.e., Temporal ID) of the coded slice NAL unit.

また、例えば、APS ID(adaptation_parameter_set_id)値が同一である複数個のSCALING LIST APSが同一ピクチャ上の2つ以上のスライスにより参照される場合、同一のAPS ID(adaptation_parameter_set_id)値を有する複数個のSCALING LIST APSは、同一の内容(content)を有さなければならない。 Also, for example, when multiple SCALING LIST APS with the same APS ID (adaptation_parameter_set_id) value are referenced by two or more slices on the same picture, the multiple SCALING LIST APS with the same APS ID (adaptation_parameter_set_id) value must have the same content.

また、例えば、同一の値のAPS ID(adaptation_parameter_set_id)及び同一の内容を有する1つのSCALING LIST APSのみが同一ピクチャ上の1つ以上のスライスにより参照されなければならない。言い換えれば、同じピクチャ内の1つ以上のスライスは、スケーリングリストデータを含む同じAPSを参照しなければならない。 Also, for example, only one SCALING LIST APS with the same value of APS ID (adaptation_parameter_set_id) and the same contents must be referenced by one or more slices on the same picture. In other words, one or more slices in the same picture must reference the same APS that contains scaling list data.

以下の図面は、本文書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な用語や名称(例えば、シンタックス/シンタックス要素の名称など)は、例示的に提示されたものであるから、本文書の技術的特徴が以下の図面に使用された具体的な名称に制限されない。 The following drawings have been created to illustrate a specific example of the present document. The names of specific devices and specific terms and names (e.g., names of syntax/syntax elements, etc.) shown in the drawings are presented for illustrative purposes only, and the technical features of the present document are not limited to the specific names used in the following drawings.

図7及び図8は、本文書の実施形態(等)に係るビデオ/画像エンコード方法及び関連コンポーネントの一例を概略的に示す。 Figures 7 and 8 show a schematic diagram of an example video/image encoding method and associated components according to an embodiment (etc.) of this document.

図7に開示された方法は、図2において開示されたエンコード装置200によって行われることができる。具体的に、図7のステップS700は、図2に開示された減算部231によって行われることができ、図7のステップS710は、図2に開示された変換部232によって行われることができ、図7のステップS720~S730は、図2に開示された量子化部233によって行われることができ、図7のステップS740は、図2に開示されたエントロピーエンコード部240によって行われることができる。また、図7において開示された方法は、本文書において上述した実施形態を含んで行われることができる。したがって、図7では、上述した実施形態と重複する内容に関して具体的な説明を省略するか、簡単にする。 The method disclosed in FIG. 7 may be performed by the encoding device 200 disclosed in FIG. 2. Specifically, step S700 in FIG. 7 may be performed by the subtraction unit 231 disclosed in FIG. 2, step S710 in FIG. 7 may be performed by the conversion unit 232 disclosed in FIG. 2, steps S720 to S730 in FIG. 7 may be performed by the quantization unit 233 disclosed in FIG. 2, and step S740 in FIG. 7 may be performed by the entropy encoding unit 240 disclosed in FIG. 2. In addition, the method disclosed in FIG. 7 may be performed including the embodiments described above in this document. Therefore, in FIG. 7, detailed descriptions of contents that overlap with the above-described embodiments are omitted or simplified.

図7に示すように、エンコード装置は、現在ブロックに対するレジデュアルサンプルを導出できる(S700)。 As shown in FIG. 7, the encoding device can derive a residual sample for the current block (S700).

一実施形態として、まず、エンコード装置は、現在ブロックに対する予測モードを決定し、予測サンプルを導出できる。例えば、エンコード装置は、現在ブロックにインター予測を行うか、またはイントラ予測を行うかの可否を決定でき、また、RDコストに基づいて具体的なインター予測モードまたは具体的なイントラ予測モードを決定できる。エンコード装置は、決定された予測モードによって予測を行って現在ブロックに対する予測サンプルを導出できる。このとき、インター予測またはイントラ予測など、本文書において開示された様々な予測方法が適用され得る。また、エンコード装置は、現在ブロックに適用された予測と関連した情報(例えば、予測モード情報)を生成し、エンコードすることができる。そして、エンコード装置は、現在ブロックに対する原本サンプルと予測サンプルとを比較してレジデュアルサンプルを導出できる。 In one embodiment, the encoding device may first determine a prediction mode for a current block and derive a prediction sample. For example, the encoding device may determine whether to perform inter prediction or intra prediction for the current block, and may determine a specific inter prediction mode or a specific intra prediction mode based on the RD cost. The encoding device may perform prediction according to the determined prediction mode to derive a prediction sample for the current block. In this case, various prediction methods disclosed in this document, such as inter prediction or intra prediction, may be applied. In addition, the encoding device may generate and encode information (e.g., prediction mode information) related to the prediction applied to the current block. Then, the encoding device may derive a residual sample by comparing an original sample and a predicted sample for the current block.

エンコード装置は、レジデュアルサンプルに基づいて変換係数を導出できる(S710)。 The encoding device can derive transform coefficients based on the residual samples (S710).

一実施形態として、エンコード装置は、レジデュアルサンプルに対する変換過程を介して変換係数を導出できる。このとき、エンコード装置は、コーディング効率を考慮して現在ブロックに対する変換適用可否を決定できる。すなわち、エンコード装置は、レジデュアルサンプルに対して変換が適用されるか否かを決定できる。例えば、レジデュアルサンプルに対して変換が適用されない場合、エンコード装置は、レジデュアルサンプルを変換係数で導出することができる。または、レジデュアルサンプルに対して変換が適用される場合、エンコード装置は、レジデュアルサンプルに対する変換を行って変換係数を導出できる。この場合、エンコード装置は、現在ブロックに対して変換が適用されるか否かに基づいて変換スキップフラグ情報を生成し、エンコードすることができる。変換スキップフラグ情報は、現在ブロックに対して変換が適用されたか、変換がスキップ(skip)されたかを表す情報であることができる。 In one embodiment, the encoding apparatus may derive transform coefficients through a transform process for the residual sample. In this case, the encoding apparatus may determine whether transform is applied to the current block in consideration of coding efficiency. That is, the encoding apparatus may determine whether transform is applied to the residual sample. For example, if transform is not applied to the residual sample, the encoding apparatus may derive the residual sample as a transform coefficient. Alternatively, if transform is applied to the residual sample, the encoding apparatus may perform transform on the residual sample to derive transform coefficients. In this case, the encoding apparatus may generate and encode transform skip flag information based on whether transform is applied to the current block. The transform skip flag information may be information indicating whether transform is applied to the current block or whether transform is skipped.

エンコード装置は、変換係数に基づいて量子化された変換係数を導出できる(S720)。 The encoding device can derive quantized transform coefficients based on the transform coefficients (S720).

一実施形態として、エンコード装置は、変換係数に対する量子化過程を適用して量子化された変換係数を導出できる。このとき、エンコード装置は、周波数によって量子化強度を調節する周波数別加重量子化を適用できる。この場合、量子化過程は、周波数別量子化スケール値に基づいてさらに行われることができる。周波数別加重量子化のための量子化スケール値は、スケーリングマトリックスを使用して導出されることができる。例えば、エンコード装置/デコード装置は、予め定義されたスケーリングマトリックスを使用することができ、エンコード装置でスケーリングマトリックスに対する周波数別量子化スケール情報を構成してエンコードし、これをデコード装置にシグナリングすることもできる。周波数別量子化スケール情報は、スケーリングリストデータを含むことができる。スケーリングリストデータに基づいて(修正された)スケーリングマトリックスが導出され得る。 In one embodiment, the encoding device may derive quantized transform coefficients by applying a quantization process to the transform coefficients. In this case, the encoding device may apply frequency-specific weighting, which adjusts the quantization strength according to the frequency. In this case, the quantization process may be further performed based on a frequency-specific quantization scale value. The quantization scale value for the frequency-specific weighting may be derived using a scaling matrix. For example, the encoding device/decoding device may use a predefined scaling matrix, or the encoding device may configure and encode frequency-specific quantization scale information for the scaling matrix and signal the same to the decoding device. The frequency-specific quantization scale information may include scaling list data. A (modified) scaling matrix may be derived based on the scaling list data.

また、エンコード装置は、デコード装置と同様に、逆量子化過程を行うことができる。この場合、エンコード装置は、スケーリングリストデータに基づいて(修正された)スケーリングマトリックスを導出し、これに基づいて量子化された変換係数に逆量子化を適用して復元された変換係数を導出できる。このとき、復元された変換係数は、変換/量子化過程での損失のため、最初変換係数とは差がありうる。 The encoding device may also perform an inverse quantization process, similar to the decoding device. In this case, the encoding device may derive a (modified) scaling matrix based on the scaling list data, and apply inverse quantization to the quantized transform coefficients based on the scaling matrix to derive reconstructed transform coefficients. At this time, the reconstructed transform coefficients may differ from the original transform coefficients due to losses in the transform/quantization process.

ここで、スケーリングマトリックスは、上述した周波数に基づく量子化スケーリングマトリックスを称することができ、説明の都合によって量子化スケーリングマトリックス、量子化マトリックス、スケーリングマトリックス、スケーリングリストなどと混用または代替して使用されることができ、本実施形態において使用された具体的な名称に制限されない。 Here, the scaling matrix can refer to the frequency-based quantization scaling matrix described above, and can be used interchangeably with or in place of the quantization scaling matrix, quantization matrix, scaling matrix, scaling list, etc. for convenience of explanation, and is not limited to the specific names used in this embodiment.

すなわち、エンコード装置は、量子化過程を行うにあたり、周波数別加重量子化をさらに適用することができ、このとき、スケーリングマトリックスに関する情報としてスケーリングリストデータを生成できる。この過程は、表5ないし表17を例に挙げて具体的に説明したことがあるので、本実施形態では、重複的な内容や具体的な説明を省略する。 That is, the encoding device can further apply frequency-specific weighting when performing the quantization process, and at this time, can generate scaling list data as information on the scaling matrix. This process has been described in detail using Tables 5 to 17 as examples, so in this embodiment, duplicate content and detailed description will be omitted.

エンコード装置は、量子化された変換係数に基づいてレジデュアル情報を生成できる(S730)。 The encoding device can generate residual information based on the quantized transform coefficients (S730).

ここで、レジデュアル情報は、変換及び/又は量子化手順を介して生成された情報であって、量子化された変換係数に関する情報であることができ、例えば、量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。 Here, the residual information is information generated through a transformation and/or quantization procedure and may be information about quantized transformation coefficients, and may include, for example, value information, position information, transformation technique, transformation kernel, quantization parameters, etc. of the quantized transformation coefficients.

また、量子化過程で量子化された変換係数を導出するにあたり、周波数別加重量子化をさらに適用した場合、量子化された変換係数に対するスケーリングリストデータが生成され得る。スケーリングリストデータは、量子化された変換係数を導出するのに使用されるスケーリングリストパラメータを含むことができる。この場合、エンコード装置は、スケーリングリストデータ関連情報を生成でき、例えば、スケーリングリストデータを含むAPSを生成できる。 In addition, if frequency-specific weighting is further applied to derive the quantized transform coefficients in the quantization process, scaling list data for the quantized transform coefficients may be generated. The scaling list data may include scaling list parameters used to derive the quantized transform coefficients. In this case, the encoding device may generate information related to the scaling list data, for example, may generate an APS including the scaling list data.

エンコード装置は、画像情報(または、ビデオ情報)をエンコードすることができる(S740)。ここで、画像情報は、前記レジデュアル情報を含むことができる。また、画像情報は、前記予測サンプルを導出するのに使用された前記予測と関連した情報(例えば、予測モード情報)を含むことができる。また、画像情報は、前記スケーリングリストデータに関する情報を含むことができる。すなわち、画像情報は、エンコード過程で導出される様々な情報を含むことができ、このような様々な情報を含んでエンコードされることができる。 The encoding device may encode image information (or video information) (S740). Here, the image information may include the residual information. The image information may also include information related to the prediction used to derive the prediction sample (e.g., prediction mode information). The image information may also include information related to the scaling list data. That is, the image information may include various information derived during the encoding process, and may be encoded including such various information.

一実施形態として、画像情報は、本文書において上述した実施形態(等)に係る様々な情報を含むことができ、上述した表1ないし47のうち、少なくとも1つに開示された情報を含むことができる。 In one embodiment, the image information may include various information related to the embodiments (etc.) described above in this document, and may include information disclosed in at least one of Tables 1 to 47 above.

また、例えば、画像情報は、APS(adaptation parameter set)を含むことができる。APSは、APS ID情報(APS識別情報)及びAPSタイプ情報(APSパラメータのタイプ情報)を含むことができる。すなわち、APS ID情報に基づいてAPSが識別され得るし、APSタイプ情報に基づいて当該タイプに対応するAPSパラメータがAPSに含まれ得る。例えば、APSタイプ情報は、ALF(adaptive loop filter)パラメータに関するALFタイプ、LMCS(luma mapping with chroma scaling)パラメータに関するLMCSタイプ、スケーリングリストデータパラメータに関するスケーリングリストタイプを含むことができる。上述した表35のように表すことができ、例えば、APSタイプ情報の値が2である場合、APSタイプ情報は、スケーリングリストデータパラメータを含むAPSであることを表すことができる。 For example, the image information may include an adaptation parameter set (APS). The APS may include APS ID information (APS identification information) and APS type information (APS parameter type information). That is, the APS may be identified based on the APS ID information, and APS parameters corresponding to the type may be included in the APS based on the APS type information. For example, the APS type information may include an ALF type related to an adaptive loop filter (ALF) parameter, an LMCS type related to a luma mapping with chroma scaling (LMCS) parameter, and a scaling list type related to a scaling list data parameter. It may be represented as in Table 35 above. For example, if the value of the APS type information is 2, the APS type information may indicate that the APS includes a scaling list data parameter.

一例として、APSは、上述した表33(または、表18)のように構成されることができる。APS ID情報(APS識別情報)は、前記表33及び表34(または、前記表18及び表19)で説明されたadaptation_parameter_set_idであることができる。APSタイプ情報は、前記表33ないし表35(または、前記表18ないし表20)で説明されたaps_params_typeであることができる。例えば、APSパラメータのタイプ情報(例:aps_params_type)がスケーリングリストデータを含むAPSであることを表すSCALING_APSタイプである場合(または、APSパラメータのタイプ情報(例:aps_params_type)の値が2である場合)、APSは、スケーリングリストデータ(例:scaling_list_data())を含むことができる。すなわち、エンコード装置は、スケーリングリストデータを含むAPSであることを表すSCALING_APSタイプ情報に基づいて、APSを介してスケーリングリストデータ(例:scaling_list_data())をシグナリングすることができる。すなわち、APSタイプ情報(SCALING_APSタイプ情報)に基づいてAPSにスケーリングリストデータが含まれ得る。スケーリングリストデータは、上述したように、量子化/逆量子化過程で使用されるスケーリングリスト/スケーリングマトリックス/スケールファクタを導出するためのスケーリングリストパラメータを含むことができる。言い換えれば、スケーリングリストデータは、スケーリングリストを構成するのに使用されるシンタックス要素を含むことができる。 As an example, the APS may be configured as shown in Table 33 (or Table 18) above. The APS ID information (APS identification information) may be the adaptation_parameter_set_id described in Tables 33 and 34 (or Tables 18 and 19). The APS type information may be the aps_params_type described in Tables 33 to 35 (or Tables 18 to 20). For example, if the type information of the APS parameter (e.g., aps_params_type) is a SCALING_APS type indicating that the APS includes scaling list data (or if the value of the type information of the APS parameter (e.g., aps_params_type) is 2), the APS may include scaling list data (e.g., scaling_list_data()). That is, the encoding device can signal scaling list data (e.g., scaling_list_data()) via the APS based on SCALING_APS type information indicating that the APS includes scaling list data. That is, scaling list data can be included in the APS based on the APS type information (SCALING_APS type information). As described above, the scaling list data can include scaling list parameters for deriving a scaling list/scaling matrix/scale factor used in the quantization/dequantization process. In other words, the scaling list data can include syntax elements used to configure a scaling list.

また、一例として、APS ID情報は、特定の範囲内の値を有することができる。例えば、APS ID情報の値は、0~3まで、または0~7までの特定の範囲内の値を有することができる。ただし、これは、例示として値を記載したものであり、APS ID情報の値の範囲は、他の値を有することができる。また、APS ID情報の値の範囲は、APSタイプ情報(例:aps_params_type)に基づいて決定されることができる。仮に、スケーリングリストデータに関するAPSであることを表すAPSタイプ情報(例:SCALING_APSタイプ)に対して、APS ID情報の値は、上述した表47のようなシンタックス要素(例:slice_scaling_list_aps_id)に基づいて表すことができる。例えば、APSタイプ情報(例:aps_params_type)がスケーリングリストデータを含むAPSであることを表す場合(例:SCALING_APSタイプである場合)、APS ID情報の値は、0~3、または0~7までの範囲内の値を有することができる。ここで、1つのピクチャ内のスライスは、スケーリングリストデータに関する同一のAPSを参照できる。または、APSタイプ情報(例:aps_params_type)がALFに関するAPSであることを表す場合(例:ALF_APSタイプである場合)、APS ID情報の値は、0~7までの範囲内の値を有することができる。または、APSタイプ情報(例:aps_params_type)がLMCSに関するAPSであることを表す場合(例:LMCS_APSタイプである場合)、APS ID情報の値は、0~3までの範囲内の値を有することができる。 Also, as an example, the APS ID information may have a value within a specific range. For example, the value of the APS ID information may have a value within a specific range from 0 to 3 or from 0 to 7. However, this is an example, and the value range of the APS ID information may have other values. Also, the value range of the APS ID information may be determined based on the APS type information (e.g., aps_params_type). For example, for APS type information (e.g., SCALING_APS type) that indicates that the APS is related to scaling list data, the value of the APS ID information may be expressed based on a syntax element (e.g., slice_scaling_list_aps_id) as shown in Table 47 above. For example, if the APS type information (e.g., aps_params_type) indicates that the APS includes scaling list data (e.g., SCALING_APS type), the value of the APS ID information may have a value within a range from 0 to 3 or from 0 to 7. Here, slices in one picture can refer to the same APS for the scaling list data. Alternatively, if the APS type information (e.g., aps_params_type) indicates that the APS is related to ALF (e.g., ALF_APS type), the value of the APS ID information can have a value in the range from 0 to 7. Alternatively, if the APS type information (e.g., aps_params_type) indicates that the APS is related to LMCS (e.g., LMCS_APS type), the value of the APS ID information can have a value in the range from 0 to 3.

また、例えば、画像情報は、SPS(Sequence Parameter Set)を含むことができる。SPSは、スケーリングリストデータの可用可否を表す第1の可用フラグ情報を含むことができる。一例として、SPSは、上述した表36(または、表21)のように構成されることができ、第1の可用フラグ情報は、前記表36及び表37(または、前記表21及び表22)で説明されたscaling_list_enabled_flagであることができる。また、SPSは、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないようにすることができる。sps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がSPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてSPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、SPSレベルでは、スケーリングリストデータを直接シグナリングせずに、スケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングするように構成されることができる。 Also, for example, the image information may include a Sequence Parameter Set (SPS). The SPS may include first availability flag information indicating whether the scaling list data is available. As an example, the SPS may be configured as shown in Table 36 (or Table 21) above, and the first availability flag information may be the scaling_list_enabled_flag described in Tables 36 and 37 (or Tables 21 and 22). Also, the SPS may prevent this flag information from being parsed/signaled by removing the sps_scaling_list_data_present_flag syntax element. The sps_scaling_list_data_present_flag syntax element is flag information indicating whether or not the syntax structure of the scaling list data exists in the SPS, and the scaling list data specified by the SPS can be parsed/signaled according to this flag information. However, by removing the sps_scaling_list_data_present_flag syntax element, the SPS level can be configured to explicitly signal only the scaling list available flag (scaling_list_enabled_flag) without directly signaling the scaling list data.

また、例えば、画像情報は、PPS(Picture ParameterSet)を含むことができる。一例として、PPSは、上述した表38のように構成されることができ、この場合、PPSには、スケーリングリストデータの可用可否を表す可用フラグ情報を含まないように構成されることができる。すなわち、PPSでpps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないように構成されることができる。pps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がPPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてPPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、pps_scaling_list_data_present_flagシンタックス要素を除去することにより、PPSレベルでは、スケーリングリストデータを直接シグナリングしないことができる。 Also, for example, the image information may include a PPS (Picture Parameter Set). As an example, the PPS may be configured as shown in Table 38 above, and in this case, the PPS may be configured not to include availability flag information indicating whether the scaling list data is available. That is, the PPS may be configured not to parse/signal this flag information by removing the pps_scaling_list_data_present_flag syntax element. The pps_scaling_list_data_present_flag syntax element is flag information indicating whether the syntax structure of the scaling list data is present in the PPS, and the scaling list data specified by the PPS may be parsed/signaled according to this flag information. However, by removing the pps_scaling_list_data_present_flag syntax element, the scaling list data may not be directly signaled at the PPS level.

この場合、スケーリングリストデータの可用可否を表す第1の可用フラグ情報(例:scaling_list_enabled_flag)は、SPSでシグナリングされ、PPSでシグナリングされないことができる。したがって、SPSでシグナリングされる第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、APSに含まれたスケーリングリストデータが取得され得る。 In this case, the first availability flag information (e.g., scaling_list_enabled_flag) indicating the availability of the scaling list data may be signaled in the SPS and not signaled in the PPS. Therefore, based on the first availability flag information signaled in the SPS (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the scaling list data included in the APS may be obtained.

また、例えば、画像情報は、ヘッダ情報を含むことができる。ヘッダ情報は、現在ブロックを含むスライスまたはピクチャに関連したヘッダ情報であることができ、例えば、ピクチャヘッダまたはスライスヘッダを含むことができる。ヘッダ情報は、スケーリングリストデータ関連APS識別情報を含むことができる。ヘッダ情報に含まれたスケーリングリストデータ関連APS識別情報は、スケーリングリストデータを含んでいるAPSに対するAPS ID情報を表すことができる。一例として、ヘッダ情報に含まれたスケーリングリストデータ関連APS ID情報は、前記表40ないし表41(または、前記表25ないし表28)で説明されたslice_scaling_list_aps_idであることができ、現在ブロックを含むスライス/ピクチャにより参照されるAPS(スケーリングリストデータを含む;すなわち、SCALING LIST APS)に対する識別情報であることができる。すなわち、ヘッダ情報のスケーリングリストデータ関連APS ID情報(例えば、slice_scaling_list_aps_id)に基づいて、スケーリングリストデータを含むAPSが識別され得る。 Also, for example, the image information may include header information. The header information may be header information related to a slice or picture including the current block, and may include, for example, a picture header or a slice header. The header information may include scaling list data related APS identification information. The scaling list data related APS identification information included in the header information may represent APS ID information for an APS including scaling list data. As an example, the scaling list data related APS ID information included in the header information may be slice_scaling_list_aps_id described in Tables 40 to 41 (or Tables 25 to 28), and may be identification information for an APS (including scaling list data; i.e., SCALING LIST APS) referenced by a slice/picture including the current block. That is, an APS including scaling list data may be identified based on the scaling list data related APS ID information (e.g., slice_scaling_list_aps_id) of the header information.

このとき、ヘッダ情報がスケーリングリストデータを含んでいるAPSに対するAPS ID情報をパーシング/シグナリングするか否かは、SPSでパーシング/シグナリングされる第1の可用フラグ情報(scaling_list_enabled_flag)に基づいて決定されることができる。例えば、SPSでのスケーリングリストが可用であることを表す第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、ヘッダ情報は、スケーリングリストデータを含んでいるAPSに対するAPS ID情報を含むことができる。 In this case, whether the header information parses/signals the APS ID information for the APS including the scaling list data can be determined based on the first availability flag information (scaling_list_enabled_flag) parsed/signaled in the SPS. For example, based on the first availability flag information indicating that the scaling list in the SPS is available (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the header information can include the APS ID information for the APS including the scaling list data.

また、例えば、ヘッダ情報は、ピクチャまたはスライスでのスケーリングリストデータの可用可否を表す第2の可用フラグ情報を含むことができる。一例として、第2の可用フラグ情報は、前記表40及び表41(または、前記表25ないし表28)で説明されたslice_scaling_list_present_flag(または、slice_scaling_list_enabled_flag)であることができる。 For example, the header information may also include second availability flag information indicating whether scaling list data is available in a picture or slice. As an example, the second availability flag information may be slice_scaling_list_present_flag (or slice_scaling_list_enabled_flag) described in Tables 40 and 41 (or Tables 25 to 28).

このとき、ヘッダ情報が第2の可用フラグ情報をパーシング/シグナリングするか否かは、SPSでパーシング/シグナリングされる第1の可用フラグ情報(scaling_list_enabled_flag)に基づいて決定されることができる。例えば、SPSでのスケーリングリストが可用であることを表す第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、ヘッダ情報は、第2の可用フラグ情報を含むことができる。そして、第2の可用フラグ情報に基づいて(例:第2の可用フラグ情報(例:slice_scaling_list_present_flag)の値が1または真である場合)、ヘッダ情報は、スケーリングリストデータ関連APS ID情報を含むことができる。 In this case, whether the header information parses/signals the second availability flag information can be determined based on the first availability flag information (scaling_list_enabled_flag) parsed/signaled in the SPS. For example, based on the first availability flag information indicating that the scaling list in the SPS is available (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the header information can include the second availability flag information. And based on the second availability flag information (e.g., when the value of the second availability flag information (e.g., slice_scaling_list_present_flag) is 1 or true), the header information can include scaling list data related APS ID information.

一例として、エンコード装置は、上述した表40のように、SPSでシグナリングされる第1の可用フラグ情報(例:scaling_list_enabled_flag)に基づいてヘッダ情報を介して第2の可用フラグ情報(例:slice_scaling_list_present_flag)をシグナリングすることができ、その後、第2の可用フラグ情報(例:slice_scaling_list_present_flag)に基づいてヘッダ情報を介してスケーリングリストデータを含むAPSに対するAPS ID情報(例:slice_scaling_list_aps_id)をシグナリングすることができる。そして、エンコード装置は、シグナリングされた前記APS ID情報(例:slice_scaling_list_aps_id)が指示するAPSからスケーリングリストデータをシグナリングすることができる。 As an example, the encoding device may signal second availability flag information (e.g., slice_scaling_list_present_flag) via header information based on the first availability flag information (e.g., scaling_list_enabled_flag) signaled in the SPS as shown in Table 40 above, and then signal APS ID information (e.g., slice_scaling_list_aps_id) for the APS including the scaling list data via header information based on the second availability flag information (e.g., slice_scaling_list_present_flag). Then, the encoding device may signal scaling list data from the APS indicated by the signaled APS ID information (e.g., slice_scaling_list_aps_id).

上述したように、SPSまたはPPSレベルで直接的にスケーリングリストデータシンタックスをシグナリングしないようにSPSシンタックスとPPSシンタックスとを構成できる。例えば、SPSでスケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングし、以後SPSでの可用フラグ(scaling_list_enabled_flag)に基づいて下位レベルシンタックス(例:APS)で個別的にスケーリングリスト(scaling_list_data())をパーシングすることができる。したがって、本文書の一実施形態によれば、スケーリングリストデータが階層的構造によってパーシング/シグナリングされることができるので、よりコーディング効率を向上させることができる。 As described above, the SPS syntax and the PPS syntax can be configured so that the scaling list data syntax is not directly signaled at the SPS or PPS level. For example, only the scaling list availability flag (scaling_list_enabled_flag) can be explicitly signaled in the SPS, and the scaling list (scaling_list_data()) can then be parsed individually in a lower level syntax (e.g., APS) based on the availability flag (scaling_list_enabled_flag) in the SPS. Therefore, according to one embodiment of this document, the scaling list data can be parsed/signaled according to a hierarchical structure, thereby improving coding efficiency.

上述したような様々な情報を含む画像情報は、エンコードされてビットストリーム形態で出力されることができる。ビットストリームは、ネットワークまたは(デジタル)格納媒体を介してデコード装置に送信されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、様々な格納媒体を含むことができる。 Image information including the various information as described above can be encoded and output in the form of a bitstream. The bitstream can be transmitted to a decoding device via a network or a (digital) storage medium. Here, the network can include a broadcasting network and/or a communication network, and the digital storage medium can include various storage media such as USB, SD, CD, DVD, Blu-ray, HDD, SSD, etc.

図9及び図10は、本文書の実施形態(等)に係るビデオ/画像デコード方法及び関連コンポーネントの一例を概略的に示す。 Figures 9 and 10 show a schematic diagram of an example of a video/image decoding method and associated components according to an embodiment (etc.) of this document.

図9に開示された方法は、図3において開示されたデコード装置300によって行われることができる。具体的に、図9のステップS900~S910は、図3に開示されたエントロピーデコード部310によって行われることができ、図9のステップS920は、図3に開示された逆量子化部321によって行われることができ、図9のステップS930は、図3に開示された逆変換部321によって行われることができ、図9のステップS940は、図3に開示された加算部340によって行われることができる。また、図9において開示された方法は、本文書において上述した実施形態を含んで行われることができる。したがって、図9では、上述した実施形態と重複する内容に関して具体的な説明を省略するか、簡単にする。 The method disclosed in FIG. 9 may be performed by the decoding device 300 disclosed in FIG. 3. Specifically, steps S900 to S910 in FIG. 9 may be performed by the entropy decoding unit 310 disclosed in FIG. 3, step S920 in FIG. 9 may be performed by the inverse quantization unit 321 disclosed in FIG. 3, step S930 in FIG. 9 may be performed by the inverse transform unit 321 disclosed in FIG. 3, and step S940 in FIG. 9 may be performed by the addition unit 340 disclosed in FIG. 3. In addition, the method disclosed in FIG. 9 may be performed including the embodiments described above in this document. Therefore, in FIG. 9, detailed descriptions of contents that overlap with the above-described embodiments are omitted or simplified.

図9に示すように、デコード装置は、ビットストリームから画像情報(または、ビデオ情報)を受信できる(S900)。 As shown in FIG. 9, the decoding device can receive image information (or video information) from a bitstream (S900).

一実施形態として、デコード装置は、ビットストリームをパーシングして画像復元(または、ピクチャ復元)に必要な情報(ex.ビデオ/画像情報)を導出できる。このとき、画像情報は、レジデュアル情報を含むことができ、レジデュアル情報は、量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。また、画像情報は、予測と関連した情報(例えば、予測モード情報)を含むことができる。また、画像情報は、スケーリングリストデータに関する情報を含むことができる。すなわち、画像情報は、デコード過程で必要な様々な情報を含むことができ、指数ゴロム符号化、CAVLC、またはCABACなどのコーディング方法を基にデコードされることができる。 In one embodiment, the decoding device may derive information (e.g., video/image information) required for image restoration (or picture restoration) by parsing the bitstream. In this case, the image information may include residual information, and the residual information may include information such as value information of quantized transform coefficients, position information, transform technique, transform kernel, and quantization parameter. The image information may also include information related to prediction (e.g., prediction mode information). The image information may also include information related to scaling list data. That is, the image information may include various information required in the decoding process, and may be decoded based on a coding method such as exponential-Golomb coding, CAVLC, or CABAC.

一実施形態として、画像情報は、本文書において上述した実施形態(等)に係る様々な情報を含むことができ、上述した表1ないし47のうち、少なくとも1つに開示された情報を含むことができる。 In one embodiment, the image information may include various information related to the embodiments (etc.) described above in this document, and may include information disclosed in at least one of Tables 1 to 47 above.

例えば、画像情報は、APS(adaptation parameter set)を含むことができる。APSは、APS ID情報(APS識別情報)及びAPSタイプ情報(APSパラメータのタイプ情報)を含むことができる。すなわち、APS ID情報に基づいてAPSが識別され得るし、APSタイプ情報に基づいて当該タイプに対応するAPSパラメータがAPSに含まれ得る。例えば、APSタイプ情報は、ALF(adaptive loop filter)パラメータに関するALFタイプ、LMCS(luma mapping with chroma scaling)パラメータに関するLMCSタイプ、スケーリングリストデータパラメータに関するスケーリングリストタイプを含むことができる。上述した表35のように表すことができ、例えば、APSタイプ情報の値が2である場合、APSタイプ情報は、スケーリングリストデータパラメータを含むAPSであることを表すことができる。 For example, the image information may include an adaptation parameter set (APS). The APS may include APS ID information (APS identification information) and APS type information (APS parameter type information). That is, the APS may be identified based on the APS ID information, and APS parameters corresponding to the type may be included in the APS based on the APS type information. For example, the APS type information may include an ALF type related to an adaptive loop filter (ALF) parameter, an LMCS type related to a luma mapping with chroma scaling (LMCS) parameter, and a scaling list type related to a scaling list data parameter. It may be represented as in Table 35 above. For example, if the value of the APS type information is 2, the APS type information may indicate that the APS includes a scaling list data parameter.

一例として、APSは、上述した表33(または、表18)のように構成されることができる。APS ID情報(APS識別情報)は、前記表33及び表34(または、前記表18及び表19)で説明されたadaptation_parameter_set_idであることができる。APSタイプ情報は、前記表33ないし表35(または、前記表18ないし表20)で説明されたaps_params_typeであることができる。例えば、APSパラメータのタイプ情報(例:aps_params_type)がスケーリングリストデータを含むAPSであることを表すSCALING_APSタイプである場合(または、APSパラメータのタイプ情報(例:aps_params_type)の値が2である場合)、APSは、スケーリングリストデータ(例:scaling_list_data())を含むことができる。すなわち、デコード装置は、スケーリングリストデータを含むAPSであることを表すSCALING_APSタイプ情報に基づいて、APSを介してスケーリングリストデータ(例:scaling_list_data())を取得してパーシングすることができる。すなわち、APSタイプ情報(SCALING_APSタイプ情報)に基づいてAPSにスケーリングリストデータが含まれ得る。スケーリングリストデータは、上述したように、量子化/逆量子化過程で使用されるスケーリングリスト/スケーリングマトリックス/スケールファクタを導出するためのスケーリングリストパラメータを含むことができる。言い換えれば、スケーリングリストデータは、スケーリングリストを構成するのに使用されるシンタックス要素を含むことができる。 As an example, the APS may be configured as shown in Table 33 (or Table 18) above. The APS ID information (APS identification information) may be the adaptation_parameter_set_id described in Tables 33 and 34 (or Tables 18 and 19). The APS type information may be the aps_params_type described in Tables 33 to 35 (or Tables 18 to 20). For example, if the type information of the APS parameter (e.g., aps_params_type) is a SCALING_APS type indicating that the APS includes scaling list data (or if the value of the type information of the APS parameter (e.g., aps_params_type) is 2), the APS may include scaling list data (e.g., scaling_list_data()). That is, the decoding device can obtain and parse the scaling list data (e.g., scaling_list_data()) through the APS based on the SCALING_APS type information indicating that the APS includes scaling list data. That is, the APS can include scaling list data based on the APS type information (SCALING_APS type information). As described above, the scaling list data can include scaling list parameters for deriving a scaling list/scaling matrix/scale factor used in the quantization/dequantization process. In other words, the scaling list data can include syntax elements used to configure a scaling list.

また、一例として、APS ID情報は、特定の範囲内の値を有することができる。例えば、APS ID情報の値は、0~3まで、または0~7までの特定の範囲内の値を有することができる。ただし、これは例示として値を記載しただけであり、APS ID情報の値の範囲は、他の値を有することができる。また、APS ID情報の値の範囲は、APSタイプ情報(例:aps_params_type)に基づいて決定されることができる。仮に、スケーリングリストデータに関するAPSであることを表すAPSタイプ情報(例:SCALING_APSタイプ)に対して、APS ID情報の値は、上述した表47のようなシンタックス要素(例:slice_scaling_list_aps_id)に基づいて表すことができる。例えば、APSタイプ情報(例:aps_params_type)がスケーリングリストデータを含むAPSであることを表す場合(例:SCALING_APSタイプである場合)、APS ID情報の値は、0~3、または0~7までの範囲内の値を有することができる。ここで、1つのピクチャ内のスライスは、スケーリングリストデータに関する同一のAPSを参照できる。または、APSタイプ情報(例:aps_params_type)がALFに関するAPSであることを表す場合(例:ALF_APSタイプである場合)、APS ID情報の値は、0~7までの範囲内の値を有することができる。または、APSタイプ情報(例:aps_params_type)がLMCSに関するAPSであることを表す場合(例:LMCS_APSタイプである場合)、APS ID情報の値は、0~3までの範囲内の値を有することができる。 Also, as an example, the APS ID information may have a value within a specific range. For example, the value of the APS ID information may have a value within a specific range from 0 to 3 or from 0 to 7. However, this is only an example, and the value range of the APS ID information may have other values. Also, the value range of the APS ID information may be determined based on the APS type information (e.g., aps_params_type). For example, for APS type information (e.g., SCALING_APS type) that indicates that the APS is related to scaling list data, the value of the APS ID information may be expressed based on a syntax element (e.g., slice_scaling_list_aps_id) as shown in Table 47 above. For example, if the APS type information (e.g., aps_params_type) indicates that the APS includes scaling list data (e.g., SCALING_APS type), the value of the APS ID information may have a value within a range from 0 to 3 or from 0 to 7. Here, slices in one picture can refer to the same APS for the scaling list data. Alternatively, if the APS type information (e.g., aps_params_type) indicates that the APS is related to ALF (e.g., ALF_APS type), the value of the APS ID information can have a value in the range from 0 to 7. Alternatively, if the APS type information (e.g., aps_params_type) indicates that the APS is related to LMCS (e.g., LMCS_APS type), the value of the APS ID information can have a value in the range from 0 to 3.

また、例えば、画像情報は、SPS(Sequence Parameter Set)を含むことができる。SPSは、スケーリングリストデータの可用可否を表す第1の可用フラグ情報を含むことができる。一例として、SPSは、上述した表36(または、表21)のように構成されることができ、第1の可用フラグ情報は、前記表36及び表37(または、前記表21及び表22)で説明されたscaling_list_enabled_flagであることができる。また、SPSは、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないようにすることができる。sps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がSPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてSPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、sps_scaling_list_data_present_flagシンタックス要素を除去することにより、SPSレベルでは、スケーリングリストデータを直接シグナリングせずに、スケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングするように構成されることができる。 Also, for example, the image information may include a Sequence Parameter Set (SPS). The SPS may include first availability flag information indicating whether the scaling list data is available. As an example, the SPS may be configured as shown in Table 36 (or Table 21) above, and the first availability flag information may be the scaling_list_enabled_flag described in Tables 36 and 37 (or Tables 21 and 22). Also, the SPS may prevent this flag information from being parsed/signaled by removing the sps_scaling_list_data_present_flag syntax element. The sps_scaling_list_data_present_flag syntax element is flag information indicating whether or not the syntax structure of the scaling list data exists in the SPS, and the scaling list data specified by the SPS can be parsed/signaled according to this flag information. However, by removing the sps_scaling_list_data_present_flag syntax element, the SPS level can be configured to explicitly signal only the scaling list available flag (scaling_list_enabled_flag) without directly signaling the scaling list data.

また、例えば、画像情報は、PPS(Picture ParameterSet)を含むことができる。一例として、PPSは、上述した表38のように構成されることができ、この場合、PPSには、スケーリングリストデータの可用可否を表す可用フラグ情報を含まないように構成されることができる。すなわち、PPSでpps_scaling_list_data_present_flagシンタックス要素を除去することにより、このフラグ情報がパーシング/シグナリングされないように構成することができる。pps_scaling_list_data_present_flagシンタックス要素は、スケーリングリストデータのシンタックス構造がPPSに存在するか否かを表すフラグ情報であり、このフラグ情報に応じてPPSにより指定されたスケーリングリストデータをパーシング/シグナリングすることができる。しかし、pps_scaling_list_data_present_flagシンタックス要素を除去することにより、PPSレベルでは、スケーリングリストデータを直接シグナリングしないことができる。 Also, for example, the image information may include a PPS (Picture Parameter Set). As an example, the PPS may be configured as shown in Table 38 above, and in this case, the PPS may be configured not to include availability flag information indicating whether the scaling list data is available. That is, by removing the pps_scaling_list_data_present_flag syntax element in the PPS, this flag information may be configured not to be parsed/signaled. The pps_scaling_list_data_present_flag syntax element is flag information indicating whether the syntax structure of the scaling list data is present in the PPS, and the scaling list data specified by the PPS may be parsed/signaled according to this flag information. However, by removing the pps_scaling_list_data_present_flag syntax element, the scaling list data may not be directly signaled at the PPS level.

この場合、スケーリングリストデータの可用可否を表す第1の可用フラグ情報(例:scaling_list_enabled_flag)は、SPSでシグナリングされ、PPSでシグナリングされないことができる。したがって、SPSでシグナリングされる第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、APSに含まれたスケーリングリストデータが取得され得る。 In this case, the first availability flag information (e.g., scaling_list_enabled_flag) indicating the availability of the scaling list data may be signaled in the SPS and not signaled in the PPS. Therefore, based on the first availability flag information signaled in the SPS (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the scaling list data included in the APS may be obtained.

また、例えば、画像情報は、ヘッダ情報を含むことができる。ヘッダ情報は、現在ブロックを含むスライスまたはピクチャに関連したヘッダ情報であることができ、例えば、ピクチャヘッダまたはスライスヘッダを含むことができる。ヘッダ情報は、スケーリングリストデータ関連APS識別情報を含むことができる。ヘッダ情報に含まれたスケーリングリストデータ関連APS識別情報は、スケーリングリストデータを含んでいるAPSに対するAPS ID情報を表すことができる。一例として、ヘッダ情報に含まれたスケーリングリストデータ関連APS ID情報は、前記表40ないし表41(または、前記表25ないし表28)で説明されたslice_scaling_list_aps_idであることができ、現在ブロックを含むスライス/ピクチャにより参照されるAPS(スケーリングリストデータを含む;すなわち、SCALING LIST APS)に対する識別情報であることができる。すなわち、ヘッダ情報のスケーリングリストデータ関連APS ID情報(例えば、slice_scaling_list_aps_id)に基づいて、スケーリングリストデータを含むAPSが識別され得る。すなわち、デコード装置は、ヘッダ情報の前記APS ID情報(例:slice_scaling_list_aps_id)に基づいてAPSを識別し、前記APSからスケーリングリストデータを取得できる。 Also, for example, the image information may include header information. The header information may be header information related to a slice or picture including the current block, and may include, for example, a picture header or a slice header. The header information may include scaling list data related APS identification information. The scaling list data related APS identification information included in the header information may represent APS ID information for an APS including scaling list data. As an example, the scaling list data related APS ID information included in the header information may be slice_scaling_list_aps_id described in Tables 40 to 41 (or Tables 25 to 28), and may be identification information for an APS (including scaling list data; i.e., SCALING LIST APS) referenced by a slice/picture including the current block. That is, an APS including scaling list data may be identified based on the scaling list data related APS ID information (e.g., slice_scaling_list_aps_id) of the header information. That is, the decoding device can identify the APS based on the APS ID information (e.g., slice_scaling_list_aps_id) in the header information and obtain the scaling list data from the APS.

このとき、ヘッダ情報がスケーリングリストデータを含んでいるAPSに対するAPS ID情報をパーシング/シグナリングするか否かは、SPSでパーシング/シグナリングされる第1の可用フラグ情報(scaling_list_enabled_flag)に基づいて決定されることができる。例えば、SPSでのスケーリングリストが可用であることを表す第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、ヘッダ情報は、スケーリングリストデータを含んでいるAPSに対するAPS ID情報を含むことができる。 In this case, whether the header information parses/signals the APS ID information for the APS including the scaling list data can be determined based on the first availability flag information (scaling_list_enabled_flag) parsed/signaled in the SPS. For example, based on the first availability flag information indicating that the scaling list in the SPS is available (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the header information can include the APS ID information for the APS including the scaling list data.

また、例えば、ヘッダ情報は、ピクチャまたはスライスでのスケーリングリストデータの可用可否を表す第2の可用フラグ情報を含むことができる。一例として、第2の可用フラグ情報は。前記表40及び表41(または、前記表25ないし表28)で説明されたslice_scaling_list_present_flag(または、slice_scaling_list_enabled_flag)であることができる。 For example, the header information may also include second availability flag information indicating whether scaling list data is available in a picture or slice. As an example, the second availability flag information may be slice_scaling_list_present_flag (or slice_scaling_list_enabled_flag) described in Tables 40 and 41 (or Tables 25 to 28).

このとき、ヘッダ情報が第2の可用フラグ情報をパーシング/シグナリングするか否かは、SPSでパーシング/シグナリングされる第1の可用フラグ情報(scaling_list_enabled_flag)に基づいて決定されることができる。例えば、SPSでのスケーリングリストが可用であることを表す第1の可用フラグ情報に基づいて(例:第1の可用フラグ情報(例:scaling_list_enabled_flag)の値が1または真である場合)、ヘッダ情報は、第2の可用フラグ情報を含むことができる。そして、第2の可用フラグ情報に基づいて(例:第2の可用フラグ情報(例:slice_scaling_list_present_flag)の値が1または真である場合)、ヘッダ情報は、スケーリングリストデータを含んでいるAPSに対するAPS ID情報を含むことができる。 In this case, whether the header information parses/signals the second availability flag information can be determined based on the first availability flag information (scaling_list_enabled_flag) parsed/signaled in the SPS. For example, based on the first availability flag information indicating that the scaling list in the SPS is available (e.g., when the value of the first availability flag information (e.g., scaling_list_enabled_flag) is 1 or true), the header information can include the second availability flag information. And, based on the second availability flag information (e.g., when the value of the second availability flag information (e.g., slice_scaling_list_present_flag) is 1 or true), the header information can include APS ID information for the APS including the scaling list data.

一例として、デコード装置は、上述した表40(または、表25)のように、SPSでシグナリングされる第1の可用フラグ情報(例:scaling_list_enabled_flag)に基づいてヘッダ情報を介して第2の可用フラグ情報(例:slice_scaling_list_present_flag)を取得でき、その後、第2の可用フラグ情報(例:slice_scaling_list_present_flag)に基づいてヘッダ情報を介してスケーリングリストデータを含むAPSに対するAPS ID情報(例:slice_scaling_list_aps_id)を取得できる。そして、デコード装置は、ヘッダ情報を介して取得された前記APS ID情報(例:slice_scaling_list_aps_id)が指示するAPSからスケーリングリストデータを取得できる。 As an example, the decoding device can acquire second availability flag information (e.g., slice_scaling_list_present_flag) via header information based on the first availability flag information (e.g., scaling_list_enabled_flag) signaled in the SPS, as shown in Table 40 (or Table 25) above, and then acquire APS ID information (e.g., slice_scaling_list_aps_id) for the APS including the scaling list data via header information based on the second availability flag information (e.g., slice_scaling_list_present_flag). Then, the decoding device can acquire scaling list data from the APS indicated by the APS ID information (e.g., slice_scaling_list_aps_id) acquired via the header information.

上述したように、SPSまたはPPSレベルで直接的にスケーリングリストデータシンタックスをシグナリングしないようにSPSシンタックスとPPSシンタックスとを構成できる。例えば、SPSでスケーリングリスト可用フラグ(scaling_list_enabled_flag)のみ明示的にシグナリングし、以後SPSでの可用フラグ(scaling_list_enabled_flag)に基づいて下位レベルシンタックス(例:APS)で個別的にスケーリングリスト(scaling_list_data())をパーシングすることができる。したがって、本文書の一実施形態によれば、スケーリングリストデータが階層的構造によってパーシング/シグナリングされることができるので、よりコーディング効率を向上させることができる。 As described above, the SPS syntax and the PPS syntax can be configured so that the scaling list data syntax is not directly signaled at the SPS or PPS level. For example, only the scaling list availability flag (scaling_list_enabled_flag) can be explicitly signaled in the SPS, and the scaling list (scaling_list_data()) can then be parsed individually in a lower level syntax (e.g., APS) based on the availability flag (scaling_list_enabled_flag) in the SPS. Therefore, according to one embodiment of this document, the scaling list data can be parsed/signaled according to a hierarchical structure, thereby improving coding efficiency.

デコード装置は、レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出できる(S910)。 The decoding device can derive quantized transform coefficients for the current block based on the residual information (S910).

一実施形態として、デコード装置は、画像情報に含まれたレジデュアル情報を取得できる。レジデュアル情報は、上述したように、量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、レジデュアル情報に含まれた量子化された変換係数情報に基づいて現在ブロックに対する量子化された変換係数を導出できる。 In one embodiment, the decoding device may obtain residual information included in the image information. As described above, the residual information may include information such as value information of the quantized transform coefficients, position information, a transform technique, a transform kernel, and a quantization parameter. The decoding device may derive quantized transform coefficients for the current block based on the quantized transform coefficient information included in the residual information.

デコード装置は、量子化された変換係数に基づいて変換係数を導出できる(S920)。 The decoding device can derive the transform coefficients based on the quantized transform coefficients (S920).

一実施形態として、デコード装置は、量子化された変換係数に対する逆量子化過程を適用して変換係数を導出できる。このとき、デコード装置は、周波数によって量子化強度を調節する周波数別加重量子化を適用できる。この場合、逆量子化過程は、周波数別量子化スケール値に基づいてさらに行われることができる。周波数別加重量子化のための量子化スケール値は、スケーリングマトリックスを使用して導出されることができる。例えば、デコード装置は、予め定義されたスケーリングマトリックスを使用することができ、エンコード装置からシグナリングされるスケーリングマトリックスに対する周波数別量子化スケール情報を使用することもできる。周波数別量子化スケール情報は、スケーリングリストデータを含むことができる。スケーリングリストデータに基づいて(修正された)スケーリングマトリックスが導出され得る。 In one embodiment, the decoding device may derive transform coefficients by applying an inverse quantization process to the quantized transform coefficients. In this case, the decoding device may apply frequency-specific weighting, which adjusts the quantization strength according to the frequency. In this case, the inverse quantization process may be further performed based on the frequency-specific quantization scale value. The quantization scale value for the frequency-specific weighting may be derived using a scaling matrix. For example, the decoding device may use a predefined scaling matrix, or may use frequency-specific quantization scale information for the scaling matrix signaled from the encoding device. The frequency-specific quantization scale information may include scaling list data. A (modified) scaling matrix may be derived based on the scaling list data.

すなわち、デコード装置は、逆量子化過程を行うにあたり、周波数別加重量子化をさらに適用することができる。このとき、デコード装置は、スケーリングリストデータに基づいて量子化された変換係数に対する逆量子化過程を適用して変換係数を導出できる。 That is, the decoding device can further apply frequency-specific weighting when performing the inverse quantization process. In this case, the decoding device can derive the transform coefficients by applying the inverse quantization process to the quantized transform coefficients based on the scaling list data.

一実施形態として、デコード装置は、画像情報に含まれたAPSを取得でき、APSに含まれたAPSタイプ情報に基づいてスケーリングリストデータを取得できる。例えば、デコード装置は、スケーリングリストデータを含むAPSであることを表すSCALING_APSタイプ情報に基づいて、APSに含まれたスケーリングリストデータを取得できる。この場合、デコード装置は、スケーリングリストデータに基づいてスケーリングマトリックスを導出でき、スケーリングマトリックスに基づいてスケーリングファクタを導出でき、スケーリングファクタに基づいて逆量子化を適用して変換係数を導出できる。このようなスケーリングリストデータに基づいてスケーリングを行う過程は、表5ないし表17を例に挙げて具体的に説明したことがあるので、本実施形態では、重複的な内容や具体的な説明を省略する。 In one embodiment, the decoding device can obtain the APS included in the image information, and can obtain the scaling list data based on the APS type information included in the APS. For example, the decoding device can obtain the scaling list data included in the APS based on SCALING_APS type information indicating that the APS includes scaling list data. In this case, the decoding device can derive a scaling matrix based on the scaling list data, derive a scaling factor based on the scaling matrix, and derive a transform coefficient by applying inverse quantization based on the scaling factor. The process of performing scaling based on such scaling list data has been described in detail using Tables 5 to 17 as examples, so duplicate content and detailed description will be omitted in this embodiment.

また、デコード装置は、逆量子化過程で周波数別加重量子化を適用するか否か(すなわち、逆量子化過程で(周波数に基づく量子化)スケーリングリストを使用して変換係数を導出するか否か)を判断できる。例えば、デコード装置は、画像情報に含まれたSPSから取得された第1の可用フラグ及び/又は画像情報に含まれたヘッダ情報から取得された第2の可用フラグ情報に基づいて、スケーリングリストデータの使用可否を決定できる。仮に、第1の可用フラグ及び/又は第2の可用フラグ情報に基づいてスケーリングリストデータを使用することと決定された場合、デコード装置は、ヘッダ情報を介してスケーリングリストデータを含むAPSに対するAPS ID情報を取得し、前記APS ID情報に基づいて当該APSを識別し、前記識別されたAPSからスケーリングリストデータを取得できる。 The decoding device may also determine whether to apply frequency-specific weighting in the inverse quantization process (i.e., whether to derive transform coefficients using a (frequency-based quantization) scaling list in the inverse quantization process). For example, the decoding device may determine whether to use scaling list data based on a first availability flag obtained from an SPS included in the image information and/or second availability flag information obtained from header information included in the image information. If it is determined to use scaling list data based on the first availability flag and/or second availability flag information, the decoding device may obtain APS ID information for an APS including scaling list data via header information, identify the APS based on the APS ID information, and obtain scaling list data from the identified APS.

デコード装置は、変換係数に基づいてレジデュアルサンプルを導出できる(S930)。 The decoding device can derive residual samples based on the transform coefficients (S930).

一実施形態として、デコード装置は、現在ブロックに対する変換係数に対して逆変換を行って現在ブロックのレジデュアルサンプルを導出できる。このとき、デコード装置は、現在ブロックに対して逆変換を適用するか否かを表す情報(すなわち、変換スキップフラグ情報)を取得し、この情報(すなわち、変換スキップフラグ情報)に基づいてレジデュアルサンプルを導出できる。 In one embodiment, the decoding device may perform an inverse transform on transform coefficients for a current block to derive a residual sample for the current block. In this case, the decoding device may obtain information indicating whether to apply an inverse transform to the current block (i.e., transform skip flag information), and may derive a residual sample based on this information (i.e., transform skip flag information).

例えば、変換係数に対して逆変換が適用されない場合(現在ブロックに対して変換スキップフラグ情報の値が1である場合)、デコード装置は、変換係数を現在ブロックのレジデュアルサンプルで導出することができる。または、変換係数に対して逆変換が適用される場合(現在ブロックに対して変換スキップフラグ情報の値が0である場合)、デコード装置は、変換係数に対して逆変換して現在ブロックのレジデュアルサンプルを導出できる。 For example, if an inverse transform is not applied to the transform coefficients (if the value of the transform skip flag information for the current block is 1), the decoding device may derive the transform coefficients from the residual samples of the current block. Alternatively, if an inverse transform is applied to the transform coefficients (if the value of the transform skip flag information for the current block is 0), the decoding device may perform an inverse transform on the transform coefficients to derive the residual samples of the current block.

デコード装置は、レジデュアルサンプルに基づいて復元サンプルを生成できる(S940)。 The decoding device can generate reconstructed samples based on the residual samples (S940).

一実施形態として、デコード装置は、画像情報に含まれた予測情報(例えば、予測モード情報)に基づいて現在ブロックに対するインター予測を行うか、またはイントラ予測を行うかの可否を決定でき、前記決定によって予測を行って現在ブロックに対する予測サンプルを導出できる。そして、デコード装置は、予測サンプルとレジデュアルサンプルとに基づいて復元サンプルを生成できる。このとき、デコード装置は、予測モードによって予測サンプルを直ちに復元サンプルとして利用することができ、または予測サンプルにレジデュアルサンプルを加算して復元サンプルを生成することもできる。また、復元サンプルに基づいて復元ブロックまたは復元ピクチャを導出できる。その後、デコード装置は、必要に応じて主観的/客観的画質を向上させるために、デブロッキングフィルタリング及び/又はSAO手順のようなインループフィルタリング手順を前記復元ピクチャに適用できることは、上述したとおりである。 In one embodiment, the decoding device may determine whether to perform inter prediction or intra prediction for the current block based on prediction information (e.g., prediction mode information) included in the image information, and may perform prediction based on the determination to derive a prediction sample for the current block. The decoding device may then generate a reconstructed sample based on the prediction sample and the residual sample. In this case, the decoding device may directly use the prediction sample as a reconstructed sample depending on the prediction mode, or may generate a reconstructed sample by adding the residual sample to the prediction sample. In addition, the decoding device may derive a reconstructed block or a reconstructed picture based on the reconstructed sample. As described above, the decoding device may then apply an in-loop filtering procedure, such as a deblocking filtering and/or an SAO procedure, to the reconstructed picture to improve subjective/objective image quality as necessary.

前述した実施形態において、方法は、一連のステップまたはブロックで流れ図に基づいて説明されているが、本文書の実施形態は、ステップの順序に限定されるものではなく、あるステップは、前述と異なるステップと、異なる順序にまたは同時に発生できる。また、当業者であれば、流れ図に示すステップが排他的でなく、他のステップが含まれ、または流れ図の一つまたはそれ以上のステップが本文書の範囲に影響を及ぼさずに削除可能であることを理解することができる。 In the above-described embodiments, the methods are described with flow charts as a series of steps or blocks, however, the embodiments herein are not limited to the order of steps, and certain steps may occur in a different order or simultaneously with different steps than those described above. Additionally, one of ordinary skill in the art will appreciate that the steps shown in the flow charts are not exclusive, and other steps may be included, or one or more steps of the flow charts may be deleted without affecting the scope of this document.

前述した本文書による方法は、ソフトウェア形態で実現されることができ、本文書によるエンコード装置及び/またはデコード装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの画像処理を実行する装置に含まれることができる。 The method according to the present document described above can be realized in software form, and the encoding device and/or decoding device according to the present document can be included in a device that performs image processing, such as a TV, a computer, a smartphone, a set-top box, or a display device.

本文書で実施形態がソフトウェアで実現される時、前述した方法は、前述した機能を遂行するモジュール(過程、機能など)で実現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあり、よく知られた多様な手段でプロセッサと連結されることができる。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。即ち、本文書で説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて実行されることができる。例えば、各図面で示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて実行されることができる。この場合、実現のための情報(例えば、information on instructions)またはアルゴリズムがデジタル格納媒体に格納されることができる。 When the embodiments in this document are implemented in software, the methods described above can be implemented with modules (processes, functions, etc.) that perform the functions described above. The modules can be stored in a memory and executed by a processor. The memory can be internal or external to the processor and can be coupled to the processor in various well-known ways. The processor can include an application-specific integrated circuit (ASIC), other chipsets, logic circuits, and/or data processing devices. The memory can include read-only memory (ROM), random access memory (RAM), flash memory, memory cards, storage media, and/or other storage devices. That is, the embodiments described in this document can be implemented and executed on a processor, microprocessor, controller, or chip. For example, the functional units shown in each drawing can be implemented and executed on a computer, processor, microprocessor, controller, or chip. In this case, information (e.g., information on instructions) or algorithms for implementation can be stored on a digital storage medium.

また、本文書が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、VR(virtual reality)装置、AR(argumente reality)装置、画像電話ビデオ装置、運送手段端末(例えば、車両(自律走行車両を含む)、飛行機端末、船舶端末等)、及び医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使われることができる。例えば、OTTビデオ(Over the top video)装置ではゲームコンソール、ブルーレイプレーヤ、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などを含むことができる。 In addition, the decoding device and encoding device to which this document applies may be included in multimedia broadcast transmitting/receiving devices, mobile communication terminals, home cinema video devices, digital cinema video devices, surveillance cameras, video interactive devices, real-time communication devices such as video communication, mobile streaming devices, storage media, camcorders, custom video (VoD) service providing devices, over the top video (OTT) devices, Internet streaming service providing devices, three-dimensional (3D) video devices, virtual reality (VR) devices, argumente reality (AR) devices, image telephone video devices, transportation terminals (e.g., vehicles (including autonomous vehicles), airplane terminals, ship terminals, etc.), and medical video devices, and may be used to process video signals or data signals. For example, OTT video (over the top video) devices can include game consoles, Blu-ray players, Internet-connected TVs, home theater systems, smartphones, tablet PCs, DVRs (Digital Video Recorders), and more.

また、本文書が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取り可能な記録媒体に格納されることができる。また、本文書によるデータ構造を有するマルチメディアデータもコンピュータが読み取り可能な記録媒体に格納されることができる。前記コンピュータが読み取り可能な記録媒体は、コンピュータで読み込むことができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取り可能な記録媒体は、例えば、ブルーレイディスク(BD)、汎用直列バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、及び光学的データ格納装置を含むことができる。また、前記コンピュータが読み取り可能な記録媒体は、搬送波(例えば、インターネットを介した送信)の形態で実現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取り可能な記録媒体に格納され、または有無線通信ネットワークを介して送信されることができる。 In addition, the processing method to which this document is applied can be produced in the form of a program executed by a computer and can be stored in a computer-readable recording medium. In addition, multimedia data having a data structure according to this document can also be stored in a computer-readable recording medium. The computer-readable recording medium includes all types of storage devices and distributed storage devices in which computer-readable data is stored. The computer-readable recording medium can include, for example, Blu-ray Disc (BD), Universal Serial Bus (USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage device. In addition, the computer-readable recording medium includes media realized in the form of a carrier wave (e.g., transmission via the Internet). In addition, the bit stream generated by the encoding method can be stored in a computer-readable recording medium or transmitted via a wired or wireless communication network.

また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で実現されることができ、前記プログラムコードは、本文書の実施形態によりコンピュータで実行されることができる。前記プログラムコードは、コンピュータにより読み取り可能なキャリア上に格納されることができる。 Furthermore, the embodiments of this document may be implemented in a computer program product by program code, which may be executed by a computer in accordance with the embodiments of this document. The program code may be stored on a computer readable carrier.

図11は、本文書に開示された実施形態が適用され得るコンテンツストリーミングシステムの例を示す。 Figure 11 shows an example of a content streaming system to which the embodiments disclosed herein may be applied.

図11を参照すると、本文書の実施形態に適用されるコンテンツストリーミングシステムは、大別して、エンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置、及びマルチメディア入力装置を含むことができる。 Referring to FIG. 11, the content streaming system applied to the embodiments of this document can broadly include an encoding server, a streaming server, a web server, a media repository, a user device, and a multimedia input device.

前記エンコードサーバは、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置から入力されたコンテンツをデジタルデータで圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。他の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略されることができる。 The encoding server compresses content input from a multimedia input device such as a smartphone, camera, camcorder, etc. into digital data to generate a bitstream and transmits it to the streaming server. As another example, if a multimedia input device such as a smartphone, camera, camcorder, etc. generates a bitstream directly, the encoding server can be omitted.

前記ビットストリームは、本文書の実施形態に適用されるエンコード方法またはビットストリーム生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信または受信する過程で一時的に前記ビットストリームを格納することができる。 The bitstream may be generated by an encoding method or a bitstream generation method applied to an embodiment of this document, and the streaming server may temporarily store the bitstream during the process of transmitting or receiving the bitstream.

前記ストリーミングサーバは、ウェブサーバを介したユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割をする。 The streaming server transmits multimedia data to a user device based on a user request via a web server, and the web server acts as an intermediary to inform the user of available services. When a user requests a desired service from the web server, the web server transmits the request to the streaming server, and the streaming server transmits the multimedia data to the user. In this case, the content streaming system may include a separate control server, and in this case, the control server controls commands/responses between each device in the content streaming system.

前記ストリーミングサーバは、メディア格納所及び/またはエンコードサーバからコンテンツを受信することができる。例えば、前記エンコードサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間格納することができる。 The streaming server may receive content from a media repository and/or an encoding server. For example, when content is received from the encoding server, the content may be received in real time. In this case, the streaming server may store the bitstream for a certain period of time to provide a smooth streaming service.

前記ユーザ装置の例として、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末(smartwatch)、グラス型端末(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイニジがある。 Examples of the user device include mobile phones, smart phones, laptop computers, digital broadcasting terminals, personal digital assistants (PDAs), portable multimedia players (PMPs), navigation systems, slate PCs, tablet PCs, ultrabooks, wearable devices (e.g., smartwatches, smart glass, head mounted displays (HMDs), digital TVs, desktop computers, and digital signage).

前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。 Each server in the content streaming system can be operated as a distributed server, in which case data received by each server can be processed in a distributed manner.

本文書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本文書の方法請求項の技術的特徴が組み合わせて装置で実現されることができ、本文書の装置請求項の技術的特徴が組み合わせて方法で実現されることができる。また、本文書の方法請求項の技術的特徴と装置請求項の技術的特徴が組み合わせて装置で実現されることができ、本文書の方法請求項の技術的特徴と装置請求項の技術的特徴が組み合わせて方法で実現されることができる。 The claims herein may be combined in various ways. For example, the technical features of the method claims herein may be combined and realized in an apparatus, and the technical features of the apparatus claims herein may be combined and realized in a method. Also, the technical features of the method claims herein and the technical features of the apparatus claims herein may be combined and realized in an apparatus, and the technical features of the method claims herein and the technical features of the apparatus claims herein may be combined and realized in a method.

Claims (3)

デコード装置によって行われる画像デコード方法において、
ビットストリームからレジデュアル情報を含む画像情報を取得するステップと、
前記レジデュアル情報に基づいて現在ブロックに対する量子化された変換係数を導出するステップと、
前記量子化された変換係数に基づいて変換係数を導出するステップと、
前記変換係数に基づいてレジデュアルサンプルを導出するステップと、
前記レジデュアルサンプルに基づいて復元サンプルを生成するステップと、
を含み、
前記画像情報は、スケーリングリストデータを含むアダプテーションパラメータセット(APS)を含み、
前記APSは、APS ID情報及びAPSタイプ情報を含み、
前記APS ID情報に基づいて前記APSが識別され、
前記APSタイプ情報に基づいて前記APSが前記スケーリングリストデータを含み、
前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に基づいて前記APS ID情報が特定の範囲内の値を有し、
前記特定の範囲は、前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に対してあらかじめ決定され、
前記APS ID情報の前記値に対する前記特定の範囲は、0から3の範囲を含む、画像デコード方法。
An image decoding method performed by a decoding device,
obtaining image information including residual information from a bitstream;
deriving quantized transform coefficients for a current block based on the residual information;
deriving transform coefficients based on the quantized transform coefficients;
deriving residual samples based on the transform coefficients;
generating reconstruction samples based on the residual samples;
Including,
The image information includes an adaptation parameter set (APS) including scaling list data;
The APS includes APS ID information and APS type information,
The APS is identified based on the APS ID information;
the APS includes the scaling list data based on the APS type information;
the APS ID information has a value within a specific range based on the APS type information that identifies the APS as an APS for the scaling list data;
the specific range is predetermined for the APS type information that identifies the APS as an APS for the scaling list data ,
The particular range for the value of the APS ID information includes a range from 0 to 3 .
エンコード装置によって行われる画像エンコード方法において、
現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記レジデュアルサンプルに基づいて変換係数を導出するステップと、
前記変換係数に対する量子化過程を適用して量子化された変換係数を導出するステップと、
前記量子化された変換係数に対する情報を含むレジデュアル情報を生成するステップと、
前記レジデュアル情報を含む画像情報をエンコードするステップと、
を含み、
前記画像情報は、スケーリングリストデータを含むアダプテーションパラメータセット(APS)を含み、
前記APSは、APS ID情報及びAPSタイプ情報を含み、
前記APS ID情報に基づいて前記APSが識別され、
前記APSタイプ情報に基づいて前記APSが前記スケーリングリストデータを含み、
前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に基づいて前記APS ID情報が特定の範囲内の値を有し、
前記特定の範囲は、前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に対してあらかじめ決定され、
前記APS ID情報の前記値に対する前記特定の範囲は、0から3の範囲を含む、画像エンコード方法。
An image encoding method performed by an encoding device, comprising:
deriving a residual sample for a current block;
deriving transform coefficients based on the residual samples;
applying a quantization process to the transform coefficients to derive quantized transform coefficients;
generating residual information including information on the quantized transform coefficients;
encoding image information including the residual information;
Including,
The image information includes an adaptation parameter set (APS) including scaling list data;
The APS includes APS ID information and APS type information,
The APS is identified based on the APS ID information;
the APS includes the scaling list data based on the APS type information;
the APS ID information has a value within a specific range based on the APS type information that identifies the APS as an APS for the scaling list data;
the specific range is predetermined for the APS type information that identifies the APS as an APS for the scaling list data ,
The method of claim 1 , wherein the particular range for the value of the APS ID information comprises a range from 0 to 3 .
画像に対するデータの送信方法において、
前記画像に対するビットストリームを取得するステップと、
前記ビットストリームを含む前記データを送信するステップと、
を含み、
前記ビットストリームは、現在ブロックに対するレジデュアルサンプルを導出し、前記レジデュアルサンプルに基づいて変換係数を導出し、前記変換係数に対する量子化過程を適用して量子化された変換係数を導出し、前記量子化された変換係数に対する情報を含むレジデュアル情報を生成し、前記レジデュアル情報を含む画像情報をエンコードすることに基づいて生成され、
前記画像情報は、スケーリングリストデータを含むアダプテーションパラメータセット(APS)を含み、
前記APSは、APS ID情報及びAPSタイプ情報を含み、
前記APS ID情報に基づいて前記APSが識別され、
前記APSタイプ情報に基づいて前記APSが前記スケーリングリストデータを含み、
前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に基づいて前記APS ID情報が特定の範囲内の値を有し、
前記特定の範囲は、前記APSが前記スケーリングリストデータに対するAPSであることを特定する前記APSタイプ情報に対してあらかじめ決定され、
前記APS ID情報の前記値に対する前記特定の範囲は、0から3の範囲を含む、データ送信方法。
A method for transmitting data for an image, comprising:
obtaining a bitstream for the image;
transmitting the data including the bitstream;
Including,
the bitstream is generated by deriving residual samples for a current block, deriving transform coefficients based on the residual samples, deriving quantized transform coefficients by applying a quantization process to the transform coefficients, generating residual information including information on the quantized transform coefficients, and encoding image information including the residual information;
The image information includes an adaptation parameter set (APS) including scaling list data;
The APS includes APS ID information and APS type information,
The APS is identified based on the APS ID information;
the APS includes the scaling list data based on the APS type information;
the APS ID information has a value within a specific range based on the APS type information that identifies the APS as an APS for the scaling list data;
the specific range is predetermined for the APS type information that identifies the APS as an APS for the scaling list data ,
The particular range for the value of the APS ID information includes a range from 0 to 3 .
JP2023102553A 2019-07-08 2023-06-22 Image or video coding based on scaling list data Active JP7492066B2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962871228P 2019-07-08 2019-07-08
US62/871,228 2019-07-08
PCT/KR2020/008953 WO2021006630A1 (en) 2019-07-08 2020-07-08 Scaling list data-based image or video coding
JP2022500869A JP7303366B2 (en) 2019-07-08 2020-07-08 Image or video coding based on scaling list data

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022500869A Division JP7303366B2 (en) 2019-07-08 2020-07-08 Image or video coding based on scaling list data

Publications (2)

Publication Number Publication Date
JP2023112125A JP2023112125A (en) 2023-08-10
JP7492066B2 true JP7492066B2 (en) 2024-05-28

Family

ID=74115085

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022500869A Active JP7303366B2 (en) 2019-07-08 2020-07-08 Image or video coding based on scaling list data
JP2023102553A Active JP7492066B2 (en) 2019-07-08 2023-06-22 Image or video coding based on scaling list data

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2022500869A Active JP7303366B2 (en) 2019-07-08 2020-07-08 Image or video coding based on scaling list data

Country Status (5)

Country Link
US (3) US11425401B2 (en)
JP (2) JP7303366B2 (en)
KR (1) KR20220017438A (en)
CN (1) CN114365496A (en)
WO (1) WO2021006630A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210130235A (en) * 2019-04-15 2021-10-29 엘지전자 주식회사 Scaling list parameter-based video or image coding
AU2020203330B2 (en) 2020-05-21 2022-12-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a block of video samples

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2501125B (en) * 2012-04-13 2015-08-19 Canon Kk Method and device for providing adaptation parameters to a decoder
CN108696755B (en) * 2012-04-13 2020-11-06 三菱电机株式会社 Image encoding device, image decoding device, and methods thereof
KR101812615B1 (en) * 2012-09-28 2017-12-27 노키아 테크놀로지스 오와이 An apparatus, a method and a computer program for video coding and decoding
JP2015076861A (en) * 2013-10-11 2015-04-20 ソニー株式会社 Decoder, decoding method and encoder, and encoding method
US10368097B2 (en) * 2014-01-07 2019-07-30 Nokia Technologies Oy Apparatus, a method and a computer program product for coding and decoding chroma components of texture pictures for sample prediction of depth pictures
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
WO2017083553A1 (en) * 2015-11-10 2017-05-18 Vid Scale, Inc. Systems and methods for coding in super-block based video coding framework
WO2017209328A1 (en) * 2016-06-03 2017-12-07 엘지전자 주식회사 Intra-prediction method and apparatus in image coding system
KR20190062273A (en) * 2017-11-28 2019-06-05 한국전자통신연구원 Method and apparatus for image processing using image transform network and inverse transform neaural network
CN116886931A (en) * 2019-03-25 2023-10-13 寰发股份有限公司 Method and apparatus for quantization matrix computation and representation for video coding and decoding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Seethal Paluri, Jaehyun Lim, and Seung Hwan Kim,AHG17: APS ID Control Mechanism,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0561,15th Meeting: Gothenburg, SE,2019年06月26日,pp.1-5
Seethal Paluri, Jie Zhao, Jaehyun Lim, and Seung Hwan Kim,AHG17: APS support for default and user defined scaling matrices,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0299 (version 1),15th Meeting: Gothenburg, SE,2019年06月25日,pp.1-5

Also Published As

Publication number Publication date
US11653008B2 (en) 2023-05-16
JP2022540149A (en) 2022-09-14
US20220337850A1 (en) 2022-10-20
JP2023112125A (en) 2023-08-10
JP7303366B2 (en) 2023-07-04
WO2021006630A1 (en) 2021-01-14
US11425401B2 (en) 2022-08-23
CN114365496A (en) 2022-04-15
US20220132149A1 (en) 2022-04-28
KR20220017438A (en) 2022-02-11
US20230319295A1 (en) 2023-10-05

Similar Documents

Publication Publication Date Title
US11496734B2 (en) Cross component filtering-based image coding apparatus and method
JP7314307B2 (en) Signaling-based video or video coding of scaling list data
US11743468B2 (en) Filtering-based image coding device and method
JP7492066B2 (en) Image or video coding based on scaling list data
US11683532B2 (en) Image coding device and method for controlling loop filtering
US11595697B2 (en) Adaptive loop filtering-based image coding apparatus and method
KR20220017439A (en) Scaling list parameter-based video or image coding
US20220400291A1 (en) Image coding device and method, for controlling loop filtering
US20230344986A1 (en) Filtering-based image coding device and method
US20230396807A1 (en) Video or image coding based on signaling of scaling list data
US20220210403A1 (en) Scaling list parameter-based video or image coding
US20230239512A1 (en) Image coding device and method for controlling loop filtering
US20230164321A1 (en) In-loop filtering-based image coding device and method
US20230007266A1 (en) Apparatus and method for coding image on basis of signaling of information for filtering
US20220337849A1 (en) Scaling list parameter-based video or image coding
KR20210129224A (en) Scaling list-based video or video coding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240516

R150 Certificate of patent or registration of utility model

Ref document number: 7492066

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150