WO2020076049A1 - 양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치 - Google Patents

양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치 Download PDF

Info

Publication number
WO2020076049A1
WO2020076049A1 PCT/KR2019/013186 KR2019013186W WO2020076049A1 WO 2020076049 A1 WO2020076049 A1 WO 2020076049A1 KR 2019013186 W KR2019013186 W KR 2019013186W WO 2020076049 A1 WO2020076049 A1 WO 2020076049A1
Authority
WO
WIPO (PCT)
Prior art keywords
coefficient
level
block
flag
syntax element
Prior art date
Application number
PCT/KR2019/013186
Other languages
English (en)
French (fr)
Inventor
김재일
이선영
이승호
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190117821A external-priority patent/KR20200040192A/ko
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Publication of WO2020076049A1 publication Critical patent/WO2020076049A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to image encoding or decoding, and more particularly, to efficiently express quantized transform coefficients.
  • video data Since video data has a large amount of data compared to audio data or still image data, it requires a lot of hardware resources including memory to store or transmit itself without processing for compression. Therefore, when storing or transmitting video data, an encoder is used to compress and store or transmit video data, and a decoder receives compressed video data, decompresses and plays it.
  • H.264 / AVC, and H.265 / HEC (High Efficiency Video Coding) standard technology established in early 2013, which improved encoding efficiency of about 40%, existed as the video compression technology. do.
  • the present disclosure provides a set of modified syntax elements representing validity information for transform coefficients, level information for valid coefficients, and sign information for valid coefficients to more efficiently represent coefficients in a transform block. I would like to suggest.
  • validity information for a specific sub-block indicating whether at least one non-zero validity coefficient is present in a specific sub-block among a plurality of sub-blocks included in a transform block from a bitstream.
  • validity information of the specific sub-block indicates that at least one valid coefficient exists in the specific sub-block, validity information, valid coefficients for each coefficient in the specific sub-block from the bitstream.
  • the syntax elements representing level information for the effective coefficients are (a) a first syntax element indicating whether the level absolute value of the effective coefficient is greater than 1, and (b) a second syntax indicating parity of the effective coefficient greater than 1 Element, (c) a third syntax element indicating whether the level absolute value of the effective coefficient greater than 1 is greater than 3, and (d) a fourth syntax element indicating the remainder of the absolute value of the effective coefficient greater than 3.
  • an image decoding method comprising determining an absolute level of levels of effective coefficients in a transform coefficient block.
  • the image decoding method includes parsing a first syntax element indicating whether an absolute value of a target effective coefficient is greater than 1; And when the first syntax element indicates that the absolute value of the target effective coefficient is not greater than 1, determining the level absolute value of the target effective coefficient to 1.
  • the first syntax element indicates that the absolute value of the target effective coefficient is greater than 1
  • the level absolute value of the second syntax element indicating the parity of the target effective coefficient and the target effective coefficient is greater than 3
  • Parsing a third syntax element indicating whether it is large
  • the third syntax element indicates that the absolute value of the target validity coefficient is not greater than 3
  • the level absolute of the target validity coefficient based on the parity of the target validity coefficient indicated by the second syntax element. And determining the value as either 2 or 3.
  • the image decoding method parses a fourth syntax element indicating the remainder of the absolute value of the target coefficient, and the second syntax element. And determining the absolute level of the target effective coefficient based on the parity of the target effective coefficient indicated by and the remainder of the level absolute value of the target coefficient indicated by the fourth syntax element.
  • an image decoding apparatus including a memory in which instructions are recorded and at least one processor, wherein the instructions, when executed by the at least one processor, cause the image decoding apparatus to perform the above-described method. It provides an image decoding apparatus, configured to realize the.
  • encoding validity information for the specific sub-block indicating whether at least one non-zero validity coefficient exists in a specific sub-block step; And when the validity information of the specific sub-block indicates that at least one valid coefficient is present in the specific sub-block, validity information for each coefficient in the specific sub-block, level information for the valid coefficients, And encoding syntax elements representing code information for effective coefficients.
  • an image encoding apparatus including a memory in which instructions are recorded and at least one processor, wherein the instructions, when executed by the at least one processor, cause the image encoding apparatus to perform the above-described method. It provides a video encoding apparatus, configured to realize.
  • FIG. 1 is an exemplary block diagram of an image encoding apparatus capable of implementing the techniques of the present disclosure.
  • 2 is an exemplary diagram of neighboring blocks of the current block.
  • FIG. 3 is a diagram illustrating exemplary scan methods used for encoding quantized coefficients of a square coefficient block.
  • 3 is a diagram for describing a plurality of intra prediction modes.
  • FIG. 4 is an exemplary block diagram of an image decoding apparatus capable of implementing the techniques of the present disclosure.
  • FIG. 5 is a diagram illustrating exemplary scan methods used for encoding quantized coefficients of a square coefficient block.
  • FIG. 6 is a diagram illustrating a more detailed subblock and scan order of coefficients for a diagonal scan scheme.
  • FIG. 7 to 9 are flowcharts illustrating methods in which an image decoding apparatus determines a level of transform coefficients, expressed using syntax elements according to a first embodiment of the present invention.
  • 10 to 12 are flowcharts illustrating methods in which an image decoding apparatus determines a level of transform coefficients, expressed using syntax elements according to a second embodiment of the present invention.
  • 13 is a diagram illustrating dependent scalar quantization using two scalar quantizers.
  • FIG. 14 is a diagram for explaining switching between two scalar quantizers Q0 and Q1 using a table describing the state of the state machine.
  • 15 is a flowchart illustrating a method of reconstructing a level of a transform coefficient by an image decoding apparatus when a dependent scalar quantization technique is used.
  • FIG. 1 is an exemplary block diagram of an image encoding apparatus capable of implementing the techniques of the present disclosure.
  • an image encoding apparatus and sub-components of the apparatus will be described with reference to FIG. 1.
  • the image encoding apparatus includes a block division unit 110, a prediction unit 120, a subtractor 130, a transformation unit 140, a quantization unit 145, an encoding unit 150, an inverse quantization unit 160, and an inverse transformation unit ( 165), an adder 170, a filter unit 180 and a memory 190.
  • Each component of the video encoding apparatus may be implemented in hardware or software, or a combination of hardware and software. Further, the function of each component may be implemented in software, and the microprocessor may be implemented to execute the function of software corresponding to each component.
  • One image is composed of a plurality of pictures. Each picture is divided into a plurality of regions, and encoding is performed for each region. For example, one picture is divided into one or more tiles or / and slices. Here, one or more tiles may be defined as a tile group. Each tile or / slice is divided into one or more coding tree units (CTUs). And each CTU is divided into one or more coding units (CUs) by a tree structure. Information applied to each CU is encoded as the syntax of the CU, and information commonly applied to CUs included in one CTU is encoded as the syntax of the CTU.
  • CTUs coding tree units
  • CUs coding units
  • information commonly applied to all blocks in one tile is encoded as the syntax of a tile or encoded as a syntax of a tile group in which a plurality of tiles are collected, and information applied to all blocks constituting one picture is It is encoded in a picture parameter set (PPS) or a picture header.
  • PPS picture parameter set
  • PPS picture parameter set
  • information commonly referred to by a plurality of pictures is encoded in a sequence parameter set (SPS).
  • SPS sequence parameter set
  • information commonly referenced by one or more SPSs is encoded in a video parameter set (VPS).
  • the block splitter 110 determines the size of a coding tree unit (CTU).
  • CTU size Information about the size of the CTU (CTU size) is encoded as a syntax of an SPS or a PPS and transmitted to an image decoding apparatus.
  • the block dividing unit 110 divides each picture constituting an image into a plurality of coding tree units (CTUs) of a determined size, and then recursively splits the CTU using a tree structure. do.
  • a leaf node in a tree structure becomes a coding unit (CU), which is a basic unit of encoding.
  • the tree structure includes a quad tree (QuadTree, QT) in which the parent node (or parent node) is divided into four sub-nodes (or child nodes) of the same size, or a binary tree (BinaryTree) in which the parent node is divided into two sub-nodes. , BT), or a ternary tree in which the upper node is divided into three lower nodes in a 1: 2: 1 ratio, or a structure using one or more of these QT structures, BT structures, and TT structures. have.
  • a QTBT QuadTree plus BinaryTree
  • a QTBTTT QuadTree plus BinaryTree TernaryTree
  • MTT Multiple-Type Tree
  • the CTU can be first divided into a QT structure.
  • the quadtree split may be repeated until the size of the splitting block reaches the minimum block size (MinQTSize) of the leaf node allowed in QT.
  • the first flag (QT_split_flag) indicating whether each node of the QT structure is divided into 4 nodes of the lower layer is encoded by the encoder 150 and signaled to the video decoding apparatus. If the leaf node of QT is not larger than the maximum block size (MaxBTSize) of the root node allowed by BT, it may be further divided into any one or more of BT structure or TT structure.
  • MaxBTSize maximum block size
  • a plurality of split directions may exist. For example, there may be two directions in which a block of a corresponding node is divided horizontally and a vertically divided direction.
  • a second flag indicating whether nodes are split
  • a flag indicating additional splitting direction vertical or horizontal
  • / or splitting type Boary or Ternary
  • the encoder 150 displays CU split flag (split_cu_flag) indicating that the block is split first and QT split flag (split_qt_flag) information indicating whether the split type is QT split. ) And signaled to the video decoding apparatus. If the CU split flag (split_cu_flag) value is not indicated, the block of the corresponding node becomes a leaf node in the split tree structure and becomes a coding unit (CU), which is a basic unit of encoding.
  • CU split flag split_cu_flag
  • the split type is QT or MTT through the QT split flag (split_qt_flag) value. If the split type is QT, there is no additional information, and when the split type is MTT, additionally, a flag indicating the MTT split direction (vertical or horizontal) (mtt_split_cu_vertical_flag) and / or a flag indicating the MTT split type (Binary or Ternary) mtt_split_cu_binary_flag) is encoded by the encoder 150 and signaled to the video decoding apparatus.
  • split_flag indicating whether each node of the BT structure is divided into blocks of a lower layer and split type information indicating a split type are encoded by the encoder 150 and transmitted to an image decoding apparatus.
  • split_flag there may be further a type of dividing a block of a corresponding node into two blocks having an asymmetric shape.
  • the asymmetric form may include a form of dividing a block of a corresponding node into two rectangular blocks having a size ratio of 1: 3, or may include a form of dividing a block of a corresponding node diagonally.
  • CU may have various sizes according to QTBT or QTBTTT division from CTU.
  • a block corresponding to a CU ie, a leaf node of QTBTTT
  • a 'current block' a block corresponding to a CU (ie, a leaf node of QTBTTT) to be encoded or decoded.
  • the prediction unit 120 predicts the current block to generate a prediction block.
  • the prediction unit 120 includes an intra prediction unit 122 and an inter prediction unit 124.
  • each of the current blocks in a picture can be predictively coded.
  • Prediction of the current block is generally performed using an intra prediction technique (using data from a picture containing the current block) or an inter prediction technique (using data from a picture coded before the picture containing the current block).
  • Inter prediction includes both one-way prediction and two-way prediction.
  • the intra prediction unit 122 predicts pixels in the current block using pixels (reference pixels) located around the current block in the current picture including the current block.
  • the plurality of intra prediction modes may include 65 non-directional modes including a planar mode and a DC mode. Peripheral pixels to be used and expressions are defined differently for each prediction mode.
  • the intra prediction unit 122 may determine an intra prediction mode to be used to encode the current block.
  • the intra prediction unit 122 may encode the current block using various intra prediction modes and select an appropriate intra prediction mode to use from the tested modes. For example, the intra prediction unit 122 calculates rate distortion values using rate-distortion analysis for various tested intra prediction modes, and has the best rate distortion characteristics among the tested modes. The intra prediction mode can also be selected.
  • the intra prediction unit 122 selects one intra prediction mode from among a plurality of intra prediction modes, and predicts a current block using a neighboring pixel (reference pixel) and an arithmetic expression determined according to the selected intra prediction mode.
  • Information on the selected intra prediction mode is encoded by the encoding unit 150 and transmitted to the image decoding apparatus.
  • the inter prediction unit 124 generates a prediction block for the current block through a motion compensation process.
  • the block most similar to the current block is searched in the reference picture that is encoded and decoded before the current picture, and a predicted block for the current block is generated using the searched block. Then, a motion vector corresponding to displacement between the current block in the current picture and the prediction block in the reference picture is generated.
  • motion estimation is performed on luma components, and motion vectors calculated based on luma components are used for both luma components and chroma components.
  • the motion information including information about the reference picture and motion vector used to predict the current block is encoded by the encoder 150 and transmitted to the video decoding apparatus.
  • the subtractor 130 subtracts the prediction block generated by the intra prediction unit 122 or the inter prediction unit 124 from the current block to generate a residual block.
  • the transform unit 140 converts the residual signal in the residual block having pixel values in the spatial domain into a transform coefficient in the frequency domain.
  • the converter 140 may convert residual signals in the residual block by using the entire size of the residual block as a transformation unit, or divide the residual block into two sub-blocks, a transform region and a non-transformed region, to convert the sub-regions. Residual signals can be transformed using only blocks as transform units.
  • the transform region sub-block may be one of two rectangular blocks having a size ratio of 1: 1 on the horizontal axis (or vertical axis).
  • a flag indicating that only the sub-block has been converted (cu_sbt_flag), directional (vertical / horizontal) information (cu_sbt_horizontal_flag) and / or location information (cu_sbt_pos_flag) is encoded by the encoder 150 and signaled to the video decoding apparatus.
  • the size of the transform region sub-block may have a size ratio of 1: 3 based on the horizontal axis (or vertical axis).
  • a flag (cu_sbt_quad_flag) for classifying the split is additionally encoded by the encoder 150 to decode the image. Signaled to the device.
  • the quantization unit 145 quantizes transform coefficients output from the transform unit 140 and outputs the quantized transform coefficients to the encoder 150.
  • the encoder 150 generates a bitstream by encoding quantized transform coefficients using an encoding method such as CABAC (Context-based Adaptive Binary Arithmetic Code). Such encoding is typically performed on quantized transform coefficients using one of a plurality of available scan patterns.
  • CABAC Context-based Adaptive Binary Arithmetic Code
  • One aspect of the techniques of this disclosure generally relates to efficiently encoding the level of (non-zero) coefficients for a coefficient block that is an array of quantized coefficients. Accordingly, the techniques of the present disclosure may be performed by the encoder 150. That is, for example, the encoder 150 may perform the techniques of the present disclosure described with reference to FIGS. 7 to 12 below. In other examples, one or more other units of the encoding apparatus may additionally be involved in performing the techniques of this disclosure.
  • the encoder 150 encodes information such as a CTU size, a CU split flag, a QT split flag, an MTT split direction, and an MTT split type related to block splitting, so that the image decoding apparatus can split the block in the same way as the image coding apparatus. To make.
  • the encoder 150 encodes information about a prediction type indicating whether the current block is encoded by intra prediction or inter prediction, and intra prediction information (that is, intra prediction mode) according to the prediction type. Information) or inter prediction information (information on reference pictures and motion vectors).
  • the inverse quantization unit 160 inverse quantizes the quantized transform coefficients output from the quantization unit 145 to generate transform coefficients.
  • the inverse transform unit 165 reconstructs the residual block by transforming transform coefficients output from the inverse quantization unit 160 from the frequency domain to the spatial domain.
  • the adder 170 restores the current block by adding the reconstructed residual block and the predicted block generated by the predictor 120.
  • the pixels in the reconstructed current block are used as a reference pixel when intra prediction of a next order block.
  • the filter unit 180 filters the reconstructed pixels to reduce blocking artifacts, ringing artifacts, and blurring artifacts caused by block-based prediction and transformation / quantization. To perform.
  • the filter unit 180 may include a deblocking filter 182 and a sample adaptive offset (SAO) filter 184.
  • SAO sample adaptive offset
  • the deblocking filter 180 filters the boundary between the restored blocks to remove blocking artifacts caused by block-level encoding / decoding, and the SAO filter 184 adds additional deblocking filtered images. Filtering is performed.
  • the SAO filter 184 is a filter used to compensate for a difference between a reconstructed pixel and an original pixel caused by lossy coding.
  • the reconstructed blocks filtered through the deblocking filter 182 and the SAO filter 184 are stored in the memory 190.
  • the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded.
  • FIG. 4 is an exemplary block diagram of an image decoding apparatus capable of implementing the techniques of the present disclosure.
  • an image decoding apparatus and sub-components of the apparatus will be described with reference to FIG. 4.
  • the image decoding apparatus may include a decoding unit 410, an inverse quantization unit 420, an inverse transform unit 430, a prediction unit 440, an adder 450, a filter unit 460, and a memory 470.
  • each component of the video decoding apparatus may be implemented in hardware or software, or a combination of hardware and software. Further, the function of each component may be implemented in software, and the microprocessor may be implemented to execute the function of software corresponding to each component.
  • the decoder 410 decodes the bitstream received from the video encoding apparatus, extracts information related to block partitioning, determines a current block to be decoded, prediction information required for reconstructing the current block, information about a residual signal, and the like. To extract.
  • the decoder 410 extracts information about the CTU size from a Sequence Parameter Set (SPS) or a Picture Parameter Set (PPS) to determine the size of the CTU, and divides the picture into CTUs of the determined size. Then, the CTU is determined as the top layer of the tree structure, that is, the root node, and the CTU is divided by using the tree structure by extracting the partition information for the CTU.
  • SPS Sequence Parameter Set
  • PPS Picture Parameter Set
  • the first flag (QT_split_flag) related to the splitting of the QT is extracted, and each node is divided into four nodes of a lower layer.
  • the second flag (MTT_split_flag) and split direction (vertical / horizontal) and / or split type (binary / ternary) information related to the splitting of the MTT are extracted to extract the corresponding leaf node from the MTT. Divide into structures. Through this, each node below the leaf node of QT is recursively divided into a BT or TT structure.
  • a CU split flag indicating whether to split the CU is first extracted, and when the corresponding block is split, a QT split flag (split_qt_flag) is extracted. . If the split type is not QT and MTT, a flag indicating the MTT splitting direction (vertical or horizontal) (mtt_split_cu_vertical_flag) and / or a flag indicating the MTT splitting type (Binary or Ternary) (mtt_split_cu_binary_flag) is additionally extracted.
  • each node may have 0 or more repetitive MTT splits after 0 or more repetitive QT splits.
  • the CTU can be directly split MTT, and conversely, the CTU may only generate multiple QT splits.
  • the first flag (QT_split_flag) related to the division of the QT is extracted, and each node is divided into four nodes of a lower layer. Then, for a node corresponding to a leaf node of QT, split flag (split_flag) indicating whether to be further divided by BT and split direction information are extracted.
  • the decoder 410 when determining a current block to be decoded through partitioning of a tree structure, extracts information on a prediction type indicating whether the current block is intra predicted or inter predicted.
  • the decoder 410 extracts a syntax element for intra prediction information (intra prediction mode) of the current block.
  • the decoder 410 extracts syntax elements for the inter prediction information, that is, information indicating a motion vector and a reference picture referenced by the motion vector.
  • the decoder 410 extracts information about quantized transform coefficients of the current block as information about the residual signal.
  • Another aspect of the techniques of this disclosure relates to efficiently decoding the level of (non-zero) coefficients for a coefficient block, which is generally an array of quantized coefficients. Accordingly, certain techniques of the present disclosure may be performed by the decoder 410. That is, for example, the decoder 410 may perform the techniques of the present disclosure described with reference to FIGS. 7 to 12 below. In other examples, one or more other components of the video decoding apparatus may additionally be involved in performing the techniques of this disclosure.
  • the inverse quantization unit 420 inverse quantizes the quantized transform coefficients, and the inverse transform unit 430 inversely transforms the inverse quantized transform coefficients from the frequency domain to the spatial domain to restore residual signals to generate a residual block for the current block.
  • the inverse quantization unit 420 is dependent scalar quantization, in which the set of available reconstruction values for the transform coefficient depends on the level of the transform coefficient that precedes the current transform coefficient in the reconstruction order (or inverse order of the scan order). Techniques can be used. The dependent scalar quantization technique will be described later with reference to FIGS. 13 to 15.
  • a flag (cu_sbt_flag) indicating that only a sub-block of the transform block is transformed, and vertical / horizontal information (cu_sbt_horizontal_flag) of the sub-block ) And / or extracting the location information (cu_sbt_pos_flag) of the sub-block, inversely transforming the transform coefficients of the sub-block from the frequency domain to the spatial domain, restoring the residual signals, and "0" as the residual signal for the region that is not inverse transform By filling, we create the final residual block for the current block.
  • the prediction unit 440 includes an intra prediction unit 442 and an inter prediction unit 444.
  • the intra prediction unit 442 is activated when intra prediction is a prediction type of the current block
  • the inter prediction unit 444 is activated when intra prediction is a prediction type of the current block.
  • the intra prediction unit 442 determines an intra prediction mode of a current block among a plurality of intra prediction modes from syntax elements for an intra prediction mode extracted from the decoder 410, and according to the intra prediction mode, reference pixels around the current block Use to predict the current block.
  • the inter prediction unit 444 determines a motion vector of a current block and a reference picture referenced by the motion vector by using a syntax element for the intra prediction mode extracted from the decoding unit 410, and uses the motion vector and the reference picture. To predict the current block.
  • the adder 450 restores the current block by adding the residual block output from the inverse transform unit and the prediction block output from the inter prediction unit or the intra prediction unit.
  • the pixels in the reconstructed current block are used as a reference pixel in intra prediction of a block to be decoded later.
  • the filter unit 460 includes a deblocking filter 462 and a SAO filter 464.
  • the deblocking filter 462 deblocks the boundary between the reconstructed blocks to remove blocking artifacts caused by block-by-block decoding.
  • the SAO filter 464 performs additional filtering on the reconstructed block after deblocking filtering to compensate for the difference between the reconstructed pixel and the original pixel caused by lossy coding.
  • the reconstructed blocks filtered through the deblocking filter 462 and the SAO filter 464 are stored in the memory 470. When all blocks in one picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded.
  • the techniques of this disclosure relate to efficiently encoding and decoding coefficients for a coefficient block, which is an array of quantized transform coefficients obtained through a transform and quantization process. At least some of the disclosed techniques may be applied directly to a residual block that has not been transformed.
  • H.265 HEVC
  • a total of six syntax elements are used to express the position of a non-zero coefficient among quantized coefficients that have undergone a quantization process.
  • coded_sub_block_flag is a flag indicating whether each 4x4 sub-block in the coefficient block contains one or more non-zero coefficients.
  • Coded_sub_block_flag is signaled only for the subblock preceding the last significant sub-block in which the last significant coefficient exists in the scan order for the count block.
  • coded_sub_block_flag is indicated as "0" if all coefficients in the corresponding subblock are zero, and "1" when one or more non-zero coefficients are present.
  • sig_coeff_flag is a flag indicating whether the coefficient is non-zero or zero for each coefficient in a sub-block. sig_coeff_flag is indicated as "0" for the zero coefficient and "1" for the non-zero coefficient. When coded_sub_block_flag is "1", the sig_coeff_flag syntax for each of all coefficients in the corresponding subblock is signaled.
  • Coding of coefficients in the coefficient block is usually performed using one of a plurality of available scan schemes.
  • 5 is a diagram illustrating exemplary scan methods used for encoding quantized coefficients of a square coefficient block. These scan methods include a diagonal method, a horizontal method, and a vertical method.
  • an encoding target block that is, a current block
  • coefficients of a corresponding coefficient block are scanned in an up-right diagonal method
  • an encoding target block is encoded using an intra-frame prediction method.
  • the coefficients of the corresponding coefficient block are scanned as one selected from the three scan methods according to the intra prediction mode.
  • the illustrated scan scheme shows the same type of scan pattern for sub-blocks in the coefficient block and coefficients in each sub-block.
  • the scan order of sub-blocks is also a horizontal method
  • the scan order of coefficients in each sub-block is also a horizontal method.
  • 6 shows a scan order of more detailed sub-blocks and coefficients for the diagonal scan scheme.
  • the order of storage in the actual bitstream is stored in the reverse order of the scan order. That is, it is stored in the bitstream in order from the pixel at position 255 in FIG. 6 to the pixel at position 0.
  • the coefficients can be decoded by the image decoding apparatus in the opposite direction of the scan order toward the first coefficient in the scan pattern.
  • syntax elements for expressing the level of a non-zero coefficient are composed of four.
  • coeff_abs_level_greater1_flag is a flag indicating whether the absolute value of the count level is greater than 1 (hereinafter, also referred to as a 'G1 flag'), and coeff_abs_level_greater2_flag is a flag indicating whether the absolute value of the count level is greater than 2 (hereinafter 'G2 flag') It can also be referred to as).
  • coeff_sign_flag is a flag indicating a sign (positive or negative) of the coefficient level (also referred to hereinafter as a 'Sign flag'), and coeff_abs_level_remaining is a residual value of the absolute value of the coefficient level greater than 2 (remainder; that is, the coefficient level) It is a syntax element expressing absolute value minus 3).
  • the video encoding apparatus displays a sign value indicating whether the value of the transform coefficient is greater than or less than 0 (that is, a Sign flag) and a binary value indicating whether the absolute value of the transform coefficient is greater than 1 (that is, , G1 flag).
  • the video encoding apparatus further encodes a binary value (that is, a G2 flag) indicating whether the transform coefficient has an absolute value greater than 2. If the transform coefficient has an absolute value greater than 2, the video encoding apparatus further encodes a value (ie, a remainder) representing minus 3 of the absolute value of the transform coefficient.
  • Table 1 shows the bit value or bit number of syntax elements representing each level of the transform coefficient according to the H.265 (HEVC) standard.
  • sig_flag, G1_flag, and G2_flag columns indicate bit values of corresponding syntax elements.
  • the remainder column "the rest value itself” is indicated instead of the exact number of bits required to express the remaining value of the absolute value of the level greater than 2 (ie, the level absolute value minus 3).
  • the number of bits in the total bits column was calculated by considering the remaining value itself indicated in the remainder column as the number of bits for expressing the remaining value.
  • the number of bits required to express the sign_flag flag is indicated in the sign_flag column (that is, '1' written in the sign_flag column is the number of bits, not a bit value).
  • syntax elements for expressing the level of a coefficient are described.
  • the present disclosure provides a set of modified syntax elements representing validity information for coefficients, level information for valid coefficients, and sign information for valid coefficients. Suggest.
  • syntax elements listed below are used to represent the level value of coefficients.
  • greater_than_0_flag is a flag indicating whether the absolute value of the count level is greater than 0 (ie, whether it is a non-zero level) (hereinafter, may also be referred to as a 'G0 flag' or 'sig_coeff_flag'), for a non-zero count It is indicated as “1” and can be indicated as "0" for the zero coefficient.
  • greater_than_1_flag is a flag indicating whether the absolute value of the count level is greater than "1” (also referred to hereinafter as the 'G1 flag'), which is indicated by "1" for the coefficient of the level absolute value greater than 1, otherwise Otherwise, it may be displayed as "0".
  • parity_flag is a flag indicating the parity of the count level (that is, whether the level value is even or odd) (hereinafter also referred to as 'par_level_flag'), which is "1" for an odd level value, and an even level value. "0".
  • greater_than_3_flag is a flag indicating whether the absolute value of the count level is greater than 3 (also referred to hereinafter as the 'G3 flag'), which is indicated as "1" for a coefficient of the level absolute value greater than 3, or 0 otherwise.
  • abs_remainder is a syntax element indicating the remainder of the absolute value of the coefficient level greater than 3.
  • abs_remainder is represented by the same value for the level absolute value "2N” and the level absolute value "2N + 1" (where N is a natural number greater than or equal to 2).
  • sign_flag is a flag indicating the sign (positive or negative) of the coefficient level.
  • the image encoding apparatus may be configured to encode a binary value (G0_flag; greater_than_0_flag) indicating whether the value of the transform coefficient is greater than or less than 0. If the transform coefficient has an absolute value greater than 0 (that is, if the transform coefficient is a non-zero coefficient), the image encoding apparatus further adds a binary value (G1_flag; greater_than_1_flag) indicating whether the absolute value of the transform coefficient is greater than 1 It can be configured to encode.
  • G0_flag greater_than_0_flag
  • the video encoding apparatus displays a binary value (parity_flag) indicating whether the transform coefficient is odd or even and a binary value (G3_flag) indicating whether the absolute value of the transform coefficient is greater than 3; greater_than_3_flag).
  • the image encoding apparatus may be configured to additionally encode the remaining value of the level absolute value (remainder).
  • the image encoding apparatus may be configured to additionally encode a binary value (sign_flag) indicating a sign (positive or negative) of the coefficient level for a non-zero coefficient.
  • the level value expressed using these syntax elements may be calculated by Equation 1 by the image decoding apparatus.
  • Table 2 shows the bit values or number of bits of syntax elements for a level of a non-zero coefficient when using syntax elements according to the first embodiment of the present invention.
  • the remainder column of Table 2 instead of displaying the exact bits (that is, the bit value of abs_remainder) representing the remaining value of the absolute value of a level greater than 3, the remaining value (remainder) itself is indicated, and sign_flag Note that the number of bits required to express the sign_flag flag is indicated in the column (that is, '1' written in the sign_flag column is not a bit value).
  • 1 bit is required to represent the level value '0'
  • 3 bits are required to represent the level absolute value '1'
  • 5 is required to represent the level absolute value '2'.
  • Need a bit That is, from Table 2, when the syntax elements according to the present embodiment are used, one more bit is required to express the level absolute value "2", compared to the H.265 (HEVC) standard, but the level absolute value "5" From the above, it can be seen that fewer bits are required. In particular, since the remainder values for the level absolute value "2N" and the level absolute value "2N + 1" are equal to each other, the larger the level absolute value, the fewer bits are required compared to the H.265 (HEVC) standard. .
  • FIG. 7 to 9 are flowcharts for explaining a coding order of syntax elements according to a first embodiment of the present invention and a method in which a video decoding apparatus determines a level of transform coefficients using the coding order.
  • the flow charts of FIGS. 7 to 9 assume that the position of the last significant coefficient in the coefficient block has already been determined. That is, the image decoding apparatus parses syntax elements (eg, last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix, and last_sig_coeff_y_suffix) regarding the position of the last valid (non-zero) coefficient from the bitstream, and parses the last valid coefficient in the coefficient block State.
  • syntax elements eg, last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix, and last_sig_coeff_y_suffix
  • subblock_sig_flag is inferred as '1' (without parsing) for the subblock in which the last valid coefficient is located, and for the coefficients preceding the last valid coefficient in the scan order in the subblock, FIGS. 7 to 9 follow the flow chart.
  • the subblock_sig_flag is also inferred as '1' (without parsing) for the subblock in which the DC coefficient is located.
  • the flow charts of FIGS. 7 to 9 are followed.
  • the G0_flag value of all coefficients before the last coefficient in the effective sub-block is "0"
  • the G0_flag value of the last coefficient is inferred to be "1" (without parsing).
  • sign_flag may be parsed only after the remaining syntax elements are parsed.
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the related subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficient is present), the video decoding apparatus determines the validity and level of each transform coefficient in the effective subblock in the following manner. Decide.
  • the video decoding apparatus parses G0_flag (that is, greater_than_0_flag or sig_coeff_flag).
  • the video decoding apparatus determines the level of the related transform coefficient as follows. That is, the related transform coefficient is determined as a zero coefficient.
  • G0_flag indicates that the relevant transform coefficient is valid (ie, a non-zero coefficient)
  • the video decoding apparatus parses G1_flag (ie, greater_than_1_flag) and sign_flag.
  • the video decoding apparatus determines the level of the related transform coefficient as follows.
  • the video decoding apparatus determines the level of the related transform coefficient as follows. That is, when the absolute value of the related transform coefficient is 2 or 3, the level of the related transform coefficient is determined as follows.
  • the video decoding apparatus parses abs_remainder indicating the remaining value (remainder) of the level absolute value, and determines the level of the related transform coefficient as follows.
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the relevant subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficients are present), the video decoding apparatus in the following manner, until the last coefficient of the last valid subblock is reached , Effectiveness and level of each transform coefficient in the effective subblock are determined.
  • the apparatus for decoding an image sets all initial values of parameters ( G0_flag, G1_flag, parity_flag, G3_flag, abs_remainder ) representing information about the validity and level of a transform coefficient to be determined to '0' (S803).
  • parameters G0_flag, G1_flag, parity_flag, G3_flag, abs_remainder
  • the values of the corresponding syntax elements are inferred to be equal to "0" by the video decoding apparatus. it means.
  • the video decoding apparatus parses G0_flag (that is, greater_than_0_flag) for the current transform coefficient.
  • the video decoding apparatus When G0_flag indicates that the relevant transform coefficient is valid (that is, the non-zero coefficient), the video decoding apparatus further parses G1_flag (ie, greater_than_1_flag) and sign_flag, and parses the initial values of the parameters G1_flag and sign_flag . Update.
  • G1_flag indicates that the level absolute value of the related transform coefficient is not greater than 1
  • the video decoding apparatus determines the level of the related transform coefficient by substituting the values of related parameters into Equation 1 described above.
  • G1_flag indicates that the level absolute value of the related transform coefficient is greater than 1
  • the video decoding apparatus parses parity_flag and G3_flag (that is, greater_than_3_flag), and updates the initial values of the parameters parity_flag and G3_flag to the parsed value.
  • G3_flag indicates that the level absolute value of the related transform coefficient is not greater than 3
  • the video decoding apparatus determines the level of the related transform coefficient by substituting the values of related parameters into Equation 1 described above.
  • the video decoding apparatus further parses abs_remainder indicating the remainder, and updates the initial value of the parameter abs_remainder to the parsed value. Then, the image decoding apparatus determines the level of the relevant transform coefficient by substituting the values of the relevant parameters into Equation 1 above.
  • G1_flag and sign_flag are parsed for transform coefficients indicating that G0_flag is a non-zero coefficient
  • G1_flag Parity_flag and G3_flag are parsed for related transform coefficients indicating that the level absolute value is greater than 1.
  • abs_remainder is parsed for related transform coefficients in which G3_flag indicates that the level absolute value is greater than 3.
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the relevant subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficients are present), the video decoding apparatus in the following manner, until the last coefficient of the last valid subblock is reached , Effectiveness and level of each transform coefficient in the effective subblock are determined.
  • the apparatus for decoding an image sets all initial values of parameters ( G0_flag, G1_flag, parity_flag, G3_flag, abs_remainder ) representing information about the validity and level of a transform coefficient to be determined to '0'.
  • the setting of such an initial value is such that at least some syntax elements (eg, greater_than_1_flag, parity_flag, greater_than_3_flag, abs_remainder) are not explicitly signaled, the value of the corresponding syntax elements is “0” and The same means that it is inferred by the video decoding apparatus.
  • the video decoding apparatus parses G0_flag for each coefficient of the current effective subblock, and updates the initial value of the parameter G0_flag for each transform coefficient to parsed values.
  • G0_flag the level the absolute value is greater than zero (that is, non-called zero coefficient) for the relevant conversion factor points
  • an image decoding apparatus parses the additional G1_flag and sign_flag, and the initial value of the parameter G1_flag and parameters sign_flag Update initial values with parsed values.
  • the video decoding apparatus parses parity_flag and G3_flag, and updates the initial value of the parameter parity_flag and the initial value of the parameter G3_flag to the parsed value.
  • the video decoding apparatus further parses abs_remainder indicating the remainder, and updates the initial value of the parameter abs_remainder to the parsed value.
  • the video decoding apparatus determines the level by substituting the values of the relevant parameters into Equation 1 described above for each of the transform coefficients.
  • the image encoding apparatus uses syntax elements, listed below, to express the level value of coefficients.
  • greater_than_0_flag is a flag indicating whether the absolute value of the count level is greater than 0 (ie, whether it is a non-zero level) (hereinafter, may also be referred to as a 'G0 flag' or 'sig_coeff_flag'), and greater_than_1_flag is the absolute value of the count level It is a flag indicating whether the value is greater than 1 (hereinafter, may also be referred to as a 'G1 flag').
  • parity_flag is a flag indicating the parity of the count level (that is, whether the level value is odd or even) (hereinafter, also referred to as 'par_level_flag').
  • abs_remainder is a syntax element that indicates the remaining value (remainder) of the absolute value of the coefficient level greater than 1.
  • the image encoding apparatus may be configured to encode a binary value (that is, Greater_than_0_flag) indicating whether the absolute value of the transform coefficient is 0 or greater. If the transform coefficient has an absolute value greater than 0 (that is, if the transform coefficient is a non-zero coefficient), the image encoding apparatus uses a binary value (that is, greater_than_1_flag) indicating whether the absolute value of the transform coefficient is greater than 1 and the transform coefficient It may be configured to additionally encode a binary value (that is, sign_flag) indicating whether the level value is positive or negative.
  • a binary value that is, Greater_than_0_flag
  • the video encoding apparatus displays a value (that is, parity_flag) indicating the parity of the transform coefficient level (that is, the level of the transform coefficient is odd or even) and the absolute value of the transform coefficient level. It may be configured to additionally encode a syntax element (that is, abs_remainder) representing the remaining value (remainder) of.
  • the level value expressed using these syntax elements may be calculated by Equation 2 by the image decoding apparatus.
  • Table 3 shows the bit values or number of bits of syntax elements for the level of the coefficient when using the syntax elements according to the second embodiment of the present invention.
  • the remainder column of Table 3 instead of the exact bits representing the remaining value of the absolute value of the coefficient level greater than 1, the remaining value itself is indicated, and the sign_flag flag is indicated in the sign_flag column. Note that the number of bits required for expression is indicated (that is, "1" written in the sign_flag column is not a bit value).
  • 10 to 12 are flowcharts illustrating a method in which an image decoding apparatus determines a level of transform coefficients, expressed using syntax elements according to a second embodiment of the present invention.
  • the flow charts of FIGS. 10 to 12 assume that the position of the last valid (non-zero) coefficient in the coefficient block has already been determined. That is, the video decoding apparatus parses syntax elements (ie, last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix, and last_sig_coeff_y_suffix) regarding the position of the last valid (non-zero) coefficient from the bitstream, and parses the last effective coefficient in the coefficient block by determining the last valid coefficient in the coefficient block State.
  • subblock_sig_flag is inferred as '1' (without parsing) for the subblock in which the last valid coefficient is located.
  • FIGS. For the coefficients preceding the last valid coefficient in the scan order in the subblock, FIGS. follow the flow chart.
  • subblock_sig_flag is also inferred as '1' (without parsing) for the subblock in which the DC coefficient is located.
  • FIGS. 10 to 12 For all coefficients in the subblock, the flow charts of FIGS. 10 to 12 are followed. 10 to 12, if the G0_flag value of all coefficients before the last coefficient in the valid subblock is "0", the G0_flag value of the last coefficient is inferred to be "1" (without parsing).
  • sign_flag may be parsed last among syntax elements.
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the relevant subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficients are present), the video decoding apparatus in the following manner, until the last coefficient of the last valid subblock is reached , Determine the effectiveness and level of each transform coefficient.
  • the video decoding apparatus parses G0_flag (that is, greater_than_0_flag).
  • the video decoding apparatus determines the level of the related transform coefficient as follows. That is, the related transform coefficient is determined as a zero coefficient.
  • the video decoding apparatus further parses G1_flag and sign_flag for the related transform coefficient.
  • the video decoding apparatus determines the level of the related transform coefficient as follows (S1009).
  • the image decoding apparatus When G1_flag indicates that the level absolute value of the related transform coefficient is greater than 1, the image decoding apparatus further parses parity_flag and abs_remainder. Then, the image decoding apparatus determines the level of the relevant transform coefficient using the following equation (the same as Equation 2).
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the relevant subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficients are present), the video decoding apparatus in the following manner, until the last coefficient of the last valid subblock is reached , Effectiveness and level of each transform coefficient in the effective subblock are determined.
  • the video decoding apparatus sets all initial values of parameters ( G0_flag, G1_flag, parity_flag, abs_remainder ) representing information about the validity and level of the transform coefficient to determine its validity and level to '0'.
  • the image decoding apparatus parses G0_flag (that is, greater_than_0_flag) for the transform coefficient to determine the level value.
  • the video decoding apparatus further parses G1_flag and sign_flag, and updates the initial value of the parameter G1_flag and the initial value of the parameter sign_flag to parsed values. do.
  • G1_flag indicates that the level absolute value of the related transform coefficient is not greater than 1
  • the video decoding apparatus determines the level of the related transform coefficient by substituting the values of related parameters into Equation 1 described above.
  • the image decoding apparatus further parses parity_flag and abs_remainder, and updates the initial value of the parameter parity_flag and the initial value of the parameter abs_remainder with the parsed values. Then, the apparatus for decoding an image determines the level value of the related transform coefficient by substituting the values of related parameters into Equation (2).
  • G1_flag and sign_flag are parsed for transform coefficients indicating that G0_flag is a non-zero coefficient, and then G1_flag is an absolute level value. For related transform coefficients indicating that it is greater than 1, parity_flag and abs_remainder are parsed. As described above, sign_flag may be parsed only after the remaining syntax elements are parsed.
  • the image decoding apparatus parses subblock_sig_flag. If subblock_sig_flag indicates that the related subblock is not a valid subblock, all transform coefficients in the subblock are inferred as zero coefficients. If subblock_sig_flag indicates that the relevant subblock is a valid subblock (ie, a subblock in which at least one non-zero coefficients are present), the video decoding apparatus in the following manner, until the last coefficient of the last valid subblock is reached , Effectiveness and level of each transform coefficient in the effective subblock are determined.
  • the video decoding apparatus sets all initial values of parameters ( G0_flag, G1_flag, parity_flag, abs_remainder ) that express information on the validity and level of all transform coefficients to be determined to '0'.
  • the apparatus for decoding an image parses greater_than_0_flag (that is, G0_flag) for each coefficient of the current effective subblock, and updates the initial value of the parameter G0_flag for each transform coefficient to the parsed value.
  • the video decoding apparatus For each of the relevant transform coefficients where G0_flag indicates that the level absolute value is greater than 0 (ie, non-zero coefficient), the video decoding apparatus further parses G1_flag (ie, greater_than_1_flag) and sign_flag, and the initial values of parameters G1_flag The value and the initial value of sign_flag are updated with parsed values.
  • the video decoding apparatus parses parity_flag and abs_remainder, and updates the initial value of the parameter parity_flag and the initial value of the parameter abs_remainder to the parsed value.
  • the apparatus for decoding an image may determine a level by substituting values of related parameters into Equation 2 described above for each transform coefficient.
  • parity_flag may be used to determine two scalar quantizers used in dependent scalar quantization, which will be described below.
  • Dependent scalar quantization refers to a technique in which a set of available reconstruction values for a transform coefficient depends on the value of the transform coefficient level preceding the current transform coefficient level in reconstruction order. This approach is realized by (a) defining two scalar quantizers with different sets of reconstruction levels and (b) defining the process of switching between the two scalar quantizers.
  • the scalar quantizer is selected through a state machine with four states, where the state is updated based on the parity of the level of transform coefficients preceding in reconstruction order (ie in scan order or coding order). do.
  • FIG. 13 is a diagram illustrating dependent quantization using two scalar quantizers (denoted Q0 and Q1). The location of the available reconstruction levels is uniquely specified by the quantization step size ( ⁇ ).
  • the reconstruction levels of the first quantizer Q0 are given in even integer multiples of the quantization step size [Delta] (ie, with values denoted by 'A' and 'B' in FIG. 13).
  • the reconstructed transform coefficient t ' is calculated according to the following.
  • k denotes an associated transform coefficient level (transmitted quantization index).
  • the reconstruction levels of the second quantizer Q1 are given as odd integer multiples of the quantization step size ( ⁇ ) and zero (ie, with values denoted by 'C' and 'D' in FIG. 13).
  • the reconstructed transform coefficient t ' is calculated according to the following.
  • sgn (k) is the following sign function. That is, if k is 0, sgn (k) is 0, if k is negative, sgn (k) is -1, and if k is positive, sgn (k) is 1.
  • the scalar quantizer (Q0 or Q1) used is not explicitly signaled in the bitstream. Instead, the quantizer used for the current transform coefficient is determined by the parity of the transform coefficient level preceding the current transform coefficient in coding / reconstruction order.
  • switching between two scalar quantizers Q0 and Q1 is realized through a state machine having four states.
  • the state can take four different values: 0, 1, 2, 3.
  • the state of the state machine is uniquely determined by the parity of the transform coefficient level preceding the current transform coefficient in coding / reconstruction order.
  • inverse quantization for a transform block or each subblock within the transform block
  • the state is set to 0.
  • the transform coefficients are reconstructed in the scan order (ie, the same order as entropy decoded).
  • the state of the state machine is updated or transitioned as shown in Fig. 14, where k represents the value of the transform coefficient level. Note that the next state depends only on the current state and the parity (k & 1) of the current transform coefficient level k. Therefore, the status update can be expressed as follows using the parity (k & 1) of the value of the current transform coefficient level.
  • the state on the left side means the next state
  • the state on the right side means the current state.
  • "&" Means the AND operator
  • sateTransTable represents the lookup table shown on the right side of FIG. 14.
  • the status update can be expressed as follows by using the syntax element parity_flag indicating the parity of the value of the current transform coefficient level.
  • the state uniquely specifies the scalar quantizer used. If the state of the current transform coefficient is 0 or 1, the scalar quantizer Q0 is used. Otherwise (i.e. if the state equals 2 or 3), the scalar quantizer Q1 is used.
  • 15 is a flowchart illustrating a method of reconstructing a level of a transform coefficient by an image decoding apparatus when a dependent scalar quantization technique is used.
  • the video decoding apparatus obtains level information about the target effective coefficient from the bitstream, and determines a level value for the target effective coefficient.
  • the level information for the target effective coefficient includes (a) a first syntax element indicating whether the absolute level of the target effective coefficient is greater than 1 (i.e. greater_than_1_flag), and (b) a second syntax element indicating the parity of the target effective coefficient ( That is, parity_flag), (c) a third syntax element (i.e.
  • greater_than_3_flag indicating whether the absolute level of the target effective coefficient is greater than 3
  • a fourth syntax element indicating the remainder of the absolute value of the target effective coefficient ( That is, abs_remainder) and (e) one or more of the fifth syntax element (ie, sign_flag) indicating the sign of the target effective coefficient may be included.
  • the image decoding apparatus performs inverse quantization on the target effective coefficient based on the state of the state machine determined for the valid coefficient preceding the target valid coefficient in the reverse order of the scan order.
  • the image decoding apparatus updates the state of the state machine based on the state machine state determined for the validity coefficient preceding the target validity coefficient and the parity of the target validity coefficient. In particular, when the absolute value of the target validity coefficient is greater than 1, parity of the target validity coefficient indicated by the second syntax element (parity_flag) for the target validity coefficient may be used.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 개시는 변환 블록 내 계수들을 효율적으로 표현하는 것과 관련되어 있다. 본 개시의 일 측면에 따르면, 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 수정된 신택스 엘리먼트들의 세트를 제안한다. 대표도: 도 9

Description

양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치
본 발명은 영상 부호화 또는 복호화에 관한 것으로, 보다 상세하게는, 양자화된 변환 계수들을 효율적으로 표현하는 것과 관련되어 있다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래 기술을 구성하는 것은 아니다.
동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 데이터량이 많기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다. 따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 인코더를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 디코더에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC 약 40% 정도의 부호화 효율을 향상시킨 2013년 초에 제정된 H.265(HEVC; High Efficiency Video Coding) 표준 기술이 존재한다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질화 됨에 따라 보다 효율적인 영상 압축 기술에 대한 논의가 진행되고 있다.
본 개시는 변환 블록 내 계수들을 보다 효율적으로 표현하기 위해, 변환계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 수정된 신택스 엘리먼트들의 세트를 제안하고자 한다.
본 발명의 일 측면에 의하면, 비트스트림으로부터, 변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 획득하는 단계; 및 상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 비트스트림으로부터, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 신택스 엘리먼트들을 획득하는 단계를 포함하는 영상 복호화 방법을 제공한다. 상기 유효 계수들에 대한 레벨 정보를 표현하는 신택스 엘리먼트들은 (a) 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트, (b) 1 보다 큰 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트, (c) 1 보다 큰 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트, 및 (d) 3 보다 큰 유효 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 포함한다.
본 발명의 다른 측면에 의하면, 변환 계수 블록 내 유효 계수들의 레벨 절대값을 결정하는 것을 포함하는 영상 복호화 방법을 제공한다. 상기 영상 복호화 방법은 대상 유효 계수의 절대값이 1 보다 큰지 여부를 가리키는 제 1 신택스 엘리먼트를 파싱하는 단계; 및 상기 제 1 신택스 엘리먼트가 상기 대상 유효 계수의 절대값이 1 보다 크지 않다고 가리키는 경우에, 상기 대상 유효 계수의 레벨 절대값을 1로 결정하는 단계를 포함한다.
상기 영상 복호화 방법은 상기 제 1 신택스 엘리먼트가 상기 대상 유효 계수의 절대값이 1 보다 크다고 가리키는 경우에, 상기 대상 유효 계수의 패리티를 가리키는 제 2 신택스 엘리먼트와 상기 대상 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 가리키는 제 3 신택스 엘리먼트를 파싱하는 단계; 및 상기 제 3 신택스 요소가 상기 대상 유효 계수의 절대값이 3 보다 크지 않다고 가리키는 경우에, 상기 비트스트림으로부터, 제 2 신택스 엘리먼트가 가리키는 상기 대상 유효 계수의 패리티를 기초로 상기 대상 유효 계수의 레벨 절대값을 2 또는 3 중 하나로 결정하는 단계를 포함한다.
또한, 상기 영상 복호화 방법은 상기 제 3 신택스 엘리먼트가 상기 대상 계수의 절대값이 3 보다 크다고 가리키는 경우에, 상기 대상 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 파싱하고, 상기 제 2 신택스 엘리먼트가 가리키는 상기 대상 유효 계수의 패리티와 상기 제 4 신택스 엘리먼트가 가리키는 상기 대상 계수의 레벨 절대값의 나머지를 기초로 상기 대상 유효 계수의 레벨 절대값을 결정하는 단계를 포함한다.
본 발명의 또 다른 측면에 의하면, 명령어들이 기록된 메모리 및 적어도 하나의 프로세서를 포함하는 영상 복호화 장치로서, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 수행될 때, 영상 복호화 장치로 하여금, 전술한 방법들을 실현하도록 구성된, 영상 복호화 장치를 제공한다.
본 발명의 또 다른 측면에 의하면, 변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 부호화하는 단계; 및 상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 신택스 엘리먼트들을 부호화하는 단계를 포함하는 영상 부호화 방법을 제공한다.
본 발명의 또 다른 측면에 의하면, 명령어들이 기록된 메모리 및 적어도 하나의 프로세서를 포함하는 영상 부호화 장치로서, 상기 명령어들은 상기 적어도 하나의 프로세서에 의해 수행될 때, 영상 부호화 장치로 하여금, 전술한 방법을 실현하도록 구성된, 영상 부호화 장치를 제공한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.
도 2는 현재 블록의 주변블록에 대한 예시도이다.
도 3은 정사각형 계수 블록의 양자화된 계수들의 부호화에 이용되는 예시적인 스캔 방식들을 나타낸 도면이다.
도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치에 대한 예시적인 블록도이다.
도 5는 정사각형 계수 블록의 양자화된 계수들의 부호화에 이용되는 예시적인 스캔 방식들을 나타낸 도면이다.
도 6은 diagonal 스캔 방식에 대한 더 상세한 서브 블록 및 계수들의 스캔 순서를 예시한 도면이다.
도 7 내지 도 9는, 영상 복호화 장치가, 본 발명의 제 1 실시예에 따른 신택스 엘리먼트들을 이용하여 표현된, 변환 계수들의 레벨을 결정하는 방법들을 도시한 흐름도이다.
도 10 내지 도 12는, 영상 복호화 장치가, 본 발명의 제 2 실시예에 따른 신택스 엘리먼트들을 이용하여 표현된, 변환 계수들의 레벨을 결정하는 방법들을 도시한 흐름도이다.
도 13은 두 개의 스칼라 양자화기를 사용한 의존적 스칼라 양자화를 예시하는 도면이다.
도 14는 상태 머신의 상태를 기술하는 테이블을 이용하여 2 개의 스칼라 양자화기(Q0 및 Q1) 사이에서의 스위칭을 설명하기 위한 도면이다.
도 15는 의존적 스칼라 양자화 기법이 사용되는 경우에 영상 복호화 장치가 변환 계수의 레벨을 재구성하는 방법을 설명하는 흐름도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.
영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.
블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS 의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.
블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 결정된 크기의 복수 CTU(Coding Tree Unit)로 분할한 이후에, CTU를 트리 구조(tree structure)를 이용하여 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.
트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 하나 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT는 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.
도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할하는 방향과 세로로 분할하는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보를 부호화부(150)에 의해 부호화하여 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할 되지 않았음을 지시하지 않는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할 되었음을 지시하지 않는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT 인지를 구분한다. 분할 타입이 QT인 경우 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우, 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태로는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태를 포함할 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태를 포함할 수도 있다.
CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.
예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.
일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 일반적으로 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.
인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65 개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.
인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.
인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차 블록을 생성한다.
변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차 블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차 블록 내의 잔차 신호들을 잔차 블록의 전체 크기를 변환 단위로 사용하여 변환할 수 있으며, 또는 잔차 블록을 변환 영역 및 비변환 영역인 두 개의 서브 블록으로 구분하여, 변환 영역 서브 블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브 블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브 블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브 블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.
부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화하여 비트스트림을 생성한다. 이러한 부호화는 통상적으로 복수의 가용 스캔 패턴 중 하나를 이용하여 양자화된 변환 계수에 대해 수행된다.
본 개시의 기술들의 일 측면은, 일반적으로, 양자화된 계수들의 어레이인 계수 블록에 대해 (비-제로) 계수들의 레벨을 효율적으로 부호화하는 것과 관련된다. 따라서, 본 개시의 기법들은 부호화부(150)에 의해 수행될 수도 있다. 즉, 예를 들어, 부호화부(150)는 아래의 도 7 내지 도 12에 대해 기술된 본 개시의 기법들을 수행할 수도 있다. 다른 예들에서, 부호화 장치의 하나 이상의 다른 유닛들이 추가적으로 본 개시의 기법들을 수행하는 데 관여할 수도 있다.
부호화부(150)는 블록 분할과 관련된 CTU 사이즈, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.
또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.
역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.
가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.
필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.
디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.
디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원 블록은 메모리(190)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450) 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.
도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출하여 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측 정보와 잔차신호에 대한 정보 등을 추출한다.
복호화부(410)는 SPS (Sequence Parameter Set) 또는 PPS (Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고 CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할 정보를 추출함으로써 CTU를 트리 구조를 이용하여 분할한다.
예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.
또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 가능하며, 반대로 CTU는 다수 번의 QT 분할만 발생할 수도 있다.
다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.
한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다.
예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다.
예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.
한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다. 본 개시의 기술들의 다른 측면은, 일반적으로, 양자화된 계수들의 어레이인 계수 블록에 대해 (비-제로) 계수들의 레벨을 효율적으로 복호화하는 것과 관련된다. 따라서, 본 개시의 소정의 기법들은 복호화부(410)에 의해 수행될 수도 있다. 즉, 예를 들어, 복호화부(410)는 아래의 도 7 내지 도 12에 대해 기술된 본 개시의 기법들을 수행할 수도 있다. 다른 예들에서, 영상 복호화 장치의 하나 이상의 다른 컴포넌트들이 추가적으로 본 개시의 기법들을 수행하는 데 관여할 수도 있다.
역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다. 역양자화부(420)는 변환 계수에 대한 가용한 재구성 값의 세트가 재구성 순서(혹은 스캔 순서의 역순)상 현재 변환 계수에 선행하는 변환 계수의 레벨에 의존하는, 의존적 스칼라 양자화(Dependent scalar quantization) 기법을 사용할 수 있다. 의존적 스칼라 양자화 기법에 대해서는, 도 13 내지 도 15를 참조하여 후술하기로 한다.
또한, 역변환부(430)는 변환 블록의 일부 영역(서브 블록)만 역변환하는 경우, 변환 블록의 서브 블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브 블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브 블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브 블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0"값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.
예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함한다. 인트라 예측부(442)는 현재블록의 예측 타입인 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입인 인트라 예측일 때 활성화된다.
인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.
인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임 벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.
가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.
필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함한다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는, 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원 블록은 메모리(470)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
전술한 바와 같이, 본 개시의 기술들은 변환 및 양자화 프로세스를 통해 얻어진 양자화된 변환 계수들의 어레이인 계수 블록에 대해 계수들을 효율적으로 부호화하고 복호화하는 것과 관련되어 있다. 개시된 기술들의 적어도 일부는 변환을 거치지 않은 잔차 블록에 대해 직접 적용될 수도 있다.
H.265(HEVC) 표준에서, 양자화 프로세스를 거친 양자화된 계수(quantized coefficient)들 중 비-제로(non-zero) 계수의 위치를 표현하기 위한 신택스(syntax) 요소들은 총 6개로 구성된다.
(1) last_sig_coeff_x_prefix
(2) last_sig_coeff_y_prefix
(3) last_sig_coeff_x_suffix
(4) last_sig_coeff_y_suffix
(5) coded_sub_block_flag
(6) sig_coeff_flag
앞의 네 개의 신택스 요소들은 계수 블록 내 스캔 순서상 마지막 비-제로 계수(즉, 마지막 유효 계수; last significant coefficient)의 위치에 관한 것으로, 해당 위치에 대한 x 성분과 y 성분을 각각 별도로 표시하고, 각 성분은 접두어(prefix) 및 접미어(suffix)로 나누어서 표현된다. coded_sub_block_flag는 계수 블록 내 각 4x4 서브 블록이 비-제로 계수를 하나 이상 포함하고 있는지 여부를 가리키는 플래그이다. 계수 블록에 대한 스캔 순서 상 마지막 유효 계수(Last significant coefficient)가 존재하는 마지막 유효 서브 블록(Last significant sub-block)에 선행하는 서브 블록에 한해서 coded_sub_block_flag가 시그널링된다. 여기서, coded_sub_block_flag는 해당 서브 블록 내 모든 계수들이 제로이면 "0", 하나 이상의 비-제로 계수가 존재하면 "1" 로 표시된다.
sig_coeff_flag는, 서브 블록 내 각 계수에 대해, 해당 계수가 비-제로인지 제로인지를 가리키는 플래그이다. sig_coeff_flag는 제로 계수에 대해 "0"으로 표시되고, 비-제로 계수에 대해 "1"로 표시된다. coded_sub_block_flag가 "1"인 경우에, 해당 서브 블록 내 모든 계수들 각각에 대한 sig_coeff_flag 신택스가 시그널링된다.
계수 블록 내의 계수들의 부호화는 통상적으로 복수의 가용한 스캔 방식 중 하나를 이용하여 수행된다. 도 5는 정사각형 계수 블록의 양자화된 계수들의 부호화에 이용되는 예시적인 스캔 방식들을 나타낸 도면이다. 이들 스캔 방식은 대각(diagonal) 방식, 수평(horizontal) 방식, 수직(vertical) 방식을 포함한다. 일반적으로, 부호화 대상 블록(즉, 현재 블록)이 화면간 예측 방식을 사용하여 부호화하는 경우, 해당 계수 블록의 계수들은 up-right diagonal 방식으로 스캐닝되고, 부호화 대상 블록이 화면내 예측 방식으로 부호화한 경우는 화면내 예측 모드에 따라 상기 세 가지 스캔 방식 중 선택된 하나로 해당 계수 블록의 계수들이 스캐닝된다.
예시된 스캔 방식은 계수 블록 내 서브 블록들 및 각 서브 블록 내 계수들에 대해서 동일한 형태의 스캔 패턴을 보인다. 예컨대, 수평(horizontal) 스캔 방식의 경우, 서브 블록들의 스캔 순서도 수평(horizontal) 방식이고, 각 서브 블록 내 계수들의 스캔 순서도 수평(horizontal) 방식이다. 도 6은 diagonal 스캔 방식에 대한 더 상세한 서브 블록 및 계수들의 스캔 순서를 보인다. 다만, 실제 비트스트림에 저장되는 순서는 스캔 순서의 역순으로 저장이 된다. 즉, 도 6의 255번 위치의 화소부터 0번 위치의 화소 순으로 비트스트림에 저장된다. 다시 말해, 이하에서 더 설명되는 바와 같이, 일단 마지막 비-제로 계수 위치가 알려지고 나면, 계수들은, 영상 복호화 장치에 의해, 스캔 패턴 내의 첫 번째 계수쪽으로 스캔 순서의 반대 방향으로 복호화될 수 있다.
H.265(HEVC) 표준에서, 비-제로(non-zero) 계수의 레벨(level)를 표현하기 위한 신택스(syntax) 요소들은 총 4개로 구성된다.
(7) coeff_abs_level_greater1_flag
(8) coeff_abs_level_greater2_flag
(9) coeff_sign_flag
(10) coeff_abs_level_remaining
coeff_abs_level_greater1_flag는 계수 레벨의 절대값이 1 보다 큰지를 알리는 플래그(이하에서 'G1 flag'로도 지칭될 수 있음)이며, coeff_abs_level_greater2_flag는 계수 레벨의 절대값이 2보다 큰지를 알리는 플래그(이하에서 'G2 flag'로도 지칭될 수 있음)이다. coeff_sign_flag는 계수 레벨의 부호(포지티브 또는 네거티브)를 알리는 플래그(이하에서 'Sign flag'로도 지칭될 수 있음)이며, coeff_abs_level_remaining는 2보다 큰 계수 레벨의 절대값의 나머지 값(remainder; 즉, 계수 레벨의 절대값 마이너스 3을 나타내는 값)을 표현하는 신택스 엘리먼트이다.
변환 계수가 유효하면, 영상 부호화 장치는 변환 계수의 값이 0 보다 크거나 또는 작은지 여부를 나타내는 부호 값(즉, Sign flag) 및 변환 계수의 절대값이 1 보다 큰지 여부를 나타내는 이진 값(즉, G1 flag)을 부호화한다. 또한, 변환 계수가 1 보다 큰 절대값을 가지면, 영상 부호화 장치는 변환 계수가 2 보다 큰 절대값을 갖는지 여부를 나타내는 이진 값(즉, G2 flag)을 추가로 부호화한다. 변환 계수가 2 보다 큰 절대값을 가지면, 영상 부호화 장치는 변환 계수의 절대값 마이너스 3을 나타내는 값(즉, remainder)을 추가로 부호화한다.
표 1은, H.265(HEVC) 표준에 따를 때, 변환 계수의 각 레벨들을 표현하는 신택스 엘리먼트들의 비트 값 혹은 비트 수를 보인다. 표 1에서, sig_flag, G1_flag, G2_flag 열들에는 해당 신택스 엘리먼트들의 비트 값들이 표기되어 있다. 그러나, remainder 열에는 2보다 큰 레벨의 절대값의 나머지 값(즉, 레벨 절대값 마이너스 3)을 표현하기 위해 필요한 정확한 비트 수 대신에, "나머지 값 자체"를 표기해 두었음에 유의한다. 다만, 나머지 값이 클수록 이를 표현하기 위해 필요한 비트수도 많을 것임이 자명하다. 그러한 취지에서, 총 비트 수(Total bits) 열의 비트 수는, remainder 열에 표기된 나머지 값 자체를 그 나머지 값을 표현하기 위한 비트 수로 간주하여, 계산되었다. 또한, 표 1에서, sign_flag 열에는 sign_flag 플래그를 표현하기 위해 필요한 비트 수를 표기해 두었음에 유의한다(즉, sign_flag 열에 표기된 '1'은 비트 값이 아닌 비트 수이다).
표 1를 참조하면, H.265(HEVC) 표준에 따를 때, 예를 들어, 레벨 값 0을 표현하기 위해서는 1 비트가 필요하고, 레벨 절대값 1을 표현하기 위해서는 3 비트가 필요하며, 레벨 절대값 2를 표현하기 위해서는 4 비트가 필요하다.
Figure PCTKR2019013186-appb-img-000001
이제, H.265(HEVC) 표준에 대비되는, 본 개시의 기법에 따른, 계수의 레벨(level)를 표현하기 위한 신택스(syntax) 요소들을 설명한다. 더 적은 비트를 요구하면서 유사한 기능을 제공하기 위해, 본 개시는 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 수정된 신택스 엘리먼트들의 세트를 제안한다.
제1실시예
본 실시예에서는 계수들의 레벨(level) 값을 표현하기 위해 아래에 나열된 신택스 엘리먼트들을 사용한다.
(1) greater_than_0_flag
(2) greater_than_1_flag
(3) parity_flag
(4) greater_than_3_flag
(5) abs_remainder
(6) sign_flag
greater_than_0_flag는 계수 레벨의 절대값이 0 보다 큰지 여부(즉, 비-제로 레벨인지 여부)를 알리는 플래그(이하에서 'G0 flag'혹은 'sig_coeff_flag' 로도 지칭될 수 있음)로서, 비-제로 계수에 대해 "1"로 표시되며, 제로 계수에 대해 "0"으로 표시될 수 있다. greater_than_1_flag는 계수 레벨의 절대값이 "1"보다 큰지 여부를 알리는 플래그(이하에서 'G1 flag'로도 지칭될 수 있음)로서, 1 보다 큰 레벨 절대값의 계수에 대해 "1"로 표시되고, 그렇지 않으면 "0"으로 표시될 수 있다. parity_flag는 계수 레벨의 패리티(즉, 레벨 값이 짝수 인지 홀수인지)를 알리는 플래그(이하에서 'par_level_flag'로도 지칭될 수 있음)로서, 홀수의 레벨 값에 대해 "1"로, 짝수의 레벨 값에 대해 "0"으로 표시될 수 있다. greater_than_3_flag는 계수 레벨의 절대값이 3 보다 큰지 여부를 알리는 플래그(이하에서 'G3 flag'로도 지칭될 수 있음)로서, 3 보다 큰 레벨 절대값의 계수에 대해 "1"로, 그렇지 않으면 0으로 표시될 수 있다. abs_remainder는 3 보다 큰 계수 레벨의 절대값의 나머지 값(remainder)을 가리키는 신택스 엘리먼트이다. abs_remainder는 레벨 절대값 "2N"과 레벨 절대값 "2N+1"에 대해 동일한 값으로 표시된다(여기서 N은 2 이상의 자연수). sign_flag는 계수 레벨의 부호(포지티브 또는 네거티브)를 알리는 플래그이다.
따라서, 본 발명의 일 실시예에 따르면, 영상 부호화 장치는 변환 계수의 값이 0 보다 크거나 또는 작은지 여부를 나타내는 이진 값(G0_flag; greater_than_0_flag)을 부호화하도록 구성될 수 있다. 변환 계수가 0 보다 큰 절대값을 가지면(즉, 변환계수가 비-제로 계수이면), 영상 부호화 장치는 그 변환 계수의 절대값이 1 보다 큰지 여부를 나타내는 이진 값(G1_flag; greater_than_1_flag)을 추가로 부호화하도록 구성될 수 있다. 또한, 변환 계수가 1 보다 큰 절대값을 가지면, 영상 부호화 장치는 그 변환 계수가 홀수인지 짝수인지를 나타내는 이진 값(parity_flag)과 변환 계수의 절대값이 3 보다 큰지 여부를 나타내는 이진 값(G3_flag; greater_than_3_flag)을 추가로 부호화하도록 구성될 수 있다. 변환 계수가 3 보다 큰 절대값을 가지면, 영상 부호화 장치는 그 레벨 절대값의 나머지 값(remainder)를 추가로 부호화하도록 구성될 수 있다. 영상 부호화 장치는 비-제로 계수에 대해 그 계수 레벨의 부호(포지티브 또는 네거티브)를 알리는 이진 값(sign_flag)를 추가로 부호화하도록 구성될 수 있다.
이들 신택스 엘리먼트들을 이용하여 표현된 레벨 값은, 영상 복호화 장치에 의해, 수학식 1과 같이 산출될 수 있다.
[수학식 1]
level = (1 - 2*sign_flag) * (G0_flag + G1_flag + parity_flag + 2*G3_flag + 2*abs_remainder)
표 2는 본 발명의 제 1 실시예에 따른 신택스 엘리먼트들을 사용할 때, 비-제로 계수의 레벨(level)에 대한 신택스 엘리먼트들의 비트 값 혹은 비트 수를 보인다. 표 2의 remainder 열에는, 3 보다 큰 level의 절대값의 나머지 값을 표현하는 정확한 비트들(즉, abs_remainder의 비트값)을 표기하는 대신에, 나머지 값(remainder) 자체를 표기해 두었으며, sign_flag 열에는 sign_flag 플래그를 표현하기 위해 필요한 비트 수를 표기해 두었음에 유의한다(즉, sign_flag 열에 표기된 '1'은 비트 값이 아니다).
특히, 3 보다 큰 레벨값들에 대해 시그널링되는 remainder 값들에 있어서, 레벨 절대값 "2N"과 레벨 절대값 "2N+1"에 대한 remainder 값이 서로 동일함에 주목한다. 이들 두 개의 레벨 절대값들은 parity_flag에 의해 구별될 수 있다.
Figure PCTKR2019013186-appb-img-000002
표 2를 참조하면, 예컨대, 레벨 값 '0'을 표현하기 위해서는 1 비트가 필요하고, 레벨 절대값 '1'을 표현하기 위해서는 3 비트가 필요하며, 레벨 절대값 '2'를 표현하기 위해서는 5 비트가 필요하다. 즉, 표 2로부터, 본 실시예에 따른 신택스 엘리먼트들을 사용하면, H.265 (HEVC) 표준에 비해, 레벨 절대값 "2"를 표현하기 위해 1 비트가 더 필요하지만, 레벨 절대값 "5" 이상부터는 더 적은 비트가 필요함을 알 수 있다. 특히, 레벨 절대값 "2N"과 레벨 절대값 "2N+1"에 대한 remainder 값이 서로 동일하기 때문에, 레벨 절대값이 커질수록, H.265 (HEVC) 표준에 비해, 더 적은 비트가 필요하다.
도 7 내지 도 9는, 본 발명의 제1실시예에 따른 신택스 엘리먼트들의 코딩 순서와 이를 이용하여 영상 복호화 장치가 변환 계수들의 레벨을 결정하는 방법들을 설명하기 위한 흐름도이다.
도 7 내지 도 9의 흐름도에서는 계수 블록 내 마지막 유효(비-제로) 계수(last significant coefficient)의 위치가 이미 결정되어 있다는 것을 전제한다. 즉, 영상 복호화 장치는 비트스트림으로부터 마지막 유효(비-제로) 계수의 위치에 관한 신택스 엘리먼트들(예컨대, last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix, 및 last_sig_coeff_y_suffix)를 파싱하여, 계수 블록 내 마지막 유효 계수의 위치를 결정한 상태이다. 또한, 마지막 유효 계수가 위치하는 서브 블록에 대해서는 subblock_sig_flag가 (파싱 없이) '1'로 추론될 뿐, 그 서브 블록 내 스캔 순서상 마지막 유효 계수에 선행하는 계수들에 대해서는, 도 7 내지 도 9의 흐름도를 따른다. DC 계수가 위치하는 서브 블록에 대해서도 subblock_sig_flag가 (파싱 없이) '1'로 추론될 뿐, 서브 블록 내 모든 계수에 대해서는, 도 7 내지 도 9의 흐름도를 따른다. 또한, 유효 서브브록 내 마지막 계수 전까지 모든 계수들의 G0_flag 값이 "0"이라면, 마지막 계수의 G0_flag 값은 (파싱 없이)"1"로 추론된다. 또한, 도 7 내지 도 9의 흐름도에서, sign_flag는 나머지 신택스 엘리먼트들이 파싱된 후에 비로소 파싱될 수도 있다.
도 7의 흐름도에서는, 하나의 변환 계수의 레벨을 표현하는 모든 신택스 엘리먼트들이 다음 스캔 위치로 이동하기 전에 코딩된다.
도 7을 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 유효 서브블록 내 각 변환 계수의 유효성 및 레벨을 결정한다.
먼저, 영상 복호화 장치는, G0_flag(즉, greater_than_0_flag 혹은 sig_coeff_flag)를 파싱한다.
G0_flag가 관련 변환 계수의 레벨 절대값이 0 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다. 즉, 관련 변환계수는 제로 계수로 결정된다.
level = 0
G0_flag가 관련 변환 계수가 유효함(즉, 비-제로 계수임)을 가리키면, 영상 복호화 장치는 G1_flag (즉, greater_than_1_flag)과 sign_flag를 파싱한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다.
level = (1 - 2*sign_flag)
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크다고 가리키면, 영상 복호화 장치는 parity_flag와 G3_flag를 추가로 파싱한다. G3_flag가 관련 변환 계수의 레벨 절대값이 3 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다. 즉, 관련 변환계수의 절대값이 2 또는 3일 때, 관련 변환계수의 레벨은 다음과 같이 결정된다.
level = (1 - 2*sign_flag) * (G0_flag + G1_flag + parity_flag)
G3_flag가 관련 변환 계수의 레벨 절대값이 3 보다 크다고 가리키면, 영상 복호화 장치는, 레벨 절대 값의 나머지 값(remainder)을 나타내는 abs_remainder를 파싱하고, 관련 변환계수의 레벨을 다음과 같이 결정한다.
level = (1 - 2*sign_flag) * (G0_flag + G1_flag + parity_flag + 2*G3_flag + 2*abs_remainder)
다음으로, 도 8을 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 마지막 유효 서브블록의 마지막 계수에 도달할 때까지, 유효 서브블록 내 각 변환 계수의 유효성 및 레벨을 결정한다.
먼저, 영상 복호화 장치는, 결정하고자 하는 변환 계수의 유효성 및 레벨에 관한 정보를 표현하는 파라미터들( G0_flag, G1_flag, parity_flag, G3_flag, abs_remainder)의 초기값을 모두 '0'으로 설정해 둔다(S803). 이는, 적어도 일부 신택스 엘리먼트들(예컨대, greater_than_1_flag, parity_flag, greater_than_3_flag, abs_remainder)이 명시적으로 시그널링되지 않는 계수들에 대해, 해당 신택스 엘리먼트들의 값은, 영상 복호화 장치에 의해, "0"과 같다고 추론됨을 의미한다.
다음으로, 영상 복호화 장치는, 현재의 변환 계수에 대한 G0_flag(즉, greater_than_0_flag)를 파싱한다.
G0_flag가 관련 변환 계수의 레벨 절대값이 0 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다. 즉, 관련 변환계수는 제로 계수로 결정된다(즉, level = 0).
G0_flag가 관련 변환 계수가 유효함(즉, 비-제로 계수임)을 가리키면, 영상 복호화 장치는 G1_flag(즉, greater_than_1_flag)과 sign_flag를 추가로 파싱하고, 파라미터들 G1_flagsign_flag의 초기값을 파싱된 값으로 업데이트한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 파라미터들의 값을 전술한 수학식 1에 대입하여 관련 변환계수의 레벨을 결정한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크다고 가리키면, 영상 복호화 장치는 parity_flag와 G3_flag(즉, greater_than_3_flag)를 파싱하고, 파라미터들 parity_flag와 G3_flag의 초기값을 파싱된 값으로 업데이트한다. G3_flag가 관련 변환 계수의 레벨 절대값이 3 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 파라미터들의 값을 전술한 수학식 1에 대입하여 관련 변환계수의 레벨을 결정한다.
G3_flag가 관련 변환 계수의 레벨 절대값이 3 보다 크다고 가리키면, 영상 복호화 장치는 remainder를 나타내는 abs_remainder를 추가로 파싱하고, 파라미터 abs_remainder의 초기값을 파싱된 값으로 업데이트한다. 그리고 영상 복호화 장치는 관련 파라미터들의 값을 전술한 수학식 1에 대입하여 관련 변환계수의 레벨을 결정한다.
다음으로, 도 9에 예시된 흐름도에서는, 서브블록 내의 모든 변환 계수들에 대해 G0_flag가 파싱된 후, G0_flag가 비-제로 계수임을 가리키는 변환 계수들에 대해 G1_flag와 sign_flag가 파싱되고, 그 후 G1_flag가 레벨 절대값이 1 보다 크다고 가리키는 관련 변환 계수들에 대해 parity_flag와 G3_flag가 파싱된다. 그리고, G3_flag가 레벨 절대값이 3 보다 크다고 가리키는 관련 변환 계수들에 대해, abs_remainder가 파싱된다.
도 9를 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 마지막 유효 서브블록의 마지막 계수에 도달할 때까지, 유효 서브블록 내 각 변환 계수의 유효성 및 레벨을 결정한다.
먼저, 영상 복호화 장치는, 결정하고자 하는 변환 계수의 유효성 및 레벨에 관한 정보를 표현하는 파라미터들( G0_flag, G1_flag, parity_flag, G3_flag, abs_remainder)의 초기값을 모두 '0'으로 설정해 둔다. 전술한 바와 같이, 이러한 초기값의 설정은, 적어도 일부 신택스 엘리먼트들(예컨대, greater_than_1_flag, parity_flag, greater_than_3_flag, abs_remainder)이 명시적으로 시그널링되지 않는 계수들에 대해, 해당 신택스 엘리먼트들의 값이 "0"과 같다고 영상 복호화 장치에 의해 추론됨을 의미한다.
다음으로, 영상 복호화 장치는, 현재의 유효 서브블록의 각 계수들에 대한 G0_flag를 파싱하고, 각 변환계수에 대한 파라미터 G0_flag의 초기값을 파싱된 값들로 업데이트한다.
다음으로, G0_flag가 레벨 절대값이 0 보다 크다고(즉, 비-제로 계수라고) 가리키는 관련 변환 계수에 대해, 영상 복호화 장치는 G1_flag과 sign_flag를 추가로 파싱하고, 파라미터 G1_flag의 초기값과 파라미터 sign_flag의 초기값들을 파싱된 값들로 업데이트한다.
다음으로, G1_flag가 레벨 절대값이 1 보다 크다고 가리키는 관련 변환 계수에 대해, 영상 복호화 장치는 parity_flag와 G3_flag를 파싱하고, 파라미터 parity_flag의 초기값과 파라미터 G3_flag의 초기값을 파싱된 값으로 업데이트한다.
다음으로, G3_flag가 레벨 절대값이 3 보다 크다고 가리키는 관련 변환 계수에 대해, 영상 복호화 장치는 remainder를 나타내는 abs_remainder를 추가로 파싱하고, 파라미터 abs_remainder의 초기값을 파싱된 값으로 업데이트한다.
그 후, 영상 복호화 장치는, 각 변환계수들에 대해, 관련 파라미터들의 값을 전술한 수학식 1에 대입하여, 레벨을 결정한다.
제 2 실시예
본 실시예에서, 영상 부호화 장치는 계수들의 레벨(level) 값을 표현하기 위해, 아래에 나열된, 신택스 엘리먼트들을 사용한다.
(1) greater_than_0_flag
(2) greater_than_1_flag
(3) parity_flag
(4) abs_remainder
(5) sign_flag
greater_than_0_flag는 계수 레벨의 절대값이 0 보다 큰지 여부(즉, 비-제로 레벨인지 여부)를 알리는 플래그(이하에서 'G0 flag'혹은 'sig_coeff_flag' 로도 지칭될 수 있음)이고, greater_than_1_flag는 계수 레벨의 절대값이 1 보다 큰지 여부를 알리는 플래그(이하에서 'G1 flag'로도 지칭될 수 있음)이다. parity_flag는 계수 레벨의 패리티(즉, 레벨 값이 홀수 인지 짝수인지)를 알리는 플래그(이하에서 'par_level_flag'로도 지칭될 수 있음)이다. abs_remainder는 1 보다 큰 계수 레벨의 절대값의 나머지 값(remainder)을 알리는 신택스 엘리먼트이다.
따라서, 제 2 실시예에 따르면, 영상 부호화 장치는 변환 계수의 절대값이 0 큰지 여부를 나타내는 이진 값(즉, Greater_than_0_flag)을 부호화하도록 구성될 수 있다. 변환 계수가 0 보다 큰 절대값을 가지면(즉, 변환 계수가 비-제로 계수이면), 영상 부호화 장치는 변환 계수의 절대값이 1 보다 큰지 여부를 나타내는 이진 값(즉, greater_than_1_flag)과 변환 계수의 레벨 값이 양수인지 음수인지 알리는 이진 값(즉, sign_flag)을 추가로 부호화하도록 구성될 수 있다. 또한, 변환 계수가 1 보다 큰 절대값을 가지면, 영상 부호화 장치는 변환 계수 레벨의 패리티(즉, 변환 계수의 레벨이 홀수인지 짝수인지)를 나타내는 값(즉, parity_flag)과 변환 계수의 레벨 절대값의 나머지 값(remainder)을 표현하는 신택스 엘리먼트(즉, abs_remainder)를 추가로 부호화하도록 구성될 수 있다.
이들 신택스 엘리먼트들을 이용하여 표현된 레벨 값은, 영상 복호화 장치에 의해, 수학식 2와 같이 산출될 수 있다.
[수학식 2]
level = (1 - 2*sign_flag) * (G0_flag + G1_flag + parity_flag + 2* abs_remainder)
표 3은 본 발명의 제 2 실시예에 따른 신택스 엘리먼트들을 사용할 때, 계수의 레벨(level)에 대한 신택스 엘리먼트들의 비트 값 혹은 비트 수를 보인다. 표 2와 동일하게, 표 3의 remainder 열에는, 1 보다 큰 계수 레벨의 절대값의 나머지 값을 표현하는 정확한 비트들을 표기하는 대신에, 나머지 값 자체를 표기해 두었으며, sign_flag 열에는 sign_flag 플래그를 표현하기 위해 필요한 비트 수를 표기해 두었음에 유의한다(즉, sign_flag 열에 표기된 "1"은 비트 값이 아니다).
특히, 1 보다 큰 레벨값들에 대해 시그널링되는 remainder 값들에 있어서, 레벨 절대값 "2N"과 레벨 절대값 "2N+1"에 대한 remainder 값이 서로 동일함에 주목한다. 이들 두 개의 레벨 절대값들은 parity_flag에 의해 구별될 수 있다.
Figure PCTKR2019013186-appb-img-000003
표 3을 참조하면, 예컨대, 레벨 값 '0'을 표현하기 위해서는 1 비트가 필요하고, 레벨 절대값 "1"을 표현하기 위해서는 3 비트가 필요하며, 레벨 절대값 "2"를 표현하기 위해서는 5 비트가 필요하다. 표 3으로부터, 제 2 실시예에 따른 신택스 엘리먼트들을 사용하면, H.265(HEVC) 표준에 비해, 레벨 절대값 "2"를 표현하기 위해 1 비트가 더 필요하지만, 레벨 절대값 '5' 이상부터는 더 적은 비트가 필요함을 알 수 있다.
도10 내지 도 12는, 영상 복호화 장치가, 본 발명의 제 2 실시예에 따른 신택스 엘리먼트들을 이용하여 표현된, 변환 계수들의 레벨을 결정하는 방법들을 도시한 흐름도이다.
도 10 내지 도 12의 흐름도는 계수 블록 내 마지막 유효(비-제로) 계수의 위치가 이미 결정되어 있다는 것을 전제한다. 즉, 영상 복호화 장치는 비트스트림으로부터 마지막 유효(비-제로) 계수의 위치에 관한 신택스 엘리먼트들(즉, last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix, 및 last_sig_coeff_y_suffix)를 파싱하여, 계수 블록 내 마지막 유효 계수의 위치를 결정한 상태이다. 또한, 마지막 유효 계수가 위치하는 서브 블록에 대해서는 subblock_sig_flag가 (파싱 없이) '1'로 추론될 뿐, 그 서브 블록 내 스캔 순서상 마지막 유효 계수에 선행하는 계수들에 대해서는, 도 10 내지 도 12의 흐름도를 따른다. 또한, DC 계수가 위치하는 서브 블록에 대해서도 subblock_sig_flag가 (파싱 없이) '1'로 추론될 뿐, 서브 블록 내 모든 계수에 대해서는, 도 10 내지 도 12의 흐름도를 따른다. 도 10 내지 도 12의 흐름도에서, 유효 서브블록 내 마지막 계수 전까지 모든 계수들의 G0_flag 값이 "0"이라면, 마지막 계수의 G0_flag 값은 (파싱 없이)"1"로 추론된다. 도 10 내지 도 12의 흐름도에서, sign_flag는 신택스 엘리먼트들 중에서 가장 마지막에 파싱될 수도 있다.
도 10 및 도 11의 흐름도들에서는, 하나의 변환 계수의 레벨 절대값을 표현하는 모든 신택스 엘리먼트들이 다음 스캐닝 위치로 이동하기 전에 코딩된다.
도 10을 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 마지막 유효 서브블록의 마지막 계수에 도달할 때까지, 각 변환 계수의 유효성 및 레벨을 결정한다.
먼저, 영상 복호화 장치는, G0_flag(즉, greater_than_0_flag)를 파싱한다.
G0_flag가 관련 변환 계수의 레벨 절대값이 0 보다 크지 않음(즉, 제로 계수임)을 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다. 즉, 관련 변환계수는 제로 계수로 결정된다.
level = 0
G0_flag가 관련 변환 계수가 유효함(즉, 비-제로 계수임)을 가리키면, 영상 복호화 장치는 관련 변환 계수에 대한 G1_flag와 sign_flag를 추가로 파싱한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크지 않다고 가리키면(S1008의 'No'), 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다(S1009).
level = (1 - 2*sign_flag)
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크다고 가리키면, 영상 복호화 장치는 parity_flag와 abs_remainder를 추가로 파싱한다. 그 후, 영상 복호화 장치는 다음 수학식(수학식 2와 동일)을 이용하여 관련 변환계수의 레벨을 결정한다.
level = (1 - 2*sign_flag) * (G0_flag + G1_flag + parity_flag + 2* abs_remainder)
다음으로, 도 11를 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 마지막 유효 서브블록의 마지막 계수에 도달할 때까지, 유효 서브블록 내 각 변환 계수의 유효성 및 레벨을 결정한다.
영상 복호화 장치는, 그 유효성 및 레벨을 결정하고자 하는 변환 계수의 유효성 및 레벨에 관한 정보를 표현하는 파라미터들( G0_flag, G1_flag, parity_flag, abs_remainder)의 초기값을 모두 '0'으로 설정해 둔다.
다음으로, 영상 복호화 장치는, 그 레벨 값을 결정하고자 하는 변환 계수에 대한 G0_flag(즉, greater_than_0_flag)를 파싱한다.
G0_flag가 관련 변환 계수의 레벨 절대값이 0 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 변환계수의 레벨을 다음과 같이 결정한다. 즉, 관련 변환계수는 제로 계수로 결정된다(즉, level = 0).
G0_flag가 관련 변환 계수가 유효함(즉, 비-제로 계수임)을 가리키면, 영상 복호화 장치는 G1_flag과 sign_flag를 추가로 파싱하고, 파라미터 G1_flag의 초기값과 파라미터 sign_flag의 초기값을 파싱된 값들로 업데이트한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크지 않다고 가리키면, 영상 복호화 장치는 관련 파라미터들의 값을 전술한 수학식 1에 대입하여 관련 변환계수의 레벨을 결정한다.
G1_flag가 관련 변환 계수의 레벨 절대값이 1 보다 크다고 가리키면, 영상 복호화 장치는 parity_flag와 abs_remainder를 추가로 파싱하고, 파라미터 parity_flag의 초기값과 파라미터 abs_remainder의 초기값을 파싱된 값들으로 업데이트한다. 그 후, 영상 복호화 장치는 관련 파라미터들의 값을 전술한 수학식 2에 대입하여 관련 변환 계수의 레벨 값을 결정한다.
도 12에 예시된 흐름도에서는, 서브블록 내의 모든 변환 계수들에 대해 G0_flag가 파싱된 후, G0_flag가 비-제로 계수임을 가리키는 변환 계수들에 대해 G1_flag와 sign_flag가 파싱되고, 그 후 G1_flag가 레벨 절대값이 1 보다 크다고 가리키는 관련 변환 계수들에 대해, parity_flag와 abs_remainder가 파싱된다. 전술한 바와 같이, sign_flag는 나머지 신택스 엘리먼트들이 파싱된 후에 비로소 파싱될 수도 있다.
도 12를 참조하면, 영상 복호화 장치는 subblock_sig_flag를 파싱한다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록이 아님을 가리키면, 그 서브블록 내 모든 변환 계수들은 제로 계수로 추론된다. subblock_sig_flag가 관련 서브블록이 유효한 서브블록(즉, 적어도 하나의 비-제로 계수들이 존재하는 서브블록)임을 가리키면, 영상 복호화 장치는 다음과 같은 방식으로, 마지막 유효 서브블록의 마지막 계수에 도달할 때까지, 유효 서브블록 내 각 변환 계수의 유효성 및 레벨을 결정한다.
먼저, 영상 복호화 장치는, 결정하고자 하는 모든 변환 계수의 유효성 및 레벨에 관한 정보를 표현하는 파라미터들( G0_flag, G1_flag, parity_flag, abs_remainder)의 초기값을 모두 '0'으로 설정해 둔다.
다음으로, 영상 복호화 장치는, 현재의 유효 서브블록의 각 계수들에 대해 greater_than_0_flag(즉, G0_flag)를 파싱하고, 각 변환계수에 대한 파라미터 G0_flag의 초기값을 파싱된 값으로 업데이트한다.
G0_flag가 레벨 절대값이 0 보다 크다고(즉, 비-제로 계수라고) 가리키는 관련 변환 계수들 각각에 대해, 영상 복호화 장치는 G1_flag(즉, greater_than_1_flag)과 sign_flag를 추가로 파싱하고, 파라미터들 G1_flag의 초기값과 sign_flag의 초기값을 파싱된 값들로 업데이트한다.
G1_flag가 레벨 절대값이 1 보다 크다고 가리키는 관련 변환 계수 각각에 대해, 영상 복호화 장치는 parity_flag와 abs_remainder를 파싱하고, 파라미터 parity_flag의 초기값과 파라미터 abs_remainder의 초기값을 파싱된 값으로 업데이트한다.
그 후, 영상 복호화 장치는, 각 변환계수들에 대해, 관련 파라미터들의 값을 전술한 수학식 2에 대입하여, 레벨을 결정할 수 있다.
한편, 변환 계수의 레벨을 표현하는 데에 사용된 신택스 엘리먼트들 중에서 parity_flag는 이하에서 설명할 의존적 스칼라 양자화에서 사용되는 두 개의 스칼라 양자화기를 결정하는 데에 사용될 수 있다.
의존적 스칼라 양자화(Dependent scalar quantization)는 변환 계수에 대한 가용한 재구성 값의 세트가 재구성 순서에서 현재 변환 계수 레벨에 선행하는 변환 계수 레벨의 값에 의존하는 기법을 가리킨다. 이러한 접근법은 (a) 상이한 재구성 레벨들의 세트를 갖는 두 개의 스칼라 양자화기(quantizer)를 정의하고 (b) 2 개의 스칼라 양자화기 사이를 스위칭하는 프로세스를 정의함으로써 실현된다. 스칼라 양자화기는 4 개의 상태(state)를 갖는 상태 머신(state machine)을 통해 선택되며, 여기서 상태는 재구성 순서상(즉, 스캔 순서 혹은 코딩 순서상) 선행하는 변환 계수의 레벨의 패리티에 기초하여 업데이트된다.
도 13은 두 개의 스칼라 양자화기(Q0 및 Q1 표기됨)를 사용한 의존적 양자화를 예시하는 도면이다. 가용한 재구성 레벨들의 위치는 양자화 스텝 사이즈(Δ)에 의해 고유하게 특정된다.
제 1 양자화기 Q0의 재구성 레벨들은 양자화 스텝 사이즈(Δ)의 짝수 정수 배들로(즉, 도 13에서 'A'및 'B'로 표시된 값들로) 주어진다. 제 1 양자화기 Q0이 사용될 때, 재구성된 변환 계수 t'는 다음에 따라 계산된다.
t' = 2*k*Δ
여기서, k는 관련된 변환 계수 레벨(전송된 양자화 인덱스)을 나타낸다.
제 2 양자화기 Q1의 재구성 레벨들은 양자화 스텝 크기(Δ)의 홀수 정수 배들과 0으로(즉, 도 13에서 'C'및 'D'로 표시된 값들로) 주어진다. 제 2 양자화기 Q1이 사용될 때, 재구성된 변환 계수 t'는 다음에 따라 계산된다.
t' = (2*k - sgn(k)) *Δ
여기서 sgn(k)은 다음과 같은 부호 함수(signum function)이다. 즉, k가 0이면 sgn(k)는 0이고, k가 음수이면 sgn(k)는 -1이며, k가 양수이면 sgn(k)는 1이다.
sgn(k) = (k == 0 ? 0 : (k < 0 ? -1 : 1))
사용된 스칼라 양자화기(Q0 또는 Q1)는 비트스트림에서 명시적으로 시그널링되지 않는다. 대신에, 현재 변환 계수에 사용된 양자화기는 코딩/재구성 순서상 현재 변환 계수에 선행하는 변환 계수 레벨의 패리티에 의해 결정된다.
도 14에 도시된 바와 같이, 2 개의 스칼라 양자화기(Q0 및 Q1) 사이에서의 스위칭은 4 개의 상태를 갖는 상태 머신을 통해 실현된다. 상태는 0, 1, 2, 3의 네 가지 다른 값을 취할 수 있다. 상태 머신의 상태는 코딩/재구성 순서상 현재 변환 계수보다 선행하는 변환 계수 레벨의 패리티에 의해 고유하게 결정된다. 변환 블록(혹은 변환 블록 내의 각 서브블록)에 대한 역 양자화가 시작될 때, 상태는 0으로 설정된다. 변환 계수는 스캔 순서(즉, 엔트로피 복호화되는 것과 동일한 순서)로 재구성된다. 현재 변환 계수가 재구성 된 후, 상태 머신의 상태는 도 14에 도시된 바와 같이 업데이트 혹은 천이되며, 여기서 k는 변환 계수 레벨의 값을 나타낸다. 다음 상태는 현재 상태 및 현재 변환 계수 레벨 k의 패리티(k & 1)에만 의존한다는 점에 유의한다. 따라서, 현재 변환 계수 레벨의 값의 패리티 (k & 1)를 사용하여 상태 업데이트를 다음과 같이 표현할 수 있다.
state = stateTransTable [state] [k & 1]
여기서, 좌변의 state는 다음 상태, 우변의 state는 현재 상태를 의미한다. "&"는 AND 연산자를 의미하며, sateTransTable은 도 14의 우측에 제시된 룩업 테이블을 나타낸다. 또한, 현재 변환 계수의 레벨 절대값이 1 보다 큰 경우에, 현재 변환 계수 레벨의 값의 패리티를 나타내는 신택스 엘리먼트인 parity_flag를 사용하여, 상태 업데이트를 다음과 같이 표현할 수 있다.
state = stateTransTable [state] [parity_flag]
상태는 사용되는 스칼라 양자화기를 고유하게 특정한다. 현재 변환 계수의 상태가 0 또는 1이면, 스칼라 양자화기 Q0가 사용된다. 그렇지 않으면(즉, 상태가 2 또는 3과 같으면), 스칼라 양자화기 Q1이 사용된다.
도 15는 의존적 스칼라 양자화 기법이 사용되는 경우에 영상 복호화 장치가 변환 계수의 레벨을 재구성하는 방법을 설명하는 흐름도이다.
영상 복호화 장치는 비트스트림으로부터 대상 유효 계수에 대한 레벨 정보를 획득하여, 대상 유효 계수에 대한 레벨 값을 결정한다. 대상 유효 계수에 대한 레벨 정보는 (a) 대상 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트(즉, greater_than_1_flag), (b) 대상 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트(즉, parity_flag), (c) 대상 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트(즉, greater_than_3_flag), (d) 대상 유효 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트(즉, abs_remainder), (e) 대상 유효 계수의 부호를 나타내는 제 5 신택스 엘리먼트(즉, sign_flag) 중 하나 이상의 정보를 포함할 수 있다.
영상 복호화 장치는 스캔 순서의 역순으로 대상 유효 계수에 선행하는 유효 계수에 대해 결정된 상태 머신의 상태에 기초하여, 대상 유효 계수에 대한 역양자화를 수행한다.
영상 복호화 장치는 대상 유효 계수에 선행하는 유효 계수에 대해 결정된 상태 머신의 상태와 대상 유효 계수의 패리티를 기초로, 상태 머신의 상태를 업데이트한다. 특히, 대상 유효 계수의 절대값이 1 보다 큰 경우에, 대상 유효 계수에 대한 제 2 신택스 엘리먼트(parity_flag)가 가리키는 대상 유효 계수의 패리티가 사용될 수 있다.
이상의 설명은 본 발명의 실시예들의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 전술한 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
[CROSS-REFERENCE TO RELATED APPLICATION]
본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2018년 10월 08일 한국에 출원한 특허출원번호 제10-2018-0119888호 및 2019년 09월 25일 한국에 출원한 특허출원번호 제10-2019-0117821호에 대해 우선권을 주장한다.

Claims (16)

  1. 영상 복호화 방법으로서,
    비트스트림으로부터, 변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 획득하는 단계; 및
    상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 비트스트림으로부터, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 신택스 엘리먼트들을 획득하는 단계
    를 포함하고,
    상기 유효 계수들에 대한 레벨 정보를 표현하는 신택스 엘리먼트들은 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트, 1 보다 큰 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트, 1 보다 큰 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트, 및 3 보다 큰 유효 계수의 레벨 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 포함하는 것을 특징으로 하는, 영상 복호화 방법.
  2. 제 1 항에 있어서,
    상기 제 4 신택스 엘리먼트는,
    레벨 절대값 2N과 레벨 절대값 2N+1에 대해(N은 2 이상의 자연수) 동일한 값을 가지는 것을 특징으로 하는, 영상 복호화 방법.
  3. 제 1 항에 있어서,
    상기 신택스 엘리먼트들을 획득하는 단계는,
    상기 제 1 신택스 엘리먼트가 관련 유효 계수의 절대값이 1 보다 크다고 가리키는 경우에, 상기 비트스트림으로부터 상기 관련 유효 계수에 대한 상기 제 2 신택스 엘리먼트와 상기 제 3 신택스 엘리먼트를 획득하는 단계; 및
    상기 제 3 신택스 요소가 상기 관련 유효 계수의 절대값이 3 보다 크지 않다고 가리키는 경우에, 상기 제 2 신택스 엘리먼트가 가리키는 상기 관련 유효 계수의 패리티를 기초로 상기 대상 유효 계수의 레벨 절대값을 2 또는 3 중 하나로 결정하는 단계
    를 포함하는 것을 특징으로 하는, 영상 복호화 방법.
  4. 제 3 항에 있어서,
    상기 신택스 엘리먼트들을 획득하는 단계는,
    상기 제 3 신택스 엘리먼트가 상기 관련 유효 계수의 절대값이 3 보다 크다고 가리키는 경우에, 상기 비트스트림으로부터 상기 관련 유효 계수에 대한 상기 제 4 신택스 엘리먼트를 획득하고, 상기 제 2 신택스 엘리먼트가 가리키는 상기 관련 유효 계수의 패리티와 상기 제 4 신택스 엘리먼트가 가리키는 상기 관련 유효 계수의 레벨 절대값의 나머지를 기초로, 상기 관련 유효 계수의 레벨 절대값을 결정하는 단계를 포함하는 것을 특징으로 하는, 영상 복호화 방법.
  5. 제 4 항에 있어서,
    상기 특정 서브 블록 내에서 스캔 순서상 상기 관련 유효 계수에 선행하는 유효 계수에 대해 결정된 상태 머신(state machine)의 상태에 기초하여, 상기 관련 유효 계수에 대한 역양자화를 수행하는 단계를 더 포함하는, 영상 복호화 방법.
  6. 제 5 항에 있어서,
    상기 관련 유효 계수의 역양자화된 계수 레벨은,
    역양자화 레벨들의 두 세트 중에서 상기 상태 머신의 상태에 따라 결정되는 하나의 세트에 포함된 역양자화 레벨들로 제한되는 것을 특징으로 하는, 영상 복호화 방법.
  7. 제 5 항에 있어서,
    상기 관련 유효 계수에 선행하는 유효 계수에 대해 결정된 상기 상태 머신의 상태와 상기 제 2 신택스 엘리먼트가 가리키는 상기 관련 유효 계수의 패리티를 기초로, 상기 상태 머신의 상태를 업데이트하는 단계를 더 포함하는, 영상 복호화 방법.
  8. 제 3 항에 있어서,
    상기 신택스 엘리먼트들을 획득하는 단계는,
    상기 제 1 신택스 엘리먼트가 상기 관련 유효 계수의 절대값이 1 보다 크지 않다고 가리키는 경우에, 상기 관련 유효 계수의 레벨 절대값을 1로 설정하는 단계를 더 포함하는 것을 특징으로 하는, 영상 복호화 방법.
  9. 제 1 항에 있어서,
    상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 상기 유효 계수가 존재하지 않음을 나타내는 경우에, 상기 특정 서브 블록에 속하는 모든 계수들을 0으로 설정하는 단계를 더 포함하는 것을 특징으로 하는, 영상 복호화 방법.
  10. 변환 계수 블록 내 유효 계수들의 레벨 절대값을 결정하는 것을 포함하는 영상 복호화 방법으로서,
    대상 유효 계수의 절대값이 1 보다 큰지 여부를 가리키는 제 1 신택스 엘리먼트를 파싱하는 단계;
    상기 제 1 신택스 엘리먼트가 상기 대상 유효 계수의 절대값이 1 보다 크지 않다고 가리키는 경우에, 상기 대상 유효 계수의 레벨 절대값을 1로 결정하는 단계;
    상기 제 1 신택스 엘리먼트가 상기 대상 유효 계수의 절대값이 1 보다 크다고 가리키는 경우에, 상기 대상 유효 계수의 패리티를 가리키는 제 2 신택스 엘리먼트와 상기 대상 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 가리키는 제 3 신택스 엘리먼트를 파싱하는 단계;
    상기 제 3 신택스 요소가 상기 대상 유효 계수의 절대값이 3 보다 크지 않다고 가리키는 경우에, 상기 비트스트림으로부터, 제 2 신택스 엘리먼트가 가리키는 상기 대상 유효 계수의 패리티를 기초로 상기 대상 유효 계수의 레벨 절대값을 2 또는 3 중 하나로 결정하는 단계; 및
    상기 제 3 신택스 엘리먼트가 상기 대상 계수의 절대값이 3 보다 크다고 가리키는 경우에, 상기 대상 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 파싱하고, 상기 제 2 신택스 엘리먼트가 가리키는 상기 대상 유효 계수의 패리티와 상기 제 4 신택스 엘리먼트가 가리키는 상기 대상 계수의 레벨 절대값의 나머지를 기초로 상기 대상 유효 계수의 레벨 절대값을 결정하는 단계
    를 포함하는, 영상 복호화 방법.
  11. 제 10 항에 있어서,
    스캔 순서의 역순으로 상기 대상 유효 계수에 선행하는 유효 계수에 대해 결정된 상태 머신(state machine)의 상태에 기초하여, 상기 대상 유효 계수에 대한 역양자화를 수행하는 단계를 더 포함하는, 영상 복호화 방법.
  12. 제 11 항에 있어서,
    상기 대상 유효 계수의 역양자화된 계수 레벨은,
    2개의 스칼라 양자화기 중에서 상기 상태 머신의 상태에 따라 결정되는 하나의 스칼라 양자화기가 제공하는 가용한 역양자화 레벨들로 제한되는 것을 특징으로 하는, 영상 복호화 방법.
  13. 제 11 항에 있어서,
    상기 제 2 신택스 엘리먼트가 가리키는 상기 대상 유효 계수의 패리티와 상기 대상 유효 계수에 선행하는 유효 계수에 대해 결정된 상기 상태 머신의 상태를 기초로, 상기 상태 머신의 상태를 업데이트하는 단계를 더 포함하는, 영상 복호화 방법.
  14. 영상 복호화 장치로서,
    비트스트림으로부터, 변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 획득하는 수단; 및
    상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 비트스트림으로부터, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 표현하는 신택스 엘리먼트들을 획득하는 수단
    을 포함하며,
    상기 유효 계수들에 대한 레벨 정보를 표현하는 신택스 엘리먼트들은 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트, 1 보다 큰 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트, 1 보다 큰 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트, 및 3 보다 큰 유효 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 포함하는 것을 특징으로 하는, 영상 복호화 장치.
  15. 영상 부호화 방법으로서,
    변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 부호화하는 단계; 및
    상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 부호화하는 단계
    를 포함하고,
    상기 유효 계수들에 대한 레벨 정보는 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트, 1 보다 큰 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트, 1 보다 큰 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트, 및 3 보다 큰 유효 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 포함하는 것을 특징으로 하는, 영상 부호화 방법.
  16. 영상 부호화 장치로서,
    변환 블록 내에 포함된 복수의 서브블록들 중 특정 서브 블록에 적어도 하나의 0이 아닌 유효 계수가 존재하는지 여부를 나타내는 상기 특정 서브 블록에 대한 유효도 정보를 부호화하는 수단; 및
    상기 특정 서브 블록의 유효도 정보가 상기 특정 서브 블록에 적어도 하나의 유효 계수가 존재함을 나타내는 경우에, 상기 특정 서브 블록 내의 각 계수들에 대한 유효도 정보, 유효 계수들에 대한 레벨 정보, 및 유효 계수들에 대한 부호 정보를 부호화하는 수단
    를 포함하고,
    상기 유효 계수들에 대한 레벨 정보는 유효 계수의 레벨 절대값이 1 보다 큰지 여부를 나타내는 제 1 신택스 엘리먼트, 1 보다 큰 유효 계수의 패리티를 나타내는 제 2 신택스 엘리먼트, 1 보다 큰 유효 계수의 레벨 절대값이 3 보다 큰지 여부를 나타내는 제 3 신택스 엘리먼트, 및 3 보다 큰 유효 계수의 절대값의 나머지를 나타내는 제 4 신택스 엘리먼트를 포함하는 것을 특징으로 하는, 영상 부호화 장치.
PCT/KR2019/013186 2018-10-08 2019-10-08 양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치 WO2020076049A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20180119888 2018-10-08
KR10-2018-0119888 2018-10-08
KR10-2019-0117821 2019-09-25
KR1020190117821A KR20200040192A (ko) 2018-10-08 2019-09-25 양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치

Publications (1)

Publication Number Publication Date
WO2020076049A1 true WO2020076049A1 (ko) 2020-04-16

Family

ID=70165031

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/013186 WO2020076049A1 (ko) 2018-10-08 2019-10-08 양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치

Country Status (1)

Country Link
WO (1) WO2020076049A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818046A (zh) * 2021-01-25 2021-05-18 同济大学 一种基于轨交云控的非时空数据变换归集处理系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160150234A1 (en) * 2014-11-26 2016-05-26 Qualcomm Incorporated Palette mode coding
KR20170139560A (ko) * 2015-04-23 2017-12-19 오스텐도 테크놀로지스 인코포레이티드 완전 시차 광 필드 디스플레이 시스템들을 위한 방법들 및 장치들

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160150234A1 (en) * 2014-11-26 2016-05-26 Qualcomm Incorporated Palette mode coding
KR20170139560A (ko) * 2015-04-23 2017-12-19 오스텐도 테크놀로지스 인코포레이티드 완전 시차 광 필드 디스플레이 시스템들을 위한 방법들 및 장치들

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHOI, JUNG-AH ET AL.: "Throughput Improvement on CABAC for Depth Videos with Modified Level Coding", JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 . JCT3V-B0123. 2ND MEETING, 19 October 2012 (2012-10-19), Shanghai, CN, pages 1 - 6 *
SCHWARZ, HEIKO ET AL.: "Description of Core Experiment 7 (CE 7): Quantization and coefficient coding", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11. JVET-K1027_ V3. 11TH MEETING, 18 July 2018 (2018-07-18), Ljubljana, SI, pages 1 - 16 *
SCHWARZ, HEIKO ET AL.: "Non-CE7: Alternative Entropy Coding for Dependent Quantization", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11. JVET-K0072_V2. 11TH MEETING, 18 July 2018 (2018-07-18), Ljubljana, SI, pages 1 - 17 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818046A (zh) * 2021-01-25 2021-05-18 同济大学 一种基于轨交云控的非时空数据变换归集处理系统及方法

Similar Documents

Publication Publication Date Title
WO2018128322A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2012081879A1 (ko) 인터 예측 부호화된 동영상 복호화 방법
WO2020185004A1 (ko) 예측 유닛을 서브 유닛들로 분할하여 예측하는 인트라 예측 방법 및 장치
WO2016159610A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016048092A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016114583A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016064123A1 (ko) 비디오 신호 처리 방법 및 장치
WO2021071183A1 (ko) 현재블록의 변환계수들을 역변환하는 방법 및 장치
WO2016122251A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016122253A1 (ko) 비디오 신호 처리 방법 및 장치
WO2021167340A1 (ko) 크로마 신호의 리샘플링에 기반하는 영상 부호화 및 복호화
WO2021025478A1 (ko) 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
WO2020231228A1 (ko) 영상 복호화 장치에서 이용하는 역양자화장치 및 방법
WO2021060801A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2016204479A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2020076049A1 (ko) 양자화된 변환 계수들의 부호화 및 복호화를 위한 방법 및 장치
WO2021060804A1 (ko) 크로마블록의 잔차블록 복원 방법 및 복호화 장치
WO2021118309A1 (ko) 비디오 신호 처리 방법 및 장치
WO2020185027A1 (ko) 데이터 블록에 변환 생략 모드를 효율적으로 적용하기 위한 방법 및 장치
WO2020122573A1 (ko) 필터링 방법 및 영상 복호화 장치
WO2022108422A1 (ko) 적응적 참조화소 선택을 이용한 영상 부호화 및 복호화 방법
WO2021040430A1 (ko) 차등 부호화를 이용하는 비디오 부호화 및 복호화
WO2022108421A1 (ko) 적응적 대체 모드를 이용한 영상 부호화 및 복호화 방법
WO2020231225A1 (ko) 색차블록을 복원하는 방법 및 영상 복호화 장치
WO2020256510A1 (ko) 코딩 툴들을 제어하는 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19870276

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19870276

Country of ref document: EP

Kind code of ref document: A1