WO2018135885A1 - 변환 처리를 제공하는 영상 복호화 및 부호화 방법 - Google Patents

변환 처리를 제공하는 영상 복호화 및 부호화 방법 Download PDF

Info

Publication number
WO2018135885A1
WO2018135885A1 PCT/KR2018/000867 KR2018000867W WO2018135885A1 WO 2018135885 A1 WO2018135885 A1 WO 2018135885A1 KR 2018000867 W KR2018000867 W KR 2018000867W WO 2018135885 A1 WO2018135885 A1 WO 2018135885A1
Authority
WO
WIPO (PCT)
Prior art keywords
transform
block
inverse
unit
inverse transform
Prior art date
Application number
PCT/KR2018/000867
Other languages
English (en)
French (fr)
Inventor
임정윤
Original Assignee
가온미디어 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170009168A external-priority patent/KR20180085526A/ko
Application filed by 가온미디어 주식회사 filed Critical 가온미디어 주식회사
Priority claimed from KR1020180006762A external-priority patent/KR20190088338A/ko
Publication of WO2018135885A1 publication Critical patent/WO2018135885A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • the present invention relates to image encoding and decoding, and more particularly, to a method for performing prediction and transformation by dividing a moving picture into a plurality of blocks.
  • one picture is divided into a plurality of blocks having a predetermined size and encoding is performed.
  • inter prediction and intra prediction techniques that remove redundancy between pictures are used to increase compression efficiency.
  • a residual signal is generated by using intra prediction and inter prediction, and the reason for obtaining the residual signal is that when coding with the residual signal, the amount of data is small and the data compression ratio is high, and the better the prediction, the residual signal. This is because the value of becomes small.
  • the intra prediction method predicts data of the current block by using pixels around the current block.
  • the difference between the actual value and the predicted value is called the residual signal block.
  • the intra prediction method is increased from nine prediction modes used in H.264 / AVC to 35 prediction modes to further refine the prediction.
  • the most similar block is found by comparing the current block with blocks in neighboring pictures.
  • the position information (Vx, Vy) of the found block is called a motion vector.
  • the difference between pixel values in a block between the current block and the prediction block predicted by the motion vector is called a residual signal block (motion-compensated residual block).
  • the amount of data of the residual signal is reduced, but the amount of computation for processing a video has greatly increased.
  • the present invention has been made to solve the above problems, and an object thereof is to provide an image processing method suitable for encoding and decoding high resolution images and providing an efficient conversion, and an image decoding and encoding method using the same.
  • a plurality of coding units in which a picture of an image is a basic unit in which inter prediction or intra prediction is performed Determining an inverse transform target block for decoding the coding unit divided into the plurality of frames) and split the picture or the divided coding unit into a binary tree structure; And adaptively selecting any one of a plurality of transform sets including one or more transform functions according to the block information for the inverse transform target block.
  • An image decoding apparatus for solving the above problems includes a plurality of coding units that are basic units on which inter prediction or intra prediction is performed on a picture of an image.
  • a picture divider for dividing the picture or the split coding unit into a binary tree structure;
  • a transform set determiner for adaptively selecting any one of a plurality of transform sets including at least one transform function according to block information on an inverse transform target block corresponding to the coding unit.
  • An image encoding method for solving the above problems, a plurality of coding units that are a basic unit in which inter prediction or intra prediction is performed on a picture of an image Dividing the picture or the split coding unit into a binary tree structure; Determining a transform target block for the split coding unit; And adaptively selecting any one of a plurality of transform sets including at least one transform function corresponding to the transform target block.
  • a coding unit which is a basic unit on which inter prediction or intra prediction is performed, may be divided into quad tree and binary tree structures, and in determining a transform function of a transform block for the divided coding unit, By using a transform set adaptively selected according to the information, bit saving and conversion efficiency can be improved, and coding efficiency for a high resolution image can be improved.
  • each target block may be adaptively and selectively determined by determining a configuration of a transform coefficient, a determination of a scanning order, and a replacement method for a second inverse transform for each target block. It is possible to provide an efficient encoding and decoding method for determining whether or not to efficiently perform secondary transform, and thus scanning and transform processing.
  • FIG. 1 is a block diagram illustrating a configuration of an image encoding apparatus according to an embodiment of the present invention.
  • 2 to 5 are diagrams for describing a first exemplary embodiment of a method of dividing and processing an image in block units.
  • FIG. 6 is a block diagram illustrating an embodiment of a method of performing inter prediction in an image encoding apparatus.
  • FIG. 7 is a block diagram illustrating a configuration of an image decoding apparatus according to an embodiment of the present invention.
  • FIG. 8 is a block diagram illustrating an embodiment of a method of performing inter prediction in an image decoding apparatus.
  • FIG. 9 is a diagram for describing a second exemplary embodiment of a method of dividing and processing an image into blocks.
  • FIG. 10 is a diagram illustrating an embodiment of a syntax structure used to divide and process an image in block units.
  • FIG. 11 is a diagram for describing a third exemplary embodiment of a method of dividing and processing an image into blocks.
  • FIG. 12 is a diagram for describing an embodiment of a method of configuring a transform unit by dividing a coding unit into a binary tree structure.
  • FIG. 13 is a diagram for describing a fourth exemplary embodiment of a method of dividing and processing an image into blocks.
  • 14 to 16 are diagrams for describing still another example of a method of dividing and processing an image into blocks.
  • 17 and 18 are diagrams for describing embodiments of a method of determining a partition structure of a transform unit by performing rate distortion optimization (RDO).
  • RDO rate distortion optimization
  • FIG. 19 is a diagram for explaining a first embodiment of a block-based adaptive loop filtering method according to the present invention.
  • FIG. 20 is a diagram for describing a second embodiment of a block-based adaptive loop filtering method according to the present invention.
  • FIG. 21 illustrates a prediction mode of block division according to an embodiment of the present invention
  • FIG. 22 is a flowchart illustrating an operation of a decoding apparatus for performing block-based adaptive inverse transform according to an embodiment of the present invention.
  • FIG. 23 is a diagram conceptually illustrating a transform set determiner according to an embodiment of the present invention.
  • 24 is a flowchart illustrating an operation of a decoding apparatus according to another embodiment of the present invention.
  • 25 is a diagram illustrating in more detail the inverse transform unit according to an embodiment of the present invention.
  • 26 and 27 are flowcharts illustrating an operation of an inverse transform unit according to an exemplary embodiment of the present invention.
  • FIG. 28 is a diagram illustrating an inverse transform unit according to another exemplary embodiment.
  • FIG. 29 is a flowchart illustrating an operation of an inverse transform unit according to another exemplary embodiment.
  • 30 to 32 are conceptual diagrams for explaining block adaptive transform and inverse transform according to whether a terminal node according to an embodiment of the present invention.
  • 33 illustrates an example of a syntax for supporting block adaptive inverse transform according to an embodiment of the present invention.
  • 34 and 35 are block diagrams for describing an encoding and decoding system according to another embodiment of the present invention.
  • 36 is a diagram schematically illustrating an inverse quantization / inverse transform unit 220 of a decoding apparatus 20 according to another embodiment of the present invention.
  • FIG. 37 is a flowchart illustrating a transform coefficient configuration-based inverse transform process according to an embodiment of the present invention.
  • 38 is a flowchart illustrating an operation of determining whether to perform a second inverse transform by the inverse quantization / inverse transform unit 220 using a predetermined condition.
  • 39 and 40 are diagrams for describing scanning order determination using a transform coefficient obtained by a transform coefficient constitution unit 305 according to an embodiment of the present invention.
  • 41 to 42 are diagrams for explaining the conversion coefficient substitution processing of the conversion coefficient substitution unit 315.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component.
  • each component shown in the embodiments of the present invention are shown independently to represent different characteristic functions, and do not mean that each component is made of separate hardware or one software component unit.
  • each component is included in each component for convenience of description, and at least two of the components may be combined into one component, or one component may be divided into a plurality of components to perform a function.
  • Integrated and separate embodiments of the components are also included within the scope of the present invention without departing from the spirit of the invention.
  • the components may not be essential components for performing essential functions in the present invention, but may be optional components for improving performance.
  • the present invention can be implemented including only the components essential for implementing the essentials of the present invention except for the components used for improving performance, and the structure including only the essential components except for the optional components used for improving performance. Also included in the scope of the present invention.
  • the image encoding apparatus 10 may include a picture divider 110, a transform unit 120, a quantization unit 130, and a scanning unit.
  • the picture dividing unit 110 analyzes an input video signal, divides a picture into coding units, determines a prediction mode, and determines a size of a prediction unit for each coding unit.
  • the picture splitter 110 sends the prediction unit to be encoded to the intra predictor 150 or the inter predictor 160 according to a prediction mode (or a prediction method). In addition, the picture dividing unit 110 sends the prediction unit to be encoded to the subtracting unit 190.
  • a picture of an image may be composed of a plurality of slices, and the slice may be divided into a plurality of coding tree units (CTUs) which are basic units for dividing a picture.
  • CTUs coding tree units
  • the coding tree unit may be divided into one or two coding units (CUs), which are basic units on which inter prediction or intra prediction is performed.
  • CUs coding units
  • the coding unit may be divided into one or more prediction units (PUs), which are basic units on which prediction is performed.
  • PUs prediction units
  • the encoding apparatus 10 determines one of inter prediction and intra prediction as a prediction method for each of the divided coding units (CUs), but differently predicts a prediction block for each prediction unit (PU). Can be generated.
  • the coding unit CU may be divided into one or two transform units (TUs), which are basic units for transforming a residual block.
  • TUs transform units
  • the picture dividing unit 110 may transmit the image data to the subtracting unit 190 in a block unit (for example, a prediction unit (PU) or a transformation unit (TU)) divided as described above.
  • a block unit for example, a prediction unit (PU) or a transformation unit (TU) divided as described above.
  • a coding tree unit (CTU) having a maximum size of 256 ⁇ 256 pixels may be divided into a quad tree structure and divided into four coding units (CUs) having a square shape.
  • the four coding units (CUs) having the square shape may be re-divided into quad tree structures, respectively, and the depth of the coding units CU divided into quad tree structures as described above may be any one of 0 to 3. It can have one integer value.
  • the coding unit CU may be divided into one or two or more prediction units (PUs) according to the prediction mode.
  • the prediction unit PU may have a size of 2Nx2N shown in FIG. 3A or NxN shown in FIG. 3B. have.
  • the prediction unit PU when the size of the coding unit CU is 2Nx2N, the prediction unit PU is 2Nx2N shown in FIG. 4A, 2NxN shown in FIG. 4B, and FIG. 4.
  • Nx2N shown in (c) of FIG. 4 NxN shown in (d) of FIG. 4, 2NxnU shown in (e) of FIG. 4, 2NxnD shown in (f) of FIG. 4, shown in (g) of FIG. It may have a size of any one of nLx2N and nRx2N shown in (h) of FIG.
  • the coding unit CU may be divided into a quad tree structure and divided into four transform units TUs having a square shape.
  • the four transform units (TUs) having a square shape may be re-divided into quad tree structures, and the depth of the transform units (TUs) divided into quad tree structures as described above may be any one of 0 to 3. It can have one integer value.
  • the prediction unit PU and the transform unit TU split from the coding unit CU may have a partition structure that is independent of each other.
  • the transform unit TU split from the coding unit CU cannot be larger than the size of the prediction unit PU.
  • the transform unit TU divided as described above may have a maximum size of 64x64 pixels.
  • the transform unit 120 converts a residual block that is a residual signal between the original block of the input prediction unit PU and the prediction block generated by the intra predictor 150 or the inter predictor 160, and the transform is performed. It may be performed using the unit (TU) as a basic unit.
  • different transform matrices may be determined according to a prediction mode (intra or inter), and since the residual signal of intra prediction has a direction according to the intra prediction mode, the transform matrix may be adaptively determined according to the intra prediction mode. have.
  • the transform unit may be transformed by two (horizontal and vertical) one-dimensional transform matrices. For example, in the case of inter prediction, one predetermined transform matrix may be determined.
  • intra prediction when the intra prediction mode is horizontal, the probability of the residual block having the directionality in the vertical direction increases, so a DCT-based integer matrix is applied in the vertical direction, and DST-based or in the horizontal direction. Apply KLT-based integer matrix.
  • an integer matrix based on DST or KLT may be applied in the vertical direction and a DCT based integer matrix in the horizontal direction.
  • a DCT based integer matrix may be applied in both directions.
  • a transform matrix may be adaptively determined based on the size of a transform unit (TU).
  • the quantization unit 130 determines a quantization step size for quantizing the coefficients of the residual block transformed by the transform matrix, and the quantization step size may be determined for each quantization unit having a predetermined size or more.
  • the size of the quantization unit may be 8x8 or 16x16, and the quantization unit 130 quantizes coefficients of the transform block using a quantization matrix determined according to the quantization step size and the prediction mode.
  • the quantization unit 130 may use the quantization step size of the quantization unit adjacent to the current quantization unit as the quantization step size predictor of the current quantization unit.
  • the quantization unit 130 may search for the left quantization unit, the upper quantization unit, and the upper left quantization unit of the current quantization unit and generate a quantization step size predictor of the current quantization unit using one or two valid quantization step sizes. have.
  • the quantization unit 130 may determine a valid first quantization step size found in the order as a quantization step size predictor, or determine an average value of two valid quantization step sizes found in the order as a quantization step size predictor, or If only one quantization step size is valid, this may be determined as a quantization step size predictor.
  • the quantization unit 130 transmits a difference value between the quantization step size and the quantization step size predictor of the current quantization unit to the entropy encoder 140.
  • the left coding unit, the upper coding unit, the upper left coding unit of the current coding unit does not all exist. Or there may be a coding unit previously present in the coding order within the largest coding unit.
  • candidates may be quantization step sizes of the quantization units adjacent to the current coding unit and the quantization unit immediately before the coding order within the maximum coding unit.
  • priority is set in the order of 1) the left quantization unit of the current coding unit, 2) the upper quantization unit of the current coding unit, 3) the upper left quantization unit of the current coding unit, and 4) the quantization unit immediately preceding the coding order.
  • the order may be reversed and the upper left quantization unit may be omitted.
  • the transform block quantized as described above is transferred to the inverse quantization unit 135 and the scanning unit 131.
  • the scanning unit 131 scans the coefficients of the quantized transform block and converts them into one-dimensional quantization coefficients. In this case, since the distribution of coefficients of the transform block after quantization may depend on the intra prediction mode, the scanning method is applied to the intra prediction mode. Can be determined accordingly.
  • the coefficient scanning scheme may be determined differently according to the size of the transform unit, and the scan pattern may vary according to the directional intra prediction mode, in which case the scanning order of the quantization coefficients may be scanned in the reverse direction.
  • the same scan pattern may be applied to the quantization coefficients in each subset, and a zigzag scan or a diagonal scan may be applied to the scan patterns between the subsets.
  • the scan pattern is preferably scanned in the forward direction from the main subset including DC to the remaining subsets, but the reverse direction is also possible.
  • a scan pattern between subsets may be set to be identical to a scan pattern of quantized coefficients in a subset, and the scan pattern between subsets may be determined according to an intra prediction mode.
  • the encoding apparatus 10 may include information indicative of the position of the last non-zero quantization coefficient and the position of the last non-zero quantization coefficient in each subset in the transform unit PU to include the decoding apparatus ( 20).
  • the inverse quantization unit 135 inverse quantizes the quantized coefficients as described above, and the inverse transform unit 125 performs inverse transformation in units of transform units (TUs) to restore the inverse quantized transform coefficients into a residual block of a spatial domain. can do.
  • TUs transform units
  • the adder 195 may generate a reconstructed block by adding the residual block reconstructed by the inverse transform unit 125 and the received prediction block from the intra predictor 150 or the inter predictor 160.
  • the post-processing unit 170 may perform a deblocking filtering process to remove a blocking effect occurring in the reconstructed picture, and a sample adaptive offset to compensate for a difference value from the original image in units of pixels.
  • a SAO) application process and a coding unit can perform an adaptive loop filtering (ALF) process to compensate for a difference value from an original image.
  • ALF adaptive loop filtering
  • the deblocking filtering process may be applied to the boundary of the prediction unit (PU) or transform unit (TU) having a size of a predetermined size or more.
  • the deblocking filtering process may include determining a boundary to filter, determining a boundary filtering strength to be applied to the boundary, determining whether to apply a deblocking filter, If it is determined to apply the deblocking filter, the method may include selecting a filter to be applied to the boundary.
  • whether the deblocking filter is applied depends on whether i) the boundary filtering intensity is greater than 0 and ii) the degree of change of pixel values at the boundary portions of two blocks (P block, Q block) adjacent to the boundary to be filtered.
  • the value represented may be determined by whether the value is smaller than the first reference value determined by the quantization parameter.
  • the said filter is at least 2 or more.
  • a filter that performs relatively weak filtering is selected.
  • the second reference value is determined by the quantization parameter and the boundary filtering intensity.
  • sample adaptive offset (SAO) application process is to reduce the distortion (distortion) between the pixel and the original pixel in the image to which the deblocking filter is applied, the sample adaptive offset (SAO) application process in the unit of picture or slice. Whether to perform may be determined.
  • the picture or slice may be divided into a plurality of offset regions, and an offset type may be determined for each offset region, and the offset type may be a predetermined number of edge offset types (eg, four) and two band offsets. It can include a type.
  • the offset type is an edge offset type
  • an edge type to which each pixel belongs is determined and an offset corresponding thereto is applied
  • the edge type may be determined based on a distribution of two pixel values adjacent to the current pixel. have.
  • the adaptive loop filtering (ALF) process may perform filtering based on a value obtained by comparing a reconstructed image and an original image that have undergone a deblocking filtering process or an adaptive offset application process.
  • the picture storage unit 180 receives the post-processed image data from the post-processing unit 170 and restores the image in a picture unit, and the picture may be an image in a frame unit or an image in a field unit.
  • the inter prediction unit 160 may perform motion estimation using at least one or more reference pictures stored in the picture storage unit 180, and may determine a reference picture index and a motion vector indicating the reference picture.
  • a prediction block corresponding to a prediction unit to be encoded may be extracted from a reference picture used for motion estimation among a plurality of reference pictures stored in the picture storage unit 180 according to the determined reference picture index and the motion vector. have.
  • the intra predictor 150 may perform intra prediction encoding by using the reconstructed pixel value inside the picture in which the current prediction unit is included.
  • the intra prediction unit 150 may receive the current prediction unit to be predictively encoded, and perform intra prediction by selecting one of a preset number of intra prediction modes according to the size of the current block.
  • the intra predictor 150 adaptively filters the reference pixel to generate the intra prediction block, and generates reference pixels using the available reference pixels when the reference pixel is not available.
  • the entropy encoder 140 may entropy encode quantization coefficients quantized by the quantizer 130, intra prediction information received from the intra predictor 150, motion information received from the inter predictor 160, and the like. .
  • FIG. 6 is a block diagram illustrating an example of a configuration for performing inter prediction in the encoding apparatus 10.
  • the inter prediction encoder illustrated in FIG. 6 includes a motion information determiner 161 and a motion information encoding mode determiner 162.
  • FIG. 6 Motion information encoder 163, prediction block generator 164, residual block generator 165, residual block encoder 166, and multiplexer 167.
  • the motion information determiner 161 determines motion information of the current block, the motion information includes a reference picture index and a motion vector, and the reference picture index is any one of a previously coded and reconstructed picture. Can be represented.
  • the current block When the current block is unidirectional inter prediction coded, it represents one of the reference pictures belonging to list 0 (L0), and when the current block is bidirectional predictively coded, it is a reference picture indicating one of the reference pictures of list 0 (L0). It may include an index and a reference picture index indicating one of the reference pictures of the list 1 (L1).
  • the current block when the current block is bidirectional predictively coded, the current block may include an index indicating one or two pictures of reference pictures of the composite list LC generated by combining the list 0 and the list 1.
  • the motion vector indicates a position of a prediction block in a picture indicated by each reference picture index, and the motion vector may be in pixel units (integer units) or sub pixel units.
  • the motion vector may have a precision of 1/2, 1/4, 1/8 or 1/16 pixels, and if the motion vector is not an integer unit, the prediction block may be generated from pixels of an integer unit. Can be.
  • the motion information encoding mode determiner 162 may determine an encoding mode for the motion information of the current block as one of a skip mode, a merge mode, and an AMVP mode.
  • the skip mode is applied when there are skip candidates having the same motion information as the motion information of the current block and the residual signal is 0.
  • the skip mode is that the current block, which is the prediction unit PU, has a size equal to that of the coding unit CU. Can be applied when
  • the merge mode is applied when there is a merge candidate having the same motion information as the motion information of the current block, and the merge mode includes a residual signal when the current block has a different size or the same size as the coding unit CU. Applies in the case. Meanwhile, the merge candidate and the skip candidate may be the same.
  • the AMVP mode is applied when the skip mode and the merge mode are not applied, and an AMVP candidate having a motion vector most similar to the motion vector of the current block may be selected as an AMVP predictor.
  • the motion information encoder 163 may encode motion information according to a method determined by the motion information encoding mode determiner 162.
  • the motion information encoder 163 may perform a merge motion vector encoding process when the motion information encoding mode is a skip mode or a merge mode, and may perform an AMVP encoding process when the motion information encoding mode is an AMVP mode.
  • the prediction block generator 164 generates a prediction block by using the motion information of the current block.
  • the prediction block generator 164 copies the block corresponding to the position indicated by the motion vector in the picture indicated by the reference picture index, and then copies the current block. Generate a predictive block of.
  • the prediction block generator 164 may generate pixels of the prediction block from integer unit pixels in a picture indicated by the reference picture index.
  • the prediction pixel may be generated using an 8-tap interpolation filter for the luminance pixel, and the prediction pixel may be generated using a 4-tap interpolation filter for the chrominance pixel.
  • the residual block generator 165 generates a residual block using the current block and the prediction block of the current block.
  • the residual block generator 165 uses the prediction block having a size of 2Nx2N corresponding to the current block and the current block. You can create a block.
  • the size of the current block used for prediction is 2NxN or Nx2N
  • the last prediction block of 2Nx2N size using the two 2NxN prediction blocks Can be generated.
  • a 2Nx2N sized residual block may be generated using the 2Nx2N sized prediction block, and overlap smoothing is applied to the pixels of the boundary part to eliminate discontinuity of the boundary parts of two prediction blocks having 2NxN size. Can be.
  • the residual block encoder 166 may divide the residual block into one or more transform units (TUs) so that each transform unit TU may be transform encoded, quantized, and entropy encoded.
  • TUs transform units
  • the residual block encoder 166 may transform the residual block generated by the inter prediction method using an integer-based transform matrix, and the transform matrix may be an integer-based DCT matrix.
  • the residual block encoder 166 uses a quantization matrix to quantize coefficients of the residual block transformed by the transform matrix, and the quantization matrix may be determined by a quantization parameter.
  • the quantization parameter is determined for each coding unit CU having a predetermined size or more, and when the current coding unit CU is smaller than the predetermined size, the first coding unit in the coding order among the coding units CU within the predetermined size ( Since only the quantization parameter of the CU) is encoded and the quantization parameter of the remaining coding unit CU is the same as the above parameter, it may not be encoded.
  • coefficients of the transform block may be quantized using a quantization matrix determined according to the quantization parameter and the prediction mode.
  • the quantization parameter determined for each coding unit CU having a predetermined size or more may be predictively encoded using the quantization parameter of the coding unit CU adjacent to the current coding unit CU.
  • a quantization parameter predictor of the current coding unit CU may be generated by searching in the order of the left coding unit CU and the upper coding unit CU of the current coding unit CU using one or two valid quantization parameters. have.
  • the first valid quantization parameter found in the above order may be determined as a quantization parameter predictor, and the left first coding unit (CU) is searched in order of the coding unit immediately before the coding order to quantize the first valid quantization parameter. Can be determined by the parameter predictor.
  • the coefficients of the quantized transform block are scanned and converted into one-dimensional quantization coefficients, and the scanning scheme may be set differently according to the entropy encoding mode.
  • inter prediction coded quantization coefficients may be scanned in a predetermined manner (zigzag or diagonal raster scan) when coded with CABAC, and different from the above method when coded with CAVLC. Can be.
  • the scanning method may be determined according to zigzag in case of inter, the intra prediction mode in case of intra, and the coefficient scanning method may be determined differently according to the size of a transform unit.
  • the scan pattern may vary according to the directional intra prediction mode, and the scanning order of the quantization coefficients may be scanned in the reverse direction.
  • the multiplexer 167 multiplexes the motion information encoded by the motion information encoder 163 and the residual signals encoded by the residual block encoder 166.
  • the motion information may vary according to an encoding mode.
  • the motion information may include only an index indicating a predictor, and in the case of AMVP, the motion information may include a reference picture index, a differential motion vector, and an AMVP index of the current block. .
  • the intra prediction unit 150 receives the prediction mode information and the size of the prediction unit PU from the picture division unit 110, and stores the reference pixel in the picture storage unit to determine the intra prediction mode of the prediction unit PU. Read from 180.
  • the intra predictor 150 determines whether a reference pixel is generated by examining whether there is a reference pixel that is not available, and the reference pixels may be used to determine an intra prediction mode of the current block.
  • pixels adjacent to the upper side of the current block are not defined. If the current block is located at the left boundary of the current picture, pixels adjacent to the left of the current block are not defined. It may be determined that the pixels are not available pixels.
  • the current block is located at the slice boundary and pixels adjacent to the upper or left side of the slice are not pixels that are first encoded and reconstructed, it may be determined that the pixels are not usable pixels.
  • the intra prediction mode of the current block may be determined using only the available pixels.
  • reference pixels at positions that are not available may be generated using the available reference pixels of the current block.
  • the upper pixels may be used using some or all of the left pixels. Can be generated and vice versa.
  • the reference pixel is generated by copying the available reference pixel at the position closest to the predetermined direction from the reference pixel at the position not available, or when the reference pixel is not available in the predetermined direction, the closest in the opposite direction.
  • the reference pixel can be generated by copying the available reference pixel at the location.
  • the upper or left pixels of the current block it may be determined as a reference pixel that is not available according to the encoding mode of the block to which the pixels belong.
  • the pixels may be determined as not available pixels.
  • reference pixels usable may be generated using pixels belonging to a block in which a block adjacent to the current block is intra-encoded, and the encoding apparatus 10 may determine that the reference pixels are available according to an encoding mode. It transmits to the decoding apparatus 20.
  • the intra predictor 150 determines the intra prediction mode of the current block by using the reference pixels, and the number of intra prediction modes allowable in the current block may vary depending on the size of the block.
  • the size of the current block is 8x8, 16x16, 32x32, there may be 34 intra prediction modes. If the size of the current block is 4x4, there may be 17 intra prediction modes.
  • the 34 or 17 intra prediction modes may be configured of at least one non-directional mode (non-directional mode) and a plurality of directional modes.
  • One or more non-directional modes may be DC mode and / or planar mode.
  • DC mode and the planner mode are included in the non-directional mode, there may be 35 intra prediction modes regardless of the size of the current block.
  • DC mode and planner mode two non-directional modes (DC mode and planner mode) and 33 directional modes may be included.
  • the prediction block of the current block is formed by using at least one pixel value (or a prediction value of the pixel value, hereinafter referred to as a first reference value) and reference pixels positioned at the bottom-right side of the current block. Is generated.
  • the configuration of an image decoding apparatus may be derived from the configuration of the image encoding apparatus 10 described with reference to FIGS. 1 to 6. For example, as described with reference to FIGS. 1 to 6. By performing the same processes of the same image encoding method in reverse, the image can be decoded.
  • the decoding apparatus 20 includes an entropy decoding unit 210, an inverse quantization / inverse transform unit 220, an adder 270, The deblocking filter 250, the picture storage unit 260, the intra predictor 230, the motion compensation predictor 240, and the intra / inter switch 280 are provided.
  • the entropy decoder 210 receives and decodes a bit stream encoded by the image encoding apparatus 10, divides the bit stream into intra prediction mode indexes, motion information, quantization coefficient sequences, and the like, and decodes the decoded motion information into a motion compensation predictor ( 240).
  • the entropy decoder 210 transmits the intra prediction mode index to the intra predictor 230 and the inverse quantization / inverse transform unit 220, and transmits the inverse quantization coefficient sequence to the inverse quantization / inverse transform unit 220.
  • the inverse quantization / inverse transform unit 220 converts the quantization coefficient sequence into inverse quantization coefficients of a two-dimensional array, and selects one of a plurality of scanning patterns for the transformation, for example, the prediction mode of the current block (ie, , Intra prediction or inter prediction), and a scanning pattern may be selected based on the intra prediction mode.
  • the prediction mode of the current block ie, Intra prediction or inter prediction
  • the inverse quantization / inverse transform unit 220 restores the quantization coefficients by applying a quantization matrix selected from a plurality of quantization matrices to the inverse quantization coefficients of the two-dimensional array.
  • a quantization matrix may be selected based on at least one of the prediction mode and the intra prediction mode of the current block for the same size block.
  • the inverse quantization / inverse transform unit 220 inversely transforms the reconstructed quantization coefficients to reconstruct the residual block, and the inverse transform process may be performed using a transform unit (TU) as a basic unit.
  • TU transform unit
  • the adder 270 reconstructs the image block by adding the residual block reconstructed by the inverse quantization / inverse transform unit 220 and the prediction block generated by the intra predictor 230 or the motion compensation predictor 240.
  • the deblocking filter 250 may perform deblocking filter processing on the reconstructed image generated by the adder 270 to reduce deblocking artifacts due to image loss due to the quantization process.
  • the picture storage unit 260 is a frame memory for storing a local decoded image on which the deblocking filter process is performed by the deblocking filter 250.
  • the intra predictor 230 restores the intra prediction mode of the current block based on the intra prediction mode index received from the entropy decoder 210, and generates a prediction block according to the restored intra prediction mode.
  • the motion compensation predictor 240 generates a prediction block for the current block from the picture stored in the picture storage unit 260 based on the motion vector information, and applies the selected interpolation filter when a motion compensation with a small precision is applied. Can be generated.
  • the intra / inter switch 280 may provide the adder 270 with the prediction block generated by either the intra predictor 230 or the motion compensation predictor 240 based on the encoding mode.
  • FIG. 8 is a block diagram illustrating an example of a configuration of performing inter prediction in the image decoding apparatus 20.
  • the inter prediction decoder includes a demultiplexer 241, a motion information encoding mode determiner 242, and a merge mode motion.
  • An information decoder 243, an AMVP mode motion information decoder 244, a prediction block generator 245, a residual block decoder 246, and a reconstruction block generator 247 are included.
  • the de-multiplexer 241 demultiplexes the currently encoded motion information and the encoded residual signals from the received bitstream, and transmits the demultiplexed motion information to the motion information encoding mode determiner 242.
  • the demultiplexed residual signal may be transmitted to the residual block decoder 246.
  • the motion information encoding mode determiner 242 determines the motion information encoding mode of the current block. If the skip_flag of the received bitstream has a value of 1, the motion information encoding mode determiner 242 determines that the motion information encoding mode of the current block is encoded as the skip encoding mode. can do.
  • the motion information encoding mode determiner 242 determines the motion information encoding mode of the current block. It may be determined that is encoded in the merge mode.
  • the motion information encoding mode determiner 242 has a skip_flag of the received bitstream having a value of 0, and the motion information received from the demultiplexer 241 has a reference picture index, a differential motion vector, and an AMVP index. In this case, it may be determined that the motion information encoding mode of the current block is encoded in the AMVP mode.
  • the merge mode motion information decoder 243 is activated when the motion information encoding mode determiner 242 determines that the motion information encoding mode of the current block is a skip or merge mode, and the AMVP mode motion information decoder 244 moves.
  • the information encoding mode determiner 242 may be activated when the motion information encoding mode of the current block is determined to be an AMVP mode.
  • the prediction block generator 245 generates the prediction block of the current block by using the motion information reconstructed by the merge mode motion information decoder 243 or the AMVP mode motion information decoder 244.
  • the prediction block of the current block may be generated by copying a block corresponding to the position indicated by the motion vector in the picture indicated by the reference picture index.
  • pixels of the prediction block are generated from integer unit pixels in the picture indicated by the reference picture index.
  • an interpolation filter of 8 taps is used for a luminance pixel and a color difference pixel
  • Predictive pixels may be generated using a 4-tap interpolation filter.
  • the residual block decoder 246 entropy decodes the residual signal and inversely scans the entropy decoded coefficients to generate a two-dimensional quantized coefficient block, and the inverse scanning scheme may vary according to an entropy decoding scheme.
  • the reverse scanning method may be applied in a diagonal raster inverse scan manner and in the case of the CAVLC-based decoding in a zigzag inverse scanning manner.
  • the inverse scanning scheme may be determined differently according to the size of the prediction block.
  • the residual block decoder 246 dequantizes the coefficient block generated as described above using an inverse quantization matrix, and reconstructs a quantization parameter to derive the quantization matrix.
  • the quantization step size may be reconstructed for each coding unit of a predetermined size or more.
  • the residual block decoder 260 inversely transforms the inverse quantized coefficient block to restore the residual block.
  • the reconstruction block generation unit 270 generates a reconstruction block by adding the prediction block generated by the prediction block generation unit 250 and the residual block generated by the residual block decoding unit 260.
  • the intra prediction mode of the current block is decoded from the received bitstream, and for this purpose, the entropy decoder 210 may reconstruct the first intra prediction mode index of the current block by referring to one of the plurality of intra prediction mode tables. Can be.
  • any one table selected according to the distribution of intra prediction modes for a plurality of blocks adjacent to the current block may be applied.
  • the first intra prediction mode index of the current block is restored by applying the first intra prediction mode table, and not the same. Otherwise, the second intra prediction mode table may be applied to restore the first intra prediction mode index of the current block.
  • the intra prediction modes of the upper block and the left block of the current block are both the directional intra prediction mode
  • the direction of the intra prediction mode of the upper block and the direction of the intra prediction mode of the left block If within this predetermined angle, the first intra prediction mode index is restored by applying the first intra prediction mode table, and if outside the predetermined angle, the first intra prediction mode index is applied by applying the second intra prediction mode table. You can also restore.
  • the entropy decoder 210 transmits the first intra prediction mode index of the reconstructed current block to the intra predictor 230.
  • the intra prediction unit 230 that receives the index of the first intra prediction mode may determine the maximum possible mode of the current block as the intra prediction mode of the current block when the index has the minimum value (ie, 0). .
  • the intra prediction unit 230 compares the index indicated by the maximum possible mode of the current block with the first intra prediction mode index, and as a result of the comparison, the first intra prediction mode. If the index is not smaller than the index indicated by the maximum possible mode of the current block, the intra prediction mode corresponding to the second intra prediction mode index obtained by adding 1 to the first intra prediction mode index is determined as the intra prediction mode of the current block. Otherwise, the intra prediction mode corresponding to the first intra prediction mode index may be determined as the intra prediction mode of the current block.
  • the intra prediction mode allowable for the current block may consist of at least one non-directional mode (non-directional mode) and a plurality of directional modes.
  • One or more non-directional modes may be DC mode and / or planar mode.
  • either DC mode or planner mode may be adaptively included in the allowable intra prediction mode set.
  • information specifying the non-directional mode included in the allowable intra prediction mode set may be included in the picture header or the slice header.
  • the intra predictor 230 reads reference pixels from the picture storage unit 260 to generate an intra prediction block, and determines whether there is a reference pixel that is not available.
  • the determination may be performed according to the presence or absence of reference pixels used to generate the intra prediction block by applying the decoded intra prediction mode of the current block.
  • the intra predictor 230 may generate reference pixels at positions that are not available using the available reference pixels reconstructed in advance.
  • Definition of a reference pixel that is not available and a method of generating the reference pixel may be the same as the operation of the intra prediction unit 150 of FIG. 1, but generate an intra prediction block according to the decoded intra prediction mode of the current block.
  • the reference pixels used to selectively recover may be selectively restored.
  • the intra prediction unit 230 determines whether to apply a filter to the reference pixels to generate the prediction block, that is, whether to apply filtering to the reference pixels to generate the intra prediction block of the current block. It may be determined based on the decoded intra prediction mode and the size of the current prediction block.
  • the problem of blocking artifacts is that the larger the block size is, the larger the block size can increase the number of prediction modes for filtering the reference pixels, but if the block is larger than the predetermined size can be seen as a flat area, the complexity is reduced The reference pixel may not be filtered for.
  • the intra predictor 230 filters the reference pixels by using a filter.
  • At least two or more filters may be adaptively applied according to the degree of difference between the steps between the reference pixels.
  • the filter coefficient of the filter is preferably symmetrical.
  • the above two filters may be adaptively applied according to the size of the current block.
  • a narrow bandwidth filter is used for a small block
  • a wide bandwidth filter is used for a large block. May be applied.
  • the filter does not need to be applied to the reference pixel, and the image is horizontal. It may not be necessary to apply a filter to the reference pixel even in a horizontal mode that is correlated in the direction.
  • the reference pixel may be adaptively filtered based on the intra prediction mode of the current block and the size of the prediction block.
  • the intra prediction unit 230 generates a prediction block using reference pixels or filtered reference pixels according to the reconstructed intra prediction mode, and the generation of the prediction block is the same as the operation of the encoding apparatus 10. As such, detailed description thereof will be omitted.
  • the intra prediction unit 230 determines whether to filter the generated prediction block, and the filtering may be determined by using information included in a slice header or a coding unit header or according to an intra prediction mode of the current block.
  • the intra predictor 230 may generate a new pixel by filtering pixels at a specific position of the generated prediction block by using available reference pixels adjacent to the current block. .
  • a prediction pixel in contact with reference pixels among the prediction pixels may be filtered using a reference pixel in contact with the prediction pixel.
  • the prediction pixels are filtered using one or two reference pixels according to the positions of the prediction pixels, and the filtering of the prediction pixels in the DC mode may be applied to the prediction blocks of all sizes.
  • prediction pixels in contact with the left reference pixel among the prediction pixels of the prediction block may be changed by using reference pixels other than the upper pixel used to generate the prediction block.
  • the prediction pixels in contact with the upper reference pixel among the generated prediction pixels may be changed using reference pixels other than the left pixel used to generate the prediction block.
  • the current block may be reconstructed using the prediction block of the current block reconstructed and the residual block of the decoded current block.
  • FIG. 9 illustrates a second exemplary embodiment of a method of dividing and processing an image into blocks.
  • a coding tree unit (CTU) having a maximum size of 256 ⁇ 256 pixels may be first divided into a quad tree structure and divided into four coding units (CUs) having a square shape.
  • At least one of the coding units divided into the quad tree structure may be divided into a binary tree structure and re-divided into two coding units (CUs) having a rectangular shape.
  • At least one of the coding units divided into the quad tree structure may be divided into a quad tree structure and re-divided into four coding units (CUs) having a square shape.
  • CUs coding units
  • At least one of the coding units re-divided into the binary tree structure may be divided into two binary tree structures and divided into two coding units (CUs) having a square or rectangular shape.
  • At least one of the coding units re-divided into the quad tree structure may be divided into a quad tree structure or a binary tree structure and divided into coding units (CUs) having a square or rectangular shape.
  • the binary partitioned CU may include a coding block (CB), which is a block unit that actually performs encoding / decoding, and syntax corresponding to the coding block. That is, the sizes of the prediction unit PU and the transform unit TU belonging to the coding block CB as shown in FIG. 9 may be equal to the size of the coding block CB.
  • CB coding block
  • the coding unit split into the quad tree structure as described above may be split into one or two prediction units (PUs) using the method described with reference to FIGS. 3 and 4.
  • the coding unit divided into the quad tree structure as described above may be divided into one or more transform units (TUs) by using the method as described with reference to FIG. 5, and the divided transform units (TU) May have a maximum size of 64x64 pixels.
  • FIG. 10 illustrates an embodiment of a syntax structure used to divide and process an image in block units.
  • a block structure according to an embodiment of the present invention may be determined through split_cu_flag indicating whether a quad tree is split and binary_split_flag indicating whether a binary tree is split.
  • whether to split the coding unit CU as described above may be indicated using split_cu_flag.
  • the binary_split_flag indicating whether the binary division is performed and the syntax indicating the division direction may be determined in response to the binary division CU.
  • a method of indicating the directionality of binary division a method of determining a split direction based on decoding a plurality of syntaxes such as binary_split_hor and binary_split_ver or decoding a syntax and a corresponding signal value such as binary_split_mode, Horizontal (0)
  • a method of processing division in the vertical (1) direction may be illustrated.
  • the depth of a coding unit (CU) split using a binary tree may be represented using binary_depth.
  • FIGS. 1 through 8 for blocks divided by the method as described with reference to FIGS. 9 and 10 (eg, coding unit (CU), prediction unit (PU), and transform unit (TU)).
  • coding unit CU
  • prediction unit PU
  • transform unit TU
  • the coding unit CU may be divided into a binary tree structure and divided into transform units (TUs) which are basic units for transforming a residual block.
  • TUs transform units
  • At least one of rectangular coding blocks CU 0 and Cu 1 divided into a binary tree structure and having a size of N ⁇ 2N or 2N ⁇ N may be divided into a binary tree structure and thus have a size of N ⁇ N. It can be divided into square transform units (TU 0 , TU 1 ) with.
  • the block-based image encoding method may perform prediction, transform, quantization, and entropy encoding steps.
  • a prediction signal may be generated by referring to a block currently performing encoding and an existing coded image or a neighboring image, and thus a difference signal between the current block and the current block may be calculated.
  • the difference signal is input, and the transform is performed using various transform functions.
  • the transformed signal is classified into DC coefficients and AC coefficients and is energy compacted to improve encoding efficiency. Can be.
  • quantization may be performed by inputting transform coefficients, and then an image may be encoded by performing entropy encoding on the quantized signal.
  • the image decoding method is performed in the reverse order of the above encoding process, the image quality distortion may occur in the quantization step.
  • the size or shape of a transform unit (TU) and the type of transform function to be applied may be varied according to the distribution of the differential signal input to the input and the characteristics of the image in the conversion step. have.
  • a difference is measured using a cost measurement method such as a sum of absolute difference (SAD) or a mean square error (MSE).
  • SAD sum of absolute difference
  • MSE mean square error
  • the signal distribution may occur in various forms according to the characteristics of the image.
  • effective encoding can be performed by selectively determining the size or shape of the transform unit CU based on the distribution of various differential signals to perform the transform.
  • the coding unit CUx is divided into a binary tree structure as shown in (b). By dividing into two transform units (TUs), an efficient transform can be performed.
  • TUs transform units
  • the DC value generally represents an average value of the input signal, so that when a differential signal as shown in FIG. 12A is received as an input of the conversion process, two coding units CUx are provided.
  • transform units TUs
  • a square coding unit CU 0 having a size of 2N ⁇ 2N may be divided into a binary tree structure and divided into rectangular transform units TU 0 and TU 1 having a size of N ⁇ 2N or 2N ⁇ N. .
  • the step of dividing the coding unit (CU) into a binary tree structure may be repeated two or more times to divide the coding unit (CU) into a plurality of transform units (TUs).
  • a rectangular coding block CB 1 having a size of Nx2N is divided into a binary tree structure, and a block having a size of the divided NxN is further divided into a binary tree structure to N / 2xN or NxN /.
  • the block having a size of N / 2xN or NxN / 2 is further divided into a binary tree structure and square transform units having a size of N / 2xN / 2 (TU 1). , TU 2 , TU 4 , and TU 5 ).
  • a square coding unit CU 0 having a size of 2Nx2N is divided into a binary tree structure, and a block having a size of Nx2N is further divided into a binary tree structure to have a square having a size of NxN.
  • the block having a size of NxN may be divided into a binary tree structure and divided into rectangular transform units TU 1 and TU 2 having a size of N / 2xN.
  • a rectangular coding unit CU 0 having a size of 2N ⁇ N is divided into a binary tree structure, and a block having a size of the divided N ⁇ N is further divided into a quad tree structure to form N / 2 ⁇ N / 2. It can be divided into square transform units TU 1 , TU 2 , TU 3 , and TU 4 having a size.
  • FIGS. 1 through 8 See FIGS. 1 through 8 for blocks divided by the method as described with reference to FIGS. 11 through 16 (eg, coding unit (CU), prediction unit (PU), and transform unit (TU)).
  • coding unit CU
  • prediction unit PU
  • transform unit TU
  • the picture division unit 110 included in the image encoding apparatus 10 performs rate distortion optimization (RDO) according to a preset order, and thus is capable of splitting a coding unit (CU), a prediction unit (PU), and a transform as described above.
  • RDO rate distortion optimization
  • the partition structure of the unit TU may be determined.
  • the picture division unit 110 determines the optimal block division structure in terms of bitrate and distortion while performing rate distortion optimization-quantization (RDO-Q). Can be.
  • RDO-Q rate distortion optimization-quantization
  • RD may be performed in the order of transform unit (PU) partition structure of 2N ⁇ N pixel size shown in (d) to determine an optimal partition structure of the transform unit PU.
  • Nx2N or 2NxN pixel size when the coding unit CU has a form of Nx2N or 2NxN pixel size, the pixel size of Nx2N (or 2NxN) shown in (a), the pixel size of NxN shown in (b), N / 2xN (or NxN / 2) and NxN pixel sizes shown in (c), N / 2xN / 2, N / 2xN and NxN pixel sizes shown in (d), N shown in (e)
  • An RDO may be performed in a transform unit (PU) partition structure order of a pixel size of 2 ⁇ N to determine an optimal partition structure of the transform unit PU.
  • PU transform unit
  • the block division method of the present invention has been described with an example in which a block division structure is determined by performing RDO (Rate distortion Optimization). ) Can be used to determine the block division structure to reduce the complexity and maintain the proper efficiency.
  • RDO Rate distortion Optimization
  • whether to apply adaptive loop filtering (ALF) in units of a coding unit (CU), a prediction unit (PU), or a transform unit (TU) divided as described above may be determined. Can be.
  • ALF adaptive loop filtering
  • whether the adaptive loop filter (ALF) is applied may be determined in units of a coding unit (CU), and the size or coefficient of the loop filter to be applied may vary according to the coding unit (CU).
  • ALF adaptive loop filter
  • information indicating whether to apply the adaptive loop filter (ALF) for each coding unit (CU) may be included in each slice header.
  • the adaptive loop filter may have a rectangular shape unlike luminance.
  • adaptive loop filtering may determine whether to apply to each slice. Therefore, information indicating whether adaptive loop filtering (ALF) is applied to the current slice may be included in a slice header or a picture header.
  • the slice header or the picture header may additionally include information indicating the filter length in the horizontal and / or vertical direction of the luminance component used in the adaptive loop filtering process.
  • the slice header or the picture header may include information indicating the number of filter sets.
  • the filter coefficients may be encoded using a prediction method.
  • the slice header or the picture header may include information indicating whether the filter coefficients are encoded by the prediction method, or may include the predicted filter coefficients when the prediction method is used.
  • the chrominance components may be adaptively filtered.
  • information indicating whether each of the chrominance components is filtered may be included in the slice header or the picture header. It may be joint coded (ie, multiplexed coding) together with information indicating whether to filter.
  • entropy encoding may be performed by allocating the largest index.
  • coding tree units having a maximum size of 256x256 pixels are divided into quad tree structures, and four coding units (CUs) having a square shape are provided. Can be divided into
  • the four coding units (CUs) having the square shape may be re-divided into quad tree structures, respectively, and the depth of the coding units CU divided into quad tree structures as described above is 0 to 3 It can have an integer value of any one.
  • ALF adaptive loop filtering
  • split_cu_flag indicates whether the corresponding node is split. If split_cu_flag is 0, the coding unit (CU) of the node is not split into smaller blocks. If split_cu_flag is 1, the coding of the node is performed. Unit CU is divided into smaller sized coding units (CUs).
  • ALF_on / off_flag indicates whether the node applies the adaptive loop filter (ALF). When ALF_on / off_flag is 0, the adaptive loop filter (ALF) is not applied to the coding unit (CU) of the node. If ALF_on / off_flag is 1, an adaptive loop filter (ALF) is applied to the coding unit (CU) of the node.
  • a coding tree unit (CTU) having a maximum size of 256x256 pixels is first divided into a quad tree structure, and four coding units (CU) having a square shape. Can be divided into
  • At least one of the coding units divided into the quad tree structure may be divided into a binary tree structure and re-divided into two coding units (CUs) having a rectangular shape.
  • At least one of the coding units divided into the quad tree structure may be divided into a quad tree structure and re-divided into four coding units (CUs) having a square shape.
  • CUs coding units
  • At least one of the coding units re-divided into the binary tree structure may be divided into two binary tree structures and divided into two coding units (CUs) having a square or rectangular shape.
  • At least one of the coding units re-divided into the quad tree structure may be divided into a quad tree structure or a binary tree structure and divided into coding units (CUs) having a square or rectangular shape.
  • ALF adaptive loop filtering
  • the solid line connecting the nodes means that the upper node is divided into quad tree structures to form lower nodes, and the dotted line connecting the nodes divides the upper node into a binary tree structure. This means forming lower nodes.
  • transform_tree_flag transform tree flags
  • the transform unit 120 of the encoding apparatus 10 when the transform unit 120 of the encoding apparatus 10 according to the embodiment of the present invention generates a transform unit and signals the information on the transform unit, not only the transform tree flag transform_tree_flag but also a binary tree. ) Partitioning information of the structure may be additionally used.
  • the conversion unit 120 may be divided into four modes of quadtree or binary tree structure splitting modes each having a size and a shape of a block that is no longer divided.
  • the transformer 120 may determine whether to split using the transform tree flag transform_tree_flag and the binary split transform flag split_binary_transform_flag to perform processing corresponding to each of the four cases.
  • the final transform may be performed on the transform blocks.
  • the decoding apparatus 20 identifies, through the inverse quantization / inverse transform unit 220, the above-described transform tree flag and binary division transform flag, and corresponds to a quad tree or binary tree. It is possible to handle division into a binary tree structure and inverse transform for the final divided transform unit.
  • the decoding apparatus 20 places the processing based on the transform tree flag according to the quad tree split and the processing operation based on the binary split transform flag in the entire transform tree function transform_tree (). Decoding of a transform unit in which a quad tree and a binary tree are combined can be efficiently handled.
  • the process of the decoding apparatus 20 may be processed in a recursive structure that is called again for each of the divided transform units.
  • FIG. 30 illustrates that the embodiments of the present invention are sequentially processed, the operation of the decoding apparatus 20 according to the embodiment of the present invention may be recursively performed for each transformation unit. It may be processed concurrently or sequentially or in parallel by parallel processes.
  • the decoding apparatus 20 may selectively or adaptively determine whether to divide a transform unit and partition direction (vertically or horizontally) by using existing parsed information without additional signaling. It can be more efficient.
  • the decoding apparatus 20 determines a binary partition or quadratic partition according to a specific condition by using a split transform flag Split_transform_flag, and accordingly Inverse transformations can be handled.
  • split transform flag (split_tranform_flag) on the existing transform tree syntax is used to signal whether to split a quad tree of 2N ⁇ 2N type.
  • the decoding apparatus 20 may extend the function of the split transform flag split_tranform_flag.
  • the split transform flag may be extended to indicate splitting into horizontal / vertical sizes for two blocks of binary partitions, or splitting into four quadratic blocks. .
  • split_transform_flag [x0] [y0] [trafoDepth] specifies whether a block is split into four blocks (quadratic) or two blocks (binary) with half horizontal and half vertical size for the purpose of transform coding. Function can be defined
  • the decoding apparatus 20 parses an extended split transform flag according to an embodiment of the present invention, and blocks a block size of a CU, a CU partition depth, a CU partition pattern, a prediction mode of a PU, a size of a TU, and a TU depth ( By using at least one of the recursive call in the upper TU block) as condition information, the binary partition structure of the transform block can be determined without additional signaling.
  • FIG. 21 is a diagram illustrating a prediction mode of block division according to an embodiment of the present invention
  • FIG. 22 is a flowchart illustrating an operation of a decoding apparatus to perform block-based adaptive inverse transform according to an embodiment of the present invention. to be.
  • the image encoding apparatus 10 may determine a prediction mode corresponding to each divided coding unit, and the prediction mode may be used for inter prediction corresponding to inter prediction and intra prediction. Can be distinguished by the corresponding intra prediction.
  • the image encoding apparatus 10 may include two coding units having a rectangular shape by dividing at least one of the coding units divided into the quad tree structure into a binary tree structure. At least one of the coding units subdivided into CUs, subdivided into four coding units (CUs) having a square shape, or subdivided into the binary tree structure is subdivided into a binary tree structure, a square or In consideration of various partitioning structures that may be divided into two coding units (CUs) having a rectangular shape, an inter / intra prediction method or a prediction mode of each coding unit may be efficiently determined according to an encoding / decoding scheme.
  • the image encoding apparatus 10 may divide the transformation unit divided into the quad tree structure in the same manner. Accordingly, the image encoding apparatus 10 may be divided into two transform units (TUs) having a rectangular shape by dividing at least one of the transform units transformed into quad tree structures into a binary tree structure. Re-divided into four transform units (TUs) having a square shape, or at least one of the transform units re-divided into the binary tree structure is divided into a binary tree structure, and has a square or rectangular shape. In consideration of various partitioning structures that may be divided into transform units (TUs), a transform type of each transform unit may be efficiently determined according to an encoding / decoding scheme.
  • TUs transform units
  • a transform type of each transform unit may be efficiently determined according to an encoding / decoding scheme.
  • the image encoding apparatus 10 may reduce the amount of transmitted bits and increase the coding efficiency in determining the transform scheme of the transform unit 120 and the quantization unit 130.
  • a method for determining an efficient transform / inverse transform type may be provided by considering a coding structure of a block and a partition structure and a prediction mode of a transform unit.
  • the image encoding apparatus 10 may perform transform type determination processing using a division structure and a prediction mode of a coding unit and a transform unit corresponding to a target block in determining the transform type for each block.
  • the decoding apparatus 20 according to the inverse quantization / inverse transform unit 220 according to the information corresponding to each inverse transform block (for example, the partition structure of the transform unit, the block size of the transform unit or coding unit or the prediction mode of the coding unit) And the like, and the inverse transform according to the determined transform type may be sequentially performed.
  • the determined transform type may correspond to two or more preset transform function sets, and a transform function having an optimal transform efficiency for the current block may be selected in each transform function set.
  • a transform function having an optimal transform efficiency for the current block may be selected in each transform function set.
  • the decoding apparatus 20 processes adaptive inverse transform for each block according to an embodiment of the present invention, and then performs prediction mode decoding and filtering using the inverse transformed residual signal. Therefore, decryption can be processed.
  • the decoding apparatus 20 may identify previously decoded block information corresponding to a block to be currently decoded.
  • the block information may include, for example, at least one of block division information, block size information, and prediction mode information of a transform unit or a coding unit corresponding to the target block.
  • the decoding apparatus 20 may determine a transform set for performing an inverse transform corresponding to a block to be inversely transformed based on at least one of the block division information, block size information, and prediction mode information.
  • the transform set may be associated with one or more transform functions corresponding to the transform type, and processing process information corresponding to each transform function may be stored in advance in the decoding apparatus 20.
  • the inverse quantization / inverse transform unit 220 may perform the above-described transform set determination and transform type determination process, and accordingly, the inverse quantization / inverse transform unit 220 may decode syntax information previously decoded. Etc. may be used to perform the above-described processes.
  • an inverse quantization / inverse transform unit 220 that performs the above-described process is illustrated and illustrated to process both inverse quantization and inverse transformation, but inverse quantization / inverse transform unit 220.
  • the decoding apparatus 20 obtains block partition information on a target block to be currently decoded from an image stream (S1001), and obtains block size information according to the block partition information (S1003). In operation S1005, a prediction mode corresponding to the block is obtained.
  • the block division information, block size information, or prediction mode information may be included in the block information, may correspond to a transform unit or a coding unit, and may be obtained in various ways.
  • the decoding apparatus 20 may obtain block information from syntax information of a preprocessed picture header or a slice header.
  • the inverse quantization / inverse transform unit 220 may pre-collect at least one of the block partition information, block size information, or prediction mode information from different modules in order to determine a transform type for inverse transform.
  • the block partition information may be exemplified as either a forward square or a non-quad split, and the block size information may be a horizontal size (W) or a vertical size (H).
  • the prediction mode information may be exemplified by inter prediction or intra prediction.
  • the intra prediction information may further include prediction direction information.
  • the decoding apparatus 20 determines a block-specific transform set on the basis of the collected block information (S1007).
  • the block-specific transform function may include DCT transform function information corresponding to one or more corresponding to the preset transform set index (0, 1, 2, 3, ... N-1), as shown in Table 1.
  • the DCT transform function may correspond to each transform function index (I, II, III, 7) and may indicate the application of known functions as shown in Table 2.
  • the decoding apparatus 20 may determine a transform set including at least one transform function index among the functions through the inverse quantization / inverse transform unit 220.
  • block information may be used, and the block information may include at least one of the above-described block partitioning information, block size information, and a prediction mode.
  • the above-described block partitioning information and block size information may be referred to as block structure information.
  • the decoding apparatus 20 may perform adaptive inverse transform and inverse quantization of the current block by using any one or more transform functions included in the block transform set selected through the inverse quantization / inverse transform unit 220. Subsequent image decoding processing may be performed sequentially to perform efficient decoding.
  • the encoding apparatus 10 and the decoding apparatus 20 may provide an adaptive transform and an inverse transform that can reduce the amount of computation to be processed while increasing the conversion efficiency.
  • FIG. 23 is a diagram conceptually illustrating a transform set determiner according to an embodiment of the present invention.
  • the transform set determiner 221 may be provided as a separate module.
  • the transform set determiner 221 uses preset block sets such as prediction information, decoded block size information, and block partition information of the decoded block, and sets the preset transform sets 1, 2, and 3. , ... N) any one transform set can be determined.
  • the transform set determiner 221 may set the following transform set as an index and use the current block size, partition information, and intra prediction mode information as variables used to determine the transform set.
  • TR_Sub_set Decision_TR_Sub_Set (Current_block_size, Partition_Info, Intra_Pred_Mode);
  • TR_Sub_set ⁇ 0, 1, 2,... , N ⁇ ;
  • variable and Decision_TR_Sub_Set function can be defined the operation of the transform set determiner 221 according to various conditions and variables.
  • the variable may also be changed, and additionally, one of the plurality of transform sets may be selected according to the block size information, the block partition information, and whether the decoding node is a terminal node. An embodiment thereof will be described later.
  • the transform set determiner 221 may select an arbitrary transform set, corresponding to one decoding block, according to various embodiments as described below.
  • the transform set determiner 221 may determine the transform set 1, and the inverse quantization / inverse transform unit 220 may perform an inverse transform using a transform function A or B.
  • the transform set determiner 221 may determine transform set 2
  • the inverse quantization / inverse transform unit 220 may perform inverse transformation using a transform function C or D.
  • the transform set determiner 221 May determine transform set 3
  • inverse quantization / inverse transform unit 220 may perform inverse transform using a transform function E or F.
  • the transform set determiner 221 may determine transform set 4, and inverse quantization / inverse transform unit 220 may perform inverse transform using a transform function G or H.
  • the transform set determiner 221 may select one of a plurality of predefined transform sets defined according to a combination of various prediction modes, a block size condition, a partition type of a block, and whether a terminal node is present. Inverse transformation may be performed through one or more transformation functions predefined by the transformation set.
  • FIG. 24 is a flowchart illustrating an operation of a decoding device 20 according to another exemplary embodiment of the present invention.
  • the encoding apparatus 10 may separately signal whether the above-described adaptive transform set selection is performed. For example, the encoding apparatus 10 may transmit an adaptive transform set flag (AMT flag) to signal the inverse transform performance according to the adaptive transform set selection to the decoding apparatus 20.
  • AMT flag adaptive transform set flag
  • the decoding apparatus 20 may identify an adaptive transform set flag (AMT flag) from picture or slice header information in determining whether to perform based on adaptive transform set selection, and adaptive according to the flag. Inverse transformation can be performed.
  • AMT flag adaptive transform set flag
  • the decoding apparatus 20 selects an appropriate transform set based on one or more block information corresponding to the inverse transform target block, and selects one or more included in the transform set. You can choose one of the transform functions to handle the inverse transform. The selection of the transform function may be selected according to the transform efficiency or may be signaled as separate information.
  • the decoding apparatus 20 first parses an adaptive transform set flag (AMT Flag) from header information or the like to determine whether it is true (S1101).
  • AMT Flag adaptive transform set flag
  • the adaptive transform set flag (AMT Flag) is used to perform inverse transform using a transform set selected from a plurality of transform sets that are separately defined according to the size of a decoding block, a divided form (Square / Non-Square), or a terminal node. Can be represented.
  • the inverse quantization / inverse transform unit 220 selects a predetermined specific transformation function according to a predefined condition and performs inverse transformation based on the predetermined quantization (S1103).
  • the decoding apparatus 20 may perform 2D inverse transform of DCTII through the inverse quantization / inverse transform unit 220. If the 4x4 intra block block is used, the DST- VII Two-dimensional inverse transformation can be performed.
  • the decoding apparatus 20 determines whether the decoding object block is encoded in the intra prediction mode (S1105).
  • the decoding apparatus 20 obtains prediction mode information of a coding unit corresponding to an inverse transform target block, and determines whether the intra prediction mode or the inter prediction mode is used by using the prediction mode information. Can be identified.
  • the decoding apparatus 20 uses the intra prediction mode using at least one of size information, segmentation information, and terminal node information corresponding to the decoding block.
  • One of a plurality of transform sets corresponding to may be selected (S1107).
  • the transform sets may be received from the encoding apparatus 10 through separate signaling or from another terminal linked with the decoding apparatus 20.
  • the decoding apparatus 20 may use the inter prediction mode using at least one of size information, division type information, and terminal node information corresponding to the decoding block. Any one of a plurality of transform sets corresponding to may be selected (S1109).
  • the decoding apparatus 20 performs an inverse transform on the decoding block using the transform function designated by the selected transform set through the inverse quantization / inverse transform unit 220.
  • a plurality of transform sets may be classified into a first group and a second group according to whether a transform set is included in an intra prediction mode and an inter prediction mode of a decoding block, and according to an embodiment of the present invention,
  • the apparatus 20 may first identify transform sets of the first group or transform sets of the second group according to whether the prediction mode is in the picture.
  • the decoding apparatus 20 may select at least one of the size information of the decoding block, the partition type information, and the terminal node information from the plurality of transform sets of the group determined from the transform set of the first group or the transform set of the second group. You can select a specific set of transformations that are determined using
  • the classification information for determining the transform sets of the first group and the second group, the function processing information predefined in correspondence with the transform sets, and the like may be separately transmitted from the encoding apparatus 10 through a separate signaling device. 20 or may be stored in advance in the decoding device 20, or may be updated by a separate device.
  • 25 is a diagram illustrating in more detail the inverse transform unit according to an embodiment of the present invention.
  • 26 and 27 are flowcharts for describing an operation of an inverse transform unit according to an exemplary embodiment of the present invention.
  • the inverse quantization / inverse transform unit 220 may process a first inverse transform and a second inverse transform on an inverse quantized residual signal, and a transform set corresponding to each inverse transform may be formed. Once determined, an inverse transform may be performed by selecting a transform function from the determined transform set. To this end, the inverse quantization / inverse transform unit 220 may include a first inverse transform determiner 222, a first inverse transform performer 223, a second inverse transform determiner 224, and a second inverse transform performer 225. Can be.
  • first inverse transform and the second inverse transform may correspond to the inverse transform in the first direction and the inverse transform in the second direction, and the first direction corresponds to the vertical direction and the second direction corresponds to the horizontal direction. Can be.
  • the first inverse transform determiner 222 may determine a first transform set corresponding to the vertical direction according to a preset condition, and the first inverse transform performer 223 corresponds to the determined transform set to the target block. The inverse transform in the first direction.
  • the second inverse transform determiner 224 may determine a second transform set corresponding to the horizontal direction according to a preset condition, and the second inverse transform performer 225 may correspond to the determined transform set, for the target block. Inverse transformation in the second direction can be handled.
  • the first inverse transform and the second inverse transform processing of the inverse quantization / inverse transform unit 220 may be effectively used in correspondence with 2 to 67 angular modes indicating the directionality of the prediction mode. have.
  • Table 3 illustrates an intra-mode transform set reference table for selecting N transform function set classifications in consideration of probabilistic characteristics in which residual signals are distributed, corresponding to a direction mode of intra picture prediction, according to an embodiment of the present invention. will be.
  • V may indicate a first inverted index
  • H may indicate a second inverted index
  • each index may correspond to a transform set shown in Table 1.
  • Each transform set may include two or more transform functions of the transform functions shown in Table 2.
  • the decoding apparatus 20 may determine a first transform set for a first inverse transform and a second transform set for a second inverse transform by using an intra mode transform set reference table.
  • the inverse transform for each direction may be processed through the first inverse transform performer 223 and the second inverse transform performer 225.
  • FIG. 26 illustrates an operation of a decoding apparatus 20 according to an embodiment of the present invention including the inverse quantization / inverse transform unit 220 of FIG. 25.
  • the decoding apparatus 20 is a dequantized decoding target block. Segmentation information is identified (S1201), and the size of the decoding target block is determined (S1203).
  • the decoding apparatus 20 determines whether to perform inverse transform using an adaptive transform set according to an embodiment of the present invention.
  • the decoding apparatus 20 may use the predetermined condition. For example, the decoding apparatus 20 may determine whether the partition information is in a forward direction (Square, Non-square), whether the block size is within a specific N x N (4x4, or 8x8) size, or whether an adaptive transform set is used. At least one may determine whether to use a transform set.
  • the decoding apparatus 20 determines the intra prediction direction mode.
  • Intra prediction direction mode information may be derived during a decoding process.
  • the inverse quantization / inverse transform unit 220 parses intra prediction direction mode information from header information or intra prediction from the intra prediction unit 230.
  • Direction mode information may be obtained.
  • the decoding apparatus 20 determines a primary and a secondary transform set.
  • the transformation set determiner 221 may determine the transformation set for each direction by using the reference table of Table 3.
  • the decoding apparatus 20 When the transform set for each direction is determined, the decoding apparatus 20 performs the first inverse transform based on the first transform set through the first inverse transform performer 223 (S1213), and performs the second transform through the second inverse transform performer. A second inverse transform based on the transform set is performed (S1215).
  • the decoding apparatus 20 When the inverse transformation is completed, the decoding apparatus 20 then reconstructs the image signal through necessary image processing.
  • the decoding apparatus 20 may perform inverse transform by selecting a transform set to be applied to the current decoding block according to a prediction direction mode.
  • the transform set may be composed of a set corresponding to a plurality of predefined transform functions, thereby improving conversion efficiency.
  • the decoding apparatus 20 may convert the transform set from a high level syntax unit, for example, a slice level SPS or a picture level PPS received from the encoding apparatus 10.
  • the configuration information of may be obtained.
  • the decoding apparatus 20 may receive and update the configuration of the transform set in the GOP unit from the encoding apparatus 10.
  • the decoding apparatus 20 receives a difference signal corresponding to the current index from the encoding apparatus 10 to configure and transform the transform set. You can perform a function update.
  • FIG. 27 is a flowchart illustrating an operation of an inverse transform unit according to another exemplary embodiment of the present invention.
  • the decoding apparatus 20 first determines an inverse transform target block as an intra prediction block (S1301).
  • the decoding apparatus 20 determines whether the inverse transform target block is a block divided in a forward direction (S1303).
  • the forward direction may refer to a state in which the target block is divided in a quad tree manner formed of squares. Accordingly, when not in the forward direction (Non-Square), it may mean a state in which the target block is divided into a binary tree method including a horizontal or vertical rectangle.
  • the decoding apparatus 20 determines block size information (S1305), and selects a first inverse transform set for the forward block corresponding to the determined block size information (S1307).
  • the first inverse transform set may include transform functions having high transform efficiency for each of the blocks divided in the forward direction.
  • the first inverse transform set may be determined corresponding to the size of each block (for example, 4 ⁇ 4, 8 ⁇ 8, etc.).
  • the decoding apparatus 20 determines the block size information (S1309), and selects a second inverse transform function for the non-forward block corresponding to the determined block size information (S1311).
  • the second inverse transform set may be a set including transform functions having high transform efficiency for each non-forwardly divided block.
  • the first inverse transform set may be determined corresponding to the size of each block (eg, 4XH or WX4, 8XH, or WX8).
  • the decoding apparatus 20 performs the first inverse transform using the first inverse transform function selected from the determined first inverse transform set through the first inverse transform performer 223 or performs the second inverse transform performer 223.
  • a second inverse transform may be performed using a second inverse transform function selected from the determined second inverse transform set.
  • the inverse quantization / inverse transform unit 220 may then perform the remaining processing required for image decoding.
  • FIG. 28 is a diagram illustrating an inverse transform unit according to another exemplary embodiment.
  • FIG. 29 is a flowchart illustrating an operation of an inverse transform unit according to another exemplary embodiment.
  • the inverse quantization / inverse transform unit 220 of the decoding apparatus 20 may include a prediction mode information decoder 226, a first inverse transform performer 223 connected thereto, and It may be configured to include a second inverse transform performing unit 225.
  • the encoding apparatus 10 may determine an optimal transform set based on an inter prediction mode based on an operation efficiency (for example, an RDO operation).
  • an operation efficiency for example, an RDO operation
  • the decoding apparatus 20 may signal information about the transform set.
  • the encoding apparatus 10 may use high level syntax, and for example, transform set identification information such as Inter_transform_set_ID may be delivered to the decoding apparatus 20. Accordingly, the decoding apparatus 20 may decode the transform set identification information through the prediction mode information decoder 226, and may select a transform set using the decoded transform set identification information.
  • transform set identification information such as Inter_transform_set_ID
  • the decoding apparatus 20 may decode the transform set identification information through the prediction mode information decoder 226, and may select a transform set using the decoded transform set identification information.
  • the decoding apparatus 20 may perform the first inverse transform performing unit 223 and the second inverse transform performing unit 225 in each direction depending on the inter prediction mode based on the selected transform set.
  • the decoding apparatus 20 may include a prediction mode information decoding unit ( In operation S1401, inter-prediction mode information of the target block is decoded.
  • the decoding apparatus 20 determines whether a transform set flag according to inter prediction is present from the inter prediction mode information.
  • the decoding apparatus 20 uses the first inverse transform execution unit 223 and the second inverse transform execution unit 225 to perform a first direction based on DCT 2 X DCT 2 transform functions designated as default transforms.
  • the second direction inverse transform may be processed in two dimensions.
  • the decoding apparatus 20 determines whether the transform set index signaled together with the inter prediction mode information is 1 (S1407).
  • the decoding apparatus 20 determines whether the first block size corresponds to the partitioning condition (S1409), and if so, the first inverse transform execution unit 223 and the second inverse transform execution unit 225. ), The first direction and the second direction inverse transform based on the DCT 7 X DCT 7 transform functions optimized for the above conditions may be processed two-dimensionally (S1413).
  • the decoding apparatus 20 uses the first inverse transform execution unit 223 and the second inverse transform execution unit 225 based on the DCT 8 X DCT 8 transform functions optimized in this case.
  • the first direction and the second direction inverse transform may be processed two-dimensionally (S1411).
  • the decoding apparatus 20 determines whether the transform set index signaled together in the inter prediction mode information is 2 (S1415).
  • the decoding apparatus 20 determines whether it corresponds to the second block size and the partitioning condition (S1417), and if so, the first inverse transform performing unit 223.
  • the second inverse transform performing unit 225 may process the first and second inverse transforms based on the DCT 2 X DCT 7 transform functions optimized for the above conditions in two dimensions.
  • the decoding apparatus 20 uses the first inverse transform performer 223 and the second inverse transform performer 225, based on the optimized DCT 7 X DCT 8 transform functions in this case. It is possible to process the first direction and the second direction inverse transformation in two dimensions.
  • 30 to 32 are conceptual diagrams for explaining block adaptive transform and inverse transform according to whether a terminal node according to an embodiment of the present invention.
  • the decoding apparatus 20 may determine a transform set for inverse transform according to whether the inverse transform target block is a terminal node.
  • the transform set determining unit 221 may further include information whether the terminal node as a variable for determining the transform set.
  • the non-terminal node may be in the form of a coding block that performs prediction or transformation at a smaller size, and may be illustrated as a node position of a left display area located at Depth 3 to 4 of FIG. 30.
  • the terminal node may mean the lowest node that is not divided into smaller sizes in order to perform prediction or transformation, and is divided into two nodes in the form of two nodes located in Depth 3 of the right display area of FIG. It can be illustrated as.
  • FIG. 31 illustrates a stepwise partitioning form in the case of a non-terminal node, and thus shows that a transform set corresponding to each partitioning step may be determined differently or identically.
  • TU0 and TU1 may be configured in divided block units for one coding unit CU.
  • the TU may have the same size as a PU which is a unit for performing prediction, and the PU may be encoded / decoded through different prediction modes.
  • TU0 and TU1 may be divided in the vertical direction or the horizontal direction according to coding efficiency, and the conversion efficiency may be different according to the prediction mode of the PU and the size of the CU and TU, the encoding apparatus 10 and the decoding apparatus. Accordingly, 20 may selectively determine the same inverse transform set or different inverse transform sets.
  • TU0, TU1, and TU2 may be configured in divided block units performing inverse transformation, respectively.
  • TU0, TU1, and TU2 may have a structure in which a coding unit is primarily divided into a vertical direction or a horizontal direction according to coding efficiency, and any one of the divided blocks is further divided.
  • each TU may have the same size as a PU which is a unit for performing prediction, and the PU may be encoded / decoded through different prediction modes.
  • TU0, TU1, and TU2 may have different conversion efficiencies, respectively, so that the encoding apparatus 10 and the decoding apparatus 20 are different.
  • TU0, TU1, TU2, and TU3 may represent four forward divided blocks for all TUs.
  • the four TUs may have the same size as the PU, which is a unit for performing prediction, and may be encoded / decoded through different prediction modes, so that the decoding apparatus 20 may block the prediction mode and the blocks of the CU and the TU.
  • the inverse transform may be performed by selectively selecting one of pre-defined inverse transform functions according to the size.
  • 32 is a diagram for describing terminal division and combination division according to an embodiment of the present invention.
  • a CU and TU may indicate a partitioning structure having the same size.
  • the CU may be divided into two binaryly divided CUs such as CU0 and CU1 through division in the vertical direction or the horizontal direction.
  • the TU may have the same size as the divided CU, and the decoding apparatus 20 may perform inverse transform independent of each other between the current TU and the neighboring TUs.
  • a flag (AMT flag) for determining whether to use the adaptive transform set for each CU 0 and CU 1 may be transmitted to the decoding apparatus 20.
  • the decoding apparatus 20 may determine different transform function sets corresponding to TU 0 and TU 1 according to a flag, and may perform each independent inverse transform based on the flag.
  • a sub-CU may be divided from different CUs, but a CU may have the same size as a TU and an adjacent CU may be divided into two TUs.
  • the AMT flag may be transmitted to the decoding apparatus 20 corresponding to the blocks of the upper depths of the upper CU 0 and the CU 1 , respectively.
  • the decoding apparatus 20 may selectively determine an inverse transform set according to each block size, prediction mode, partition type, etc., and select an inverse transform function included therein to perform inverse transform, corresponding to CB0 and CB1.
  • the decoding apparatus 20 determines that TU0 belonging to CU0 has an index 0 according to a specific condition (prediction mode, CU size, division direction, TU size, etc.) when AMT flag is True.
  • Inverse transformation may be performed through the corresponding DCT-VIII and DST-VII functions, and TU1 belonging to CU1 may perform inverse transformation to DST-I and DST-VIII corresponding to Index 1 according to a specific condition.
  • the reference table based on Tables 1 to 2 may be defined according to the video compression standard, and the present invention is not limited to the function of the table.
  • the type and number of the transform function may be changed by a signal additionally received from the encoder according to the characteristics of the image.
  • the decoding apparatus 20 decodes a signaling signal such as AMT_Flag in the decoding process to determine whether to apply a predefined or separately received inverse transform function other than the default inverse transform function. You can decide. In this case, since the PU, which is a unit for performing prediction, is predicted independently of the TU, blocks decoded in different prediction modes in one CU may be included.
  • the decoding apparatus 20 may determine whether the inverse transform block from the coding unit CU is two-stage, three-stage, four-stage, terminal, or combined division, prediction mode, block size of the CU and TU, and division direction. According to one, an inverse transform set for performing an inverse transform and an inverse transform function included in the transform set may be selected.
  • the decoding apparatus 20 may include at least one of a size of a coding block, whether a partition is divided into TUs, a split direction, a size of a TU, and whether a terminal node exists. One may be selected according to efficiency, or may be selected by receiving a separate index from the encoding apparatus 10.
  • 33 illustrates an example of a syntax for supporting block adaptive inverse transform according to an embodiment of the present invention.
  • an adaptive transform set flag (AMT Flag) according to an embodiment of the present invention may be included in a high level syntax corresponding to a coding unit as shown in FIG. 33 and decoded by the decoding apparatus 20. have.
  • the prediction mode when the prediction mode is an intra prediction mode, a specific transform function in the first direction and the second direction that are pre-assigned for each existing prediction direction mode may be applied.
  • the conversion function can be used as it is.
  • the adaptive transform set flag of the syntax may be used only in the inter prediction mode.
  • the syntax information may further include index information of the first inverse transform set and the second inverse transform set determined according to the conversion efficiency in inter prediction.
  • index information of the first inverse transform set and the second inverse transform set determined according to the conversion efficiency in inter prediction.
  • each transform set index to be applied to a vertical (Inter_AMT_second_sub_set_index) inverse transform as a first inverse transform and a horizontal (Inter_AMT_First_sub_set_index) inverse transform as a second inverse transform May be included in the syntax and transmitted to the decoding apparatus 20.
  • 34 and 35 are block diagrams for describing an encoding and decoding system according to another embodiment of the present invention.
  • the transform unit 120 of the encoding apparatus 10 may include a first transform unit 121A, a second transform unit 122A, and a quantization unit 130A.
  • the inverse transform unit 220 may include a first inverse transform unit 223A, a second inverse transform unit 225A, and an inverse quantizer 229A.
  • the first transformer 121A and the first inverse transformer 223A may process two-dimensional transform and inverse transform in a general vertical / horizontal direction.
  • the second transforming unit 122A may selectively operate before the processing of the quantization unit 130A is performed, and the second transforming unit 122A performs the second transform of the residual signal subjected to the first transformed process. It can be further processed.
  • the operation of the second transformer 122A compares whether the prediction mode of the coding block is the intra prediction mode, and the coding efficiency of each of the coding transforms when the transform of the second transform is applied or not. May be optionally determined.
  • the encoding apparatus 10 may decode a separate flag (for example, a mode dependent non-separable secondary transform flag, MDNSST_Flag, a mode dependent non-separable secondary transform). Can be sent to. Accordingly, the decoding apparatus 20 may parse MDNSST_Flag and determine whether to perform the second inverse transform according to the signal value of the corresponding flag.
  • a separate flag for example, a mode dependent non-separable secondary transform flag, MDNSST_Flag, a mode dependent non-separable secondary transform.
  • the second inverse transform unit 225A may also selectively operate only when the flag is received to process the second inverse transform of the inverse quantized bitstream in the inverse quantizer 229A, and then the first inverse transform unit 223A.
  • the residual signal may be decoded.
  • the second transform unit 122A may perform a second transform in units of coding blocks. Unlike the first transform unit 121A that receives a residual signal and performs transformation in units of blocks, the second transform includes transform coefficients of a block having an arbitrary size in a predetermined number of lower levels. Grouping may include a transform that performs a second transform on the grouped transform coefficients, and the size of the subgroup may have a minimum of 4x4 or more.
  • a conversion process for this is disclosed in FIG. 35. If a block having an arbitrary size of 64x64 can be classified into a subgroup having 16 4x4 transform coefficients. Subsequently, the second transform unit 122A may apply a predetermined transform matrix according to the direction of intra prediction of each subgroup, and may represent a representative characteristic of coefficients belonging to each group. (Vector) and so on. Accordingly, when the quantization unit 130A quantizes the block having the arbitrary size, the quantization unit 130A can perform quantization using 16 vectors as inputs.
  • the decoding apparatus 20 may parse the MDNSST Flag in units of decoding blocks when the decoding block is encoded in the intra mode.
  • the decoding apparatus 20 may determine whether the second inverse transform unit 225A operates based on the MDNSST Flag.
  • the second inverse transform unit 225A may determine a predetermined table according to a prediction mode including a directional mode and a non-directional mode from the output of the inverse quantizer 229A. By referring to a table such as 4, a second inverse transform on the vectors of the lower group may be performed first. Table 4 illustrates the type of transform set corresponding to the intra mode.
  • the encoding apparatus 10 performs a first transform of a block unit (NxN) that receives the residual signal according to the predictive encoding through the first transform unit 121A, and then through the second transform unit 122A.
  • the transform coefficients of the first transformed block may be grouped into N subgroups, and the second subgroup may be transformed into N Vectors by performing a second transform according to the direction (including DC and planar) of the intra prediction mode. have.
  • the quantization unit 130A may perform quantization on N Vector values.
  • NxN transform coefficients are not quantized, but only MDNSST_Flag indicating whether to perform the second transform and N vectors corresponding thereto are quantized, thereby improving transmission efficiency due to bit saving. And an increase in encoding efficiency.
  • 36 is a diagram schematically illustrating an inverse quantization / inverse transform unit 220 of a decoding apparatus 20 according to another embodiment of the present invention.
  • the inverse quantization / inverse transform unit 220 adaptively transforms transform coefficients using performance information of a secondary transform corresponding to a current block to be decoded. By determining (Adaptive), the coding efficiency can be improved.
  • the performance information of the second transform may include information on whether to perform the second transform, information on the second transform mode, and the like.
  • the inverse quantization / inverse transform unit 220 of the decoding apparatus 20 includes an inverse quantizer 310, a transform coefficient substitute unit 315, a second inverse transform unit 320, and a first inverse transform unit 220.
  • 1 may include an inverse transform unit 330.
  • the transform coefficient configuration unit 305 may be further included to be connected to the transform coefficient substitution unit 315, which will be described later.
  • the encoding apparatus 10 performs a transform process and a signaling process that enable the transform unit 120 and the quantization unit 130 to operate the inverse quantization / inverse transform unit 220 of the decoding apparatus 20 to be described later. can do.
  • the inverse quantization / inverse transform unit 220 may determine whether to perform a second inverse transform in response to an inverse quantized signal.
  • whether to perform the second inverse transform may be selectively determined according to a predetermined condition, and according to whether or not to perform the second inverse transform, the inverse quantization unit 310 may perform an inverse quantized signal obtained by inverse quantization of the input signal.
  • the transmission may be performed by either the second inverse transform unit 320 or the first inverse transform unit 330.
  • the transform coefficient configuring unit 305 may process the configuration of the transform coefficient information corresponding to performing the second inverse transform, and according to the configured coefficient information or preset coefficient information, the transform coefficient replacing unit 315 may perform a second operation. Substitution of transform coefficients for inverse transformation can be handled. Accordingly, information about whether the second inverse transform is performed may be transmitted to the inverse quantizer 310, and the inverse quantizer 310 may perform the second inverse transform unit 320 or the first inverse transform unit according to whether the second inverse transform is performed. The inverse quantized signal may be passed to 330.
  • the inverse quantization / inverse transform unit 220 determines the second inverse transform performance according to the second inverse transform performance information signaled from the encoding apparatus 10, and the inverse quantization unit 310 determines the second.
  • the transform coefficient determined through the transform coefficient substitute unit 315 and the transform coefficient configuration unit 305 may be transmitted to the second inverse transform unit 320.
  • the inverse quantization unit 310 transmits the inverse quantized signal to the second inverse transform unit 320 so that the second inverse transform is processed.
  • the second inverse transform unit 320 transfers the second inverse transformed signal to the first inverse transform unit 330 according to the transform coefficient, and the first inverse transform unit 330 processes the first inverse transform corresponding thereto, thereby restoring.
  • Output differential signal In addition, the second inverse transform unit 320 transfers the second inverse transformed signal to the first inverse transform unit 330 according to the transform coefficient, and the first inverse transform unit 330 processes the first inverse transform corresponding thereto, thereby restoring. Output differential signal.
  • the inverse quantization / inverse transform unit 220 determines the second inverse transform to be performed by comparing with the condition information corresponding to the current block, and when the second inverse transform is performed, the transform coefficient substitute unit 315 or The transform coefficient configuration unit 305 may transmit the determined transform coefficient information for the second inverse transform to the second inverse transform unit 320.
  • the condition information may include block size information or inverse transform function information
  • the inverse transform function used for the second inverse transform may include, for example, a hypercube-givens transform (HyGT).
  • the transformation coefficient may be predetermined according to the transformation, the scale, the rotation, the substitution, the optimization information, and the like.
  • the inverse quantizer 310 when the inverse quantization unit 310 determines not to perform the second inverse transform but performs the first inverse transform, the inverse quantizer 310 directly transmits the inverse quantized signal to the first inverse transform unit 330, and thus, the first inverse transform unit 330 It is possible to restore and output the differential signal.
  • FIG. 37 is a flowchart illustrating a transform coefficient configuration-based inverse transform process according to an embodiment of the present invention.
  • FIG. 37 shows the inverse transform processing operation in the case where the inverse quantization / inverse transform unit 220 includes a transform coefficient constitution unit 305 that replaces the transform coefficient replacement unit 315.
  • the transform coefficient constructing unit 305 first constructs transform coefficients from an input bitstream signal (S2001).
  • the transform coefficient configuration unit 305 may first determine whether to perform a second inverse transform and transform coefficients using the transform coefficient configuration information obtained from the bitstream.
  • the transform coefficient constructing unit 305 may include an inverse transform flag of the current block identified from the header information of the bitstream, a size of the current block, a prediction mode type (between screens or in screens), and a split depth of a block ( Depth) may be used to configure whether to perform the second inverse transform and transform coefficient information for the inverse transform.
  • the transform coefficient configuring unit 305 may configure transform coefficient information by obtaining second transform performance information separately signaled from the encoding apparatus 10.
  • the transform coefficient information configured as described above is used for block adaptive substitution by the transform coefficient replacement unit 315 according to the above-described transform set, so that the second inverse transform unit 320 determines the second inverse transform coefficient of the current block. Can be used.
  • the second inverse transform unit 320 may selectively and adaptively determine a scanning order of corresponding coefficients when configuring the transform coefficients, which enables more efficient encoding and decoding processing. Let's do it. This will be described later in more detail.
  • the transform coefficient configuring unit 305 may configure a transform coefficient corresponding to a condition for determining the transform coefficient information corresponding to the current block, and the configured transform coefficient information is converted through the transform coefficient replacement unit 315. It may be transferred to the second inverse transform unit 320.
  • the inverse quantization / inverse transformation unit 220 determines whether to perform a second inverse transformation according to whether or not the above-described transform coefficients are configured (S2005).
  • the transform coefficient substitution unit 315 performs transform coefficient substitution based on the transform coefficient information (S2007), and then the second inverse transform of the second inverse transform unit 320 based on the substituted transform coefficients is processed. (S2009).
  • step S2005 it is determined that the second inverse transform is not performed, or after step S2009, the first inverse transform corresponding to the output of the inverse quantization unit 310 or the output and transform coefficient information of the second inverse transform unit 320 is performed. It may be (S2011).
  • 38 is a flowchart illustrating an operation of determining whether to perform a second inverse transform by the inverse quantization / inverse transform unit 220 using a predetermined condition.
  • the inverse quantization / inverse transform unit 220 may determine whether to perform a second inverse transform using at least one of attribute information of the current block and second inverse transform signaling information.
  • the inverse quantization / inverse transform unit 220 may further include a second inverse transform performance determiner (not shown).
  • the inverse quantization / inverse transform unit 220 first uses a second inverse transform performance index to apply a second inverse transform target.
  • the recognition is first determined (S2040).
  • the inverse quantization / inverse transform unit 220 determines whether the size of the current block is 4x4 (S2041), and if not, determines whether it is the upper left 8x8 block (S2042). This is an example for improving the encoding / decoding efficiency by adaptively determining whether to apply the second inverse transform according to the block size and position.
  • the inverse quantization / inverse transform unit 220 determines whether or not the number information threshold of the non-zero coefficient in the current block is greater than or equal to the threshold value thr. (S2043).
  • the inverse quantization / inverse transform unit 220 may determine that the second inverse transform execution flag b2ndTrFlag is performed (TRUE) and return the determined value (S2044).
  • the inverse quantization / inverse transform unit 220 determines that the second inverse transform performing flag b2ndTrFlag is not performed (FALSE). In this case, the determined value can be returned and output.
  • whether to perform the second inverse transform may be selectively and adaptively determined according to the inverse transform coefficient and the block information. Accordingly, the scanning order may be differently determined, thereby improving encoding and decoding efficiency. This will be described in more detail with reference to FIGS. 39 and 43.
  • 39 and 40 are diagrams for describing scanning order determination using a transform coefficient obtained by a transform coefficient constitution unit 305 according to an embodiment of the present invention.
  • the transform coefficient configuring unit 305 may obtain transform coefficient information determined from at least one of intra prediction mode information, block size information, and second inverse transform performance information obtained from a bitstream. At least one scanning order information may be determined corresponding to the transform coefficient information. In addition, the transform coefficient configuring unit 305 may configure a transform coefficient according to the determined scanning order and transmit the transform coefficient to the inverse quantization unit 310.
  • the transform coefficient configuring unit 305 may determine a transform coefficient scanning order of one of the plurality of scanning orders according to a predetermined condition, and may process the transform coefficient corresponding to the determined scanning order to be configured.
  • a predetermined condition For example, the transform coefficient configuring unit 305 may determine a transform coefficient scanning order of one of the plurality of scanning orders according to a predetermined condition, and may process the transform coefficient corresponding to the determined scanning order to be configured.
  • FIG. 40 three types of scanning orders are illustrated. A zigzag scan, a horizontal scan, a vertical scan, and the like may be illustrated. Any one of the above-described prediction mode information, block size information, and second inverse transform performance information may be selected.
  • the inverse quantization / inverse transform unit 220 may generate a second transform index as the second inverse transform is determined and provide the transform index to the transform coefficient substitute unit 315. This may be provided by the transform coefficient configuring unit 305 or may be provided by a second inverse transform determining unit (not shown).
  • FIGS. 41 to 42 are views for explaining the conversion coefficient substitution processing of the conversion coefficient substitution unit 315, which corresponds to the conversion coefficient information configured in FIG. 39 described above.
  • the transform coefficient replacement unit 315 may obtain inverse quantized transform coefficients from the inverse quantization unit 310 according to a scanning order determined by the transform coefficient configuration unit 305.
  • the transform coefficient substitute unit 315 When the second inverse transform based on the second transform index and the predetermined condition is determined, the transform coefficient substitute unit 315 performs a substitution process on the transform coefficients and transfers the transform coefficient to the second inverse transform unit 320, thereby converting the transformed transform coefficients. And a second inverse transform corresponding to.
  • the determination of the second inverse transform includes condition information including at least one of a second transform index or flag, a size of a current block, a position of a current block, information of a neighboring block, and a non-zero coefficeint coefficient of the current block. Can be determined using.
  • the substitution process is to adjust the position of the transform coefficients for the second inverse transform.
  • the transform coefficient substitute unit 315 selects one of the at least one substitution method from the inverse quantized transform coefficients. Transform coefficient substitution for adjusting the position of the transform coefficient can be performed.
  • the transform coefficient replacement unit 315 may perform a substitution process using a transform coefficient vector.
  • the scanned transform coefficients may be composed of 1D vectors, and the transform coefficient substitution unit 315 applies PERMUTATION to 2D vectors to handle the change of the coefficient position of the second inverse transform. By doing so, the substituted result vector can be constructed corresponding to the 2D block.
  • the transform coefficient substituter 315 may perform second inverse transform performance information (eg, intra prediction mode, second inverse transform index, block size, block position, etc.).
  • second inverse transform performance information eg, intra prediction mode, second inverse transform index, block size, block position, etc.
  • the 2D transform coefficient F ' can be obtained by performing the transform processing of the transform coefficient using the selected transform vector among the preset substitution vectors, thereby enabling the second inverse transform process.
  • the encoding apparatus 10 and the decoding apparatus 20 take into account the conversion efficiency due to the existence of the coding unit, the transform unit, and the prediction unit of the quad tree structure and the binary tree structure, It is possible to provide an encoding and decoding method capable of selectively and adaptively applying a transform set composed of efficient transform functions for each target block.
  • the encoding apparatus 10 and the decoding apparatus 20 block-construct the configuration of the transform coefficients, the determination of the scanning order, and the substitution method for the second inverse transform for each target block.
  • By selectively determining it is possible to provide an encoding and decoding method capable of determining whether to efficiently transform secondary blocks for each target block and scanning and transform processing accordingly.
  • the method according to the present invention described above may be stored in a computer-readable recording medium that is produced as a program for execution on a computer, and examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape , Floppy disks, optical data storage devices, and the like, and also include those implemented in the form of carrier waves (eg, transmission over the Internet).
  • the computer readable recording medium can be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
  • functional programs, codes, and code segments for implementing the method can be easily inferred by programmers in the art to which the present invention belongs.

Abstract

본 발명의 실시 예에 따른 영상 복호화 방법은, 영상의 픽쳐가 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할되고, 상기 픽쳐 또는 상기 분할된 코딩 유닛을 쿼드 트리(quad tree) 및 이진 트리(binary tree) 구조로 분할된 코딩 유닛을 복호화하기 위한 역변환 대상 블록을 결정하는 단계; 및 상기 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함한다.

Description

변환 처리를 제공하는 영상 복호화 및 부호화 방법
본 발명은 영상 부호화 및 복호화에 관한 것으로, 더욱 상세하게는 동영상 픽쳐(picture)를 복수의 블록(block)들로 분할하여 예측 및 변환을 수행하는 방법에 관한 것이다.
영상 압축 방법에서는 하나의 픽처(picture)를 소정 크기를 가지는 복수의 블록(block)으로 구분하여 부호화를 수행한다. 또한, 압축 효율을 높이기 위해 픽쳐들 사이의 중복도를 제거하는 인터 예측(inter prediction) 및 인트라 예측(intra prediction) 기술을 이용한다.
이 경우, 인트라 예측과 인터 예측을 이용하여 잔차 신호(residual signal)를 만들며, 잔차 신호를 구하는 이유는 잔차 신호를 가지고 코딩을 했을 때 데이터의 양이 작아서 데이터 압축률이 높아지고, 예측이 좋을수록 잔차 신호의 값이 작게 되기 때문이다.
인트라 예측 방법은 현재 블록의 주변의 픽셀을 이용하여 현재 블록의 데이터를 예측한다. 실제 값과 예측 값의 차이를 잔차 신호 블록이라고 한다. HEVC의 경우는 인트라 예측 방법이 기존 H.264/AVC에서 사용되던 9개의 예측모드에서 35개의 예측모드로 증가하여 더욱 세분화하여 예측을 한다.
인터 예측 방법의 경우는 현재 블록을 주변의 픽쳐들 내의 블록들과 비교하여 가장 비슷한 블록을 찾는다. 이때 찾은 블록에 대한 위치정보(Vx, Vy)를 모션 벡터라고 한다. 현재블록과 모션 벡터에 의하여 예측된 예측블록간의 블록내 화소 값들의 차이를 잔차 신호(residual signal) 블록이라고 한다 (motion-compensated residual block).
이와 같이 인트라 예측과 인터 예측이 더 세분화 되어 잔차 신호의 데이터 양이 줄어들고 있으나, 동영상의 처리를 위한 연산량은 크게 증가하였다.
특히, 영상 부호화 및 복호화를 위한 픽쳐 내 분할 구조를 결정하는 과정에서의 복잡도 증가량으로 인해 파이프라인 구현 등에 있어서의 어려움이 존재하며, 기존의 블록 분할 방법 및 그에 따라 분할된 블록의 크기가 고해상도 영상의 부호화에는 적합하지 않을 수 있다.
본 발명은 상기와 같은 과제를 해결하기 위한 것으로, 고해상도 영상의 부호화 및 복호화에 적합하며, 효율적인 변환을 제공하는 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법을 제공하는데 그 목적이 있다.
상기와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 영상 복호화 방법은, 영상의 픽쳐가 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할되고, 상기 픽처 또는 상기 분할된 코딩 유닛을 이진 트리(binary tree) 구조로 분할된 코딩 유닛을 복호화하기 위한 역변환 대상 블록을 결정하는 단계; 및 상기 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함한다.
상기와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 영상 복호화 장치는, 영상의 픽쳐를 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할하고, 상기 픽처 또는 상기 분할된 코딩 유닛을 이진 트리(binary tree) 구조로 분할하는 픽쳐 분할부; 및 상기 코딩 유닛에 대응하는 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 변환 집합 결정부를 포함한다.
상기와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 영상 부호화 방법은, 영상의 픽쳐를 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할하고, 상기 픽처 또는 상기 분할된 코딩 유닛을 이진 트리(binary tree) 구조로 분할하는 단계; 분할된 코딩 유닛에 대한 변환 대상 블록을 결정하는 단계; 및 상기 변환 대상 블록에 대응하여, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함한다.
본 발명의 실시예에 따르면, 인터 예측 또는 인트라 예측이 수행되는 기본 단위인 코딩 유닛을 쿼드 트리 및 이진 트리 구조로 분할할 수 있으며, 분할된 코딩 유닛에 대한 변환 블록의 변환 함수 결정에 있어서, 블록 정보에 따라 적응적으로 선택되는 변환 집합을 이용함으로써, 비트 세이빙 및 변환 효율을 향상시킬 수 있고, 고해상도 영상에 대한 코딩 효율을 향상시킬 수 있다.
또한, 본 발명의 실시 예에 따르면, 각 대상 블록에 대해 변환 계수의 구성 및 스캐닝 오더의 결정과, 제2 역변환을 위한 그 치환방법을 블록 적응적이며, 선택적으로 결정할 수 있도록 함으로써, 각 대상 블록에 대한 효율적인 2차 변환 여부의 결정과, 이에 따른 스캐닝 및 변환 처리가 이루어질 수 있는 효율적인 부호화 및 복호화 방법을 제공할 수 있게 된다.
도 1은 본 발명의 일실시예에 따른 영상 부호화 장치의 구성을 나타내는 블록도이다.
도 2 내지 도 5는 영상을 블록 단위로 분할하여 처리하는 방법에 대한 제1 실시예를 설명하기 위한 도면이다.
도 6은 영상 부호화 장치에서 인터 예측을 수행하는 방법에 대한 일실시예를 설명하기 위한 블록도이다.
도 7은 본 발명의 일실시예에 따른 영상 복호화 장치의 구성을 나타내는 블록도이다.
도 8은 영상 복호화 장치에서 인터 예측을 수행하는 방법에 대한 일실시예를 설명하기 위한 블록도이다.
도 9는 영상을 블록 단위로 분할하여 처리하는 방법에 대한 제2 실시예를 설명하기 위한 도면이다.
도 10은 영상을 블록 단위로 분할하여 처리하기 위해 사용되는 신택스(syntax) 구조에 대한 일실시예를 나타내는 도면이다.
도 11은 영상을 블록 단위로 분할하여 처리하는 방법에 대한 제3 실시예를 설명하기 위한 도면이다.
도 12는 코딩 유닛을 이진 트리 구조로 분할하여 변환 유닛을 구성하는 방법에 대한 일실시예를 설명하기 위한 도면이다.
도 13은 영상을 블록 단위로 분할하여 처리하는 방법에 대한 제4 실시예를 설명하기 위한 도면이다.
도 14 내지 도 16은 영상을 블록 단위로 분할하여 처리하는 방법에 대한 또 다른 실시예들을 설명하기 위한 도면들이다.
도 17 및 도 18은 RDO(Rate distortion Optimization)를 수행하여 변환 유닛의 분할 구조를 결정하는 방법에 대한 실시예들을 설명하기 위한 도면들이다.
도 19는 본 발명에 따른 블록 기반 적응적 루프 필터링 방법에 대한 제1 실시예를 설명하기 위한 도면이다.
도 20은 본 발명에 따른 블록 기반 적응적 루프 필터링 방법에 대한 제2 실시예를 설명하기 위한 도면이다.
도 21은 본 발명의 실시 예에 따른 블록 분할의 예측 모드를 도시한 것이며, 도 22는 본 발명의 일 실시 예에 따른 블록 기반 적응적 역변환을 수행하는 복호화 장치의 동작을 설명하기 위한 흐름도이다.
도 23은 본 발명의 실시 예에 따른 변환 집합 결정부를 개념적으로 도시한 도면이다.
도 24는 본 발명의 다른 일 실시 예에 따른 복호화 장치의 동작을 설명하기 위한 흐름도이다.
도 25는 본 발명의 실시 예에 따른 역변환부를 보다 구체적으로 도시한 도면이다.
도 26 및 도 27은 본 발명의 실시 예에 따른 역변환부의 동작을 설명하기 위한 흐름도이다.
도 28은 본 발명의 다른 일 실시 예에 따른 역변환부를 도시한 도면이며, 도 29는 본 발명의 다른 일 실시 예에 따른 역변환부의 동작을 설명하기 위한 흐름도이다.
도 30 내지 도 32는 본 발명의 실시 예에 따른 단말 노드 여부에 따른 블록 적응적 변환 및 역변환을 설명하기 위한 개념도이다.
도 33은 본 발명의 실시 예에 따른 블록 적응적 역변환을 지원하기 위한 신택스의 일 예를 나타낸다.
도 34 및 도 35는 본 발명의 또 다른 일 실시 예에 따른 부호화 및 복호화 시스템을 설명하기 위한 블록도이다.
도 36은 본 발명의 다른 일 실시 예에 따른 복호화 장치(20)의 역양자화/역변환부(220)를 개략적으로 도시한 도면이다.
도 37은 본 발명의 실시 예에 따른 변환 계수 구성 기반 역변환 처리를 설명하기 위한 흐름도이다.
도 38은 사전 결정된 조건을 이용한 역 양자화/역변환부(220)의 제2 역 변환 수행 여부 결정 동작을 나타내는 흐름도이다.
도 39 및 도 40은 본 발명의 실시 예에 따라, 변환 계수 구성부(305)에서 획득된 변환 계수를 이용한 스캐닝 오더 결정을 설명하기 위한 도면들이다.
도 41 내지 도 42는 변환 계수 치환부(315)의 변환 계수 치환 처리를 설명하기 위한 도면들이다.
이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시 예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 아울러, 본 발명에서 특정 구성을 "포함"한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 발명의 실시 또는 본 발명의 기술적 사상의 범위에 포함될 수 있음을 의미한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
또한 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
도 1은 본 발명의 일실시예에 따른 영상 부호화 장치의 구성을 블록도로 도시한 것으로, 영상 부호화 장치(10)는 픽쳐 분할부(110), 변환부(120), 양자화부(130), 스캐닝부(131), 엔트로피 부호화부(140), 인트라 예측부(150), 인터 예측부(160), 역양자화부(135), 역변환부(125), 후처리부(170), 픽쳐 저장부(180), 감산부(190) 및 가산부(195)를 포함한다.
도 1을 참조하면, 픽쳐 분할부(110)는 입력되는 비디오 신호를 분석하여 픽쳐를 코딩 유닛으로 분할하여 예측 모드를 결정하고, 상기 코딩 유닛별로 예측 유닛의 크기를 결정한다.
또한, 픽쳐 분할부(110)는 부호화할 예측 유닛을 예측 모드(또는 예측 방법)에 따라 인트라 예측부(150) 또는 인터 예측부(160)로 보낸다. 또한, 픽쳐 분할부(110)는 부호화할 예측 유닛을 감산부(190)로 보낸다.
여기서, 영상의 픽쳐(picture)는 복수의 슬라이스로 구성되고, 슬라이스는 픽쳐를 분할하는 기본 단위인 복수의 코딩 트리 유닛(Coding Tree Unit: CTU)들로 분할될 수 있다.
상기 코딩 트리 유닛은 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 하나 또는 2 이상의 코딩 유닛(Coding Unit: CU)들로 분할될 수 있다.
코딩 유닛(CU)은 예측이 수행되는 기본 단위인 하나 또는 그 이상의 예측 유닛(Prediction unit: PU)들로 분할될 수 있다.
이 경우, 부호화 장치(10)는 상기 분할된 코딩 유닛(CU)들 각각에 대해 인터 예측과 인트라 예측 중 어느 하나를 예측 방법으로 결정하나, 각각의 예측 유닛(PU)에 대해 서로 다르게 예측 블록을 생성할 수 있다.
한편, 코딩 유닛(CU)은 잔차 블록(residual block)에 대한 변환이 수행되는 기본 단위인 하나 또는 2 이상의 변환 유닛(Transform Unit: TU)들로 분할될 수 있다.
이 경우, 픽쳐 분할부(110)는 상기와 같이 분할된 블록 단위(예를 들어, 예측 유닛(PU) 또는 변환 유닛(TU))로 영상 데이터를 감산부(190)에 전달할 수 있다.
도 2를 참조하면, 최대 256x256 픽셀 크기를 가지는 코딩 트리 유닛(CTU)는 쿼드 트리(quad tree) 구조로 분할되어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 분할될 수 있다.
상기 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들은 각각 쿼드 트리 구조로 재 분할될 수 있으며, 상기와 같이 쿼드 트리 구조로 분할되는 코딩 유닛(CU)의 깊이(Depth)는 0부터 3 중 어느 하나의 정수 값을 가질 수 있다.
코딩 유닛(CU)은 예측 모드에 따라 하나 또는 2 이상의 예측 유닛(PU)들로 분할될 수 있다.
인트라 예측 모드의 경우, 코딩 유닛(CU)의 크기가 2Nx2N 일 때, 예측 유닛(PU)은 도 3의 (a)에 도시된 2Nx2N 또는 도 3의 (b)에 도시된 NxN의 크기를 가질 수 있다.
한편, 인터 예측 모드의 경우, 코딩 유닛(CU)의 크기가 2Nx2N 일 때, 예측 유닛(PU)은 도 4의 (a)에 도시된 2Nx2N, 도 4의 (b)에 도시된 2NxN, 도 4의 (c)에 도시된 Nx2N, 도 4의 (d)에 도시된 NxN, 도 4의 (e)에 도시된 2NxnU, 도 4의 (f)에 도시된 2NxnD, 도 4의 (g)에 도시된 nLx2N 및 도 4의 (h)에 도시된 nRx2N 중 어느 하나의 크기를 가질 수 있다.
도 5를 참조하면, 코딩 유닛(CU)는 쿼드 트리(quad tree) 구조로 분할되어, 정사각형의 형태를 가지는 4개의 변환 유닛(TU)들로 분할될 수 있다.
상기 정사각형의 형태를 가지는 4개의 변환 유닛(TU)들은 각각 쿼드 트리 구조로 재 분할될 수 있으며, 상기와 같이 쿼드 트리 구조로 분할되는 변환 유닛(TU)의 깊이(Depth)는 0부터 3 중 어느 하나의 정수 값을 가질 수 있다.
여기서, 코딩 유닛(CU)이 인터 예측 모드인 경우, 해당 코딩 유닛(CU)으로부터 분할된 예측 유닛(PU)와 변환 유닛(TU)은 서로 독립적인 분할 구조를 가질 수 있다.
코딩 유닛(CU)이 인트라 예측 모드인 경우, 해당 코딩 유닛(CU)으로부터 분할된 변환 유닛(TU)은 예측 유닛(PU)의 크기보다 클 수 없다.
또한, 상기와 같이 분할되는 변환 유닛(TU)은 최대 64x64 픽셀 크기를 가질 수 있다.
변환부(120)는 입력된 예측 유닛(PU)의 원본 블록과 인트라 예측부(150) 또는 인터 예측부(160)에서 생성된 예측 블록 사이의 잔차 신호인 잔차 블록을 변환하며, 상기 변환은 변환 유닛(TU)을 기본 단위로 하여 수행될 수 있다.
상기 변환 과정에서 예측 모드(intra or inter)에 따라 서로 다른 변환 매트릭스가 결정될 수 있으며, 인트라 예측의 잔차 신호는 인트라 예측 모드에 따라 방향성을 가지므로 인트라 예측 모드에 따라 적응적으로 변환 매트릭스가 결정될 수 있다.
변환 단위는 2개(수평, 수직)의 1차원 변환 매트릭스에 의해 변환될 수 있으며, 예를 들어 인터 예측의 경우에는 미리 결정된 1개의 변환 매트릭스가 결정될 수 있다.
한편, 인트라 예측의 경우, 인트라 예측 모드가 수평인 경우에는 잔차 블록이 수직방향으로의 방향성을 가질 확률이 높아지므로, 수직방향으로는 DCT 기반의 정수 매트릭스를 적용하고, 수평방향으로는 DST 기반 또는 KLT 기반의 정수 매트릭스를 적용한다. 인트라 예측 모드가 수직인 경우에는 수직방향으로는 DST 기반 또는 KLT 기반의 정수 매트릭스를, 수평 방향으로는 DCT 기반의 정수 매트릭스를 적용할 수 있다.
또한, DC 모드의 경우에는 양방향 모두 DCT 기반 정수 매트릭스를 적용할 수 있다.
그리고, 인트라 예측의 경우, 변환 유닛(TU)의 크기에 기초하여 변환 매트릭스가 적응적으로 결정될 수도 있다.
양자화부(130)는 상기 변환 매트릭스에 의해 변환된 잔차 블록의 계수들을 양자화하기 위한 양자화 스텝 사이즈를 결정하며, 양자화 스텝 사이즈는 미리 정해진 크기 이상의 양자화 유닛별로 결정될 수 있다.
양자화 유닛의 크기는 8x8 또는 16x16일 수 있으며, 양자화부(130)는 양자화 스텝 사이즈 및 예측 모드에 따라 결정되는 양자화 매트릭스를 이용하여 변환 블록의 계수들을 양자화한다.
또한, 양자화부(130)는 현재 양자화 유닛의 양자화 스텝 사이즈 예측자로서 현재 양자화 유닛에 인접한 양자화 유닛의 양자화 스텝 사이즈를 이용할 수 있다.
양자화부(130)는 현재 양자화 유닛의 좌측 양자화 유닛, 상측 양자화 유닛, 좌상측 양자화 유닛 순서로 검색하여 1개 또는 2개의 유효한 양자화 스텝 사이즈를 이용하여 현재 양자화 유닛의 양자화 스텝 사이즈 예측자를 생성할 수 있다.
예를 들어, 양자화부(130)는 상기 순서로 검색된 유효한 첫번째 양자화 스텝 사이즈를 양자화 스텝 사이즈 예측자로 결정하거나, 상기 순서로 검색된 유효한 2개의 양자화 스텝 사이즈의 평균값을 양자화 스텝 사이즈 예측자로 결정하거나, 또는 1개의 양자화 스텝 사이즈만이 유효한 경우에는 이를 양자화 스텝 사이즈 예측자로 결정할 수 있다.
상기 양자화 스텝 사이즈 예측자가 결정되면, 양자화부(130)는 현재 양자화 유닛의 양자화 스텝 사이즈와 양자화 스텝 사이즈 예측자 사이의 차분값을 엔트로피 부호화부(140)로 전송한다.
한편, 현재 코딩 유닛의 좌측 코딩 유닛, 상측 코딩 유닛, 좌상측 코딩 유닛 모두가 존재하지 않거나. 또는 최대 코딩 유닛 내의 부호화 순서 상으로 이전에 존재하는 코딩 유닛이 존재할 수 있다.
따라서, 현재 코딩 유닛에 인접한 양자화 유닛들과 상기 최대 코딩 유닛 내에서는 부호화 순서상 바로 이전의 양자화 유닛의 양자화 스텝 사이즈가 후보자가 될 수 있다.
이 경우, 1) 현재 코딩 유닛의 좌측 양자화 유닛, 2) 현재 코딩 유닛의 상측 양자화 유닛, 3) 현재 코딩 유닛의 좌상측 양자화 유닛, 4) 부호화 순서상 바로 이전의 양자화 유닛 순서로 우선순위가 설정될 수 있다. 상기 순서는 바뀔 수 있고, 상기 좌상측 양자화 유닛은 생략될 수도 있다.
한편, 상기와 같이 양자화된 변환 블록은 역양자화부(135)와 스캐닝부(131)로 전달된다.
스캐닝부(131)는 양자화된 변환 블록의 계수들을 스캐닝하여 1차원의 양자화 계수들로 변환하며, 이 경우 양자화 후의 변환 블록의 계수 분포가 인트라 예측 모드에 의존적일 수 있으므로 스캐닝 방식은 인트라 예측 모드에 따라 결정될 수 있다.
또한, 계수 스캐닝 방식은 변환 단위의 크기에 따라 달리 결정될 수도 있고, 상기 스캔 패턴은 방향성 인트라 예측 모드에 따라 달라질 수 있으며, 이 경우 양자화 계수들의 스캔 순서는 역방향으로 스캔될 수 있다.
상기 양자화된 계수들이 복수의 서브셋(sub-set)들로 분할된 경우, 각각의 서브셋 내의 양자화 계수들에 동일한 스캔 패턴이 적용될 수 있으며, 서브셋 간의 스캔 패턴은 지그재그 스캔 또는 대각선 스캔이 적용될 수 있다.
한편, 상기 스캔 패턴은 DC를 포함하는 메인 서브셋으로부터 순방향으로 잔여 서브셋들로 스캔하는 것이 바람직하나, 그 역방향도 가능하다.
또한, 서브셋 내의 양자화된 계수들의 스캔 패턴과 동일하게 서브셋 간의 스캔 패턴을 설정할 수도 있으며, 서브셋 간의 스캔 패턴은 인트라 예측 모드에 따라 결정될 수 있다.
한편, 부호화 장치(10)는 상기 변환 유닛(PU) 내에서 0이 아닌 마지막 양자화 계수의 위치 및 각 서브셋 내의 0이 아닌 마지막 양자화 계수의 위치를 나타낼 수 있는 정보를 비트스트림에 포함시켜 복호화 장치(20)로 전송할 수 있다.
역양자화부(135)는 상기와 같이 양자화된 양자화 계수를 역양자화하며, 역변환부(125)는 변환 유닛(TU) 단위로 역변환을 수행하여 상기 역양자화된 변환 계수를 공간 영역의 잔차 블록으로 복원할 수 있다.
가산기(195)는 상기 역변환부(125)에 의해 복원된 잔차 블록과 인트라 예측부(150) 또는 인터 예측부(160)로부터의 수신된 예측 블록을 합하여 복원 블록을 생성할 수 있다.
또한, 후처리부(170)는 복원된 픽쳐에 발생하는 블록킹 효과를 제거하기 위한 디블록킹(deblocking) 필터링 과정, 화소 단위로 원본 영상과의 차이 값을 보완하기 위한 샘플 적응적 오프셋(Sample Adaptive Offset : SAO) 적용 과정 및 코딩 유닛으로 원본 영상과의 차이 값을 보완하기 위한 적응적 루프 필터링(Adaptive Loof Filtering : ALF) 과정을 수행할 수 있다.
디블록킹 필터링 과정은 미리 정해진 크기 이상의 크기를 갖는 예측 유닛(PU) 또는 변환 유닛(TU)의 경계에 적용될 수 있다.
예를 들어, 디블록킹 필터링 과정은, 필터링할 경계(boundary)를 결정하는 단계, 상기 경계에 적용할 경계 필터링 강도(bounary filtering strength)를 결정하는 단계, 디블록킹 필터의 적용 여부를 결정하는 단계, 상기 디블록킹 필터를 적용할 것으로 결정된 경우, 상기 경계에 적용할 필터를 선택하는 단계를 포함할 수 있다.
한편, 상기 디블록킹 필터의 적용 여부는 i) 상기 경계 필터링 강도가 0보다 큰지 여부 및 ii) 상기 필터링할 경계에 인접한 2개의 블록(P 블록, Q블록) 경계 부분에서의 화소값들이 변화 정도를 나타내는 값이 양자화 파라미터에 의해 결정되는 제1 기준값보다 작은지 여부에 의해 결정될 수 있다.
상기 필터는 적어도 2개 이상인 것이 바람직하다. 블록 경계에 위치한 2개의 화소들간의 차이값의 절대값이 제2 기준값보다 크거나 같은 경우에는 상대적으로 약한 필터링을 수행하는 필터를 선택한다.
상기 제2 기준값은 상기 양자화 파라미터 및 상기 경계 필터링 강도에 의해 결정된다.
또한, 샘플 적응적 오프셋(SAO) 적용 과정은 디블록킹 필터가 적용된 영상 내의 화소와 원본 화소 간의 차이값(distortion)을 감소시키기 위한 것으로, 픽쳐 또는 슬라이스 단위로 샘플 적응적 오프셋(SAO) 적용 과정을 수행할지 여부가 결정될 수 있다.
픽쳐 또는 슬라이스는 복수의 오프셋 영역들로 분할될 수 있고, 각 오프셋 영역별로 오프셋 타입이 결정될 수 있으며, 상기 오프셋 타입은 미리 정해진 개수(예를 들어, 4개)의 에지 오프셋 타입과 2개의 밴드 오프셋 타입을 포함할 수 있다.
예를 들어, 오프셋 타입이 에지 오프셋 타입일 경우, 각 화소가 속하는 에지 타입을 결정하여 이에 대응하는 오프셋을 적용하며, 상기 에지 타입은 현재 화소와 인접하는 2개의 화소값의 분포를 기준으로 결정될 수 있다.
적응적 루프 필터링(ALF) 과정은 디블록킹 필터링 과정 또는 적응적 오프셋 적용 과정을 거친 복원된 영상과 원본 영상을 비교한 값을 기초로 필터링을 수행할 수 있다.
픽쳐 저장부(180)는 후처리된 영상 데이터를 후처리부(170)로부터 입력받아 픽쳐(picture) 단위로 영상을 복원하여 저장하며, 픽쳐는 프레임 단위의 영상이거나 필드 단위의 영상일 수 있다.
인터 예측부(160)는 픽쳐 저장부(180)에 저장된 적어도 하나 이상의 참조 픽쳐를 이용하여 움직임 추정을 수행하고, 참조 픽쳐를 나타내는 참조 픽쳐 인덱스 및 움직임 벡터를 결정할 수 있다.
이 경우, 결정된 참조 픽쳐 인덱스 및 움직임 벡터에 따라, 픽쳐 저장부(180)에 저장된 다수의 참조 픽쳐들 중 움직임 추정에 이용된 참조 픽쳐로부터, 부호화하고자 하는 예측 유닛에 대응하는 예측 블록이 추출될 수 있다.
인트라 예측부(150)는 현재 예측 유닛이 포함되는 픽처 내부의 재구성된 화소값을 이용하여 인트라 예측 부호화를 수행할 수 있다.
인트라 예측부(150)는 예측 부호화할 현재 예측 유닛을 입력받아 현재 블록의 크기에 따라 미리 설정된 개수의 인트라 예측 모드 중에 하나를 선택하여 인트라 예측을 수행할 수 있다.
인트라 예측부(150)는 인트라 예측 블록을 생성하기 위해 참조 화소를 적응적으로 필터링하며, 참조 화소가 이용 가능하지 않은 경우 이용 가능한 참조 화소들을 이용하여 참조 화소들을 생성할 수 있다.
엔트로피 부호화부(140)는 양자화부(130)에 의해 양자화된 양자화 계수, 인트라 예측부(150)로부터 수신된 인트라 예측 정보, 인터 예측부(160)로부터 수신된 움직임 정보 등을 엔트로피 부호화할 수 있다.
도 6은 부호화 장치(10)에서 인터 예측을 수행하는 구성에 대한 일실시예를 블록도로 도시한 것으로, 도시된 인터 예측 부호화기는 움직임 정보 결정부(161), 움직임 정보 부호화 모드 결정부(162), 움직임 정보 부호화부(163), 예측 블록 생성부(164), 잔차 블록 생성부(165), 잔차 블록 부호화부(166) 및 멀티플렉서(167)를 포함하여 구성될 수 있다.
도 6을 참조하면, 움직임 정보 결정부(161)는 현재 블록의 움직임 정보를 결정하며, 움직임 정보는 참조 픽쳐 인덱스와 움직임 벡터를 포함하고, 참조 픽쳐 인덱스는 이전에 부호화되어 복원된 픽쳐 중 어느 하나를 나타낼 수 있다.
현재 블록이 단방향 인터 예측 부호화되는 경우에는 리스트 0(L0)에 속하는 참조 픽쳐들 중의 어느 하나를 나타내며, 현재 블록이 양방향 예측 부호화되는 경우에는 리스트 0(L0)의 참조 픽쳐들 중 하나를 나타내는 참조 픽쳐 인덱스와 리스트 1(L1)의 참조 픽쳐들 중의 하나를 나타내는 참조 픽쳐 인덱스를 포함할 수 있다.
또한, 현재 블록이 양방향 예측 부호화되는 경우에는 리스트 0과 리스트 1을 결합하여 생성된 복합 리스트(LC)의 참조 픽쳐들 중의 1개 또는 2개의 픽쳐를 나타내는 인덱스를 포함할 수 있다.
움직임 벡터는 각각의 참조 픽쳐 인덱스가 나타내는 픽쳐 내의 예측 블록의 위치를 나타내며, 상기 움직임 벡터는 화소 단위(정수 단위) 또는 서브 화소 단위일 수 있다.
예를 들어, 상기 움직임 벡터는 1/2, 1/4, 1/8 또는 1/16 화소의 정밀도를 가질 수 있으며, 움직임 벡터가 정수단위가 아닐 경우 예측 블록은 정수 단위의 화소들로부터 생성될 수 있다.
움직임 정보 부호화 모드 결정부(162)는 현재 블록의 움직임 정보에 대한 부호화 모드를 스킵 모드, 머지 모드 및 AMVP 모드 중 어느 하나로 결정할 수 있다.
스킵 모드는 현재 블록의 움직임 정보와 동일한 움직임 정보를 갖는 스킵 후보자가 존재하고, 잔차 신호가 0인 경우에 적용되며, 상기 스킵 모드는 예측 유닛(PU)인 현재 블록이 코딩 유닛(CU)과 크기가 같을 때 적용될 수 있다.
머지 모드는 현재 블록의 움직임 정보와 동일한 움직임 정보를 갖는 머지 후보자가 존재할 때 적용되며, 상기 머지 모드는 현재 블록이 코딩 유닛(CU)과 크기가 다르거나, 크기가 같을 경우에는 잔차 신호가 존재하는 경우에 적용된다. 한편, 머지 후보자와 스킵 후보자는 동일할 수 있다.
AMVP 모드는 스킵 모드 및 머지 모드가 적용되지 않을 때 적용되며, 현재 블록의 움직임 벡터와 가장 유사한 움직임 벡터를 갖는 AMVP 후보자를 AMVP 예측자로 선택할 수 있다.
움직임 정보 부호화부(163)는 움직임 정보 부호화 모드 결정부(162)에 의해 결정된 방식에 따라 움직임 정보를 부호화할 수 있다.
예를 들어, 움직임 정보 부호화부(163)는 움직임 정보 부호화 모드가 스킵 모드 또는 머지 모드일 경우에는 머지 움직임 벡터 부호화 과정을 수행하며, AMVP 모드일 경우에는 AMVP 부호화 과정을 수행할 수 있다.
예측 블록 생성부(164)는 현재 블록의 움직임 정보를 이용하여 예측 블록을 생성하며, 움직임 벡터가 정수 단위일 경우 참조 픽쳐 인덱스가 나타내는 픽쳐 내의 움직임 벡터가 나타내는 위치에 대응하는 블록을 복사하여 현재 블록의 예측 블록을 생성한다.
한편, 움직임 벡터가 정수 단위가 아닌 경우, 예측 블록 생성부(164)는 참조 픽쳐 인덱스가 나타내는 픽쳐 내의 정수 단위 화소들로부터 예측 블록의 화소들을 생성할 수 있다.
이 경우, 휘도 화소에 대해 8탭의 보간 필터를 사용하여 예측 화소가 생성되며, 색차 화소에 대해서는 4탭 보간 필터를 사용하여 예측 화소가 생성될 수 있다.
잔차 블록 생성부(165)는 현재 블록과 현재 블록의 예측 블록을 이용하여 잔차 블록을 생성하며, 현재 블록의 크기가 2Nx2N인 경우 현재 블록과 현재 블록에 대응하는 2Nx2N 크기의 예측 블록을 이용하여 잔차 블록을 생성할 수 있다.
한편, 예측에 이용되는 현재 블록의 크기가 2NxN 또는 Nx2N인 경우, 2Nx2N을 구성하는 2개의 2NxN 블록 각각에 대한 예측 블록을 구한 후, 상기 2개의 2NxN 예측 블록을 이용하여 2Nx2N 크기의 최종 예측 블록이 생성될 수 있다.
또한, 상기 2Nx2N 크기의 예측 블록을 이용하여 2Nx2N 크기의 잔차 블록이 생성될 수도 있으며, 2NxN 크기를 가지는 2개의 예측 블록들의 경계 부분의 불연속성을 해소하기 위해 경계 부분의 픽셀들에 대해 오버랩 스무딩이 적용될 수 있다.
잔차 블록 부호화부(166)는 상기 잔차 블록을 하나 이상의 변환 유닛(TU)들로 분할하여, 각각의 변환 유닛(TU)이 변환 부호화, 양자화 및 엔트로피 부호화될 수 있다.
잔차 블록 부호화부(166)는 인터 예측 방법에 의해 생성된 잔차 블록을 정수기반 변환 매트릭스를 이용하여 변환할 수 있으며, 상기 변환 매트릭스는 정수기반 DCT 매트릭스일 수 있다.
한편, 잔차 블록 부호화부(166)는 변환 매트릭스에 의해 변환된 잔차 블록의 계수들을 양자화하기 위해 양자화 매트릭스를 이용하며, 상기 양자화 매트릭스는 양자화 파라미터에 의해 결정될 수 있다.
상기 양자화 파라미터는 미리 정해진 크기 이상의 코딩 유닛(CU) 별로 결정되며, 현재 코딩 유닛(CU)이 상기 미리 정해진 크기보다 작은 경우 상기 미리 정해진 크기 내의 코딩 유닛(CU)들 중 부호화 순서상 첫번째 코딩 유닛(CU)의 양자화 파라미터만을 부호화하고 나머지 코딩 유닛(CU)의 양자화 파라미터는 상기 파라미터와 동일하므로 부호화하지 않을 수 있다.
또한, 상기 양자화 파라미터 및 예측 모드에 따라 결정되는 양자화 매트릭스를 이용하여 상기 변환 블록의 계수들이 양자화될 수 있다.
상기 미리 정해진 크기 이상의 코딩 유닛(CU) 별로 결정되는 양자화 파라미터는 현재 코딩 유닛(CU)에 인접한 코딩 유닛(CU)의 양자화 파라미터를 이용하여 예측 부호화될 수 있다.
현재 코딩 유닛(CU)의 좌측 코딩 유닛(CU), 상측 코딩 유닛(CU) 순서로 검색하여 유효한 1개 또는 2개의 유효한 양자화 파라미터를 이용하여 현재 코딩 유닛(CU)의 양자화 파라미터 예측자를 생성할 수 있다.
예를 들어, 상기 순서로 검색된 유효한 첫번째 양자화 파라미터를 양자화 파라미터 예측자로 결정할 수 있으며, 또한 좌측 코딩 유닛(CU), 부호화 순서상 바로 이전의 코딩 유닛(CU) 순으로 검색하여 유효한 첫번째 양자화 파라미터를 양자화 파라미터 예측자로 결정할 수 있다.
양자화된 변환 블록의 계수들은 스캐닝되어 1차원의 양자화 계수들로 변환되며, 스캐닝 방식은 엔트로피 부호화 모드에 따라 다르게 설정될 수 있다.
예를 들어, CABAC으로 부호화될 경우 인터 예측 부호화된 양자화 계수들은 미리 정해진 하나의 방식(지그재그, 또는 대각선 방향으로의 래스터 스캔)으로 스캐닝될 수 있으며, CAVLC으로 부호화될 경우 상기 방식과 다른 방식으로 스캐닝될 수 있다.
예를 들어, 스캐닝 방식이 인터의 경우에는 지그재그, 인트라의 경우에는 인트라 예측 모드에 따라 결정될 수 있으며, 계수 스캐닝 방식은 변환 단위의 크기에 따라 상이하게 결정될 수도 있다.
한편, 상기 스캔 패턴은 방향성 인트라 예측 모드에 따라 달라질 수 있으며, 양자화 계수들의 스캔 순서는 역방향으로 스캔 될 수 있다.
멀티플렉서(167)는 상기 움직임 정보 부호화부(163)에 의해 부호화된 움직임 정보들과 상기 잔차 블록 부호화부(166)에 의해 부호화된 잔차 신호들을 다중한다.
상기 움직임 정보는 부호화 모드에 따라 달라질 수 있으며, 예를 들어 스킵 또는 머지일 경우에는 예측자를 나타내는 인덱스만을 포함하고, AMVP일 경우 현재 블록의 참조 픽쳐 인덱스, 차분 움직임 벡터 및 AMVP 인덱스를 포함할 수 있다.
이하, 도 1에 도시된 인트라 예측부(150)의 동작에 대한 일실시예를 상세히 설명하기로 한다.
먼저, 인트라 예측부(150)는 픽쳐 분할부(110)로부터 예측 모드 정보 및 예측 유닛(PU)의 크기를 수신하며, 예측 유닛(PU)의 인트라 예측 모드를 결정하기 위해 참조 화소를 픽쳐 저장부(180)로부터 읽어들일 수 있다.
인트라 예측부(150)는 이용 가능하지 않은 참조 화소가 존재하는지 여부를 검토하여 참조 화소 생성 여부를 판단하며, 상기 참조 화소들은 현재 블록의 인트라 예측 모드를 결정하는데 사용될 수 있다.
현재 블록이 현재 픽쳐의 상측 경계에 위치하는 경우에는 현재 블록의 상측에 인접한 화소들이 정의되지 않고, 현재 블록이 현재 픽쳐의 좌측 경계에 위치하는 경우에는 현재 블록의 좌측에 인접한 화소들이 정의되지 않으며, 상기 화소들은 이용 가능한 화소들이 아닌 것으로 판단될 수 있다.
또한, 현재 블록이 슬라이스 경계에 위치하여 슬라이스의 상측 또는 좌측에 인접하는 화소들이 먼저 부호화되어 복원되는 화소들이 아닌 경우에도 이용 가능한 화소들이 아닌 것으로 판단될 수 있다.
상기와 같이 현재 블록의 좌측 또는 상측에 인접한 화소들이 존재하지 않거나, 미리 부호화되어 복원된 화소들이 존재하지 않는 경우, 이용 가능한 화소들만을 이용하여 현재 블록의 인트라 예측 모드가 결정될 수도 있다.
한편, 현재 블록의 이용 가능한 참조 화소들을 이용하여 이용 가능하지 않은 위치의 참조 화소가 생성될 수도 있으며, 예를 들어 상측 블록의 화소들이 이용 가능하지 않은 경우 좌측 화소들의 일부 또는 전부를 이용하여 상측 화소들을 생성할 수 있고, 그 역으로도 가능하다.
즉, 이용 가능하지 않은 위치의 참조 화소로부터 미리 정해진 방향으로 가장 가까운 위치의 이용 가능한 참조 화소를 복사하여 참조 화소가 생성되거나, 미리 정해진 방향에 이용 가능한 참조 화소가 존재하지 않는 경우 반대 방향의 가장 가까운 위치의 이용 가능한 참조 화소를 복사하여 참조 화소가 생성될 수 있다.
한편, 현재 블록의 상측 또는 좌측 화소들이 존재하는 경우에도 상기 화소들이 속하는 블록의 부호화 모드에 따라 이용 가능하지 않은 참조 화소로 결정될 수 있다.
예를 들어, 현재 블록의 상측에 인접한 참조 화소가 속하는 블록이 인터 부호화되어 복원된 블록일 경우, 상기 화소들을 이용 가능하지 않은 화소들로 판단할 수 있다.
이 경우, 현재 블록에 인접한 블록이 인트라 부호화되어 복원된 블록에 속하는 화소들을 이용하여 이용 가능한 참조 화소들이 생성될 수 있으며, 부호화 장치(10)가 부호화 모드에 따라 이용 가능한 참조 화소를 판단한다는 정보를 복호화 장치(20)로 전송한다.
인트라 예측부(150)는 상기 참조 화소들을 이용하여 현재 블록의 인트라 예측 모드를 결정하며, 현재 블록에 허용 가능한 인트라 예측 모드의 수는 블록의 크기에 따라 달라질 수 있다.
예를 들어, 현재 블록의 크기가 8x8, 16x16, 32x32인 경우에는 34개의 인트라 예측 모드가 존재할 수 있고, 현재 블록의 크기가 4x4인 경우에는 17개의 인트라 예측 모드가 존재할 수 있다.
상기 34개 또는 17개의 인트라 예측 모드는 적어도 하나 이상의 비방향성 모드(비 directional 모드)와 복수개의 방향성 모드들(directional 모드s)로 구성될 수 있다.
하나 이상의 비방향성 모드는 DC 모드 및/또는 플래너(planar) 모드일수 있다. DC 모드 및 플래너모드가 비방향성 모드로 포함되는 경우에는, 현재 블록의 크기에 관계없이 35개의 인트라 예측 모드가 존재할 수도 있다.
이 경우, 2개의 비방향성 모드(DC 모드 및 플래너 모드)와 33개의 방향성 모드가 포함될 수 있다.
플래너 모드의 경우, 현재 블록의 우하측(bottom-right)에 위치하는 적어도 하나의 화소값(또는 상기 화소값의 예측값, 이하 제1 참조값이라 함)과 참조 화소들을 이용하여 현재 블록의 예측 블록이 생성된다.
본 발명의 일실시예에 따른 영상 복호화 장치의 구성은 도 1 내지 도 6을 참조하여 설명한 영상 부호화 장치(10)의 구성으로부터 도출될 수 있으며, 예를 들어 도 1 내지 도 6을 참조하여 설명한 바와 같은 영상 부호화 방법의 과정들을 역으로 수행함으로써 영상을 복호화할 수 있다.
도 7은 본 발명의 일실시예에 따른 동영상 복호화 장치의 구성을 블록도로 도시한 것으로, 복호화 장치(20)는 엔트로피 복호화부(210), 역양자화/역변환부(220), 가산기(270), 디블록킹 필터(250), 픽쳐 저장부(260), 인트라 예측부(230), 움직임 보상 예측부(240) 및 인트라/인터전환 스위치(280)를 구비한다.
엔트로피 복호화부(210)는, 영상 부호화 장치(10)에서 부호화된 비트 스트림을 입력받아 복호화하여 인트라 예측 모드 인덱스, 움직임 정보, 양자화 계수 시퀀스 등으로 분리하며, 복호화된 움직임 정보를 움직임 보상 예측부(240)로 전달한다.
엔트로피 복호화부(210)는 인트라 예측 모드 인덱스를 인트라 예측부(230)와 역양자화/역변환부(220)로 전달하여, 역양자화 계수 시퀀스를 역양자화/역변환부(220)로 전달한다.
역양자화/역변환부(220)는 상기 양자화 계수 시퀀스를 2차원 배열의 역양자화 계수로 변환하며, 상기 변환을 위해 복수의 스캐닝 패턴들 중 하나를 선택할 수 있으며 예를 들어 현재 블록의 예측 모드(즉, 인트라 예측 또는 인터 예측)와 인트라 예측 모드에 기초하여 스캐닝 패턴을 선택할 수 있다.
역양자화/역변환부(220)는 2차원 배열의 역양자화 계수에 대해 복수의 양자화 매트릭스들 중에서 선택된 양자화 매트릭스를 적용하여 양자화 계수를 복원한다.
한편, 복원하고자 하는 현재 블록의 크기에 따라 서로 다른 양자화 매트릭스가 적용되며, 동일 크기의 블록에 대해서도 상기 현재 블록의 예측 모드 및 인트라 예측 모드 중 적어도 하나에 기초하여 양자화 매트릭스가 선택될 수 있다.
역양자화/역변환부(220)는 상기 복원된 양자화 계수를 역변환하여 잔차 블록을 복원하며, 상기 역변환 과정은 변환 유닛(TU)을 기본 단위로 하여 수행될 수 있다.
가산기(270)는 역양자화/역변환부(220)에 의해 복원된 잔차 블록과 인트라 예측부(230) 또는 움직임 보상 예측부(240)에 의해 생성되는 예측 블록을 합하여 영상 블록을 복원한다.
디블록킹 필터(250)는 가산기(270)에 의해 생성된 복원 영상에 디블록킹 필터 처리를 수행하여, 양자화 과정에 따른 영상 손실에 기인하는 디블록킹 아티펙트를 감소시킬 수 있다.
픽쳐 저장부(260)는 디블록킹 필터(250)에 의해 디블록킹 필터 처리가 수행된 로컬 복호 영상을 저장하기 위한 프레임 메모리이다.
인트라 예측부(230)는 엔트로피 복호화부(210)로부터 수신된 인트라 예측 모드 인덱스에 기초하여 현재 블록의 인트라 예측 모드를 복원하고, 복원된 인트라 예측 모드에 따라 예측 블록을 생성한다.
움직임 보상 예측부(240)는 움직임 벡터 정보에 기초하여 픽쳐 저장부(260)에 저장된 픽쳐로부터 현재 블록에 대한 예측 블록을 생성하며, 소수 정밀도의 움직임 보상이 적용될 경우 선택된 보간 필터를 적용하여 예측 블록을 생성할 수 있다.
인트라/인터 전환 스위치(280)는 부호화 모드에 기초하여 인트라 예측부(230)와 움직임 보상 예측부(240)의 어느 하나에서 생성된 예측 블록을 가산기(270)에 제공할 수 있다.
도 8는 영상 복호화 장치(20)에서 인터 예측을 수행하는 구성에 대한 일실시예를 블록도로 도시한 것으로, 인터 예측 복호화기는 디멀티플렉서(241), 움직임 정보 부호화 모드 판단부(242), 머지 모드 움직임 정보 복호화부(243), AMVP 모드 움직임 정보 복호화부(244), 예측블록 생성부(245), 잔차 블록 복호화부(246) 및 복원블록 생성부(247)를 포함한다.
도 8을 참조하면, 디-멀티플렉서(241)는 수신된 비트스트림으로부터 현재 부호화된 움직임 정보와 부호화된 잔차 신호들을 역다중화하여, 역다중화된 움직임 정보를 움직임 정보 부호화 모드 판단부(242)로 전송하고, 역다중화된 잔차신호를 잔차블록 복호화부(246)로 전송할 수 있다.
움직임 정보 부호화 모드 판단부(242)는 현재 블록의 움직임 정보 부호화 모드를 판단하며, 수신된 비트스트림의 skip_flag가 1의 값을 갖는 경우 현재 블록의 움직임 정보 부호화 모드가 스킵 부호화 모드로 부호화된 것으로 판단할 수 있다.
움직임 정보 부호화 모드 판단부(242)는 수신된 비트스트림의 skip_flag가 0의 값을 갖고, 디-멀티블렉서(241)로부터 수신된 움직임 정보가 머지 인덱스만을 갖는 경우, 현재 블록의 움직임 정보 부호화 모드가 머지 모드로 부호화된 것으로 판단할 수 있다.
또한, 움직임 정보 부호화 모드 판단부(242)는 수신된 비트스트림의 skip_flag가 0의 값을 갖고, 디멀티블렉서(241)로부터 수신된 움직임 정보가 참조 픽쳐 인덱스와 차분 움직임 벡터와 AMVP인덱스를 갖는 경우, 현재 블록의 움직임 정보 부호화 모드가 AMVP 모드로 부호화된 것으로 판단할 수 있다.
머지 모드 움직임 정보 복호화부(243)는 움직임 정보 부호화 모드 판단부(242)가 현재 블록의 움직임 정보 부호화 모드를 스킵 또는 머지 모드로 판단한 경우에 활성화되며, AMVP 모드 움직임 정보 복호화부(244)는 움직임 정보 부호화 모드 판단부(242)가 현재 블록의 움직임 정보 부호화 모드를 AMVP 모드로 판단한 경우에 활성화될 수 있다.
예측블록 생성부(245)는 머지 모드 움직임 정보 복호화부(243) 또는 AMVP 모드 움직임 정보 복호화부(244)에 의해 복원된 움직임 정보를 이용하여 현재 블록의 예측 블록을 생성한다.
움직임 벡터가 정수 단위일 경우, 참조 픽쳐 인덱스가 나타내는 픽쳐 내의 움직임 벡터가 나타내는 위치에 대응하는 블록을 복사하여 현재 블록의 예측 블록이 생성될 수 있다.
한편, 움직임 벡터가 정수 단위가 아닐 경우, 참조 픽쳐 인덱스가 나타내는 픽쳐 내의 정수 단위 화소들로부터 예측 블록의 화소들이 생성되며, 이 경우 휘도 화소의 경우에는 8탭의 보간 필터를 사용하고 색차 화소의 경우 4탭 보간 필터를 사용하여 예측 화소가 생성될 수 있다.
잔차 블록 복호화부(246)는 잔차 신호를 엔트로피 복호화하고, 엔트로피 복호화된 계수들을 역스캐닝하여 2차원의 양자화된 계수 블록을 생성하며, 역스캐닝 방식은 엔트로피 복호화 방식에 따라 달라질 수 있다.
예를 들어, CABAC 기반으로 복호화된 경우 대각선 방향의 래스터 역스캔 방식으로, CAVLC 기반으로 복호화된 경우에는 지그재그 역스캔 방식으로 상기 역스캐닝 방식이 적용될 수 있다. 또한, 예측 블록의 크기에 따라 상기 역스캐닝 방식이 상이하게 결정될 수도 있다.
잔차블록 복호화부(246)는 상기와 같이 생성된 계수블록을 역양자화 매트릭스를 이용하여 역양자화하며, 상기 양자화 매트릭스를 유도하기 위해 양자화 파리미터를 복원할 수 있다. 여기서, 양자화 스텝 사이즈는 미리 정해진 크기 이상의 코딩 유닛별로 복원될 수 있다.
잔차블록 복호화부(260)는 상기 역양자화된 계수 블록을 역변환하여 잔차블록을 복원한다.
복원블록 생성부(270)는 상기 예측블록 생성부(250)에 의해 생성된 예측 블록과 상기 잔차블록 복호화부(260)에 의하여 생성된 잔차 블록을 더하여 복원 블록을 생성한다.
이하, 현재 블록을 인트라 예측을 통해 복원하는 과정에 대한 일실시예를 도 7을 다시 참조하여 설명한다.
먼저, 수신된 비트스트림으로부터 현재 블록의 인트라 예측 모드가 복호화되며, 그를 위해 엔트로피 복호화부(210)는 복수의 인트라 예측 모드 테이블들 중 하나를 참조하여 현재 블록의 제1 인트라 예측 모드 인덱스를 복원할 수 있다.
상기 복수의 인트라 예측 모드 테이블들 부호화 장치(10)와 복호화 장치(20)가 공유하는 테이블로서, 현재 블록에 인접한 복수 블록들에 대한 인트라 예측 모드의 분포에 따라 선택된 어느 하나의 테이블이 적용될 수 있다.
예를 들어, 현재 블록의 좌측 블록의 인트라 예측 모드와 현재 블록의 상측 블록의 인트라 예측 모드가 동일하면 제1 인트라 예측 모드 테이블을 적용하여 현재 블록의 제 1 인트라 예측 모드 인덱스를 복원하고, 동일하지 않으면 제2 인트라 예측 모드 테이블을 적용하여 현재 블록의 제 1 인트라 예측 모드 인덱스를 복원할 수 있다.
또 다른 예로써, 현재 블록의 상측 블록과 좌측 블록의 인트라 예측 모드가 모두 방향성 예측 모드(directional intra prediction 모드)일 경우, 상기 상측 블록의 인트라 예측 모드의 방향과 상기 좌측 블록의 인트라 예측 모드의 방향이 소정 각도 이내이면 제 1 인트라 예측 모드 테이블을 적용하여 현재 블록의 제 1 인트라 예측 모드 인덱스를 복원하고, 소정 각도를 벗어나면 제2 인트라 예측 모드 테이블을 적용하여 현재 블록의 제 1 인트라 예측 모드 인덱스를 복원할 수도 있다.
엔트로피 복호화부(210)는 복원된 현재 블록의 제1 인트라 예측 모드 인덱스를 인트라 예측부(230)로 전송한다.
제1 인트라 예측 모드를 인덱스를 수신한 인트라 예측부(230)는, 상기 인덱스가 최소값을 가질 경우(즉, 0일 경우), 현재 블록의 최대 가능 모드를 현재 블록의 인트라 예측 모드로 결정할 수 있다.
한편, 인트라 예측부(230)는, 상기 인덱스가 0 이외의 값을 가질 경우, 현재 블록의 최대 가능 모드가 나타내는 인덱스와 상기 제1 인트라 예측 모드 인덱스를 비교하고, 비교 결과 상기 제1 인트라 예측 모드 인덱스가 상기 현재 블록의 최대 가능 모드가 나타내는 인덱스보다 작지 않으면 상기 제1 인트라 예측 모드 인덱스에 1을 더한 제2 인트라 예측 모드 인덱스에 대응하는 인트라 예측 모드를 현재 블록의 인트라 예측 모드로 결정하고, 그렇지 않으면 상기 제1 인트라 예측 모드 인덱스에 대응하는 인트라 예측 모드를 현재 블록의 인트라 예측 모드로 결정할 수 있다.
현재 블록에 허용 가능한 인트라 예측 모드는 적어도 하나 이상의 비방향성 모드(비 directional 모드)와 복수 개의 방향성 모드들(directional 모드s)로 구성될 수 있다.
하나 이상의 비방향성 모드는 DC 모드 및/또는 플래너(planar) 모드일수 있다. 또한, DC 모드와 플래너 모드 중 어느 하나가 적응적으로 상기 허용 가능한 인트라 예측 모드 셋에 포함될 수 있다.
이를 위해, 픽쳐 헤더 또는 슬라이스 헤더에 상기 허용 가능한 인트라 예측 모드 셋에 포함되는 비방향성 모드를 특정하는 정보가 포함될 수 있다.
다음으로, 인트라 예측부(230)는 인트라 예측 블록을 생성하기 위해, 참조 화소들을 픽쳐 저장부(260)로터 읽어들이고, 이용 가능하지 않은 참조 화소가 존재하는지 여부를 판단한다.
상기 판단은 현재 블록의 복호된 인트라 예측 모드를 적용하여 인트라 예측 블록을 생성하는데 이용되는 참조 화소들의 존재 여부에 따라 행해질 수도 있다.
다음으로, 인트라 예측부(230)는 참조 화소를 생성할 필요가 있을 경우에는 미리 복원된 이용 가능한 참조 화소들을 이용하여 이용 가능하지 않은 위치의 참조 화소들을 생성할 수 있다.
이용 가능하지 않은 참조 화소에 대한 정의 및 참조 화소의 생성 방법은 도 1에 따른 인트라 예측부(150)에서의 동작과 동일할 수 있으나, 현재 블록의 복호화된 인트라 예측 모드에 따라 인트라 예측 블록을 생성하는데 이용되는 참조 화소들이 선택적으로 복원될 수도 있다.
또한, 인트라 예측부(230)는 예측 블록을 생성하기 위해 참조 화소들에 필터를 적용할지 여부를 판단하며, 즉 현재 블록의 인트라 예측 블록을 생성하기 위하여 참조 화소들에 대해 필터링을 적용할지 여부를 상기 복호된 인트라 예측 모드 및 현재 예측 블록의 크기에 기초하여 결정할 수 있다.
블록킹 아티펙트의 문제는 블록의 크기가 커질수록 커지므로, 블록의 크기가 커질수록 참조 화소를 필터링하는 예측모드의 수를 증가시킬 수 있으나, 블록이 소정 크기보다 커지는 경우 평탄한 영역으로 볼 수 있으므로 복잡도 감소를 위해 참조 화소를 필터링하지 않을 수도 있다.
상기 참조 화소에 필터 적용이 필요하다고 판단된 경우, 인트라 예측부(230)는 필터를 이용하여 상기 참조 화소들을 필터링한다.
상기한 참조 화소들 간의 단차의 차이 정도에 따라 적어도 2개 이상의 필터를 적응적으로 적용할 수도 있다. 상기 필터의 필터계수는 대칭적인 것이 바람직하다.
또한, 상기한 2개 이상의 필터가 현재 블록의 크기에 따라 적응적으로 적용될 수도 있으며, 필터를 적용할 경우 크기가 작은 블록에 대해서는 대역폭이 좁은 필터가, 크기가 큰 블록들에 대해서는 대역폭이 넓은 필터가 적용될 수도 있다.
DC 모드의 경우에는 참조 화소들의 평균값으로 예측 블록이 생성되므로 필터를 적용할 필요가 없으며, 상이 수직 방향으로 연관성(correlation)이 있는 수직 모드에서는 참조 화소에 필터를 적용할 필요가 없고, 영상이 수평 방향으로 연관성이 있는 수평 모드에서도 참조 화소에 필터를 적용할 필요가 없을 수 있다.
이와 같이, 필터링의 적용 여부는 현재 블록의 인트라 예측 모드와도 연관성이 있으므로, 현재 블록의 인트라 예측 모드 및 예측 블록의 크기에 기초하여 참조 화소를 적응적으로 필터링할 수 있다.
다음으로, 인트라 예측부(230)는 상기 복원된 인트라 예측 모드에 따라 참조 화소 또는 필터링된 참조 화소들을 이용하여 예측 블록을 생성하며, 상기 예측 블록의 생성은 부호화 장치(10)에서의 동작과 동일할 수 있으므로, 그에 대한 상세한 설명은 생략하기로 한다.
인트라 예측부(230)는 상기 생성된 예측 블록을 필터링할지 여부를 판단하며, 상기 필터링 여부는 슬라이스 헤더 또는 부호화 유닛 헤더에 포함된 정보를 이용하거나 또는 현재 블록의 인트라 예측 모드에 따라 결정될 수 있다.
상기 생성된 예측 블록을 필터링할 것으로 판단할 경우, 인트라 예측부(230)는 현재 블록에 인접한 이용 가능한 참조 화소들을 이용하여 생성된 예측 블록의 특정 위치의 화소를 필터링하여 새로운 화소를 생성할 수 있다.
예를 들어, DC 모드에서는 예측 화소들 중 참조 화소들과 접하는 예측 화소는 상기 예측 화소와 접하는 참조 화소를 이용하여 필터링 될 수 있다.
따라서, 예측 화소의 위치에 따라 1개 또는 2개의 참조 화소를 이용하여 예측 화소가 필터링되며, DC 모드에서의 예측 화소의 필터링은 모든 크기의 예측 블록에 적용할 수 있다.
한편, 수직 모드에서는 예측 블록의 예측 화소들 중 좌측 참조 화소와 접하는 예측 화소들은 상기 예측블록을 생성하는데 이용되는 상측 화소 이외의 참조 화소들을 이용하여 변경될 수 있다.
마찬가지로, 수평 모드에서는 생성된 예측 화소들 중 상측 참조 화소와 접하는 예측 화소들은 상기 예측블록을 생성하는데 이용되는 좌측 화소 이외의 참조 화소들을 이용하여 변경될 수 있다.
이와 같은 방식으로 복원된 현재 블록의 예측 블록과 복호화한 현재 블록의 잔차 블록을 이용하여 현재 블록이 복원될 수 있다.
도 9는 영상을 블록 단위로 분할하여 처리하는 방법에 대한 제2 실시예를 설명하기 위한 도시한 것이다.
도 9를 참조하면, 최대 256x256 픽셀 크기를 가지는 코딩 트리 유닛(CTU)은 먼저 쿼드 트리(quad tree) 구조로 나뉘어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 분할될 수 있다.
여기서, 상기 쿼드 트리 구조로 분할된 코딩 유닛들 중 적어도 하나는 이진 트리(binary tree) 구조로 나뉘어, 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 재 분할될 수 있다.
한편, 상기 쿼드 트리 구조로 분할된 코딩 유닛들 중 적어도 하나는 쿼드 트리 구조로 나뉘어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 재 분할될 수도 있다.
그리고 상기 이진 트리 구조로 재 분할된 코딩 유닛들 중 적어도 하나는 이진 트리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 분할될 수 있다.
한편, 상기 쿼드 트리 구조로 재 분할된 코딩 유닛들 중 적어도 하나는 쿼드 트리 구조 또는 이진 크리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 코딩 유닛(CU)들로 분할될 수도 있다.
상기와 같이 이진 트리 구조로 분할되어 구성된 CU들은 들은, 더 이상 분할되지 않고, 예측 및 변환에 이용될 수 있다. 이때, 이진 분할된 CU는 실제 부/복호화를 수행하는 블록 단위인 코딩 블록(Coding block: CB)과 해당 코딩 블록에 해당되는 신택스를 포함할 수 있다. 즉, 도 9에 도시된 바와 같은 코딩 블록(CB)에 속하는 예측 유닛(PU)과 변환 유닛(TU)의 크기는, 해당 코딩 블록(CB)의 크기와 동일할 수 있다.
상기와 같이 쿼드 트리 구조로 분할된 코딩 유닛은 도 3 및 도 4를 참조하여 설명한 바와 같은 방법을 이용하여 하나 또는 2 이상의 예측 유닛(PU)들로 분할될 수 있다.
또한, 상기와 같이 쿼드 트리 구조로 분할된 코딩 유닛은 도 5를 참조하여 설명한 바와 같은 방법을 이용하여 하나 또는 2 이상의 변환 유닛(TU)들로 분할될 수 있으며, 상기 분할된 변환 유닛(TU)은 최대 64x64 픽셀 크기를 가질 수 있다.
도 10은 영상을 블록 단위로 분할하여 처리하기 위해 사용되는 신택스(syntax) 구조에 대한 일실시예를 나타내는 것이다.
도 10 및 도 9를 참조하면, 본 발명의 실시 예에 따른 블록 구조(block structure)는 쿼드 트리 분할 여부를 나타내는 split_cu_flag와 이진 트리 분할 여부를 나타내는 binary_split_flag를 통해 결정될 수 있다.
예를 들어, 앞서 설명한 바와 같은 코딩 유닛(CU)의 분할 여부는 split_cu_flag를 이용하여 나타낼 수 있다. 그리고, 쿼드 트리 분할 이후 이진 분할된 CU에 대응하여, 이진 분할 여부를 나타내는 binary_split_flag 및 분할된 방향을 나타내는 신택스가 결정될 수 있다. 이 때, 이진 분할의 방향성을 나타내는 방법으로서, binary_split_hor과 binary_split_ver과 같이 복수개의 신택스를 복호화하여 이에 기초한 분할 방향을 결정하는 방법 또는 binary_split_mode와 같이 하나의 신택스와 이에 따른 신호 값을 복호화하여 Horizontal(0) 또는 Vertical(1) 방향으로의 분할을 처리하는 방법이 예시될 수 있다.
본 발명에 따른 또 다른 실시예로써, 이진 트리를 이용하여 분할되는 코딩 유닛(CU)의 깊이는 binary_depth를 이용하여 나타내어질 수 있다.
도 9 및 도 10을 참조하여 설명한 바와 같은 방법에 의해 분할된 블록들(예를 들어, 코딩 유닛(CU), 예측 유닛(PU) 및 변환 유닛(TU))에 대해 도 1 내지 도 8을 참조하여 설명한 바와 같은 방법들이 적용됨으로써, 영상에 대한 부호화 및 복호화가 수행될 수 있다.
이하에서는, 도 11 내지 도 16을 참조하여, 코딩 유닛(CU)을 하나 또는 2 이상의 변환 유닛(TU)들로 분할하는 방법에 대한 또 다른 실시예들을 설명하기로 한다.
본 발명의 실시예에 따르면, 코딩 유닛(CU)은 이진 트리 구조로 나뉘어 잔차 블록에 대한 변환이 수행되는 기본 단위인 변환 유닛(TU)들로 분할될 수 있다.
예를 들어, 도 11을 참조하면, 이진 트리 구조로 분할되어 Nx2N 또는 2NxN의 크기를 가지는 직사각형의 코딩 블록들(CU0, Cu1) 중 적어도 하나는, 다시 이진 트리 구조로 나뉘어, NxN의 크기를 가지는 정사각형의 변환 유닛들(TU0, TU1)로 분할될 수 있다.
상기한 바와 같이, 블록 기반의 영상 부호화 방법은, 예측, 변환, 양자화 및 엔트로피 부호화 단계들을 수행할 수 있다.
상기 예측 단계에서는, 현재 부호화를 수행하는 블록과 기존의 부호화된 영상 또는 주변 영상을 참조하여 예측 신호를 생성하며, 이를 통해 현재 블록과의 차분 신호를 계산할 수 있다.
한편, 변환 단계에서는, 상기 차분 신호를 입력으로 하여 다양한 변환 함수를 이용하여 변환을 수행하며, 상기 변환된 신호는 DC 계수와 AC 계수들로 분류되 에너지 집중(Energy compaction)되어 부호화 효율이 향상될 수 있다.
또한, 양자화 단계에서는 변환 계수(Transform coefficient)들을 입력으로 양자화가 수행하며, 이후 양자화된 신호에 대해 엔트로피 부호화가 수행됨으로써 영상이 부호화될 수 있다.
한편, 영상 복호화 방법은 상기와 같은 부호화 과정의 역순으로 진행되며, 영상의 화질 왜곡 현상이 양자화 단계에서 발생할 수 있다.
부호화 효율을 향상시키면서 화질 왜곡 현상을 줄이기 위한 방법으로서, 변환 단계에서 입력으로 들어오는 차분 신호의 분포 및 영상의 특징에 따라 변환 유닛(TU)의 크기 또는 모양과 적용되는 변환 함수 종류를 다양하게 할 수 있다.
예를 들어, 예측 단계에서 블록 기반 움직임 추정 과정을 통해 현재 블록과 유사한 블록을 찾는 경우, SAD(Sum of Absolute Difference) 또는 MSE(Mean Square error) 등과 같은 코스트(cost) 측정 방법을 이용하여, 차분 신호의 분포는 영상의 특성에 따라 다양한 형태로 생길 수 있다.
그에 따라, 다양한 차분 신호의 분포에 기초해 선택적으로 변환 유닛(CU)의 크기 또는 모양을 결정하여 변환을 수행함으로써, 효과적인 부호화가 수행될 수 있다.
도 12를 참조하면, 임의의 코딩 유닛(CUx) 에서 (a)에 도시된 바와 같이 차분 신호가 발생하는 경우, (b)에 도시된 바와 같이 해당 코딩 유닛(CUx)을 이진 트리 구조로 나누어 2개의 변환 유닛(TU)들로 분할함으로써 효과적인 변환이 수행되도록 할 수 있다.
예를 들어, DC 값은 일반적으로 입력 신호의 평균값을 나타낸다고 말할 수 있으므로, 도 12의 (a)에 도시된 바와 같은 차분 신호가 변환 과정의 입력으로 수신되는 경우, 코딩 유닛(CUx)을 2개의 변환 유닛(TU)들로 분할함으로써 효과적으로 DC 값을 나타낼 수 있다.
도 13을 참조하면, 2Nx2N의 크기를 가지는 정사각형의 코딩 유닛(CU0)이 이진 트리 구조로 나뉘어, Nx2N 또는 2NxN의 크기를 가지는 직사각형의 변환 유닛들(TU0, TU1)로 분할될 수 있다.
본 발명의 또 다른 실시예에 따르면, 상기한 바와 같이 코딩 유닛(CU)을 이진 트리 구조로 분할하는 단계를 2회 이상 반복해 수행하여, 복수의 변환 유닛(TU)들로 분할할 수 있다.
도 14를 참조하면, Nx2N의 크기를 가지는 직사각형의 코딩 블록(CB1)을 이진 트리 구조로 분할하고, 상기 분할된 NxN의 크기를 가지는 블록을 다시 이진 트리 구조로 분할하여 N/2xN 또는 NxN/2의 크기를 가지는 직사각형의 블록을 구성한 후, 상기 N/2xN 또는 NxN/2의 크기를 가지는 블록을 다시 이진 트리 구조로 분할하여 N/2xN/2의 크기를 가지는 정사각형의 변환 유닛들(TU1, TU2, TU4, TU5)로 분할할 수 있다.
도 15를 참조하면, 2Nx2N의 크기를 가지는 정사각형의 코딩 유닛(CU0)을 이진 트리 구조로 분할하고, 상기 분할된 Nx2N의 크기를 가지는 블록을 다시 이진 트리 구조로 분할하여 NxN의 크기를 가지는 정사각형의 블록을 구성한 후, 상기 NxN의 크기를 가지는 블록을 다시 이진 트리 구조로 분할하여 N/2xN의 크기를 가지는 직사각형의 변환 유닛들(TU1, TU2)로 분할할 수 있다.
도 16을 참조하면, 2NxN의 크기를 가지는 직사각형의 코딩 유닛(CU0)을 이진 트리 구조로 분할하고, 상기 분할된 NxN의 크기를 가지는 블록을 다시 쿼드 트리 구조로 분할하여 N/2xN/2의 크기를 가지는 정사각형의 변환 유닛들(TU1, TU2, TU3, TU4)로 분할할 수 있다.
도 11 내지 도 16을 참조하여 설명한 바와 같은 방법에 의해 분할된 블록들(예를 들어, 코딩 유닛(CU), 예측 유닛(PU) 및 변환 유닛(TU))에 대해 도 1 내지 도 8을 참조하여 설명한 바와 같은 방법들이 적용됨으로써, 영상에 대한 부호화 및 복호화가 수행될 수 있다.
이하에서는, 본 발명에 따른 부호화 장치(10)가 블록 분할 구조를 결정하는 방법에 대한 실시예들에 대해 설명한다.
영상 부호화 장치(10)에 구비된 픽쳐 분할부(110)는 미리 설정된 순서에 따라 RDO(Rate distortion Optimization)를 수행하여, 상기한 바와 같이 분할 가능한 코딩 유닛(CU), 예측 유닛(PU) 및 변환 유닛(TU)의 분할 구조를 결정할 수 있다.
예를 들어, 블록 분할 구조를 결정하기 위해, 픽쳐 분할부(110)는 RDO-Q(Rate distortion Optimization- Quantization)를 수행하면서 비트율(bitrate)와 왜곡(distortion) 측면에서 최적의 블록 분할 구조를 결정할 수 있다.
도 17을 참조하면, 코딩 유닛(CU)이 2Nx2N 픽셀 크기의 형태를 가지는 경우, (a)에 도시된 2Nx2N 픽셀 크기, (b)에 도시된 NxN 픽셀 크기, (c)에 도시된 Nx2N 픽셀 크기, (d)에 도시된 2NxN 픽셀 크기의 변환 유닛(PU) 분할 구조 순서로 RDO를 수행하여 변환 유닛(PU)의 최적 분할 구조를 결정할 수 있다.
도 18을 참조하면, 코딩 유닛(CU)이 Nx2N 또는 2NxN 픽셀 크기의 형태를 가지는 경우, (a)에 도시된 Nx2N(또는, 2NxN)의 픽셀 크기, (b)에 도시된 NxN의 픽셀 크기, (c)에 도시된 N/2xN(또는, NxN/2)와 NxN의 픽셀 크기, (d)에 도시된 N/2xN/2, N/2xN 및 NxN의 픽셀 크기, (e)에 도시된 N/2xN의 픽셀 크기의 변환 유닛(PU) 분할 구조 순서로 RDO를 수행하여 변환 유닛(PU)의 최적 분할 구조를 결정할 수 있다.
상기에서는 RDO(Rate distortion Optimization)를 수행하여 블록 분할 구조가 결정되는 것을 예로 들어 본 발명의 블록 분할 방법을 설명하였으나, 픽쳐 분할부(110)는 SAD(Sum of Absolute difference) 또는 MSE(Mean Square Error)를 이용하여 블록 분할 구조를 결정함으로써 복잡도를 감소시키면서도 적절한 효율을 유지할 수 있다.
본 발명의 일실시예에 따르면, 상기한 바와 같이 분할된 코딩 유닛(CU), 예측 유닛(PU) 또는 변환 유닛(TU) 단위로 적응적 루프 필터링(Adaptive Loof Filtering: ALF)의 적용 여부가 결정될 수 있다.
예를 들어, 적응적 루프 필터(ALF)의 적용 여부는 코딩 유닛(CU) 단위로 결정될 수 있으며, 코딩 유닛(CU)에 따라 적용될 루프 필터의 크기 또는 계수는 달라질 수 있다.
이 경우, 코딩 유닛(CU) 별 상기 적응적 루프 필터(ALF)의 적용 여부를 나타내는 정보가 각 슬라이스 헤더에 포함될 수 있다.
색차 신호의 경우, 픽쳐 단위로 적응적 루프 필터(ALF)의 적용 여부를 결정할 수도 있으며, 루프 필터의 형태도 휘도와 달리 직사각형 형태를 가질 수 있다.
또한, 상기 적응적 루프 필터링(ALF)은 슬라이스별로 적용 여부를 결정할 수 있다. 따라서, 현재 슬라이스에 적응적 루프 필터링(ALF)이 적용되는지 여부를 나타내는 정보는 슬라이스 헤더 또는 픽쳐 헤더에 포함될 수 있다.
현재 슬라이스에 적응적 루프 필터링이 적용됨을 나타내면, 슬라이스 헤더 또는 픽쳐 헤더는 추가적으로 적응적 루프 필터링 과정에 사용되는 휘도 성분의 수평 및/또는 수직 방향의 필터 길이를 나타내는 정보를 포함할 수 있다.
슬라이스 헤더 또는 픽쳐 헤더는 필터 세트의 수를 나타내는 정보를 포함할 수 있으며, 필터 세트의 수가 2 이상인 경우 필터 계수들이 예측 방법을 사용하여 부호화 될 수 있다.
따라서, 슬라이스 헤더 또는 픽쳐 헤더는 필터 계수들이 예측 방법으로 부호화 되는지 여부를 나타내는 정보를 포함할 수 있으며, 예측 방법이 사용되는 경우에는 예측된 필터 계수를 포함할 수 있다.
한편, 휘도 뿐만 아니라, 색차 성분들도 적응적으로 필터링 될 수 있으며, 이 경우 색차 성분 각각이 필터링 되는지 여부를 나타내는 정보가 슬라이스 헤더 또는 픽쳐 헤더에 포함될 수 있으며 비트 수를 줄이기 위해 Cr과 Cb에 대한 필터링 여부를 나타내는 정보와 함께 조인트 코딩(즉, 다중화 코딩)될 수 있다.
이 때, 색차 성분들의 경우에는 복잡도 감소를 위해 Cr과 Cb를 모두 필터링하지 않는 경우가 가장 빈번할 가능성이 높으므로, Cr과 Cb를 모두 필터링하지 않는 경우에 가장 작은 인덱스를 할당하여 엔트로피 부호화를 수행할 수 있다.
그리고, Cr 및 Cb를 모두 필터링하는 경우에 가장 큰 인덱스를 할당하여 엔트로피 부호화를 수행할 수 있다.
도 19를 참조하면, (a)에 도시된 바와 같이 최대 256x256 픽셀 크기를 가지는 코딩 트리 유닛(CTU)는 쿼드 트리(quad tree) 구조로 분할되어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 분할될 수 있다.
또한, 상기 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들은 각각 쿼드 트리 구조로 재 분할될 수 있으며, 상기와 같이 쿼드 트리 구조로 분할되는 코딩 유닛(CU)의 깊이(Depth)는 0부터 3 중 어느 하나의 정수 값을 가질 수 있다.
한편, 도 19의 (a)에 도시된 바와 같이 분할된 코드 유닛(CU)들 각각에 대해 적응적 루프 필터링(ALF)의 적용 여부가 결정될 수 있으며, 적응적 루프 필터링(ALF)의 적용 여부를 포함하는 코딩 유닛(CU)의 분할 구조는 (b)에 도시된 바와 같이 표현될 수 있다.
여기서, split_cu_flag는 해당 노드(node)의 분할 여부를 나타내는 것으로, split_cu_flag가 0인 경우 해당 노드의 코딩 유닛(CU)은 더 작은 크기의 블록들로 분할되지 아니하며, split_cu_flag가 1인 경우 해당 노드의 코딩 유닛(CU) 더 작은 크기의 코딩 유닛(CU)들로 분할된다.
또한, ALF_on/off_flag는 해당 노드의 적응적 루프 필터(ALF) 적용 여부를 나타내는 것으로, ALF_on/off_flag가 0인 경우 해당 노드의 코딩 유닛(CU)에 적응적 루프 필터(ALF)가 적용되지 아니하며, ALF_on/off_flag가 1인 경우 해당 노드의 코딩 유닛(CU)에 적응적 루프 필터(ALF)가 적용된다.
도 20을 참조하면, (a)에 도시된 바와 같이 최대 256x256 픽셀 크기를 가지는 코딩 트리 유닛(CTU)은 먼저 쿼드 트리(quad tree) 구조로 나뉘어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 분할될 수 있다.
여기서, 상기 쿼드 트리 구조로 분할된 코딩 유닛들 중 적어도 하나는 이진 트리(bunary tree) 구조로 나뉘어, 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 재 분할될 수 있다.
한편, 상기 쿼드 트리 구조로 분할된 코딩 유닛들 중 적어도 하나는 쿼드 트리 구조로 나뉘어, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 재 분할될 수도 있다.
그리고 상기 이진 트리 구조로 재 분할된 코딩 유닛들 중 적어도 하나는 이진 트리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 분할될 수 있다.
한편, 상기 쿼드 트리 구조로 재 분할된 코딩 유닛들 중 적어도 하나는 쿼드 트리 구조 또는 이진 크리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 코딩 유닛(CU)들로 분할될 수도 있다.
한편, 도 20의 (a)에 도시된 바와 같이 분할된 코드 유닛(CU)들 각각에 대해 적응적 루프 필터링(ALF)의 적용 여부가 결정될 수 있으며, 적응적 루프 필터링(ALF)의 적용 여부를 포함하는 코딩 유닛(CU)의 분할 구조는 (b)에 도시된 바와 같이 표현될 수 있다.
도 20의 (b)에 있어서, 노드들을 연결하는 실선은 상측의 노드가 쿼드 트리 구조로 분할되어 하측의 노드들을 형성하는 것을 의미하며, 노드들을 연결하는 점선은 상측의 노드가 이진 트리 구조로 분할되어 하측의 노드들을 형성하는 것을 의미한다.
한편, 이하에서는 본 발명의 실시 예에 따른 변환 유닛(Transform Unit: TU)에 대한 처리를 설명하도록 한다.
전술한 바와 같이, 코딩 유닛을 이진 트리(binary tree) 구조로 분할함에 있어서, 예측 유닛 뿐만 아니라 변환 유닛 또한 이진 트리(binary tree) 구조로 분할될 수 있다. 다만, 기존의 쿼드 트리 변환에서 이용되는 변환 트리 플래그(transform_tree_flag)만을 포함하는 신택스를 이용하는 경우, 각각의 분할된 TU들에 대해 순차적으로 쿼드 트리를 구성하기 위한 함수들이 호출되므로 비효율적인 문제점이 있다.
이에 따라, 본 발명의 실시 예에 따른 부호화 장치(10)의 변환부(120)는 변환 유닛을 생성하고, 이에 대한 정보를 시그널링함에 있어서, 변환 트리 플래그(transform_tree_flag)뿐만 아니라, 이진 트리(binary tree) 구조의 분할 정보를 추가적으로 이용할 수 있다.
이를 위해, 변환부(120)는 각각은 더이상 분할되지 않는 블록의 크기와 모양을 갖는 4가지 경우의 쿼드 트리 또는 이진 트리 구조의 분할 모드들로 구분할 수 있다. 변환부(120)는 각각의 4가지 경우에 대응되는 처리를 수행하기 위해, 변환 트리 플래그(transform_tree_flag)와 바이너리 분할 변환 플래그(split_binary_transform_flag)를 이용한 분할여부를 결정할 수 있으며, 각각의 4가지 경우까지 분할된 변환 블록들에 대한 최종 변환을 수행할 수 있다.
또한, 복호화 장치(20)에서는 이와 같이 변환된 영상 스트림이 수신되면, 역양자화/역변환부(220)를 통해, 전술한 변환 트리 플래그 및 바이너리 분할 변환 플래그를 식별하고 이에 대응되는 쿼드 트리 또는 이진 트리(binary tree) 구조로의 분할 및 최종 분할된 변환 유닛에 대한 역변환을 처리할 수 있다.
따라서, 본 발명의 실시 예에 따르면, 복호화 장치(20)는 쿼드 트리 분할에 따른 변환 트리 플래그에 기반한 처리 및 바이너리 분할 변환 플래그에 기반한 처리동작을 전체 변환 트리 함수(transform_tree()) 내에 위치시킴으로써, 쿼드 트리와 이진 트리가 복합된 변환 유닛에 대한 복호화를 효율적으로 처리할 수 있다.
이와 같은 복호화 장치(20)의 프로세스는 각각의 분할 된 변환 유닛들에 대해 다시 호출되는 재귀적 구조로 처리될 수 있다. 따라서, 도 30에서는 본 발명의 실시 예가 순차적으로 처리되는 것을 예시하고 있으나, 본 발명의 실시 예에 따른 복호화 장치(20)의 동작은 각각의 변환 유닛들 별로 재귀적으로 수행될 수 있으며, 따라서, 동시 또는 순차적으로 처리되거나 병렬 프로세스에 의해 병행 처리될 수도 있다.
한편, 본 발명의 실시 예에 따르면, 복호화 장치(20)는 별도 시그널링 없이 기존 파싱 된 정보를 이용하여, 선택적 또는 적응적으로 변환 유닛의 분할 여부 및 파티션 방향(수직 또는 수평 등)을 결정하는 것이 더 효율적일 수 있다.
이를 위해, 본 발명의 실시 예에 따른 복호화 장치(20)는 분할 변환 플래그(Split_transform_flag)를 이용하여, 특정 조건에 따른 이진 파티션(binary partition) 또는 쿼드라틱 파티션(quadratic partition)을 결정하고, 이에 따른 역변환을 처리할 수 있다.
이에 따라, 기존의 쿼드 트리 분할만을 적용하는 분할 변환 플래그(split_tranform_flag)의 기능이 확장될 필요성이 있다.
보다 구체적으로, 기존의 변환 트리 신택스 상의 분할 변환 플래그(split_tranform_flag)는 2N x 2N 형태의 쿼드 트리에 대한 분할여부를 시그널링하는데 이용되고 있다.
그러나, 본 발명의 실시 예에 따른 복호화 장치(20)는 분할 변환 플래그(split_tranform_flag)의 기능을 확장시킬 수 있다. 이에 따라, 분할 변환 플래그는 이진 파티션(binary partition) 2개의 블록에 대한 수평 / 수직 크기로의 분할을 나타내거나, 또는 쿼드라틱(Quadratic)한 4개의 블록으로 분할하는 것을 나타낼 수 있도록 확장될 수 있다. (예를 들어, split_transform_flag[ x0 ][ y0 ][ trafoDepth ] specifies whether a block is split into four blocks(quadratic) or two blocks(binary) with half horizontal and half vertical size for the purpose of transform coding. 과 같이 추가적인 기능이 정의될 수 있다)
이에 따라, 복호화 장치(20)는 본 발명의 실시 예에 따라 확장된 분할 변환 플래그를 파싱하고, CU의 블록 크기, CU 분할 Depth, CU 분할 패턴, PU의 예측 모드, TU의 크기, TU Depth(상위 TU 블록에서의 재귀 호출 여부) 중 적어도 하나를 조건 정보로 이용함으로써, 변환 블록의 바이너리 파티션(binary partition) 구조를 별도 시그널링 없이도 판단할 수 있게 된다.
한편, 도 21은 본 발명의 실시 예에 따른 블록 분할의 예측 모드를 도시한 것이며, 도 22는 본 발명의 일 실시 예에 따른 블록 기반 적응적 역변환을 수행하는 복호화 장치의 동작을 설명하기 위한 흐름도이다.
본 발명의 일 실시 예에 따르면, 영상 부호화 장치(10)는 각각의 분할된 코딩 유닛에 대응하여, 예측 모드를 결정할 수 있으며, 예측 모드는 화면 간 예측에 대응하는 인터 예측과, 화면 내 예측에 대응하는 인트라 예측으로 구분될 수 있다.
특히, 본 발명의 실시 예에 따라 영상 부호화 장치(10)는 상기 쿼드 트리 구조로 분할된 코딩 유닛들 중 적어도 하나가 이진 트리(binary tree) 구조로 나뉘어, 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 재 분할되거나, 정사각형의 형태를 가지는 4개의 코딩 유닛(CU)들로 재 분할되거나, 상기 이진 트리 구조로 재 분할된 코딩 유닛들 중 적어도 하나가 이진 트리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 2개의 코딩 유닛(CU)들로 분할될 수 있는 다양한 분할 구조를 고려하여, 부호화/복호화 방식에 따라 각 코딩 유닛의 인터/인트라 예측방법 또는 예측 모드를 효율적으로 결정할 수 있다.
또한, 영상 부호화 장치(10)는 상기 쿼드 트리 구조로 분할된 변환 유닛도 마찬가지 방식으로 분할 할 수 있다. 이에 따라, 영상 부호화 장치(10)는 쿼드 트리 구조로 변환된 변환 유닛들 중 적어도 하나가 이진 트리(binary tree) 구조로 나뉘어, 직사각형의 형태를 가지는 2개의 변환 유닛(TU)들로 재 분할되거나, 정사각형의 형태를 가지는 4개의 변환 유닛(TU)들로 재 분할되거나, 상기 이진 트리 구조로 재 분할된 변환 유닛들 중 적어도 하나가 이진 트리 구조로 다시 나뉘어, 정사각형 또는 직사각형의 형태를 가지는 2개의 변환 유닛(TU)들로 분할될 수 있는 다양한 분할 구조를 고려하여, 부호화/복호화 방식에 따라 각 변환 유닛의 변환 타입이 효율적으로 결정될 수 있다.
이와 같이, 각 인터/인트라 예측에 있어서 코딩 유닛의 쿼드트리 이하의 바이너리 분할 구조도 함께 고려됨에 따라, 기존의 변환 유닛의 경우에도 코딩 유닛에 의해 미리 정해진 타입의 DCT 변환이 수행되는 등의 변환 처리 방식으로는 그 변환 효율이 떨어질 수 있다. 이를 해결하기 위해, 복수 타입의 변환을 수행해볼 수는 있으나, 이에 대한 연산량의 증가와 복잡성 증가로 인해 실용성이 낮아지는 문제점이 있다.
이에 따라, 본 발명의 실시 예에 따른 영상 부호화 장치(10)는 변환부(120) 및 양자화부(130)의 변환 방식을 결정함에 있어서도 전송되는 비트량을 감소시키고 부호화 효율을 높이기 위해, 복호화 대상 블록의 코딩 유닛 및 변환 유닛의 분할 구조 및 예측 모드를 고려하여, 효율적인 변환/역변환 타입을 결정하는 방법을 제공할 수 있다.
이를 위해, 영상 부호화 장치(10)는 각 블록 별 변환 타입 결정에 있어서, 대상 블록에 대응되는 코딩 유닛 및 변환 유닛의 분할 구조 및 예측 모드를 이용한 변환 타입 결정 처리를 수행할 수 있으며, 이와 같은 처리에 따라 복호화 장치(20)에서는 역양자화/역변환부(220)를 통해 각 역변환 블록에 대응하는 정보(예를 들어, 변환 유닛의 분할 구조, 변환 유닛 또는 코딩 유닛의 블록 크기 또는 코딩 유닛의 예측 모드 등)에 기초하여 상기 변환 타입을 결정하고, 결정된 변환 타입에 따른 역변환을 순차적으로 수행할 수 있다.
이와 같은 본 발명의 실시 예에서, 상기 결정된 변환 타입은 미리 설정된 2 이상의 변환 함수 집합에 대응될 수 있으며, 각 변환 함수 집합에서 현재 블록에 대해 최적의 변환 효율을 갖는 변환 함수가 선택될 수 있다. 이하에서는 이에 대하여 보다 구체적으로 설명하도록 한다.
보다 구체적으로, 복호화 장치(20)는 수신된 입력 신호로부터 엔트로피 복호화가 처리되면, 본 발명의 실시 예에 따른 블록 별 적응적 역변환을 처리하고, 이후 역변환된 잔차 신호를 이용한 예측 모드 복호화 및 필터링에 따라 복호화를 처리할 수 있다.
특히, 본 발명의 실시 예에 따른 복호화 장치(20)는 현재 복호화할 블록에 대응하여, 미리 복호화된 블록 정보를 식별할 수 있다. 블록 정보는 예를 들어, 대상 블록에 대응하는 변환 유닛 또는 코딩 유닛의 블록 분할 정보, 블록 크기 정보 및 예측 모드 정보 중 적어도 하나를 포함할 수 있다. 이 경우, 복호화 장치(20)는 상기 블록 분할 정보, 블록 크기 정보 및 예측 모드 정보 중 적어도 하나에 기초하여 역변환할 블록에 대응하는 역변환을 수행하기 위한 변환 집합을 결정할 수 있다. 변환 집합은 변환 타입에 대응하는 하나 이상의 변환 함수와 연관될 수 있으며, 각 변환 함수에 대응되는 처리 프로세스 정보가 복호화 장치(20)에 미리 저장될 수 있다.
이는 본 발명의 실시 예에 따른 역양자화/역변환부(220)에서 처리될 수 있다. 특히, 본 발명의 실시 예에 따른 역양자화/역변환부(220)는 전술한 변환 집합 결정 및 변환 타입 결정 프로세스를 수행할 수 있으며, 이에 따라 역양자화/역변환부(220)는 미리 복호화된 신택스 정보 등을 이용하여 전술한 프로세스를 수행할 수 있다.
설명의 편의를 위해, 본 발명의 실시 예에서 상기 프로세스를 수행하는 역양자화/역변환부(220)가 예시되고 있으며, 역양자화와 역변환을 모두 처리하는 것으로 예시되고 있으나, 역양자화/역변환부(220)의 기능은 그 명칭에 제한되는 것은 아니며, 각각의 기능에 따라 역양자화부 및 적응적 변환 집합을 결정하여 처리하는 역변환부로 모듈화되어 별도 분리되어 동작할 수 있다. 이에 따라, 역양자화/역변환부(220)는 그 기능에 따라 역양자화부(220) 또는 역변환부(220)로 표현될 수 있다.
먼저, 본 발명의 실시 예에 따른 복호화 장치(20)는 영상 스트림으로부터 현재 복호화할 대상 블록에 대한 블록 분할 정보를 획득하고(S1001), 상기 블록 분할 정보에 따른 블록 크기 정보를 획득하며(S1003), 상기 블록에 대응되는 예측 모드를 획득한다(S1005).
여기서, 상기 블록 분할 정보, 블록 크기 정보 또는 예측 모드 정보는 블록 정보에 포함될 수 있으며, 변환 유닛 또는 코딩 유닛에 대응될 수 있고, 다양한 방식으로 획득될 수 있다. 예를 들어, 복호화 장치(20)는 미리 처리된 픽쳐 헤더 또는 슬라이스 헤더의 신택스 정보로부터 블록 정보를 획득할 수 있다. 또한, 역양자화/역변환부(220)에서 역변환을 위한 변환 타입 결정을 위해, 상기 블록 분할 정보, 블록 크기 정보 또는 예측 모드 정보 중 적어도 하나를 서로 다른 모듈로부터 미리 수집할 수도 있다.
그리고, 상기 블록 정보에 있어서, 블록 분할 정보는 정방향 분할(Square) 또는 비-정방향 분할(Non-Square) 중 어느 하나로 예시될 수 있으며, 블록 크기 정보는 가로 크기(W) 또는 세로 크기(H) 등으로 예시될 수 있고, 예측 모드 정보는 화면 간 예측(Inter) 또는 화면 내 예측(Intra) 등으로 예시될 수 있다. 또한, 화면 내 예측 정보는 예측 방향 정보를 더 포함할 수 있다.
그리고, 복호화 장치(20)는 수집된 블록 정보에 기초하여, 블록별 변환 집합을 결정한다(S1007).
여기서, 블록별 변환 함수는 표 1에 도시된 바와 같이, 미리 설정된 변환 집합 인덱스(0, 1, 2, 3, ... N-1)에 대응하여 하나 이상 대응되는 DCT 변환 함수 정보를 포함할 수 있으며, DCT 변환 함수는 각 변환 함수 인덱스(I, II, III, ...)에 대응할 수 있고, 표 2에 도시된 바와 같은 알려진 함수들의 적용을 나타낼 수 있다.
Figure PCTKR2018000867-appb-T000001
Figure PCTKR2018000867-appb-T000002
이에 따라, 본 발명의 실시 예에 따른 복호화 장치(20)는 역양자화/역변환부(220)를 통해 상기 함수 중 하나 이상의 변환 함수 인덱스를 포함하는 변환 집합을 결정할 수 있다. 이를 위해, 블록 정보가 이용될 수 있으며, 블록 정보는 전술한 블록 분할 정보, 블록 크기 정보 및 예측 모드 중 적어도 하나를 포함할 수 있다. 또한, 전술한 블록 분할 정보, 블록 크기 정보는 블록 구조 정보라고 할 수도 있다.
그리고, 복호화 장치(20)는 역양자화/역변환부(220)를 통해 선택된 블록 변환 집합에 포함된 하나 이상의 변환 함수 중 어느 하나를 이용하여 현재 블록의 적응적 역변환 및 역양자화를 수행할 수 있으며, 이후 단계의 영상 복호화 처리를 순차적으로 수행하여 효율적인 복호화를 수행할 수 있다.
이에 따라, 본 발명의 실시 예에 따른 부호화 장치(10)와 복호화 장치(20)는 변환 효율을 증가시키면서도 처리할 연산량은 감소시킬 수 있는 적응적 변환 및 역변환을 제공할 수 있다.
도 23은 본 발명의 실시 예에 따른 변환 집합 결정부를 개념적으로 도시한 도면이다.
특히, 변환 효율을 위해 변환 집합 선택을 위한 블록 정보는 블록 크기 정보, 분할 형태(또는 분할 구조) 정보, 단말 노드 여부 정보 등 여러가지가 예시될 수 있으며, 각각에 대한 효율 및 연산량이 상이할 수 있다. 이에 따라, 본 발명의 실시 예에 따르면, 변환 집합 결정부(221)가 별도 모듈로 구비될 수 있다.
도 23에 도시된 바와 같이, 변환 집합 결정부(221)는, 복호화 블록의 예측 정보, 복호화 블록 크기 정보 및 블록 분할 정보와 같은 블록 정보를 이용하여, 미리 설정된 변환 집합들(1, 2, 3, ... N) 중에서 어느 하나의 변환 집합을 결정할 수 있다.
변환 집합 결정부(221)는 예를 들어, 하기와 같은 변환 집합을 인덱스로 설정하고, 변환 집합의 결정에 이용되는 변수로서, 현재 블록 사이즈, 분할 정보 및 인트라 예측 여부 모드 정보를 이용할 수 있다.
TR_Sub_set = Decision_TR_Sub_Set (Current_block_size, Partition_Info, Intra_Pred_Mode);
TR_Sub_set {0, 1, 2, …, N};
또한, 상기 변수 및 Decision_TR_Sub_Set 함수는 다양한 조건 및 변수에 따른 변환 집합 결정부(221)의 동작이 정의될 수 있다. 그리고, 상기 변수 또한 변경될 수 있으며, 추가적으로 블록의 크기 정보, 블록의 분할 정보 및 복호화 블록의 단말 노드 여부 정보에 따라 복수개의 변환 집합들 중 하나를 선택할 수도 있다. 이에 대한 실시 예에 대하여는 후술하도록 한다.
변환 집합 결정부(221)는 하기와 같은 다양한 실시 예에 따라, 하나의 복호화 블록에 대응하여, 임의의 변환 집합을 선택할 수 있다.
1) 역변환 대상 블록에 대응하는 코딩 유닛이 화면 내 예측을 통한 부호화 된 블록일 경우, 블록 크기가 8xH, Wx8 이내의 크기를 갖는 블록들에 대하여, 정방향 분할(W, H == 8) 된 블록일 경우, 변환 집합 결정부(221)는 변환 집합 1을 결정할 수 있으며, 역양자화/역변환부(220)는 변환 함수 A 또는 B를 이용한 역 변환을 수행할 수 있다.
2) 역변환 대상 블록에 대응하는 코딩 유닛이 화면 간 예측 블록으로 부호화 되었고, 1)과 동일한 조건의 블록 크기 및 분할 조건을 가질 경우, 변환 집합 결정부(221)는 변환 집합 2를 결정할 수 있으며, 역양자화/역변환부(220)는 변환 함수 C 또는 D를 이용한 역 변환을 수행할 수 있다.
3) 역변환 대상 블록에 대응하는 코딩 유닛이 화면 내 예측 블록으로 부호화 되었고, 블록 크기가 4xH, Wx4인 블록들이며, 정방향 분할(W, H == 4)된 블록일 경우, 변환 집합 결정부(221)는 변환 집합 3을 결정할 수 있으며, 역양자화/역변환부(220)는 변환 함수 E 또는 F를 이용한 역 변환을 수행할 수 있다.
4) 역변환 대상 블록에 대응하는 코딩 유닛이 해당 블록이 화면 내 예측 블록으로 부호화 되었고, 블록 크기가 4xH, Wx4인 블록들에 대하여, 정방향 분할(W =/ H)되지 않은 경우, 변환 집합 결정부(221)는 변환 집합 4를 결정할 수 있으며, 역양자화/역변환부(220)는 변환 함수 G 또는 H를 이용한 역 변환을 수행할 수 있다.
변환 집합 결정부(221)는 이 외에도 다양한 예측 모드, 블록의 크기 조건, 블록의 분할 형태 및 단말 노드 여부 등의 조합에 따라 기 정의된 복수 개의 기 정의된 변환 집합들 중 하나를 선택할 수 있으며, 변환 집합에 의해 미리 정의된 하나 이상의 변환 함수를 통한 역 변환을 수행할 수 있다.
본 발명의 다른 일 실시 예에 따른 복호화 장치(20)의 동작이 도 24에 개시되어 있다.
한편, 부호화 장치(10)는 전술한 적응적 변환 집합 선택여부를 별도 시그널링 할 수 있다. 예를 들어, 부호화 장치(10)는 적응적 변환 집합 플래그(AMT flag, Adaptive multi transform)의 전송하여, 복호화 장치(20)로 적응적 변환 집합 선택에 따른 역변환 수행을 시그널링 할 수 있다.
예를 들어, 복호화 장치(20)는 적응적 변환 집합 선택에 기반한 수행여부를 결정함에 있어서, 픽쳐 또는 슬라이스 헤더 정보로부터 적응적 변환 집합 플래그(AMT flag)를 식별할 수 있으며, 플래그에 따른 적응적 역변환을 수행할 수 있다.
그리고, 적응적 역변환이 수행되는 경우, 복호화 장치(20)는 변환 집합을 선택함에 있어서, 역변환 대상 블록에 대응되는 하나 이상의 블록 정보에 기초하여 적절한 변환 집합을 선택하고, 변환 집합에 포함되는 하나 이상의 변환 함수들 중 어느 하나를 선택하여 역변환을 처리할 수 있다. 변환 함수의 선택은 변환 효율에 따라서 선택되거나, 별도 정보로 시그널링 될 수도 있다.
이에 따라, 도 24를 참조하면, 먼저 복호화 장치(20)는 헤더 정보 등으로부터 적응적 변환 집합 플래그(AMT Flag)를 파싱하여 참인지 여부를 판단한다(S1101).
적응적 변환 집합 플래그(AMT Flag)는 복호화 블록의 크기, 분할된 형태 (Square / Non-Square), 단말 노드 여부 등에 따라 별도로 정의된 복수개의 변환 집합 중 선택된 변환 집합을 이용하여 역변환을 수행할지 여부를 나타낼 수 있다.
만약, 복호화 장치(20)는 참이 아닌 경우, 역양자화/역변환부(220)를 통해, 기 정의된 조건에 따라 미리 설정된 특정 변환 함수를 선택하고, 이에 기초한 역변환을 수행한다(S1103).
예를 들어, 복호화 장치(20)는 AMT Flag가 거짓일 경우, 역양자화/역변환부(220)를 통해 DCTII의 2차원 역 변환을 수행할 수 있으며, 만약, 4X4 Intra block 블록일 경우, DST-VII 2차원 역 변환을 수행할 수 있다.
그리고, 복호화 장치(20)는 적응적 변환 집합 플래그(AMT Flag)가 참인 경우, 복호화 대상 블록이 화면 내 예측 모드로 부호화 되었는지 여부를 판단한다(S1105).
예를 들어, 복호화 장치(20)는 역변환 대상 블록에 대응되는 코딩 유닛의 예측 모드 정보를 획득하고, 예측 모드 정보를 이용하여 화면 내(인트라) 예측 모드인지 또는 화면 간(인터) 예측 모드인지를 식별할 수 있다.
그리고, 복호화 장치(20)는 복호화 블록이 화면 내 예측 모드로 부호화된 것으로 판단된 경우, 복호화 블록에 대응되는 크기 정보, 분할 형태 정보, 단말 노드 여부 정보 중 적어도 하나를 이용하여, 화면 내 예측 모드에 대응되는 복수개의 변환 집합들 중 어느 하나를 선택할 수 있다(S1107).
이 때, 상기 변환 집합들은 별도의 시그널링을 통해 부호화 장치(10)로부터 전송 받거나, 복호화 장치(20)와 연동된 다른 단말로부터 수신 할 수 있다.
또한, 복호화 장치(20)는 복호화 블록이 화면 간 예측 모드로 부호화된 것으로 판단된 경우, 복호화 블록에 대응되는 크기 정보, 분할 형태 정보, 단말 노드 여부 정보 중 적어도 하나를 이용하여, 화면 간 예측 모드에 대응되는 복수개의 변환 집합들 중 어느 하나를 선택할 수 있다(S1109).
그리고, 복호화 장치(20)는 역양자화/역변환부(220)를 통해 상기 선택된 변환 집합에 의해 지정된 변환 함수를 이용하여 상기 복호화 블록에 대한 역변환을 수행한다(S1111).
이에 따라, 예를 들어 변환 집합을 복호화 블록의 화면 내 예측 모드와 화면 간 예측 모드 여부에 따라 복수개의 변환 집합들을 제1 그룹 및 제2 그룹으로 분류할 수 있으며, 본 발명의 실시 예에 따른 복호화 장치(20)는 화면 내 예측 모드인지 여부에 따라 제1 그룹의 변환 집합들 또는 제2 그룹의 변환 집합들을 우선 식별할 수 있다.
그리고, 복호화 장치(20)는 제1 그룹의 변환 집합 또는 제2 그룹의 변환 집합 중 결정된 그룹의 복수의 변환 집합들로부터, 복호화 블록의 크기 정보, 분할 형태 정보, 단말 노드 여부 정보 중 적어도 하나를 이용하여 결정되는 특정 변환 집합을 선택할 수 있다.
여기서, 상기 제1 그룹 및 제2 그룹의 변환 집합들을 결정하기 위한 구분 정보와, 상기 변환 집합들에 대응하여 미리 정의되는 함수 프로세싱 정보 등은 별도의 시그널링을 통해 부호화 장치(10)로부터 복호화 장치(20)로 전달되거나, 복호화 장치(20)에 미리 저장될 수 있고, 별도 장치에 의해 업데이트 될 수도 있다.
도 25는 본 발명의 실시 예에 따른 역변환부를 보다 구체적으로 도시한 도면이다. 그리고, 도 26 및 도 27은 본 발명의 실시 예에 따른 역변환부의 동작을 설명하기 위한 흐름도이다.
도 25를 참조하면, 본 발명의 실시 예에 따른 역양자화/역변환부(220)는 역양자화된 잔차 신호에 대한 제1 역변환 및 제2 역변환을 처리할 수 있으며, 각 역변환에 대응하는 변환 집합이 결정되면, 결정된 변환 집합으로부터 변환 함수를 선택하여 역변환을 수행할 수 있다. 이를 위해, 역양자화/역변환부(220)는 제1 역변환 결정부(222), 제1 역변환 수행부(223), 제2 역변환 결정부(224) 및 제2 역변환 수행부(225)를 포함할 수 있다.
여기서, 제1 역변환, 제2 역변환은 제1 방향으로의 역변환 및 제2 방향으로의 역변환에 대응될 수 있으며, 제1 방향은 수직 방향(Vertical), 제2 방향을 수평 방향(Horizontal)에 대응될 수 있다.
이에 따라, 제1 역변환 결정부(222)는 미리 설정된 조건에 따라 수직 방향에 대응되는 제1 변환 집합을 결정할 수 있으며, 제1 역변환 수행부(223)는 결정된 변환 집합에 대응하여, 대상 블록에 대한 제1 방향으로의 역변환을 처리할 수 있다.
또한, 제2 역변환 결정부(224)는 미리 설정된 조건에 따라 수평 방향에 대응되는 제2 변환 집합을 결정할 수 있으며, 제2 역변환 수행부(225)는 결정된 변환 집합에 대응하여, 대상 블록에 대한 제2 방향으로의 역변환을 처리할 수 있다.
이와 같은 역양자화/역변환부(220)의 제1 역변환 및 제2 역변환 처리는 특히, 화면 내 예측 모드인 경우 그 예측 모드의 방향성을 나타내는 2 내지 67 방향(Angular) 모드에 대응하여 효과적으로 이용될 수 있다.
표 3은 본 발명의 실시 예에 따라, 화면 내 예측의 방향 모드에 대응하여, 잔차 신호가 분포할 확률적 특성을 고려한 N개의 변환 함수 집합 분류를 선택하기 위한 인트라 모드 변환 집합 참조 테이블을 도시한 것이다.
Figure PCTKR2018000867-appb-T000003
표 3에서, V는 제1 역변환(Vertical) 인덱스, H는 제2 역변환(Horizontal) 인덱스를 나타낼 수 있으며, 각 인덱스는 표 1에 도시된 변환 집합에 대응될 수 있다. 그리고, 각 변환 집합은 표 2에 도시된 변환 함수 중 2 이상의 변환 함수를 포함할 수 있다.
이와 같이, 화면 내 예측 부호화가 수행 된 경우, 복호화 장치(20)는 인트라 모드 변환 집합 참조 테이블을 이용하여, 제1 역변환을 위한 제1 변환 집합과 제2 역변환을 위한 제2 변환 집합을 결정할 수 있으며, 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 통해 방향별 역변환을 처리할 수 있다.
도 26은 도 25의 역양자화/역변환부(220)를 포함하는 본 발명의 일 실시 예에 따른 복호화 장치(20)의 동작을 도시한 것으로, 먼저 복호화 장치(20)는 역양자화된 복호화 대상 블록의 분할 정보를 식별하고(S1201), 상기 복호화 대상 블록의 크기를 판단한다(S1203).
그리고, 복호화 장치(20)는 본 발명의 실시 예에 따른 적응적 변환 집합을 사용한 역변환 수행여부를 결정한다(S1205).
수행여부 결정을 위해, 복호화 장치(20)는 미리 판단된 상기 조건을 이용할 수 있다. 예를 들어, 복호화 장치(20)는 분할 정보가 정방향인지 여부(Square, Non-square), 블록 크기가 특정 N x N (4x4, or 8x8) 사이즈 이내인지 여부 또는 적응적 변환 집합 사용 여부 플래그 중 적어도 하나를 이용하여, 변환 집합 사용 여부를 결정할 수 있다.
이에 따라, 변환 집합에 기초한 적응적 역변환 수행이 결정되면, 복호화 장치(20)는 화면 내 예측 방향 모드를 결정한다. 화면 내 예측 방향 모드 정보는 복호화 처리 과정에서 도출될 수 있으며, 이를 위해, 역양자화/역변환부(220)는 헤더 정보로부터 인트라 예측 방향 모드 정보를 파싱하거나, 인트라 예측부(230)로부터 화면 내 예측 방향 모드 정보를 획득할 수 있다.
그리고, 복호화 장치(20)는 1차 및 2차 변환 집합을 결정한다(S1211).
변환 집합 결정부(221)는 표 3의 참조 테이블을 이용하여, 각 방향별 변환 집합을 각각 결정할 수 있다.
그리고, 방향별 변환 집합이 결정되면, 복호화 장치(20)는 제1 역변환 수행부(223)를 통해 1차 변환 집합에 기초한 1차 역변환을 수행하고(S1213), 제2 역변환 수행부를 통해 2차 변환 집합에 기초한 2차 역변환을 수행한다(S1215).
그리고, 복호화 장치(20)는 역변환이 완료되면, 이후 필요한 영상 처리를 통해 영상 신호의 복원을 수행한다.
이와 같이, 복호화 장치(20)는 화면 내 예측인 경우, 예측 방향 모드(Angular mode)에 따라 현재 복호화 블록에 적용할 변환 집합을 선택하여 역 변환을 수행할 수 있다. 특히, 변환 집합은 사전에 정의된 임의의 복수개의 변환 함수에 대응되는 집합으로 구성될 수 있어 변환 효율을 향상시킬 수 있다.
또한, 이와 같은 변환 집합을 구성하기 위해, 복호화 장치(20)는 하이 레벨 신택스(High Level Syntax) 단위, 예를 들어 부호화 장치(10)로부터 수신되는 슬라이스 레벨의 SPS 또는 픽쳐 레벨의 PPS 로부터 변환 집합의 구성 정보를 획득할 수 있다.
또한, 변환 집합 구성에 있어, 복호화 장치(20)는 GOP 단위로 해당 변환 집합의 구성을 부호화 장치(10)로부터 수신하여 갱신할 수 있다.
또한, 복호화 장치(20)는 변환 집합을 업데이트함에 있어서, 임의의 DCT/DST 함수가 특정 인덱스로 정의되면, 현재 인덱스에 대응되는 차분 신호를 부호화 장치(10)로부터 수신하여 변환 집합의 구성 및 변환 함수 업데이트를 수행할 수 있다.
도 27은 본 발명의 또 다른 실시 예에 따른 역변환부의 동작을 설명하기 위한 흐름도이다.
도 27을 참조하면, 먼저 복호화 장치(20)는 역변환 대상 블록을 화면 내 예측 블록으로 판단한다(S1301).
그리고, 복호화 장치(20)는 역변환 대상 블록이 정방향으로 분할된 블록인지 여부를 판단한다(S1303).
여기서, 상기 정방향은 대상 블록이 정사각형(Square)으로 구성되는 쿼드 트리 방식으로 분할된 상태를 의미할 수 있다. 이에 따라 정방향이 아닌 경우(Non-Square)에는, 대상 블록이 가로 또는 세로형태의 직사각형이 포함된 이진 트리 방식으로 분할된 상태를 의미할 수 있다.
이후, 정방향으로 분할된 블록인 경우, 복호화 장치(20)는 블록 크기 정보를 판단하고(S1305), 판단된 블록 크기 정보에 대응되는 정방향 블록에 대한 제1 역변환 집합을 선택한다(S1307).
여기서, 상기 제1 역변환 집합에는 각 정방향으로 분할된 블록에 대하여 변환 효율이 높은 변환 함수들이 포함될 수 있다. 또한, 제1 역변환 집합은 각 블록의 크기(예를 들어, 4X4, 8X8 등)에 대응하여 결정될 수 있다.
그리고, 정방향 분할이 아닌 경우, 복호화 장치(20)는 블록 크기 정보를 판단하고(S1309), 판단된 블록 크기 정보에 대응되는 비-정방향 블록에 대한 제2 역변환 함수를 선택한다(S1311).
마찬가지로, 상기 제2 역변환 집합에는 각 비-정방향으로 분할된 블록에 대하여 변환 효율이 높은 변환 함수들이 포함될 집합일 수 있다. 또한, 제1 역변환 집합은 각 블록의 크기(예를 들어, 4XH 또는 WX4, 8XH 또는 WX8 등)에 대응하여 결정될 수 있다.
이에 따라, 복호화 장치(20)는 제1 역변환 수행부(223)를 통해, 상기 결정된 제1 역변환 집합으로부터 선택된 제1 역변환 함수를 이용한 제1 역변환을 수행하거나, 제2 역변환 수행부(223)를 통해, 상기 결정된 제2 역변환 집합으로부터 선택된 제2 역변환 함수를 이용한 제2 역변환을 수행할 수 있다(S1313).
그리고, 역양자화/역변환부(220)는 이후 영상 복호화에 필요한 나머지 처리를 수행할 수 있다.
도 28은 본 발명의 다른 일 실시 예에 따른 역변환부를 도시한 도면이며, 도 29는 본 발명의 다른 일 실시 예에 따른 역변환부의 동작을 설명하기 위한 흐름도이다.
도 28을 참조하면, 본 발명의 실시 예에 따른 복호화 장치(20)의 역양자화/역변환부(220)는 예측 모드 정보 복호화부(226)와, 이와 연결되는 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 포함하여 구성될 수 있다.
본 발명의 실시 예에 따르면, 부호화 장치(10)는 화면 간 예측 모드의 경우에 있어서도, 화면 간 예측 모드 기반의 최적의 변환 집합(Transform set)을 연산 효율(예를 들어 RDO 연산)에 따라 결정할 수 있으며, 변환 집합이 결정되면 복호화 장치(20)로 상기 변환 집합에 대한 정보를 시그널링 할 수 있다.
시그널링을 위해, 부호화 장치(10)는 하이 레벨 신택스를 이용할 수 있으며, 예를 들어 Inter_transform_set_ID 와 같은 변환 집합 식별 정보가 복호화 장치(20)로 전달 될 수 있다. 이에 따라, 복호화 장치(20)는 예측 모드 정보 복호화부(226)를 통해 상기 변환 집합 식별 정보를 복호화할 수 있으며, 상기 복호화된 변환 집합 식별 정보를 이용하여, 변환 집합을 선택할 수 있다.
그리고, 복호화 장치(20)는 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)는 상기 선택된 변환 집합 기초한 화면 간 예측 모드에 의존되는 각 방향별 역변환을 수행할 수 있게 된다.
도 29는 상기와 같이 시그널링되는 화면 간 예측 모드 정보에 기반한 적응적 역변환 복호화를 처리하기 위한 복호화 장치(20)의 동작을 흐름도로 도시한 것으로, 먼저 복호화 장치(20)는 예측 모드 정보 복호화부(226)를 통해, 대상 블록의 화면 간 예측 모드 정보를 복호화한다(S1401).
그리고, 복호화 장치(20)는 화면 간 예측 모드 정보로부터, 화면 간 예측에 따른 변환 집합 플래그가 존재하는지 판단한다(S1403).
만약 존재하지 않는 경우, 복호화 장치(20)는 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 이용하여, 디폴트 변환으로 지정된 DCT 2 X DCT 2 변환 함수들에 기초한 제1 방향 및 제2 방향 역변환을 2차원적으로 처리할 수 있다(S1405).
그리고, 복호화 장치(20)는 변환 집합 플래그가 존재하는 경우, 화면 간 예측 모드 정보에 함께 시그널링된 변환 집합 인덱스가 1인지 판단한다(S1407).
그리고, 인덱스가 1인 경우, 복호화 장치(20)는 제1 블록 크기 및 분할 여부 조건에 대응되는지 판단하며(S1409), 대응되는 경우 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 이용하여, 상기 조건에 최적화된 DCT 7 X DCT 7 변환 함수들에 기초한 기초한 제1 방향 및 제2 방향 역변환을 2차원적으로 처리할 수 있다(S1413).
또한 조건에 대응되지 않는 경우 복호화 장치(20)는 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 이용하여, 이 경우에 최적화된 DCT 8 X DCT 8 변환 함수들에 기초한 기초한 제1 방향 및 제2 방향 역변환을 2차원적으로 처리할 수 있다(S1411).
한편, 인덱스가 1이 아닌 경우, 복호화 장치(20)는 변환 집합 플래그가 존재하는 경우, 화면 간 예측 모드 정보에 함께 시그널링된 변환 집합 인덱스가 2인지 판단한다(S1415).
그리고, 변환 집합 인덱스가 최대치인 예시로서 2인 경우(S1415), 복호화 장치(20)는 제2 블록 크기 및 분할 여부 조건에 대응되는지 판단하며(S1417), 대응되는 경우 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 이용하여, 상기 조건에 최적화된 DCT 2 X DCT 7 변환 함수들에 기초한 기초한 제1 방향 및 제2 방향 역변환을 2차원적으로 처리할 수 있다
또한 조건에 대응되지 않는 경우 복호화 장치(20)는 제1 역변환 수행부(223) 및 제2 역변환 수행부(225)를 이용하여, 이 경우에 최적화된 DCT 7 X DCT 8 변환 함수들에 기초한 기초한 제1 방향 및 제2 방향 역변환을 2차원적으로 처리할 수 있다
도 30 내지 도 32는 본 발명의 실시 예에 따른 단말 노드 여부에 따른 블록 적응적 변환 및 역변환을 설명하기 위한 개념도이다.
전술한 바와 같이, 복호화 장치(20)는 역변환 대상 블록이 단말 노드인지 여부에 따라서, 역변환을 위한 변환 집합을 결정할 수 있다. 이를 위해, 변환 집합 결정부(221)는 변환 집합 결정을 위한 변수로서 단말 노드인지 여부 정보를 더 포함시킬 수 있다.
도 30을 참조하면, 비 단말 노드는 예측 또는 변환 등을 더 작은 크기에서 수행하는 코딩 블록 형태일 수 있으며, 도 30의 Depth 3~4 에 위치한 좌측 표시 영역의 노드 위치로 예시될 수 있다. 이 때, 예측 또는 변환 유닛의 효율에 따라 비 단말 노드인 대상 블록에 대해 이진(Binary) 분할 또는 쿼드 트리(Quadratic) 분할 등이 더 수행될 수 있다. 따라서, 비 단말 노드인지 여부는 대상 블록이 (CU != PU, PU != TU, CU != TU)에 해당하는지 여부로 결정될 수 있다. 이에 따라, 대상 블록에 비 단말 노드에 대응하는 경우에 대응하는 적절한 변환 집합이 구성될 수 있다.
그리고, 단말 노드는 예측 또는 변환 등을 수행하기 위해 더 작은 크기로 분할 되지 않는 최 하단 노드를 의미할 수 있으며, 도 30의 우측 표시 영역의 Depth 3에 위치한 2개의 노드와 같은 형태로 분할된 노드로 예시될 수 있다. 이 때, 부호화 효율에 따라 대상 블록은 2개 또는 4개의 단말 노드로 분할되어 예측 또는 변환이 수행될 수 있다. 따라서, 단말 노드인지 여부는 대상 블록이 (CU = PU = TU)에 해당하는지 여부로 결정될 수 있다. 이에 따라, 대상 블록에 단말 노드에 대응하는 경우에 대응하는 적절한 변환 집합이 구성될 수 있다.
한편, 도 31은 비 단말 노드인 경우의 단계적 분할 형태를 예시하고 있으며, 이에 따라 각 분할 단계에 대응되는 변환 집합이 서로 다르거나 동일하게 결정될 수 있음을 나타내고 있다.
예를 들어, 도 31을 참조하면, TU 2단 분할의 경우, CU로부터 예측 또는 분할을 수행하는 블록 단위로서 하나의 코딩 유닛 CU 에 대해, TU0, TU1이 각각 분할된 블록 단위로 구성될 수 있다. 이때, TU는 예측을 수행하는 단위인 PU와 동일한 크기를 가질 수 있으며, PU는 서로 다른 예측 모드를 통해 부/복호화 될 수 있다.
그리고, TU0과 TU1은 코딩 효율에 따라 수직 방향 또는 수평 방향으로 분할될 수 있으며, PU의 예측 모드와 CU, TU의 크기에 따라, 변환 효율이 상이할 수 있으므로, 부호화 장치(10) 및 복호화 장치(20)는 이에 따라 서로 동일한 역 변환 집합 또는 서로 다른 역 변환 집합을 선택적으로 결정할 수 있다.
또한, TU 3단 분할의 경우, TU0, TU1 및 TU2는 각각 역 변환을 수행하는 분할된 블록 단위로 구성될 수 있다. 이 때, TU0, TU1, TU2는 코딩 효율에 따라, 코딩 유닛을 1차적으로 수직 방향 또는 수평 방향으로 분할하고, 분할된 블록 중 어느 하나를 더 분할한 구조를 가질 수 있다. 이 때, 각 TU는 예측을 수행하는 단위인 PU와 동일한 크기를 가질 수 있으며, PU는 서로 다른 예측 모드를 통해 부/복호화 될 수 있다. 이러한 하나의 비 대칭(Non-square), 2개의 정 방향(Square) 분할 구조가 형성됨에 따라, TU0, TU1, TU2는 각각 변환 효율이 상이할 수 있으므로, 부호화 장치(10) 및 복호화 장치(20)는 이에 따라 서로 동일한 역 변환 집합 또는 서로 다른 역 변환 집합을 선택적으로 결정할 수 있다.
한편, TU 4단 분할의 경우, TU0, TU1, TU2, TU3 은 전체 TU에 대한 4개의 정 방향 분할된 블록을 나타낼 수 있다. 이 때, 4개의 TU는 예측을 수행하는 단위인 PU와 동일한 크기를 가질 수 있으며, 각각 서로 다른 예측 모드를 통해 부/복호화 될 수 있으므로, 복호화 장치(20)는 예측 모드와 CU 및 TU의 블록 크기 등에 따라 선택적으로 기 정의된 역 변환 함수들 중 하나를 선택하여 역 변환을 수행할 수 있다.
한편 도 32는 본 발명의 실시 예에 따른 단말 분할 및 조합분할을 설명하기 위한 도면이다.
먼저, CU/TU 단말 분할의 경우는 CU와 TU가 동일한 크기를 갖는 분할 구조를 나타낼 수 있다. 이 때 CU는 수직 방향 또는 수평 방향으로 분할을 통해 CU0, CU1 등과 같이 2개의 이진 분할된 CU로 분할 될 수 있다.
또한, TU는 분할된 CU와 동일한 크기를 가질 수 있으며, 복호화 장치(20)는 현재 TU와 이웃한 TU간 서로 독립적인 역 변환을 수행할 수 있다. 이를 위해, 각각의 CU0, CU1 에 대한 적응적 변환 집합 이용여부를 결정하는 플래그(AMT flag)가 복호화 장치(20)로 전송될 수 있다. 복호화 장치(20)는 플래그에 따라 TU0과 TU1에 대응되는 서로 다른 변환 함수 집합을 결정할 수 있고, 이에 기초한 각 독립적인 역 변환을 수행할 수 있다.
CU/TU 조합 분할의 경우는 서로 다른 CU로부터 하위 CU로 분할되었으나, 한 CU는 TU와 동일한 크기를 갖고, 인접한 CU는 2개의 TU로 분할된 경우를 의미할 수 있다. 이 때, AMT Flag는 각각 상위 CU0과 CU1의 상위 Depth의 블록에 대응하여 복호화 장치(20)로 전송될 수 있다. 복호화 장치(20)는 CB0과 CB1에 대응하여, 각각의 블록 크기, 예측 모드, 분할 형태 등에 따라 선택적으로 역 변환 집합을 결정하고, 이에 포함된 역변환 함수를 선택하여 역 변환을 수행할 수 있다.
예를 들어, 표 1을 참조하면, 복호화 장치(20)는 CU0에 속한 TU0은 AMT Flag가 True일 경우, 특정 조건(예측 모드, CU 크기, 분할 방향, TU 크기 등)에 따라, Index 0에 해당하는 DCT-VIII, DST-VII 함수를 통해 역 변환을 수행할 수 있으며, CU1에 속한 TU1은 특정 조건에 따라 Index 1에 해당하는 DST-I, DST-VIII으로 역 변환을 수행할 수 있다.
다만, 여기서 표 1 내지 표 2 에 기초한 참조 테이블은 비디오 압축 표준에 따라 정의될 수 있으며, 상기 테이블의 함수로 본 발명이 한정되는 것은 아니다. 또한, 본 변환 함수의 종류와 개수는 영상의 특성에 따라 추가적으로 부호화기로부터 전달 받은 신호에 의해 변경될 수 있다.
이와 같이, 본 발명의 실시 예에 따르면, 복호화 장치(20)는 복호화 과정에서 AMT_Flag 등과 같은 시그널링 신호를 복호화함으로써, 먼저 Default 역 변환 함수 이외의 기 정의된 혹은 별도로 전송 받은 역 변환 함수를 적용할 지를 결정할 수 있다. 이 때, 예측을 수행하는 단위인 PU는 TU와는 독립적으로 예측되므로, 한 CU 내 서로 다른 예측 모드로 복호화된 블록들이 포함 될 수도 있다.
이에 따라, 복호화 장치(20)는 코딩 유닛(CU)으로부터의 역 변환 블록이 2단, 3단, 4단, 단말 또는 조합 분할인지 여부, 예측 모드, CU 및 TU의 블록 크기, 분할 방향 중 적어도 하나에 따라 역변환을 수행하기 위한 역 변환 집합 및 상기 변환 집합에 포함된 역변환 함수를 선택할 수 있다.
그리고, 분할된 TU의 구성에 따라서 각 블록별로 서로 다른 변환 함수 집합이 적용될 수 있으며, 복호화 장치(20)는 코딩 블록의 크기, TU로의 분할 여부, 분할 방향, TU의 크기, 단말 노드 여부 중 적어도 하나를 이용하여 효율에 따라 선택하거나, 부호화 장치(10)로부터 별도의 인덱스를 전달 받아 선택할 수 있다.
도 33은 본 발명의 실시 예에 따른 블록 적응적 역변환을 지원하기 위한 신택스의 일 예를 나타낸다.
도 33을 참조하면, 본 발명의 실시 예에 따른 적응적 변환 집합 플래그(AMT Flag)는 도 33에 도시된 바와 같이 코딩 유닛에 대응되는 하이 레벨 신택스에 포함되어 복호화 장치(20)에서 복호화될 수 있다.
다만, 본 발명의 실시 예에 따르면, 예측 모드가 화면 내 예측 모드인 경우에는, 기존의 각 예측 방향 모드별 미리 할당되는 제1 방향 및 제2 방향으로의 특정 변환 함수가 적용될 수 있고, 기존의 변환 함수가 그대로 이용될 수 있다.
이와 같은 상태에서, 상기 신택스의 적응적 변환 집합 플래그는 인터 예측 모드에서만 이용될 수도 있다.
이에 따라, 신택스 상에는 화면 간 예측 시 변환 효율에 따라 결정된 제1 역변환 집합 및 제2 역변환 집합의 인덱스 정보가 더 포함될 수 있다. 도 33에 도시된 바와 같이, 현재 역변환 대상 블록에 대응되는 코딩 유닛이 화면 간 예측된 경우, 제1 역변환으로서 Vertical(Inter_AMT_second_sub_set_index) 역 변환과 제2 역변환으로서 Horizontal(Inter_AMT_First_sub_set_index) 역변환에 적용될 각 변환 집합 인덱스가 신택스상에 포함되어 복호화 장치(20)로 전송될 수 있다.
도 34 및 도 35는 본 발명의 또 다른 일 실시 예에 따른 부호화 및 복호화 시스템을 설명하기 위한 블록도이다.
도 34 및 도 35를 참조하면, 부호화 장치(10)의 변환부(120)는 제 1 변환부(121A), 제2 변환부(122A) 및 양자화부(130A)를 포함할 수 있으며, 역양자화/역변환부(220)는 제1 역변환부(223A), 제2 역변환부(225A) 및 역양자화부(229A)를 포함할 수 있다.
먼저, 제1 변환부(121A) 및 제1 역변환부(223A)는 일반적인 수직/수평 방향으로의 2차원 변환 및 역변환을 처리할 수 있다.
그리고, 제2 변환부(122A)는 본 발명의 실시 예에 따라, 양자화부(130A)의 처리가 수행되기 이전에 선택적으로 동작할 수 있으며, 상기 제1 변환 처리된 잔차 신호의 제2 변환을 추가적으로 처리할 수 있다.
여기서, 상기 제2 변환부(122A)의 동작여부는 부호화 블록의 예측 모드가 화면 내 예측 모드인지 여부와, 제2 변환의 변환을 적용했을 때와 적용하지 않았을 때의 각각의 부호화 효율을 비교하여 선택적으로 결정될 수 있다.
이 때, 제2 변환이 수행될 경우, 부호화 장치(10)는 별도의 Flag (예를 들어, 모드 의존적 비분리 제2 변환 플래그, MDNSST_Flag, Mode dependent Non-separable secondary transform)를 복호화 장치(20)로 전송할 수 있다. 이에 따라, 복호화 장치(20)에서는 MDNSST_Flag를 파싱하여 해당 Flag의 신호 값에 따라 제2 역변환의 수행 여부를 결정할 수 있다.
이에 따라, 제2 역변환부(225A) 또한 상기 플래그 수신시에만 선택적으로 동작하여 역양자화부(229A)에서 역양자화된 비트스트림의 제2 역변환을 처리할 수 있으며, 이후 제1 역변환부(223A)의 기존과 같은 2차원 제1 역변환이 수행되어 잔차 신호가 복호화 될 수 있다.
일 실시 예에서, 제2 변환부(122A)는 코딩 블록 단위로 제2 변환을 수행할 수 있다. 제2 변환은 잔차 신호(Residual signal)을 입력 받아 블록 단위로 변환을 수행하는 제1 변환부(121A)과는 달리, 임의의 사이즈를 갖는 한 블록의 변환 계수(Transform coefficient)들을 일정한 수의 하위 그룹으로 그룹화 하여, 그룹화된 변환 계수에 대한 제2 변환을 수행하는 변환을 포함할 수 있으며, 이때 하위 그룹의 크기는 최소 4x4 이상을 가질 수 있다.
이에 대한 변환과정이 도 35에 개시된다. 만약, 64x64의 임의의 크기를 갖는 블록은 16개의 4x4 크기의 변환 계수를 갖는 하위 그룹으로 분류될 수 있다. 이후, 제2 변환부(122A)는 각각의 하위 그룹의 화면 내 예측의 방향에 따라, 미리 정해진 변환 매트릭스(Transform matrix)를 적용하여, 각 그룹에 속한 계수들의 대표적인 특성을 나타낼 수 있는 하나의 벡터(Vector) 등으로 변환할 수 있다. 이에 따라, 양자화부(130A)는 상기 임의의 크기를 갖는 블록을 양자화 할 때, 총 16개의 백터를 입력으로 하는 양자화를 수행할 수 있게 된다.
이와 같은 변환이 처리되면, 복호화 장치(20)는 복호화 블록이 Intra mode로 부호화 되었을 경우, 복호화 블록 단위로 MDNSST Flag를 파싱할 수 있다.
그리고, 복호화 장치(20)는 MDNSST Flag 에 기초하여 제2 역변환부(225A)의 동작 여부를 판단할 수 있다.
만약 현재 복호화를 수행하는 블록이 제2 변환으로 부호화 된 경우, 제2 역변환부(225A)는 역양자화부(229A)의 출력으로부터 방향성 모드 및 비 방향 모드를 포함한 예측 모드에 따라, 미리 정해진 하기 표 4와 같은 테이블을 참조하여, 하위 그룹의 벡터들에 대한 제2 역변환을 먼저 수행할 수 있다. 표 4는 Intra mode에 대응되는 변환 집합의 종류를 예시한다.
Figure PCTKR2018000867-appb-T000004
이에 따라, 부호화 장치(10)는 제1 변환부(121A)를 통해 예측 부호화에 따른 잔차 신호를 입력으로 하는 블록 단위(NxN)의 제1 변환을 수행하고, 제2 변환부(122A)를 통해 제1 변환된 블록의 변환 계수들을 N개의 하위 그룹으로 그룹화하며, 화면 내 예측 모드의 방향성(DC, Planar 포함)에 따른 제2 변환을 수행하여, N개의 하위 그룹을 N개의 Vector로 변환할 수 있다. 이후, 양자화부(130A)는 N개의 Vector값에 대한 양자화를 수행할 수 있다.
이는 특히, NxN 사이즈의 블록에서, NxN개의 변환 계수(Transform coefficient)를 각각 양자화 하지 않고, 제2 변환 수행 여부를 나타내는 MDNSST_Flag와 이에 대응되는 N개의 Vector만을 양자화 하기 때문에, Bit saving 에 따른 전송 효율 향상 및 부호화 효율 증가의 효과를 가져 올 수 있다.
도 36은 본 발명의 다른 일 실시 예에 따른 복호화 장치(20)의 역양자화/역변환부(220)를 개략적으로 도시한 도면이다.
도 36을 참조하면, 본 발명의 실시 예에 따른 역양자화/역변환부(220)는, 복호화 대상 현재 블록에 대응하는 제 2차 변환(Secondary Transform)의 수행 정보를 이용하여, 변환 계수를 적응적(Adaptive)으로 결정함으로써, 부호화 효율을 향상킬 수 있다.
예를 들어, 현재 블록에 대응하는 적응적 결정 변수로서, 현재 블록의 화면 내 예측 모드, 블록의 크기(4x4, 8x8, …), 분할 Depth, 블록의 분할 방향 정보 중 적어도 하나가 예시될 수 있다. 또한, 예를 들어, 상기 제 2차 변환의 수행 정보는 제 2차 변환의 수행 여부 정보, 제 2차 변환 모드 정보 등이 예시될 수 있다.
이에 따라, 본 발명의 실시 예에 따른 복호화 장치(20)의 역양자화/역변환부(220)는, 역 양자화부(310), 변환 계수 치환부(315), 제2 역변환부(320) 및 제1 역변환부(330)를 포함할 수 있다. 또한, 변환 계수 구성부(305)는 변환 계수 치환부(315)와 연결되도록 선택적으로 더 포함될 수 있으며, 이에 대하여는 후술하도록 한다.
또한, 부호화 장치(10)에서는 변환부(120) 및 양자화부(130)에서 후술할 복호화 장치(20)의 역 양자화/역변환부(220)의 동작을 가능하게 하는, 변환 처리 및 시그널링 처리를 수행할 수 있다.
이에 따라, 도 36을 참조하면, 먼저, 역 양자화/역변환부(220)는 역 양자화된 신호에 대응하여, 제2 역 변환 수행 여부를 판단할 수 있다.
여기서, 제2 역 변환 수행 여부는 미리 설정된 특정 조건에 따라 선택적으로 결정될 수 있으며, 제2 역변환 수행 여부에 따라, 역 양자화부(310)는 입력 신호를 역 양자화 처리하여 획득된 역 양자화된 신호를 제2 역변환부(320) 또는 제1 역변환부(330)중 어느 하나로 전달할 수 있다.
또한, 변환 계수 구성부(305)는 제2 역 변환 수행에 대응하는 변환 계수 정보의 구성을 처리할 수 있으며, 구성된 계수 정보 또는 미리 설정된 계수 정보에 따라, 변환 계수 치환부(315)는 제2 역변환을 위한 변환 계수의 치환을 처리할 수 있다. 이에 따라, 제2 역 변환의 수행여부 정보가 역 양자화부(310)로 전달될 수 있고, 역 양자화부(310)는 제2 역변환 수행여부에 따라 제2 역변환부(320) 또는 제1 역변환부(330)로 역 양자화된 신호를 전달할 수 있다.
보다 구체적으로, 예를 들어, 역 양자화/역변환부(220)는 부호화 장치(10)로부터 시그널링된 제2 역변환 수행 정보에 따라 제2 역 변환 수행을 결정하고, 역 양자화부(310)는 제2 역변환 수행이 결정된 경우, 변환 계수 치환부(315) 및 변환 계수 구성부(305)를 통해 결정된 변환 계수를 제2 역변환부(320)로 전달할 수 있다. 그리고, 역 양자화부(310)는 역 양자화된 신호를 제2 역변환부(320)로 전달하여, 제2 역변환이 처리되도록 한다.
그리고, 제2 역변환부(320)는 변환 계수에 따라 제2 역변환된 신호를 제1 역변환부(330)로 전달하며, 제1 역변환부(330)는 이에 대응하는 제1 역변환을 처리함으로써, 복원된 차분 신호가 출력되도록 한다.
또한, 예를 들어, 역 양자화/역변환부(220)는 현재 블록에 대응하는 조건 정보와 비교하여, 제2 역변환 수행을 결정하고, 제2 역변환 수행이 결정된 경우, 변환 계수 치환부(315) 또는 변환 계수 구성부(305)는 결정된 제2 역변환을 위한 변환 계수 정보를 제2 역변환부(320)로 전달할 수 있다. 여기서, 조건 정보는 블록의 크기 정보 또는 역 변환 함수 정보 등이 예시될 수 있으며, 제2 역 변환에 이용되는 역 변환 함수는 HyGT(Hypercube-Givens Transform) 등이 예시될 수 있다. 또한, 계수의 변환 / 스케일 / 로테이션(Rotation) / 치환, 및 최적화 정보 등에 따라 변환 계수가 사전 결정될 수 있다.
한편, 역 양자화부(310)는 제2 역 변환 수행이 아닌, 제1 역변환 수행이 결정된 경우, 제1 역변환부(330)로 바로 역 양자화된 신호를 전달하여, 제1 역변환부(330)에서 차분 신호를 복원 및 출력하도록 할 수 있다.
도 37은 본 발명의 실시 예에 따른 변환 계수 구성 기반 역변환 처리를 설명하기 위한 흐름도이다.
도 37은 역 양자화/역변환부(220)가 변환 계수 치환부(315)를 대체하는 변환 계수 구성부(305)를 포함하는 경우의 역변환 처리 동작을 나타내고 있다.
도 37을 참조하면, 먼저 변환 계수 구성부(305)는 입력된 비트스트림 신호로부터 변환 계수를 구성한다(S2001).
이를 위해, 먼저 변환 계수 구성부(305)는 비트스트림으로부터 획득된 변환 계수 구성 정보를 이용하여, 제2 역 변환 수행 여부 및 변환 계수를 결정할 수 있다.
예를 들어, 변환 계수 구성부(305)는 비트스트림의 헤더 정보로부터 식별되는 현재 블록의 역변환 플래그(Flag), 현재 블록의 크기, 예측 모드 종류(화면 간 또는 화면 내), 블록의 분할 깊이(Depth) 중 적어도 하나를 이용하여, 상기 제2 역 변환 수행 여부와, 상기 역변환을 위한 변환 계수 정보를 구성할 수 있다.
또한, 변환 계수 구성부(305)는 부호화 장치(10)로부터 별도 시그널링된 제2 변환 수행 정보를 획득함으로써, 변환 계수 정보를 구성할 수도 있다.
이와 같이 구성된 변환 계수 정보는 전술한 변환 집합에 따라, 변환 계수 치환부(315)에서 블록 적응적으로 치환되는데 이용됨으로써, 제2 역변환부(320)가 현재 블록의 제2 역변환 계수를 결정하는 데 이용될 수 있다.
또한, 구성된 변환 계수 정보에 따라, 제2 역변환부(320)는 변환 계수를 구성할 때 해당 계수들의 스캐닝 순서(Scanning order)를 선택 적응적으로 결정할 수 있으며, 이는 보다 효율적인 부호화 및 복호화 처리를 가능하게 한다. 이에 대하여는 보다 구체적으로 후술하도록 한다.
이에 따라, 변환 계수 구성부(305)는 현재 블록에 대응하여, 변환 계수 정보를 결정하기 위한 조건에 대응하는 변환 계수를 구성할 수 있으며, 구성된 변환 계수 정보는 변환 계수 치환부(315)를 통해 제2 역변환부(320)로 전달될 수 있다.
이후, 역 양자화부(310)에서 역 양자화가 수행되면(S2003), 역 양자화/역변환부(220)는 전술한 변환 계수 구성여부에 따라, 제2 역변환 수행여부를 판단하고(S2005), 제2 역변환이 수행되는 경우, 변환 계수 정보에 기초한 변환 계수 치환부(315)의 변환 계수 치환 수행이 처리되며(S2007), 이후 치환된 변환 계수에 기초한 제2 역변환부(320)의 제2 역변환이 처리된다(S2009).
S2005 단계에서, 제2 역변환이 수행되지 않는 것으로 판단되거나, S2009 단계 이후에는, 역 양자화부(310)의 출력 또는 제2 역변환부(320)의 출력 및 변환 계수 정보에 대응하는 제1 역변환이 수행될 수 있다(S2011).
도 38은 사전 결정된 조건을 이용한 역 양자화/역변환부(220)의 제2 역 변환 수행 여부 결정 동작을 나타내는 흐름도이다.
도 38을 참조하면, 본 발명의 실시 예에 따른 역 양자화/역변환부(220)는 현재 블록의 속성 정보 및 제2 역변환 시그널링 정보 중 적어도 하나를 이용하여, 제2 역변환 수행여부를 결정할 수 있다. 이를 위해, 역 양자화/역변환부(220)는 제2 역변환 수행 판단부(미도시)를 더 구비할 수도 있다.
도 38은 상기 제2 역변환 수행 판단부를 이용한 역 양자화/역변환부(220) 동작의 예시적 흐름도로서, 역 양자화/역변환부(220)는 먼저 제2 역변환 수행 인덱스를 이용하여, 제2 역변환 적용 대상인지를 우선 판단한다(S2040).
그리고, 제2 역변환 적용 대상인 경우, 역 양자화/역변환부(220)는 현재 블록의 크기가 4x4 인지를 판단하고(S2041) , 아닌 경우 좌상단 8x8 블록인지를 판단한다(S2042). 이는 블록 크기 및 위치에 따라 제2 역변환 적용여부를 적응적으로 결정함으로써 부호화/복호화 효율을 향상시키기 위한 예시이다.
이에 따라, 현재 블록이 4x4 블록이거나, 좌상단 8x8 블록인 경우, 역 양자화/역변환부(220)는 현재 블록 내 논제로 계수(Non-Zero Coefficient)의 개수 정보기 임계값(thr) 이상인지를 판단한다(S2043).
임계값 이상인 경우, 역 양자화/역변환부(220)는 제2 역변환 수행 플래그(b2ndTrFlag)를 수행함(TRUE)으로 결정하여, 결정된 값을 리턴 출력할 수 있다(S2044).
한편, 제2 역변환 수행 인덱스가 0 이하이거나, 해당 블록 크기에 대응하지 않거나, 임계값 이하인 경우, 역 양자화/역변환부(220)는 제2 역변환 수행 플래그(b2ndTrFlag)를 수행안함(FALSE)으로 결정하여, 결정된 값을 리턴 출력할 수 있다.
이와 같이, 제2 역변환 수행여부는 역 변환 계수 및 블록 정보에 따라 선택적, 적응적으로 결정될 수 있는 바, 이에 따른 스캐닝 순서 또한 상이하게 결정됨으로써 부호화 및 복호화 효율이 향상될 수 있다. 이에 대하여 도 39 내지 도 43을 참조하여 보다 구체적으로 설명하도록 한다.
도 39 및 도 40은 본 발명의 실시 예에 따라, 변환 계수 구성부(305)에서 획득된 변환 계수를 이용한 스캐닝 오더 결정을 설명하기 위한 도면들이다.
도 39 및 도 40을 참조하면, 변환 계수 구성부(305)는 비트스트림으로부터 획득되는 화면 내 예측 모드 정보, 블록 크기 정보 및 제2 역 변환 수행 정보 중 적어도 하나로부터 결정된 변환 계수 정보를 획득할 수 있으며, 변환 계수 정보에 대응하여 적어도 하나 이상의 스캐닝 오더(Scanning order) 정보를 결정할 수 있다. 그리고, 변환 계수 구성부(305)는 결정된 스캐닝 오더에 따라 변환 계수를 구성하여 역 양자화부(310)로 전달할 수 있다.
예를 들어, 변환 계수 구성부(305)는 사전 결정된 조건에 따라 다수의 스캐닝 오더 중 하나의 변환 계수 스캐닝 오더를 결정할 수 있으며, 결정된 스캐닝 오더에 대응하는 변환 계수가 구성되도록 처리할 수 있다. 도 40에서는 3 종류의 스캐닝 오더를 예시하고 있으며, 지그재그 스캔(Zig-Zag scan), 수평 스캔(Horizontal scan), 수직 스캔(Vertical scan) 등이 예시될 수 있고, 변환 계수 구성부(305)는 전술한 화면 내 예측 모드 정보, 블록 크기 정보 및 제2 역 변환 수행 정보 중 적어도 하나로부터 이 중 어느 하나가 선택되도록 처리할 수 있다.
그리고, 역 양자화/역변환부(220)는 제2 역변환이 결정됨에 따라 제2 변환 인덱스를 생성하여, 변환 계수 치환부(315)로 제공할 수 있다. 이는 변환 계수 구성부(305)에서 제공되거나, 제2 역변환 여부 판단부(비도시)에서 제공될 수도 있다.
한편, 도 41 내지 도 42는 전술한 도 39에서 구성된 변환 계수 정보에 대응하는, 변환 계수 치환부(315)의 변환 계수 치환 처리를 설명하기 위한 도면들이다.
도 41을 참조하면, 변환 계수 치환부(315)는 변환 계수 구성부(305)로부터 결정된 스캐닝 오더에 따라, 역 양자화부(310)로부터 역 양자화된 변환 계수를 획득할 수 있다.
그리고, 변환 계수 치환부(315)는 제2 변환 인덱스 및 사전 결정된 조건에 따른 제2 역변환이 결정된 경우, 변환 계수의 치환 처리를 수행하여 제2 역변환부(320)로 전달함으로써, 치환된 변환 계수에 대응하는 제2 역변환이 처리되도록 한다.
상기 제2 역변환의 결정은 전술한 바와 같이, 제2 변환 인덱스 또는 플래그, 현재 블록의 크기, 현재 블록의 위치, 주변 블록의 정보, 현재 블록의 Non-zero Coefficeint계수 중 적어도 하나를 포함하는 조건 정보를 이용하여 결정될 수 있다.
그리고, 치환 처리는 제2 역변환을 위한 변환 계수의 위치를 조정하기 위한 것으로, 도 42를 참조하면, 변환 계수 치환부(315)는 기 역 양자화된 변환 계수를 하나 이상의 치환 방식 중 선택된 하나의 방식을 이용하여 변환 계수의 위치를 조정하기 위한 변환 계수 치환을 처리할 수 있다.
보다 구체적으로, 도 42를 참조하면, 변환 계수 치환부(315)는 변환 계수 벡터를 이용한 치환 처리를 수행할 수 있다.
도 42에 도시된 바와 같이, 스캐닝된 변환 계수는 1D 벡터로 구성될 수 있으며, 변환 계수 치환부(315)는 제2 역변환의 계수 위치 변경을 처리하기 위하여 2D 벡터로의 치환(PERMUTATION)을 적용함으로써, 치환된 결과 벡터가 2D 블록에 대응하여 구성될 수 있도록 한다.
예를 들어, 16x1의 1D 변환 계수 F를 이용하는 경우, 변환 계수 치환부(315)는 제2 역 변환 수행 정보(예를 들어, 화면 내 예측 모드, 제 2역 변환 인덱스, 블록 크기, 블록 위치 등)를 이용하여, 미리 설정된 치환 벡터 중 선택된 하나의 변환 벡터를 이용한 변환 계수의 치환 처리를 수행함으로써, 2D 변환 계수 F'를 획득할 수 있으며, 이에 따른 제2 역변환 처리가 가능하게 된다.
상기한 바와 같이, 본 발명의 실시 예에 따른 부호화 장치(10) 및 복호화 장치(20)는 쿼드 트리 구조 및 이진 트리 구조의 코딩 유닛, 변환 유닛 및 예측 유닛이 존재함으로 인한 변환 효율을 고려하여, 각 대상 블록에 대해 효율적인 변환 함수로 구성되는 변환 집합을 선택적이고 적응적으로 적용할 수 있는 부호화 및 복호화 방법을 제공할 수 있게 된다.
또한, 본 발명의 실시 예에 따른 부호화 장치(10) 및 복호화 장치(20)는 각 대상 블록에 대해 변환 계수의 구성 및 스캐닝 오더의 결정과, 제2 역변환을 위한 그 치환방법을 블록 적응적이며, 선택적으로 결정할 수 있도록 함으로써, 각 대상 블록에 대한 효율적인 2차 변환 여부의 결정과, 이에 따른 스캐닝 및 변환 처리가 이루어질 수 있는 부호화 및 복호화 방법을 제공할 수 있게 된다.
상술한 본 발명에 따른 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해 되어서는 안될 것이다.

Claims (19)

  1. 영상 복호화 방법에 있어서,
    영상의 픽쳐가 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할되고, 상기 픽쳐 또는 상기 분할된 코딩 유닛을 쿼드 트리(quad tree) 및 이진 트리(binary tree) 구조로 분할한 코딩 유닛을 복호화하기 위한 역변환 대상 블록을 결정하는 단계; 및
    상기 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함하는
    영상 복호화 방법.
  2. 제1항에 있어서,
    상기 블록 정보는 역변환 대상 블록의 블록 크기 정보를 포함하고,
    상기 적응적으로 선택하는 단계는 상기 블록 크기 정보에 따라 변환 집합을 결정하는 단계를 포함하는
    영상 복호화 방법.
  3. 제1항에 있어서,
    상기 블록 정보는 역변환 대상 블록의 블록 분할 정보를 포함하고,
    상기 적응적으로 선택하는 단계는 상기 블록 분할 정보에 따라 변환 집합을 선택하는 단계를 포함하는
    영상 복호화 방법.
  4. 제1항에 있어서,
    상기 블록 정보는 역변환 대상 블록에 대응되는 코딩 유닛의 예측 모드 정보를 포함하고,
    상기 적응적으로 선택하는 단계는 상기 예측 모드 정보에 따라 변환 집합을 선택하는 단계를 포함하는
    영상 복호화 방법.
  5. 제4항에 있어서,
    상기 예측 모드 정보는 화면 내 예측 모드 정보 또는 화면 간 예측 모드 정보를 포함하는
    영상 복호화 방법.
  6. 제1항에 있어서,
    상기 선택된 변환 집합에 포함된 상기 하나 이상의 변환 함수를 이용하여 상기 역변환 대상 블록의 역변환을 수행하는 단계를 포함하는
    영상 복호화 방법.
  7. 제6항에 있어서,
    상기 선택하는 단계는,
    상기 블록 정보에 따라, 제1 방향에 대응되는 제1 역변환 집합 및 제2 방향에 대응되는 제2 역변환 집합을 선택하는 단계를 포함하고,
    상기 역변환을 수행하는 단계는,
    상기 제1 역변환 집합을 이용하여 상기 제1 방향에 대응하는 1차 역변환을 수행하는 단계; 및
    상기 제2 역변환 집합을 이용하여 상기 제2 방향에 대응하는 2차 역변환을 수행하는 단계를 포함하는
    영상 복호화 방법.
  8. 제1항에 있어서,
    상기 선택하는 단계는,
    상기 블록 정보가 화면 간 예측 모드에 대응되는 경우, 화면 간 예측 모드 정보로부터 변환 집합 인덱스를 획득하는 단계; 및
    상기 변환 집합 인덱스와 상기 블록 크기 및 분할 여부를 포함하는 조건에 따라 역변환을 위한 변환 함수를 선택하는 단계를 포함하는
    영상 복호화 방법.
  9. 제1항에 있어서,
    상기 블록 정보는 역변환 대상 블록에 대응되는 코딩 유닛의 단말 노드 여부 정보를 포함하고,
    상기 적응적으로 선택하는 단계는 블록 크기, 분할 형태, 상기 코딩 유닛에 대응하는 변환 유닛의 크기 및 상기 단말 노드 여부 정보 중 적어도 하나에 따라 변환 집합을 선택하는 단계를 포함하는
    영상 복호화 방법.
  10. 제1항에 있어서,
    상기 역변환 대상 블록에 대한 적응적 역변환 사용여부를 나타내는 플래그를 복호화하는 단계를 더 포함하는
    영상 복호화 방법.
  11. 제1항에 있어서,
    상기 플래그가 모드 의존적 비분리 제2 변환 플래그인 경우,
    상기 선택하는 단계는,
    화면 내 예측 방향 모드에 따라, 복수의 제2 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함하고,
    상기 대상 블록에 대해 상기 선택된 제2 변환 집합에 따라 제2 역변환을 수행하는 단계; 및
    상기 제2 역변환된 블록에 대한 제1 역변환을 수행하는 단계를 더 포함하며,
    상기 제2 역변환에 대응되는 제2 변환은 잔차 신호로부터 제1 변환된 특정 크기의 한 블록의 변환 계수들을 일정한 수의 하위 그룹으로 그룹화하고, 상기 하위 그룹의 화면 내 예측 방향에 따라 변환 매트릭스를 적용하여 벡터 변환하는 것을 특징으로 하는
    복호화 방법.
  12. 영상 복호화 장치에 있어서,
    영상의 픽쳐를 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할하고, 상기 픽처 또는 상기 분할된 코딩 유닛을 쿼드 트리(quad tree) 및 이진 트리(binary tree) 구조로 분할하는 픽쳐 분할부; 및
    상기 코딩 유닛에 대응하는 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 변환 집합 결정부를 포함하는
    영상 복호화 장치.
  13. 영상 부호화 방법에 있어서,
    영상의 픽쳐를 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할하고, 상기 픽처 또는 상기 분할된 코딩 유닛을 쿼드 트리(quad tree) 및 이진 트리(binary tree) 구조로 분할하는 단계;
    분할된 코딩 유닛에 대한 변환 대상 블록을 결정하는 단계; 및
    상기 변환 대상 블록에 대응하여, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함하는
    영상 부호화 방법.
  14. 영상 복호화 방법에 있어서,
    영상의 픽쳐가 인터 예측(inter prediction) 또는 인트라 예측(intra prediction)이 수행되는 기본 단위인 복수의 코딩 유닛(Coding Unit)들로 분할되고, 상기 픽쳐 또는 상기 분할된 코딩 유닛을 쿼드 트리(quad tree) 및 이진 트리(binary tree) 구조로 분할한 코딩 유닛을 복호화하기 위한 역변환 대상 블록을 결정하는 단계;
    상기 역변환 대상 블록에 대한 블록 정보에 따라, 하나 이상의 변환 함수를 포함하는 복수의 변환 집합들 중 어느 하나를 적응적으로 선택하는 단계를 포함하고,
    상기 선택된 변환 집합 및 상기 역변환 대상 블록에 대한 제2 역변환 수행 정보에 따라, 제2 방향에 대응하는 제2 역변환을 적응적으로 수행하는 단계; 및
    상기 제2 역변환된 블록에 대한 제1 방향에 대응하는 제1 역변환을 수행하여, 복원된 차분 신호를 획득하는 단계를 포함하는
    영상 복호화 방법.
  15. 제14항에 있어서,
    상기 적응적으로 수행하는 단계는,
    상기 대상 블록의 예측 모드 정보, 크기 정보, 분할 정보 중 적어도 하나에 따라, 제2 역변환 수행 여부를 결정하는 단계를 포함하는
    영상 복호화 방법.
  16. 제14항에 있어서,
    상기 적응적으로 수행하는 단계는,
    상기 대상 블록에 대응하여 시그널링된 제2 역변환 수행 플래그를 획득하여, 상기 제2 역변환 수행여부를 결정하는 단계를 포함하는
    영상 복호화 방법.
  17. 제14항에 있어서,
    상기 적응적으로 수행하는 단계는,
    상기 대상 블록에 대응하는 변환 계수 정보를 획득하는 단계; 및
    상기 변환 계수 정보를 이용하여, 상기 제2 역변환을 수행하는 단계를 포함하는
    영상 복호화 방법.
  18. 제17항에 있어서,
    상기 적응적으로 수행하는 단계는,
    상기 대상 블록에 대응하는 상기 변환 계수 정보를 이용하여, 상기 대상 블록의 역 양자화 스캐닝 오더를 결정하는 단계;
    상기 스캐닝 오더에 따른 역 양자화를 처리하는 단계; 및
    상기 변환 계수 정보를 이용하여, 상기 역 양자화된 대상 블록의 제2 역변환을 처리하는 단계를 더 포함하는
    영상 복호화 방법.
  19. 제17항에 있어서,
    상기 적응적으로 수행하는 단계는,
    상기 변환 계수 정보를 이용하여, 상기 제2 역변환을 위한 변환 계수 치환을 처리하는 단계를 더 포함하는
    영상 복호화 방법.
PCT/KR2018/000867 2017-01-19 2018-01-18 변환 처리를 제공하는 영상 복호화 및 부호화 방법 WO2018135885A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020170009168A KR20180085526A (ko) 2017-01-19 2017-01-19 효율적 변환을 처리하는 영상 복호화 및 부호화 방법
KR10-2017-0009168 2017-01-19
KR10-2018-0006762 2018-01-18
KR1020180006762A KR20190088338A (ko) 2018-01-18 2018-01-18 변환 처리를 제공하는 영상 복호화 및 부호화 방법

Publications (1)

Publication Number Publication Date
WO2018135885A1 true WO2018135885A1 (ko) 2018-07-26

Family

ID=62908040

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/000867 WO2018135885A1 (ko) 2017-01-19 2018-01-18 변환 처리를 제공하는 영상 복호화 및 부호화 방법

Country Status (1)

Country Link
WO (1) WO2018135885A1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020117583A1 (en) * 2018-12-07 2020-06-11 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (cbf)
CN111757104A (zh) * 2020-06-29 2020-10-09 北京百度网讯科技有限公司 一种图像编码方法、装置、电子设备及存储介质
WO2020211765A1 (en) * 2019-04-17 2020-10-22 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods harmonzting matrix-based intra prediction and secoundary transform core selection
CN112655213A (zh) * 2018-09-12 2021-04-13 松下知识产权经营株式会社 变换装置、解码装置、变换方法以及解码方法
CN113228685A (zh) * 2018-12-19 2021-08-06 Lg电子株式会社 用于基于二次变换编码图像的方法及其装置
CN113330748A (zh) * 2019-02-07 2021-08-31 华为技术有限公司 帧内预测模式信令的方法和装置
CN113940070A (zh) * 2019-06-06 2022-01-14 Lg电子株式会社 基于变换的图像编码方法及其装置
CN114071189A (zh) * 2020-08-03 2022-02-18 纬创资通股份有限公司 视频处理装置及视频串流的处理方法
US20220150470A1 (en) * 2019-03-20 2022-05-12 Hyundai Motor Company Method and apparatus for intra predictionbased on deriving prediction mode
US20220150518A1 (en) * 2020-11-11 2022-05-12 Tencent America LLC Method and apparatus for video coding
RU2795932C1 (ru) * 2019-10-04 2023-05-15 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования изображения на основе преобразования и устройство для его осуществления
US11758176B2 (en) 2018-09-21 2023-09-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image signal encoding/decoding method and non-transitory computer-readable medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130033968A (ko) * 2011-09-27 2013-04-04 브로드콤 코포레이션 비디오 코딩에 따른 예측 크기 유닛 시그널링
WO2013115568A1 (ko) * 2012-01-30 2013-08-08 한국전자통신연구원 인트라 예측 모드 부호화/복호화 방법 및 장치
KR20140031397A (ko) * 2011-08-08 2014-03-12 모토로라 모빌리티 엘엘씨 변환 유닛 분할의 잔여 트리 구조
US20140092965A1 (en) * 2012-10-01 2014-04-03 Qualcomm Incorporated Intra-coding for 4:2:2 sample format in video coding
KR20150056610A (ko) * 2012-11-13 2015-05-26 인텔 코포레이션 차세대 비디오용 비디오 코덱 아키텍처

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140031397A (ko) * 2011-08-08 2014-03-12 모토로라 모빌리티 엘엘씨 변환 유닛 분할의 잔여 트리 구조
KR20130033968A (ko) * 2011-09-27 2013-04-04 브로드콤 코포레이션 비디오 코딩에 따른 예측 크기 유닛 시그널링
WO2013115568A1 (ko) * 2012-01-30 2013-08-08 한국전자통신연구원 인트라 예측 모드 부호화/복호화 방법 및 장치
US20140092965A1 (en) * 2012-10-01 2014-04-03 Qualcomm Incorporated Intra-coding for 4:2:2 sample format in video coding
KR20150056610A (ko) * 2012-11-13 2015-05-26 인텔 코포레이션 차세대 비디오용 비디오 코덱 아키텍처

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112655213A (zh) * 2018-09-12 2021-04-13 松下知识产权经营株式会社 变换装置、解码装置、变换方法以及解码方法
US11758176B2 (en) 2018-09-21 2023-09-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image signal encoding/decoding method and non-transitory computer-readable medium
RU2812857C2 (ru) * 2018-09-21 2024-02-05 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ и устройство для кодирования/декодирования сигналов изображений
RU2799588C2 (ru) * 2018-09-21 2023-07-06 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ и устройство для кодирования/декодирования сигналов изображений
WO2020117583A1 (en) * 2018-12-07 2020-06-11 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (cbf)
US11533473B2 (en) 2018-12-07 2022-12-20 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (CBF)
US11115652B2 (en) 2018-12-07 2021-09-07 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (CBF)
CN113228685A (zh) * 2018-12-19 2021-08-06 Lg电子株式会社 用于基于二次变换编码图像的方法及其装置
US11792430B2 (en) 2018-12-19 2023-10-17 Lg Electronics Inc. Method for coding image on basis of secondary transform and device therefor
CN113228685B (zh) * 2018-12-19 2023-08-04 Lg电子株式会社 用于基于二次变换编码图像的方法及其装置
CN113330748A (zh) * 2019-02-07 2021-08-31 华为技术有限公司 帧内预测模式信令的方法和装置
CN113330748B (zh) * 2019-02-07 2023-04-18 华为技术有限公司 帧内预测模式信令的方法和装置
US20220150470A1 (en) * 2019-03-20 2022-05-12 Hyundai Motor Company Method and apparatus for intra predictionbased on deriving prediction mode
WO2020211765A1 (en) * 2019-04-17 2020-10-22 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods harmonzting matrix-based intra prediction and secoundary transform core selection
CN113940070B (zh) * 2019-06-06 2023-11-21 Lg电子株式会社 基于变换的图像解码和编码方法及发送比特流的方法
CN113940070A (zh) * 2019-06-06 2022-01-14 Lg电子株式会社 基于变换的图像编码方法及其装置
RU2795932C1 (ru) * 2019-10-04 2023-05-15 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования изображения на основе преобразования и устройство для его осуществления
RU2803457C2 (ru) * 2019-10-04 2023-09-13 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования изображения на основе преобразования и устройство для его осуществления
CN111757104B (zh) * 2020-06-29 2022-11-18 北京百度网讯科技有限公司 一种图像编码方法、装置、电子设备及存储介质
CN111757104A (zh) * 2020-06-29 2020-10-09 北京百度网讯科技有限公司 一种图像编码方法、装置、电子设备及存储介质
CN114071189B (zh) * 2020-08-03 2023-05-05 纬创资通股份有限公司 视频处理装置及视频串流的处理方法
CN114071189A (zh) * 2020-08-03 2022-02-18 纬创资通股份有限公司 视频处理装置及视频串流的处理方法
US20220150518A1 (en) * 2020-11-11 2022-05-12 Tencent America LLC Method and apparatus for video coding

Similar Documents

Publication Publication Date Title
WO2018135885A1 (ko) 변환 처리를 제공하는 영상 복호화 및 부호화 방법
WO2018030773A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2018226015A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2018016823A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2017222237A1 (ko) 화면 내 예측 방법 및 장치
WO2018070809A1 (ko) 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법
WO2019172705A1 (ko) 샘플 필터링을 이용한 영상 부호화/복호화 방법 및 장치
WO2017204427A1 (ko) 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법
WO2019182385A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2018097692A2 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2020256413A1 (ko) 적응적 루프내 필터링 방법 및 장치
WO2020005035A1 (ko) 처리율 향상을 위한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2015122549A1 (ko) 동영상 처리 방법 및 장치
WO2011096741A2 (en) Method and apparatus for encoding video based on scanning order of hierarchical data units, and method and apparatus for decoding video based on scanning order of hierarchical data units
WO2020060184A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2020005031A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2017183751A1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2019240493A1 (ko) 문맥 적응적 이진 산술 부호화 방법 및 장치
WO2013141596A1 (ko) 트리 구조의 부호화 단위에 기초한 스케일러블 비디오 부호화 방법 및 그 장치, 트리 구조의 부호화 단위에 기초한 스케일러블 비디오 복호화 방법 및 그 장치
WO2020060244A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2019194653A1 (ko) 움직임 정보의 복합적 머지 모드 처리를 제공하는 영상 처리 방법, 그를 이용한 영상 복호화, 부호화 방법 및 그 장치
WO2020013532A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2019194647A1 (ko) 필터 정보 기반의 적응적 루프 필터링 방법, 그를 이용한 영상 부호화 및 복호화 방법
WO2015122550A1 (ko) 동영상 처리 방법 및 장치
WO2018101700A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18741655

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18741655

Country of ref document: EP

Kind code of ref document: A1