WO2020050684A1 - 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치 - Google Patents

인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
WO2020050684A1
WO2020050684A1 PCT/KR2019/011554 KR2019011554W WO2020050684A1 WO 2020050684 A1 WO2020050684 A1 WO 2020050684A1 KR 2019011554 W KR2019011554 W KR 2019011554W WO 2020050684 A1 WO2020050684 A1 WO 2020050684A1
Authority
WO
WIPO (PCT)
Prior art keywords
block
sample
current block
prediction
mode
Prior art date
Application number
PCT/KR2019/011554
Other languages
English (en)
French (fr)
Inventor
김기백
Original Assignee
김기백
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to MX2021002608A priority Critical patent/MX2021002608A/es
Priority to CN202310429492.5A priority patent/CN116389742A/zh
Application filed by 김기백 filed Critical 김기백
Priority to CN201980056309.3A priority patent/CN112806001A/zh
Priority to EP19858139.9A priority patent/EP3833021A4/en
Priority to SG11202102238SA priority patent/SG11202102238SA/en
Priority to AU2019336038A priority patent/AU2019336038A1/en
Priority to BR112021004024-2A priority patent/BR112021004024A2/pt
Priority to CA3111982A priority patent/CA3111982C/en
Priority to CN202110462138.3A priority patent/CN113225557B/zh
Priority to CN202310426208.9A priority patent/CN116405679A/zh
Priority to JP2021512701A priority patent/JP7448526B2/ja
Publication of WO2020050684A1 publication Critical patent/WO2020050684A1/ko
Priority to IL281221A priority patent/IL281221A/en
Priority to US17/192,733 priority patent/US11477439B2/en
Priority to PH12021550480A priority patent/PH12021550480A1/en
Priority to ZA2021/01569A priority patent/ZA202101569B/en
Priority to US17/932,636 priority patent/US20230026704A1/en
Priority to US17/932,632 priority patent/US20230024482A1/en
Priority to US17/932,585 priority patent/US20230026401A1/en
Priority to US17/932,627 priority patent/US20230024256A1/en
Priority to JP2024029883A priority patent/JP2024059905A/ja
Priority to JP2024029923A priority patent/JP2024059906A/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Definitions

  • the present invention relates to an image encoding / decoding method and apparatus.
  • the present invention seeks to improve encoding / decoding efficiency through adaptive block division.
  • the present invention seeks to improve encoding / decoding efficiency through matrix-based intra prediction.
  • the present invention provides a method and apparatus for determining a reference sample and matrix for matrix-based intra prediction.
  • the present invention provides a method and apparatus for downsampling and upsampling for matrix-based intra prediction.
  • a video signal processing method and apparatus determines an intra prediction mode of a current block, determines a reference sample for intra prediction of the current block, and determines a predetermined matrix based on the intra prediction mode, , Based on the reference sample and matrix, the current block may be predicted.
  • the step of determining the reference sample may include determining a peripheral region of the current block and downsampling the determined peripheral region.
  • the peripheral region is divided into a plurality of sample groups, the sample group is composed of one or more samples, and a representative value of the sample group is determined as the reference sample
  • the representative value may be any one of an average value, a minimum value, a maximum value, a mode value, and an intermediate value.
  • the matrix is determined by further considering the encoding information of the current block, and the encoding information is the size, shape, or angle or directionality of the intra prediction mode It may include.
  • the step of predicting the current block may include generating a prediction block by applying the matrix to the reference sample.
  • the step of predicting the current block may further include rearranging all or part of the prediction samples of the generated prediction block.
  • the predicting the current block comprises: interpolating the current block based on at least one of the prediction block or pre-restored samples adjacent to the current block. It may further include.
  • coding / decoding efficiency can be improved through block division of a tree structure.
  • encoding / decoding efficiency can be improved through downsampling or upsampling for matrix-based intra prediction.
  • FIG. 1 is a schematic block diagram of an encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a block diagram of a decoding apparatus according to an embodiment of the present invention.
  • FIG. 3 illustrates a block division type according to an embodiment to which the present invention is applied.
  • FIG. 4 is a diagram illustrating a tree structure based block partitioning method according to an embodiment to which the present invention is applied.
  • FIG. 5 is an embodiment of the present invention, showing a process of intra prediction for a current block based on a matrix.
  • FIG. 6 illustrates a method of determining a reference sample by downsampling a peripheral area as an embodiment to which the present invention is applied.
  • FIG. 7 is an embodiment to which the present invention is applied, and shows a downsampling method based on a weighted average.
  • FIG. 8 is an embodiment to which the present invention is applied, and shows an allocation method of a first prediction sample and an interpolation method for the remaining regions.
  • 9 is an embodiment to which the present invention is applied, and shows weighting for distance in an interpolation step.
  • FIG 10 is an embodiment to which the present invention is applied, and shows the sequence of interpolation steps.
  • a video signal processing method and apparatus determines an intra prediction mode of a current block, determines a reference sample for intra prediction of the current block, and determines a predetermined matrix based on the intra prediction mode, , Based on the reference sample and matrix, the current block may be predicted.
  • the step of determining the reference sample may include determining a peripheral region of the current block and downsampling the determined peripheral region.
  • the peripheral region is divided into a plurality of sample groups, the sample group is composed of one or more samples, and a representative value of the sample group is determined as the reference sample
  • the representative value may be any one of an average value, a minimum value, a maximum value, a mode value, and an intermediate value.
  • the matrix is determined by further considering the encoding information of the current block, and the encoding information is the size, shape, or angle or directionality of the intra prediction mode It may include.
  • the step of predicting the current block may include generating a prediction block by applying the matrix to the reference sample.
  • the step of predicting the current block may further include rearranging all or part of the prediction samples of the generated prediction block.
  • the predicting the current block comprises: interpolating the current block based on at least one of the prediction block or pre-restored samples adjacent to the current block. It may further include.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components.
  • first component may be referred to as a second component without departing from the scope of the present invention, and similarly, the second component may be referred to as a first component.
  • FIG. 1 is a schematic block diagram of an encoding apparatus according to an embodiment of the present invention.
  • the encoding apparatus 100 may include a picture splitter 110, a predictor 120 and 125, a transformer 130, a quantizer 135, a reordering unit 160, and an entropy encoder 165. ), An inverse quantization unit 140, an inverse transform unit 145, a filter unit 150, and a memory 155.
  • each component shown in FIG. 1 is independently illustrated to represent different characteristic functions in the image encoding apparatus, and may mean that each component is made of separate hardware. However, each component is included for the convenience of description as listed in each component, at least two of the components are combined to form a single component, or one component may be divided into a plurality of components to perform a function, The integrated and separated embodiments of each of these components are also included in the scope of the present invention without departing from the spirit of the present invention.
  • the components are not essential components for performing essential functions in the present invention, but may be optional components for improving performance.
  • the present invention can be implemented by including only components necessary for realizing the essence of the present invention, except for components used for performance improvement, and structures including only essential components excluding optional components used for performance improvement. Also included in the scope of the present invention.
  • the picture dividing unit 110 may divide the input picture into at least one block.
  • the block may mean a coding unit (CU), a prediction unit (PU), or a transformation unit (TU).
  • the division may be performed based on at least one of a quadtree, a binary tree, and a ternary tree.
  • Quad tree is a method of dividing an upper block into lower blocks having a width and a height of half of the upper block.
  • the binary tree divides the upper block into lower blocks, which are half of the upper block in either width or height.
  • the block may have a square as well as a non-square shape through the above-described binary tree-based partitioning of the upper block having a height of half.
  • a coding unit may be used as a unit for encoding or as a unit for decoding.
  • the predictors 120 and 125 may include an inter predictor 120 that performs inter prediction and an intra predictor 125 that performs intra prediction. It is determined whether to use inter prediction or intra prediction for a prediction unit, and specific information (eg, intra prediction mode, motion vector, reference picture, etc.) according to each prediction method may be determined. In this case, the processing unit in which the prediction is performed may differ from the processing unit in which the prediction method and the detailed content are determined. For example, the method of prediction and the prediction mode may be determined in the prediction unit, and the prediction may be performed in the transform unit. The residual value (residual block) between the generated prediction block and the original block may be input to the transformer 130.
  • specific information eg, intra prediction mode, motion vector, reference picture, etc.
  • prediction mode information, motion vector information, and the like used for prediction may be encoded by the entropy encoding unit 165 together with the residual value and transmitted to the decoding apparatus.
  • the original block may be encoded as it is and transmitted to the decoder without generating the prediction block through the prediction units 120 and 125.
  • the inter prediction unit 120 may predict the prediction unit based on the information of at least one of the previous picture or the next picture of the current picture. In some cases, the inter prediction unit 120 may predict the prediction unit based on the information of the partial region in which the current picture is encoded. You can also predict units.
  • the inter prediction unit 120 may include a reference picture interpolation unit, a motion prediction unit, and a motion compensation unit.
  • the reference picture interpolation unit may receive reference picture information from the memory 155 and generate pixel information of an integer pixel or less in the reference picture.
  • a DCT-based 8-tap interpolation filter having different filter coefficients may be used to generate pixel information of integer pixels or less in units of 1/4 pixels.
  • a DCT-based interpolation filter having different filter coefficients may be used to generate pixel information of an integer pixel or less in units of 1/8 pixels.
  • the motion prediction unit may perform motion prediction based on the reference picture interpolated by the reference picture interpolation unit.
  • various methods such as Full Search-based Block Matching Algorithm (FBMA), Three Step Search (TSS), and New Three-Step Search Algorithm (NTS) can be used.
  • the motion vector may have a motion vector value in units of 1/2 or 1/4 pixels based on the interpolated pixels.
  • the motion prediction unit may predict a current prediction unit by differently using a motion prediction method.
  • Various methods such as a skip method, a merge method, and an advanced motion vector prediction (AMVP) method may be used as a motion prediction method.
  • AMVP advanced motion vector prediction
  • the intra prediction unit 125 may generate a prediction unit based on reference pixel information around a current block, which is pixel information in a current picture. If the neighboring block of the current prediction unit is a block that has undergone inter prediction, and the reference pixel is a pixel that has undergone inter prediction, the reference pixel included in the block that has undergone inter prediction is a reference pixel of the block that has undergone intra prediction. It can be used as a substitute for information. That is, when the reference pixel is not available, the available reference pixel information may be replaced with at least one reference pixel among the available reference pixels.
  • the prediction mode may have a directional prediction mode that uses reference pixel information according to a prediction direction and a non-directional mode that does not use directional information when performing prediction.
  • the mode for predicting the luminance component and the mode for predicting the color difference component may be different, and the color difference component may be predicted using the intra prediction mode used for predicting the luminance component or the predicted / restored luminance component.
  • the intra prediction method may generate a prediction block after applying an adaptive intra smoothing (AIS) filter to a reference pixel according to the intra prediction mode.
  • AIS adaptive intra smoothing
  • the type of AIS filter applied to the reference pixel may be different.
  • the intra prediction mode of the current prediction unit may be predicted from the intra prediction mode of the prediction unit existing around the current prediction unit.
  • the prediction mode of the current prediction unit is predicted using the mode information predicted from the neighboring prediction unit, if the intra prediction mode of the current prediction unit and the neighboring prediction unit are the same, the current prediction unit and the neighboring prediction unit using predetermined flag information It is possible to transmit information that the intra prediction modes of are the same, and if the intra prediction modes of the current prediction unit and the neighboring prediction units are different from each other, entropy encoding may be performed to encode the intra prediction mode information of the current block.
  • a residual block including residual information which is a difference value between the prediction unit generated by the prediction units 120 and 125 and the original block, may be generated.
  • the generated residual block may be input to the converter 130.
  • the transform unit 130 may convert the residual block including the residual data using a transform type such as DCT, DST, or the like.
  • the transform type may be determined based on the intra prediction mode of the prediction unit used to generate the residual block.
  • the quantization unit 135 may quantize the values converted by the transformer 130 into the frequency domain.
  • the quantization coefficient may change depending on the block or the importance of the image.
  • the value calculated by the quantization unit 135 may be provided to the inverse quantization unit 140 and the reordering unit 160.
  • the rearrangement unit 160 may rearrange the coefficient values for the quantized residual block.
  • the reordering unit 160 may change the coefficient in the form of a 2D block into a 1D vector form through a coefficient scanning method. For example, the reordering unit 160 may scan from the DC coefficient to the coefficient of the high frequency region by using a predetermined scan type and change it into a one-dimensional vector form.
  • the entropy encoder 165 may perform entropy encoding based on the values calculated by the reordering unit 160. Entropy encoding may use various encoding methods, such as exponential Golomb, CAVLC (Context-Adaptive Variable Length Coding), and CABAC (Context-Adaptive Binary Arithmetic Coding).
  • the entropy encoding unit 165 includes residual coefficient information and block type information, prediction mode information, split unit information, prediction unit information and transmission unit information, and motion vectors of coding units from the reordering unit 160 and the prediction units 120 and 125.
  • Various information such as information, reference frame information, block interpolation information, and filtering information can be encoded.
  • the entropy encoder 165 may entropy encode a coefficient value of a coding unit input from the reordering unit 160.
  • the inverse quantizer 140 and the inverse transformer 145 inverse quantize the quantized values in the quantizer 135 and inversely transform the transformed values in the transformer 130.
  • the residual values generated by the inverse quantizer 140 and the inverse transformer 145 are reconstructed by being combined with prediction units predicted by the motion estimator, the motion compensator, and the intra predictor included in the predictors 120 and 125. You can create a Reconstructed Block.
  • the filter unit 150 may include at least one of a deblocking filter, an offset correction unit, and an adaptive loop filter (ALF).
  • a deblocking filter may include at least one of a deblocking filter, an offset correction unit, and an adaptive loop filter (ALF).
  • ALF adaptive loop filter
  • the deblocking filter may remove block distortion caused by boundary between blocks in the reconstructed picture.
  • it may be determined whether to apply a deblocking filter to a current block based on pixels included in a few columns or rows included in the block.
  • a strong filter or a weak filter may be applied according to the required deblocking filtering strength.
  • horizontal filtering and vertical filtering may be performed in parallel when performing vertical filtering and horizontal filtering.
  • the offset correction unit may correct an offset from the original image in units of pixels for the deblocking image.
  • the offset correction unit may correct an offset from the original image in units of pixels for the deblocking image. In order to perform offset correction for a specific picture, after dividing the pixels included in the image into a certain number of regions, determining the region to perform the offset and applying the offset to the region or offset by considering the edge information of each pixel You can use the method of applying.
  • Adaptive Loop Filtering may be performed based on a value obtained by comparing the filtered reconstructed image with the original image. After dividing the pixels included in the image into a predetermined group, one filter to be applied to the group may be determined to perform filtering differently for each group. For information related to whether to apply ALF, a luminance signal may be transmitted for each coding unit (CU), and the shape and filter coefficient of an ALF filter to be applied may vary according to each block. In addition, the same type (fixed form) of the ALF filter may be applied regardless of the characteristics of the block to be applied.
  • ALF Adaptive Loop Filtering
  • the memory 155 may store the reconstructed block or picture calculated by the filter unit 150, and the stored reconstructed block or picture may be provided to the predictors 120 and 125 when performing inter prediction.
  • FIG. 2 is a schematic block diagram of a decoding apparatus according to an embodiment of the present invention.
  • the decoding apparatus 200 includes an entropy decoding unit 210, a reordering unit 215, an inverse quantization unit 220, an inverse transform unit 225, a prediction unit 230, 235, and a filter unit 240.
  • Memory 245 may be included.
  • Each component shown in FIG. 2 is independently shown to represent different characteristic functions in the decoding apparatus, and may mean that each component is made of separate hardware. However, each component is included for the convenience of description to be listed as each component to form at least two components of each of the components combined into one component, or one component may be divided into a plurality of components to perform a function, such The integrated and separated embodiments of each component are also included in the scope of the present invention without departing from the spirit of the present invention.
  • the entropy decoder 210 may perform entropy decoding on the input bitstream. For example, for entropy decoding, various methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be applied.
  • various methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be applied.
  • the entropy decoder 210 may decode information related to intra prediction and inter prediction performed by the encoding apparatus.
  • the reordering unit 215 may reorder the entropy decoded bitstream by the entropy decoding unit 210. Coefficients expressed in the form of a one-dimensional vector may be reconstructed by reconstructing the coefficients in a two-dimensional block form.
  • the reordering unit 215 may receive information related to coefficient scanning performed by the encoding apparatus and perform reordering by performing a reverse scanning method based on the scanning order performed by the encoding apparatus.
  • the inverse quantization unit 220 may perform inverse quantization based on quantization parameters and coefficient values of the rearranged block.
  • the inverse transform unit 225 may inverse transform the inverse-quantized transform coefficient into a predetermined transform type.
  • the transform type is at least one of information about a prediction mode (inter / intra prediction), a block size / shape, an intra prediction mode, a component type (luminance / chrominance component), and a split type (QT, BT, TT, etc.). It can be determined based on.
  • the prediction units 230 and 235 may generate the prediction block based on the prediction block generation related information provided by the entropy decoder 210 and previously decoded blocks or picture information provided by the memory 245.
  • the predictors 230 and 235 may include a prediction unit determiner, an inter predictor, and an intra predictor.
  • the prediction unit discrimination unit receives various information such as prediction unit information input from the entropy decoding unit 210, intra prediction mode related information of the intra prediction method, and motion prediction related information of the inter prediction method, and is predicted by the current coding unit (CU). The units may be classified, and it may be determined whether the prediction unit performs inter prediction or intra prediction.
  • the inter prediction unit 230 may use information necessary for inter prediction of the current prediction unit provided by the encoding apparatus, based on information included in at least one of a previous picture or a subsequent picture of the current picture including the current prediction unit. Inter prediction may be performed on the current prediction unit. Alternatively, inter prediction may be performed based on information of some regions pre-restored in the current picture including the current prediction unit. To this end, some of the pre-restored regions may be added to the reference picture list.
  • a motion prediction method of a prediction unit included in a corresponding coding unit based on a coding unit is a skip mode, a merge mode, an AMVP mode, and a current picture reference mode It can be determined whether it is any of the methods.
  • the intra predictor 235 may generate a prediction block based on pixel information in the current picture.
  • intra prediction may be performed based on intra prediction mode information of the prediction unit provided by the encoding apparatus.
  • the intra predictor 235 may include an adaptive intra smoothing (AIS) filter, a reference pixel interpolator, and a DC filter.
  • the AIS filter is a part that performs filtering on the reference pixel of the current block, and can be applied by determining whether to apply the filter according to the prediction mode of the current prediction unit.
  • AIS filtering may be performed on the reference pixel of the current block by using the prediction mode of the prediction unit and the AIS filter information provided by the encoding apparatus. If the prediction mode of the current block is a mode that does not perform AIS filtering, the AIS filter may not be applied.
  • the reference pixel interpolator may generate a reference pixel having an integer value or less by interpolating the reference pixel.
  • the prediction mode of the current prediction unit is a prediction mode for generating a prediction block without interpolating the reference pixel
  • the reference pixel may not be interpolated.
  • the DC filter may generate the prediction block through filtering when the prediction mode of the current block is the DC mode.
  • the reconstructed block or picture may be provided to the filter unit 240.
  • the filter unit 240 may include a deblocking filter, an offset correction unit, and an ALF.
  • the deblocking filter of the decoding apparatus may receive the deblocking filter related information provided by the encoding apparatus, and perform the deblocking filtering on the corresponding block in the decoding apparatus.
  • the offset correction unit may perform offset correction on the reconstructed image based on the type of offset correction and offset value information applied to the image during encoding.
  • the ALF may be applied to a coding unit based on ALF application information, ALF coefficient information, and the like provided from the encoder. Such ALF information may be provided included in a specific parameter set.
  • the memory 245 may store the reconstructed picture or block to use as a reference picture or reference block, and provide the reconstructed picture to the output unit.
  • FIG. 3 illustrates a block division type according to an embodiment to which the present invention is applied.
  • blocks a to s may be obtained according to a division setting and a division method, and additional block shapes not shown may also be possible.
  • asymmetric partitioning may be allowed for tree-based partitioning.
  • blocks such as b and c may be possible, or blocks such as b to g may be possible.
  • the flag that allows asymmetric splitting is deactivated explicitly or implicitly depending on the sub / decoding setting, the candidate block obtainable may be b or c, and when the flag that allows asymmetric splitting is activated, the candidate block obtainable is b, It may be d, e (horizontal division in this example) or c, f, g (vertical division in this example).
  • the ratio of the length of the left: right or the top and the bottom of the asymmetric division is assumed on the assumption that the ratio is 1: 3 or 3: 1, but the present invention is not limited thereto, and candidate groups having other ratios (for example, 1: 2, 1) : 4, 2: 3, 2: 5, 3: 5, etc.) may be possible depending on encoding settings.
  • the following shows various examples of split information that occurs in binary tree splitting (a candidate group of 1: 1, 1: 3, and 3: 1 in this example).
  • a flag indicating a division type may be generated in addition to the flag indicating the division direction.
  • the division form may mean symmetrical or asymmetrical division.
  • a flag indicating a partition ratio may occur, and an index may be allocated according to a preset candidate group. If a 1: 3 or 3: 1 split ratio is supported as a candidate group, a split ratio may be selected through a 1-bit flag.
  • a flag indicating a split ratio may be generated in addition to a flag indicating whether to split or not, and a flag indicating a split direction.
  • a candidate group for the split ratio a candidate having a symmetric ratio of 1: 1 may be included.
  • the binary tree partition has the same configuration as the previous example (when the flag that allows asymmetric partitioning is activated), and the binary tree means a symmetric binary tree unless otherwise specified.
  • additional tree partitioning may be allowed for tree-based partitioning.
  • a ternary tree, a quad type tree, or an octa tree may be partitioned, through which n partition blocks (3, 4, 8 in this example) .n is an integer).
  • supported blocks in this example, when divided into a plurality of blocks
  • supported blocks in the case of a ternary tree, supported blocks may be h to m
  • supported blocks in the case of a quad type tree
  • supported blocks may be n to p
  • an octa tree supported blocks are supported.
  • the block may be q.
  • Whether to support the tree-based partitioning may be determined implicitly according to the sub / decoding setting, or related information may be explicitly generated. Also, it can be used alone or mixed with binary tree, quad tree split, etc. depending on the sub / decryption setting.
  • blocks such as b and c may be possible, and when a binary tree and a ternary tree are used in combination (in this example, the usage range of the binary tree and the usage range of the ternary tree are partially overlapped) Assuming the case) Blocks such as b, c, i, and l may be possible.
  • the candidate block obtainable may be b or c, and when activated, the obtainable candidate block is b, i or b, It can be h, i, j (horizontal division in this example) or c, l or c, k, l, m (vertical division in this example).
  • the length ratio of left: middle: right or top: middle: bottom of the ternary tree split is described on the assumption that the ratio is 2: 1: 1 or 1: 2: 1 or 1: 1: 2, but is not limited thereto. Other ratios may also be possible depending on encoding settings.
  • the following shows an example of split information generated in a ternary tree split (a candidate that is 1: 2: 1 in this example).
  • the flag indicating the type of division may be generated in addition to the flag indicating the division direction.
  • the division type may mean binary tree or ternary tree division.
  • adaptive sub / decoding settings can be applied according to the division method.
  • a partitioning method may be determined according to the type of block.
  • the coding block and the transform block may use quad tree splitting
  • the prediction block may use a quad tree and binary tree (or ternary tree) splitting scheme.
  • a partitioning method may be determined according to the size of a block. For example, some ranges between the maximum and minimum values of a block (for example, a ⁇ b to c ⁇ d. If the latter is a larger size), quad tree splitting, and some ranges (for example, e ⁇ In f to g ⁇ h), a binary tree (or ternary tree, etc.) may be split.
  • the range information according to the division method may be explicitly generated or may be determined implicitly, and the ranges are also possible when overlapping.
  • a partitioning scheme may be determined according to the shape of a block (or block before partitioning). For example, when a block has a square shape, a quad tree and a binary tree (or ternary tree, etc.) may be split. Alternatively, when the block shape is rectangular, division based on a binary tree (or ternary tree, etc.) may be possible.
  • the division setting may be determined according to the type of block.
  • a coding tree and a prediction block may use quad trees, and a transform block may use binary tree splitting.
  • a split allowable depth may be set to m
  • a split allowable depth may be set to n in a predictive block
  • a split allowable depth may be set to o in a transform block, and m, n, and o may not be the same or equal.
  • a division setting may be determined according to the size of a block.
  • a quad tree split is used for some ranges of blocks (eg, a ⁇ b to c ⁇ d), and some ranges (eg, e ⁇ f to g ⁇ h.
  • c ⁇ d is g It is possible to divide the binary tree in some extents (assuming it is greater than ⁇ h), and ternary tree divisions in some ranges (for example, i ⁇ j to k ⁇ l.In this example, g ⁇ h is greater than or equal to k ⁇ l). Can.
  • the range may include all ranges between the maximum and minimum values of the block, and the range may have settings that do not overlap with each other or may have settings that overlap.
  • the minimum value of some ranges may be the same as the maximum value of some ranges, or the minimum value of some ranges may be smaller than the maximum value of some ranges.
  • a partitioning scheme having a higher maximum value may have priority, or information on which partitioning scheme to use may be explicitly generated. That is, in the splitting scheme having a priority, whether to perform the splitting scheme having the next priority may be determined according to the splitting result, or which splitting scheme to use may be determined according to the splitting method selection information.
  • the division setting may be determined according to the shape of the block. For example, quad-tree splitting may be possible when a block has a square shape. Alternatively, the binary tree or the ternary tree may be split when the block has a rectangular shape.
  • a split setting may be determined according to sub / decoding information (eg, slice type, color component, encoding mode, etc.). For example, if the slice type is I, quad tree (or binary tree, ternary tree) partitioning is a partial range (for example, a ⁇ b to c ⁇ d), and P is a partial range (for example, e ⁇ f to g ⁇ h), and in case of B, it may be possible in some ranges (for example, i ⁇ j to k ⁇ l).
  • sub / decoding information eg, slice type, color component, encoding mode, etc.
  • the split allowable depth m of the quad tree (or binary tree, ternary tree split) split can be set to the split allowable depth n for P, and the split allowable depth o for B, m and n And o may or may not be the same.
  • Some slice types may have the same settings as other slices (eg, P and B slices).
  • a quad tree (or binary tree, ternary tree) division allowable depth may be set to m, and a color difference component may be set to n, and m and n may or may not be the same.
  • a range of quad tree (or binary tree, ternary tree) division for example, a ⁇ b to c ⁇ d
  • a color difference component, a quad tree (or binary tree, ternary) Tree The range of division (eg, e ⁇ f to g ⁇ h) may or may not be the same.
  • a quad tree (or binary tree, ternary tree) split allowable depth may be m, and in the case of Inter, n (assuming that n is greater than m in this example) may be equal to m and n. Or may not be the same.
  • the range of quad tree (or binary tree, ternary tree) splitting and when the encoding mode is Inter may or may not be the same. have.
  • information on whether to support adaptive split candidate group configuration according to the encoding / decoding information may be explicitly generated or may be determined implicitly.
  • a division method and a division setting may be determined according to a combination of a plurality of elements.
  • a division method and a division setting may be determined according to the type, size, shape, and sub / decoding information of a block.
  • elements involved in the partitioning scheme, setting, etc. may be determined implicitly or explicitly generated information to determine whether to allow the adaptive case as in the above example.
  • the segmentation depth of the segmentation setting refers to the number of spatial divisions based on the initial block (in this example, the segmentation depth of the initial block is 0), and can be divided into smaller blocks as the segmentation depth increases. This may have different depth-related settings according to the division method. For example, among the methods of performing tree-based partitioning, one common depth can be used for the splitting depth of the binary tree and the splitting depth of the ternary tree, and the splitting depth of the quadtree and the splitting depth of the binary tree are different depths. You can use individual depths depending on the type of tree, such as using.
  • the splitting depth 0 may be set at the splitting starting position of the tree (block before performing splitting in this example).
  • the division depth may be calculated based on the location at which division starts, not based on the division range (maximum value in this example) of each tree.
  • FIG. 4 is a diagram illustrating a tree structure based block partitioning method according to an embodiment to which the present invention is applied.
  • the thick solid line represents the basic coding block
  • the thick dotted line is the quad tree partition boundary
  • the double solid line is the symmetric binary tree partition boundary
  • the solid line is the ternary tree partition boundary
  • the thin dotted line is the asymmetric binary tree partition boundary. It means the boundary divided according to each division method except for the thick solid line.
  • the segmentation settings eg, segmentation type, segmentation information, segmentation information configuration order, etc. described below are not limited to the case, and various modifications may be possible.
  • This example is a case where a single tree type split (quad tree in this example) is supported, and the size and shape of a block obtainable through one block split setting such as a maximum coding block, a minimum coding block, and a split depth may be determined.
  • Can. if there is only one block that can be obtained according to the partition (2 horizontal and vertical partitions each), whether the partition information required for one partitioning operation (based on the block 4M x 4N before partitioning. It is a flag (in this example, if 0, division x. If 1, division o), candidates that can be obtained may be 4M x 4N and 2M x 2N.
  • This example is a case in which multi-tree division (quad tree and binary tree in this example) is supported, and a size and shape of a block obtainable through a plurality of block division settings may be determined.
  • the maximum coded block is 64 x 64
  • the minimum coded block is 4 on one side
  • the maximum split depth is 4.
  • the division information required for one division operation is a flag indicating whether to divide or not, and the type of division.
  • a flag indicating a, a flag indicating a split type, a flag indicating a splitting direction, and candidates obtainable are 4M x 4N, 4M x 2N, 2M x 4N, 4M x N / 4M x 3N, 4M x 3N / 4M x N, and M x It may be 4N / 3M x 4N, 3M x 4N / M x 4N.
  • split information may be divided into the following cases and configured. That is, when blocks supported according to each division setting are obtainable by a plurality of division methods, classification information may be generated by classifying the following processes.
  • a means a flag indicating whether to split the quad tree, and if 1, performs quad tree split (QT). If the flag is 0, b, which is a flag indicating whether to split the binary tree, is checked. If b is 0, no further partitioning is performed in the corresponding block (No Split), and if 1, binary tree partitioning is performed.
  • c is a flag indicating the dividing direction
  • 0 means horizontal split (hor)
  • 1 means vertical split (ver)
  • d is a flag indicating the split type
  • 0 is symmetrical split (SBT.Symmetric Binary Tree)
  • 1 is asymmetric It stands for ABT (Asymmetric Binary Tree).
  • This example is a case where multi-tree partitioning (quad tree, binary tree, ternary tree in this example) is supported, and the size and shape of a block obtainable through a plurality of block partitioning settings may be determined.
  • multi-tree partitioning quad tree, binary tree, ternary tree in this example
  • the maximum coded block is 64 x 64
  • the minimum coded block is 4 on one side
  • the maximum split depth is 4.
  • the division information required for one division operation is a flag indicating whether to divide, a flag indicating a division type, and a division direction It is a flag representing and candidates obtainable may be 4M x 4N, 4M x 2N, 2M x 4N, 4M x N / 4M x 2N / 4M x N, M x 4N / 2M x 4N / M x 4N.
  • split information may be divided into the following cases and configured.
  • a is a flag indicating whether to split a quad tree, and if 1, performs a quad tree split. If the flag is 0, b, which is a flag indicating whether to split the binary tree or ternary tree, is checked. If b is 0, no further partitioning is performed in the corresponding block, and if 1, binary tree or ternary tree partitioning is performed.
  • c is a flag indicating a splitting direction, where 0 means horizontal splitting, 1 means vertical splitting, d is 0 indicating a split type, 0 means binary tree splitting (BT), and 1 means ternary tree splitting (TT). .
  • A13 and A14 are the cases in which the split information in (2) is generated because the split is not performed in the quad tree in the blocks (A13 and A14) before splitting, but is split into a ternary tree.
  • This example is a case where multi-tree partitioning (quad tree, binary tree, ternary tree in this example) is supported, and the size and shape of a block obtainable through a plurality of block partitioning settings may be determined.
  • multi-tree partitioning quad tree, binary tree, ternary tree in this example
  • the maximum coded block is 64 x 64
  • the minimum coded block is 4 on one side
  • the maximum split depth is 4.
  • a flag indicating whether to divide into division information required for one division operation a flag indicating a division type, and a division type A flag indicating the dividing direction, and candidates obtainable are 4M x 4N, 4M x 2N, 2M x 4N, 4M x N / 4M x 3N, 4M x 3N / 4M x N, M x 4N / 3M x 4N, It may be 3M x 4N / M x 4N, 4M x N / 4M x 2N / 4M x N, M x 4N / 2M x 4N / M x 4N.
  • split information may be classified into the following cases and configured.
  • a means a flag indicating whether to split a quad tree, and if 1, splits a quad tree. If the flag is 0, b, which is a flag indicating whether to split the binary tree, is checked. If b is 0, no further partitioning is performed in the corresponding block, and if 1, binary tree or ternary tree partitioning is performed.
  • c is a flag indicating a splitting direction, where 0 means horizontal splitting, 1 means vertical splitting, d is 0 a flag indicating splitting type, 0 means ternary splitting, and 1 means binary tree splitting.
  • d is 1, e, which is a flag for the division type, is checked, and when e is 0, symmetric division is performed, and when 1, asymmetric division is performed.
  • e is 1 day, check the information about the detailed division ratio in the asymmetric division, which is the same as in the previous example.
  • the A20 block corresponds to a case in which split information in (1) is generated because quad-tree splitting is possible in blocks A16 to A19 before splitting.
  • FIG. 5 is an embodiment of the present invention, showing a process of performing intra prediction on a current block based on a matrix.
  • an intra prediction mode for intra prediction of a current block may be determined (S500).
  • the encoding / decoding apparatus may determine an intra prediction mode when performing intra prediction of a current block.
  • the current block may be one of a coding block (CU), a prediction block (PU), a transform block (TU), or a subblock thereof.
  • the intra prediction mode may be determined based on signaled information.
  • the information may specify any one of the N intra prediction modes pre-defined in the encoding / decoding device.
  • the pre-defined intra prediction mode means the entire intra prediction mode in which the current block is available, and N may be a natural number (e.g, 67, 35, 11) less than or equal to 67 and greater than or equal to 11.
  • the N value may be determined based on the size of the current block. For example, if the current block is smaller than 8x8, N is determined to be 35, and otherwise, N can be determined to be either 19 or 11.
  • the intra prediction mode may be determined as a fixed mode or index pre-promised in the encoding / decoding device.
  • the fixed mode may be at least one of a planar mode (index 0), a DC mode (index 1), a horizontal mode (index 18), a vertical mode (index 50), and a diagonal mode (index 2, 34, 66).
  • the index corresponds to a case where there are 67 pre-defined intra prediction modes, and indexes for each mode may be differently assigned according to the N value.
  • the intra prediction mode may be variably determined based on encoding information.
  • the encoded information may include not only information encoded and signaled by the encoding device, but also information derived based on information signaled by the decoding device.
  • the encoding information may be related to at least one of a current block or a neighboring block.
  • the neighboring blocks include spatial and / or temporal neighboring blocks of the current block, and the spatial neighboring blocks may mean blocks adjacent to at least one of the left, top, left, top, bottom, or right top of the current block.
  • the coded information includes block size / shape, block availability, split type, split count, component type, prediction mode, intra prediction mode information, inter mode, motion information, transform type, transform skip mode, and non-zero residual coefficient Information, scan order, color format, in-loop filter information, and the like.
  • the block size may be expressed as either width or height, minimum / maximum values of width and height, sum of width and height, and the number of samples belonging to the block.
  • the availability of the block may be determined in consideration of a block location, a range of parallel processing regions, and a decoding order.
  • the prediction mode may mean information indicating an intra mode or an inter mode.
  • the information on the intra prediction mode includes whether the intra prediction mode is a non-directional mode, whether the intra prediction mode is a vertical / horizontal mode, the directionality of the intra prediction mode, the number of intra prediction modes predefined in the encoding / decoding device, and the like.
  • the inter mode may mean information indicating a merge / skip mode, an AMVP mode, or a current picture reference mode.
  • the current picture reference mode refers to a method of predicting a current block using a pre-restored area of the current picture.
  • the current picture may be a picture to which the current block belongs.
  • the current picture may be added to a reference picture list for inter prediction, and the current picture may be arranged after a short-term reference picture or a long-term reference picture in the reference picture list.
  • the motion information may include a prediction direction flag, a motion vector, and a reference picture index.
  • the intra prediction mode may be derived based on an MPM list and an MPM index.
  • the MPM list includes a plurality of MPMs, and the MPM may be determined based on the intra / prediction mode of spatial / temporal neighboring blocks of the current block.
  • the number of MPMs is x, and x may be an integer of 3, 4, 5, 6, or more.
  • the MPM list may include at least one of an intra prediction mode modeA, (modeA-n), (modeA + n) or default mode of the neighboring block.
  • the n value may be an integer of 1, 2, 3, 4 or more.
  • the neighboring block may mean a block adjacent to the left and / or top of the current block.
  • the default mode may be at least one of a planar mode, a DC mode, or a predetermined directional mode.
  • the predetermined directional mode may include at least one of a horizontal mode (modeV), a vertical mode (modeH), (modeV-k), (modeV + k), (modeH-k), or (modeH + k).
  • the MPM index may specify, among the MPMs in the MPM list, the same MPM as the intra prediction mode of the current block. That is, the MPM specified by the MPM index may be set as the intra prediction mode of the current block.
  • the intra prediction mode of the current block may be determined by selectively using any one of the above-described embodiments 1 to 4, or the intra prediction mode of the current block may be determined based on a combination of at least two of the embodiments 1 to 4.
  • a predetermined flag may be used for the selection, and the flag may be encoded and signaled in an encoding device.
  • a reference sample for intra prediction of a current block may be determined (S510).
  • the reference sample can be derived from the periphery of the current block.
  • the peripheral area of the current block may include at least one of left, right, top, bottom left, top left, bottom right, or top right of the current block.
  • the peripheral area may include one or more sample lines.
  • the number of sample lines belonging to the peripheral area is k, where k may be a natural number of 1, 2, 3, 4, or more.
  • the k value may be a fixed value pre-promised in the encoding / decoding device, or may be variably determined based on the above-described encoding information.
  • the current block is the first size (eg, 4x4, 4x8, 8x4)
  • the surrounding area is composed of one sample line
  • the current block is the second size (eg, 8x8, 16x16, etc.)
  • the peripheral area may consist of two sample lines.
  • the sample line may be determined in a vertical direction or a horizontal direction according to the position of the surrounding area.
  • the sample line may be in contact with the current block, or may be separated by a predetermined distance in a vertical and / or horizontal direction based on the current block.
  • the plurality of sample lines may be continuously positioned in a vertical and / or horizontal direction based on the current block, or may be positioned apart from each other by a predetermined distance.
  • the first and second sample lines are respectively called from the lowest sample line of the two lines upward.
  • the first sample line and the second sample line may be in contact with each other or may be located at a predetermined distance apart.
  • the predetermined distance may be expressed by i line lengths (ie, width or height).
  • i may be 0, 1, 2, 3 or more natural numbers.
  • the first, second, and third sample lines are respectively referred to upward from the lowest sample line among the plurality of sample lines.
  • the first sample line and the second sample line may contact each other, and the second sample line and the third sample line may contact each other.
  • the first to third sample lines may be positioned at a predetermined distance described above.
  • the interval d1 between the first and second sample lines and the interval d2 between the second and third sample lines may have the same interval.
  • d1 may be set to be larger than d2, and d1 may be set to be smaller than d2.
  • the four sample lines may be determined in the same manner as the three sample lines.
  • the present embodiment can be equally applied to the sample line located on the left side as well as the sample line located on the top, and detailed description will be omitted.
  • the reference sample may be derived using all or part of the samples belonging to the surrounding area.
  • Some samples of the surrounding area may be samples at positions pre-promised by the encoding / decoding device.
  • the pre-promised location may include at least one of a leftmost sample, a rightmost sample, or a center sample of the top sample line.
  • the pre-promised location may include at least one of a top sample, a bottom sample, or a center sample of the left sample line.
  • the pre-promised location may include at least one of the even-numbered samples of the top and / or left sample line, or at least one of the odd-numbered samples.
  • the pre-promised location may include a sample having an x-coordinate of j times among samples of the upper sample line, or a sample having a y-coordinate of j times among samples of the left sample line.
  • j may be a natural number of 2, 3, 4 or more.
  • Embodiment 2 Some samples of the surrounding area may be variably determined based on encoding information.
  • the encoding information is as described above, and detailed description will be omitted.
  • Either one of Examples 1 or 2 may be used selectively, and some samples may be specified based on the combination of Examples 1 and 2. At this time, as described above, the interval between some samples may be set evenly, but is not limited thereto, and the interval between some samples may be set to be non-uniform.
  • the number of some of the samples may be 1, 2, 3, 4 or more pre-defined in the encoding / decoding device. Also, the number of some samples may be defined differently for the left peripheral area and the upper peripheral area of the current block, respectively. For example, when the width of the current block is greater than the height, the number of some samples belonging to the upper peripheral region (numSamA) may be greater than the number of some samples belonging to the left peripheral region (numSamL). Conversely, if the width of the current block is less than the height, numSamA may be less than numSamL. Alternatively, the number of some samples may be variably determined based on the encoding information described above.
  • the samples of the surrounding area may be predictive samples or reconstructed samples.
  • the prediction sample may be obtained through intra prediction or inter prediction.
  • the reconstruction sample may be a reconstruction sample before the in-loop filter is applied, or may be a reconstruction sample to which the in-loop filter is applied.
  • the reference sample may be directly derived as a sample in the peripheral region (CASE 1) or may be derived by downsampling a sample in the peripheral region (CASE 2). Any one of CASE 1 and 2 may be selectively used. The selection may be performed based on the encoding information described above. For example, if the size of the current block is smaller than a predetermined threshold, a reference sample is derived based on CASE 1, otherwise, a reference sample can be derived based on CASE 2.
  • the size may be expressed as one of the width, height, maximum / minimum value of width and height, ratio of width and height, or product of width and height.
  • the reference sample is derived as a sample in the peripheral area, otherwise, the reference sample can be derived by downsampling a sample in the peripheral area.
  • the downsampling method will be described in detail with reference to FIGS. 6 and 7.
  • a matrix for matrix-based intra prediction may be determined (S520).
  • the matrix may be determined based on at least one of the intra prediction mode determined in S500 or the size of the current block. Alternatively, the matrix may be limited to be determined considering only the intra prediction mode of the current block, or only considering the size of the current block.
  • the size may be expressed as either width or height, minimum / maximum values of width and height, sum of width and height, and the number of samples belonging to the current block.
  • the present invention is not limited thereto, and the matrix may be determined by further considering encoding information about a current block.
  • the encoding information is as described above, and detailed description will be omitted.
  • the matrix pre-promised in the encoding / decoding device may be grouped into a plurality of matrix groups.
  • the plurality of matrix groups include a first matrix group, a second matrix group,... , Mth matrix group.
  • m may be 2, 3, 4, 5 or more natural numbers.
  • the current block can selectively use any one of a plurality of matrix groups. For example, when the size of the current block is 4x4, the first matrix group is used, and when the size of the current block is 8x4, 4x8, and 8x8, the second matrix group is used, and in other cases, the third matrix group is used.
  • Matrix groups can be used.
  • the matrix group selected based on the size of the current block may include one or more matrix candidates. Any one of the plurality of matrix candidates may be determined as the matrix of the current block. The determination may be performed based on the encoding information (e.g., intra prediction mode) of the current block described above.
  • the number of pre-promised matrices may be the same as the number of pre-defined intra prediction modes described above. Also, the number of pre-promised matrices may be less than the number of pre-defined intra prediction modes. In this case, a plurality of intra prediction modes may be matched to one matrix. For example, one matrix can be matched with two intra prediction modes. In this case, the number of pre-promised matrices may have a value 1/2 times the number of pre-defined intra prediction modes. However, the present invention is not limited thereto, and the number of intra prediction modes matching one matrix may be 3, 4, 5, 6 or more.
  • the matching may be determined in consideration of directionality and / or symmetry of the intra prediction mode.
  • the pre-defined intra prediction mode may include a directional mode having a predetermined angle.
  • the directional mode may be divided into a first mode group having horizontal directionality and a second mode group having vertical directionality. Assuming that the number of directional modes is 65, the first mode group may be configured as a mode belonging to between index 2 and index 34, and the second mode group may be configured as a mode belonging to between index 34 and index 66. have.
  • the encoding / decoding device may define only the matrix for the first mode group, and the second mode group may use the same matrix defined for the first mode group.
  • the encoding / decoding apparatus may define only the matrix for the second mode group, and the first mode group may use the same matrix defined for the second mode group.
  • the number of pre-promised matrices may have a value 1/2 times the number of pre-defined intra prediction modes.
  • the number of pre-promised matrices may have a value of 1 / x times the number of pre-defined intra prediction modes.
  • x may be 3,4 or more.
  • the symmetry may include symmetry of the prediction angle between a mode having a vertical direction and a mode having a horizontal direction, based on an intra prediction mode having an angle of -45 °.
  • the intra prediction mode having directionality has a prediction angle (PredAngle) according to each directionality.
  • the mode having the vertical direction based on the intra prediction mode where the angle is -45 °, includes those modes and modes having an angle of -45 ° ⁇ (PredAngle) ⁇ 45 ° in the x-axis direction from the corresponding mode. can do.
  • the mode having the horizontal directionality based on the intra prediction mode in which the angle is -45 °, except for the corresponding mode, modes having an angle of -45 ° ⁇ (PredAngle) ⁇ 45 ° in the y-axis direction from the corresponding mode It can contain.
  • a current block may be predicted based on a reference sample and a matrix (S530).
  • the encoding / decoding device may predict the current block based on the reference sample and the matrix.
  • the predicting the current block may include obtaining a predictive sample (hereinafter referred to as a first predictive sample) of a DS block by applying the matrix to the reference sample.
  • the DS block may mean a current block or a downsampled current block. That is, the DS block may have the same size as the current block, or a size that is 1/2, 1/4, 1/8, or 1/16 of the size (at least one of width or height) of the current block. For example, if the current block is a 4x4, 4x8, or 8x4 block, the DS block may be a 4x4 block. Alternatively, if the current block is an 8x8, 8x16 or 16x8 block, the DS block may be a 4x4 or 8x8 block.
  • the DS block may be an 8x8 or 16x16 block.
  • the DS block is not limited to a square block, and may be a non-square block.
  • the DS block may be limited to a square block.
  • the application of the matrix may include multiplying the reference sample by a weight obtained from the matrix.
  • the obtaining of the first prediction sample may include at least one of adding an offset value or filtering.
  • the obtaining of the first prediction sample may further include rearranging the first prediction sample.
  • the rearrangement may be performed only when a plurality of intra prediction modes match one matrix.
  • the rearrangement may be performed only when the intra prediction mode of the current block belongs to the first mode group having horizontal directionality. For example, if the intra prediction mode of the current block belongs to the first mode group having horizontal directionality, rearrangement is performed on the first prediction sample of the DS block, and the intra prediction mode of the current block has vertical directionality. When belonging to the 2 mode group, rearrangement of the first prediction sample of the DS block may not be performed.
  • the rearrangement may be performed only when the intra prediction mode of the current block belongs to the second mode group having vertical directionality. For example, if the intra prediction mode of the current block belongs to the first mode group having horizontal directionality, the rear prediction mode of the current block does not perform rearrangement, and the intra prediction mode of the current block has vertical directionality. When belonging to the second mode group, rearrangement may be performed on the first prediction sample of the DS block.
  • the rearrangement may be performed as shown in Equation 1 below.
  • x may mean an x-axis coordinate value
  • y may mean a y-axis coordinate value. That is, the rearrangement may refer to a process of assigning a first prediction sample of (x, y) coordinates to (y, x) coordinates.
  • the rearrangement according to the present invention may mean a process in which the DS block composed of the first prediction sample rotates at a predetermined angle.
  • the predetermined angle may mean 90 degrees or 180 degrees in the clockwise direction or 90 degrees or 180 degrees in the counterclockwise direction.
  • the step of predicting the current block may further include obtaining a second prediction sample by performing upsampling based on at least one of a pre-restored sample or the first prediction sample adjacent to the current block.
  • whether to perform the upsampling or at least one of the upsampling methods may be determined based on encoding information of a current block. For example, whether to perform the upsampling or at least one of the upsampling methods may be determined based on the size of the DS block composed of the first prediction sample and the size of the current block.
  • the block size may be expressed as either a width or a height, a minimum / maximum value of the width and height, a sum of the width and height, and the number of samples belonging to the block.
  • Whether to perform the upsampling may be determined to be performed only when the size of the DS block composed of the first prediction sample is smaller than the size of the current block.
  • the upsampling method may include allocating the first prediction sample to a predetermined location in the current block using a ratio of the size of the DS block composed of the first prediction sample and the size of the current block, and the current block And interpolating the rest of my area.
  • the remaining area may mean an area excluding the area to which the first prediction sample is allocated in the current block.
  • FIG. 6 illustrates a method of determining a reference sample by downsampling a peripheral area as an embodiment to which the present invention is applied.
  • FIG. 6- (a) shows a case in which surrounding regions for intra prediction are located on the left and top sides of a current block.
  • the sample line located on the left side of the current block is in contact with the current block and is composed of one sample line in the vertical direction.
  • the sample line located at the top of the current block is in contact with the current block and consists of one sample line in the horizontal direction.
  • the reference sample above A downsampled area formed by downsampling the peripheral area of the current block may be included.
  • the down-sampled region may be derived as an average value, a maximum value, a minimum value, a mode value, or a filtered value of all or some samples belonging to the peripheral region.
  • the down-sampled region may be formed by assigning an average value of N samples different from each other to a sample of the down-sampled region.
  • the different N samples may be continuously arranged samples, or may be spaced apart from each other at regular intervals.
  • the predetermined interval is one or more sample size intervals. When the intervals are plural, the intervals may be uniform or non-uniform. (Here, N is 2 or more, and the total number of samples belonging to the peripheral area is less than or equal to '.)
  • the set of N different samples will be referred to as a sample group. At this time, the first sample group and the second sample group may or may not overlap.
  • N is 2, two sample groups do not overlap with each other, and the average value of two samples belonging to each sample group is assigned to one sample in the downsampled area, and downsampling is performed. Shows that.
  • the first sample group may be composed of three consecutive samples (S1, S2, and S3), and an average value of three samples belonging to the first sample group may be allocated to the sample DS1 of the downsampled region.
  • a second sample group may be composed of three consecutive samples S2, S3, and S4, and an average value of three samples belonging to the second sample group may be assigned to the sample DS2 of the downsampled region.
  • a minimum value or a maximum value among two samples S1 and S2 belonging to the first sample group may be determined and assigned to the sample DS1 of the downsampled region.
  • a minimum value or a maximum value among two samples S3 and S4 belonging to the second sample group may be determined and assigned to the sample DS2 of the downsampled region. This can be used in the same way when the first / second sample group is composed of three samples.
  • a sample at a pre-defined position among a plurality of samples belonging to the first sample group is assigned to the sample DS1 of the downsampled area, and a group of the plurality of samples belonging to the second sample group -A sample at a defined location can be assigned to the sample DS2 in the downsampled region.
  • the pre-defined position means a fixed position pre-promised in the encoding / decoding device, and may be one of the leftmost, rightmost, or central positions, for example. Even in the left peripheral region, samples of pre-defined positions among a plurality of samples belonging to each sample group may be allocated to samples of the downsampled region, respectively. At this time, the pre-defined position may be any one of the top, bottom, or center position.
  • FIG. 7 is an embodiment to which the present invention is applied, and shows a downsampling method based on a weighted average.
  • the average value is (Hereinafter referred to as the first average equation), or (Hereinafter, the second average equation).
  • FIGS. 7- (a) is a case where the sample group described above is composed of three samples.
  • the weight applied to the three samples may be determined in a ratio of 1: 2: 1.
  • the weight may be adjusted in a ratio of 1: 1: 4: 1: 1.
  • the weight is 1: 2: 1: 2: 2: 1 or 1: 2: 2 in the Z direction with the upper left as a starting point. : 1: 2: 1.
  • FIGS. 7- (a) and (c) show weights applied to the upper peripheral area, the same may be applied to the left peripheral area.
  • the average value may include a result value obtained by applying a predetermined operation to a plurality of average values calculated by the first average formula or the second average formula.
  • the predetermined operation may be the first average expression or the second average expression described above. For example, if three samples (ie, first to third samples) belong to a sample group, the average value between the first sample and the second sample (first value), and the average value between the second sample and the third sample ( Each of the second values) can be calculated.
  • the average value may be derived as an average value between the calculated first and second values.
  • the above-described downsampling method may be applied only to the upper peripheral region or, conversely, to the left peripheral region only.
  • the downsampling method according to FIG. 6 (hereinafter referred to as the first method) is applied to either the upper or left peripheral area
  • the downsampling method according to FIG. 7 (hereinafter referred to as the second method) is the upper or left side. It can be applied to the other of the surrounding areas.
  • At least one of the first method and the second method may be selectively used in consideration of the size / shape of the current block. For example, if the width of the current block is greater than a predetermined threshold, the first method may be applied to an area around the top of the current block, otherwise, the second method may be applied. Downsampling may be performed in the same manner in the current block height. Alternatively, when the current block is in the non-direction, the first method may be applied to one of the upper or left peripheral areas, and the second method may be applied to the other. At this time, when the width of the current block is greater than the height, the first method may be applied to the upper peripheral region and the second method to the left peripheral region.
  • the second method may be applied to the upper peripheral region and the first method to the left peripheral region.
  • the same downsampling method may be applied to the upper and left peripheral regions, where the downsampling method may be limited to the first method.
  • FIG. 8 is an embodiment to which the present invention is applied, and shows an allocation method of a first prediction sample and an interpolation method for the remaining regions.
  • a prediction sample of a DS block may be assigned to a prediction sample of a predetermined position in the current block.
  • the predetermined position may be determined in consideration of the size ratio between the current block and the DS block.
  • a correspondence relationship between a DS block and a prediction block between a current block may be defined as Equation 2 below.
  • r means a size ratio between the current block and the DS block
  • x, y are the x-axis and y-axis coordinates of the first prediction sample in the DS block, respectively.
  • the first prediction_sample_curBLK may mean the location of the first prediction sample in the current block
  • the first_prediction_sample_dsBLK may mean the location of the first prediction sample in the DS block.
  • an interpolation target sample is the first prediction sample allocated to the current block or the It may be derived using at least one of the pre-restored samples adjacent to the current block (hereinafter, interpolated reference samples).
  • the interpolation reference sample may further include a prediction sample (ie, a previous interpolation target sample) generated through interpolation before the current interpolation target sample.
  • the location and range of the pre-restored sample adjacent to the current block are the same as the reference sample described above, and thus detailed description is omitted.
  • the interpolation reference sample may be composed of a plurality of first prediction samples, or may be composed of at least one first prediction sample and at least one pre-restored surrounding sample.
  • the pre-restored peripheral sample any one of samples having the same x coordinate or y coordinate as the interpolation target sample may be selectively used, and a plurality of samples having the same x coordinate or y coordinate equal to the interpolation target sample may be identical. Samples may be used. The selection may be performed based on the position of the sample to be interpolated.
  • the pre-restored surrounding sample may include only the sample having the same x-coordinate as the interpolation target sample.
  • the pre-restored neighbor sample may include only the sample having the same y coordinate as the interpolation target sample.
  • the pre-restored peripheral sample may include a plurality of samples located in the same horizontal and vertical lines as the interpolation target sample.
  • the interpolation target sample may be derived as a representative value of a plurality of interpolation reference samples, where the representative value may include at least one of an average value, a minimum value, a maximum value, a mode value, or an intermediate value.
  • the average value is (Hereinafter referred to as the first average equation), or (Hereinafter, the second average equation).
  • the weight according to the second average equation may be determined based on the relative / absolute distance between the interpolation target sample and the interpolation reference sample, which will be described in detail with reference to FIG. 9.
  • 9 is an embodiment to which the present invention is applied, and shows weighting for distance in an interpolation step.
  • the weight according to the present invention may include a weight determined based on a distance from an interpolation target sample to an interpolation reference sample.
  • the first interpolation reference sample 911 and the second interpolation reference sample 912 from the first interpolation target sample 910 Since the ratio of each distance of is 3: 1, the weight applied to the first interpolation reference sample 911 and the second interpolation reference sample may be 1: 3.
  • the ratio of the distance of each of the first interpolation reference sample 921 and the second interpolation reference sample 922 from the second interpolation target sample 920 is 1: 1.
  • the ratio of weights applied to the first and second interpolation reference blocks 921 and 922 may be 1: 1.
  • the interpolation filter according to the present invention may have directionality.
  • the directionality may include directions such as vertical, horizontal, zigzag, and diagonal.
  • the interpolation step may be performed based on a predetermined priority order.
  • the priority order may be either interpolating in the vertical direction and then interpolating in the horizontal direction (first order) or interpolating in the horizontal direction and then interpolating in the vertical direction (second order).
  • interpolation third order may be performed in parallel with the vertical direction and the horizontal direction.
  • the current block may be interpolated using only one of the first to third order, or may be interpolated using at least two combinations of the first to third order.
  • the interpolation order will be described in detail with reference to FIG. 10.
  • FIG 10 is an embodiment to which the present invention is applied, and shows the sequence of interpolation steps.
  • a vertical line to which the first prediction sample belongs may be interpolated first, and a horizontal line may be interpolated based on the interpolated line and the interpolation reference sample to the left of the current block.
  • a horizontal line to which the first prediction block belongs may be interpolated first, and a vertical line may be interpolated based on the interpolated line and the interpolation reference sample at the top of the current block.
  • one interpolation target sample may have both a first interpolation value with a vertical line and a second interpolation value with a horizontal line.
  • a representative value between the first interpolation value and the second interpolation value may be assigned to the interpolation target sample.
  • the representative value may be derived as an average value, a minimum value, a maximum value, a mode value, or an intermediate value.
  • the interpolation order may be a pre-promised order in the encoding / decoding device, or may be selectively determined based on encoding information of the current block.
  • the encoding information is as described above, and detailed description is omitted herein.
  • the order can be determined based on the block size.
  • the block size may be expressed as either width or height, minimum / maximum values of width and height, sum of width and height, and the number of samples belonging to the block.
  • the first interpolation may be performed, otherwise, the second interpolation may be performed.
  • the second interpolation may be performed, otherwise, the first interpolation may be performed.
  • the threshold may be a natural number of 8, 16, 32 or more.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명에 따른 비디오 신호 처리 방법 및 장치는, 현재 블록의 인트라 예측 모드를 결정하고, 상기 현재 블록의 인트라 예측을 위한 참조 샘플을 결정하며, 상기 인트라 예측 모드를 기반으로, 소정의 매트릭스를 결정하고, 상기 참조 샘플 및 매트릭스를 기반으로, 상기 현재 블록을 예측할 수 있다.

Description

인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치
본 발명은 영상 부호화/복호화 방법 및 장치에 관한 것이다.
인터넷과 휴대 단말의 보급과 정보 통신 기술의 발전에 따라 멀티미디어 데이터에 대한 이용이 급증하고 있다. 따라서, 각종 시스템에서 영상 예측을 통해 다양한 서비스나 작업을 수행하기 위하여 영상 처리 시스템의 성능 및 효율 개선에 대한 필요성이 상당히 증가하고 있으나, 이러한 분위기에 호응할 수 있는 연구 개발 결과가 미흡한 실정이다.
이와 같이, 종래 기술의 영상 부호화 복호화 방법 및 장치에서는 영상 처리 특히 영상 부호화 또는 영상 복호화에 대한 성능 개선이 요구되고 있는 실정이다.
본 발명은, 적응적인 블록 분할을 통해서 부호화/복호화 효율을 향상시키고자 한다.
본 발명은, 매트릭스 기반 인트라 예측을 통해서 부호화/복호화 효율을 향상시키고자 한다.
본 발명은, 매트릭스 기반 인트라 예측을 위한 참조 샘플 및 매트릭스를 결정하는 방법 및 장치를 제공한다.
본 발명은, 매트릭스 기반 인트라 예측을 위한 다운샘플링 및 업샘플링의 방법 및 장치를 제공한다.
본 발명에 따른 비디오 신호 처리 방법 및 장치는, 현재 블록의 인트라 예측 모드를 결정하고, 상기 현재 블록의 인트라 예측을 위한 참조 샘플을 결정하며, 상기 인트라 예측 모드를 기반으로, 소정의 매트릭스를 결정하고, 상기 참조 샘플 및 매트릭스를 기반으로, 상기 현재 블록을 예측할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 참조 샘플을 결정하는 단계는, 상기 현재 블록의 주변 영역을 결정하는 단계 및 상기 결정된 주변 영역을 다운샘플링하는 단계를 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 주변 영역은 복수의 샘플 그룹으로 구분되고, 상기 샘플 그룹은 하나 또는 그 이상의 샘플로 구성되며, 상기 샘플 그룹의 대표값이 상기 참조 샘플로 결정되고, 상기 대표값은 평균값, 최소값, 최대값, 최빈값, 또는 중간값 중 어느 하나일 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 매트릭스는, 상기 현재 블록의 부호화 정보를 더 고려하여 결정되고, 상기 부호화 정보는, 상기 현재 블록의 크기, 형태, 인트라 예측 모드의 각도 또는 방향성을 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 참조 샘플에 상기 매트릭스를 적용하여 예측 블록을 생성하는 단계를 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 생성된 예측 블록의 예측 샘플 전부 또는 일부를 재배열하는 단계를 더 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 예측 블록 또는 상기 현재 블록에 인접한 기-복원된 샘플 중 적어도 하나를 기반으로, 상기 현재 블록을 보간하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 트리구조의 블록 분할을 통해 부호화/복호화 효율을 향상시킬 수 있다.
본 발명에 따르면, 매트릭스 기반 인트라 예측을 통해 부호화/복호화 효율을 향상시킬 수 있다.
본 발명에 따르면, 매트릭스 기반 인트라 예측을 위한 다운샘플링 또는 업샘플링을 통해 부호화/복호화 효율을 향상시킬 수 있다.
도 1은 본 발명의 일실시예로서, 부호화 장치의 개략적인 블록도를 도시한 것이다.
도 2는 본 발명의 일실시예로서, 복호화 장치의 개략적인 블록도를 도시한 것이다.
도 3은 본 발명이 적용되는 일실시예로서, 블록 분할 타입을 도시한 것이다.
도 4는 본 발명이 적용되는 일실시예로서, 트리 구조 기반의 블록 분할 방법을 도시한 것이다.
도 5는 본 발명의 일실시예로서, 매트릭스 기반으로 현재 블록에 대한 인트라 예측을 하는 과정을 도시한 것이다.
도 6은 본 발명이 적용되는 일실시예로서, 주변 영역을 다운샘플링하여 참조 샘플을 결정하는 방법을 도시한 것이다.
도 7은 본 발명이 적용되는 일실시예로서, 가중 평균에 기반한 다운샘플링 방법을 도시한다.
도 8은 본 발명이 적용되는 일실시예로서, 제1 예측 샘플의 할당 및 나머지 영역에 대한 보간 방법을 도시한 것이다.
도 9는 본 발명이 적용되는 일실시예로서, 보간 단계에서 거리에 대한 가중치를 부여하는 것을 도시한 것이다.
도 10은 본 발명이 적용되는 일실시예로서, 보간 단계의 순서를 도시한 것이다.
본 발명에 따른 비디오 신호 처리 방법 및 장치는, 현재 블록의 인트라 예측 모드를 결정하고, 상기 현재 블록의 인트라 예측을 위한 참조 샘플을 결정하며, 상기 인트라 예측 모드를 기반으로, 소정의 매트릭스를 결정하고, 상기 참조 샘플 및 매트릭스를 기반으로, 상기 현재 블록을 예측할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 참조 샘플을 결정하는 단계는, 상기 현재 블록의 주변 영역을 결정하는 단계 및 상기 결정된 주변 영역을 다운샘플링하는 단계를 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 주변 영역은 복수의 샘플 그룹으로 구분되고, 상기 샘플 그룹은 하나 또는 그 이상의 샘플로 구성되며, 상기 샘플 그룹의 대표값이 상기 참조 샘플로 결정되고, 상기 대표값은 평균값, 최소값, 최대값, 최빈값, 또는 중간값 중 어느 하나일 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 매트릭스는, 상기 현재 블록의 부호화 정보를 더 고려하여 결정되고, 상기 부호화 정보는, 상기 현재 블록의 크기, 형태, 인트라 예측 모드의 각도 또는 방향성을 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 참조 샘플에 상기 매트릭스를 적용하여 예측 블록을 생성하는 단계를 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 생성된 예측 블록의 예측 샘플 전부 또는 일부를 재배열하는 단계를 더 포함할 수 있다.
본 발명에 따른 비디오 신호 처리 방법 및 장치에 있어서, 상기 현재 블록을 예측하는 단계는, 상기 예측 블록 또는 상기 현재 블록에 인접한 기-복원된 샘플 중 적어도 하나를 기반으로, 상기 현재 블록을 보간하는 단계를 더 포함할 수 있다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 것을 의미한다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일실시예로서, 부호화 장치의 개략적인 블록도를 도시한 것이다.
도 1을 참조하면, 부호화 장치(100)는 픽쳐 분할부(110), 예측부(120, 125), 변환부(130), 양자화부(135), 재정렬부(160), 엔트로피 부호화부(165), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함할 수 있다.
도 1에 나타난 각 구성부들은 영상 부호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시한 것으로, 각 구성부들이 분리된 하드웨어로 이루어짐을 의미할 수 있다. 다만, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수개의 구성부로 나뉘어져 기능을 수행할 수 있고, 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
픽쳐 분할부(110)는 입력된 픽쳐를 적어도 하나의 블록으로 분할할 수 있다. 이때, 블록은 부호화 단위(CU), 예측 단위(PU) 또는 변환 단위(TU)를 의미할 수 있다. 상기 분할은 쿼드 트리(Quadtree), 바이너리 트리(Biniary tree), 터너리 트리(Ternary tree) 중 적어도 하나에 기반하여 수행될 수 있다. 쿼드 트리는 상위 블록을 너비와 높이가 상위 블록의 절반인 하위 블록으로 사분할하는 방식이다. 바이너리 트리는 상위 블록을 너비 또는 높이 중 어느 하나가 상위 블록의 절반인 하위 블록으로 이분할하는 방식이다. 바이너리 트리에서는 상위 블록이 높이가 절반이 전술한 바이너리 트리 기반의 분할을 통해, 블록은 정방형뿐만 아니라 비정방형의 형태를 가질 수 있다.
이하, 본 발명의 실시예에서는 부호화 단위는 부호화를 수행하는 단위의 의미로 사용할 수도 있고, 복호화를 수행하는 단위의 의미로 사용할 수도 있다.
예측부(120, 125)는 인터 예측을 수행하는 인터 예측부(120)와 인트라 예측을 수행하는 인트라 예측부(125)를 포함할 수 있다. 예측 단위에 대해 인터 예측을 사용할 것인지 또는 인트라 예측을 수행할 것인지를 결정하고, 각 예측 방법에 따른 구체적인 정보(예컨대, 인트라 예측 모드, 움직임 벡터, 참조 픽쳐 등)를 결정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 예측 단위로 결정되고, 예측의 수행은 변환 단위로 수행될 수도 있다. 생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록)은 변환부(130)로 입력될 수 있다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 잔차값과 함께 엔트로피 부호화부(165)에서 부호화되어 복호화 장치에 전달될 수 있다. 특정한 부호화 모드를 사용할 경우, 예측부(120, 125)를 통해 예측 블록을 생성하지 않고, 원본 블록을 그대로 부호화하여 복호화부에 전송하는 것도 가능하다.
인터 예측부(120)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측 단위를 예측할 수도 있고, 경우에 따라서는 현재 픽쳐 내의 부호화가 완료된 일부 영역의 정보를 기초로 예측 단위를 예측할 수도 있다. 인터 예측부(120)는 참조 픽쳐 보간부, 움직임 예측부, 움직임 보상부를 포함할 수 있다.
참조 픽쳐 보간부에서는 메모리(155)로부터 참조 픽쳐 정보를 제공받고 참조 픽쳐에서 정수 화소 이하의 화소 정보를 생성할 수 있다. 휘도 화소의 경우, 1/4 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 8탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다. 색차 신호의 경우 1/8 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 4탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다.
움직임 예측부는 참조 픽쳐 보간부에 의해 보간된 참조 픽쳐를 기초로 움직임 예측을 수행할 수 있다. 움직임 벡터를 산출하기 위한 방법으로 FBMA(Full search-based Block Matching Algorithm), TSS(Three Step Search), NTS(New Three-Step Search Algorithm) 등 다양한 방법이 사용될 수 있다. 움직임 벡터는 보간된 화소를 기초로 1/2 또는 1/4 화소 단위의 움직임 벡터값을 가질 수 있다. 움직임 예측부에서는 움직임 예측 방법을 다르게 하여 현재 예측 단위를 예측할 수 있다. 움직임 예측 방법으로 스킵(Skip) 방법, 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법 등 다양한 방법이 사용될 수 있다.
인트라 예측부(125)는 현재 픽쳐 내의 화소 정보인 현재 블록 주변의 참조 화소 정보를 기초로 예측 단위를 생성할 수 있다. 현재 예측 단위의 주변 블록이 인터 예측을 수행한 블록이어서, 참조 화소가 인터 예측을 수행한 화소일 경우, 인터 예측을 수행한 블록에 포함되는 참조 화소를 주변의 인트라 예측을 수행한 블록의 참조 화소 정보로 대체하여 사용할 수 있다. 즉, 참조 화소가 가용하지 않는 경우, 가용하지 않은 참조 화소 정보를 가용한 참조 화소 중 적어도 하나의 참조 화소로 대체하여 사용할 수 있다.
인트라 예측에서 예측 모드는 참조 화소 정보를 예측 방향에 따라 사용하는 방향성 예측 모드와 예측을 수행시 방향성 정보를 사용하지 않는 비방향성 모드를 가질 수 있다. 휘도 성분을 예측하기 위한 모드와 색차 성분을 예측하기 위한 모드가 상이할 수 있고, 휘도 성분을 예측하기 위해 사용된 인트라 예측 모드 또는 예측/복원된 휘도 성분을 이용하여 색차 성분을 예측할 수 있다.
인트라 예측 방법은 인트라 예측 모드에 따라 참조 화소에 AIS(Adaptive Intra Smoothing) 필터를 적용한 후 예측 블록을 생성할 수 있다. 참조 화소에 적용되는 AIS 필터의 종류는 상이할 수 있다. 인트라 예측 방법을 수행하기 위해 현재 예측 단위의 인트라 예측 모드는 현재 예측 단위의 주변에 존재하는 예측 단위의 인트라 예측 모드로부터 예측할 수 있다. 주변 예측 단위로부터 예측된 모드 정보를 이용하여 현재 예측 단위의 예측 모드를 예측하는 경우, 현재 예측 단위와 주변 예측 단위의 인트라 예측 모드가 동일하면 소정의 플래그 정보를 이용하여 현재 예측 단위와 주변 예측 단위의 인트라 예측 모드가 동일하다는 정보를 전송할 수 있고, 만약 현재 예측 단위와 주변 예측 단위의 인트라 예측 모드가 서로 상이하면 엔트로피 부호화를 수행하여 현재 블록의 인트라 예측 모드 정보를 부호화할 수 있다.
또한, 예측부(120, 125)에서 생성된 예측 단위와 원본 블록 간의 차이값인 잔차값(Residual) 정보를 포함하는 잔차 블록이 생성될 수 있다. 생성된 잔차 블록은 변환부(130)로 입력될 수 있다.
변환부(130)에서는 잔차 데이터를 포함한 잔차 블록을 DCT, DST 등과 같은 변환 타입을 사용하여 변환시킬 수 있다. 이때, 변환 타입은 잔차 블록을 생성하기 위해 사용된 예측 단위의 인트라 예측 모드에 기반하여 결정될 수 있다.
양자화부(135)는 변환부(130)에서 주파수 영역으로 변환된 값들을 양자화할 수 있다. 블록에 따라 또는 영상의 중요도에 따라 양자화 계수는 변할 수 있다. 양자화부(135)에서 산출된 값은 역양자화부(140)와 재정렬부(160)에 제공될 수 있다.
재정렬부(160)는 양자화된 잔차 블록에 대해 계수값의 재정렬을 수행할 수 있다. 재정렬부(160)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원의 블록 형태의 계수를 1차원의 벡터 형태로 변경할 수 있다. 예를 들어, 재정렬부(160)에서는 소정의 스캔 타입을 이용하여 DC 계수부터 고주파수 영역의 계수까지 스캔하여 1차원 벡터 형태로 변경시킬 수 있다.
엔트로피 부호화부(165)는 재정렬부(160)에 의해 산출된 값들을 기초로 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 사용할 수 있다.
엔트로피 부호화부(165)는 재정렬부(160) 및 예측부(120, 125)로부터 부호화 단위의 잔차 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 단위 정보 및 전송 단위 정보, 움직임 벡터 정보, 참조 프레임 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 부호화할 수 있다.
엔트로피 부호화부(165)에서는 재정렬부(160)에서 입력된 부호화 단위의 계수값을 엔트로피 부호화할 수 있다.
역양자화부(140) 및 역변환부(145)에서는 양자화부(135)에서 양자화된 값들을 역양자화하고 변환부(130)에서 변환된 값들을 역변환한다. 역양자화부(140) 및 역변환부(145)에서 생성된 잔차값(Residual)은 예측부(120, 125)에 포함된 움직임 추정부, 움직임 보상부 및 인트라 예측부를 통해서 예측된 예측 단위와 합쳐져 복원 블록(Reconstructed Block)을 생성할 수 있다.
필터부(150)는 디블록킹 필터, 오프셋 보정부, ALF(Adaptive Loop Filter)중 적어도 하나를 포함할 수 있다.
디블록킹 필터는 복원된 픽쳐에서 블록간의 경계로 인해 생긴 블록 왜곡을 제거할 수 있다. 디블록킹을 수행할지 여부를 판단하기 위해 블록에 포함된 몇 개의 열 또는 행에 포함된 화소를 기초로 현재 블록에 디블록킹 필터 적용할지 여부를 판단할 수 있다. 블록에 디블록킹 필터를 적용하는 경우 필요한 디블록킹 필터링 강도에 따라 강한 필터(Strong Filter) 또는 약한 필터(Weak Filter)를 적용할 수 있다. 또한 디블록킹 필터를 적용함에 있어 수직 필터링 및 수평 필터링 수행시 수평 방향 필터링 및 수직 방향 필터링이 병행 처리되도록 할 수 있다.
오프셋 보정부는 디블록킹을 수행한 영상에 대해 화소 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 픽쳐에 대한 오프셋 보정을 수행하기 위해 영상에 포함된 화소를 일정한 수의 영역으로 구분한 후 오프셋을 수행할 영역을 결정하고 해당 영역에 오프셋을 적용하는 방법 또는 각 화소의 에지 정보를 고려하여 오프셋을 적용하는 방법을 사용할 수 있다.
ALF(Adaptive Loop Filtering)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로 수행될 수 있다. 영상에 포함된 화소를 소정의 그룹으로 나눈 후 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다. ALF를 적용할지 여부에 관련된 정보는 휘도 신호는 부호화 단위(Coding Unit, CU) 별로 전송될 수 있고, 각각의 블록에 따라 적용될 ALF 필터의 모양 및 필터 계수는 달라질 수 있다. 또한, 적용 대상 블록의 특성에 상관없이 동일한 형태(고정된 형태)의 ALF 필터가 적용될 수도 있다.
메모리(155)는 필터부(150)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있고, 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행 시 예측부(120, 125)에 제공될 수 있다.
도 2는 본 발명의 일실시예로서, 복호화 장치의 개략적인 블록도를 도시한것이다.
도 2를 참조하면, 복호화 장치(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230, 235), 필터부(240), 메모리(245)가 포함될 수 있다.
도 2에 나타난 각 구성부들은 복호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시한 것으로, 각 구성부들이 분리된 하드웨어로 이루짐을 의미할 수 있다. 다만, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수개의 구성부로 나뉘어져 기능을 수행할 수 있고, 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
엔트로피 복호화부(210)는 입력 비트스트림에 대해 엔트로피 복호화를 수행할 수 있다. 예를 들어, 엔트로피 복호화를 위해, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 방법이 적용될 수 있다.
엔트로피 복호화부(210)에서는 부호화 장치에서 수행된 인트라 예측 및 인터 예측에 관련된 정보를 복호화할 수 있다.
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림에 대해 재정렬을 수행할 수 있다. 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(215)에서는 부호화 장치에서 수행된 계수 스캐닝에 관련된 정보를 제공받고, 해당 부호화 장치에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통해 재정렬을 수행할 수 있다.
역양자화부(220)는 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
역변환부(225)는 역양자화된 변환 계수를 소정의 변환 타입으로 역변환을 수행할 수 있다. 이때, 변환 타입은, 예측 모드(인터/인트라 예측), 블록의 크기/형태, 인트라 예측 모드, 성분 타입(휘도/색차 성분), 분할 타입(QT, BT, TT 등) 등에 관한 정보 중 적어도 하나를 기반으로 결정될 수 있다.
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다.
예측부(230, 235)는 예측 단위 판별부, 인터 예측부 및 인트라 예측부를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 인트라 예측 방법의 인트라 예측 모드 관련 정보, 인터 예측 방법의 움직임 예측 관련 정보 등 다양한 정보를 입력 받고, 현재 부호화 단위(CU)에서 예측 단위를 구분하고, 예측 단위가 인터 예측을 수행하는지 아니면 인트라 예측을 수행하는지 여부를 판별할 수 있다. 인터 예측부(230)는 부호화 장치에서 제공된 현재 예측 단위의 인터 예측에 필요한 정보를 이용하여, 현재 예측 단위가 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 단위에 대한 인터 예측을 수행할 수 있다. 또는, 현재 예측 단위가 포함된 현재 픽쳐 내에서 기-복원된 일부 영역의 정보를 기초로 인터 예측을 수행할 수도 있다. 이를 위해, 상기 기-복원된 일부 영역이 참조 픽쳐 리스트에 추가될 수 있다.
인터 예측을 수행하기 위해 부호화 단위를 기준으로, 해당 부호화 단위에 포함된 예측 단위의 움직임 예측 방법이 스킵 모드(Skip Mode), 머지 모드(Merge 모드), AMVP 모드(AMVP Mode), 현재 픽쳐 참조 모드 중 어떠한 방법인지 여부를 판단할 수 있다.
인트라 예측부(235)는 현재 픽쳐 내의 화소 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 인트라 예측을 수행한 예측 단위인 경우, 부호화 장치에서 제공된 예측 단위의 인트라 예측 모드 정보를 기초로, 인트라 예측을 수행할 수 있다. 인트라 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 부분으로서, 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 부호화 장치에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여, 현재 블록의 참조 화소에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.
참조 화소 보간부는 예측 단위의 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 정수값 이하의 화소 단위의 참조 화소를 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우, 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다.
복원된 블록 또는 픽쳐는 필터부(240)로 제공될 수 있다. 필터부(240)는 디블록킹 필터, 오프셋 보정부, ALF를 포함할 수 있다.
부호화 장치로부터 해당 블록 또는 픽쳐에 디블록킹 필터를 적용하였는지 여부에 대한 정보 및 디블록킹 필터를 적용하였을 경우, 강한 필터를 적용하였는지 또는 약한 필터를 적용하였는지에 대한 정보를 제공받을 수 있다. 복호화 장치의 디블록킹 필터에서는 부호화 장치에서 제공된 디블록킹 필터 관련 정보를 제공받고, 복호화 장치에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다.
ALF는 부호화기로부터 제공된 ALF 적용 여부 정보, ALF 계수 정보 등을 기초로 부호화 단위에 적용될 수 있다. 이러한 ALF 정보는 특정한 파라메터 셋에 포함되어 제공될 수 있다.
메모리(245)는 복원된 픽쳐 또는 블록을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽쳐를 출력부로 제공할 수 있다.
도 3은 본 발명이 적용되는 일실시예로서, 블록 분할 타입을 도시한 것이다.
도 3을 참조하면, 분할 설정, 분할 방식에 따라 a 내지 s의 블록을 획득할 수 있으며, 도시되지 않은 추가적인 블록 형태 또한 가능할 수 있다.
일 예(1)로, 트리 기반의 분할에 비대칭 분할을 허용할 수 있다. 예를 들어, 바이너리 트리의 경우 b, c와 같은 블록이 가능할 수 있거나 또는 b ~ g와 같은 블록이 가능할 수 있다. 비대칭 분할을 허용하는 플래그가 부/복호화 설정에 따라 명시적 또는 묵시적으로 비활성화될 경우 획득 가능한 후보 블록은 b 또는 c일 수 있고, 비대칭 분할을 허용하는 플래그가 활성화될 경우 획득 가능한 후보 블록은 b, d, e(본 예에서 가로 분할)일 수 있거나 c, f, g(본 예에서 세로 분할)일 수 있다.
상기 예에서 비대칭 분할의 좌:우 또는 상:하의 길이 비율은 1:3 또는 3:1인 경우를 가정하여 설명하나 이에 한정하지 않고 그 외의 비율을 갖는 후보군(예를 들어, 1:2, 1:4, 2:3, 2:5, 3:5 등)을 갖는 것도 부호화 설정에 따라 가능할 수 있다.
다음은 바이너리 트리 분할(본 예에서 1:1, 1:3, 3:1의 후보군)에서 발생하는 분할 정보에 대한 다양한 예를 나타낸다.
예를 들어, 분할 여부를 나타내는 플래그, 분할 방향을 나타내는 플래그에 추가적으로 분할 형태를 나타내는 플래그가 발생할 수 있다. 이때, 분할 형태는 대칭 또는 비대칭 분할을 의미할 수 있다. 이 중 비대칭 분할이 분할 형태로 결정되는 경우에는 분할 비율을 나타내는 플래그가 발생할 수 있으며, 기 설정된 후보군에 따라 인덱스가 할당될 수 있다. 만약 1:3 또는 3:1의 분할 비율이 후보군으로 지원될 경우 1비트 플래그를 통해 분할 비율을 선택할 수 있다.
또는, 분할 여부를 나타내는 플래그, 분할 방향을 나타내는 플래그에 추가적으로 분할 비율을 나타내는 플래그가 발생할 수 있다. 본 예에서 분할 비율에 대한 후보군으로 1:1의 대칭 비율을 갖는 후보가 포함되어 구성될 수 있다.
본 발명에서는 (비대칭 분할을 허용하는 플래그가 활성화될 경우) 바이너리 트리 분할에서 전자의 예와 같은 구성을 갖는 경우를 가정하며, 특별한 설명이 없는 한 바이너리 트리는 대칭 바이너리 트리를 의미한다.
일 예(2)로, 트리 기반의 분할에 추가적인 트리 분할을 허용할 수 있다. 예를 들어, 터너리 트리(Ternary Tree), 쿼드 타입 트리(Quad Type Tree), 옥타 트리(Octa Tree) 등의 분할이 가능할 수 있으며, 이를 통해 n개의 분할 블록(본 예에서 3, 4, 8. n은 정수)을 획득할 수 있다. 터너리 트리의 경우 지원되는 블록(본 예에서 복수의 블록으로 분할된 경우)은 h ~ m일 수 있고, 쿼드 타입 트리의 경우 지원되는 블록은 n ~ p일 수 있고, 옥타 트리의 경우 지원되는 블록은 q일 수 있다. 상기 트리 기반의 분할의 지원 여부는 부/복호화 설정에 따라 묵시적으로 정해지거나 또는 명시적으로 관련 정보가 생성될 수 있다. 또한, 부/복호화 설정에 따라 단독으로 사용되거나 또는 바이너리 트리, 쿼드 트리 분할 등과 혼합 사용될 수 있다.
예를 들어, 바이너리 트리의 경우 b, c와 같은 블록이 가능할 수 있고, 바이너리 트리와 터너리 트리가 혼합 사용되는 경우(본 예는 바이너리 트리의 사용 범위와 터너리 트리의 사용 범위가 일부 중복되는 경우라 가정) b, c, i, l와 같은 블록이 가능할 수 있다. 기존 트리 외의 추가 분할을 허용하는 플래그가 부/복호화 설정에 따라 명시적 또는 묵시적으로 비활성화될 경우 획득 가능한 후보 블록은 b 또는 c일 수 있고, 활성화될 경우 획득 가능한 후보 블록은 b, i 또는 b, h, i, j(본 예에서 가로 분할)일 수 있거나 c, l 또는 c, k, l, m(본 예에서 세로 분할)일 수 있다.
상기 예에서 터너리 트리 분할의 좌:중:우 또는 상:중:하의 길이 비율은 2:1:1 또는 1:2:1 또는 1:1:2 인 경우를 가정하여 설명하나 이에 한정하지 않고 그 외의 비율을 갖는 것도 부호화 설정에 따라 가능할 수 있다.
다음은 터너리 트리 분할(본 예에서 1:2:1 인 후보)에서 발생하는 분할 정보에 대한 예를 나타낸다.
예를 들어, 분할 여부를 나타내는 플래그, 분할 방향을 나타내는 플래그에 추가적으로 분할 종류를 나타내는 플래그가 발생할 수 있다. 이때, 분할 종류는 바이너리 트리 또는 터너리 트리 분할을 의미할 수 있다.
본 발명에서는 분할 방식에 따라 적응적인 부/복호화 설정을 적용할 수 있다.
일 예로, 블록의 종류에 따라 분할 방식이 정해질 수 있다. 예를 들어, 부호화 블록과 변환 블록은 쿼드 트리 분할을, 예측 블록은 쿼드 트리와 바이너리 트리(또는 터너리 트리 등) 분할 방식을 사용할 수 있다.
일 예로, 블록의 크기에 따라 분할 방식이 정해질 수 있다. 예를 들어, 블록의 최대값과 최소값 사이에서 일부 범위(예를 들어, a×b ~ c×d. 후자가 더 큰 크기인 경우)에는 쿼드 트리 분할을, 일부 범위(예를 들어, e×f ~ g×h)에는 바이너리 트리(또는 터너리 트리 등) 분할이 가능할 수 있다. 이때, 분할 방식에 따른 범위 정보가 명시적으로 생성될 수 있거나 묵시적으로 정해질 수 있으며, 상기 범위는 중첩되는 경우 또한 가능하다.
일 예로, 블록(또는 분할 전 블록)의 형태에 따라 분할 방식이 정해질 수 있다. 예를 들어, 블록의 형태가 정사각일 경우 쿼드 트리와 바이너리 트리(또는 터너리 트리 등) 분할이 가능할 수 있다. 또는, 블록의 형태가 직사각일 경우에 바이너리 트리(또는 터너리 트리 등) 기반의 분할이 가능할 수 있다.
일 예로, 블록의 종류에 따라 분할 설정이 정해질 수 있다. 예를 들어, 트리 기반의 분할에서 부호화 블록과 예측 블록은 쿼드 트리, 변환 블록은 바이너리 트리 분할을 사용할 수 있다. 또는, 부호화 블록의 경우 분할 허용 깊이는 m, 예측 블록의 경우 분할 허용 깊이는 n, 변환 블록의 경우 분할 허용 깊이는 o로 설정할 수 있으며, m과 n과 o는 동일하거나 동일하지 않을 수 있다.
일 예로, 블록의 크기에 따라 분할 설정이 정해질 수 있다. 예를 들어, 블록의 일부 범위(예를 들어, a×b ~ c×d)에는 쿼드 트리 분할을, 일부 범위(예를 들어, e×f ~ g×h. 본 예에서 c×d는 g×h보다 크다고 가정)에는 바이너리 트리 분할을, 일부 범위(예를 들어, i×j ~ k×l. 본 예에서 g×h은 k×l보다 크거나 같다고 가정)에는 터너리 트리 분할이 가능할 수 있다. 이때, 상기 범위로 블록의 최대값과 최소값 사이의 모든 범위를 포함할 수 있고, 상기 범위는 서로 중첩되지 않은 설정을 갖거나 중첩되는 설정을 가질 수 있다. 예를 들어, 일부 범위의 최소값은 일부 범위의 최대값과 동일하거나 또는 일부 범위의 최소값은 일부 범위의 최대값보다 작을 수 있다. 중첩되는 범위를 가질 경우 더 높은 최대값을 갖는 분할 방식이 우선 순위를 가질 수 있거나 어떤 분할 방식을 사용할 지에 대한 정보가 명시적으로 발생할 수 있다. 즉, 우선 순위를 갖는 분할 방식에서 분할 결과에 따라 후순위를 갖는 분할 방식의 수행 여부가 정해질 수 있거나 분할 방식 선택 정보에 따라 어떤 분할 방식을 사용할 지가 정해질 수 있다.
일 예로, 블록의 형태에 따라 분할 설정이 정해질 수 있다. 예를 들어, 블록의 형태가 정사각일 경우 쿼드 트리 분할이 가능할 수 있다. 또는, 블록의 형태가 직사각일 경우에 바이너리 트리 또는 터너리 트리 분할이 가능할 수 있다.
일 예로, 부/복호화 정보(예를 들어, 슬라이스 타입, 컬러 성분, 부호화 모드 등)에 따라 분할 설정이 정해질 수 있다. 예를 들어, 슬라이스 타입이 I일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할은 일부 범위(예를 들어, a×b ~ c×d), P일 경우 일부 범위(예를 들어, e×f ~ g×h), B일 경우 일부 범위(예를 들어, i×j ~ k×l)에서 가능할 수 있다. 또한, 슬라이스 타입이 I일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리 분할) 분할의 분할 허용 깊이 m, P일 경우 분할 허용 깊이 n, B일 경우 분할 허용 깊이 o으로 설정할 수 있으며, m과 n과 o는 동일하거나 동일하지 않을 수 있다. 일부 슬라이스 타입의 경우 다른 슬라이스(예를 들어, P와 B 슬라이스)와 동일한 설정을 가질 수 있다.
다른 예로, 컬러 성분이 휘도 성분일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할 허용 깊이를 m, 색차 성분일 경우 n으로 설정할 수 있으며, m과 n은 동일하거나 동일하지 않을 수 있다. 또한, 컬러 성분이 휘도 성분일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할의 범위(예를 들어, a×b ~ c×d)와 색차 성분일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할의 범위(예를 들어, e×f ~ g×h)는 동일하거나 동일하지 않을 수 있다.
다른 예로, 부호화 모드가 Intra일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할 허용 깊이가 m, Inter일 경우 n(본 예에서 n은 m보다 크다고 가정)일 수 있으며, m과 n은 동일하거나 동일하지 않을 수 있다. 또한, 부호화 모드가 Intra일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할의 범위와 부호화 모드가 Inter일 경우 쿼드 트리(또는 바이너리 트리, 터너리 트리) 분할의 범위는 동일하거나 동일하지 않을 수 있다.
상기 예의 경우 부/복호화 정보에 따른 적응적인 분할 후보군 구성 지원 여부에 대한 정보가 명시적으로 생성될 수 있거나 묵시적으로 정해질 수 있다.
상기 예를 통해 부/복호화 설정에 따라 분할 방식과 분할 설정이 정해지는 경우를 설명하였다. 상기 예는 각 요소에 따른 일부 경우를 나타내며, 다른 경우로의 변형 또한 가능할 수 있다. 또한, 복수의 요소에 의한 조합에 따라 분할 방식과 분할 설정이 정해질 수도 있다. 예를 들어, 블록의 종류, 크기, 형태, 부/복호화 정보 등에 의해 분할 방식과 분할 설정이 정해질 수 있다.
또한, 상기 예에서 분할 방식, 설정 등에 관여하는 요소들은 묵시적으로 정해지거나 또는 명시적으로 정보를 생성하여 상기 예와 같은 적응적인 경우의 허용 여부를 정할 수 있다.
상기 분할 설정 중 분할 깊이는 초기 블록을 기준으로 공간적으로 분할한 횟수(본 예에서 초기 블록의 분할 깊이는 0)를 의미하며, 분할 깊이가 증가할수록 더 작은 블록으로 분할될 수 있다. 이는 분할 방식에 따라 깊이 관련 설정을 달리할 수 있다. 예를 들어, 트리 기반의 분할을 수행하는 방식 중 바이너리 트리의 분할 깊이와 터너리 트리의 분할 깊이는 공통되는 하나의 깊이를 사용할 수 있고, 쿼드 트리의 분할 깊이와 바이너리 트리의 분할 깊이는 다른 깊이를 사용하는 등 트리의 종류에 따른 개별적인 깊이를 사용할 수 있다.
상기 예에서 트리의 종류에 따라 개별적인 분할 깊이를 사용하는 경우 트리의 분할 시작 위치(본 예에서 분할을 수행하기 전 블록)에서 분할 깊이 0으로 설정할 수 있다. 각 트리의 분할 범위(본 예에서 최대값)에 기반하지 않고 분할이 시작되는 위치를 중심으로 분할 깊이가 계산될 수 있다.
도 4는 본 발명이 적용되는 일실시예로서, 트리 구조 기반의 블록 분할 방법을 도시한 것이다.
그림에서 굵은 실선은 기본 부호화 블록, 굵은 점선은 쿼드 트리 분할 경계, 이중 실선은 대칭 바이너리 트리 분할 경계, 실선은 터너리 트리 분할 경계, 얇은 점선은 비대칭 바이너리 트리 분할 경계를 의미한다. 굵은 실선을 제외하고는 각 분할 방법에 따라 구획되는 경계를 의미한다. 다음에서 설명하는 분할 설정(예를 들어, 분할 종류, 분할 정보, 분할 정보 구성 순서 등)은 해당 예의 경우에만 한정되지 않으며, 다양한 변형의 예가 가능할 수 있다.
설명의 편의를 위해 기본 부호화 블록(2N x 2N. 128 x 128)을 기준으로 좌상, 우상, 좌하, 우하 블록(N x N. 64 x 64)에 개별적인 블록 분할 설정을 갖는 경우를 가정하여 설명한다. 우선, 초기 블록에서 한 번의 분할 동작(분할 깊이 0 -> 1. 즉, 분할 깊이 1 증가)으로 인해 4개의 서브 블록이 획득된 상태이며, 쿼드 트리에 관한 분할 설정으로 최대 부호화 블록은 128 x 128, 최소 부호화 블록은 8 x 8이며 최대 분할 깊이는 4인 경우로 이는 각 블록에 공통 적용되는 설정임을 가정한다.
(1번. 좌상 블록. A1 ~ A6)
본 예는 단일 트리 방식의 분할(본 예에서 쿼드 트리)이 지원되는 경우로, 최대 부호화 블록, 최소 부호화 블록, 분할 깊이 등과 같은 하나의 블록 분할 설정을 통해 획득 가능한 블록의 크기 및 형태가 정해질 수 있다. 본 예에서는 분할에 따라 획득 가능한 블록이 하나인 경우(가로와 세로를 각각 2분할)로 한 번의 분할 동작(분할 전 블록 4M x 4N 기준. 분할 깊이 1 증가)에 요구되는 분할 정보는 분할 여부를 나타내는 플래그(본 예에서 0이면 분할 x. 1이면 분할 o)이며 획득 가능한 후보는 4M x 4N과 2M x 2N일 수 있다.
(2번. 우상 블록. A7 ~ A11)
본 예는 다중 트리 방식의 분할(본 예에서 쿼드 트리, 바이너리 트리)이 지원되는 경우로, 복수의 블록 분할 설정을 통해 획득 가능한 블록의 크기 및 형태가 정해질 수 있다. 본 예에서 바이너리 트리의 경우 최대 부호화 블록은 64 x 64, 최소 부호화 블록은 한 쪽 길이가 4이고 최대 분할 깊이가 4인 경우라 가정한다.
본 예에서는 분할에 따라 획득 가능한 블록은 2개 이상인 경우(본 예에서 2 또는 4개)라 한 번의 분할 동작(쿼드 트리 분할 깊이 1 증가)에 요구되는 분할 정보는 분할 여부를 나타내는 플래그, 분할 종류를 나타내는 플래그, 분할 형태를 나타내는 플래그, 분할 방향을 나타내는 플래그이며 획득 가능한 후보는 4M x 4N, 4M x 2N, 2M x 4N, 4M x N/4M x 3N, 4M x 3N/4M x N, M x 4N/3M x 4N, 3M x 4N/M x 4N일 수 있다.
만약 쿼드 트리와 바이너리 트리 분할 범위가 중첩(즉, 현재 단계에서 쿼드 트리 분할과 바이너리 트리 분할이 모두 가능한 범위)되며 현재 블록(아직 분할 하기 전 상태)이 쿼드 트리 분할에 의해 획득된 블록(부모 블록<분할 깊이가 현재보다 1적은 경우>에서 쿼드 트리 분할에 의해 획득된 블록)일 경우에 분할 정보는 다음과 같은 경우로 구분되어 구성될 수 있다. 즉, 각 분할 설정에 따라 지원되는 블록이 복수의 분할 방법에 의해 획득 가능한 경우에는 다음과 같은 과정으로 분류하여 분할 정보가 발생 가능하다.
(1) 쿼드 트리 분할과 바이너리 트리 분할이 중첩되는 경우
a b c d e
QT 1
No Split 0 0
SBT hor 0 1 0 0
ABT hor 1/4 0 1 0 1 0
ABT hor 3/4 0 1 0 1 1
SBT ver 0 1 1 0
ABT ver 1/4 0 1 1 1 0
ABT ver 3/4 0 1 1 1 1
위의 표에서 a는 쿼드 트리 분할 여부를 나타내는 플래그를 의미하며, 1이면 쿼드 트리 분할(QT)을 수행한다. 상기 플래그가 0이면 바이너리 트리 분할 여부를 나타내는 플래그인 b를 확인한다. b가 0이면 해당 블록에서 더 이상의 분할은 수행하지 않고(No Split), 1이면 바이너리 트리 분할을 수행한다.
c는 분할 방향을 나타내는 플래그로 0이면 가로 분할(hor), 1이면 세로 분할(ver)을 의미하고, d는 분할 형태를 나타내는 플래그로 0이면 대칭 분할(SBT. Symmetric Binary Tree), 1이면 비대칭 분할(ABT. Asymmetric Binary Tree)을 의미한다. d가 1일때만 비대칭 분할에서의 세부 분할 비율에 대한 정보(1/4 or 3/4)를 확인하며, 0일 때는 좌/우 또는 상/하 블록에서 좌와 상 블록이 1/4의 비율을 갖고 우와 하 블록이 3/4의 비율을 가지며, 1이면 반대의 비율을 갖는다.
(2) 바이너리 트리 분할만 가능한 경우
위의 표에서 a를 제외한 b 내지 e의 플래그로 분할 정보에 대한 표현이 가능하다.
도 4에서 A7 블록의 경우 분할 전 블록(A7 ~ A11)에서 쿼드 트리 분할이 가능한 경우(즉, 쿼드 트리 분할이 가능했지만 쿼드 트리 분할이 아닌 바이너리 트리 분할이 된 경우)였으므로 (1)에서의 분할 정보가 생성되는 경우에 해당한다.
반면, A8 내지 A11의 경우 분할 전 블록(A8 ~ A11)에서 이미 쿼드 트리 분할이 수행되지 않고 바이너리 트리 분할이 된 경우(즉, 더 이상 해당 블록<A8 ~ A11>에서는 쿼드 트리 분할이 불가능한 경우)라 (2)에서의 분할 정보가 생성되는 경우에 해당한다.
(3번. 좌하 블록. A12 ~ A15)
본 예는 다중 트리 방식의 분할(본 예에서 쿼드 트리, 바이너리 트리, 터너리 트리)이 지원되는 경우로, 복수의 블록 분할 설정을 통해 획득 가능한 블록의 크기 및 형태가 정해질 수 있다. 본 예에서 바이너리 트리/터너리의 경우 최대 부호화 블록은 64 x 64, 최소 부호화 블록은 한 쪽 길이가 4이고 최대 분할 깊이가 4인 경우라 가정한다.
본 예에서는 분할에 따라 획득 가능한 블록은 2개 이상인 경우(본 예에서 2, 3, 4개)라 한 번의 분할 동작에 요구되는 분할 정보는 분할 여부를 나타내는 플래그, 분할 종류를 나타내는 플래그, 분할 방향을 나타내는 플래그이며 획득 가능한 후보는 4M x 4N, 4M x 2N, 2M x 4N, 4M x N/4M x 2N/4M x N, M x 4N/2M x 4N/M x 4N일 수 있다.
만약 쿼드 트리와 바이너리 트리/터너리 트리 분할 범위가 중첩되며 현재 블록이 쿼드 트리 분할에 의해 획득된 블록일 경우에 분할 정보는 다음과 같은 경우로 구분되어 구성될 수 있다.
(1) 쿼드 트리 분할과 바이너리 트리/터너리 트리 분할이 중첩되는 경우
a b c d
QT 1
No Split 0 0
BT hor 0 1 0 0
TT hor 0 1 0 1
BT ver 0 1 1 0
TT ver 0 1 1 1
위의 표에서 a는 쿼드 트리 분할 여부를 나타내는 플래그이고, 1이면 쿼드 트리 분할을 수행한다. 상기 플래그가 0이면 바이너리 트리 또는 터너리 트리 분할 여부를 나타내는 플래그인 b를 확인한다. b가 0이면 해당 블록에서 더 이상의 분할은 수행하지 않고, 1이면 바이너리 트리 또는 터너리 트리 분할을 수행한다.
c는 분할 방향을 나타내는 플래그로 0이면 가로 분할, 1이면 세로 분할을 의미하고, d는 분할 종류를 나타내는 플래그로 0이면 바이너리 트리 분할(BT), 1이면 터너리 트리 분할(TT)을 의미한다.
(2) 바이너리 트리/터너리 트리 분할만 가능한 경우
위의 표에서 a를 제외한 b 내지 d의 플래그로 분할 정보에 대한 표현이 가능하다.
도 4에서 A12, A15 블록의 경우 분할 전 블록(A12 ~ A15)에서 쿼드 트리 분할이 가능한 경우였으므로 (1)에서의 분할 정보가 생성되는 경우에 해당한다.
반면, A13와 A14는 분할 전 블록(A13, A14)에서 이미 쿼드 트리로 분할이 수행되지 않고 터너리 트리로 분할이 된 경우라 (2)에서의 분할 정보가 생성되는 경우에 해당한다.
(4번. 좌하 블록. A16 ~ A20)
본 예는 다중 트리 방식의 분할(본 예에서 쿼드 트리, 바이너리 트리, 터너리 트리)이 지원되는 경우로, 복수의 블록 분할 설정을 통해 획득 가능한 블록의 크기 및 형태가 정해질 수 있다. 본 예에서 바이너리 트리/터너리 트리의 경우 최대 부호화 블록은 64 x 64, 최소 부호화 블록은 한 쪽 길이가 4이고 최대 분할 깊이가 4인 경우라 가정한다.
본 예에서는 분할에 따라 획득 가능한 블록은 2개 이상인 경우(본 예에서 2, 3, 4개)라 한 번의 분할 동작에 요구되는 분할 정보로 분할 여부를 나타내는 플래그, 분할 종류를 나타내는 플래그, 분할 형태를 나타내는 플래그, 분할 방향을 나타내는 플래그이며 획득 가능한 후보는 4M x 4N, 4M x 2N, 2M x 4N, 4M x N/4M x 3N, 4M x 3N/4M x N, M x 4N/3M x 4N, 3M x 4N/M x 4N, 4M x N/4M x 2N/4M x N, M x 4N/2M x 4N/M x 4N일 수 있다.
만약 쿼드 트리와 바이너리 트리/터너리 트리 분할 범위가 중첩되며 현재 블록이 쿼드 트리 분할에 의해 획득된 블록일 경우에 분할 정보는 다음과 같은 경우로 구분되어 구성될 수 있다.
(1) 쿼드 트리 분할과 바이너리 트리/터너리 분할이 중첩되는 경우
a b c d e f
QT 1
No Split 0 0
TT hor 0 1 0 0
SBT hor 0 1 0 1 0
ABT hor1/4 0 1 0 1 1 0
ABT hor3/4 0 1 0 1 1 1
TT ver 0 1 1 0
SBT ver 0 1 1 1 0
ABT ver1/4 0 1 1 1 1 0
ABT ver3/4 0 1 1 1 1 1
위의 표에서 a는 쿼드 트리 분할 여부를 나타내는 플래그를 의미하며, 1이면 쿼드 트리 분할을 수행한다. 상기 플래그가 0이면 바이너리 트리 분할 여부를 나타내는 플래그인 b를 확인한다. b가 0이면 해당 블록에서 더 이상의 분할은 수행하지 않고, 1이면 바이너리 트리 또는 터너리 트리 분할을 수행한다.
c는 분할 방향을 나타내는 플래그로 0이면 가로 분할, 1이면 세로 분할을 의미하고, d는 분할 종류를 나타내는 플래그로 0이면 터너리 분할, 1이면 바이너리 트리 분할을 의미한다. d가 1일 때는 분할 형태에 대한 플래그인 e를 확인하여 e가 0일 때는 대칭 분할을, 1일 때는 비대칭 분할을 수행한다. e가 1일 떄는 비대칭 분할에서의 세부 분할 비율에 대한 정보를 확인하며 이는 이전 예에서와 동일하다.
(2) 바이너리 트리/터너리 트리 분할만 가능한 경우
위의 표에서 a를 제외한 b 내지 f의 플래그로 분할 정보에 대한 표현이 가능하다.
도 4에서 A20 블록은 분할 전 블록(A16 ~ A19)에서 쿼드 트리 분할이 가능한 경우였으므로 (1)에서의 분할 정보가 생성되는 경우에 해당한다.
반면, A16 내지 A19의 경우 분할 전 블록(A16 ~ A19)에서 이미 쿼드 트리 분할이 수행되지 않고 바이너리 트리 분할이 된 경우라 (2)에서의 분할 정보가 생성되는 경우에 해당한다.
도 5는 본 발명의 일실시예로서, 매트릭스 기반으로 현재 블록에 대한 인트라 예측을 수행하는 과정을 도시한 것이다.
도 5를 참조하면, 현재 블록의 인트라 예측을 위한 인트라 예측 모드를 결정할 수 있다(S500).
부호화/복호화 장치는, 현재 블록의 인트라 예측을 함에 있어서, 인트라 예측 모드를 결정할 수 있다. 상기 현재 블록은 코딩 블록(CU), 예측 블록(PU), 변환 블록(TU), 또는 이들의 서브블록 중 어느 하나일 수 있다.
(실시예 1) 상기 인트라 예측 모드는, 시그날링되는 정보에 기초하여 결정될 수 있다. 상기 정보는, 부호화/복호화 장치에 기-정의된 N개의 인트라 예측 모드 중 어느 하나를 특정할 수 있다. 상기 기-정의된 인트라 예측 모드는, 현재 블록이 이용 가능한 전체 인트라 예측 모드를 의미하고, N은 67보다 작거나 같고, 11보다 크거나 같은 자연수(e.g, 67, 35, 11)일 수 있다. 또한, N 값은 현재 블록의 크기에 기초하여 결정될 수 있다. 예를 들어, 현재 블록이 8x8보다 작은 경우, N은 35로 결정되고, 그렇지 않은 경우, N은 19 또는 11 중 어느 하나로 결정될 수 있다.
(실시예 2) 상기 인트라 예측 모드는, 부호화/복호화 장치에 기-약속된 고정된 모드 또는 인덱스로 결정될 수도 있다. 상기 고정된 모드는, Planar mode(인덱스 0), DC 모드(인덱스 1), 수평 모드(인덱스 18), 수직 모드(인덱스 50), 대각선 모드(인덱스 2, 34, 66) 중 적어도 하나일 수 있다. 여기서, 인덱스는 기-정의된 인트라 예측 모드가 67개인 경우에 대응되고, 상기 N 값에 따라 모드 별 인덱스는 상이하게 할당될 수 있다.
(실시예 3) 상기 인트라 예측 모드는, 부호화 정보에 기초하여 가변적으로 결정될 수도 있다. 여기서, 부호화 정보는 부호화 장치에서 부호화 되어 시그날링되는 정보뿐만 아니라, 복호화 장치에서 시그날링되는 정보에 기초하여 유도되는 정보까지 포함할 수 있다. 상기 부호화 정보는, 현재 블록 또는 주변 블록 중 적어도 하나에 관한 것일 수 있다. 주변 블록은, 현재 블록의 공간적 및/또는 시간적 주변 블록을 포함하고, 공간적 주변 블록은 현재 블록의 좌측, 상단, 좌상단, 좌하단 또는 우상단 중 적어도 하나에 인접한 블록을 의미할 수 있다.
상기 부호화 정보는 블록 크기/형태, 블록의 가용성, 분할 타입, 분할 횟수, 성분 타입, 예측 모드, 인트라 예측 모드에 관한 정보, 인터 모드, 움직임 정보, 변환 타입, 변환 스킵 모드, 넌-제로 잔차 계수에 관한 정보, 스캔 순서, 칼라 포맷, 인-루프 필터 정보 등을 포함할 수 있다. 상기 블록 크기는 너비 또는 높이 중 어느 하나, 너비와 높이 중 최소값/최대값, 너비와 높이의 합, 블록에 속한 샘플의 개수 등으로 표현될 수 있다. 상기 블록의 가용성은 블록 위치, 병렬 처리 영역의 범위, 복호화 순서 등을 고려하여 판단될 수 있다. 상기 예측 모드는 인트라 모드 또는 인터 모드를 나타내는 정보를 의미할 수 있다. 상기 인트라 예측 모드에 관한 정보는 인트라 예측 모드가 비방향성 모드인지 여부, 인트라 예측 모드가 수직/수평 모드인지 여부, 인트라 예측 모드의 방향성, 부호화/복호화 장치에 기-정의된 인트라 예측 모드의 개수 등에 관한 정보를 포함할 수 있다. 상기 인터 모드는 머지/스킵 모드, AMVP 모드 또는 현재 픽쳐 참조 모드를 나타내는 정보를 의미할 수 있다. 상기 현재 픽쳐 참조 모드는 현재 픽쳐의 기-복원된 영역을 이용하여 현재 블록을 예측하는 방법을 의미한다. 상기 현재 픽쳐는 상기 현재 블록이 속한 픽쳐일 수 있다. 상기 현재 픽쳐는 인터 예측을 위한 참조 픽쳐 리스트에 추가될 수 있으며, 상기 현재 픽쳐는 참조 픽쳐 리스트 내에서 근거리(short-term) 참조 픽쳐 또는 장거리(long-term) 참조 픽쳐 다음에 배열될 수 있다. 상기 움직임 정보는 예측 방향 플래그, 움직임 벡터, 참조 픽쳐 인덱스 등을 포함할 수 있다.
(실시예 4) 상기 인트라 예측 모드는, MPM 리스트 및 MPM 인덱스에 기초하여 유도될 수도 있다. 상기 MPM 리스트는 복수의 MPM을 포함하고, MPM은 현재 블록의 공간적/시간적 주변 블록의 인트라 예측 모드에 기초하여 결정될 수 있다. MPM의 개수는 x개이며, x는 3, 4, 5, 6, 또는 그 이상의 정수일 수 있다.
예를 들어, MPM 리스트는, 주변 블록의 인트라 예측 모드 modeA, (modeA-n), (modeA+n) 또는 디폴트 모드 중 적어도 하나를 포함할 수 있다. 상기 n 값은 1, 2, 3, 4 또는 그 이상의 정수일 수 있다. 상기 주변 블록은, 현재 블록의 좌측 및/또는 상단에 인접한 블록을 의미할 수 있다. 디폴트 모드는, Planar 모드, DC 모드, 또는 소정의 방향성 모드 중 적어도 하나일 수 있다. 소정의 방향성 모드는, 수평 모드(modeV), 수직 모드(modeH), (modeV-k), (modeV+k), (modeH-k) 또는 (modeH+k) 중 적어도 하나를 포함할 수 있다.
상기 MPM 인덱스는, MPM 리스트의 MPM 중에서, 현재 블록의 인트라 예측 모드와 동일한 MPM을 특정할 수 있다. 즉, MPM 인덱스에 의해 특정된 MPM이 현재 블록의 인트라 예측 모드로 설정될 수 있다.
전술한 실시예 1 내지 4 중 어느 하나를 선택적으로 이용하여 현재 블록의 인트라 예측 모드가 결정될 수도 있고, 실시예 1 내지 4 중 적어도 2개의 조합에 기초하여 현재 블록의 인트라 예측 모드가 결정될 수도 있다. 상기 선택을 위해 소정의 플래그가 이용될 수 있고, 이때 플래그는 부호화 장치에서 부호화되어 시그날링될 수 있다.
도 5를 참조하면, 현재 블록의 인트라 예측을 위한 참조 샘플을 결정할 수 있다(S510).
상기 참조 샘플은 현재 블록의 주변 영역으로부터 유도될 수 있다. 상기 현재 블록의 주변 영역은 상기 현재 블록의 좌측, 우측, 상단, 좌하단, 좌상단, 우하단, 또는 우상단 중 적어도 어느 하나를 포함할 수 있다.
상기 주변 영역은 하나 또는 그 이상의 샘플 라인을 포함할 수 있다. 구체적으로, 주변 영역에 속한 샘플 라인의 개수는 k개이며, 여기서 k는 1, 2, 3, 4, 또는 그 이상의 자연수일 수 있다. k 값은 부호화/복호화 장치에 기-약속된 고정된 값일 수도 있고, 전술한 부호화 정보에 기초하여 가변적으로 결정될 수도 있다. 예를 들어, 현재 블록이 제1 크기(e.g., 4x4, 4x8, 8x4)인 경우, 주변 영역은 1개의 샘플 라인으로 구성되고, 현재 블록이 제2 크기(e.g., 8x8, 16x16 등)인 경우, 주변 영역은 2개의 샘플 라인으로 구성될 수 있다. 상기 샘플 라인은 주변 영역의 위치에 따라 수직 방향 또는 수평 방향으로 결정될 수 있다. 또한, 상기 샘플 라인은 현재 블록에 접해 있을 수도 있고, 현재 블록을 기준으로 수직 및/또는 수평 방향으로 소정의 거리만큼 떨어져 있을 수도 있다
상기 복수개의 샘플 라인들은, 현재 블록을 기준으로 수직 및/또는 수평 방향으로 연속적으로 위치하거나, 상호 소정의 거리만큼 떨어져 위치할 수도 있다. 일실시예로서, 현재 블록의 상단에 2개의 샘플 라인이 있는 경우, 상기 2개의 라인들 중 가장 하단의 샘플 라인부터 위쪽 방향으로 각각 제1, 제2 샘플 라인이라고 명명한다. 이 경우, 제1 샘플 라인과 제2 샘플 라인은 서로 접해 있거나, 소정의 거리만큼 떨어져 위치할 수도 있다. 여기서, 소정의 거리는 i개의 라인 길이(즉, 너비 또는 높이)로 표현될 수 있다. 여기서, i는 0, 1, 2, 3 또는 그 이상의 자연수일 수 있다. 일실시예로서, 현재 블록의 상단에 3개의 샘플 라인이 있는 경우, 상기 복수개의 샘플 라인들 중 가장 하단의 샘플 라인부터 위쪽 방향으로 각각 제1, 제2, 제3 샘플 라인이라 명명한다. 이 경우, 제1 샘플 라인과 제2 샘플 라인은 서로 접하고, 제2 샘플 라인과 제3 샘플 라인은 서로 접할 수 있다. 또는, 제1 내지 제3 샘플 라인은 전술한 소정의 거리만큼 떨어져 위치할 수도 있다. 이때, 제1 및 제2 샘플 라인 사이의 간격(d1)과 제2 및 제3 샘플 라인 사이의 간격(d2)이 동일한 간격을 가질 수 있다. 또는, d1은 d2보다 크도록 설정될 수 있고, 반대로 d1은 d2보다 작도록 설정될 수도 있다. 일실시예로서, 현재 블록의 상단에 4개 이상의 샘플 라인이 있는 경우, 상기 4개의 샘플 라인은 상기 3개의 샘플 라인의 경우와 같은 방법으로 결정될 수 있다. 또한, 본 실시예는 상단에 위치한 샘플 라인뿐만 아니라 좌측에 위치한 샘플 라인에도 동일하게 적용될 수 있으며, 자세한 설명은 생략하기로 한다.
상기 참조 샘플은, 주변 영역에 속한 샘플 전부 또는 일부를 이용하여 유도될 수 있다.
(실시예 1) 상기 주변 영역의 일부 샘플은, 부호화/복호화 장치에 기-약속된 위치의 샘플일 수 있다. 상기 기-약속된 위치는, 상단 샘플 라인의 최좌측 샘플, 최우측 샘플 또는 중앙 샘플 중 적어도 하나를 포함할 수 있다. 상기 기-약속된 위치는, 좌측 샘플 라인의 최상단 샘플, 최하단 샘플 또는 중앙 샘플 중 적어도 하나를 포함할 수 있다. 또는, 기-약속된 위치는, 상단 및/또는 좌측 샘플 라인의 짝수번째 샘플 중 적어도 하나를 포함하거나, 홀수번째 샘플 중 적어도 하나를 포함할 수 있다. 또는, 기-약속된 위치는, 상단 샘플 라인의 샘플 중 j배수의 x 좌표를 가진 샘플을 포함하거나, 좌측 샘플 라인의 샘플 중 j배수의 y 좌표를 가진 샘플을 포함할 수도 있다. 여기서, j는 2, 3, 4 또는 그 이상의 자연수일 수 있다.
(실시예 2) 상기 주변 영역의 일부 샘플은, 부호화 정보에 기초하여 가변적으로 결정될 수도 있다. 여기서, 부호화 정보는 전술한 바와 같으며, 자세한 설명은 생략하기로 한다.
상기 실시예 1 또는 2 중 어느 하나가 선택적으로 이용될 수도 있고, 실시예 1 및 2의 조합에 기초하여 일부 샘플이 특정될 수도 있다. 이때, 전술한 바와 같이, 일부 샘플들 간의 간격이 균등하게 설정될 수 있으나, 이에 한정되지 아니하며, 일부 샘플들 간의 간격이 균등하지 않게 설정될 수도 있다.
상기 일부 샘플의 개수는, 부호화/복호화 장치에 기-정의된 1개, 2개, 3개, 4개 또는 그 이상일 수 있다. 또한, 일부 샘플의 개수는, 현재 블록의 좌측 주변 영역과 상단 주변 영역에 대해서 각각 상이하게 정의될 수 있다. 예를 들어, 현재 블록의 너비가 높이보다 큰 경우, 상단 주변 영역에 속한 일부 샘플의 개수(numSamA)는 좌측 주변 영역에 속한 일부 샘플의 개수(numSamL)보다 클 수 있다. 반대로, 현재 블록의 너비가 높이보다 작은 경우, numSamA는 numSamL보다 작을 수 있다. 또는, 일부 샘플의 개수는 전술한 부호화 정보에 기초하여 가변적으로 결정될 수도 있다.
상기 주변 영역의 샘플은 예측 샘플 또는 복원 샘플일 수 있다. 상기 예측 샘플은 인트라 예측 또는 인터 예측을 통해 획득될 수 있다. 상기 복원 샘플은 인-루프 필터가 적용되기 전 복원 샘플일 수도 있고, 인-루프 필터가 적용된 복원 샘플일 수도 있다.
한편, 참조 샘플은 주변 영역의 샘플로 그대로 유도되거나(CASE 1), 주변 영역의 샘플을 다운샘플링하여 유도될 수 있다(CASE 2). 상기 CASE 1과 2 중 어느 하나가 선택적으로 이용될 수 있다. 상기 선택은, 전술한 부호화 정보에 기초하여 수행될 수 있다. 예를 들어, 현재 블록의 크기가 소정의 문턱값보다 작은 경우, CASE 1에 기초하여 참조 샘플이 유도되고, 그렇지 않은 경우, CASE 2에 기초하여 참조 샘플이 유도될 수 있다. 여기서, 크기는 현재 블록의 너비, 높이, 너비와 높이의 최대값/최소값, 너비와 높이의 비율 또는 너비와 높이의 곱 중 어느 하나로 표현될 수 있다. 일예로, 현재 블록이 8x8보다 작은 경우, 참조 샘플은 주변 영역의 샘플로 유도되고, 그렇지 않은 경우, 참조 샘플은 주변 영역의 샘플을 다운샘플링하여 유도될 수 있다. 상기 다운샘플링 방법에 대해서는 도 6 및 도 7을 참조하여 자세히 살펴보도록 한다.
도 5를 참조하면, 매트릭스 기반 인트라 예측을 위한 매트릭스를 결정할 수 있다(S520).
상기 매트릭스는, S500에서 결정된 인트라 예측 모드 또는 현재 블록의 크기 중 적어도 하나에 기초하여 결정될 수 있다. 또는, 상기 매트릭스는, 현재 블록의 인트라 예측 모드만을 고려하여 결정되거나, 현재 블록의 크기만을 고려하여 결정되도록 제한될 수도 있다. 상기 크기는, 너비 또는 높이 중 어느 하나, 너비와 높이 중 최소값/최대값, 너비와 높이의 합, 현재 블록에 속한 샘플의 개수 등으로 표현될 수 있다. 다만, 이에 한정되지 아니하며, 상기 매트릭스는, 현재 블록에 관한 부호화 정보를 더 고려하여 결정될 수 있다. 여기서, 부호화 정보는 전술한 바와 같으며, 자세한 설명은 생략하기로 한다.
구체적으로, 부호화/복호화 장치에 기-약속된 매트릭스는 복수의 매트릭스 그룹으로 그룹핑될 수 있다. 상기 복수의 매트릭스 그룹은, 제1 매트릭스 그룹, 제2 매트릭스 그룹, …, 제m 매트릭스 그룹으로 구성될 수 있다. 여기서, m은 2, 3, 4, 5 또는 그 이상의 자연수일 수 있다. 현재 블록의 크기에 기초하여, 현재 블록은 복수의 매트릭스 그룹 중 어느 하나를 선택적으로 이용할 수 있다. 예를 들면, 현재 블록의 크기가 4x4인 경우에 제1 매트릭스 그룹이 이용되고, 현재 블록의 크기가 8x4, 4x8, 및 8x8인 경우에 제2 매트릭스 그룹이 이용되며, 그리고 그 외의 경우에 제3 매트릭스 그룹이 이용될 수 있다. 현재 블록의 크기에 기초하여 선택된 매트릭스 그룹은, 하나 또는 그 이상의 매트릭스 후보를 포함할 수 있다. 복수의 매트릭스 후보 중 어느 하나가 현재 블록의 매트릭스로 결정될 수 있다. 상기 결정은, 전술한 현재 블록의 부호화 정보(e.g., 인트라 예측 모드)에 기초하여 수행될 수 있다.
상기 기-약속된 매트릭스의 개수는 전술한 기-정의된 인트라 예측 모드의 개수와 동일할 수 있다. 또한, 상기 기-약속된 매트릭스의 개수는 상기 기-정의된 인트라 예측 모드의 개수보다 적을 수 있다. 이 경우, 하나의 매트릭스에 복수개의 인트라 예측 모드가 매칭될 수 있다. 예를 들면, 하나의 매트릭스가 2개의 인트라 예측 모드와 매칭될 수 있다. 이 경우, 상기 기-약속된 매트릭스의 개수는 기-정의된 인트라 예측 모드의 개수의 1/2배 값을 가질 수 있다. 다만, 이에 한정되지 아니하며, 하나의 매트릭스에 매칭되는 인트라 예측 모드의 개수는 3개, 4개, 5개, 6개 또는 그 이상일 수 있다.
일실시예로서, 상기 매칭은, 인트라 예측 모드의 방향성 및/또는 대칭성을 고려하여 결정될 수 있다.
기-정의된 인트라 예측 모드는 소정의 각도를 가진 방향성 모드를 포함할 수 있다. 방향성 모드는 수평 방향성을 가진 제1 모드 그룹과 수직 방향성을 가진 제2 모드 그룹으로 구분될 수 있다. 방향성 모드의 개수가 65개인 경우를 가정하면, 상기 제1 모드 그룹은 인덱스 2 내지 인덱스 34 사이에 속하는 모드로 구성되고, 상기 제2 모드 그룹은 인덱스 34 내지 인덱스 66 사이에 속하는 모드로 구성될 수 있다.
부호화/복호화 장치는, 제1 모드 그룹에 대한 매트릭스만을 정의하고, 제2 모드 그룹은 제1 모드 그룹에 대해 정의된 매트릭스를 동일하게 이용할 수 있다. 반대로, 부호화/복호화 장치는, 제2 모드 그룹에 대한 매트릭스만을 정의하고, 제1 모드 그룹은 제2 모드 그룹에 대해 정의된 매트릭스를 동일하게 이용할 수 있다. 이 경우, 기-약속된 매트릭스의 개수는 기-정의된 인트라 예측 모드 개수의 1/2배 값을 가질 수 있다. 일실시예로서, 상기 대칭성을 가지는 모드 그룹이 x개인 경우, 상기 기-약속된 매트릭스의 개수는 기-정의된 인트라 예측 모드 개수의 1/x배 값을 가질 수 있다. 여기서 x는 3,4 또는 그 이상일 수 있다.
상기 대칭성은, 각도 -45°를 가진 인트라 예측 모드를 기준으로, 수직 방향성을 가진 모드와 수평 방향성을 가진 모드 간의 예측 각도의 대칭성을 포함할 수 있다. 여기서, 방향성을 가진 인트라 예측 모드는 각 방향성에 따른 예측 각도(PredAngle)를 가진다. 여기서, 수직 방향성을 가진 모드는, 상기 각도가 -45°인 인트라 예측 모드를 기준으로, 해당 모드와 해당 모드부터 x축 방향으로 -45°<(PredAngle)≤45°의 각도를 가지는 모드들은 포함할 수 있다. 여기서, 수평 방향성 가진 모드는, 상기 각도가 -45°인 인트라 예측 모드를 기준으로, 해당 모드를 제외하고 해당 모드로부터 y축 방향으로 -45°<(PredAngle)≤45°의 각도를 가지는 모드들을 포함할 수 있다.
도 5를 참조하면, 참조 샘플 및 매트릭스를 기반으로 현재 블록을 예측할 수 있다(S530).
S510에서 참조 샘플이 결정되고, S520에서 매트릭스가 결정되면, 부호화/복호화 장치는 상기 참조 샘플 및 매트릭스를 기반으로 현재 블록을 예측할 수 있다.
상기 현재 블록을 예측하는 단계는 상기 참조 샘플에 상기 매트릭스를 적용하여 DS 블록의 예측 샘플(이하, 제1 예측 샘플이라 함)을 획득하는 단계를 포함할 수 있다. 상기 DS 블록은 현재 블록을 의미할 수도 있고, 다운샘플링된 현재 블록을 의미할 수도 있다. 즉, DS 블록은 현재 블록과 동일한 크기를 가질 수도 있고, 현재 블록의 크기(너비 또는 높이 중 적어도 하나)의 1/2, 1/4, 1/8 또는 1/16인 크기를 가질 수도 있다. 예를 들어, 현재 블록이 4x4, 4x8 또는 8x4 블록인 경우, DS 블록은 4x4 블록일 수 있다. 또는, 현재 블록이 8x8, 8x16 또는 16x8 블록인 경우, DS 블록은 4x4 또는 8x8 블록일 수 있다. 또는, 현재 블록이 16x16보다 크거나 같은 경우, DS 블록은 8x8 또는 16x16 블록일 수 있다. 다만, DS 블록은 정방형 블록에 한하지 않으며, 비정방형 블록일 수도 있다. 또는, DS 블록은 정방형 블록으로 제한될 수도 있다. 여기서, 상기 매트릭스의 적용은 상기 참조 샘플에 상기 매트릭스로부터 얻는 가중치를 곱하는 것을 포함할 수 있다.
상기 제1 예측 샘플을 얻는 단계는 offset 값을 더하는 단계 또는 필터링 단계 중 적어도 하나를 포함할 수 있다.
상기 제1 예측 샘플을 얻는 단계는, 제1 예측 샘플을 재배열하는 단계를 더 포함할 수도 있다. 상기 재배열은, 하나의 매트릭스에 복수개의 인트라 예측 모드가 매칭되는 경우에 한하여 수행될 수 있다.
또는, 상기 재배열은, 현재 블록의 인트라 예측 모드가 수평 방향성을 가진 제1 모드 그룹에 속하는 경우에 한하여 수행될 수 있다. 예를 들어, 현재 블록의 인트라 예측 모드가 수평 방향성을 가진 제1 모드 그룹에 속하는 경우, DS 블록의 제1 예측 샘플에 대한 재배열을 수행하고, 현재 블록의 인트라 예측 모드가 수직 방향성을 가진 제2 모드 그룹에 속하는 경우, DS 블록의 제1 예측 샘플에 대한 재배열을 수행하지 않을 수 있다.
반대로, 상기 재배열은, 현재 블록의 인트라 예측 모드가 수직 방향성을 가진 제2 모드 그룹에 속하는 경우에 한하여 수행될 수 있다. 예를 들어, 현재 블록의 인트라 예측 모드가 수평 방향성을 가진 제1 모드 그룹에 속하는 경우, DS 블록의 제1 예측 샘플에 대한 재배열을 수행하지 않고, 현재 블록의 인트라 예측 모드가 수직 방향성을 가진 제2 모드 그룹에 속하는 경우, DS 블록의 제1 예측 샘플에 대한 재배열을 수행할 수 있다.
상기 재배열은, 다음 수학식 1과 같이 수행될 수 있다. 여기서, x는 x축 좌표값, y는 y축 좌표 값을 의미할 수 있다. 즉, 상기 재배열은 (x,y) 좌표의 제1 예측 샘플을 (y,x) 좌표에 할당하는 과정을 의미할 수 있다.
[수학식 1]
제1_예측_샘플[x][y] = 제1_예측_샘플[y][x]
또는, 본 발명에 따른 재배열은, 제1 예측 샘플로 구성된 DS 블록은 소정의 각도로 회전하는 과정을 의미할 수도 있다. 여기서, 소정의 각도는, 시계 방향으로 90도 또는 180도를 의미할 수도 있고, 반시계 방향으로 90도 또는 180도를 의미할 수도 있다.
상기 현재 블록을 예측하는 단계는, 상기 현재 블록에 인접한 기-복원된 샘플 또는 상기 제1 예측 샘플 중 적어도 하나를 기반으로 업샘플링을 수행하여 제2 예측 샘플을 획득하는 단계를 더 포함할 수 있다.
상기 업샘플링에 있어서, 상기 업샘플링의 수행 여부 또는 상기 업샘플링의 방법 중 적어도 하나는 현재 블록의 부호화 정보에 기초하여 결정될 수 있다. 예를 들어, 상기 업샘플링의 수행 여부 또는 상기 업샘플링의 방법 중 적어도 하나는, 상기 제1 예측 샘플로 구성된 DS 블록의 크기와 현재 블록의 크기를 기반으로 결정될 수 있다. 상기 블록 크기는, 너비 또는 높이 중 어느 하나, 너비와 높이 중 최소값/최대값, 너비와 높이의 합, 블록에 속한 샘플의 개수 등으로 표현될 수 있다.
상기 업샘플링 수행 여부는 상기 제1 예측 샘플로 구성된 DS 블록의 크기가 상기 현재 블록의 크기보다 작은 경우에만 수행되도록 결정될 수 있다.
상기 업샘플링 수행 방법은 상기 제1 예측 샘플로 구성된 DS 블록의 크기와 상기 현재 블록의 크기의 비율을 이용하여 상기 제1 예측 샘플을 상기 현재 블록 내의 소정의 위치에 할당하는 단계와, 상기 현재 블록 내 나머지 영역을 보간하는 단계를 포함할 수 있다. 상기 나머지 영역은, 현재 블록 내에서 상기 제1 예측 샘플이 할당된 영역을 제외한 영역을 의미할 수 있다. 상기 제1 예측 샘플의 할당 및 나머지 영역에 대한 보간 방법에 대해서는 도 8 내지 도 10을 참조하여 자세히 살펴보기로 한다.
도 6은 본 발명이 적용되는 일실시예로서, 주변 영역을 다운샘플링하여 참조 샘플을 결정하는 방법을 도시한 것이다.
도 6을 참조하면, 도 6-(a)는 인트라 예측을 위한 주변 영역이 현재 블록의 좌측 및 상단에 위치하는 경우를 도시한다. 또한, 일실시예로서, 현재 블록의 좌측에 위치한 샘플 라인은 현재 블록에 접해있고, 수직 방향의 1개 샘플 라인으로 구성된다. 현재 블록의 상단에 위치한 샘플 라인은 현재 블록에 접해있고, 수평 방향의 1개 샘플 라인으로 구성된다.
상기 참조 샘플은 상기 현재 블록의 주변 영역을 다운샘플링하여 형성된 다운샘플링된 영역을 포함할 수 있다.
상기 다운샘플링된 영역은 상기 주변 영역에 속한 전체 또는 일부 샘플의 평균값, 최대값, 최소값, 최빈값, 또는 필터링된 값으로 유도될 수 있다.
상기 평균값으로 유도되는 경우, 상기 다운샘플링된 영역은 서로 다른 N개의 샘플들의 평균값을 다운샘플링된 영역의 샘플에 할당하는 방법으로 형성될 수 있다.
상기 서로 다른 N개의 샘플은 연속적으로 배열된 샘플이거나, 일정 간격을 두고 상호 떨어져 있을 수 있다. 상기 일정 간격은 하나 또는 그 이상의 샘플 크기의 간격이다. 상기 간격이 복수개인 경우, 상기 복수개의 간격들은 균등하거나 불균등할 수 있다. (여기서, N은 2이상이고, 상기 주변 영역에 속한 샘플들의 총 개수'이하이다.) 또한, 상기 서로 다른 N개의 샘플들의 집합을 샘플 그룹이라고 부르기로 한다. 이때, 제1 샘플 그룹과 제2 샘플 그룹은 겹칠 수도 있고, 겹치지 않을 수도 있다.
일실시예로서, 도 6은, N이 2이고, 2개의 샘플 그룹이 서로 겹지치 않으며, 각 샘플 그룹에 속하는 2개의 샘플들의 평균값을 다운샘플링된 영역 내 1개의 샘플에 각각 할당하여 다운샘플링 하는 것을 도시한다.
또는, 연속적인 3개의 샘플(S1, S2, S3)로 제1 샘플 그룹이 구성될 수 있고, 제1 샘플 그룹에 속한 3개의 샘플의 평균값을 다운샘플링된 영역의 샘플(DS1)에 할당할 수 있다. 연속적인 3개의 샘플(S2, S3, S4)로 제2 샘플 그룹이 구성될 수 있고, 제2 샘플 그룹에 속한 3개의 샘플의 평균값을 다운샘플링된 영역의 샘플(DS2)에 할당할 수 있다.
또는, 제1 샘플 그룹에 속한 2개의 샘플(S1, S2) 중 최소값 또는 최대값을 결정하고, 이를 다운샘플된 영역의 샘플(DS1)에 할당할 수 있다. 마찬가지로, 제2 샘플 그룹에 속한 2개의 샘플(S3, S4) 중 최소값 또는 최대값을 결정하고, 이를 다운샘플된 영역의 샘플(DS2)에 할당할 수 있다. 이는, 제1/제2 샘플 그룹이 3개의 샘플로 구성된 경우에도 동일하게 이용될 수 있다.
또는, 상단 주변 영역에 있어서, 제1 샘플 그룹에 속한 복수의 샘플 중 기-정의된 위치의 샘플이 다운샘플링된 영역의 샘플(DS1)에 할당되고, 제2 샘플 그룹에 속한 복수의 샘플 중 기-정의된 위치의 샘플이 다운샘플링된 영역의 샘플(DS2)에 할당될 수 있다. 상기 기-정의된 위치는, 부호화/복호화 장치에 기-약속된 고정된 위치를 의미하며, 일예로 최좌측, 최우측 또는 중앙 위치 중 어느 하나일 수 있다. 좌측 주변 영역에서도, 각 샘플 그룹에 속한 복수의 샘플 중 기-정의된 위치의 샘플이 다운샘플링된 영역의 샘플에 각각 할당될 수 있다. 이때, 기-정의된 위치는, 최상단, 최하단 또는 중앙 위치 중 어느 하나일 수 있다.
도 7은 본 발명이 적용되는 일실시예로서, 가중 평균에 기반한 다운샘플링 방법을 도시한다.
본 실시예에서, 평균값은
Figure PCTKR2019011554-appb-I000001
(이하, 제1 평균식)으로 계산되거나,
Figure PCTKR2019011554-appb-I000002
(이하, 제2 평균식)으로 계산될 수 있다.
도 7-(a)은, 전술한 샘플 그룹이 3개의 샘플로 구성된 경우이다. 이 경우, 3개의 샘플에 적용되는 가중치는 1:2:1의 비율로 결정될 수 있다. 도 7-(b)와 같이 샘플 그룹이 5개의 샘플로 구성된 경우, 상기 가중치는 1:1:4:1:1의 비율로 걸정될 수 있다. 도 7-(c)와 같이 샘플 그룹이 6개의 샘플로 구성된 경우, 상기 가중치는, 좌측 상단을 시작점으로 하여, Z방향으로, 1:2:1:2:2:1 또는 1:2:2:1:2:1의 비율로 결정될 수 있다. 또한, 상기 도 7-(a)와 (c)는 상단 주변 영역에 적용되는 가중치를 도시하고 있으나, 이는 좌측 주변 영역에도 동일하게 적용될 수 있다.
상기 평균값은, 상기 제1 평균식 또는 제2 평균식으로 계산된 복수개의 평균값들에 소정의 연산을 적용하여 나온 결과값을 포함할 수도 있다. 여기서, 소정의 연산은 전술한 제1 평균식 또는 제2 평균식일 수 있다. 예를 들면, 샘플 그룹에 3개의 샘플(즉, 제1 내지 제3 샘플)이 속한 경우, 제1 샘플과 제2 샘플 간의 평균값(제1 값), 그리고 제2 샘플과 제3 샘플 간의 평균값(제2 값)을 각각 산출할 수 있다. 상기 평균값은, 산출된 제1 값 및 제2 값 간의 평균값으로 유도될 수 있다.
전술한 다운샘플링 방법은, 상단 주변 영역에 대해서만 적용될 수도 있고, 반대로 좌측 주변 영역에 대해서만 적용될 수도 있다. 또는, 도 6에 따른 다운샘플링 방법(이하, 제1 방법이라 함)은 상단 또는 좌측 주변 영역 중 어느 하나에 적용되고, 도 7에 따른 다운샘플링 방법(이하 제2 방법이라 함)은 상단 또는 좌측 주변 영역 중 다른 하나에 적용될 수 있다.
또한, 현재 블록의 크기/형태를 고려하여, 제1 방법 또는 제2 방법 중 적어도 하나를 선택적으로 이용할 수 있다. 예를 들어, 현재 블록의 너비가 소정의 문턱값보다 큰 경우, 현재 블록의 상단 주변 영역에는 제1 방법이 적용되고, 그렇지 않은 경우, 제2 방법이 적용될 수 있다. 현재 블록의 높이도 동일한 방식으로 다운샘플링이 수행될 수 있다. 또는, 현재 블록이 비정방향인 경우, 상단 또는 좌측 주변 영역 중 어느 하나에는 제1 방법이 적용되고, 다른 하나에는 제2 방법이 적용될 수 있다. 이때, 현재 블록의 너비가 높이보다 큰 경우, 상단 주변 영역에 제1 방법이, 좌측 주변 영역에 제2 방법이 각각 적용될 수 있다. 반대로, 현재 블록의 너비가 높이보다 작은 경우, 상단 주변 영역에 제2 방법이, 좌측 주변 영역에 제1 방법이 각각 적용될 수 있다. 현재 블록의 정방형인 경우, 상단 및 좌측 주변 영역에 동일한 다운샘플링 방법이 적용될 수 있으며, 여기서 다운샘플링 방법은 상기 제1 방법으로 제한될 수도 있다.
도 8은 본 발명이 적용되는 일실시예로서, 제1 예측 샘플의 할당 및 나머지 영역에 대한 보간 방법을 도시한 것이다.
도 8-(a) 를 참조하면, DS 블록의 예측 샘플은, 현재 블록 내 소정의 위치의 예측 샘플에 할당될 수 있다. 여기서, 소정의 위치는, 현재 블록과 DS 블록 간의 크기 비율을 고려하여 결정될 수 있다. 예를 들어, DS 블록과 현재 블록 간 예측 샘플의 대응 관계는 다음 수학식 2와 같이 정의될 수 있다.
[수학식 2]
Figure PCTKR2019011554-appb-I000003
여기서, r은 현재 블록과 DS 블록 간의 크기 비율을 의미하고,, x,y는 각각 DS 블록 내 제1 예측 샘플의 x축,y축 좌표이다. 제1 예측_샘플_curBLK은 현재 블록 내 제1 예측 샘플의 위치를 의미하고, 제1_예측_샘플_dsBLK는 DS 블록 내 제1 예측 샘플의 위치를 의미할 수 있다.
상기 보간 단계는, 도 8-(b)를 참조하면, 현재 블록 내에서 상기 제1 예측 샘플이 할당되지 않은 샘플(이하, 보간 대상 샘플)은, 현재 블록에 할당된 상기 제1 예측 샘플 또는 상기 현재 블록에 인접한 기-복원된 샘플 중 적어도 하나(이하, 보간 참조 샘플)를 이용하여 유도될 수 있다. 또한, 상기 보간 참조 샘플은, 현재 보간 대상 샘플 이전에 보간을 통해 생성된 예측 샘플(즉, 이전 보간 대상 샘플)을 더 포함할 수도 있다.
상기 현재 블록에 인접한 기-복원된 샘플의 위치 및 범위는, 전술한 참조 샘플과 동일하므로 자세한 설명은 생략한다.
보간 대상 샘플의 위치에 따라서, 상기 보간 참조 샘플은 복수의 제1 예측 샘플로 구성될 수도 있고, 적어도 하나의 제1 예측 샘플과 적어도 하나의 기-복원된 주변 샘플로 구성될 수도 있다. 상기 기-복원된 주변 샘플은, 보간 대상 샘플과 동일한 x 좌표 또는 y 좌표를 가진 샘플 중 어느 하나가 선택적으로 이용될 수도 있고, 보간 대상 샘플과 동일한 x 좌표 또는 y 좌표 중 적어도 하나가 동일한 복수의 샘플을 이용할 수도 있다. 상기 선택은, 보간 대상 샘플의 위치에 기반하여 수행될 수 있다. 예를 들어, 보간 대상 샘플이 제1 예측 샘플과 동일한 x 좌표를 가진 경우, 기-복원된 주변 샘플은 보간 대상 샘플과 동일한 x 좌표를 가진 샘플만이 포함할 수 있다. 반대로, 보간 대상 샘플이 제1 예측 샘플과 동일한 y 좌표를 가진 경우, 기-복원된 주변 샘플은 보간 대상 샘플과 동일한 y 좌표를 가진 샘플만을 포함할 수 있다. 또는, 기-복원된 주변 샘플은, 보간 대상 샘플과 동일한 수평 및 수직 라인에 위치한 복수의 샘플을 포함할 수도 있다.
상기 보간 대상 샘플은, 복수의 보간 참조 샘플의 대표값으로 유도될 수 있으며, 여기서, 대표값은 평균값, 최소값, 최대값, 최빈값, 또는 중간값 중 적어도 하나를 포함할 수 있다.
상기 평균값은
Figure PCTKR2019011554-appb-I000004
(이하, 제1 평균식)으로 계산되거나,
Figure PCTKR2019011554-appb-I000005
(이하, 제2 평균식)으로 계산될 수 있다. 제2 평균식에 따른 가중치는, 보간 대상 샘플과 보간 참조 샘플 간의 상대적/절대적 거리에 기초하여 결정될 수 있으며, 이는 도 9를 참조하여 자세히 살펴 보기로 한다.
도 9는 본 발명이 적용되는 일실시예로서, 보간 단계에서 거리에 대한 가중치를 부여하는 것을 도시한 것이다.
본 발명에 따른 가중치는 보간 대상 샘플으로부터 보간 참조 샘플까지의 거리를 기반으로 결정되는 가중치를 포함할 수 있다. 일실시예로, 도 9를 참조하면, 제1 보간 대상 블록(910)을 보간하는 경우, 제1 보간 대상 샘플(910)로부터 제1 보간 참조 샘플(911)과 제2 보간 참조 샘플(912)의 각각의 거리의 비는 3:1이므로, 제1 보간 참조 샘플(911)과 제2 보간 참조 샘플에 적용되는 가중치는 비는 1:3일 수 있다. 제2 보간 대상 샘플(920)을 보간하는 경우, 제2 보간 대상 샘플(920)로부터 제1 보간 참조 샘플(921)과 제2 보간 참조 샘플(922)의 각각의 거리의 비는 1:1이므로, 제1 및 제2 보간 참조 블록(921, 922)에 적용되는 가중치의 비는 1:1일 수 있다.
또한, 본 발명에 따른 보간 필터는 방향성을 가질 수 있다. 상기 방향성은 수직, 수평, 지그재그, 대각선 등의 방향을 포함할 수 있다.
상기 보간 단계는, 소정의 우선 순서에 기초하여 수행될 수 있다. 상기 우선 순서는 수직 방향으로 보간 후 수평 방향으로 보간하는 경우(제1 순서) 또는 수평 방향으로 보간 후 수직 방향으로 보간하는 경우(제2 순서) 중 어느 하나일 수 있다. 또는 수직 방향 및 수평 방향을 병행하여 보간(제3 순서)이 수행될 수도 있다.
현재 블록은 전술한 제1 순서 내지 제3 순서 중 어느 하나만을 이용하여 보간될 수도 있고, 제1 순서 내지 제3 순서 중 적어도 2개의 조합을 이용하여 보간될 수도 있다. 보간 순서에 대해서는 도 10을 참조하여 자세히 살펴 보도록 한다.
도 10은 본 발명이 적용되는 일실시예로서, 보간 단계의 순서를 도시한 것이다.
도 10-(a)는, 도 9에서의 제1 순서에 관한 것이다. 구체적으로, 제1 예측 샘플이 속한 수직 라인을 먼저 보간하고, 보간된 라인과 현재 블록 좌측의 보간 참조 샘플을 기반으로, 수평 라인을 보간할 수 있다.
도 10-(b)는, 도 9에서의 제2 순서에 관한 것이다. 구체적으로, 제1 예측 블록이 속한 수평 라인을 먼저 보간하고, 보간된 라인과 현재 블록 상단의 보간 참조 샘플을 기반으로, 수직 라인을 보간할 수 있다.
도 10-(c)는 도 9에서의 제3 순서에 관한 것이다. 먼저, 제1 예측 샘플이 속한 수직 및 수평 라인을 보간할 수 있다. 그런 다음, 보간되지 않은 남은 샘플에 대해서 보간을 수행하며, 이때 보간은 수직 라인으로만 수행되거나, 수평 라인으로만 수행되거나, 또는 수직 및 수평 라인으로 수행될 수 있다. 상기 수직 및 수평 라인으로 보간하는 경우, 하나의 보간 대상 샘플은 수직 라인으로의 제1 보간 값 및 수평 라인으로의 제2 보간 값을 모두 가질 수 있다. 이 경우, 제1 보간 값과 제2 보간 값 간의 대표값을 상기 보간 대상 샘플에 할당할 수 있다. 여기서, 대표값은 평균값, 최소값, 최대값, 최빈값, 또는 중간값으로 유도될 수 있다.
상기 보간 순서는, 부호화/복호화 장치에 기-약속된 순서일 수도 있고, 현재 블록의 부호화 정보에 기초하여 선택적으로 결정될 수도 있다. 여기서, 부호화 정보는 전술한 바와 같은바, 여기서 자세한 설명은 생략하기로 한다.
상기 순서는 블록 크기에 기반하여 결정될 수 있다. 상기 블록 크기는 너비 또는 높이 중 어느 하나, 너비와 높이 중 최소값/최대값, 너비와 높이의 합, 블록에 속한 샘플의 개수 등으로 표현될 수 있다.
예를 들면, 현재 블록의 크기가 소정의 문턱값보다 큰 경우에는 상기 제1 보간을 수행할 수 있고, 그렇지 않은 경우에는 상기 제2 보간을 수행할 수 있다. 이와 달리, 현재 블록의 크기가 소정의 문턱값보다 큰 경우에는 상기 제2 보간을 수행할 수 있고, 그렇지 않은 경우에는 상기 제1 보간을 수행할 수 있다. 상기 문턱값은, 8, 16, 32 또는 그 이상의 자연수일 수 있다.

Claims (7)

  1. 현재 블록의 인트라 예측 모드를 결정하는 단계;
    상기 현재 블록의 인트라 예측을 위한 참조 샘플을 결정하는 단계;
    상기 인트라 예측 모드를 기반으로, 소정의 매트릭스를 결정하는 단계; 및
    상기 참조 샘플 및 매트릭스를 기반으로, 상기 현재 블록을 예측하는 단계를 포함하는, 비디오 신호 처리 방법.
  2. 제1항에 있어서,
    상기 참조 샘플을 결정하는 단계는,
    상기 현재 블록의 주변 영역을 결정하는 단계; 및
    상기 결정된 주변 영역을 다운샘플링하는 단계를 포함하는, 비디오 신호 처리 방법.
  3. 제2항에 있어서,
    상기 주변 영역은 복수의 샘플 그룹으로 구분되고,
    상기 샘플 그룹은 하나 또는 그 이상의 샘플로 구성되며,
    상기 샘플 그룹의 대표값이 상기 참조 샘플로 결정되고,
    상기 대표값은 평균값, 최소값, 최대값, 최빈값, 또는 중간값 중 어느 하나인, 비디오 신호 처리 방법.
  4. 제1항에 있어서,
    상기 매트릭스는, 상기 현재 블록의 부호화 정보를 더 고려하여 결정되고,
    상기 부호화 정보는, 상기 현재 블록의 크기, 형태, 인트라 예측 모드의 각도 또는 방향성을 포함하는, 비디오 신호 처리 방법.
  5. 제1항에 있어서,
    상기 현재 블록을 예측하는 단계는,
    상기 참조 샘플에 상기 매트릭스를 적용하여 예측 블록을 생성하는 단계를 포함하는, 비디오 신호 처리 방법.
  6. 제5항에 있어서,
    상기 현재 블록을 예측하는 단계는,
    상기 생성된 예측 블록의 예측 샘플 전부 또는 일부를 재배열하는 단계를 더 포함하는, 비디오 신호 처리 방법.
  7. 제5항에 있어서,
    상기 현재 블록을 예측하는 단계는,
    상기 예측 블록 또는 상기 현재 블록에 인접한 기-복원된 샘플 중 적어도 하나를 기반으로, 상기 현재 블록을 보간하는 단계를 더 포함하는, 비디오 신호 처리 방법.
PCT/KR2019/011554 2018-09-07 2019-09-06 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치 WO2020050684A1 (ko)

Priority Applications (21)

Application Number Priority Date Filing Date Title
JP2021512701A JP7448526B2 (ja) 2018-09-07 2019-09-06 イントラ予測を利用した画像符号化/復号化方法及び装置
CN202310426208.9A CN116405679A (zh) 2018-09-07 2019-09-06 利用帧内预测的图像编码/解码方法以及装置
CN201980056309.3A CN112806001A (zh) 2018-09-07 2019-09-06 利用帧内预测的图像编码/解码方法以及装置
EP19858139.9A EP3833021A4 (en) 2018-09-07 2019-09-06 IMAGE ENCODING / DECODING METHOD AND DEVICE USING INTRAPREDICTION
SG11202102238SA SG11202102238SA (en) 2018-09-07 2019-09-06 Image encoding/decoding method and device using intra prediction
AU2019336038A AU2019336038A1 (en) 2018-09-07 2019-09-06 Image encoding/decoding method and device using intra prediction
BR112021004024-2A BR112021004024A2 (pt) 2018-09-07 2019-09-06 método para processamento de sinal de vídeo realizado por um decodificador, método para processamento de sinal de vídeo realizado por um codificador, aparelho de decodificação para processamento de sinal de vídeo, decodificador, aparelho de codificação para processamento de sinal de vídeo, codificador e mídia de armazenamento de computador
CA3111982A CA3111982C (en) 2018-09-07 2019-09-06 Image encoding/decoding method and device using intra prediction
CN202310429492.5A CN116389742A (zh) 2018-09-07 2019-09-06 利用帧内预测的图像编码/解码方法以及装置
MX2021002608A MX2021002608A (es) 2018-09-07 2019-09-06 Metodo y dispositivo de codificacion / descodificacion de imagenes utilizando intra prediccion.
CN202110462138.3A CN113225557B (zh) 2018-09-07 2019-09-06 利用帧内预测的图像编码/解码方法以及装置
IL281221A IL281221A (en) 2018-09-07 2021-03-03 Image encoding/decoding method and device using intraprediction
US17/192,733 US11477439B2 (en) 2018-09-07 2021-03-04 Method and device for video signal processing
PH12021550480A PH12021550480A1 (en) 2018-09-07 2021-03-05 Image encoding/decoding method and device using intra prediction
ZA2021/01569A ZA202101569B (en) 2018-09-07 2021-03-08 Image encoding/decoding method and device using intra prediction
US17/932,636 US20230026704A1 (en) 2018-09-07 2022-09-15 Method and device for video signal processing
US17/932,632 US20230024482A1 (en) 2018-09-07 2022-09-15 Method and device for video signal processing
US17/932,585 US20230026401A1 (en) 2018-09-07 2022-09-15 Method and device for video signal processing
US17/932,627 US20230024256A1 (en) 2018-09-07 2022-09-15 Method and device for video signal processing
JP2024029883A JP2024059905A (ja) 2018-09-07 2024-02-29 イントラ予測を利用した画像符号化/復号化方法及び装置
JP2024029923A JP2024059906A (ja) 2018-09-07 2024-02-29 イントラ予測を利用した画像符号化/復号化方法及び装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2018-0107255 2018-09-07
KR20180107255 2018-09-07

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/192,733 Continuation US11477439B2 (en) 2018-09-07 2021-03-04 Method and device for video signal processing

Publications (1)

Publication Number Publication Date
WO2020050684A1 true WO2020050684A1 (ko) 2020-03-12

Family

ID=69722959

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/011554 WO2020050684A1 (ko) 2018-09-07 2019-09-06 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치

Country Status (15)

Country Link
US (5) US11477439B2 (ko)
EP (1) EP3833021A4 (ko)
JP (3) JP7448526B2 (ko)
KR (1) KR20200028856A (ko)
CN (4) CN112806001A (ko)
AU (1) AU2019336038A1 (ko)
BR (1) BR112021004024A2 (ko)
CA (1) CA3111982C (ko)
CL (1) CL2021000527A1 (ko)
IL (1) IL281221A (ko)
MX (1) MX2021002608A (ko)
PH (1) PH12021550480A1 (ko)
SG (1) SG11202102238SA (ko)
WO (1) WO2020050684A1 (ko)
ZA (1) ZA202101569B (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL304953A (en) 2018-09-21 2023-10-01 Guangdong Oppo Mobile Telecommunications Corp Ltd A method of encoding/decoding image signals and a device therefor
IL307586A (en) 2018-09-21 2023-12-01 Guangdong Oppo Mobile Telecommunications Corp Ltd A method for encoding/decoding image signals and a device therefor
BR112021010706A2 (pt) 2018-12-07 2021-11-30 Samsung Electronics Co Ltd Método de decodificação de vídeo, método de codificação de vídeo, e dispositivo de decodificação de vídeo
BR112021006547A2 (pt) 2018-12-25 2021-07-06 Guangdong Oppo Mobile Telecommunications Corp Ltd método de previsão para decodificação, dispositivo de previsão para decodificação e mídia de armazenamento de computador que armazena um programa de previsão para decodificação
CN113840144B (zh) * 2019-03-25 2023-06-02 Oppo广东移动通信有限公司 图像分量的预测方法、编码器、解码器及计算机存储介质
CN113678453B (zh) 2019-04-12 2024-05-14 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文确定
WO2020211807A1 (en) 2019-04-16 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Matrix derivation in intra coding mode
CN113728647B (zh) 2019-05-01 2023-09-05 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
JP2022531147A (ja) 2019-05-01 2022-07-06 北京字節跳動網絡技術有限公司 フィルタリングを用いた行列ベースイントラ予測
KR20220011127A (ko) 2019-05-22 2022-01-27 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 업샘플링을 이용한 행렬 기반 인트라 예측
JP2022535726A (ja) 2019-05-31 2022-08-10 北京字節跳動網絡技術有限公司 行列ベースイントラ予測における制約されたアップサンプリングプロセス
CN114009043A (zh) * 2019-06-03 2022-02-01 Lg电子株式会社 基于矩阵的帧内预测装置和方法
CN117768652A (zh) 2019-06-05 2024-03-26 北京字节跳动网络技术有限公司 视频处理方法、装置、介质、以及存储比特流的方法
KR20220082847A (ko) 2019-10-28 2022-06-17 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 색상 성분에 기초한 신택스 시그널링 및 파싱
WO2022186620A1 (ko) * 2021-03-04 2022-09-09 현대자동차주식회사 인트라 예측의 예측 신호를 개선하는 비디오 코딩방법 및 장치
WO2023039859A1 (zh) * 2021-09-17 2023-03-23 Oppo广东移动通信有限公司 视频编解码方法、设备、系统、及存储介质
WO2023204624A1 (ko) * 2022-04-20 2023-10-26 엘지전자 주식회사 Cccm(convolutional cross-component model) 예측에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080082143A (ko) * 2007-03-07 2008-09-11 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
JP2017017742A (ja) * 2011-10-24 2017-01-19 インフォブリッジ ピーティーイー. エルティーディー. 映像復号化方法及び装置
WO2017068856A1 (ja) * 2015-10-21 2017-04-27 シャープ株式会社 予測画像生成装置、画像復号装置および画像符号化装置
KR20180000303A (ko) * 2016-06-22 2018-01-02 한국전자통신연구원 화면 내 예측 방법 및 장치
KR20180001479A (ko) * 2016-06-24 2018-01-04 주식회사 케이티 비디오 신호 처리 방법 및 장치

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8705619B2 (en) * 2010-04-09 2014-04-22 Sony Corporation Directional discrete wavelet transform (DDWT) for video compression applications
KR101772459B1 (ko) * 2010-05-17 2017-08-30 엘지전자 주식회사 신규한 인트라 예측 모드
US9258573B2 (en) 2010-12-07 2016-02-09 Panasonic Intellectual Property Corporation Of America Pixel adaptive intra smoothing
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US20120218432A1 (en) 2011-02-28 2012-08-30 Sony Corporation Recursive adaptive intra smoothing for video coding
KR20120103517A (ko) * 2011-03-10 2012-09-19 한국전자통신연구원 인트라 예측 방법 및 그 장치
US8861593B2 (en) * 2011-03-15 2014-10-14 Sony Corporation Context adaptation within video coding modules
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
RU2627033C1 (ru) * 2011-06-28 2017-08-03 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования и декодирования изображения, используя внутреннее предсказание
WO2013040287A1 (en) 2011-09-15 2013-03-21 Vid Scale, Inc. Systems and methods for spatial prediction
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
WO2015182342A1 (ja) * 2014-05-26 2015-12-03 シャープ株式会社 画像復号装置、および、画像符号化装置
GB2596767B (en) * 2015-08-28 2022-07-06 Kt Corp Method and device for processing video signal
US10819987B2 (en) * 2015-11-12 2020-10-27 Lg Electronics Inc. Method and apparatus for coefficient induced intra prediction in image coding system
WO2017209328A1 (ko) * 2016-06-03 2017-12-07 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측 방법 및 장치
US10484712B2 (en) * 2016-06-08 2019-11-19 Qualcomm Incorporated Implicit coding of reference line index used in intra prediction
CN113873239A (zh) * 2016-06-24 2021-12-31 株式会社Kt 用于处理视频信号的方法和设备
US10477240B2 (en) * 2016-12-19 2019-11-12 Qualcomm Incorporated Linear model prediction mode with sample accessing for video coding
WO2019050292A1 (ko) * 2017-09-08 2019-03-14 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR102595070B1 (ko) * 2017-11-16 2023-10-27 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
RU2762873C2 (ru) * 2017-12-15 2021-12-23 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования изображений на основе преобразования и устройство для этого
CN115834876A (zh) * 2017-12-21 2023-03-21 Lg电子株式会社 解码和编码设备、存储比特流的介质和数据发送设备
US11533508B2 (en) * 2018-06-08 2022-12-20 Kt Corporation Method and apparatus for encoding/decoding residual data based on a plurality of transformations
AU2019292471A1 (en) 2018-06-30 2021-01-28 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Merge mode-based inter-prediction method and apparatus
US10404980B1 (en) * 2018-07-10 2019-09-03 Tencent America LLC Intra prediction with wide angle mode in video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080082143A (ko) * 2007-03-07 2008-09-11 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
JP2017017742A (ja) * 2011-10-24 2017-01-19 インフォブリッジ ピーティーイー. エルティーディー. 映像復号化方法及び装置
WO2017068856A1 (ja) * 2015-10-21 2017-04-27 シャープ株式会社 予測画像生成装置、画像復号装置および画像符号化装置
KR20180000303A (ko) * 2016-06-22 2018-01-02 한국전자통신연구원 화면 내 예측 방법 및 장치
KR20180001479A (ko) * 2016-06-24 2018-01-04 주식회사 케이티 비디오 신호 처리 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3833021A4 *

Also Published As

Publication number Publication date
MX2021002608A (es) 2021-05-12
CA3111982C (en) 2024-02-27
CN113225557A (zh) 2021-08-06
US20230026401A1 (en) 2023-01-26
PH12021550480A1 (en) 2021-10-11
US20230024256A1 (en) 2023-01-26
CN113225557B (zh) 2023-06-20
AU2019336038A1 (en) 2021-04-01
US11477439B2 (en) 2022-10-18
EP3833021A4 (en) 2021-10-06
CL2021000527A1 (es) 2021-08-20
US20210195176A1 (en) 2021-06-24
EP3833021A1 (en) 2021-06-09
IL281221A (en) 2021-04-29
US20230026704A1 (en) 2023-01-26
US20230024482A1 (en) 2023-01-26
JP2024059906A (ja) 2024-05-01
JP2024059905A (ja) 2024-05-01
JP7448526B2 (ja) 2024-03-12
CN116405679A (zh) 2023-07-07
CN112806001A (zh) 2021-05-14
CN116389742A (zh) 2023-07-04
KR20200028856A (ko) 2020-03-17
CA3111982A1 (en) 2020-03-12
SG11202102238SA (en) 2021-04-29
ZA202101569B (en) 2022-08-31
BR112021004024A2 (pt) 2021-05-25
JP2022501881A (ja) 2022-01-06

Similar Documents

Publication Publication Date Title
WO2020050684A1 (ko) 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2017188652A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2018212577A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018106047A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017222325A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018088805A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017039256A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017179835A1 (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
WO2018221817A1 (ko) 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
WO2017164645A2 (ko) 비디오 신호 부호화/복호화 방법 및 장치
WO2018008904A2 (ko) 비디오 신호 처리 방법 및 장치
WO2017164441A1 (ko) 비디오 코딩 시스템에서 인터 예측 방법 및 장치
WO2018044088A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016052977A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018008905A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019117634A1 (ko) 2차 변환에 기반한 영상 코딩 방법 및 그 장치
WO2014171713A1 (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
WO2017082443A1 (ko) 영상 코딩 시스템에서 임계값을 이용한 적응적 영상 예측 방법 및 장치
WO2013154366A1 (ko) 블록 정보에 따른 변환 방법 및 이러한 방법을 사용하는 장치
WO2016159610A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018044089A1 (ko) 비디오 신호 처리 방법 및 장치
WO2020009419A1 (ko) 병합 후보를 사용하는 비디오 코딩 방법 및 장치
WO2016048092A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016114583A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019194484A1 (ko) 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19858139

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3111982

Country of ref document: CA

Ref document number: 2021512701

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019858139

Country of ref document: EP

Effective date: 20210305

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112021004024

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 2019336038

Country of ref document: AU

Date of ref document: 20190906

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 112021004024

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20210303