WO2018070790A1 - 영상의 부호화/복호화 방법 및 장치 - Google Patents

영상의 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
WO2018070790A1
WO2018070790A1 PCT/KR2017/011219 KR2017011219W WO2018070790A1 WO 2018070790 A1 WO2018070790 A1 WO 2018070790A1 KR 2017011219 W KR2017011219 W KR 2017011219W WO 2018070790 A1 WO2018070790 A1 WO 2018070790A1
Authority
WO
WIPO (PCT)
Prior art keywords
intra prediction
current block
prediction mode
reference pixel
block
Prior art date
Application number
PCT/KR2017/011219
Other languages
English (en)
French (fr)
Inventor
문주희
임성원
원동재
Original Assignee
세종대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170127940A external-priority patent/KR102357283B1/ko
Priority claimed from KR1020170127938A external-priority patent/KR102357282B1/ko
Priority to CN202410023671.3A priority Critical patent/CN117615131A/zh
Priority to CN202410028685.4A priority patent/CN117692635A/zh
Application filed by 세종대학교 산학협력단 filed Critical 세종대학교 산학협력단
Priority to CN202410023686.XA priority patent/CN117615132A/zh
Priority to CN202410023919.6A priority patent/CN117615134A/zh
Priority to CN202410026450.1A priority patent/CN117834860A/zh
Priority to CN202410029164.0A priority patent/CN117857784A/zh
Priority to CN202410023964.1A priority patent/CN117615135A/zh
Priority to CN202410026775.XA priority patent/CN117596390A/zh
Priority to JP2019520095A priority patent/JP6953523B2/ja
Priority to CN202410026037.5A priority patent/CN117834859A/zh
Priority to CN201780063589.1A priority patent/CN109845254B/zh
Priority to CN202410023716.7A priority patent/CN117615133A/zh
Priority to EP17860513.5A priority patent/EP3528497A4/en
Priority to US16/341,590 priority patent/US11039148B2/en
Publication of WO2018070790A1 publication Critical patent/WO2018070790A1/ko
Priority to US17/318,144 priority patent/US11792409B2/en
Priority to US17/318,020 priority patent/US20210281853A1/en
Priority to JP2021159186A priority patent/JP7442200B2/ja
Priority to JP2021159171A priority patent/JP2022020629A/ja
Priority to US17/988,094 priority patent/US20230101636A1/en
Priority to US17/988,100 priority patent/US20230073580A1/en
Priority to JP2024018920A priority patent/JP2024050883A/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Definitions

  • the present invention relates to a video signal encoding / decoding method and apparatus, and more particularly, to a video encoding / decoding method and apparatus using improved intra prediction.
  • Video compression is largely composed of intra prediction, inter prediction, transform, quantization, entropy coding, and in-loop filter.
  • intra prediction is a technique of generating a prediction block for the current block by using reconstructed pixels existing around the current block.
  • pixels of a fractional position are generated through an interpolation process using reference pixels of integer positions, and a prediction block is generated using the pixels of the fractional positions thus generated. At this time, an error between the original pixel value and the prediction value is affected depending on whether the integer reference pixels are used and which interpolation scheme is applied.
  • the conventional intra picture prediction technology should encode a considerable amount of information about the prediction mode to inform the image decoding apparatus which intra picture prediction mode of the plurality of intra picture prediction modes has been used for the intra picture prediction of the input image. .
  • the present invention mainly aims at improving the efficiency of intra prediction by performing intra prediction using a plurality of reference pixel lines in encoding / decoding an image.
  • the present invention mainly aims at improving the efficiency of intra prediction by deriving an intra prediction block by using an interpolation method selected from a plurality of interpolation methods in encoding / decoding an image.
  • An object of the present invention is to provide a filtering method capable of reducing discontinuity between an intra prediction block and a peripheral region when intra prediction is performed using a plurality of reference pixel lines in encoding / decoding an image.
  • the present invention mainly aims at improving the efficiency of intra prediction by deriving an intra prediction mode of an image to be encoded or decoded using an already reconstructed pixel area in encoding / decoding an image.
  • An image decoding method and apparatus may select at least one reference pixel line among a plurality of reference pixel lines, and apply the at least one pixel value included in the selected at least one reference pixel line.
  • a prediction value of one pixel in the current block may be derived based on the result.
  • An image decoding method and apparatus obtain reference pixel line index information from an input bitstream and based on the reference pixel line index information, the at least one of the plurality of reference pixel lines.
  • the reference pixel line can be selected.
  • the method and apparatus for decoding an image may select at least one reference pixel line for each pixel in the current block based on the position of each pixel in the current block.
  • An image decoding method and apparatus selects one of a plurality of interpolation schemes and selects at least one pixel included in the selected at least one reference pixel line using the selected interpolation scheme.
  • the prediction value may be obtained by performing interpolation.
  • the selected interpolation scheme may be selected based on index information representing one of a plurality of interpolation schemes.
  • An image decoding method and apparatus may derive prediction values of all pixels of the current block to obtain a prediction block of the current block and filter the prediction block.
  • An image decoding method and apparatus may filter a predetermined region of the current block according to the size of the current block or the intra prediction mode of the current block.
  • An image encoding method and apparatus select at least one reference pixel line among a plurality of reference pixel lines, and apply the at least one pixel value included in the selected at least one reference pixel line.
  • a prediction value of one pixel in the current block can be obtained based on the above.
  • An image encoding method and apparatus may encode reference pixel line index information indicating the selected at least one reference pixel line and include the encoded reference pixel line index information in a bitstream. Can be.
  • An image encoding method and apparatus may select at least one reference pixel line for each pixel in the current block based on the position of each pixel in the current block.
  • the image encoding method and apparatus may select at least one reference pixel line for each pixel in the current block based on the intra prediction mode of the current block.
  • An image encoding method and apparatus selects one of a plurality of interpolation schemes and selects at least one pixel included in the selected at least one reference pixel line using the selected interpolation scheme.
  • the prediction value may be obtained by performing interpolation.
  • Index information representing one of the plurality of interpolation schemes may be encoded and included in the bitstream.
  • the method and apparatus for encoding an image may derive the prediction values of all the pixels of the current block to obtain the prediction block of the current block and then filter the prediction block.
  • An image encoding method and apparatus may filter a predetermined region of the current block according to the size of the current block or an intra prediction mode of the current block.
  • An image encoding / decoding method and apparatus derive an intra prediction mode of the reconstructed pixel region based on a reference pixel region of at least one pixel region that has already been reconstructed, Based on the intra prediction mode of the reconstructed pixel region, an intra prediction mode of the current block is derived, an intra prediction block of the current block is obtained using the derived intra prediction mode, the obtained intra prediction block and the current The residual block of the block may be added to restore the current block.
  • An image decoding method and apparatus obtain information indicating a method of deriving an intra prediction mode from an input bitstream, and reconstruct the pixel region according to information indicating the method of deriving an intra prediction mode. Whether or not to perform the intra prediction mode of may be selected.
  • An image decoding method and apparatus may include available intra prediction mode information specifying a number of the plurality of available intra prediction modes or a list of the available plurality of intra prediction modes in an input bitstream.
  • the intra prediction mode of the current block may be derived based on the available intra prediction mode information.
  • An image encoding method and apparatus encodes information indicating a method of deriving an intra prediction mode of a current block and includes it in a bitstream, and the image decoding apparatus receiving the bitstream includes: Deriving an intra prediction mode of the reconstructed pixel region may be selectively performed according to information indicating a method of deriving an intra prediction mode of a current block.
  • the compression efficiency of an image and the image quality of a reproduced image can be improved.
  • the image quality of the reproduced image may be improved by applying a filtering method that may reduce the discontinuity between the intra prediction block and the surrounding area according to the present invention.
  • FIG. 1 is a block diagram illustrating an image encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating an example of an intra prediction mode.
  • 3 is a diagram for explaining a planar mode.
  • FIG. 5 is a diagram for describing an example of generating a prediction block.
  • FIG. 6 is a block diagram illustrating an image decoding apparatus according to an embodiment of the present invention.
  • 7A and 7B are diagrams for describing a method of deriving an intra prediction pixel using interpolation.
  • FIG. 8 is a diagram for explaining an interpolation method or an implicit method for selecting interpolation coefficients.
  • FIG. 9 is a flowchart illustrating a process of selecting an intra prediction mode by an image encoding apparatus.
  • FIG. 10 is a flowchart illustrating a process of selecting one of a plurality of interpolation schemes by the image encoding apparatus.
  • FIG. 11 is a flowchart illustrating a process of encoding interpolation index information by a video encoding apparatus.
  • FIG. 12 is a flowchart illustrating a process of decoding interpolation index information by an image decoding apparatus.
  • FIG. 13 is a diagram for describing derivation of an intra prediction pixel using a plurality of reference pixel lines according to an exemplary embodiment.
  • FIG. 14 is a flowchart illustrating a process of deriving an intra prediction pixel value according to an embodiment of the present invention.
  • FIG. 15 is a flowchart for describing a process of adaptively determining a reference pixel line to be used for intra prediction for each prediction block.
  • 16 is a flowchart illustrating a process of encoding reference pixel line index information by an image encoding apparatus.
  • 17 is a flowchart illustrating a process of decoding reference pixel line index information by an image decoding apparatus.
  • 18 and 19 are diagrams for describing a method of determining a reference pixel line without transmitting the reference pixel line index.
  • 20 is a diagram for explaining smoothing between a prediction block and a reference pixel line.
  • FIG. 21 shows a case where a common reference pixel line is used for all of the transform blocks in the current block.
  • 22A to 22D show a case where reference pixel lines are selected for each transform block and used for intra prediction.
  • FIG. 23 is a diagram for explaining a DIMD according to the first embodiment of the present invention.
  • FIG. 24 is a diagram for explaining a DIMD according to the third embodiment of the present invention.
  • FIG. 25 is a flowchart illustrating a DIMD according to the present invention.
  • 26 is a flowchart illustrating a method of encoding an intra prediction mode when an image is encoded using DIMD according to the present invention.
  • FIG. 27 is a flowchart illustrating a method of decoding an intra prediction mode when decoding an image using DIMD according to the present invention.
  • 29 is a flowchart illustrating a process of encoding an intra prediction mode when the seventh embodiment of the present invention is applied.
  • FIG. 30 is a flowchart illustrating a process of decoding an intra prediction mode when the seventh embodiment of the present invention is applied.
  • 31A and 31B are diagrams for explaining a modification of DIMD for transmitting a template index.
  • 32 is a flowchart for explaining a method of encoding an intra prediction mode according to DIMD using a template index.
  • 33 is a flowchart illustrating a method of encoding an intra prediction mode according to DIMD using a template index.
  • 34 is a diagram for explaining an example of setting an intra prediction mode induced using a template as an MPM candidate.
  • 35 is a diagram to describe MPM candidate setting according to an embodiment of the present invention.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component.
  • FIG. 1 is a block diagram illustrating an image encoding apparatus according to an embodiment of the present invention.
  • the image encoding apparatus 100 may include an image splitter 101, an intra picture predictor 102, an inter picture predictor 103, a subtractor 104, a transformer 105, and a quantizer. 106, an entropy encoding unit 107, an inverse quantization unit 108, an inverse transform unit 109, an increase unit 110, a filter unit 111, and a memory 112.
  • each of the components shown in FIG. 1 is independently illustrated to represent different characteristic functions in the image encoding apparatus, and does not mean that each of the components is made of separate hardware or one software component unit.
  • each component is included in each component for convenience of description, and at least two of the components may be combined into one component, or one component may be divided into a plurality of components to perform a function.
  • Integrated and separate embodiments of the components are also included within the scope of the present invention without departing from the spirit of the invention.
  • the components may not be essential components for performing essential functions in the present invention, but may be optional components for improving performance.
  • the present invention can be implemented including only the components essential for implementing the essentials of the present invention except for the components used for improving performance, and the structure including only the essential components except for the optional components used for improving performance. Also included in the scope of the present invention.
  • the image divider 100 may divide the input image into at least one block.
  • the input image may have various shapes and sizes, such as a picture, a slice, a tile, and a segment.
  • a block may mean a coding unit (CU), a prediction unit (PU), or a transformation unit (TU).
  • the partitioning may be performed based on at least one of a quadtree or a binary tree.
  • Quad tree is a method of dividing an upper block into lower blocks having a width and a height of half of the upper block.
  • the binary tree divides the upper block into lower blocks, which are half of the upper block in either width or height.
  • a block may have a square as well as a non-square shape.
  • a coding unit may be used as a unit for encoding or may be used as a unit for decoding.
  • the predictors 102 and 103 may include an inter prediction unit 103 that performs inter prediction and an intra prediction unit 102 that performs intra prediction. Whether to use inter prediction or intra prediction on the prediction unit may be determined, and specific information (eg, an intra prediction mode, a motion vector, a reference picture, etc.) according to each prediction method may be determined. In this case, the processing unit in which the prediction is performed may differ from the processing unit in which the prediction method and the details are determined. For example, the method of prediction and the prediction mode may be determined in the prediction unit, and the prediction may be performed in the transform unit.
  • the residual value (residual block) between the generated prediction block and the original block may be input to the transformer 105.
  • prediction mode information and motion vector information used for prediction may be encoded by the entropy encoder 107 together with the residual value and transmitted to the decoder.
  • the original block may be encoded as it is and transmitted to the decoder without generating the prediction block through the prediction units 102 and 103.
  • the intra prediction unit 102 may determine an intra prediction mode of the current block and generate one or a plurality of prediction blocks using reference pixels according to the determined intra prediction mode.
  • the prediction mode of the neighboring block of the current block on which intra prediction is to be performed is inter prediction
  • a reference pixel included in the neighboring block to which inter prediction is applied may be replaced with a reference pixel in another block around to which intra prediction is applied. That is, when the reference pixel is not available, the unavailable reference pixel information may be replaced with at least one reference pixel among the available reference pixels.
  • a prediction mode may have a directional prediction mode using reference pixel information according to a prediction direction, and a non-directional mode using no directional information when performing prediction.
  • the mode for predicting the luminance information and the mode for predicting the color difference information may be different, and the intra prediction mode information or the predicted luminance signal information used for predicting the luminance information may be utilized to predict the color difference information.
  • the intra prediction unit 102 may include an adaptive intra smoothing (AIS) filter, a reference pixel interpolator, and a DC filter.
  • AIS filter is a filter that filters the reference pixels of the current block and may adaptively determine whether to apply the filter according to the prediction mode of the current prediction unit. If the prediction mode of the current block is a mode that does not perform AIS filtering, the AIS filter may not be applied.
  • the reference pixel interpolation unit of the intra prediction unit 102 interpolates the reference pixel when the intra prediction mode of the prediction unit performs the intra prediction based on the pixel value interpolated with the reference pixel. Can be generated. If the prediction mode of the current prediction unit is a prediction mode for generating a prediction block without interpolating the reference pixel, the reference pixel may not be interpolated.
  • the DC filter may generate the prediction block through filtering when the prediction mode of the current block is the DC mode.
  • a residual block including residual information which is a difference between a prediction block generated by the predictors 102 and 103 and an original block of the prediction block, may be generated.
  • the generated residual block may be input to the converter 130 and converted.
  • FIG. 2 is a diagram illustrating an example of an intra prediction mode.
  • the intra prediction mode illustrated in FIG. 2 has a total of 35 modes.
  • Mode 0 represents a planar mode
  • mode 1 represents a DC mode
  • modes 2 to 34 represent an angular mode.
  • FIG. 3 is a diagram for explaining a planar mode.
  • a reconstructed pixel at the same position on the Y axis and a reconstructed pixel T existing at the upper right of the current block are generated by linear interpolation as shown.
  • a reconstructed pixel at the same position on the X axis and a reconstructed pixel L existing at the lower left of the current block are generated by linear interpolation as shown.
  • the average of two prediction pixels P1 and P2 becomes the final prediction pixel.
  • the prediction pixels of the current block are generated by deriving the prediction pixels in the above manner.
  • FIG. 4 is a diagram for explaining a DC mode.
  • the average of the reconstructed pixels around the current block is calculated, and then the average value is used as the prediction value of all the pixels in the current block.
  • FIG. 5 is a diagram for describing an example of generating a prediction block using mode 10 (horizontal mode) and mode 26 (vertical mode) of FIG. 2.
  • mode 10 horizontal mode
  • mode 26 vertical mode
  • each reference pixel adjacent to the left side of the current block is copied in the right direction to generate a prediction block of the current block.
  • mode 26 each reference pixel in contact with an upper side of the current block is copied downward to generate a prediction block of the current block.
  • the inter prediction unit 103 may predict the prediction unit based on information of at least one of a previous picture or a subsequent picture of the current picture, and in some cases, encoding in the current picture is completed.
  • the prediction unit may be predicted based on the information of some region.
  • the inter prediction unit 103 may include a reference picture interpolator, a motion predictor, and a motion compensator.
  • the reference picture interpolation unit may receive reference picture information from the memory 112 and generate pixel information of less than an integer pixel in the reference picture.
  • a DCT based 8-tap interpolation filter having different filter coefficients may be used to generate pixel information of integer pixels or less in units of 1/4 pixels.
  • a DCT-based interpolation filter having different filter coefficients may be used to generate pixel information of an integer pixel or less in units of 1/8 pixels.
  • the motion predictor may perform motion prediction based on the reference picture interpolated by the reference picture interpolator.
  • various methods such as full search-based block matching algorithm (FBMA), three step search (TSS), and new three-step search algorithm (NTS) may be used.
  • FBMA full search-based block matching algorithm
  • TSS three step search
  • NTS new three-step search algorithm
  • the motion vector may have a motion vector value of 1/2 or 1/4 pixel units based on the interpolated pixels.
  • the motion prediction unit may predict the current prediction unit by using a different motion prediction method.
  • various methods such as a skip method, a merge method, and an advanced motion vector prediction (AMVP) method may be used.
  • AMVP advanced motion vector prediction
  • the subtraction unit 104 generates a residual block of the current block by subtracting the block to be currently encoded from the prediction block generated by the intra prediction unit 102 or the inter prediction unit 103.
  • the transform unit 105 may transform the residual block including the residual data by using a transformation method such as DCT, DST, or Karhunen Loeve Transform (KLT).
  • the transformation method may be determined based on the intra prediction mode of the prediction unit used to generate the residual block. For example, depending on the intra prediction mode, DCT may be used in the horizontal direction and DST may be used in the vertical direction.
  • the quantization unit 106 may quantize the values converted in the frequency domain by the transformer 105.
  • the quantization coefficient may change depending on the block or the importance of the image.
  • the value calculated by the quantization unit 106 may be provided to the inverse quantization unit 108 and the entropy encoding unit 107.
  • the transform unit 105 and / or the quantization unit 106 may be selectively included in the image encoding apparatus 100. That is, the image encoding apparatus 100 may encode the residual block by performing at least one of transform or quantization on the residual data of the residual block, or skipping both transform and quantization. Even if neither the transformation nor the quantization is performed or neither the transformation nor the quantization is performed in the image encoding apparatus 100, a block entering the input of the entropy encoder 107 is generally referred to as a transform block.
  • the entropy encoder 107 entropy encodes the input data. Entropy encoding may use various encoding methods such as, for example, Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC).
  • the entropy encoding unit 107 receives prediction coefficient information, block type information, prediction mode information, division unit information, prediction unit information, transmission unit information, motion vector information, and reference frame information from the prediction units 102 and 103. , Various pieces of information such as interpolation information and filtering information of a block can be encoded.
  • the coefficients of the transform block encode various types of flags indicating non-zero coefficients, coefficients having an absolute value greater than 1 or 2, coefficients of coefficients, and the like, in units of partial blocks in the transform block. Can be. Coefficients not encoded with only the flag may be encoded through an absolute value of the difference between the coefficient encoded through the flag and the coefficient of the actual transform block.
  • the inverse quantization unit 108 and the inverse transformer 109 inverse quantize the quantized values in the quantization unit 106 and inverse transform the transformed values in the transformer 105.
  • the residual values generated by the inverse quantizer 108 and the inverse transformer 109 are predicted by the motion estimator, the motion compensator, and the intra prediction unit 102 included in the predictors 102 and 103. It may be combined with the prediction unit to generate a reconstructed block.
  • the transcriptor 110 generates a reconstructed block by multiplying the prediction blocks generated by the predictors 102 and 103 and the residual blocks generated by the inverse transform unit 109.
  • the filter unit 111 may include at least one of a deblocking filter, an offset correction unit, and an adaptive loop filter (ALF).
  • ALF adaptive loop filter
  • the deblocking filter may remove block distortion caused by boundaries between blocks in the reconstructed picture.
  • it may be determined whether to apply a deblocking filter to the current block based on the pixels included in several columns or rows included in the block.
  • a strong filter or a weak filter may be applied according to the required deblocking filtering strength.
  • horizontal filtering and vertical filtering may be performed in parallel when vertical filtering and horizontal filtering are performed.
  • the offset correction unit may correct the offset with respect to the original image on a pixel-by-pixel basis for the deblocking image.
  • the pixels included in the image are divided into a predetermined number of areas, and then, an area to be offset is determined, an offset is applied to the corresponding area, or offset considering the edge information of each pixel. You can use this method.
  • Adaptive Loop Filtering may be performed based on a value obtained by comparing the filtered reconstructed image with the original image. After dividing the pixels included in the image into a predetermined group, one filter to be applied to the group may be determined and filtering may be performed for each group. For information related to whether to apply ALF, a luminance signal may be transmitted for each coding unit (CU), and the shape and filter coefficient of an ALF filter to be applied may vary according to each block. In addition, regardless of the characteristics of the block to be applied, the same type (fixed form) of the ALF filter may be applied.
  • ALF Adaptive Loop Filtering
  • the memory 112 may store the reconstructed block or picture calculated by the filter 111, and the stored reconstructed block or picture may be provided to the predictors 102 and 103 when performing inter prediction.
  • FIG. 6 is a block diagram illustrating an image decoding apparatus 600 according to an embodiment of the present invention.
  • the image decoding apparatus 600 includes an entropy decoding unit 601, an inverse quantization unit 602, an inverse transform unit 603, an increase unit 604, a filter unit 605, a memory 606, and the like.
  • the prediction unit 607 and 608 may be included.
  • the input bitstream may be decoded according to a process opposite to that performed by the image encoding apparatus 100.
  • the entropy decoding unit 601 may perform entropy decoding in a procedure opposite to that of the entropy encoding unit 107 of the image encoding apparatus 100. For example, various methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC) may be applied to the method performed by the image encoder.
  • coefficients of a transform block are based on various types of flags indicating non-zero coefficients, coefficients having an absolute value greater than 1 or 2, coefficients of coefficients, and the like in units of partial blocks in the transform block. Can be decrypted. Coefficients not represented by the flag alone may be decoded through the sum of the coefficients represented by the flag and the signaled coefficients.
  • the entropy decoder 601 may decode information related to intra prediction and inter prediction performed by the encoder.
  • the inverse quantization unit 602 generates a transform block by performing inverse quantization on the quantized transform block. It operates substantially the same as the inverse quantizer 108 of FIG.
  • the inverse transform unit 603 performs an inverse transform on the transform block to generate a residual block.
  • the transformation method may be determined based on information on a prediction method (inter or intra prediction), a size and / or shape of a block, an intra prediction mode, and the like. It operates substantially the same as the inverse transform unit 109 of FIG.
  • the increasing unit 604 generates a reconstructed block by multiplying the prediction block generated by the intra prediction unit 607 or the inter prediction unit 608 and the residual block generated by the inverse transform unit 603. It operates substantially the same as the transpiration section 110 of FIG.
  • the filter unit 605 reduces various kinds of noise generated in the restored blocks.
  • the filter unit 605 may include a deblocking filter, an offset correction unit, and an ALF.
  • the image encoding apparatus 100 may receive information about whether a strong filter or a weak filter is applied.
  • the deblocking filter of the image decoding apparatus 600 the deblocking filter related information provided by the image encoding apparatus 100 may be provided, and the image decoding apparatus 600 may perform deblocking filtering on the corresponding block.
  • the offset correction unit may perform offset correction on the reconstructed image based on the type of offset correction and offset value information applied to the image during encoding.
  • the ALF may be applied to a coding unit based on ALF application information, ALF coefficient information, and the like provided from the image encoding apparatus 100. Such ALF information may be provided included in a specific parameter set.
  • the filter unit 605 operates substantially the same as the filter unit 111 of FIG. 1.
  • the memory 606 stores the reconstruction block generated by the multiplier 604. It operates substantially the same as the memory 112 of FIG.
  • the prediction units 607 and 608 may generate the prediction block based on the prediction block generation related information provided by the entropy decoding unit 601 and previously decoded blocks or picture information provided by the memory 606.
  • the prediction units 607 and 608 may include an intra prediction unit 607 and an inter prediction unit 608. Although not separately illustrated, the prediction units 607 and 608 may further include a prediction unit discrimination unit.
  • the prediction unit determiner receives various information such as prediction unit information input from the entropy decoder 601, prediction mode information of the intra prediction method, and motion prediction related information of the inter prediction method, and distinguishes the prediction unit from the current coding unit, and predicts It may be determined whether the unit performs inter prediction or intra prediction.
  • the inter prediction unit 608 may include information included in at least one of a previous picture or a subsequent picture of the current picture including the current prediction unit by using information required for inter prediction of the current prediction unit provided by the image encoding apparatus 100. Based on the inter prediction on the current prediction unit may be performed. Alternatively, inter prediction may be performed based on information of some regions pre-restored in the current picture including the current prediction unit.
  • Whether the motion prediction method of the prediction unit included in the coding unit based on the coding unit to perform inter prediction is skip mode, merge mode, or AMVP mode. Can be determined.
  • the intra prediction unit 607 generates a prediction block using pixels that are located around the block to be currently encoded and are reconstructed.
  • the intra prediction unit 607 may include an adaptive intra smoothing (AIS) filter, a reference pixel interpolator, and a DC filter.
  • the AIS filter is a filter that filters the reference pixels of the current block and may adaptively determine whether to apply the filter according to the prediction mode of the current prediction unit.
  • the AIS filtering may be performed on the reference pixel of the current block by using the prediction mode of the prediction unit and the AIS filter information provided by the image encoding apparatus 100. If the prediction mode of the current block is a mode that does not perform AIS filtering, the AIS filter may not be applied.
  • the reference pixel interpolation unit of the intra prediction unit 607 interpolates a reference pixel at a fractional position by interpolating the reference pixel when the prediction mode of the prediction unit is a prediction unit that performs intra prediction based on pixel values interpolating the reference pixel. Can be generated.
  • the generated reference pixel at the fractional unit location may be used as the prediction pixel of the pixel in the current block. If the prediction mode of the current prediction unit is a prediction mode for generating a prediction block without interpolating the reference pixel, the reference pixel may not be interpolated.
  • the DC filter may generate the prediction block through filtering when the prediction mode of the current block is the DC mode.
  • the intra prediction unit 607 operates substantially the same as the intra prediction unit 102 of FIG. 1.
  • the inter prediction unit 608 generates the inter prediction block by using the reference picture and the motion information stored in the memory 606.
  • the inter screen predictor 608 operates substantially the same as the inter screen predictor 103 of FIG. 1.
  • the present invention relates in particular to intra prediction, which is described in more detail below with reference to the various embodiments of the invention.
  • FIG. 7A and 7B are diagrams for describing a method of deriving an intra prediction pixel using interpolation.
  • the prediction angle of mode m which is one of the intra prediction modes of FIG. 2
  • the reference pixel X to be used for prediction is located at an integer pixel position. does not exist. Therefore, interpolation is performed using reference pixels A and B which exist at integer pixel positions on the left and right sides of the reference pixel X to generate the reference pixel X at the fractional pixel position.
  • the generated reference pixel X is used as a prediction pixel of the pixel at the P position in the current block.
  • FIG. 7B is a diagram for explaining the relationship between pixels X, A, and B.
  • the distance between pixels X and A is S1
  • the distance between pixels B and X is S2.
  • the pixel X may be derived using various interpolation methods.
  • various interpolation methods such as linear interpolation, cubic convolution interpolation, and B-spline interpolation may be applied.
  • the first method is a method in which the image encoding apparatus 100 transmits index information indicating which interpolation method among a plurality of available interpolation methods is applied to the image decoding apparatus 600.
  • the video encoding apparatus 100 may set index information indicating the interpolation method through a block unit or an upper header.
  • setting through the upper header means that the header is set to be larger than the block unit such as a slice segment header, a picture parameter set, a sequence parameter set, and the like. it means.
  • Index information indicating the interpolation method included in the upper header may be encoded by the image encoding apparatus 100 and transmitted to the image decoding apparatus 600.
  • the encoding apparatus 100 and the decoding apparatus 600 may store the plurality of preset interpolation coefficient sets in the same manner, and the interpolation coefficient index information indicating which set is selected and used for encoding may be obtained in units of blocks.
  • the upper header may be notified to the decoding apparatus 600.
  • the image encoding apparatus 100 may transmitting the above-described index information indicating the interpolation method or interpolation coefficient index information indicating which interpolation coefficient set is used, to the image decoding apparatus 600,
  • the image encoding apparatus 100 and the image decoding apparatus 600 may derive the interpolation coefficients in the same manner in an implicit manner.
  • the image encoding apparatus 100 and the image decoding apparatus 600 may derive interpolation coefficients using the same reconstructed pixels.
  • R reference pixels ie, pixels that have already been reconstructed
  • R x K K is any real number
  • the same interpolation filter is then used to reconstruct the original R reference pixels through an inverse process.
  • the optimal interpolation filter may be determined according to the difference between the values of the reconstructed R reference pixels and the values of the original reference pixels.
  • FIG. 8 is a diagram for describing another method of selecting an interpolation method and / or interpolation coefficients by the image encoding apparatus 100 or the image decoding apparatus 600 in an implicit manner.
  • the 4x4 block including the pixel P corresponds to the current block to be decoded through intra prediction.
  • a plurality of reference pixel lines of pre-reconstructed pixels located around the current block are used to determine the interpolation method or the interpolation coefficient.
  • each reference pixel line may include a predetermined number of pixels in a line in a horizontal direction and a predetermined number of pixels in a line in a vertical direction.
  • the reference pixel line may consist of a predetermined number of pixels in a row in the horizontal direction or may consist of a predetermined number of pixels in a row in the vertical direction.
  • pixels in reference pixel line 0 are predicted using pixels in reference pixel line 1.
  • N directional modes that are the same as the intra prediction mode of the current block are used for prediction.
  • the reference pixel X corresponding to the prediction pixel of the pixel R in the reference pixel line 0 is not a pixel of an integer position
  • the reference pixel X is interpolated using two integer position reference pixels as shown in FIGS. 7A and 7B. Can be derived.
  • specific interpolation schemes and interpolation coefficients are used.
  • the above-described interpolation may be performed by the reference pixel interpolation unit included in each of the intra prediction unit 102 of the image encoding apparatus 100 and the intra prediction unit 607 of the image decoding apparatus 600.
  • FIG. 9 is a flowchart illustrating a process of selecting an optimal intra prediction mode by the image encoding apparatus 100.
  • the interpolation method is set based on a block unit or an upper header.
  • MAX_VALUE is the maximum value that can be stored in the COST_BEST variable, which is a very large value that cannot be actually calculated.
  • the total number of preset intra prediction modes is set to the variable M (S901).
  • BEST_INTRA_MODE which represents the best intra prediction mode for the current block, is initialized to 0 (S901).
  • the interpolation position corresponding to each pixel position of the prediction block is found, and the interpolation value is generated using one of a preset interpolation scheme or a plurality of interpolation schemes set in the upper header, and then the prediction block Is generated (S902).
  • the cost value COST_m corresponding to m is calculated using the generated prediction block (S903).
  • the COST_m may be calculated using the number of bits necessary for encoding the intra mode, and the difference between the prediction block and the current block.
  • COST_m is less than or equal to COST_BEST (S904), m is stored in BEST_INTRA_MODE, a variable that stores the optimal intra prediction mode, and cost_m is stored in the COST_BEST variable, and m is increased (S905). If COST_m is greater than COST_BEST, only m is increased by one (S906). Finally, if m has reached the maximum number of prediction modes in the scene, it exits, otherwise it returns to S902 and repeats.
  • the interpolation scheme is a preset scheme in the image encoding apparatus 100 or the image decoding apparatus 600, S1 and S2 are set using the schemes of FIGS. 7 and 8, and the pixel X using the preset interpolation scheme. Create The prediction block is generated by using the same method for all the pixels in the prediction block. Or, if a plurality of interpolation schemes are used, the content of step S902 may be changed.
  • step S902 of the steps illustrated in FIG. 9 are changed.
  • FIG. 10 is a flowchart illustrating a process of selecting one of a plurality of interpolation schemes by the image encoding apparatus 100.
  • MAX_VALUE is the maximum value that can be stored in the COST_BEST_i variable, which is a very large value that cannot be calculated when the cost is calculated.
  • variable i the total number of available interpolation methods is set.
  • the BEST_INTERPOLATION which is a variable that stores the optimal interpolation method used for the current block, is initialized to 0 (S1001).
  • an interpolation value corresponding to each pixel position of the prediction block is generated and then a prediction block is generated (S1002).
  • the cost_i corresponding to the cost value i is calculated using the generated prediction block (S1003).
  • COST_i is calculated by using the number of bits needed to encode the interpolation index and the difference between the prediction block and the current block. If COST_i is less than or equal to COST_BEST_i (S1004), i is stored in BEST_INTERPOLATION, a variable that stores the optimal interpolation method, and cost_i is stored in COST_BEST_i variable, and i is increased by 1 (S1005).
  • COST_i is greater than COST_BEST_i, only i is increased by one (S1006). Finally, if i reaches the maximum number of available interpolation methods, it exits, otherwise it returns to S1002 and repeats.
  • the COST_m is calculated by adding the number of bits in which the interpolation index is encoded in addition to the number of bits in the intra prediction mode encoded in step S903 shown in FIG. 9.
  • FIG. 11 is a flowchart illustrating a process of encoding interpolation index information when a plurality of interpolation schemes are adaptively applied to each prediction block by the image encoding apparatus 100.
  • FIG. 12 is a flowchart illustrating a process of decoding interpolation index information by the image decoding apparatus 600.
  • S1201 whether or not the intra prediction mode is predicted for each prediction block is decoded.
  • S1202 it is determined whether the prediction is made (S1202). If the prediction is made, an index indicating which candidate is selected from the prediction candidates of the intra prediction mode generated in the neighboring block is decoded (S1203). If not, the remaining modes are rearranged except for the prediction candidates of the intra prediction modes generated from the neighboring blocks to decode the currently selected intra prediction modes (S2104). After that, the interpolation index used in the encoder is decoded (S1205), and the process ends.
  • FIG. 13 is a diagram for describing derivation of an intra prediction pixel using a plurality of reference pixel lines according to an exemplary embodiment.
  • the reference pixel line 0 includes a predetermined number of reference pixels in contact with the upper end of the current block and a predetermined number of reference pixels in contact with the left side of the current block.
  • the present invention can improve the accuracy of intra prediction by deriving a prediction pixel or a prediction block using various reference pixel lines and reference pixels belonging to the reference pixel lines. This embodiment may be performed by the intra prediction unit 102 of the image encoding apparatus 100 and the intra prediction unit 607 of the image decoding apparatus 600 in the same manner.
  • any N reference pixel lines may be used.
  • the number N of reference pixel lines may be included in a block unit or an upper header to inform the decoding apparatus 600.
  • the encoding apparatus 100 and the decoding apparatus 600 may use N preset reference pixel lines without encoding the number N of the reference pixel lines.
  • a 4x4 block including a pixel P corresponds to a current block to be encoded or decoded using intra prediction.
  • Three reference pixel lines 0, 1 and 2 are located around the current block.
  • the prediction pixels that may be used as prediction pixels of the current pixel P using three reference pixel lines 0, 1, and 2 may be X, Y, and Z.
  • a prediction block may be generated using each of the three reference pixel lines to determine an optimal reference pixel line.
  • the encoding apparatus 100 may encode reference pixel line index information indicating the optimal reference pixel line determined as described above.
  • the reference pixel line index may be assigned a low index number to a reference pixel line close to the current block as shown in FIG. 13.
  • FIG. 14 is a flowchart illustrating a process of deriving an intra prediction pixel value according to an embodiment of the present invention.
  • at least one reference pixel line to be used for intra prediction of the current block is selected from a plurality of reference pixel lines (S1301).
  • the plurality of reference pixel lines exist in the same image as the current block to be decoded using intra prediction.
  • the selected at least one reference pixel line may be indicated by the aforementioned reference pixel line index.
  • at least one reference pixel line to be used for intra prediction of the current block may be selected using a method common to both the image encoding apparatus 100 and the image decoding apparatus 600 by an implicit method to be described later. .
  • the selected at least one reference pixel line may be selected for each prediction block. This will be described later with reference to FIG. 15. Alternatively, it may be adaptively selected for each pixel in the prediction block. This will be described later with reference to FIGS. 18 and 19.
  • the image encoding apparatus 100 or the image decoding apparatus 600 may obtain a prediction value of one pixel in the current block based on at least one pixel value included in the selected at least one reference pixel line (S1303).
  • the image encoding apparatus 100 or the image decoding apparatus 600 may derive the prediction block of the current block by repeating all or part of steps S1301 or S1303.
  • FIG. 15 is a flowchart for describing a process of adaptively determining a reference pixel line to be used for intra prediction for each prediction block.
  • step S902 illustrated in FIG. 9 may be replaced by steps illustrated in FIG. 15.
  • MAX_VALUE is the maximum value that can be stored in the COST_BEST_n variable, and it is a very large value that cannot be calculated when the cost is calculated.
  • the variable N sets the total number of preset reference pixel lines.
  • BEST_n representing an optimal reference pixel line index in the current block is initialized to 0 (S1401). Thereafter, an interpolation position corresponding to each pixel position of the prediction block is found according to the reference pixel line index n, and a prediction block is generated (S1402).
  • the COST_n corresponding to n is calculated using the generated prediction block (S1403).
  • COST_n is calculated by using the number of bits necessary for encoding the reference pixel line n, and the difference between the prediction block and the current block. If COST_n is less than or equal to COST_BEST_n (S1404), n is stored in BEST_n, which is a variable for storing an optimal reference pixel line, cost_n is stored in COST_BEST_n variable, and n is increased by 1 (S1405). If COST_n is greater than COST_BEST_n, only n is increased by one (S1406). Finally, if n reaches the maximum number of reference pixel lines, it ends, otherwise it returns to S1402 and repeats.
  • FIG. 16 is a flowchart illustrating a process of encoding, by the encoding apparatus 100, reference pixel line index information indicating a selected reference pixel line when a reference pixel line is adaptively selected for each prediction block.
  • the intra prediction mode is predicted or not is encoded for each prediction block (S1501).
  • the used reference pixel line index is encoded (S1505) and ends.
  • FIG. 17 is a flowchart illustrating a process in which reference pixel line index information indicating a selected reference pixel line is decoded by the decoding apparatus 600 when the reference pixel line is adaptively selected for each prediction block.
  • the intra prediction mode is predicted for each prediction block is decoded (S1601). After that, it is determined whether the prediction is made (S1602). If the prediction is made, an index indicating which candidate is selected from the prediction candidates of the intra prediction mode generated in the neighboring block is decoded (S1603). If not, the remaining modes are rearranged except for the prediction candidates of the intra prediction modes generated in the neighboring blocks to decode the currently selected intra prediction modes (S1604). Thereafter, the used reference pixel line index is decoded (S1605) and ends.
  • the precision of the position of the prediction pixel obtained through interpolation in each reference pixel line may be different. Therefore, among the prediction pixels obtained through interpolation in each reference pixel line, the prediction pixel closest to the integer pixel position may be selected as the prediction pixel of the current pixel P. In this case, the above process may be applied to N reference pixel lines.
  • a prediction pixel close to the current block may be selected as the final prediction pixel.
  • the prediction pixel line may be adaptively selected for each prediction block by giving priority to a line having many lines where the prediction pixel exists at an integer position. Assuming that the precision and frequency of the interpolated pixel used when generating the prediction block by using each reference pixel line are the same as those in FIG. 19, the line may be selected by weighting according to the precision of each pixel position.
  • the reference pixel line index may be used to exclude one of N lines.
  • N-1 lines except line 1 are used.
  • prediction values may be generated in lines other than line 1 in pixel units without line division.
  • the encoding apparatus 100 may encode and transmit to the decoding apparatus 600 whether a method of directly encoding the reference pixel line index or a non-coding scheme is used in a block unit or higher header. .
  • a prediction block When a prediction block is derived by using predetermined pixel (s) in a reference pixel line, there may be a discontinuity between a reference pixel line and a prediction block which are not used for deriving the prediction block, or between a region adjacent to the prediction block and a prediction block. . Smoothing can be used to reduce this discontinuity. Smoothing may correspond to a kind of low pass filter.
  • Smoothing according to an embodiment of the present invention may be performed by each of the intra prediction unit 102 of the image encoding apparatus 100 and the intra prediction unit 607 of the image decoding apparatus 600.
  • 20 is a diagram for explaining smoothing between a prediction block and a reference pixel line.
  • the intra prediction mode used hereinafter is described by taking a mode in which intra prediction is performed in a 45 degree up-right direction. It is also assumed that reference pixel line 1 has been selected for intra prediction.
  • smoothing using pixels A to E is described as a pixel to which smoothing is applied, the same applies to other pixels.
  • smoothing may be performed in the 45 degree down-left direction which is the opposite direction to the intra prediction direction.
  • an area of the prediction block to which smoothing is applied may be determined according to the size or shape of the prediction block of the current block.
  • pixels belonging to half of the prediction block are smoothed. That is, smoothing may be applied only to the pixels in the left half that are darkly displayed.
  • a predetermined area or ratio may be used according to the size of the prediction block and / or the intra prediction mode. For example, smoothing may be applied to only one quarter of the prediction block, and other ratios may be possible.
  • the prediction pixel A may be smoothed using Equation 1 below using the pixel D present in the reference pixel line 1.
  • Equation 1 A ', A, and D are the values of the predicted pixel A after smoothing, the value of the predicted pixel A before smoothing, and the value of the reference pixel D, respectively, and w1 and w2 are respectively applied to the predicted pixel A.
  • prediction pixel B may be smoothed by using an equation similar to that of Equation 1 using the pixel D present in the reference pixel line 1.
  • the strength of the smoothing may be adjusted according to the distance. Since the prediction pixel A is farther from the pixel D in the distance than the prediction pixel B, the smoothing of the prediction pixels A and D is smoother than the smoothing of the prediction pixels B and D when smoothing. In this case, strong smoothing may be performed by smoothing the prediction pixel by giving more weight to the pixel D side.
  • the reference pixel line used for smoothing may be set to a line close to the prediction block, independently of the reference pixel line selected for intra prediction.
  • the pixels used for smoothing the prediction pixels A and B may be set to C instead of D.
  • the strength of the smoothing can be selected according to the distance. For example, when the prediction pixel B is smoothed using the reference pixel C, the same weight is applied to each pixel, and when the prediction pixel A is smoothed using the reference pixel C, the weighting of the pixel C is more weighted to perform smoothing. It may be.
  • the weight may be varied according to the distance between the reference pixel and the prediction pixel.
  • the smoothing may be performed by giving a greater weight to the pixel C.
  • FIG. it is also possible to perform smoothing using any line using a predetermined method.
  • Such a smoothing method can be encoded in units of blocks or not, and can also be encoded through an upper header.
  • the encoder and the decoder may perform the same operation under predetermined conditions without encoding whether the smoothing is applied or not. For example, it may be determined whether smoothing is performed according to an angle of the intra prediction mode. In the present embodiment, it is described that the greater the distance, the smoother the distance for convenience of explanation. However, the opposite case is also possible depending on the characteristics of the image.
  • FIGS. 21 and 22A through 22D a unit of a block in which a reference pixel line is selected for intra prediction is described according to an embodiment of the present invention.
  • the current block is 16x16 in size and the current block is divided into four 8x8 transform blocks and the transform is performed four times in units of 8x8 transform blocks
  • the current block may be divided into a plurality of transform blocks smaller than the size of the current block for conversion. Therefore, when the intra prediction mode is determined in the current block unit, the actual prediction may be performed in the transform block unit by applying the determined intra prediction mode in the transform block unit.
  • An advantage of this method is that the correlation between the pixels may decrease as the reference pixel moves away from the current block. Referring to FIG. 21, when intra prediction is applied in units of blocks, the pixels of the transform block A are closer to the tract pixels than the pixels of the transform block D. Therefore, the pixels in the transform block D may be far from the reference pixels, thereby lowering the efficiency of prediction.
  • intra prediction mode may be determined in units of blocks, and intra prediction may be performed in units of transform blocks.
  • FIG. 21 illustrates a case in which intra prediction is performed in units of transform blocks, at least one reference pixel line selected for intra prediction of a current block is commonly used for all transform blocks in the current block.
  • 22A to 22D illustrate a case where at least one reference pixel line is selected for each transform block and used for intra prediction.
  • the transform block B can use the reference pixel lines as shown for intra prediction using the pixels of the reconstructed transform block A.
  • FIG. 22C reference pixel lines as shown using the reconstructed pixels of the transform blocks A and B may be used for intra prediction.
  • FIG. 22D reference pixel lines as shown using the reconstructed pixels of transform blocks A, B, and C may be used for intra prediction.
  • pixel lines determined in units of blocks may be applied as they are in case of performing prediction in units of transform blocks of FIGS. 22A to 22, as shown in FIG. 21.
  • a new optimal reference pixel line may be obtained in units of transform blocks.
  • whether the optimal reference pixel line obtained in block units is to be used for the entire transform block or whether the reference pixel line is derived for each transform block unit is used to inform the decoding apparatus 600 by encoding through a block unit or an upper header. It is possible.
  • the image encoding apparatus and the image decoding apparatus may derive the intra prediction mode by the same method and / or the same criterion, so that the information for notifying the intra prediction mode itself may be displayed. There is no need to pass it to the decoding device.
  • DIMD decoder-side intra mode derivation
  • the DIMD may be similarly performed by the video encoding apparatus. Therefore, despite the name DIMD, DIMD may be performed by each of the image encoding apparatus 100 and the image decoding apparatus 600. In particular, the DIMD may be performed by the intra prediction unit 102 of the image encoding apparatus 100 and the intra prediction unit 607 of the image decoding apparatus 600, respectively.
  • FIG. 23 is a diagram for explaining a DIMD according to the first embodiment of the present invention.
  • an intra prediction mode of the current block may be derived by using already reconstructed pixels positioned around the current block.
  • the size of the current block 2001 to be encoded or decoded is M ⁇ N
  • the size of template A 2004 is P ⁇ N
  • the size of template B 2003 is M ⁇ Q.
  • the reference pixel area 2002 is composed of an area located on the left side of the template A 2004 and an area located above the template B 2003.
  • the reference pixel area 2002 selects 2 (Q + N) + 2 (P + M) + 1 reference pixels. Include.
  • prediction values of the template A 2004 and the template B 2003 are calculated using reference pixels in the reference pixel area 2002 according to each of the available intra prediction modes.
  • template A 2004 and template B 2003 are treated as one area.
  • the prediction values of the template A 2004 and the template B 2003 are calculated using the reference pixels in the reference pixel area 2002 according to each of the 35 intra-picture prediction modes as shown in FIG. 2. .
  • Sum of Absolute Difference (SAD) corresponding to the sum of the differences between the template A (2004) and the template B (2003) and the reconstruction values of the template A (2004) and the template B (2003) predicted according to each intra prediction mode.
  • the intra prediction mode having the smallest sum of absolute difference (SAD) may be selected as the intra prediction mode of the current block 2001.
  • Both the image encoding apparatus 100 and the image decoding apparatus 600 are derived because the intra-prediction mode of the current block 2001 is derived using the pixels already reconstructed by the image encoding apparatus 100 or the decoding apparatus 600.
  • the same intra prediction mode can be derived.
  • the intra prediction mode applied to the luminance pixels may be equally applied to the chrominance pixels. Since the encoding apparatus 100 does not transmit the intra prediction mode to the decoding apparatus 600, there is no overhead burden. Thus it is also possible to add an intra prediction mode at half, 1/3, or quarter positions between angular modes.
  • information about the number of intra prediction modes used may be transmitted to the decoding apparatus 600 using various methods. As an example, the power of 2 may be encoded and transmitted to the decoding apparatus 600 through a block header or an upper header of a block such as a slice header, a picture header, a sequence header, and the like.
  • information about the number of available intra prediction modes is transmitted to the decoding apparatus 600 by using a method of transmitting an index indicating one of a plurality of intra prediction mode lists having different numbers of intra prediction modes. It may be delivered.
  • Template A 2004 and Template B 2003 are used to derive the intra prediction mode of the current block 2001, but three or more templates may be used.
  • all of the intra prediction modes are applied to the template A 2004 and / or the template B 2003 to derive the final intra prediction modes, but the preset partial intra prediction is not the entire mode.
  • the final intra prediction mode of the current block 2001 may be derived.
  • two template A 2004 and template B 2003 have been described as one region. However, in this embodiment, two template A 2004 and template B 2003 are treated as separate regions. In detail, after deriving the prediction mode of the current block using each template, one mode may be finally selected from the two prediction modes derived.
  • the angle modes on the left side of the 18th angle mode apply only to template A (2004), and then each Obtain The mode having the minimum value among the SAD values calculated for each mode is determined as the intra prediction mode of the template A (2004).
  • the angle modes existing on the right side of the angle mode 18 are applied only to the template B (2003), and each SAD is obtained.
  • the mode having the minimum value among the SAD values calculated for each mode is determined as the intra prediction mode of the template B 2003.
  • one of the determined intra prediction mode of the template A 2004 and the intra prediction mode of the template B 2003 is finally selected as the prediction mode of the current block 2001.
  • the SAD value corresponding to the DC mode and the SAD value corresponding to the planner mode can be obtained. Then, the final screen of each template is compared by comparing the SAD value corresponding to the mode selected as the intra prediction mode of the template among the aforementioned angle modes, the SAD value corresponding to the DC mode, and the SAD value corresponding to the planner mode. You can select my prediction mode.
  • a third embodiment according to the present invention relates to a method for executing DIMD using the remaining available templates when some of the templates of the current block are not available.
  • FIG. 24 is a diagram for explaining a DIMD according to the third embodiment of the present invention.
  • the template on the upper side of the current block 2101 is not available, and only the template A 2104 on the left is available.
  • the encoding apparatus 100 and the decoding apparatus 600 use 35 intra prediction modes as illustrated in FIG. 2, and one of the two templates is not available, as shown in FIG. 24. In this way, 35 intra-prediction modes may be applied to only one template 2104.
  • the lower left 45 degree direction is set to the intra prediction mode 2
  • the horizontal direction is set to the intra prediction mode 34
  • the intra prediction mode of the current block 2101 may be derived.
  • a suitable peripheral Upper reference pixels 2102 may be generated through padding using the pixels.
  • the peripheral pixels used for padding may be the upper pixels of current block 2101 and / or template A 2104, or reference pixels 2105 on the left of template A 2104.
  • FIG. 25 is a flowchart illustrating a DIMD according to the present invention. Regarding the above-described first to third embodiments. The method illustrated in FIG. 25 may be identically performed by the intra prediction unit 102 of the image encoding apparatus 100 and the intra prediction unit 607 of the image decoding apparatus 600.
  • an intra prediction mode of the reconstructed pixel region is derived based on a reference pixel region of at least one pixel region that is already reconstructed (S2201).
  • at least one pixel area may be template A (2004, 2104) and / or template B (2003) in the above-described embodiments.
  • the reference pixel area may correspond to the reference pixel areas 2002, 2102, and 2105 described in the above embodiments. However, of course, it is not limited to these reference pixel areas.
  • an intra prediction mode of the current block is derived based on the intra prediction mode of the reconstructed pixel region derived in step S2201 (S2203).
  • the current block is reconstructed by adding the obtained intra prediction block and the residual block of the current block (S2207).
  • 26 is a flowchart illustrating a method of encoding an intra prediction mode when an image is encoded using DIMD according to the present invention.
  • This information is information for informing the image decoding apparatus 600 of a method of deriving an intra prediction mode. That is, whether the intra prediction mode is derived using the DIMD according to the present invention or whether the intra prediction mode is derived using another method is signaled.
  • MPM Most Probable Mode
  • the MPM flag and the MPM index information indicating whether the intra prediction mode of the current block belongs to the most probable mode list are additionally transmitted to the decoding apparatus 600.
  • the number of intra prediction modes included in the MPM list is very small compared to the number of all intra prediction modes. Therefore, if the intra prediction mode of the current block belongs to the most probable mode list, it is possible to signal to the decoding apparatus 600 using very few bits.
  • the MPM index information indicates which mode among the modes belonging to the most probable mode list of the intra prediction mode of the current block.
  • the intra prediction mode of the current block belongs to the MPM list, and if the flag is 0, the intra prediction mode of the current block belongs to the residual mode group.
  • the residual mode group may include all intra prediction modes other than intra prediction modes belonging to the MPM list.
  • encoding whether the Most Probable Mode (MPM) is applied is performed by encoding the MPM flag.
  • FIG. 27 is a flowchart illustrating a method of decoding an intra prediction mode when decoding an image using DIMD according to the present invention.
  • the information informing whether or not the DIMD according to the present invention is performed is decoded (S2601). This information indicates whether the intra prediction mode is derived using the DIMD according to the present invention or whether the intra prediction mode is derived using another method.
  • DIMD After determining whether the DIMD according to the present invention is used (S2602), if DIMD is used, the process is terminated, and the intra prediction mode of the current block is derived by the DIMD.
  • step S2603 whether to apply Most Probable Mode (MPM) is decoded.
  • MPM Most Probable Mode
  • the residual mode group may include all intra prediction modes other than intra prediction modes belonging to the MPM list.
  • the mode other than the MPM candidate is rearranged and the intra prediction mode of the current block is decoded (S2605). If the MPM is used, the MPM index indicating the intra prediction mode candidate is applied (S2606) and then terminates.
  • a seventh embodiment of the present invention relates to a method of deriving an intra prediction mode using a plurality of reference pixel lines in a template.
  • the angle modes existing on the right side of the upper left 45 degree direction mode are defined as the upper angle mode and template B and reference pixel lines above it are used.
  • the angle modes on the left side of the upper left 45 degree direction mode are defined as the left angle mode, and template A and reference pixel lines on the left side are used.
  • prediction is performed for each reference pixel line according to the intra prediction mode.
  • the reference pixel line 2 of the template is predicted using the reference pixel line 2 of the template, and an optimal intra prediction mode candidate 1 is generated.
  • the template is predicted using the reference pixel line 1 of the template, and an optimal intra prediction mode candidate 2 is generated. If the intra prediction modes candidates 1 and 2 are the same, the prediction mode is selected as the intra prediction mode of the current block. If different, it is determined whether to perform one of the above-described DIMD methods according to various embodiments of the present invention.
  • 29 is a flowchart illustrating a process of encoding an intra prediction mode when the seventh embodiment of the present invention is applied.
  • intra prediction mode candidates are derived using a reference pixel line of a template (S2801). Thereafter, after determining whether the intra prediction modes candidates are the same (S2802), if the same mode is selected, the flowchart ends because the same mode is selected as the intra prediction mode of the current block. If intra prediction mode candidates are not the same, whether to perform DIMD according to the present invention is encoded (S2803).
  • FIG. 30 is a flowchart illustrating a process of decoding an intra prediction mode when the seventh embodiment of the present invention is applied.
  • Each process shown in FIG. 30 is substantially the same as each step shown in FIG. 29 except that the process is performed by the image decoding apparatus 600, and thus a detailed description thereof will be omitted.
  • the intra prediction mode itself is not signaled.
  • the candidate intra prediction modes are derived using a plurality of templates, and then index information indicating which mode is used is transmitted by the encoding apparatus 100 to the decoding apparatus 600.
  • 31A and 31B are diagrams for describing a variation of DIMD for transmitting a template index.
  • Each of the intra prediction mode candidates is generated by using two templates using the DIMD of the present invention and then designated using an index.
  • R and S representing the size of the reference pixel region of the template illustrated in FIG. 31A or 31B are assumed to be 1 for convenience of description.
  • the intra prediction mode candidate 1 is derived from the template A 3102 using pixels in the reference pixel area 3103 of the template.
  • the intra prediction mode candidate 2 is derived from the template B 3104 by using the pixels in the reference pixel area 3105 of the template.
  • an index indicating whether an intra prediction mode candidate derived from a template is the intra prediction mode of the current block 3101 is encoded and transmitted to the decoding apparatus 600.
  • intra prediction mode the block containing the template is encoded may be used in the present embodiment.
  • the intra prediction mode of the block including the template A 3102 is called the intra prediction mode A
  • the template using the intra prediction mode A and the reference pixels of the template is used. If the intra prediction mode determined by applying to the A 3102 is the same, a high or low priority may be given. It is also possible to allocate bits in the placement of candidates for index setting according to their priority. Similarly, if there are multiple templates other than template A 3102, it is also possible to set priorities in bit allocation using the above conditions.
  • 32 is a flowchart for explaining a method of encoding an intra prediction mode according to DIMD using a template index.
  • information indicating whether to perform the DIMD using the template index is coded (S3301). After determining whether the DIMD using the template index has been performed (S3302), if so, the template index is encoded and terminated (S3307). If DIMD using the template index has not been performed, whether to apply the Most Probable Mode (MPM) is encoded (S3303). After checking whether the MPM has been applied (S3304), if not applied, reordering the modes except for the MPM candidate, and performing encoding (S3305), and if the MPM is applied, encoding the MPM index indicating which candidate is applied ( S3306) End.
  • MPM Most Probable Mode
  • FIG. 33 is a flowchart illustrating a method of encoding an intra prediction mode according to DIMD using a template index.
  • Each process shown in FIG. 33 is substantially the same as each step shown in FIG. 32 except that the process is performed by the image decoding apparatus 600, and thus a detailed description thereof will be omitted.
  • 31A and 31B exemplify two templates as surroundings, it is also possible to use three or more templates.
  • the intra prediction mode candidate which does not signal the intra prediction mode itself to the decoding apparatus 600 or is derived using any one of the plurality of templates is the intra prediction mode of the current block.
  • Template index information indicating whether or not is selected is transmitted by the encoding apparatus 100 to the decoding apparatus 600.
  • MPM Most Probable Mode
  • the MPM candidate for the prediction of the intra prediction mode After generating the MPM candidate for the prediction of the intra prediction mode, it is also possible to arrange the MPM candidates in the order similar to the intra prediction mode derived using the template.
  • 34 is a diagram for explaining an example of setting an intra prediction mode induced using a template as an MPM candidate.
  • block A 3503 assumes intra prediction
  • block B 3505 assumes inter prediction.
  • the block B 3505 generates an intra picture prediction mode of block B 3505 using a template. Deriving the intra prediction mode of block B 3505 using a template refers to the foregoing descriptions related to FIGS. 31B and 31B.
  • the intra prediction mode of the template B 3104 is derived using the template B 3104 of FIG. 31B, the method of encoding the intra prediction mode, the number of intra prediction modes, and the prediction angles are determined by the image encoding apparatus ( 100 or the same as those preset by the image decoding apparatus 600.
  • the candidate of the MPM is set using the intra prediction mode in which the block including the template is encoded.
  • the intra prediction mode of the left block 3703 of the current block 3701 is a mode 10
  • the template pixel 3705 corresponding to a portion of the left block 3703 is a reference pixel of the template.
  • the intra prediction mode derived from the above is the 12th mode.
  • the intra prediction mode of the upper block 3707 of the current block 3701 is 28, and the reference pixels (not shown) of the template are used for the template B 3709 which is a part of the upper block 3707.
  • the intra prediction mode derived from the above is 28.
  • mode 10 is advantageous for encoding considering the entire left block 3703, but since mode 12 is set in the template A 3705 adjacent to the current block 3701, the prediction mode of the current block is It can be assumed that mode 12 is more appropriate than mode 10.
  • the MPM candidate may be generated using the intra prediction mode derived from the template A 3705 rather than the intra prediction mode of the left block 3703 when the candidate is set.
  • the intra prediction mode of the upper block 3707 and the intra prediction mode derived through the template B 3709 are the same, and thus the same mode is used as the MPM candidate.
  • Exemplary methods of the present disclosure are represented as a series of operations for clarity of description, but are not intended to limit the order in which the steps are performed, and each step may be performed simultaneously or in a different order as necessary.
  • the illustrated step may further include other steps, may include other steps except some, or may include additional other steps except some.
  • various embodiments of the present disclosure may be implemented by hardware, firmware, software, or a combination thereof.
  • one or more Application Specific Integrated Circuits (ASICs), Digital Signal Processors (DSPs), Digital Signal Processing Devices (DSPDs), Programmable Logic Devices (PLDs), Field Programmable Gate Arrays (FPGAs), General Purpose It may be implemented by a general processor, a controller, a microcontroller, a microprocessor, and the like.
  • scope of the disclosure include software or machine-executable instructions (eg, an operating system, an application, firmware, a program, etc.) to cause an operation in accordance with various embodiments of the method to be executed on an apparatus or a computer, and such software or Instructions, and the like, including non-transitory computer-readable media that are stored and executable on a device or computer.
  • software or machine-executable instructions eg, an operating system, an application, firmware, a program, etc.
  • the present invention can be used in the field of encoding or decoding video signals.

Abstract

본 발명의 일 실시예에 따른 영상의 부호화/복호화 방법 및 장치는, 복수의 참조 화소 라인들 중 적어도 하나의 참조 화소 라인을 선택하고, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 상기 현재 블록 내의 하나의 화소의 예측값을 유도할 수 있다. 또한, 본 발명의 다른 실시예에 따른 영상 부호화/복호화 방법 및 장치는, 이미 복원된, 적어도 하나의 화소 영역의 참조 화소 영역에 기초하여 상기 복원된 화소 영역의 인트라 예측 모드를 유도하고, 상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하고, 상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻고, 상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원할 수 있다.

Description

영상의 부호화/복호화 방법 및 장치
본 발명은 영상 신호 부호화/복호화 방법 및 장치에 관한 것으로서, 보다 구체적으로는 개선된 화면 내 예측을 이용한 영상 부호화/복호화 방법 및 장치에 관한 것이다.
최근, 인터넷에서는 동영상과 같은 멀티미디어 데이터의 수요가 급격히 증가하고 있다. 하지만 채널(Channel)의 대역폭(Bandwidth)이 발전하는 속도는 급격히 증가하고 있는 멀티미디어 데이터의 양을 따라가기 힘든 상황이다. 이러한 문제를 해결하기 위하여 국제 표준화 기구인 ITU-T의 VCEG(Video Coding Expert Group)과 ISO/IEC의 MPEG(Moving Picture Expert Group)에서는 꾸준히 공동 연구를 통하여 보다 향상된 동영상 압축 표준을 연구하는 중이다.
동영상 압축은 크게 화면 내 예측, 화면 간 예측, 변환, 양자화, 엔트로피(Entropy coding)부호화, 인루프 필터(In-loop filter)로 구성된다. 이 중, 화면 내 예측은 현재 블록주변에 존재하는 복원된 화소들을 이용하여 현재 블록을 위한 예측 블록을 생성하는 기술을 말한다.
종래의 화면 내 예측은, 정수 위치의 참조 화소들을 이용한 보간 과정을 통해 분수 위치의 화소들을 생성하고, 이렇게 생성된 분수 위치의 화소들을 이용하여 예측 블록을 생성한다. 이 때 어떤 정수 위치의 참조 화소들을 이용하느냐 여부와 어떤 보간 방식을 적용하였는지 여부에 따라 원래 화소값과 그 예측값 간의 오차에 영향을 주게된다.
또한, 종래의 화면 내 예측 기술은, 다수의 화면 내 예측 모드들 중 어떠한 화면 내 예측 모드가 입력 영상의 화면 내 예측에 사용되었는지를 영상 복호화 장치에 알리기 위해 예측 모드에 관한 상당한 정보를 부호화해야 한다.
본 발명은 영상을 부호화/복호화함에 있어서, 복수의 참조 화소 라인들을 이용하여 인트라 예측을 수행함으로써, 인트라 예측의 효율을 향상시키는 것에 주된 목적이 있다.
본 발명은 영상을 부호화/복호화함에 있어서, 복수의 보간 방식 중에서 선택된 보간 방식을 이용하여 인트라 예측 블록을 유도함으로써, 인트라 예측의 효율을 향상시키는 것에 주된 목적이 있다.
본 발명은 영상을 부호화/복호화함에 있어서, 복수의 참조 화소 라인들을 이용하여 인트라 예측을 수행한 경우, 인트라 예측 블록과 주변 영역 간의 불연속성을 감소시킬 수 있는 필터링 방법을 제공하는데 주된 목적이 있다.
본 발명은 영상을 부호화/복호화함에 있어서, 이미 복원된 화소 영역을 이용하여 부호화 또는 복호화할 영상의 화면 내 예측 모드를 유도함으로써, 화면 내 예측의 효율을 향상시키는 것에 주된 목적이 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 복수의 참조 화소 라인들 중 적어도 하나의 참조 화소 라인을 선택하고, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 상기 현재 블록 내의 하나의 화소의 예측값을 유도할 수 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 입력 비트스트림으로부터 참조 화소 라인 인덱스 정보를 얻어, 상기 참조 화소 라인 인덱스 정보에 기초하여, 상기 복수의 참조 화소 라인들 중에서 상기 적어도 하나의 참조 화소 라인을 선택할 수 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 상기 현재 블록 내의 각 화소의 위치에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택할 수 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 복수의 보간 방식 중 하나를 선택하고, 상기 선택된 보간 방식을 이용하여, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소를 이용하여 보간을 수행하여 상기 예측값을 얻을 수 있다. 상기 선택된 보간 방식은, 복수의 보간 방식 중 하나를 나타내는 인덱스 정보에 기초하여 선택될 수 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 상기 현재 블록의 모든 화소들의 예측값을 유도하여 상기 현재 블록의 예측 블록을 얻고, 상기 예측 블록을 필터링할 수 있다.
본 발명의 일 실시예에 따른 영상의 복호화 방법 및 장치는, 상기 현재 블록의 크기 또는 상기 현재 블록의 인트라 예측 모드에 따라 상기 현재 블록의 소정 영역을 필터링할 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 복수의 참조 화소 라인들 중 적어도 하나의 참조 화소 라인을 선택하고, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 상기 현재 블록 내의 하나의 화소의 예측값을 얻을 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 선택된 적어도 하나의 참조 화소 라인을 지시하는 참조 화소 라인 인덱스 정보를 부호화하고, 상기 부호화된 참조 화소 라인 인덱스 정보를 비트스트림에 포함시킬 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 현재 블록 내의 각 화소의 위치에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택할 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 현재 블록의 인트라 예측 모드에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택할 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 복수의 보간 방식 중 하나를 선택하고, 상기 선택된 보간 방식을 이용하여, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소를 이용하여 보간을 수행하여 상기 예측값을 얻을 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 복수의 보간 방식 중 하나를 나타내는 인덱스 정보를 부호화하여 비트스트림에 포함시킬 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 현재 블록의 모든 화소들의 예측값을 유도하여 상기 현재 블록의 예측 블록을 얻은 후 상기 예측 블록을 필터링할 수 있다.
본 발명의 일 실시예에 따른 영상의 부호화 방법 및 장치는, 상기 현재 블록의 크기 또는 상기 현재 블록의 인트라 예측 모드에 따라 상기 현재 블록의 소정 영역을 필터링할 수 있다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 방법 및 장치는, 이미 복원된, 적어도 하나의 화소 영역의 참조 화소 영역에 기초하여 상기 복원된 화소 영역의 인트라 예측 모드를 유도하고, 상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하고, 상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻고, 상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원할 수 있다.
본 발명의 일 실시예에 따른 영상 복호화 방법 및 장치는, 입력 비트스트림으로부터 인트라 예측 모드의 유도 방법을 지시하는 정보를 얻고, 상기 인트라 예측 모드의 유도 방법을 지시하는 정보에 따라, 복원된 화소 영역의 인트라 예측 모드의 유도의 수행 여부가 선택될 수 있다.
본 발명의 일 실시예에 따른 영상 복호화 방법 및 장치는, 입력 비트스트림에서 상기 가용한 복수의 인트라 예측 모드들의 개수 또는 상기 가용한 복수의 인트라 예측 모드들의 리스트를 특정하는 가용한 인트라 예측 모드 정보를 얻고, 상기 가용한 인트라 예측 모드 정보에 기초하여 상기 현재 블록의 인트라 예측 모드를 유도할 수 있다.
본 발명의 일 실시예에 따른 영상 부호화 방법 및 장치는, 현재 블록의 인트라 예측 모드의 유도 방법을 지시하는 정보를 부호화한 후 비트스트림에 포함시키고, 상기 비트스트림을 입력받은 영상 복호화 장치는, 상기 현재 블록의 인트라 예측 모드의 유도 방법을 지시하는 정보에 따라 상기 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계를 선택적으로 수행할 수 있다.
본 발명에 따르면, 보다 효과적인 인트라 예측 기술을 적용함으로써, 영상의 압축 효율과 재생된 영상의 화질을 향상시킬 수 있다. 또한, 본 발명에 따른, 인트라 예측 블록과 주변 영역 간의 불연속성을 감소시킬 수 있는 필터링 방법을 적용함으로써 재생된 영상의 화질을 향상시킬 수 있다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 나타낸 블록도이다.
도 2는 인트라 예측 모드의 일 예를 설명하기 위한 도면이다.
도 3은 평면 모드를 설명하기 위한 도면이다.
도 4는 DC 모드를 설명하기 위한 도면이다.
도 5는 예측 블록을 생성하는 일 예를 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 영상 복호화 장치를 나타낸 블록도이다.
도 7a 및 도 7b는 보간을 이용하여 화면 내 예측 화소를 유도하는 방법을 설명하기 위한 도면이다.
도 8은 보간 방법 또는 보간 계수들을 선택하는 묵시적인 방법을 설명하기 위한 도면이다.
도 9는 영상 부호화 장치에 의해 화면 내 예측 모드가 선택되는 과정을 설명하기 위한 순서도이다.
도 10은 영상 부호화 장치에 의해 복수의 보간 방식들 중 하나가 선택되는 과정을 설명하기 위한 순서도이다.
도 11은 영상 부호화 장치에 의해 보간 방식 인덱스 정보를 부호화하는 과정을 설명하는 순서도이다.
도 12는 영상 복호화 장치에 의해 보간 방식 인덱스 정보가 복호화되는 과정을 설명하는 순서도이다.
도 13은 본 발명의 일 실시예에 따른, 복수의 참조 화소 라인들을 이용한 화면 내 예측 화소의 유도를 설명하기 위한 도면이다.
도 14는 본 발명의 일 실시예에 따른, 화면 내 예측 화소값을 유도하는 과정을 설명하기 위한 흐름도이다.
도 15는 예측 블록마다 인트라 예측에 이용될 참조 화소 라인을 적응적으로 결정하는 과정을 설명하기 위한 흐름도이다.
도 16은 참조 화소 라인 인덱스 정보가 영상 부호화 장치에 의해 부호화되는 과정을 나타낸 흐름도이다.
도 17은 참조 화소 라인 인덱스 정보가 영상 복호화 장치에 의해 복호화되는 과정을 나타낸 흐름도이다.
도 18 및 도 19는 참조 화소 라인 인덱스의 전송 없이 참조 화소 라인을 결정하는 방법을 설명하기 위한 도면이다.
도 20은 예측 블록과 참조 화소 라인간의 스무딩을 설명하기 위한 도면이다.
도 21은 공통의 참조 화소 라인을 현재 블록 내의 모든 변환 블록들에 이용되는 경우를 도시한다.
도 22a 내지 22d는 각 변환 블록 마다 참조 화소 라인을 선택하여 인트라 예측에 이용되는 경우를 도시한다.
도 23은 본 발명의 제1 실시예에 따른 DIMD를 설명하기 위한 도면이다.
도 24는 본 발명의 제3 실시예에 따른 DIMD를 설명하기 위한 도면이다.
도 25는 본 발명에 따른 DIMD를 설명하기 위한 순서도이다.
도 26은 본 발명에 따른 DIMD를 이용하여 영상을 부호화하는 경우, 화면 내 예측 모드를 부호화하는 방법을 설명하기 위한 순서도이다.
도 27은 본 발명에 따른 DIMD를 이용하여 영상을 복호화하는 경우, 화면 내 예측 모드를 복호화하는 방법을 설명하기 위한 순서도이다.
도 28은 본 발명에 따른 제7 실시예를 설명하기 위한 도면이다.
도 29는 본 발명의 제7 실시예를 적용한 경우, 인트라 예측 모드를 부호화 하는 과정을 나타낸 순서도이다.
도 30은 본 발명의 제7 실시예를 적용한 경우, 인트라 예측 모드를 복호화 하는 과정을 나타낸 순서도이다.
도 31a 및 도 31b는 템플릿 인덱스를 전송하는 DIMD의 변형예를 설명하기 위한 도면이다.
도 32는 템플릿 인덱스가 사용되는 DIMD에 따른 화면 내 예측 모드의 부호화 방법을 설명하는 순서도이다.
도 33은 템플릿 인덱스가 사용되는 DIMD에 따른 화면 내 예측 모드의 부호화 방법을 설명하는 순서도이다.
도 34는 템플릿을 이용하여 유도된 화면 내 예측 모드를 MPM 후보로 설정하는 일 예를 설명하기 위한 도면이다.
도 35는 본 발명의 일 실시예에 따른 MPM 후보 설정을 설명하기 위한 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부한 도면들을 참조하여, 본 발명의 실시예들을 상세하게 설명한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일실시예에 따른 영상 부호화 장치를 나타낸 블록도이다.
도 1을 참조하면, 영상 부호화 장치(100)는 영상 분할부(101),화면 내 예측부(102), 화면 간 예측부(103), 감산부(104), 변환부(105), 양자화부(106), 엔트로피 부호화부(107), 역양자화부(108), 역변환부(109), 증산부(110), 필터부(111) 및 메모리(112)를 포함할 수 있다.
도 1에 나타난 각 구성부들은 영상 부호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시한 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
영상 분할부(100)는 입력된 영상을 적어도 하나의 블록으로 분할할 수 있다. 이 때, 입력된 영상은 픽처, 슬라이스, 타일, 세그먼트 등 다양한 형태와 크기를 가질 수 있다. 블록은 부호화 단위(CU), 예측 단위(PU) 또는 변환 단위(TU)를 의미할 수 있다. 상기 분할은 쿼드 트리(Quadtree) 또는 바이너리 트리(Biniary tree) 중 적어도 하나에 기반하여 수행될 수 있다. 쿼드 트리는 상위 블록을 너비와 높이가 상위 블록의 절반인 하위 블록으로 사분할하는 방식이다. 바이너리 트리는 상위 블록을 너비 또는 높이 중 어느 하나가 상위 블록의 절반인 하위 블록으로 이분할하는 방식이다. 전술한 바이너리 트리 기반의 분할을 통해, 블록은 정방형뿐만 아니라 비정방형의 형태를 가질 수 있다.
이하, 본 발명의 실시예에서는 부호화 단위는 부호화를 수행하는 단위의 의미로 사용할 수도 있고, 복호화를 수행하는 단위의 의미로 사용할 수도 있다.
예측부(102, 103)는 인터 예측을 수행하는 화면 간 예측부(103)와 인트라 예측을 수행하는 화면 내 예측부(102)를 포함할 수 있다. 예측 단위에 대해 인터 예측을 사용할 것인지 또는 인트라 예측을 수행할 것인지를 결정하고, 각 예측 방법에 따른 구체적인 정보(예컨대, 인트라 예측 모드, 모션 벡터, 참조 픽쳐 등)를 결정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 예측 단위로 결정되고, 예측의 수행은 변환 단위로 수행될 수도 있다.
생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록)은 변환부(105)로 입력될 수 있다. 또한, 예측을 위해 사용한 예측 모드 정보, 모션 벡터 정보 등은 잔차값과 함께 엔트로피 부호화부(107)에서 부호화되어 복호화기에 전달될 수 있다. 특정한 부호화 모드를 사용할 경우, 예측부(102, 103)를 통해 예측 블록을 생성하지 않고, 원본 블록을 그대로 부호화하여 복호화부에 전송하는 것도 가능하다.
화면 내 예측부(102)는 현재 블록의 화면 내 예측 모드를 결정하고, 상기 결정된 인트라 예측 모드에 따라, 참조 화소들을 이용하여 하나 또는 복수개의 예측 블록을 생성할 수 있다. 인트라 예측이 수행될 현재 블록의 주변 블록의 예측 모드가 인터 예측인 경우, 인터 예측이 적용된 주변 블록에 포함되는 참조 픽셀을, 인트라 예측이 적용된 주변의 다른 블록 내의 참조 픽셀로 대체될 수 있다. 즉, 참조 픽셀이 가용하지 않는 경우, 가용하지 않은 참조 픽셀 정보를, 가용한 참조 픽셀 중 적어도 하나의 참조 픽셀로 대체하여 사용할 수 있다.
인트라 예측에서 예측 모드는 참조 픽셀 정보를 예측 방향에 따라 사용하는 방향성 예측 모드와 예측을 수행시 방향성 정보를 사용하지 않는 비방향성 모드를 가질 수 있다. 휘도 정보를 예측하기 위한 모드와 색차 정보를 예측하기 위한 모드가 상이할 수 있고, 색차 정보를 예측하기 위해 휘도 정보를 예측하기 위해 사용된 인트라 예측 모드 정보 또는 예측된 휘도 신호 정보를 활용할 수 있다.
화면 내 예측부(102)는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 필터로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 적응적으로 결정할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.
화면 내 예측부(102)의 참조 화소 보간부는 예측 단위의 인트라 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 분수 단위 위치의 참조 화소를 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다.
예측부(102, 103)에서 생성된 예측 블록과 예측 블록의 원본 블록 간의 차이값인 잔차값(Residual) 정보를 포함하는 잔차 블록이 생성될 수 있다. 생성된 잔차 블록은 변환부(130)로 입력되어 변환될 수 있다.
도 2는 인트라 예측 모드의 일 예를 설명하기 위한 도면이다. 도 2에 도시된 인트라 예측 모드는 총 35가지의 모드를 가지고 있다. 0번 모드는 평면 모드(Planar mode), 1번 모드는 DC 모드, 2 내지 34번 모드는 각도 모드(Angular mode)를 나타낸다.
도 3은 평면 모드를 설명하기 위한 도면이다. 현재 블록 내의 첫 번째 화소 P1의 예측값을 생성하기 위해 Y축으로 같은 위치에 있는 복원된 화소와 현재 블록의 우측 상단에 존재하는 복원된 화소 T를 도시된 바와 같이 선형 보간 하여 생성한다. 마찬가지로 두 번째 화소 P2의 예측값을 생성하기 위해 X축으로 같은 위치에 있는 복원된 화소와 현재 블록의 좌측 하단에 존재하는 복원된 화소 L을 도시된 바와 같이 선형 보간 하여 생성한다. 두 개의 예측 화소 P1과 P2를 평균한 값이 최종적인 예측 화소가 된다. 평면 모드에서는 위와 같은 방식으로 예측 화소들을 유도하여 현재 블록의 예측 블록을 생성한다.
도 4는 DC 모드를 설명하기 위한 도면이다. 현재 블록 주변의 복원된 화소들의 평균을 계산한 다음, 그 평균 값을 현재 블록 내의 모든 화소들의 예측값으로 이용한다.
도 5는 도 2의 10번 모드(수평 모드)와 26번 모드(수직 모드)를 이용하여 예측 블록을 생성하는 일 예를 설명하기 위한 도면이다. 10번 모드를 이용하는 경우, 현재 블록의 좌측에 접하는 각 참조화소를 오른쪽 방향으로 복사하여 현재 블록의 예측 블록을 생성한다. 마찬가지로 26번 모드는, 현재 블록의 상측에 접하는 각 참조 화소를 아래쪽 방향으로 복사하여 현재 블록의 예측 블록을 생성한다.
다시 도 1을 참조하면, 화면 간 예측부(103)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측 단위를 예측할 수도 있고, 경우에 따라서는 현재 픽쳐 내의 부호화가 완료된 일부 영역의 정보를 기초로 예측 단위를 예측할 수도 있다. 화면 간 예측부(103)는 참조 픽쳐 보간부, 모션 예측부, 움직임 보상부를 포함할 수 있다.
참조 픽쳐 보간부에서는 메모리(112)로부터 참조 픽쳐 정보를 제공받고 참조 픽쳐에서 정수 화소 이하의 화소 정보를 생성할 수 있다. 휘도 화소의 경우, 1/4 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 8탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다. 색차 신호의 경우 1/8 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 4탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다.
모션 예측부는 참조 픽쳐 보간부에 의해 보간된 참조 픽쳐를 기초로 모션 예측을 수행할 수 있다. 모션 벡터를 산출하기 위한 방법으로 FBMA(Full search-based Block Matching Algorithm), TSS(Three Step Search), NTS(New Three-Step Search Algorithm) 등 다양한 방법이 사용될 수 있다. 모션 벡터는 보간된 화소를 기초로 1/2 또는 1/4 화소 단위의 모션 벡터값을 가질 수 있다. 모션 예측부에서는 모션 예측 방법을 다르게 하여 현재 예측 단위를 예측할 수 있다. 모션 예측 방법으로 스킵(Skip) 방법, 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법 등 다양한 방법이 사용될 수 있다.
감산부(104)는, 현재 부호화하려는 블록과 화면 내 예측부(102) 혹은 화면 간 예측부(103)에서 생성된 예측 블록을 감산하여 현재 블록의 잔차 블록을 생성한다.
변환부(105)에서는 잔차 데이터를 포함한 잔차 블록을 DCT, DST, KLT(Karhunen Loeve Transform) 등과 같은 변환 방법을 사용하여 변환시킬 수 있다. 이때 변환 방법은 잔차 블록을 생성하기 위해 사용된 예측 단위의 인트라 예측 모드에 기반하여 결정될 수 있다. 예를 들어, 인트라 예측 모드에 따라, 가로 방향으로는 DCT를 사용하고, 세로 방향으로는 DST를 사용할 수도 있다.
양자화부(106)는 변환부(105)에서 주파수 영역으로 변환된 값들을 양자화할 수 있다. 블록에 따라 또는 영상의 중요도에 따라 양자화 계수는 변할 수 있다. 양자화부(106)에서 산출된 값은 역양자화부(108)와 엔트로피 부호화부(107)에 제공될 수 있다.
상기 변환부(105) 및/또는 양자화부(106)는, 영상 부호화 장치(100)에 선택적으로 포함될 수 있다. 즉, 영상 부호화 장치(100)는, 잔차 블록의 잔차 데이터에 대해 변환 또는 양자화 중 적어도 하나를 수행하거나, 변환 및 양자화를 모두 스킵하여 잔차 블록을 부호화할 수 있다. 영상 부호화 장치(100)에서 변환 또는 양자화 중 어느 하나가 수행되지 않거나, 변환 및 양자화 모두 수행되지 않더라도, 엔트로피 부호화부(107)의 입력으로 들어가는 블록을 통상적으로 변환 블록이라 일컫는다. 엔트로피 부호화부(107)는 입력 데이터를 엔트로피 부호화한다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 사용할 수 있다.
엔트로피 부호화부(107)는 예측부(102, 103)로부터 부호화 단위의 잔차값 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 단위 정보 및 전송 단위 정보, 모션 벡터 정보, 참조 프레임 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 부호화할 수 있다. 엔트로피 부호화부(107)에서, 변환 블록의 계수는, 변환 블록 내 부분 블록 단위로, 0이 아닌 계수, 절대값이 1 또는 2보다 큰 계수, 그리고 계수의 부호 등을 나타내는 여러 종류의 플래그를 부호화될 수 있다. 상기 플래그만으로 부호화되지 않는 계수는, 플래그를 통해 부호화된 계수와 실제 변환 블록의 계수 간의 차이의 절대값을 통해 부호화될 수 있다. 역양자화부(108) 및 역변환부(109)에서는 양자화부(106)에서 양자화된 값들을 역양자화하고 변환부(105)에서 변환된 값들을 역변환한다. 역양자화부(108) 및 역변환부(109)에서 생성된 잔차값(Residual)은 예측부(102, 103)에 포함된 움직임 추정부, 움직임 보상부 및 화면 내 예측부(102)를 통해서 예측된 예측 단위와 합쳐져 복원 블록(Reconstructed Block)을 생성할 수 있다. 증산기(110)는, 예측부(102, 103)에서 생성된 예측 블록과, 역 변환부(109)를 통해 생성된 잔차 블록을 증산하여 복원 블록을 생성한다.
필터부(111)는 디블록킹 필터, 오프셋 보정부, ALF(Adaptive Loop Filter)중 적어도 하나를 포함할 수 있다.
디블록킹 필터는 복원된 픽쳐에서 블록간의 경계로 인해 생긴 블록 왜곡을 제거할 수 있다. 디블록킹을 수행할지 여부를 판단하기 위해 블록에 포함된 몇 개의 열 또는 행에 포함된 픽셀을 기초로 현재 블록에 디블록킹 필터 적용할지 여부를 판단할 수 있다. 블록에 디블록킹 필터를 적용하는 경우 필요한 디블록킹 필터링 강도에 따라 강한 필터(Strong Filter) 또는 약한 필터(Weak Filter)를 적용할 수 있다. 또한 디블록킹 필터를 적용함에 있어 수직 필터링 및 수평 필터링 수행시 수평 방향 필터링 및 수직 방향 필터링이 병행 처리되도록 할 수 있다.
오프셋 보정부는 디블록킹을 수행한 영상에 대해 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 픽쳐에 대한 오프셋 보정을 수행하기 위해 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후 오프셋을 수행할 영역을 결정하고 해당 영역에 오프셋을 적용하는 방법 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법을 사용할 수 있다.
ALF(Adaptive Loop Filtering)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다. ALF를 적용할지 여부에 관련된 정보는 휘도 신호는 부호화 단위(Coding Unit, CU) 별로 전송될 수 있고, 각각의 블록에 따라 적용될 ALF 필터의 모양 및 필터 계수는 달라질 수 있다. 또한, 적용 대상 블록의 특성에 상관없이 동일한 형태(고정된 형태)의 ALF 필터가 적용될 수도 있다.
메모리(112)는 필터부(111)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있고, 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행 시 예측부(102, 103)에 제공될 수 있다.
도 6은 본 발명의 일 실시예에 따른 영상 복호화 장치(600)를 나타낸 블록도이다.
도 6을 참조하면, 영상 복호화 장치(600)는 엔트로피 복호화부(601), 역양자화부(602), 역변환부(603), 증산부(604), 필터부(605), 메모리(606) 및 예측부(607, 608)를 포함할 수 있다.
영상 부호화 장치(100)에 의해 생성된 영상 비트스트림이 영상 복호화 장치(600)로 입력되는 경우, 입력된 비트스트림은 영상 부호화 장치(100)에서 수행된 과정과 반대의 과정에 따라 복호될 수 있다.
엔트로피 복호화부(601)는 영상 부호화 장치(100)의 엔트로피 부호화부(107)에서 엔트로피 부호화를 수행한 것과 반대의 절차로 엔트로피 복호화를 수행할 수 있다. 예를 들어, 영상 부호화기에서 수행된 방법에 대응하여 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 방법이 적용될 수 있다. 엔트로피 복호화부(601)에서, 변환 블록의 계수는, 변환 블록 내 부분 블록 단위로, 0이 아닌 계수, 절대값이 1 또는 2보다 큰 계수, 그리고 계수의 부호 등을 나타내는 여러 종류의 플래그를 기반으로 복호화될 수 있다. 상기 플래그만으로 표현되지 않는 계수는, 플래그를 통해 표현되는 계수와 시그날링된 계수의 합을 통해 복호화될 수 있다.
엔트로피 복호화부(601)에서는 부호화기에서 수행된 인트라 예측 및 인터 예측에 관련된 정보를 복호화할 수 있다.역 양자화부(602)는 양자화된 변환 블록에 역 양자화를 수행하여 변환 블록을 생성한다. 도 1의 역 양자화부(108)와 실질적으로 동일하게 동작한다.
역 변환부(603)은 변환 블록에 역 변환을 수행하여 잔차 블록을 생성한다. 이때, 변환 방법은 예측 방법(인터 또는 인트라 예측), 블록의 크기 및/또는 형태, 인트라 예측 모드 등에 관한 정보를 기반으로 결정될 수 있다. 도 1의 역 변환부(109)와 실질적으로 동일하게 동작한다.
증산부(604)는, 화면 내 예측부(607) 혹은 화면 간 예측부(608)에서 생성된 예측 블록과 역 변환부(603)를 통해 생성된 잔차 블록를 증산하여 복원 블록을 생성한다. 도 1의 증산부(110)과 실질적으로 동일하게 동작한다.
필터부(605)는, 복원된 블록들에 발생하는 여러 종류의 노이즈를 감소시킨다.
필터부(605)는 디블록킹 필터, 오프셋 보정부, ALF를 포함할 수 있다.
영상 부호화 장치(100)로부터 해당 블록 또는 픽쳐에 디블록킹 필터를 적용하였는지 여부에 대한 정보 및 디블록킹 필터를 적용하였을 경우, 강한 필터를 적용하였는지 또는 약한 필터를 적용하였는지에 대한 정보를 제공받을 수 있다. 영상 복호화 장치(600)의 디블록킹 필터에서는 영상 부호화 장치(100)에서 제공된 디블록킹 필터 관련 정보를 제공받고 영상 복호화 장치(600)에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다.
ALF는 영상 부호화 장치(100)로부터 제공된 ALF 적용 여부 정보, ALF 계수 정보 등을 기초로 부호화 단위에 적용될 수 있다. 이러한 ALF 정보는 특정한 파라미터 셋에 포함되어 제공될 수 있다. 필터부(605)는 도 1의 필터부(111)와 실질적으로 동일하게 동작한다.
메모리(606)는 증산부(604)에 의해 생성된 복원 블록을 저장한다. 도 1의 메모리(112)와 실질적으로 동일하게 동작한다.
예측부(607, 608)는 엔트로피 복호화부(601)에서 제공된 예측 블록 생성 관련 정보와 메모리(606)에서 제공된 이전에 복호화된 블록 또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다.
예측부(607, 608)는 화면 내 예측부(607) 및 화면 간 예측부(608)를 포함할 수 있다. 별도로 도시되지는 아니하였으나, 예측부(607, 608)는 예측 단위 판별부를 더 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(601)에서 입력되는 예측 단위 정보, 인트라 예측 방법의 예측 모드 정보, 인터 예측 방법의 모션 예측 관련 정보 등 다양한 정보를 입력 받고 현재 부호화 단위에서 예측 단위를 구분하고, 예측 단위가 인터 예측을 수행하는지 아니면 인트라 예측을 수행하는지 여부를 판별할 수 있다. 화면 간 예측부(608)는 영상 부호화 장치(100)에서 제공된 현재 예측 단위의 인터 예측에 필요한 정보를 이용해 현재 예측 단위가 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 단위에 대한 인터 예측을 수행할 수 있다. 또는, 현재 예측 단위가 포함된 현재 픽쳐 내에서 기-복원된 일부 영역의 정보를 기초로 인터 예측을 수행할 수도 있다.
화면 간 예측을 수행하기 위해 부호화 단위를 기준으로 해당 부호화 단위에 포함된 예측 단위의 모션 예측 방법이 스킵 모드(Skip Mode), 머지 모드(Merge 모드), AMVP 모드(AMVP Mode) 중 어떠한 방법인지 여부를 판단할 수 있다.
화면 내 예측부(607)는, 현재 부호화하려는 블록 주변에 위치한, 그리고 기 복원된 화소들을 이용하여 예측 블록을 생성한다.
화면 내 예측부(607)는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 필터로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 적응적으로 결정할 수 있다. 영상 부호화 장치(100)에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 화소에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.
화면 내 예측부(607)의 참조 화소 보간부는 예측 단위의 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 분수 단위 위치의 참조 화소를 생성할 수 있다. 생성된 분수 단위 위치의 참조 화소가 현재 블록 내의 화소의 예측 화소로 이용될 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다.
화면 내 예측부(607)는 도 1의 화면 내 예측부(102)와 실질적으로 동일하게 동작한다.
화면 간 예측부(608)는, 메모리(606)에 저장된 참조 픽처, , 움직임 정보를 이용하여 인터 예측 블록을 생성한다. 화면 간 예측부(608)는 도 1의 화면 간 예측부(103)와 실질적으로 동일하게 동작한다.
본 발명은 특히 인트라 예측에 관한 것으로서, 이하에 본 발명의 다양한 실시예들을 도면들을 참조하면서 보다 상세하게 설명한다.
<화면 내 예측을 위한 보간>
도 7a 및 도 7b는 보간을 이용하여 화면 내 예측 화소를 유도하는 방법을 설명하기 위한 도면이다. 도 2의 화면 내 예측 모드들 중 하나인 m번 모드의 예측 각도가 도 7a와 같다고 가정하면, m번 모드를 이용하여 화면 내 예측을 수행하는 경우 예측에 이용될 참조 화소 X는 정수 화소 위치에 존재하지 않는다. 따라서 참조 화소 X의 왼쪽과 오른쪽의 정수 화소 위치에 존재하는 참조 화소인 A와 B를 이용하여 보간을 수행하여 분수 화소 위치의 참조 화소 X를 생성한다. 생성된 참조 화소 X는 현재 블록 내의 P위치의 화소의 예측 화소로 이용된다.
도 7b는 화소 X, A, B 간의 관계를 설명하기 위한 도면이다. 도 7b를 참조하면, 화소 X와 A 간의 거리는 S1이고, 화소 B와 X 간의 거리는 S2이다. 거리 S1과 S2의 비율에 따라 다양한 보간 방법을 사용하여 화소 X 를 유도할 수 있다. 이때 사용되는 보간 방법에는 선형 보간(linear interpolation), 큐빅컨볼루션 보간(cubic convolution interpolation), B-spline 보간(B-spline interpolation) 등 다양한 보간 방법이 적용 될 수 있다.
영상 복호화 장치(100)가, 가용한 복수의 보간 방법들 중 어떤 보간 방법이 적용되었는지 또는 어떤 보간 계수 세트가 사용되었는지 여부를 알게 하기 위한 방법으로는 여러가지가 있다. 첫번째 방법은 영상 부호화 장치(100)가, 가용한 복수의 보간 방법들 중 어떤 보간 방법이 적용되었는지를 나타내는 인덱스 정보를 영상 복호화 장치(600)로 전송하는 방법이다. 이 때 영상 부호화 장치(100)는, 보간 방법을 지시하는 인덱스 정보를 블록 단위나 상위의 헤더를 통해 설정하는 것도 가능하다. 여기서 상위 헤더를 통해 설정한다는 것은 슬라이스 세크멘트 헤더(slice segment header), 픽처 파라메터 세트(picture parameter set), 시퀀스 파라메터 세트(sequence parameter set) 등 블록 단위보다 더 큰 단위의 헤더를 이용하여 설정한다는 것을 의미한다. 상위 헤더에 포함된, 보간 방법을 지시하는 인덱스 정보는 영상 부호화 장치(100)에 의해 부호화되어 영상 복호화 장치(600)로 전송될 수 있다.
다른 방법으로는, 기 설정된 복수의 보간 계수 세트들을 부호화 장치(100)와 복호화 장치(600)가 동일하게 저장하고, 어떤 세트가 선택되어 부호화에 사용되었는지를 알려주는 보간 계수 인덱스 정보를 블록 단위나 상위 헤더를 통해 복호화 장치(600)로 알릴 수 있다.
또 다른 방법으로는, 전술한 보간 방법을 지시하는 인덱스 정보 또는 어떠한 보간 계수 세트가 사용되는지를 지시하는 보간 계수 인덱스 정보를 영상 부호화 장치(100)가 영상 복호화 장치(600)로 전송하는 대신에, 영상 부호화 장치(100)와 영상 복호화 장치(600)가 묵시적인(implicit) 방식으로 동일하게 보간 계수들을 유도할 수 있다.
구체적으로, 이미 복원된 화소들을 이용하여 영상 부호화 장치(100)와 영상 복호화 장치(600)가 동일한 방식을 통해 보간 계수들을 유도할 수 있다. 예를 들어, R개의 참조 화소들(즉, 이미 복원된 화소들)을 이용해서 R x K (K는 임의의 실수)배로 하나의 보간 필터를 이용하여 확대또는 축소한다. 그 후 동일한 보간 필터를 이용하여 역과정을 통해 원래 R개의 참조 화소들을 복원한다. 복원된 R개의 참조 화소들의 값과 원래 참조 화소들의 값 간의 차이가 얼마나 되는지에 따라 최적의 보간 필터를 결정할 수 있다.
도 8은 영상 부호화 장치(100) 또는 영상 복호화 장치(600)가 묵시적인(implicit) 방식으로 보간 방법 및/또는 보간 계수들을 선택하는 다른 방법을 설명하기 위한 도면이다. 도 8을 참조하여 설명하면, 화소 P가 포함된 4x4 블록이, 인트라 예측을 통해 복호될 현재 블록에 해당한다. 현재 블록 주변에 위치한, 기 복원된 화소들로 이루어진 복수의 참조 화소 라인들이 보간 방법 내지 보간 계수 결정에 이용된다. 도 8에 도시된 바와 같이 각 참조 화소 라인은 수평 방향의 한 줄의 소정 개수의 화소들과 수직 방향의 한 줄의 소정 개수의 화소들을 포함할 수 있다. 또는, 참조 화소 라인은 수평 방향의 한 줄의 소정 개수의 화소들로 구성되거나, 수직 방향의 한 줄의 소정 개수의 화소들로 구성될 수도 있다.
도 8을 다시 참조하면, 참조 화소 라인 0 내의 화소들을 참조 화소 라인 1 내의 화소들을 이용하여 예측한다. 이 때 현재 블록의 인트라 예측 모드와 동일한 N번의 방향성 모드가 예측에 사용된다. 예컨대, 참조 화소 라인 0 내의 화소 R의 예측 화소에 해당하는 참조 화소 X는 정수 위치의 화소가 아니므로, 참조 화소 X는 도 7a 및 7b에서와 같이 두 개의 정수 위치 참조 화소들을 이용하여 보간을 통해 유도될 수 있다. 이 때 특정 보간 방식 및 보간 계수들이 사용된다.
이와 같은 방식으로, 참조 화소 라인 0 내의 화소들의 예측 값들을 생성한 후, 각 예측 값과 원래의 각 화소 값 간의 차분 값을 계산한 후 각 차분값들을 합산한다. 영상 부호화 장치(100) 또는 영상 복호화 장치(600)에서 가용한 보간 방식들 및 보간 계수들을 사용하여 위 과정을 반복하여 각 차분값들의 합산이 최소가 되는 때의 보간 방식 및/또는 보간 계수들을 최종적으로 선택한다.
전술한 보간은, 영상 부호화 장치(100)의 화면 내 예측부(102) 및 영상 복호화 장치(600)의 화면 내 예측부(607)의 각각에 포함된 참조 화소 보간부에 의해 수행될 수 있다.
도 9는 영상 부호화 장치(100)에 의해 최적의 화면 내 예측 모드가 선택되는 과정을 설명하기 위한 순서도이다. 이 때 블록 단위 또는 상위 헤더 등에 의해 보간 방법은 설정되었다고 가정한다.
도 9를 참조하여 설명하면, 화면 내 예측 모드 번호를 나타내는 변수 m은 0으로 초기화되고, 최적의 cost값을 저장할 변수인 COST_BEST = MAX_VALUE로 초기화된다 (S901). 여기서 MAX_VALUE는 COST_BEST 변수에 저장 가능한 최대 값이며, 실제로 cost계산시 나올 수 없는 아주 큰 값이다. 변수 M에는 기 설정된 화면 내 예측 모드의 총 개수가 설정된다 (S901). 현재 블록에 최적의 화면 내 예측 모드를 나타내는 BEST_INTRA_MODE는 0으로 초기화된다(S901).
그 후 화면 내 예측 모드 m에 따라, 예측 블록의 각 화소 위치에 해당하는 보간 위치를 찾고, 기 설정된 보간 방식 혹은 상위 헤더에서 설정된 다수의 보간 방식 중 하나를 이용하여 보간 값을 생성한 후 예측 블록이 생성된다(S902). 그리고 생성된 예측 블록을 이용하여 m에 해당하는 cost값인 COST_m이 계산된다(S903). 여기서 COST_m은 화면 내 모드를 부호화 하는데 필요한 비트수, 예측 블록과 현재 블록과의 차이를 이용하여 계산될 수 있다. COST_m이 COST_BEST보다 작거나 같다면(S904), 최적의 화면 내 예측 모드를 저장하는 변수인 BEST_INTRA_MODE에 m을 저장하고, COST_BEST 변수엔 cost_m을 저장하며 m은 1증가시킨다(S905). 만약 COST_m이COST_BEST보다 크다면 m만 1 증가시킨다(S906). 마지막으로 m이 화면 내 예측 모드의 최대 개수에 도달 했다면 종료하며 그게 아니라면 S902로 돌아가 반복한다. 여기서 보간 방식이 영상 부호화 장치(100) 또는 영상 복호화 장치(600)에서 기 설정된 방식을 사용된다면, 도 7과 도 8의 방식을 이용하여 S1과 S2를 설정하고 기설정된 보간 방식을 이용하여 화소 X를 생성한다. 예측 블록안의 모든 화소에는 동일한 방식을 이용하여 예측 블록을 생성한다. 혹은, 다수의 보간 방식이 사용된다면 단계 S902의 내용이 변경될 수 있다.
또한 예측 블록마다 적응적으로 다수의 보간 방식을 적용 할 수도 있다. 이때 도 9에 도시된 단계들 중 단계 S902의 내용이 변경된다.
도 10은 영상 부호화 장치(100)에 의해 복수의 보간 방식들 중 하나가 선택되는 과정을 설명하기 위한 순서도이다.
도 10을 참조하여 설명하면, 영상 부호화 장치(100)는 보간 방식 인덱스를 나타내는 변수 i는 0으로 초기화하고, 최적의 cost값을 저장할 변수인 COST_BEST_i = MAX_VALUE로 초기화한다. 여기서 MAX_VALUE는 COST_BEST_i 변수에 저장 가능한 최대 값이며, 실제로 cost계산시 나올 수 없는 아주 큰 값이다. 변수 i에는 기 설정된, 사용 가능한 보간 방식의 총 개수를 설정한다. 현재 블록에 사용되는 최적의 보간 방식을 저장하는 변수인 BEST_INTERPOLATION에는 0으로 초기화한다(S1001). 그 후 보간 방식 인덱스 i에 따라, 예측 블록의 각 화소 위치에 해당하는 보간 값을 생성한 후 예측 블록을 생성한다(S1002). 그리고 생성된 예측 블록을 이용하여 i에 해당하는 cost값인COST_i을 계산한다(S1003). 여기서 COST_i은 보간 방식 인덱스를 부호화 하는데 필요한 비트수, 예측 블록과 현재 블록과의 차이를 이용하여 계산한다. COST_i가 COST_BEST_i보다 작거나 같다면(S1004) 최적의 보간 방식을 저장하는 변수인 BEST_INTERPOLATION에 i를 저장하고, COST_BEST_i 변수엔 cost_i를 저장하며 i는 1증가시킨다(S1005). 만약 COST_i가COST_BEST_i보다 크다면 i만 1 증가시킨다(S1006). 마지막으로 i가 사용 가능한 보간 방식의 최대 개수에 도달 했다면 종료하며 그게 아니라면 S1002로 돌아가 반복한다. 이러한 방식이 사용되는 경우, 도 9에 도시된 단계 S903에서 부호화 되는 화면 내 예측 모드의 비트 수에 추가적으로 보간 방식 인덱스를 부호화한 비트 수가 추가되어 COST_m이 계산된다.
도 11은 영상 부호화 장치(100)에 의해 예측 블록마다 적응적으로 다수의 보간 방식이 적용되는 경우 보간 방식 인덱스 정보를 부호화하는 과정을 설명하는 순서도이다. 먼저, 예측 블록마다 화면 내 예측 모드의 예측 여부를 부호화한다(S1101). 그 후 예측이 되었는지 여부를 판단한 후(S1102) 만약 예측이 되었다면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보에서 어떤 후보가 선택되었는지를 알려주는 인덱스를 부호화한다(S1103). 그게 아니라면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보를 제외하고 나머지 모드를 재정렬하여 현재 선택된 화면 내 예측 모드를 이진화 후 부호화한다(S1104). 그 후 사용된 보간 방식 인덱스를 부호화하고(S1105) 종료한다.
도 12는 영상 복호화 장치(600)에 의해 보간 방식 인덱스 정보가 복호화되는 과정을 설명하는 순서도이다. 먼저, 예측 블록마다 화면 내 예측 모드의 예측 여부를 복호화한다(S1201). 그 후 예측이 되었는지 여부를 판단한 후(S1202) 만약 예측이 되었다면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보에서 어떤 후보가 선택되었는지를 알려주는 인덱스를 복호화한다(S1203). 그게 아니라면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보를 제외하고 나머지 모드를 재정렬하여 현재 선택된 화면 내 예측 모드를 복호화한다(S2104). 그 후 부호화기에서 사용된 보간 방식 인덱스를 복호화하고(S1205) 종료한다.
<복수의 참조 화소 라인들을 이용한 화면 내 예측 화소의 유도>
이하에서는, 본 발명의 다른 실시예에 따른, 복수의 참조 화소 라인들을 이용한 화면 내 예측 화소의 유도에 대해 설명한다.
도 13은 본 발명의 일 실시예에 따른, 복수의 참조 화소 라인들을 이용한 화면 내 예측 화소의 유도를 설명하기 위한 도면이다.
종래 인트라 예측에는 하나의 참조 화소 라인이 사용되었다. 도 13에 도시된 참조 화소 라인 0이 그것이다. 참조 화소 라인 0은, 현재 블록의 상단에 접하는 소정 개수의 참조 화소들과 현재 블록의 좌측에 접하는 소정 개수의 참조 화소들로 이루어진다. 본 발명은, 다양한 참조 화소 라인들 및 그 참조 화소 라인들에 속하는 참조 화소들을 이용하여 예측 화소 내지 예측 블록을 유도함으로써 인트라 예측의 정확성을 향상 시킬 수 있다. 본 실시예는, 영상 부호화 장치(100)의 화면 내 예측부(102) 및 영상 복호화 장치(600)의 화면 내 예측부(607) 각각에 의해 동일하게 수행될 수 있다.
이하 설명을 위해 참조 화소 라인은 총 3개의 라인들이 사용된다고 가정하고 설명한다. 그러나 임의의 N개의 참조 화소 라인들을 이용할 수 있다. 여기서, 참조 화소 라인의 개수 N은 블록 단위 혹은 상위 헤더에 포함되어 복호화 장치(600)로 알려주는 것도 가능하다. 혹은 참조 화소 라인의 개수 N을 부호화하지 않고 부호화 장치(100)와 복호화 장치(600)가 기 설정된 N개의 참조 화소 라인들을 이용하는 것 또한 가능하다.
도 13을 참조하여 설명하면, 화소 P가 포함된 4x4 크기의 블록이 인트라 예측을 이용하여 부호화 또는 복호화될 현재 블록에 해당한다. 3개의 참조 화소 라인 0, 1 및 2가 현재 블록 주변에 위치한다.
현재 블록의 인트라 예측 모드가 m번 방향성 모드인 경우에 3개의 참조 화소 라인 0, 1 및 2를 사용하여 현재 화소 P의 예측 화소로 사용될 수 있는 예측 화소는 X, Y, Z가 될 수 있다. 이때 3개의 참조 화소 라인들의 각각을 사용하여 예측 블록을 생성해보고 최적의 참조 화소 라인을 결정할 수 있다. 이와 같이 결정된 최적의 참조 화소 라인을 지시하는 참조 화소 라인 인덱스 정보를 부호화장치(100)는 부호화할 수 있다. 참조 화소 라인 인덱스는, 예를 들면, 도 13에서와 같이 현재 블록에 가까운 참조 화소 라인에 낮은 인덱스 번호를 할당할 수 있다.
도 14는 본 발명의 일 실시예에 따른, 화면 내 예측 화소값을 유도하는 과정을 설명하기 위한 흐름도이다. 도 14를 참조하면, 현재 블록의 인트라 예측을 위해 이용될 적어도 하나의 참조 화소 라인이 복수의 참조 화소 라인들 중에서 선택된다 (S1301). 상기 복수의 참조 화소 라인들은, 인트라 예측을 이용하여 복호화 될 현재 블록과 동일한 영상 내에 존재한다. 상기 선택되는 적어도 하나의 참조 화소 라인은, 전술한 참조 화소 라인 인덱스에 의해 지시될 수 있다. 다른 대안으로서, 후술될 묵시적 방법에 의해 영상 부호화 장치(100)와 영상 복호화 장치(600)에서 공통적인 방법을 이용하여, 현재 블록의 인트라 예측에 이용될 적어도 하나의 참조 화소 라인은 선택될 수도 있다.
또한, 상기 선택되는 적어도 하나의 참조 화소 라인은, 예측 블록 마다 선택될 수 있다. 여기에 대해서는 도 15를 참조하면서 후술한다. 또는, 예측 블록 내의 각 화소 마다 적응적으로 선택될 수도 있다. 여기에 대해서는 도 18 및 19를 참조하면서 후술한다.
영상 부호화 장치(100) 또는 영상 복호화 장치(600)는 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 현재 블록 내의 하나의 화소의 예측값을 얻을 수 있다 (S1303). 영상 부호화 장치(100) 또는 영상 복호화 장치(600)는 단계 S1301 또는 S1303의 전부 또는 일부 단계를 반복하여 현재 블록의 예측 블록을 유도할 수 있다.
도 15는 예측 블록마다 인트라 예측에 이용될 참조 화소 라인을 적응적으로 결정하는 과정을 설명하기 위한 흐름도이다. 이 때 도 9에 도시된 단계 S902가 도 15에 도시된 단계들로 대체될 수 있다.
도 15를 참조하면, 참조 화소 라인 인덱스를 나타내는 변수 n은 0으로 초기화하고, 최적의 cost값을 저장할 변수인 COST_BEST_n = MAX_VALUE로 초기화한다. 여기서 MAX_VALUE는 COST_BEST_n 변수에 저장 가능한 최대 값이며, 실제로 cost계산시 나올 수 없는 아주 큰 값이다. 변수 N에는 기 설정된 참조 화소 라인의 총 개수를 설정한다. 현재 블록에 최적의 참조 화소 라인 인덱스를 나타내는 BEST_n은 0으로 초기화한다(S1401). 그 후 참조 화소 라인 인덱스 n에 따라 예측 블록의 각 화소 위치에 해당하는 보간 위치를 찾고 예측 블록을 생성한다(S1402). 그리고 생성된 예측 블록을 이용하여 n에 해당하는 cost값인 COST_n을 계산한다(S1403). 여기서 COST_n은 참조 화소 라인 n을 부호화 하는데 필요한 비트수, 예측 블록과 현재 블록과의 차이를 이용하여 계산한다. COST_n이 COST_BEST_n보다 작거나 같다면(S1404) 최적의 참조 화소 라인을 저장하는 변수인 BEST_n에 n을 저장하고, COST_BEST_n 변수엔 cost_n을 저장하며 n은 1증가시킨다(S1405). 만약 COST_n이COST_BEST_n보다 크다면 n만 1 증가시킨다(S1406). 마지막으로 n이 참조 화소 라인의 최대 개수에 도달 했다면 종료하며 그게 아니라면 S1402로 돌아가 반복한다.
도 16은 예측 블록마다 적응적으로 참조 화소 라인이 선택되는 경우 선택된 참조 화소 라인을 지시하는 참조 화소 라인 인덱스 정보가 부호화 장치(100)에 의해 부호화하는 과정을 나타낸 흐름도이다. 먼저, 예측 블록마다 화면 내 예측 모드의 예측 여부를 부호화한다(S1501). 그 후 예측이 되었는지 여부를 판단한 후(S1502) 만약 예측이 되었다면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보에서 어떤 후보가 선택되었는지를 알려주는 인덱스를 부호화한다(S1503). 그게 아니라면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보를 제외하고 나머지 모드를 재정렬하여 현재 선택된 화면 내 예측 모드를 이진화 후 부호화한다(S1504). 그 후 사용된 참조 화소 라인 인덱스를 부호화하고(S1505) 종료한다.
도 17은 예측 블록마다 적응적으로 참조 화소 라인이 선택되는 경우 선택된 참조 화소 라인을 지시하는 참조 화소 라인 인덱스 정보가 복호화 장치(600)에 의해 복호화되는 과정을 나타낸 흐름도이다. 먼저, 예측 블록마다 화면 내 예측 모드의 예측 여부를 복호화한다(S1601). 그 후 예측이 되었는지 여부를 판단한 후(S1602) 만약 예측이 되었다면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보에서 어떤 후보가 선택되었는지를 알려주는 인덱스를 복호화한다(S1603). 그게 아니라면 주변 블록에서 생성된 화면 내 예측 모드의 예측 후보를 제외하고 나머지 모드를 재정렬하여 현재 선택된 화면 내 예측 모드를 복호화한다(S1604). 그 후 사용된 참조 화소 라인 인덱스를 복호화하고(S1605) 종료한다.
다음으로, 도 18 및 도 19를 참조하여, 참조 화소 라인 인덱스의 전송 없이 예측 블록의 각 화소 위치마다 적응적으로 참조 화소 라인을 결정하는 방법에 대해 설명한다.
예측 블록 안의 각 화소마다, 각 참조 화소 라인 내에서 보간을 통해 얻어지는 예측 화소의 위치의 정밀도는 다를 수 있다. 따라서 각 참조 화소 라인 내에서 보간을 통해 얻어진 예측 화소들 중에서 정수 화소 위치에 가장 가까운 예측 화소를 현재 화소 P의 예측 화소로 선택할 수 있다. 이 때 미리 정해진 N개의 참조 화소 라인들을 대상으로 위 과정을 적용할 수 있다.
만약, 정수 화소 위치의 예측 화소들이 복수개 존재하는 경우, 현재 블록에 가까운 예측 화소를 최종적인 예측 화소로 선택 할 수도 있다.
도 19는 참조 화소 라인 인덱스의 전송 없이 적응적으로 참조 화소 라인을 선택하는 방법을 설명하기 위한 참고도이다. 도 19에 도시된 바와 같이, 예측 화소가 정수 위치에 존재한 라인이 많은 라인에 우선 순위를 두어 예측 블록마다 적응적으로 예측 화소 라인을 선택할 수 있다. 각 참조 화소 라인을 이용하여 예측 블록을 생성할 때 사용되는 보간된 화소의 정밀도와 빈도수가 도 19에서와 같다고 가정하면, 각 화소 위치의 정밀도에 따라 가중치를 두어 라인을 선택하게 할 수 있다.
도 19를 다시 참조하면, 라인 1을 이용하여 예측 블록을 생성하는 경우, 정수 위치 예측 화소들이 5개, 1/2 위치의 예측 화소들이 3개, 1/4 위치 예측 화소들이 4개, 1/8 위치 예측 화소들이 2개, 1/16 위치 예측 화소들이 1개, 1/32 위치 예측 화소들이 1개가 선택이 되었다. 따라서 예측 블록 내의 총 화소의 개수는 16개가 된다. 참조 화소 라인 2 및 참조 화소 라인 3의 경우도 동일하게 설명될 수 있다.
정수 화소 위치에만 우선순위를 두는 경우, 정수위치가 가장 많은 라인 1을 참조 화소 라인으로 선택하게 할 수도 있다. 혹은 각 위치마다 가중치를 두어 가중치와 빈도수의 합을 계산한 후, 계산된 값이 가장 크게 나온 라인을 참조 화소 라인으로 선택하게 하는 것 또한 가능하다. 혹은 각 라인 마다 가중치를 두어 가중치와 빈도수의 합을 계산한 후, 계산된 값이 가장 크게 나온 라인을 참조 화소 라인으로 선택하게 하는 것 또한 가능하다. 혹은 각 라인과 위치 모두에 가중치를 두어 가중치와 빈도수의 합을 계산한 후, 계산된 값이 가장 크게 나온 라인을 참조 화소 라인으로 선택하게 하는 것 또한 가능하다.
다른 실시예로서, 라인마다 가중치를 두어 가중치합 된 화소를 이용하여 예측 블록을 생성하는 것 또한 가능하다. 예를 들어 도 13의 X, Y, Z위치의 화소값이 존재하는 경우, 블록에 가까울수록 가중치를 더 두어 가중치합 된 값을 P위치의 예측 화소로 선택하는 것 또한 가능하다. 혹은 정수 화소 위치에 가까울수록 가중치를 더 두어 가중치합 된 값을 P위치의 예측 화소로 선택하는 것 또한 가능하다. 혹은 가중치합, 즉 가중평균을 이용하여 예측 화소를 유도하는 방법 외에도 산술평균, 중간값 등을 이용하여 예측 화소의 값을 유도할 수도 있다.
혹은 참조 화소 라인 인덱스를 사용하여 부호화되, 어떤 N개의 라인 중 하나를 제외하는 것으로 사용할 수도 있다. 예를 들어 참조 화소 라인 인덱스가 1로 설정되어 있는 경우, 라인 1을 제외 한 N-1개의 라인을 이용한다. 이 때, m번 모드를 이용하여 예측 값을 보간 할 시에, 정수 화소 위치에 가까울수록 우선순위를 높게 부여하거나 보간되는 위치의 정밀도에 따라 우선순위를 다르게 부여할 수 도 있다. 이런 기설정된 임의의 우선순위에 따라 라인 구분 없이 화소 단위로 라인 1을 제외한 다른 라인에서 예측 값을 생성 할 수도 있다.
혹은 블록 단위 또는 상위 헤더에서, 참조 화소 라인 인덱스를 직접 부호화하는 방법과 부호화 하지 않는 방식 중 어떤 방식이 사용되었는지 여부를 부호화 장치(100)가 부호화하여 복호화 장치(600)로 전송하는 것 또한 가능하다.
<예측 블록과 참조 화소 라인 간의 스무딩(smoothing)>
이하, 본 발명의 다른 실시예로서 예측 블록과 참조 화소 라인 간의 스무딩(smoothing)을 설명한다.
참조 화소 라인 내의 소정 화소(들)를 이용하여 예측 블록이 유도된 경우, 상기 예측 블록의 유도에 사용되지 않은 참조 화소 라인과 예측 블록 간에 또는 예측 블록에 인접한 영역과 예측 블록 간에는 불연속성이 존재할 수 있다. 이러한 불연속성을 감소시키기 위해 스무딩(smoothing)이 사용될 수 있다. 스무딩은 일종의 저역 필터에 해당할 수 있다.
본 발명의 실시예에 따른 스무딩은, 영상 부호화 장치(100)의 화면 내 예측부(102) 및 영상 복호화 장치(600)의 화면 내 예측부(607) 각각에 의해 수행될 수 있다.
도 20은 예측 블록과 참조 화소 라인간의 스무딩(smoothing)을 설명하기 위한 도면이다.
이하 사용된 화면 내 예측 모드는 45도 up-right 방향에서 화면 내 예측이 수행되는 모드를 예로 들어 설명한다. 또한 참조 화소 라인 1이 인트라 예측을 위해 선택되었다고 가정한다. 또한 스무딩이 적용되는 화소로서 화소 A 내지 E를 이용한 스무딩을 설명하지만 그 외 화소에도 동일하게 적용 가능하다.
도 20의 예시에서 45도 up-right 방향으로 화면 내 예측이 수행되었으므로 스무딩은 화면 내 예측 방향의 반대 방향인 45도 down-left 방향으로 수행될 수 있다. 이때, 현재 블록의 예측 블록의 크기 또는 형태에 따라 스무딩이 적용되는 예측 블록의 영역이 결정될 수 있다. 도 20에서는 예측 블록의 절반의 영역에 속하는 화소들이 스무딩된다. 즉, 어둡게 표시된 왼쪽 절반의 화소들에만 스무딩을 적용할 수 있다. 혹은 예측 블록의 크기 및/또는 화면 내 예측 모드에 따라 기설정된 영역 또는 비율을 이용할 수도 있다. 예를 들면, 예측 블록의 1/4 영역만 스무딩을 적용할 수도 있으며 그외의 비율도 가능하다.
도 20에서는 참조 화소 라인 1이 인트라 예측을 위한 참조 화소 라인으로 결정되었으므로, 참조 화소 라인 1에 존재하는 화소 D를 이용하여 예측 화소 A를 아래 수학식1을 이용하여 스무딩할 수 있다.
Figure PCTKR2017011219-appb-M000001
위 수학식1에서 A', A 및 D는 각각 스무딩된 후의 예측 화소 A의 값, 스무딩되기 이전의 예측 화소 A의 값 및 참조 화소 D의 값이고, w1 및 w2는 각각 예측 화소 A에 적용되는 가중치 및 참조 화소 D에 적용되는 가중치이다.
또한, 참조 화소 라인 1에 존재하는 화소 D를 이용하여 예측 화소 B 를 상기 수학식1과 유사한 수학식을 이용하여 스무딩 할 수 있다.
이때 스무딩의 강도를 거리에 따라 조정할 수도 있다. 예측 화소 B보다는 예측 화소 A가 거리상 화소 D와 더 멀리 떨어져 있으므로 스무딩을 수행할 때 예측 화소 B와 화소 D를 스무딩할 때 보다, 예측 화소 A와 D를 스무딩할 때 더 강하게 스무딩해준다. 여기서 강한 스무딩은 화소 D쪽에 더 많은 가중치를 두어 예측 화소를 스무딩 함으로써 수행될 수 있다.
혹은 인트라 예측을 위해 선택된 참조 화소 라인과는 별개로 스무딩에 이용되는 참조 화소 라인은 예측 블록과 가까운 라인으로 설정하는 것도 가능하다. 도 20을 참조하면, 참조 화소 라인 1이 인트라 예측을 위해 선택되었지만 예측 화소 A, B의 스무딩에 이용되는 화소는 D가 아닌 C로 설정하는 것도 가능하다. 이러한 경우도 마찬가지로 거리에 따라 스무딩의 강도를 선택할 수 있다. 예컨대, 참조 화소 C를 이용하여 예측 화소 B 를 스무딩 할 경우에는 각각에 동일한 가중치를 적용하고, 참조 화소 C를 이용하여 예측 화소 A 를 스무딩 하는 경우에는 화소 C에 더 많은 가중치를 두어 스무딩을 수행할 수도 있다.
스무딩을 수행할 때, 양 방향 모두 사용하는 것 또한 가능하다. 예를 들어, 참조 화소 라인 0을 이용하여 스무딩한다고 가정하고 예측 화소 A를 스무딩할 때 참조 화소 F와 C에 각각 가중치를 두어 예측 화소 A와 스무딩 할 수도 있다. 예측 화소 B를 스무딩할 때도 화소 F와 C에 각각 가중치를 두어 예측 화소 B와 스무딩 하는 것 또한 가능하다. 이때, 라인 1이 인트라 예측을 위한 참조 화소 라인으로 선택되었으므로 up-right 방향에서는 화소 G를 이용하고 down-left 방향에서는 화소 C를 이용하는 것도 가능하다.
본 발명의 일 실시예에 따르면, 참조 화소와 예측 화소 간의 거리에 따라 가중치를 달리 하는 것 또한 가능하다. 예를 들어 참조 화소 F와 C를 이용하여 예측 화소 A 를 스무딩 하는 경우, 화소 C와 A 간의 거리가 화소 F와 A간의 거리보다 멀기 때문에 화소 C에 더 큰 가중치를 두어 스무딩을 수행할 수도 있다. 혹은 기설정된 방식을 이용하여 임의의 라인을 이용하여 스무딩을 수행하는 것 또한 가능하다. 이러한 스무딩 방식은 적용 여부를 블록단위로 부호화 하는 것 또한 가능하며 상위 헤더를 통해 부호화 하는 것 또한 가능하다. 혹은 스무딩 적용 여부를 부호화하는 것 없이 기설정된 조건에 의해 부호화기와 복호화기가 동일하게 수행하는 것 또한 가능하다. 예를 들어 어떤 각도의 화면 내 예측 모드가 수행되었는지에 따라 스무딩의 여부를 결정할 수도 있다. 본 실시예에서는 설명의 편의성을 위해 거리가 멀수록 더 강하게 스무딩한다고 설명하였지만 영상의 특성 등에 따라 반대의 경우도 또한 가능하다.
다음으로, 도 21, 도 22a 내지 22d를 참조하여, 본 발명의 일 실시예에 따라, 인트라 예측을 위한 참조 화소 라인이 선택되는 블록의 단위에 대해 설명한다.
이하, 설명의 편의를 위해, 현재 블록이 16x16 크기이고 현재 블록이 4개의 8x8 변환 블록들로 분할되어 변환은 8x8 변환 블록 단위로 총 4번 수행되는 경우를 예로 들어 설명한다. 현재 블록은 변환을 위해 현재 블록의 크기보다 작은 다수의 변환 블록들로 분할될 수 있다. 따라서 현재 블록 단위로 화면 내 예측 모드가 결정되면, 결정된 화면 내 예측 모드를 변환 블록 단위로 적용하여 실제 예측은 변환 블록 단위로 수행될 수 있다. 이러한 방식의 장점으로는 참조 화소가 현재 블록에서 멀어질수록 화소 간의 상관도가 떨어질 수도 있는 점을 보완할 수 있다는 점이다. 도 21을 참조하면, 블록 단위로 화면 내 예측을 적용하면 변환 블록 A의 화소들은 변환 블록 D의 화소들 보다는 참소 화소들과의 거리가 가깝다. 따라서 변환 블록 D내의 화소들은 참조 화소들과의 거리가 멀어져서 예측의 효율이 낮아질 수 있다.
전술한 단점을 보완하기 위해 블록 단위로는 화면 내 예측 모드만 결정하고 화면 내 예측은 변환 블록 단위로 수행될 수 있다.
도 21은 변환 블록 단위로 인트라 예측이 수행되는 경우, 현재 블록의 인트라 예측을 위해 선택된 적어도 하나의 참조 화소 라인을 현재 블록 내의 모든 변환 블록들에 공통적으로 이용하는 경우를 도시한다.
도 22a 내지 22d는 각 변환 블록 마다 적어도 하나의 참조 화소 라인을 선택하여 인트라 예측에 이용하는 경우를 도시한다.
도 22a를 참조하면, 8x8 크기를 가진 4개의 변환 블록들이 사용되고 변환 블록 단위로 예측이 수행되는 경우, 변환 블록 A의 인트라 예측을 위해 도 21에 도시된 바와 동일한 참조 화소 라인들이 이용된다.
도 22b를 참조하면, 변환 블록 B는 복원된 변환 블록 A의 화소들을 이용해서 도시된 바와 같은 참조 화소 라인들을 인트라 예측을 위해 사용할 수 있다. 마찬가지로 도 22c에서는 복원된 변환 블록 A와 B의 화소들을 이용해서 도시된 바와 같은 참조 화소 라인들을 인트라 예측을 위해 사용할 수 있다. 도22d에서도 복원된 변환 블록 A, B 및 C의 화소들을 이용해 도시된 바와 같은 참조 화소 라인들을 인트라 예측을 위해 사용할 수 있다.
이상 설명한 바와 같이, 다수의 참조 화소 라인을 사용하는 경우, 도 21에 도시된 바와 같이 블록 단위로 결정된 화소 라인들을 도 22a 내지 d의 변환 블록 단위로 예측을 수행하는 경우에 그대로 적용할 수도 있다. 혹은 변환 블록 단위로 최적의 참조 화소 라인을 새로 구하는 것 또한 가능하다. 혹은 블록 단위로 구한 최적의 참조 화소 라인을 변환 블록 전체에 사용할지 아니면 변환 블록 단위 마다 참조 화소 라인을 유도해 사용할지 여부를 블록 단위 혹은 상위 헤더를 통해 부호화 하여 복호화 장치(600)로 알리는 것 또한 가능하다.
다음으로, 본 발명에 따른 화면 내 예측 모드의 유도, 부호화 및 복호화와 관련된 다양한 실시예들과 응용예들을 도면들을 참조하면서 설명한다. 본 발명에 따른 화면 내 예측 모드 유도를 적용하면, 동일한 방법 및/또는 동일한 기준으로 영상 부호화 장치와 영상 복호화 장치가, 화면 내 예측 모드를 유도할 수 있으므로 화면 내 예측 모드 자체를 알리기 위한 정보를 영상 복호화 장치로 전달할 필요가 없다.
<영상 복호화 장치에 의한 화면 내 예측 모드의 유도>
본 실시예에서는, 영상 복호화 장치에 의한 화면 내 예측 모드의 유도가 설명된다. 본 발명에 따른 영상 복호화 장치에 의한 화면 내 예측 모드의 유도는 이 후 줄여서 DIMD (Decoder-side Intra Mode Derivation)라 부른다. 그러나 DIMD는 영상 부호화 장치에 의해서도 동일하게 수행될 수 있다. 따라서 DIMD 라는 명칭에도 불구하고, DIMD는 영상 부호화 장치 (100) 및 영상 복호화 장치 (600) 각각에 의해 수행될 수 있다. 특히, DIMD는, 영상 부호화 장치(100)의 화면 내 예측부(102) 및 영상 복호화 장치(600)의 화면 내 예측부(607)에 의해 각각 동일하게 수행될 수 있다.
이하, 도면들을 참조하면서 본 발명에 따른 DIMD에 관한 다양한 실시예들을 설명한다.
(제1 실시예)
도 23은 본 발명의 제1 실시예에 따른 DIMD를 설명하기 위한 도면이다. 본 발명의 일 실시예에 따르면, 현재 블록 주변에 위치하는, 이미 복원된 화소들을 이용하여 현재 블록의 화면 내 예측 모드를 유도할 수 있다.
도 23을 참조하면, 부호화 또는 복호화될 현재 블록(2001)의 크기는 M x N이고, 템플릿 A(2004)의 크기는 P x N, 템플릿 B(2003)의 크기는 M x Q 이라 가정한다. 도 7에 도시된 바와 같이, 참조 화소 영역(2002)는 템플릿 A (2004)의 왼쪽에 위치한 영역과 템플릿 B(2003)의 위쪽에 위치한 영역으로 구성된다.
참조 화소 영역(2002)의 크기를 나타내는 값들 중 R과 S의 값이 각각 1이라 가정하면, 참조 화소 영역(2002)은 2(Q+N) + 2(P+M) + 1 개의 참조 화소들을 포함한다.
본 발명의 일 실시예에 따르면, 가용한 화면 내 예측모드들 각각에 따라, 참조 화소 영역(2002) 내의 참조 화소들을 이용하여 템플릿 A (2004)와 템플릿 B(2003)의 예측값들을 산출한다. 이 때 템플릿 A (2004)와 템플릿 B(2003)는 하나의 영역으로 취급된다. 예를 들면, 도 2에 도시된 바와 같은 35가지의 화면 내 예측 모드 각각에 따라, 참조 화소 영역(2002) 내의 참조 화소들을 이용하여 템플릿 A (2004)와 템플릿 B(2003)의 예측값들을 산출한다. 각 화면 내 예측 모드에 따라 예측된 템플릿 A (2004) 및 템플릿 B(2003)와 템플릿 A (2004) 및 템플릿 B(2003)의 복원값들 간의 차이의 합에 해당하는 SAD(Sum of Absolute Difference)를 구한다. 그 후, 가장 적은 SAD(Sum of Absolute Difference)를 가지는 화면 내 예측 모드를 현재 블록(2001)의 화면 내 예측 모드로 선택할 수 있다.
영상 부호화 장치 (100) 또는 복호화 장치 (600)에 의해 이미 복원된 화소들을 이용하여 현재 블록(2001)의 화면 내 예측 모드를 유도하기 때문에 영상 부호화 장치 (100) 및 영상 복호화 장치 (600) 양자 모두 동일한 화면 내 예측모드를 유도할 수 있다.
한편, 휘도 화소들에게 적용되었던된 화면 내 예측 모드가 색차 화소들에서도 동일하게 적용될 수 있다. 화면 내 예측 모드를 부호화 장치 (100)가 복호화 장치 (600)로 전송하지 않기 때문에 오버헤드의 부담이 없다. 따라서 각도 모드들(angular modes) 사이의 1/2위치, 1/3위치, 혹은 1/4위치에 화면 내 예측 모드를 추가하는 것 또한 가능하다. 이때 사용된 화면 내 예측 모드의 개수에 관한 정보가 다양한 방법을 이용하여 복호화 장치(600)로 전송될 수 있다. 일 예로서, 2의 지수승을 이용하여 블록 헤더 또는 블록의 상위 헤더, 예컨대 슬라이스 헤더, 픽처 헤더, 시퀀스 헤더 등을 통해 부호화되어 복호화 장치(600)로 전송될 수 있다. 또는 서로 다른 개수의 인트라 예측 모드들로 구성된 복수의 인트라 예측 모드 리스트들 중 하나를 지시하는 인덱스를 전송하는 방법을 이용하여, 가용한 화면 내 예측 모드의 개수에 관한 정보가 복호화 장치(600)로 전달될 수도 있다.
또한, 전술한 실시예에서는, 현재 블록(2001)의 인트라 예측 모드를 유도하기 위해 템플릿 A (2004)와 템플릿 B(2003)의 두 개의 템플릿이 이용되었으나 세 개 이상의 템플릿들이 이용될 수도 있다.
또한, 전술한 실시예에서는, 화면 내 예측 모드 전부를 템플릿 A (2004) 및/또는 템플릿 B(2003)에 적용하여 최종적인 화면 내 예측 모드를 유도하였으나, 전체 모드가 아닌 기 설정된 일부 화면 내 예측 모드 중에서 현재 블록(2001)의 최종적인 화면 내 예측 모드를 유도할 수도 있다.
(제2 실시예)
전술한 제1 실시예에서는, 두 개의 템플릿 A (2004) 및 템플릿 B(2003)를 하나의 영역으로 간주하여 설명하였다. 그러나, 본 실시예에서는, 두 개의 템플릿 A (2004) 및 템플릿 B(2003)이 별개의 영역으로 취급된다. 구체적으로, 각 템플릿을 이용하여 현재 블록의 예측 모드를 각각 유도한 후 유도된 두 개의 예측 모드들 중에서 하나의 모드를 최종적으로 선택할 수도 있다.
예를 들면, 도 2에 도시된 18번 각도 모드(왼쪽 위 45도 방향 화면 내 예측모드)를 기준으로, 18번 각도 모드의 왼쪽에 존재하는 각도 모드들은 템플릿 A (2004)에만 적용한 후 각각 SAD를 구한다. 모드 별로 산출된 SAD 값들 중 최소 값을 가지는 모드를 템플릿 A (2004)의 화면 내 예측모드로 결정한다.
다음으로, 18번 각도 모드의 오른쪽에 존재하는 각도 모드들은 템플릿 B(2003)에만 적용 한 후 각각 SAD를 구한다. 모드 별로 산출된 SAD 값들 중 최소 값을 가지는 모드를 템플릿 B(2003)의 화면 내 예측모드로 결정한다. 그 후 결정된 템플릿 A(2004)의 화면 내 예측모드와 템플릿 B(2003)의 화면 내 예측모드 중 하나를 최종적으로 현재 블록(2001)의 예측 모드로 선택한다.
각 템플릿에 DC 모드와 플래너 모드를 각각 적용하여 DC 모드에 대응하는 SAD값과 플래너 모드에 대응하는 SAD 값을 구할 수 있다. 그 후, 전술한 각도 모드들 중 해당 템플릿의 화면 내 예측모드로 선택된 모드에 대응하는 SAD 값, DC 모드에 대응하는 SAD값과 플래너 모드에 대응하는 SAD 값을 상호 비교하여 각 템플릿의 최종적인 화면 내 예측모드를 선택할 수 있다.
(제3 실시예)
이하, 본 발명에 따른 DIMD의 제3 실시예를 설명한다.
본 발명에 따른 제3 실시예는, 현재 블록의 템플릿들 중 일부가 가용하지 않은 경우, 가용한 나머지 템플릿을 이용하여 DIMD를 실행하는 방법에 관한 것이다.
도 24는 본 발명의 제3 실시예에 따른 DIMD를 설명하기 위한 도면이다.
도 24에서는, 현재 블록(2101)의 상측의 템플릿은 가용하지 않고 좌측의 템플릿 A(2104)만 가용하다.
만약 부호화 장치(100)와 복호화 장치(600)가 도 2에 예시된 바와 같이 35개의 화면 내 예측 모드를 사용하기로 하였는데, 2개의 템플릿들 중 어느 하나가 이용 불가능 하다면, 도 24에 도시된 바와 같이 범위를 정하여 하나의 템플릿(2104)에만 35개의 화면 내 예측 모드를 적용할 수 있다. 도 24에서는, 왼쪽 아래 45도 방향을 화면 내 예측 모드 2번으로 설정하고, 수평한 방향을 화면 내 예측 모드 34번으로 설정하고, 예측 모드 2번과 예측 모드 34번 사이에 각도 모드 33개가 존재하도록 설정하였다.
전술한 바와 같이 설정된 33개의 각도 모드들, DC 모드 및 플래너 모드를 가용한 템플릿 A(2104)에 적용하여 DIMD를 수행한 후 현재 블록(2101)의 인트라 예측 모드를 유도할 수 있다.
현재 블록(2101)이 입력 영상의 상측 경계에 해당하여, 템플릿 A(2104)의 좌측의 참조 화소들(2105)들은 가용하지만 템플릿 A(2104)의 상측의 참조 화소들이 존재하지 않는 경우, 적절한 주변 화소들을 이용한 패딩을 통해 상측의 참조 화소들(2102)을 생성할 수 있다. 패딩에 이용되는 주변 화소들은 현재 블록(2101) 및/또는 템플릿 A(2104)의 상측 화소들, 또는 템플릿 A(2104)의 좌측의 참조 화소들(2105)들이 될 수 있다.
(제4 실시예)
도 25는 본 발명에 따른 DIMD를 설명하기 위한 순서도이다. 전술한 제1 실시예 내지 제3 실시예와 관련된다. 도 25에 도시된 방법은, 영상 부호화 장치(100)의 화면 내 예측부(102) 및 영상 복호화 장치(600)의 화면 내 예측부(607)에 의해 각각 동일하게 수행될 수 있다.
도 25를 참조하면, 먼저, 이미 복원된, 적어도 하나의 화소 영역의 참조 화소 영역에 기초하여 상기 복원된 화소 영역의 인트라 예측 모드가 유도된다 (S2201). 여기서, 적어도 하나의 화소 영역은 전술한 실시예들에서 템플릿 A (2004, 2104) 및/또는 템플릿 B(2003)이 될 수 있다. 그러나 이들 템플릿에 한정되지 않음은 물론이다. 참조 화소 영역은 전술한 실시예들에서 설명된 참조 화소 영역(2002, 2102, 2105)에 해당될 수 있다. 그러나 이들 참조 화소 영역에 한정되지 않음은 물론이다.
다음으로, S2201단계에서 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드가 유도된다 (S2203). 상기 유도된 인트라 예측 모드를 이용하여 현재 블록의 인트라 예측 블록을 얻은 후 (S2205), 상기 얻은 인트라 예측 블록과 현재 블록의 잔차 블록을 가산함으로써 현재 블록이 복원된다 (S2207).
(제5 실시예)
도 26은 본 발명에 따른 DIMD를 이용하여 영상을 부호화하는 경우, 화면 내 예측 모드를 부호화하는 방법을 설명하기 위한 순서도이다.
먼저, 본 발명에 따른 DIMD의 수행 여부를 알려주는 정보를 부호화 한다(S2501). 이 정보는 화면 내 예측 모드의 유도 방법을 영상 복호화 장치(600)에 알리는 정보이다. 즉, 본 발명에 따른 DIMD를 이용하여 화면 내 예측 모드가 유도되는지 아니면 다른 방법을 이용하여 화면 내 예측 모드가 유도되는지 여부를 시그널링한다.
본 발명에 따른 DIMD가 사용 되었는지 여부를 판단한 후(S2502), 만약 사용 되었다면 본 프로세스는 종료되고, 현재 블록의 인트라 예측 모드는 DIMD에 의해 유도된다.
그러나, 본 발명에 따른 DIMD가 사용되지 않았다면 MPM(Most Probable Mode) 적용 여부가 부호화된다(S2503). 본 발명에 따른 DIMD를 이용한 화면 내 예측 모드 유도 외의 다른 방법으로서 MPM이 사용될 수 있다.
현재 블록의 인트라 예측 모드가 MPM 리스트(most probable mode list)에 속하는지 여부를 나타내는 MPM 플래그 및 MPM 인덱스 정보가 추가로 복호화 장치(600)로 전달된다. 상기 MPM 리스트 내에 포함되는 인트라 예측 모드의 개수는 전체 인트라 예측 모드의 개수에 비해 매우 적다. 따라서, 현재 블록의 인트라 예측 모드가 MPM 리스트(most probable mode list)에 속한다면 매우 적은 비트를 이용하여 복호화 장치(600)로 시그널링하는 것이 가능하다. MPM 인덱스 정보는 현재 블록의 인트라 예측 모드가 MPM 리스트(most probable mode list)에 속하는 모드들 중 어떤 모드에 해당하는지 여부를 나타낸다.
상기 MPM 플래그가 1이면, 현재 블록의 인트라 예측 모드가 MPM 리스트에 속하고, 상기 플래그가 0이면, 현재 블록의 인트라 예측 모드가 잔여 모드 그룹(residual mode group)에 속한다. 상기 잔여 모드 그룹은 상기 MPM 리스트에 속하는 인트라 예측 모드들 이외의 모든 인트라 예측 모드들을 포함할 수 있다. S2503 단계에서, MPM(Most Probable Mode) 적용 여부의 부호화는 상기 MPM 플래그를 부호화함으로써 수행된다.
다시 도 26을 참조하면, MPM이 사용되었는지 여부를 확인한 후(S2504), 사용되지 않았다면 MPM 후보를 제외한 나머지 모드를 재 정렬한 후 현재 블록의 인트라 예측 모드를 부호화(S2505)한다. 만약, MPM이 사용되었다면 어떤 인트라 예측 모드 후보가 적용되었는지를 알려주는 MPM 인덱스를 부호화 (S2506)한 후 종료한다.
(제6 실시예)
도 27은 본 발명에 따른 DIMD를 이용하여 영상을 복호화하는 경우, 화면 내 예측 모드를 복호화하는 방법을 설명하기 위한 순서도이다.
먼저, 본 발명에 따른 DIMD의 수행 여부를 알려주는 정보를 복호화 한다(S2601). 이 정보는, 본 발명에 따른 DIMD를 이용하여 화면 내 예측 모드가 유도되는지 아니면 다른 방법을 이용하여 화면 내 예측 모드가 유도되는지 여부를 지시한다.
본 발명에 따른 DIMD가 사용 되었는지 여부를 판단한 후(S2602), 만약 DIMD가 사용되었다면 본 프로세스는 종료되고, 현재 블록의 인트라 예측 모드는 DIMD에 의해 유도된다.
그러나, 본 발명에 따른 DIMD가 사용되지 않았다면 MPM(Most Probable Mode) 적용 여부가 복호화된다(S2603). S2603 단계에서는, MPM 플래그가 복호될 수 있다.
상기 MPM 플래그가 1이면, 현재 블록의 인트라 예측 모드가 MPM 리스트에 속하고, 상기 플래그가 0이면, 현재 블록의 인트라 예측 모드가 잔여 모드 그룹(residual mode group)에 속한다. 상기 잔여 모드 그룹은 상기 MPM 리스트에 속하는 인트라 예측 모드들 이외의 모든 인트라 예측 모드들을 포함할 수 있다.
다음으로, MPM이 사용되었는지 여부를 확인한 후(S2604), 사용되지 않았다면 MPM 후보를 제외한 나머지 모드를 재 정렬한 후 현재 블록의 인트라 예측 모드를 복호화(S2605)한다. 만약, MPM이 사용되었다면, 어떤 인트라 예측 모드 후보가 적용되었는지를 알려주는 MPM 인덱스를 복호화 (S2606)한 후 종료한다.
(제7 실시예)
도 28은 본 발명에 따른 제7 실시예를 설명하기 위한 도면이다. 본 발명의 제7 실시예는, 템플릿에 다수의 참조 화소 라인들을 이용하여 인트라 예측 모드를 유도하는 방법에 관한 것이다.
도 28에 도시된 바와 같이, 템플릿의 참조 화소 라인으로서 참조 화소 라인 1과 참조 화소 라인 2의 2개 라인이 이용된다고 가정한다. 템플릿의 길이인 P와 Q는 각각 1이라고 가정하고 설명한다.
왼쪽 위 45도 방향 모드의 오른쪽에 존재하는 각도 모드들을 위측 각도 모드라 정의하고 템플릿 B와 그 위쪽의 참조 화소 라인들을 사용한다. 또한 왼쪽 위 45도 방향 모드를 기준으로 왼쪽에 존재하는 각도 모드들을 좌측 각도 모드라 정의하고 템플릿 A와 그 왼쪽의 참조 화소 라인들을 사용한다. 그 후 화면 내 예측 모드에 따라 도 28에 도시한 바와 같이 참조 화소 라인별로 예측을 수행해본다. 예를 들어 템플릿의 참조 화소라인 2를 이용하여 템플릿의 참조 화소라인 1를 예측하고, 최적의 화면 내 예측 모드 후보 1을 생성한다. 그 후, 템플릿의 참조 화소라인 1를 이용하여 템플릿을 예측하고 최적의 화면 내 예측 모드 후보 2를 생성한다. 만약 화면 내 예측 모드 후보 1과 2가 동일하다면 그 예측 모드를 현재 블록의 화면 내 예측 모드로 선택한다. 만약 다르다면, 전술한, 본 발명의 다양한 실시예들에 따른 DIMD 방법 중 하나를 수행할지 여부를 결정한다.
도 29는 본 발명의 제7 실시예를 적용한 경우, 인트라 예측 모드를 부호화 하는 과정을 나타낸 순서도이다.
먼저, 템플릿의 참조 화소 라인을 이용하여 화면 내 예측 모드 후보들을 유도한다(S2801). 그 후, 화면 내 예측 모드 후보들이 동일한지 여부를 판단한 후(S2802), 동일 하다면 그 동일한 모드가 현재 블록의 화면 내 예측 모드로 선택되기 때문에 순서도가 종료된다. 만약, 화면 내 예측 모드 후보들이 동일하지 않다면 본 발명에 따른 DIMD를 수행할지 여부가 부호화된다(S2803).
이 후 단계들인 S2804 내지 S2808은 도 26에 도시된 S2502 내지 S2506과 실질적으로 동일하므로 상세한 설명은 생략한다.
도 30은 본 발명의 제7 실시예를 적용한 경우, 인트라 예측 모드를 복호화 하는 과정을 나타낸 순서도이다. 도 30에 도시된 각 과정은 영상 복호화 장치(600)에 의해 수행된다는 점 외에는 도 29에 도시된 각 단계들과 실질적으로 동일하므로 상세한 설명은 생략한다.
<DIMD의 변형예: 템플릿 인덱스의 전송>
전술한 다양한 실시예들에 따른 DIMD를 사용할 경우, 인트라 예측 모드 자체를 시그널링하지는 않는다. 그러나, 본 실시예에서는 복수의 템플릿을 이용하여 각각 후보 인트라 예측 모드를 유도한 후 이 중 어느 모드가 사용되는지를 나타내는 인덱스 정보가 부호화 장치(100)에 의해 복호화 장치(600)로 전송된다. 도 31a 및 도 31b는 템플릿 인덱스를 전송하는 DIMD의 변형예를 설명하기 위한 도면으로서, 본 발명의 DIMD를 이용하여 두 개의 템플릿을 이용하여 각각 인트라 예측 모드 후보를 생성한 후 인덱스를 이용하여 지정하는 방식에 대한 예시이다. 도 31a 또는 도 31b에 도시된 템플릿의 참조 화소 영역의 크기를 나타내는 R과 S는 설명의 편의성을 위해 1이라고 가정하고 설명한다.
도 31a에서는, 템플릿 A(3102)에 템플릿의 참조 화소 영역(3103)내의 화소들을 이용하여 화면 내 예측 모드 후보 1을 유도한다. 도 31b에서는, 템플릿 B(3104)에 템플릿의 참조 화소 영역(3105)내의 화소들을 이용하여 화면 내 예측 모드 후보 2을 유도한다. 다음으로, 어떤 템플릿에서 유도한 화면 내 예측 모드 후보가 현재 블록(3101)의 화면 내 예측 모드인지를 나타내는 인덱스를 부호화 하여 복호화 장치(600)로 전송된다.
한편, 템플릿을 포함하고 있는 블록이 어떤 화면 내 예측 모드로 부호화 되었는지 여부가 본 실시예에 이용될 수 있다. 예를 들면, 도 31a 및 도 31b에서, 템플릿 A(3102)를 포함하고 있는 블록의 화면 내 예측 모드를 화면 내 예측모드 A라 할 때, 화면 내 예측모드 A와 템플릿의 참조 화소들을 이용하여 템플릿 A(3102)에 적용하여 결정된 화면 내 예측 모드가 동일하면 높거나 낮은 우선순위를 부여할 수 있다. 그 우선순위에 따라 인덱스 설정을 위한 후보들 배치시에 비트를 할당 하는 것 또한 가능하다. 마찬가지로, 템플릿 A (3102)외에 다수의 템플릿이 존재하는 경우 위 조건을 이용하여 비트 할당 시, 우선순위를 설정하는 것 또한 가능하다.
도 32는 템플릿 인덱스가 사용되는 DIMD에 따른 화면 내 예측 모드의 부호화 방법을 설명하는 순서도이다.
먼저, 템플릿 인덱스가 사용되는 DIMD의 수행여부를 알려주는 정보가 부호된다(S3301). 템플릿 인덱스가 사용되는 DIMD가 수행 되었는지 여부를 판단한 후(S3302), 만약 수행되었다면 템플릿 인덱스를 부호화 하고 종료한다(S3307). 만약 템플릿 인덱스가 사용되는 DIMD가 수행되지 않았다면 MPM(Most Probable Mode) 적용 여부를 부호화한다(S3303). MPM이 적용되었는지 여부를 확인한 후(S3304), 적용되지 않았다면 MPM 후보를 제외한 나머지 모드를 재 정렬 후 부호화를 수행하고(S3305) MPM이 적용되었다면 어떤 후보가 적용되었는지를 알려주는 MPM 인덱스를 부호화하고(S3306) 종료한다.
도 33은 템플릿 인덱스가 사용되는 DIMD에 따른 화면 내 예측 모드의 부호화 방법을 설명하는 순서도이다. 도 33에 도시된 각 과정은 영상 복호화 장치(600)에 의해 수행된다는 점 외에는 도 32에 도시된 각 단계들과 실질적으로 동일하므로 상세한 설명은 생략한다.
한편, 도 31a 및 도 31b는 주변 2개의 템플릿들을 예시로 들었지만 3개 이상의 템플릿들을 이용하는 것 또한 가능하다.
<DIMD의 응용예: MPM 리스트 생성>
앞에서는, 본 발명에 따른 DIMD를 사용할 경우, 인트라 예측 모드 자체를 복호화 장치(600)로 시그널링하지 않거나 또는 복수의 템플릿들 중 어떤 템플릿을 이용하여 유도된 인트라 예측 모드 후보가 현재 블록의 인트라 예측 모드로 선택되었는지를 나타내는 템플릿 인덱스 정보가 부호화 장치(100)에 의해 복호화 장치(600)로 전송되었다.
이하에서는, DIMD에 따라 유도된 화면 내 예측모드를 사용하여 MPM(Most Probable Mode) 후보를 재정렬하거나 MPM 리스트를 생성하는 실시예를 설명한다.
화면 내 예측 모드의 예측을 위해 MPM 후보를 생성한 후, 템플릿을 이용하여 유도한 화면 내 예측 모드와 유사한 순으로 MPM 후보를 상위에 배치하는 것 또한 가능하다.
(제1 실시예)
도 34는 템플릿을 이용하여 유도된 화면 내 예측 모드를 MPM 후보로 설정하는 일 예를 설명하기 위한 도면이다.
현재 블록(3501) 주변에 복원된 블록 A(3503)와 블록 B(3505)가 존재한다고 가정하고, 블록 A(3503)는 화면 내 예측, 블록 B(3505)는 화면 간 예측이 사용 되었다고 가정한다. 블록 B(3505)는 화면 간 예측이 사용되어 화면 내 예측 모드가 존재하지 않기 때문에, 본 실시예에서는 템플릿을 이용하여 블록 B(3505)의 화면 내 예측 모드를 생성한다. 템플릿을 이용하여 블록 B(3505)의 화면 내 예측 모드를 유도하는 것은 도 31b 및 도 31b와 관련된 앞선 설명들을 참고한다. 한편, 도 31b의 템플릿 B(3104)를 이용하여 템플릿 B(3104)의 화면 내 예측 모드를 유도할 때, 화면 내 예측 모드를 부호화하는 방식, 인트라 예측 모드의 개수와 예측 각도들은 영상 부호화 장치 (100) 또는 영상 복호화 장치(600)에 의해 기 설정된 것들과 동일해야 한다.
(제2 실시예)
본 실시예에서는 템플릿을 포함하고 있는 블록이 어떤 화면 내 예측 모드로 부호화 되었는지를 이용하여 MPM의 후보를 설정한다.
도 35는 본 발명의 일 실시예에 따른 MPM 후보 설정을 설명하기 위한 도면이다. 도 35를 참조하면, 현재 블록(3701)의 왼쪽 블록(3703)의 화면 내 예측 모드를 10번 모드라 가정하고, 왼쪽 블록(3703)의 일부분에 해당하는 템플릿 A(3705)에 템플릿의 참조 화소들(도시되지 않음)을 이용하여 유도한 화면 내 예측 모드가 12번 모드라 가정한다. 마찬가지로 현재 블록(3701)의 위쪽 블록(3707)의 화면 내 예측 모드는 28번이라 가정하고, 위쪽 블록(3707)의 일부분인 템플릿 B(3709)에 템플릿의 참조 화소들(도시되지 않음)을 이용하여 유도한 화면 내 예측 모드가 28번이라 가정한다. 왼쪽 블록(3703)의 경우, 왼쪽 블록(3703) 전체를 고려하면 10번 모드가 부호화에 유리하지만 현재 블록(3701)과 인접한 템플릿 A(3705)에서는 12번 모드가 설정 되었으므로 현재 블록의 예측 모드는 10번 모드보다는 12번 모드가 더 적절하다고 가정할 수 있다. 이러한 경우, MPM의 후보 설정시에 왼쪽 블록(3703)의 화면 내 예측모드보다는 템플릿 A(3705)에서 유도된 화면 내 예측모드를 이용하여 MPM 후보를 생성할 수 있다.
위쪽 블록(3707)의 경우 위쪽 블록(3707)의 화면 내 예측모드와 템플릿 B(3709)를 통해 유도된 화면 내 예측모드가 동일하므로 그 동일한 모드가 MPM 후보로 사용된다.
다른 대안으로서, 왼쪽 블록(3703)의 화면 내 예측모드, 템플릿A(3705)에서 유도된 화면 내 예측모드, 위쪽 블록(3707)의 화면 내 예측모드, 템플릿B(3709)에서 유도된 화면 내 예측모드의 4가지 모드를 이용하여 MPM의 후보 설정을 하는 것 또한 가능하다. 이때, 템플릿을 이용하여 유도한 화면 내 예측 모드가 현재 블록에 더욱 가깝기 때문에, 템플릿을 이용하여 유도한 화면 내 예측 모드를 MPM 후보 설정시에 높은 우선순위를 부과하여 비트를 적게 할당하는 것 또한 가능하다.
본 개시의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 개시에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.
본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.
또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.
본 발명은 영상 신호의 부호화 또는 복호화 분야에 이용가능하다.

Claims (30)

  1. 영상의 복호화 방법에 있어서,
    복수의 참조 화소 라인들 중 적어도 하나의 참조 화소 라인을 선택하는 단계, 여기서, 상기 복수의 참조 화소 라인들은, 인트라 예측을 이용하여 복호화 될 현재 블록과 동일한 영상 내에 위치함; 및
    상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 상기 현재 블록 내의 하나의 화소의 예측값을 얻는 단계;
    를 포함하는 영상의 복호화 방법.
  2. 제1항에 있어서, 상기 영상의 복호화 방법은,
    입력 비트스트림으로부터 참조 화소 라인 인덱스 정보를 얻는 단계를 더 포함하고,
    상기 참조 화소 라인 인덱스 정보에 기초하여, 상기 복수의 참조 화소 라인들 중에서 상기 적어도 하나의 참조 화소 라인이 선택되는 것을 특징으로 하는 영상의 복호화 방법.
  3. 제1항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록 내의 각 화소의 위치에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  4. 제3항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  5. 제4항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드가 각도 모드인 경우, 상기 복수의 참조 화소 라인들 각각에 포함된 화소들을 이용하여 얻어진 복수의 예측 화소들 중에서 정수 화소의 위치 또는 정수 화소의 위치에 가장 가까운 위치의 예측 화소를 상기 예측값으로 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  6. 제4항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드가 각도 모드인 경우, 상기 복수의 참조 화소 라인들 각각에 포함된 화소들을 이용하여 얻어진 복수의 예측 화소들 중에서 정수 화소 위치의 예측 화소들이 복수이면, 상기 현재 블록 내의 화소에 가장 가까운 예측 화소를 상기 예측값으로 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  7. 제4항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드가 각도 모드인 경우, 상기 복수의 참조 화소 라인들 각각에 포함된 화소들을 이용하여 얻어진 복수의 예측 화소들 각각에 가중치를 적용하여 계산한 가중평균값을 상기 예측값으로 선택하며,
    여기서, 상기 현재 블록 내의 화소와 예측 화소 간의 거리에 따라 상기 가중치가 결정되는 것을 특징으로 하는 영상의 복호화 방법.
  8. 제1항에 있어서,
    상기현재 블록 내의 하나의 화소의 예측값을 얻는 단계는,
    복수의 보간 방식 중 하나를 선택하는 단계; 및
    상기 선택된 보간 방식을 이용하여, 상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소를 이용하여 보간을 수행하여 상기 예측값을 얻는 단계를 포함하고,
    상기 선택된 보간 방식은, 복수의 보간 방식 중 하나를 나타내는 인덱스 정보에 기초하여 선택되는 것을 특징으로 하는 영상의 복호화 방법.
  9. 제1항에 있어서, 상기 영상의 복호화 방법은,
    상기 현재 블록의 모든 화소들의 예측값을 유도하여 상기 현재 블록의 예측 블록을 얻는 단계; 및
    상기 예측 블록을 필터링하는 단계를 포함하고,
    여기서, 상기 현재 블록의 크기 또는 상기 현재 블록의 인트라 예측 모드에 따라 상기 현재 블록의 소정 영역이 필터링되는 영상의 복호화 방법.
  10. 제9항에 있어서, 상기 필터링하는 단계는,
    상기 예측 블록 내의 제1 화소의 예측에 이용된 제1 참조 화소가 속하는 참조 화소 라인에 속하는 제2 참조 화소를 이용하여 상기 예측 블록 내의 상기 제1 화소를 필터링하는 것을 특징으로 하는 영상의 복호화 방법.
  11. 제10항에 있어서, 상기 필터링하는 단계는,
    상기 예측 블록 내의 상기 제1 화소와 제2 화소를 상기 제2 참조 화소를 이용하여 필터링하며,
    여기서, 상기 예측 블록 내의 상기 제1 화소와 상기 제2 참조 화소 간의 거리와, 상기 예측 블록 내의 상기 제2 화소와 상기 제2 참조 화소 간의 거리에 따라 달리 필터링하는 것을 특징으로 하는 영상의 복호화 방법.
  12. 제9항에 있어서, 상기 필터링하는 단계는,
    상기 예측 블록에 접한 참조 화소 라인에 속하는 참조 화소를 이용하여 상기 예측 블록 내의 화소를 필터링하는 것을 특징으로 하는 영상의 복호화 방법.
  13. 제9항에 있어서, 상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록이 복수의 변환 블록들로 분할되는 경우, 상기 각 변환 블록 마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  14. 제13항에 있어서, 상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    변환 블록 단위로 참조 화소 라인을 유도할지 여부를 지시하는 정보에 기초하여 상기 각 변환 블록 마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 복호화 방법.
  15. 영상의 부호화 방법에 있어서,
    복수의 참조 화소 라인들 중 적어도 하나의 참조 화소 라인을 선택하는 단계, 여기서, 상기 복수의 참조 화소 라인들은, 인트라 예측을 이용하여 부호화 될 현재 블록과 동일한 영상 내에 위치함; 및
    상기 선택된 적어도 하나의 참조 화소 라인에 포함된 적어도 하나의 화소 값에 기초하여 상기 현재 블록 내의 하나의 화소의 예측값을 얻는 단계;
    를 포함하는 것을 특징으로 하는 영상의 부호화 방법.
  16. 제15항에 있어서, 상기 영상의 부호화 방법은,
    상기 선택된 적어도 하나의 참조 화소 라인을 지시하는 참조 화소 라인 인덱스 정보를 부호화하는 단계; 및
    상기 부호화된 참조 화소 라인 인덱스 정보를 비트스트림에 포함시키는 단계를 포함하는 것을 특징으로 하는 영상의 부호화 방법.
  17. 제15항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록 내의 각 화소의 위치에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 부호화 방법.
  18. 제17항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드에 기초하여 상기 현재 블록 내의 각 화소마다 적어도 하나의 참조 화소 라인을 선택하는 것을 특징으로 하는 영상의 부호화 방법.
  19. 제18항에 있어서,
    상기 적어도 하나의 참조 화소 라인을 선택하는 단계는,
    상기 현재 블록의 인트라 예측 모드가 각도 모드인 경우, 상기 복수의 참조 화소 라인들 각각에 포함된 화소들을 이용하여 얻어진 복수의 예측 화소들 중에서 정수 화소의 위치 또는 정수 화소의 위치에 가장 가까운 위치의 예측 화소를 상기 예측값으로 선택하는 것을 특징으로 하는 영상의 부호화 방법.
  20. 가용한 복수의 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    이미 복원된, 적어도 하나의 화소 영역의 참조 화소 영역에 기초하여 상기 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계; 및
    상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
  21. 제20항에 있어서, 상기 영상의 복호화 방법은,
    입력 비트스트림에서 인트라 예측 모드의 유도 방법을 지시하는 정보를 얻는 단계를 포함하고,
    상기 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계는, 상기 인트라 예측 모드의 유도 방법을 지시하는 정보에 따라 수행 여부가 선택되는 것을 특징으로 하는 영상의 복호화 방법.
  22. 제20항에 있어서, 상기 가용한 복수의 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    입력 비트스트림에서 상기 가용한 복수의 인트라 예측 모드들의 개수 또는 상기 가용한 복수의 인트라 예측 모드들의 리스트를 특정하는 가용한 인트라 예측 모드 정보를 얻는 단계; 및
    상기 가용한 인트라 예측 모드 정보에 기초하여 상기 현재 블록의 인트라 예측 모드를 유도하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
  23. 가용한 복수의 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    이미 복원된 화소 영역, 상기 이미 복원된 화소 영역의 제1 참조 화소 라인, 및 상기 이미 복원된 화소 영역의 제2 참조 화소 라인에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 것을 특징으로 하는 영상의 복호화 방법.
  24. 제23항에 있어서,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    상기 제2 참조 화소 라인을 이용하여 상기 제1 참조 화소 라인의 인트라 예측 모드를 유도하는 단계;
    상기 제1 참조 화소 라인을 이용하여 상기 이미 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 제1 참조 화소 라인의 인트라 예측 모드와 상기 유도된 이미 복원된 화소 영역의 인트라 예측 모드가 동일하면, 상기 동일한 예측 모드를 상기 현재 블록의 인트라 예측 모드로 선택하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
  25. 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    복수의 복원된 화소 영역들 중에서 상기 현재 블록의 인트라 예측 모드를 유도하기 위해 이용되는 영역을 선택하는 단계;
    상기 선택된, 복원 화소 영역의 참조 화소 영역에 기초하여 상기 복원 화소 영역의 인트라 예측 모드를 유도하는 단계; 및
    상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
  26. 제25항에 있어서, 상기 영상의 복호화 방법은,
    입력 비트스트림에서 상기 복수의 복원된 화소 영역들 중에서 어떤 영역을 이용하여 상기 현재 블록의 인트라 예측 모드를 유도할지를 나타내는 인덱스 정보를 얻는 단계;
    상기 인덱스 정보에 기초하여 상기 복수의 복원된 화소 영역들 중에서 상기 현재 블록의 인트라 예측 모드를 유도하기 위해 이용되는 상기 영역을 선택하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
  27. 가용한 복수의 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    이미 복원된, 적어도 하나의 화소 영역의 참조 화소 영역에 기초하여 상기 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계; 및
    상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 단계를 포함하는 것을 특징으로 하는 영상의 부호화 방법.
  28. 가용한 복수의 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    이미 복원된 화소 영역, 상기 이미 복원된 화소 영역의 제1 참조 화소 라인, 및 상기 이미 복원된 화소 영역의 제2 참조 화소 라인에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 것을 특징으로 하는 영상의 부호화 방법.
  29. 제28항에 있어서,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    상기 제2 참조 화소 라인을 이용하여 상기 제1 참조 화소 라인의 인트라 예측 모드를 유도하는 단계;
    상기 제1 참조 화소 라인을 이용하여 상기 이미 복원된 화소 영역의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 제1 참조 화소 라인의 인트라 예측 모드와 상기 유도된 이미 복원된 화소 영역의 인트라 예측 모드가 동일하면, 상기 동일한 예측 모드를 상기 현재 블록의 인트라 예측 모드로 선택하는 단계를 포함하는 것을 특징으로 하는 영상의 부호화 방법.
  30. 현재 블록의 인트라 예측 모드를 유도하는 단계;
    상기 유도된 인트라 예측 모드를 이용하여 상기 현재 블록의 인트라 예측 블록을 얻는 단계; 및
    상기 얻은 인트라 예측 블록과 상기 현재 블록의 잔차 블록을 가산하여 상기 현재 블록을 복원하는 단계를 포함하고,
    상기 현재 블록의 인트라 예측 모드를 유도하는 단계는,
    복수의 복원된 화소 영역들 중에서 상기 현재 블록의 인트라 예측 모드를 유도하기 위해 이용되는 영역을 선택하는 단계;
    상기 선택된, 복원 화소 영역의 참조 화소 영역에 기초하여 상기 복원 화소 영역의 인트라 예측 모드를 유도하는 단계; 및
    상기 유도된 상기 복원된 화소 영역의 인트라 예측 모드에 기초하여, 상기 현재 블록의 인트라 예측 모드를 유도하는 단계를 포함하는 것을 특징으로 하는 영상의 부호화 방법.
PCT/KR2017/011219 2016-10-14 2017-10-12 영상의 부호화/복호화 방법 및 장치 WO2018070790A1 (ko)

Priority Applications (21)

Application Number Priority Date Filing Date Title
CN202410028685.4A CN117692635A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
US16/341,590 US11039148B2 (en) 2016-10-14 2017-10-12 Method and apparatus for encoding/decoding an image
CN201780063589.1A CN109845254B (zh) 2016-10-14 2017-10-12 影像编码/解码方法及装置
CN202410026037.5A CN117834859A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410023686.XA CN117615132A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410023919.6A CN117615134A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410026450.1A CN117834860A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410029164.0A CN117857784A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410023964.1A CN117615135A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410026775.XA CN117596390A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410023716.7A CN117615133A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
CN202410023671.3A CN117615131A (zh) 2016-10-14 2017-10-12 影像编码/解码方法及比特流的传送方法
EP17860513.5A EP3528497A4 (en) 2016-10-14 2017-10-12 IMAGE CODING AND DECODING PROCESS AND DEVICE
JP2019520095A JP6953523B2 (ja) 2016-10-14 2017-10-12 画像の符号化/復号化方法及び装置
US17/318,020 US20210281853A1 (en) 2016-10-14 2021-05-12 Method and apparatus for encoding/decoding an image
US17/318,144 US11792409B2 (en) 2016-10-14 2021-05-12 Method and apparatus for encoding/decoding an image
JP2021159186A JP7442200B2 (ja) 2016-10-14 2021-09-29 画像の符号化/復号化方法及び装置
JP2021159171A JP2022020629A (ja) 2016-10-14 2021-09-29 画像の符号化/復号化方法及び装置
US17/988,094 US20230101636A1 (en) 2016-10-14 2022-11-16 Method and apparatus for encoding/decoding an image
US17/988,100 US20230073580A1 (en) 2016-10-14 2022-11-16 Method and apparatus for encoding/decoding an image
JP2024018920A JP2024050883A (ja) 2016-10-14 2024-02-09 画像の符号化/復号化方法及び装置

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
KR10-2016-0133755 2016-10-14
KR20160133753 2016-10-14
KR20160133755 2016-10-14
KR10-2016-0133753 2016-10-14
KR10-2017-0127940 2017-09-29
KR1020170127940A KR102357283B1 (ko) 2016-10-14 2017-09-29 영상의 부호화/복호화 방법 및 장치
KR1020170127938A KR102357282B1 (ko) 2016-10-14 2017-09-29 영상의 부호화/복호화 방법 및 장치
KR10-2017-0127938 2017-09-29

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US16/341,590 A-371-Of-International US11039148B2 (en) 2016-10-14 2017-10-12 Method and apparatus for encoding/decoding an image
US17/318,020 Continuation US20210281853A1 (en) 2016-10-14 2021-05-12 Method and apparatus for encoding/decoding an image
US17/318,144 Continuation US11792409B2 (en) 2016-10-14 2021-05-12 Method and apparatus for encoding/decoding an image

Publications (1)

Publication Number Publication Date
WO2018070790A1 true WO2018070790A1 (ko) 2018-04-19

Family

ID=66882898

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/011219 WO2018070790A1 (ko) 2016-10-14 2017-10-12 영상의 부호화/복호화 방법 및 장치

Country Status (5)

Country Link
US (5) US11039148B2 (ko)
EP (1) EP3528497A4 (ko)
JP (4) JP6953523B2 (ko)
CN (11) CN117596390A (ko)
WO (1) WO2018070790A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020211642A1 (zh) * 2019-04-15 2020-10-22 中兴通讯股份有限公司 码块的预测、解码方法及装置
CN113347423A (zh) * 2018-06-25 2021-09-03 Oppo广东移动通信有限公司 帧内预测方法和装置
RU2795549C2 (ru) * 2018-06-25 2023-05-05 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ и устройство для внутрифреймового предсказания
WO2023106599A1 (ko) * 2021-12-06 2023-06-15 현대자동차주식회사 참조샘플라인의 유도 기반 인트라 예측을 이용하는 비디오 코딩을 위한 방법 및 장치
US11956436B2 (en) 2018-06-26 2024-04-09 Interdigital Vc Holdings, Inc. Multiple reference intra prediction using variable weights

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019007490A1 (en) * 2017-07-04 2019-01-10 Huawei Technologies Co., Ltd. DECODER INTEGRATED MODE (DIMD) INTEGRATED DEVICE TOOL CALCULATION COMPLEXITY REDUCTION
CN115037931A (zh) 2017-10-18 2022-09-09 韩国电子通信研究院 图像编码/解码方法和装置以及存储有比特流的记录介质
US10491893B1 (en) * 2018-08-29 2019-11-26 Tencent America LLC Method and apparatus for multi-line intra prediction
JP7039731B2 (ja) * 2018-09-03 2022-03-22 ホアウェイ・テクノロジーズ・カンパニー・リミテッド イントラ予測のための方法及び装置
US11445216B2 (en) * 2018-09-14 2022-09-13 Lg Electronics Inc. Image prediction method and apparatus for performing intra prediction
EP3629579A1 (en) * 2018-09-27 2020-04-01 Ateme Method for image processing and apparatus for implementing the same
US11095885B2 (en) 2018-10-05 2021-08-17 Tencent America LLC Mode list generation for multi-line intra prediction
US11178396B2 (en) * 2018-11-14 2021-11-16 Tencent America LLC Constrained intra prediction and unified most probable mode list generation
WO2020186763A1 (zh) * 2019-03-18 2020-09-24 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
US11197001B2 (en) * 2020-02-05 2021-12-07 Tencent America LLC Method and apparatus for interactions between decoder-side intra mode derivation and adaptive intra prediction modes
US20220321909A1 (en) 2021-03-31 2022-10-06 Tencent America LLC Harmonized design between multiple reference line intra prediction and transform partitioning
US20220345692A1 (en) * 2021-04-26 2022-10-27 Tencent America LLC Template matching based intra prediction
US11943432B2 (en) * 2021-04-26 2024-03-26 Tencent America LLC Decoder side intra mode derivation
WO2022237870A1 (en) * 2021-05-13 2022-11-17 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing
WO2023049292A1 (en) * 2021-09-22 2023-03-30 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
WO2023056176A1 (en) * 2021-09-29 2023-04-06 Qualcomm Incorporated Candidate lists of multiple reference lines for video coding
WO2023075450A1 (ko) * 2021-10-28 2023-05-04 엘지전자 주식회사 Mpm 리스트를 이용하는 영상 코딩 방법 및 장치
WO2023091688A1 (en) * 2021-11-19 2023-05-25 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
WO2023114155A1 (en) * 2021-12-13 2023-06-22 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
WO2023128615A1 (ko) * 2021-12-29 2023-07-06 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2023129744A1 (en) * 2021-12-30 2023-07-06 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
WO2023141238A1 (en) * 2022-01-20 2023-07-27 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
WO2023198112A1 (en) * 2022-04-15 2023-10-19 Mediatek Inc. Method and apparatus of improvement for decoder-derived intra prediction in video coding system
WO2024007366A1 (zh) * 2022-07-08 2024-01-11 Oppo广东移动通信有限公司 一种帧内预测融合方法、视频编解码方法、装置和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080041972A (ko) * 2006-11-08 2008-05-14 한국전자통신연구원 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
KR20090097688A (ko) * 2008-03-12 2009-09-16 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 장치
KR20130004548A (ko) * 2011-07-01 2013-01-11 삼성전자주식회사 단일화된 참조가능성 확인 과정을 통해 인트라 예측을 수반하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR20140062454A (ko) * 2011-06-20 2014-05-23 한국전자통신연구원 영상 부호화/복호화 방법 및 그 장치
KR20150091456A (ko) * 2010-07-16 2015-08-11 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120012385A (ko) * 2010-07-31 2012-02-09 오수미 인트라 예측 부호화 장치
CN102595118B (zh) 2011-01-14 2015-04-08 华为技术有限公司 一种编解码中的预测方法和预测器
JP5823608B2 (ja) * 2011-06-20 2015-11-25 メディア テック シンガポール ピーティーイー.リミテッド 方向性イントラ予測の方法及び装置
EP2774360B1 (en) * 2011-11-04 2017-08-02 Huawei Technologies Co., Ltd. Differential pulse code modulation intra prediction for high efficiency video coding
US20140105473A1 (en) * 2012-10-12 2014-04-17 Samsung Electronics Co., Ltd. Method and apparatus for segmenting contour in image
KR20140124442A (ko) * 2013-04-15 2014-10-27 인텔렉추얼디스커버리 주식회사 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
SG11201703015PA (en) * 2014-10-31 2017-05-30 Mediatek Inc Method of improved directional intra prediction for video coding
US10382791B2 (en) * 2015-03-06 2019-08-13 Qualcomm Incorporated Data structure for video coding unit
US10291932B2 (en) * 2015-03-06 2019-05-14 Qualcomm Incorporated Method and apparatus for low complexity quarter pel generation in motion search
CN115134596A (zh) * 2015-06-05 2022-09-30 杜比实验室特许公司 用于执行帧间预测的图像编解码方法、比特流存储方法
CN109076241B (zh) * 2016-05-04 2023-06-23 微软技术许可有限责任公司 利用样本值的非相邻参考线进行帧内图片预测
WO2018047995A1 (ko) * 2016-09-08 2018-03-15 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080041972A (ko) * 2006-11-08 2008-05-14 한국전자통신연구원 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
KR20090097688A (ko) * 2008-03-12 2009-09-16 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 장치
KR20150091456A (ko) * 2010-07-16 2015-08-11 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR20140062454A (ko) * 2011-06-20 2014-05-23 한국전자통신연구원 영상 부호화/복호화 방법 및 그 장치
KR20130004548A (ko) * 2011-07-01 2013-01-11 삼성전자주식회사 단일화된 참조가능성 확인 과정을 통해 인트라 예측을 수반하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113347423A (zh) * 2018-06-25 2021-09-03 Oppo广东移动通信有限公司 帧内预测方法和装置
US11528505B2 (en) 2018-06-25 2022-12-13 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Intra-frame prediction method and device
RU2795549C2 (ru) * 2018-06-25 2023-05-05 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ и устройство для внутрифреймового предсказания
US11930210B2 (en) 2018-06-25 2024-03-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Intra-frame prediction method and device
US11936908B2 (en) 2018-06-25 2024-03-19 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Intra-frame prediction method and device
US11936906B2 (en) 2018-06-25 2024-03-19 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Intra-frame prediction method and device
US11936907B2 (en) 2018-06-25 2024-03-19 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Intra-frame prediction method and device
RU2816201C2 (ru) * 2018-06-25 2024-03-27 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ и устройство для внутрифреймового предсказания
US11956436B2 (en) 2018-06-26 2024-04-09 Interdigital Vc Holdings, Inc. Multiple reference intra prediction using variable weights
WO2020211642A1 (zh) * 2019-04-15 2020-10-22 中兴通讯股份有限公司 码块的预测、解码方法及装置
WO2023106599A1 (ko) * 2021-12-06 2023-06-15 현대자동차주식회사 참조샘플라인의 유도 기반 인트라 예측을 이용하는 비디오 코딩을 위한 방법 및 장치

Also Published As

Publication number Publication date
CN117615132A (zh) 2024-02-27
JP6953523B2 (ja) 2021-10-27
US20230101636A1 (en) 2023-03-30
US20210281854A1 (en) 2021-09-09
CN117692635A (zh) 2024-03-12
CN117615133A (zh) 2024-02-27
JP7442200B2 (ja) 2024-03-04
US20230073580A1 (en) 2023-03-09
US20190379891A1 (en) 2019-12-12
JP2019535211A (ja) 2019-12-05
CN117834860A (zh) 2024-04-05
CN109845254B (zh) 2024-01-26
EP3528497A1 (en) 2019-08-21
US11792409B2 (en) 2023-10-17
CN117596390A (zh) 2024-02-23
JP2022020630A (ja) 2022-02-01
JP2024050883A (ja) 2024-04-10
CN117615131A (zh) 2024-02-27
CN117615135A (zh) 2024-02-27
CN109845254A (zh) 2019-06-04
CN117857784A (zh) 2024-04-09
CN117615134A (zh) 2024-02-27
US20210281853A1 (en) 2021-09-09
EP3528497A4 (en) 2020-07-22
US11039148B2 (en) 2021-06-15
JP2022020629A (ja) 2022-02-01
CN117834859A (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
WO2018070790A1 (ko) 영상의 부호화/복호화 방법 및 장치
WO2017222325A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018066849A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2018221817A1 (ko) 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
WO2018106047A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018066959A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018212577A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018008906A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017179835A1 (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
WO2018080122A1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2018236028A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018236031A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2014171713A1 (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치
WO2012087077A2 (ko) 영상 예측 단위에 대한 인트라 예측 모드 부호화 방법 및 장치, 및 영상 예측 단위에 대한 인트라 예측 모드 복호화 방법 및 장치
WO2020096425A1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2020004979A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2018070713A1 (ko) 크로마 성분에 대한 인트라 예측 모드를 유도하는 방법 및 장치
WO2018062880A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2018044089A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019194568A1 (ko) 어파인 모델 기반의 영상 부호화/복호화 방법 및 장치
WO2016159610A1 (ko) 비디오 신호 처리 방법 및 장치
WO2016048092A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018066958A1 (ko) 비디오 신호 처리 방법 및 장치
WO2013109123A1 (ko) 인트라 예측 처리 속도 향상을 위한 비디오의 부호화 방법 및 장치, 비디오의 복호화 방법 및 장치
WO2016064123A1 (ko) 비디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17860513

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019520095

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017860513

Country of ref document: EP

Effective date: 20190514